KR20240007135A - 콘드로이틴-생산 재조합 세포 - Google Patents
콘드로이틴-생산 재조합 세포 Download PDFInfo
- Publication number
- KR20240007135A KR20240007135A KR1020237037339A KR20237037339A KR20240007135A KR 20240007135 A KR20240007135 A KR 20240007135A KR 1020237037339 A KR1020237037339 A KR 1020237037339A KR 20237037339 A KR20237037339 A KR 20237037339A KR 20240007135 A KR20240007135 A KR 20240007135A
- Authority
- KR
- South Korea
- Prior art keywords
- recombinant
- polypeptide
- activity
- nucleic acid
- chondroitin
- Prior art date
Links
- DLGJWSVWTWEWBJ-HGGSSLSASA-N chondroitin Chemical compound CC(O)=N[C@@H]1[C@H](O)O[C@H](CO)[C@H](O)[C@@H]1OC1[C@H](O)[C@H](O)C=C(C(O)=O)O1 DLGJWSVWTWEWBJ-HGGSSLSASA-N 0.000 title claims abstract description 159
- 229920002567 Chondroitin Polymers 0.000 title claims abstract description 157
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims abstract description 221
- 238000000034 method Methods 0.000 claims abstract description 75
- 230000028327 secretion Effects 0.000 claims abstract description 57
- 238000004519 manufacturing process Methods 0.000 claims abstract description 37
- 150000007523 nucleic acids Chemical class 0.000 claims description 645
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 476
- 229920001184 polypeptide Polymers 0.000 claims description 472
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 472
- 230000000694 effects Effects 0.000 claims description 443
- 102000039446 nucleic acids Human genes 0.000 claims description 431
- 108020004707 nucleic acids Proteins 0.000 claims description 431
- 210000004027 cell Anatomy 0.000 claims description 288
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 claims description 219
- 108010009115 chondroitin synthase Proteins 0.000 claims description 123
- 108010023736 Chondroitinases and Chondroitin Lyases Proteins 0.000 claims description 77
- 102100031688 N-acetylgalactosamine-6-sulfatase Human genes 0.000 claims description 77
- 241000701245 Paramecium bursaria Chlorella virus 1 Species 0.000 claims description 65
- 102100029640 UDP-glucose 6-dehydrogenase Human genes 0.000 claims description 58
- 239000001963 growth medium Substances 0.000 claims description 57
- 241000606856 Pasteurella multocida Species 0.000 claims description 54
- 101710105361 Phosphoglucomutase 1 Proteins 0.000 claims description 54
- 102100030999 Phosphoglucomutase-1 Human genes 0.000 claims description 54
- 229940051027 pasteurella multocida Drugs 0.000 claims description 54
- 102000048175 UTP-glucose-1-phosphate uridylyltransferases Human genes 0.000 claims description 51
- 108700023183 UTP-glucose-1-phosphate uridylyltransferases Proteins 0.000 claims description 51
- 108010043841 Glucosamine 6-Phosphate N-Acetyltransferase Proteins 0.000 claims description 50
- 102000002740 Glucosamine 6-Phosphate N-Acetyltransferase Human genes 0.000 claims description 50
- 108010074307 Phosphoacetylglucosamine mutase Proteins 0.000 claims description 48
- 102100024440 Phosphoacetylglucosamine mutase Human genes 0.000 claims description 47
- 108010054269 Uridine Diphosphate Glucose Dehydrogenase Proteins 0.000 claims description 43
- 238000004873 anchoring Methods 0.000 claims description 42
- 239000000047 product Substances 0.000 claims description 42
- 210000005253 yeast cell Anatomy 0.000 claims description 41
- 102100037921 UDP-N-acetylglucosamine pyrophosphorylase Human genes 0.000 claims description 36
- 108010061048 UDPacetylglucosamine pyrophosphorylase Proteins 0.000 claims description 35
- 241000588724 Escherichia coli Species 0.000 claims description 31
- 102100021436 UDP-glucose 4-epimerase Human genes 0.000 claims description 31
- 108010075202 UDP-glucose 4-epimerase Proteins 0.000 claims description 31
- 241000894006 Bacteria Species 0.000 claims description 26
- 241000235070 Saccharomyces Species 0.000 claims description 22
- 241000219195 Arabidopsis thaliana Species 0.000 claims description 21
- 239000000203 mixture Substances 0.000 claims description 21
- 241000282414 Homo sapiens Species 0.000 claims description 18
- 241000235013 Yarrowia Species 0.000 claims description 17
- 241000256844 Apis mellifera Species 0.000 claims description 16
- 241001164830 Vespa magnifica Species 0.000 claims description 16
- 241000283690 Bos taurus Species 0.000 claims description 15
- 241000235649 Kluyveromyces Species 0.000 claims description 15
- 101100315731 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) QRI1 gene Proteins 0.000 claims description 15
- 101100315730 Schizosaccharomyces pombe (strain 972 / ATCC 24843) uap1 gene Proteins 0.000 claims description 15
- 241000239272 Tityus serrulatus Species 0.000 claims description 15
- 101710191933 UDP-glucose 6-dehydrogenase Proteins 0.000 claims description 15
- 241000238869 Cupiennius salei Species 0.000 claims description 14
- 241000120569 Streptococcus equi subsp. zooepidemicus Species 0.000 claims description 12
- 241000282553 Macaca Species 0.000 claims description 11
- 241000187479 Mycobacterium tuberculosis Species 0.000 claims description 11
- 241000589517 Pseudomonas aeruginosa Species 0.000 claims description 11
- 241001465328 Eremothecium gossypii Species 0.000 claims description 10
- 241000985513 Penicillium oxalicum Species 0.000 claims description 10
- 241000222120 Candida <Saccharomycetales> Species 0.000 claims description 8
- 241000222178 Candida tropicalis Species 0.000 claims description 8
- 241001099341 Ogataea polymorpha Species 0.000 claims description 8
- 241000235072 Saccharomyces bayanus Species 0.000 claims description 8
- 241000198072 Saccharomyces mikatae Species 0.000 claims description 8
- 238000012258 culturing Methods 0.000 claims description 8
- 241000235035 Debaryomyces Species 0.000 claims description 7
- 235000014663 Kluyveromyces fragilis Nutrition 0.000 claims description 7
- 241001112159 Ogataea Species 0.000 claims description 7
- 235000018368 Saccharomyces fragilis Nutrition 0.000 claims description 7
- 229940031154 kluyveromyces marxianus Drugs 0.000 claims description 7
- 241000235036 Debaryomyces hansenii Species 0.000 claims description 6
- 241001465321 Eremothecium Species 0.000 claims description 6
- 241000222126 [Candida] glabrata Species 0.000 claims description 6
- 208000032343 candida glabrata infection Diseases 0.000 claims description 6
- 235000015872 dietary supplement Nutrition 0.000 claims description 6
- 235000013305 food Nutrition 0.000 claims description 6
- 229960002181 saccharomyces boulardii Drugs 0.000 claims description 6
- 241000222122 Candida albicans Species 0.000 claims description 5
- 241001138401 Kluyveromyces lactis Species 0.000 claims description 5
- 241000670409 Saccharomyces castelli Species 0.000 claims description 5
- 241001123228 Saccharomyces paradoxus Species 0.000 claims description 5
- 241001489220 Vanderwaltozyma polyspora Species 0.000 claims description 5
- 229940095731 candida albicans Drugs 0.000 claims description 5
- 239000002537 cosmetic Substances 0.000 claims description 5
- 239000000796 flavoring agent Substances 0.000 claims description 5
- 235000013361 beverage Nutrition 0.000 claims description 4
- 238000004140 cleaning Methods 0.000 claims description 4
- 239000002417 nutraceutical Substances 0.000 claims description 4
- 235000021436 nutraceutical agent Nutrition 0.000 claims description 4
- 239000008194 pharmaceutical composition Substances 0.000 claims description 4
- 241000588722 Escherichia Species 0.000 claims description 2
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 claims description 2
- 241000194017 Streptococcus Species 0.000 claims description 2
- 235000019634 flavors Nutrition 0.000 claims description 2
- 229910052698 phosphorus Inorganic materials 0.000 claims description 2
- 239000011574 phosphorus Substances 0.000 claims description 2
- 241000235650 Kluyveromyces marxianus Species 0.000 claims 1
- 230000004048 modification Effects 0.000 abstract description 5
- 238000012986 modification Methods 0.000 abstract description 5
- 230000015572 biosynthetic process Effects 0.000 abstract description 3
- 238000003786 synthesis reaction Methods 0.000 abstract description 2
- 108091028043 Nucleic acid sequence Proteins 0.000 description 207
- 125000003275 alpha amino acid group Chemical group 0.000 description 180
- 150000001413 amino acids Chemical class 0.000 description 142
- 108090000623 proteins and genes Proteins 0.000 description 118
- 239000012634 fragment Substances 0.000 description 106
- 230000004071 biological effect Effects 0.000 description 82
- 108010003272 Hyaluronate lyase Proteins 0.000 description 67
- 102000001974 Hyaluronidases Human genes 0.000 description 65
- 229960002773 hyaluronidase Drugs 0.000 description 65
- 239000002773 nucleotide Substances 0.000 description 62
- 125000003729 nucleotide group Chemical group 0.000 description 62
- 102000003918 Hyaluronan Synthases Human genes 0.000 description 55
- 108090000320 Hyaluronan Synthases Proteins 0.000 description 55
- 102000004169 proteins and genes Human genes 0.000 description 50
- 230000001939 inductive effect Effects 0.000 description 49
- 102000004190 Enzymes Human genes 0.000 description 47
- 108090000790 Enzymes Proteins 0.000 description 47
- 229940088598 enzyme Drugs 0.000 description 47
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical group [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 23
- 229920001287 Chondroitin sulfate Polymers 0.000 description 23
- 229910052799 carbon Inorganic materials 0.000 description 23
- SQDAZGGFXASXDW-UHFFFAOYSA-N 5-bromo-2-(trifluoromethoxy)pyridine Chemical compound FC(F)(F)OC1=CC=C(Br)C=N1 SQDAZGGFXASXDW-UHFFFAOYSA-N 0.000 description 19
- 229940059329 chondroitin sulfate Drugs 0.000 description 19
- 230000001965 increasing effect Effects 0.000 description 19
- LFTYTUAZOPRMMI-UHFFFAOYSA-N UNPD164450 Natural products O1C(CO)C(O)C(O)C(NC(=O)C)C1OP(O)(=O)OP(O)(=O)OCC1C(O)C(O)C(N2C(NC(=O)C=C2)=O)O1 LFTYTUAZOPRMMI-UHFFFAOYSA-N 0.000 description 18
- 238000006243 chemical reaction Methods 0.000 description 18
- 239000002609 medium Substances 0.000 description 17
- 239000002207 metabolite Substances 0.000 description 17
- 108020004705 Codon Proteins 0.000 description 16
- 108091026890 Coding region Proteins 0.000 description 14
- 241001465754 Metazoa Species 0.000 description 13
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 12
- 210000004899 c-terminal region Anatomy 0.000 description 12
- 229930182817 methionine Natural products 0.000 description 12
- 244000005700 microbiome Species 0.000 description 12
- BRGMHAYQAZFZDJ-PVFLNQBWSA-N N-Acetylglucosamine 6-phosphate Chemical compound CC(=O)N[C@H]1[C@@H](O)O[C@H](COP(O)(O)=O)[C@@H](O)[C@@H]1O BRGMHAYQAZFZDJ-PVFLNQBWSA-N 0.000 description 11
- HSCJRCZFDFQWRP-JZMIEXBBSA-N UDP-alpha-D-glucose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1OP(O)(=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C(NC(=O)C=C2)=O)O1 HSCJRCZFDFQWRP-JZMIEXBBSA-N 0.000 description 11
- HSCJRCZFDFQWRP-UHFFFAOYSA-N Uridindiphosphoglukose Natural products OC1C(O)C(O)C(CO)OC1OP(O)(=O)OP(O)(=O)OCC1C(O)C(O)C(N2C(NC(=O)C=C2)=O)O1 HSCJRCZFDFQWRP-UHFFFAOYSA-N 0.000 description 11
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 11
- 238000013518 transcription Methods 0.000 description 11
- 230000035897 transcription Effects 0.000 description 11
- 102000005469 Chitin Synthase Human genes 0.000 description 10
- 241000206602 Eukaryota Species 0.000 description 10
- LFTYTUAZOPRMMI-NESSUJCYSA-N UDP-N-acetyl-alpha-D-galactosamine Chemical compound O1[C@H](CO)[C@H](O)[C@H](O)[C@@H](NC(=O)C)[C@H]1O[P@](O)(=O)O[P@](O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C(NC(=O)C=C2)=O)O1 LFTYTUAZOPRMMI-NESSUJCYSA-N 0.000 description 10
- HDYANYHVCAPMJV-LXQIFKJMSA-N UDP-alpha-D-glucuronic acid Chemical compound C([C@@H]1[C@H]([C@H]([C@@H](O1)N1C(NC(=O)C=C1)=O)O)O)OP(O)(=O)OP(O)(=O)O[C@H]1O[C@H](C(O)=O)[C@@H](O)[C@H](O)[C@H]1O HDYANYHVCAPMJV-LXQIFKJMSA-N 0.000 description 10
- 229910052802 copper Inorganic materials 0.000 description 10
- 239000010949 copper Substances 0.000 description 10
- 239000008103 glucose Substances 0.000 description 10
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 9
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 9
- HXXFSFRBOHSIMQ-VFUOTHLCSA-N alpha-D-glucose 1-phosphate Chemical compound OC[C@H]1O[C@H](OP(O)(O)=O)[C@H](O)[C@@H](O)[C@@H]1O HXXFSFRBOHSIMQ-VFUOTHLCSA-N 0.000 description 9
- 238000000855 fermentation Methods 0.000 description 9
- 230000004151 fermentation Effects 0.000 description 9
- XHMJOUIAFHJHBW-VFUOTHLCSA-N glucosamine 6-phosphate Chemical compound N[C@H]1[C@H](O)O[C@H](COP(O)(O)=O)[C@H](O)[C@@H]1O XHMJOUIAFHJHBW-VFUOTHLCSA-N 0.000 description 9
- 229950010772 glucose-1-phosphate Drugs 0.000 description 9
- 150000004804 polysaccharides Chemical class 0.000 description 9
- 239000000758 substrate Substances 0.000 description 9
- 241000203069 Archaea Species 0.000 description 8
- MBLBDJOUHNCFQT-UHFFFAOYSA-N N-acetyl-D-galactosamine Natural products CC(=O)NC(C=O)C(O)C(O)C(O)CO MBLBDJOUHNCFQT-UHFFFAOYSA-N 0.000 description 8
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 8
- 229930006000 Sucrose Natural products 0.000 description 8
- LFTYTUAZOPRMMI-CFRASDGPSA-N UDP-N-acetyl-alpha-D-glucosamine Chemical compound O1[C@H](CO)[C@@H](O)[C@H](O)[C@@H](NC(=O)C)[C@H]1OP(O)(=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C(NC(=O)C=C2)=O)O1 LFTYTUAZOPRMMI-CFRASDGPSA-N 0.000 description 8
- 108700006921 chitin synthase 2 Proteins 0.000 description 8
- 239000000543 intermediate Substances 0.000 description 8
- 229920001282 polysaccharide Polymers 0.000 description 8
- 239000005017 polysaccharide Substances 0.000 description 8
- 230000001105 regulatory effect Effects 0.000 description 8
- 239000005720 sucrose Substances 0.000 description 8
- 235000000346 sugar Nutrition 0.000 description 8
- 208000006820 Arthralgia Diseases 0.000 description 7
- 108700010070 Codon Usage Proteins 0.000 description 7
- 101150093384 JLP1 gene Proteins 0.000 description 7
- -1 chondroitin sulfate Chemical class 0.000 description 7
- 201000008482 osteoarthritis Diseases 0.000 description 7
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 6
- GSXOAOHZAIYLCY-UHFFFAOYSA-N D-F6P Natural products OCC(=O)C(O)C(O)C(O)COP(O)(O)=O GSXOAOHZAIYLCY-UHFFFAOYSA-N 0.000 description 6
- 108020004414 DNA Proteins 0.000 description 6
- 101150076716 SAM3 gene Proteins 0.000 description 6
- 244000253911 Saccharomyces fragilis Species 0.000 description 6
- BGWGXPAPYGQALX-ARQDHWQXSA-N beta-D-fructofuranose 6-phosphate Chemical compound OC[C@@]1(O)O[C@H](COP(O)(O)=O)[C@@H](O)[C@@H]1O BGWGXPAPYGQALX-ARQDHWQXSA-N 0.000 description 6
- 210000000845 cartilage Anatomy 0.000 description 6
- 210000000349 chromosome Anatomy 0.000 description 6
- 230000002068 genetic effect Effects 0.000 description 6
- 238000003780 insertion Methods 0.000 description 6
- 230000037431 insertion Effects 0.000 description 6
- 108020004999 messenger RNA Proteins 0.000 description 6
- 241000894007 species Species 0.000 description 6
- 229920002683 Glycosaminoglycan Polymers 0.000 description 5
- 101150089755 MET14 gene Proteins 0.000 description 5
- FZLJPEPAYPUMMR-FMDGEEDCSA-N N-acetyl-alpha-D-glucosamine 1-phosphate Chemical compound CC(=O)N[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1OP(O)(O)=O FZLJPEPAYPUMMR-FMDGEEDCSA-N 0.000 description 5
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 5
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 5
- 230000003247 decreasing effect Effects 0.000 description 5
- 239000003550 marker Substances 0.000 description 5
- 229950006780 n-acetylglucosamine Drugs 0.000 description 5
- 229910052760 oxygen Inorganic materials 0.000 description 5
- 239000013612 plasmid Substances 0.000 description 5
- 108091033319 polynucleotide Proteins 0.000 description 5
- 102000040430 polynucleotide Human genes 0.000 description 5
- 239000002157 polynucleotide Substances 0.000 description 5
- 230000002829 reductive effect Effects 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- NBSCHQHZLSJFNQ-GASJEMHNSA-N D-Glucose 6-phosphate Chemical compound OC1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H](O)[C@H]1O NBSCHQHZLSJFNQ-GASJEMHNSA-N 0.000 description 4
- SRBFZHDQGSBBOR-IOVATXLUSA-N D-xylopyranose Chemical compound O[C@@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-IOVATXLUSA-N 0.000 description 4
- VFRROHXSMXFLSN-UHFFFAOYSA-N Glc6P Natural products OP(=O)(O)OCC(O)C(O)C(O)C(O)C=O VFRROHXSMXFLSN-UHFFFAOYSA-N 0.000 description 4
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 4
- 239000004472 Lysine Substances 0.000 description 4
- 241000282560 Macaca mulatta Species 0.000 description 4
- OVRNDRQMDRJTHS-CBQIKETKSA-N N-Acetyl-D-Galactosamine Chemical compound CC(=O)N[C@H]1[C@@H](O)O[C@H](CO)[C@H](O)[C@@H]1O OVRNDRQMDRJTHS-CBQIKETKSA-N 0.000 description 4
- OVRNDRQMDRJTHS-KEWYIRBNSA-N N-acetyl-D-galactosamine Chemical compound CC(=O)N[C@H]1C(O)O[C@H](CO)[C@H](O)[C@@H]1O OVRNDRQMDRJTHS-KEWYIRBNSA-N 0.000 description 4
- OVRNDRQMDRJTHS-FMDGEEDCSA-N N-acetyl-beta-D-glucosamine Chemical compound CC(=O)N[C@H]1[C@H](O)O[C@H](CO)[C@@H](O)[C@@H]1O OVRNDRQMDRJTHS-FMDGEEDCSA-N 0.000 description 4
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 4
- 230000003115 biocidal effect Effects 0.000 description 4
- 238000012217 deletion Methods 0.000 description 4
- 230000037430 deletion Effects 0.000 description 4
- 108020001507 fusion proteins Proteins 0.000 description 4
- 102000037865 fusion proteins Human genes 0.000 description 4
- 238000010353 genetic engineering Methods 0.000 description 4
- 230000012010 growth Effects 0.000 description 4
- 230000010354 integration Effects 0.000 description 4
- 210000004379 membrane Anatomy 0.000 description 4
- 239000012528 membrane Substances 0.000 description 4
- 239000001301 oxygen Substances 0.000 description 4
- 230000019635 sulfation Effects 0.000 description 4
- 238000005670 sulfation reaction Methods 0.000 description 4
- 230000000153 supplemental effect Effects 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 3
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 3
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 3
- 241000701248 Chlorella virus Species 0.000 description 3
- 241000196324 Embryophyta Species 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- 229930091371 Fructose Natural products 0.000 description 3
- RFSUNEUAIZKAJO-ARQDHWQXSA-N Fructose Chemical compound OC[C@H]1O[C@](O)(CO)[C@@H](O)[C@@H]1O RFSUNEUAIZKAJO-ARQDHWQXSA-N 0.000 description 3
- 239000005715 Fructose Substances 0.000 description 3
- IAJILQKETJEXLJ-UHFFFAOYSA-N Galacturonsaeure Natural products O=CC(O)C(O)C(O)C(O)C(O)=O IAJILQKETJEXLJ-UHFFFAOYSA-N 0.000 description 3
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 101150009006 HIS3 gene Proteins 0.000 description 3
- 241000282412 Homo Species 0.000 description 3
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 3
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 3
- 241000124008 Mammalia Species 0.000 description 3
- OVRNDRQMDRJTHS-UHFFFAOYSA-N N-acelyl-D-glucosamine Natural products CC(=O)NC1C(O)OC(CO)C(O)C1O OVRNDRQMDRJTHS-UHFFFAOYSA-N 0.000 description 3
- MBLBDJOUHNCFQT-LXGUWJNJSA-N N-acetylglucosamine Natural products CC(=O)N[C@@H](C=O)[C@@H](O)[C@H](O)[C@H](O)CO MBLBDJOUHNCFQT-LXGUWJNJSA-N 0.000 description 3
- 108700026244 Open Reading Frames Proteins 0.000 description 3
- 241001440673 Saccharomyces arboricola Species 0.000 description 3
- 241000198063 Saccharomyces kudriavzevii Species 0.000 description 3
- 229920002472 Starch Polymers 0.000 description 3
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 3
- 239000004473 Threonine Substances 0.000 description 3
- 239000002253 acid Substances 0.000 description 3
- WQZGKKKJIJFFOK-PHYPRBDBSA-N alpha-D-galactose Chemical compound OC[C@H]1O[C@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-PHYPRBDBSA-N 0.000 description 3
- 239000003242 anti bacterial agent Substances 0.000 description 3
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- GUBGYTABKSRVRQ-QUYVBRFLSA-N beta-maltose Chemical compound OC[C@H]1O[C@H](O[C@H]2[C@H](O)[C@@H](O)[C@H](O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@@H]1O GUBGYTABKSRVRQ-QUYVBRFLSA-N 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 230000004656 cell transport Effects 0.000 description 3
- 239000001913 cellulose Substances 0.000 description 3
- 229920002678 cellulose Polymers 0.000 description 3
- 230000002759 chromosomal effect Effects 0.000 description 3
- 230000006866 deterioration Effects 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 235000013355 food flavoring agent Nutrition 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 229930182830 galactose Natural products 0.000 description 3
- 238000012239 gene modification Methods 0.000 description 3
- 230000005017 genetic modification Effects 0.000 description 3
- 235000013617 genetically modified food Nutrition 0.000 description 3
- 230000002401 inhibitory effect Effects 0.000 description 3
- 239000008101 lactose Substances 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 229910052757 nitrogen Inorganic materials 0.000 description 3
- 229920001542 oligosaccharide Polymers 0.000 description 3
- 150000002482 oligosaccharides Chemical class 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000003248 secreting effect Effects 0.000 description 3
- 239000008107 starch Substances 0.000 description 3
- 235000019698 starch Nutrition 0.000 description 3
- 229940032147 starch Drugs 0.000 description 3
- 150000008163 sugars Chemical class 0.000 description 3
- 238000011282 treatment Methods 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 230000035899 viability Effects 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- MSWZFWKMSRAUBD-IVMDWMLBSA-N 2-amino-2-deoxy-D-glucopyranose Chemical compound N[C@H]1C(O)O[C@H](CO)[C@@H](O)[C@@H]1O MSWZFWKMSRAUBD-IVMDWMLBSA-N 0.000 description 2
- ZHBXLZQQVCDGPA-UHFFFAOYSA-N 5-[(1,3-dioxo-2-benzofuran-5-yl)sulfonyl]-2-benzofuran-1,3-dione Chemical compound C1=C2C(=O)OC(=O)C2=CC(S(=O)(=O)C=2C=C3C(=O)OC(C3=CC=2)=O)=C1 ZHBXLZQQVCDGPA-UHFFFAOYSA-N 0.000 description 2
- UJOBWOGCFQCDNV-UHFFFAOYSA-N 9H-carbazole Chemical compound C1=CC=C2C3=CC=CC=C3NC2=C1 UJOBWOGCFQCDNV-UHFFFAOYSA-N 0.000 description 2
- NLXLAEXVIDQMFP-UHFFFAOYSA-N Ammonia chloride Chemical compound [NH4+].[Cl-] NLXLAEXVIDQMFP-UHFFFAOYSA-N 0.000 description 2
- 244000063299 Bacillus subtilis Species 0.000 description 2
- 235000014469 Bacillus subtilis Nutrition 0.000 description 2
- 241000222173 Candida parapsilosis Species 0.000 description 2
- 108700040089 Chitin synthases Proteins 0.000 description 2
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 2
- 241001136648 Debaryomyces udenii Species 0.000 description 2
- 101000833492 Homo sapiens Jouberin Proteins 0.000 description 2
- 101000651236 Homo sapiens NCK-interacting protein with SH3 domain Proteins 0.000 description 2
- 102000009066 Hyaluronoglucosaminidase Human genes 0.000 description 2
- 206010023232 Joint swelling Diseases 0.000 description 2
- 102100024407 Jouberin Human genes 0.000 description 2
- 241000500435 Kluyveromyces dobzhanskii Species 0.000 description 2
- 241000500414 Kluyveromyces wickerhamii Species 0.000 description 2
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 2
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 2
- 101150007280 LEU2 gene Proteins 0.000 description 2
- CSNNHWWHGAXBCP-UHFFFAOYSA-L Magnesium sulfate Chemical compound [Mg+2].[O-][S+2]([O-])([O-])[O-] CSNNHWWHGAXBCP-UHFFFAOYSA-L 0.000 description 2
- PVNIIMVLHYAWGP-UHFFFAOYSA-N Niacin Chemical compound OC(=O)C1=CC=CN=C1 PVNIIMVLHYAWGP-UHFFFAOYSA-N 0.000 description 2
- 108700027408 O-acetylhomoserine (thiol)-lyase Proteins 0.000 description 2
- 101150116218 PROT1 gene Proteins 0.000 description 2
- 239000001888 Peptone Substances 0.000 description 2
- 108010080698 Peptones Proteins 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- 235000018370 Saccharomyces delbrueckii Nutrition 0.000 description 2
- 241000235343 Saccharomycetales Species 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- 244000288561 Torulaspora delbrueckii Species 0.000 description 2
- 102000005924 Triose-Phosphate Isomerase Human genes 0.000 description 2
- 108700015934 Triose-phosphate isomerases Proteins 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- 239000005862 Whey Substances 0.000 description 2
- 108010046377 Whey Proteins Proteins 0.000 description 2
- 102000007544 Whey Proteins Human genes 0.000 description 2
- 150000007513 acids Chemical class 0.000 description 2
- 238000007792 addition Methods 0.000 description 2
- VFRROHXSMXFLSN-SLPGGIOYSA-N aldehydo-D-glucose 6-phosphate Chemical class OP(=O)(O)OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C=O VFRROHXSMXFLSN-SLPGGIOYSA-N 0.000 description 2
- IAJILQKETJEXLJ-QTBDOELSSA-N aldehydo-D-glucuronic acid Chemical compound O=C[C@H](O)[C@@H](O)[C@H](O)[C@H](O)C(O)=O IAJILQKETJEXLJ-QTBDOELSSA-N 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 2
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 2
- 235000011130 ammonium sulphate Nutrition 0.000 description 2
- 229940088710 antibiotic agent Drugs 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- MSWZFWKMSRAUBD-UHFFFAOYSA-N beta-D-galactosamine Natural products NC1C(O)OC(CO)C(O)C1O MSWZFWKMSRAUBD-UHFFFAOYSA-N 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 101150038738 ble gene Proteins 0.000 description 2
- 229940041514 candida albicans extract Drugs 0.000 description 2
- 229940055022 candida parapsilosis Drugs 0.000 description 2
- 230000010261 cell growth Effects 0.000 description 2
- 235000013351 cheese Nutrition 0.000 description 2
- 229940094517 chondroitin 4-sulfate Drugs 0.000 description 2
- KXKPYJOVDUMHGS-OSRGNVMNSA-N chondroitin sulfate Chemical compound CC(=O)N[C@H]1[C@H](O)O[C@H](OS(O)(=O)=O)[C@H](O)[C@@H]1O[C@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](C(O)=O)O1 KXKPYJOVDUMHGS-OSRGNVMNSA-N 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000007850 degeneration Effects 0.000 description 2
- 239000008121 dextrose Substances 0.000 description 2
- 150000002016 disaccharides Chemical group 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 235000021472 generally recognized as safe Nutrition 0.000 description 2
- 229960002442 glucosamine Drugs 0.000 description 2
- 229940097043 glucuronic acid Drugs 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 230000006698 induction Effects 0.000 description 2
- 239000004615 ingredient Substances 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000004060 metabolic process Effects 0.000 description 2
- 235000013379 molasses Nutrition 0.000 description 2
- 229910000402 monopotassium phosphate Inorganic materials 0.000 description 2
- 235000019796 monopotassium phosphate Nutrition 0.000 description 2
- 150000002772 monosaccharides Chemical class 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 235000015097 nutrients Nutrition 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 235000019319 peptone Nutrition 0.000 description 2
- 239000012466 permeate Substances 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- GNSKLFRGEWLPPA-UHFFFAOYSA-M potassium dihydrogen phosphate Chemical compound [K+].OP(O)([O-])=O GNSKLFRGEWLPPA-UHFFFAOYSA-M 0.000 description 2
- LWIHDJKSTIGBAC-UHFFFAOYSA-K potassium phosphate Substances [K+].[K+].[K+].[O-]P([O-])([O-])=O LWIHDJKSTIGBAC-UHFFFAOYSA-K 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 238000002864 sequence alignment Methods 0.000 description 2
- 210000003491 skin Anatomy 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 239000012138 yeast extract Substances 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- PAWQVTBBRAZDMG-UHFFFAOYSA-N 2-(3-bromo-2-fluorophenyl)acetic acid Chemical compound OC(=O)CC1=CC=CC(Br)=C1F PAWQVTBBRAZDMG-UHFFFAOYSA-N 0.000 description 1
- 101150096273 ADE2 gene Proteins 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 1
- 239000004254 Ammonium phosphate Substances 0.000 description 1
- 241000256836 Apis Species 0.000 description 1
- 235000016068 Berberis vulgaris Nutrition 0.000 description 1
- 241000335053 Beta vulgaris Species 0.000 description 1
- 102100030981 Beta-alanine-activating enzyme Human genes 0.000 description 1
- 108010006654 Bleomycin Proteins 0.000 description 1
- 101100327917 Caenorhabditis elegans chup-1 gene Proteins 0.000 description 1
- 101100459439 Caenorhabditis elegans nac-2 gene Proteins 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 241000144583 Candida dubliniensis Species 0.000 description 1
- 241001660259 Cereus <cactus> Species 0.000 description 1
- 101710190010 Chitin synthase chs-2 Proteins 0.000 description 1
- 102100029305 Chondroitin sulfate synthase 3 Human genes 0.000 description 1
- 241001508813 Clavispora lusitaniae Species 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- 241000235646 Cyberlindnera jadinii Species 0.000 description 1
- GUBGYTABKSRVRQ-CUHNMECISA-N D-Cellobiose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-CUHNMECISA-N 0.000 description 1
- MTCFGRXMJLQNBG-UWTATZPHSA-N D-Serine Chemical compound OC[C@@H](N)C(O)=O MTCFGRXMJLQNBG-UWTATZPHSA-N 0.000 description 1
- 229930195711 D-Serine Natural products 0.000 description 1
- 239000011665 D-biotin Substances 0.000 description 1
- 235000000638 D-biotin Nutrition 0.000 description 1
- LKDRXBCSQODPBY-VRPWFDPXSA-N D-fructopyranose Chemical compound OCC1(O)OC[C@@H](O)[C@@H](O)[C@@H]1O LKDRXBCSQODPBY-VRPWFDPXSA-N 0.000 description 1
- 238000012270 DNA recombination Methods 0.000 description 1
- 241001123230 Debaryomyces coudertii Species 0.000 description 1
- 241001123229 Debaryomyces maramus Species 0.000 description 1
- 241001123214 Debaryomyces nepalensis Species 0.000 description 1
- 241000236538 Debaryomyces psychrosporus Species 0.000 description 1
- 108091029865 Exogenous DNA Proteins 0.000 description 1
- 108010037362 Extracellular Matrix Proteins Proteins 0.000 description 1
- 102000010834 Extracellular Matrix Proteins Human genes 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 101710141682 Galactofuranosyltransferase GlfT2 Proteins 0.000 description 1
- 229920002488 Hemicellulose Polymers 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 101000884385 Homo sapiens Arylamine N-acetyltransferase 1 Proteins 0.000 description 1
- 101000773364 Homo sapiens Beta-alanine-activating enzyme Proteins 0.000 description 1
- 101001034811 Homo sapiens Eukaryotic translation initiation factor 4 gamma 2 Proteins 0.000 description 1
- 101000639975 Homo sapiens Sodium-dependent noradrenaline transporter Proteins 0.000 description 1
- 240000005979 Hordeum vulgare Species 0.000 description 1
- 235000007340 Hordeum vulgare Nutrition 0.000 description 1
- 102100021082 Hyaluronidase-3 Human genes 0.000 description 1
- 108050004076 Hyaluronidase-3 Proteins 0.000 description 1
- GRRNUXAQVGOGFE-UHFFFAOYSA-N Hygromycin-B Natural products OC1C(NC)CC(N)C(O)C1OC1C2OC3(C(C(O)C(O)C(C(N)CO)O3)O)OC2C(O)C(CO)O1 GRRNUXAQVGOGFE-UHFFFAOYSA-N 0.000 description 1
- 229910021578 Iron(III) chloride Inorganic materials 0.000 description 1
- 239000007836 KH2PO4 Substances 0.000 description 1
- 241000588747 Klebsiella pneumoniae Species 0.000 description 1
- 241000235058 Komagataella pastoris Species 0.000 description 1
- 101150060341 LYP1 gene Proteins 0.000 description 1
- 101150044775 LYS1 gene Proteins 0.000 description 1
- DUKURNFHYQXCJG-UHFFFAOYSA-N Lewis A pentasaccharide Natural products OC1C(O)C(O)C(C)OC1OC1C(OC2C(C(O)C(O)C(CO)O2)O)C(NC(C)=O)C(OC2C(C(OC3C(OC(O)C(O)C3O)CO)OC(CO)C2O)O)OC1CO DUKURNFHYQXCJG-UHFFFAOYSA-N 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 241000209510 Liliopsida Species 0.000 description 1
- 102000055008 Matrilin Proteins Human genes 0.000 description 1
- 108010072582 Matrilin Proteins Proteins 0.000 description 1
- 241000235048 Meyerozyma guilliermondii Species 0.000 description 1
- 229910017234 MnSO4 H2O Inorganic materials 0.000 description 1
- GXCLVBGFBYZDAG-UHFFFAOYSA-N N-[2-(1H-indol-3-yl)ethyl]-N-methylprop-2-en-1-amine Chemical compound CN(CCC1=CNC2=C1C=CC=C2)CC=C GXCLVBGFBYZDAG-UHFFFAOYSA-N 0.000 description 1
- 239000007832 Na2SO4 Substances 0.000 description 1
- 108091005461 Nucleic proteins Proteins 0.000 description 1
- 241000320412 Ogataea angusta Species 0.000 description 1
- 241000537784 Ogataea deakii Species 0.000 description 1
- 241000467261 Ogataea histrianica Species 0.000 description 1
- 241000489469 Ogataea kodamae Species 0.000 description 1
- 241000467262 Ogataea kolombanensis Species 0.000 description 1
- 241001489174 Ogataea minuta Species 0.000 description 1
- 241000522645 Ogataea nonfermentans Species 0.000 description 1
- 241001563619 Ogataea parapolymorpha Species 0.000 description 1
- 241001600670 Ogataea philodendri Species 0.000 description 1
- 241001033367 Ogataea siamensis Species 0.000 description 1
- 241001136637 Priceomyces carsonii Species 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 102000018120 Recombinases Human genes 0.000 description 1
- 108010091086 Recombinases Proteins 0.000 description 1
- 101100394989 Rhodopseudomonas palustris (strain ATCC BAA-98 / CGA009) hisI gene Proteins 0.000 description 1
- 241000198071 Saccharomyces cariocanus Species 0.000 description 1
- 101100386089 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) MET17 gene Proteins 0.000 description 1
- 241001123227 Saccharomyces pastorianus Species 0.000 description 1
- 241000582914 Saccharomyces uvarum Species 0.000 description 1
- 241000235344 Saccharomycetaceae Species 0.000 description 1
- 241000235342 Saccharomycetes Species 0.000 description 1
- 235000012377 Salvia columbariae var. columbariae Nutrition 0.000 description 1
- 240000005481 Salvia hispanica Species 0.000 description 1
- 235000001498 Salvia hispanica Nutrition 0.000 description 1
- 241001123231 Schwanniomyces capriottii Species 0.000 description 1
- 241001123650 Schwanniomyces occidentalis Species 0.000 description 1
- 241001123645 Schwanniomyces yamadae Species 0.000 description 1
- PMZURENOXWZQFD-UHFFFAOYSA-L Sodium Sulfate Chemical compound [Na+].[Na+].[O-]S([O-])(=O)=O PMZURENOXWZQFD-UHFFFAOYSA-L 0.000 description 1
- 102100033929 Sodium-dependent noradrenaline transporter Human genes 0.000 description 1
- 241000203644 Streptoalloteichus hindustanus Species 0.000 description 1
- 241000187310 Streptomyces noursei Species 0.000 description 1
- QAOWNCQODCNURD-UHFFFAOYSA-N Sulfuric acid Chemical compound OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 1
- 101150006914 TRP1 gene Proteins 0.000 description 1
- 101150050575 URA3 gene Proteins 0.000 description 1
- 241001597853 Yarrowia alimentaria Species 0.000 description 1
- 241001503229 Yarrowia galli Species 0.000 description 1
- 241000841254 Yarrowia yakushimensis Species 0.000 description 1
- 108010084455 Zeocin Proteins 0.000 description 1
- NRAUADCLPJTGSF-ZPGVOIKOSA-N [(2r,3s,4r,5r,6r)-6-[[(3as,7r,7as)-7-hydroxy-4-oxo-1,3a,5,6,7,7a-hexahydroimidazo[4,5-c]pyridin-2-yl]amino]-5-[[(3s)-3,6-diaminohexanoyl]amino]-4-hydroxy-2-(hydroxymethyl)oxan-3-yl] carbamate Chemical compound NCCC[C@H](N)CC(=O)N[C@@H]1[C@@H](O)[C@H](OC(N)=O)[C@@H](CO)O[C@H]1\N=C/1N[C@H](C(=O)NC[C@H]2O)[C@@H]2N\1 NRAUADCLPJTGSF-ZPGVOIKOSA-N 0.000 description 1
- 239000006096 absorbing agent Substances 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- AEMOLEFTQBMNLQ-WAXACMCWSA-N alpha-D-glucuronic acid Chemical compound O[C@H]1O[C@H](C(O)=O)[C@@H](O)[C@H](O)[C@H]1O AEMOLEFTQBMNLQ-WAXACMCWSA-N 0.000 description 1
- 235000019270 ammonium chloride Nutrition 0.000 description 1
- 229910000148 ammonium phosphate Inorganic materials 0.000 description 1
- 235000019289 ammonium phosphates Nutrition 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 239000008346 aqueous phase Substances 0.000 description 1
- 235000013405 beer Nutrition 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000003181 biological factor Substances 0.000 description 1
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 1
- 229960001561 bleomycin Drugs 0.000 description 1
- OYVAGSVQBOHSSS-UAPAGMARSA-O bleomycin A2 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC=C(N=1)C=1SC=C(N=1)C(=O)NCCC[S+](C)C)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C OYVAGSVQBOHSSS-UAPAGMARSA-O 0.000 description 1
- 235000008429 bread Nutrition 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 235000011148 calcium chloride Nutrition 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- KUKRZUPDYACRAM-GXIDORRSSA-L calcium;3-[[(2r)-2,4-dihydroxy-3,3-dimethylbutanoyl]amino]propanoate;hydrate Chemical compound O.[Ca+2].OCC(C)(C)[C@@H](O)C(=O)NCCC([O-])=O.OCC(C)(C)[C@@H](O)C(=O)NCCC([O-])=O KUKRZUPDYACRAM-GXIDORRSSA-L 0.000 description 1
- 239000002775 capsule Substances 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 235000013877 carbamide Nutrition 0.000 description 1
- 230000025938 carbohydrate utilization Effects 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 235000014167 chia Nutrition 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 150000001868 cobalt Chemical class 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 210000002808 connective tissue Anatomy 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 229910000366 copper(II) sulfate Inorganic materials 0.000 description 1
- 230000002559 cytogenic effect Effects 0.000 description 1
- MNNHAPBLZZVQHP-UHFFFAOYSA-N diammonium hydrogen phosphate Chemical compound [NH4+].[NH4+].OP([O-])([O-])=O MNNHAPBLZZVQHP-UHFFFAOYSA-N 0.000 description 1
- ZPWVASYFFYYZEW-UHFFFAOYSA-L dipotassium hydrogen phosphate Chemical compound [K+].[K+].OP([O-])([O-])=O ZPWVASYFFYYZEW-UHFFFAOYSA-L 0.000 description 1
- 235000019797 dipotassium phosphate Nutrition 0.000 description 1
- 229910000396 dipotassium phosphate Inorganic materials 0.000 description 1
- 230000002222 downregulating effect Effects 0.000 description 1
- 230000003828 downregulation Effects 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000009483 enzymatic pathway Effects 0.000 description 1
- 210000002744 extracellular matrix Anatomy 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000010363 gene targeting Methods 0.000 description 1
- 230000004077 genetic alteration Effects 0.000 description 1
- 231100000118 genetic alteration Toxicity 0.000 description 1
- 238000010362 genome editing Methods 0.000 description 1
- 125000002791 glucosyl group Chemical group C1([C@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 150000004676 glycans Polymers 0.000 description 1
- 235000011187 glycerol Nutrition 0.000 description 1
- 150000002337 glycosamines Chemical class 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 239000007952 growth promoter Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- XLYOFNOQVPJJNP-ZSJDYOACSA-N heavy water Substances [2H]O[2H] XLYOFNOQVPJJNP-ZSJDYOACSA-N 0.000 description 1
- 150000002402 hexoses Chemical class 0.000 description 1
- 101150029559 hph gene Proteins 0.000 description 1
- GRRNUXAQVGOGFE-NZSRVPFOSA-N hygromycin B Chemical compound O[C@@H]1[C@@H](NC)C[C@@H](N)[C@H](O)[C@H]1O[C@H]1[C@H]2O[C@@]3([C@@H]([C@@H](O)[C@@H](O)[C@@H](C(N)CO)O3)O)O[C@H]2[C@@H](O)[C@@H](CO)O1 GRRNUXAQVGOGFE-NZSRVPFOSA-N 0.000 description 1
- 229940097277 hygromycin b Drugs 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 229910052500 inorganic mineral Inorganic materials 0.000 description 1
- 229960000367 inositol Drugs 0.000 description 1
- CDAISMWEOUEBRE-GPIVLXJGSA-N inositol Chemical compound O[C@H]1[C@H](O)[C@@H](O)[C@H](O)[C@H](O)[C@@H]1O CDAISMWEOUEBRE-GPIVLXJGSA-N 0.000 description 1
- RBTARNINKXHZNM-UHFFFAOYSA-K iron trichloride Chemical compound Cl[Fe](Cl)Cl RBTARNINKXHZNM-UHFFFAOYSA-K 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 230000008407 joint function Effects 0.000 description 1
- 210000005067 joint tissue Anatomy 0.000 description 1
- 210000000629 knee joint Anatomy 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 1
- 239000000314 lubricant Substances 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 159000000003 magnesium salts Chemical class 0.000 description 1
- 229910052943 magnesium sulfate Inorganic materials 0.000 description 1
- 235000019341 magnesium sulphate Nutrition 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 150000002696 manganese Chemical class 0.000 description 1
- ISPYRSDWRDQNSW-UHFFFAOYSA-L manganese(II) sulfate monohydrate Chemical compound O.[Mn+2].[O-]S([O-])(=O)=O ISPYRSDWRDQNSW-UHFFFAOYSA-L 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 235000013372 meat Nutrition 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 230000037353 metabolic pathway Effects 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 235000010755 mineral Nutrition 0.000 description 1
- 239000011707 mineral Substances 0.000 description 1
- 230000003020 moisturizing effect Effects 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 229960003512 nicotinic acid Drugs 0.000 description 1
- 235000001968 nicotinic acid Nutrition 0.000 description 1
- 239000011664 nicotinic acid Substances 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- AHLBNYSZXLDEJQ-FWEHEUNISA-N orlistat Chemical compound CCCCCCCCCCC[C@H](OC(=O)[C@H](CC(C)C)NC=O)C[C@@H]1OC(=O)[C@H]1CCCCCC AHLBNYSZXLDEJQ-FWEHEUNISA-N 0.000 description 1
- 230000020477 pH reduction Effects 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 150000002972 pentoses Chemical class 0.000 description 1
- CWCMIVBLVUHDHK-ZSNHEYEWSA-N phleomycin D1 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC[C@@H](N=1)C=1SC=C(N=1)C(=O)NCCCCNC(N)=N)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C CWCMIVBLVUHDHK-ZSNHEYEWSA-N 0.000 description 1
- OTYBMLCTZGSZBG-UHFFFAOYSA-L potassium sulfate Chemical compound [K+].[K+].[O-]S([O-])(=O)=O OTYBMLCTZGSZBG-UHFFFAOYSA-L 0.000 description 1
- 229910052939 potassium sulfate Inorganic materials 0.000 description 1
- 239000013630 prepared media Substances 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- ZUFQODAHGAHPFQ-UHFFFAOYSA-N pyridoxine hydrochloride Chemical compound Cl.CC1=NC=C(CO)C(CO)=C1O ZUFQODAHGAHPFQ-UHFFFAOYSA-N 0.000 description 1
- 229960004172 pyridoxine hydrochloride Drugs 0.000 description 1
- 235000019171 pyridoxine hydrochloride Nutrition 0.000 description 1
- 239000011764 pyridoxine hydrochloride Substances 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000001718 repressive effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- CDAISMWEOUEBRE-UHFFFAOYSA-N scyllo-inosotol Natural products OC1C(O)C(O)C(O)C(O)C1O CDAISMWEOUEBRE-UHFFFAOYSA-N 0.000 description 1
- 239000006152 selective media Substances 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 230000009131 signaling function Effects 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 229910052938 sodium sulfate Inorganic materials 0.000 description 1
- 235000011152 sodium sulphate Nutrition 0.000 description 1
- 238000010532 solid phase synthesis reaction Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- BDHFUVZGWQCTTF-UHFFFAOYSA-M sulfonate Chemical compound [O-]S(=O)=O BDHFUVZGWQCTTF-UHFFFAOYSA-M 0.000 description 1
- 235000011149 sulphuric acid Nutrition 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 230000009469 supplementation Effects 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 230000008961 swelling Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- DPJRMOMPQZCRJU-UHFFFAOYSA-M thiamine hydrochloride Chemical compound Cl.[Cl-].CC1=C(CCO)SC=[N+]1CC1=CN=C(C)N=C1N DPJRMOMPQZCRJU-UHFFFAOYSA-M 0.000 description 1
- 229960000344 thiamine hydrochloride Drugs 0.000 description 1
- 235000019190 thiamine hydrochloride Nutrition 0.000 description 1
- 239000011747 thiamine hydrochloride Substances 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 239000011573 trace mineral Substances 0.000 description 1
- 235000013619 trace mineral Nutrition 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- YWYZEGXAUVWDED-UHFFFAOYSA-N triammonium citrate Chemical compound [NH4+].[NH4+].[NH4+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O YWYZEGXAUVWDED-UHFFFAOYSA-N 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 201000008827 tuberculosis Diseases 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
- 230000003827 upregulation Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 235000014101 wine Nutrition 0.000 description 1
- 239000007222 ypd medium Substances 0.000 description 1
- NWONKYPBYAMBJT-UHFFFAOYSA-L zinc sulfate Chemical compound [Zn+2].[O-]S([O-])(=O)=O NWONKYPBYAMBJT-UHFFFAOYSA-L 0.000 description 1
- 229910000368 zinc sulfate Inorganic materials 0.000 description 1
- 239000011686 zinc sulphate Substances 0.000 description 1
- 235000009529 zinc sulphate Nutrition 0.000 description 1
- UZVNCLCLJHPHIF-NOJKMYKQSA-J zinc;(1e)-2-(ethylcarbamoylamino)-n-methoxy-2-oxoethanimidoyl cyanide;manganese(2+);n-[2-(sulfidocarbothioylamino)ethyl]carbamodithioate Chemical compound [Mn+2].[Zn+2].[S-]C(=S)NCCNC([S-])=S.[S-]C(=S)NCCNC([S-])=S.CCNC(=O)NC(=O)C(\C#N)=N\OC UZVNCLCLJHPHIF-NOJKMYKQSA-J 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0006—Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/001—Oxidoreductases (1.) acting on the CH-CH group of donors (1.3)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1048—Glycosyltransferases (2.4)
- C12N9/1051—Hexosyltransferases (2.4.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/90—Isomerases (5.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/26—Preparation of nitrogen-containing carbohydrates
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- Medicinal Chemistry (AREA)
- Mycology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Cosmetics (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
Abstract
본 발명은 콘드로이틴의 생물생산 (bio-production) 분야에 관한 것이다. 당업계에서는 콘드로이틴의 매우 효율적인 합성 및 분비를 가능하게 하는 콘드로이틴 생산 방법에 대한 필요성이 존재한다. 본 발명에서 제안된 용액은 본 명세서에 기재된 바와 같은 많은 변형을 포함하는 재조합 세포, 특히 재조합 효모의 용도이다. 또한, 본 발명은 재조합 세포, 특히 본 발명의 재조합 효모를 이용하여 콘드로이틴을 생물생산하는 방법을 제안한다.
Description
본 발명은 콘드로이틴의 생물생산 (bio-production) 분야에 관한 것이다.
콘드로이틴은 사람과 동물의 결합 조직에서 자연적으로 발생하는 고분자량 다당류이다. 콘드로이틴은 글리코사미노글리칸이라 불리는 헤테로다당류 계통에 속한다.
글리코사미노글리칸 (GAGs) 또는 뮤코다당류는 산성 당 및 아미노 당 (N-아세틸글루코사민 또는 N-아세틸갈락토사민) 을 포함하는 반복 이당류 단위로 구성된 비분지형의, 음전하 다당류 사슬이다. 유연하지 않은 성질과 높은 음전하 때문에, GAG 는 신체에서 윤활제 또는 충격 흡수제로서 사용된다. 예를 들어 GAG 가 풍부한 무릎 관절을 감싸는 연골 매트릭스는 이러한 기작에 의해 수백 기압의 압력을 지탱할 수 있다.
D-글루쿠론산 및 N-아세틸-D-갈락토사민으로 형성된 콘드로이틴은 황산화될 수 있다. 콘드로이틴 설페이트는 연골 강도와 탄력 유지에 중요하며 관절 통증을 감소시키고 건강한 연골과 관절 기능을 촉진하는 영양 보충제로 시판되고 있다. 임상 연구는 골관절염의 치료를 위한 콘드로이틴 및 콘드로이틴 설페이트의 사용을 지지한다.
콘드로이틴 설페이트 또는 콘드로이틴은 피부의 관절 조직의 세포외 매트릭스에 자연적으로 존재하므로, 화장품 적용, 특히 피부 보습, 개선 및 진정, 또는 모발 컨디셔너의 성분으로도 사용된다.
현재, 콘드로이틴은 주로 동물의 연골에서 화학적 및 효소적 처리를 이용하여 추출에 의해 생성되어, 단백질로부터 다당류를 해리시키고 다양한 품질의 다당류 산물을 생성한다. 그러나, 이들 방법은 수고롭고 고가일 수 있다.
이와 같이, 콘드로이틴의 미생물 생산이 제안되었다. 실제로, 특정 박테리아는 그들의 캡슐의 성분으로서 콘드로이틴 및 콘드로이틴-유사 다당류 중합체를 생성한다. 그러나, 이러한 공지된 박테리아, 예를 들어 파스튜렐라 물토시다 (Pasteurella multocida) 또는 에스케리키아 콜라이 (Escherichia coli) 는 많은 포유동물에게 병원균이며, 적은 양의 다당류를 생성한다.
그 결과, 콘드로이틴의 생산을 위한 재조합 미생물, 특히 재조합 박테리아에 대한 연구가 이루어지고 있다. 예를 들어, WO2011109438, EP2142643, 또는 US20090263867 이 언급될 수 있다.
생물학적 분자의 생산에 흔히 사용되는 다른 미생물과는 달리, 효모는 일반적으로 안전한 것으로 인식된다. 이들은 박테리아와 비교하여 빠르게 성장하고 더 높은 밀도에서 재배될 수 있으며, 무균 환경을 요구하지 않는다. 또한 효모 세포는 박테리아보다 배양 배지로부터 쉽게 분리될 수 있어, 생성물 추출 및 정제 과정을 크게 단순화시킬 수 있다. 마지막으로, 효모는 배양 배지의 pH 변화에 대해 더 저항성인 이점을 제시하며, 이와 같이 더 강한 발효 시스템을 나타낸다.
그러나, 효모 중에서, 종들 사이에서 특성을 구별하는 것은 또한 특정 과제를 제시할 수 있다. 이는 주로 종들 사이의 신진대사 및 이들의 배양 조건의 차이로 인한 것이다.
그러나, 본 발명자는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 는 인간에 의해 사용되는 경우 (예컨대 와인, 맥주 또는 빵에서) 긴 안전한 역사를 갖고 있고, 따라서 당업계에 잘 알려진 유전 정보를 갖는 잘 확립된 모델이기 때문에, 관심 분자의 생산을 위한 도구로서 특히 유용하다는 것을 밝혀냈다. S. 세레비지에 (S. cerevisiae) 는 일반적으로 인간과 동물에게 안전하다고 인식되는 장점을 더 제시한다. 게다가, 이러한 효모를 배양할 때 발생하는 배지의 산성화는 생물 발효기의 오염 가능성을 감소시키며, 따라서 배지에 항생제를 첨가할 필요응 감소시킨다. 마지막으로, 그의 게놈의 안정한 변형 (염색체 내 통합) 을 가능하게 하는 많은 유전적 도구가 개발되었다.
따라서, 당업계에서는 콘드로이틴의 매우 효율적인 합성 및 분비를 가능하게 하는 추가의 콘드로이틴 생산 방법에 대한 필요성이 여전히 존재한다. 특히, 비용 효율적이고 인간 적용에 안전한 콘드로이틴을 공급하는 생산 방법을 제공할 필요성이 여전히 존재한다.
특별한 경우, 당업계에서는 특정하고 제어된 크기의 콘드로이틴을 대량으로 수득할 수 있게 하는 콘드로이틴 생산 방법에 대한 필요성이 여전히 존재한다.
따라서 본 발명은 하기 항목에 관한 것이다.
항목 1: 콘드로이틴을 생산하는 재조합 효모 세포로서,
(a) 콘드로이틴 신타아제 (HCOS) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산; 및
(b) UDP-글루코오스 탈수소효소 (UDP-GlcDH 또는 HASB) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산; 및
(c) UDP-글루코오스-4-에피머라아제 (kfoA 또는 GNE1) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산을 포함하는 재조합 효모 세포.
실시예에 예시된 바와 같이, 본 발명의 재조합 효모는 자연적으로 이 글리코사미노글리칸틴을 생산할 수 없는 효모 세포에서 콘드로이틴의 생산을 가능하게 한다. 재조합 효모에 의해 생산되는 콘드로이틴의 크기를 조절할 수 있음을 실시예에서 추가로 입증하였다.
상기 유리한 특성은 효모를 이하 기재된 추가적인 변형과 재조합하여 추가로 증가될 수 있다.
항목 2: 항목 1 에 있어서, 재조합 세포가 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산을 포함하고, 콘드로이티나아제 활성을 갖는 폴리펩티드가 분비 신호, 및 임의로는 고정 신호를 포함하는 것인 재조합 세포.
항목 3: 콘드로이틴을 생산하는 재조합 숙주 세포로서,
(a) 콘드로이틴 신타아제 (HCOS) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산; 및
(b) UDP-글루코오스 탈수소효소 (UDP-GlcDH 또는 HASB) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산;
(c) UDP-글루코오스-4-에피머라아제 (kfoA 또는 GNE1) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산; 및
(d) 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산으로서, 콘드로이티나아제 활성을 갖는 폴리펩티드는 분비 신호를 포함하거나 분비 신호, 및 임의로는 고정 신호를 포함하여, 콘드로이틴, 특히 원하는 분자량의 콘드로이틴이 숙주 세포에 의해 생산되는 하나 이상의 재조합 핵산을 포함하는 재조합 숙주 세포.
항목 4: 항목 2 또는 3 에 있어서, 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산이 큐피엔니우스 살레이 (Cupiennius salei), 티티우스 세르룰라투스 (Tityus serrulatus), 보스 타우루스 (Bos taurus), 베스파 마그니피카 (Vespa magnifica), 마카카 물라타 (Macaca mulata) 또는 아피스 멜리페라 (Apis mellifera) 중 적어도 하나로부터, 바람직하게는 티티우스 세르룰라투스 (Tityus serrulatus) 로부터 수득되는 또는 유래되는 재조합 숙주 세포.
항목 5: 항목 2 내지 4 중 어느 하나에 있어서, 콘드로이틴의 분자량이 50kDa 미만의 범위, 바람직하게는 약 20kDa 내지 약 50kDa 범위인 재조합 세포.
항목 6: 항목 1 내지 4 중 어느 하나에 있어서, 콘드로이틴의 분자량이 50kDa 초과의 범위, 바람직하게는 약 50kDa 내지 약 250kDa 범위인 재조합 세포.
항목 7: 항목 1 내지 4 중 어느 하나에 있어서, 콘드로이틴의 분자량이 100kDa 초과의 범위, 바람직하게는 약 100kDa 내지 약 1500kDa 범위인 재조합 세포.
항목 8: 항목 1 내지 7 중 어느 하나에 있어서, UDP-글루코오스 탈수소효소 (UDP-GlcDH 또는 HASB) 활성을 갖는 폴리펩티드를 코딩하는 핵산이 아라비돕시스 탈리아나 (Arabidopsis thaliana), 클로렐라 바이러스 PBCV1 또는 스트렙토코쿠스 주에피데미쿠스 (Streptococcus zooepidemicus) 중 적어도 하나로부터, 특히 아라비돕시스 탈리아나 (Arabidopsis thaliana) 또는 클로렐라 바이러스 PBCV1 중 적어도 하나로부터 수득되는 또는 유래하는 재조합 세포.
항목 9: 항목 1 내지 8 중 어느 하나에 있어서, 콘드로이틴 신타아제 (HCOS) 활성을 갖는 폴리펩티드를 코딩하는 핵산이 하기와 같은 재조합 세포:
(i) 콘드로이틴 신타아제를 코딩하는 핵산; 또는
(ii) 콘드로이틴 신타아제 활성을 갖는 키메라 폴리펩티드를 코딩하는 핵산.
항목 10: 항목 9 에 있어서, 핵산이 파스튜렐라 물토시다 (Pasteurella multocida), 클로렐라 바이러스 (Chlorella virus) PBCV1, 마이코박테리움 튜베르쿨로시스 (Mycobacterium tuberculosis), 호모 사피엔스 (Homo sapiens), 에스케리키아 콜라이 (Escherichia coli), 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 또는 페니실룸 옥살리쿰 (Penicillium oxalicum) 중 적어도 하나로부터 수득되는 또는 유래되는 재조합 세포.
항목 11: 항목 1 내지 10 중 어느 하나에 있어서, UDP-글루코오스-4-에피머라제 (kfoA 또는 GNE1) 활성을 갖는 폴리펩티드를 코딩하는 핵산이 박테리아로부터, 특히 슈도모나스 아에루기노사 (Pseudomonas aeruginosa), 파스튜렐라 물토시다 (Pasteurella multocida), 및 에스케리키아 콜라이 (Escherichia coli) 로 이루어진 군으로부터 선택되는 박테리아로부터 수득되는 또는 유래되는 재조합 세포.
항목 12: 항목 1 내지 항목 11 중 어느 하나에 있어서,
(i) 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 (GFA1) 활성을 갖는 폴리펩티드; 및/또는
(ii) UDP-N-아세틸글루코사민 피로포스포릴라아제 (QRI1) 활성을 갖는 폴리펩티드
중 하나 이상을 코딩하는 적어도 하나의 재조합 핵산을 추가로 포함하는 재조합 세포.
항목 13: 항목 1 내지 항목 12 중 어느 하나에 있어서,
(i) 포스포글루코뮤타아제-1 (PGM1) 활성을 갖는 폴리펩티드; 및/또는
(ii) UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 (UGP1) 활성을 갖는 폴리펩티드; 및/또는
(iii) 글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 (GNA1) 활성을 갖는 폴리펩티드; 및/또는
(iv) 포스포아세틸글루코사민 뮤타아제 (PCM1) 활성을 갖는 폴리펩티드
중 하나 이상을 코딩하는 적어도 하나의 재조합 핵산을 추가로 포함하는 재조합 세포.
항목 14: 항목 12 또는 13 에 있어서,
- 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 (GFA1) 활성을 갖는 폴리펩티드를 코딩하는 핵산;
- UDP-N-아세틸글루코사민 피로포스포릴라아제 (QRI1) 활성을 갖는 폴리펩티드를 코딩하는 핵산;
- 포스포글루코뮤타아제-1 (PGM1) 활성을 갖는 폴리펩티드를 코딩하는 핵산;
- UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 (UGP1) 활성을 갖는 폴리펩티드를 코딩하는 핵산;
- 글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 (GNA1) 활성을 갖는 폴리펩티드를 코딩하는 핵산; 및/또는
- 포스포아세틸글루코사민 뮤타아제 (PCM1) 를 갖는 폴리펩티드를 코딩하는 핵산
이 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 수득되는 또는 유래하는 재조합 세포.
항목 15: 항목 3 내지 14 중 어느 하나에 있어서, 재조합 숙주 세포가 효모인 재조합 숙주 세포.
항목 16: 항목 1 내지 15 중 어느 하나에 있어서, 재조합 세포가 사카로마이세스 (Saccharomyces) 속, 또는 칸디다 (Candida) 속, 또는 클루이베로마이세스 (Kluyveromyces) 속, 또는 오가타에아 (Ogataea) 속, 또는 야로위아 (Yarrowia) 속, 또는 데바리오마이세스 (Debaryomyces) 속, 또는 아쉬비아 (Ashbya) 속에 속하고, 특히 사카로마이세스 속에 속하는 재조합 세포.
항목 17: 항목 16 에 있어서, 재조합 세포가 사카로마이세스 세레비지에 (Saccharomyces cerevisiae), 사카로마이세스 보울라르디이 (Saccharomyces boulardii), 사카로마이세스 바야누스 (Saccharomyces bayanus), 사카로마이세스 파라독수스 (Saccharomyces paradoxus), 사카로마이세스 미카타에 (Saccharomyces mikatae), 사카로마이세스 카스텔리 (Saccharomyces castelli), 칸디다 알비칸스 (Candida albicans), 칸디다 글라브라타 (Candida glabrata), 칸디다 트로피칼리스 (Candida tropicalis), 클루이베로마이세스 락티스 (Kluyveromyces lactis), 클루이베로마이세스 마르시아누스 (Kluyveromyces marxianus), 클루이베로마이세스 폴리스포루스 (Kluyveromyces polysporus), 클루이베로마이세스 테르모톨레렌스 (Kluyveromyces thermotolerens), 오가타에아 폴리모르파 (Ogataea polymorpha), 야로위아 리폴리티카 (Yarrowia lypolytica), 데바리오마이세스 한세니이 (Debaryomyces hansenii) 및 아쉬비아 고시피이 (Ashbya gossypii) 로 이루어지는 군에서 선택되고, 바람직하게는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 인 재조합 세포.
항목 18: 하기를 포함하는, 원하는 분자량의 콘드로이틴의 생산 방법:
(a) 항목 1 내지 17 중 어느 하나에서 정의된 바와 같은 재조합 세포를 원하는 분자량의 콘드로이틴을 생산하기에 충분한 시간 동안 배양 배지에서 배양하는 단계; 및
(b) 임의로는 재조합 세포 및/또는 배양 배지로부터 콘드로이틴을 단리하거나 회수하는 단계.
항목 19: 항목 18 에 있어서, 콘드로이틴이 약 20kDa 내지 약 50kDa 의 분자량을 갖는 방법.
항목 20: 항목 18 에 있어서, 콘드로이틴이 약 50kDa 내지 약 150kDa 의 분자량을 갖는 방법.
항목 21: 항목 18 에 있어서, 콘드로이틴이 약 150kDa 내지 약 1500 kDa 의 분자량을 갖는 방법.
항목 22: 항목 18 내지 21 중 어느 하나에 있어서, 재조합 세포가 사카로마이세스 속에 속하는 효모이고, 특히 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 인 방법.
항목 23: 항목 18 내지 22 중 어느 하나에 있어서, 원하는 분자량의 콘드로이틴을 생산하기에 충분한 시간이 약 35 시간 내지 약 50 시간, 바람직하게는 약 40 시간 내지 약 50 시간, 바람직하게는 약 48 시간의 기간인 방법.
항목 24: 항목 18 내지 항목 23 중 어느 하나에 있어서, 생산된 콘드로이틴의 분자량이 단계 (a) 동안 배양 배지의 pH 를 조절함으로써 제어되는 방법.
항목 25: 항목 18 내지 24 중 어느 하나에 있어서, 방법이 산업적 규모로 실행되고, 바람직하게는 배양 배지가 적어도 약 100L 이고, 더욱 바람직하게는 약 1,000L 내지 약 3,000L 범위이고, 더욱 더 바람직하게는 약 10,000L 이거나, 더욱 더 바람직하게는 약 100,000L 이거나, 심지어 약 250,000L 인 방법.
항목 26: 항목 1 내지 17 중 어느 하나에 따른 재조합 세포로부터 또는 항목 18 내지 25 중 어느 하나에 따른 방법으로부터 수득가능한 콘드로이틴.
항목 27: 항목 26 에 따른 콘드로이틴을 포함하는 배양 배지.
항목 28: 항목 26 에 따른 콘드로이틴을 포함하는 조성물.
항목 29: (i) 항목 5 내지 7 중 어느 하나에서 정의된 바와 같은 분자량을 갖는 콘드로이틴, (ii) 항목 27 의 배양 배지 또는 (iii) 항목 28 의 조성물을 포함하는 공산품 또는 소비재 또는 소모품.
항목 30: 항목 29 에 있어서, 화장품, 향미 제품, 향료 제품, 식료품, 식품, 음료, 식감제, 약학 조성물, 식이 보충제, 기능식품, 세정 제품, 치아 및/또는 구강 위생 조성물인 공산품 또는 소비재 또는 소모품.
항목 31: 약 20kDa 내지 약 50kDa, 또는 약 50kDa 내지 약 1000kDa 범위의 분자량을 갖는 콘드로이틴의 생산을 위한 항목 2 내지 17 중 어느 하나에서 정의된 바와 같은 재조합 세포의 용도.
항목 32:
(a) 항목 1 내지 17 중 어느 하나에서 정의된 바와 같은 재조합 효모를 배양 배지에서 배양하는 단계; 및
(b) 상기 배양 배지로부터 콘드로이틴을 회수하는 단계
를 포함하는, 콘드로이틴의 생산 방법으로서,
여기서, 단계 (b) 에서 회수된 콘드로이틴은,
- 재조합 효모의 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 핵산의 성질 및 기원,
- 재조합 효모의 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산의 발현을 제어하는 프로모터의 성질 및 기원,
- 재조합 효모의 콘드로이티나아제 활성을 갖는 폴리펩티드와 관련된 고정 및/또는 분비 신호의 존재,
- 재조합 효모를 배양하는 단계 동안 배양 배지의 pH, 및/또는
- 재조합 효모의 배양 지속기간
의 선별을 통해 제어된 분자량을 갖는 생산 방법.
본 발명의 특정 구현예는 하기 이점 중 하나 이상을 제공할 수 있다:
· 제어된 분자량의 콘드로이틴을 생산하는 방법;
· 사카로마이세스 효모 세포에서 제어된 분자량의 콘드로이틴을 생산하는 방법; 및
· 유전적 매개변수 (예를 들어, 조절 서열) 및/또는 방법 매개변수 (pH 또는 발효 시간) 를 변화시킴으로써 제어된 분자량의 콘드로이틴을 생산하는 방법
본 발명의 언급된 양상 중 임의의 특정 하나 이상과 관련하여 제공된 세부사항, 예시 및 바람직함이 본원에서 추가로 설명될 것이고, 본 발명의 모든 양상에 동등하게 적용될 것이다. 이의 모든 가능한 변형에서의 상기에서 기술한 구현예, 예시 및 바람직함의 임의의 조합은 본원에서 달리 나타내지 않거나 또는 문맥에 의해 명확하게 모순되지 않는 한, 본 발명에 포함된다.
도 1 은 콘드로이틴의 생산을 위한 개략적 경로를 나타낸다.
서열의 요약
SEQ ID NO: 1 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS1-1)
SEQ ID NO: 2 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS1-2)
SEQ ID NO: 3 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS1-3)
SEQ ID NO: 4 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 핵산 서열: 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편 및 사카로마이세스 세레비지아에 (Saccharomyces cerevisiae) 로부터 유래된 키틴 신타아제 2 를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS.Sc)
SEQ ID NO: 5 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 핵산 서열: 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 사카로마이세스 세레비지아에 (Saccharomyces cerevisiae) 로부터 유래된 키틴 신타아제 2 를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HHASA.Sc)
SEQ ID NO: 6 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 에스케리치아 콜라이로부터 유래된 콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS1-Vir)
SEQ ID NO: 7 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 에스케리치아 콜라이로부터 유래된 콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS2-Vir)
SEQ ID NO: 8 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 마이코박테리움 투베르쿨로시스 (Mycobacterium tuberculosis) 로부터 유래된 갈락토푸라노실트랜스페라아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS3-Vir)
SEQ ID NO: 9 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 에스케리치아 콜라이로부터 유래된 콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS4-Vir)
SEQ ID NO: 10 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 페니실리움 옥살리쿰 (Penicillium oxalicum) 으로부터 유래된 콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS5-Vir)
SEQ ID NO: 11 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된 콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS6-Vir)
SEQ ID NO: 12 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된 콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS7-Vir)
SEQ ID NO: 13 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된 콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS8-Vir)
SEQ ID NO: 14 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 호모 사피엔스 (Homo sapiens) 로부터 유래된 콘드로이틴 술페이트 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS9-Vir)
SEQ ID NO: 15 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 호모 사피엔스 (Homo sapiens) 로부터 유래된 콘드로이틴 술페이트 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS10-Vir)
SEQ ID NO: 16 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 호모 사피엔스 (Homo sapiens) 로부터 유래된 콘드로이틴 술페이트 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS11-Vir)
SEQ ID NO: 17 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 호모 사피엔스 (Homo sapiens) 로부터 유래된 콘드로이틴 술페이트 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS12-Vir)
SEQ ID NO: 18 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 아미노산 서열: 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS1-1)
SEQ ID NO: 19 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 아미노산 서열: 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS1-2)
SEQ ID NO: 20 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 아미노산 서열: 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS1-3)
SEQ ID NO: 21: 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 아미노산 서열: 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편, 파스튜렐라 물토시다로부터 유래된 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편 및 사카로마이세스 세레비지아에 (Saccharomyces cerevisiae) 로부터 유래된 키틴 신타아제 2 를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS.Sc)
SEQ ID NO: 22: 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 핵산 서열: 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 사카로마이세스 세레비지아에 (Saccharomyces cerevisiae) 로부터 유래된 키틴 신타아제 2 를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HHASA.Sc)
SEQ ID NO: 23: 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 에스케리치아 콜라이로부터 유래된 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS1-Vir)
SEQ ID NO: 24: 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 에스케리치아 콜라이로부터 유래된 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS2-Vir)
SEQ ID NO: 25: 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 에스케리치아 콜라이로부터 유래된 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS3-Vir)
SEQ ID NO: 26: 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 에스케리치아 콜라이로부터 유래된 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS4-Vir)
SEQ ID NO: 27: 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 페니실리움 옥살리쿰 (Penicillium oxalicum) 으로부터 유래된 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS5-Vir)
SEQ ID NO: 28: 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS6-Vir)
SEQ ID NO: 29: 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS7-Vir)
SEQ ID NO: 30: 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS8-Vir)
SEQ ID NO: 31: 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 호모 사피엔스로부터 유래된 콘드로이틴 술페이트 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS9-Vir)
SEQ ID NO: 32: 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 호모 사피엔스로부터 유래된 콘드로이틴 술페이트 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS10-Vir)
SEQ ID NO: 33: 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 호모 사피엔스로부터 유래된 콘드로이틴 술페이트 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS11-Vir)
SEQ ID NO: 34: 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 호모 사피엔스로부터 유래된 콘드로이틴 술페이트 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS12-Vir)
SEQ ID NO: 35 는 아라비돕시스 탈리아나 (Arabidopsis thaliana) 로부터 기원하는 UDP-글루코오스 탈수소효소 (HASB) 의 핵산 서열이다
SEQ ID NO: 36 은 클로렐라 바이러스 PBCV-1 로부터 기원하는 UDP-글루코오스 탈수소효소 (HASB) 의 재코딩된 핵산 서열이다
SEQ ID NO: 37 은 클로렐라 바이러스 PBCV-1 로부터 기원하는 UDP-글루코오스 탈수소효소 (HASB-A) 의 재코딩된 핵산 서열이다
SEQ ID NO: 38 은 스트렙토코쿠스 주에피데미쿠스 (Streptococcus zooepidemicus) 로부터 기원하는 UDP-글루코오스 탈수소효소 (HASB) 의 핵산 서열이다
SEQ ID NO: 39 는 아라비돕시스 탈리아나 (Arabidopsis thaliana) 로부터 기원하는 UDP-글루코오스 탈수소효소 (HASB) 의 아미노산 서열이다
SEQ ID NO: 40 은 클로렐라 바이러스 PBCV-1 로부터 기원하는 UDP-글루코오스 탈수소효소 (HASB) 의 아미노산 서열이다
SEQ ID NO: 41 는 스트렙토코쿠스 주에피데미쿠스 (Streptococcus zooepidemicus) 로부터 기원하는 UDP-글루코오스 탈수소효소 (HASB) 의 아미노산 서열이다
SEQ ID NO: 42 는 슈도모나스 아에루기노사 (Pseudomonas aeruginosa) 로부터 기원하는 UDP-글루코오스-4-에피머라제 (GNE1) 의 핵산 서열이다
SEQ ID NO: 43 은 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 UDP-글루코오스-4-에피머라제 (KFOA) 의 핵산 서열이다
SEQ ID NO: 44 는 에스케리치아 콜라이 (Escherichia coli) 로부터 기원하는 UDP-글루코오스-4-에피머라제 (KFOA) 의 핵산 서열이다
SEQ ID NO: 45 는 슈도모나스 아에루기노사 (Pseudomonas aeruginosa) 로부터 기원하는 UDP-글루코오스-4-에피머라제 (GNE1) 의 아미노산 서열이다
SEQ ID NO: 46 은 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 UDP-글루코오스-4-에피머라제 (KFOA) 의 아미노산 서열이다
SEQ ID NO: 47 은 에스케리치아 콜라이 (Escherichia coli) 로부터 기원하는 UDP-글루코오스-4-에피머라제 (KFOA) 의 아미노산 서열이다
SEQ ID NO: 48 은 N-말단 분비 신호를 갖는 큐피에니우스 살레이 (Cupiennius salei) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 49 는 N-말단 분비 신호를 갖는 티티우스 세르룰라투스 (Tityus serrulatus) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 50 은 N-말단 분비 신호를 갖는 보스 타우루스 (Bos Taurus) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 51 은 N-말단 분비 신호를 갖는 아피스 멜리페라 (Apis mellifera) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 52 는 N-말단 분비 신호를 갖는 마카카 물라타 (Macaca mulatta) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 53 는 N-말단 분비 신호를 갖는 베스파 마그니피카 (Vespa magnifica) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 54 는 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 큐피에니우스 살레이 (Cupiennius salei) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 55 는 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 티티우스 세르룰라투스 (Tityus serrulatus) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 56 은 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 보스 타우루스 (Bos Taurus) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 57 은 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 아피스 멜리페라 (Apis mellifera) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 58 은 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 마카카 물라타 (Macaca mulatta) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 59 은 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 베스파 마그니피카 (Vespa magnifica) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 60 은 N-말단 분비 신호를 갖는 큐피에니우스 살레이 (Cupiennius salei) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 61 은 N-말단 분비 신호를 갖는 티티우스 세르룰라투스 (Tityus serrulatus) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 62 는 N-말단 분비 신호를 갖는 보스 타우루스 (Bos Taurus) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 63 은 N-말단 분비 신호를 갖는 아피스 멜리페라 (Apis mellifera) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 64 는 N-말단 분비 신호를 갖는 마카카 물라타 (Macaca mulatta) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 65 는 N-말단 분비 신호를 갖는 베스파 마그니피카 (Vespa magnifica) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 66 은 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 큐피에니우스 살레이 (Cupiennius salei) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 67 은 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 티티우스 세르룰라투스 (Tityus serrulatus) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 68 은 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 보스 타우루스 (Bos Taurus) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 69 는 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 아피스 멜리페라 (Apis mellifera) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 70 은 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 마카카 물라타 (Macaca mulatta) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 71 은 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 베스파 마그니피카 (Vespa magnifica) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 72 는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 (GFA1) 의 핵산 서열이다.
SEQ ID NO: 73 은 클로렐라 바이러스 1 (PBCV-1) 로부터 기원하는 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 (GFA1) 의 재코딩된 핵산 서열이다
SEQ ID NO: 74 은 클로렐라 바이러스 1 (PBCV-1) 로부터 기원하는 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 (GFA1) 의 재코딩된 핵산 서열이다
SEQ ID NO: 75 는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 (GFA1) 의 아미노산 서열이다
SEQ ID NO: 76 은 클로렐라 바이러스 1 (PBCV-1) 로부터 기원하는 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 (GFA1) 의 아미노산 서열이다
SEQ ID NO: 77 은 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 UDP-N-아세틸글루코사민 피로포스포릴라아제 (QRI1) 의 핵산 서열이다
SEQ ID NO: 78 은 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 UDP-N-아세틸글루코사민 피로포스포릴라아제 (QRI1) 의 아미노산 서열이다
SEQ ID NO: 79 는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 포스포글루코뮤타아제-1 (PGM1) 의 핵산 서열이다
SEQ ID NO: 80 은 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 포스포글루코뮤타아제-1 (PGM1) 의 아미노산 서열이다
SEQ ID NO: 81 은 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 (UGP1) 의 핵산 서열이다
SEQ ID NO: 82 는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 (UGP1) 의 아미노산 서열이다
SEQ ID NO: 83 은 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 글루코사민 6-포스페이트 N-아세틸트랜스퍼라아제 (GNA1) 의 핵산 서열이다
SEQ ID NO: 84 는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 글루코사민 6-포스페이트 N-아세틸트랜스퍼라아제 (GNA1) 의 아미노산 서열이다
SEQ ID NO: 85 는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 포스포아세틸글루코사민 뮤타아제 (PCM1) 의 핵산 서열이다
SEQ ID NO: 86 은 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 포스포아세틸글루코사민 뮤타아제 (PCM1) 의 아미노산 서열이다
SEQ ID NO: 87 은 프로모터 pTDH3 의 핵산 서열이다
SEQ ID NO: 88 은 프로모터 pTDH3.Sk 의 핵산 서열이다
SEQ ID NO: 89 은 프로모터 pTDH3-1.sba 의 핵산 서열이다
SEQ ID NO: 90 은 프로모터 pTDH3-1.Sar 의 핵산 서열이다
SEQ ID NO: 91 은 프로모터 pENO2 의 핵산 서열이다
SEQ ID NO: 92 은 프로모터 pTEF3 의 핵산 서열이다
SEQ ID NO: 93 은 프로모터 pTEF1 의 핵산 서열이다
SEQ ID NO: 94 은 프로모터 pTEF1.Ago 의 핵산 서열이다
SEQ ID NO: 95 은 프로모터 pTEF1.Sba 의 핵산 서열이다
SEQ ID NO: 96 은 프로모터 pPDC1 의 핵산 서열이다
SEQ ID NO: 97 은 프로모터 pCCW12 의 핵산 서열이다
SEQ ID NO: 98 은 프로모터 pCCW12.Sm 의 핵산 서열이다
SEQ ID NO: 99 은 프로모터 pCCW12.Sk 의 핵산 서열이다
SEQ ID NO: 100 은 프로모터 pCCW12.Sba 의 핵산 서열이다
SEQ ID NO: 101 은 프로모터 pCCW12.Sar 의 핵산 서열이다
SEQ ID NO: 102 은 프로모터 pNUP57 의 핵산 서열이다
SEQ ID NO: 103 은 프로모터 pCCW10.Ago 의 핵산 서열이다
SEQ ID NO: 104 은 프로모터 pCWP2 의 핵산 서열이다
SEQ ID NO: 105 은 프로모터 pFBA1 의 핵산 서열이다
SEQ ID NO: 106 은 프로모터 pCCW120.Sm 의 핵산 서열이다
SEQ ID NO: 107 은 프로모터 pCUP1 의 핵산 서열이다
SEQ ID NO: 108 은 프로모터 pMET6 의 핵산 서열이다
SEQ ID NO: 109 은 프로모터 pMET25 의 핵산 서열이다
SEQ ID NO: 110 은 프로모터 pSAM1 의 핵산 서열이다
SEQ ID NO: 111 은 터미네이터 tTPI1 의 핵산 서열이다
SEQ ID NO: 112 은 터미네이터 tMET25 의 핵산 서열이다
SEQ ID NO: 113 은 터미네이터 tDIT1 의 핵산 서열이다
SEQ ID NO: 114 은 터미네이터 tRPL3 의 핵산 서열이다
SEQ ID NO: 115 은 터미네이터 tRPL3.Sm 의 핵산 서열이다
SEQ ID NO: 116 은 터미네이터 tRPL3.sba 의 핵산 서열이다
SEQ ID NO: 117 은 터미네이터 tRPL41B 의 핵산 서열이다
SEQ ID NO: 118 은 터미네이터 tRPL41B.Sba 의 핵산 서열이다
SEQ ID NO: 1119 은 터미네이터 tRPL15A 의 핵산 서열이다
SEQ ID NO: 120 은 터미네이터 tRPL15A.Sm 의 핵산 서열이다
SEQ ID NO: 121 은 터미네이터 tRPL15A.sba 의 핵산 서열이다
SEQ ID NO: 122 은 터미네이터 tIDP1 의 핵산 서열이다
SEQ ID NO: 123 은 터미네이터 tIDP1.Sba 의 핵산 서열이다
SEQ ID NO: 124 은 터미네이터 tTEF1.sba 의 핵산 서열이다
SEQ ID NO: 125 은 5' 에서 부가된 분비 서열의 핵산 서열이다
SEQ ID NO: 126 은 N-말단에서 부가된 분비 서열의 아미노산 서열이다
SEQ ID NO: 127 은 3' 에서 부가된 고정 서열의 핵산 서열이다
SEQ ID NO: 128 은 C-말단에서 부가된 고정 서열의 아미노산 서열이다
서열의 요약
SEQ ID NO: 1 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS1-1)
SEQ ID NO: 2 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS1-2)
SEQ ID NO: 3 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS1-3)
SEQ ID NO: 4 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 핵산 서열: 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편 및 사카로마이세스 세레비지아에 (Saccharomyces cerevisiae) 로부터 유래된 키틴 신타아제 2 를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS.Sc)
SEQ ID NO: 5 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 핵산 서열: 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 사카로마이세스 세레비지아에 (Saccharomyces cerevisiae) 로부터 유래된 키틴 신타아제 2 를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HHASA.Sc)
SEQ ID NO: 6 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 에스케리치아 콜라이로부터 유래된 콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS1-Vir)
SEQ ID NO: 7 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 에스케리치아 콜라이로부터 유래된 콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS2-Vir)
SEQ ID NO: 8 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 마이코박테리움 투베르쿨로시스 (Mycobacterium tuberculosis) 로부터 유래된 갈락토푸라노실트랜스페라아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS3-Vir)
SEQ ID NO: 9 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 에스케리치아 콜라이로부터 유래된 콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS4-Vir)
SEQ ID NO: 10 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 페니실리움 옥살리쿰 (Penicillium oxalicum) 으로부터 유래된 콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS5-Vir)
SEQ ID NO: 11 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된 콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS6-Vir)
SEQ ID NO: 12 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된 콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS7-Vir)
SEQ ID NO: 13 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된 콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS8-Vir)
SEQ ID NO: 14 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 호모 사피엔스 (Homo sapiens) 로부터 유래된 콘드로이틴 술페이트 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS9-Vir)
SEQ ID NO: 15 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 호모 사피엔스 (Homo sapiens) 로부터 유래된 콘드로이틴 술페이트 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS10-Vir)
SEQ ID NO: 16 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 호모 사피엔스 (Homo sapiens) 로부터 유래된 콘드로이틴 술페이트 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS11-Vir)
SEQ ID NO: 17 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 호모 사피엔스 (Homo sapiens) 로부터 유래된 콘드로이틴 술페이트 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS12-Vir)
SEQ ID NO: 18 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 아미노산 서열: 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS1-1)
SEQ ID NO: 19 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 아미노산 서열: 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS1-2)
SEQ ID NO: 20 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 아미노산 서열: 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS1-3)
SEQ ID NO: 21: 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 아미노산 서열: 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편, 파스튜렐라 물토시다로부터 유래된 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편 및 사카로마이세스 세레비지아에 (Saccharomyces cerevisiae) 로부터 유래된 키틴 신타아제 2 를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS.Sc)
SEQ ID NO: 22: 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 핵산 서열: 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 사카로마이세스 세레비지아에 (Saccharomyces cerevisiae) 로부터 유래된 키틴 신타아제 2 를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HHASA.Sc)
SEQ ID NO: 23: 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 에스케리치아 콜라이로부터 유래된 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS1-Vir)
SEQ ID NO: 24: 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 에스케리치아 콜라이로부터 유래된 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS2-Vir)
SEQ ID NO: 25: 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 에스케리치아 콜라이로부터 유래된 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS3-Vir)
SEQ ID NO: 26: 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 에스케리치아 콜라이로부터 유래된 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS4-Vir)
SEQ ID NO: 27: 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 페니실리움 옥살리쿰 (Penicillium oxalicum) 으로부터 유래된 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS5-Vir)
SEQ ID NO: 28: 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS6-Vir)
SEQ ID NO: 29: 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS7-Vir)
SEQ ID NO: 30: 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS8-Vir)
SEQ ID NO: 31: 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 호모 사피엔스로부터 유래된 콘드로이틴 술페이트 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS9-Vir)
SEQ ID NO: 32: 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 호모 사피엔스로부터 유래된 콘드로이틴 술페이트 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS10-Vir)
SEQ ID NO: 33: 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 호모 사피엔스로부터 유래된 콘드로이틴 술페이트 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS11-Vir)
SEQ ID NO: 34: 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 호모 사피엔스로부터 유래된 콘드로이틴 술페이트 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS12-Vir)
SEQ ID NO: 35 는 아라비돕시스 탈리아나 (Arabidopsis thaliana) 로부터 기원하는 UDP-글루코오스 탈수소효소 (HASB) 의 핵산 서열이다
SEQ ID NO: 36 은 클로렐라 바이러스 PBCV-1 로부터 기원하는 UDP-글루코오스 탈수소효소 (HASB) 의 재코딩된 핵산 서열이다
SEQ ID NO: 37 은 클로렐라 바이러스 PBCV-1 로부터 기원하는 UDP-글루코오스 탈수소효소 (HASB-A) 의 재코딩된 핵산 서열이다
SEQ ID NO: 38 은 스트렙토코쿠스 주에피데미쿠스 (Streptococcus zooepidemicus) 로부터 기원하는 UDP-글루코오스 탈수소효소 (HASB) 의 핵산 서열이다
SEQ ID NO: 39 는 아라비돕시스 탈리아나 (Arabidopsis thaliana) 로부터 기원하는 UDP-글루코오스 탈수소효소 (HASB) 의 아미노산 서열이다
SEQ ID NO: 40 은 클로렐라 바이러스 PBCV-1 로부터 기원하는 UDP-글루코오스 탈수소효소 (HASB) 의 아미노산 서열이다
SEQ ID NO: 41 는 스트렙토코쿠스 주에피데미쿠스 (Streptococcus zooepidemicus) 로부터 기원하는 UDP-글루코오스 탈수소효소 (HASB) 의 아미노산 서열이다
SEQ ID NO: 42 는 슈도모나스 아에루기노사 (Pseudomonas aeruginosa) 로부터 기원하는 UDP-글루코오스-4-에피머라제 (GNE1) 의 핵산 서열이다
SEQ ID NO: 43 은 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 UDP-글루코오스-4-에피머라제 (KFOA) 의 핵산 서열이다
SEQ ID NO: 44 는 에스케리치아 콜라이 (Escherichia coli) 로부터 기원하는 UDP-글루코오스-4-에피머라제 (KFOA) 의 핵산 서열이다
SEQ ID NO: 45 는 슈도모나스 아에루기노사 (Pseudomonas aeruginosa) 로부터 기원하는 UDP-글루코오스-4-에피머라제 (GNE1) 의 아미노산 서열이다
SEQ ID NO: 46 은 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 UDP-글루코오스-4-에피머라제 (KFOA) 의 아미노산 서열이다
SEQ ID NO: 47 은 에스케리치아 콜라이 (Escherichia coli) 로부터 기원하는 UDP-글루코오스-4-에피머라제 (KFOA) 의 아미노산 서열이다
SEQ ID NO: 48 은 N-말단 분비 신호를 갖는 큐피에니우스 살레이 (Cupiennius salei) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 49 는 N-말단 분비 신호를 갖는 티티우스 세르룰라투스 (Tityus serrulatus) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 50 은 N-말단 분비 신호를 갖는 보스 타우루스 (Bos Taurus) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 51 은 N-말단 분비 신호를 갖는 아피스 멜리페라 (Apis mellifera) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 52 는 N-말단 분비 신호를 갖는 마카카 물라타 (Macaca mulatta) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 53 는 N-말단 분비 신호를 갖는 베스파 마그니피카 (Vespa magnifica) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 54 는 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 큐피에니우스 살레이 (Cupiennius salei) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 55 는 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 티티우스 세르룰라투스 (Tityus serrulatus) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 56 은 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 보스 타우루스 (Bos Taurus) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 57 은 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 아피스 멜리페라 (Apis mellifera) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 58 은 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 마카카 물라타 (Macaca mulatta) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 59 은 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 베스파 마그니피카 (Vespa magnifica) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 60 은 N-말단 분비 신호를 갖는 큐피에니우스 살레이 (Cupiennius salei) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 61 은 N-말단 분비 신호를 갖는 티티우스 세르룰라투스 (Tityus serrulatus) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 62 는 N-말단 분비 신호를 갖는 보스 타우루스 (Bos Taurus) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 63 은 N-말단 분비 신호를 갖는 아피스 멜리페라 (Apis mellifera) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 64 는 N-말단 분비 신호를 갖는 마카카 물라타 (Macaca mulatta) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 65 는 N-말단 분비 신호를 갖는 베스파 마그니피카 (Vespa magnifica) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 66 은 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 큐피에니우스 살레이 (Cupiennius salei) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 67 은 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 티티우스 세르룰라투스 (Tityus serrulatus) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 68 은 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 보스 타우루스 (Bos Taurus) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 69 는 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 아피스 멜리페라 (Apis mellifera) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 70 은 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 마카카 물라타 (Macaca mulatta) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 71 은 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 베스파 마그니피카 (Vespa magnifica) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 72 는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 (GFA1) 의 핵산 서열이다.
SEQ ID NO: 73 은 클로렐라 바이러스 1 (PBCV-1) 로부터 기원하는 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 (GFA1) 의 재코딩된 핵산 서열이다
SEQ ID NO: 74 은 클로렐라 바이러스 1 (PBCV-1) 로부터 기원하는 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 (GFA1) 의 재코딩된 핵산 서열이다
SEQ ID NO: 75 는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 (GFA1) 의 아미노산 서열이다
SEQ ID NO: 76 은 클로렐라 바이러스 1 (PBCV-1) 로부터 기원하는 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 (GFA1) 의 아미노산 서열이다
SEQ ID NO: 77 은 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 UDP-N-아세틸글루코사민 피로포스포릴라아제 (QRI1) 의 핵산 서열이다
SEQ ID NO: 78 은 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 UDP-N-아세틸글루코사민 피로포스포릴라아제 (QRI1) 의 아미노산 서열이다
SEQ ID NO: 79 는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 포스포글루코뮤타아제-1 (PGM1) 의 핵산 서열이다
SEQ ID NO: 80 은 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 포스포글루코뮤타아제-1 (PGM1) 의 아미노산 서열이다
SEQ ID NO: 81 은 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 (UGP1) 의 핵산 서열이다
SEQ ID NO: 82 는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 (UGP1) 의 아미노산 서열이다
SEQ ID NO: 83 은 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 글루코사민 6-포스페이트 N-아세틸트랜스퍼라아제 (GNA1) 의 핵산 서열이다
SEQ ID NO: 84 는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 글루코사민 6-포스페이트 N-아세틸트랜스퍼라아제 (GNA1) 의 아미노산 서열이다
SEQ ID NO: 85 는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 포스포아세틸글루코사민 뮤타아제 (PCM1) 의 핵산 서열이다
SEQ ID NO: 86 은 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 포스포아세틸글루코사민 뮤타아제 (PCM1) 의 아미노산 서열이다
SEQ ID NO: 87 은 프로모터 pTDH3 의 핵산 서열이다
SEQ ID NO: 88 은 프로모터 pTDH3.Sk 의 핵산 서열이다
SEQ ID NO: 89 은 프로모터 pTDH3-1.sba 의 핵산 서열이다
SEQ ID NO: 90 은 프로모터 pTDH3-1.Sar 의 핵산 서열이다
SEQ ID NO: 91 은 프로모터 pENO2 의 핵산 서열이다
SEQ ID NO: 92 은 프로모터 pTEF3 의 핵산 서열이다
SEQ ID NO: 93 은 프로모터 pTEF1 의 핵산 서열이다
SEQ ID NO: 94 은 프로모터 pTEF1.Ago 의 핵산 서열이다
SEQ ID NO: 95 은 프로모터 pTEF1.Sba 의 핵산 서열이다
SEQ ID NO: 96 은 프로모터 pPDC1 의 핵산 서열이다
SEQ ID NO: 97 은 프로모터 pCCW12 의 핵산 서열이다
SEQ ID NO: 98 은 프로모터 pCCW12.Sm 의 핵산 서열이다
SEQ ID NO: 99 은 프로모터 pCCW12.Sk 의 핵산 서열이다
SEQ ID NO: 100 은 프로모터 pCCW12.Sba 의 핵산 서열이다
SEQ ID NO: 101 은 프로모터 pCCW12.Sar 의 핵산 서열이다
SEQ ID NO: 102 은 프로모터 pNUP57 의 핵산 서열이다
SEQ ID NO: 103 은 프로모터 pCCW10.Ago 의 핵산 서열이다
SEQ ID NO: 104 은 프로모터 pCWP2 의 핵산 서열이다
SEQ ID NO: 105 은 프로모터 pFBA1 의 핵산 서열이다
SEQ ID NO: 106 은 프로모터 pCCW120.Sm 의 핵산 서열이다
SEQ ID NO: 107 은 프로모터 pCUP1 의 핵산 서열이다
SEQ ID NO: 108 은 프로모터 pMET6 의 핵산 서열이다
SEQ ID NO: 109 은 프로모터 pMET25 의 핵산 서열이다
SEQ ID NO: 110 은 프로모터 pSAM1 의 핵산 서열이다
SEQ ID NO: 111 은 터미네이터 tTPI1 의 핵산 서열이다
SEQ ID NO: 112 은 터미네이터 tMET25 의 핵산 서열이다
SEQ ID NO: 113 은 터미네이터 tDIT1 의 핵산 서열이다
SEQ ID NO: 114 은 터미네이터 tRPL3 의 핵산 서열이다
SEQ ID NO: 115 은 터미네이터 tRPL3.Sm 의 핵산 서열이다
SEQ ID NO: 116 은 터미네이터 tRPL3.sba 의 핵산 서열이다
SEQ ID NO: 117 은 터미네이터 tRPL41B 의 핵산 서열이다
SEQ ID NO: 118 은 터미네이터 tRPL41B.Sba 의 핵산 서열이다
SEQ ID NO: 1119 은 터미네이터 tRPL15A 의 핵산 서열이다
SEQ ID NO: 120 은 터미네이터 tRPL15A.Sm 의 핵산 서열이다
SEQ ID NO: 121 은 터미네이터 tRPL15A.sba 의 핵산 서열이다
SEQ ID NO: 122 은 터미네이터 tIDP1 의 핵산 서열이다
SEQ ID NO: 123 은 터미네이터 tIDP1.Sba 의 핵산 서열이다
SEQ ID NO: 124 은 터미네이터 tTEF1.sba 의 핵산 서열이다
SEQ ID NO: 125 은 5' 에서 부가된 분비 서열의 핵산 서열이다
SEQ ID NO: 126 은 N-말단에서 부가된 분비 서열의 아미노산 서열이다
SEQ ID NO: 127 은 3' 에서 부가된 고정 서열의 핵산 서열이다
SEQ ID NO: 128 은 C-말단에서 부가된 고정 서열의 아미노산 서열이다
발명의 상세한 설명
본 발명자들은 부모 세포와 비교하여, 그리고 특히 자연적으로 그렇게 할 수 없는 부모 효모와 비교하여, 콘드로이틴을 생산하는 능력을 갖는 유전적으로 변형된 세포, 특히 유전적으로 변형된 효모를 구상하였다.
이러한 유전적으로 변형된 세포는 본 명세서 전체에 걸쳐 기재되어 있다.
정의
용어 "콘드로이틴" 은 교대 β-(1→4) 및 β-(1→3) 글리코시드 결합을 통해 연결된, N-아세틸갈락토사민 및 글루쿠로니크산의 다당류 (β-글루쿠론산-(1→3)-N-아세틸-β-갈락토사민-4-설페이트-(1→4) 의 교대 중합체) 이며, 화학식 (C14H21NO11)n 을 갖는다.
본원에서 사용되는 용어 "콘드로이틴" 은 또한 화장품, 향미 제품, 향료 제품, 식료품, 식품, 음료, 식감제, 약학 조성물, 식이 보충제, 기능식품, 세정 제품 및/또는 치아 및/또는 구강 위생 조성물 또는 이의 조합에서의 적용에 유용한 콘드로이틴 설페이트를 포함하나 이에 제한되지 않는 콘드로이틴 및 이의 유도체를 포괄하도록 의도된다.
콘드로이틴 설페이트는 콘드로이틴-4-설페이트, 콘드로이틴-6-설페이트, 콘드로이틴-2,6-설페이트, 콘드로이틴-4,6-설페이트 및/또는 이들의 혼합물을 포함하나 이에 제한되지 않는다.
콘드로이틴-4-설페이트의 황화 부위는 N-아세틸갈락토사민 (GalNAc) 당의 탄소 4 이다.
콘드로이틴-6-설페이트의 황화 부위는 GalNAc 당의 탄소 6 이다.
콘드로이틴-2,6-설페이트의 황화 부위는 글루쿠론산의 탄소 2 및 GalNAc 당의 6 이다.
콘드로이틴-4,6-설페이트의 황화 부위는 GalNAc 당의 탄소 4 및 6 이다.
콘드로이틴 유도체, 예컨대 콘드로이틴 설페이트는 골관절염, 연골 악화, 및 골관절염-관련 관절 통증, 압통, 및/또는 부종의 위험의 완화, 감소, 예방 및/또는 치료하는 데 유용할 수 있다.
특히, 콘드로틴 유도체, 예컨대 콘드로이틴 설페이트는 골관절염; 골관절염-관련 관절 통증, 관절 압통, 및 관절 부종; 관절 퇴행; 및/또는 연골 악화의 위험의 완화, 감소, 예방 및/또는 치료하는 데 유용할 수 있다.
콘드로틴, 특히 콘드로이틴 설페이트는 골관절염; 골관절염-관련 관절 통증, 관절 압통, 및 관절 부종; 관절 변성; 및/또는 연골 악화의 치료를 위한 식이 보충제로서 단독으로 또는 글루코사민과 함께 사용될 수 있다.
콘드로이틴, 특히 콘드로이틴 설페이트는 조성물로서 제조될 수 있다.
콘드로이틴 유도체는 적절한 화학적 또는 효소적 단계를 통해 콘드로이틴으로부터 제조될 수 있다.
콘드로이틴은 재조합 세포에서 생산될 수 있다.
본원에서 사용되는 용어 "재조합"은, 세포에 관하여 사용되는 경우, 내인성 및/또는 이종 핵산 또는 단백질의 세포 내로의 도입 또는 천연 세포의 변경에 의해 세포가 변형되거나, 세포가 그렇게 변형된 세포로부터 유래되는 것을 나타낸다. 따라서 예를 들어, 재조합 세포는 천연 (비-재조합) 형태의 세포 내에서 발견되지 않는 유전자 또는 핵산을 발현하거나, 천연 (예를 들어, 내인성) 유전자를 이들의 천연 수준과 상이한 수준으로 발현하거나, 천연 (예를 들어, 내인성) 의 추가적인 또는 보충 카피를 이들의 천연 수준과 상이한 수준으로 발현한다.
본원에서 사용되는 용어 "재조합"은 핵산 또는 벡터에 관하여 사용되는 경우, 당업자에게 잘 알려진 유전 공학 기법에 의해 형성/수득된 서열이다. 이에 따라 미국 국립 보건원 (NIH) 의 지침은 하기와 나타내고 있다:
"재조합 [...] 핵산은 다음과 같이 정의된다:
i. (a) 핵산 분자를 연결함으로써 구성되며 (b) 살아있는 세포에서 복제할 수 있는 분자, 즉 재조합 핵산";
이는 핵산 서열에 붙은 단어 "재조합"의 통상적인 사용을 반영하여, 또 다른 핵산의 삽입 또는 또 다른 핵산과 함께 결합 후에 재조합되는 것을 의미한다.
살아있는 세포 내에서 재조합 DNA 또는 재조합 벡터의 발현으로부터 발생하는 단백질은 또한 재조합 단백질로 불린다.
따라서 용어 "재조합"은 용어 "유전적으로 변형된"과 동의어이다. 용어 "유전자" 는 용어 "핵산" 또는 "뉴클레오티드 서열" 과 동의어이다.
본 발명의 재조합 세포, 및 특히 재조합 효모에서 사용하기 위한 재조합 핵산 서열은 핵산 구축물의 형태로 제공될 수 있다. 용어 "핵산 구축물" 은 천연 (예를 들어, 내인성) 자연 발생 유전자로부터 단리되거나 유래하거나 이종 핵산이거나, 자연에 존재하지 않는 방식으로 조합되고 병치되는 핵산의 세그먼트를 함유하도록 변형된, 단일-가닥 또는 이중-가닥의 핵산 분자를 의미한다. 용어 "핵산 구축물"은 핵산 구축물이 코딩 서열의 발현에 필요한 하나 이상의 조절 요소를 함유하는 경우 용어 "발현 카세트" 또는 "이종 핵산 발현 카세트" 와 동의어이며, 여기서 상기 제어 서열은 상기 코딩 서열에 작동가능하게 연결된다. 조절 요소의 비제한적인 예는 프로모터, 인핸서, 사일런서 (silencer), 터미네이터 및 폴리-A 신호를 포함한다.
본 발명의 재조합 세포에 사용하기 위한 재조합 핵산 서열은 발현 벡터의 형태로 제공될 수 있으며, 여기서 폴리뉴클레오티드 서열은 재조합 세포에서 폴리뉴클레오티드 서열의 발현을 위한 적어도 하나의 제어 서열에 작동가능하게 연결된다.
용어 미생물 또는 동물 "로부터 수득되는" 또는 "로부터 기원하다" 또는 "로부터 기원하는" 은 일반적으로 미생물 또는 동물로부터 기원하는 물질 (예를 들어, 핵산 분자 또는 폴리펩티드) 이 그 미생물 또는 동물에 고유하다는 것을 의미한다.
용어 미생물 또는 동물 "로부터 유래한" 은 일반적으로 미생물 또는 동물로부터 유래한 물질 (예를 들어, 핵산 분자 또는 폴리펩티드) 이 그 미생물 또는 동물에 고유한 (즉, 그 자체로 존재하는) 물질에 초래된 변형의 결과라는 것을 의미한다. 예를 들어, 미생물 또는 동물로부터 유래한 핵산 서열에 관하여, 상기 핵산 서열은 이러한 미생물 또는 동물로부터의 천연 핵산 서열의 재코딩된 및/또는 절단된 버전에 상응할 수 있다. 당업자에게 잘 알려진 다른 변형은 미생물 또는 동물의 본래의 천연 물질 (native substance) 이 되어 상기 미생물 또는 동물로부터 "유래하는" 물질로 이어질 수 있다.
본원에서 사용되는 용어 "폴리펩티드" 는 펩티드 결합에 의해 연결된 아미노산 잔기를 포함하고 5 개 초과의 아미노산 잔기를 함유하는 분자를 의미한다. 아미노산은 단일 문자 또는 세 문자 지정에 의해 식별된다. 본원에서 사용되는 용어 "단백질"은 용어 "폴리펩티드"와 동의어이며, 둘 이상의 폴리펩티드를 또한 의미할 수 있다. 따라서, 용어 "단백질", "펩티드" 및 "폴리펩티드"는 상호교환가능하게 사용될 수 있다. 폴리펩티드는 임의로는 변형 (예를 들어, 글리코실화, 인산화, 아실화, 파르네실화, 프레닐화, 술폰화 등) 되어 기능성이 부가될 수 있다. 활성을 나타내는 폴리펩티드는 효소로 지칭될 수 있다. 유전자 코드의 축퇴 (degeneracy) 의 결과로서, 주어진 폴리펩티드를 코딩하는 다수의 뉴클레오티드 서열이 생성될 수 있다는 것이 이해될 것이다.
본 발명의 재조합 세포, 특히 재조합 효모에서 사용하기 위한 재조합 핵산에 의해 코딩된 폴리펩티드는 신호 펩티드 및/또는 프로펩티드 서열을 포함할 수 있다. 재조합 세포, 특히 재조합 효모에 의해 발현되는 폴리펩티드가 신호 펩티드 및/또는 프로펩티드를 포함하는 경우, 성숙 폴리펩티드 서열에 걸쳐 서열 동일성이 계산될 수 있다.
본원에서 사용되는 용어 "작동가능하게 연결된" 은 물리적으로 연결되어 있고 서로 기능적 관계에 있는 둘 이상의 핵산 서열 요소를 의미한다. 예를 들어, 프로모터가 코딩 서열의 전사 또는 발현을 개시하거나 조절할 수 있다면 프로모터는 코딩 서열에 작동가능하게 연결되며, 이러한 경우 코딩 서열은 프로모터 "의 제어 하에" 있는 것으로 이해되어야 한다. 일반적으로, 2 개의 핵산 서열이 작동가능하게 연결되는 경우, 이들은 동일한 배향에 있을 것이며 통상 또한 동일한 판독 프레임 (reading frame) 에 있을 것이다. 필요하지 않을 수 있지만, 이들은 본질적으로 연속될 것이다.
분자, 특히 효소 및 핵산에 관해 본원에서 사용되는 용어 "천연" 또는 "내인성"은 이들이 기원하는 유기체에서 발현되거나 자연에서 발견되는 분자를 나타낸다.
용어 "내인성 유전자" 는 유전자가 야생형 균주에서 임의의 유전적 변형 전에 세포에 존재하였다는 것을 의미한다. 내인성 유전자는 내인성 조절 요소에 추가로 또는 이를 대체하기 위해 이종 서열을 도입함으로써, 또는 염색체 또는 플라스미드 내로 유전자의 하나 이상의 추가적인 또는 보충 카피를 도입함으로써 과발현될 수 있다 (상기 추가적인 또는 보충 카피는 본원에서 정의된 바와 같은 "외인성 또는 이종 유전자" 또는 "이종 뉴클레오티드 서열" 또는 "이종 핵산" 으로 지정됨). 내인성 유전자는 또한 그의 발현 및/또는 활성을 조절하기 위해 변형될 수 있다. 예를 들어, 유전자 산물을 변형시키기 위해 돌연변이가 코딩 서열 내로 도입될 수 있거나, 내인성 조절 요소에 추가로 또는 이를 대체하기 위해 이종 서열이 도입될 수 있다. 내인성 유전자의 조절은 유전자 산물의 활성의 상향 조절 및/또는 강화를 초래할 수 있거나, 대안적으로, 내인성 유전자 산물의 활성의 하향 조절 및/또는 감쇠를 초래할 수 있다. 내인성 유전자의 발현을 강화시키는 또 다른 방식은 염색체 또는 플라스미드 상에 유전자의 하나 이상의 추가적인 또는 보충 카피를 도입하는 것이다 (상기 보충 카피는 본원에 정의된 바와 같이 "외인성 또는 이종 유전자" 또는 "이종 뉴클레오티드 서열" 또는 "이종 핵산" 임).
본 발명에 따른 "유전자의 하나 이상의 추가적인 또는 보충 카피"는 예를 들어 본 발명에서 1 내지 50 카피, 특히 1 내지 30 카피, 보다 특히 1 내지 20 카피, 바람직하게는 1 내지 10 카피인 것으로 이해된다. 상기 카피는 본 발명의 재조합 세포의 동일한 유전자좌 또는 상이한 유전자좌에 삽입될 수 있다.
용어 "외인성 유전자" 는 당업자에게 잘 알려진 수단에 의해 유전자가 세포에 도입되는 반면, 이 유전자가 야생형 세포에서 자연 발생하거나 자연 발생하지 않는다는 것을 의미한다. 외인성 유전자가 세포 내에서 그의 발현을 허용하는 모든 요소와 함께 세포에 도입된다면, 세포는 외인성 유전자를 발현할 수 있다. 외인성 DNA 로 세포를 형질전환하는 것은 당업자에게 일상적인 작업이다. 외인성 유전자는 숙주 염색체 내로 통합되거나 플라스미드 또는 벡터로부터 염색체외로 발현될 수 있다. 세포에서 그의 복제 기원 (origin of replication) 및 그의 카피 수와 관련하여 상이한 다양한 플라스미드가 모두 당업계에 공지되어 있다. 외인성 유전자의 서열은 세포에서의 그의 발현을 위해 조정될 수 있다. 실제로, 당업자는 코돈 사용 편향의 개념 및 추론된 단백질을 변형시키지 않고 특정 코돈 사용 편향에 대해 핵산 서열을 조정하는 방법을 알고 있다. 특정 구현예에서, 코돈 최적화된 유전자는 천연 효소를 발현한다.
용어 "이종 유전자" 또는 "이종 핵산 서열" 은 자연적으로 주어진 세포에서 일반적으로 발견되지 않는 유전자 또는 핵산 서열을 의미한다. 이와 같이, 이종 핵산 서열은: (a) 그의 숙주 세포에 대해 외래이고 (즉, 세포에 대해 "외인성" 임); (b) 숙주 세포에서 자연적으로 발견되지만 (즉, "내인성") 세포 내에서 비자연적인 양으로 존재하거나 (즉, 숙주 세포에서 자연적으로 발견되는 것보다 더 많거나 더 적음); 또는 (c) 숙주 세포에서 자연적으로 발견되지만 그의 자연적 유전자좌의 외부에 위치할 수 있다.
본 출원에서, 모든 유전자는 이들의 공통적인 명칭에 대해 및 이들의 뉴클레오티드 서열 및 경우에 따라 이들의 아미노산 서열에 대해 언급된다. 공지된 유전자에 대한 등록 번호에 주어진 참조를 사용하여, 당업자는 다른 유기체, 박테리아 균주, 효모, 진균, 포유동물, 식물 등에서 동등한 유전자를 결정할 수 있다. 이러한 일상적인 작업은 유리하게는 다른 세포로부터 유래한 유전자와의 서열 정렬을 실행하고 또 다른 유기체에서 상응하는 유전자를 클로닝하기 위해 축퇴된 프로브를 설계함으로써 결정될 수 있는 컨센서스 서열을 사용하여 수행된다.
당업자는 내인성 유전자의 발현을 조절하는, 특히 상향 조절 또는 하향 조절하는 상이한 수단을 알고 있다. 예를 들어, 내인성 유전자의 발현을 향상시키거나 과발현시키는 방식은 염색체 또는 플라스미드 상에 유전자의 하나 이상의 추가적인 또는 보충 카피를 도입하는 것이다.
또 다른 방식은 유전자의 내인성 프로모터를 더 강한 프로모터로 대체하는 것이다. 이들 프로모터는 동종 또는 이종일 수 있다. 본 발명에서 특히 흥미로운 프로모터는 본 명세서의 다른 곳에서 더 상세히 기재된다.
핵산 발현 구축물은 5' 및/또는 3' 인식 서열 및/또는 선택 마커를 추가로 포함할 수 있다.
용어 "유도성 프로모터"는 활성이 유도된, 즉 증가된 프로모터를 자격부여하는데 사용된다:
- 하나 이상의 특정 대사산물(들) 의 존재 하에. 배지 중 대사산물 농도가 높을수록, 프로모터 활성이 더 강해지거나; 또는
- 낮은 농도의 존재 하에 또는 하나 이상의 대사산물(들) 의 부재 하에. 이들 대사산물은 그의 존재 증가가 프로모터의 활성을 유도하는 것들과 상이하다. 배지 중 대사산물 농도가 낮을수록, 프로모터 활성은 더 강해진다.
용어 "억제성 프로모터"는 활성이 억제된, 즉 감소된 프로모터를 자격부여하는데 사용된다:
- 하나 이상의 특정 대사산물(들) 의 존재 하에. 배지 중 대사산물 농도가 높을수록, 프로모터 활성이 더 약해지거나; 또는
- 낮은 농도의 존재 하에 또는 하나 이상의 대사산물(들) 의 부재 하에. 이들 대사산물은 그의 존재 증가가 프로모터의 활성을 억제하는 것들과 상이하다. 배지 중 대사산물 농도가 낮을수록, 프로모터 활성은 더 약해진다.
본원에서 사용되는 용어 "고정 신호" 는 효소 (예를 들어 히알루로니다아제) 와 같은 단백질 또는 폴리펩티드와 함께 사용되는 경우, 예를 들어 단백질 또는 폴리펩티드를 코딩하는 제 2 핵산에 작동가능하게 연결되는 단백질을 코딩하는 제 1 핵산, 또는 효소 (예컨대, 예를 들어 융합 단백질을 형성하기 위한 히알루로니다아제) 와 같은 제 2 단백질 또는 폴리펩티드에 작동가능하게 연결되는 제 1 단백질 또는 폴리펩티드를 의미하며 이는 세포, 특히 S. 세레비지에 (S. cerevisiae) 세포의 세포 수송 기구가 제 1 단백질에 작동가능하게 연결되는 제 2 단백질을 세포의 멤브레인 내에 정확하게 고정 및/또는 위치시킬 수 있게 한다.
본원에서 사용되는 용어 "분비 신호" 는 효소 (예를 들어 히알루로니다아제) 와 같은 단백질 또는 폴리펩티드와 함께 사용되는 경우, 예를 들어 단백질을 코딩하는 제 2 핵산에 작동가능하게 연결되는 펩티드 또는 단백질을 코딩하는 제 1 핵산, 또는 효소 (예컨대, 예를 들어 융합 단백질을 형성하기 위한 히알루로니다아제) 와 같은 제 2 단백질에 연결되는 제 1 단백질을 의미하며 이는 제 1 단백질이 예를 들어, 제 2 단백질로부터 절단된 후에, 세포, 특히 S. 세레비지에 (S. cerevisiae) 세포의 세포 수송 기구가 적어도 제 2 단백질을 세포의 멤브레인에 위치시키고 제 2 단백질을 세포 외부로 분비시킬 수 있게 한다.
본원에서 사용되는 용어 "분비 신호" 및 "고정 신호" 는 효소 (예를 들어 히알루로니다아제) 와 같은 단백질 또는 폴리펩티드와 함께 사용되는 경우, 예를 들어 단백질을 코딩하는 제 2 핵산에 작동가능하게 연결되는 펩티드 또는 단백질을 코딩하는 제 1 핵산, 또는 효소 (예를 들어 히알루로니다아제) 와 같은 제 2 단백질에 작동가능하게 연결되는 제 1 단백질을 의미하며 이는 세포, 특히 S. 세레비지에 (S. cerevisiae) 세포의 세포 수송 기구가 적어도 제 2 단백질을 세포의 멤브레인에 위치시킬 수 있게 하고 여기서 제 2 단백질이 또한 "고정 신호" 에 작동가능하게 연결되는 경우 제 2 단백질은 분비되지 않으나 세포의 멤브레인에 부착된 채로 남아 있다. 일부 경우에, 분비-고정 신호는 이중 분비 신호 및 고정 신호 기능을 제공할 수 있다.
분비 및 고정 신호의 서열, 세포 (예를 들어 효모 세포) 의 표면 상의 이종 단백질, 예컨대 효소 (예를 들어, 히알루로니다아제) 의 발현, 고정 및/또는 분비를 위한 방법이 당업계에 잘 알려져 있다 (예를 들어, Ast et al (2013) Cell 152: 1134-1145, Ast and Schuldiner (2013) Crit Rev Biochem Mol Biol 48(3) 273-288, Van der Vaart et al (1997) Applied Environmental Microbiology 63(2) 615-620 참조, 이들 간행물 각각의 전체 내용은 본원에 참조로 포함됨).효소의 "활성" 은 용어 "기능" 과 상호교환가능하게 사용되며, 본 발명의 맥락에서, 원하는 반응을 촉매화하는 효소의 능력을 지정한다. 숙주 세포 내 효소의 양은 효소를 코딩하는 유전자의 전사를 변형시킴으로써 변경될 수 있다. 이는 예를 들어 효소를 코딩하는 뉴클레오티드 서열의 카피 수를 변형함으로써 (예를 들어, 뉴클레오티드 서열을 포함하는 더 높거나 더 낮은 카피 수 발현 벡터를 사용함으로써, 또는 뉴클레오티드 서열의 추가적인 카피를 숙주 세포의 게놈에 도입함으로써 또는 숙주 세포의 게놈에서 뉴클레오티드 서열을 결실시키거나 파괴함으로써), 오페론의 폴리시스트론성 mRNA 상의 코딩 서열의 순서를 변경하거나 오페론을 각각 그의 제어 요소를 갖는 개별 유전자로 분해함으로써, 또는 뉴클레오티드 서열이 작동가능하게 연결되는 프로모터 또는 오퍼레이터의 강도를 증가시킴으로써 달성될 수 있다.
대안적으로 또는 추가적으로, 숙주 세포 내의 효소의 카피 수는 효소를 인코딩하는 mRNA 의 번역 수준을 변형시킴으로써 변경될 수 있다. 이는 예를 들어, mRNA 의 안정성을 변형시키고, 리보솜 결합 위치의 서열을 변형시키고, 리보솜 결합 위치와 효소 코딩 서열의 시작 코돈 사이의 거리 또는 서열을 변형시키고, 효소 코딩 부위의 시작 코돈의 5' 측의 "업스트림" 에 위치하거나 이에 인접한 전체 인터시스트론 부위를 변형시키고, 헤어핀 및 특수 서열을 사용하여 mRNA 전사체의 3'-말단을 안정화시키고, 효소의 코돈 용법을 변형시키고, 효소의 생합성에 사용된 희귀 코돈 tRNA 의 발현을 변경시키고/시키거나, 예를 들어 그의 코딩 서열의 돌연변이를 통해 효소의 안정성을 증가시킴으로써 달성될 수 있다.
숙주 세포에서 효소의 활성은, 숙주 세포에서 증가되거나 감소된 용해도를 나타내는 효소의 변형된 형태를 발현시키거나, 효소의 활성이 억제되는 도메인이 결여된 효소의 변경된 형태를 발현시키거나, 기질에 대해 더 높거나 더 낮은 Kcat 또는 더 낮거나 더 높은 Km 을 갖는 효소의 변형된 형태를 발현시키거나, 경로 내의 또 다른 분자에 의한 피드백 또는 피드포워드 조절에 의해 더 많거나 더 적게 영향을 받는 효소의 변경된 형태를 발현시키는 것을 포함하지만 이에 제한되지 않는 다수의 방식으로 변경될 수 있다.용어 "코딩" 또는 "~을 코딩하는" 은 전사 및 번역의 메커니즘을 통해 폴리뉴클레오티드가 아미노산 서열을 생성하는 과정을 의미한다.
본 발명에서 고려되는 효소(들) 를 코딩하는 유전자(들) 는 외인성 또는 내인성일 수 있다.
본 발명에서 실행되는 방법은 바람직하게는 염색체 상의 특정 위치에 이종 뉴클레오티드 서열을 안정적으로 도입하기 위한 또는 유전적으로 변형된 세포에서 하나 이상의 표적 유전자의 기능적 파괴를 위한 하나 이상의 염색체 통합 구축물의 사용을 필요로 한다. 일부 구현예에서, 표적 유전자의 파괴는 관련된 기능적 단백질의 발현을 방지한다. 일부 구현예에서, 표적 유전자의 파괴는 파괴된 유전자로부터 비-기능적 단백질의 발현을 초래한다.
본 발명의 실행에서 변화될 수 있는 염색체 통합 구축물의 매개변수는 상동 서열의 길이; 상동 서열의 뉴클레오티드 서열; 통합 서열의 길이; 통합 서열의 뉴클레오티드 서열; 및 표적 유전자좌의 뉴클레오티드 서열을 포함하나 이에 제한되지 않는다. 일부 구현예에서, 각각의 상동 서열의 길이에 대한 유효 범위는 20 내지 5,000 개 염기쌍, 바람직하게는 50 내지 100 개 염기쌍이다. 특정 구현예에서, 각각의 상동 서열의 길이는 약 50 개 염기쌍이다. 유전자 표적화에 필요한 상동성의 길이에 대한 더 많은 정보는 D. Burke et al., Methods in yeast Genetics - A cold spring harbor laboratory course Manual (2000) 를 참조한다.
일부 구현예에서, (a) 상기 언급된 DNA 구축물(들) 이 삽입되도록 의도되는 파괴된 유전자(들) 는 유리하게는 형질전환된 세포의 선택에 유용한 하나 이상의 선별 마커를 포함할 수 있다. 바람직하게는, 상기 선별 마커(들) 는 본 발명에 따른 DNA 구축물(들) 에 포함된다.
일부 구현예에서, 선별 마커는 항생제 내성 마커이다. 항생제 내성 마커의 예시적인 예는 NAT1, AURl-C, HPH, DSDA, KAN<R> 및 SH BLE 유전자 산물을 포함하지만 이에 제한되지 않는다. S. 누르세이 (S. noursei) 로부터의 NAT 1 유전자 산물은 누르세오트리신에 대한 내성을 부여하고; 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터의 AURl-C 유전자 산물은 아우에로바시딘 A (AbA) 에 대한 내성을 부여하고; 클렙시엘라 뉴모니아에 (Klebsiella pneumoniae) 의 HPH 유전자 산물은 히그로마이신 B 에 대한 내성을 부여하고; 대장균의 DSDA 유전자 산물은 유일한 질소원으로서 D-세린과 함께 플레이트 상에서 세포가 성장하게 하고; Tn903 트랜스포존의 KAN<R> 유전자는 G418 에 대한 내성을 부여하고; 스트렙토알로테이쿠스 힌두스타누스 (Streptoalloteichus hindustanus) 로부터의 SH BLE 유전자 산물은 제오신 (블레오마이신) 에 대한 내성을 부여한다.
일부 구현예에서, 항생제 내성 마커는 본 발명의 유전적으로 변형된 세포가 단리된 후에 결실된다. 당업자는 특정 유전적 맥락에서 적절한 마커를 선택할 수 있다.
특정 구현예에서, 본 발명에 따른 재조합 세포는 어떠한 항생제 내성 마커도 없다. 이는 유리하게는 선택 배지에 항생제를 첨가할 필요성을 방지한다.
일부 구현예에서, 선별 마커는 유전적으로 변형된 세포에서 영양요구성 (예를 들어, 영양적 영양요구성) 을 구제한다. 이러한 구현예에서, 모 세포, 및 특히 모 효모는 아미노산 또는 뉴클레오티드 생합성 경로에서 기능하는 하나 이상의 유전자 산물, 예를 들어 효모에서의 HIS3, LEU2, LYS1, LYS2, MET15, TRP1, ADE2 및 URA3 유전자 산물에서의 기능적 파괴를 포함하며, 이는 모 세포가 하나 이상의 영양소 (영양요구성 표현형) 의 보충 없이 배지에서 성장할 수 없게 한다. 이어서, 영양요구성 표현형은 파괴된 유전자 산물의 기능적 카피를 코딩하는 염색체 통합으로 모 세포를 형질전환시킴으로써 구제될 수 있고 (일부 구현예에서, 유전자의 기능적 카피는 클루베로마이세스 (Kluveromyces), 칸디다 (Candida) 등과 같은 가까운 종으로부터 기원할 수 있음), 생성된 유전적으로 변형된 세포는 모 세포의 영양요구성 표현형의 손실을 기반으로 하여 선택될 수 있다.
프로모터 서열, 코딩 서열 (예를 들어, 효소 코딩 서열), 또는 터미네이터 서열을 포함하는 핵산 서열 각각에 대해, 참조 서열이 본원에 기재된다. 본 설명은 또한 참조 핵산 서열과 특정 백분율의 핵산 동일성을 갖는 핵산 서열을 포함한다.
각각의 관심 아미노산 서열에 대해, 참조 서열이 본원에 기재된다. 본 설명은 또한 참조 아미노산 서열과 특정 백분율의 아미노산 동일성을 갖는 아미노산 서열 (예를 들어, 효소 아미노산 서열) 을 포함한다.
명백한 이유로, 본 설명 전체에서, 각각 고려되는 뉴클레오티드 또는 아미노산 동일성을 준수하는 특정 핵산 서열 또는 특정 아미노산 서열은 원하는 생물학적 활성을 나타내는 단백질 (또는 효소) 을 수득하는 것으로 더 이어져야 한다. 본원에서 사용되는 바와 같이, 2 개의 핵산 서열 사이 또는 2 개의 아미노산 서열 사이의 "동일성 백분율"은 비교 윈도우 (comparison window) 를 통해 최적으로 정렬된 서열 모두를 비교함으로써 결정된다.
따라서, 비교 윈도우에서 뉴클레오티드 또는 아미노산 서열의 일부는 두 서열 사이의 최적 정렬이 수득되도록 참조 서열 (이들 부가 또는 이들 결실을 포함하지 않음) 과 비교하여 부가 또는 결실 (예를 들어, "갭") 을 포함할 수 있다.
용어 "서열 상동성" 또는 "서열 동일성" 또는 "상동성" 또는 "동일성"은 본원에서 상호교환가능하게 사용된다. 본 발명의 목적을 위해, 2 개의 아미노산 서열 또는 2 개의 핵산 서열의 서열 상동성 또는 서열 동일성의 백분율을 결정하기 위하여, 서열을 최적의 비교 목적을 위해 정렬하는 것이 본원에서 정의된다. 두 서열 사이의 정렬을 최적화하기 위해, 비교되는 2 개 서열 중 임의의 서열에 갭이 도입될 수 있다. 이러한 정렬은 비교되는 서열의 전체 길이에 걸쳐 실행될 수 있다. 대안적으로, 정렬은 더 짧은 길이, 예를 들어 약 20 개, 약 50 개, 약 100 개 이상의 핵산/기반 또는 아미노산에 걸쳐 실행될 수 있다. 서열 동일성은 보고된 정렬된 부위에 걸쳐 2 개의 서열 사이의 동일한 매치 백분율이다. 2 개 서열 사이의 서열의 비교 및 서열 동일성 백분율의 결정은 수학적 알고리즘을 사용하여 수행될 수 있다. 당업자는 여러 상이한 컴퓨터 프로그램이 2 개 서열을 정렬하고 2 개 서열 사이의 동일성을 결정하는데 이용 가능하다는 사실을 인식할 것이다 (Kruskal, J. B. (1983) An overview of sequence comparison In D. Sankoff and J. B. Kruskal, (ed.), Time warps, string edits and macromolecules: the theory and practice of sequence comparison, pp. 1-44 Addison Wesley).
2 개 아미노산 서열 사이 또는 2 개 뉴클레오티드 서열 사이의 서열 동일성 퍼센트는 2 개 서열의 정렬을 위한 니들만 (Needleman) 및 분쉬 (Wunsch) 알고리즘을 사용하여 결정될 수 있다 (Needleman, S. B. and Wunsch, C. D. (1970) J. Mol. Biol. 48, 443-453). 아미노산 서열 및 뉴클레오티드 서열 둘 모두는 알고리즘에 의해 정렬될 수 있다. 니들만-분쉬 알고리즘은 컴퓨터 프로그램 NEEDLE 에서 구현되었다.
본 발명의 목적을 위해, EMBOSS 패키지로부터의 NEEDLE 프로그램을 사용하였다 (버전 2.8.0 이상, EMBOSS: The European Molecular Biology Open Software Suite (2000) Rice, P. LongdenJ. and Bleasby,A. Trends in Genetics 16, (6) pp276― 277, http://emboss.bioinformatics.nl/). 단백질 서열의 경우, EBLOSUM62 가 치환 매트릭스에 사용된다. 뉴클레오티드 서열의 경우, EDNAFULL 이 사용된다. 사용된 선택적인 매개변수는 10 의 갭 개방 페널티 및 0.5 의 갭 연장 페널티이다. 앤드 갭 페널티 (end gap penalty) 가 추가되지 않는다. 출력 (Output) 섹션에서, 출력 정렬 포맷으로서 표시된 질문 "간략한 동일성 및 유사성 (Brief identity and similarity)" 및 "SRS 쌍별 (pairwise)" 에 대한 응답으로 Yes 가 표시되었다.
상기 기재된 바와 같은 프로그램 NEEDLE 에 의한 정렬 후, 질의 서열 (query sequence) 과 본 발명의 서열 사이의 서열 동일성 백분율을 하기와 같이 계산한다: 정렬에서 갭의 총 수를 뺀 후 정렬의 총 길이로 나눈 양 서열에서 동일한 아미노산 또는 동일한 뉴클레오티드를 나타내는 정렬에서 상응하는 위치의 수. 본원에서 정의된 동일성은 NOBRIEF 옵션을 사용하여 NEEDLE 로부터 수득할 수 있고, 프로그램의 출력에서 "최장 동일성 (longest-identity)" 으로서 라벨링된다.
뉴클레오티드 및 아미노산 서열의 유사성, 즉 서열 동일성의 백분율은 여러 다른 업계-공지된 알고리즘을 사용하여, 바람직하게는 칼린 (Karlin) 과 알츠철 (Altschul) 의 수학적 알고리즘 (Karlin & Altschul (1993) Proc. Natl. Acad. Sci. USA 90: 5873-5877), hmmalign (HMMER 패키지, http://hmmer.wustl.edu/) 또는 예를 들어 https://www.ebi.ac.uk/Tools/msa/clustalo/ 또는 GAP 프로그램 (아이오와 대학의 수학적 알고리즘) 에서 이용가능한 CLUSTAL 알고리즘 (Thompson, J. D., Higgins, D. G. & Gibson, T. J. (1994) Nucleic Acids Res. 22, 4673-80) 또는 마이어스 (Myers) 와 밀러 (Miller) (1989 - Cabios 4: 11-17) 또는 Clone Manager 9 의 수학적 알고리즘으로, 서열 정렬을 통해 결정될 수 있다. 사용한 바람직한 매개변수는 https://www.ebi.ac.uk/Tools/msa/clustalo/ 에서 설정되는 바와 같은 디폴트 매개변수이다.
서열 동일성 등급 (서열 매칭) 은 예를 들어, BLAST, BLAT 또는 BlastZ (또는 BlastX) 를 사용하여 계산될 수 있다. 유사한 알고리즘이 Altschul et al (1990) J. Mol. Biol. 215, 403-410 의 BLASTN 및 BLASTP 프로그램에 통합된다. BLAST 폴리뉴클레오티드 검색을 BLASTN 프로그램, 스코어 = 100, 단어 길이 = 12 로 수행하여, 관련 단백질을 코딩하는 핵산과 상동성인 폴리뉴클레오티드 서열을 수득한다.
BLAST 단백질 검색을 BLASTP 프로그램, 스코어 = 50, 단어 길이 = 3 으로 수행하여 SHC 폴리펩티드에 상동성인 아미노산 서열을 수득한다. 비교 목적을 위한 갭화된 정렬 (gapped alignment) 을 수득하기 위해, Gapped BLAST 를 Altschul et al (1997) Nucleic Acids Res. 25, 3389-3402 에서 기재된 바와 같이 이용할 수 있다. BLAST 및 Gapped BLAST 프로그램을 이용할 때, 각각의 프로그램의 디폴트 매개변수가 사용된다. 서열 매칭 분석은 Shuffle-LAGAN (Brudno M., Bioinformatics 2003b, 19 Suppl 1: 154-162) 또는 마르코브 (Markov) 랜덤 필드와 같은 확립된 상동성 맵핑 기법에 의해 보충될 수 있다. 서열 동일성의 백분율이 본 출원에서 언급되는 경우, 이들 백분율은 달리 구체적으로 나타내지 않는 한 더 긴 서열의 전체 길이와 관련하여 계산된다.
특정 구현예에서, 2 개 서열 사이의 동일성 % 는 CLUSTAL O (버전 1.2.4) 를 사용하여 결정된다.
"발효" 또는 "배양"은 일반적으로 적어도 하나의 단순한 탄소원 및 필요한 경우 보조 기질을 함유하는, 배양되는 세포에 적합한 적절한 배양 배지를 갖는 발효기에서 수행된다.
용어 "발효 조성물"은 유전적으로 변형된 숙주 세포 및 유전적으로 변형된 숙주 세포에 의해 생산되는 생성물 또는 대사산물을 포함하는 조성물을 의미한다. 발효 조성물의 예는 전세포 브로쓰 (whole cell broth) 이며, 이는 세포, 수성상, 및 유전적으로 변형된 숙주 세포로부터 생산된 화합물을 포함하는 용기 (예를 들어, 플라스크, 플레이트 또는 발효기) 의 전체 내용물일 수 있다.
용어 "배지"는 배양 (culture) 배지 또는 배양 (cultivation) 배지 또는 발효 배지를 의미한다.
콘드로이틴의 최대 생산을 위해, 생산 숙주로서 사용되는 재조합 세포는 바람직하게는 높은 탄수화물 이용률을 갖는다. 이러한 특징은 돌연변이유발 및 선택, 유전 공학에 의해 부여되거나, 자연적인 것일 수 있다. 본 세포에 대한 발효 배지, 또는 "배양 배지 (culture medium)" 또는 "배양 배지 (cultivation medium)" 는 적어도 약 10 g/L 의 글루코dh스 및/또는 수크로오스를 함유할 수 있다. 추가적인 탄소 기질은 단당류 예컨대 프룩토오스, 만노오스, 자일로오스 및 아라비노오스; 올리고당류 예컨대 락토오스, 말토오스, 갈락토오스 또는 수크로오스; 다당류 예컨대 전분 또는 셀룰로오스 또는 이의 혼합물 및 치즈 유청 투과액 (cheese whey permeate) 옥수수 침지액 (cornsteep liquor), 사탕무 당밀 및 보리 맥아와 같은 재생가능한 공급원료로부터의 비정제된 혼합물을 포함할 수 있으나 이에 제한되지 않는다. 다른 탄소 기질은 글리세롤, 아세테이트 및/또는 에탄올을 포함할 수 있다.
따라서, 본 발명에 사용되는 탄소원은 매우 다양한 탄소 함유 기질을 포함할 수 있고, 단지 세포, 특히 효모의 선택에 의해 제한될 것으로 고려된다.
상기 언급된 모든 탄소 기질 및 이의 혼합물이 본 발명에 적합한 것으로 고려되지만, 바람직한 탄소 기질은 글루코오스, 프룩토오스 및 수크로오스, 또는 C5 당, 보다 특히 글루코오스를 사용하도록 변형된, 세포, 특히 효모에 대한 자일로오스 및/또는 아라비노오스와 같은 C5 당과 이들의 혼합물이다.
바람직한 탄소 기질은 글루코오스 또는 수크로오스이다.
적절한 탄소원에 추가로, 발효 배지는 원하는 생성물의 생산에 필요한 배양물의 성장 및 효소적 경로의 촉진에 적합한, 당업자에게 공지된 적합한 미네랄, 염, 보조인자, 완충제 및 다른 성분을 함유할 수 있다.
게다가, 본 발명에 따른 재조합 세포의 성장에 적합한 추가적인 유전적 변형이 고려될 수 있다.
용어 "호기성 조건" 은 호기성 또는 통성 혐기성 세포, 특히 효모가 말단 전자 수용체로서 이산소 (di-oxygene) 을 사용하기에 충분한 배양 배지 중의 산소 농도를 의미한다.
"미세호기성 조건" 은 산소의 농도가 공기 중의 농도보다 더 낮은, 즉 산소 농도가 6% O2 까지인 배양 배지를 의미한다.
"적절한 배양 배지" 는 탄소원 또는 탄소 기질, 질소원, 예를 들어 펩톤, 효모 추출물, 고기 추출물, 맥아 추출물, 우레아, 암모늄 술페이트, 암모늄 클로라이드, 암모늄 니트레이트 및 암모늄 포스페이트; 인 공급원, 예를 들어 모노포타슘 포스페이트 또는 디포타슘 포스페이트; 미량 원소 (예를 들어, 금속 염), 예를 들어 마그네슘 염, 코발트 염 및/또는 망간 염; 뿐만 아니라 아미노산, 비타민, 성장 촉진제 등과 같은 성장 인자와 같은 세포의 유지 및/또는 성장에 필수적이거나 이로운 영양소를 포함하는 배지 (예를 들어 멸균, 액체 배지) 를 나타낸다. 본 발명에 따른 용어 "탄소원" 또는 "탄소 기질" 또는 "탄소의 공급원" 은 세포의 정상적인 성장을 지지하기 위해 당업자에 의해 사용될 수 있는 탄소의 임의 공급원을 나타내며 헥소오스 (예컨대 글루코오스, 갈락토오스 또는 락토오스), 펜토오스, 단당류, 올리고당류, 이당류 (예컨대 수크로오스, 셀로비오스 또는 말토오스), 당밀, 전분 또는 이의 유도체, 셀룰로오스, 헤미셀룰로오스 및 이의 조합을 포함한다.
본 발명의 재조합 세포, 및 특히 본 발명의 재조합 효모를 생산하기에 특히 적합한 배양 배지는 하기 본문에서 기재된다. 본 발명의 콘드로이틴의 "제어된" 분자량은 본 발명의 방법에 의해 생성된 콘드로이틴의 적어도 80%, 특히 적어도 85% 가, 하기와 같은 본 발명의 방법 및/또는 재조합 세포의 적어도 하나의 매개변수의 조절을 통해 특정한 사전결정된 분자량 범위 내에 포함되는 분자량을 갖는 것을 의미하는 것으로 의도된다:
- 재조합 세포의 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 핵산의 성질 및 기원,
- 재조합 세포의 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 핵산의 발현을 제어하는 프로모터의 성질 및 기원,
- 재조합 세포의 콘드로이티나아제 활성을 갖는 폴리펩티드와 관련된 고정 및/또는 분비 신호의 존재,
- 재조합 세포를 배양하는 단계 동안 배양 배지의 pH, 및/또는
- 재조합 세포의 배양 지속기간.
본원에서 사용되는 용어 "약" 은 당업자에게 결정되는 바와 같은 값에 대한 합리적인 범위를 의미한다. 특정 구현예에서, 용어 약은 ± 1, 2 또는 3 표준 편차를 의미한다. 특정 구현예에서, 용어 약은 ± 5%, 10%, 20% 또는 25% 를 의미한다. 특정 구현예에서, 용어 약은 ± 0.1, 0.2 또는 0.3 로그 단위, 예를 들어 pH 단위를 의미한다.
본 발명에 따라 도입된 유전자 변형의 일반적 특성
- 모든 게놈 변형은 공지된 유전 공학 기법에 따라 재조합 세포, 특히 재조합 효모에 삽입된다:
- 본 발명에 따른 재조합 세포 게놈에 도입되는 유전자 구축물에 포함되는 연속적인 핵산 서열은 하기 구조의 것이다:
Prom1-ORF1-term1-ORF2-유전자2-term2 - …/… -Promn-ORFn-termn, 여기서:
- Prom1 은 코딩 서열 ORF1 의 발현을 조절하는 서열이고,
- ORF1 은 원하는 단백질 PROT1, 특히 원하는 효소 PROT1 을 코딩하는 핵산 서열이고,
- Term1 은 전사 복합체로부터 mRNA 를 방출하는 과정을 촉발하는 새롭게 합성된 mRNA 에 신호를 제공함으로써 전사 종결을 매개하는 전사 터미네이터 서열이고,
- "1", "2", .../... "n"은 동일한 ORF (개방 판독 프레임), 프로모터 또는 터미네이터를 기재할 수 있거나 기재하지 않을 수 있다. 핵산 서열의 순서는 중요하지 않다. "n" 은 통상 5 내지 20 범위의 정수이다. 이들 구축물은 제어된 위치에서 재조합 세포 염색체 중 하나에 삽입된다. 일부 구현예에서, 삽입 위치는 삽입된 구축물의 기능성에 필수적이지도 않고, 생성된 유전적으로 변형된 세포의 생존력에 필수적이지도 않다.
당업자에 의해 이해되는 바와 같이, 코딩 서열을 변형하여 특정 숙주에서 그의 발현을 향상시키는 것이 유리할 수 있다. 유전자 코드는 64 개의 가능한 코돈과 중복되지만, 대부분의 유기체는 전형적으로 이들 코돈의 하위세트를 사용한다. 한 종에서 가장 자주 사용되는 코돈을 최적 코돈이라고 하며, 매우 자주 사용되지 않는 코돈을 희귀 또는 저사용량 코돈으로 분류한다. 코돈은 때때로 "코돈 최적화" 또는 "종 코돈 편향에 대한 제어" 라고 불리는 공정에서, 숙주의 바람직한 코돈 용법을 반영하도록 치환될 수 있다. 다른 숙주 세포에 대한 코돈 최적화는 코돈 용법 표를 사용하여 쉽게 결정될 수 있거나, Integrated DNA Technologies 로부터의 CodonOp (www.idtdna.com/CodonOptfrom) 와 같은 상업적으로 이용가능한 소프트웨어를 사용하여 수행될 수 있다. 특정 원핵 또는 진핵 숙주에 의해 바람직한 코돈을 함유하는 최적화된 코딩 서열 (Murray et al, 1989 , Nucl Acids Res. 17: 477-508) 은, 예를 들어, 비-최적화된 서열로부터 생성된 전사체와 비교하여, 번역의 속도를 증가시키거나 더 긴 반감기와 같은 바람직한 특성을 갖는 재조합 RNA 전사체를 생성하도록 제조될 수 있다. 번역 중지 코돈은 또한 숙주 선호도를 반영하도록 변형될 수 있다. 예를 들어, S. 세레비지에 (S. cerevisiae) 및 포유동물에 대한 전형적인 중지 코돈은 각각 UAA 및 UGA 이다. 단자엽 식물에 대한 전형적인 중지 코돈은 UGA 인 반면, 곤충 및 대장균은 중지 코돈으로서 UAA 를 통상적으로 사용한다 (Dalphin et al., 1996, Nucl Acids Res. 24: 216-8).
- 재조합 세포가 효모 세포이고, 특히 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 효모 세포인 경우, 효모 게놈에 도입되고 사카로마이세스 세레비지에 이외의 다른 유기체로부터 기원하는 핵산 서열은 일반적으로 "트랜스코딩" (일반적으로 "코돈-최적화") 되며, 이는 이들 핵산 서열이 S. 세레비지에 (S. cerevisiae) 에서의 발현을 위한 최적의 코돈 용법으로 합성된다는 것을 의미한다. S. 세레비지에로부터의 일부 핵산 서열의 뉴클레오티드 서열 (및 단백질 서열이 아님) 은 또한 상기 유전자의 내인성 카피와의 재조합을 최소화하기 위해 변형 ("트랜스코딩") 되었다.
- 유전자는 세포 유전 공학에 사용되는 표준 절차를 통해 결실될 수 있다. 일부 구현예에서, 결실을 위해 표적화된 유전자는 상기 기재된 유전자 구축물 중 하나의 삽입에 의해 중단될 수 있거나, 대안적으로 결실을 위해 표적화된 유전자는 뉴클레오티드의 짧은 스트레치에 의해 대체된다.
- 핵산 서열은 핵산 서열의 내인성 카피를 결실시키고 (필요한 경우) 유도성 또는 억제성 프로모터의 조절 하에 ORF 의 새로운 카피를 배치함으로써 "유도성 또는 억제성" 이 될 수 있다. 유도성 또는 억제성 프로모터는 환경 조건 또는 외부 자극의 변화시 활성이 조절되거나 제어되는, 즉 증가 또는 감소되는 프로모터이다. 유도 또는 억제는 인위적으로 제어될 수 있으며, 이는 세포, 특히 효모에서 자연적으로 발견되지 않는 관심 대상의 화학적 화합물, 빛, 산소 수준, 열 또는 냉감과 같은 비생물학적 인자에 의한 유도 또는 억제를 포함한다. 유도성 또는 억제성 프로모터의 목록 및 서열은 본 명세서의 다른 곳에 기재되어 있다.
본 발명에 따른 재조합 세포
본 발명자는 콘드로이틴을 생산하는 능력을 갖는 재조합 세포, 특히 재조합 효모를 구상하였다.
본 발명은 콘드로이틴을 생산하는 능력을 갖는 재조합 세포, 특히 재조합 효모에 관한 것이며, 여기서 콘드로이틴을 생산하는 이러한 능력은 유전 공학 방법에 의해 그의 게놈에 도입된 다수의 변경을 통해 수득된다.
본 발명은 콘드로이틴을 생산하는 재조합 효모 세포에 관한 것이며, 여기서 재조합 세포는 하기를 포함한다:
(a) 콘드로이틴 신타아제 (HCOS) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산;
(b) UDP-글루코오스 탈수소효소 (UDP-GlcDH 또는 HASB) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산; 및
(c) UDP-글루코오스-4-에피머라아제 (kfoA 또는 GNE1) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산.
본 발명은 또한 콘드로이틴을 생산하는 재조합 숙주 세포에 관한 것이며, 여기서 재조합 숙주 세포는 하기를 포함한다:
(a) 콘드로이틴 신타아제 (HCOS) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산;
(b) UDP-글루코오스 탈수소효소 (UDP-GlcDH 또는 HASB) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산;
(c) UDP-글루코오스-4-에피머라아제 (kfoA 또는 GNE1) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산; 및
(d) 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산으로서, 콘드로이티나아제 활성을 갖는 폴리펩티드는 분비 신호를 포함하고, 임의로는 고정 신호를 포함하여, 콘드로이틴, 특히 원하는 분자량이 숙주 세포에 의해 생산되는 하나 이상의 재조합 핵산.
본 발명자들은 세포에 의해, 특히 효모 세포에 의해 콘드로이틴을 생산하는 능력이 이들 세포의 게놈에 복수의 유전적 변경을 도입함으로써 달성될 수 있다는 것을 발견하였다.
본 발명의 세포, 특히 본 발명의 효모 세포에 의한 콘드로이틴의 생산은 UDP-글루코오스 및 UDP-N-아세틸-글루코사민의 내인성 대사를 최적화함으로써 달성되어 왔고, 후속적인 인공적으로 변형된 대사 경로를 주로 콘드로이틴 생산으로 유도하면서, 동시에 생성된 유전적으로 변형된 세포의 최적 생존력을 유지한다.
본 발명에 따른 재조합 세포에 의한 콘드로이틴 생산은 글루코오스-6-포스페이트의 연속 중간 대사산물 (i) 글루코오스-1-포스페이트, UDP-글루코오스, UDP-글루쿠로네이트 및 콘드로이틴 또는 (ii) 프룩토오스-6-포스페이트, 글루코사민-6-포스페이트, N-아세틸-글루코사민-6-포스페이트, N-아세틸-글루코사민-1-포스페이트, UDP-N-아세틸-글루코사민, UDP-N-아세틸-갈락토사민 및 콘드로이틴으로의 전환을 증가시키면서, 생성된 재조합 세포의 양호한 생존력을 허용하는 대사 균형을 유지함으로써 증가될 수 있는 것으로 결정되었다.
실제로, 본 발명의 생존가능한 재조합 세포를 수득하기 위해, 생존가능하고 효율적인 재조합 세포, 및 특히 생존가능한 재조합 효모를 수득하기 위해 많은 상이한 구축물을 시험하였다. 특히, 이러한 재조합 효모는 일부 중간체의 일시적인 축적이 효모에 대해 독성을 나타낸 것으로 나타났기 때문에 수득하기 어려웠다.
콘드로이틴을 생산할 수 있는 재조합 세포의 제조, 특히 분자량이 제어된 콘드로이틴을 생산하기에 적합한 조건을 확립하는데 예상치 못한 기술적 어려움이 있었다.
실제로, 많은 연구 및 실험 시험 후, 본 발명자들은 하기 매개변수를 사용하여 제어된 분자량을 갖는 콘드로이틴을 생산할 수 있는 재조합 세포, 및 특히 재조합 효모 세포, 보다 특히 재조합 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 효모 세포를 배양할 수 있다는 것을 발견하였다:
- 본 발명의 재조합 세포, 특히 재조합 효모의 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 핵산 서열의 성질 및 기원의 선택; 및/또는
- 본 발명의 재조합 세포, 특히 재조합 효모의 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 핵산 서열의 발현을 제어하는 프로모터의 성질 및 기원; 및/또는
- 본 발명에 따른 재조합 세포, 특히 재조합 효모의 콘드로이티나아제 활성을 갖는 코딩된 폴리펩티드와 관련된 분비 신호에 추가로, 고정 신호의 선택적 존재; 및/또는
- 본 발명에 따른 재조합 세포, 특히 재조합 효모를 배양하는 단계 동안 배양 배지의 pH; 및/또는
- 본 발명에 따른 재조합 세포, 특히 재조합 효모의 배양 지속기간.
발명자들의 지식에 따르면, 이는 이전에는 결코 달성된 적이 없다.
본 발명의 재조합 세포에서 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 핵산은 큐피엔니우스 살레이 (Cupiennius salei), 티티우스 세르룰라투스 (Tityus serrulatus), 보스 타우루스 (Bos taurus), 베스파 마그니피카 (Vespa magnifica), 마카카 물라타 (Macaca mulata) 또는 아피스 멜리페라 (Apis mellifera) 중 적어도 하나로부터, 바람직하게는 티티우스 세르룰라투스 (Tityus serrulatus) 로부터 수득되거나 유래될 수 있다.
콘드로이틴의 분자량은 50kDa 미만의 범위, 바람직하게는 약 20kDa 내지 약 50kDa 의 범위일 수 있다.
대안적으로, 콘드로이틴의 분자량은 50kDa 초과의 범위, 바람직하게는 약 50kDa 내지 약 250kDa 의 범위일 수 있다.
또 다른 대안에서, 콘드로이틴의 분자량은 100kDa 초과의 범위, 바람직하게는 약 100kDa 내지 약 1500kDa 의 범위일 수 있다.
UDP-글루코오스 탈수소효소 (UDP-GlcDH 또는 HASB) 활성을 갖는 폴리펩티드를 코딩하는 핵산은 아라비돕시스 탈리아나 (Arabidopsis thaliana), 클로렐라 바이러스 PBCV1 또는 스트렙토코쿠스 주에피데미쿠스 (Streptococcus zooepidemicus) 중 적어도 하나로부터 수득되거나 유래할 수 있고, 특히 아라비돕시스 탈리아나 (Arabidopsis thaliana) 또는 클로렐라 바이러스 PBCV1 로부터 수득되거나 유래할 수 있다.
콘드로이틴 신타아제 (HCOS) 활성을 갖는 폴리펩티드를 코딩하는 핵산은 하기일 수 있다
(i) 콘드로이틴 신타아제를 코딩하는 핵산; 또는
(ii) 콘드로이틴 신타아제 활성을 갖는 키메라 폴리펩티드를 코딩하는 핵산
핵산은 파스튜렐라 물토시다 (Pasteurella multocida), 클로렐라 바이러스 (Chlorella virus) PBCV1, 마이코박테리움 튜베르쿨로시스 (Mycobacterium tuberculosis), 호모 사피엔스 (Homo sapiens), 에스케리키아 콜라이 (Escherichia coli), 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 또는 페니실룸 옥살리쿰 (Penicillium oxalicum) 중 적어도 하나로부터 수득되거나 유래될 수 있다.
UDP-글루코오스-4-에피머라제 (kfoA 또는 GNE1) 활성을 갖는 폴리펩티드를 코딩하는 핵산은 박테리아, 특히 슈도모나스 아에루기노사 (Pseudomonas aeruginosa), 파스튜렐라 물토시다 (Pasteurella multocida), 및 에스케리키아 콜라이 (Escherichia coli) 로 이루어진 군으로부터 선택되는 박테리아로부터 수득되거나 유래될 수 있다.
재조합 세포는 하기 중 하나 이상을 코딩하는 적어도 하나의 재조합 핵산을 추가로 포함할 수 있다:
(i) 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 (GFA1) 활성을 갖는 폴리펩티드; 및/또는
(ii) UDP-N-아세틸글루코사민 피로포스포릴라아제 (QRI1) 활성을 갖는 폴리펩티드.
재조합 세포는 하기 중 하나 이상을 코딩하는 적어도 하나의 재조합 핵산을 추가로 포함할 수 있다:
(i) 포스포글루코뮤타아제-1 (PGM1) 활성을 갖는 폴리펩티드; 및/또는
(ii) UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 (UGP1) 활성을 갖는 폴리펩티드; 및/또는
(iii) 글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 (GNA1) 활성을 갖는 폴리펩티드; 및/또는
(iv) 포스포아세틸글루코사민 뮤타아제 (PCM1) 활성을 갖는 폴리펩티드.
재조합 세포의 특정 구현예에서,
- 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 (GFA1) 활성을 갖는 폴리펩티드를 코딩하는 핵산;
- UDP-N-아세틸글루코사민 피로포스포릴라아제 (QRI1) 활성을 갖는 폴리펩티드를 코딩하는 핵산;
- 포스포글루코뮤타아제-1 (PGM1) 활성을 갖는 폴리펩티드를 코딩하는 핵산;
- UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 (UGP1) 활성을 갖는 폴리펩티드를 코딩하는 핵산;
- 글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 (GNA1) 활성을 갖는 폴리펩티드를 코딩하는 핵산; 및/또는
- 포스포아세틸글루코사민 뮤타아제 (PCM1) 를 갖는 폴리펩티드를 코딩하는 핵산
이 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 수득되거나 유래한다.
특정 구현예에서, 재조합 숙주 세포는 효모이다.
특히, 재조합 세포는 사카로마이세스 (Saccharomyces) 속, 또는 칸디다 (Candida) 속, 또는 클루이베로마이세스 (Kluyveromyces) 속, 또는 오가타에아 (Ogataea) 속, 또는 야로위아 (Yarrowia) 속, 또는 데바리오마이세스 (Debaryomyces) 속, 또는 아쉬비아 (Ashbya) 속에 속하고, 특히 사카로마이세스 속에 속한다.
특히, 재조합 세포는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae), 사카로마이세스 보울라르디이 (Saccharomyces boulardii), 사카로마이세스 바야누스 (Saccharomyces bayanus), 사카로마이세스 파라독수스 (Saccharomyces paradoxus), 사카로마이세스 미카타에 (Saccharomyces mikatae), 사카로마이세스 카스텔리 (Saccharomyces castelli), 칸디다 알비칸스 (Candida albicans), 칸디다 글라브라타 (Candida glabrata), 칸디다 트로피칼리스 (Candida tropicalis), 클루이베로마이세스 락티스 (Kluyveromyces lactis), 클루이베로마이세스 마르시아누스 (Kluyveromyces marxianus), 클루이베로마이세스 폴리스포루스 (Kluyveromyces polysporus), 클루이베로마이세스 테르모톨레렌스 (Kluyveromyces thermotolerens), 오가타에아 폴리모르파 (Ogataea polymorpha), 야로위아 리폴리티카 (Yarrowia lypolytica), 데바리오마이세스 한세니이 (Debaryomyces hansenii) 및 아쉬비아 고시피이 (Ashbya gossypii) 로 이루어지는 군에서 선택되고, 바람직하게는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 이다.
본 발명의 또 다른 목적은 하기 단계를 포함하는 원하는 분자량의 콘드로이틴의 생산 방법에 관한 것이다:
(a) 본원에서 정의된 바와 같은 재조합 세포를 원하는 분자량의 콘드로이틴을 생산하기에 충분한 시간 동안 배양 배지에서 배양하는 단계; 및
(b) 임의로는 재조합 세포 및/또는 배양 배지로부터 콘드로이틴을 단리하거나 회수하는 단계.
본 방법에서, 콘드로이틴은 약 20 kDa 내지 약 50 kDa 의 분자량을 가질 수 있다.
또다른 구현예에서, 콘드로이틴은 약 50 kDa 내지 약 150 kDa 의 분자량을 가질 수 있다.
또다른 구현예에서, 콘드로이틴은 약 150 kDa 내지 약 1500 kDa 의 분자량을 가질 수 있다.
본 발명의 방법에서, 재조합 세포는 사카로마이세스 속에 속하는 효모일 수 있고, 특히 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 일 수 있다.
원하는 분자량의 콘드로이틴을 생산하기에 충분한 시간은 약 35 시간 내지 약 50 시간, 바람직하게는 약 40 시간 내지 약 50 시간의 기간일 수 있고, 바람직하게는 약 48 시간일 수 있다.
특정 구현예에서, 생산된 콘드로이틴의 분자량은 단계 (a) 동안 배양 배지의 pH 를 조절함으로써 제어될 수 있다.
구현예에서, 방법이 산업적 규모로 실행되고, 바람직하게는 배양 배지가 적어도 약 100L 이고, 더욱 바람직하게는 약 1,000L 내지 약 3,000L 범위이고, 더욱 더 바람직하게는 약 10,000L 이거나, 더욱 더 바람직하게는 약 100,000L 이거나, 심지어 약 250,000L 이다.
본 발명의 또 다른 목적은 본 발명의 재조합 세포로부터, 또는 본 발명에 따른 방법으로부터 수득되는 콘드로이틴에 관한 것이다.
본 발명은 또한 본 발명의 콘드로이틴을 포함하는 배양 배지에 관한 것이다.
본 발명의 또다른 양상은 본 발명의 콘드로이틴을 포함하는 조성물이다.
본 발명은 또한 (i) 본 발명에 따른 분자량을 갖는 콘드로이틴, (ii) 본 발명에 따른 배양 배지 또는 (iii) 본 발명에 따른 조성물을 포함하는 공산품 또는 소비재 또는 소모품에 관한 것이다.
특히, 공산품 또는 소비재 또는 소모품은 화장품, 향미 제품, 향료 제품, 식료품, 식품, 음료, 식감제, 약학 조성물, 식이 보충제, 기능식품, 세정 제품, 치아 및/또는 구강 위생 조성물일 수 있다.
본 발명은 또한 약 20kDa 내지 약 50kDa 또는 약 50kDa 내지 약 1000kDa 범위의 분자량을 갖는 콘드로이틴의 생산을 위한 본 발명의 재조합 세포의 용도에 관한 것이다.
본 발명의 또다른 목적은 하기의 단계:
(a) 본원에서 정의된 바와 같은 재조합 효모를 배양 배지에서 배양하는 단계; 및
(b) 상기 배양 배지로부터 콘드로이틴을 회수하는 단계
를 포함하는 콘드로이틴의 생산 방법으로서,
여기서, 단계 (b) 에서 회수된 콘드로이틴은,
- 재조합 효모의 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산의 성질 및 기원,
- 재조합 효모의 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산의 발현을 제어하는 프로모터의 성질 및 기원,
- 재조합 효모의 콘드로이티나아제 활성을 갖는 폴리펩티드와 관련된 고정 및/또는 분비 신호의 존재,
- 재조합 효모를 배양하는 단계 동안 배양 배지의 pH, 및/또는
- 재조합 효모의 배양 지속기간
의 선별을 통해 제어된 분자량을 갖는 생산 방법에 관한 것이다.
또한, 본 발명은 콘드로이틴-생산 재조합 효모에 관한 것이며, 재조합 효모는 하기를 포함한다:
- (A) 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 (GFA1) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산,
- (B) UDP-N-아세틸글루코사민 피로포스포릴라아제 (QRI1) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산,
- (C) UDP-글루코오스 탈수소효소 (UDP-GlcDH 또는 HASB) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산.
- (D) 콘드로이틴 신타아제 (HCOS) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산, 및
- (E) UDP-글루코오스-4-에피머라아제 (kfoA 또는 GNE1) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산, 상기 재조합 효모는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 임.
특정 구현예에서, 본 발명에 따른 재조합 세포, 특히 본 발명에 따른 재조합 효모는 (F) 콘드로이티나제 활성을 갖는 폴리펩티드를 코딩하는 하나의 핵산을 추가로 포함하며, 여기서 콘드로이티나제 활성을 갖는 폴리펩티드를 코딩하는 핵산은 콘드로이틴, 특히 원하는 분자량의 콘드로이틴이 숙주 세포에 의해 생성되도록 고정 신호 및/또는 분비 신호를 포함한다.
특정 구현예에서, 본 발명에 따른 재조합 세포, 특히 재조합 효모는 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 (GFA1) 활성을 갖는 폴리펩티드를 코딩하는 오직 하나의 재조합 핵산을 포함한다.
특정 구현예에서, 본 발명에 따른 재조합 세포, 특히 재조합 효모는 UDP-N-아세틸글루코사민 피로포스포릴라아제 (QRI1) 활성을 갖는 폴리펩티드를 코딩하는 1 과 10 사이, 바람직하게는 2 와 8 사이의 재조합 핵산을 포함한다.
특정 구현예에서, 본 발명에 따른 재조합 세포, 특히 재조합 효모는 UDP-글루코오스 탈수소효소 (UDP-GlcDH 또는 HASB) 활성을 갖는 폴리펩티드를 코딩하는 1 과 5 사이의 재조합 핵산을 포함한다.
또다른 구현예에서, UDP-글루코오스 탈수소효소 (UDP-GlcDH 또는 HASB) 를 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 아라비돕시스 탈리아나 (Arabidopsis thaliana), 클로렐라 바이러스 PBCV1 또는 스트렙토코쿠스 주에피데미쿠스 (Streptococcus zooepidemicus) 중 적어도 하나로부터 수득되거나 유래하고, 특히 클로렐라 바이러스 PBCV1 또는 아라비돕시스 탈리아나 (Arabidopsis thaliana) 로부터 수득되거나 유래한다.
또다른 구현예에서, 본 발명에 따른 재조합 세포, 특히 재조합 효모는 콘드로이틴 신타아제 (HCOS) 활성을 갖는 폴리펩티드를 코딩하는 1 과 5 사이의 재조합 핵산을 포함한다.
특정 구현예에서, 콘드로이틴 신타아제 (HCOS) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 핵산은 파스튜렐라 물토시다 (Pasteurella multocida), 클로렐라 바이러스 (Chlorella virus) PBCV1, 마이코박테리움 튜베르쿨로시스 (Mycobacterium tuberculosis), 호모 사피엔스 (Homo sapiens), 에스케리키아 콜라이 (Escherichia coli), 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 또는 페니실룸 옥살리쿰 (Penicillium oxalicum) 중 적어도 하나로부터 수득되거나 유래한다.
또다른 구현예에서, 본 발명에 따른 재조합 세포, 특히 재조합 효모는 UDP-글루코오스-4-에피머라아제 (kfoA 또는 GNE1) 활성을 갖는 폴리펩티드를 코딩하는 1 과 5 사이의 재조합 핵산을 포함한다.
특정 구현예에서, UDP-글루코오스-4-에피머라제 (kfoA 또는 GNE1) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 핵산은 슈도모나스 아에루기노사 (Pseudomonas aeruginosa), 파스퇴렐라 물토시다 (Pasteurella multocida) 및 에스케리키아 콜라이 (Escherichia coli) 중 적어도 하나로부터 수득되거나 유래한다.
특정 구현예에서, 본 발명에 따른 재조합 세포, 특히 재조합 효모는 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 오직 하나의 재조합 핵산을 포함한다.
또다른 구현예에서, 콘드로이티나제 활성을 갖는 폴리펩티드를 인코딩하는 하나 이상의 재조합 핵산은 큐피엔니우스 살레이 (Cupiennius salei), 티티우스 세르룰라투스 (Tityus serrulatus), 보스 타우루스 (Bos taurus), 아피스 멜리페라 (Apis mellifera), 마카카 물라타 (Macaca mulata), 또는 베스파 마그니피카 (Vespa magnifica) 중 적어도 하나로부터 수득되거나 유래한다.
또다른 구현예에서, 본 발명에 따른 재조합 세포, 특히 재조합 효모 세포는 하나 이상의 하기를 코딩하는 적어도 하나의 재조합 핵산을 포함할 수 있다:
(A) 포스포글루코뮤타아제-1 (PGM1) 활성을 갖는 폴리펩티드, 및/또는
(B) UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 (UGP1) 활성을 갖는 폴리펩티드, 및/또는
(C) 글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 (GNA1) 활성을 갖는 폴리펩티드, 및/또는
(D) 포스포아세틸글루코사민 뮤타아제 (PCM1) 활성을 갖는 폴리펩티드.
특히, 본 발명에 따른 재조합 세포, 특히 본 발명의 재조합 효모 세포는 적어도 2 개, 특히 적어도 3 개, 및 더욱 특히 상기 나타낸 모든 변형을 포함한다.
특정 구현예에서, 포스포글루코뮤타제-1 (PGM1) 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산, UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라제 (UGP1) 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산, 글루타민-프룩토스-6-포스페이트 아미도트랜스퍼라제 (GFA1) 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산, 글루코사민-6-포스페이트 N-아세틸트랜스퍼라제 (GNA1) 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산, 포스포아세틸글루코사민 뮤타아제 (PCM1) 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산 및 UDP-N-아세틸글루코사민 피로포스포릴라제 (QRI1) 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산은 효모, 바람직하게는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 수득되는 또는 유래되는 재조합 핵산이다.
특정 구현예에서, 상기 정의되고 본 발명에 따른 재조합 세포에 포함된 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산, 특히 본 발명의 재조합 효모는 pPDC1, pTDH3, pTDH3.Sk, pTDH3-1.Sba, pCCW12, pCCW120.Sm , pTEF1, pENO2 pTEF1.Ago, 및 pTEF1.Sba 로 이루어진 군으로부터 선택된 프로모터의 제어 하에 있다.
특정 구현예에서, 본 명세서에 언급된 유도성 또는 억제성 프로모터는 구리로 유도성 또는 억제성 프로모터 또는 메티오닌으로 유도성 또는 억제성 프로모터, 특히 pCUP1 로 구성된 군으로부터 선택된다.
특정 구현예에서, 재조합 핵산은 프로모터 pCWP2 의 제어 하에 있다.
본 발명의 또다른 목적은 하기의 단계를 포함하는, 콘드로이틴의 생산 방법에 관한 것이다:
(a) 본 발명에 따른 재조합 세포, 및 특히 본 명세서에 정의된 바와 같은 재조합 효모를 배양 배지에서 배양하는 단계; 및
(b) 상기 배양 배지로부터 콘드로이틴을 회수하는 단계.
특정 구현예에서, 단계 (b) 에서 회수된 콘드로이틴은 하기의 선택을 통해 제어된 미리 결정된 분자량을 갖는다:
-
재조합 세포, 및 특히 재조합 효모의 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산의 성질 및 기원,
-
재조합 세포, 및 특히 재조합 효모의 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산의 발현을 통제하는 프로모터의 성질 및 기원,
-
재조합 세포, 및 특히 재조합 효모의 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산과 연관된 고정 또는 분비 신호의 존재,
-
재조합 세포, 및 특히 재조합 효모를 배양하는 단계 동안 배양 배지의 pH, 및/또는
-
재조합 세포, 및 특히 재조합 효모의 배양 지속기간.
특정 구현예에서, 본 발명의 방법은 분자량이 엄격하게 50 kDa 이하, 특히 엄격하게 50 kDa 이하이고 20 kDa 이상인 콘드로이틴을 생산하기 위한 것이며, 여기서 (c) 배양 배지로부터 콘드로이틴을 회수하는 단계는 재조합 세포, 특히 재조합 효모의 배양을 시작한 후 48 시간에 수행된다.
또다른 구현예에서, 본 발명의 방법은 분자량이 엄격하게 50 kDa 이하이고 1000 kDa 이상인 콘드로이틴을 생산하기 위한 것이며, 여기서 (c) 배양 배지로부터 콘드로이틴을 회수하는 단계는 재조합 효모의 배양을 시작한 후 48 시간에 수행된다.
또다른 구현예에서, 본 발명의 방법은 분자량이 엄격하게 1000 kDa 이상, 특히 엄격하게 1000 kDa 이상과 1.5 Million kDa 사이인 콘드로이틴을 생산하기 위한 것이며, 여기서 (c) 배양 배지로부터 콘드로이틴을 회수하는 단계는 재조합 세포, 특히 재조합 효모의 배양을 시작한 후 48 시간에 수행된다.
특히, 배양 배지는 적어도 탄소 공급원, 바람직하게는 글루코오스 및 수크로스로 이루어진 군으로부터 선택되는 탄소 공급원을 포함한다.
본 발명의 또다른 목적은 또한 콘드로이틴, 특히 제어된 분자량의 콘드로이틴의 생산을 위한, 본원에 정의된 바와 같은 본 발명의 재조합 세포, 특히 재조합 효모의 용도에 관한 것이다.
콘드로이틴 신타아제 활성 (HCOS) 을 갖는 폴리펩티드를 코딩하는 재조합 핵산
본 발명에 따른 재조합 세포, 특히 본 발명의 재조합 효모는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산을 포함한다.
본 발명에 따른 콘드로이틴 신타아제 활성을 갖는 폴리펩타이드는 중간체 대사물질 UDP-글루코로네이트 및 UDP-N-아세틸-갈락토사민을 콘드로이틴 ((β-D-1,3-GalNAc-β-D-1,4-GlcA)n) 으로 전환시키는 폴리펩티드를 의미한다.
일부 구현예에서, 콘드로이틴 신타아제 활성을 갖는 폴리펩티드를 코딩하는 핵산은 유도성 또는 억제성 프로모터의 제어 하에 있을 수 있다.
콘드로이틴 신타아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산 중 하나 이상은 pTDH3-1.Sba 또는 pTDH3.Sar 프로모터의 제어 하에 있을 수 있다.
콘드로이틴 신타아제 (HCOS) 활성을 갖는 폴리펩티드를 코딩하는 상기 하나 이상의 재조합 핵산은 하기일 수 있다:
(i) 콘드로이틴 신타아제를 코딩하는 핵산; 또는
(ii) 콘드로이틴 신타아제 활성을 갖는 키메라 폴리펩티드를 코딩하는 핵산.
콘드로이틴 신타아제 활성을 갖는 폴리펩티드를 코딩하는 핵산은 파스튜렐라 물토시다 (Pasteurella multocida), 클로렐라 바이러스 (Chlorella virus) PBCV1, 마이코박테리움 튜베르쿨로시스 (Mycobacterium tuberculosis), 호모 사피엔스 (Homo sapiens), 에스케리키아 콜라이 (Escherichia coli), 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 또는 페니실룸 옥살리쿰 (Penicillium oxalicum) 중 적어도 하나로부터 수득되거나 유래될 수 있다;
본 발명에 따른 재조합 세포, 특히 본 발명에 따른 재조합 효모는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드를 코딩하는 하나의 재조합 핵산을 포함할 수 있다.
예시적으로, 콘드로이틴 신타아제 유전자는 본원의 실시예에 나타낸 바와 같이, JLP1 유전자 내에 및/또는 SAM3 유전자 내에 삽입될 수 있다.
본 발명의 구현예에서, 본 발명의 재조합 세포, 특히 재조합 효모는 하기를 포함한다:
- 콘드로이틴 신타아제 활성을 갖는 폴리펩티드를 코딩하는 하나의 재조합 핵산;
- 콘드로이틴 신타아제 활성을 갖는 폴리펩티드를 코딩하는 상기 하나의 재조합 핵산은 파스튜렐라 물토시다 (Pasteurella multocida), 클로렐라 바이러스 (Chlorella virus) PBCV1, 마이코박테리움 튜베르쿨로시스 (Mycobacterium tuberculosis), 호모 사피엔스 (Homo sapiens), 에스케리키아 콜라이 (Escherichia coli), 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 또는 페니실룸 옥살리쿰 (Penicillium oxalicum) 중 적어도 하나로부터 수득되거나 유래될 수 있음;
- 콘드로이틴 신타아제 활성을 갖는 폴리펩티드를 코딩하는 상기 하나의 재조합 핵산은 유도성 또는 억제성 프로모터의 제어 하에 및/또는 pTDH3-1.Sba 또는 pTDH3.Sar 프로모터의 제어 하에 있다.
UDP-글루코오스 탈수소효소 활성 (HASB) 을 갖는 폴리펩티드를 코딩하는 재조합 핵산
본 발명에 따른 재조합 세포, 특히 본 발명에 따른 재조합 효모는 UDP-글루코오스 탈수소효소 (UDP-GlcDH 또는 HASB) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산을 포함한다.
본 발명에 따른 UDP-글루코오스 탈수소효소 (UDP-GlcDH 또는 HASB) 활성을 갖는 폴리펩티드는 중간 대사산물 우리딘-디포스페이트-글루코오스 (UDP-글루코오스) 를 UDP-글루쿠로네이트로 전환시키는 폴리펩티드를 의미한다.
UDP-글루코오스 탈수소효소 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 pTEF1.sba, pCCW12 및 pTDH3.Sk 로 이루어지는 군에서 선택되는 프로모터의 제어 하에 있을 수 있다.
UDP-글루코오스 탈수소효소 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 아라비돕시스 탈리아나 (Arabidopsis thaliana), 클로렐라 바이러스 PBCV1 또는 스트렙토코쿠스 주에피데미쿠스 (Streptococcus zooepidemicus) 중 적어도 하나로부터, 특히 아라비돕시스 탈리아나 (Arabidopsis thaliana) 또는 클로렐라 바이러스 PBCV1 중 적어도 하나로부터 수득되거나 유래될 수 있다.
본 발명에 따른 재조합 세포, 특히 본 발명에 따른 재조합 효모는 UDP-글루코오스 탈수소효소 활성을 갖는 폴리펩티드를 코딩하는 1 에서 5 개 사이의 재조합 핵산을 포함할 수 있다.
예시적으로, UDP-글루코오스 탈수소효소 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 본원의 실시예에 나타낸 바와 같이 재조합 세포, 특히 재조합 효모의 JLP1 유전자 및/또는 SAM3 유전자 내에 삽입될 수 있다.
본 발명의 구현예에서, 본 발명의 재조합 세포, 특히 재조합 효모는 하기를 포함한다:
- UDP-글루코오스 탈수소효소 활성을 갖는 폴리펩티드를 코딩하는 1 에서 5 개 사이의 재조합 핵산;
- 상기 UDP-글루코오스 탈수소효소 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산은 아라비돕시스 탈리아나 (Arabidopsis thaliana), 클로렐라 바이러스 PBCV1 또는 스트렙토코쿠스 주에피데미쿠스 (Streptococcus zooepidemicus) 중 적어도 하나로부터, 특히 아라비돕시스 탈리아나 (Arabidopsis thaliana) 또는 클로렐라 바이러스 PBCV1 중 적어도 하나로부터 수득되거나 유래될 수 있음.
- 본 발명의 재조합 세포에서 기능적인 유도성 또는 억제성 프로모터의 제어 하에 있는 및/또는 pTEF1.sba, pCCW12 및 pTDH3.Sk 로 이루어지는 군에서 선택되는 프로모터의 제어 하에 있는 상기 UDP-글루코오스 탈수소효소 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산.
UDP-글루코오스-4-에피머라아제 활성 (kfoA 또는 GNE1) 을 갖는 폴리펩티드를 코딩하는 재조합 핵산
본 발명에 따른 재조합 세포, 특히 본 발명에 따른 재조합 효모는 UDP-글루코오스-4-에피머라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산을 포함한다.
본 발명에 따른 UDP-글루코오스-4-에피머라아제 활성을 갖는 폴리펩티드는 중간체 대사물질 UDP-N-아세틸-글루코사민을 UDP-N-아세틸-갈락토사민으로 전환시키는 폴리펩티드를 의미한다.
일 구현예에서, UDP-글루코오스-4-에피머라아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산 중 하나 이상은 pCCW12 또는 pCCW120.Sm 으로 이루어지는 군에서 선택되는 프로모터의 제어 하에 있을 수 있다.
UDP-글루코오스-4-에피머라제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 박테리아, 특히 슈도모나스 아에루기노사 (Pseudomonas aeruginosa), 파스튜렐라 물토시다 (Pasteurella multocida), 및 에스케리키아 콜라이 (Escherichia coli) 로 이루어진 군으로부터 선택되는 박테리아로부터 수득되거나 유래될 수 있다.
본 발명에 따른 재조합 세포, 특히 본 발명에 따른 재조합 효모는 UDP-글루코오스-4-에피머라제 활성을 갖는 폴리펩티드를 코딩하는 1 에서 5 개 사이의 재조합 핵산을 포함할 수 있다.
예시적으로, UDP-글루코오스-4-에피머라제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 본원의 실시예에 나타낸 바와 같이 재조합 세포, 특히 재조합 효모의 JLP1 유전자 및/또는 SAM3 유전자 내에 삽입될 수 있다.
본 발명의 구현예에서, 본 발명의 재조합 세포, 특히 재조합 효모 세포는 하기를 포함한다:
- UDP-글루코오스-4-에피머라제 활성을 갖는 폴리펩티드를 코딩하는 1 에서 5 개 사이의 재조합 핵산;
- 슈도모나스 아에루기노사 (Pseudomonas aeruginosa), 파스퇴렐라 물토시다 (Pasteurella multocida) 및 에스케리키아 콜라이 (Escherichia coli) 로 이루어진 군으로부터 유래되는 또는 수득되는 상기 UDP-글루코오스-4-에피머라제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산;
- 본 발명의 재조합 세포에서 기능적인 유도성 또는 억제성 프로모터의 제어 하에 있는 및/또는 pCCW12 또는 pCCW120.Sm 으로 이루어지는 군에서 선택되는 프로모터의 제어 하에 있는 상기 UDP-글루코오스-4-에피머라제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산.
콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산
본 발명에 따른 재조합 세포, 특히 본 발명에 따른 재조합 효모는 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산을 포함한다.
본 발명에 따른 콘드로이티나아제 활성을 갖는 폴리펩티드는 콘드로이틴을 분해하는, 즉 주어진 분자량의 콘드로이틴을 더 낮은 분자량의 콘드로이틴으로 전환시키는 폴리펩티드를 의미한다.
본 발명에 따른 콘드로이티나아제 활성을 갖는 폴리펩티드는 히알루로노글루코사미니다제, 예컨대 콘드로이티나아제 또는 히알루로니다아제를 포함할 수 있다.
이전에 나타낸 바와 같이, 본 발명의 콘드로이티나아제 활성을 갖는 폴리펩티드는 분비 신호를 포함한다.
한 구현예에서, 콘드로이티나아제 활성을 갖는 폴리펩티드는 분비 신호 및 고정 신호 둘 모두를 포함한다.
한 구현예에서, 상기 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 본 발명의 재조합 세포에서 기능적인 유도성 또는 억제성 프로모터의 제어 하에 있다.
콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산 중 하나 이상은 pTEF1, pCCW12, pCCW12.sba, pCCW12.Sar, pPDC1, pTEF3, pTDH3, pNUP57 및 pCCW10.ago 로 이루어지는 군에서 선택되는 프로모터, 특히 pCCW12.Sba 프로모터의 제어 하에 있을 수 있다.
상기 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 큐피엔니우스 살레이 (Csa), 티티우스 세르룰라투스 (Ts), 보스 타우루스 (Bt), 아피스 멜리페라 (Am), 마카카 물라타 (Mm), 또는 베스파 마그니피카 (Vm) 중 적어도 하나로부터, 특히 티티우스 세르룰라투스 (Ts) 로부터 수득되거나 유래한다.
본 발명에 따른 재조합 세포, 특히 본 발명에 따른 재조합 효모는 콘드로이티나제 활성을 갖는 폴리펩티드를 코딩하는 단 하나의 재조합 핵산을 포함할 수 있다.
예시적으로, 콘드로이티나제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 JLP1 유전자 내에 및/또는 LYP1 유전자 내에 및/또는 LEU2 유전자 내에, 특히 LEU2 유전자 내에 삽입될 수 있다.
바람직한 구현예에서, 콘드로이티나제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산은 히알루로니다아제를 코딩하는 재조합 핵산이다. 특히, 콘드로이티나아제 활성을 갖는 폴리펩티드는 히알루로니다아제이다.
콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산과 관련되는 상기 모든 특징은 히알루로니다아제를 코딩하는 재조합 핵산에 적용된다.
본 발명의 구현예에서, 본 발명의 재조합 세포, 특히 재조합 효모는 하기를 포함한다:
- 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 단 하나의 재조합 핵산;
- 상기 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산은 큐피엔니우스 살레이 (Csa), 티티우스 세르룰라투스 (Ts), 보스 타우루스 (Bt), 아피스 멜리페라 (Am), 마카카 물라타 (Mm), 또는 베스파 마그니피카 (Vm) 중 적어도 하나로부터, 특히 티티우스 세르룰라투스 (Ts) 로부터 유래되거나 수득된다.
- (i) 분비 신호 및 고정 신호 없음 또는 (ii) 분비 신호 및 고정 신호를 포함하는 상기 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산;
- 상기 콘드로이티나아제를 갖는 폴리펩티드는 히알루로니다아제이고,
- 본 발명의 재조합 세포에서 기능적인 유도성 또는 억제성 프로모터의 제어 하에 있는 및/또는 pTEF1, pCCW12, pCCW12.sba, pCCW12.Sar, pPDC1, pTEF3, pTDH3, pNUP57 및 pCCW10.ago 로 이루어지는 군에서 선택되는 프로모터, 특히 pCCW12.Sba 프로모터의 제어 하에 있는 상기 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산.
글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 활성 (GFA1) 을 갖는 폴리펩티드를 코딩하는 재조합 핵산
본 발명에 따른 재조합 세포, 특히 본 발명에 따른 재조합 효모 세포는 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 오직 하나의 재조합 핵산을 포함할 수 있다.
본 발명에 따른 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 활성을 갖는 폴리펩티드는 프룩토오스-6-포스페이트를 글루코사민-6-포스페이트로 전환시키는 폴리펩티드를 의미한다.
한 구현예에서, 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산 중 하나 이상은 본 발명의 재조합 세포에서 기능적인 유도성 또는 억제성 프로모터의 제어 하에 있다.
글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산 중 하나 이상은 pTEF1.Ago 프로모터의 제어 하에 있을 수 있다.
상기 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 본원의 실시예에서 나타낸 바와 같이 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 수득되거나 유래할 수 있다.
본 발명에 따른 재조합 세포, 특히 본 발명에 따른 재조합 효모 세포는 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 오직 하나의 재조합 핵산을 포함할 수 있다.
예시적으로, 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 본원의 실시예에서 나타낸 바와 같이 재조합 세포, 특히 재조합 효모 세포의 JLP1 유전자 내에 삽입될 수 있다.
본 발명의 구현예에서, 본 발명의 재조합 세포, 특히 재조합 효모 세포는 하기를 포함한다:
- 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 오직 하나의 재조합 핵산;
- 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하거나 유래되는 상기 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산; 및
- pTEF1.Ago 프로모터의 제어 하에 있는 상기 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산.
UDP-N-아세틸글루코사민 피로포스포릴라아제 활성 (QRI1) 을 갖는 폴리펩티드를 코딩하는 재조합 핵산
본 발명에 따른 재조합 세포, 특히 본 발명에 따른 재조합 효모 세포는 UDP-N-아세틸글루코사민 피로포스포릴라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산을 포함할 수 있다.
본 발명에 따른 UDP-N-아세틸글루코사민 피로포스포릴라아제 활성을 갖는 폴리펩티드는 N-아세틸-글루코사민을 UDP-N-아세틸-글루코사민으로 전환시키는 폴리펩티드를 의미한다.
한 구현예에서, UDP-N-아세틸글루코사민 피로포스포릴라아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산 중 하나 이상은 본 발명의 재조합 세포에서 기능적인 유도성 또는 억제성 프로모터, 예를 들어 유도성 또는 억제성 프로모터 pMET6 또는 pCUP1 의 제어 하에 있다.
UDP-N-아세틸글루코사민 피로포스포릴라아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산 중 하나 이상은 프로모터 pTDH3-1.Sba 또는 pTDH3 의 제어 하에 있을 수 있다.
상기 UDP-N-아세틸글루코사민 피로포스포릴라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 본원의 실시예에서 나타낸 바와 같이 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 수득되거나 유래될 수 있다.
본 발명에 따른 재조합 세포, 특히 본 발명에 따른 재조합 효모는 UDP-N-아세틸글루코사민 피로포스포릴라제 활성을 갖는 폴리펩티드를 코딩하는 1 과 10 개 사이의 재조합 핵산을 포함할 수 있고, 특히 UDP-N-아세틸글루코사민 피로포스포릴라제 활성을 갖는 폴리펩티드를 코딩하는 2 와 8 개 사이의 재조합 핵산을 포함할 수 있고, 예를 들어 UDP-N-아세틸글루코사민 피로포스포릴라제 활성을 갖는 폴리펩티드를 코딩하는 2, 6 또는 7 개의 재조합 핵산을 포함할 수 있다.
예시적으로, UDP-N-아세틸글루코사민 피로포스포릴라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 본원의 실시예에서 나타낸 바와 같이 재조합 세포, 특히 재조합 효모의 HIS3 유전자 내에 및/또는 MET14 유전자 내에 및/또는 JLP1 유전자 내에 삽입될 수 있다.
본 발명의 구현예에서, 본 발명의 재조합 세포, 특히 재조합 효모 세포는 하기를 포함한다:
- UDP-N-아세틸글루코사민 피로포스포릴라아제 활성을 갖는 폴리펩티드를 코딩하는 2 와 8 개 사이의 재조합 핵산;
- 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하거나 유래되는 상기 UDP-N-아세틸글루코사민 피로포스포릴라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산;
- 본 발명의 재조합 세포에서 기능적인 유도성 또는 억제성 프로모터, 예를 들어 유도성 또는 억제성 프로모터 pMET6 또는 pCUP1 의 제어 하에 있고/있거나 프로모터 pTDH3-1.Sba 또는 pTDH3 의 제어 하에 있는 상기 UDP-N-아세틸글루코사민 피로포스포릴라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산.
포스포글루코뮤타아제-1 활성 (PGM1) 을 갖는 폴리펩티드를 코딩하는 재조합 핵산
본 발명에 따른 재조합 세포, 특히 본 발명에 따른 재조합 효모 세포는 포스포글루코뮤타아제-1 (PGM1) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산을 포함할 수 있다.
본 발명에 따른 포스포글루코뮤타아제-1 (PGM1) 활성을 갖는 폴리펩티드는 글루코오스-6-포스페이트를 중간 대사산물 글루코오스-1-포스페이트로 전환시키는 폴리펩티드를 의미한다.
한 구현예에서, 포스포글루코뮤타아제-1 (PGM1) 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산 중 하나 이상은 본 발명의 재조합 세포에서 기능적인 유도성 또는 억제성 프로모터의 제어 하에 있다.
포스포글루코뮤타아제-1 (PGM1) 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산 중 하나 이상은 프로모터 pTDH3 의 제어 하에 있을 수 있다.
포스포글루코뮤타아제-1 (PGM1) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 본원의 실시예에서 나타낸 바와 같이 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 수득되거나 유래할 수 있다.
본 발명에 따른 재조합 세포, 특히 본 발명에 따른 재조합 효모 세포는 포스포글루코뮤타아제-1 (PGM1) 활성을 갖는 폴리펩티드를 코딩하는 단 하나의 재조합 핵산을 포함할 수 있다.
예시적으로, 포스포글루코뮤타아제-1 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 재조합 세포, 특히 재조합 효모의 MET14 유전자 내에 삽입될 수 있다.
본 발명의 구현예에서, 본 발명의 재조합 세포, 특히 재조합 효모는 하기를 포함한다:
- 포스포글루코뮤타아제-1 활성을 갖는 폴리펩티드를 코딩하는 단 하나의 재조합 핵산;
- 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하거나 유래하는 상기 포스포글루코뮤타아제-1 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산; 및
- 상기 포스포글루코뮤타아제-1 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산은 본 발명의 재조합 세포에서 기능적인 유도성 또는 억제성 프로모터의 제어 하에 및/또는 프로모터 pTDH3 의 하에 있음.
UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 활성 (UGP1) 을 갖는 폴리펩티드를 코딩하는 재조합 핵산
본 발명에 따른 재조합 세포, 특히 본 발명에 따른 재조합 효모 세포는 UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 (UGP1) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산을 포함한다.
본 발명에 따른 UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 (UGP1) 활성을 갖는 폴리펩티드는 중간 대사산물 글루코오스-1-포스페이트를 중간 대사산물 UDP-글루코오스로 전환시키는 폴리펩티드를 의미한다.
한 구현예에서, UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산 중 하나 이상은 본 발명의 재조합 세포에서 기능적인 유도성 또는 억제성 프로모터, 예를 들어 유도성 또는 억제성 프로모터 pSAM1 또는 pCUP1 의 제어 하에 있다.
UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산 중 하나 이상은 pFBA1, pENO2 또는 pPDC1 프로모터의 제어 하에 있을 수 있다.
UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 본원의 실시예에서 나타낸 바와 같이 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 수득되거나 유래될 수 있다.
본 발명에 따른 재조합 세포, 특히 본 발명에 따른 재조합 효모 세포는 UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 1 과 10 개 사이의 재조합 핵산을 포함할 수 있고, 특히 UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 2 와 8 개 사이의 재조합 핵산을 포함할 수 있고, 예를 들어 UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 2, 6 또는 8 개의 재조합 핵산을 포함할 수 있다.
예시적으로, UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 활성 유전자를 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 본원의 실시예에 나타낸 바와 같이 재조합 세포, 특히 재조합 효모의 HIS3 유전자 내에 및/또는 MET14 유전자 내에 및/또는 JLP1 유전자 내에 및/또는 SAM3 유전자 내에 삽입될 수 있다.
본 발명의 구현예에서, 본 발명의 재조합 세포, 특히 재조합 효모 세포는 하기를 포함한다:
- UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 2 에서 8 개 사이의 재조합 핵산;
- 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하거나 유래하는 상기 UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산; 및
- 본 발명의 재조합 세포에서 기능적인 유도성 또는 억제성 프로모터, 예를 들어 유도성 또는 억제성 프로모터 pSAM1 또는 pCUP1 의 제어 하 및/또는 pFBA1, pENO2 및 pPDC1 로 이루어지는 군에서 선택되는 프로모터의 제어 하에 있는 상기 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산.
글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 (GNA1) 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산
본 발명에 따른 재조합 세포, 특히 본 발명에 따른 재조합 효모 세포는 글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 (GNA1) 활성을 갖는 폴리펩티드를 코딩하는 단 하나의 재조합 핵산을 포함할 수 있다.
본 발명에 따른 글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 (GNA1) 활성을 갖는 폴리펩티드는 글루코사민-6-포스페이트를 N-아세틸-글루코사민-6-포스페이트로 전환시키는 폴리펩티드를 의미한다.
한 구현예에서, 글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산 중 하나 이상은 본 발명의 재조합 세포에서 기능적인 유도성 또는 억제성 프로모터의 제어 하에 있다.
글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산 중 하나 이상은 프로모터 pCWP2 의 제어 하에 있을 수 있다.
상기 글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 본원의 실시예에서 나타낸 바와 같이 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 수득되거나 유래될 수 있다.
본 발명에 따른 재조합 세포, 특히 본 발명에 따른 재조합 효모 세포는 글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 단 하나의 재조합 핵산을 포함할 수 있다.
예시적으로, 글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 본원의 실시예에 나타낸 바와 같이 재조합 세포, 특히 재조합 효모의 MET14 유전자 내에 및/또는 SAM3 유전자 내에 삽입될 수 있다.
본 발명의 구현예에서, 본 발명의 재조합 세포, 특히 재조합 효모는 하기를 포함한다:
- 글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 단 하나의 재조합 핵산;
- 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하거나 유래하는 상기 글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산; 및
- 상기 글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산은 본 발명의 재조합 세포에서 기능적인 유도성 또는 억제성 프로모터의 제어 하에 및/또는 프로모터 pCWP2 의 제어 하에 있음.
포스포아세틸글루코사민 뮤타아제 (PCM1) 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산
본 발명에 따른 재조합 세포, 특히 본 발명에 따른 재조합 효모는 포스포아세틸글루코사민 뮤타아제 (PCM1) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산을 포함할 수 있다.
본 발명에 따른 포스포아세틸글루코사민 뮤타아제 활성을 갖는 폴리펩티드는 N-아세틸-글루코사민-6-포스페이트를 N-아세틸-글루코사민-1-포스페이트로 전환시키는 폴리펩티드를 의미한다.
한 구현예에서, 포스포아세틸글루코사민 뮤타아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산 중 하나 이상은 본 발명의 재조합 세포에서 기능적인 유도성 또는 억제성 프로모터의 제어 하에 있다.
포스포아세틸글루코사민 뮤타아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산 중 하나 이상은 pTEF1 프로모터의 제어 하에 있을 수 있다.
상기 포스포아세틸글루코사민 뮤타아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 본원의 실시예에서 나타낸 바와 같이 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 수득되거나 유래할 수 있다.
본 발명에 따른 재조합 세포, 특히 본 발명에 따른 재조합 효모는 포스포아세틸글루코사민 뮤타아제 활성을 갖는 폴리펩티드를 코딩하는 단 하나의 재조합 핵산을 포함할 수 있다.
예시적으로, 포스포아세틸글루코사민 뮤타아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 본원의 실시예에 나타낸 바와 같이 재조합 세포, 특히 재조합 효모의 MET14 유전자 내에 및/또는 SAM3 유전자 내에 삽입될 수 있다.
본 발명의 구현예에서, 본 발명의 재조합 세포, 특히 재조합 효모 세포는 하기를 포함한다:
- 포스포아세틸글루코사민 뮤타아제 활성을 갖는 폴리펩티드를 코딩하는 단 하나의 재조합 핵산;
- 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하거나 유래하는 상기 포스포아세틸글루코사민 뮤타아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산; 및
- 본 발명의 재조합 세포에서 기능적인 유도성 또는 억제성 프로모터의 제어 하에 있는 및/또는 pTEF1 프로모터의 제어 하에 있는 상기 포스포아세틸글루코사민 뮤타아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산.
콘드로이틴 신타아제 (HCOS)
콘드로이틴 신타아제 효소는 UDP-글루쿠로네이트 및 UDP-N-아세틸-갈락토사민의 콘드로이틴으로의 전환을 촉매화하기 위한 당업계에 기재되는 단백질이다.
특정 구현예에서, 콘드로이틴 신타아제 (HCOS) 활성을 갖는 폴리펩티드를 코딩하는 핵산은 하기이다:
(i) 콘드로이틴 신타아제를 코딩하는 핵산; 또는
(ii) 콘드로이틴 신타아제 활성을 갖는 키메라 폴리펩티드를 코딩하는 핵산.
융합 폴리펩티드로서 또한 공지된 키메라 폴리펩티드는 단일 유닛으로서 전사 및 번역되어 단일 폴리펩티드를 생성하도록 연결된 별개의 핵산에 의해 코딩되는 적어도 2 개의 도메인 또는 단편, 바람직하게는 2 개의 별개의 폴리펩티드로부터 이루어진 폴리펩티드이다. 키메라 폴리펩티드는 재조합 DNA 기술을 사용하여 in vivo 또는 in vitro 로 생성될 수 있다. 당업계에 공지된 이러한 기술은 특히 DNA 고체상 합성, 재조합 PCR, 제한 효소, 리가아제, 리콤비나제의 사용을 포함하는 통상의 분자 기술, 깁슨 어셈블리 (Gibson DG, Young L, Chuang RY, Venter JC, Hutchison CA 3rd, Smith HO (2009). Nature Methods. 6 (5): 343-345) 와 같은 기술 또는 생체 내에서 바람직하게는 효모에서 선형 DNA 재조합의 이용을 포함할 수 있다.
본 발명에 따라 적합한 콘드로이틴 신타아제 활성을 갖는 키메라 폴리펩티드는 히알루로난 신타아제 활성을 갖는 폴리펩티드를 코딩하는 핵산 및 콘드로이틴 신타아제 활성을 갖는 폴리펩티드를 코딩하는 핵산을 포함하는 핵산에 의해 코딩되는, 당업계에 공지된 하이브리드 단백질일 수 있다 (키메라 콘드로이틴 신타아제의 개념은 문헌 Tracy et al.(2006) Journal of biological chemistry, 282, 337-344 and Jing and DeAngelis (2003) Glycobiology 13, 66171 에 기재되어 있다). 생성된 폴리펩티드는 히알루로난 신타아제와 콘드로이틴 신타아제 사이의 키메라 폴리펩티드이다.
본 발명에 따라 적합한 콘드로이틴 신타아제 활성을 갖는 또다른 키메라 폴리펩티드는 히알루로난 신타아제 활성을 갖는 폴리펩티드를 코딩하는 핵산 및 갈락토푸라노실트랜스퍼라제 활성을 갖는 폴리펩티드를 코딩하는 핵산을 포함하는 핵산에 의해 코딩된다. 생성된 폴리펩티드는 히알루로난 신타아제와 갈락토푸라노실트랜스퍼라제 (갈락토푸라노실트랜스퍼라제 GlfT2 마이코박테리움 투베르쿨로시스 UNIPROT O53585 EC 2.1.4.288) 사이의 융합 단백질이다.
본 발명에 따라 적합한 콘드로이틴 신타아제 활성을 갖는 또다른 키메라 폴리펩티드는 히알루로난 신타아제 활성을 갖는 폴리펩티드를 코딩하는 핵산 및 키틴 신타아제 활성을 갖는 폴리펩티드를 코딩하는 핵산을 포함하는 핵산에 의해 코딩된다. 생성된 폴리펩티드는 히알루로난 신타아제와 키틴 신타아제 (키틴 신타아제 CHS2 사카로마이세스 세레비지에 UNIPROT P14180 EC 2.1.4.16) 사이의 융합 단백질이다.
본 발명에 따라 적합한 콘드로이틴 신타아제 활성을 갖는 키메라 폴리펩티드의 예는 하기를 포함하는 핵산 서열에 의해 코딩될 수 있다:
- 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터의 콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편 (예컨대, HCOS1-1, HCOS1-2 또는 HCOS1-3);
- 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편, 파스튜렐라 물토시다로부터 유래된 콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편 및 사카로마이세스 세레비지아에 (Saccharomyces cerevisiae) 로부터의 키틴 신타아제 2 를 코딩하는 핵산으로부터의 단편 (예컨대, HCOS.Sc);
- 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 사카로마이세스 세레비지아에 (Saccharomyces cerevisiae) 로부터의 키틴 신타아제 2 를 코딩하는 핵산으로부터의 단편 (예컨대, HHASA.Sc)
- 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 에스케리키아 콜라이 (Escherichia coli) 로부터의 콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편 (예컨대, HCOS1-Vir, HCOS2-Vir, 또는 HCOS4-Vir);
- 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 마이코박테리움 투베르쿨로시스 (Mycobaterium tuberculosis) 로부터의 갈락토푸라노실트랜스페라아제를 코딩하는 핵산으로부터의 단편 (예컨대, HCOS3-Vir);
- 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 페니실리움 옥살리쿰 (Penicillium oxalicum) 로부터의 콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편 (예컨대, HCOS5-Vir, HCOS6-Vir, HCOS7-Vir 또는 HCOS8-Vir);
- 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 호모 사피엔스로부터의 콘드로이틴 설페이트 신타아제를 코딩하는 핵산으로부터의 단편 (예컨대, HCOS9-Vir, HCOS10-Vir, HCOS11-Vir, 또는 HCOS12-Vir).
콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 활성 수준을 측정하기 위해 실행되는 방법은 당업자의 일반적인 지식에 속한다.
이와 관련하여, 당업자는 카르바졸 방법 (Bitter and Muir (1962) analytical biochemistry 4, 330-334) 을 이용하여 분석된 상청액 내 콘드로이틴의 존재에 의해 콘드로이틴을 생산하는 효소의 능력을 평가하는 방법을 유용하게 참조할 수 있다.
본 명세서에서 콘드로이틴 신타아제 활성을 갖는 바람직한 폴리펩티드는 2 개의 활성 EC 2.4.1.175 및 2.4.1.226 을 갖는 효소이다.
바람직한 구현예에 따르면, 콘드로이틴 신타아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 바람직하게는 원핵 생물 및 진핵 생물로 이루어진 군에서 선택되는 유기체로부터 수득되거나 유래될 수 있다. 일부 구현예에서, 콘드로이틴 신타아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 고세균으로부터 수득되거나 유래될 수 있다. 일부 바람직한 구현예에서, 콘드로이틴 신타아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 파스튜렐라 물토시다 (Pm), 클로렐라 바이러스 PBCV1 (Vir), 마이코박테리움 튜베르쿨로시스 (Mt), 호모 사피엔스 (Hs), 에스케리키아 콜라이 (Ec), 사카로마이세스 세레비지에 (Sc) 또는 페니실룸 옥살리쿰 (Po) 으로 이루어진 군으로부터 수득되거나 유래될 수 있다.
또다른 바람직한 구현예에 따르면, 콘드로이틴 신타아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 하기를 갖는 핵산 서열로 이루어진 군으로부터 선택될 수 있다: (i) 서열 SEQ ID NO: 1 (HCOS1-1), SEQ ID NO: 2 (HCOS1-2), SEQ ID NO: 3 (HCOS-1-3), SEQ ID NO: 4 (HCOS.Sc), SEQ ID NO: 5 (HHASA.Sc), SEQ ID NO: 6 (HCOS1-Vir), SEQ ID NO: 7 (HCOS2-Vir), SEQ ID NO: 8 (HCOS3-Vir), SEQ ID NO: 9 (HCOS4-Vir), SEQ ID NO: 10 (HCOS5-Vir), SEQ ID NO: 11 (HCOS6-Vir), SEQ ID NO: 12 (HCOS7-Vir), SEQ ID NO: 13 (HCOS8-Vir), SEQ ID NO: 14 (HCOS9-Vir), SEQ ID NO: 15 (HCOS10-Vir), SEQ ID NO: 16 (HCOS11-Vir), 또는 SEQ ID NO: 17 (HCOS12-Vir) 로서 언급된 핵산 서열과 적어도 65%, 유리하게는 적어도 70%, 바람직하게는 적어도 80% 핵산 동일성, 및 (i) 서열 SEQ ID NO: 1 (HCOS1-1), SEQ ID NO: 2 (HCOS1-2), SEQ ID NO: 3 (HCOS-1-3), SEQ ID NO: 4 (HCOS.Sc), SEQ ID NO: 5 (HHASA.Sc), SEQ ID NO: 6 (HCOS1-Vir), SEQ ID NO: 7 (HCOS2-Vir), SEQ ID NO: 8 (HCOS3-Vir), SEQ ID NO: 9 (HCOS4-Vir), SEQ ID NO: 10 (HCOS5-Vir), SEQ ID NO: 11 (HCOS6-Vir), SEQ ID NO: 12 (HCOS7-Vir), SEQ ID NO: 13 (HCOS8-Vir), SEQ ID NO: 14 (HCOS9-Vir), SEQ ID NO: 15 (HCOS10-Vir), SEQ ID NO: 16 (HCOS11-Vir), 또는 SEQ ID NO: 17 (HCOS12-Vir) 로서 언급된 핵산 서열을, 각각 갖는 색산 서열과 동일한 성질의 생물학적 활성.
이러한 서열에 관한 동일한 성질의 생물학적 활성은, 이전에 설명한 바와 같이, UDP-글루쿠로네이트 및 UDP-N-아세틸-갈락토사민을 콘드로이틴으로 전환시키는 폴리펩티드를 코딩하는 능력이다.
본원에 기재된 바와 같이, 참조 핵산 서열과 적어도 65% 뉴클레오티드 동일성을 갖는 핵산 서열은 상기 참조 핵산 서열과 적어도 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 동일성, 및 또한 상기 참조 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열을 포함한다.
본원에 기재된 바와 같이, 참조 핵산 서열과 적어도 70% 뉴클레오티드 동일성을 갖는 핵산 서열은 상기 참조 핵산 서열과 적어도 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 동일성, 및 또한 상기 참조 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열을 포함한다.
본원에 기재된 바와 같이, 참조 핵산 서열과 적어도 80% 뉴클레오티드 동일성을 갖는 핵산 서열은 상기 참조 서열과 적어도 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 동일성, 및 또한 상기 참조 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열을 포함한다.
파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터의 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 아미노산을 포함하는 콘드로이틴 신타아제 활성을 갖는 키메라 폴리펩티드의 아미노산 서열에 대해, 당업자는 UniProt 데이터베이스에서 각각 등록 번호 Q7BLV3 및 Q9CMP0, 또는 본원에 기재된 SEQ ID NO: 18 (HCOS1-1), SEQ ID NO: 19 (HCOS1-2) 및 SEQ ID NO: 20 (HCOS-1-3) 에 언급된 서열을 참조할 수 있다.
파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편, 파스튜렐라 물토시다 (Pasteurella multocida) 로부터의 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편 및 사카로마이세스 세레비지아에 (Saccharomyces cerevisiae) 로부터의 키틴 신타아제 2 를 코딩하는 아미노산으로부터의 단편을 포함하는 콘드로이틴 신타아제 활성을 갖는 키메라 폴리펩티드의 아미노산 서열에 대해, 당업자는 UniProt 데이터베이스에서 각각 등록 번호 Q7BLV3, Q9CMP0 및 P14180, 또는 본원에 기재된 SEQ ID NO: 21 (HCOS.Sc) 에 언급된 서열을 참조할 수 있다.
파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 사카로마이세스 세레비지아에 (Saccharomyces cerevisiae) 로부터의 키틴 신타아제 2 를 코딩하는 아미노산으로부터의 단편을 포함하는 콘드로이틴 신타아제 활성을 갖는 키메라 폴리펩티드의 아미노산 서열에 대해, 당업자는 UniProt 데이터베이스에서 각각 등록 번호 Q7BLV3 및 P14180, 또는 본원에 기재된 SEQ ID NO: 22 (HHASA.Sc) 에 언급된 서열을 참조할 수 있다.
클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 에스케리키아 콜라이 (Escherichia coli) 로부터의 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 콘드로이틴 신타아제 활성을 갖는 키메라 폴리펩티드의 아미노산 서열에 대해, 당업자는 UniProt 데이터베이스에서 각각 등록 번호 Q84419 및 Q8L0V4, 또는 본원에 기재된 SEQ ID NO: 23 (HCOS1-Vir), SEQ ID NO: 24 (HCOS2-Vir), 또는 SEQ ID NO: 26 (HCOS4-Vir) 에 언급된 서열을 참조할 수 있다.
클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 마이코박테리움 투베르쿨로시스 (Mycobaterium tuberculosis) 로부터의 갈락토푸라노실트랜스페라아제를 코딩하는 아미노산으로부터의 단편을 포함하는 콘드로이틴 신타아제 활성을 갖는 키메라 폴리펩티드의 아미노산 서열에 대해, 당업자는 UniProt 데이터베이스에서 각각 등록 번호 Q84419 및 O53585, 또는 본원에 기재된 SEQ ID NO: 25 (HCOS3-Vir) 에 언급된 서열을 참조할 수 있다.
클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 페니실리움 옥살리쿰 (Penicillium oxalicum) 로부터의 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 콘드로이틴 신타아제 활성을 갖는 키메라 폴리펩티드의 아미노산 서열에 대해, 당업자는 UniProt 데이터베이스에서 각각 등록 번호 Q84419 및 S7Z8F8, 또는 SEQ ID NO: 27 (HCOS5-Vir) 에 언급된 서열을 참조할 수 있다.
클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터의 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 콘드로이틴 신타아제 활성을 갖는 키메라 폴리펩티드의 아미노산 서열에 대해, 당업자는 UniProt 데이터베이스에서 각각 등록 번호 Q84419 및 Q9CMP0, 또는 본원에 기재된 SEQ ID NO: 28 (HCOS6-Vir), SEQ ID NO: 29 (HCOS7-Vir), 또는 SEQ ID NO: 30 (HCOS8-Vir) 에 언급된 서열을 참조할 수 있다.
클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 호모 사피엔스로부터의 콘드로이틴 설페이트 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 콘드로이틴 신타아제 활성을 갖는 키메라 폴리펩티드의 아미노산 서열에 대해, 당업자는 UniProt 데이터베이스에서 각각 등록 번호 Q84419 및 Q86X52, 또는 본원에 기재된 SEQ ID NO: 31 (HCOS9-Vir), SEQ ID NO: 32 (HCOS10-Vir), SEQ ID NO: 33 (HCOS11-Vir) 또는 SEQ ID NO: 34 (HCOS12-Vir) 에 언급된 서열을 참조할 수 있다.
또다른 특정 구현예에 따르면, 콘드로이틴 신타아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 하기를 갖는 폴리펩티드를 코딩하는 핵산(들) 일 수 있다: SEQ ID NO: 18 (HCOS1-1), SEQ ID NO: 19 (HCOS1-2), SEQ ID NO: 20 (HCOS-1-3), SEQ ID NO: 21 (HCOS.Sc), SEQ ID NO: 22 (HHASA.Sc), SEQ ID NO: 23 (HCOS1-Vir), SEQ ID NO: 24 (HCOS2-Vir), SEQ ID NO: 25 (HCOS3-Vir), SEQ ID NO: 26 (HCOS4-Vir), SEQ ID NO: 27 (HCOS5-Vir), SEQ ID NO: 28 (HCOS6-Vir), SEQ ID NO: 29 (HCOS7-Vir), SEQ ID NO: 30 (HCOS8-Vir), SEQ ID NO: 31 (HCOS9-Vir), SEQ ID NO: 32 (HCOS10-Vir), SEQ ID NO: 33 (HCOS11-Vir), 및 SEQ ID NO: 34 (HCOS12-Vir) 의 아미노산 서열과 적어도 55%, 유리하게는 적어도 65%, 바람직하게는 적어도 80% 아미노산 동일성 및 또한 동일한 성질의 생물학적 활성을 갖는 서열로 이루어진 군으로부터 선택되는 아미노산 서열.
이러한 서열에 관한 동일한 성질의 생물학적 활성은 이전에 기재된 바와 같은, 즉 UDP-글루쿠로네이트 및 UDP-N-아세틸-갈락토사민의 UDP-N-아세틸-갈락토사민으로의 전환을 촉매화하는 능력이다.
본원에 기재된 바와 같이, 참조 아미노산 서열과 적어도 55% 아미노산 동일성을 갖는 아미노산 서열은 상기 참조 아미노산 서열과 적어도 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 아미노산 동일성, 및 또한 상기 참조 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 아미노산 서열을 포함한다.
본원에 기재된 바와 같이, 참조 아미노산 서열과 적어도 65% 아미노산 동일성을 갖는 아미노산 서열은 상기 참조 아미노산 서열과 적어도 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 아미노산 동일성, 및 또한 상기 참조 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 아미노산 서열을 포함한다.
본원에 기재된 바와 같이, 참조 아미노산 서열과 적어도 80% 아미노산 동일성을 갖는 아미노산 서열은 상기 참조 아미노산 서열과 적어도 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 아미노산 동일성, 및 또한 상기 참조 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 아미노산 서열을 포함한다.
상기 언급된 바와 같이, 본 발명에서 콘드로이틴 신타아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산의 발현 수준은 적어도 하나의 프로모터 및 적어도 하나의 터미네이터에 의해 조절되며, 예를 들어 본원에서 보다 상세하게 정의된 바와 같이, 이는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산의 5' 및 3' 위치에 각각 존재한다.
UDP-글루코오스 탈수소효소 (UDP-GlcDH 또는 HASB)
UDP-글루코오스 탈수소효소는 UDP-글루코오스의 UDP-글루쿠로네이트로의 전환을 촉매화하는 것으로 당업계에 공지된 단백질이다. 아라비돕시스 탈리아나 (Arabidopsis thaliana), 클로렐라 바이러스 PBCV1 또는 스트렙토코쿠스 주에피데미쿠스 (Streptococcus zooepidemicus) 의 게놈으로부터 기원하는 UDP-글루코오스 탈수소효소는 HASB 로 명명될 수 있다.
UDP-글루코오스 탈수소효소 활성을 갖는 폴리펩티드의 활성 수준을 측정하기 위해 실행되는 방법은 당업자의 일반적인 지식에 속한다.
이와 관련하여, 당업자는 유리하게는 Oka 와 Jigami (FEBS Journal 273, 2645-2657, 2006) 에 의해 기재된 방법을 참조할 수 있다.
본 명세서에서 UDP-글루코오스 탈수소효소 활성을 갖는 바람직한 폴리펩티드는 EC 번호 1.1.1.22 를 갖는 효소이다.
바람직한 구현예에 따르면, UDP-글루코오스 탈수소효소 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 바람직하게는 원핵 생물 및 진핵 생물을 포함하는 군에서 선택되는 유기체로부터 수득하거나 유래할 수 있다. 일부 구현예에서, UDP-글루코오스 탈수소효소 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 고세균으로부터 수득하거나 유래할 수 있다. 일부 바람직한 구현예에서, UDP-글루코오스 탈수소효소 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 효모, 특히 아라비돕시스 탈리아나 (Arabidopsis thaliana), 클로렐라 바이러스 PBCV1 또는 스트렙토코쿠스 주에피데미쿠스 (Streptococcus zooepidemicus), 바람직하게는 아라비돕시스 탈리아나 (Arabidopsis thaliana) 또는 클로렐라 바이러스 PBCV1 로부터 수득하거나 유래할 수 있다.
또다른 바람직한 구현예에 따르면, UDP-글루코오스 탈수소효소 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 (i) 서열 SEQ ID NO: 35 (At), SEQ ID NO: 36 (Vir), SEQ ID NO: 37 (Vir) 및 SEQ ID NO: 38 (Sz) 에서 나타낸 바와 같은 핵산 서열과 적어도 65%, 유리하게는 적어도 70%, 바람직하게는 적어도 80% 핵산 동일성, 및 (ii) 서열 SEQ ID NO: 35 (At), SEQ ID NO: 36 (Vir), SEQ ID NO: 37 (Vir) 및 SEQ ID NO: 38 (Sz) 에서 나타낸 바와 같은 동일한 성질의 생물학적 활성을 갖는 핵산 서열로 이루어지는 군에서 선택될 수 있다. SEQ ID NO: 35 (At), SEQ ID NO: 36 (Vir), SEQ ID NO: 37 (Vir) 및 SEQ ID NO: 38 (Sz) 에서 나타낸 핵산 서열은, 본원에서 또한 집합적으로 HASB 로 지칭될 수 있는 아라비돕시스 탈리아나 (At), 클로렐라 바이러스 PBCV1 (Vir) 또는 스트렙토코쿠스 주에피데미쿠스 (Sz) 로부터 각각 수득되는 또는 유래되는 UDP-글루코오스 탈수소효소 활성을 갖는 폴리펩티드를 코딩한다.
이러한 서열에 관한 동일한 성질의 생물학적 활성은, 이전에 설명한 바와 같이, UDP-글루코오스를 UDP-글루쿠로네이트로 전환시키는 폴리펩티드를 코딩하는 능력이다.
본원에 기재된 바와 같이, 참조 핵산 서열과 적어도 65% 뉴클레오티드 동일성을 갖는 핵산 서열은 상기 참조 핵산 서열과 적어도 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 동일성, 및 또한 상기 참조 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열을 포함한다.
본원에 기재된 바와 같이, 참조 핵산 서열과 적어도 70% 뉴클레오티드 동일성을 갖는 핵산 서열은 상기 참조 핵산 서열과 적어도 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 동일성, 및 또한 상기 참조 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열을 포함한다.
본원에 기재된 바와 같이, 참조 핵산 서열과 적어도 80% 뉴클레오티드 동일성을 갖는 핵산 서열은 상기 참조 서열과 적어도 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 동일성, 및 또한 상기 참조 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열을 포함한다.
아라비돕시스 탈리아나 (Arabidopsis thaliana), 클로렐라 바이러스 PBCV1 또는 스트렙토코쿠스 주에피데미쿠스 (Streptococcus zooepidemicus) 로부터의 UDP-글루코오스 탈수소효소 활성을 갖는 폴리펩티드의 아미노산 서열에 대해, 당업자는 각각 UniProt 데이터베이스에서의 등록 번호 NP_173979.1, NP_048965 또는 KIS19289, 또는 본원에 기재된 SEQ ID NO: 39 (At), SEQ ID NO: 40 (Vir) 및 SEQ ID NO: 41 (Sz) 에 나타낸 바와 같은 서열을 참조할 수 있다.
또 다른 특정 구현예에 따르면, UDP-글루코오스 탈수소효소를 코딩하는 핵산(들) 은 SEQ ID NO: 39 (At), SEQ ID NO: 40 (Cv) 및 SEQ ID NO: 41 (Sz) 의 아미노산 서열과 적어도 55%, 유리하게는 적어도 65%, 바람직하게는 적어도 80% 아미노산 동일성, 및 또한 SEQ ID NO: 39 (At), SEQ ID NO: 40 (Vir) 및 SEQ ID NO: 41 (Sz) 의 아미노산 서열과 동일한 성질의 생물학적 활성 및 또한 동일한 성질의 생물학적 활성을 갖는 서열로 이루어지는 군에서 선택되는 아미노산 서열을 코딩하는 핵산(들) 일 수 있다.
이러한 서열에 관한 동일한 성질의 생물학적 활성은 이전에 기재된 바와 같이, 즉 UDP-글루코오스의 UDP-글루쿠로네이트로의 전환을 촉매화하는 능력이다.
본원에 기재된 바와 같이, 참조 아미노산 서열과 적어도 55% 아미노산 동일성을 갖는 아미노산 서열은 상기 참조 아미노산 서열과 적어도 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 아미노산 동일성, 및 또한 상기 참조 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 아미노산 서열을 포함한다.
본원에 기재된 바와 같이, 참조 아미노산 서열과 적어도 65% 아미노산 동일성을 갖는 아미노산 서열은 상기 참조 아미노산 서열과 적어도 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 아미노산 동일성, 및 또한 상기 참조 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 아미노산 서열을 포함한다.
본원에 기재된 바와 같이, 참조 아미노산 서열과 적어도 80% 아미노산 동일성을 갖는 아미노산 서열은 상기 참조 아미노산 서열과 적어도 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 아미노산 동일성, 및 또한 상기 참조 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 아미노산 서열을 포함한다.
상기 언급된 바와 같이, 본 발명에서 UDP-글루코오스 탈수소효소 활성을 갖는 폴리펩티드의 발현 수준은 적어도 하나의 프로모터 및 적어도 하나의 터미네이터에 의해 조절되며, 예를 들어 본원에서 보다 상세하게 정의된 바와 같이, 이는 상기 UDP-글루코오스 탈수소효소 활성을 갖는 폴리펩티드를 코딩하는 핵산의 5' 및 3' 위치에 각각 존재한다.
UDP-글루코오스-4-에피머라제 (kfoA 또는 GNE1)
UDP-글루코오스-4-에피머라제는 UDP-N-아세틸-글루코사민의 UDP-N-아세틸-갈락토사민으로의 전환을 촉매화하는 것으로 당업계에 공지된 단백질이다. 슈도모나스 아에루기노사 (Pseudomonas aeruginosa), 파스튜렐라 물토시다 (Pasteurella multocida), 또는 에스케리키아 콜라이 (Escherichia coli) 로부터 수득되는 또는 유래되는 UDP-글루코오스-4-에피머라제는 kfoA 또는 GNE1 로 명명될 수 있다.
UTP-글루코오스-4-에피머라제 활성을 갖는 폴리펩티드의 활성 수준을 측정하기 위해 실행되는 방법은 당업자의 일반적인 지식에 속한다.
이와 관련하여, 당업자는 유리하게는 Creuzenet et al. (2000, Journal of Biological Chemistry 275, 1906067) 에 기재된 방법을 참조할 수 있다.
본 명세서에서 UTP-글루코오스-4-에피머라제 활성을 갖는 바람직한 폴리펩티드는 EC 번호 5.1.3.7 를 갖는 효소이다.
바람직한 구현예에 따르면, UTP-글루코오스-4-에피머라제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 바람직하게는 원핵 생물 및 진핵 생물로 이루어진 군에서 선택되는 유기체로부터 수득되거나 유래될 수 있다. 일부 구현예에서, UTP-글루코오스-4-에피머라제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 고세균으로부터 수득되거나 유래될 수 있다. 일부 바람직한 구현예에서, UTP-글루코오스-4-에피머라제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 슈도모나스 아에루기노사 (Pseudomonas aeruginosa), 파스튜렐라 물토시다 (Pm), 또는 에스케리키아 콜라이 (Ec) 로부터 수득되거나 유래될 수 있다.
또다른 바람직한 구현예에 따르면, UTP-글루코오스-4-에피머라제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 (i) 서열 SEQ ID NO: 42 (Pa), SEQ ID NO: 43 (Pm), 및 SEQ ID NO: 44 (Ec) 에서 나타낸 바와 같은 핵산 서열과 적어도 65%, 유리하게는 적어도 70%, 바람직하게는 적어도 80% 핵산 동일성, 및 (ii) 서열 SEQ ID NO: 42 (Pa), SEQ ID NO: 43 (Pm), 및 SEQ ID NO: 44 (Ec) 에서 나타낸 바와 같은 동일한 성질의 생물학적 활성을 갖는 핵산 서열로 이루어지는 군에서 선택될 수 있다.
이러한 서열에 관한 동일한 성질의 생물학적 활성은 이전에 설명한 바와 같이, UDP-N-아세틸-글루코사민을 UDP-N-아세틸-갈락토사민으로 전환시키는 폴리펩티드를 코딩하는 능력이다.
본원에 기재된 바와 같이, 참조 핵산 서열과 적어도 65% 뉴클레오티드 동일성을 갖는 핵산 서열은 상기 참조 핵산 서열과 적어도 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 동일성, 및 또한 상기 참조 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열을 포함한다.
본원에 기재된 바와 같이, 참조 핵산 서열과 적어도 70% 뉴클레오티드 동일성을 갖는 핵산 서열은 상기 참조 핵산 서열과 적어도 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 동일성, 및 또한 상기 참조 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열을 포함한다.
본원에 기재된 바와 같이, 참조 핵산 서열과 적어도 80% 뉴클레오티드 동일성을 갖는 핵산 서열은 상기 참조 서열과 적어도 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 동일성, 및 또한 상기 참조 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열을 포함한다.
슈도모나스 아에루기노사 (Pseudomonas aeruginosa), 파스튜렐라 물토시다 (Pasteurella multocida), 및 에스케리키아 콜라이 (Escherichia coli) 로부터의 UTP-글루코오스-4-에피머라제 활성을 갖는 폴리펩티드의 아미노산 서열에 대해, 당업자는 각각 UniProt 데이터베이스에서의 등록 번호 Q8KN66, AAK02370 또는 Q8L0V2, 또는 본원에 기재된 SEQ ID NO: 45 (Pa), SEQ ID NO: 46 (Pm), 및 SEQ ID NO: 47 (Ec) 에 나타낸 바와 같은 서열을 참조할 수 있다.
또 다른 특정 구현예에 따르면, UTP-글루코오스-4-에피머라제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 SEQ ID NO: 45 (Pa), SEQ ID NO: 46 (Pm), 또는 SEQ ID NO: 47 (Ec) 에 제시된 아미노산 서열과 적어도 55%, 유리하게는 적어도 65%, 바람직하게는 적어도 80% 아미노산 동일성, 및 또한 SEQ ID NO: 45 (Pa), SEQ ID NO: 46 (Pm), 또는 SEQ ID NO: 47 (Ec) 의 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 서열로 이루어지는 군에서 선택되는 아미노산 서열을 갖는 폴리펩티드를 코딩하는 핵산(들) 일 수 있다.
이러한 서열에 관한 동일한 성질의 생물학적 활성은 이전에 기재된 바와 같은, 즉 UDP-N-아세틸-글루코사민의 UDP-N-아세틸-갈락토사민으로의 전환을 촉매화하는 능력이다.
본원에 기재된 바와 같이, 참조 아미노산 서열과 적어도 55% 아미노산 동일성을 갖는 아미노산 서열은 상기 참조 아미노산 서열과 적어도 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 아미노산 동일성, 및 또한 상기 참조 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 아미노산 서열을 포함한다.
본원에 기재된 바와 같이, 참조 아미노산 서열과 적어도 65% 아미노산 동일성을 갖는 아미노산 서열은 상기 참조 아미노산 서열과 적어도 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 아미노산 동일성, 및 또한 상기 참조 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 아미노산 서열을 포함한다.
본원에 기재된 바와 같이, 참조 아미노산 서열과 적어도 80% 아미노산 동일성을 갖는 아미노산 서열은 상기 참조 아미노산 서열과 적어도 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 아미노산 동일성, 및 또한 상기 참조 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 아미노산 서열을 포함한다.
상기 언급된 바와 같이, 본 발명에서 UTP-글루코오스-4-에피머라제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산의 발현 수준은 적어도 하나의 프로모터 및 적어도 하나의 터미네이터에 의해 조절되며, 예를 들어 본원에서 보다 상세하게 정의된 바와 같이, 이는 UTP-글루코오스-4-에피머라제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산의 5' 및 3' 위치에 각각 존재한다.
콘드로이티나아제 (HYAL)
콘드로이티나아제 효소는 콘드로이틴 분자의 더 작은 콘드로이틴 분자로의 분해를 촉매화하기 위한 당업계에 기재된 단백질이다. 상기 언급된 바와 같이, 콘드로이티나아제 활성을 갖는 폴리펩티드는 콘드로이티나아제 또는 히알루로니다아제와 같은 히알루로노글루코사미니다아제일 수 있다.
특정 구현예에서, 콘드로이티나아제 활성을 갖는 폴리펩티드는 히알루로니다아제이다.
콘드로이티나아제 활성을 갖는 폴리펩티드는 큐피엔니우스 살레이 (Cupiennius salei), 티티우스 세르룰라투스 (Tityus serrulatus), 보스 타우루스 (Bos taurus), 아피스 멜리페라 (Apis mellifera), 마카카 물라타 (Macaca mulata), 또는 베스파 마그니피카 (Vespa magnifica) 의 게놈에 의해 코딩될 수 있으며, HYAL 로 명명될 수 있다.
콘드로이티나아제 활성을 갖는 폴리펩티드는 분비 신호 및 고정 신호 둘 모두를 갖거나 분비 신호를 갖고 고정 신호를 갖지 않거나, 이중 분비 및 고정 기능을 갖는 분비-고정 신호를 가질 수 있다. 콘드로이티나아제 활성을 갖는 코딩된 폴리펩티드가 분비 신호 및 고정 신호 둘 모두를 갖는 경우, 이는 HYAL-31 로 지칭될 수 있다.
콘드로이티나아제 활성을 갖는 코딩된 폴리펩티드가 분비 신호를 갖고 고정 신호를 갖지 않는 경우, 이는 HYAL-3 으로 지칭될 수 있다.
콘드로이티나아제 활성을 갖는 폴리펩티드의 활성 수준을 측정하기 위해 실행되는 방법은 당업자의 일반적인 지식에 속한다.
이와 관련하여, 당업자는 유리하게는 아가로오스 겔 상에서 수득한 콘드로이틴의 분자량을 모니터링할 수 있다.
본 명세서에서 콘드로이티나아제 활성을 갖는 바람직한 폴리펩티드는 EC 번호 n° 3.2.1.35 를 갖는 효소이다.
바람직한 구현예에 따르면, 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 바람직하게는 원핵 생물 및 진핵 생물을 포함하는 군에서 선택되는 유기체로부터 수득되거나 유래될 수 있다. 일부 구현예에서, 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 고세균으로부터 수득되거나 유래될 수 있다. 일부 구현예에서, 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 바람직하게는 효모로부터 선택되는 유기체로부터 수득되거나 유래될 수 있다. 일부 다른 바람직한 구현예에서, 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 큐피엔니우스 살레이 (Csa), 티티우스 세르룰라투스 (Ts), 보스 타우루스 (Bt), 아피스 멜리페라 (Am), 마카카 물라타 (Mm), 또는 베스파 마그니피카 (Vm) 로부터, 특히 티티우스 세르룰라투스 (Ts) 로부터 수득되거나 유래될 수 있다.
또다른 바람직한 구현예에 따르면, 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 (i) SEQ ID NO: 48 (Csa), SEQ ID NO: 49 (Ts), SEQ ID NO: 50 (Bt), SEQ ID NO: 51 (Am), SEQ ID NO: 52 (Mm) 또는 SEQ ID NO: 53 (Vm) 의 핵산과 적어도 65%, 유리하게는 적어도 70%, 바람직하게는 적어도 80% 핵산 동일성을 갖고, (ii) 큐피엔니우스 살레이, 티티우스 세르룰라투스, 보스 타우루스, 아피스 멜리페라, 마카카 물라타, 또는 베스파 마그니피카로부터 각각 수득되거나 유래된 분비 신호를 포함하고 고정 신호를 포함하지 않는 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하고, (iii) SEQ ID NO: 48 (Csa), SEQ ID NO: 49 (Ts), SEQ ID NO: 50 (Bt), SEQ ID NO: 51 (Am), SEQ ID NO: 52 (Mm) 또는 SEQ ID NO: 53 (Vm) 의 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열로 이루어진 군으로부터 선택될 수 있다.
또다른 바람직한 구현예에 따르면, 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 SEQ ID NO: 54 (Csa), SEQ ID NO: 55 (Ts), SEQ ID NO: 56 (Bt), SEQ ID NO: 57 (Am), SEQ ID NO: 58 (Mm) 또는 SEQ ID NO: 59 (Vm) 의 핵산과 적어도 65%, 유리하게는 적어도 70%, 바람직하게는 적어도 80% 핵산 동일성을 갖고, (ii) 큐피엔니우스 살레이, 티티우스 세르룰라투스, 보스 타우루스, 아피스 멜리페라, 마카카 물라타, 또는 베스파 마그니피카로부터 각각 수득되거나 유래된 분비 신호 및 고정 신호를 포함하는 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하고, (iii) SEQ ID NO: 54 (Csa), SEQ ID NO: 55 (Ts), SEQ ID NO: 56 (Bt), SEQ ID NO: 57 (Am), SEQ ID NO: 58 (Mm) 또는 SEQ ID NO: 59 (Vm) 의 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열로 이루어진 군으로부터 선택될 수 있다.
이러한 서열에 관한 동일한 성질의 생물학적 활성은, 이전에 설명한 바와 같이, 콘드로이틴 분자의 더 작은 콘드로이틴 분자로의 분해를 촉매화하는 폴리펩티드를 코딩하는 능력이다.
본원에 기재된 바와 같이, 참조 핵산 서열과 적어도 65% 뉴클레오티드 동일성을 갖는 핵산 서열은 상기 참조 핵산 서열과 적어도 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 동일성, 및 또한 상기 참조 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열을 포함한다.
본원에 기재된 바와 같이, 참조 핵산 서열과 적어도 70% 뉴클레오티드 동일성을 갖는 핵산 서열은 상기 참조 핵산 서열과 적어도 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 동일성, 및 또한 상기 참조 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열을 포함한다.
본원에 기재된 바와 같이, 참조 핵산 서열과 적어도 80% 뉴클레오티드 동일성을 갖는 핵산 서열은 상기 참조 서열과 적어도 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 동일성, 및 또한 상기 참조 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열을 포함한다.
큐피엔니우스 살레이 (Cupiennius salei), 티티우스 세르룰라투스 (Tityus serrulatus), 보스 타우루스 (Bos taurus), 아피스 멜리페라 (Apis mellifera), 마카카 물라타 (Macaca mulata), 또는 베스파 마그니피카 (Vespa magnifica) 유래의 히알루로니다아제의 아미노산 서열에 대해, 당업자는 각각 UniProt 데이터베이스에서의 등록 번호 A0A0S4JYH2, P85841, Q7YS45, Q08169, G7ML68 또는 P86875, 또는 본원에 기재된 SEQ ID NO: 60 (Csa), SEQ ID NO: 61 (Ts), SEQ ID NO: 62 (Bt), SEQ ID NO: 63 (Am), SEQ ID NO: 64 (Mm) 또는 SEQ ID NO: 65 (Vm) 을 참조할 수 있다.
또 다른 특정 구현예에 따르면, 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 분비 신호는 포함하고 고정 신호는 포함하지 않는 SEQ ID NO: 60 (Csa), SEQ ID NO: 61 (Ts), SEQ ID NO: 62 (Bt), SEQ ID NO: 63 (Am), SEQ ID NO: 64 (Mm) 또는 SEQ ID NO: 65 (Vm) 의 아미노산 서열과 적어도 55%, 유리하게는 적어도 65%, 바람직하게는 적어도 80% 아미노산 동일성, 및 또한 서열 SEQ ID NO: 60 (Csa), SEQ ID NO: 61 (Ts), SEQ ID NO: 62 (Bt), SEQ ID NO: 63 (Am), SEQ ID NO: 64 (Mm) 또는 SEQ ID NO: 65 (Vm) 과 동일한 성질의 생물학적 활성을 갖는 서열로 이루어지는 군에서 선택되는 아미노산 서열을 갖는 폴리펩티드를 코딩하는 핵산(들) 일 수 있다.
또 다른 특정 구현예에 따르면, 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 분비 신호 및 고정 신호를 포함하는 SEQ ID NO: 66 (Csa), SEQ ID NO: 67 (Ts), SEQ ID NO: 68 (Bt), SEQ ID NO: 69 (Am), SEQ ID NO: 70 (Mm) 또는 SEQ ID NO: 71 (Vm) 의 아미노산 서열과 적어도 55%, 유리하게는 적어도 65%, 바람직하게는 적어도 80% 아미노산 동일성, 및 또한 SEQ ID NO: 66 (Csa), SEQ ID NO: 67 (Ts), SEQ ID NO: 68 (Bt), SEQ ID NO: 69 (Am), SEQ ID NO: 70 (Mm) 또는 SEQ ID NO: 71 (Vm) 의 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 서열로 이루어지는 군에서 선택되는 아미노산 서열을 갖는 폴리펩티드를 코딩하는 핵산(들) 일 수 있다.
이러한 서열에 관한 동일한 성질의 생물학적 활성은 이전에 기재된 바와 같이, 즉 콘드로이틴 분자의 더 작은 콘드로이틴 분자로의 분해를 촉매화하는 능력이다.
본원에 기재된 바와 같이, 참조 아미노산 서열과 적어도 55% 아미노산 동일성을 갖는 아미노산 서열은 상기 참조 아미노산 서열과 적어도 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 아미노산 동일성, 및 또한 상기 참조 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 아미노산 서열을 포함한다.
본원에 기재된 바와 같이, 참조 아미노산 서열과 적어도 65% 아미노산 동일성을 갖는 아미노산 서열은 상기 참조 아미노산 서열과 적어도 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 아미노산 동일성, 및 또한 상기 참조 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 아미노산 서열을 포함한다.
본원에 기재된 바와 같이, 참조 아미노산 서열과 적어도 80% 아미노산 동일성을 갖는 아미노산 서열은 상기 참조 아미노산 서열과 적어도 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 아미노산 동일성, 및 또한 상기 참조 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 아미노산 서열을 포함한다.
상기 언급된 바와 같이, 본 발명에서 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산의 발현 수준은 적어도 하나의 프로모터 및 적어도 하나의 터미네이터에 의해 조절되며, 예를 들어 본원에서 보다 상세하게 정의된 바와 같이, 이는 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산의 5' 및 3' 위치에 각각 존재한다.
글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 (GFA1)
글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 효소는 프룩토오스-6-포스페이트의 글루코사민-6-포스페이트로의 전환을 촉매화하기 위한 당업계에서 기재된 단백질이다. 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제는 GFA1 로 명명될 수 있다.
글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 활성을 갖는 폴리펩티드의 활성 수준을 측정하기 위해 실행되는 방법은 당업자의 일반적인 지식에 속한다.
이와 관련하여, 당업자는 유리하게는 Shiga Shibatan 과 Hiroaki Kitazawa (Plant Biotechnology 26, 149-152, 2009) 에 의해 기재된 방법을 참조할 수 있다.
본 발명에서 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 활성을 갖는 바람직한 폴리펩티드는 EC 번호 n° EC 2.6.1.16 을 갖는 효소이다.
바람직한 구현예에 따르면, 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 바람직하게는 원핵 생물 및 진핵 생물을 포함하는 군에서 선택되는 유기체로부터 기원하거나 유래할 수 있다. 일부 구현예에서, 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 고세균으로부터 기원하거나 유래할 수 있다. 일부 구현예에서, 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 바람직하게는 바실러스 서브틸리스 (Bacillus subtilis) 및 효모에서 선택되는 유기체로부터 기원하거나 유래할 수 있다. 일부 다른 바람직한 구현예에서, 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 효모, 특히 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하거나 유래할 수 있다.
바람직한 구현예에 따르면, 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 (i) 서열 SEQ ID NO: 72 (Sc) 에서 나타낸 바와 같은 핵산 서열과 적어도 65%, 유리하게는 적어도 70%, 바람직하게는 적어도 80% 핵산 동일성, 및 (ii) 서열 SEQ ID NO: 72 에서 나타낸 바와 같은 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열로 이루어지는 군에서 선택될 수 있다. 서열 SEQ ID NO: 72 에서 나타낸 바와 같은 핵산은 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 수득되는 또는 유래되는 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하며, 또한 GFA1 로 명명된다.
또 다른 구현예에 따르면, 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 (i) 서열 SEQ ID NO: 73 또는 SEQ ID NO: 74 에서 나타낸 바와 같은 핵산 서열과 적어도 65%, 유리하게는 적어도 70%, 바람직하게는 적어도 80% 핵산 동일성, 및 (ii) 서열 SEQ ID NO: 73 또는 SEQ ID NO: 74 에서 나타낸 바와 같은 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열로 이루어지는 군에서 선택될 수 있다. 서열 SEQ ID NO: 73 또는 SEQ ID NO: 74 에서 나타낸 바와 같은 핵산 서열은 클로렐라 바이러스 PBCV1 로부터 기원하는 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩한다.
이러한 서열에 관한 동일한 성질의 생물학적 활성은, 이전에 설명한 바와 같이, 프룩토오스-6-포스페이트를 글루코사민-6-포스페이트로 전환시키는 폴리펩티드를 코딩하는 능력이다.
본원에 기재된 바와 같이, 참조 핵산 서열과 적어도 65% 뉴클레오티드 동일성을 갖는 핵산 서열은 상기 참조 핵산 서열과 적어도 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 동일성, 및 또한 상기 참조 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열을 포함한다.
본원에 기재된 바와 같이, 참조 핵산 서열과 적어도 70% 뉴클레오티드 동일성을 갖는 핵산 서열은 상기 참조 핵산 서열과 적어도 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 동일성, 및 또한 상기 참조 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열을 포함한다.
본원에 기재된 바와 같이, 참조 핵산 서열과 적어도 80% 뉴클레오티드 동일성을 갖는 핵산 서열은 상기 참조 서열과 적어도 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 동일성, 및 또한 상기 참조 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열을 포함한다.
사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 활성을 갖는 폴리펩티드의 아미노산 서열에 대해, 당업자는 UniProt 데이터베이스에서의 등록 번호 NP8012818, 또는 본원에 기재된 서열 SEQ ID NO: 75 를 참조할 수 있다.
클로렐라 바이러스 PBCV1 로부터 기원하는 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 활성을 갖는 폴리펩티드의 아미노산 서열에 대해, 당업자는 또한 UniProt 데이터베이스에서의 등록 번호 NP_048448, 또는 본원에 기재된 서열 SEQ ID NO: 76 을 참조할 수 있다.
또 다른 특정 구현예에 따르면, 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 SEQ ID NO: 75 또는 SEQ ID NO: 76 의 아미노산 서열과 적어도 35%, 유리하게는 적어도 65%, 바람직하게는 적어도 80% 아미노산 동일성, 및 또한 SEQ ID NO: 75 또는 SEQ ID NO: 76 의 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 서열로 이루어지는 군에서 선택되는 아미노산 서열을 갖는 폴리펩티드를 코딩하는 핵산(들) 일 수 있다.
이러한 서열에 관한 동일한 성질의 생물학적 활성은 이전에 기재된 바와 같이, 즉 프룩토오스-6-포스페이트의 글루코사민-6-포스페이트로의 전환을 촉매화하는 능력이다.
본원에 기재된 바와 같이, 참조 아미노산 서열과 적어도 35% 아미노산 동일성을 갖는 아미노산 서열은 상기 참조 아미노산 서열과 적어도 36%, 37%, 38%, 39%, 40% 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 아미노산 동일성, 및 또한 상기 참조 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 아미노산 서열을 포함한다.
본원에 기재된 바와 같이, 참조 아미노산 서열과 적어도 65% 아미노산 동일성을 갖는 아미노산 서열은 상기 참조 아미노산 서열과 적어도 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 아미노산 동일성, 및 또한 상기 참조 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 아미노산 서열을 포함한다.
본원에 기재된 바와 같이, 참조 아미노산 서열과 적어도 80% 아미노산 동일성을 갖는 아미노산 서열은 상기 참조 아미노산 서열과 적어도 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 아미노산 동일성, 및 또한 상기 참조 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 아미노산 서열을 포함한다.
상기 언급된 바와 같이, 본 발명에서 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 활성을 갖는 폴리펩티드의 발현 수준은 적어도 하나의 프로모터 및 적어도 하나의 터미네이터에 의해 조절되며, 예를 들어 본원에서 보다 상세하게 정의된 바와 같이, 이는 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산의 5' 및 3' 위치에 각각 존재한다.
UDP-N-아세틸글루코사민 피로포스포릴라아제 (QRI1)
UDUDP-N-아세틸글루코사민 피로포스포릴라아제 효소는 N-아세틸-글루코사민-6-포스페이트의 UDP-N-아세틸-글루코오스로의 전환을 촉매화하기 위한 당업계에 기재된 단백질이다. 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 UDP-N-아세틸글루코사민 피로포스포릴라아제는 QRI1 로 명명될 수 있다.
UDP-N-아세틸글루코사민 피로포스포릴라아제 활성을 갖는 폴리펩티드의 활성 수준을 측정하기 위해 실행되는 방법은 당업자의 일반적인 지식에 속한다.
이와 관련하여, 당업자는 유리하게는, UDP-N-아세틸-글루코사민이 Synergi RP Fusion 컬럼을 사용하여 LC MS/MS 에 의해 검출된다는 것을 제외하고는 Mio et al. (The Journal of Biological Chemistry, Col. 273, No 23, June 5, 1998, 14392-14397) 에 의해 기재된 방법을 참조할 수 있다.
본 발명에서 UDP-N-아세틸글루코사민 피로포스포릴라아제 활성을 갖는 바람직한 폴리펩티드는 EC 번호 n° EC 2.7.7.23 을 갖는 효소이다.
바람직한 구현예에 따르면, UDP-N-아세틸글루코사민 피로포스포릴라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 바람직하게는 원핵 생물 및 진핵 생물로 이루어지는 군에서 선택되는 유기체로부터 기원하거나 유래할 수 있다. 일부 구현예에서, UDP-N-아세틸글루코사민 피로포스포릴라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 고세균으로부터 기원하거나 유래할 수 있다. 일부 구현예에서, UDP-N-아세틸글루코사민 피로포스포릴라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 바람직하게는 바실러스 서브틸리스 (Bacillus subtilis), 및 효모에서 선택되는 유기체로부터 기원하거나 유래할 수 있다. 일부 다른 바람직한 구현예에서, UDP-N-아세틸글루코사민 피로포스포릴라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 효모, 특히 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하거나 유래할 수 있다.
바람직한 구현예에 따르면, UDP-N-아세틸글루코사민 피로포스포릴라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 (i) SEQ ID NO: 77 에서 나타낸 바와 같은 핵산 서열과 적어도 65%, 유리하게는 적어도 70%, 바람직하게는 적어도 80% 핵산 동일성, 및 (ii) SEQ ID NO: 77 에서 나타낸 바와 같은 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열로 이루어지는 군에서 선택될 수 있다. SEQ ID NO: 77 에서 나타낸 바와 같은 핵산 서열은 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 UDP-N-아세틸글루코사민 피로포스포릴라아제 활성을 갖는 폴리펩티드를 코딩하며, 또한 QRI1 로 명명된다.
이러한 서열에 관한 동일한 성질의 생물학적 활성은 이전에 설명한 바와 같이, N-아세틸-글루코사민-6-포스페이트를 UDP-N-아세틸-글루코오스로 전환시키는 폴리펩티드를 코딩하는 능력이다.
본원에 기재된 바와 같이, 참조 핵산 서열과 적어도 65% 뉴클레오티드 동일성을 갖는 핵산 서열은 상기 참조 핵산 서열과 적어도 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 동일성, 및 또한 상기 참조 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열을 포함한다.
본원에 기재된 바와 같이, 참조 핵산 서열과 적어도 70% 뉴클레오티드 동일성을 갖는 핵산 서열은 상기 참조 핵산 서열과 적어도 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 동일성, 및 또한 상기 참조 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열을 포함한다.
본원에 기재된 바와 같이, 참조 핵산 서열과 적어도 80% 뉴클레오티드 동일성을 갖는 핵산 서열은 상기 참조 서열과 적어도 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 동일성, 및 또한 상기 참조 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열을 포함한다.
사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 UDP-N-아세틸글루코사민 피로포스포릴라아제 활성을 갖는 폴리펩티드의 아미노산 서열에 대해, 당업자는 UniProt 데이터베이스에서의 등록 번호 NP_010180, 또는 본원에 기재된 SEQ ID NO. 78 를 참조할 수 있다.
또 다른 특정 구현예에 따르면, UDP-N-아세틸글루코사민 피로포스포릴라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 서열 SEQ ID NO. 78 에서 나타낸 바와 같은 아미노산 서열과 적어도 35%, 유리하게는 적어도 45%, 바람직하게는 적어도 80% 아미노산 동일성, 및 또한 서열 SEQ ID NO. 78 에서 나타낸 바와 같은 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 서열로 이루어지는 군에서 선택되는 아미노산 서열을 갖는 폴리펩티드를 코딩하는 핵산(들) 일 수 있다.
이러한 서열에 관한 동일한 성질의 생물학적 활성은 이전에 기재된 바와 같이, 즉 N-아세틸-글루코사민-6-포스페이트의 UDP-N-아세틸-글루코오스로의 전환을 촉매화하는 능력이다.
본원에 기재된 바와 같이, 참조 아미노산 서열과 적어도 35% 아미노산 동일성을 갖는 아미노산 서열은 상기 참조 아미노산 서열과 적어도 36%, 37%, 38%, 39%, 40% 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 아미노산 동일성, 및 또한 상기 참조 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 아미노산 서열을 포함한다.
본원에 기재된 바와 같이, 참조 아미노산 서열과 적어도 45% 아미노산 동일성을 갖는 아미노산 서열은 상기 참조 아미노산 서열과 적어도 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 아미노산 동일성, 및 또한 상기 참조 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 아미노산 서열을 포함한다.
본원에 기재된 바와 같이, 참조 아미노산 서열과 적어도 80% 아미노산 동일성을 갖는 아미노산 서열은 상기 참조 아미노산 서열과 적어도 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 아미노산 동일성, 및 또한 상기 참조 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 아미노산 서열을 포함한다.
상기 언급된 바와 같이, 본 발명에서 UDP-N-아세틸글루코사민 피로포스포릴라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산의 발현 수준은 적어도 하나의 프로모터 및 적어도 하나의 터미네이터에 의해 조절되며, 예를 들어 본원에서 보다 상세하게 정의된 바와 같이, 이는 UDP-N-아세틸글루코사민 피로포스포릴라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산의 5' 및 3' 위치에 각각 존재한다.
포스포글루코뮤타아제-1 (PGM1)
포스포글루코뮤타아제-1 효소는 글루코오스-6-포스페이트의 글루코오스-1-포스페이트로의 전환을 촉매화하기 위한 당업계에 기재된 단백질이다. 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 포스포글루코뮤타아제-1 은 PGM1 로 명명될 수 있다.
포스포글루코뮤타아제-1 활성을 갖는 폴리펩티드의 활성 수준을 측정하기 위해 실행되는 방법은 당업자의 일반적인 지식에 속한다.
이와 관련하여, 당업자는 유리하게는 Tiwari 와 Bhat (Biochemical and Biophysical Research Communications 366, 340-345, 2008) 에 의해 기재된 방법을 참조할 수 있다.
본 발명에서 포스포글루코뮤타아제-1 활성을 갖는 바람직한 폴리펩티드는 EC 번호 n° 5.4.2.2 를 갖는 효소이다.
바람직한 구현예에 따르면, 포스포글루코뮤타아제-1 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 바람직하게는 원핵 생물 및 진핵 생물로 이루어지는 군에서 선택되는 유기체로부터 기원하거나 유래할 수 있다. 일부 구현예에서, 포스포글루코뮤타아제-1 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 고세균으로부터 기원하거나 유래할 수 있다. 일부 구현예에서, 포스포글루코뮤타아제-1 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 바람직하게는 박테리아에서 선택되는 유기체로부터 기원하거나 유래할 수 있다. 바람직한 구현예에서, 포스포글루코뮤타아제-1 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하거나 유래할 수 있다.
한 구현예에 따르면, 포스포글루코뮤타아제-1 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 (i) 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는, 서열 SEQ ID NO: 79 에서 나타낸 바와 같은 핵산 서열과 적어도 80% 핵산 동일성, 및 (ii) 서열 SEQ ID NO: 79 에서 나타낸 바와 같은 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열로 이루어지는 군에서 선택될 수 있다.
이러한 서열에 관한 동일한 성질의 생물학적 활성은, 이전에 설명한 바와 같이, 글루코오스-6-포스페이트를 글루코오스-1-포스페이트로 전환시키는 폴리펩티드를 코딩하는 능력이다.
본원에 기재된 바와 같이, 참조 핵산 서열과 적어도 80% 뉴클레오티드 동일성을 갖는 핵산 서열은 상기 참조 서열과 적어도 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 동일성, 및 또한 상기 참조 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열을 포함한다.
사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터의 포스포글루코뮤타아제-1 활성을 갖는 펩티드의 아미노산 서열에 대해, 당업자는 UniProt 데이터베이스에서의 등록 번호 NP33401, 또는 본원에 기재된 SEQ ID NO: 80 를 참조할 수 있다.
또 다른 특정 구현예에 따르면, 포스포글루코뮤타아제-1 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 서열 SEQ ID NO: 80 에서 나타낸 바와 같은 아미노산 서열과 적어도 80% 아미노산 동일성, 및 또한 서열 SEQ ID NO: 80 에서 나타낸 바와 같은 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 서열로 이루어지는 군에서 선택되는 아미노산 서열을 갖는 폴리펩티드를 코딩하는 핵산(들) 일 수 있다.
이러한 서열에 관한 동일한 성질의 생물학적 활성은 이전에 기재된 바와 같이, 즉 글루코오스-6-포스페이트의 글루코오스-1-포스페이트로의 전환을 촉매화하는 능력이다.
본원에 기재된 바와 같이, 참조 아미노산 서열과 적어도 80% 아미노산 동일성을 갖는 아미노산 서열은 상기 참조 아미노산 서열과 적어도 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 아미노산 동일성, 및 또한 상기 참조 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 아미노산 서열을 포함한다.
상기 언급된 바와 같이, 본 발명에서 포스포글루코뮤타아제-1 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산의 발현 수준은 적어도 하나의 프로모터 및 적어도 하나의 터미네이터에 의해 조절되며, 예를 들어 본원에서 보다 상세하게 정의된 바와 같이, 이는 포스포글루코뮤타아제-1 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산의 5' 및 3' 위치에 각각 존재한다.
UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 (UGP1)
UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 효소는 글루코오스-1-포스페이트의 UDP-글루코오스로의 전환을 촉매화하기 위한 당업계에 기재된 단백질이다. 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제는 UGP1 로 명명될 수 있다.
UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 활성을 갖는 폴리펩티드의 활성 수준을 측정하기 위해 실행되는 방법은 당업자의 일반적인 지식에 속한다.
이와 관련하여, 당업자는 유리하게는 Roeben (J. Mol. Biol 364, 551-560, 2006) 에 의해 기재된 방법을 참조할 수 있다.
본 발명에서 UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 활성을 갖는 바람직한 폴리펩티드는 EC 번호 n° 2.7.7.9 를 갖는 효소이다.
바람직한 구현예에 따르면, UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 바람직하게는 원핵 생물 및 진핵 생물로 이루어지는 군에서 선택되는 유기체로부터 기원하거나 유래할 수 있다. 일부 구현예에서, UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 고세균으로부터 기원하거나 유래할 수 있다. 일부 구현예에서, UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 바람직하게는 박테리아에서 선택되는 유기체로부터 기원하거나 유래할 수 있다. 바람직한 구현예에서, UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하거나 유래할 수 있다.
특정 구현예에 따르면, UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 (i) 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는, SEQ ID NO: 81 에서 나타낸 바와 같은 핵산과 적어도 80% 핵산 동일성, 및 (ii) SEQ ID NO: 81 에서 나타낸 바와 같은 핵산과 동일한 성질의 생물학적 활성을 갖는 핵산 서열로 이루어지는 군에서 선택될 수 있다.
이러한 서열에 관한 동일한 성질의 생물학적 활성은, 이전에 설명한 바와 같이, 글루코오스-1-포스페이트를 UDP-글루코오스로 전환시키는 폴리펩티드를 코딩하는 능력이다.
본원에 기재된 바와 같이, 참조 핵산 서열과 적어도 80% 뉴클레오티드 동일성을 갖는 핵산 서열은 상기 참조 서열과 적어도 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 동일성, 및 또한 상기 참조 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열을 포함한다.
사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 활성을 갖는 폴리펩티드의 아미노산 서열에 대해, 당업자는 UniProt 데이터베이스에서의 등록 번호 NP_32861, 또는 본원에 기재된 서열 SEQ ID NO: 82 에 나타낸 서열을 참조할 수 있다.
또 다른 특정 구현예에 따르면, UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 SEQ ID NO: 82 에서 나타낸 바와 같은 아미노산 서열과 적어도 80% 아미노산 동일성, 및 또한 SEQ ID NO: 82 에서 나타낸 바와 같은 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 서열로 이루어지는 군에서 선택되는 아미노산 서열을 갖는 폴리펩티드를 코딩하는 핵산(들) 일 수 있다.
이러한 서열에 관한 동일한 성질의 생물학적 활성은 이전에 기재된 바와 같이, 즉 글루코오스-1-포스페이트의 UDP-글루코오스로의 전환을 촉매화하는 능력이다.
본원에 기재된 바와 같이, 참조 아미노산 서열과 적어도 80% 아미노산 동일성을 갖는 아미노산 서열은 상기 참조 아미노산 서열과 적어도 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 아미노산 동일성, 및 또한 상기 참조 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 아미노산 서열을 포함한다.
상기 언급된 바와 같이, 본 발명에서 UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산의 발현 수준은 적어도 하나의 프로모터 및 적어도 하나의 터미네이터에 의해 조절되며, 예를 들어 본원에서 보다 상세하게 정의된 바와 같이, 이는 UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산의 5' 및 3' 위치에 각각 존재한다.
글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 (GNA1)
글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 효소는 글루코사민-6-포스페이트의 N-아세틸-글루코사민-6-포스페이트로의 전환을 촉매화하기 위한 당업계에서 기재된 단백질이다. 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제는 GNA1 로 명명될 수 있다.
글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 활성을 갖는 폴리펩티드의 활성 수준을 측정하기 위해 실행되는 방법은 당업자의 일반적인 지식에 속한다.
이와 관련하여, 당업자는 유리하게는 Li et al. (Anal. Biochem. 370, 142-146, 2007) 에 의해 기재된 방법을 참조할 수 있다.
본 발명에서 글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 활성을 갖는 바람직한 폴리펩티드는 EC 번호 n° 2.3.1.4 를 갖는 효소이다.
바람직한 구현예에 따르면, 글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 바람직하게는 원핵 생물 및 진핵 생물로 이루어지는 군에서 선택되는 유기체로부터 기원하거나 유래할 수 있다. 일부 바람직한 구현예에서, 글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 효모, 특히 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하거나 유래할 수 있다.
특정 구현예에 따르면, 글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 (i) 서열 SEQ ID NO: 83 에서 나타낸 바와 같은 핵산 서열과 적어도 80% 핵산 동일성, 및 (ii) 서열 SEQ ID NO: 83 에서 나타낸 바와 같은 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열로 이루어지는 군에서 선택될 수 있다. 서열 SEQ ID NO: 83 에서 나타낸 바와 같은 핵산 서열은 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하며, 또한 GNA1 로 명명된다.
이러한 서열에 관한 동일한 성질의 생물학적 활성은, 이전에 설명한 바와 같이, 글루코사민-6-포스페이트를 N-아세틸-글루코사민-6-포스페이트로 전환시키는 폴리펩티드를 코딩하는 능력이다.
본원에 기재된 바와 같이, 참조 핵산 서열과 적어도 80% 뉴클레오티드 동일성을 갖는 핵산 서열은 상기 참조 서열과 적어도 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 동일성, 및 또한 상기 참조 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열을 포함한다.
사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 수득되는 또는 유래되는 글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 활성을 갖는 폴리펩티드의 아미노산 서열에 대해, 당업자는 UniProt 데이터베이스에서의 등록 번호 NP_116637, 또는 본원에 기재된 SEQ ID NO. 84 을 참조할 수 있다.
또 다른 특정 구현예에 따르면, 글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 SEQ ID NO. 84 에서 나타낸 바와 같은 아미노산 서열과 적어도 80% 아미노산 동일성, 및 또한 SEQ ID NO. 84 에서 나타낸 바와 같은 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 서열로 이루어지는 군에서 선택되는 아미노산 서열을 갖는 폴리펩티드를 코딩하는 핵산(들) 일 수 있다.
이러한 서열에 관한 동일한 성질의 생물학적 활성은 이전에 기재된 바와 같이, 즉 글루코사민-6-포스페이트의 N-아세틸-글루코사민-6-포스페이트로의 전환을 촉매화하는 능력이다..
본원에 기재된 바와 같이, 참조 아미노산 서열과 적어도 80% 아미노산 동일성을 갖는 아미노산 서열은 상기 참조 아미노산 서열과 적어도 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 아미노산 동일성, 및 또한 상기 참조 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 아미노산 서열을 포함한다.
상기 언급된 바와 같이, 본 발명에서 글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산의 발현 수준은 적어도 하나의 프로모터 및 적어도 하나의 터미네이터에 의해 조절되며, 예를 들어 본원에서 보다 상세하게 정의된 바와 같이, 이는 글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산의 5' 및 3' 위치에 각각 존재한다.
포스포아세틸글루코사민 뮤타아제 (PCM1)
포스포아세틸글루코사민 뮤타아제 효소는 N-아세틸-글루코사민-6-포스페이트의 N-아세틸-글루코사민-1-포스페이트로의 전환을 촉매화하기 위한 당업계에서 기재된 단백질이다. 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 포스포아세틸글루코사민 뮤타아제는 PCM1 로 명명될 수 있다.
포스포아세틸글루코사민 뮤타아제 활성을 갖는 폴리펩티드의 활성 수준을 측정하기 위해 실행되는 방법은 당업자의 일반적인 지식에 속한다.
이와 관련하여, 당업자는 유리하게는 Bandini et al. (Molecular Microbiology 85(3), 513-534, 2012) 에 의해 기재된 방법을 참조할 수 있다.
본 발명에서 포스포아세틸글루코사민 뮤타아제 활성을 갖는 바람직한 폴리펩티드는 EC 번호 n° 5.4.2.3 을 갖는 효소이다.
바람직한 구현예에 따르면, 포스포아세틸글루코사민 뮤타아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 바람직하게는 원핵 생물 및 진핵 생물로 이루어지는 군에서 선택되는 유기체로부터 기원하거나 유래할 수 있다. 일부 바람직한 구현예에서, 포스포아세틸글루코사민 뮤타아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 효모, 특히 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하거나 유래할 수 있다.
특정 구현예에 따르면, 포스포아세틸글루코사민 뮤타아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 (i) SEQ ID NO: 85 에서 나타낸 바와 같은 핵산 서열과 적어도 80% 핵산 동일성, 및 (ii) SEQ ID NO: 85 에서 나타낸 바와 같은 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열로 이루어지는 군에서 선택될 수 있다. SEQ ID NO: 85 에서 나타낸 바와 같은 핵산은 사카로마이세스로부터 기원하는 포스포아세틸글루코사민 뮤타아제 활성을 갖는 폴리펩티드를 코딩하며, 또한 PCM1 로 명명된다.
이러한 서열에 관한 동일한 성질의 생물학적 활성은, 이전에 설명한 바와 같이, N-아세틸-글루코사민-6-포스페이트를 N-아세틸-글루코사민-1-포스페이트로 전환시키는 폴리펩티드를 코딩하는 능력이다.
본원에 기재된 바와 같이, 참조 핵산 서열과 적어도 80% 뉴클레오티드 동일성을 갖는 핵산 서열은 상기 참조 서열과 적어도 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 동일성, 및 또한 상기 참조 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열을 포함한다.
사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 포스포아세틸글루코사민 뮤타아제 활성을 갖는 폴리펩티드의 아미노산 서열에 대해, 당업자는 UniProt 데이터베이스에서의 등록 번호 NP_010856, 또는 본원에 기재된 SEQ ID NO. 86 을 참조할 수 있다.
또 다른 특정 구현예에 따르면, 포스포아세틸글루코사민 뮤타아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 SEQ ID NO. 86 에서 나타낸 바와 같은 아미노산 서열과 적어도 80% 아미노산 동일성, 및 또한 SEQ ID NO. 86 에서 나타낸 바와 같은 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 서열로 이루어지는 군에서 선택되는 아미노산 서열을 갖는 폴리펩티드를 코딩하는 핵산(들) 일 수 있다.
이러한 서열에 관한 동일한 성질의 생물학적 활성은 이전에 기재된 바와 같이, 즉 N-아세틸-글루코사민-6-포스페이트의 N-아세틸-글루코사민-1-포스페이트로의 전환을 촉매화하는 능력이다.
본원에 기재된 바와 같이, 참조 아미노산 서열과 적어도 80% 아미노산 동일성을 갖는 아미노산 서열은 상기 참조 아미노산 서열과 적어도 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 아미노산 동일성, 및 또한 상기 참조 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 아미노산 서열을 포함한다.
상기 언급된 바와 같이, 본 발명에서 포스포아세틸글루코사민 뮤타아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산의 발현 수준은 적어도 하나의 프로모터 및 적어도 하나의 터미네이터에 의해 조절되며, 예를 들어 본원에서 보다 상세하게 정의된 바와 같이, 이는 포스포아세틸글루코사민 뮤타아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산의 5' 및 3' 위치에 각각 존재한다.
프로모터
본원에 개시된 바와 같이, 본 발명에 따른 재조합 세포를 수득하기 위해 유전자 조작된 관심 유전자의 발현은 본 발명의 재조합 세포, 특히 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 를 포함하는 특히 본 발명의 재조합 효모 세포에서 기능적인 적절한 조절 서열을 포함한다.
다양한 프로모터가 관심 코딩 서열의 원하는 발현에 사용될 수 있다.
본 발명에 따른 프로모터는 하기 프로모터로 이루어지는 군에서 선택될 수 있다:
ㆍ pTDH3 (SEQ ID NO: 87),
ㆍ pTDH3.Sk (SEQ ID NO: 88)
ㆍ pTDH3-1.Sba (SEQ ID NO: 89),
ㆍ pTDH3.Sar (SEQ ID NO: 90)
ㆍ pENO2 (SEQ ID NO: 91)
ㆍ pTEF3 (SEQ ID NO: 92)
ㆍ pTEF1 (SEQ ID NO: 93),
ㆍ pTEF1.Ago (SEQ ID NO: 94),
ㆍ pTEF1.sba (SEQ ID NO: 95),
ㆍ pPDC1 (SEQ ID NO: 96),
ㆍ pCCW12 (SEQ ID NO: 97),
ㆍ pCCW12.Sm (SEQ ID NO: 98),
ㆍ pCCW12.sk (SEQ ID NO: 99),
ㆍ pCCW12.sba (SEQ ID NO: 100),
ㆍ pCCW12.sar (SEQ ID NO: 101),
ㆍ pNUP57 (SEQ ID NO: 102),
ㆍ pCCW10.ago (SEQ ID NO: 103),
ㆍ pCWP2 (SEQ ID NO: 104),
ㆍ pFBA1 (SEQ ID NO: 105),
ㆍ pCCW120.Sm (SEQ ID NO: 106).
본 발명에서 보다 특히 관심 대상인 프로모터는 하기로 이루어진 군에서 선택될 수 있다:
ㆍ pTDH3 (SEQ ID NO: 65). 87)
ㆍ pTDH3.Sk (SEQ ID NO: 88)
ㆍ pTDH3-1.Sba (SEQ ID NO: 89)
ㆍ pTDH3.Sar (SEQ ID NO: 90),
ㆍ pENO2 (SEQ ID NO: 91),
ㆍ pTEF3 (SEQ ID NO: 92),
ㆍ pTEF1 (SEQ ID NO: 93),
ㆍ pTEF1.Ago (SEQ ID NO: 94),
ㆍ pTEF1.sba (SEQ ID NO: 95),
ㆍ pPDC1 (SEQ ID NO: 96),
ㆍ pCCW12 (SEQ ID NO: 97),,
ㆍ pCCW12.sba (SEQ ID NO: 100)
ㆍ pCCW120.Sm (SEQ ID NO: 106),
ㆍ pNUP57 (SEQ ID NO: 102),
ㆍ pCCW10.ago (SEQ ID NO: 103),
ㆍ pCWP2 (SEQ ID NO: 104), 및
ㆍ pFBA1 (SEQ ID NO: 105)
상기 터미네이터는 특히 pTDH3, pTDH3.Sk, pTDH3-1.Sba, pTEF1, pTEF1.Ago, pTEF1.sba, pCCW12, pCCW120.Sm, pCWP2 및 pFBA1 로 이루어지는 군에서 선택될 수 있다.
대안적으로, 본 발명에서 관심 대상인 프로모터는 하기로 이루어진 군에서 선택될 수 있다:
ㆍ pNUP57 (SEQ ID NO: 102), 및
ㆍ pCCW10.ago (SEQ ID NO: 103).
본 발명에서 관심있는 또다른 프로모터는 다음과 같을 수 있다:
ㆍ pCWP2 (SEQ ID NO: 104).
이전에 언급된 바와 같이, 유도성 또는 억제성 프로모터는 그의 활성이 생물학적 또는 비생물학적 인자의 존재 또는 부재 및 또한 상기 인자의 양에 의해 제어되는 프로모터이다. 따라서, 일부 프로모터의 경우, 주어진 인자의 양이 증가하거나 증가될 때 이들의 활성이 특히 유도되고 이에 따라 증가할 것이며, 따라서, 상기 인자의 양이 감소하거나 감소될 때 이들 동일한 프로모터의 활성이 억제되고 이에 따라 감소될 수 있다. 유도성 또는 억제성 프로모터를 포함하는 본 발명의 재조합 효모 세포의 배양 배지에서 상기 인자(들) 의 양은 당업자에 의해 결정되고 이에 따라 제어될 수 있다.
예를 들어, pCUP1 프로모터를 포함하는 본 발명에 따른 재조합 효모 세포의 배양 배지에서 구리의 양을 증가시키는 것은 이러한 프로모터의 제어 하에 유전자의 전사를 유도하고 이에 따라 증가시킬 것이다. 반대로, 상기 배양 배지에서 구리의 양을 감소시키는 것은 이러한 프로모터의 제어 하에 유전자의 전사를 억제하고 이에 따라 감소시킬 것이다.
또 다른 예에서, pMET6 프로모터를 포함하는 본 발명에 따른 재조합 효모 세포의 배양 배지에서 메티오닌의 양을 증가시키는 것은 이러한 프로모터의 제어 하에 유전자의 전사를 억제하고 이에 따라 감소시킬 것이다. 반대로, 상기 배양 배지에서 메티오닌의 양을 감소시키는 것은 이러한 프로모터의 제어 하에 유전자의 전사를 유도하고 이에 따라 증가시킬 것이다.
이러한 이유로, 하기 프로모터는 본문에서 "유도성 또는 억제성 프로모터"로 지칭된다.
제 1 구현예에 따르면, 본 발명에 따른 유도성 또는 억제성 프로모터는 구리로의 유도성 또는 억제성 프로모터, 메티오닌으로의 유도성 또는 억제성 프로모터 및 트레오닌으로의 유도성 또는 억제성 프로모터를 포함하는 군에서 선택될 수 있고, 특히 CUP-1 - 구리 유도성 또는 억제성이다.
이러한 구현예에 따르면, 본 발명에 따른 유도성 또는 억제성 프로모터는 특히 pCUP1 (SEQ ID NO: 107) 일 수 있다.
따라서, 이들 프로모터의 활성은 상기 나타낸 바와 같이 메티오닌, 구리 또는 트레오닌의 존재를 증가시킴으로써 유도되고, 메티오닌, 구리 또는 트레오닌의 양이 감소될 때 이들의 활성이 감소, 즉 억제된다.
제 2 구현예에 따르면, 본 발명에 따른 유도성 또는 억제성 프로모터는 구리로의 유도성 또는 억제성 프로모터, 리신으로의 유도성 또는 억제성 프로모터 및 메티오닌으로의 유도성 또는 억제성 프로모터를 포함하는 군에서. 특히 하기로 이루어지는 군에서 선택될수 있다:
ㆍ pMET6 - 메티오닌 유도성 또는 억제성 (SEQ ID NO: 108),
ㆍ pMET25 - 메티오닌 유도성 또는 억제성 (SEQ ID NO: 109), 및
ㆍ pSAM1 - 메티오닌 유도성 또는 억제성 (SEQ ID NO: 110).
이러한 특정 구현예에 따르면, 본 발명에 따른 유도성 또는 억제성 프로모터는, pMET6 및 pSAM1 로 이루어지는 군에서 선택될 수 있다.
따라서, 이들 프로모터의 활성은 상기 나타낸 바와 같이 메티오닌, 구리, 리신 또는 글루코오스의 존재를 증가시킴으로써 억제되고, 메티오닌, 구리, 리신 또는 글루코오스의 양이 감소될 때 이들의 활성이 증가, 즉 유도된다.
특정 구현예에서, 본 발명에 따른 유도성 또는 억제성 프로모터는 구리로의 유도성 또는 억제성 프로모터, 글루코오스로의 유도성 또는 억제성 프로모터, 리신으로의 유도성 또는 억제성 프로모터, 메티오닌으로의 유도성 또는 억제성 프로모터 및 트레오닌으로의 유도성 또는 억제성 프로모터를 포함하는 군에서 선택될 수 있다.
Blazeck & Alper (2013) Biotechnol. J. 8 46-58 에서 기재된 바와 같은 합성 프로모터가 또한 사용될 수 있다.
본 발명의 프로모터는 사카로마이세스 강 (Saccharomycetes class) 으로부터의 임의의 유기체로부터 기원할 수 있고, 특히 사카로마이세스 세레비지에 (Saccharomyces cerevisiae), 사카로마이세스 보울라르디이 (Saccharomyces boulardii), 사카로마이세스 카스텔리이 (Saccharomyces castelii), 사카로마이세스 바야누스 (Saccharomyces bayanus), 사카로마이세스 아르보리콜라 (Saccharomyces arboricola), 사카로마이세스 쿠드리아브제비이 (Saccharomyces kudriavzevii), 사카로마이세스 미카타에 (Saccharomyces mikatae), 아쉬비아 고시피이 (Ashbya gossypii), 클루베로마이세스 락티스 (Kluveromyces lactis), 피치아 파스토리스 (Pichia pastoris), 칸디다 글라브라타 (Candida glabrata), 칸디다 트로피칼리스 (Candida tropicalis), 데바리오마이세스 카르텔리이 (Debaryomyces castelii), 야로위아 리포리티카 (Yarrowia lipolitica) 및 사이버린드네라 자디니이 (Cyberlindnera jadinii) 중 적어도 하나로 이루어지는 군에서 선택되는 유기체로부터 기원할 수 있다.
본 발명의 프로모터는 바람직하게는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) (sc), 사카로마이세스 미카타에 (Saccharomyces mikatae) (Sm), 사카로마이세스 쿠드리아브제비이 (Saccharomyces kudriavzevii) (sk), 사카로마이세스 바야누스 (Saccharomyces bayanus) (sba), 사카로마이세스 아르보리콜라 (Saccharomyces arboricola) (Sar), 및 아쉬비아 고시피이 (Ashbya gossypii) (Ago) 로 이루어지는 군에서 선택되는 유기체로부터 기원할 수 있다.
터미네이터
본원에 개시된 바와 같이, 본 발명에 따른 재조합 세포, 특히 본 발명에 따른 재조합 효모를 수득하기 위해 유전자 조작된 관심 유전자의 발현은 본 발명의 재조합 세포, 특히 본 발명의 재조합 효모 세포, 특히 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 에서 기능적인 적절한 전사 터이네이터 서열을 포함한다.
동일하거나 상이한 상기 전사 터미네이터는 문헌 [Yamanishi et al., (2013) ACS synthetic biology 2, 337-347] 에서 발견될 있다.
본 발명에서 보다 특히 관심 대상인 터미네이터는 하기를 포함하는 군에서 선택될 수 있다:
ㆍ 트리오스 포스페이트 이소머라아제를 코딩하는 유전자로부터의 tTPI1 (SEQ ID NO: 111),
ㆍ O-아세틸 호모세린-O-아세틸 세린 술프히드릴라아제를 코딩하는 유전자로부터의 tMET25 (SEQ ID NO: 112),
ㆍ tDIT1 (SEQ ID NO: 113),
ㆍ tRPL3 (SEQ ID NO: 114),
ㆍ tRPL3.sm (SEQ ID NO: 115),
ㆍ tRPL3.sba (SEQ ID NO: 116),
ㆍ tRPL41B (SEQ ID NO: 117),
ㆍ tRPL41B.Sba (SEQ ID NO: 118)
ㆍ tRPL15A (SEQ ID NO: 119),
ㆍ tRPL15A.Sm (SEQ ID NO: 120),
ㆍ tRPL15A.sba (SEQ ID NO: 121),
ㆍ tIDP1 (SEQ ID NO: 122),
ㆍ tIDP1.Sba (SEQ ID NO: 123), 및
ㆍ tTEF1.sba (SEQ ID NO: 124).
본 발명에서 보다 특히 관심 대상인 터미네이터는 하기로 이루어진 군에서 선택될 수 있다:
ㆍ 트리오스 포스페이트 이소머라아제를 코딩하는 유전자로부터의 tTPI1 (SEQ ID NO: 111),
ㆍ O-아세틸 호모세린-O-아세틸 세린 술프히드릴라아제를 코딩하는 유전자로부터의 tMET25 (SEQ ID NO: 112)
ㆍ tDIT1 (SEQ ID NO: 113)
ㆍ tRPL3 (SEQ ID NO: 114)
ㆍ tRPL3.Sm (SEQ ID NO: 115)
ㆍ tRPL3.sba (SEQ ID NO: 116)
ㆍ tRPL41B (SEQ ID NO: 117)
ㆍ tRPL41B.Sba (SEQ ID NO: 118)
ㆍ tRPL15A (SEQ ID NO: 119)
ㆍ tRPL15A.Sm (SEQ ID NO: 120)
ㆍ tIDP1 (SEQ ID NO: 122)
ㆍ tIDP1.Sba (SEQ ID NO: 123), 및
ㆍ tTEF1.sba (SEQ ID NO: 124).
특히, 상기 터미네이터는 tTPI1, tDIT11, tRPL3, tRPL3.Sm, tRPL41B, tRPL41B.Sba, tRPL15A, tRPL15A.Sm, tIDP1, tIDP1.Sba 및 tTEF1.sba 로 이루어지는 군에서 선택될 수 있다.
본 발명의 터미네이터는 사카로마이세스 강으로부터의 임의의 유기체로부터 기원할 수 있고, 특히 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) (sc), 사카로마이세스 미카타에 (Saccharomyces mikatae) (Sm) 및 사카로마이세스 바야누스 (Saccharomyces bayanus) (sba) 로 이루어지는 군에서 선택되는 유기체로부터 기원할 수 있다.
재조합 세포
본 발명의 재조합 세포는 효모 및 박테리아로 이루어지는 군에서 선택될 수 있다.
본 발명의 재조합 숙주 세포와 같은 본 발명의 재조합 세포는 바람직하게는 재조합 효모 세포이다.
일반적으로, 효모는 빠르게 성장할 수 있고, 박테리아와 비교하여 더 높은 밀도로 배양될 수 있으며, 산업적 환경에서 무균 환경을 요구하지 않는다. 또한, 효모 세포는 박테리아 세포와 비교하여 배양 배지로부터 더 쉽게 분리될 수 있어, 생성물 추출 및 정제 과정을 크게 단순화시킬 수 있다.
본 발명의 재조합 세포, 특히 본 발명의 효모 세포는 바람직하게는 사카로마이세탈레스 (Saccharomycetales) 세포이다.
본 발명의 재조합 세포, 및 특히 본 발명의 재조합 효모는 특히 사카로마이세스 (Saccharomyces) 속, 또는 칸디다 (Candida) 속, 또는 클루이베로마이세스 (Kluyveromyces) 속, 또는 오가타에아 (Ogataea)속, 또는 야로위아 (Yarrowia) 속, 또는 데바리오마이세스 (Debaryomyces) 속, 또는 아쉬비아 (Ashbya) 속에 속할 수 있다.
사카로마이세스 속에 속하는 본 발명의 재조합 세포는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae), 사카로마이세스 보울라르디이 (Saccharomyces boulardii), 사카로마이세스 바야누스 (Saccharomyces bayanus), 사카로마이세스 파라독수스 (Saccharomyces paradoxus), 사카로마이세스 미카타에 (Saccharomyces mikatae), 사카로마이세스 카스텔리 (Saccharomyces castelli), 사카로마이세스 카리오카누스 (Saccharomyces cariocanus), 사카로마이세스 쿠드리아브제비이 (Saccharomyces kudriavzevii), 사카로마이세스 아르보리콜루스 (Saccharomyces arboricolus), 사카로마이세스 파스토리아누스 (Saccharomyces pastorianus), 사카로마이세스 우바룸 (Saccharomyces uvarum) 및 사카로마이세스 델브루엑키이 (Saccharomyces delbrueckii) 로 이루어지는 군에서 선택될 수 있다.
칸디다 속에 속하는 본 발명의 재조합 세포는 칸디다 알비칸스 (Candida albicans), 칸디다 글라브라타 (Candida glabrata), 칸디다 트로피칼리스 (Candida tropicalis), 칸디다 두블리니엔시스 (Candida dubliniensis), 칸디다 파라프실로시스 (Candida parapsilosis), 칸디다 루시타니에 (Candida lusitaniae) 및 칸디다 길리에르몬디이 (Candida guilliermondii) 로 이루어지는 군에서 선택될 수 있다.
클루이베로마이세스 속에 속하는 본 발명의 재조합 세포는 클루이베로마이세스 락티스 (Kluyveromyces lactis), 클루이베로마이세스 마르시아누스 (Kluyveromyces marxianus), 클루이베로마이세스 폴리스포루스 (Kluyveromyces polysporus), 클루이베로마이세스 테르모톨레렌스 (Kluyveromyces thermotolerens), 클루이베로마이세스 도브잔스키이 (Kluyveromyces dobzhanskii) 및 클루이베로마이세스 위커하미이 (Kluyveromyces wickerhamii) 로 이루어지는 군에서 선택될 수 있다.
오가타에아 속에 속하는 본 발명의 재조합 세포는 오가타에아 폴리모르파 (Ogataea polymorpha), 오가타에아 히스트리아니카 (Ogataea histrianica), 오가타에아 데아키이 (Ogataea deakii), 오가타에아 콜롬바넨시스 (Ogataea kolombanensis), 오가타에아 필로덴드라 (Ogataea philodendra), 오가타에아 시아멘시스 (Ogataea siamensis), 오가타에아 안구스타 (Ogataea angusta), 오가타에아 파라폴리모르파 (Ogataea parapolymorpha), 오가타에아 미누타 (Ogataea minuta), 오가타에아 논페르멘탄스 (Ogataea nonfermentans) 및 오가타에아 코다마에 (Ogataea kodamae) 로 이루어지는 군에서 선택될 수 있다.
야로위아 속에 속하는 본 발명의 재조합 세포는 야로위아 리폴리티카 (Yarrowia lypolytica), 야로위아 파로포니이 (Yarrowia parophonii), 야로위아 갈리 (Yarrowia galli), 야로위아 오슬로넨시스 (Yarrowia oslonensis), 야로위아 알리멘타리아 (Yarrowia alimentaria), 야로위아 홀란디카 (Yarrowia hollandica) 및 야로위아 야쿠시멘시스 (Yarrowia yakushimensis) 로 이루어지는 군에서 선택될 수 있다.
데바리오마이세스 속에 속하는 본 발명의 재조합 세포는 데바리오마이세스 한세니이 (Debaryomyces hansenii), 데바리오마이세스 카르소니이 (Debaryomyces carsonii), 데바리오마이세스 카스텔리이 (Debaryomyces castellii), 데바리오마이세스 마라마 (Debaryomyces marama), 데바리오마이세스 옥시덴탈리스 (Debaryomyces occidentalis), 데바리오마이세스 오비포르미스 (Debaryomyces oviformis), 데바리오마이세스 네팔렌시스 (Debaryomyces nepalensis), 데바리오마이세스 쿠데르티이 (Debaryomyces coudertii), 데바리오마이세스 우데니이 (Debaryomyces udenii), 데바리오마이세스 사이크로스포루스 (Debaryomyces psychrosporus) 및 데바리오마이세스 야마다에 (Debaryomyces yamadae) 로 이루어지는 군에서 선택될 수 있다.
아쉬비아 속에 속하는 본 발명의 재조합 세포는 아쉬비아 고시피이 (Ashbya gossypii) 및 아쉬비아 아세리 (Ashbya aceri) 로 이루어지는 군에서 선택될 수 있다.
본 발명의 재조합 세포, 특히 본 발명의 재조합 효모 세포는, 특히 사카로마이세스 세레비지에 (Saccharomyces cerevisiae), 사카로마이세스 보울라르디이 (Saccharomyces boulardii), 사카로마이세스 바야누스 (Saccharomyces bayanus), 사카로마이세스 파라독수스 (Saccharomyces paradoxus), 사카로마이세스 미카타에 (Saccharomyces mikatae), 사카로마이세스 카스텔리 (Saccharomyces castelli), 칸디다 알비칸스 (Candida albicans), 칸디다 글라브라타 (Candida glabrata), 칸디다 트로피칼리스 (Candida tropicalis), 클루이베로마이세스 락티스 (Kluyveromyces lactis), 클루이베로마이세스 마르시아누스 (Kluyveromyces marxianus), 클루이베로마이세스 폴리스포루스 (Kluyveromyces polysporus) , 클루이베로마이세스 테르모톨레렌스 (Kluyveromyces thermotolerens), 오가타에아 폴리모르파 (Ogataea polymorpha), 야로위아 리폴리티카 (Yarrowia lypolytica), 데바리오마이세스 한세니이 (Debaryomyces hansenii) 및 아쉬비아 고시피이 (Ashbya gossypii) 로 이루어지는 군에서 선택될 수 있고, 바람직하게는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 이다.
특정 구현예에서, 본 발명에 따른 재조합 효모 세포는 사카로마이세스, 클루이베로마이세스 또는 에레모테시움 (Eremothecium) 속의 것이고, 보다 특히 사카로마이세스 세레비지에 (Saccharomyces cerevisiae), 클루이베로마이세스 마르시아누스 (Kluyveromyces marxianus), 오가타에아 폴리모르파 (Ogataea polymorpha) 및 아쉬비아 고시피이 (Ashbya gossypii) 로 이루어지는 군에서 선택되는 종의 것이다..
한 구현예에서, 본 발명의 재조합 숙주 세포는 사카로마이세탈레스 목, 특히 사카로마이세타세아에 과 (Saccharomycetaceae family) 에 속하고, 특히 야로위아 리포리티카 (Yarrowia lipolitica), 클루이베로마이세스 마르시아누스 (Kluyveromyces marxianus), 오가타에아 폴리모르파 (Ogataea polymorpha), 아쉬비아 고시피이 (Ashbya gossypii) 및 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로 이루어지는 군에서 선택되는 효모이다.
본 발명의 재조합 세포는 가장 바람직하게는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 세포일 수 있다.
상기 언급된 바와 같이, 본 발명에 따른 재조합 세포는 본 발명에 따른 하나 이상의 재조합 핵산의 삽입에 의해 콘드로이틴을 생산하는 능력을 갖는다. 특정 구체예에서, 본 발명에 따른 재조합 효모는 본 발명에 따른 하나 이상의 재조합 핵산의 삽입에 의해 제어된 크기 (제어된 분자량) 를 갖는 콘드로이틴을 생산하는 능력을 갖는다.
유전자 내에 특정 DNA 구축물을 삽입하기 위해 실행되는 방법은 당업자의 일반적인 지식에 속한다. 관련 방법은 이하 예에서 더 상세히 기재된다.
그러나, 예를 들어 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 의 게놈에서 세포의 게놈 내에, 특히 효모의 게놈 내에 DNA 구축물의 삽입의 결과가 예측할 수 없기 때문에, 예상치 못한 기술적 어려움에 직면하였다. 특히, 세포, 특히 효모의 생존율, 및 원하는 콘드로이틴을 성장시키고 생산하는 이들의 능력도 예측할 수 없다.
본 발명의 재조합 세포, 특히 재조합 효모를 수득하기 위해서, 많은 상이한 구축물을 생존가능하고 효율적인 재조합 세포, 특히 효모를 수득하기 위해 본 발명자들에 의해 시험하였다.
배양 조건
본 발명은 또한 콘드로이틴, 특히 제어된 분자량의 콘드로이틴의 생산을 위한 본 발명의 재조합 세포의 용도에 관한 것이다.
본 발명은 또한 하기 단계를 포함하는, 원하는 분자량의 콘드로이틴을 생산하는 방법에 관한 것이다:
(a) 본원에서 정의된 바와 같은 재조합 세포를 원하는 분자량의 콘드로이틴을 생산하기에 충분한 시간 동안 배양 배지에서 배양하는 단계; 및
(b) 임의로는 재조합 세포 및/또는 배양 배지로부터 콘드로이틴을 단리하거나 회수하는 단계. 전형적으로, 본 발명의 세포, 특히 본 발명의 효모는 적절한 배양 배지에서 약 20℃ 내지 약 37℃ 범위의 온도, 바람직하게는 27℃ 내지 34℃ 범위의 온도에서 성장한다.
본 발명의 세포, 특히 본 발명의 효모를 위한 적합한 성장 배지는 효모 질소 베이스 (base), 암모늄 술페이트 및 덱스트로오스를 탄소/에너지 공급원으로서 포함하는 브로쓰 또는 YPD 배지, 가장 잘 성장시키기 위한 최적 비율로의 펩톤, 효모 추출물 및 덱스트로오스의 배합물과 같은 통상적인 상업적으로 제조된 배지이다. 다른 정의된 또는 합성 성장 배지가 또한 사용될 수 있고, 특정 세포, 특히 효모의 성장을 위한 적절한 배지는 미생물학 또는 발효 과학의 당업자에 의해 알려질 것이다.
본원에서 적합한 특정 배지는 하기 요소를 포함하는 SY 배지이다:
KH2PO4: 100 mM; MgSO4 7H2O: 2,8 mM; K2SO4: 11,5 mM; Na2SO4: 1,1 mM; NaCl: 2,6 mM; CaCl2 2H2O: 0,7 mM; CuSO4 5H2O: 15 μM; KI: 6 μM; FeCl3: 30 μM; ZnSO4 7H2O: 61 μM; MnSO4 H2O: 25 μM; H2SO4: 110 μΜ; 판토텐산 헤미칼슘 염: 42 μΜ; 티아민 히드로클로라이드: 59 μΜ; 피리독신 히드로클로라이드: 49 μΜ ; 마이오-이노시톨 (C6H12O6): 555 μΜ ; 니코틴산 (C6H5NO2): 29 μM ; D-비오틴: 0,82 μΜ; 암모늄 시트레이트 3염기: 33 mM; 및 글루코오스 또는 수크로오스 2-30%.
배양 배지에서 사용될 수 있는 탄소원은 프룩토오스, 만노오스, 자일로오스 및 아라비노오스; 올리고당류 예컨대 락토오스, 말토오스, 갈락토오스 또는 수크로오스; 다당류 예컨대 전분 또는 셀룰로오스 또는 이의 혼합물; 및 치즈 유청 투과액 옥수수 침지액, 사탕무 당밀 및 보리 맥아와 같은 재생가능한 공급원료로부터의 비정제된 혼합물을 포함한다.
배양 배지에 포함될 수 있는 질소원은 펩톤, 효모 추출물, 고기 추출물, 맥아 추출물, 우레아, 암모늄 술페이트, 암모늄 클로라이드, 암모늄 니트레이트, 암모늄 포스페이트, 암모늄 시트레이트 및 이의 조합을 포함한다.
배양 배지는 미량 원소 (예를 들어, 금속 염), 예를 들어 마그네슘 염, 코발트 염 및/또는 망간 염; 뿐만 아니라 아미노산, 비타민, 성장 촉진제 등과 같은 성장 인자를 추가로 포함할 수 있다.
포함될 수 있는 비타민의 예는 판토텐산 헤미칼슘, 티아민 히드로클로라이드; 피리독신 히드로클로라이드; Myo-이노시톨; 니코틴산; D-바이오틴, 엽산, p-아미노벤조산, 리보플라빈이다.
본 발명의 배양 배지는 CuSO4ㆍ5H2O, KI, FeCl3, ZnSO4ㆍ7H2O, MnSO4ㆍH2O, 또는 H2SO4, MgCl2, CaCl2, NaCl, K2HPO4, KH2PO4, ZnCl, H3BO3, MnSO4, Na2MoO4 와 같은 희귀 요소를 추가로 포함할 수 있다.
용어 "적절한 배양 배지" 는 상기 정의되어 있다.
본 발명에 따른 재조합 세포에 대한 공지된 배양 배지의 예는 당업자에게 공지되어 있으며, 다음의 출판물 [D. Burke et al., Methods in yeast Genetics - A cold spring harbor laboratory course Manual (2000)] 에 제시되어 있다.
발효에 적합한 pH 범위는 pH 3.0 과 pH 7.5 사이일 수 있으며, 여기서 초기 조건으로서 pH 4 내지 pH 6 이 바람직하다.
본 명세서의 다른 곳에서 언급된 바와 같이, 배양 배지의 pH 값은 콘드로이틴 활성을 갖는 폴리펩티드의 활성을 조절하기 위해 본 발명의 방법의 배양 단계 동안 조절될 수 있으며 이는 본 발명의 재조합 세포에 의해, 특히 본 발명의 재조합 효모에 의해 생산된 콘드로이틴 분자의 분자량에 영향을 미칠 것이다.
특히, 배양 배지의 pH 는 재조합 효모에 의해 생산되는 것으로 의도되는 콘드로이틴에 따라 변형될 수 있다. 예를 들어, 배양 배지의 pH 는 배양 시간 동안 pH 4, 5,5 또는 6 에서 유지될 수 있다.
특정 구현예에서, 배양 배지의 pH 는 본 발명의 재조합 세포, 특히 본 발명의 재조합 효모의 배양의 시간 길이 동안 변화할 수 있거나 변화될 수 있다. 이전에 언급한 바와 같이, 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 는 그것이 배양되는 배지를 산성화시키고, 따라서 그의 배양 배지의 pH 를 감소시킨다. 예를 들어, 배양 배지의 pH 는 6 에서 시작할 수 있고, 4 로 내려간 다음 6 으로 되돌아올 수 있다. 또 다른 예에서, 배양 배지의 pH 는 6 에서 시작하여 6 에서 남아 있거나 유지된 다음 4 로 낮아질 수 있다.
특정 구현예에서, 배양 배지의 pH 는 본 발명의 방법의 배양 단계 (a) 동안 조절될 수 있어서, 본 발명의 방법의 배양 단계의 말미에, 배양 배지의 pH 는 상기 배양 단계 (a) 의 시작시 pH 와 동일하다.
또 다른 구현예에서, 배양 배지의 pH 는 본 발명의 재조합 세포, 특히 본 발명의 재조합 효모 세포의 배양의 시간 길이 동안 동일하게 유지될 수 있다.
본 발명에 따른 재조합 세포, 특히 본 발명의 재조합 효모의 상기 배양의 시간 길이는 관심 콘드로이틴의 분자량에 따라 달라질 수 있다. 상기 시간 길이가 길수록, 본 발명의 재조합 세포, 특히 본 발명의 재조합 효모 세포의 주어진 배양 배지에서 콘드로이틴의 분자량이 감소된다.
본 발명의 재조합 세포, 특히 본 발명의 재조합 효모의 배양 시간의 시간 길이는 약 35 시간 내지 약 50 시간, 바람직하게는 약 40 시간 내지 약 50 시간, 특히 약 48 시간의 기간일 수 있다.
발효는 호기성 조건 또는 미세호기성 조건 하에 수행될 수 있다.
발효 배지 중 콘드로이틴 생성물의 양은 당업계에 공지된 다수의 방법, 예를 들어 고성능 액체 크로마토그래피 (HPLC) 또는 기체 크로마토그래피 (GC) 를 사용하여 결정될 수 있다.
본 공정은 발효의 회분식 방법을 이용할 수 있다. 고전적인 회분식 발효는 배지의 조성이 발효의 초기에 설정되고 발효 동안 인위적으로 변경되지 않는 폐쇄된 시스템이다. 따라서, 발효의 초기에, 배지에 원하는 유기체 또는 유기체들을 접종하고, 시스템에 아무것도 첨가하지 않고 발효가 일어나도록 허용한다. 그러나 전형적으로, "회분식 (batch)" 발효 방법 또는 시스템은 탄소원의 첨가와 관련되는 회분이며 온도, pH 및 산소 농도와 같은 제어 인자에서 종종 시도된다. 회분식 시스템에서, 시스템의 대사물질 및 바이오매스 조성은 발효가 중지될 때까지 일정하게 변화된다. 회분식 배양물 내에서 세포는 정적 지연 단계 (static lag phase) 를 통해 고성장 로그 단계로, 그리고 마지막으로 성장 속도가 감소되거나 정지되는 정지 단계로 진행된다. 치료하지 않는 경우, 정지 단계에서의 세포는 결국 죽게 된다. 로그 단계에서의 세포는 일반적으로 최종 생성물 또는 중간체의 대량 생산을 담당한다.
본 발명에서는 유가식 (Fed-Batch) 시스템을 또한 사용할 수 있다. 유가식 시스템은 발효가 진행됨에 따라 탄소원 기질이 증분으로 첨가되는 것을 제외하고는 전형적인 회분식 시스템과 유사하다. 유가식 시스템은 이화생성물 억제 (예를 들어, 글루코오스 억제) 가 세포의 대사를 억제하기 쉽고 배지 내에 제한된 양의 기질을 갖는 것이 바람직한 경우에 유용하다. 유가식 시스템에서의 실제 기질 농도의 측정은 어렵고, 따라서 pH, 용존 산소 및 폐가스 예컨대 CO2 의 분압과 같은 측정가능한 인자의 변화를 기반으로 추정된다.
회분식 및 유가식 배양 방법은 통상적이고 당업계에 잘 알려져 있으며, 예는 Biotechnology: A Textbook of Industrial Microbiology, Crueger, Crueger, and Brock, Second Edition (1989) Sinauer Associates, Inc., Sunderland, MA, 또는 Deshpande, Mukund V., Appl. Biochem. Biotechnol., 36, 227, (1992) 에서 발견될 수 있다. 본 발명은 회분식 모드로 수행되지만, 방법은 연속 발효에 적합할 것으로 예상된다.
연속 발효는 정의된 발효 배지가 생물반응기에 연속적으로 첨가되고 동일한 양의 조건화된 배지가 처리를 위해 동시에 제거되는 개방 시스템이다. 연속 발효는 일반적으로 세포가 주로 로그 단계 성장에 있는 일정한 높은 밀도로 배양을 유지한다.
연속 발효는 세포 성장 또는 최종 생성물 농도에 영향을 미치는 하나의 인자 또는 임의의 수의 인자의 조절을 허용한다. 예를 들어, 하나의 방법은 탄소원 또는 질소 수준과 같은 제한 영양소를 고정된 비율로 유지하고 모든 다른 매개변수가 변화되도록 할 것이다. 다른 시스템에서, 배지 혼탁도에 의해 측정되는 세포 농도가 일정하게 유지되면서, 성장에 영향을 미치는 다수의 인자가 연속적으로 변경될 수 있다. 연속 시스템은 정상 상태 (steady state) 성장 조건을 유지하고자 분투하며, 따라서 배지가 배출되는 것으로 인한 세포 손실은 발효에서의 세포 성장 속도에 대해 균형을 이루어야 한다. 생성물 형성 속도를 최대화하기 위한 기법 뿐만 아니라 연속적인 발효 공정을 위한 영양소 및 성장 인자를 조절하는 방법은 산업 미생물학 분야에 잘 알려져 있다.
본 발명이 회분식, 유가식 또는 연속 공정을 사용하여 실시될 수 있으며 임의의 공지된 발효 모드가 적합할 것으로 고려된다. 추가적으로, 세포가 전체 세포 촉매로서 기질 상에 고정될 수 있으며 생산을 위한 발효 조건에 적용될 수 있는 것으로 고려된다.
콘드로이틴 생산을 여전히 개선하기 위해서, 특정 구현예는 상기 언급된 바와 같은 적절한 배지에서 본 발명의 재조합 세포, 특히 본 발명의 재조합 효모 세포를 배양하는 것으로 이루어질 수 있으며, 여기서 상기 배양 배지는 최적의 양의 탄소원, 특히 글루코오스 또는 수크로오스를 포함한다.
바람직한 구현예에서, 상기 최적 배양 배지에 포함된 탄소원은 글루코오스 및/또는 수크로오스로 이루어진다. 바람직한 구현예에서, 상기 최적 배양 배지는 1% w/w 이상의 글루코오스 및/또는 수크로오스를 포함하고, 특히 5% w/w 이상의 글루코오스 및/또는 수크로오스를 포함하고, 특히 10% w/w 이상의 글루코오스 및/또는 수크로오스를 포함하고, 특히 15% w/w 이상의 글루코오스 및/또는 수크로오스를 포함한다. 바람직한 구현예에서, 상기 최적 배양 배지는 최대 40% w/w 글루코오스를 포함하며, 이는 최대 35% w/w 글루코오스를 포함한다.
바람직한 구현예에서, 본 발명의 방법은 산업적 규모로 실행된다.
보다 특히, 본 발명에 따른 방법의 배양 배지는 적어도 약 100L, 더욱 바람직하게는 약 1,000L 내지 약 3,000L 범위, 더욱 더 바람직하게는 약 10,000L, 더욱 더 바람직하게는 100,000L, 또는 심지어 약 250,000L 일 수 있다.
본 발명은 또한 이전에 기재된 바와 같은 콘드로이틴을 생산하는 방법에 관한 것이며, 하기 단계를 포함한다:
(a) 본 발명의 재조합 세포를 배양 배지에서 배양하는 단계; 및
(b) 상기 배양 배지로부터 콘드로이틴을 회수하는 단계,
여기서, 단계 (b) 에서 회수된 콘드로이틴은 하기의 선택을 통해 제어된 분자량을 갖는다:
-
본 발명의 재조합 세포, 특히 본 발명의 재조합 효모의 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산의 성질 및 기원,
-
본 발명의 재조합 세포, 특히 본 발명의 재조합 효모의 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산의 발현을 제어하는 프로모터의 성질 및 기원,
-
본 발명의 재조합 세포, 특히 본 발명의 재조합 효모의 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산과 연관된 고정 신호의 존재 또는 부재,
-
본 발명의 재조합 세포, 특히 본 발명의 재조합 효모를 배양하는 단계 동안 배양 배지의 pH, 및/또는
-
본 발명의 재조합 세포, 특히 본 발명의 재조합 효모의 배양 지속기간.
콘드로이틴의 분자량은 특정 분자량 또는 더욱 바람직하게는 특정 범위의 분자량, 예를 들어, 50 kDa 미만, 약 20 kDa 내지 약 50 kDa 의 범위, 50 kDa 이상, 약 50 kDa 내지 약 150 kDa 의 범위, 약 50 kDa 내지 약 250 kDa 의 범위, 100 kDa 이상, 약 100 kDa 내지 약 1500 kDa 의 범위, 약 150 kDa 내지 약 1500 kDa 의 범위, 1000 kDa 초과 또는 1500 kDa 초과일 수 있다.
본 발명은 또한 약 20 kDa 내지 약 50 kDa 또는 약 50 kDa 내지 약 1000 kDa 범위의 분자량을 갖는 콘드로이틴의 생산을 위한 본 발명에 따른 재조합 세포, 특히 본 발명의 재조합 효모의 용도에 관한 것이다.
본 발명의 재조합 세포의 콘드로이티나제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은, 예를 들어, 큐피엔니우스 살레이 (Cupiennius salei), 티티우스 세르룰라투스 (Tityus serrulatus), 보스 타우루스 (Bos taurus),
아피스 멜리페라 (Apis mellifera), 마카카 물라타 (Macaca mulata), 또는 베스파 마그니피카 (Vespa magnifica) 중 적어도 하나로부터, 특히 이들의 분비될 때 (즉, 분비 신호의 존재 및 고정 신호의 부재 하에서) 서열 SEQ ID NO: 48 (Csa), SEQ ID NO: 49 (Ts), SEQ ID NO: 50 (Bt), SEQ ID NO: 51 (Am), SEQ ID NO: 52 (Mm) 또는 SEQ ID NO: 53 (Vm) 에 기재된 서열의 것으로부터 수득되거나 유래된 것으로부터 선택될 수 있다.
본 발명의 재조합 세포의 콘드로이티나제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은, 예를 들어, 큐피엔니우스 살레이 (Cupiennius salei), 티티우스 세르룰라투스 (Tityus serrulatus), 보스 타우루스 (Bos taurus),
아피스 멜리페라 (Apis mellifera), 마카카 물라타 (Macaca mulata), 또는 베스파 마그니피카 (Vespa magnifica) 중 적어도 하나로부터, 특히 이들의 고정될 때 (즉, 분비 신호 및 고정 신호 모두의 존재 하에서) 서열 SEQ ID NO: 54 (Csa), SEQ ID NO: 55 (Ts), SEQ ID NO: 56 (Bt), SEQ ID NO: 57 (Am), SEQ ID NO: 58 (Mm) 또는 SEQ ID NO: 59 (Vm) 에 기재된 서열의 것으로부터 수득되거나 유래된 것으로부터 선택될 수 있다.
본 발명의 재조합 세포의 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 예를 들어 pTDH3, pTDH3.Sk, pTDH3-1.Sba, pTEF1, pTEF1.Ago, pTEF1.sba, pCCW12, pCCW12.Sba, pCCW120.Sm, pCWP2, pCW10.Ago, pNUP57 및 pFBA1 로 이루어진 군으로부터, 특히 pCCW12.Sba, pCW10.Ago 및 pNUP57 로 이루어진 군으로부터 선택되는 프로모터의 제어 하에 놓일 수 있다.
특히, 본 발명의 재조합 세포, 특히 본 발명의 재조합 효모의 콘드로이티나아제 활성을 갖는 폴리펩티드를 인코딩하는 하나 이상의 재조합 핵산의 프로모터는
사카로마이세스 바야누스 (Saccharomyces bayanus), 사카로마이세스 쿠드리아브제비이 (Saccharomyces kudriavzevii), 사카로마이세스 미카타에 (Saccharomyces mikatae), 사카로마이세스 아르보리콜라 (Saccharomyces arboricola) 또는 다른 사카로마이세트목 (saccharomycetales), 또는 아쉬비아 고시피이 (Ashbya gossypii) 로부터 수득되거나 유래될 수 있다.
본 발명의 분비 신호는 예를 들어 하기를 가질 수 있다:
- SEQ ID NO: 125 에 나타낸 핵산 서열; 및/또는
- SEQ ID NO: 126 에 기재된 아미노산 서열.
본 발명의 고정 신호는 예를 들어 하기를 가질 수 있다:
- SEQ ID NO: 127 에 나타낸 핵산 서열; 및/또는
- SEQ ID NO: 128 에 나타낸 아미노산 서열.
분비 신호는 신호 펩티드를 코딩하는 핵산 서열에 의해 출발하는 키메라 핵산, 이후 이전에 정의된 바와 같은 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산을 생성함으로써 콘드로이티나아제 활성을 갖는 폴리펩티드에 융합될 수 있다.
분비 신호 및 고정 신호는 신호 펩티드를 코딩하는 핵산 서열에 의해 출발하는 키메라 핵산, 이후 이전에 정의된 바와 같은 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산, 이후 고정 신호를 코딩하는 핵산 서열을 생성함으로써 콘드로이티나아제 활성을 갖는 폴리펩티드에 융합될 수 있다.
이러한 키메라 핵산 서열은 당업자에 의해 공지된 기법 예컨대 핵산의 화학적 합성 또는 임의의 재조합 기법 예컨대 클로닝 또는 PCR 에 의해 수득될 수 있다.
본 발명은 또한 약 10 kDa 미만의 분자량을 갖는 콘드로이틴을 생산하기 위한, 앞서 기재된 바와 같은 방법에 관한 것이며, 여기서:
(a) 배지의 pH 는 4 보다 높고, 특히 약 5 내지 약 7 의 범위이다;
(b) 본 발명의 재조합 세포의 게놈에 통합된 콘드로티나아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 티티우스 세르룰라투스 (Tityus serrulatus) 로부터 기원하거나 유래되고, 분비 신호를 보유하지만 고정 신호가 없고, pCCW12.sba 프로모터의 제어 하에 있다;
(c) 콘드로이티나아제 활성을 갖는 폴리펩티드는 히알루로니다아제이다;
(d) 배양 배지로부터 콘드로이틴을 회수하는 단계는 본 발명의 재조합 세포, 특히 본 발명의 재조합 효모 세포의 배양을 시작한 후 약 48 시간에 수행된다;
재조합 세포는 특히 재조합 효모 세포, 보다 특히 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 세포임.
본 발명은 또한 약 10 kDa 내지 약 50 kDa 의 분자량을 갖는 콘드로이틴을 생산하기 위한, 앞서 기재된 바와 같은 방법에 관한 것이며, 여기서:
(a) 배지의 pH 는 4 보다 높고, 특히 약 5 내지 약 7 의 범위이다;
(b) 본 발명의 재조합 세포의 게놈에 통합된 콘드로티나아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 티티우스 세르룰라투스 (Tityus serrulatus) 로부터 기원하거나 유래되고, 분비 신호를 보유하지만 고정 신호가 없고, pCCW10.Ago 프로모터의 제어 하에 있다;
(c) 콘드로이티나아제 활성을 갖는 폴리펩티드는 히알루로니다아제이다;
(d) 배양 배지로부터 콘드로이틴을 회수하는 단계는 본 발명의 재조합 세포, 특히 본 발명의 재조합 효모 세포의 배양을 시작한 후 약 48 시간에 수행된다;
재조합 세포는 특히 재조합 효모 세포, 보다 특히 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 세포임.
본 발명은 또한 약 50 kDa 내지 약 500 kDa 의 분자량을 갖는 콘드로이틴을 생산하기 위한, 앞서 기재된 바와 같은 방법에 관한 것이며, 여기서:
(a) 배지의 pH 는 4 보다 높고, 특히 약 5 내지 약 7 의 범위이다;
(b) 본 발명의 재조합 세포의 게놈에 통합된 콘드로티나아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 티티우스 세르룰라투스 (Tityus serrulatus) 로부터 기원하거나 유래되고, 분비 신호를 보유하지만 고정 신호가 없고, pNUP57 프로모터의 제어 하에 있다;
(c) 콘드로이티나아제 활성을 갖는 폴리펩티드는 히알루로니다아제이다;
(d) 배양 배지로부터 콘드로이틴을 회수하는 단계는 본 발명의 재조합 세포, 특히 본 발명의 재조합 효모 세포의 배양을 시작한 후 약 48 시간에 수행된다;
재조합 세포는 특히 재조합 효모 세포, 보다 특히 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 세포임.
본 발명의 또 다른 양상은 본 발명의 재조합 세포 또는 본 발명에 따른 방법으로부터 수득하거나 수득할 수 있는 콘드로이틴에 관한 것이다.
본 발명의 추가 양상은 본 발명의 콘드로이틴을 포함하는 배양 배지이다.
본 발명은 또한 본 발명에 따른 콘드로이틴을 포함하는 조성물에 관한 것이다.
본 발명은 또한 (i) 본 발명의 콘드로이틴, (ii) 본 발명의 콘드로이틴을 포함하는 배양 배지 또는 (iii) 본 발명의 콘드로이틴을 포함하는 조성물을 포함하는 공산품 또는 소비재 또는 소모품에 관한 것이다.
특시, 본 발명에 따른 상기 공산품 또는 소비재 또는 소모품은 화장품, 향미 제품, 향료 제품, 식료품, 식품, 음료, 식감제, 약학 조성물, 식이 보충제, 기능식품, 세정 제품 및/또는 치아 및/또는 구강 위생 조성물일 수 있다.
콘드로이틴의 정제
본 발명의 특정 양상에 따르면, 콘드로이틴의 발효 생산은 바람직하게는 배양 배지로부터 생성된 콘드로이틴을 단리하는 단계를 포함한다. 배양 배지로부터 콘드로이틴을 회수하는 것은 당업자에게 일상적인 작업이다. 이는 투과증발, 선택적 침전, 여과, 원심분리, 분무 건조, 동결건조 또는 액체 추출을 포함하지만 이에 제한되지 않는 당업계에 잘 알려진 다수의 기법에 의해 달성될 수 있다. 당해 분야의 전문가는 분리하고자 하는 재료의 특징에 따라 각 기법의 매개변수를 조정하는 방법을 알고 있다.
본 발명에서 세포 모델로서의 효모는 합성된 콘드로이틴이 세포 외부로 모두 배출되어 정제 공정을 단순화시킨다는 점에서 바람직하다.
가스 스트리핑은 헬륨, 아르곤, 카본 디옥시드, 수소, 질소 또는 이의 혼합물 중에서 선택되는 스트리핑 가스로 달성된다.
액체 추출은 펜탄, 헥산, 헵탄 또는 도데칸과 같은 소수성 상으로서의 유기 용매로 달성된다. 재생 용매가 또한 사용될 수 있다.
제형 및 생성물
본 발명의 조성물은 제형/생성물, 예컨대 기능식품, 약학, 수의학, 양조학 또는 화장 제형/생성물에 포함될 수 있다.
따라서, 본 발명은 본 발명의 조성물을 포함하는 제형을 제공한다. 예를 들어, 본 발명은 본 발명의 조성물을 포함하는 화장 제형을 제공할 수 있다.
본 발명은 또한 본 발명의 조성물을 포함하는 생성물을 제공한다. 예를 들어, 본 발명은 본 발명의 조성물을 포함하는 화장품을 제공할 수 있다.
"화장품" 은 인체의 외부 부분 (표피, 모발 시스템, 손톱, 입술 및 외부 생식 기관) 또는 치아와 구강의 점막과 접촉하게 배치되도록 의도된 임의의 물질 또는 혼합물을 의미하는 것으로 의도되는데, 이는 이들을 단독으로 또는 주로 세정하고, 이들을 훈습하고, 이들의 외관을 변경하고, 이들을 보호하고, 이들을 양호한 상태로 유지하고, 체취를 교정하고/하거나 이의 조합을 위한 것이다.
"물질" 은 그의 안정성을 보존하기 위해 필요한 임의의 첨가제 및 사용된 공정으로부터 유래하는 임의의 불순물을 포함하지만 물질의 안정성에 영향을 주거나 그의 조성을 변화시키지 않으면서 분리될 수 있는 임의의 용매를 제외하여, 자연 상태의 또는 임의의 제조 공정에 의해 수득된 화학 원소 및 그의 화합물을 의미하는 것으로 의도된다.
"혼합물" 은 둘 이상의 물질로 구성된 혼합물 또는 용액을 의미하는 것으로 의도된다.
본 발명은 또한 기능식품, 약학, 수의학, 양조학 또는 화장 제형/생성물에서의 본 발명의 조성물의 용도를 제공한다.
이러한 제형 또는 생성물은 이하에서 "본 발명의 제형 또는 생성물" 로 지칭된다.
기능식품, 약학, 수의학, 양조학 또는 화장 제형/생성물은 임의로는 약학/수의학/화장 (화장 활성물 포함) 성분, 예컨대 적절한 부형제, 담체 및 이의 혼합물을 추가로 포함할 수 있다.
"화장품" 또는 "화장 활성 성분" 은 개별적으로 또는 화합물, 성분, 중간체, 분자, 물질, 원료 또는 생성물, 배합물, 조성물, 제형 (피부 보습제, 크림, 밤, 세럼, 오일, 눈, 얼굴 화장, 워시 오프 (wash off) 헤어 제품, 리브-온 (leave-on) 헤어 제품, 모발 착색제 (천연 모발 착색제를 포함하나 이에 제한되지 않음) 및/또는 이의 조합을 포함하나 이에 제한되지 않음), 완제품 및 관련 기술 (예를 들어, 화장 제형에 혼입된 성분 (예를 들어, 피부, 모발, 두피 등에 활성을 갖지 않지만 완제품의 제형에서 역할을 하는 천연 착색제, 보존제, 유화제, 산화방지제 등을 포함하지만 이에 제한되지 않음) 을 포함하지만 이에 제한되지 않음), 전달 시스템, 마케팅 보조제 (예를 들어, 반투명한 제형에 적용되는 착색 유니스피어) 및 하기에서 유용하고/하기에서 사용되고/하기에 의도되는 이에 관련된 무엇이든 제조하는 방법과의 혼합의 일부로서의, 임의의 및 모든 자연적, 자연 발생적, 자연 동일, 합성, 합성적으로 제조된, 생합성적으로 제조된, 지속가능, 재생가능 및/또는 생분해성 화합물, 성분, 중간체, 분자, 물질, 원료 또는 생성물을 의미한다:
- 사람 또는 동물 신체 상에 또는 이에 문지르거나, 붓거나, 뿌리거나, 분무하거나 다른 방식으로 직접 및/또는 사람 또는 동물 신체의 다양한 외부 및/또는 표면 부분 (피부, 모발, 체모, 모발 시스템, 두피, 손톱, 입술, 외부 생식기, 치아, 구강 및/또는 비강 점막 등을 포함하지만 이에 제한되지 않음) 과 접촉되게 배치함으로써 적용; 및/또는 사람 또는 동물 신체 상에 또는 이에 간접적으로 적용, 예를 들어 직물의 일부로서 적용 또는 직물에 적용된 전달 장치 (예컨대 캡슐) 또는 전달 시스템 (예컨대 배합물 또는 제형) 의 일부로서 직물에 적용; 및/또는
- 사람 또는 동물 신체의 외부 부분 및/또는 표면 (예를 들어 비제한적으로 두피) 또는 인간 또는 동물 신체의 미적 외관을 세정, 관리, 냉각, 미용, 컨디셔닝, 치료, 진정, 텍스처라이징, 매력 증진, 보호, 유지, 개선, 향상, 변경 및/또는 변화시킴; 및/또는 주로 세정 또는 발향, 또는 체취를 양호한 상태로 보호 또는 유지하거나 퇴치하거나, 피부의 진정, 치유, 회복 또는 재활성화, 수화를 제공함으로써 피부, 구강 점막, 두피 또는 모발의 외양을 변화시키거나 이의 불균형 상태를 교정 또는 복구하기 위함, 또는 건조함, 자극, 부상 또는 피로의 상태를 완화하고, 윤활하고, 촉촉하게 하고, 탄력을 주고, 치유하고, 살균하고, 완화하고, 교정 및/또는 치료하기 위해, 및/또는 착색 장애를 교장하거나 비듬, 여드름, 자극 및/또는 염증 등의 비약학적 예방 및/또는 치료를 제공하고/하거나 피부 표면의 세균총 (예를 들어 미생물군집) 의 균형을 재조정하기 위함 (예를 들어, 피부 표면의 유익한 세균총의 수준을 촉진함으로써) 및/또는 건강 및/또는 복지 목적을 위해 인간 또는 동물 신체를 양호한 상태로 유지하기 위한 목적으로 및/또는 예를 들어, 인간 또는 신체에 적용되는 생성물의 외관을 개선함으로써 인간 또는 동물 신체의 외관을 개선하기 위함; 및/또는
- 미용 및/또는 피부과 기능 및/또는 생물학적 활동 이익을 갖는 이익 (그러나 신체의 구조 또는 기능에 영향을 주지 않음) 을 제공. 의심의 여지를 피하기 위해, 화장품 또는 화장 활성 성분 또는 이의 임의의 부분은 또한 기능적 성분 및/또는 기능식품으로서의 자격을 가질 수 있다.
"기능적 성분" 은 의약 또는 건강상 이익을 제공하는 식품 성분 또는 식품의 일부를 의미하며, 카로티노이드, 식이 섬유, 지방산, 사포닌, 산화방지제, 플라보노이드, 이소티오시아네이트, 페놀, 폴리페놀 (예컨대 레스베라트롤), 식물 스테롤 또는 스타놀 (피토스테롤 및 피토스타놀), 폴리올, 프리바이오틱 (prebiotic), 피토에스트로겐, 대두 단백질, 술파이드/티올, 비타민, 글루코사민, 보존제, 수화제, 식용 겔화 성분, 식용 겔 믹스 및 겔 조성물, 장쇄 1차 지방족 포화 알코올, 색상제, 텍스쳐화제, 유화제 및 이의 조합 중 임의의 것을 포함한다.
"기능식품" 은 인체의 외양을 개선하거나 유지할 뿐만 아니라, 건강 및/또는 미용 이익과 관련되는 임의의 그리고 모든 자연적, 자연 발생적, 지속가능, 합성적으로 제조되고 생합성적으로 제조된 화합물, 화합물의 혼합물, 기능적 성분, 분자, 조성물, 원료 및 중간체 (이에 관련된 성분 및 전달 장치 (예컨대 캡슐), 이의 전달 시스템 (예컨대 배합물 또는 제형) 및 전술한 것의 제조 방법 포함) 를 의미한다. 의심의 여지를 피하기 위해, 기능식품은 고체 제형, 캡슐, 정제, 액체 제형, 용액 또는 현탁액이든간에 식품 또는 음료에 대한 보충제로서 사용될 수 있는 화합물을 포함한다.
대안적으로, 기능식품, 약학, 수의학, 양조학 또는 화장 제형/생성물은 본 발명의 조성물로 이루어지거나 본질적으로 이루어질 수 있다.
화장 제형/생성물은 노화방지 제형일 수 있다.
본원에 사용된 바와 같이, 약학적으로, 수의학적으로 또는 미용적으로 허용가능한 부형제에 대한 언급은 당업자에게 공지된 바와 같은 약학적으로, 수의학적으로 또는 미용적으로 허용가능한 보조제, 희석제 및/또는 담체를 지칭할 수 있다.
"약학적/수의학적/미용적으로 허용가능한"은 조성물의 추가 성분이 일반적으로 안전하고, 비-독성이며, 생물학적으로나 달리 바람직하지 않다는 것을 의미한다. 예를 들어, 추가 성분은 일반적으로 무균이며 발열원 (pyrogen) 이 없을 수 있다. 이러한 성분은 본 발명의 조성물과 상용성이며 이의 수용자에게 해롭지 않은 의미에서, "허용가능" 해야 한다. 따라서, "약학적으로 허용가능한 부형제"는 단지 부형제로서 작용하도록 의도된, 즉 생물학적 활성 자체를 갖도록 의도되지 않은 제형의 일부를 형성하는데 사용되는 임의의 화합물(들) 을 포함한다.
기능식품, 약학, 수의학, 양조학 또는 화장 제형/생성물은 액체 또는 고체의 형태일 수 있다.
경구 투여를 위한 액체 투여 제형/제품은 용액, 유액, 수성 또는 유성 현탁액, 시럽 및 엘릭시르 (elixir) 를 포함한다.
경구 투여용으로 의도된 것들과 같은 본원에 기재된 제형 및 생성물 (예를 들어 약학, 수의학 또는 화장 제형/생성물) 은, 예를 들어 제형/생성물의 성분을 함께 혼합하는 것과 같이 당업자에게 공지된 방법에 따라 제조될 수 있다.
제형 또는 생성물 (예를 들어, 약학, 수의학 또는 화장 제형/생성물) 은 하나 이상의 추가 성분, 예컨대 약학 성분 및 부형제, 예컨대 감미제, 향미제, 착색제 및 보존제를 함유할 수 있다.
제형 또는 생성물 (예를 들어, 약학, 수의학 또는 화장 제형/생성물) 은 또한 하나 이상의 추가 활성 성분, 예컨대 화장 또는 약학 활성 성분, 예컨대 히알루론산, 병풀 추출물, 펩티드 예컨대 Matrixyl® 및 Argireline®, 및 이의 혼합물을 함유할 수 있다.
본 발명의 제형 또는 생성물은 활성 성분(들) 을 비독성인 약학적으로 허용가능한 부형제 (또는 성분) 와 혼합하여 함유할 수 있다. 이들 부형제 (또는 성분) 는, 예를 들어, 불활성 희석제, 예컨대 칼슘 카르보네이트, 소듐 카르보네이트, 락토오스, 칼슘 포스페이트 또는 소듐 포스페이트; 과립화제 및 붕괴제, 예를 들어 옥수수 전분, 말토덱스트린 또는 알긴산; 결합제, 예를 들어 전분, 젤라틴 또는 아카시아; 및 윤활제, 예를 들어 마그네슘 스테아레이트, 스테아르산, 탈크 및 이의 혼합물일 수 있다.
액체 제형 또는 생성물 (예를 들어, 약학, 수의학 또는 화장 제형/생성물) 은 캡슐 내에 함유될 수 있으며, 이는 상기 정의된 바와 같이 코팅되지 않거나 코팅될 수 있다.
적합한 약학적 또는 수의학적 담체는 불활성 고체 희석제 또는 충전제, 멸균 수용액 및 다양한 유기 용매를 포함한다. 액체 담체의 예는 시럽, 땅콩 오일, 올리브 오일, 인지질, 지방산, 지방산 아민, 폴리옥시에틸렌 및 물이다.
또한, 담체 또는 희석제는 글리세릴 모노스테아레이트 또는 글리세릴 디스테아레이트와 같은 당업계에 공지된 임의의 지속 방출 물질을 단독으로 또는 왁스와 혼합하여 포함할 수 있다.
적합한 약학적 담체는 불활성 멸균 수용액 및 다양한 유기 용매를 포함한다. 액체 담체의 예는 시럽, 식물성 오일, 인지질, 지방산, 지방산 아민, 폴리옥시에틸렌 및 물이다. 또한, 담체 또는 희석제는 글리세릴 모노스테아레이트 또는 글리세릴 디스테아레이트와 같은 당업계에 공지된 임의의 지속 방출 물질을 단독으로 또는 왁스와 혼합하여 포함할 수 있다.
적합한 화장용 담체는 전형적으로 피부 및/또는 모발 및/또는 두피와 같은 인체의 외부 표면에 국소 투여하기에 적합한 것들이다.
전형적으로, 이러한 담체는 피부과적으로 허용가능하다.
어구 "피부과적으로 허용가능한 담체" 는 담체가 각질 조직에 국소적으로 적용하기에 적합하고, 양호한 미적 특성을 가지고, 조성물 중의 활성물과 상용성이며, 어떠한 불합리한 안전성 또는 독성 우려도 야기하지 않는다는 것을 의미한다.
담체는 매우 다양한 형태일 수 있다. 일부 경우에, 성분 (예를 들어, 추출물, 자외선 차단제 활성물, 추가 성분) 의 용해도 또는 분산성은 담체의 형태 및 특성을 좌우할 수 있다. 비제한적인 예는 단순 용액 (예를 들어, 수성 또는 무수), 분산액, 유액 및 고체 형태 (예를 들어, 겔, 스틱, 유동성 고체 또는 비정질 물질) 를 포함한다.
피부과적으로 허용가능한 담체는 유액의 형태일 수 있다. 유액은 일반적으로 연속 수성상 (예를 들어, 수중유 및 수중유중수) 또는 연속 유상 (예를 들어, 유중수 또는 수중유) 을 갖는 것으로 분류될 수 있다. 본 발명의 유상은 실리콘 오일, 비-실리콘 오일 예컨대 탄화수소 오일, 에스테르, 에테르 등, 및 이의 혼합물을 포함할 수 있다. 수성상은 전형적으로 물 및 수용성 성분 (예를 들어, 수용성 보습제, 컨디셔닝제, 항미생물제, 보습제 및/또는 다른 피부 케어 활성제) 을 포함한다. 그러나 일부 경우에, 수성상은 수용성 보습제, 컨디셔닝제, 항미생물제, 보습제 및/또는 다른 수용성 피부 케어 활성제를 포함하지만 이에 제한되지 않는 물 이외의 성분을 포함할 수 있다. 일부 경우에, 조성물의 물이 아닌 성분은 습윤제, 예컨대 글리세린 및/또는 다른 폴리올(들) 을 포함한다. 유액은 또한 유화제를 함유할 수 있다. 유화제는 비이온성, 음이온성 또는 양이온성일 수 있다.
담체는 하나 이상의 피부과적으로 허용가능한 친수성 희석제를 함유할 수 있다. 본원에서 사용되는 바와 같이, "희석제"는 본 발명의 조성물이 분산, 용해 또는 다르게는 혼입될 수 있는 물질을 포함한다. 친수성 희석제는 물, 유기 친수성 희석제, 예컨대 저급 일가 알코올 (예를 들어, C1-C4), 및 저분자량 글리콜 및 폴리올, 예컨대 프로필렌 글리콜, 폴리에틸렌 글리콜, 폴리프로필렌 글리콜, 글리세롤, 부틸렌 글리콜, 1,2,4-부탄트리올, 소르비톨 에스테르, 1,2,6-헥산트리올, 에탄올, 이소프로판올, 소르비톨 에스테르, 부탄디올, 에테르 프로판올, 에톡실화 에테르, 프로폭실화 에테르 및 이의 조합을 포함한다.
화장 제형/생성물은 임의로는 화장 조성물에 통상적으로 사용되는 하나 이상의 추가 성분 (예를 들어, 착색제, 피부톤 제제, 피부 노화 방지제, 항염증제, 자외선 차단제, 이들의 조합 등) 을 포함할 수 있으며, 단, 추가 성분은 조성물에 의해 제공되는 항-당화 이익을 바람직하지 않게 변경하지 않는다.
일부 경우에, 활성제가 서로 간섭하지 않도록 상이한 생물학적 경로를 통해 기능하는 피부톤 제제를 선택하는 것이 바람직할 수 있으며, 이는 양 제제 모두의 효능을 감소시킬 수 있다. 추가의 성분은, 조성물에 혼입될 때, 과도한 독성, 부적합성, 불안정성, 알레르기 반응 등이 없이 인간 피부 조직과 접촉하여 사용하기에 적합해야 한다.
본원에서 사용되는 용어 "담체"는 또한 천연 생성물, 또는 말토덱스트린과 같이 이것이 유래된 천연 생성물과 구별되도록 변형 또는 개질된 천연물로부터 유래된 생성물을 지칭할 수 있다.
기능식품, 약학, 수의학, 양조학 또는 화장 제형 또는 생성물에 존재하는 본 발명의 조성물의 양은 적용에 따라 가변적일 것이다.
전형적으로, 기능식품, 약학, 수의학, 양조학 또는 화장 제형 또는 제품에 존재할 수 있는 본 발명의 조성물의 양은 기능식품, 약학, 수의학, 양조학 또는 화장 제형 또는 생성물의 약 0.001 내지 약 50 중량%, 예컨대 약 0.01 내지 약 30 중량% 또는 약 1 내지 약 20 중량% , 예컨대 제형 또는 생성물의 약 0.01 내지 약 20 중량%, 또는 약 0.1 내지 10 중량% 또는 약 1 내지 약 5 중량% 일 것이다.
당업자는 유전자 코드의 축퇴 성질로 인해, 그들의 뉴클레오티드 서열에서 상이한 다양한 DNA 분자가 본 개시물의 주어진 효소를 코딩하는데 사용될 수 있다는 것을 인식할 것이다. 상기 기재된 생합성 효소를 코딩하는 천연 DNA 서열은 단지 본 개시물의 구현예를 예시하기 위해 본원에서 참조되며, 본 개시물은 본 개시물의 방법에 이용되는 효소의 단백질 및 폴리펩티드의 아미노산 서열을 코딩하는 임의의 서열의 DNA 분자를 포함한다. 유사한 방식으로, 폴리펩티드는 전형적으로 원하는 활성의 손실 또는 상당한 손실 없이 그의 아미노산 서열에서 하나 이상의 아미노산 치환, 결실 및 삽입을 용인할 수 있다. 본 개시물은 변형된 또는 변이체 폴리펩티드가 참조 폴리펩티드의 효소적 동화 또는 이화 활성을 갖는 한, 본원에 기재된 특정 단백질과는 상이한 아미노산 서열을 갖는 이러한 폴리펩티드를 포함한다. 또한, 본원에 나타낸 DNA 서열에 의해 코딩된 아미노산 서열은 단지 본 개시물의 구현예를 예시한다.
본 개시물의 방법, 조성물 및 유기체에 유용한 특정 유전자 및 단백질이 본원에 기재되지만; 이러한 유전자에 대한 절대적 동일성이 필요하지 않다는 것이 인식될 것이다. 예를 들어, 폴리펩티드 또는 효소를 코딩하는 서열을 포함하는 특정 유전자 또는 폴리뉴클레오티드에서의 변화를 수행하고 활성에 대해 스크리닝할 수 있다. 전형적으로 이러한 변화는 보존적 돌연변이 및 침묵 돌연변이를 포함한다. 이러한 변형된 또는 돌연변이화된 폴리뉴클레오티드 및 폴리펩티드는 당업계에 공지된 방법을 사용하여 기능적 효소의 발현에 대해 스크리닝될 수 있다.
유전자 코드의 고유한 축퇴성으로 인해, 실질적으로 동일하거나 기능적으로 동등한 폴리펩티드를 코딩하는 다른 폴리뉴클레오티드가 또한 이러한 효소를 코딩하는 폴리뉴클레오티드를 클로닝하고 발현하는데 사용될 수 있다.
당업자에게 공지된 기법은 추가적인 상동 유전자 및 상동 효소를 확인하는데 적합할 수 있다. 일반적으로, 유사한 유전자 및/또는 유사한 효소는 기능적 분석에 의해 확인될 수 있으며 기능적 유사성을 가질 것이다.
당업자에게 공지된 기법은 유사한 유전자 및 유사한 효소 또는 임의의 생합성 경로 유전자, 단백질 또는 효소를 확인하는데 적합할 수 있으며, 기법은 관심 대상의 유전자/효소의 공개된 서열을 기반으로 하는 프라이머를 사용하는 PCR 에 의해, 또는 관심 대상의 유전자 중의 보존된 부위를 증폭하도록 설계된 축퇴 프라이머를 사용하는 축퇴 PCR 에 의해 유전자를 클로닝하는 것을 포함할 수 있으나 이에 제한되지 않는다. 또한, 당업자는 기능적 상동성 또는 유사성을 갖는 상동 또는 유사 유전자, 단백질 또는 효소를 확인하는 기법을 사용할 수 있다. 기법은 효소의 촉매 활성에 대한 세포 또는 세포 배양물을 상기 활성에 대한 시험관내 효소 어세이 (예를 들어, 본원 또는 Kiritani, K., Branched-Chain Amino Acids Methods Enzymology, 1970 에서 기재된 바와 같음) 를 통해 검사하는 것, 그런 다음 정제를 통해 상기 활성을 갖는 효소를 단리하는 것, 에드만 (Edman) 분해와 같은 기법을 통해 효소의 단백질 서열을 결정하는 것, 가능한 핵산 서열에 대한 PCR 프라이머의 설계, PCR 을 통한 상기 DNA 서열의 증폭, 및 상기 핵산 서열의 클로닝을 포함한다. 상동 또는 유사 유전자 및/또는 상동 또는 유사 효소, 유사 유전자 및/또는 유사 효소 또는 단백질을 확인하기 위해, 기법은 또한 후보 유전자 또는 효소에 관한 데이터를 BRENDA, KEGG 또는 MetaCYC 와 같은 데이터베이스와 비교하는 것을 포함한다. 후보 유전자 또는 효소는 본원의 교시에 따라 상기 언급된 데이터베이스 내에서 확인될 수 있다.
용어 "...와 ...사이" 및 "... 내지...의 범위" 는 달리 명시되지 않는 한, 한계치를 포함하는 것으로 이해되어야 한다. 본 명세서 및 후속하는 청구항에 걸쳐, 맥락상 달리 요구되지 않는 한, 단어 "포함하다" 및 이의 변형 예컨대 "포함한다", "포함하는" 및 "가지다" 는 언급된 정수 또는 단계 또는 정수들 또는 단계들의 군을 포함하지만 임의의 다른 정수 또는 단계 또는 정수 또는 단계의 군을 배제하지 않는 것으로 이해될 것이다. 용어 "포함하는"은 또한 "함유하는"뿐만 아니라 "~로 이루어지는"을 의미하고, 예를 들어, X 를 "포함하는" 조성물은 X 로만 이루어질 수 있거나 예를 들어 X + Y 와 같은 추가적인 어떤 것을 포함할 수 있다. 또한, 본 명세서 및 첨부된 청구항에서 사용된 바와 같이, 단수 형태는 맥락에서 명확하게 달리 지시하지 않는 한, 복수형 대상을 포함한다는 것에 유의해야 한다. 예를 들어, "유전자" 또는 "효소"에 대한 언급은 "하나 이상의 유전자" 또는 "하나 이상의 효소"에 대한 언급이다.
또한, 본 개시물이 본원에 기재된 특정 방법론, 프로토콜 및 시약에 제한되지 않는다는 것이 이해되어야 하는데, 이들이 가변적일 수 있기 때문이다. 또한 본원에서 사용되는 전문용어가 단지 특정한 구현예를 설명하기 위한 목적이고 본 개시물의 범주를 제한하려는 의도가 아니며, 본 개시물의 범주는 오직 첨부된 청구항에 의해서만 제한될 것임이 이해되어야 한다. 달리 정의되지 않는 한, 본원에서 사용된 모든 기술적 및 과학적 용어들은 당업자에 의해 통상적으로 이해되는 바와 동일한 의미를 갖는다. 본 개시물에 따르면, 당업계의 기술 내에 있는 종래의 분자 생물학, 미생물학 및 재조합 DNA 기법이 사용될 수 있다.
본 개시물은 구성의 세부 사항 및 하기의 설명에 나타내거나 도면에 예시된 성분의 배열에 대한 그의 적용에 제한되지 않는다. 본 개시물은 다른 구현예가 가능하고 다양한 방식으로 실시되거나 실행되는 것이 가능하다. 또한, 본원에서 사용된 어법 및 전문용어는 설명의 목적을 위한 것이며 제한하는 것으로서 간주되어서는 안된다. 바람직하게는, 본원에서 사용되는 용어는 "A multilingual glossary of biotechnological terms: (IUPAC Recommendations)", Leuenberger, H.G.W, Nagel, B. and Kolbl, H. eds. (1995), Helvetica Chimica Acta, CH-4010 Basel, Switzerland 에서 기재된 바와 같이 정의된다.
본 명세서의 문서 전체에 걸쳐 몇몇 문헌이 인용된다. 본원에 인용된, 상기 또는 하기의, 각각의 문헌 (모든 특허, 특허 출원, 과학 간행물, 제조업체의 사양, 지침, GenBank 등록 번호 서열 제출 등 포함) 은 본 명세서에 그 전체가 참조로 포함된다.
하기의 실시예 및 도면은 본 발명의 암시적 제한 없이 예시로서 제시된다.
실시예
실시예 1: 본 발명에 따른 재조합 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 균주의 제조를 위한 프로토콜
이하 실행되는 모든 재조합 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 균주는 표준 효모 분자 유전학 절차 (Methods in yeast Genetics - A cold spring harbor laboratory course Manual (2000) by D. Burke, D. Dawson, T. Stearns CSHL Press) 를 사용하여 표준 균주로부터 구축하였다.
서열 상동성을 갖는 유리 DNA 말단을 효율적으로 재조합할 수 있는 효모의 능력을 사용하여 하기 언급된 유전자의 클러스터를 재조합 효모에 한번에 통합하였다.
또한, 하기 유전자형의 더 양호한 이해를 위해:
- jlp1, his 3, leu2, sam3 및 met14 은 삽입 위치이다.
- 소문자는 고려되는 유전자가 비활성임을 의미하고, 대문자는 활성 유전자를 반영한다.
- 유전자 뒤의 "::": 유전자가 뒤이어지는 것에 의해 중단된다는 것을 의미한다 (하나 초과의 유전자가 삽입되는 경우, 이들은 괄호 [] 로 표시됨). 유전자의 중단은 코딩 서열의 전체 결실에 수반되는 것이지만, 프로모터는 보존한다. 그 결과, "::" 에 뒤이어지는 유전자는 비활성이며 소문자로 표시된다. 명시되지 않은 경우 삽입된 유전자의 전사는 파괴된 유전자의 프로모터에 의해 제어된다.
- "gene.Kl" 은 유전자가 클루이베로마이세스 락티스 (Kluyveromyces lactis) 로부터 기원한다는 것을 의미한다. 본 실시예에서 유전자 뒤에 아무것도 나타내지 않는 경우, 이는 유전자가 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 유래한다는 것을 의미한다.
보다 특히, 클로닝하고자 하는 코딩 서열을 인위적으로 합성하였다. 이종 서열 (비-효모) 의 경우, 효모 코돈 용법을 사용하여 동의적 코딩 서열을 수득하기 위해 핵산 서열을 변형시켰다. 제한 효소 및 고전적 클로닝 기법을 사용하여, 각각의 합성 서열을 전사 프로모터와 전사 터미네이터 사이에 클로닝하였다. 각각의 프로모터 서열에는 업스트림 유전자의 터미네이터의 서열에 상동성인 50 내지 200 개 뉴클레오티드 서열이 선행한다. 유사하게, 각각의 유전자 (프로모터-코딩 서열-터미네이터를 포함하는 유전자) 의 터미네이터에는 바로 다음의 유전자에 상동성인 서열이 뒤이어진다. 따라서, 통합되는 단위 각각은 업스트림 및 단위 다운스트림 둘 모두와의 50-200 개 뉴클레오티드 오버랩 (overlap) 을 갖는다. 제 1 단위에 대해, 프로모터에는 이것이 통합될 유전자좌에 대한 효모 염색체 뉴클레오티드와 상동성인 50-200 개 뉴클레오티드가 선행한다. 유사하게, 마지막 단위에 대해, 터미네이터에는 이것이 통합될 유전자좌에 대한 효모 염색체 뉴클레오티드와 상동성인 50-200 개 뉴클레오티드가 뒤이어진다.
그런 다음, 각각의 단위는 플라스미드 구축물로부터 PCR 증폭되어, 오버랩 서열을 갖는 선형 DNA 의 X 단위가 산출된다. 재조합 사건을 위한 선택을 위해, 이러한 유전자의 적어도 하나는 영양요구성 마커이다. 모든 선형 절편은 효모에서 한번에 형질전환되고, 재조합 효모 세포는 사용된 마커와 관련된 영양요구성에 대해 선택된다. 그런 다음, 서열의 무결성 (integrity) 은 PCR 및 서열분석에 의해 확인된다.
실시예 2: 콘드로이틴의 생산을 위한 비교예
먼저, 3 개의 재조합 균주를 수득한다: YA5809, YA5810 및 YA5571.
따라서, 이들 3 개의 균주는 다음과 같다:
YA5809 : MAT-α, his3::[tRPL3-UGP1-pSAM1, pMET6-QRI1-tIDP1, HIS3]x5, jlp1::[LEU2.Sba-loxP, pTEF1.Sba-HASB.Vir-tRPL3.Sm, pTDH3.Sk-HASB-A.Vir-tTEF1.Sba, pTDH3-1.Sba-HCOS1-3.Pm-tRPL15A.Sm, pCCW12-KFOA.Pm-tRPL41B.Sba, pCCW120.Sm-KFOA.Pm-tRPL15A.Sba, pTEF1.Ago-GFA1.Vir-tRPL15A], leu2, met14::[TRP1.Sba-RS, pTDH3-PGM1-tIDP1, pCWP2-GNA1-tTPI1, pTEF1-PCM1-tRPL41B, pFBA1-UGP1-tRPL3, pTDH3-1.Sba-QRI1-tIDP1.Sba, pTEF1.Ago-GFA1-tRPL15A], trp1, ura3
YA5810 : MAT-α, his3::[tRPL3-UGP1-pSAM1, pMET6-QRI1-tIDP1, HIS3]x5, jlp1::[LEU2.Sba-loxP, pTEF1.Sba-HASB.Vir-tRPL3.Sm, pTDH3.Sk-HASB-A.Vir-tTEF1.Sba, pTDH3-1.Sba-HCOS1-3.Pm-tRPL15A.Sm, pCCW12-KFOA.Pm-tRPL41B.Sba, pCCW120.Sm-KFOA.Pm-tRPL15A.Sba, pTEF1.Ago-GFA1.Vir-tRPL15A], leu2, met14::[TRP1.Sba-RS, pTDH3-PGM1-tIDP1, pCWP2-GNA1-tTPI1, pTEF1-PCM1-tRPL41B, pFBA1-UGP1-tRPL3, pTDH3-1.Sba-QRI1-tIDP1.Sba], trp1, ura3
YA5571 : MAT-α, his3::[tRPL3-UGP1-pSAM1, pMET6-QRI1-tIDP1, HIS3]x5, jlp1::[LEU2.Sba-loxP, pTEF1.Sba-HASB.Vir-tRPL3.Sm, pTDH3.Sk-HASB-A.Vir-tTEF1.Sba, pTDH3-1.Sba-HCOS1-3.Pm-tRPL15A.Sm, pCCW12-KFOA.Pm-tRPL41B.Sba, pCCW120.Sm-KFOA.Pm-tRPL15A.Sba, pTEF1.Ago-GFA1.Vir-tRPL15A], leu2, trp1, ura3
HASB 및 HASB-A 는 UDP-글루코오스 6-탈수소효소 활성을 갖는 폴리펩티드를 코딩하는 핵산 서열을 나타낸다. 이들은 효소를 코딩하는 핵산 서열의 상이한 재코딩된 버전이라는 점에서 서로 상이하다. HASB 는 서열 SEQ ID NO: 36 을 갖고, HASB-A 는 서열 SEQ ID NO: 37 을 갖는다. HCOS1-3.Pm 은 히알루로난 신타아제 활성을 갖는 폴리펩티드를 코딩하는 핵산 및 콘드로이틴 신타아제 활성을 갖는 폴리펩티드를 코딩하는 핵산의 단편을 포함하는 핵산인 콘드로이틴 신타아제 활성을 갖는 폴리펩티드를 코딩하는 핵산 서열을 나타낸다. HCOS1-3.Pm 은 서열 SEQ ID NO: 3 을 갖는다.
이들 균주를 2% 글루코스가 보충된 25 ml 의 SY 배지에서 48 시간 동안 28°C 에서 Erlenmeyer 플라스크에서 인큐베이션하였다.
SY 배지는 다음 요소를 포함한다:
KH2PO4: 100 mM; MgSO4 7H2O: 2,8 mM; K2SO4: 11,5 mM; Na2SO4:
1,1 mM; NaCl: 2,6 mM; CaCl2 2H2O: 0,7 mM; CuSO4 5H2O: 15 μM; KI: 6 μM; FeCl3: 30 μM; ZnSO4 7H2O: 61 μM; MnSO4 H2O: 25 μM; H2SO4: 110 μΜ; 판토텐산 헤미칼슘 염: 42 μΜ; 티아민 히드로클로라이드: 59 μΜ; 피리독신 히드로클로라이드: 49 μΜ ; 마이오-이노시톨 (C6H12O6): 555 μΜ ; 니코틴산 (C6H5NO2): 29 μM ; D-비오틴:
0,82 μΜ; 암모늄 시트레이트 3염기: 33 mM; 및 글루코오스 또는 수크로오스 2-30%
성장 배지를 48 시간에 회수하고 콘드로이틴 함량에 대해 어세이하였다.
상청액의 분취액을 로딩하고, 0.5% 아가로스 겔 상에서 실행시킨 후 브로모페놀 블루로 염색하였다.
배지 중에 존재하는 콘드로이틴의 양을 농축 황산 및 카르바졸로 처리한 후 비색 결정에 의해 평가하였다 (Bitter and Muir (1962) analytical biochemistry 4, 330-334).
이들 상이한 균주로 수득된 양은 각각 다음과 같다:
- YA5809: 200 mg.L-1
- YA5810: 200 mg.L-1
- YA5571: 200 mg.L-1
이에 비해, 다른 3 종의 균주가 유해라는 본래의 균주 (Chιrest et al. (2000) J Biol. Chem. 275: 14056-14063) 는 콘드로이틴을 생산하지 않는다.
본 발명에 따른 변형을 포함하는 재조합 균주는 본 발명에 따른 모든 유전적 변형을 포함하지 않는 다른 균주와 동일한 조건에서 배양할 때 더 많은 양의 콘드로이틴을 생산한다는 것이 본 실험으로부터 얻은 결과이다.
실시예 3: 제어된 분자량의 콘드로이틴의 제조에 대한 실시예
1. 분자량이 10kDa 미만인 콘드로이틴의 제조
그 다음, 2 개의 재조합 균주를 수득한다: YA5887 및 5902.
따라서, 이들 두 균주는 다음과 같다:
YA5887 : MAT-a, his3, jlp1::[LEU2.Kl, pCUP1-UGP1-tRPL3, pCUP1-QRI1-tIDP1, pPDC1-UGP1-tTPI1, pTDH3-QRI1-tMET25, pCCW12-HASB.At-tRPL15A], leu2::[TRP1.Sba, pCCW12.Sba-HYAL-3.Ts-tRPL15A], sam3::[HASB.Vir-tTEF1.Sba, pTDH3-1.Sba-HCOS1-3.Pm-tRPL3.Sba, pTDH3.Sar-HCOS1-3.Pm-tRPL15A.Sm, pCCW12-KFOA.Pm-tRPL41B.Sba, pCCW120.Sm-KFOA.Pm-tRPL15A.Sba, HIS3.Sba], trp1
YA5902: MAT-α, his3::[ pSAM1-UGP1-tRPL3, pMET6-QRI1-tIDP1, HIS3]x5, jlp1::[LEU2.Kl, pCUP1-UGP1-tRPL3, pCUP1-QRI1-tIDP1, pPDC1-UGP1-tTPI1, pTDH3-QRI1-tMET25, pCCW12-HASB.At-tRPL15A], leu2::[TRP1.Sba, pCCW12.Sba-HYAL-3.Ts-tRPL15A], sam3::[LEU2.Kl, pENO2-UGP1-tRPL3, pCWP2-GNA1-tTPI1, pTEF1-PCM1-tRPL41B, pTEF1.Sba-HASB.vir-tRPL3.Sm, pTDH3.Sk-HASB-A.Vir-tTEF1.Sba, pTDH3-1.Sba-HCOS1-3.Pm-tRPL15A.Sm, pCCW12-KFOA.Pm-tRPL15A.Sba, HIS3.Sba-loxP], trp1
HYAL-3.Ts 는 분비 신호와 연관된 콘드로이티나아제 활성을 갖지만 고정 신호를 갖지 않는 폴리펩티드를 코딩하는 핵산 서열을 나타낸다. HYAL-3.Ts 는 아미노산 서열 SEQ ID NO: 23 을 갖는다.
HASB, HASB-A 및 HCOS-1.Pm 은 상기 정의된 바와 같다.
이들 균주를 2% 글루코스가 보충된 25 ml 의 SY 배지에서 48 시간 동안 28°C 에서 Erlenmeyer 플라스크에서 인큐베이션하였다.
성장 배지를 48 시간에 회수하고 콘드로이틴 함량에 대해 어세이하였다.
상청액의 분취액을 로딩하고, 0.5% 아가로스 겔 상에서 실행시킨 후 브로모페놀 블루로 염색하였다.
배지 중에 존재하는 콘드로이틴의 양을 농축 황산 및 카르바졸로 처리한 후 비색 결정에 의해 평가하였다 (Bitter and Muir (1962) analytical biochemistry 4, 330-334).
이들 상이한 균주로 수득된 양은 각각 다음과 같다:
- YA5887: 600 mg.L-1
- YA5902: 600 mg.L-1
이에 비해, 다른 2 종의 균주가 유해라는 본래의 균주 (Chιrest et al. (2000) J Biol. Chem. 275: 14056-14063) 는 콘드로이틴을 생산하지 않는다.
본 발명에 따른 변형을 포함하는 재조합 균주는 본 발명에 따른 모든 유전적 변형을 포함하지 않는 다른 균주와 동일한 조건에서 배양할 때 더 많은 양의 콘드로이틴을 생산한다는 것이 본 실험으로부터 얻은 결과이다.
더욱이, 이들 두 균주는 48 시간 후 10kDa 미만의 분자량을 갖는 콘드로이틴의 생산을 유도하였다.
2. 약 10kDa 내지 약 50kDa 의 분자량을 갖는 콘드로이틴의 제조
그 다음, 2 개의 다른 재조합 균주를 수득한다: YA5888 및 5903.
따라서, 이들 두 균주는 다음과 같다:
YA5888 : MAT-a, his3, jlp1::[LEU2.Kl, pCUP1-UGP1-tRPL3, pCUP1-QRI1-tIDP1, pPDC1-UGP1-tTPI1, pTDH3-QRI1-tMET25, pCCW12-HASB.At-tRPL15A], leu2::[TRP1.Sba, pCCW10.Ago-HYAL-3.Ts-tRPL15A], sam3::[HASB.Vir-tTEF1.Sba, pTDH3-1.Sba-HCOS1-3.Pm-tRPL3.Sba, pTDH3.Sar-HCOS1-3.Pm-tRPL15A.Sm, pCCW12-KFOA.Pm-tRPL41B.Sba, pCCW120.Sm-KFOA.Pm-tRPL15A.Sba, HIS3.Sba], trp1
YA5903 : MAT-α, his3::[ pSAM1-UGP1-tRPL3, pMET6-QRI1-tIDP1, HIS3]x5, jlp1::[LEU2.Kl, pCUP1-UGP1-tRPL3, pCUP1-QRI1-tIDP1, pPDC1-UGP1-tTPI1, pTDH3-QRI1-tMET25, pCCW12-HASB.At-tRPL15A], leu2::[TRP1.Sba, pCCW10.Ago-HYAL-3.Ts-tRPL15A], sam3::[LEU2.Kl, pENO2-UGP1-tRPL3, pCWP2-GNA1-tTPI1, pTEF1-PCM1-tRPL41B, pTEF1.Sba-HASB.vir-tRPL3.Sm, pTDH3.Sk-HASB-A.Vir-tTEF1.Sba, pTDH3-1.Sba-HCOS1-3.Pm-tRPL15A.Sm, pCCW12-KFOA.Pm-tRPL15A.Sba, HIS3.Sba-loxP], trp1
HYAL-3.Ts, HASB, HASB-A 및 HCOS-1.Pm 은 상기 정의된 바와 같다.
이들 균주를 2% 글루코스가 보충된 25 ml 의 SY 배지에서 48 시간 동안 28°C 에서 Erlenmeyer 플라스크에서 인큐베이션하였다.
성장 배지를 48 시간에 회수하고 콘드로이틴 함량에 대해 어세이하였다.
상청액의 분취액을 로딩하고, 0.5% 아가로스 겔 상에서 실행시킨 후 브로모페놀 블루로 염색하였다.
배지 중에 존재하는 콘드로이틴의 양을 농축 황산 및 카르바졸로 처리한 후 비색 결정에 의해 평가하였다 (Bitter and Muir (1962) analytical biochemistry 4, 330-334).
이들 상이한 균주로 수득된 양은 각각 다음과 같다:
- YA5888: 600 mg.L-1
- YA5903: 600 mg.L-1
이에 비해, 다른 2 종의 균주가 유해라는 본래의 균주 (Chιrest et al. (2000) J Biol. Chem. 275: 14056-14063) 는 콘드로이틴을 생산하지 않는다.
본 발명에 따른 변형을 포함하는 재조합 균주는 본 발명에 따른 모든 유전적 변형을 포함하지 않는 다른 균주와 동일한 조건에서 배양할 때 더 많은 양의 콘드로이틴을 생산한다는 것이 본 실험으로부터 얻은 결과이다.
더욱이, 이들 두 균주는 48 시간 후 약 10kDa 내지 약 50kDa 범위의 분자량을 갖는 콘드로이틴의 생산을 유도하였다.
3. 약 50kDa 내지 약 500kDa 의 분자량을 갖는 콘드로이틴의 제조
그 다음, 2 개의 다른 재조합 균주를 수득한다: YA5889 및 5904.
따라서, 이들 두 균주는 다음과 같다:
YA5889 : MAT-a, his3, jlp1::[LEU2.Kl, pCUP1-UGP1-tRPL3, pCUP1-QRI1-tIDP1, pPDC1-UGP1-tTPI1, pTDH3-QRI1-tMET25, pCCW12-HASB.At-tRPL15A], leu2::[TRP1.Sba, pNUP57-HYAL-3.Ts-tRPL15A], sam3::[HASB.Vir-tTEF1.Sba, pTDH3-1.Sba-HCOS1-3.Pm-tRPL3.Sba, pTDH3.Sar-HCOS1-3.Pm-tRPL15A.Sm, pCCW12-KFOA.Pm-tRPL41B.Sba, pCCW120.Sm-KFOA.Pm-tRPL15A.Sba, HIS3.Sba], trp1
YA5904 : MAT-α, his3::[ pSAM1-UGP1-tRPL3, pMET6-QRI1-tIDP1, HIS3]x5, jlp1::[LEU2.Kl, pCUP1-UGP1-tRPL3, pCUP1-QRI1-tIDP1, pPDC1-UGP1-tTPI1, pTDH3-QRI1-tMET25, pCCW12-HASB.At-tRPL15A], leu2::[TRP1.Sba, pNUP57-HYAL-3.Ts-tRPL15A], sam3::[LEU2.Kl, pENO2-UGP1-tRPL3, pCWP2-GNA1-tTPI1, pTEF1-PCM1-tRPL41B, pTEF1.Sba-HASB.vir-tRPL3.Sm, pTDH3.Sk-HASB-A.Vir-tTEF1.Sba, pTDH3-1.Sba-HCOS1-3.Pm-tRPL15A.Sm, pCCW12-KFOA.Pm-tRPL15A.Sba, HIS3.Sba-loxP], trp1
HYAL-3.Ts, HASB, HASB-A 및 HCOS-1.Pm 은 상기 정의된 바와 같다.
이들 균주를 2% 글루코스가 보충된 25 ml 의 SY 배지에서 48 시간 동안 28°C 에서 Erlenmeyer 플라스크에서 인큐베이션하였다.
성장 배지를 48 시간에 회수하고 콘드로이틴 함량에 대해 어세이하였다.
상청액의 분취액을 로딩하고, 0.5% 아가로스 겔 상에서 실행시킨 후 브로모페놀 블루로 염색하였다.
배지 중에 존재하는 콘드로이틴의 양을 농축 황산 및 카르바졸로 처리한 후 비색 결정에 의해 평가하였다 (Bitter and Muir (1962) analytical biochemistry 4, 330-334).
이들 상이한 균주로 수득된 양은 각각 다음과 같다:
- YA5889: 600 mg.L-1
- YA5904: 600 mg.L-1
이에 비해, 다른 2 종의 균주가 유해라는 본래의 균주 (Chιrest et al. (2000) J Biol. Chem. 275: 14056-14063) 는 콘드로이틴을 생산하지 않는다.
본 발명에 따른 변형을 포함하는 재조합 균주는 본 발명에 따른 모든 유전적 변형을 포함하지 않는 다른 균주와 동일한 조건에서 배양할 때 더 많은 양의 콘드로이틴을 생산한다는 것이 본 실험으로부터 얻은 결과이다.
더욱이, 이들 두 균주는 48 시간 후 약 10kDa 내지 약 50kDa 범위의 분자량을 갖는 콘드로이틴의 생산을 유도하였다.
서열
SEQ ID NO: 1 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS1-1):
SEQ ID NO: 2 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS1-2):
SEQ ID NO: 3 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS1-3):
SEQ ID NO: 4 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 핵산 서열: 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편 및 사카로마이세스 세레비지아에 (Saccharomyces cerevisiae) 로부터 유래된 키틴 신타아제 2 를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS.Sc)
SEQ ID NO: 5 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 핵산 서열: 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 사카로마이세스 세레비지아에 (Saccharomyces cerevisiae) 로부터 유래된 키틴 신타아제 2 를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HHASA.Sc)
SEQ ID NO: 6 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 에스케리치아 콜라이로부터 유래된 콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS1-Vir)
SEQ ID NO: 7 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 에스케리치아 콜라이로부터 유래된 콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS2-Vir)
SEQ ID NO: 8 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 마이코박테리움 투베르쿨로시스 (Mycobacterium tuberculosis) 로부터 유래된 갈락토푸라노실트랜스페라아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS3-Vir)
SEQ ID NO: 9 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 에스케리치아 콜라이로부터 유래된 콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS4-Vir)
SEQ ID NO: 10 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 페니실리움 옥살리쿰 (Penicillium oxalicum) 으로부터 유래된 콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS5-Vir)
SEQ ID NO: 11 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된 콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS6-Vir)
SEQ ID NO: 12 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된 콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS7-Vir)
SEQ ID NO: 13 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된 콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS8-Vir)
SEQ ID NO: 14 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 호모 사피엔스 (Homo sapiens) 로부터 유래된 콘드로이틴 술페이트 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS9-Vir)
SEQ ID NO: 15 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 호모 사피엔스 (Homo sapiens) 로부터 유래된 콘드로이틴 술페이트 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS10-Vir)
SEQ ID NO: 16 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 호모 사피엔스 (Homo sapiens) 로부터 유래된 콘드로이틴 술페이트 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS11-Vir)
SEQ ID NO: 17 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 호모 사피엔스 (Homo sapiens) 로부터 유래된 콘드로이틴 술페이트 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS12-Vir)
SEQ ID NO: 18 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 아미노산 서열: 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS1-1)
SEQ ID NO: 19 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 아미노산 서열: 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS1-2)
SEQ ID NO: 20 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 아미노산 서열: 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS1-3)
SEQ ID NO: 21: 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 아미노산 서열: 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편, 파스튜렐라 물토시다로부터 유래된 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편 및 사카로마이세스 세레비지아에 (Saccharomyces cerevisiae) 로부터 유래된 키틴 신타아제 2 를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS.Sc)
SEQ ID NO: 22: 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 아미노산 서열: 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 사카로마이세스 세레비지아에 (Saccharomyces cerevisiae) 로부터 유래된 키틴 신타아제 2 를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HHASA.Sc)
SEQ ID NO: 23: 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 에스케리치아 콜라이로부터 유래된 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS1-Vir)
SEQ ID NO: 24: 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 에스케리치아 콜라이로부터 유래된 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS2-Vir)
SEQ ID NO: 25: 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 마이코박테리움 투베르쿨로시스 (Mycobacterium tuberculosis) 로부터 유래된 갈락토푸라노실트랜스페라아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS3-Vir)
SEQ ID NO: 26: 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 에스케리치아 콜라이로부터 유래된 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS4-Vir)
SEQ ID NO: 27: 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 페니실리움 옥살리쿰 (Penicillium oxalicum) 으로부터 유래된 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS5-Vir)
SEQ ID NO: 28: 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS6-Vir)
SEQ ID NO: 29: 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS7-Vir)
SEQ ID NO: 30: 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS8-Vir)
SEQ ID NO: 31: 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 호모 사피엔스로부터 유래된 콘드로이틴 술페이트 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS9-Vir)
SEQ ID NO: 32: 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 호모 사피엔스로부터 유래된 콘드로이틴 술페이트 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS10-Vir)
SEQ ID NO: 33: 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 호모 사피엔스로부터 유래된 콘드로이틴 술페이트 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS11-Vir)
SEQ ID NO: 34: 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 호모 사피엔스로부터 유래된 콘드로이틴 술페이트 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS12-Vir)
SEQ ID NO: 35 는 아라비돕시스 탈리아나 (Arabidopsis thaliana) 로부터 기원하는 UDP-글루코오스 탈수소효소 (HASB) 의 핵산 서열이다
SEQ ID NO: 36 은 클로렐라 바이러스 PBCV-1 로부터 기원하는 UDP-글루코오스 탈수소효소 (HASB) 의 재코딩된 핵산 서열이다
SEQ ID NO: 37 은 클로렐라 바이러스 PBCV-1 로부터 기원하는 UDP-글루코오스 탈수소효소 (HASB-A) 의 재코딩된 핵산 서열이다
SEQ ID NO: 38 은 스트렙토코쿠스 주에피데미쿠스 (Streptococcus zooepidemicus) 로부터 기원하는 UDP-글루코오스 탈수소효소 (HASB) 의 핵산 서열이다
SEQ ID NO: 39 는 아라비돕시스 탈리아나 (Arabidopsis thaliana) 로부터 기원하는 UDP-글루코오스 탈수소효소 (HASB) 의 아미노산 서열이다
SEQ ID NO: 40 은 클로렐라 바이러스 PBCV1 로부터 기원하는 UDP-글루코스 탈수소효소 (HASB) 의 아미노산 서열이다
SEQ ID NO: 41 는 스트렙토코쿠스 주에피데미쿠스 (Streptococcus zooepidemicus) 로부터 기원하는 UDP-글루코오스 탈수소효소 (HASB) 의 아미노산 서열이다
SEQ ID NO: 42 는 슈도모나스 아에루기노사 (Pseudomonas aeruginosa) 로부터 기원하는 UDP-글루코오스-4-에피머라제 (GNE1) 의 핵산 서열이다
SEQ ID NO: 43 은 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 UDP-글루코오스-4-에피머라제 (KFOA) 의 핵산 서열이다
SEQ ID NO: 44 는 에스케리치아 콜라이 (Escherichia coli) 로부터 기원하는 UDP-글루코오스-4-에피머라제 (KFOA) 의 핵산 서열이다
SEQ ID NO: 45 는 슈도모나스 아에루기노사 (Pseudomonas aeruginosa) 로부터 기원하는 UDP-글루코오스-4-에피머라제 (GNE1) 의 아미노산 서열이다
SEQ ID NO: 46 은 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 UDP-글루코오스-4-에피머라제 (KFOA) 의 아미노산 서열이다
SEQ ID NO: 47 은 에스케리치아 콜라이 (Escherichia coli) 로부터 기원하는 UDP-글루코오스-4-에피머라제 (KFOA) 의 아미노산 서열이다
SEQ ID NO: 48 은 N-말단 분비 신호를 갖는 큐피에니우스 살레이 (Cupiennius salei) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 49 는 N-말단 분비 신호를 갖는 티티우스 세르룰라투스 (Tityus serrulatus) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 50 은 N-말단 분비 신호를 갖는 보스 타우루스 (Bos Taurus) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 51 은 N-말단 분비 신호를 갖는 아피스 멜리페라 (Apis mellifera) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 52 는 N-말단 분비 신호를 갖는 마카카 물라타 (Macaca mulatta) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 53 는 N-말단 분비 신호를 갖는 베스파 마그니피카 (Vespa magnifica) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 54 는 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 큐피에니우스 살레이 (Cupiennius salei) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 55 는 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 티티우스 세르룰라투스 (Tityus serrulatus) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 56 은 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 보스 타우루스 (Bos Taurus) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 57 은 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 아피스 멜리페라 (Apis mellifera) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 58 은 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 마카카 물라타 (Macaca mulatta) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 59 은 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 베스파 마그니피카 (Vespa magnifica) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 60 은 N-말단 분비 신호를 갖는 큐피에니우스 살레이 (Cupiennius salei) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 61 은 N-말단 분비 신호를 갖는 티티우스 세르룰라투스 (Tityus serrulatus) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 62 는 N-말단 분비 신호를 갖는 보스 타우루스 (Bos Taurus) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 63 은 N-말단 분비 신호를 갖는 아피스 멜리페라 (Apis mellifera) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 64 는 N-말단 분비 신호를 갖는 마카카 물라타 (Macaca mulatta) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 65 는 N-말단 분비 신호를 갖는 베스파 마그니피카 (Vespa magnifica) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 66 은 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 큐피에니우스 살레이 (Cupiennius salei) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 67 은 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 티티우스 세르룰라투스 (Tityus serrulatus) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 68 은 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 보스 타우루스 (Bos Taurus) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 69 는 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 아피스 멜리페라 (Apis mellifera) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 70 은 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 마카카 물라타 (Macaca mulatta) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 71 은 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 베스파 마그니피카 (Vespa magnifica) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 72 는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 (GFA1) 의 핵산 서열이다.
SEQ ID NO: 73 은 클로렐라 바이러스 1 (PBCV-1) 로부터 기원하는 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 (GFA1) 의 재코딩된 핵산 서열이다
SEQ ID NO: 74 은 클로렐라 바이러스 1 (PBCV-1) 로부터 기원하는 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 (GFA1) 의 재코딩된 핵산 서열이다
SEQ ID NO: 75 는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 (GFA1) 의 아미노산 서열이다
SEQ ID NO: 76 은 클로렐라 바이러스 1 (PBCV-1) 로부터 기원하는 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 (GFA1) 의 아미노산 서열이다
SEQ ID NO: 77 은 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 UDP-N-아세틸글루코사민 피로포스포릴라아제 (QRI1) 의 핵산 서열이다
SEQ ID NO: 78 은 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 UDP-N-아세틸글루코사민 피로포스포릴라아제 (QRI1) 의 아미노산 서열이다
SEQ ID NO: 79 는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 포스포글루코뮤타아제-1 (PGM1) 의 핵산 서열이다
SEQ ID NO: 80 은 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 포스포글루코뮤타아제-1 (PGM1) 의 아미노산 서열이다
SEQ ID NO: 81 은 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 (UGP1) 의 핵산 서열이다
SEQ ID NO: 82 는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 (UGP1) 의 아미노산 서열이다
SEQ ID NO: 83 은 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 글루코사민 6-포스페이트 N-아세틸트랜스퍼라아제 (GNA1) 의 핵산 서열이다
SEQ ID NO: 84 는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 글루코사민 6-포스페이트 N-아세틸트랜스퍼라아제 (GNA1) 의 아미노산 서열이다
SEQ ID NO: 85 는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 포스포아세틸글루코사민 뮤타아제 (PCM1) 의 핵산 서열이다
SEQ ID NO: 86 은 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 포스포아세틸글루코사민 뮤타아제 (PCM1) 의 아미노산 서열이다
SEQ ID NO: 87 은 프로모터 pTDH3 의 핵산 서열이다
SEQ ID NO: 88 은 프로모터 pTDH3.Sk 의 핵산 서열이다
SEQ ID NO: 89 은 프로모터 pTDH3-1.sba 의 핵산 서열이다
SEQ ID NO: 90 은 프로모터 pTDH3.Sar 의 핵산 서열이다
SEQ ID NO: 91 은 프로모터 pENO2 의 핵산 서열이다
SEQ ID NO: 92 은 프로모터 pTEF3 의 핵산 서열이다
SEQ ID NO: 93 은 프로모터 pTEF1 의 핵산 서열이다
SEQ ID NO: 94 은 프로모터 pTEF1.ago 의 핵산 서열이다
SEQ ID NO: 95 은 프로모터 pTEF1.Sba 의 핵산 서열이다
SEQ ID NO: 96 은 프로모터 pPDC1 의 핵산 서열이다
SEQ ID NO: 97 은 프로모터 pCCW12 의 핵산 서열이다
SEQ ID NO: 98 은 프로모터 pCCW12.Sm 의 핵산 서열이다
SEQ ID NO: 99 은 프로모터 pCCW12.Sk 의 핵산 서열이다
SEQ ID NO: 100 은 프로모터 pCCW12.Sba 의 핵산 서열이다
SEQ ID NO: 101 은 프로모터 pCCW12.Sar 의 핵산 서열이다
SEQ ID NO: 102 은 프로모터 pNUP57 의 핵산 서열이다
SEQ ID NO: 103 은 프로모터 pCCW10.ago 의 핵산 서열이다
SEQ ID NO: 104 은 프로모터 pCWP2 의 핵산 서열이다
SEQ ID NO: 105 은 프로모터 pFBA1 의 핵산 서열이다
SEQ ID NO: 106 은 프로모터 pCCW120.Sm 의 핵산 서열이다
SEQ ID NO: 107 은 프로모터 pCUP1 의 핵산 서열이다
SEQ ID NO: 108 은 프로모터 pMET6 의 핵산 서열이다
SEQ ID NO: 109 은 프로모터 pMET25 의 핵산 서열이다
SEQ ID NO: 110 은 프로모터 pSAM1 의 핵산 서열이다
SEQ ID NO: 111 은 터미네이터 tTPI1 의 핵산 서열이다
SEQ ID NO: 112 은 터미네이터 tMET25 의 핵산 서열이다
SEQ ID NO: 113 은 터미네이터 tDIT1 의 핵산 서열이다
SEQ ID NO: 114 은 터미네이터 tRPL3 의 핵산 서열이다
SEQ ID NO: 115 은 터미네이터 tRPL3.sm 의 핵산 서열이다
SEQ ID NO: 116 은 터미네이터 tRPL3.sba 의 핵산 서열이다
SEQ ID NO: 117 은 터미네이터 tRPL41B 의 핵산 서열이다
SEQ ID NO: 118 은 터미네이터 tRPL41B.Sba 의 핵산 서열이다
SEQ ID NO: 119 은 터미네이터 tRPL15A 의 핵산 서열이다
SEQ ID NO: 120 은 터미네이터 tRPL15A.Sm 의 핵산 서열이다
SEQ ID NO: 121 은 터미네이터 tRPL15A.sba 의 핵산 서열이다
SEQ ID NO: 122 은 터미네이터 tIDP1 의 핵산 서열이다
SEQ ID NO: 123 은 터미네이터 tIDP1.Sba 의 핵산 서열이다
SEQ ID NO: 124 은 터미네이터 tTEF1.sba 의 핵산 서열이다
SEQ ID NO: 125 은 5' 에서 부가된 분비 서열의 핵산 서열이다
SEQ ID NO: 126 은 N-말단에서 부가된 분비 서열의 아미노산 서열이다
SEQ ID NO: 127 은 3' 에서 부가된 고정 서열의 핵산 서열이다
SEQ ID NO: 128 은 C-말단에서 부가된 고정 서열의 아미노산 서열이다
SEQUENCE LISTING
<110> GIVAUDAN SA
<120> CHONDROITIN-PRODUCING RECOMBINANT CELL
<130> PR92298/MGG
<150> EP21166740.7
<151> 2021-04-01
<160> 128
<170> BiSSAP 1.3.6
<210> 1
<211> 2919
<212> DNA
<213> other sequences
<220>
<223> reencoded nucleic acid sequence of a polypeptide having a
chondroitin synthase activity (HCOS-1)
<400> 1
atgaacaccc tttcccaggc aattaaggct tataatagta atgattatca actagccctc 60
aagctgttcg aaaagtcggc agaaatctac ggcagaaaga tagttgagtt ccaaattacg 120
aagtgcaagg agaaactttc tgcgcaccca tccgttaaca gtgcgcatct ctcggttaac 180
aaagaagaga aggtgaatgt ttgcgacagt ccattagaca tagccactca attattgtta 240
tcgaatgtga aaaaactcgt ccttagtgat agcgagaaaa atacactaaa gaataaatgg 300
aagttgttga ctgaaaagaa gtctgagaac gcagaggtcc gggccgtagc tttagttccc 360
aaggactttc cgaaagattt agtgcttgcg ccgttaccag accatgtgaa cgattttacg 420
tggtataaga agcggaagaa acgcctagga atcaaaccag aacaccaaca cgttggcctc 480
tccattattg tgacaacgtt caaccgtcct gccatcctca gcatcaccct ggcttgcctc 540
gtcaatcaaa agacccatta tccttttgag gtgatcgtga ccgacgatgg ttctcaagag 600
gatttatcgc ctataatccg tcaatatgag aacaagctag acatccgtta tgttcggcaa 660
aaggactatg ggtatcagct gtgcgccgtt agaaaccttg gtctaaggac agcgaagtat 720
gactttgtct ctatcttgga ttgcgacatg gccccgcagc agctatgggt tcactcttac 780
cttacagaac tattagagga cgatgatttg accataatag gccccaggaa gtacattgac 840
acgcaacaca tagatcccaa ggatttcctt aataacgcct ctctgttaga gtcgttgcca 900
gaggttaaga ccaataattc cgtcgcggct aagggcgagg ggaccgtatc tttagactgg 960
cgtttggaac aatttgagaa gaccgagaac ttgaggctat ccgatagccc tttccgattc 1020
ttcgcagctg ggaatgtggc tttcgccaag aagtggctta acaagtcagg attcttcgac 1080
gaggaattca atcactgggg aggtgaagat gtagagttcg gttatcgtct gtttcggtac 1140
ggttcgttct tcaaaactat agacggcatc atggcctatc atcaggaacc gccaggtaaa 1200
gaaaacgaaa ctgacagaga agcgggcaag aacattaccc tcgatataat gagggagaag 1260
gtgccttaca tctaccgtaa actcctgcct atagaagaca gtcatatcaa ccgagtacca 1320
ttggtatcaa tttacatccc ggcctacaac tgtgctaact atattcaaag atgtgttgat 1380
tcagctttga atcaaacggt agttgatctc gaagtgtgca tttgcaacga cggtagtact 1440
gacaacacgc tggaagttat taacaagctg tatggtaata atccgcgtgt gcgtataatg 1500
tctaaaccca atggcggcat tgcgagtgca tccaacgcag cggtcagctt cgcaaagggt 1560
tattacatag gacagttgga cagcgacgat tacttagaac ccgacgcagt ggagttatgt 1620
ctcaaggaat ttcttaagga taagaccctt gcgtgcgttt acaccactaa tcgtaacgtc 1680
aacccagatg gctctttaat agccaatggc tataactggc cagagttcag tcgtgagaag 1740
ttgactacgg ccatgattgc tcatcacttc cggatgttta ccattcgtgc ttggcatctg 1800
acggatgggt tcaatgagaa gattgagaac gctgttgact acgacatgtt tctcaagctc 1860
agtgaagttg gtaaatttaa gcatctgaac aaaatatgtt ataatcgggt gttacacggc 1920
gataacacct caatcaagaa gcttggcata caaaagaaga atcatttcgt agttgtcaat 1980
cagtctctaa accgccaagg tataacttat tataactacg atgaatttga tgatctcgat 2040
gagagtcgga aatacatttt caacaagact gcagagtatc aagaagagat agatattctt 2100
aaagatatta agatcattca gaacaaagac gccaaaatag ctgtctccat tttctatccg 2160
aacactctaa acgggttggt gaagaagcta aataatatta tagagtataa taagaatatc 2220
ttcgttattg tacttcatgt cgataagaat cacttaaccc cagacatcaa gaaggagata 2280
ttagccttct accataagca tcaggtgaac atcttattga acaatgacat ctcctactat 2340
acatcaaatc gtctgattaa gacagaagcc catttgagta acattaacaa gctaagtcaa 2400
ttaaatctta actgcgaata cattatattc gacaatcacg attccttatt tgtgaagaac 2460
gattcctatg catacatgaa gaagtatgat gttggaatga acttctctgc attgactcat 2520
gattggattg aaaagataaa cgctcacccg ccatttaaga agctgatcaa aacttacttc 2580
aatgacaatg atcttaagtc gatgaatgta aagggtgcct cccagggaat gtttatgaca 2640
tacgcattag cccacgagtt attgacgatc atcaaggagg tgataacctc ttgtcaatcc 2700
attgactccg tccccgaata caacacagaa gatatttggt ttcagtttgc acttttaatt 2760
ctggaaaaga agaccggcca cgtattcaac aagacaagca ctctcacgta tatgccatgg 2820
gaacgtaaac tgcagtggac gaatgaacaa atagagtccg caaagagggg cgaaaacatt 2880
ccggtaaaca agttcatcat taacagcatt accctttaa 2919
<210> 2
<211> 2919
<212> DNA
<213> other sequences
<220>
<223> reencoded nucleic acid sequence of a polypeptide having a
chondroitin synthase activity (HCOS1-2)
<400> 2
atgaacaccc tttcccaggc aattaaggct tataatagta atgattatca actagccctc 60
aagctgttcg aaaagtcggc agaaatctac ggcagaaaga tagttgagtt ccaaattacg 120
aagtgcaagg agaaactttc tgcgcaccca tccgttaaca gtgcgcatct ctcggttaac 180
aaagaagaga aggtgaatgt ttgcgacagt ccattagaca tagccactca attattgtta 240
tcgaatgtga aaaaactcgt ccttagtgat agcgagaaaa atacactaaa gaataaatgg 300
aagttgttga ctgaaaagaa gtctgagaac gcagaggtcc gggccgtagc tttagttccc 360
aaggactttc cgaaagattt agtgcttgcg ccgttaccag accatgtgaa cgattttacg 420
tggtataaga agcggaagaa acgcctagga atcaaaccag tgaacaagaa catcgggttg 480
tcaatcataa tcccaacttt caatcgtagt aggatattag acatcaccct ggcttgcctc 540
gtcaatcaaa agacccatta tccttttgag gtgatcgtga ccgacgatgg ttctcaagag 600
gatttatcgc ctataatccg tcaatatgag aacaagctag acatccgtta tgttcggcaa 660
aaggactatg ggtatcagct gtgcgccgtt agaaaccttg gtctaaggac agcgaagtat 720
gactttgtct ctatcttgga ttgcgacatg gccccgcagc agctatgggt tcactcttac 780
cttacagaac tattagagga cgatgatttg accataatag gccccaggaa gtacattgac 840
acgcaacaca tagatcccaa ggatttcctt aataacgcct ctctgttaga gtcgttgcca 900
gaggttaaga ccaataattc cgtcgcggct aagggcgagg ggaccgtatc tttagactgg 960
cgtttggaac aatttgagaa gaccgagaac ttgaggctat ccgatagccc tttccgattc 1020
ttctcatgcg gaaatgtggc cttctccaaa gagtggctga acaaagttgg ctggttcgac 1080
gaggaattca atcactgggg aggtgaagat gtagagttcg gttatcgtct gtttcggtac 1140
ggttcgttct tcaaaactat agacggcatc atggcctatc atcaggaacc gccaggtaaa 1200
gaaaacgaaa ctgacagaga agcgggcaag aacattaccc tcgatataat gagggagaag 1260
gtgccttaca tctaccgtaa actcctgcct atagaagaca gtcatatcaa ccgagtacca 1320
ttggtatcaa tttacatccc ggcctacaac tgtgctaact atattcaaag atgtgttgat 1380
tcagctttga atcaaacggt agttgatctc gaagtgtgca tttgcaacga cggtagtact 1440
gacaacacgc tggaagttat taacaagctg tatggtaata atccgcgtgt gcgtataatg 1500
tctaaaccca atggcggcat tgcgagtgca tccaacgcag cggtcagctt cgcaaagggt 1560
tattacatag gacagttgga cagcgacgat tacttagaac ccgacgcagt ggagttatgt 1620
ctcaaggaat ttcttaagga taagaccctt gcgtgcgttt acaccactaa tcgtaacgtc 1680
aacccagatg gctctttaat agccaatggc tataactggc cagagttcag tcgtgagaag 1740
ttgactacgg ccatgattgc tcatcacttc cggatgttta ccattcgtgc ttggcatctg 1800
acggatgggt tcaatgagaa gattgagaac gctgttgact acgacatgtt tctcaagctc 1860
agtgaagttg gtaaatttaa gcatctgaac aaaatatgtt ataatcgggt gttacacggc 1920
gataacacct caatcaagaa gcttggcata caaaagaaga atcatttcgt agttgtcaat 1980
cagtctctaa accgccaagg tataacttat tataactacg atgaatttga tgatctcgat 2040
gagagtcgga aatacatttt caacaagact gcagagtatc aagaagagat agatattctt 2100
aaagatatta agatcattca gaacaaagac gccaaaatag ctgtctccat tttctatccg 2160
aacactctaa acgggttggt gaagaagcta aataatatta tagagtataa taagaatatc 2220
ttcgttattg tacttcatgt cgataagaat cacttaaccc cagacatcaa gaaggagata 2280
ttagccttct accataagca tcaggtgaac atcttattga acaatgacat ctcctactat 2340
acatcaaatc gtctgattaa gacagaagcc catttgagta acattaacaa gctaagtcaa 2400
ttaaatctta actgcgaata cattatattc gacaatcacg attccttatt tgtgaagaac 2460
gattcctatg catacatgaa gaagtatgat gttggaatga acttctctgc attgactcat 2520
gattggattg aaaagataaa cgctcacccg ccatttaaga agctgatcaa aacttacttc 2580
aatgacaatg atcttaagtc gatgaatgta aagggtgcct cccagggaat gtttatgaca 2640
tacgcattag cccacgagtt attgacgatc atcaaggagg tgataacctc ttgtcaatcc 2700
attgactccg tccccgaata caacacagaa gatatttggt ttcagtttgc acttttaatt 2760
ctggaaaaga agaccggcca cgtattcaac aagacaagca ctctcacgta tatgccatgg 2820
gaacgtaaac tgcagtggac gaatgaacaa atagagtccg caaagagggg cgaaaacatt 2880
ccggtaaaca agttcatcat taacagcatt accctttaa 2919
<210> 3
<211> 2919
<212> DNA
<213> other sequences
<220>
<223> reencoded nucleic acid sequence of a polypeptide having a
chondroitin synthase activity (HCOS1-3)
<400> 3
atgaacaccc tttcccaggc aattaaggct tataatagta atgattatca actagccctc 60
aagctgttcg aaaagtcggc agaaatctac ggcagaaaga tagttgagtt ccaaattacg 120
aagtgcaagg agaaactttc tgcgcaccca tccgttaaca gtgcgcatct ctcggttaac 180
aaagaagaga aggtgaatgt ttgcgacagt ccattagaca tagccactca attattgtta 240
tcgaatgtga aaaaactcgt ccttagtgat agcgagaaaa atacactaaa gaataaatgg 300
aagttgttga ctgaaaagaa gtctgagaac gcagaggtcc gggccgtagc tttagtccca 360
aaggattttc ccaaagactt agttttagcg ccactaccag accatgtgaa cgattttacc 420
tggtacaaga atagaaagaa gagcctgggc ataaagcctg tgaacaagaa catcgggttg 480
tcaatcataa tcccaacttt caatcgtagt aggatattag acattaccct ggcgtgtcta 540
gttaatcaga aaactaacta tccgtttgag gtggttgttg cagatgatgg gtcgaaggaa 600
aatctattga ctatagttca gaaatacgag cagaaactag acattaagta tgtgagacag 660
aaggactatg ggtatcagct gtgcgccgtt agaaaccttg gtctaaggac agcgaagtat 720
gactttgtct ctatcttgga ttgcgacatg gccccgcagc agctatgggt tcactcttac 780
cttacagagt tactggaaga caacgacatc gtcttgatcg ggccaaggaa atacgttgat 840
acccacaaca tcacggctga gcagtttctg aacgacccat atttaattga gagtttaccg 900
gaaaccgcca caaacaataa tccatcgatt accagtaagg gtaacatctc attagattgg 960
agattagaac attttaagaa gacagacaac ctaagactat gcgactcccc gttcaggtat 1020
ttctcatgcg gaaatgtggc cttctccaaa gagtggctga acaaagttgg ctggttcgac 1080
gaagaattta atcactgggg cggcgaagac gtcgaattcg gctacaggtt atttgcaaaa 1140
gggtgcttct ttagggttat cgacggtggt atggcctacc atcaagagcc accaggaaag 1200
gagaacgaaa cggatcgtga ggccggtaag tctatcactc ttaaaatagt aaaggagaaa 1260
gtgccctaca tctacaggaa gttgttgccg attgaggact cccacataaa ccgagtacca 1320
ttggtatcaa tttacatccc ggcctacaac tgtgctaact atattcaaag atgtgttgat 1380
tcagctttga atcaaacggt agttgatctc gaagtgtgca tttgcaacga cggtagtact 1440
gacaacacgc tggaagttat taacaagctg tatggtaata atccgcgtgt gcgtataatg 1500
tctaaaccca atggcggcat tgcgagtgca tccaacgcag cggtcagctt cgcaaagggt 1560
tattacatag gacagttgga cagcgacgat tacttagaac ccgacgcagt ggagttatgt 1620
ctcaaggaat ttcttaagga taagaccctt gcgtgcgttt acaccactaa tcgtaacgtc 1680
aacccagatg gctctttaat agccaatggc tataactggc cagagttcag tcgtgagaag 1740
ttgactacgg ccatgattgc tcatcacttc cggatgttta ccattcgtgc ttggcatctg 1800
acggatgggt tcaatgagaa gattgagaac gctgttgact acgacatgtt tctcaagctc 1860
agtgaagttg gtaaatttaa gcatctgaac aaaatatgtt ataatcgggt gttacacggc 1920
gataacacct caatcaagaa gcttggcata caaaagaaga atcatttcgt agttgtcaat 1980
cagtctctaa accgccaagg tataacttat tataactacg atgaatttga tgatctcgat 2040
gagagtcgga aatacatttt caacaagact gcagagtatc aagaagagat agatattctt 2100
aaagatatta agatcattca gaacaaagac gccaaaatag ctgtctccat tttctatccg 2160
aacactctaa acgggttggt gaagaagcta aataatatta tagagtataa taagaatatc 2220
ttcgttattg tacttcatgt cgataagaat cacttaaccc cagacatcaa gaaggagata 2280
ttagccttct accataagca tcaggtgaac atcttattga acaatgacat ctcctactat 2340
acatcaaatc gtctgattaa gacagaagcc catttgagta acattaacaa gctaagtcaa 2400
ttaaatctta actgcgaata cattatattc gacaatcacg attccttatt tgtgaagaac 2460
gattcctatg catacatgaa gaagtatgat gttggaatga acttctctgc attgactcat 2520
gattggattg aaaagataaa cgctcacccg ccatttaaga agctgatcaa aacttacttc 2580
aatgacaatg atcttaagtc gatgaatgta aagggtgcct cccagggaat gtttatgaca 2640
tacgcattag cccacgagtt attgacgatc atcaaggagg tgataacctc ttgtcaatcc 2700
attgactccg tccccgaata caacacagaa gatatttggt ttcagtttgc acttttaatt 2760
ctggaaaaga agaccggcca cgtattcaac aagacaagca ctctcacgta tatgccatgg 2820
gaacgtaaac tgcagtggac gaatgaacaa atagagtccg caaagagggg cgaaaacatt 2880
ccggtaaaca agttcatcat taacagcatt accctttaa 2919
<210> 4
<211> 3072
<212> DNA
<213> other sequences
<220>
<223> nucleic acid sequence of a polypeptide having chondroitin
synthase activity (HCOS.Sc)
<400> 4
atgaacaccc tttcccaggc aattaaggct tataatagta atgattatca actagccctc 60
aagctgttcg aaaagtcggc agaaatctac ggcagaaaga tagttgagtt ccaaattacg 120
aagtgcaagg agaaactttc tgcgcaccca tccgttaaca gtgcgcatct ctcggttaac 180
aaagaagaga aggtgaatgt ttgcgacagt ccattagaca tagccactca attattgtta 240
tcgaatgtga aaaaactcgt ccttagtgat agcgagaaaa atacactaaa gaataaatgg 300
aagttgttga ctgaaaagaa gtctgagaac gcagaggtcc gggccgtagc tttagtccca 360
aaggattttc ccaaagactt agttttagcg ccactaccag accatgtgaa cgattttacc 420
tggtacaaga atagaaagaa gagcctgggc ataaagcctg tgaacaagaa catcgggttg 480
tcaatcataa tcccaacttt caatcgtagt aggatattag acattaccct ggcgtgtcta 540
gttaatcaga aaactaacta tccgtttgag gtggttgttg cagatgatgg gtcgaaggaa 600
aatctattga ctatagttca gaaatacgag cagaaactag acattaagta tgtgagacag 660
aaggactatg ggtatcagct gtgcgccgtt agaaaccttg gtctaaggac agcgaagtat 720
gactttgtct ctatcttgga ttgcgacatg gccccgcagc agctatgggt tcactcttac 780
cttacagagt tactggaaga caacgacatc gtcttgatcg ggccaaggaa atacgttgat 840
acccacaaca tcacggctga gcagtttctg aacgacccat atttaattga gagtttaccg 900
gaaaccgcca caaacaataa tccatcgatt accagtaagg gtaacatctc attagattgg 960
agattagaac attttaagaa gacagacaac ctaagactat gcgactcccc gttcaggtat 1020
ttctcatgcg gaaatgtggc cttctccaaa gagtggctga acaaagttgg ctggttcgac 1080
gaagaattta atcactgggg cggcgaagac gtcgaattcg gctacaggtt atttgcaaaa 1140
gggtgcttct ttagggttat cgacggtggt atggcctacc atcaagagcc accaggaaag 1200
gagaacgaaa cggatcgtga ggccggtaag tctatcactc ttaaaatagt aaaggagaaa 1260
gtgccctaca tctacaggaa gttgttgccg attgaggact cccacataaa ccgagtacca 1320
ttggtatcaa tttacatccc ggcctacaac tgtgctaact atattcaaag atgtgttgat 1380
tcagctttga atcaaacggt agttgatctc gaagtgtgca tttgcaacga cggtagtact 1440
gacaacacgc tggaagttat taacaagctg tatggtaata atccgcgtgt gcgtataatg 1500
tctaaaccca atggcggcat tgcgagtgca tccaacgcag cggtcagctt cgcaaagggt 1560
tattacatag gacagttgga cagcgacgat tacttagaac ccgacgcagt ggagttatgt 1620
ctcaaggaat ttcttaagga taagaccctt gcgtgcgttt acaccactaa tcgtaacgtc 1680
aacccagatg gctctttaat agccaatggc tataactggc cagagttcag tcgtgagaag 1740
ttgactacgg ccatgattgc tcatcacttc cggatgttta ccattcgtgc ttggcatctg 1800
acggatgggt tcaatgagaa gattgagaac gctgttgact acgacatgtt tctcaagctc 1860
agtgaagttg gtaaatttaa gcatctgaac aaaatatgtt ataatcgggt gttacacggc 1920
gataacacct caatcaagaa gcttggcata caaaagaaga atcatttcgt agttgtcaat 1980
cagtctctaa accgccaagg tataacttat tataactacg atgaatttga tgatctcgat 2040
gagagtcgga aatacatttt caacaagact gcagagtatc aagaagagat agatattctt 2100
aaagatattt ttattcagat gcttttttcc tggttttcta ttgcaaattt cgttcttacc 2160
ttttattatt tagcaggatc aatgaattta gttattaaac atggtgaggc cttattcatt 2220
ttttttaaat acctgatctt ttgtgacttg gcaagtttat tcattatttc catgggtaat 2280
agaccccagg gcgcgaaaca tttattcatt acctccatgg ttatactgtc tatatgtgcc 2340
acatattctc taatttgtgg gtttgttttt gctttcaagt cgttagcttc tggaacggaa 2400
tcccacaaaa tatttgtcga catcgttatc tcattgctct ccacctatgg cctatacttt 2460
ttctcatcac tgatgtacct agatccttgg cacatgttta catcatccat acaatacttt 2520
ttgacacttc ccgcctttac gtgtacttta cagatttttg ccttctgtaa tacacacgac 2580
gtttcctggg gtactaaagg ttccacacag gagtccaagc aattgtccaa ggccattgtc 2640
gttcaaggtc cagatgggaa acagattgtg gaaacagatt ggcctcagga agttgataag 2700
aagtttttgg aaataaaaag tcgtttgaaa gaaccagaat ttgaagaatc aagcggcaat 2760
gaaaaacaat ccaagaatga ttattataga gatataagaa ccagaattgt gatgatttgg 2820
atgctatcaa atctaatact gatcatgtct ataattcaag tctttacacc acaagatact 2880
gacaatggtt atttgatatt cattttatgg tctgtggccg ctttagctgc ctttagggtg 2940
gttggttcca tggccttttt gttcatgaaa tacttgcgta taatagtgag ttacagaaat 3000
aaagttgaag gtagcggctc atgggaagtc tctaaattag acttaccaaa tgttttccac 3060
aaaaagggct aa 3072
<210> 5
<211> 3072
<212> DNA
<213> other sequences
<220>
<223> nucleic acid sequence of a polypeptide having chondroitin
synthase activity (HHASA.Sc)
<400> 5
atgaacaccc tttcccaggc aattaaggct tataatagta atgattatca actagccctc 60
aagctgttcg aaaagtcggc agaaatctac ggcagaaaga tagttgagtt ccaaattacg 120
aagtgcaagg agaaactttc tgcgcaccca tccgttaaca gtgcgcatct ctcggttaac 180
aaagaagaga aggtgaatgt ttgcgacagt ccattagaca tagccactca attattgtta 240
tcgaatgtga aaaaactcgt ccttagtgat agcgagaaaa atacactaaa gaataaatgg 300
aagttgttga ctgaaaagaa gtctgagaac gcagaggtcc gggccgtagc tttagttccc 360
aaggactttc cgaaagattt agtgcttgcg ccgttaccag accatgtgaa cgattttacg 420
tggtataaga agcggaagaa acgcctagga atcaaaccag aacaccaaca cgttggcctc 480
tccattattg tgacaacgtt caaccgtcct gccatcctca gcatcaccct ggcttgcctc 540
gtcaatcaaa agacccatta tccttttgag gtgatcgtga ccgacgatgg ttctcaagag 600
gatttatcgc ctataatccg tcaatatgag aacaagctag acatccgtta tgttcggcaa 660
aaggacaacg gttttcaggc atcggccgca cgtaatatgg gcctacgtct agccaaatat 720
gacttcattg ggctccttga ttgtgatatg gctcccaacc ctttgtgggt acactcatac 780
gttgcggaac tattagagga cgatgatttg accataatag gccccaggaa gtacattgac 840
acgcaacaca tagatcccaa ggatttcctt aataacgcct ctctgttaga gtcgttgcca 900
gaggttaaga ccaataattc cgtcgcggct aagggcgagg ggaccgtatc tttagactgg 960
cgtttggaac aatttgagaa gaccgagaac ttgaggctat ccgatagccc tttccgattc 1020
ttcgcagctg ggaatgtggc tttcgccaag aagtggctta acaagtcagg attcttcgac 1080
gaggaattca atcactgggg aggtgaagat gtagagttcg gttatcgtct gtttcggtac 1140
ggttcgttct tcaaaactat agacggcatc atggcctatc atcaggaacc gccaggtaaa 1200
gaaaacgaaa ctgacagaga agcgggcaag aacattaccc tcgatataat gagggagaag 1260
gtgccttaca tctaccgtaa actcctgcct atagaagaca gtcatatcaa ccgagtacca 1320
ttggtatcaa tttacatccc ggcctacaac tgtgctaact atattcaaag atgtgttgat 1380
tcagctttga atcaaacggt agttgatctc gaagtgtgca tttgcaacga cggtagtact 1440
gacaacacgc tggaagttat taacaagctg tatggtaata atccgcgtgt gcgtataatg 1500
tctaaaccca atggcggcat tgcgagtgca tccaacgcag cggtcagctt cgcaaagggt 1560
tattacatag gacagttgga cagcgacgat tacttagaac ccgacgcagt ggagttatgt 1620
ctcaaggaat ttcttaagga taagaccctt gcgtgcgttt acaccactaa tcgtaacgtc 1680
aacccagatg gctctttaat agccaatggc tataactggc cagagttcag tcgtgagaag 1740
ttgactacgg ccatgattgc tcatcacttc cggatgttta ccattcgtgc ttggcatctg 1800
acggatgggt tcaatgagaa gattgagaac gctgttgact acgacatgtt tctcaagctc 1860
agtgaagttg gtaaatttaa gcatctgaac aaaatatgtt ataatcgggt gttacacggc 1920
gataacacct caatcaagaa gcttggcata caaaagaaga atcatttcgt agttgtcaat 1980
cagtctctaa accgccaagg tataacttat tataactacg atgaatttga tgatctcgat 2040
gagagtcgga aatacatttt caacaagact gcagagtatc aagaagagat agatattctt 2100
aaagatattt ttattcagat gcttttttcc tggttttcta ttgcaaattt cgttcttacc 2160
ttttattatt tagcaggatc aatgaattta gttattaaac atggtgaggc cttattcatt 2220
ttttttaaat acctgatctt ttgtgacttg gcaagtttat tcattatttc catgggtaat 2280
agaccccagg gcgcgaaaca tttattcatt acctccatgg ttatactgtc tatatgtgcc 2340
acatattctc taatttgtgg gtttgttttt gctttcaagt cgttagcttc tggaacggaa 2400
tcccacaaaa tatttgtcga catcgttatc tcattgctct ccacctatgg cctatacttt 2460
ttctcatcac tgatgtacct agatccttgg cacatgttta catcatccat acaatacttt 2520
ttgacacttc ccgcctttac gtgtacttta cagatttttg ccttctgtaa tacacacgac 2580
gtttcctggg gtactaaagg ttccacacag gagtccaagc aattgtccaa ggccattgtc 2640
gttcaaggtc cagatgggaa acagattgtg gaaacagatt ggcctcagga agttgataag 2700
aagtttttgg aaataaaaag tcgtttgaaa gaaccagaat ttgaagaatc aagcggcaat 2760
gaaaaacaat ccaagaatga ttattataga gatataagaa ccagaattgt gatgatttgg 2820
atgctatcaa atctaatact gatcatgtct ataattcaag tctttacacc acaagatact 2880
gacaatggtt atttgatatt cattttatgg tctgtggccg ctttagctgc ctttagggtg 2940
gttggttcca tggccttttt gttcatgaaa tacttgcgta taatagtgag ttacagaaat 3000
aaagttgaag gtagcggctc atgggaagtc tctaaattag acttaccaaa tgttttccac 3060
aaaaagggct aa 3072
<210> 6
<211> 1719
<212> DNA
<213> other sequences
<220>
<223> nucleic acid sequence of a polypeptide having chondroitin
synthase activity (HCOS1-Vir)
<400> 6
atgggtaaga acatcattat tatggtttct tggtacacta ttattacatc caatctcatc 60
gcagtgggtg gcgcctcact catactagcc ccagctatta cgggctatgt ccttcactgg 120
aacattgccc tttcaacaat ttggggagtg tcggcctacg gaattttcgt gtttggtttc 180
tttcttgccc aggtattatt tagtgaactc aaccggaaaa ggctccggaa gtggatttcc 240
ctccgaccca aagggtggaa tgatgttagg ttggctgtaa ttattgccgg ctaccgtgag 300
gacccgtata tgttccaaaa gtgtcttgaa agtgtgcgtg actcagacta tgggaatgta 360
gctagactaa tatgcgttat tgacggcgat gaagacgacg acatgaggat ggctgcagtg 420
tacaaggcta tctataacga caacatcaag aaacctgagt ttgtcctctg tgagagtgac 480
gataaggagg gtgagagaat agatagcgat ttcagccgtg atatctgcgt gctgcaaccg 540
catcgcggaa agcgtgaatg tttgtacaca gggttccaat tggcaaagat ggacccctca 600
gttaatgccg tcgtcctaat cgacagtgac actgtgttag aaaaggacgc gattctcgaa 660
gtagtatacc cgctggcatg cgatccagaa atacaggctg tagcaggcga atgcaaaata 720
tggaatactg acacactgtt gagtttgctg gtagcctggc gatattacag cgcattttgc 780
gtagagcgta gcgcccaatc attcttcagg acagtacaat gcgtcggagg acctctcggc 840
gcctacaaga ttgatataat taaggaaatc aaggacccat ggatcagcca acgtttcctt 900
ggccaaaagt gcacatacgg cgacgataga cgactcacta atgaaatact aatgaggggt 960
aagaaagtag ttttcacccc attcgctgtt ggctggggat ggttcgacga ggagttcaca 1020
cactggggtg gccgttacat tgtacagcaa acacggtggt ccaagtcgtg gtgtagggag 1080
atatggtata cactgtttgc agcatggaag catggacttt cgggcatttg gctcgcattc 1140
gagtgcttat accagattac ttatttcttc ctggtgattt acctattctc ccgtttggct 1200
gttgaggctg acccacgggc gcaaacggcc accgtcattg tttcgaccac agttgcgctt 1260
attaagtgcg gttactttag cttcagagct aaagacatta gggccttcta tttcgtcctc 1320
tacacgttcg tttacttctt ctgcatgatt ccggcacgaa taactgcgat gatgaccctg 1380
tgggacatag gttggggaac caggggagga aatgagaagc cttccgtagg caccagagtt 1440
gctttgtggg ccaagcaata tttgattgct tacatgtggt gggccgctgt cgtcggtgct 1500
ggcgtgtact ccatcgttca taattggatg tttgactgga attcactttc ctacaggttc 1560
gcactggtag gcatctgttc gtatatagtt ttcattgtaa tagtgctggt agtctacttt 1620
acaggaaaga tcacgacctg gaacttcacg aagctacaga aagaattgat cgaggaccgc 1680
gtactgtacg acgcaacgac caatgcccag tcggtataa 1719
<210> 7
<211> 1716
<212> DNA
<213> other sequences
<220>
<223> reencoded nucleic acid sequence of a polypeptide having
chondroitin synthase activity (HCOS2-Vir)
<400> 7
atgggtaaga acatcattat tatggtttct tggtacacta ttattacatc caatctcatc 60
gcagtgggtg gcgcctcact catactagcc ccagctatta cgggctatgt ccttcactgg 120
aacattgccc tttcaacaat ttggggagtg tcggcctacg gaattttcgt gtttggtttc 180
tttcttgccc aggtattatt tagtgaactc aaccggaaaa ggctccggaa gtggatttcc 240
ctccgaccca aagggtggaa tgatgttagg ttggctgtaa ttattgccgg ctaccgtgag 300
gacccgtata tgttccaaaa gtgtcttgaa agtgtgcgtg actcagacta tgggaatgta 360
gctagactaa tatgcgttat tgacggcgat gaagacgacg acatgaggat ggctgcagtg 420
tacaaggcta tctataacga caacatcaag aaacctgagt ttgtcctctg tgagagtgac 480
gataaggagg gtgagagaat agatagcgat ttcagccgtg atatctgcgt gctgcaaccg 540
catcgcggaa agcgtgaatg tttgtacaca gggttccaat tggcaaagat ggacccctca 600
gttaatgccg tcgtcctaat cgacagtgac actgtgttag aaaaggacgc gattctcgaa 660
gtagtatacc cgctggcatg cgatccagaa atacaggctg tagcaggcga atgcaaaata 720
tggaatactg acacactgtt gagtttgctg gtagcctggc gatattacag cgcattttgc 780
gtagagcgta gcgcccaatc attcttcagg acagtacaat gcgtcggagg acctctcggc 840
gcctacaaga ttgatataat taaggaaatc aaggacccat ggatcagcca acgtttcctt 900
ggccaaaagt gcacatacgg cgacgataga cgactcacta atgaaatact aatgaggggt 960
aagaaagtag ttttcacccc attcgctgtt ggctggctac acggtgagaa tacgtctatc 1020
aagaagttac gttacattgt acagcaaaca cggtggtcca agtcgtggtg tagggagata 1080
tggtatacac tgtttgcagc atggaagcat ggactttcgg gcatttggct cgcattcgag 1140
tgcttatacc agattactta tttcttcctg gtgatttacc tattctcccg tttggctgtt 1200
gaggctgacc cacgggcgca aacggccacc gtcattgttt cgaccacagt tgcgcttatt 1260
aagtgcggtt actttagctt cagagctaaa gacattaggg ccttctattt cgtcctctac 1320
acgttcgttt acttcttctg catgattccg gcacgaataa ctgcgatgat gaccctgtgg 1380
gacataggtt ggggaaccag gggaggaaat gagaagcctt ccgtaggcac cagagttgct 1440
ttgtgggcca agcaatattt gattgcttac atgtggtggg ccgctgtcgt cggtgctggc 1500
gtgtactcca tcgttcataa ttggatgttt gactggaatt cactttccta caggttcgca 1560
ctggtaggca tctgttcgta tatagttttc attgtaatag tgctggtagt ctactttaca 1620
ggaaagatca cgacctggaa cttcacgaag ctacagaaag aattgatcga ggaccgcgta 1680
ctgtacgacg caacgaccaa tgcccagtcg gtataa 1716
<210> 8
<211> 1719
<212> DNA
<213> other sequences
<220>
<223> reencoded nucleic acid sequence of a polypeptide having
chondroitin synthase activity (HCOS3-Vir)
<400> 8
atgggtaaga acatcattat tatggtttct tggtacacta ttattacatc caatctcatc 60
gcagtgggtg gcgcctcact catactagcc ccagctatta cgggctatgt ccttcactgg 120
aacattgccc tttcaacaat ttggggagtg tcggcctacg gaattttcgt gtttggtttc 180
tttcttgccc aggtattatt tagtgaactc aaccggaaaa ggctccggaa gtggatttcc 240
ctccgaccca aagggtggaa tgatgttagg ttggctgtaa ttattgccgg ctaccgtgag 300
gacccgtata tgttccaaaa gtgtcttgaa agtgtgcgtg actcagacta tgggaatgta 360
gctagactaa tatgcgttat tgacggcgat gaagacgacg acatgaggat ggctgcagtg 420
tacaaggcta tctataacga caacatcaag aaacctgagt ttgtcctctg tgagagtgac 480
gataaggagg gtgagagaat agatagcgat ttcagccgtg atatctgcgt gctgcaaccg 540
catcgcggaa agcgtgaatg tttgtacaca gggttccaat tggcaaagat ggacccctca 600
gttaatgccg tcgtcctaat cgacagtgac actgtgttag aaaaggacgc gattctcgaa 660
gtagtatacc cgctggcatg cgatccagaa atacaggctg tagcaggcga atgcaaaata 720
tggaatactg acacactgtt gagtttgctg gtagcctggc gatattacag cgcattttgc 780
gtagagcgta gcgcccaatc attcttcagg acagtacaat gcgtcggagg acctctcggc 840
gcctacaaga ttgatataat taaggaaatc aaggacccat ggatcagcca acgtttcctt 900
ggccaaaagt gcacatacgg cgacgataga cgactcacta atgaaatact aatgaggggt 960
aagaaagtag ttttcacccc attcgctgtt ggctggcaca tggcatggtc cgacaaggac 1020
gacgcaatcg accgttacat tgtacagcaa acacggtggt ccaagtcgtg gtgtagggag 1080
atatggtata cactgtttgc agcatggaag catggacttt cgggcatttg gctcgcattc 1140
gagtgcttat accagattac ttatttcttc ctggtgattt acctattctc ccgtttggct 1200
gttgaggctg acccacgggc gcaaacggcc accgtcattg tttcgaccac agttgcgctt 1260
attaagtgcg gttactttag cttcagagct aaagacatta gggccttcta tttcgtcctc 1320
tacacgttcg tttacttctt ctgcatgatt ccggcacgaa taactgcgat gatgaccctg 1380
tgggacatag gttggggaac caggggagga aatgagaagc cttccgtagg caccagagtt 1440
gctttgtggg ccaagcaata tttgattgct tacatgtggt gggccgctgt cgtcggtgct 1500
ggcgtgtact ccatcgttca taattggatg tttgactgga attcactttc ctacaggttc 1560
gcactggtag gcatctgttc gtatatagtt ttcattgtaa tagtgctggt agtctacttt 1620
acaggaaaga tcacgacctg gaacttcacg aagctacaga aagaattgat cgaggaccgc 1680
gtactgtacg acgcaacgac caatgcccag tcggtataa 1719
<210> 9
<211> 1713
<212> DNA
<213> other sequences
<220>
<223> reencoded nucleic acid sequence of a polypeptide having
chondroitin synthase activity (HCOS4-Vir)
<400> 9
atgggtaaga acatcattat tatggtttct tggtacacta ttattacatc caatctcatc 60
gcagtgggtg gcgcctcact catactagcc ccagctatta cgggctatgt ccttcactgg 120
aacattgccc tttcaacaat ttggggagtg tcggcctacg gaattttcgt gtttggtttc 180
tttcttgccc aggtattatt tagtgaactc aaccggaaaa ggctccggaa gtggatttcc 240
ctccgaccca aagggtggaa tgatgttagg ttggctgtaa ttattgccgg ctaccgtgag 300
gacccgtata tgttccaaaa gtgtcttgaa agtgtgcgtg actcagacta tgggaatgta 360
gctagactaa tatgcgttat tgacggcgat gaagacgacg acatgaggat ggctgcagtg 420
tacaaggcta tctataacga caacatcaag aaacctgagt ttgtcctctg tgagagtgac 480
gataaggagg gtgagagaat agatagcgat ttcagccgtg atatctgcgt gctgcaaccg 540
catcgcggaa agcgtgaatg tttgtacaca gggttccaat tggcaaagat ggacccctca 600
gttaatgccg tcgtcctaat cgacagtgac actgtgttag aaaaggacgc gattctcgaa 660
gtagtatacc cgctggcatg cgatccagaa atacaggctg tagcaggcga atgcaaaata 720
tggaatactg acacactgtt gagtttgctg gtagcctggc gatattacag cgcattttgc 780
gtagagcgta gcgcccaatc attcttcagg acagtacaat gcgtcggagg acctctcggc 840
gcctacaaga ttgatataat taaggaaatc aaggacccat ggatcagcca acgtttcctt 900
ggccaaaagt gcacatacgg cgacgataga cgactcacta atgaaatact aatgaggggt 960
aagaaagtag ttttcacccc attcgctgtt ggctggttcg acgaggagtt cacacactgg 1020
ggtggccgtt acattgtaca gcaaacacgg tggtccaagt cgtggtgtag ggagatatgg 1080
tatacactgt ttgcagcatg gaagcatgga ctttcgggca tttggctcgc attcgagtgc 1140
ttataccaga ttacttattt cttcctggtg atttacctat tctcccgttt ggctgttgag 1200
gctgacccac gggcgcaaac ggccaccgtc attgtttcga ccacagttgc gcttattaag 1260
tgcggttact ttagcttcag agctaaagac attagggcct tctatttcgt cctctacacg 1320
ttcgtttact tcttctgcat gattccggca cgaataactg cgatgatgac cctgtgggac 1380
ataggttggg gaaccagggg aggaaatgag aagccttccg taggcaccag agttgctttg 1440
tgggccaagc aatatttgat tgcttacatg tggtgggccg ctgtcgtcgg tgctggcgtg 1500
tactccatcg ttcataattg gatgtttgac tggaattcac tttcctacag gttcgcactg 1560
gtaggcatct gttcgtatat agttttcatt gtaatagtgc tggtagtcta ctttacagga 1620
aagatcacga cctggaactt cacgaagcta cagaaagaat tgatcgagga ccgcgtactg 1680
tacgacgcaa cgaccaatgc ccagtcggta taa 1713
<210> 10
<211> 2079
<212> DNA
<213> other sequences
<220>
<223> nucleic acid sequence of a polypeptide having chondroitin
synthase activity (HCOS5-Vir)
<400> 10
atgggtaaga acatcattat tatggtttct tggtacacta ttattacatc caatctcatc 60
gcagtgggtg gcgcctcact catactagcc ccagctatta cgggctatgt ccttcactgg 120
aacattgccc tttcaacaat ttggggagtg tcggcctacg gaattttcgt gtttggtttc 180
tttcttgccc aggtattatt tagtgaactc aaccggaaaa ggctccggaa gtggatttcc 240
ctccgaccca aatccattca ccatccaatt tcgaaaacga ctcaccccga cacagaaaat 300
gcaggtgact caacattgtt gtgcccgccc atggatggta tggacgacat attagtcgtt 360
atgaagacag gtgtcacaga ggctaaggaa aaggtgccag tacattttca gacaacgctg 420
aggtgtgtgc cgcactacgt tatctatagc gacttcgaag aagagataga aggtgtaaag 480
atttacgacg tcttgcaagg aatggacccc gatgttatga cgcaggttcc ggacttcgat 540
ctttacaatc gtattaagaa gttagggcgt cagggccttg cggagaacga cttcgcggac 600
gaagcgaact ctgcggtggg taagcctaat aaccctggtt ggaagttaga taaatggaag 660
ttcttaccta tgatcattga ggctctgaga tacaaaccaa aggctaagtg gtatgttttc 720
atggaagcag acacttatat atcttggccg actttattag cctggctaaa acacttcaac 780
cacaagaagc cgtggtatct tggcactgag acacagatag ccgatgtgat tttcgctcat 840
ggtggttcag gattcatgat tagtcatgcc gcgcttaagc ttgctgctga agaatatacc 900
gcacgtcgta ctgagttgca ccactacaca gacggtcact gggcaggaga ctgcgtatta 960
ggtaaagttc ttgctgacgc aggtgtgaac ttgcatttct cctggccaat tttacagaat 1020
tccaatctgg gcgaactgga tgagttcaac gttgacttat acaggcaacc ttggtgcttt 1080
ccagctgccg ctttccacca cttgaacgct cagaagatcc aggacttatg gtcttacgag 1140
cagaaaaggt ggcaggacaa ggacaagagg gttctgttac atagcgacgt cttcagggac 1200
ctattatatc cggatatagc attaaaaccc gcgaggatcg gttgggacaa cctgagtgca 1260
gacgaacagt ctacggcctc tagtttcgag gaatgcaggc aaatttgtga tcaattagac 1320
gattgtaccc agtttagttt cagggacaaa tcctgtttta catcaagaac tccacgtttg 1380
ggcgcagcca atccaaatac agttagcgga tggatggttg atcgtatccg tgcgaatatg 1440
gagaagtctg gactgtttgc agcatggaag catggacttt cgggcatttg gctcgcattc 1500
gagtgcttat accagattac ttatttcttc ctggtgattt acctattctc ccgtttggct 1560
gttgaggctg acccacgggc gcaaacggcc accgtcattg tttcgaccac agttgcgctt 1620
attaagtgcg gttactttag cttcagagct aaagacatta gggccttcta tttcgtcctc 1680
tacacgttcg tttacttctt ctgcatgatt ccggcacgaa taactgcgat gatgaccctg 1740
tgggacatag gttggggaac caggggagga aatgagaagc cttccgtagg caccagagtt 1800
gctttgtggg ccaagcaata tttgattgct tacatgtggt gggccgctgt cgtcggtgct 1860
ggcgtgtact ccatcgttca taattggatg tttgactgga attcactttc ctacaggttc 1920
gcactggtag gcatctgttc gtatatagtt ttcattgtaa tagtgctggt agtctacttt 1980
acaggaaaga tcacgacctg gaacttcacg aagctacaga aagaattgat cgaggaccgc 2040
gtactgtacg acgcaacgac caatgcccag tcggtataa 2079
<210> 11
<211> 2733
<212> DNA
<213> other sequences
<220>
<223> nucleic acid sequence of a polypeptide having chondroitin
synthase activity (HCOS6-Vir)
<400> 11
atgggtaaga acatcattat tatggtttct tggtacacta ttattacatc caatctcatc 60
gcagtgggtg gcgcctcact catactagcc ccagctatta cgggctatgt ccttcactgg 120
aacattgccc tttcaacaat ttggggagtg tcggcctacg gaattttcgt gtttggtttc 180
tttcttgccc aggtattatt tagtgaactc aaccggaaaa ggctccggaa gtggatttcc 240
ctccgaccca aattagacat tgcaacacag ttattactat cgaatgttaa gaaattgacc 300
ttaagcgagt ccgaaaagaa cagcttaaag aataagtgga agagtataac aggcaagaag 360
tccgagaatg ctgaaattag gaaggttgag ttagtcccaa aggattttcc caaagactta 420
gttttagcgc cactaccaga ccatgtgaac gattttacct ggtacaagaa tagaaagaag 480
agcctgggca taaagcctgt gaacaagaac atcgggttgt caatcataat cccaactttc 540
aatcgtagta ggatattaga cattaccctg gcgtgtctag ttaatcagaa aactaactat 600
ccgtttgagg tggttgttgc agatgatggg tcgaaggaaa atctattgac tatagttcag 660
aaatacgagc agaaactaga cattaagtat gtgagacaga aggactatgg gtatcagctg 720
tgcgccgtta gaaaccttgg tctaaggaca gcgaagtatg actttgtctc tatcttggat 780
tgcgacatgg ccccgcagca gctatgggtt cactcttacc ttacagagtt actggaagac 840
aacgacatcg tcttgatcgg gccaaggaaa tacgttgata cccacaacat cacggctgag 900
cagtttctga acgacccata tttaattgag agtttaccgg aaaccgccac aaacaataat 960
ccatcgatta ccagtaaggg taacatctca ttagattgga gattagaaca ttttaagaag 1020
acagacaacc taagactatg cgactccccg ttcaggtatt tctcatgcgg aaatgtggcc 1080
ttctccaaag agtggctgaa caaagttggc tggttcgacg aagaatttaa tcactggggc 1140
ggcgaagacg tcgaattcgg ctacaggtta tttgcaaaag ggtgcttctt tagggttatc 1200
gacggtggta tggcctacca tcaagagcca ccaggaaagg agaacgaaac ggatcgtgag 1260
gccggtaagt ctatcactct taaaatagta aaggagaaag tgccctacat ctacaggaag 1320
ttgttgccga ttgaggactc ccacatacac cgtataccgc ttgtgagcat atacattcca 1380
gcgtacaact gcgccaatta tattcaaagg tgtgtagata gcgcgttgaa tcaaacagtg 1440
gtagatttgg aagtttgtat atgtaacgac ggaagtactg acaatacttt agaggtgatt 1500
aacaagctgt atggcaacaa cccgcgtgtc aggataatga gcaagcccaa tggtggaatt 1560
gcttccgcgt ctaacgctgc cgtttcattc gcgaaaggct actacattgg ccagttggac 1620
tcggatgatt acttggaacc tgacgcagtg gagctttgtt taaaggagtt cttgaaggac 1680
aaaacactag cctgtgtata tacaacgaac agaaatgtta atcctgacgg ttccctaatc 1740
gctaacggat acaattggcc tgagttcagc agggagaagc tgaccactgc tatgatcgcc 1800
caccatttca ggatgttcac aatcagggct tggcatttaa cagatggttt taatgagaaa 1860
atagagaacg cagtagacta cgatatgttt ctgaagttat cagaggtcgg gaaattcaaa 1920
cacttgaaca aaatttgtta caatagggta ttacacggtg acaacaccag tattaagaat 1980
cttgacaccc aaaagaagaa ccacttcgta gtagtgaacc agtctctgaa cagacaaagg 2040
gtgtcgaatt ataactacga tgagtttgat aacctggacg agagccgtaa gtacatattc 2100
aacaagctgt ttgcagcatg gaagcatgga ctttcgggca tttggctcgc attcgagtgc 2160
ttataccaga ttacttattt cttcctggtg atttacctat tctcccgttt ggctgttgag 2220
gctgacccac gggcgcaaac ggccaccgtc attgtttcga ccacagttgc gcttattaag 2280
tgcggttact ttagcttcag agctaaagac attagggcct tctatttcgt cctctacacg 2340
ttcgtttact tcttctgcat gattccggca cgaataactg cgatgatgac cctgtgggac 2400
ataggttggg gaaccagggg aggaaatgag aagccttccg taggcaccag agttgctttg 2460
tgggccaagc aatatttgat tgcttacatg tggtgggccg ctgtcgtcgg tgctggcgtg 2520
tactccatcg ttcataattg gatgtttgac tggaattcac tttcctacag gttcgcactg 2580
gtaggcatct gttcgtatat agttttcatt gtaatagtgc tggtagtcta ctttacagga 2640
aagatcacga cctggaactt cacgaagcta cagaaagaat tgatcgagga ccgcgtactg 2700
tacgacgcaa cgaccaatgc ccagtcggta taa 2733
<210> 12
<211> 2112
<212> DNA
<213> other sequences
<220>
<223> reencoded nucleic acid sequence of a polypeptide having
chondroitin synthase activity (HCOS7-Vir)
<400> 12
atgggtaaga acatcattat tatggtttct tggtacacta ttattacatc caatctcatc 60
gcagtgggtg gcgcctcact catactagcc ccagctatta cgggctatgt ccttcactgg 120
aacattgccc tttcaacaat ttggggagtg tcggcctacg gaattttcgt gtttggtttc 180
tttcttgccc aggtattatt tagtgaactc aaccggaaaa ggctccggaa gtggatttcc 240
ctccgaccca aaatcccaac tttcaatcgt agtaggatat tagacattac cctggcgtgt 300
ctagttaatc agaaaactaa ctatccgttt gaggtggttg ttgcagatga tgggtcgaag 360
gaaaatctat tgactatagt tcagaaatac gagcagaaac tagacattaa gtatgtgaga 420
cagaaggact atgggtatca gctgtgcgcc gttagaaacc ttggtctaag gacagcgaag 480
tatgactttg tctctatctt ggattgcgac atggccccgc agcagctatg ggttcactct 540
taccttacag agttactgga agacaacgac atcgtcttga tcgggccaag gaaatacgtt 600
gatacccaca acatcacggc tgagcagttt ctgaacgacc catatttaat tgagagttta 660
ccggaaaccg ccacaaacaa taatccatcg attaccagta agggtaacat ctcattagat 720
tggagattag aacattttaa gaagacagac aacctaagac tatgcgactc cccgttcagg 780
tatttctcat gcggaaatgt ggccttctcc aaagagtggc tgaacaaagt tggctggttc 840
gacgaagaat ttaatcactg gggcggcgaa gacgtcgaat tcggctacag gttatttgca 900
aaagggtgct tctttagggt tatcgacggt ggtatggcct accatcaaga gccaccagga 960
aaggagaacg aaacggatcg tgaggccggt aagtctatca ctcttaaaat agtaaaggag 1020
aaagtgccct acatctacag gaagttgttg ccgattgagg actcccacat acaccgtata 1080
ccgcttgtga gcatatacat tccagcgtac aactgcgcca attatattca aaggtgtgta 1140
gatagcgcgt tgaatcaaac agtggtagat ttggaagttt gtatatgtaa cgacggaagt 1200
actgacaata ctttagaggt gattaacaag ctgtatggca acaacccgcg tgtcaggata 1260
atgagcaagc ccaatggtgg aattgcttcc gcgtctaacg ctgccgtttc attcgcgaaa 1320
ggctactaca ttggccagtt ggactcggat gattacttgg aacctgacgc agtggagctt 1380
tgtttaaagg agttcttgaa ggacaaaaca ctagcctgtg tatatacaac gaacagaaat 1440
gttaatcctg acggttccct aatcgctaac ggatacaatt ggcctctgtt tgcagcatgg 1500
aagcatggac tttcgggcat ttggctcgca ttcgagtgct tataccagat tacttatttc 1560
ttcctggtga tttacctatt ctcccgtttg gctgttgagg ctgacccacg ggcgcaaacg 1620
gccaccgtca ttgtttcgac cacagttgcg cttattaagt gcggttactt tagcttcaga 1680
gctaaagaca ttagggcctt ctatttcgtc ctctacacgt tcgtttactt cttctgcatg 1740
attccggcac gaataactgc gatgatgacc ctgtgggaca taggttgggg aaccagggga 1800
ggaaatgaga agccttccgt aggcaccaga gttgctttgt gggccaagca atatttgatt 1860
gcttacatgt ggtgggccgc tgtcgtcggt gctggcgtgt actccatcgt tcataattgg 1920
atgtttgact ggaattcact ttcctacagg ttcgcactgg taggcatctg ttcgtatata 1980
gttttcattg taatagtgct ggtagtctac tttacaggaa agatcacgac ctggaacttc 2040
acgaagctac agaaagaatt gatcgaggac cgcgtactgt acgacgcaac gaccaatgcc 2100
cagtcggtat aa 2112
<210> 13
<211> 1710
<212> DNA
<213> other sequences
<220>
<223> reencoded nucleic acid sequence of a polypeptide having
chondroitin synthase activity (HCOS8-Vir)
<400> 13
atgggtaaga acatcattat tatggtttct tggtacacta ttattacatc caatctcatc 60
gcagtgggtg gcgcctcact catactagcc ccagctatta cgggctatgt ccttcactgg 120
aacattgccc tttcaacaat ttggggagtg tcggcctacg gaattttcgt gtttggtttc 180
tttcttgccc aggtattatt tagtgaactc aaccggaaaa ggctccggaa gtggatttcc 240
ctccgaccca aagggtggaa tgatgttagg ttggctgtaa ttattgccgg ctaccgtgag 300
gacccgtata tgttccaaaa gtgtcttgaa agtgtgcgtg actcagacta tgggaatgta 360
gctagactaa tatgcgttat tgacggcgat gaagacgacg acatgaggat ggctgcagtg 420
tacaaggcta tctataacga caacatcaag aaacctgagt ttgtcctctg tgagagtgac 480
gataaggagg gtgagagaat agatagcgat ttcagccgtg atatctgcgt gctgcaaccg 540
catcgcggaa agcgtgaatg tttgtacaca gggttccaat tggcaaagat ggacccctca 600
gttaatgccg tcgtcctaat cgacagtgac actgtgttag aaaaggacgc gattctcgaa 660
gtagtatacc cgctggcatg cgatccagaa atacaggctg tagcaggcga atgcaaaata 720
tggaatactg acacactgtt gagtttgctg gtagcctggc gatattacag cgcattttgc 780
gtagagcgta gcgcccaatc attcttcagg acagtacaat gcgtcagact atgcgactcc 840
ccgttcaggt atttctcatg cggaaatgtg gccttctcca aagagtggct gaacaaagtt 900
ggctggttcg acgaagaatt taatcactgg ggcggcgaag acgtcgaatt cggctacagg 960
ttaaagaaag tagttttcac cccattcgct gttggctggt ccgacagccc gacgaacgtc 1020
ttccgttaca ttgtacagca aacacggtgg tccaagtcgt ggtgtaggga gatatggtat 1080
acactgtttg cagcatggaa gcatggactt tcgggcattt ggctcgcatt cgagtgctta 1140
taccagatta cttatttctt cctggtgatt tacctattct cccgtttggc tgttgaggct 1200
gacccacggg cgcaaacggc caccgtcatt gtttcgacca cagttgcgct tattaagtgc 1260
ggttacttta gcttcagagc taaagacatt agggccttct atttcgtcct ctacacgttc 1320
gtttacttct tctgcatgat tccggcacga ataactgcga tgatgaccct gtgggacata 1380
ggttggggaa ccaggggagg aaatgagaag ccttccgtag gcaccagagt tgctttgtgg 1440
gccaagcaat atttgattgc ttacatgtgg tgggccgctg tcgtcggtgc tggcgtgtac 1500
tccatcgttc ataattggat gtttgactgg aattcacttt cctacaggtt cgcactggta 1560
ggcatctgtt cgtatatagt tttcattgta atagtgctgg tagtctactt tacaggaaag 1620
atcacgacct ggaacttcac gaagctacag aaagaattga tcgaggaccg cgtactgtac 1680
gacgcaacga ccaatgccca gtcggtataa 1710
<210> 14
<211> 2499
<212> DNA
<213> other sequences
<220>
<223> a nucleic acid sequence of a polypeptide having chondroitin
synthase activity (HCOS9-Vir)
<400> 14
atgggtaaga acatcattat tatggtttct tggtacacta ttattacatc caatctcatc 60
gcagtgggtg gcgcctcact catactagcc ccagctatta cgggctatgt ccttcactgg 120
aacattgccc tttcaacaat ttggggagtg tcggcctacg gaattttcgt gtttggtttc 180
tttcttgccc aggtattatt tagtgaactc aaccggaaaa ggctccggaa gtggatttcc 240
ctccgaccca aacacattgg taagtgtcta agggaaatgt atacgactca tgaggacgtg 300
gaagtaggaa gatgcgttag gagattcgct ggagtacagt gtgtttggtc ttacgagatg 360
caacagttat tctacgagaa ctacgagcag aataagaagg gatacatccg tgatctgcac 420
aactccaaaa ttcaccaagc aataacgctg catcctaaca agaatccgcc ctatcagtat 480
aggttgcact cttacatgtt gagtagaaag atatctgagc tacgtcatag aactattcag 540
ttgcacaggg agatagtact gatgtctaaa tactcaaaca cggagatcca taaggaagac 600
ctacagttgg gtataccacc ttcgttcatg agattccagc caagacagag ggaagaaatt 660
ttggagtggg agttcttgac tggtaaatac ttgtattctg ctgttgacgg tcaaccacct 720
aggagaggga tggactctgc acagcgtgag gctttagacg atatagtgat gcaagtaatg 780
gaaatgatca acgctaatgc aaagacacgt ggtcgtatca tagatttcaa agagatccag 840
tatggatatc gtcgtgtgaa cccaatgtac ggcgcggagt atattcttga cttattgttg 900
ctatacaaga aacataaggg taagaagatg actgtcccgg ttcgtaggca cgcgtatttg 960
caacagactt tctcgaaaat acagtttgta gagcatgagg aacttgacgc gcaagagtta 1020
gcgaaacgta taaaccaaga gtcggggagt ttatccttct taagtaattc ccttaagaag 1080
ttggttcctt tccagctgcc tggaagtaaa agtgagcaca aggagccaaa ggataagaaa 1140
atcaacattc ttatacctct ttccggcaga ttcgacatgt tcgttaggtt catgggtaac 1200
ttcgagaaga cctgcttaat tcctaaccag aatgttaagt tggtagtttt gttattcaat 1260
tctgacagta accccgacaa agcaaagcag gttgaactga tgagagacta taggattaag 1320
tacccaaaag cagatatgca gatactacct gtttccggag aattctcaag agccttggct 1380
ctggaagtag gcagctctca gtttaataat gagtctcttc tgttcttctg cgacgttgac 1440
ttagttttca cgacagagtt tctgcagaga tgtcgtgcaa acactgtact aggtcagcag 1500
atatatttcc ccattatttt cagtcagtac gatccaaaga ttgtttatag tggaaaagtt 1560
ccatctgaca accattttgc gtttactcaa aagacagggt tttggcgtaa ctacgggttc 1620
ggcataacat gtatctataa aggggacctg gtaagagttg gcggattcga cgtatctata 1680
cagggctggg gtttagaaga cgtcgatcta tttaataaag tagttcaggc aggtttgaag 1740
acattccgta gtcaagaggt aggcgttgta cacgtgcacc atccagtatt ttgcgaccca 1800
aacttagacc cgaagcaata taaaatgtgc ttgggttcca aggcatcgac ttacggttcc 1860
acgcagcaac tactgtttgc agcatggaag catggacttt cgggcatttg gctcgcattc 1920
gagtgcttat accagattac ttatttcttc ctggtgattt acctattctc ccgtttggct 1980
gttgaggctg acccacgggc gcaaacggcc accgtcattg tttcgaccac agttgcgctt 2040
attaagtgcg gttactttag cttcagagct aaagacatta gggccttcta tttcgtcctc 2100
tacacgttcg tttacttctt ctgcatgatt ccggcacgaa taactgcgat gatgaccctg 2160
tgggacatag gttggggaac caggggagga aatgagaagc cttccgtagg caccagagtt 2220
gctttgtggg ccaagcaata tttgattgct tacatgtggt gggccgctgt cgtcggtgct 2280
ggcgtgtact ccatcgttca taattggatg tttgactgga attcactttc ctacaggttc 2340
gcactggtag gcatctgttc gtatatagtt ttcattgtaa tagtgctggt agtctacttt 2400
acaggaaaga tcacgacctg gaacttcacg aagctacaga aagaattgat cgaggaccgc 2460
gtactgtacg acgcaacgac caatgcccag tcggtataa 2499
<210> 15
<211> 3006
<212> DNA
<213> other sequences
<220>
<223> reencoded nucleic acid sequence of a polypeptide having
chondroitin synthase activity (HCOS10-Vir)
<400> 15
atgggtaaga acatcattat tatggtttct tggtacacta ttattacatc caatctcatc 60
gcagtgggtg gcgcctcact catactagcc ccagctatta cgggctatgt ccttcactgg 120
aacattgccc tttcaacaat ttggggagtg tcggcctacg gaattttcgt gtttggtttc 180
tttcttgccc aggtattatt tagtgaactc aaccggaaaa ggctccggaa gtggatttcc 240
ctccgaccca aaagagatag aaacttccta ttcgttggtg ttatgacagc tcagaagtac 300
ttacagacca gggcggttgc agcatataga acctggtcaa agacaattcc aggtaaggta 360
cagttcttca gctccgaggg ttctgacacc agcgtcccta tcccagtagt gcctttgcgt 420
ggagtggatg attcataccc acctcagaag aagtccttca tgatgcttaa gtatatgcac 480
gaccactatc tggacaaata cgagtggttc atgagagcag acgacgacgt ttacataaag 540
ggtgatagac tggagaattt cttgaggtca ctaaacagtt cagaaccact tttcctagga 600
cagacgggcc ttggtacgac agaggagatg ggtaagttgg cattggagcc aggggagaac 660
ttctgcatgg gtggccctgg tgtgattatg agtagggaag ttttaagaag aatggttccg 720
cacattggta agtgtctaag ggaaatgtat acgactcatg aggacgtgga agtaggaaga 780
tgcgttagga gattcgctgg agtacagtgt gtttggtctt acgagatgca acagttattc 840
tacgagaact acgagcagaa taagaaggga tacatccgtg atctgcacaa ctccaaaatt 900
caccaagcaa taacgctgca tcctaacaag aatccgccct atcagtatag gttgcactct 960
tacatgttga gtagaaagat atctgagcta cgtcatagaa ctattcagtt gcacagggag 1020
atagtactga tgtctaaata ctcaaacacg gagatccata aggaagacct acagttgggt 1080
ataccacctt cgttcatgag attccagcca agacagaggg aagaaatttt ggagtgggag 1140
ttcttgactg gtaaatactt gtattctgct gttgacggtc aaccacctag gagagggatg 1200
gactctgcac agcgtgaggc tttagacgat atagtgatgc aagtaatgga aatgatcaac 1260
gctaatgcaa agacacgtgg tcgtatcata gatttcaaag agatccagta tggatatcgt 1320
cgtgtgaacc caatgtacgg cgcggagtat attcttgact tattgttgct atacaagaaa 1380
cataagggta agaagatgac tgtcccggtt cgtaggcacg cgtatttgca acagactttc 1440
tcgaaaatac agtttgtaga gcatgaggaa cttgacgcgc aagagttagc gaaacgtata 1500
aaccaagagt cggggagttt atccttctta agtaattccc ttaagaagtt ggttcctttc 1560
cagctgcctg gaagtaaaag tgagcacaag gagccaaagg ataagaaaat caacattctt 1620
atacctcttt ccggcagatt cgacatgttc gttaggttca tgggtaactt cgagaagacc 1680
tgcttaattc ctaaccagaa tgttaagttg gtagttttgt tattcaattc tgacagtaac 1740
cccgacaaag caaagcaggt tgaactgatg agagactata ggattaagta cccaaaagca 1800
gatatgcaga tactacctgt ttccggagaa ttctcaagag ccttggctct ggaagtaggc 1860
agctctcagt ttaataatga gtctcttctg ttcttctgcg acgttgactt agttttcacg 1920
acagagtttc tgcagagatg tcgtgcaaac actgtactag gtcagcagat atatttcccc 1980
attattttca gtcagtacga tccaaagatt gtttatagtg gaaaagttcc atctgacaac 2040
cattttgcgt ttactcaaaa gacagggttt tggcgtaact acgggttcgg cataacatgt 2100
atctataaag gggacctggt aagagttggc ggattcgacg tatctataca gggctggggt 2160
ttagaagacg tcgatctatt taataaagta gttcaggcag gtttgaagac attccgtagt 2220
caagaggtag gcgttgtaca cgtgcaccat ccagtatttt gcgacccaaa cttagacccg 2280
aagcaatata aaatgtgctt gggttccaag gcatcgactt acggttccac gcagcaacta 2340
gcagagatgt ggttggagaa gaacgaccca tcttatagcc tgtttgcagc atggaagcat 2400
ggactttcgg gcatttggct cgcattcgag tgcttatacc agattactta tttcttcctg 2460
gtgatttacc tattctcccg tttggctgtt gaggctgacc cacgggcgca aacggccacc 2520
gtcattgttt cgaccacagt tgcgcttatt aagtgcggtt actttagctt cagagctaaa 2580
gacattaggg ccttctattt cgtcctctac acgttcgttt acttcttctg catgattccg 2640
gcacgaataa ctgcgatgat gaccctgtgg gacataggtt ggggaaccag gggaggaaat 2700
gagaagcctt ccgtaggcac cagagttgct ttgtgggcca agcaatattt gattgcttac 2760
atgtggtggg ccgctgtcgt cggtgctggc gtgtactcca tcgttcataa ttggatgttt 2820
gactggaatt cactttccta caggttcgca ctggtaggca tctgttcgta tatagttttc 2880
attgtaatag tgctggtagt ctactttaca ggaaagatca cgacctggaa cttcacgaag 2940
ctacagaaag aattgatcga ggaccgcgta ctgtacgacg caacgaccaa tgcccagtcg 3000
gtataa 3006
<210> 16
<211> 1596
<212> DNA
<213> other sequences
<220>
<223> reencoded nucleic acid sequence of a polypeptide having
chondroitin synthase activity (HCOS11-Vir)
<400> 16
atgggtaaga acatcattat tatggtttct tggtacacta ttattacatc caatctcatc 60
gcagtgggtg gcgcctcact catactagcc ccagctatta cgggctatgt ccttcactgg 120
aacattgccc tttcaacaat ttggggagtg tcggcctacg gaattttcgt gtttggtttc 180
tttcttgccc aggtattatt tagtgaactc aaccggaaaa ggctccggaa gtggatttcc 240
ctccgaccca aaagagatag aaacttccta ttcgttggtg ttatgacagc tcagaagtac 300
ttacagacca gggcggttgc agcatataga acctggtcaa agacaattcc aggtaaggta 360
cagttcttca gctccgaggg ttctgacacc agcgtcccta tcccagtagt gcctttgcgt 420
ggagtggatg attcataccc acctcagaag aagtccttca tgatgcttaa gtatatgcac 480
gaccactatc tggacaaata cgagtggttc atgagagcag acgacgacgt ttacataaag 540
ggtgatagac tggagaattt cttgaggtca ctaaacagtt cagaaccact tttcctagga 600
cagacgggcc ttggtacgac agaggagatg ggtaagttgg cattggagcc aggggagaac 660
ttctgcatgg gtggccctgg tgtgattatg agtagggaag ttttaagaag aatggttccg 720
cacattggta agtgtctaag ggaaatgtat acgactcatg aggacgtgga agtaggaaga 780
tgcgttagga gattcgctgg agtacagtgt gtttggtctt acgagatgca acagttattc 840
tacgagaact acgagcagaa taagaaggga tacatccgtg atctgcacaa ctccaaaatt 900
caccaagcaa taacgctgca tcctaacaag aatccgccct atcagtatag gttgcactct 960
tacatgttgc tgtttgcagc atggaagcat ggactttcgg gcatttggct cgcattcgag 1020
tgcttatacc agattactta tttcttcctg gtgatttacc tattctcccg tttggctgtt 1080
gaggctgacc cacgggcgca aacggccacc gtcattgttt cgaccacagt tgcgcttatt 1140
aagtgcggtt actttagctt cagagctaaa gacattaggg ccttctattt cgtcctctac 1200
acgttcgttt acttcttctg catgattccg gcacgaataa ctgcgatgat gaccctgtgg 1260
gacataggtt ggggaaccag gggaggaaat gagaagcctt ccgtaggcac cagagttgct 1320
ttgtgggcca agcaatattt gattgcttac atgtggtggg ccgctgtcgt cggtgctggc 1380
gtgtactcca tcgttcataa ttggatgttt gactggaatt cactttccta caggttcgca 1440
ctggtaggca tctgttcgta tatagttttc attgtaatag tgctggtagt ctactttaca 1500
ggaaagatca cgacctggaa cttcacgaag ctacagaaag aattgatcga ggaccgcgta 1560
ctgtacgacg caacgaccaa tgcccagtcg gtataa 1596
<210> 17
<211> 1662
<212> DNA
<213> other sequences
<220>
<223> reencoded nucleic acid sequence of a polypeptide having
chondroitin synthase activity (HCOS12-Vir)
<400> 17
atgggtaaga acatcattat tatggtttct tggtacacta ttattacatc caatctcatc 60
gcagtgggtg gcgcctcact catactagcc ccagctatta cgggctatgt ccttcactgg 120
aacattgccc tttcaacaat ttggggagtg tcggcctacg gaattttcgt gtttggtttc 180
tttcttgccc aggtattatt tagtgaactc aaccggaaaa ggctccggaa gtggatttcc 240
ctccgaccca aaaaggataa gaaaatcaac attcttatac ctctttccgg cagattcgac 300
atgttcgtta ggttcatggg taacttcgag aagacctgct taattcctaa ccagaatgtt 360
aagttggtag ttttgttatt caattctgac agtaaccccg acaaagcaaa gcaggttgaa 420
ctgatgagag actataggat taagtaccca aaagcagata tgcagatact acctgtttcc 480
ggagaattct caagagcctt ggctctggaa gtaggcagct ctcagtttaa taatgagtct 540
cttctgttct tctgcgacgt tgacttagtt ttcacgacag agtttctgca gagatgtcgt 600
gcaaacactg tactaggtca gcagatatat ttccccatta ttttcagtca gtacgatcca 660
aagattgttt atagtggaaa agttccatct gacaaccatt ttgcgtttac tcaaaagaca 720
gggttttggc gtaactacgg gttcggcata acatgtatct ataaagggga cctggtaaga 780
gttggcggat tcgacgtatc tatacagggc tggggtttag aagacgtcga tctatttaat 840
aaagtagttc aggcaggttt gaagacattc cgtagtcaag aggtaggcgt tgtacacgtg 900
caccatccag tattttgcga cccaaactta gacccgaagc aatataaaat gtgcttgggt 960
tccaaggcat cgacttacgg ttccacgcag caactagcag agatgtggtt ggagaagaac 1020
gacccatctt atagcctgtt tgcagcatgg aagcatggac tttcgggcat ttggctcgca 1080
ttcgagtgct tataccagat tacttatttc ttcctggtga tttacctatt ctcccgtttg 1140
gctgttgagg ctgacccacg ggcgcaaacg gccaccgtca ttgtttcgac cacagttgcg 1200
cttattaagt gcggttactt tagcttcaga gctaaagaca ttagggcctt ctatttcgtc 1260
ctctacacgt tcgtttactt cttctgcatg attccggcac gaataactgc gatgatgacc 1320
ctgtgggaca taggttgggg aaccagggga ggaaatgaga agccttccgt aggcaccaga 1380
gttgctttgt gggccaagca atatttgatt gcttacatgt ggtgggccgc tgtcgtcggt 1440
gctggcgtgt actccatcgt tcataattgg atgtttgact ggaattcact ttcctacagg 1500
ttcgcactgg taggcatctg ttcgtatata gttttcattg taatagtgct ggtagtctac 1560
tttacaggaa agatcacgac ctggaacttc acgaagctac agaaagaatt gatcgaggac 1620
cgcgtactgt acgacgcaac gaccaatgcc cagtcggtat aa 1662
<210> 18
<211> 972
<212> PRT
<213> other sequences
<220>
<223> an amino acid sequence of a polypeptide having a chondroitin
synthase activity (HCOS-1)
<400> 18
Met Asn Thr Leu Ser Gln Ala Ile Lys Ala Tyr Asn Ser Asn Asp Tyr
1 5 10 15
Gln Leu Ala Leu Lys Leu Phe Glu Lys Ser Ala Glu Ile Tyr Gly Arg
20 25 30
Lys Ile Val Glu Phe Gln Ile Thr Lys Cys Lys Glu Lys Leu Ser Ala
35 40 45
His Pro Ser Val Asn Ser Ala His Leu Ser Val Asn Lys Glu Glu Lys
50 55 60
Val Asn Val Cys Asp Ser Pro Leu Asp Ile Ala Thr Gln Leu Leu Leu
65 70 75 80
Ser Asn Val Lys Lys Leu Val Leu Ser Asp Ser Glu Lys Asn Thr Leu
85 90 95
Lys Asn Lys Trp Lys Leu Leu Thr Glu Lys Lys Ser Glu Asn Ala Glu
100 105 110
Val Arg Ala Val Ala Leu Val Pro Lys Asp Phe Pro Lys Asp Leu Val
115 120 125
Leu Ala Pro Leu Pro Asp His Val Asn Asp Phe Thr Trp Tyr Lys Lys
130 135 140
Arg Lys Lys Arg Leu Gly Ile Lys Pro Glu His Gln His Val Gly Leu
145 150 155 160
Ser Ile Ile Val Thr Thr Phe Asn Arg Pro Ala Ile Leu Ser Ile Thr
165 170 175
Leu Ala Cys Leu Val Asn Gln Lys Thr His Tyr Pro Phe Glu Val Ile
180 185 190
Val Thr Asp Asp Gly Ser Gln Glu Asp Leu Ser Pro Ile Ile Arg Gln
195 200 205
Tyr Glu Asn Lys Leu Asp Ile Arg Tyr Val Arg Gln Lys Asp Tyr Gly
210 215 220
Tyr Gln Leu Cys Ala Val Arg Asn Leu Gly Leu Arg Thr Ala Lys Tyr
225 230 235 240
Asp Phe Val Ser Ile Leu Asp Cys Asp Met Ala Pro Gln Gln Leu Trp
245 250 255
Val His Ser Tyr Leu Thr Glu Leu Leu Glu Asp Asp Asp Leu Thr Ile
260 265 270
Ile Gly Pro Arg Lys Tyr Ile Asp Thr Gln His Ile Asp Pro Lys Asp
275 280 285
Phe Leu Asn Asn Ala Ser Leu Leu Glu Ser Leu Pro Glu Val Lys Thr
290 295 300
Asn Asn Ser Val Ala Ala Lys Gly Glu Gly Thr Val Ser Leu Asp Trp
305 310 315 320
Arg Leu Glu Gln Phe Glu Lys Thr Glu Asn Leu Arg Leu Ser Asp Ser
325 330 335
Pro Phe Arg Phe Phe Ala Ala Gly Asn Val Ala Phe Ala Lys Lys Trp
340 345 350
Leu Asn Lys Ser Gly Phe Phe Asp Glu Glu Phe Asn His Trp Gly Gly
355 360 365
Glu Asp Val Glu Phe Gly Tyr Arg Leu Phe Arg Tyr Gly Ser Phe Phe
370 375 380
Lys Thr Ile Asp Gly Ile Met Ala Tyr His Gln Glu Pro Pro Gly Lys
385 390 395 400
Glu Asn Glu Thr Asp Arg Glu Ala Gly Lys Asn Ile Thr Leu Asp Ile
405 410 415
Met Arg Glu Lys Val Pro Tyr Ile Tyr Arg Lys Leu Leu Pro Ile Glu
420 425 430
Asp Ser His Ile Asn Arg Val Pro Leu Val Ser Ile Tyr Ile Pro Ala
435 440 445
Tyr Asn Cys Ala Asn Tyr Ile Gln Arg Cys Val Asp Ser Ala Leu Asn
450 455 460
Gln Thr Val Val Asp Leu Glu Val Cys Ile Cys Asn Asp Gly Ser Thr
465 470 475 480
Asp Asn Thr Leu Glu Val Ile Asn Lys Leu Tyr Gly Asn Asn Pro Arg
485 490 495
Val Arg Ile Met Ser Lys Pro Asn Gly Gly Ile Ala Ser Ala Ser Asn
500 505 510
Ala Ala Val Ser Phe Ala Lys Gly Tyr Tyr Ile Gly Gln Leu Asp Ser
515 520 525
Asp Asp Tyr Leu Glu Pro Asp Ala Val Glu Leu Cys Leu Lys Glu Phe
530 535 540
Leu Lys Asp Lys Thr Leu Ala Cys Val Tyr Thr Thr Asn Arg Asn Val
545 550 555 560
Asn Pro Asp Gly Ser Leu Ile Ala Asn Gly Tyr Asn Trp Pro Glu Phe
565 570 575
Ser Arg Glu Lys Leu Thr Thr Ala Met Ile Ala His His Phe Arg Met
580 585 590
Phe Thr Ile Arg Ala Trp His Leu Thr Asp Gly Phe Asn Glu Lys Ile
595 600 605
Glu Asn Ala Val Asp Tyr Asp Met Phe Leu Lys Leu Ser Glu Val Gly
610 615 620
Lys Phe Lys His Leu Asn Lys Ile Cys Tyr Asn Arg Val Leu His Gly
625 630 635 640
Asp Asn Thr Ser Ile Lys Lys Leu Gly Ile Gln Lys Lys Asn His Phe
645 650 655
Val Val Val Asn Gln Ser Leu Asn Arg Gln Gly Ile Thr Tyr Tyr Asn
660 665 670
Tyr Asp Glu Phe Asp Asp Leu Asp Glu Ser Arg Lys Tyr Ile Phe Asn
675 680 685
Lys Thr Ala Glu Tyr Gln Glu Glu Ile Asp Ile Leu Lys Asp Ile Lys
690 695 700
Ile Ile Gln Asn Lys Asp Ala Lys Ile Ala Val Ser Ile Phe Tyr Pro
705 710 715 720
Asn Thr Leu Asn Gly Leu Val Lys Lys Leu Asn Asn Ile Ile Glu Tyr
725 730 735
Asn Lys Asn Ile Phe Val Ile Val Leu His Val Asp Lys Asn His Leu
740 745 750
Thr Pro Asp Ile Lys Lys Glu Ile Leu Ala Phe Tyr His Lys His Gln
755 760 765
Val Asn Ile Leu Leu Asn Asn Asp Ile Ser Tyr Tyr Thr Ser Asn Arg
770 775 780
Leu Ile Lys Thr Glu Ala His Leu Ser Asn Ile Asn Lys Leu Ser Gln
785 790 795 800
Leu Asn Leu Asn Cys Glu Tyr Ile Ile Phe Asp Asn His Asp Ser Leu
805 810 815
Phe Val Lys Asn Asp Ser Tyr Ala Tyr Met Lys Lys Tyr Asp Val Gly
820 825 830
Met Asn Phe Ser Ala Leu Thr His Asp Trp Ile Glu Lys Ile Asn Ala
835 840 845
His Pro Pro Phe Lys Lys Leu Ile Lys Thr Tyr Phe Asn Asp Asn Asp
850 855 860
Leu Lys Ser Met Asn Val Lys Gly Ala Ser Gln Gly Met Phe Met Thr
865 870 875 880
Tyr Ala Leu Ala His Glu Leu Leu Thr Ile Ile Lys Glu Val Ile Thr
885 890 895
Ser Cys Gln Ser Ile Asp Ser Val Pro Glu Tyr Asn Thr Glu Asp Ile
900 905 910
Trp Phe Gln Phe Ala Leu Leu Ile Leu Glu Lys Lys Thr Gly His Val
915 920 925
Phe Asn Lys Thr Ser Thr Leu Thr Tyr Met Pro Trp Glu Arg Lys Leu
930 935 940
Gln Trp Thr Asn Glu Gln Ile Glu Ser Ala Lys Arg Gly Glu Asn Ile
945 950 955 960
Pro Val Asn Lys Phe Ile Ile Asn Ser Ile Thr Leu
965 970
<210> 19
<211> 972
<212> PRT
<213> other sequences
<220>
<223> an amino acid sequence of a polypeptide having a chondroitin
synthase activity (HCOS1-2)
<400> 19
Met Asn Thr Leu Ser Gln Ala Ile Lys Ala Tyr Asn Ser Asn Asp Tyr
1 5 10 15
Gln Leu Ala Leu Lys Leu Phe Glu Lys Ser Ala Glu Ile Tyr Gly Arg
20 25 30
Lys Ile Val Glu Phe Gln Ile Thr Lys Cys Lys Glu Lys Leu Ser Ala
35 40 45
His Pro Ser Val Asn Ser Ala His Leu Ser Val Asn Lys Glu Glu Lys
50 55 60
Val Asn Val Cys Asp Ser Pro Leu Asp Ile Ala Thr Gln Leu Leu Leu
65 70 75 80
Ser Asn Val Lys Lys Leu Val Leu Ser Asp Ser Glu Lys Asn Thr Leu
85 90 95
Lys Asn Lys Trp Lys Leu Leu Thr Glu Lys Lys Ser Glu Asn Ala Glu
100 105 110
Val Arg Ala Val Ala Leu Val Pro Lys Asp Phe Pro Lys Asp Leu Val
115 120 125
Leu Ala Pro Leu Pro Asp His Val Asn Asp Phe Thr Trp Tyr Lys Lys
130 135 140
Arg Lys Lys Arg Leu Gly Ile Lys Pro Val Asn Lys Asn Ile Gly Leu
145 150 155 160
Ser Ile Ile Ile Pro Thr Phe Asn Arg Ser Arg Ile Leu Asp Ile Thr
165 170 175
Leu Ala Cys Leu Val Asn Gln Lys Thr His Tyr Pro Phe Glu Val Ile
180 185 190
Val Thr Asp Asp Gly Ser Gln Glu Asp Leu Ser Pro Ile Ile Arg Gln
195 200 205
Tyr Glu Asn Lys Leu Asp Ile Arg Tyr Val Arg Gln Lys Asp Tyr Gly
210 215 220
Tyr Gln Leu Cys Ala Val Arg Asn Leu Gly Leu Arg Thr Ala Lys Tyr
225 230 235 240
Asp Phe Val Ser Ile Leu Asp Cys Asp Met Ala Pro Gln Gln Leu Trp
245 250 255
Val His Ser Tyr Leu Thr Glu Leu Leu Glu Asp Asp Asp Leu Thr Ile
260 265 270
Ile Gly Pro Arg Lys Tyr Ile Asp Thr Gln His Ile Asp Pro Lys Asp
275 280 285
Phe Leu Asn Asn Ala Ser Leu Leu Glu Ser Leu Pro Glu Val Lys Thr
290 295 300
Asn Asn Ser Val Ala Ala Lys Gly Glu Gly Thr Val Ser Leu Asp Trp
305 310 315 320
Arg Leu Glu Gln Phe Glu Lys Thr Glu Asn Leu Arg Leu Ser Asp Ser
325 330 335
Pro Phe Arg Phe Phe Ser Cys Gly Asn Val Ala Phe Ser Lys Glu Trp
340 345 350
Leu Asn Lys Val Gly Trp Phe Asp Glu Glu Phe Asn His Trp Gly Gly
355 360 365
Glu Asp Val Glu Phe Gly Tyr Arg Leu Phe Arg Tyr Gly Ser Phe Phe
370 375 380
Lys Thr Ile Asp Gly Ile Met Ala Tyr His Gln Glu Pro Pro Gly Lys
385 390 395 400
Glu Asn Glu Thr Asp Arg Glu Ala Gly Lys Asn Ile Thr Leu Asp Ile
405 410 415
Met Arg Glu Lys Val Pro Tyr Ile Tyr Arg Lys Leu Leu Pro Ile Glu
420 425 430
Asp Ser His Ile Asn Arg Val Pro Leu Val Ser Ile Tyr Ile Pro Ala
435 440 445
Tyr Asn Cys Ala Asn Tyr Ile Gln Arg Cys Val Asp Ser Ala Leu Asn
450 455 460
Gln Thr Val Val Asp Leu Glu Val Cys Ile Cys Asn Asp Gly Ser Thr
465 470 475 480
Asp Asn Thr Leu Glu Val Ile Asn Lys Leu Tyr Gly Asn Asn Pro Arg
485 490 495
Val Arg Ile Met Ser Lys Pro Asn Gly Gly Ile Ala Ser Ala Ser Asn
500 505 510
Ala Ala Val Ser Phe Ala Lys Gly Tyr Tyr Ile Gly Gln Leu Asp Ser
515 520 525
Asp Asp Tyr Leu Glu Pro Asp Ala Val Glu Leu Cys Leu Lys Glu Phe
530 535 540
Leu Lys Asp Lys Thr Leu Ala Cys Val Tyr Thr Thr Asn Arg Asn Val
545 550 555 560
Asn Pro Asp Gly Ser Leu Ile Ala Asn Gly Tyr Asn Trp Pro Glu Phe
565 570 575
Ser Arg Glu Lys Leu Thr Thr Ala Met Ile Ala His His Phe Arg Met
580 585 590
Phe Thr Ile Arg Ala Trp His Leu Thr Asp Gly Phe Asn Glu Lys Ile
595 600 605
Glu Asn Ala Val Asp Tyr Asp Met Phe Leu Lys Leu Ser Glu Val Gly
610 615 620
Lys Phe Lys His Leu Asn Lys Ile Cys Tyr Asn Arg Val Leu His Gly
625 630 635 640
Asp Asn Thr Ser Ile Lys Lys Leu Gly Ile Gln Lys Lys Asn His Phe
645 650 655
Val Val Val Asn Gln Ser Leu Asn Arg Gln Gly Ile Thr Tyr Tyr Asn
660 665 670
Tyr Asp Glu Phe Asp Asp Leu Asp Glu Ser Arg Lys Tyr Ile Phe Asn
675 680 685
Lys Thr Ala Glu Tyr Gln Glu Glu Ile Asp Ile Leu Lys Asp Ile Lys
690 695 700
Ile Ile Gln Asn Lys Asp Ala Lys Ile Ala Val Ser Ile Phe Tyr Pro
705 710 715 720
Asn Thr Leu Asn Gly Leu Val Lys Lys Leu Asn Asn Ile Ile Glu Tyr
725 730 735
Asn Lys Asn Ile Phe Val Ile Val Leu His Val Asp Lys Asn His Leu
740 745 750
Thr Pro Asp Ile Lys Lys Glu Ile Leu Ala Phe Tyr His Lys His Gln
755 760 765
Val Asn Ile Leu Leu Asn Asn Asp Ile Ser Tyr Tyr Thr Ser Asn Arg
770 775 780
Leu Ile Lys Thr Glu Ala His Leu Ser Asn Ile Asn Lys Leu Ser Gln
785 790 795 800
Leu Asn Leu Asn Cys Glu Tyr Ile Ile Phe Asp Asn His Asp Ser Leu
805 810 815
Phe Val Lys Asn Asp Ser Tyr Ala Tyr Met Lys Lys Tyr Asp Val Gly
820 825 830
Met Asn Phe Ser Ala Leu Thr His Asp Trp Ile Glu Lys Ile Asn Ala
835 840 845
His Pro Pro Phe Lys Lys Leu Ile Lys Thr Tyr Phe Asn Asp Asn Asp
850 855 860
Leu Lys Ser Met Asn Val Lys Gly Ala Ser Gln Gly Met Phe Met Thr
865 870 875 880
Tyr Ala Leu Ala His Glu Leu Leu Thr Ile Ile Lys Glu Val Ile Thr
885 890 895
Ser Cys Gln Ser Ile Asp Ser Val Pro Glu Tyr Asn Thr Glu Asp Ile
900 905 910
Trp Phe Gln Phe Ala Leu Leu Ile Leu Glu Lys Lys Thr Gly His Val
915 920 925
Phe Asn Lys Thr Ser Thr Leu Thr Tyr Met Pro Trp Glu Arg Lys Leu
930 935 940
Gln Trp Thr Asn Glu Gln Ile Glu Ser Ala Lys Arg Gly Glu Asn Ile
945 950 955 960
Pro Val Asn Lys Phe Ile Ile Asn Ser Ile Thr Leu
965 970
<210> 20
<211> 972
<212> PRT
<213> other sequences
<220>
<223> amino acid sequence of a polypeptide having a chondroitin
synthase activity (HCOS1-3)
<400> 20
Met Asn Thr Leu Ser Gln Ala Ile Lys Ala Tyr Asn Ser Asn Asp Tyr
1 5 10 15
Gln Leu Ala Leu Lys Leu Phe Glu Lys Ser Ala Glu Ile Tyr Gly Arg
20 25 30
Lys Ile Val Glu Phe Gln Ile Thr Lys Cys Lys Glu Lys Leu Ser Ala
35 40 45
His Pro Ser Val Asn Ser Ala His Leu Ser Val Asn Lys Glu Glu Lys
50 55 60
Val Asn Val Cys Asp Ser Pro Leu Asp Ile Ala Thr Gln Leu Leu Leu
65 70 75 80
Ser Asn Val Lys Lys Leu Val Leu Ser Asp Ser Glu Lys Asn Thr Leu
85 90 95
Lys Asn Lys Trp Lys Leu Leu Thr Glu Lys Lys Ser Glu Asn Ala Glu
100 105 110
Val Arg Ala Val Ala Leu Val Pro Lys Asp Phe Pro Lys Asp Leu Val
115 120 125
Leu Ala Pro Leu Pro Asp His Val Asn Asp Phe Thr Trp Tyr Lys Asn
130 135 140
Arg Lys Lys Ser Leu Gly Ile Lys Pro Val Asn Lys Asn Ile Gly Leu
145 150 155 160
Ser Ile Ile Ile Pro Thr Phe Asn Arg Ser Arg Ile Leu Asp Ile Thr
165 170 175
Leu Ala Cys Leu Val Asn Gln Lys Thr Asn Tyr Pro Phe Glu Val Val
180 185 190
Val Ala Asp Asp Gly Ser Lys Glu Asn Leu Leu Thr Ile Val Gln Lys
195 200 205
Tyr Glu Gln Lys Leu Asp Ile Lys Tyr Val Arg Gln Lys Asp Tyr Gly
210 215 220
Tyr Gln Leu Cys Ala Val Arg Asn Leu Gly Leu Arg Thr Ala Lys Tyr
225 230 235 240
Asp Phe Val Ser Ile Leu Asp Cys Asp Met Ala Pro Gln Gln Leu Trp
245 250 255
Val His Ser Tyr Leu Thr Glu Leu Leu Glu Asp Asn Asp Ile Val Leu
260 265 270
Ile Gly Pro Arg Lys Tyr Val Asp Thr His Asn Ile Thr Ala Glu Gln
275 280 285
Phe Leu Asn Asp Pro Tyr Leu Ile Glu Ser Leu Pro Glu Thr Ala Thr
290 295 300
Asn Asn Asn Pro Ser Ile Thr Ser Lys Gly Asn Ile Ser Leu Asp Trp
305 310 315 320
Arg Leu Glu His Phe Lys Lys Thr Asp Asn Leu Arg Leu Cys Asp Ser
325 330 335
Pro Phe Arg Tyr Phe Ser Cys Gly Asn Val Ala Phe Ser Lys Glu Trp
340 345 350
Leu Asn Lys Val Gly Trp Phe Asp Glu Glu Phe Asn His Trp Gly Gly
355 360 365
Glu Asp Val Glu Phe Gly Tyr Arg Leu Phe Ala Lys Gly Cys Phe Phe
370 375 380
Arg Val Ile Asp Gly Gly Met Ala Tyr His Gln Glu Pro Pro Gly Lys
385 390 395 400
Glu Asn Glu Thr Asp Arg Glu Ala Gly Lys Ser Ile Thr Leu Lys Ile
405 410 415
Val Lys Glu Lys Val Pro Tyr Ile Tyr Arg Lys Leu Leu Pro Ile Glu
420 425 430
Asp Ser His Ile Asn Arg Val Pro Leu Val Ser Ile Tyr Ile Pro Ala
435 440 445
Tyr Asn Cys Ala Asn Tyr Ile Gln Arg Cys Val Asp Ser Ala Leu Asn
450 455 460
Gln Thr Val Val Asp Leu Glu Val Cys Ile Cys Asn Asp Gly Ser Thr
465 470 475 480
Asp Asn Thr Leu Glu Val Ile Asn Lys Leu Tyr Gly Asn Asn Pro Arg
485 490 495
Val Arg Ile Met Ser Lys Pro Asn Gly Gly Ile Ala Ser Ala Ser Asn
500 505 510
Ala Ala Val Ser Phe Ala Lys Gly Tyr Tyr Ile Gly Gln Leu Asp Ser
515 520 525
Asp Asp Tyr Leu Glu Pro Asp Ala Val Glu Leu Cys Leu Lys Glu Phe
530 535 540
Leu Lys Asp Lys Thr Leu Ala Cys Val Tyr Thr Thr Asn Arg Asn Val
545 550 555 560
Asn Pro Asp Gly Ser Leu Ile Ala Asn Gly Tyr Asn Trp Pro Glu Phe
565 570 575
Ser Arg Glu Lys Leu Thr Thr Ala Met Ile Ala His His Phe Arg Met
580 585 590
Phe Thr Ile Arg Ala Trp His Leu Thr Asp Gly Phe Asn Glu Lys Ile
595 600 605
Glu Asn Ala Val Asp Tyr Asp Met Phe Leu Lys Leu Ser Glu Val Gly
610 615 620
Lys Phe Lys His Leu Asn Lys Ile Cys Tyr Asn Arg Val Leu His Gly
625 630 635 640
Asp Asn Thr Ser Ile Lys Lys Leu Gly Ile Gln Lys Lys Asn His Phe
645 650 655
Val Val Val Asn Gln Ser Leu Asn Arg Gln Gly Ile Thr Tyr Tyr Asn
660 665 670
Tyr Asp Glu Phe Asp Asp Leu Asp Glu Ser Arg Lys Tyr Ile Phe Asn
675 680 685
Lys Thr Ala Glu Tyr Gln Glu Glu Ile Asp Ile Leu Lys Asp Ile Lys
690 695 700
Ile Ile Gln Asn Lys Asp Ala Lys Ile Ala Val Ser Ile Phe Tyr Pro
705 710 715 720
Asn Thr Leu Asn Gly Leu Val Lys Lys Leu Asn Asn Ile Ile Glu Tyr
725 730 735
Asn Lys Asn Ile Phe Val Ile Val Leu His Val Asp Lys Asn His Leu
740 745 750
Thr Pro Asp Ile Lys Lys Glu Ile Leu Ala Phe Tyr His Lys His Gln
755 760 765
Val Asn Ile Leu Leu Asn Asn Asp Ile Ser Tyr Tyr Thr Ser Asn Arg
770 775 780
Leu Ile Lys Thr Glu Ala His Leu Ser Asn Ile Asn Lys Leu Ser Gln
785 790 795 800
Leu Asn Leu Asn Cys Glu Tyr Ile Ile Phe Asp Asn His Asp Ser Leu
805 810 815
Phe Val Lys Asn Asp Ser Tyr Ala Tyr Met Lys Lys Tyr Asp Val Gly
820 825 830
Met Asn Phe Ser Ala Leu Thr His Asp Trp Ile Glu Lys Ile Asn Ala
835 840 845
His Pro Pro Phe Lys Lys Leu Ile Lys Thr Tyr Phe Asn Asp Asn Asp
850 855 860
Leu Lys Ser Met Asn Val Lys Gly Ala Ser Gln Gly Met Phe Met Thr
865 870 875 880
Tyr Ala Leu Ala His Glu Leu Leu Thr Ile Ile Lys Glu Val Ile Thr
885 890 895
Ser Cys Gln Ser Ile Asp Ser Val Pro Glu Tyr Asn Thr Glu Asp Ile
900 905 910
Trp Phe Gln Phe Ala Leu Leu Ile Leu Glu Lys Lys Thr Gly His Val
915 920 925
Phe Asn Lys Thr Ser Thr Leu Thr Tyr Met Pro Trp Glu Arg Lys Leu
930 935 940
Gln Trp Thr Asn Glu Gln Ile Glu Ser Ala Lys Arg Gly Glu Asn Ile
945 950 955 960
Pro Val Asn Lys Phe Ile Ile Asn Ser Ile Thr Leu
965 970
<210> 21
<211> 1023
<212> PRT
<213> other sequences
<220>
<223> amino acid sequence of a polypeptide having chondroitin synthase
activity (HCOS.Sc)
<400> 21
Met Asn Thr Leu Ser Gln Ala Ile Lys Ala Tyr Asn Ser Asn Asp Tyr
1 5 10 15
Gln Leu Ala Leu Lys Leu Phe Glu Lys Ser Ala Glu Ile Tyr Gly Arg
20 25 30
Lys Ile Val Glu Phe Gln Ile Thr Lys Cys Lys Glu Lys Leu Ser Ala
35 40 45
His Pro Ser Val Asn Ser Ala His Leu Ser Val Asn Lys Glu Glu Lys
50 55 60
Val Asn Val Cys Asp Ser Pro Leu Asp Ile Ala Thr Gln Leu Leu Leu
65 70 75 80
Ser Asn Val Lys Lys Leu Val Leu Ser Asp Ser Glu Lys Asn Thr Leu
85 90 95
Lys Asn Lys Trp Lys Leu Leu Thr Glu Lys Lys Ser Glu Asn Ala Glu
100 105 110
Val Arg Ala Val Ala Leu Val Pro Lys Asp Phe Pro Lys Asp Leu Val
115 120 125
Leu Ala Pro Leu Pro Asp His Val Asn Asp Phe Thr Trp Tyr Lys Asn
130 135 140
Arg Lys Lys Ser Leu Gly Ile Lys Pro Val Asn Lys Asn Ile Gly Leu
145 150 155 160
Ser Ile Ile Ile Pro Thr Phe Asn Arg Ser Arg Ile Leu Asp Ile Thr
165 170 175
Leu Ala Cys Leu Val Asn Gln Lys Thr Asn Tyr Pro Phe Glu Val Val
180 185 190
Val Ala Asp Asp Gly Ser Lys Glu Asn Leu Leu Thr Ile Val Gln Lys
195 200 205
Tyr Glu Gln Lys Leu Asp Ile Lys Tyr Val Arg Gln Lys Asp Tyr Gly
210 215 220
Tyr Gln Leu Cys Ala Val Arg Asn Leu Gly Leu Arg Thr Ala Lys Tyr
225 230 235 240
Asp Phe Val Ser Ile Leu Asp Cys Asp Met Ala Pro Gln Gln Leu Trp
245 250 255
Val His Ser Tyr Leu Thr Glu Leu Leu Glu Asp Asn Asp Ile Val Leu
260 265 270
Ile Gly Pro Arg Lys Tyr Val Asp Thr His Asn Ile Thr Ala Glu Gln
275 280 285
Phe Leu Asn Asp Pro Tyr Leu Ile Glu Ser Leu Pro Glu Thr Ala Thr
290 295 300
Asn Asn Asn Pro Ser Ile Thr Ser Lys Gly Asn Ile Ser Leu Asp Trp
305 310 315 320
Arg Leu Glu His Phe Lys Lys Thr Asp Asn Leu Arg Leu Cys Asp Ser
325 330 335
Pro Phe Arg Tyr Phe Ser Cys Gly Asn Val Ala Phe Ser Lys Glu Trp
340 345 350
Leu Asn Lys Val Gly Trp Phe Asp Glu Glu Phe Asn His Trp Gly Gly
355 360 365
Glu Asp Val Glu Phe Gly Tyr Arg Leu Phe Ala Lys Gly Cys Phe Phe
370 375 380
Arg Val Ile Asp Gly Gly Met Ala Tyr His Gln Glu Pro Pro Gly Lys
385 390 395 400
Glu Asn Glu Thr Asp Arg Glu Ala Gly Lys Ser Ile Thr Leu Lys Ile
405 410 415
Val Lys Glu Lys Val Pro Tyr Ile Tyr Arg Lys Leu Leu Pro Ile Glu
420 425 430
Asp Ser His Ile Asn Arg Val Pro Leu Val Ser Ile Tyr Ile Pro Ala
435 440 445
Tyr Asn Cys Ala Asn Tyr Ile Gln Arg Cys Val Asp Ser Ala Leu Asn
450 455 460
Gln Thr Val Val Asp Leu Glu Val Cys Ile Cys Asn Asp Gly Ser Thr
465 470 475 480
Asp Asn Thr Leu Glu Val Ile Asn Lys Leu Tyr Gly Asn Asn Pro Arg
485 490 495
Val Arg Ile Met Ser Lys Pro Asn Gly Gly Ile Ala Ser Ala Ser Asn
500 505 510
Ala Ala Val Ser Phe Ala Lys Gly Tyr Tyr Ile Gly Gln Leu Asp Ser
515 520 525
Asp Asp Tyr Leu Glu Pro Asp Ala Val Glu Leu Cys Leu Lys Glu Phe
530 535 540
Leu Lys Asp Lys Thr Leu Ala Cys Val Tyr Thr Thr Asn Arg Asn Val
545 550 555 560
Asn Pro Asp Gly Ser Leu Ile Ala Asn Gly Tyr Asn Trp Pro Glu Phe
565 570 575
Ser Arg Glu Lys Leu Thr Thr Ala Met Ile Ala His His Phe Arg Met
580 585 590
Phe Thr Ile Arg Ala Trp His Leu Thr Asp Gly Phe Asn Glu Lys Ile
595 600 605
Glu Asn Ala Val Asp Tyr Asp Met Phe Leu Lys Leu Ser Glu Val Gly
610 615 620
Lys Phe Lys His Leu Asn Lys Ile Cys Tyr Asn Arg Val Leu His Gly
625 630 635 640
Asp Asn Thr Ser Ile Lys Lys Leu Gly Ile Gln Lys Lys Asn His Phe
645 650 655
Val Val Val Asn Gln Ser Leu Asn Arg Gln Gly Ile Thr Tyr Tyr Asn
660 665 670
Tyr Asp Glu Phe Asp Asp Leu Asp Glu Ser Arg Lys Tyr Ile Phe Asn
675 680 685
Lys Thr Ala Glu Tyr Gln Glu Glu Ile Asp Ile Leu Lys Asp Ile Phe
690 695 700
Ile Gln Met Leu Phe Ser Trp Phe Ser Ile Ala Asn Phe Val Leu Thr
705 710 715 720
Phe Tyr Tyr Leu Ala Gly Ser Met Asn Leu Val Ile Lys His Gly Glu
725 730 735
Ala Leu Phe Ile Phe Phe Lys Tyr Leu Ile Phe Cys Asp Leu Ala Ser
740 745 750
Leu Phe Ile Ile Ser Met Gly Asn Arg Pro Gln Gly Ala Lys His Leu
755 760 765
Phe Ile Thr Ser Met Val Ile Leu Ser Ile Cys Ala Thr Tyr Ser Leu
770 775 780
Ile Cys Gly Phe Val Phe Ala Phe Lys Ser Leu Ala Ser Gly Thr Glu
785 790 795 800
Ser His Lys Ile Phe Val Asp Ile Val Ile Ser Leu Leu Ser Thr Tyr
805 810 815
Gly Leu Tyr Phe Phe Ser Ser Leu Met Tyr Leu Asp Pro Trp His Met
820 825 830
Phe Thr Ser Ser Ile Gln Tyr Phe Leu Thr Leu Pro Ala Phe Thr Cys
835 840 845
Thr Leu Gln Ile Phe Ala Phe Cys Asn Thr His Asp Val Ser Trp Gly
850 855 860
Thr Lys Gly Ser Thr Gln Glu Ser Lys Gln Leu Ser Lys Ala Ile Val
865 870 875 880
Val Gln Gly Pro Asp Gly Lys Gln Ile Val Glu Thr Asp Trp Pro Gln
885 890 895
Glu Val Asp Lys Lys Phe Leu Glu Ile Lys Ser Arg Leu Lys Glu Pro
900 905 910
Glu Phe Glu Glu Ser Ser Gly Asn Glu Lys Gln Ser Lys Asn Asp Tyr
915 920 925
Tyr Arg Asp Ile Arg Thr Arg Ile Val Met Ile Trp Met Leu Ser Asn
930 935 940
Leu Ile Leu Ile Met Ser Ile Ile Gln Val Phe Thr Pro Gln Asp Thr
945 950 955 960
Asp Asn Gly Tyr Leu Ile Phe Ile Leu Trp Ser Val Ala Ala Leu Ala
965 970 975
Ala Phe Arg Val Val Gly Ser Met Ala Phe Leu Phe Met Lys Tyr Leu
980 985 990
Arg Ile Ile Val Ser Tyr Arg Asn Lys Val Glu Gly Ser Gly Ser Trp
995 1000 1005
Glu Val Ser Lys Leu Asp Leu Pro Asn Val Phe His Lys Lys Gly
1010 1015 1020
<210> 22
<211> 1023
<212> PRT
<213> other sequences
<220>
<223> an amino acid sequence of a polypeptide having chondroitin
synthase activity (HHASA.Sc)
<400> 22
Met Asn Thr Leu Ser Gln Ala Ile Lys Ala Tyr Asn Ser Asn Asp Tyr
1 5 10 15
Gln Leu Ala Leu Lys Leu Phe Glu Lys Ser Ala Glu Ile Tyr Gly Arg
20 25 30
Lys Ile Val Glu Phe Gln Ile Thr Lys Cys Lys Glu Lys Leu Ser Ala
35 40 45
His Pro Ser Val Asn Ser Ala His Leu Ser Val Asn Lys Glu Glu Lys
50 55 60
Val Asn Val Cys Asp Ser Pro Leu Asp Ile Ala Thr Gln Leu Leu Leu
65 70 75 80
Ser Asn Val Lys Lys Leu Val Leu Ser Asp Ser Glu Lys Asn Thr Leu
85 90 95
Lys Asn Lys Trp Lys Leu Leu Thr Glu Lys Lys Ser Glu Asn Ala Glu
100 105 110
Val Arg Ala Val Ala Leu Val Pro Lys Asp Phe Pro Lys Asp Leu Val
115 120 125
Leu Ala Pro Leu Pro Asp His Val Asn Asp Phe Thr Trp Tyr Lys Lys
130 135 140
Arg Lys Lys Arg Leu Gly Ile Lys Pro Glu His Gln His Val Gly Leu
145 150 155 160
Ser Ile Ile Val Thr Thr Phe Asn Arg Pro Ala Ile Leu Ser Ile Thr
165 170 175
Leu Ala Cys Leu Val Asn Gln Lys Thr His Tyr Pro Phe Glu Val Ile
180 185 190
Val Thr Asp Asp Gly Ser Gln Glu Asp Leu Ser Pro Ile Ile Arg Gln
195 200 205
Tyr Glu Asn Lys Leu Asp Ile Arg Tyr Val Arg Gln Lys Asp Asn Gly
210 215 220
Phe Gln Ala Ser Ala Ala Arg Asn Met Gly Leu Arg Leu Ala Lys Tyr
225 230 235 240
Asp Phe Ile Gly Leu Leu Asp Cys Asp Met Ala Pro Asn Pro Leu Trp
245 250 255
Val His Ser Tyr Val Ala Glu Leu Leu Glu Asp Asp Asp Leu Thr Ile
260 265 270
Ile Gly Pro Arg Lys Tyr Ile Asp Thr Gln His Ile Asp Pro Lys Asp
275 280 285
Phe Leu Asn Asn Ala Ser Leu Leu Glu Ser Leu Pro Glu Val Lys Thr
290 295 300
Asn Asn Ser Val Ala Ala Lys Gly Glu Gly Thr Val Ser Leu Asp Trp
305 310 315 320
Arg Leu Glu Gln Phe Glu Lys Thr Glu Asn Leu Arg Leu Ser Asp Ser
325 330 335
Pro Phe Arg Phe Phe Ala Ala Gly Asn Val Ala Phe Ala Lys Lys Trp
340 345 350
Leu Asn Lys Ser Gly Phe Phe Asp Glu Glu Phe Asn His Trp Gly Gly
355 360 365
Glu Asp Val Glu Phe Gly Tyr Arg Leu Phe Arg Tyr Gly Ser Phe Phe
370 375 380
Lys Thr Ile Asp Gly Ile Met Ala Tyr His Gln Glu Pro Pro Gly Lys
385 390 395 400
Glu Asn Glu Thr Asp Arg Glu Ala Gly Lys Asn Ile Thr Leu Asp Ile
405 410 415
Met Arg Glu Lys Val Pro Tyr Ile Tyr Arg Lys Leu Leu Pro Ile Glu
420 425 430
Asp Ser His Ile Asn Arg Val Pro Leu Val Ser Ile Tyr Ile Pro Ala
435 440 445
Tyr Asn Cys Ala Asn Tyr Ile Gln Arg Cys Val Asp Ser Ala Leu Asn
450 455 460
Gln Thr Val Val Asp Leu Glu Val Cys Ile Cys Asn Asp Gly Ser Thr
465 470 475 480
Asp Asn Thr Leu Glu Val Ile Asn Lys Leu Tyr Gly Asn Asn Pro Arg
485 490 495
Val Arg Ile Met Ser Lys Pro Asn Gly Gly Ile Ala Ser Ala Ser Asn
500 505 510
Ala Ala Val Ser Phe Ala Lys Gly Tyr Tyr Ile Gly Gln Leu Asp Ser
515 520 525
Asp Asp Tyr Leu Glu Pro Asp Ala Val Glu Leu Cys Leu Lys Glu Phe
530 535 540
Leu Lys Asp Lys Thr Leu Ala Cys Val Tyr Thr Thr Asn Arg Asn Val
545 550 555 560
Asn Pro Asp Gly Ser Leu Ile Ala Asn Gly Tyr Asn Trp Pro Glu Phe
565 570 575
Ser Arg Glu Lys Leu Thr Thr Ala Met Ile Ala His His Phe Arg Met
580 585 590
Phe Thr Ile Arg Ala Trp His Leu Thr Asp Gly Phe Asn Glu Lys Ile
595 600 605
Glu Asn Ala Val Asp Tyr Asp Met Phe Leu Lys Leu Ser Glu Val Gly
610 615 620
Lys Phe Lys His Leu Asn Lys Ile Cys Tyr Asn Arg Val Leu His Gly
625 630 635 640
Asp Asn Thr Ser Ile Lys Lys Leu Gly Ile Gln Lys Lys Asn His Phe
645 650 655
Val Val Val Asn Gln Ser Leu Asn Arg Gln Gly Ile Thr Tyr Tyr Asn
660 665 670
Tyr Asp Glu Phe Asp Asp Leu Asp Glu Ser Arg Lys Tyr Ile Phe Asn
675 680 685
Lys Thr Ala Glu Tyr Gln Glu Glu Ile Asp Ile Leu Lys Asp Ile Phe
690 695 700
Ile Gln Met Leu Phe Ser Trp Phe Ser Ile Ala Asn Phe Val Leu Thr
705 710 715 720
Phe Tyr Tyr Leu Ala Gly Ser Met Asn Leu Val Ile Lys His Gly Glu
725 730 735
Ala Leu Phe Ile Phe Phe Lys Tyr Leu Ile Phe Cys Asp Leu Ala Ser
740 745 750
Leu Phe Ile Ile Ser Met Gly Asn Arg Pro Gln Gly Ala Lys His Leu
755 760 765
Phe Ile Thr Ser Met Val Ile Leu Ser Ile Cys Ala Thr Tyr Ser Leu
770 775 780
Ile Cys Gly Phe Val Phe Ala Phe Lys Ser Leu Ala Ser Gly Thr Glu
785 790 795 800
Ser His Lys Ile Phe Val Asp Ile Val Ile Ser Leu Leu Ser Thr Tyr
805 810 815
Gly Leu Tyr Phe Phe Ser Ser Leu Met Tyr Leu Asp Pro Trp His Met
820 825 830
Phe Thr Ser Ser Ile Gln Tyr Phe Leu Thr Leu Pro Ala Phe Thr Cys
835 840 845
Thr Leu Gln Ile Phe Ala Phe Cys Asn Thr His Asp Val Ser Trp Gly
850 855 860
Thr Lys Gly Ser Thr Gln Glu Ser Lys Gln Leu Ser Lys Ala Ile Val
865 870 875 880
Val Gln Gly Pro Asp Gly Lys Gln Ile Val Glu Thr Asp Trp Pro Gln
885 890 895
Glu Val Asp Lys Lys Phe Leu Glu Ile Lys Ser Arg Leu Lys Glu Pro
900 905 910
Glu Phe Glu Glu Ser Ser Gly Asn Glu Lys Gln Ser Lys Asn Asp Tyr
915 920 925
Tyr Arg Asp Ile Arg Thr Arg Ile Val Met Ile Trp Met Leu Ser Asn
930 935 940
Leu Ile Leu Ile Met Ser Ile Ile Gln Val Phe Thr Pro Gln Asp Thr
945 950 955 960
Asp Asn Gly Tyr Leu Ile Phe Ile Leu Trp Ser Val Ala Ala Leu Ala
965 970 975
Ala Phe Arg Val Val Gly Ser Met Ala Phe Leu Phe Met Lys Tyr Leu
980 985 990
Arg Ile Ile Val Ser Tyr Arg Asn Lys Val Glu Gly Ser Gly Ser Trp
995 1000 1005
Glu Val Ser Lys Leu Asp Leu Pro Asn Val Phe His Lys Lys Gly
1010 1015 1020
<210> 23
<211> 572
<212> PRT
<213> other sequences
<220>
<223> amino acid sequence of a polypeptide having chondroitin synthase
activity (HCOS1-Vir)
<400> 23
Met Gly Lys Asn Ile Ile Ile Met Val Ser Trp Tyr Thr Ile Ile Thr
1 5 10 15
Ser Asn Leu Ile Ala Val Gly Gly Ala Ser Leu Ile Leu Ala Pro Ala
20 25 30
Ile Thr Gly Tyr Val Leu His Trp Asn Ile Ala Leu Ser Thr Ile Trp
35 40 45
Gly Val Ser Ala Tyr Gly Ile Phe Val Phe Gly Phe Phe Leu Ala Gln
50 55 60
Val Leu Phe Ser Glu Leu Asn Arg Lys Arg Leu Arg Lys Trp Ile Ser
65 70 75 80
Leu Arg Pro Lys Gly Trp Asn Asp Val Arg Leu Ala Val Ile Ile Ala
85 90 95
Gly Tyr Arg Glu Asp Pro Tyr Met Phe Gln Lys Cys Leu Glu Ser Val
100 105 110
Arg Asp Ser Asp Tyr Gly Asn Val Ala Arg Leu Ile Cys Val Ile Asp
115 120 125
Gly Asp Glu Asp Asp Asp Met Arg Met Ala Ala Val Tyr Lys Ala Ile
130 135 140
Tyr Asn Asp Asn Ile Lys Lys Pro Glu Phe Val Leu Cys Glu Ser Asp
145 150 155 160
Asp Lys Glu Gly Glu Arg Ile Asp Ser Asp Phe Ser Arg Asp Ile Cys
165 170 175
Val Leu Gln Pro His Arg Gly Lys Arg Glu Cys Leu Tyr Thr Gly Phe
180 185 190
Gln Leu Ala Lys Met Asp Pro Ser Val Asn Ala Val Val Leu Ile Asp
195 200 205
Ser Asp Thr Val Leu Glu Lys Asp Ala Ile Leu Glu Val Val Tyr Pro
210 215 220
Leu Ala Cys Asp Pro Glu Ile Gln Ala Val Ala Gly Glu Cys Lys Ile
225 230 235 240
Trp Asn Thr Asp Thr Leu Leu Ser Leu Leu Val Ala Trp Arg Tyr Tyr
245 250 255
Ser Ala Phe Cys Val Glu Arg Ser Ala Gln Ser Phe Phe Arg Thr Val
260 265 270
Gln Cys Val Gly Gly Pro Leu Gly Ala Tyr Lys Ile Asp Ile Ile Lys
275 280 285
Glu Ile Lys Asp Pro Trp Ile Ser Gln Arg Phe Leu Gly Gln Lys Cys
290 295 300
Thr Tyr Gly Asp Asp Arg Arg Leu Thr Asn Glu Ile Leu Met Arg Gly
305 310 315 320
Lys Lys Val Val Phe Thr Pro Phe Ala Val Gly Trp Gly Trp Phe Asp
325 330 335
Glu Glu Phe Thr His Trp Gly Gly Arg Tyr Ile Val Gln Gln Thr Arg
340 345 350
Trp Ser Lys Ser Trp Cys Arg Glu Ile Trp Tyr Thr Leu Phe Ala Ala
355 360 365
Trp Lys His Gly Leu Ser Gly Ile Trp Leu Ala Phe Glu Cys Leu Tyr
370 375 380
Gln Ile Thr Tyr Phe Phe Leu Val Ile Tyr Leu Phe Ser Arg Leu Ala
385 390 395 400
Val Glu Ala Asp Pro Arg Ala Gln Thr Ala Thr Val Ile Val Ser Thr
405 410 415
Thr Val Ala Leu Ile Lys Cys Gly Tyr Phe Ser Phe Arg Ala Lys Asp
420 425 430
Ile Arg Ala Phe Tyr Phe Val Leu Tyr Thr Phe Val Tyr Phe Phe Cys
435 440 445
Met Ile Pro Ala Arg Ile Thr Ala Met Met Thr Leu Trp Asp Ile Gly
450 455 460
Trp Gly Thr Arg Gly Gly Asn Glu Lys Pro Ser Val Gly Thr Arg Val
465 470 475 480
Ala Leu Trp Ala Lys Gln Tyr Leu Ile Ala Tyr Met Trp Trp Ala Ala
485 490 495
Val Val Gly Ala Gly Val Tyr Ser Ile Val His Asn Trp Met Phe Asp
500 505 510
Trp Asn Ser Leu Ser Tyr Arg Phe Ala Leu Val Gly Ile Cys Ser Tyr
515 520 525
Ile Val Phe Ile Val Ile Val Leu Val Val Tyr Phe Thr Gly Lys Ile
530 535 540
Thr Thr Trp Asn Phe Thr Lys Leu Gln Lys Glu Leu Ile Glu Asp Arg
545 550 555 560
Val Leu Tyr Asp Ala Thr Thr Asn Ala Gln Ser Val
565 570
<210> 24
<211> 571
<212> PRT
<213> other sequences
<220>
<223> reencoded amino acid sequence of a polypeptide having chondroitin
synthase activity (HCOS2-Vir)
<400> 24
Met Gly Lys Asn Ile Ile Ile Met Val Ser Trp Tyr Thr Ile Ile Thr
1 5 10 15
Ser Asn Leu Ile Ala Val Gly Gly Ala Ser Leu Ile Leu Ala Pro Ala
20 25 30
Ile Thr Gly Tyr Val Leu His Trp Asn Ile Ala Leu Ser Thr Ile Trp
35 40 45
Gly Val Ser Ala Tyr Gly Ile Phe Val Phe Gly Phe Phe Leu Ala Gln
50 55 60
Val Leu Phe Ser Glu Leu Asn Arg Lys Arg Leu Arg Lys Trp Ile Ser
65 70 75 80
Leu Arg Pro Lys Gly Trp Asn Asp Val Arg Leu Ala Val Ile Ile Ala
85 90 95
Gly Tyr Arg Glu Asp Pro Tyr Met Phe Gln Lys Cys Leu Glu Ser Val
100 105 110
Arg Asp Ser Asp Tyr Gly Asn Val Ala Arg Leu Ile Cys Val Ile Asp
115 120 125
Gly Asp Glu Asp Asp Asp Met Arg Met Ala Ala Val Tyr Lys Ala Ile
130 135 140
Tyr Asn Asp Asn Ile Lys Lys Pro Glu Phe Val Leu Cys Glu Ser Asp
145 150 155 160
Asp Lys Glu Gly Glu Arg Ile Asp Ser Asp Phe Ser Arg Asp Ile Cys
165 170 175
Val Leu Gln Pro His Arg Gly Lys Arg Glu Cys Leu Tyr Thr Gly Phe
180 185 190
Gln Leu Ala Lys Met Asp Pro Ser Val Asn Ala Val Val Leu Ile Asp
195 200 205
Ser Asp Thr Val Leu Glu Lys Asp Ala Ile Leu Glu Val Val Tyr Pro
210 215 220
Leu Ala Cys Asp Pro Glu Ile Gln Ala Val Ala Gly Glu Cys Lys Ile
225 230 235 240
Trp Asn Thr Asp Thr Leu Leu Ser Leu Leu Val Ala Trp Arg Tyr Tyr
245 250 255
Ser Ala Phe Cys Val Glu Arg Ser Ala Gln Ser Phe Phe Arg Thr Val
260 265 270
Gln Cys Val Gly Gly Pro Leu Gly Ala Tyr Lys Ile Asp Ile Ile Lys
275 280 285
Glu Ile Lys Asp Pro Trp Ile Ser Gln Arg Phe Leu Gly Gln Lys Cys
290 295 300
Thr Tyr Gly Asp Asp Arg Arg Leu Thr Asn Glu Ile Leu Met Arg Gly
305 310 315 320
Lys Lys Val Val Phe Thr Pro Phe Ala Val Gly Trp Leu His Gly Glu
325 330 335
Asn Thr Ser Ile Lys Lys Leu Arg Tyr Ile Val Gln Gln Thr Arg Trp
340 345 350
Ser Lys Ser Trp Cys Arg Glu Ile Trp Tyr Thr Leu Phe Ala Ala Trp
355 360 365
Lys His Gly Leu Ser Gly Ile Trp Leu Ala Phe Glu Cys Leu Tyr Gln
370 375 380
Ile Thr Tyr Phe Phe Leu Val Ile Tyr Leu Phe Ser Arg Leu Ala Val
385 390 395 400
Glu Ala Asp Pro Arg Ala Gln Thr Ala Thr Val Ile Val Ser Thr Thr
405 410 415
Val Ala Leu Ile Lys Cys Gly Tyr Phe Ser Phe Arg Ala Lys Asp Ile
420 425 430
Arg Ala Phe Tyr Phe Val Leu Tyr Thr Phe Val Tyr Phe Phe Cys Met
435 440 445
Ile Pro Ala Arg Ile Thr Ala Met Met Thr Leu Trp Asp Ile Gly Trp
450 455 460
Gly Thr Arg Gly Gly Asn Glu Lys Pro Ser Val Gly Thr Arg Val Ala
465 470 475 480
Leu Trp Ala Lys Gln Tyr Leu Ile Ala Tyr Met Trp Trp Ala Ala Val
485 490 495
Val Gly Ala Gly Val Tyr Ser Ile Val His Asn Trp Met Phe Asp Trp
500 505 510
Asn Ser Leu Ser Tyr Arg Phe Ala Leu Val Gly Ile Cys Ser Tyr Ile
515 520 525
Val Phe Ile Val Ile Val Leu Val Val Tyr Phe Thr Gly Lys Ile Thr
530 535 540
Thr Trp Asn Phe Thr Lys Leu Gln Lys Glu Leu Ile Glu Asp Arg Val
545 550 555 560
Leu Tyr Asp Ala Thr Thr Asn Ala Gln Ser Val
565 570
<210> 25
<211> 572
<212> PRT
<213> other sequences
<220>
<223> reencoded amino acid sequence of a polypeptide having chondroitin
synthase activity (HCOS3-Vir)
<400> 25
Met Gly Lys Asn Ile Ile Ile Met Val Ser Trp Tyr Thr Ile Ile Thr
1 5 10 15
Ser Asn Leu Ile Ala Val Gly Gly Ala Ser Leu Ile Leu Ala Pro Ala
20 25 30
Ile Thr Gly Tyr Val Leu His Trp Asn Ile Ala Leu Ser Thr Ile Trp
35 40 45
Gly Val Ser Ala Tyr Gly Ile Phe Val Phe Gly Phe Phe Leu Ala Gln
50 55 60
Val Leu Phe Ser Glu Leu Asn Arg Lys Arg Leu Arg Lys Trp Ile Ser
65 70 75 80
Leu Arg Pro Lys Gly Trp Asn Asp Val Arg Leu Ala Val Ile Ile Ala
85 90 95
Gly Tyr Arg Glu Asp Pro Tyr Met Phe Gln Lys Cys Leu Glu Ser Val
100 105 110
Arg Asp Ser Asp Tyr Gly Asn Val Ala Arg Leu Ile Cys Val Ile Asp
115 120 125
Gly Asp Glu Asp Asp Asp Met Arg Met Ala Ala Val Tyr Lys Ala Ile
130 135 140
Tyr Asn Asp Asn Ile Lys Lys Pro Glu Phe Val Leu Cys Glu Ser Asp
145 150 155 160
Asp Lys Glu Gly Glu Arg Ile Asp Ser Asp Phe Ser Arg Asp Ile Cys
165 170 175
Val Leu Gln Pro His Arg Gly Lys Arg Glu Cys Leu Tyr Thr Gly Phe
180 185 190
Gln Leu Ala Lys Met Asp Pro Ser Val Asn Ala Val Val Leu Ile Asp
195 200 205
Ser Asp Thr Val Leu Glu Lys Asp Ala Ile Leu Glu Val Val Tyr Pro
210 215 220
Leu Ala Cys Asp Pro Glu Ile Gln Ala Val Ala Gly Glu Cys Lys Ile
225 230 235 240
Trp Asn Thr Asp Thr Leu Leu Ser Leu Leu Val Ala Trp Arg Tyr Tyr
245 250 255
Ser Ala Phe Cys Val Glu Arg Ser Ala Gln Ser Phe Phe Arg Thr Val
260 265 270
Gln Cys Val Gly Gly Pro Leu Gly Ala Tyr Lys Ile Asp Ile Ile Lys
275 280 285
Glu Ile Lys Asp Pro Trp Ile Ser Gln Arg Phe Leu Gly Gln Lys Cys
290 295 300
Thr Tyr Gly Asp Asp Arg Arg Leu Thr Asn Glu Ile Leu Met Arg Gly
305 310 315 320
Lys Lys Val Val Phe Thr Pro Phe Ala Val Gly Trp His Met Ala Trp
325 330 335
Ser Asp Lys Asp Asp Ala Ile Asp Arg Tyr Ile Val Gln Gln Thr Arg
340 345 350
Trp Ser Lys Ser Trp Cys Arg Glu Ile Trp Tyr Thr Leu Phe Ala Ala
355 360 365
Trp Lys His Gly Leu Ser Gly Ile Trp Leu Ala Phe Glu Cys Leu Tyr
370 375 380
Gln Ile Thr Tyr Phe Phe Leu Val Ile Tyr Leu Phe Ser Arg Leu Ala
385 390 395 400
Val Glu Ala Asp Pro Arg Ala Gln Thr Ala Thr Val Ile Val Ser Thr
405 410 415
Thr Val Ala Leu Ile Lys Cys Gly Tyr Phe Ser Phe Arg Ala Lys Asp
420 425 430
Ile Arg Ala Phe Tyr Phe Val Leu Tyr Thr Phe Val Tyr Phe Phe Cys
435 440 445
Met Ile Pro Ala Arg Ile Thr Ala Met Met Thr Leu Trp Asp Ile Gly
450 455 460
Trp Gly Thr Arg Gly Gly Asn Glu Lys Pro Ser Val Gly Thr Arg Val
465 470 475 480
Ala Leu Trp Ala Lys Gln Tyr Leu Ile Ala Tyr Met Trp Trp Ala Ala
485 490 495
Val Val Gly Ala Gly Val Tyr Ser Ile Val His Asn Trp Met Phe Asp
500 505 510
Trp Asn Ser Leu Ser Tyr Arg Phe Ala Leu Val Gly Ile Cys Ser Tyr
515 520 525
Ile Val Phe Ile Val Ile Val Leu Val Val Tyr Phe Thr Gly Lys Ile
530 535 540
Thr Thr Trp Asn Phe Thr Lys Leu Gln Lys Glu Leu Ile Glu Asp Arg
545 550 555 560
Val Leu Tyr Asp Ala Thr Thr Asn Ala Gln Ser Val
565 570
<210> 26
<211> 570
<212> PRT
<213> other sequences
<220>
<223> reencoded amino acid sequence of a polypeptide having chondroitin
synthase activity (HCOS4-Vir)
<400> 26
Met Gly Lys Asn Ile Ile Ile Met Val Ser Trp Tyr Thr Ile Ile Thr
1 5 10 15
Ser Asn Leu Ile Ala Val Gly Gly Ala Ser Leu Ile Leu Ala Pro Ala
20 25 30
Ile Thr Gly Tyr Val Leu His Trp Asn Ile Ala Leu Ser Thr Ile Trp
35 40 45
Gly Val Ser Ala Tyr Gly Ile Phe Val Phe Gly Phe Phe Leu Ala Gln
50 55 60
Val Leu Phe Ser Glu Leu Asn Arg Lys Arg Leu Arg Lys Trp Ile Ser
65 70 75 80
Leu Arg Pro Lys Gly Trp Asn Asp Val Arg Leu Ala Val Ile Ile Ala
85 90 95
Gly Tyr Arg Glu Asp Pro Tyr Met Phe Gln Lys Cys Leu Glu Ser Val
100 105 110
Arg Asp Ser Asp Tyr Gly Asn Val Ala Arg Leu Ile Cys Val Ile Asp
115 120 125
Gly Asp Glu Asp Asp Asp Met Arg Met Ala Ala Val Tyr Lys Ala Ile
130 135 140
Tyr Asn Asp Asn Ile Lys Lys Pro Glu Phe Val Leu Cys Glu Ser Asp
145 150 155 160
Asp Lys Glu Gly Glu Arg Ile Asp Ser Asp Phe Ser Arg Asp Ile Cys
165 170 175
Val Leu Gln Pro His Arg Gly Lys Arg Glu Cys Leu Tyr Thr Gly Phe
180 185 190
Gln Leu Ala Lys Met Asp Pro Ser Val Asn Ala Val Val Leu Ile Asp
195 200 205
Ser Asp Thr Val Leu Glu Lys Asp Ala Ile Leu Glu Val Val Tyr Pro
210 215 220
Leu Ala Cys Asp Pro Glu Ile Gln Ala Val Ala Gly Glu Cys Lys Ile
225 230 235 240
Trp Asn Thr Asp Thr Leu Leu Ser Leu Leu Val Ala Trp Arg Tyr Tyr
245 250 255
Ser Ala Phe Cys Val Glu Arg Ser Ala Gln Ser Phe Phe Arg Thr Val
260 265 270
Gln Cys Val Gly Gly Pro Leu Gly Ala Tyr Lys Ile Asp Ile Ile Lys
275 280 285
Glu Ile Lys Asp Pro Trp Ile Ser Gln Arg Phe Leu Gly Gln Lys Cys
290 295 300
Thr Tyr Gly Asp Asp Arg Arg Leu Thr Asn Glu Ile Leu Met Arg Gly
305 310 315 320
Lys Lys Val Val Phe Thr Pro Phe Ala Val Gly Trp Phe Asp Glu Glu
325 330 335
Phe Thr His Trp Gly Gly Arg Tyr Ile Val Gln Gln Thr Arg Trp Ser
340 345 350
Lys Ser Trp Cys Arg Glu Ile Trp Tyr Thr Leu Phe Ala Ala Trp Lys
355 360 365
His Gly Leu Ser Gly Ile Trp Leu Ala Phe Glu Cys Leu Tyr Gln Ile
370 375 380
Thr Tyr Phe Phe Leu Val Ile Tyr Leu Phe Ser Arg Leu Ala Val Glu
385 390 395 400
Ala Asp Pro Arg Ala Gln Thr Ala Thr Val Ile Val Ser Thr Thr Val
405 410 415
Ala Leu Ile Lys Cys Gly Tyr Phe Ser Phe Arg Ala Lys Asp Ile Arg
420 425 430
Ala Phe Tyr Phe Val Leu Tyr Thr Phe Val Tyr Phe Phe Cys Met Ile
435 440 445
Pro Ala Arg Ile Thr Ala Met Met Thr Leu Trp Asp Ile Gly Trp Gly
450 455 460
Thr Arg Gly Gly Asn Glu Lys Pro Ser Val Gly Thr Arg Val Ala Leu
465 470 475 480
Trp Ala Lys Gln Tyr Leu Ile Ala Tyr Met Trp Trp Ala Ala Val Val
485 490 495
Gly Ala Gly Val Tyr Ser Ile Val His Asn Trp Met Phe Asp Trp Asn
500 505 510
Ser Leu Ser Tyr Arg Phe Ala Leu Val Gly Ile Cys Ser Tyr Ile Val
515 520 525
Phe Ile Val Ile Val Leu Val Val Tyr Phe Thr Gly Lys Ile Thr Thr
530 535 540
Trp Asn Phe Thr Lys Leu Gln Lys Glu Leu Ile Glu Asp Arg Val Leu
545 550 555 560
Tyr Asp Ala Thr Thr Asn Ala Gln Ser Val
565 570
<210> 27
<211> 692
<212> PRT
<213> other sequences
<220>
<223> amino acid sequence of a polypeptide having chondroitin synthase
activity (HCOS5-Vir)
<400> 27
Met Gly Lys Asn Ile Ile Ile Met Val Ser Trp Tyr Thr Ile Ile Thr
1 5 10 15
Ser Asn Leu Ile Ala Val Gly Gly Ala Ser Leu Ile Leu Ala Pro Ala
20 25 30
Ile Thr Gly Tyr Val Leu His Trp Asn Ile Ala Leu Ser Thr Ile Trp
35 40 45
Gly Val Ser Ala Tyr Gly Ile Phe Val Phe Gly Phe Phe Leu Ala Gln
50 55 60
Val Leu Phe Ser Glu Leu Asn Arg Lys Arg Leu Arg Lys Trp Ile Ser
65 70 75 80
Leu Arg Pro Lys Ser Ile His His Pro Ile Ser Lys Thr Thr His Pro
85 90 95
Asp Thr Glu Asn Ala Gly Asp Ser Thr Leu Leu Cys Pro Pro Met Asp
100 105 110
Gly Met Asp Asp Ile Leu Val Val Met Lys Thr Gly Val Thr Glu Ala
115 120 125
Lys Glu Lys Val Pro Val His Phe Gln Thr Thr Leu Arg Cys Val Pro
130 135 140
His Tyr Val Ile Tyr Ser Asp Phe Glu Glu Glu Ile Glu Gly Val Lys
145 150 155 160
Ile Tyr Asp Val Leu Gln Gly Met Asp Pro Asp Val Met Thr Gln Val
165 170 175
Pro Asp Phe Asp Leu Tyr Asn Arg Ile Lys Lys Leu Gly Arg Gln Gly
180 185 190
Leu Ala Glu Asn Asp Phe Ala Asp Glu Ala Asn Ser Ala Val Gly Lys
195 200 205
Pro Asn Asn Pro Gly Trp Lys Leu Asp Lys Trp Lys Phe Leu Pro Met
210 215 220
Ile Ile Glu Ala Leu Arg Tyr Lys Pro Lys Ala Lys Trp Tyr Val Phe
225 230 235 240
Met Glu Ala Asp Thr Tyr Ile Ser Trp Pro Thr Leu Leu Ala Trp Leu
245 250 255
Lys His Phe Asn His Lys Lys Pro Trp Tyr Leu Gly Thr Glu Thr Gln
260 265 270
Ile Ala Asp Val Ile Phe Ala His Gly Gly Ser Gly Phe Met Ile Ser
275 280 285
His Ala Ala Leu Lys Leu Ala Ala Glu Glu Tyr Thr Ala Arg Arg Thr
290 295 300
Glu Leu His His Tyr Thr Asp Gly His Trp Ala Gly Asp Cys Val Leu
305 310 315 320
Gly Lys Val Leu Ala Asp Ala Gly Val Asn Leu His Phe Ser Trp Pro
325 330 335
Ile Leu Gln Asn Ser Asn Leu Gly Glu Leu Asp Glu Phe Asn Val Asp
340 345 350
Leu Tyr Arg Gln Pro Trp Cys Phe Pro Ala Ala Ala Phe His His Leu
355 360 365
Asn Ala Gln Lys Ile Gln Asp Leu Trp Ser Tyr Glu Gln Lys Arg Trp
370 375 380
Gln Asp Lys Asp Lys Arg Val Leu Leu His Ser Asp Val Phe Arg Asp
385 390 395 400
Leu Leu Tyr Pro Asp Ile Ala Leu Lys Pro Ala Arg Ile Gly Trp Asp
405 410 415
Asn Leu Ser Ala Asp Glu Gln Ser Thr Ala Ser Ser Phe Glu Glu Cys
420 425 430
Arg Gln Ile Cys Asp Gln Leu Asp Asp Cys Thr Gln Phe Ser Phe Arg
435 440 445
Asp Lys Ser Cys Phe Thr Ser Arg Thr Pro Arg Leu Gly Ala Ala Asn
450 455 460
Pro Asn Thr Val Ser Gly Trp Met Val Asp Arg Ile Arg Ala Asn Met
465 470 475 480
Glu Lys Ser Gly Leu Phe Ala Ala Trp Lys His Gly Leu Ser Gly Ile
485 490 495
Trp Leu Ala Phe Glu Cys Leu Tyr Gln Ile Thr Tyr Phe Phe Leu Val
500 505 510
Ile Tyr Leu Phe Ser Arg Leu Ala Val Glu Ala Asp Pro Arg Ala Gln
515 520 525
Thr Ala Thr Val Ile Val Ser Thr Thr Val Ala Leu Ile Lys Cys Gly
530 535 540
Tyr Phe Ser Phe Arg Ala Lys Asp Ile Arg Ala Phe Tyr Phe Val Leu
545 550 555 560
Tyr Thr Phe Val Tyr Phe Phe Cys Met Ile Pro Ala Arg Ile Thr Ala
565 570 575
Met Met Thr Leu Trp Asp Ile Gly Trp Gly Thr Arg Gly Gly Asn Glu
580 585 590
Lys Pro Ser Val Gly Thr Arg Val Ala Leu Trp Ala Lys Gln Tyr Leu
595 600 605
Ile Ala Tyr Met Trp Trp Ala Ala Val Val Gly Ala Gly Val Tyr Ser
610 615 620
Ile Val His Asn Trp Met Phe Asp Trp Asn Ser Leu Ser Tyr Arg Phe
625 630 635 640
Ala Leu Val Gly Ile Cys Ser Tyr Ile Val Phe Ile Val Ile Val Leu
645 650 655
Val Val Tyr Phe Thr Gly Lys Ile Thr Thr Trp Asn Phe Thr Lys Leu
660 665 670
Gln Lys Glu Leu Ile Glu Asp Arg Val Leu Tyr Asp Ala Thr Thr Asn
675 680 685
Ala Gln Ser Val
690
<210> 28
<211> 910
<212> PRT
<213> other sequences
<220>
<223> amino acid sequence of a polypeptide having chondroitin synthase
activity (HCOS6-Vir)
<400> 28
Met Gly Lys Asn Ile Ile Ile Met Val Ser Trp Tyr Thr Ile Ile Thr
1 5 10 15
Ser Asn Leu Ile Ala Val Gly Gly Ala Ser Leu Ile Leu Ala Pro Ala
20 25 30
Ile Thr Gly Tyr Val Leu His Trp Asn Ile Ala Leu Ser Thr Ile Trp
35 40 45
Gly Val Ser Ala Tyr Gly Ile Phe Val Phe Gly Phe Phe Leu Ala Gln
50 55 60
Val Leu Phe Ser Glu Leu Asn Arg Lys Arg Leu Arg Lys Trp Ile Ser
65 70 75 80
Leu Arg Pro Lys Leu Asp Ile Ala Thr Gln Leu Leu Leu Ser Asn Val
85 90 95
Lys Lys Leu Thr Leu Ser Glu Ser Glu Lys Asn Ser Leu Lys Asn Lys
100 105 110
Trp Lys Ser Ile Thr Gly Lys Lys Ser Glu Asn Ala Glu Ile Arg Lys
115 120 125
Val Glu Leu Val Pro Lys Asp Phe Pro Lys Asp Leu Val Leu Ala Pro
130 135 140
Leu Pro Asp His Val Asn Asp Phe Thr Trp Tyr Lys Asn Arg Lys Lys
145 150 155 160
Ser Leu Gly Ile Lys Pro Val Asn Lys Asn Ile Gly Leu Ser Ile Ile
165 170 175
Ile Pro Thr Phe Asn Arg Ser Arg Ile Leu Asp Ile Thr Leu Ala Cys
180 185 190
Leu Val Asn Gln Lys Thr Asn Tyr Pro Phe Glu Val Val Val Ala Asp
195 200 205
Asp Gly Ser Lys Glu Asn Leu Leu Thr Ile Val Gln Lys Tyr Glu Gln
210 215 220
Lys Leu Asp Ile Lys Tyr Val Arg Gln Lys Asp Tyr Gly Tyr Gln Leu
225 230 235 240
Cys Ala Val Arg Asn Leu Gly Leu Arg Thr Ala Lys Tyr Asp Phe Val
245 250 255
Ser Ile Leu Asp Cys Asp Met Ala Pro Gln Gln Leu Trp Val His Ser
260 265 270
Tyr Leu Thr Glu Leu Leu Glu Asp Asn Asp Ile Val Leu Ile Gly Pro
275 280 285
Arg Lys Tyr Val Asp Thr His Asn Ile Thr Ala Glu Gln Phe Leu Asn
290 295 300
Asp Pro Tyr Leu Ile Glu Ser Leu Pro Glu Thr Ala Thr Asn Asn Asn
305 310 315 320
Pro Ser Ile Thr Ser Lys Gly Asn Ile Ser Leu Asp Trp Arg Leu Glu
325 330 335
His Phe Lys Lys Thr Asp Asn Leu Arg Leu Cys Asp Ser Pro Phe Arg
340 345 350
Tyr Phe Ser Cys Gly Asn Val Ala Phe Ser Lys Glu Trp Leu Asn Lys
355 360 365
Val Gly Trp Phe Asp Glu Glu Phe Asn His Trp Gly Gly Glu Asp Val
370 375 380
Glu Phe Gly Tyr Arg Leu Phe Ala Lys Gly Cys Phe Phe Arg Val Ile
385 390 395 400
Asp Gly Gly Met Ala Tyr His Gln Glu Pro Pro Gly Lys Glu Asn Glu
405 410 415
Thr Asp Arg Glu Ala Gly Lys Ser Ile Thr Leu Lys Ile Val Lys Glu
420 425 430
Lys Val Pro Tyr Ile Tyr Arg Lys Leu Leu Pro Ile Glu Asp Ser His
435 440 445
Ile His Arg Ile Pro Leu Val Ser Ile Tyr Ile Pro Ala Tyr Asn Cys
450 455 460
Ala Asn Tyr Ile Gln Arg Cys Val Asp Ser Ala Leu Asn Gln Thr Val
465 470 475 480
Val Asp Leu Glu Val Cys Ile Cys Asn Asp Gly Ser Thr Asp Asn Thr
485 490 495
Leu Glu Val Ile Asn Lys Leu Tyr Gly Asn Asn Pro Arg Val Arg Ile
500 505 510
Met Ser Lys Pro Asn Gly Gly Ile Ala Ser Ala Ser Asn Ala Ala Val
515 520 525
Ser Phe Ala Lys Gly Tyr Tyr Ile Gly Gln Leu Asp Ser Asp Asp Tyr
530 535 540
Leu Glu Pro Asp Ala Val Glu Leu Cys Leu Lys Glu Phe Leu Lys Asp
545 550 555 560
Lys Thr Leu Ala Cys Val Tyr Thr Thr Asn Arg Asn Val Asn Pro Asp
565 570 575
Gly Ser Leu Ile Ala Asn Gly Tyr Asn Trp Pro Glu Phe Ser Arg Glu
580 585 590
Lys Leu Thr Thr Ala Met Ile Ala His His Phe Arg Met Phe Thr Ile
595 600 605
Arg Ala Trp His Leu Thr Asp Gly Phe Asn Glu Lys Ile Glu Asn Ala
610 615 620
Val Asp Tyr Asp Met Phe Leu Lys Leu Ser Glu Val Gly Lys Phe Lys
625 630 635 640
His Leu Asn Lys Ile Cys Tyr Asn Arg Val Leu His Gly Asp Asn Thr
645 650 655
Ser Ile Lys Asn Leu Asp Thr Gln Lys Lys Asn His Phe Val Val Val
660 665 670
Asn Gln Ser Leu Asn Arg Gln Arg Val Ser Asn Tyr Asn Tyr Asp Glu
675 680 685
Phe Asp Asn Leu Asp Glu Ser Arg Lys Tyr Ile Phe Asn Lys Leu Phe
690 695 700
Ala Ala Trp Lys His Gly Leu Ser Gly Ile Trp Leu Ala Phe Glu Cys
705 710 715 720
Leu Tyr Gln Ile Thr Tyr Phe Phe Leu Val Ile Tyr Leu Phe Ser Arg
725 730 735
Leu Ala Val Glu Ala Asp Pro Arg Ala Gln Thr Ala Thr Val Ile Val
740 745 750
Ser Thr Thr Val Ala Leu Ile Lys Cys Gly Tyr Phe Ser Phe Arg Ala
755 760 765
Lys Asp Ile Arg Ala Phe Tyr Phe Val Leu Tyr Thr Phe Val Tyr Phe
770 775 780
Phe Cys Met Ile Pro Ala Arg Ile Thr Ala Met Met Thr Leu Trp Asp
785 790 795 800
Ile Gly Trp Gly Thr Arg Gly Gly Asn Glu Lys Pro Ser Val Gly Thr
805 810 815
Arg Val Ala Leu Trp Ala Lys Gln Tyr Leu Ile Ala Tyr Met Trp Trp
820 825 830
Ala Ala Val Val Gly Ala Gly Val Tyr Ser Ile Val His Asn Trp Met
835 840 845
Phe Asp Trp Asn Ser Leu Ser Tyr Arg Phe Ala Leu Val Gly Ile Cys
850 855 860
Ser Tyr Ile Val Phe Ile Val Ile Val Leu Val Val Tyr Phe Thr Gly
865 870 875 880
Lys Ile Thr Thr Trp Asn Phe Thr Lys Leu Gln Lys Glu Leu Ile Glu
885 890 895
Asp Arg Val Leu Tyr Asp Ala Thr Thr Asn Ala Gln Ser Val
900 905 910
<210> 29
<211> 703
<212> PRT
<213> other sequences
<220>
<223> reencoded amino acid sequence of a polypeptide having chondroitin
synthase activity (HCOS7-Vir)
<400> 29
Met Gly Lys Asn Ile Ile Ile Met Val Ser Trp Tyr Thr Ile Ile Thr
1 5 10 15
Ser Asn Leu Ile Ala Val Gly Gly Ala Ser Leu Ile Leu Ala Pro Ala
20 25 30
Ile Thr Gly Tyr Val Leu His Trp Asn Ile Ala Leu Ser Thr Ile Trp
35 40 45
Gly Val Ser Ala Tyr Gly Ile Phe Val Phe Gly Phe Phe Leu Ala Gln
50 55 60
Val Leu Phe Ser Glu Leu Asn Arg Lys Arg Leu Arg Lys Trp Ile Ser
65 70 75 80
Leu Arg Pro Lys Ile Pro Thr Phe Asn Arg Ser Arg Ile Leu Asp Ile
85 90 95
Thr Leu Ala Cys Leu Val Asn Gln Lys Thr Asn Tyr Pro Phe Glu Val
100 105 110
Val Val Ala Asp Asp Gly Ser Lys Glu Asn Leu Leu Thr Ile Val Gln
115 120 125
Lys Tyr Glu Gln Lys Leu Asp Ile Lys Tyr Val Arg Gln Lys Asp Tyr
130 135 140
Gly Tyr Gln Leu Cys Ala Val Arg Asn Leu Gly Leu Arg Thr Ala Lys
145 150 155 160
Tyr Asp Phe Val Ser Ile Leu Asp Cys Asp Met Ala Pro Gln Gln Leu
165 170 175
Trp Val His Ser Tyr Leu Thr Glu Leu Leu Glu Asp Asn Asp Ile Val
180 185 190
Leu Ile Gly Pro Arg Lys Tyr Val Asp Thr His Asn Ile Thr Ala Glu
195 200 205
Gln Phe Leu Asn Asp Pro Tyr Leu Ile Glu Ser Leu Pro Glu Thr Ala
210 215 220
Thr Asn Asn Asn Pro Ser Ile Thr Ser Lys Gly Asn Ile Ser Leu Asp
225 230 235 240
Trp Arg Leu Glu His Phe Lys Lys Thr Asp Asn Leu Arg Leu Cys Asp
245 250 255
Ser Pro Phe Arg Tyr Phe Ser Cys Gly Asn Val Ala Phe Ser Lys Glu
260 265 270
Trp Leu Asn Lys Val Gly Trp Phe Asp Glu Glu Phe Asn His Trp Gly
275 280 285
Gly Glu Asp Val Glu Phe Gly Tyr Arg Leu Phe Ala Lys Gly Cys Phe
290 295 300
Phe Arg Val Ile Asp Gly Gly Met Ala Tyr His Gln Glu Pro Pro Gly
305 310 315 320
Lys Glu Asn Glu Thr Asp Arg Glu Ala Gly Lys Ser Ile Thr Leu Lys
325 330 335
Ile Val Lys Glu Lys Val Pro Tyr Ile Tyr Arg Lys Leu Leu Pro Ile
340 345 350
Glu Asp Ser His Ile His Arg Ile Pro Leu Val Ser Ile Tyr Ile Pro
355 360 365
Ala Tyr Asn Cys Ala Asn Tyr Ile Gln Arg Cys Val Asp Ser Ala Leu
370 375 380
Asn Gln Thr Val Val Asp Leu Glu Val Cys Ile Cys Asn Asp Gly Ser
385 390 395 400
Thr Asp Asn Thr Leu Glu Val Ile Asn Lys Leu Tyr Gly Asn Asn Pro
405 410 415
Arg Val Arg Ile Met Ser Lys Pro Asn Gly Gly Ile Ala Ser Ala Ser
420 425 430
Asn Ala Ala Val Ser Phe Ala Lys Gly Tyr Tyr Ile Gly Gln Leu Asp
435 440 445
Ser Asp Asp Tyr Leu Glu Pro Asp Ala Val Glu Leu Cys Leu Lys Glu
450 455 460
Phe Leu Lys Asp Lys Thr Leu Ala Cys Val Tyr Thr Thr Asn Arg Asn
465 470 475 480
Val Asn Pro Asp Gly Ser Leu Ile Ala Asn Gly Tyr Asn Trp Pro Leu
485 490 495
Phe Ala Ala Trp Lys His Gly Leu Ser Gly Ile Trp Leu Ala Phe Glu
500 505 510
Cys Leu Tyr Gln Ile Thr Tyr Phe Phe Leu Val Ile Tyr Leu Phe Ser
515 520 525
Arg Leu Ala Val Glu Ala Asp Pro Arg Ala Gln Thr Ala Thr Val Ile
530 535 540
Val Ser Thr Thr Val Ala Leu Ile Lys Cys Gly Tyr Phe Ser Phe Arg
545 550 555 560
Ala Lys Asp Ile Arg Ala Phe Tyr Phe Val Leu Tyr Thr Phe Val Tyr
565 570 575
Phe Phe Cys Met Ile Pro Ala Arg Ile Thr Ala Met Met Thr Leu Trp
580 585 590
Asp Ile Gly Trp Gly Thr Arg Gly Gly Asn Glu Lys Pro Ser Val Gly
595 600 605
Thr Arg Val Ala Leu Trp Ala Lys Gln Tyr Leu Ile Ala Tyr Met Trp
610 615 620
Trp Ala Ala Val Val Gly Ala Gly Val Tyr Ser Ile Val His Asn Trp
625 630 635 640
Met Phe Asp Trp Asn Ser Leu Ser Tyr Arg Phe Ala Leu Val Gly Ile
645 650 655
Cys Ser Tyr Ile Val Phe Ile Val Ile Val Leu Val Val Tyr Phe Thr
660 665 670
Gly Lys Ile Thr Thr Trp Asn Phe Thr Lys Leu Gln Lys Glu Leu Ile
675 680 685
Glu Asp Arg Val Leu Tyr Asp Ala Thr Thr Asn Ala Gln Ser Val
690 695 700
<210> 30
<211> 569
<212> PRT
<213> other sequences
<220>
<223> reencoded amino acid sequence of a polypeptide having chondroitin
synthase activity (HCOS8-Vir)
<400> 30
Met Gly Lys Asn Ile Ile Ile Met Val Ser Trp Tyr Thr Ile Ile Thr
1 5 10 15
Ser Asn Leu Ile Ala Val Gly Gly Ala Ser Leu Ile Leu Ala Pro Ala
20 25 30
Ile Thr Gly Tyr Val Leu His Trp Asn Ile Ala Leu Ser Thr Ile Trp
35 40 45
Gly Val Ser Ala Tyr Gly Ile Phe Val Phe Gly Phe Phe Leu Ala Gln
50 55 60
Val Leu Phe Ser Glu Leu Asn Arg Lys Arg Leu Arg Lys Trp Ile Ser
65 70 75 80
Leu Arg Pro Lys Gly Trp Asn Asp Val Arg Leu Ala Val Ile Ile Ala
85 90 95
Gly Tyr Arg Glu Asp Pro Tyr Met Phe Gln Lys Cys Leu Glu Ser Val
100 105 110
Arg Asp Ser Asp Tyr Gly Asn Val Ala Arg Leu Ile Cys Val Ile Asp
115 120 125
Gly Asp Glu Asp Asp Asp Met Arg Met Ala Ala Val Tyr Lys Ala Ile
130 135 140
Tyr Asn Asp Asn Ile Lys Lys Pro Glu Phe Val Leu Cys Glu Ser Asp
145 150 155 160
Asp Lys Glu Gly Glu Arg Ile Asp Ser Asp Phe Ser Arg Asp Ile Cys
165 170 175
Val Leu Gln Pro His Arg Gly Lys Arg Glu Cys Leu Tyr Thr Gly Phe
180 185 190
Gln Leu Ala Lys Met Asp Pro Ser Val Asn Ala Val Val Leu Ile Asp
195 200 205
Ser Asp Thr Val Leu Glu Lys Asp Ala Ile Leu Glu Val Val Tyr Pro
210 215 220
Leu Ala Cys Asp Pro Glu Ile Gln Ala Val Ala Gly Glu Cys Lys Ile
225 230 235 240
Trp Asn Thr Asp Thr Leu Leu Ser Leu Leu Val Ala Trp Arg Tyr Tyr
245 250 255
Ser Ala Phe Cys Val Glu Arg Ser Ala Gln Ser Phe Phe Arg Thr Val
260 265 270
Gln Cys Val Arg Leu Cys Asp Ser Pro Phe Arg Tyr Phe Ser Cys Gly
275 280 285
Asn Val Ala Phe Ser Lys Glu Trp Leu Asn Lys Val Gly Trp Phe Asp
290 295 300
Glu Glu Phe Asn His Trp Gly Gly Glu Asp Val Glu Phe Gly Tyr Arg
305 310 315 320
Leu Lys Lys Val Val Phe Thr Pro Phe Ala Val Gly Trp Ser Asp Ser
325 330 335
Pro Thr Asn Val Phe Arg Tyr Ile Val Gln Gln Thr Arg Trp Ser Lys
340 345 350
Ser Trp Cys Arg Glu Ile Trp Tyr Thr Leu Phe Ala Ala Trp Lys His
355 360 365
Gly Leu Ser Gly Ile Trp Leu Ala Phe Glu Cys Leu Tyr Gln Ile Thr
370 375 380
Tyr Phe Phe Leu Val Ile Tyr Leu Phe Ser Arg Leu Ala Val Glu Ala
385 390 395 400
Asp Pro Arg Ala Gln Thr Ala Thr Val Ile Val Ser Thr Thr Val Ala
405 410 415
Leu Ile Lys Cys Gly Tyr Phe Ser Phe Arg Ala Lys Asp Ile Arg Ala
420 425 430
Phe Tyr Phe Val Leu Tyr Thr Phe Val Tyr Phe Phe Cys Met Ile Pro
435 440 445
Ala Arg Ile Thr Ala Met Met Thr Leu Trp Asp Ile Gly Trp Gly Thr
450 455 460
Arg Gly Gly Asn Glu Lys Pro Ser Val Gly Thr Arg Val Ala Leu Trp
465 470 475 480
Ala Lys Gln Tyr Leu Ile Ala Tyr Met Trp Trp Ala Ala Val Val Gly
485 490 495
Ala Gly Val Tyr Ser Ile Val His Asn Trp Met Phe Asp Trp Asn Ser
500 505 510
Leu Ser Tyr Arg Phe Ala Leu Val Gly Ile Cys Ser Tyr Ile Val Phe
515 520 525
Ile Val Ile Val Leu Val Val Tyr Phe Thr Gly Lys Ile Thr Thr Trp
530 535 540
Asn Phe Thr Lys Leu Gln Lys Glu Leu Ile Glu Asp Arg Val Leu Tyr
545 550 555 560
Asp Ala Thr Thr Asn Ala Gln Ser Val
565
<210> 31
<211> 832
<212> PRT
<213> other sequences
<220>
<223> amino acid sequence of a polypeptide having chondroitin synthase
activity (HCOS9-Vir)
<400> 31
Met Gly Lys Asn Ile Ile Ile Met Val Ser Trp Tyr Thr Ile Ile Thr
1 5 10 15
Ser Asn Leu Ile Ala Val Gly Gly Ala Ser Leu Ile Leu Ala Pro Ala
20 25 30
Ile Thr Gly Tyr Val Leu His Trp Asn Ile Ala Leu Ser Thr Ile Trp
35 40 45
Gly Val Ser Ala Tyr Gly Ile Phe Val Phe Gly Phe Phe Leu Ala Gln
50 55 60
Val Leu Phe Ser Glu Leu Asn Arg Lys Arg Leu Arg Lys Trp Ile Ser
65 70 75 80
Leu Arg Pro Lys His Ile Gly Lys Cys Leu Arg Glu Met Tyr Thr Thr
85 90 95
His Glu Asp Val Glu Val Gly Arg Cys Val Arg Arg Phe Ala Gly Val
100 105 110
Gln Cys Val Trp Ser Tyr Glu Met Gln Gln Leu Phe Tyr Glu Asn Tyr
115 120 125
Glu Gln Asn Lys Lys Gly Tyr Ile Arg Asp Leu His Asn Ser Lys Ile
130 135 140
His Gln Ala Ile Thr Leu His Pro Asn Lys Asn Pro Pro Tyr Gln Tyr
145 150 155 160
Arg Leu His Ser Tyr Met Leu Ser Arg Lys Ile Ser Glu Leu Arg His
165 170 175
Arg Thr Ile Gln Leu His Arg Glu Ile Val Leu Met Ser Lys Tyr Ser
180 185 190
Asn Thr Glu Ile His Lys Glu Asp Leu Gln Leu Gly Ile Pro Pro Ser
195 200 205
Phe Met Arg Phe Gln Pro Arg Gln Arg Glu Glu Ile Leu Glu Trp Glu
210 215 220
Phe Leu Thr Gly Lys Tyr Leu Tyr Ser Ala Val Asp Gly Gln Pro Pro
225 230 235 240
Arg Arg Gly Met Asp Ser Ala Gln Arg Glu Ala Leu Asp Asp Ile Val
245 250 255
Met Gln Val Met Glu Met Ile Asn Ala Asn Ala Lys Thr Arg Gly Arg
260 265 270
Ile Ile Asp Phe Lys Glu Ile Gln Tyr Gly Tyr Arg Arg Val Asn Pro
275 280 285
Met Tyr Gly Ala Glu Tyr Ile Leu Asp Leu Leu Leu Leu Tyr Lys Lys
290 295 300
His Lys Gly Lys Lys Met Thr Val Pro Val Arg Arg His Ala Tyr Leu
305 310 315 320
Gln Gln Thr Phe Ser Lys Ile Gln Phe Val Glu His Glu Glu Leu Asp
325 330 335
Ala Gln Glu Leu Ala Lys Arg Ile Asn Gln Glu Ser Gly Ser Leu Ser
340 345 350
Phe Leu Ser Asn Ser Leu Lys Lys Leu Val Pro Phe Gln Leu Pro Gly
355 360 365
Ser Lys Ser Glu His Lys Glu Pro Lys Asp Lys Lys Ile Asn Ile Leu
370 375 380
Ile Pro Leu Ser Gly Arg Phe Asp Met Phe Val Arg Phe Met Gly Asn
385 390 395 400
Phe Glu Lys Thr Cys Leu Ile Pro Asn Gln Asn Val Lys Leu Val Val
405 410 415
Leu Leu Phe Asn Ser Asp Ser Asn Pro Asp Lys Ala Lys Gln Val Glu
420 425 430
Leu Met Arg Asp Tyr Arg Ile Lys Tyr Pro Lys Ala Asp Met Gln Ile
435 440 445
Leu Pro Val Ser Gly Glu Phe Ser Arg Ala Leu Ala Leu Glu Val Gly
450 455 460
Ser Ser Gln Phe Asn Asn Glu Ser Leu Leu Phe Phe Cys Asp Val Asp
465 470 475 480
Leu Val Phe Thr Thr Glu Phe Leu Gln Arg Cys Arg Ala Asn Thr Val
485 490 495
Leu Gly Gln Gln Ile Tyr Phe Pro Ile Ile Phe Ser Gln Tyr Asp Pro
500 505 510
Lys Ile Val Tyr Ser Gly Lys Val Pro Ser Asp Asn His Phe Ala Phe
515 520 525
Thr Gln Lys Thr Gly Phe Trp Arg Asn Tyr Gly Phe Gly Ile Thr Cys
530 535 540
Ile Tyr Lys Gly Asp Leu Val Arg Val Gly Gly Phe Asp Val Ser Ile
545 550 555 560
Gln Gly Trp Gly Leu Glu Asp Val Asp Leu Phe Asn Lys Val Val Gln
565 570 575
Ala Gly Leu Lys Thr Phe Arg Ser Gln Glu Val Gly Val Val His Val
580 585 590
His His Pro Val Phe Cys Asp Pro Asn Leu Asp Pro Lys Gln Tyr Lys
595 600 605
Met Cys Leu Gly Ser Lys Ala Ser Thr Tyr Gly Ser Thr Gln Gln Leu
610 615 620
Leu Phe Ala Ala Trp Lys His Gly Leu Ser Gly Ile Trp Leu Ala Phe
625 630 635 640
Glu Cys Leu Tyr Gln Ile Thr Tyr Phe Phe Leu Val Ile Tyr Leu Phe
645 650 655
Ser Arg Leu Ala Val Glu Ala Asp Pro Arg Ala Gln Thr Ala Thr Val
660 665 670
Ile Val Ser Thr Thr Val Ala Leu Ile Lys Cys Gly Tyr Phe Ser Phe
675 680 685
Arg Ala Lys Asp Ile Arg Ala Phe Tyr Phe Val Leu Tyr Thr Phe Val
690 695 700
Tyr Phe Phe Cys Met Ile Pro Ala Arg Ile Thr Ala Met Met Thr Leu
705 710 715 720
Trp Asp Ile Gly Trp Gly Thr Arg Gly Gly Asn Glu Lys Pro Ser Val
725 730 735
Gly Thr Arg Val Ala Leu Trp Ala Lys Gln Tyr Leu Ile Ala Tyr Met
740 745 750
Trp Trp Ala Ala Val Val Gly Ala Gly Val Tyr Ser Ile Val His Asn
755 760 765
Trp Met Phe Asp Trp Asn Ser Leu Ser Tyr Arg Phe Ala Leu Val Gly
770 775 780
Ile Cys Ser Tyr Ile Val Phe Ile Val Ile Val Leu Val Val Tyr Phe
785 790 795 800
Thr Gly Lys Ile Thr Thr Trp Asn Phe Thr Lys Leu Gln Lys Glu Leu
805 810 815
Ile Glu Asp Arg Val Leu Tyr Asp Ala Thr Thr Asn Ala Gln Ser Val
820 825 830
<210> 32
<211> 1001
<212> PRT
<213> other sequences
<220>
<223> reencoded amino acid sequence of a polypeptide having chondroitin
synthase activity (HCOS10-Vir)
<400> 32
Met Gly Lys Asn Ile Ile Ile Met Val Ser Trp Tyr Thr Ile Ile Thr
1 5 10 15
Ser Asn Leu Ile Ala Val Gly Gly Ala Ser Leu Ile Leu Ala Pro Ala
20 25 30
Ile Thr Gly Tyr Val Leu His Trp Asn Ile Ala Leu Ser Thr Ile Trp
35 40 45
Gly Val Ser Ala Tyr Gly Ile Phe Val Phe Gly Phe Phe Leu Ala Gln
50 55 60
Val Leu Phe Ser Glu Leu Asn Arg Lys Arg Leu Arg Lys Trp Ile Ser
65 70 75 80
Leu Arg Pro Lys Arg Asp Arg Asn Phe Leu Phe Val Gly Val Met Thr
85 90 95
Ala Gln Lys Tyr Leu Gln Thr Arg Ala Val Ala Ala Tyr Arg Thr Trp
100 105 110
Ser Lys Thr Ile Pro Gly Lys Val Gln Phe Phe Ser Ser Glu Gly Ser
115 120 125
Asp Thr Ser Val Pro Ile Pro Val Val Pro Leu Arg Gly Val Asp Asp
130 135 140
Ser Tyr Pro Pro Gln Lys Lys Ser Phe Met Met Leu Lys Tyr Met His
145 150 155 160
Asp His Tyr Leu Asp Lys Tyr Glu Trp Phe Met Arg Ala Asp Asp Asp
165 170 175
Val Tyr Ile Lys Gly Asp Arg Leu Glu Asn Phe Leu Arg Ser Leu Asn
180 185 190
Ser Ser Glu Pro Leu Phe Leu Gly Gln Thr Gly Leu Gly Thr Thr Glu
195 200 205
Glu Met Gly Lys Leu Ala Leu Glu Pro Gly Glu Asn Phe Cys Met Gly
210 215 220
Gly Pro Gly Val Ile Met Ser Arg Glu Val Leu Arg Arg Met Val Pro
225 230 235 240
His Ile Gly Lys Cys Leu Arg Glu Met Tyr Thr Thr His Glu Asp Val
245 250 255
Glu Val Gly Arg Cys Val Arg Arg Phe Ala Gly Val Gln Cys Val Trp
260 265 270
Ser Tyr Glu Met Gln Gln Leu Phe Tyr Glu Asn Tyr Glu Gln Asn Lys
275 280 285
Lys Gly Tyr Ile Arg Asp Leu His Asn Ser Lys Ile His Gln Ala Ile
290 295 300
Thr Leu His Pro Asn Lys Asn Pro Pro Tyr Gln Tyr Arg Leu His Ser
305 310 315 320
Tyr Met Leu Ser Arg Lys Ile Ser Glu Leu Arg His Arg Thr Ile Gln
325 330 335
Leu His Arg Glu Ile Val Leu Met Ser Lys Tyr Ser Asn Thr Glu Ile
340 345 350
His Lys Glu Asp Leu Gln Leu Gly Ile Pro Pro Ser Phe Met Arg Phe
355 360 365
Gln Pro Arg Gln Arg Glu Glu Ile Leu Glu Trp Glu Phe Leu Thr Gly
370 375 380
Lys Tyr Leu Tyr Ser Ala Val Asp Gly Gln Pro Pro Arg Arg Gly Met
385 390 395 400
Asp Ser Ala Gln Arg Glu Ala Leu Asp Asp Ile Val Met Gln Val Met
405 410 415
Glu Met Ile Asn Ala Asn Ala Lys Thr Arg Gly Arg Ile Ile Asp Phe
420 425 430
Lys Glu Ile Gln Tyr Gly Tyr Arg Arg Val Asn Pro Met Tyr Gly Ala
435 440 445
Glu Tyr Ile Leu Asp Leu Leu Leu Leu Tyr Lys Lys His Lys Gly Lys
450 455 460
Lys Met Thr Val Pro Val Arg Arg His Ala Tyr Leu Gln Gln Thr Phe
465 470 475 480
Ser Lys Ile Gln Phe Val Glu His Glu Glu Leu Asp Ala Gln Glu Leu
485 490 495
Ala Lys Arg Ile Asn Gln Glu Ser Gly Ser Leu Ser Phe Leu Ser Asn
500 505 510
Ser Leu Lys Lys Leu Val Pro Phe Gln Leu Pro Gly Ser Lys Ser Glu
515 520 525
His Lys Glu Pro Lys Asp Lys Lys Ile Asn Ile Leu Ile Pro Leu Ser
530 535 540
Gly Arg Phe Asp Met Phe Val Arg Phe Met Gly Asn Phe Glu Lys Thr
545 550 555 560
Cys Leu Ile Pro Asn Gln Asn Val Lys Leu Val Val Leu Leu Phe Asn
565 570 575
Ser Asp Ser Asn Pro Asp Lys Ala Lys Gln Val Glu Leu Met Arg Asp
580 585 590
Tyr Arg Ile Lys Tyr Pro Lys Ala Asp Met Gln Ile Leu Pro Val Ser
595 600 605
Gly Glu Phe Ser Arg Ala Leu Ala Leu Glu Val Gly Ser Ser Gln Phe
610 615 620
Asn Asn Glu Ser Leu Leu Phe Phe Cys Asp Val Asp Leu Val Phe Thr
625 630 635 640
Thr Glu Phe Leu Gln Arg Cys Arg Ala Asn Thr Val Leu Gly Gln Gln
645 650 655
Ile Tyr Phe Pro Ile Ile Phe Ser Gln Tyr Asp Pro Lys Ile Val Tyr
660 665 670
Ser Gly Lys Val Pro Ser Asp Asn His Phe Ala Phe Thr Gln Lys Thr
675 680 685
Gly Phe Trp Arg Asn Tyr Gly Phe Gly Ile Thr Cys Ile Tyr Lys Gly
690 695 700
Asp Leu Val Arg Val Gly Gly Phe Asp Val Ser Ile Gln Gly Trp Gly
705 710 715 720
Leu Glu Asp Val Asp Leu Phe Asn Lys Val Val Gln Ala Gly Leu Lys
725 730 735
Thr Phe Arg Ser Gln Glu Val Gly Val Val His Val His His Pro Val
740 745 750
Phe Cys Asp Pro Asn Leu Asp Pro Lys Gln Tyr Lys Met Cys Leu Gly
755 760 765
Ser Lys Ala Ser Thr Tyr Gly Ser Thr Gln Gln Leu Ala Glu Met Trp
770 775 780
Leu Glu Lys Asn Asp Pro Ser Tyr Ser Leu Phe Ala Ala Trp Lys His
785 790 795 800
Gly Leu Ser Gly Ile Trp Leu Ala Phe Glu Cys Leu Tyr Gln Ile Thr
805 810 815
Tyr Phe Phe Leu Val Ile Tyr Leu Phe Ser Arg Leu Ala Val Glu Ala
820 825 830
Asp Pro Arg Ala Gln Thr Ala Thr Val Ile Val Ser Thr Thr Val Ala
835 840 845
Leu Ile Lys Cys Gly Tyr Phe Ser Phe Arg Ala Lys Asp Ile Arg Ala
850 855 860
Phe Tyr Phe Val Leu Tyr Thr Phe Val Tyr Phe Phe Cys Met Ile Pro
865 870 875 880
Ala Arg Ile Thr Ala Met Met Thr Leu Trp Asp Ile Gly Trp Gly Thr
885 890 895
Arg Gly Gly Asn Glu Lys Pro Ser Val Gly Thr Arg Val Ala Leu Trp
900 905 910
Ala Lys Gln Tyr Leu Ile Ala Tyr Met Trp Trp Ala Ala Val Val Gly
915 920 925
Ala Gly Val Tyr Ser Ile Val His Asn Trp Met Phe Asp Trp Asn Ser
930 935 940
Leu Ser Tyr Arg Phe Ala Leu Val Gly Ile Cys Ser Tyr Ile Val Phe
945 950 955 960
Ile Val Ile Val Leu Val Val Tyr Phe Thr Gly Lys Ile Thr Thr Trp
965 970 975
Asn Phe Thr Lys Leu Gln Lys Glu Leu Ile Glu Asp Arg Val Leu Tyr
980 985 990
Asp Ala Thr Thr Asn Ala Gln Ser Val
995 1000
<210> 33
<211> 531
<212> PRT
<213> other sequences
<220>
<223> reencoded amino acid sequence of a polypeptide having chondroitin
synthase activity (HCOS11-Vir)
<400> 33
Met Gly Lys Asn Ile Ile Ile Met Val Ser Trp Tyr Thr Ile Ile Thr
1 5 10 15
Ser Asn Leu Ile Ala Val Gly Gly Ala Ser Leu Ile Leu Ala Pro Ala
20 25 30
Ile Thr Gly Tyr Val Leu His Trp Asn Ile Ala Leu Ser Thr Ile Trp
35 40 45
Gly Val Ser Ala Tyr Gly Ile Phe Val Phe Gly Phe Phe Leu Ala Gln
50 55 60
Val Leu Phe Ser Glu Leu Asn Arg Lys Arg Leu Arg Lys Trp Ile Ser
65 70 75 80
Leu Arg Pro Lys Arg Asp Arg Asn Phe Leu Phe Val Gly Val Met Thr
85 90 95
Ala Gln Lys Tyr Leu Gln Thr Arg Ala Val Ala Ala Tyr Arg Thr Trp
100 105 110
Ser Lys Thr Ile Pro Gly Lys Val Gln Phe Phe Ser Ser Glu Gly Ser
115 120 125
Asp Thr Ser Val Pro Ile Pro Val Val Pro Leu Arg Gly Val Asp Asp
130 135 140
Ser Tyr Pro Pro Gln Lys Lys Ser Phe Met Met Leu Lys Tyr Met His
145 150 155 160
Asp His Tyr Leu Asp Lys Tyr Glu Trp Phe Met Arg Ala Asp Asp Asp
165 170 175
Val Tyr Ile Lys Gly Asp Arg Leu Glu Asn Phe Leu Arg Ser Leu Asn
180 185 190
Ser Ser Glu Pro Leu Phe Leu Gly Gln Thr Gly Leu Gly Thr Thr Glu
195 200 205
Glu Met Gly Lys Leu Ala Leu Glu Pro Gly Glu Asn Phe Cys Met Gly
210 215 220
Gly Pro Gly Val Ile Met Ser Arg Glu Val Leu Arg Arg Met Val Pro
225 230 235 240
His Ile Gly Lys Cys Leu Arg Glu Met Tyr Thr Thr His Glu Asp Val
245 250 255
Glu Val Gly Arg Cys Val Arg Arg Phe Ala Gly Val Gln Cys Val Trp
260 265 270
Ser Tyr Glu Met Gln Gln Leu Phe Tyr Glu Asn Tyr Glu Gln Asn Lys
275 280 285
Lys Gly Tyr Ile Arg Asp Leu His Asn Ser Lys Ile His Gln Ala Ile
290 295 300
Thr Leu His Pro Asn Lys Asn Pro Pro Tyr Gln Tyr Arg Leu His Ser
305 310 315 320
Tyr Met Leu Leu Phe Ala Ala Trp Lys His Gly Leu Ser Gly Ile Trp
325 330 335
Leu Ala Phe Glu Cys Leu Tyr Gln Ile Thr Tyr Phe Phe Leu Val Ile
340 345 350
Tyr Leu Phe Ser Arg Leu Ala Val Glu Ala Asp Pro Arg Ala Gln Thr
355 360 365
Ala Thr Val Ile Val Ser Thr Thr Val Ala Leu Ile Lys Cys Gly Tyr
370 375 380
Phe Ser Phe Arg Ala Lys Asp Ile Arg Ala Phe Tyr Phe Val Leu Tyr
385 390 395 400
Thr Phe Val Tyr Phe Phe Cys Met Ile Pro Ala Arg Ile Thr Ala Met
405 410 415
Met Thr Leu Trp Asp Ile Gly Trp Gly Thr Arg Gly Gly Asn Glu Lys
420 425 430
Pro Ser Val Gly Thr Arg Val Ala Leu Trp Ala Lys Gln Tyr Leu Ile
435 440 445
Ala Tyr Met Trp Trp Ala Ala Val Val Gly Ala Gly Val Tyr Ser Ile
450 455 460
Val His Asn Trp Met Phe Asp Trp Asn Ser Leu Ser Tyr Arg Phe Ala
465 470 475 480
Leu Val Gly Ile Cys Ser Tyr Ile Val Phe Ile Val Ile Val Leu Val
485 490 495
Val Tyr Phe Thr Gly Lys Ile Thr Thr Trp Asn Phe Thr Lys Leu Gln
500 505 510
Lys Glu Leu Ile Glu Asp Arg Val Leu Tyr Asp Ala Thr Thr Asn Ala
515 520 525
Gln Ser Val
530
<210> 34
<211> 553
<212> PRT
<213> other sequences
<220>
<223> reencoded amino acid sequence of a polypeptide having chondroitin
synthase activity (HCOS12-Vir)
<400> 34
Met Gly Lys Asn Ile Ile Ile Met Val Ser Trp Tyr Thr Ile Ile Thr
1 5 10 15
Ser Asn Leu Ile Ala Val Gly Gly Ala Ser Leu Ile Leu Ala Pro Ala
20 25 30
Ile Thr Gly Tyr Val Leu His Trp Asn Ile Ala Leu Ser Thr Ile Trp
35 40 45
Gly Val Ser Ala Tyr Gly Ile Phe Val Phe Gly Phe Phe Leu Ala Gln
50 55 60
Val Leu Phe Ser Glu Leu Asn Arg Lys Arg Leu Arg Lys Trp Ile Ser
65 70 75 80
Leu Arg Pro Lys Lys Asp Lys Lys Ile Asn Ile Leu Ile Pro Leu Ser
85 90 95
Gly Arg Phe Asp Met Phe Val Arg Phe Met Gly Asn Phe Glu Lys Thr
100 105 110
Cys Leu Ile Pro Asn Gln Asn Val Lys Leu Val Val Leu Leu Phe Asn
115 120 125
Ser Asp Ser Asn Pro Asp Lys Ala Lys Gln Val Glu Leu Met Arg Asp
130 135 140
Tyr Arg Ile Lys Tyr Pro Lys Ala Asp Met Gln Ile Leu Pro Val Ser
145 150 155 160
Gly Glu Phe Ser Arg Ala Leu Ala Leu Glu Val Gly Ser Ser Gln Phe
165 170 175
Asn Asn Glu Ser Leu Leu Phe Phe Cys Asp Val Asp Leu Val Phe Thr
180 185 190
Thr Glu Phe Leu Gln Arg Cys Arg Ala Asn Thr Val Leu Gly Gln Gln
195 200 205
Ile Tyr Phe Pro Ile Ile Phe Ser Gln Tyr Asp Pro Lys Ile Val Tyr
210 215 220
Ser Gly Lys Val Pro Ser Asp Asn His Phe Ala Phe Thr Gln Lys Thr
225 230 235 240
Gly Phe Trp Arg Asn Tyr Gly Phe Gly Ile Thr Cys Ile Tyr Lys Gly
245 250 255
Asp Leu Val Arg Val Gly Gly Phe Asp Val Ser Ile Gln Gly Trp Gly
260 265 270
Leu Glu Asp Val Asp Leu Phe Asn Lys Val Val Gln Ala Gly Leu Lys
275 280 285
Thr Phe Arg Ser Gln Glu Val Gly Val Val His Val His His Pro Val
290 295 300
Phe Cys Asp Pro Asn Leu Asp Pro Lys Gln Tyr Lys Met Cys Leu Gly
305 310 315 320
Ser Lys Ala Ser Thr Tyr Gly Ser Thr Gln Gln Leu Ala Glu Met Trp
325 330 335
Leu Glu Lys Asn Asp Pro Ser Tyr Ser Leu Phe Ala Ala Trp Lys His
340 345 350
Gly Leu Ser Gly Ile Trp Leu Ala Phe Glu Cys Leu Tyr Gln Ile Thr
355 360 365
Tyr Phe Phe Leu Val Ile Tyr Leu Phe Ser Arg Leu Ala Val Glu Ala
370 375 380
Asp Pro Arg Ala Gln Thr Ala Thr Val Ile Val Ser Thr Thr Val Ala
385 390 395 400
Leu Ile Lys Cys Gly Tyr Phe Ser Phe Arg Ala Lys Asp Ile Arg Ala
405 410 415
Phe Tyr Phe Val Leu Tyr Thr Phe Val Tyr Phe Phe Cys Met Ile Pro
420 425 430
Ala Arg Ile Thr Ala Met Met Thr Leu Trp Asp Ile Gly Trp Gly Thr
435 440 445
Arg Gly Gly Asn Glu Lys Pro Ser Val Gly Thr Arg Val Ala Leu Trp
450 455 460
Ala Lys Gln Tyr Leu Ile Ala Tyr Met Trp Trp Ala Ala Val Val Gly
465 470 475 480
Ala Gly Val Tyr Ser Ile Val His Asn Trp Met Phe Asp Trp Asn Ser
485 490 495
Leu Ser Tyr Arg Phe Ala Leu Val Gly Ile Cys Ser Tyr Ile Val Phe
500 505 510
Ile Val Ile Val Leu Val Val Tyr Phe Thr Gly Lys Ile Thr Thr Trp
515 520 525
Asn Phe Thr Lys Leu Gln Lys Glu Leu Ile Glu Asp Arg Val Leu Tyr
530 535 540
Asp Ala Thr Thr Asn Ala Gln Ser Val
545 550
<210> 35
<211> 1446
<212> DNA
<213> Arabidopsis thaliana
<220>
<223> nucleic acid sequence of UDP-Glucose dehydrogenase (HASB)
<400> 35
atggtcaaaa tatgctgtat cggggctgga tatgtcggtg ggcctacaat ggccgttatg 60
gccctaaagt gtccagagat tgaagtcgtg gtagttgata tatcggagcc acgaattaac 120
gcatggaact cagaccgtct accaatttat gagccagggt tagaggatgt cgtcaaacag 180
tgtagaggga agaatttgtt cttctctaca gatgtagaga agcatgtatt tgagtcagat 240
atagtgtttg tttcggtaaa cactcctacg aaaacgcagg gtctgggtgc aggtaaagca 300
gcagatttga catattggga gtccgctgct cgcatgatag ctgatgtgag caaatcgtcg 360
aaaatcgtcg ttgaaaagag tacagtacca gttcgtacag ccgaggctat agaaaagatt 420
ttaacgcaca attcgaaggg tatcgaattc cagatcttat caaatccaga attcttggcc 480
gaagggacgg cgattaaaga cttatataac cctgatagag ttctaatcgg tggcagggac 540
accgctgcgg gacaaaaggc cattaaggcg ttgcgtgacg tgtatgccca ctgggttcct 600
gttgagcaaa taatctgtac taatttatgg agtgccgagc tatcaaagtt ggctgcgaac 660
gcatttctag ctcaaaggat aagttcagta aacgcaatgt cagcgctttg tgaggcaact 720
ggtgctgacg taacccaagt cgctcacgcc gttggaaccg acactagaat tggaccgaag 780
tttcttaacg catccgtagg cttcggcgga tcttgctttc agaaagacat cctgaatctt 840
atttacatct gcgaatgcaa tggtcttcca gaagcagcca attattggaa acaggtagtc 900
aaggtaaatg actaccaaaa gattaggttt gctaatcgag tcgtatcttc tatgttcaac 960
accgtctccg gtaagaaaat tgctattttg ggatttgcgt tcaagaagga caccggcgac 1020
acgcgtgaaa ctcctgccat agatgtgtgt aatcgcctcg tggctgataa agcaaagctg 1080
tcgatctatg atccgcaagt attagaagag cagatccgcc gtgatctgtc catggcccga 1140
ttcgattggg accatccagt cccactccag cagatcaaag ctgaaggtat ctccgaacag 1200
gttaacgttg tgtccgacgc ctacgaggct acgaaggatg ctcatggttt atgtgtttta 1260
accgaatggg acgaattcaa gtcacttgat tttaagaaga tctttgataa tatgcagaaa 1320
cccgctttcg ttttcgacgg aagaaacgtg gtcgacgctg tgaaattgag agaaattgga 1380
ttcatagtat attccatagg taaacctctg gatagttggc tcaaggatat gccggctgtt 1440
gcataa 1446
<210> 36
<211> 1166
<212> DNA
<213> Chlorella virus
<220>
<223> reencoded nucleic acid sequence of UDP-Glucose dehydrogenase
(HASB)
<400> 36
atgagtagaa ttgctgtcgt tggatgcggt tacgtgggta cggcctgcgc cgtacttttg 60
gcgcagaaga acgaagttat cgttttggat atctcggagg accgggtaca actgattaag 120
aataagaagt cacctataga agataaggaa atcgaagaat tcctggagac gaaagatttg 180
aatctaacag cgacgacgga taaggtgctc gcctatgaga atgctgaatt cgttataata 240
gctacaccga ccgattacga tgtcgtcact agatatttca acactaagtc tgttgaaaat 300
gtgataggcg atgtcattaa gaacactcag acacacccta ctatagtgat caagagtact 360
attccaatcg gtttcgtgga taaagttaga gaacagttcg attatcaaaa tattatcttc 420
tcgccggaat tcttgagaga aggacgagca ttatatgata atctttaccc ctcccgtatc 480
atcgtcggtg atgactcccc aattgcctta aaattcgcga atctcttggt cgagggtagc 540
aaaactccac tagctcccgt attaactatg ggtacgcgag aggccgaagc tgtaaaacta 600
ttttcaaata catatttggc tatgagagta gcatacttca atgagctaga cacatttgca 660
atgtcccatg gtatgaacgc aaaagagatt atcgacggag tcacactaga accaaggata 720
gggcagggtt attcgaatcc ttcatttggg tatggagcct attgtttccc aaaagataca 780
aagcaattgt tggctaattt tgaaggggtt ccacaagata ttattggcgc aatcgtagag 840
tctaacgaaa ctagaaagga ggttattgtt tctgaggtcg agaacagatt tccgaccaca 900
gttggcgtat ataagttggc tgctaaagct ggttcggata atttcaggtc tagtgcgata 960
gtcgatatca tggaaaggtt ggctaataag ggctaccaca tcaaaatatt tgaacctacc 1020
gttgaacaat ttgagaattt tgaggtagat aataatctca caacttttgc aaccgagtct 1080
gatgtaataa ttgcgaacag agttccagtc gaacatcgca ttctgtttgg gaagaagtta 1140
ataacacggg atgtctatgg ggataa 1166
<210> 37
<211> 1170
<212> DNA
<213> Chlorella virus
<220>
<223> reencoded nucleic acid sequence of UDP-Glucose dehydrogenase
(HASB-A)
<400> 37
atgtcacgaa tcgcagtagt tggctgtggg tacgtgggaa ccgcatgcgc tgtactgctg 60
gcgcaaaaga atgaggtaat cgttcttgat attagtgagg atagggtcca actaatcaag 120
aacaagaaat ccccgatcga agataaggag attgaagaat tcttggaaac aaaagaccta 180
aacttaactg caacaactga caaagtttta gcctacgaaa acgctgagtt tgtgattata 240
gcgacaccca cagattatga cgtagttacc agatacttta acacgaagtc cgtagagaac 300
gtcattggag atgttataaa gaatactcag actcatccta cgatagtaat aaagtcaacc 360
attcccatag gtttcgtaga taaggttagg gagcaattcg attaccagaa cattatattt 420
tcgccagaat ttctgagaga gggtcgcgcc ctgtatgata atctatatcc atcacggatt 480
atagtgggcg atgactctcc gattgcactt aagtttgcta atcttttagt tgagggctcc 540
aaaactccgc tcgccccagt acttacgatg ggtacacgtg aggctgaagc tgtcaagctg 600
ttttcaaaca cataccttgc tatgcgagtc gcatacttta acgaactaga tacctttgct 660
atgtcgcacg gtatgaatgc taaagaaatc atagatggcg taacgttgga gcctcggata 720
ggtcaaggat attccaatcc atcttttggc tacggtgcgt attgtttccc aaaggacacg 780
aagcaattat tagctaactt tgagggtgtt ccgcaagata taattggggc gatagtagaa 840
agcaatgaaa cacggaagga ggtaatcgtg agtgaagtgg aaaaccgatt ccccactacg 900
gtcggcgttt acaaattagc cgccaaggct ggttccgaca atttccgatc cagcgcaata 960
gtagatatta tggaaagatt agctaataag ggataccaca ttaaaatctt tgaacctact 1020
gtcgaacagt tcgagaactt cgaggttgat aataacttga cgactttcgc aacggagagc 1080
gatgtaatta ttgcaaaccg cgtacctgtg gaacatcgaa ttttgttcgg aaagaagctg 1140
attacacgcg atgtatatgg cgataactaa 1170
<210> 38
<211> 1199
<212> DNA
<213> Streptococcus
<220>
<223> a nucleic acid sequence of UDP-Glucose dehydrogenase (HASB)
<400> 38
atgaagatat cggtagcggg ttcggggtac gtggggttat ccttgtcaat cttgcttgcc 60
caacataacg atgtgactgt tgtagatata atcgacgaaa aggtacggct aattaaccag 120
ggcatatctc cgattaagga tgcggacatt gaggaatatc tgaagaatgc accgttgaat 180
cttacggcta cactagacgg agcttcggct tatagtaatg ctgatctgat tataatcgca 240
acgccaacta attacgattc agaacgcaat tatttcgaca ccagacacgt tgaagaagta 300
attgagcaag tattggattt aaatgcctcc gctactataa tcatcaagag taccataccc 360
ttgggtttta ttaaacacgt aagagagaaa taccaaacag acagaatcat cttttctcca 420
gagttcttaa gagagtcaaa ggcattgtac gataacttat acccctctcg tataatagtc 480
agttatgaga aggatgactc tccaagagtt atacaagcag ctaaggcgtt cgcgggttta 540
ttaaaagagg gggcaaagag caaggatacc ccagttctgt ttatgggctc tcaagaagct 600
gaagctgtca agctgtttgc taatactttt ctcgccatga gggtcagtta cttcaacgag 660
cttgacactt atagcgaatc aaaaggacta gacgcccaaa gagttataga aggcgtctgc 720
catgatcaaa ggataggtaa tcattacaat aatccatcct tcggatatgg cggttattgt 780
ttacccaaag actcaaagca acttttggct aattatagag gcatacctca gtctctaatg 840
tctgccatcg ttgaatcgaa caagatccgt aagtcgtatt tagctgaaca aatattagat 900
agggcttctt cacaaaagca ggctggtgta cctttaacca taggatttta ccgtttgatt 960
atgaagtcca actccgataa ctttagagaa tcagccatta aagatattat tgacatcatt 1020
aatgactacg gtgtcaatat tgtcatttat gaacctatgt tgggagaaga cattggttat 1080
agagtcgtta aagatttgga acagtttaag aacgaaagta caattattgt tagtaacagg 1140
tttgaagatg atttaggtga tgttattgat aaagtttata cacgtgacgt ctttggtag 1199
<210> 39
<211> 481
<212> PRT
<213> Arabidopsis thaliana
<220>
<223> amino acid sequence of UDP-Glucose dehydrogenase (HASB)
<400> 39
Met Val Lys Ile Cys Cys Ile Gly Ala Gly Tyr Val Gly Gly Pro Thr
1 5 10 15
Met Ala Val Met Ala Leu Lys Cys Pro Glu Ile Glu Val Val Val Val
20 25 30
Asp Ile Ser Glu Pro Arg Ile Asn Ala Trp Asn Ser Asp Arg Leu Pro
35 40 45
Ile Tyr Glu Pro Gly Leu Glu Asp Val Val Lys Gln Cys Arg Gly Lys
50 55 60
Asn Leu Phe Phe Ser Thr Asp Val Glu Lys His Val Phe Glu Ser Asp
65 70 75 80
Ile Val Phe Val Ser Val Asn Thr Pro Thr Lys Thr Gln Gly Leu Gly
85 90 95
Ala Gly Lys Ala Ala Asp Leu Thr Tyr Trp Glu Ser Ala Ala Arg Met
100 105 110
Ile Ala Asp Val Ser Lys Ser Ser Lys Ile Val Val Glu Lys Ser Thr
115 120 125
Val Pro Val Arg Thr Ala Glu Ala Ile Glu Lys Ile Leu Thr His Asn
130 135 140
Ser Lys Gly Ile Glu Phe Gln Ile Leu Ser Asn Pro Glu Phe Leu Ala
145 150 155 160
Glu Gly Thr Ala Ile Lys Asp Leu Tyr Asn Pro Asp Arg Val Leu Ile
165 170 175
Gly Gly Arg Asp Thr Ala Ala Gly Gln Lys Ala Ile Lys Ala Leu Arg
180 185 190
Asp Val Tyr Ala His Trp Val Pro Val Glu Gln Ile Ile Cys Thr Asn
195 200 205
Leu Trp Ser Ala Glu Leu Ser Lys Leu Ala Ala Asn Ala Phe Leu Ala
210 215 220
Gln Arg Ile Ser Ser Val Asn Ala Met Ser Ala Leu Cys Glu Ala Thr
225 230 235 240
Gly Ala Asp Val Thr Gln Val Ala His Ala Val Gly Thr Asp Thr Arg
245 250 255
Ile Gly Pro Lys Phe Leu Asn Ala Ser Val Gly Phe Gly Gly Ser Cys
260 265 270
Phe Gln Lys Asp Ile Leu Asn Leu Ile Tyr Ile Cys Glu Cys Asn Gly
275 280 285
Leu Pro Glu Ala Ala Asn Tyr Trp Lys Gln Val Val Lys Val Asn Asp
290 295 300
Tyr Gln Lys Ile Arg Phe Ala Asn Arg Val Val Ser Ser Met Phe Asn
305 310 315 320
Thr Val Ser Gly Lys Lys Ile Ala Ile Leu Gly Phe Ala Phe Lys Lys
325 330 335
Asp Thr Gly Asp Thr Arg Glu Thr Pro Ala Ile Asp Val Cys Asn Arg
340 345 350
Leu Val Ala Asp Lys Ala Lys Leu Ser Ile Tyr Asp Pro Gln Val Leu
355 360 365
Glu Glu Gln Ile Arg Arg Asp Leu Ser Met Ala Arg Phe Asp Trp Asp
370 375 380
His Pro Val Pro Leu Gln Gln Ile Lys Ala Glu Gly Ile Ser Glu Gln
385 390 395 400
Val Asn Val Val Ser Asp Ala Tyr Glu Ala Thr Lys Asp Ala His Gly
405 410 415
Leu Cys Val Leu Thr Glu Trp Asp Glu Phe Lys Ser Leu Asp Phe Lys
420 425 430
Lys Ile Phe Asp Asn Met Gln Lys Pro Ala Phe Val Phe Asp Gly Arg
435 440 445
Asn Val Val Asp Ala Val Lys Leu Arg Glu Ile Gly Phe Ile Val Tyr
450 455 460
Ser Ile Gly Lys Pro Leu Asp Ser Trp Leu Lys Asp Met Pro Ala Val
465 470 475 480
Ala
<210> 40
<211> 389
<212> PRT
<213> Chlorella virus
<220>
<223> amino acid sequence of UDP-Glucose dehydrogenase (HASB)
<400> 40
Met Ser Arg Ile Ala Val Val Gly Cys Gly Tyr Val Gly Thr Ala Cys
1 5 10 15
Ala Val Leu Leu Ala Gln Lys Asn Glu Val Ile Val Leu Asp Ile Ser
20 25 30
Glu Asp Arg Val Gln Leu Ile Lys Asn Lys Lys Ser Pro Ile Glu Asp
35 40 45
Lys Glu Ile Glu Glu Phe Leu Glu Thr Lys Asp Leu Asn Leu Thr Ala
50 55 60
Thr Thr Asp Lys Val Leu Ala Tyr Glu Asn Ala Glu Phe Val Ile Ile
65 70 75 80
Ala Thr Pro Thr Asp Tyr Asp Val Val Thr Arg Tyr Phe Asn Thr Lys
85 90 95
Ser Val Glu Asn Val Ile Gly Asp Val Ile Lys Asn Thr Gln Thr His
100 105 110
Pro Thr Ile Val Ile Lys Ser Thr Ile Pro Ile Gly Phe Val Asp Lys
115 120 125
Val Arg Glu Gln Phe Asp Tyr Gln Asn Ile Ile Phe Ser Pro Glu Phe
130 135 140
Leu Arg Glu Gly Arg Ala Leu Tyr Asp Asn Leu Tyr Pro Ser Arg Ile
145 150 155 160
Ile Val Gly Asp Asp Ser Pro Ile Ala Leu Lys Phe Ala Asn Leu Leu
165 170 175
Val Glu Gly Ser Lys Thr Pro Leu Ala Pro Val Leu Thr Met Gly Thr
180 185 190
Arg Glu Ala Glu Ala Val Lys Leu Phe Ser Asn Thr Tyr Leu Ala Met
195 200 205
Arg Val Ala Tyr Phe Asn Glu Leu Asp Thr Phe Ala Met Ser His Gly
210 215 220
Met Asn Ala Lys Glu Ile Ile Asp Gly Val Thr Leu Glu Pro Arg Ile
225 230 235 240
Gly Gln Gly Tyr Ser Asn Pro Ser Phe Gly Tyr Gly Ala Tyr Cys Phe
245 250 255
Pro Lys Asp Thr Lys Gln Leu Leu Ala Asn Phe Glu Gly Val Pro Gln
260 265 270
Asp Ile Ile Gly Ala Ile Val Glu Ser Asn Glu Thr Arg Lys Glu Val
275 280 285
Ile Val Ser Glu Val Glu Asn Arg Phe Pro Thr Thr Val Gly Val Tyr
290 295 300
Lys Leu Ala Ala Lys Ala Gly Ser Asp Asn Phe Arg Ser Ser Ala Ile
305 310 315 320
Val Asp Ile Met Glu Arg Leu Ala Asn Lys Gly Tyr His Ile Lys Ile
325 330 335
Phe Glu Pro Thr Val Glu Gln Phe Glu Asn Phe Glu Val Asp Asn Asn
340 345 350
Leu Thr Thr Phe Ala Thr Glu Ser Asp Val Ile Ile Ala Asn Arg Val
355 360 365
Pro Val Glu His Arg Ile Leu Phe Gly Lys Lys Leu Ile Thr Arg Asp
370 375 380
Val Tyr Gly Asp Asn
385
<210> 41
<211> 401
<212> PRT
<213> Streptococcus
<220>
<223> amino acid sequence of UDP-Glucose dehydrogenase (HASB)
<400> 41
Met Lys Ile Ser Val Ala Gly Ser Gly Tyr Val Gly Leu Ser Leu Ser
1 5 10 15
Ile Leu Leu Ala Gln His Asn Asp Val Thr Val Val Asp Ile Ile Asp
20 25 30
Glu Lys Val Arg Leu Ile Asn Gln Gly Ile Ser Pro Ile Lys Asp Ala
35 40 45
Asp Ile Glu Glu Tyr Leu Lys Asn Ala Pro Leu Asn Leu Thr Ala Thr
50 55 60
Leu Asp Gly Ala Ser Ala Tyr Ser Asn Ala Asp Leu Ile Ile Ile Ala
65 70 75 80
Thr Pro Thr Asn Tyr Asp Ser Glu Arg Asn Tyr Phe Asp Thr Arg His
85 90 95
Val Glu Glu Val Ile Glu Gln Val Leu Asp Leu Asn Ala Ser Ala Thr
100 105 110
Ile Ile Ile Lys Ser Thr Ile Pro Leu Gly Phe Ile Lys His Val Arg
115 120 125
Glu Lys Tyr Gln Thr Asp Arg Ile Ile Phe Ser Pro Glu Phe Leu Arg
130 135 140
Glu Ser Lys Ala Leu Tyr Asp Asn Leu Tyr Pro Ser Arg Ile Ile Val
145 150 155 160
Ser Tyr Glu Lys Asp Asp Ser Pro Arg Val Ile Gln Ala Ala Lys Ala
165 170 175
Phe Ala Gly Leu Leu Lys Glu Gly Ala Lys Ser Lys Asp Thr Pro Val
180 185 190
Leu Phe Met Gly Ser Gln Glu Ala Glu Ala Val Lys Leu Phe Ala Asn
195 200 205
Thr Phe Leu Ala Met Arg Val Ser Tyr Phe Asn Glu Leu Asp Thr Tyr
210 215 220
Ser Glu Ser Lys Gly Leu Asp Ala Gln Arg Val Ile Glu Gly Val Cys
225 230 235 240
His Asp Gln Arg Ile Gly Asn His Tyr Asn Asn Pro Ser Phe Gly Tyr
245 250 255
Gly Gly Tyr Cys Leu Pro Lys Asp Ser Lys Gln Leu Leu Ala Asn Tyr
260 265 270
Arg Gly Ile Pro Gln Ser Leu Met Ser Ala Ile Val Glu Ser Asn Lys
275 280 285
Ile Arg Lys Ser Tyr Leu Ala Glu Gln Ile Leu Asp Arg Ala Ser Ser
290 295 300
Gln Lys Gln Ala Gly Val Pro Leu Thr Ile Gly Phe Tyr Arg Leu Ile
305 310 315 320
Met Lys Ser Asn Ser Asp Asn Phe Arg Glu Ser Ala Ile Lys Asp Ile
325 330 335
Ile Asp Ile Ile Asn Asp Tyr Gly Val Asn Ile Val Ile Tyr Glu Pro
340 345 350
Met Leu Gly Glu Asp Ile Gly Tyr Arg Val Val Lys Asp Leu Glu Gln
355 360 365
Phe Lys Asn Glu Ser Thr Ile Ile Val Ser Asn Arg Phe Glu Asp Asp
370 375 380
Leu Gly Asp Val Ile Asp Lys Val Tyr Thr Arg Asp Val Phe Gly Arg
385 390 395 400
Asp
<210> 42
<211> 1026
<212> DNA
<213> Pseudomonas aeruginosa
<220>
<223> nucleic acid sequence of UDP-glucose-4-epimerase (GNE1)
<400> 42
atgatgtccc gttacgagga acttcgtaaa gagctgcctg cacagccgaa ggtatggttg 60
atcactggtg tcgcgggctt catcgggtca aatctgctag agaccttgct taaattggat 120
cagaaggttg ttggcttgga caactttgca actggccacc agaggaatct ggacgaggtg 180
aggtcattgg tttctgagaa acagtggagc aactttaagt ttattcaagg ggacattaga 240
aatctggacg actgcaacaa cgcatgtgca ggcgtcgatt atgtcttaca ccaggcagca 300
ttgggcagtg tgccgaggtc tataaacgac cctataacat cgaatgcaac taacatagac 360
ggtttcttga acatgctgat tgcagcgagg gatgcaaaag ttcagtcttt tacctatgcc 420
gcttcatcct ctacatacgg ggatcacccc ggtttgccaa aggtggaaga cactatcggc 480
aagcctctat ctccatacgc tgtgacgaag tatgttaatg agttgtacgc agacgtgttt 540
tcacgttgtt atggattttc aaccatcggt ctgagatact ttaacgtctt cggccgtaga 600
caagatccga atggggcata cgccgccgta atccctaagt ggacatcctc aatgatacag 660
ggtgacgacg tctacattaa cggagatgga gagacatcac gtgacttctg ctacatagaa 720
aacacagttc aagcaaactt attagccgca acggccggcc tagacgccag aaaccaggtg 780
tataatatcg cggtgggtgg tagaacgtca ctaaatcagc ttttcttcgc cttgagagac 840
ggtctagctg agaacggcgt tagctaccat agggaaccag tttataggga ttttagagaa 900
ggagatgtga gacacagctt ggcagatatt tccaaggcgg ctaaacttct tgggtatgct 960
cctaaatatg acgtatcagc aggggtggcg cttgcaatgc catggtatat aatgtttctt 1020
aagtaa 1026
<210> 43
<211> 1020
<212> DNA
<213> Pasteurella multocida
<220>
<223> nucleic acid sequence of UDP-glucose-4-epimerase (KFOA)
<400> 43
atgaacattc tagtgaccgg cggtgctggc tatatcggct cccataccag tttatgctta 60
ctgaataaag gatataacgt ggtcatcatt gacaacctga tcaatagttc atgcgagtcg 120
atccgtagga tagaactgat agctaagaag aaggtcacct tctacgagct gaacattaat 180
aatgaaaagg aagtgaacca gatccttaag aaacacaaat tcgattgcat aatgcacttc 240
gcaggtgcca agtcggtggc cgagtcacta attaagccaa ttttctacta tgacaacaac 300
gtctctggaa ctttgcagct gattaattgt gctataaaga acgacgtcgc aaatttcatc 360
ttttcttcat cagcaactgt ttatggtgag tcaaagatta tgccagtgac agaggactgc 420
cacatcggcg gcacactaaa tccatacgga acatcaaaat acatttcaga gttgatgata 480
agggacatcg ccaagaagta ctcagacact aatttcttat gcttgcgtta tttcaatcct 540
accggggccc acgagtccgg catgatcggc gagtctccag ctgatatacc atccaatctg 600
gtgccttaca ttttacaggt ggccatgggc aagttggaga agttaatggt attcggcggt 660
gactacccaa caaaggacgg cacgggtgtg agagactata ttcacgtgat ggacctagcg 720
gaaggtcatg tggcagccct aagctacctt ttcagagata ataacactaa ttaccatgta 780
ttcaatctgg gcacgggtaa gggctacagt gtccttgaat tagtaagcac attcgagaaa 840
atctcgggtg tcaggattcc atacgagatc gtttctcgtc gtgatgggga catcgcagag 900
agttggtcat caccggagaa agcgaacaag tacttaaatt ggaaggccaa gagggagctt 960
gagacaatgc tagaagacgc atggcgttgg cagatgaaga acccgaatgg ttacatataa 1020
<210> 44
<211> 1021
<212> DNA
<213> Escherichia coli
<220>
<223> nucleic acid sequence of UDP-glucose-4-epimerase (KFOA)
<400> 44
aatgaacatt ctagtgaccg gcggtgctgg ctatatcggc tcccatacca gtttatgctt 60
actgaataaa ggatataacg tggtcatcat tgacaacctg atcaatagtt catgcgagtc 120
gatccgtagg atagaactga tagctaagaa gaaggtcacc ttctacgagc tgaacattaa 180
taatgaaaag gaagtgaacc agatccttaa gaaacacaaa ttcgattgca taatgcactt 240
cgcaggtgcc aagtcggtgg ccgagtcact aattaagcca attttctact atgacaacaa 300
cgtctctgga actttgcagc tgattaattg tgctataaag aacgacgtcg caaatttcat 360
cttttcttca tcagcaactg tttatggtga gtcaaagatt atgccagtga cagaggactg 420
ccacatcggc ggcacactaa atccatacgg aacatcaaaa tacatttcag agttgatgat 480
aagggacatc gccaagaagt actcagacac taatttctta tgcttgcgtt atttcaatcc 540
taccggggcc cacgagtccg gcatgatcgg cgagtctcca gctgatatac catccaatct 600
ggtgccttac attttacagg tggccatggg caagttggag aagttaatgg tattcggcgg 660
tgactaccca acaaaggacg gcacgggtgt gagagactat attcacgtga tggacctagc 720
ggaaggtcat gtggcagccc taagctacct tttcagagat aataacacta attaccatgt 780
attcaatctg ggcacgggta agggctacag tgtccttgaa ttagtaagca cattcgagaa 840
aatctcgggt gtcaggattc catacgagat cgtttctcgt cgtgatgggg acatcgcaga 900
gagttggtca tcaccggaga aagcgaacaa gtacttaaat tggaaggcca agagggagct 960
tgagacaatg ctagaagacg catggcgttg gcagatgaag aacccgaatg gttacatata 1020
a 1021
<210> 45
<211> 341
<212> PRT
<213> Pseudomonas aeruginosa
<220>
<223> amino acid sequence of UDP-glucose-4-epimerase (GNE1)
<400> 45
Met Met Ser Arg Tyr Glu Glu Leu Arg Lys Glu Leu Pro Ala Gln Pro
1 5 10 15
Lys Val Trp Leu Ile Thr Gly Val Ala Gly Phe Ile Gly Ser Asn Leu
20 25 30
Leu Glu Thr Leu Leu Lys Leu Asp Gln Lys Val Val Gly Leu Asp Asn
35 40 45
Phe Ala Thr Gly His Gln Arg Asn Leu Asp Glu Val Arg Ser Leu Val
50 55 60
Ser Glu Lys Gln Trp Ser Asn Phe Lys Phe Ile Gln Gly Asp Ile Arg
65 70 75 80
Asn Leu Asp Asp Cys Asn Asn Ala Cys Ala Gly Val Asp Tyr Val Leu
85 90 95
His Gln Ala Ala Leu Gly Ser Val Pro Arg Ser Ile Asn Asp Pro Ile
100 105 110
Thr Ser Asn Ala Thr Asn Ile Asp Gly Phe Leu Asn Met Leu Ile Ala
115 120 125
Ala Arg Asp Ala Lys Val Gln Ser Phe Thr Tyr Ala Ala Ser Ser Ser
130 135 140
Thr Tyr Gly Asp His Pro Gly Leu Pro Lys Val Glu Asp Thr Ile Gly
145 150 155 160
Lys Pro Leu Ser Pro Tyr Ala Val Thr Lys Tyr Val Asn Glu Leu Tyr
165 170 175
Ala Asp Val Phe Ser Arg Cys Tyr Gly Phe Ser Thr Ile Gly Leu Arg
180 185 190
Tyr Phe Asn Val Phe Gly Arg Arg Gln Asp Pro Asn Gly Ala Tyr Ala
195 200 205
Ala Val Ile Pro Lys Trp Thr Ser Ser Met Ile Gln Gly Asp Asp Val
210 215 220
Tyr Ile Asn Gly Asp Gly Glu Thr Ser Arg Asp Phe Cys Tyr Ile Glu
225 230 235 240
Asn Thr Val Gln Ala Asn Leu Leu Ala Ala Thr Ala Gly Leu Asp Ala
245 250 255
Arg Asn Gln Val Tyr Asn Ile Ala Val Gly Gly Arg Thr Ser Leu Asn
260 265 270
Gln Leu Phe Phe Ala Leu Arg Asp Gly Leu Ala Glu Asn Gly Val Ser
275 280 285
Tyr His Arg Glu Pro Val Tyr Arg Asp Phe Arg Glu Gly Asp Val Arg
290 295 300
His Ser Leu Ala Asp Ile Ser Lys Ala Ala Lys Leu Leu Gly Tyr Ala
305 310 315 320
Pro Lys Tyr Asp Val Ser Ala Gly Val Ala Leu Ala Met Pro Trp Tyr
325 330 335
Ile Met Phe Leu Lys
340
<210> 46
<211> 338
<212> PRT
<213> Pasteurella multocida
<220>
<223> amino acid sequence of UDP-glucose-4-epimerase (KFOA)
<400> 46
Met Ala Ile Leu Val Thr Gly Gly Ala Gly Tyr Ile Gly Ser His Thr
1 5 10 15
Val Val Glu Leu Leu Asn Ala Asn Lys Asp Val Val Val Leu Asp Asn
20 25 30
Leu Cys Asn Ser Ser Pro Lys Ser Leu Glu Arg Val Ala Gln Ile Thr
35 40 45
Gly Lys Gln Val Lys Phe Tyr Gln Gly Asp Ile Leu Asp Thr Ala Leu
50 55 60
Leu Gln Lys Ile Phe Ala Glu Asn Gln Ile Gln Ser Val Ile His Phe
65 70 75 80
Ala Gly Leu Lys Ala Val Gly Glu Ser Val Gln Lys Pro Ala Glu Tyr
85 90 95
Tyr Met Asn Asn Val Thr Gly Ser Leu Val Leu Ile Gln Glu Met Lys
100 105 110
Lys Ala Gly Val Trp Asn Phe Val Phe Ser Ser Ser Ala Thr Val Tyr
115 120 125
Gly Asp Pro Glu Ile Ile Pro Ile Thr Glu Ser Cys Lys Val Gly Gly
130 135 140
Thr Thr Asn Pro Tyr Gly Thr Ser Lys Phe Met Val Glu Gln Ile Leu
145 150 155 160
Lys Asp Ile Ala Lys Ala Thr Pro Glu Phe Ser Ile Thr Ile Leu Arg
165 170 175
Tyr Phe Asn Pro Val Gly Ala His Glu Ser Gly Leu Ile Gly Glu Asp
180 185 190
Pro Asn Gly Ile Pro Asn Asn Leu Leu Pro Tyr Ile Ser Gln Val Ala
195 200 205
Ile Gly Lys Leu Pro Gln Leu Ser Val Phe Gly Ser Asp Tyr Glu Thr
210 215 220
His Asp Gly Thr Gly Val Arg Asp Tyr Ile His Val Val Asp Leu Ala
225 230 235 240
Ile Gly His Leu Lys Ala Leu Asp Arg His Glu Gly Asp Ala Gly Leu
245 250 255
His Ile Tyr Asn Leu Gly Thr Gly Ser Gly Tyr Ser Val Leu Asp Met
260 265 270
Val Lys Ala Phe Glu Lys Val Asn Asp Ile Lys Ile Pro Tyr Lys Leu
275 280 285
Val Asp Arg Arg Pro Gly Asp Ile Ala Thr Cys Tyr Ser Asp Pro Ser
290 295 300
Leu Ala Lys Thr Glu Leu Asn Trp Thr Ala Ala Arg Gly Leu Glu Gln
305 310 315 320
Met Met Lys Asp Thr Trp His Trp Gln Lys Lys Asn Pro Lys Gly Tyr
325 330 335
Arg Asp
<210> 47
<211> 339
<212> PRT
<213> Escherichia coli
<220>
<223> amino acid sequence of UDP-glucose-4-epimerase (KFOA)
<400> 47
Met Asn Ile Leu Val Thr Gly Gly Ala Gly Tyr Ile Gly Ser His Thr
1 5 10 15
Ser Leu Cys Leu Leu Asn Lys Gly Tyr Asn Val Val Ile Ile Asp Asn
20 25 30
Leu Ile Asn Ser Ser Cys Glu Ser Ile Arg Arg Ile Glu Leu Ile Ala
35 40 45
Lys Lys Lys Val Thr Phe Tyr Glu Leu Asn Ile Asn Asn Glu Lys Glu
50 55 60
Val Asn Gln Ile Leu Lys Lys His Lys Phe Asp Cys Ile Met His Phe
65 70 75 80
Ala Gly Ala Lys Ser Val Ala Glu Ser Leu Ile Lys Pro Ile Phe Tyr
85 90 95
Tyr Asp Asn Asn Val Ser Gly Thr Leu Gln Leu Ile Asn Cys Ala Ile
100 105 110
Lys Asn Asp Val Ala Asn Phe Ile Phe Ser Ser Ser Ala Thr Val Tyr
115 120 125
Gly Glu Ser Lys Ile Met Pro Val Thr Glu Asp Cys His Ile Gly Gly
130 135 140
Thr Leu Asn Pro Tyr Gly Thr Ser Lys Tyr Ile Ser Glu Leu Met Ile
145 150 155 160
Arg Asp Ile Ala Lys Lys Tyr Ser Asp Thr Asn Phe Leu Cys Leu Arg
165 170 175
Tyr Phe Asn Pro Thr Gly Ala His Glu Ser Gly Met Ile Gly Glu Ser
180 185 190
Pro Ala Asp Ile Pro Ser Asn Leu Val Pro Tyr Ile Leu Gln Val Ala
195 200 205
Met Gly Lys Leu Glu Lys Leu Met Val Phe Gly Gly Asp Tyr Pro Thr
210 215 220
Lys Asp Gly Thr Gly Val Arg Asp Tyr Ile His Val Met Asp Leu Ala
225 230 235 240
Glu Gly His Val Ala Ala Leu Ser Tyr Leu Phe Arg Asp Asn Asn Thr
245 250 255
Asn Tyr His Val Phe Asn Leu Gly Thr Gly Lys Gly Tyr Ser Val Leu
260 265 270
Glu Leu Val Ser Thr Phe Glu Lys Ile Ser Gly Val Arg Ile Pro Tyr
275 280 285
Glu Ile Val Ser Arg Arg Asp Gly Asp Ile Ala Glu Ser Trp Ser Ser
290 295 300
Pro Glu Lys Ala Asn Lys Tyr Leu Asn Trp Lys Ala Lys Arg Glu Leu
305 310 315 320
Glu Thr Met Leu Glu Asp Ala Trp Arg Trp Gln Met Lys Asn Pro Asn
325 330 335
Gly Tyr Ile
<210> 48
<211> 1197
<212> DNA
<213> Cupiennius salei
<220>
<223> reencoded nucleic acid sequence of hyaluronidase (HYAL)
originating from Cupiennius salei with a N-terminal secretion
signal
<400> 48
atgcaattca gcactgttgc atcagttgca tttgtcgccc tggcgaattt tgtagccgcg 60
ttcaagattt actggaacgt cccaactttt cagtgcacgc ataactacaa aatcgattat 120
gtcaaattgt tgtccactta cgggatacag gtcaatgatg gcggtaagtt tcaaggaaac 180
caagtgacta tcttttatga aacccagttg ggtttgtatc cacgaatcct aaaatctggt 240
aaaatggaaa acggcggaat ccctcaacgc ggtaactttg agaaacacct agaaaaggca 300
agcacggacc tccagaaagt gatcccttgg aaagagttta gcggattagg tgtgatagat 360
tgggaggctt ggagacccac atgggaattt aactgggaac cgttgaggat atatcaaacc 420
gaatcaatta agagagctaa agaactacac cctaccgcaa acgattccgc agtaaaagaa 480
attgcagagc ggcaatggga agattcagcc aagttataca tgttagaaac actgcggctg 540
gcaaagaaac ttcgacctca agcgccttgg tgttactact tatttcctga ttgctataat 600
tacgtcggaa agaaaccaaa agatttccaa tgtagtgcct cgatacgtaa aggtaacgat 660
aagctaagct ggttgtggaa agattctacg gcattgtgtc catcgatata cgtatatgaa 720
tcacaattag acaggtattc ttttgaacaa aggacatggc gcgacaatga gaaacttcgg 780
gaagcgttgc gtgtagccac gagaacctct aaaatatacc catacgttaa ctatttcgat 840
aaggagctta taccggagca agaagtatgg agaatgcttg cgcaggcagc tgctgtcggt 900
ggcagtggtg cggtaatttg gggctcatct gctgcagttg catctgaaga gttatgtaaa 960
tctttaaaac agtatattat tgaaacgctt gggccggcgg cagagaaggt ggcttggcgt 1020
agtgacttat gcagcaaaga aatttgtaat aatcagggtc gctgcacatt cccggacgat 1080
gattatgcaa acgcatggaa attatttaca gatgatactg ttaagtttta tgctggtaat 1140
attacatgta ggtgctccga gaattattct ggtcgtttct gcgaaaagaa gaattaa 1197
<210> 49
<211> 1218
<212> DNA
<213> Tityus serrulatus
<220>
<223> reencoded nucleic acid sequence of hyaluronidase (HYAL)
originating from Tityus serrulatus with a N-terminal secretion
signal
<400> 49
atgcaattct ctactgtcgc ttccgttgct ttcgtcgctt tggctaactt tgttgccgct 60
gctgatttta aagtttactg ggaagtgcct tccttccttt gttctaaacg ttttaaaatt 120
aatgtaacgg aagttttaac aagtcacgag attcttgtca atcagggtga gagtttcaac 180
ggtgacaaga tagtaatctt ttacgaaaac caattgggga agtacccgca tattgactca 240
aacaatgtgg agatcaatgg aggaatactt caagtagccg atttggcgaa gcatttgaaa 300
gtagccaagg ataatatcac taaattcgtc ccgaatccta atttcaacgg tgtcggagtg 360
atcgactggg aagcttggcg gccatcatgg gaatttaact ggggtaagtt aaaagtatat 420
aaagaaaaga gcattgactt ggtcaagtcg aaacatccgg agtggccctc cgacagggtt 480
gaaaaggttg ctaaagagga gtgggaggag agtgccaaag aatggatggt gaagaccctg 540
aagttagcac aggaaatgcg accgaacgca gtttggtgct attatctatt ccctgactgc 600
tacaattatt tcggtaagga tcaaccctct caattcagct gctcgtctcg aattcagaag 660
gaaaattctc gtctttcttg gctctggaat caatcaacag ccatttgcct aagcatttat 720
atccaggaat cccatgttac caaatataat atgtcccagc ggacatggtg gatcgatgcg 780
agattaagag aagcaattcg agtcagcgaa cacagaccaa acatacccat ctacccttac 840
attaattata ttctacctgg aactaatcaa actgtaccag caatggactt taaaaggaca 900
ctgggtcaaa tagctagcct cggcctagat ggtgctttgt tatggggatc tagctatcat 960
gttttaacag aatctcaatg caaaatcact tctgattatg tgaaatcagt gattgctcct 1020
accgtggcta ctgtcgttct caatacaaac agatgctcac agataatttg taagggtcgc 1080
ggcaactgtg tttggcctga agaaccattt agttcttgga aatacttagt tgaccccaaa 1140
atgccagtgt tcaagccaac caacatccac tgtaaatgta aaggttacct aggtagatac 1200
tgtgagatcc caaagtaa 1218
<210> 50
<211> 1308
<212> DNA
<213> Bos taurus
<220>
<223> reencoded nucleic acid sequence of hyaluronidase (HYAL)
originating from Bos Taurus with a N-terminal secretion signal
<400> 50
atgcaatttt ctactgttgc ttctgtcgct ttcgtagcac tggccaattt tgtagctgct 60
ggaagccgtg accccgttgt cccaaaccag cctttcacaa caatatggaa cgcaaatacg 120
gagtggtgca tgaagaagca tggagtggac gtcgatattt caatcttcga cgtggtcact 180
aatccaggac agacatttag aggtccaaat atgacaatat tttacagttc acaattgggg 240
acctaccctt actacacatc cgcgggtgag ccagtattcg gtggtctacc ccagaacgca 300
agtttgaatg cccacttggc taggacattt caagatattc tggcagccat gccagagccc 360
aggttctcag gtttggctgt catagactgg gaagcgtgga gacctcgttg ggcatttaat 420
tgggatacga aagacatata caggcagagg tccagagcat tggttcagaa acagcacccg 480
gattggctgg cgccacgtgt tgaggccgca gcgcaagacc agttcgaggg cgctgctgag 540
gagtggatgg ccggcacact taaattaggg caggcgcttc gtcctcaagg cttgtggggt 600
ttctataact tcccggagtg ttacaattat gacttcaaat ctccgaacta cacaggaagg 660
tgccctttaa acatctgtgc gcagaacgac cagttaggtt ggctatgggg tcaaagtcgt 720
gcactatatc catcaatcta cttgccggcg gctttggaag gcacgaagaa gactcagatg 780
ttcgttcagc accgtgtagc agaggcattt agggtggcgg caggcgctgg tgaccccaag 840
ctacccgtct taccctatat gcagctattt tacgatatga caaaccactt cttgcccgcg 900
gaagaactgg aacatagctt aggtgagtca gcagcgcagg gtgcagccgg ggttgttctg 960
tgggtttcct ggttatcaac ttcgacaaag gaaagctgtc aagcaatcaa ggaatacgta 1020
gatactacgt tgggcccttc aatcttgaac gtcacatctg gtgccaggtt gtgttctcag 1080
gtattgtgca gtggccacgg gagatgcgcg agaagacctt catatcctaa agccaggctg 1140
attctaaatt caacgtcgtt ctccatcaag ccaacacccg gtggtggtcc attgacactt 1200
caaggcgctt tgagtttgga agacagatta cgtatggcag ttgagtttga atgcagatgt 1260
tacagaggat ggagagggac acgttgtgag cagtggggca tgtggtaa 1308
<210> 51
<211> 1137
<212> DNA
<213> Apis mellifera
<220>
<223> reencoded nucleic acid sequence of hyaluronidase (HYAL)
originating from Apis mellifera with a N-terminal secretion
signal
<400> 51
atgcagtttt ccacagttgc ttccgtagct ttcgtagctt tagcaaattt tgtcgcagct 60
ttgttgttgg gcttcgttca gtctactcca gataataata agactgtgcg tgaatttaac 120
gtgtattgga acgttcctac attcatgtgc cataagtacg ggttgagatt cgaagaggtg 180
agcgagaagt atggcatttt gcaaaattgg atggacaaat tcagaggaga ggaaattgcg 240
atcttatacg accccggcat gttccccgca ctgttgaaag accccaatgg gaatgtagta 300
gctaggaatg gcggagtgcc ccagcttggc aatttaacta aacatttaca ggtgttcagg 360
gaccacctaa tcaatcagat tccagataaa agctttcccg gagttggtgt aatagatttc 420
gagtcatgga gacctatttt cagacagaac tgggcctctt tgcaaccgta caagaagcta 480
tcagtcgaag tcgtacgtcg tgagcaccca ttctgggatg atcagagagt ggagcaagag 540
gcgaaaagaa gatttgaaaa gtacggccag cttttcatgg aagagacctt gaaagccgca 600
aaacgtatgc gtcctgcagc caattggggc tactacgctt acccttattg ctacaacctg 660
accccaaacc agccctcagc tcaatgcgag gctacaacaa tgcaggagaa cgacaagatg 720
tcatggttat tcgagtccga ggacgtctta ctgcccagcg tctatttgag gtggaacctg 780
actagcggag agagggttgg tttagttggt ggtcgtgtca aggaagccct gagaatagct 840
cgtcagatga ccacctctag gaagaaggtc ctaccatact actggtacaa ataccaggat 900
aggagagaca cggacctaag tagggctgat cttgaggcga ctctacgtaa aatcacggac 960
ttaggagccg acggtttcat aatctgggga tcttccgatg acatcaacac caaggcaaaa 1020
tgtttgcagt tcagagaata tttgaataac gagttgggcc cggcagtgaa gagaatagcc 1080
ttaaacaata atgcgaatga caggctaaca gtggatgtgt ctgttgacca ggtttaa 1137
<210> 52
<211> 1305
<212> DNA
<213> Macaca mulatta
<220>
<223> reencoded nucleic acid sequence of hyaluronidase (HYAL)
originating from Macaca mulatta with a N-terminal secretion
signal
<400> 52
atgcaattca gtactgtcgc tagcgtcgcc tttgtggctc ttgcaaattt cgtcgctgct 60
tcacgtgggc ctttattgcc gaacagacca tttgcaacgg tatggaatgc taacacccaa 120
tggtgtttag agaggcactc agtagacgtc gatgtctcca tatttgatgt tgtagcaaac 180
cccggccaga cttttcgtgg gccggacatg actattttct attccagtca gctaggtact 240
tacccttatt ataccccgac gggtgaacct gtctttggtg gccttccaca gaacgcatca 300
cttatagcgc acttggctag gactttccag gatatattgg cagctatacc agcccccgac 360
ttttctgggc tagccgtaat tgactgggaa gcatggagac cgagatgggc atttaactgg 420
gacacgaaag acatttacag gcaaaggtcc cgtgccttag tccaagcaca gcatcccgac 480
tggccagtta ctcaagttga ggctgtggca caagaccagt tccagggtgc tgcgagggca 540
tggatggcag gaaccttgca attaggccgt gctttaagac caaggggact atggggcttc 600
tacggttttc ccgattgcta caattacgat ttcctatctc ctaattacac agggcaatgc 660
ccatcaggga tcagagcaca aaatgaccag ttaggatggt tgtggggtca gagtcgtgca 720
ttatatccca gtatctacat gccggctgtt ttggaaggaa caggcaaatc ccaaatgtac 780
gtgcagcaca gggtcgcgga agcctttagg gttgctgttg cagcaggcga cccaaactta 840
cccgtcctac cgtacgtcca gattttctac gatatgacca accactttct tccattggac 900
gagttagagc atagtcttgg agaatcagcg gctcagggcg cagcaggagt cgtgttatgg 960
gtgtcatggg agaatactag aacaaaagaa tcttgccagg caattaaaga atatatggac 1020
actaccttgg ggccttttat tctgaacgtc acttcgggtg cgttgttatg ctcgcaagcc 1080
ttatgttcaa gccatggtcg ttgtgtccgt cgtccctcac atccaaaagc cttgctaatc 1140
cttaatcccg caagctttag tattcagttg acaccagatg gtggtccctt gtcgttaagg 1200
ggagcattgt cacttgagga ccaggcacaa atggctgttg aattcaaatg caggtgctac 1260
cccgggtggc aaggcccttg gtgtgagcag aagagtatgt ggtaa 1305
<210> 53
<211> 1083
<212> DNA
<213> Vespa magnifica
<220>
<223> reencoded nucleic acid sequence of hyaluronidase (HYAL)
originating from Vespa magnifica with a N-terminal secretion
signal
<400> 53
atgcaatttt ctacagtggc aagtgttgca ttcgttgcac tagccaactt tgtggcggca 60
gatagctgtg ggtcaaactg cgaaaagagt gagagaccga aaagggtctt caacatttac 120
tggaacgtac ctacattcat gtgtcaccag tacggactat actttgacga ggtcacgaat 180
tttaatataa agcacaacag caaagacaat tttcaagggg acaagatcgc gatcttttat 240
gaccccgggg agtttcccgc tctgctgcca ctaaactatg gtaagtacaa gatcaggaat 300
ggtggtgttc cacaagaggg taacatcacc atccatctgc agagattcat agagtaccta 360
gataagacct atccgaaccg taacttttca ggcatcggtg tgatcgattt cgagaggtgg 420
agaccaattt tcagacagaa ttggggtaat atgaagattt acaagaactt ctccatcgat 480
cttgtgcgta aagagcatcc tttctggaat aagaaaatga tcgagttgga agcttctaaa 540
agattcgaga aatacgcccg tctgttcatg gaagaaacat taaagttggc taagaaaact 600
agaaaacagg ccgattgggg ctactacggt tacccctatt gcttcaacat gtctcctact 660
aatttcgttc ctgactgcga tgtcacagct agggatgaga acaacgagat gtcttggttg 720
tttaacaacc agaatgtcct attaccaagt gtatacatta ggagagagct aactcctgac 780
cagaggattg ggcttgtaca ggggagagtg aaggaagctg tgagaatttc aaataaactg 840
aagcactcac ctaaagtctt cagctattgg tggtatgttt accaagacga gaccaacacc 900
ttcttaacgg agaccgacgt caagaagacg tttcaggaga ttgtgatcaa cggtggagat 960
gggattataa tctggggttc gtcctctgat gtaaacagct tgtccaagtg tacgaggtta 1020
agggagtacc tattgacagt cttgggacca attgctgtta acgtgactga agcagtaaac 1080
taa 1083
<210> 54
<211> 1407
<212> DNA
<213> Cupiennius salei
<220>
<223> reencoded nucleic acid sequence of hyaluronidase (HYAL)
originating from Cupiennius salei with a N-terminal secretion
signal and a C-terminal anchoring signal
<400> 54
atgcaattca gcactgttgc atcagttgca tttgtcgccc tggcgaattt tgtagccgcg 60
ttcaagattt actggaacgt cccaactttt cagtgcacgc ataactacaa aatcgattat 120
gtcaaattgt tgtccactta cgggatacag gtcaatgatg gcggtaagtt tcaaggaaac 180
caagtgacta tcttttatga aacccagttg ggtttgtatc cacgaatcct aaaatctggt 240
aaaatggaaa acggcggaat ccctcaacgc ggtaactttg agaaacacct agaaaaggca 300
agcacggacc tccagaaagt gatcccttgg aaagagttta gcggattagg tgtgatagat 360
tgggaggctt ggagacccac atgggaattt aactgggaac cgttgaggat atatcaaacc 420
gaatcaatta agagagctaa agaactacac cctaccgcaa acgattccgc agtaaaagaa 480
attgcagagc ggcaatggga agattcagcc aagttataca tgttagaaac actgcggctg 540
gcaaagaaac ttcgacctca agcgccttgg tgttactact tatttcctga ttgctataat 600
tacgtcggaa agaaaccaaa agatttccaa tgtagtgcct cgatacgtaa aggtaacgat 660
aagctaagct ggttgtggaa agattctacg gcattgtgtc catcgatata cgtatatgaa 720
tcacaattag acaggtattc ttttgaacaa aggacatggc gcgacaatga gaaacttcgg 780
gaagcgttgc gtgtagccac gagaacctct aaaatatacc catacgttaa ctatttcgat 840
aaggagctta taccggagca agaagtatgg agaatgcttg cgcaggcagc tgctgtcggt 900
ggcagtggtg cggtaatttg gggctcatct gctgcagttg catctgaaga gttatgtaaa 960
tctttaaaac agtatattat tgaaacgctt gggccggcgg cagagaaggt ggcttggcgt 1020
agtgacttat gcagcaaaga aatttgtaat aatcagggtc gctgcacatt cccggacgat 1080
gattatgcaa acgcatggaa attatttaca gatgatactg ttaagtttta tgctggtaat 1140
attacatgta ggtgctccga gaattattct ggtcgtttct gcgaaaagaa gaatggatcc 1200
gccatttctc aaatcactga cggtcaaatc caagctacta ccactgctac caccgaagct 1260
accaccactg ctgccccatc ttccaccgtt gaaactgttt ctccatccag caccgaaact 1320
atctctcaac aaactgaaaa tggtgctgct aaggccgctg tcggtatggg tgccggtgct 1380
ctagctgctg ctgctatgtt gttataa 1407
<210> 55
<211> 1428
<212> DNA
<213> Tityus serrulatus
<220>
<223> reencoded nucleic acid sequence of hyaluronidase (HYAL)
originating from Tityus serrulatus with a N-terminal secretion
signal and a C-terminal anchoring signal
<400> 55
atgcaattct ctactgtcgc ttccgttgct ttcgtcgctt tggctaactt tgttgccgct 60
gctgatttta aagtttactg ggaagtgcct tccttccttt gttctaaacg ttttaaaatt 120
aatgtaacgg aagttttaac aagtcacgag attcttgtca atcagggtga gagtttcaac 180
ggtgacaaga tagtaatctt ttacgaaaac caattgggga agtacccgca tattgactca 240
aacaatgtgg agatcaatgg aggaatactt caagtagccg atttggcgaa gcatttgaaa 300
gtagccaagg ataatatcac taaattcgtc ccgaatccta atttcaacgg tgtcggagtg 360
atcgactggg aagcttggcg gccatcatgg gaatttaact ggggtaagtt aaaagtatat 420
aaagaaaaga gcattgactt ggtcaagtcg aaacatccgg agtggccctc cgacagggtt 480
gaaaaggttg ctaaagagga gtgggaggag agtgccaaag aatggatggt gaagaccctg 540
aagttagcac aggaaatgcg accgaacgca gtttggtgct attatctatt ccctgactgc 600
tacaattatt tcggtaagga tcaaccctct caattcagct gctcgtctcg aattcagaag 660
gaaaattctc gtctttcttg gctctggaat caatcaacag ccatttgcct aagcatttat 720
atccaggaat cccatgttac caaatataat atgtcccagc ggacatggtg gatcgatgcg 780
agattaagag aagcaattcg agtcagcgaa cacagaccaa acatacccat ctacccttac 840
attaattata ttctacctgg aactaatcaa actgtaccag caatggactt taaaaggaca 900
ctgggtcaaa tagctagcct cggcctagat ggtgctttgt tatggggatc tagctatcat 960
gttttaacag aatctcaatg caaaatcact tctgattatg tgaaatcagt gattgctcct 1020
accgtggcta ctgtcgttct caatacaaac agatgctcac agataatttg taagggtcgc 1080
ggcaactgtg tttggcctga agaaccattt agttcttgga aatacttagt tgaccccaaa 1140
atgccagtgt tcaagccaac caacatccac tgtaaatgta aaggttacct aggtagatac 1200
tgtgagatcc caaagggatc cgccatttct caaatcactg acggtcaaat ccaagctact 1260
accactgcta ccaccgaagc taccaccact gctgccccat cttccaccgt tgaaactgtt 1320
tctccatcca gcaccgaaac tatctctcaa caaactgaaa atggtgctgc taaggccgct 1380
gtcggtatgg gtgccggtgc tctagctgct gctgctatgt tgttataa 1428
<210> 56
<211> 1518
<212> DNA
<213> Bos taurus
<220>
<223> reencoded nucleic acid sequence of hyaluronidase (HYAL)
originating from Bos taurus with a N-terminal secretion signal
and a C-terminal anchoring signal
<400> 56
atgcaatttt ctactgttgc ttctgtcgct ttcgtagcac tggccaattt tgtagctgct 60
ggaagccgtg accccgttgt cccaaaccag cctttcacaa caatatggaa cgcaaatacg 120
gagtggtgca tgaagaagca tggagtggac gtcgatattt caatcttcga cgtggtcact 180
aatccaggac agacatttag aggtccaaat atgacaatat tttacagttc acaattgggg 240
acctaccctt actacacatc cgcgggtgag ccagtattcg gtggtctacc ccagaacgca 300
agtttgaatg cccacttggc taggacattt caagatattc tggcagccat gccagagccc 360
aggttctcag gtttggctgt catagactgg gaagcgtgga gacctcgttg ggcatttaat 420
tgggatacga aagacatata caggcagagg tccagagcat tggttcagaa acagcacccg 480
gattggctgg cgccacgtgt tgaggccgca gcgcaagacc agttcgaggg cgctgctgag 540
gagtggatgg ccggcacact taaattaggg caggcgcttc gtcctcaagg cttgtggggt 600
ttctataact tcccggagtg ttacaattat gacttcaaat ctccgaacta cacaggaagg 660
tgccctttaa acatctgtgc gcagaacgac cagttaggtt ggctatgggg tcaaagtcgt 720
gcactatatc catcaatcta cttgccggcg gctttggaag gcacgaagaa gactcagatg 780
ttcgttcagc accgtgtagc agaggcattt agggtggcgg caggcgctgg tgaccccaag 840
ctacccgtct taccctatat gcagctattt tacgatatga caaaccactt cttgcccgcg 900
gaagaactgg aacatagctt aggtgagtca gcagcgcagg gtgcagccgg ggttgttctg 960
tgggtttcct ggttatcaac ttcgacaaag gaaagctgtc aagcaatcaa ggaatacgta 1020
gatactacgt tgggcccttc aatcttgaac gtcacatctg gtgccaggtt gtgttctcag 1080
gtattgtgca gtggccacgg gagatgcgcg agaagacctt catatcctaa agccaggctg 1140
attctaaatt caacgtcgtt ctccatcaag ccaacacccg gtggtggtcc attgacactt 1200
caaggcgctt tgagtttgga agacagatta cgtatggcag ttgagtttga atgcagatgt 1260
tacagaggat ggagagggac acgttgtgag cagtggggca tgtggggatc cgccatttct 1320
caaatcactg acggtcaaat ccaagctact accactgcta ccaccgaagc taccaccact 1380
gctgccccat cttccaccgt tgaaactgtt tctccatcca gcaccgaaac tatctctcaa 1440
caaactgaaa atggtgctgc taaggccgct gtcggtatgg gtgccggtgc tctagctgct 1500
gctgctatgt tgttataa 1518
<210> 57
<211> 1347
<212> DNA
<213> Apis mellifera
<220>
<223> reencoded nucleic acid sequence of hyaluronidase (HYAL)
originating from Apis mellifera with a N-terminal secretion
signal and a C-terminal anchoring signal
<400> 57
atgcagtttt ccacagttgc ttccgtagct ttcgtagctt tagcaaattt tgtcgcagct 60
ttgttgttgg gcttcgttca gtctactcca gataataata agactgtgcg tgaatttaac 120
gtgtattgga acgttcctac attcatgtgc cataagtacg ggttgagatt cgaagaggtg 180
agcgagaagt atggcatttt gcaaaattgg atggacaaat tcagaggaga ggaaattgcg 240
atcttatacg accccggcat gttccccgca ctgttgaaag accccaatgg gaatgtagta 300
gctaggaatg gcggagtgcc ccagcttggc aatttaacta aacatttaca ggtgttcagg 360
gaccacctaa tcaatcagat tccagataaa agctttcccg gagttggtgt aatagatttc 420
gagtcatgga gacctatttt cagacagaac tgggcctctt tgcaaccgta caagaagcta 480
tcagtcgaag tcgtacgtcg tgagcaccca ttctgggatg atcagagagt ggagcaagag 540
gcgaaaagaa gatttgaaaa gtacggccag cttttcatgg aagagacctt gaaagccgca 600
aaacgtatgc gtcctgcagc caattggggc tactacgctt acccttattg ctacaacctg 660
accccaaacc agccctcagc tcaatgcgag gctacaacaa tgcaggagaa cgacaagatg 720
tcatggttat tcgagtccga ggacgtctta ctgcccagcg tctatttgag gtggaacctg 780
actagcggag agagggttgg tttagttggt ggtcgtgtca aggaagccct gagaatagct 840
cgtcagatga ccacctctag gaagaaggtc ctaccatact actggtacaa ataccaggat 900
aggagagaca cggacctaag tagggctgat cttgaggcga ctctacgtaa aatcacggac 960
ttaggagccg acggtttcat aatctgggga tcttccgatg acatcaacac caaggcaaaa 1020
tgtttgcagt tcagagaata tttgaataac gagttgggcc cggcagtgaa gagaatagcc 1080
ttaaacaata atgcgaatga caggctaaca gtggatgtgt ctgttgacca ggttggatcc 1140
gccatttctc aaatcactga cggtcaaatc caagctacta ccactgctac caccgaagct 1200
accaccactg ctgccccatc ttccaccgtt gaaactgttt ctccatccag caccgaaact 1260
atctctcaac aaactgaaaa tggtgctgct aaggccgctg tcggtatggg tgccggtgct 1320
ctagctgctg ctgctatgtt gttataa 1347
<210> 58
<211> 1515
<212> DNA
<213> Macaca mulatta
<220>
<223> reencoded nucleic acid sequence of hyaluronidase (HYAL)
originating from Macaca mulatta with a N-terminal secretion
signal and a C-terminal anchoring signal
<400> 58
atgcaattca gtactgtcgc tagcgtcgcc tttgtggctc ttgcaaattt cgtcgctgct 60
tcacgtgggc ctttattgcc gaacagacca tttgcaacgg tatggaatgc taacacccaa 120
tggtgtttag agaggcactc agtagacgtc gatgtctcca tatttgatgt tgtagcaaac 180
cccggccaga cttttcgtgg gccggacatg actattttct attccagtca gctaggtact 240
tacccttatt ataccccgac gggtgaacct gtctttggtg gccttccaca gaacgcatca 300
cttatagcgc acttggctag gactttccag gatatattgg cagctatacc agcccccgac 360
ttttctgggc tagccgtaat tgactgggaa gcatggagac cgagatgggc atttaactgg 420
gacacgaaag acatttacag gcaaaggtcc cgtgccttag tccaagcaca gcatcccgac 480
tggccagtta ctcaagttga ggctgtggca caagaccagt tccagggtgc tgcgagggca 540
tggatggcag gaaccttgca attaggccgt gctttaagac caaggggact atggggcttc 600
tacggttttc ccgattgcta caattacgat ttcctatctc ctaattacac agggcaatgc 660
ccatcaggga tcagagcaca aaatgaccag ttaggatggt tgtggggtca gagtcgtgca 720
ttatatccca gtatctacat gccggctgtt ttggaaggaa caggcaaatc ccaaatgtac 780
gtgcagcaca gggtcgcgga agcctttagg gttgctgttg cagcaggcga cccaaactta 840
cccgtcctac cgtacgtcca gattttctac gatatgacca accactttct tccattggac 900
gagttagagc atagtcttgg agaatcagcg gctcagggcg cagcaggagt cgtgttatgg 960
gtgtcatggg agaatactag aacaaaagaa tcttgccagg caattaaaga atatatggac 1020
actaccttgg ggccttttat tctgaacgtc acttcgggtg cgttgttatg ctcgcaagcc 1080
ttatgttcaa gccatggtcg ttgtgtccgt cgtccctcac atccaaaagc cttgctaatc 1140
cttaatcccg caagctttag tattcagttg acaccagatg gtggtccctt gtcgttaagg 1200
ggagcattgt cacttgagga ccaggcacaa atggctgttg aattcaaatg caggtgctac 1260
cccgggtggc aaggcccttg gtgtgagcag aagagtatgt ggggatccgc catttctcaa 1320
atcactgacg gtcaaatcca agctactacc actgctacca ccgaagctac caccactgct 1380
gccccatctt ccaccgttga aactgtttct ccatccagca ccgaaactat ctctcaacaa 1440
actgaaaatg gtgctgctaa ggccgctgtc ggtatgggtg ccggtgctct agctgctgct 1500
gctatgttgt tataa 1515
<210> 59
<211> 1293
<212> DNA
<213> Vespa magnifica
<220>
<223> reencoded nucleic acid sequence of hyaluronidase (HYAL)
originating from Vespa magnifica with a N-terminal secretion
signal and a C-terminal anchoring signal
<400> 59
atgcaatttt ctacagtggc aagtgttgca ttcgttgcac tagccaactt tgtggcggca 60
gatagctgtg ggtcaaactg cgaaaagagt gagagaccga aaagggtctt caacatttac 120
tggaacgtac ctacattcat gtgtcaccag tacggactat actttgacga ggtcacgaat 180
tttaatataa agcacaacag caaagacaat tttcaagggg acaagatcgc gatcttttat 240
gaccccgggg agtttcccgc tctgctgcca ctaaactatg gtaagtacaa gatcaggaat 300
ggtggtgttc cacaagaggg taacatcacc atccatctgc agagattcat agagtaccta 360
gataagacct atccgaaccg taacttttca ggcatcggtg tgatcgattt cgagaggtgg 420
agaccaattt tcagacagaa ttggggtaat atgaagattt acaagaactt ctccatcgat 480
cttgtgcgta aagagcatcc tttctggaat aagaaaatga tcgagttgga agcttctaaa 540
agattcgaga aatacgcccg tctgttcatg gaagaaacat taaagttggc taagaaaact 600
agaaaacagg ccgattgggg ctactacggt tacccctatt gcttcaacat gtctcctact 660
aatttcgttc ctgactgcga tgtcacagct agggatgaga acaacgagat gtcttggttg 720
tttaacaacc agaatgtcct attaccaagt gtatacatta ggagagagct aactcctgac 780
cagaggattg ggcttgtaca ggggagagtg aaggaagctg tgagaatttc aaataaactg 840
aagcactcac ctaaagtctt cagctattgg tggtatgttt accaagacga gaccaacacc 900
ttcttaacgg agaccgacgt caagaagacg tttcaggaga ttgtgatcaa cggtggagat 960
gggattataa tctggggttc gtcctctgat gtaaacagct tgtccaagtg tacgaggtta 1020
agggagtacc tattgacagt cttgggacca attgctgtta acgtgactga agcagtaaac 1080
ggatccgcca tttctcaaat cactgacggt caaatccaag ctactaccac tgctaccacc 1140
gaagctacca ccactgctgc cccatcttcc accgttgaaa ctgtttctcc atccagcacc 1200
gaaactatct ctcaacaaac tgaaaatggt gctgctaagg ccgctgtcgg tatgggtgcc 1260
ggtgctctag ctgctgctgc tatgttgtta taa 1293
<210> 60
<211> 398
<212> PRT
<213> Cupiennius salei
<220>
<223> amino acid sequence of hyaluronidase (HYAL) originating from
Cupiennius salei with a N-terminal secretion signal
<400> 60
Met Gln Phe Ser Thr Val Ala Ser Val Ala Phe Val Ala Leu Ala Asn
1 5 10 15
Phe Val Ala Ala Phe Lys Ile Tyr Trp Asn Val Pro Thr Phe Gln Cys
20 25 30
Thr His Asn Tyr Lys Ile Asp Tyr Val Lys Leu Leu Ser Thr Tyr Gly
35 40 45
Ile Gln Val Asn Asp Gly Gly Lys Phe Gln Gly Asn Gln Val Thr Ile
50 55 60
Phe Tyr Glu Thr Gln Leu Gly Leu Tyr Pro Arg Ile Leu Lys Ser Gly
65 70 75 80
Lys Met Glu Asn Gly Gly Ile Pro Gln Arg Gly Asn Phe Glu Lys His
85 90 95
Leu Glu Lys Ala Ser Thr Asp Leu Gln Lys Val Ile Pro Trp Lys Glu
100 105 110
Phe Ser Gly Leu Gly Val Ile Asp Trp Glu Ala Trp Arg Pro Thr Trp
115 120 125
Glu Phe Asn Trp Glu Pro Leu Arg Ile Tyr Gln Thr Glu Ser Ile Lys
130 135 140
Arg Ala Lys Glu Leu His Pro Thr Ala Asn Asp Ser Ala Val Lys Glu
145 150 155 160
Ile Ala Glu Arg Gln Trp Glu Asp Ser Ala Lys Leu Tyr Met Leu Glu
165 170 175
Thr Leu Arg Leu Ala Lys Lys Leu Arg Pro Gln Ala Pro Trp Cys Tyr
180 185 190
Tyr Leu Phe Pro Asp Cys Tyr Asn Tyr Val Gly Lys Lys Pro Lys Asp
195 200 205
Phe Gln Cys Ser Ala Ser Ile Arg Lys Gly Asn Asp Lys Leu Ser Trp
210 215 220
Leu Trp Lys Asp Ser Thr Ala Leu Cys Pro Ser Ile Tyr Val Tyr Glu
225 230 235 240
Ser Gln Leu Asp Arg Tyr Ser Phe Glu Gln Arg Thr Trp Arg Asp Asn
245 250 255
Glu Lys Leu Arg Glu Ala Leu Arg Val Ala Thr Arg Thr Ser Lys Ile
260 265 270
Tyr Pro Tyr Val Asn Tyr Phe Asp Lys Glu Leu Ile Pro Glu Gln Glu
275 280 285
Val Trp Arg Met Leu Ala Gln Ala Ala Ala Val Gly Gly Ser Gly Ala
290 295 300
Val Ile Trp Gly Ser Ser Ala Ala Val Ala Ser Glu Glu Leu Cys Lys
305 310 315 320
Ser Leu Lys Gln Tyr Ile Ile Glu Thr Leu Gly Pro Ala Ala Glu Lys
325 330 335
Val Ala Trp Arg Ser Asp Leu Cys Ser Lys Glu Ile Cys Asn Asn Gln
340 345 350
Gly Arg Cys Thr Phe Pro Asp Asp Asp Tyr Ala Asn Ala Trp Lys Leu
355 360 365
Phe Thr Asp Asp Thr Val Lys Phe Tyr Ala Gly Asn Ile Thr Cys Arg
370 375 380
Cys Ser Glu Asn Tyr Ser Gly Arg Phe Cys Glu Lys Lys Asn
385 390 395
<210> 61
<211> 405
<212> PRT
<213> Tityus serrulatus
<220>
<223> amino acid sequence of hyaluronidase (HYAL) originating from
Tityus serrulatus with a N-terminal secretion signal
<400> 61
Met Gln Phe Ser Thr Val Ala Ser Val Ala Phe Val Ala Leu Ala Asn
1 5 10 15
Phe Val Ala Ala Ala Asp Phe Lys Val Tyr Trp Glu Val Pro Ser Phe
20 25 30
Leu Cys Ser Lys Arg Phe Lys Ile Asn Val Thr Glu Val Leu Thr Ser
35 40 45
His Glu Ile Leu Val Asn Gln Gly Glu Ser Phe Asn Gly Asp Lys Ile
50 55 60
Val Ile Phe Tyr Glu Asn Gln Leu Gly Lys Tyr Pro His Ile Asp Ser
65 70 75 80
Asn Asn Val Glu Ile Asn Gly Gly Ile Leu Gln Val Ala Asp Leu Ala
85 90 95
Lys His Leu Lys Val Ala Lys Asp Asn Ile Thr Lys Phe Val Pro Asn
100 105 110
Pro Asn Phe Asn Gly Val Gly Val Ile Asp Trp Glu Ala Trp Arg Pro
115 120 125
Ser Trp Glu Phe Asn Trp Gly Lys Leu Lys Val Tyr Lys Glu Lys Ser
130 135 140
Ile Asp Leu Val Lys Ser Lys His Pro Glu Trp Pro Ser Asp Arg Val
145 150 155 160
Glu Lys Val Ala Lys Glu Glu Trp Glu Glu Ser Ala Lys Glu Trp Met
165 170 175
Val Lys Thr Leu Lys Leu Ala Gln Glu Met Arg Pro Asn Ala Val Trp
180 185 190
Cys Tyr Tyr Leu Phe Pro Asp Cys Tyr Asn Tyr Phe Gly Lys Asp Gln
195 200 205
Pro Ser Gln Phe Ser Cys Ser Ser Arg Ile Gln Lys Glu Asn Ser Arg
210 215 220
Leu Ser Trp Leu Trp Asn Gln Ser Thr Ala Ile Cys Leu Ser Ile Tyr
225 230 235 240
Ile Gln Glu Ser His Val Thr Lys Tyr Asn Met Ser Gln Arg Thr Trp
245 250 255
Trp Ile Asp Ala Arg Leu Arg Glu Ala Ile Arg Val Ser Glu His Arg
260 265 270
Pro Asn Ile Pro Ile Tyr Pro Tyr Ile Asn Tyr Ile Leu Pro Gly Thr
275 280 285
Asn Gln Thr Val Pro Ala Met Asp Phe Lys Arg Thr Leu Gly Gln Ile
290 295 300
Ala Ser Leu Gly Leu Asp Gly Ala Leu Leu Trp Gly Ser Ser Tyr His
305 310 315 320
Val Leu Thr Glu Ser Gln Cys Lys Ile Thr Ser Asp Tyr Val Lys Ser
325 330 335
Val Ile Ala Pro Thr Val Ala Thr Val Val Leu Asn Thr Asn Arg Cys
340 345 350
Ser Gln Ile Ile Cys Lys Gly Arg Gly Asn Cys Val Trp Pro Glu Glu
355 360 365
Pro Phe Ser Ser Trp Lys Tyr Leu Val Asp Pro Lys Met Pro Val Phe
370 375 380
Lys Pro Thr Asn Ile His Cys Lys Cys Lys Gly Tyr Leu Gly Arg Tyr
385 390 395 400
Cys Glu Ile Pro Lys
405
<210> 62
<211> 435
<212> PRT
<213> Bos taurus
<220>
<223> amino acid sequence of hyaluronidase (HYAL) originating from Bos
taurus with a N-terminal secretion signal
<400> 62
Met Gln Phe Ser Thr Val Ala Ser Val Ala Phe Val Ala Leu Ala Asn
1 5 10 15
Phe Val Ala Ala Gly Ser Arg Asp Pro Val Val Pro Asn Gln Pro Phe
20 25 30
Thr Thr Ile Trp Asn Ala Asn Thr Glu Trp Cys Met Lys Lys His Gly
35 40 45
Val Asp Val Asp Ile Ser Ile Phe Asp Val Val Thr Asn Pro Gly Gln
50 55 60
Thr Phe Arg Gly Pro Asn Met Thr Ile Phe Tyr Ser Ser Gln Leu Gly
65 70 75 80
Thr Tyr Pro Tyr Tyr Thr Ser Ala Gly Glu Pro Val Phe Gly Gly Leu
85 90 95
Pro Gln Asn Ala Ser Leu Asn Ala His Leu Ala Arg Thr Phe Gln Asp
100 105 110
Ile Leu Ala Ala Met Pro Glu Pro Arg Phe Ser Gly Leu Ala Val Ile
115 120 125
Asp Trp Glu Ala Trp Arg Pro Arg Trp Ala Phe Asn Trp Asp Thr Lys
130 135 140
Asp Ile Tyr Arg Gln Arg Ser Arg Ala Leu Val Gln Lys Gln His Pro
145 150 155 160
Asp Trp Leu Ala Pro Arg Val Glu Ala Ala Ala Gln Asp Gln Phe Glu
165 170 175
Gly Ala Ala Glu Glu Trp Met Ala Gly Thr Leu Lys Leu Gly Gln Ala
180 185 190
Leu Arg Pro Gln Gly Leu Trp Gly Phe Tyr Asn Phe Pro Glu Cys Tyr
195 200 205
Asn Tyr Asp Phe Lys Ser Pro Asn Tyr Thr Gly Arg Cys Pro Leu Asn
210 215 220
Ile Cys Ala Gln Asn Asp Gln Leu Gly Trp Leu Trp Gly Gln Ser Arg
225 230 235 240
Ala Leu Tyr Pro Ser Ile Tyr Leu Pro Ala Ala Leu Glu Gly Thr Lys
245 250 255
Lys Thr Gln Met Phe Val Gln His Arg Val Ala Glu Ala Phe Arg Val
260 265 270
Ala Ala Gly Ala Gly Asp Pro Lys Leu Pro Val Leu Pro Tyr Met Gln
275 280 285
Leu Phe Tyr Asp Met Thr Asn His Phe Leu Pro Ala Glu Glu Leu Glu
290 295 300
His Ser Leu Gly Glu Ser Ala Ala Gln Gly Ala Ala Gly Val Val Leu
305 310 315 320
Trp Val Ser Trp Leu Ser Thr Ser Thr Lys Glu Ser Cys Gln Ala Ile
325 330 335
Lys Glu Tyr Val Asp Thr Thr Leu Gly Pro Ser Ile Leu Asn Val Thr
340 345 350
Ser Gly Ala Arg Leu Cys Ser Gln Val Leu Cys Ser Gly His Gly Arg
355 360 365
Cys Ala Arg Arg Pro Ser Tyr Pro Lys Ala Arg Leu Ile Leu Asn Ser
370 375 380
Thr Ser Phe Ser Ile Lys Pro Thr Pro Gly Gly Gly Pro Leu Thr Leu
385 390 395 400
Gln Gly Ala Leu Ser Leu Glu Asp Arg Leu Arg Met Ala Val Glu Phe
405 410 415
Glu Cys Arg Cys Tyr Arg Gly Trp Arg Gly Thr Arg Cys Glu Gln Trp
420 425 430
Gly Met Trp
435
<210> 63
<211> 378
<212> PRT
<213> Apis mellifera
<220>
<223> amino acid sequence of hyaluronidase (HYAL) originating from Apis
mellifera with a N-terminal secretion signal
<400> 63
Met Gln Phe Ser Thr Val Ala Ser Val Ala Phe Val Ala Leu Ala Asn
1 5 10 15
Phe Val Ala Ala Leu Leu Leu Gly Phe Val Gln Ser Thr Pro Asp Asn
20 25 30
Asn Lys Thr Val Arg Glu Phe Asn Val Tyr Trp Asn Val Pro Thr Phe
35 40 45
Met Cys His Lys Tyr Gly Leu Arg Phe Glu Glu Val Ser Glu Lys Tyr
50 55 60
Gly Ile Leu Gln Asn Trp Met Asp Lys Phe Arg Gly Glu Glu Ile Ala
65 70 75 80
Ile Leu Tyr Asp Pro Gly Met Phe Pro Ala Leu Leu Lys Asp Pro Asn
85 90 95
Gly Asn Val Val Ala Arg Asn Gly Gly Val Pro Gln Leu Gly Asn Leu
100 105 110
Thr Lys His Leu Gln Val Phe Arg Asp His Leu Ile Asn Gln Ile Pro
115 120 125
Asp Lys Ser Phe Pro Gly Val Gly Val Ile Asp Phe Glu Ser Trp Arg
130 135 140
Pro Ile Phe Arg Gln Asn Trp Ala Ser Leu Gln Pro Tyr Lys Lys Leu
145 150 155 160
Ser Val Glu Val Val Arg Arg Glu His Pro Phe Trp Asp Asp Gln Arg
165 170 175
Val Glu Gln Glu Ala Lys Arg Arg Phe Glu Lys Tyr Gly Gln Leu Phe
180 185 190
Met Glu Glu Thr Leu Lys Ala Ala Lys Arg Met Arg Pro Ala Ala Asn
195 200 205
Trp Gly Tyr Tyr Ala Tyr Pro Tyr Cys Tyr Asn Leu Thr Pro Asn Gln
210 215 220
Pro Ser Ala Gln Cys Glu Ala Thr Thr Met Gln Glu Asn Asp Lys Met
225 230 235 240
Ser Trp Leu Phe Glu Ser Glu Asp Val Leu Leu Pro Ser Val Tyr Leu
245 250 255
Arg Trp Asn Leu Thr Ser Gly Glu Arg Val Gly Leu Val Gly Gly Arg
260 265 270
Val Lys Glu Ala Leu Arg Ile Ala Arg Gln Met Thr Thr Ser Arg Lys
275 280 285
Lys Val Leu Pro Tyr Tyr Trp Tyr Lys Tyr Gln Asp Arg Arg Asp Thr
290 295 300
Asp Leu Ser Arg Ala Asp Leu Glu Ala Thr Leu Arg Lys Ile Thr Asp
305 310 315 320
Leu Gly Ala Asp Gly Phe Ile Ile Trp Gly Ser Ser Asp Asp Ile Asn
325 330 335
Thr Lys Ala Lys Cys Leu Gln Phe Arg Glu Tyr Leu Asn Asn Glu Leu
340 345 350
Gly Pro Ala Val Lys Arg Ile Ala Leu Asn Asn Asn Ala Asn Asp Arg
355 360 365
Leu Thr Val Asp Val Ser Val Asp Gln Val
370 375
<210> 64
<211> 434
<212> PRT
<213> Macaca mulatta
<220>
<223> amino acid sequence of hyaluronidase (HYAL) originating from
Macaca mulatta with a N-terminal secretion signal
<400> 64
Met Gln Phe Ser Thr Val Ala Ser Val Ala Phe Val Ala Leu Ala Asn
1 5 10 15
Phe Val Ala Ala Ser Arg Gly Pro Leu Leu Pro Asn Arg Pro Phe Ala
20 25 30
Thr Val Trp Asn Ala Asn Thr Gln Trp Cys Leu Glu Arg His Ser Val
35 40 45
Asp Val Asp Val Ser Ile Phe Asp Val Val Ala Asn Pro Gly Gln Thr
50 55 60
Phe Arg Gly Pro Asp Met Thr Ile Phe Tyr Ser Ser Gln Leu Gly Thr
65 70 75 80
Tyr Pro Tyr Tyr Thr Pro Thr Gly Glu Pro Val Phe Gly Gly Leu Pro
85 90 95
Gln Asn Ala Ser Leu Ile Ala His Leu Ala Arg Thr Phe Gln Asp Ile
100 105 110
Leu Ala Ala Ile Pro Ala Pro Asp Phe Ser Gly Leu Ala Val Ile Asp
115 120 125
Trp Glu Ala Trp Arg Pro Arg Trp Ala Phe Asn Trp Asp Thr Lys Asp
130 135 140
Ile Tyr Arg Gln Arg Ser Arg Ala Leu Val Gln Ala Gln His Pro Asp
145 150 155 160
Trp Pro Val Thr Gln Val Glu Ala Val Ala Gln Asp Gln Phe Gln Gly
165 170 175
Ala Ala Arg Ala Trp Met Ala Gly Thr Leu Gln Leu Gly Arg Ala Leu
180 185 190
Arg Pro Arg Gly Leu Trp Gly Phe Tyr Gly Phe Pro Asp Cys Tyr Asn
195 200 205
Tyr Asp Phe Leu Ser Pro Asn Tyr Thr Gly Gln Cys Pro Ser Gly Ile
210 215 220
Arg Ala Gln Asn Asp Gln Leu Gly Trp Leu Trp Gly Gln Ser Arg Ala
225 230 235 240
Leu Tyr Pro Ser Ile Tyr Met Pro Ala Val Leu Glu Gly Thr Gly Lys
245 250 255
Ser Gln Met Tyr Val Gln His Arg Val Ala Glu Ala Phe Arg Val Ala
260 265 270
Val Ala Ala Gly Asp Pro Asn Leu Pro Val Leu Pro Tyr Val Gln Ile
275 280 285
Phe Tyr Asp Met Thr Asn His Phe Leu Pro Leu Asp Glu Leu Glu His
290 295 300
Ser Leu Gly Glu Ser Ala Ala Gln Gly Ala Ala Gly Val Val Leu Trp
305 310 315 320
Val Ser Trp Glu Asn Thr Arg Thr Lys Glu Ser Cys Gln Ala Ile Lys
325 330 335
Glu Tyr Met Asp Thr Thr Leu Gly Pro Phe Ile Leu Asn Val Thr Ser
340 345 350
Gly Ala Leu Leu Cys Ser Gln Ala Leu Cys Ser Ser His Gly Arg Cys
355 360 365
Val Arg Arg Pro Ser His Pro Lys Ala Leu Leu Ile Leu Asn Pro Ala
370 375 380
Ser Phe Ser Ile Gln Leu Thr Pro Asp Gly Gly Pro Leu Ser Leu Arg
385 390 395 400
Gly Ala Leu Ser Leu Glu Asp Gln Ala Gln Met Ala Val Glu Phe Lys
405 410 415
Cys Arg Cys Tyr Pro Gly Trp Gln Gly Pro Trp Cys Glu Gln Lys Ser
420 425 430
Met Trp
<210> 65
<211> 360
<212> PRT
<213> Vespa magnifica
<220>
<223> amino acid sequence of hyaluronidase (HYAL) originating from
Vespa magnifica with a N-terminal secretion signal
<400> 65
Met Gln Phe Ser Thr Val Ala Ser Val Ala Phe Val Ala Leu Ala Asn
1 5 10 15
Phe Val Ala Ala Asp Ser Cys Gly Ser Asn Cys Glu Lys Ser Glu Arg
20 25 30
Pro Lys Arg Val Phe Asn Ile Tyr Trp Asn Val Pro Thr Phe Met Cys
35 40 45
His Gln Tyr Gly Leu Tyr Phe Asp Glu Val Thr Asn Phe Asn Ile Lys
50 55 60
His Asn Ser Lys Asp Asn Phe Gln Gly Asp Lys Ile Ala Ile Phe Tyr
65 70 75 80
Asp Pro Gly Glu Phe Pro Ala Leu Leu Pro Leu Asn Tyr Gly Lys Tyr
85 90 95
Lys Ile Arg Asn Gly Gly Val Pro Gln Glu Gly Asn Ile Thr Ile His
100 105 110
Leu Gln Arg Phe Ile Glu Tyr Leu Asp Lys Thr Tyr Pro Asn Arg Asn
115 120 125
Phe Ser Gly Ile Gly Val Ile Asp Phe Glu Arg Trp Arg Pro Ile Phe
130 135 140
Arg Gln Asn Trp Gly Asn Met Lys Ile Tyr Lys Asn Phe Ser Ile Asp
145 150 155 160
Leu Val Arg Lys Glu His Pro Phe Trp Asn Lys Lys Met Ile Glu Leu
165 170 175
Glu Ala Ser Lys Arg Phe Glu Lys Tyr Ala Arg Leu Phe Met Glu Glu
180 185 190
Thr Leu Lys Leu Ala Lys Lys Thr Arg Lys Gln Ala Asp Trp Gly Tyr
195 200 205
Tyr Gly Tyr Pro Tyr Cys Phe Asn Met Ser Pro Thr Asn Phe Val Pro
210 215 220
Asp Cys Asp Val Thr Ala Arg Asp Glu Asn Asn Glu Met Ser Trp Leu
225 230 235 240
Phe Asn Asn Gln Asn Val Leu Leu Pro Ser Val Tyr Ile Arg Arg Glu
245 250 255
Leu Thr Pro Asp Gln Arg Ile Gly Leu Val Gln Gly Arg Val Lys Glu
260 265 270
Ala Val Arg Ile Ser Asn Lys Leu Lys His Ser Pro Lys Val Phe Ser
275 280 285
Tyr Trp Trp Tyr Val Tyr Gln Asp Glu Thr Asn Thr Phe Leu Thr Glu
290 295 300
Thr Asp Val Lys Lys Thr Phe Gln Glu Ile Val Ile Asn Gly Gly Asp
305 310 315 320
Gly Ile Ile Ile Trp Gly Ser Ser Ser Asp Val Asn Ser Leu Ser Lys
325 330 335
Cys Thr Arg Leu Arg Glu Tyr Leu Leu Thr Val Leu Gly Pro Ile Ala
340 345 350
Val Asn Val Thr Glu Ala Val Asn
355 360
<210> 66
<211> 468
<212> PRT
<213> Cupiennius salei
<220>
<223> amino acid sequence of hyaluronidase (HYAL) originating from
Cupiennius salei with a N-terminal secretion signal and a
C-terminal anchoring signal
<400> 66
Met Gln Phe Ser Thr Val Ala Ser Val Ala Phe Val Ala Leu Ala Asn
1 5 10 15
Phe Val Ala Ala Phe Lys Ile Tyr Trp Asn Val Pro Thr Phe Gln Cys
20 25 30
Thr His Asn Tyr Lys Ile Asp Tyr Val Lys Leu Leu Ser Thr Tyr Gly
35 40 45
Ile Gln Val Asn Asp Gly Gly Lys Phe Gln Gly Asn Gln Val Thr Ile
50 55 60
Phe Tyr Glu Thr Gln Leu Gly Leu Tyr Pro Arg Ile Leu Lys Ser Gly
65 70 75 80
Lys Met Glu Asn Gly Gly Ile Pro Gln Arg Gly Asn Phe Glu Lys His
85 90 95
Leu Glu Lys Ala Ser Thr Asp Leu Gln Lys Val Ile Pro Trp Lys Glu
100 105 110
Phe Ser Gly Leu Gly Val Ile Asp Trp Glu Ala Trp Arg Pro Thr Trp
115 120 125
Glu Phe Asn Trp Glu Pro Leu Arg Ile Tyr Gln Thr Glu Ser Ile Lys
130 135 140
Arg Ala Lys Glu Leu His Pro Thr Ala Asn Asp Ser Ala Val Lys Glu
145 150 155 160
Ile Ala Glu Arg Gln Trp Glu Asp Ser Ala Lys Leu Tyr Met Leu Glu
165 170 175
Thr Leu Arg Leu Ala Lys Lys Leu Arg Pro Gln Ala Pro Trp Cys Tyr
180 185 190
Tyr Leu Phe Pro Asp Cys Tyr Asn Tyr Val Gly Lys Lys Pro Lys Asp
195 200 205
Phe Gln Cys Ser Ala Ser Ile Arg Lys Gly Asn Asp Lys Leu Ser Trp
210 215 220
Leu Trp Lys Asp Ser Thr Ala Leu Cys Pro Ser Ile Tyr Val Tyr Glu
225 230 235 240
Ser Gln Leu Asp Arg Tyr Ser Phe Glu Gln Arg Thr Trp Arg Asp Asn
245 250 255
Glu Lys Leu Arg Glu Ala Leu Arg Val Ala Thr Arg Thr Ser Lys Ile
260 265 270
Tyr Pro Tyr Val Asn Tyr Phe Asp Lys Glu Leu Ile Pro Glu Gln Glu
275 280 285
Val Trp Arg Met Leu Ala Gln Ala Ala Ala Val Gly Gly Ser Gly Ala
290 295 300
Val Ile Trp Gly Ser Ser Ala Ala Val Ala Ser Glu Glu Leu Cys Lys
305 310 315 320
Ser Leu Lys Gln Tyr Ile Ile Glu Thr Leu Gly Pro Ala Ala Glu Lys
325 330 335
Val Ala Trp Arg Ser Asp Leu Cys Ser Lys Glu Ile Cys Asn Asn Gln
340 345 350
Gly Arg Cys Thr Phe Pro Asp Asp Asp Tyr Ala Asn Ala Trp Lys Leu
355 360 365
Phe Thr Asp Asp Thr Val Lys Phe Tyr Ala Gly Asn Ile Thr Cys Arg
370 375 380
Cys Ser Glu Asn Tyr Ser Gly Arg Phe Cys Glu Lys Lys Asn Gly Ser
385 390 395 400
Ala Ile Ser Gln Ile Thr Asp Gly Gln Ile Gln Ala Thr Thr Thr Ala
405 410 415
Thr Thr Glu Ala Thr Thr Thr Ala Ala Pro Ser Ser Thr Val Glu Thr
420 425 430
Val Ser Pro Ser Ser Thr Glu Thr Ile Ser Gln Gln Thr Glu Asn Gly
435 440 445
Ala Ala Lys Ala Ala Val Gly Met Gly Ala Gly Ala Leu Ala Ala Ala
450 455 460
Ala Met Leu Leu
465
<210> 67
<211> 475
<212> PRT
<213> Tityus serrulatus
<220>
<223> amino acid sequence of hyaluronidase (HYAL) originating from
Tityus serrulatus with a N-terminal secretion signal and a
C-terminal anchoring signal
<400> 67
Met Gln Phe Ser Thr Val Ala Ser Val Ala Phe Val Ala Leu Ala Asn
1 5 10 15
Phe Val Ala Ala Ala Asp Phe Lys Val Tyr Trp Glu Val Pro Ser Phe
20 25 30
Leu Cys Ser Lys Arg Phe Lys Ile Asn Val Thr Glu Val Leu Thr Ser
35 40 45
His Glu Ile Leu Val Asn Gln Gly Glu Ser Phe Asn Gly Asp Lys Ile
50 55 60
Val Ile Phe Tyr Glu Asn Gln Leu Gly Lys Tyr Pro His Ile Asp Ser
65 70 75 80
Asn Asn Val Glu Ile Asn Gly Gly Ile Leu Gln Val Ala Asp Leu Ala
85 90 95
Lys His Leu Lys Val Ala Lys Asp Asn Ile Thr Lys Phe Val Pro Asn
100 105 110
Pro Asn Phe Asn Gly Val Gly Val Ile Asp Trp Glu Ala Trp Arg Pro
115 120 125
Ser Trp Glu Phe Asn Trp Gly Lys Leu Lys Val Tyr Lys Glu Lys Ser
130 135 140
Ile Asp Leu Val Lys Ser Lys His Pro Glu Trp Pro Ser Asp Arg Val
145 150 155 160
Glu Lys Val Ala Lys Glu Glu Trp Glu Glu Ser Ala Lys Glu Trp Met
165 170 175
Val Lys Thr Leu Lys Leu Ala Gln Glu Met Arg Pro Asn Ala Val Trp
180 185 190
Cys Tyr Tyr Leu Phe Pro Asp Cys Tyr Asn Tyr Phe Gly Lys Asp Gln
195 200 205
Pro Ser Gln Phe Ser Cys Ser Ser Arg Ile Gln Lys Glu Asn Ser Arg
210 215 220
Leu Ser Trp Leu Trp Asn Gln Ser Thr Ala Ile Cys Leu Ser Ile Tyr
225 230 235 240
Ile Gln Glu Ser His Val Thr Lys Tyr Asn Met Ser Gln Arg Thr Trp
245 250 255
Trp Ile Asp Ala Arg Leu Arg Glu Ala Ile Arg Val Ser Glu His Arg
260 265 270
Pro Asn Ile Pro Ile Tyr Pro Tyr Ile Asn Tyr Ile Leu Pro Gly Thr
275 280 285
Asn Gln Thr Val Pro Ala Met Asp Phe Lys Arg Thr Leu Gly Gln Ile
290 295 300
Ala Ser Leu Gly Leu Asp Gly Ala Leu Leu Trp Gly Ser Ser Tyr His
305 310 315 320
Val Leu Thr Glu Ser Gln Cys Lys Ile Thr Ser Asp Tyr Val Lys Ser
325 330 335
Val Ile Ala Pro Thr Val Ala Thr Val Val Leu Asn Thr Asn Arg Cys
340 345 350
Ser Gln Ile Ile Cys Lys Gly Arg Gly Asn Cys Val Trp Pro Glu Glu
355 360 365
Pro Phe Ser Ser Trp Lys Tyr Leu Val Asp Pro Lys Met Pro Val Phe
370 375 380
Lys Pro Thr Asn Ile His Cys Lys Cys Lys Gly Tyr Leu Gly Arg Tyr
385 390 395 400
Cys Glu Ile Pro Lys Gly Ser Ala Ile Ser Gln Ile Thr Asp Gly Gln
405 410 415
Ile Gln Ala Thr Thr Thr Ala Thr Thr Glu Ala Thr Thr Thr Ala Ala
420 425 430
Pro Ser Ser Thr Val Glu Thr Val Ser Pro Ser Ser Thr Glu Thr Ile
435 440 445
Ser Gln Gln Thr Glu Asn Gly Ala Ala Lys Ala Ala Val Gly Met Gly
450 455 460
Ala Gly Ala Leu Ala Ala Ala Ala Met Leu Leu
465 470 475
<210> 68
<211> 448
<212> PRT
<213> Bos taurus
<220>
<223> amino acid sequence of hyaluronidase (HYAL) originating from Bos
taurus with a N-terminal secretion signal and a C-terminal
anchoring signal
<400> 68
Met Gln Phe Ser Thr Val Ala Ser Val Ala Phe Val Ala Leu Ala Asn
1 5 10 15
Phe Val Ala Ala Leu Leu Leu Gly Phe Val Gln Ser Thr Pro Asp Asn
20 25 30
Asn Lys Thr Val Arg Glu Phe Asn Val Tyr Trp Asn Val Pro Thr Phe
35 40 45
Met Cys His Lys Tyr Gly Leu Arg Phe Glu Glu Val Ser Glu Lys Tyr
50 55 60
Gly Ile Leu Gln Asn Trp Met Asp Lys Phe Arg Gly Glu Glu Ile Ala
65 70 75 80
Ile Leu Tyr Asp Pro Gly Met Phe Pro Ala Leu Leu Lys Asp Pro Asn
85 90 95
Gly Asn Val Val Ala Arg Asn Gly Gly Val Pro Gln Leu Gly Asn Leu
100 105 110
Thr Lys His Leu Gln Val Phe Arg Asp His Leu Ile Asn Gln Ile Pro
115 120 125
Asp Lys Ser Phe Pro Gly Val Gly Val Ile Asp Phe Glu Ser Trp Arg
130 135 140
Pro Ile Phe Arg Gln Asn Trp Ala Ser Leu Gln Pro Tyr Lys Lys Leu
145 150 155 160
Ser Val Glu Val Val Arg Arg Glu His Pro Phe Trp Asp Asp Gln Arg
165 170 175
Val Glu Gln Glu Ala Lys Arg Arg Phe Glu Lys Tyr Gly Gln Leu Phe
180 185 190
Met Glu Glu Thr Leu Lys Ala Ala Lys Arg Met Arg Pro Ala Ala Asn
195 200 205
Trp Gly Tyr Tyr Ala Tyr Pro Tyr Cys Tyr Asn Leu Thr Pro Asn Gln
210 215 220
Pro Ser Ala Gln Cys Glu Ala Thr Thr Met Gln Glu Asn Asp Lys Met
225 230 235 240
Ser Trp Leu Phe Glu Ser Glu Asp Val Leu Leu Pro Ser Val Tyr Leu
245 250 255
Arg Trp Asn Leu Thr Ser Gly Glu Arg Val Gly Leu Val Gly Gly Arg
260 265 270
Val Lys Glu Ala Leu Arg Ile Ala Arg Gln Met Thr Thr Ser Arg Lys
275 280 285
Lys Val Leu Pro Tyr Tyr Trp Tyr Lys Tyr Gln Asp Arg Arg Asp Thr
290 295 300
Asp Leu Ser Arg Ala Asp Leu Glu Ala Thr Leu Arg Lys Ile Thr Asp
305 310 315 320
Leu Gly Ala Asp Gly Phe Ile Ile Trp Gly Ser Ser Asp Asp Ile Asn
325 330 335
Thr Lys Ala Lys Cys Leu Gln Phe Arg Glu Tyr Leu Asn Asn Glu Leu
340 345 350
Gly Pro Ala Val Lys Arg Ile Ala Leu Asn Asn Asn Ala Asn Asp Arg
355 360 365
Leu Thr Val Asp Val Ser Val Asp Gln Val Gly Ser Ala Ile Ser Gln
370 375 380
Ile Thr Asp Gly Gln Ile Gln Ala Thr Thr Thr Ala Thr Thr Glu Ala
385 390 395 400
Thr Thr Thr Ala Ala Pro Ser Ser Thr Val Glu Thr Val Ser Pro Ser
405 410 415
Ser Thr Glu Thr Ile Ser Gln Gln Thr Glu Asn Gly Ala Ala Lys Ala
420 425 430
Ala Val Gly Met Gly Ala Gly Ala Leu Ala Ala Ala Ala Met Leu Leu
435 440 445
<210> 69
<211> 448
<212> PRT
<213> Apis mellifera
<220>
<223> amino acid sequence of hyaluronidase (HYAL) originating from Apis
mellifera with a N-terminal secretion signal and a C-terminal
anchoring signal
<400> 69
Met Gln Phe Ser Thr Val Ala Ser Val Ala Phe Val Ala Leu Ala Asn
1 5 10 15
Phe Val Ala Ala Leu Leu Leu Gly Phe Val Gln Ser Thr Pro Asp Asn
20 25 30
Asn Lys Thr Val Arg Glu Phe Asn Val Tyr Trp Asn Val Pro Thr Phe
35 40 45
Met Cys His Lys Tyr Gly Leu Arg Phe Glu Glu Val Ser Glu Lys Tyr
50 55 60
Gly Ile Leu Gln Asn Trp Met Asp Lys Phe Arg Gly Glu Glu Ile Ala
65 70 75 80
Ile Leu Tyr Asp Pro Gly Met Phe Pro Ala Leu Leu Lys Asp Pro Asn
85 90 95
Gly Asn Val Val Ala Arg Asn Gly Gly Val Pro Gln Leu Gly Asn Leu
100 105 110
Thr Lys His Leu Gln Val Phe Arg Asp His Leu Ile Asn Gln Ile Pro
115 120 125
Asp Lys Ser Phe Pro Gly Val Gly Val Ile Asp Phe Glu Ser Trp Arg
130 135 140
Pro Ile Phe Arg Gln Asn Trp Ala Ser Leu Gln Pro Tyr Lys Lys Leu
145 150 155 160
Ser Val Glu Val Val Arg Arg Glu His Pro Phe Trp Asp Asp Gln Arg
165 170 175
Val Glu Gln Glu Ala Lys Arg Arg Phe Glu Lys Tyr Gly Gln Leu Phe
180 185 190
Met Glu Glu Thr Leu Lys Ala Ala Lys Arg Met Arg Pro Ala Ala Asn
195 200 205
Trp Gly Tyr Tyr Ala Tyr Pro Tyr Cys Tyr Asn Leu Thr Pro Asn Gln
210 215 220
Pro Ser Ala Gln Cys Glu Ala Thr Thr Met Gln Glu Asn Asp Lys Met
225 230 235 240
Ser Trp Leu Phe Glu Ser Glu Asp Val Leu Leu Pro Ser Val Tyr Leu
245 250 255
Arg Trp Asn Leu Thr Ser Gly Glu Arg Val Gly Leu Val Gly Gly Arg
260 265 270
Val Lys Glu Ala Leu Arg Ile Ala Arg Gln Met Thr Thr Ser Arg Lys
275 280 285
Lys Val Leu Pro Tyr Tyr Trp Tyr Lys Tyr Gln Asp Arg Arg Asp Thr
290 295 300
Asp Leu Ser Arg Ala Asp Leu Glu Ala Thr Leu Arg Lys Ile Thr Asp
305 310 315 320
Leu Gly Ala Asp Gly Phe Ile Ile Trp Gly Ser Ser Asp Asp Ile Asn
325 330 335
Thr Lys Ala Lys Cys Leu Gln Phe Arg Glu Tyr Leu Asn Asn Glu Leu
340 345 350
Gly Pro Ala Val Lys Arg Ile Ala Leu Asn Asn Asn Ala Asn Asp Arg
355 360 365
Leu Thr Val Asp Val Ser Val Asp Gln Val Gly Ser Ala Ile Ser Gln
370 375 380
Ile Thr Asp Gly Gln Ile Gln Ala Thr Thr Thr Ala Thr Thr Glu Ala
385 390 395 400
Thr Thr Thr Ala Ala Pro Ser Ser Thr Val Glu Thr Val Ser Pro Ser
405 410 415
Ser Thr Glu Thr Ile Ser Gln Gln Thr Glu Asn Gly Ala Ala Lys Ala
420 425 430
Ala Val Gly Met Gly Ala Gly Ala Leu Ala Ala Ala Ala Met Leu Leu
435 440 445
<210> 70
<211> 504
<212> PRT
<213> Macaca mulatta
<220>
<223> amino acid sequence of hyaluronidase (HYAL) originating from
Macaca mulatta with a N-terminal secretion signal and a
C-terminal anchoring signal
<400> 70
Met Gln Phe Ser Thr Val Ala Ser Val Ala Phe Val Ala Leu Ala Asn
1 5 10 15
Phe Val Ala Ala Ser Arg Gly Pro Leu Leu Pro Asn Arg Pro Phe Ala
20 25 30
Thr Val Trp Asn Ala Asn Thr Gln Trp Cys Leu Glu Arg His Ser Val
35 40 45
Asp Val Asp Val Ser Ile Phe Asp Val Val Ala Asn Pro Gly Gln Thr
50 55 60
Phe Arg Gly Pro Asp Met Thr Ile Phe Tyr Ser Ser Gln Leu Gly Thr
65 70 75 80
Tyr Pro Tyr Tyr Thr Pro Thr Gly Glu Pro Val Phe Gly Gly Leu Pro
85 90 95
Gln Asn Ala Ser Leu Ile Ala His Leu Ala Arg Thr Phe Gln Asp Ile
100 105 110
Leu Ala Ala Ile Pro Ala Pro Asp Phe Ser Gly Leu Ala Val Ile Asp
115 120 125
Trp Glu Ala Trp Arg Pro Arg Trp Ala Phe Asn Trp Asp Thr Lys Asp
130 135 140
Ile Tyr Arg Gln Arg Ser Arg Ala Leu Val Gln Ala Gln His Pro Asp
145 150 155 160
Trp Pro Val Thr Gln Val Glu Ala Val Ala Gln Asp Gln Phe Gln Gly
165 170 175
Ala Ala Arg Ala Trp Met Ala Gly Thr Leu Gln Leu Gly Arg Ala Leu
180 185 190
Arg Pro Arg Gly Leu Trp Gly Phe Tyr Gly Phe Pro Asp Cys Tyr Asn
195 200 205
Tyr Asp Phe Leu Ser Pro Asn Tyr Thr Gly Gln Cys Pro Ser Gly Ile
210 215 220
Arg Ala Gln Asn Asp Gln Leu Gly Trp Leu Trp Gly Gln Ser Arg Ala
225 230 235 240
Leu Tyr Pro Ser Ile Tyr Met Pro Ala Val Leu Glu Gly Thr Gly Lys
245 250 255
Ser Gln Met Tyr Val Gln His Arg Val Ala Glu Ala Phe Arg Val Ala
260 265 270
Val Ala Ala Gly Asp Pro Asn Leu Pro Val Leu Pro Tyr Val Gln Ile
275 280 285
Phe Tyr Asp Met Thr Asn His Phe Leu Pro Leu Asp Glu Leu Glu His
290 295 300
Ser Leu Gly Glu Ser Ala Ala Gln Gly Ala Ala Gly Val Val Leu Trp
305 310 315 320
Val Ser Trp Glu Asn Thr Arg Thr Lys Glu Ser Cys Gln Ala Ile Lys
325 330 335
Glu Tyr Met Asp Thr Thr Leu Gly Pro Phe Ile Leu Asn Val Thr Ser
340 345 350
Gly Ala Leu Leu Cys Ser Gln Ala Leu Cys Ser Ser His Gly Arg Cys
355 360 365
Val Arg Arg Pro Ser His Pro Lys Ala Leu Leu Ile Leu Asn Pro Ala
370 375 380
Ser Phe Ser Ile Gln Leu Thr Pro Asp Gly Gly Pro Leu Ser Leu Arg
385 390 395 400
Gly Ala Leu Ser Leu Glu Asp Gln Ala Gln Met Ala Val Glu Phe Lys
405 410 415
Cys Arg Cys Tyr Pro Gly Trp Gln Gly Pro Trp Cys Glu Gln Lys Ser
420 425 430
Met Trp Gly Ser Ala Ile Ser Gln Ile Thr Asp Gly Gln Ile Gln Ala
435 440 445
Thr Thr Thr Ala Thr Thr Glu Ala Thr Thr Thr Ala Ala Pro Ser Ser
450 455 460
Thr Val Glu Thr Val Ser Pro Ser Ser Thr Glu Thr Ile Ser Gln Gln
465 470 475 480
Thr Glu Asn Gly Ala Ala Lys Ala Ala Val Gly Met Gly Ala Gly Ala
485 490 495
Leu Ala Ala Ala Ala Met Leu Leu
500
<210> 71
<211> 360
<212> PRT
<213> Vespa magnifica
<220>
<223> amino acid sequence of hyaluronidase (HYAL) originating from
Vespa magnifica with a N-terminal secretion signal and a
C-terminal anchoring signal
<400> 71
Asp Asn Phe Gln Gly Asp Lys Ile Ala Ile Phe Tyr Asp Pro Gly Glu
1 5 10 15
Phe Pro Ala Leu Leu Pro Leu Asn Tyr Gly Lys Tyr Lys Ile Arg Asn
20 25 30
Gly Gly Val Pro Gln Glu Gly Asn Ile Thr Ile His Leu Gln Arg Phe
35 40 45
Ile Glu Tyr Leu Asp Lys Thr Tyr Pro Asn Arg Asn Phe Ser Gly Ile
50 55 60
Gly Val Ile Asp Phe Glu Arg Trp Arg Pro Ile Phe Arg Gln Asn Trp
65 70 75 80
Gly Asn Met Lys Ile Tyr Lys Asn Phe Ser Ile Asp Leu Val Arg Lys
85 90 95
Glu His Pro Phe Trp Asn Lys Lys Met Ile Glu Leu Glu Ala Ser Lys
100 105 110
Arg Phe Glu Lys Tyr Ala Arg Leu Phe Met Glu Glu Thr Leu Lys Leu
115 120 125
Ala Lys Lys Thr Arg Lys Gln Ala Asp Trp Gly Tyr Tyr Gly Tyr Pro
130 135 140
Tyr Cys Phe Asn Met Ser Pro Thr Asn Phe Val Pro Asp Cys Asp Val
145 150 155 160
Thr Ala Arg Asp Glu Asn Asn Glu Met Ser Trp Leu Phe Asn Asn Gln
165 170 175
Asn Val Leu Leu Pro Ser Val Tyr Ile Arg Arg Glu Leu Thr Pro Asp
180 185 190
Gln Arg Ile Gly Leu Val Gln Gly Arg Val Lys Glu Ala Val Arg Ile
195 200 205
Ser Asn Lys Leu Lys His Ser Pro Lys Val Phe Ser Tyr Trp Trp Tyr
210 215 220
Val Tyr Gln Asp Glu Thr Asn Thr Phe Leu Thr Glu Thr Asp Val Lys
225 230 235 240
Lys Thr Phe Gln Glu Ile Val Ile Asn Gly Gly Asp Gly Ile Ile Ile
245 250 255
Trp Gly Ser Ser Ser Asp Val Asn Ser Leu Ser Lys Cys Thr Arg Leu
260 265 270
Arg Glu Tyr Leu Leu Thr Val Leu Gly Pro Ile Ala Val Asn Val Thr
275 280 285
Glu Ala Val Asn Ala Ile Ser Gln Ile Thr Asp Gly Gln Ile Gln Ala
290 295 300
Thr Thr Thr Ala Thr Thr Glu Ala Thr Thr Thr Ala Ala Pro Ser Ser
305 310 315 320
Thr Val Glu Thr Val Ser Pro Ser Ser Thr Glu Thr Ile Ser Gln Gln
325 330 335
Thr Glu Asn Gly Ala Ala Lys Ala Ala Val Gly Met Gly Ala Gly Ala
340 345 350
Leu Ala Ala Ala Ala Met Leu Leu
355 360
<210> 72
<211> 2154
<212> DNA
<213> Saccharomyces cerevisiae
<220>
<223> nucleic acid sequence of glutamine-fructose-6-phosphate
amidotransferase (GFA1) originating from Saccharomyces cerevisiae
<400> 72
atgtgtggta tctttggtta ctgcaattat ctagtggaaa gatccagagg agaaattatc 60
gacaccttag tggatggttt acaaagatta gaatatagag gctatgattc caccggtatt 120
gctatcgatg gtgacgaagc tgattctact ttcatctata agcaaatcgg taaagtgagt 180
gctttgaaag aggagattac taagcaaaat ccgaacagag acgttacttt tgtctctcat 240
tgtggtattg cgcatactag atgggctact cacggtcgac cagaacaagt taactgtcac 300
cctcaaagat ctgacccaga agaccaattt gtggtcgttc ataatggtat catcacaaat 360
tttagagaac tgaagactct tttaattaac aaaggttata aattcgaaag tgataccgat 420
accgagtgta ttgctaaact atatttgcat ttatacaata caaatttaca aaatgggcat 480
gacttagatt tccacgaatt aaccaagcta gttcttttag aactagaagg ttcatacggg 540
ttattatgta aatcttgtca ctatcctaat gaggttatcg ccactagaaa agggtcccct 600
ttactgattg gtgtcaaatc tgaaaaaaaa ctaaaagtcg acttcgtgga tgtggaattt 660
cccgaagaaa acgctggtca accggaaatt ccattgaaat ctaacaacaa atcatttggc 720
ttgggcccaa agaaagctcg tgaatttgaa gctggttccc aaaatgccaa tttactacca 780
attgccgcca atgaatttaa cttgagacat tctcaatcca gggctttcct atcagaagat 840
ggatctccaa caccggtgga attttttgtt tcttcggatg cggcatctgt tgttaaacat 900
accaagaagg tgctattttt agaagatgac gatttggctc atatttacga tggtgagtta 960
catattcata gatctagaag agaagtaggc gcatcaatga caaggtccat tcaaacttta 1020
gagatggagt tagctcagat catgaagggc ccttacgacc attttatgca aaaggaaatc 1080
tatgagcaac cagaatctac tttcaatact atgagaggta gaatcgacta tgaaaataat 1140
aaagtgatat tgggtggttt aaaggcatgg ttaccagttg tcagaagagc acggagactg 1200
atcatgatcg catgcggtac ttcttatcat tcatgtttgg ctactcgtgc tatcttcgaa 1260
gaattatcag atatcccagt tagtgtggaa ttagcgtctg actttctgga cagaaaatgc 1320
cctgtcttca gagacgatgt atgcgtgttt gtttcacaaa gtggtgaaac tgcggatacc 1380
atgctggctc taaattattg tttagaaaga ggagccttaa ctgtcggaat tgttaacagt 1440
gttggttctt ctatctctcg tgtcacccac tgtggtgttc atattaacgc tggtcctgaa 1500
attggtgttg cctctacaaa agcttatact tcccagtata ttgccttagt gatgtttgct 1560
ctatcgctgt cagatgaccg tgtatcgaaa atagacagaa gaattgaaat cattcaaggc 1620
ttgaagttaa tcccgggcca aattaagcag gtattaaagc tggaaccaag aataaaaaag 1680
ctctgtgcga ctgaattaaa ggatcaaaaa tctctattgt tattgggtag aggttaccaa 1740
tttgctgctg ctctggaagg tgctttgaag atcaaagaaa tttcttatat gcattctgaa 1800
ggtgttttgg caggtgagtt gaagcacggt gtcttggcct tggtggacga aaacttgcca 1860
atcattgctt ttggtaccag agactctcta ttccctaaag tagtttcctc tattgagcaa 1920
gttactgtaa gaaagggcca tccaattatt atttgtaacg aaaatgatga agtgtgggcg 1980
caaaaatcta aatcaatcga cctgcaaacc ttagaagttc cacaaactgt tgattgttta 2040
caaggtctaa ttaatattat tccattacaa ctaatgtcat attggttggc tgttaataaa 2100
gggattgatg ttgattttcc aagaaacttg gctaaatctg ttaccgtcga ataa 2154
<210> 73
<211> 1788
<212> DNA
<213> Chlorella virus
<220>
<223> reencoded nucleic acid sequence of glutamine-fructose-6-phosphate
amidotransferase (GFA1) originating from Chlorella virus 1
(PBCV-1)
<400> 73
atgtgcggga tcttcggtgc tgtgtcgaac aataatagca tagaagtttc catcaagggt 60
atacagaagc tagagtaccg cgggtacgat tcgtgtggaa tagcctatac agacggaggc 120
gccattgaac ggatcaggtc aatagatggg atcgacgact taaggaagaa aacaataaca 180
gagtcttccc cggtagctat cgctcattca aggtggagta ccactgggat tccaagtgtt 240
gtgaacgccc acccgcacat ctctcggggc acgtctggat gcgagtcgcg cattgcagtc 300
gtacacaatg gcattattga aaattaccag cagatccgca agtacttgat aaatcttggg 360
tatactttcg attcacagac cgacacggaa gtcattgctc atctaataga ctcgcagtat 420
aacgggaaca tcctgcacac cgtccaaatg gcagttaagc acctcaaagg aagctacgcc 480
atagcagtca tgtgccataa ggagtccggg aagatcgtgg tggcaaaaca gaagagtccg 540
ttggtattgg gtataggaag cgacggagct tattatatcg catcggacgt attggctctt 600
cccactaaca aagtggtcta cataagtgac ggattctctg ctgagttaag tcctggatcg 660
atgactatct atgatctgga tggcaataag gtagaatacg aggtggaaga cgttgaaatg 720
gagcagacgt cgatgtcttt agataacttt gatcactaca tgatcaaaga gatcaatgaa 780
cagccgatat caattctcaa tactattaag aacaaaggat tctatgcaga gatatttggt 840
gatctagcac atgaaatatt tcagaagatc gacaatatat tgattctagc ctgcggaact 900
tcgtatcatg caggtctcgt cgggaagcaa tggatagaga ccatctcacg catcccggtg 960
gatgttcata ttgcaagcga gtatgagccg acaattccac gagccaatac acttgtgata 1020
acgattagtc aaagcggcga gactgcggat acaatcgcag cccttcaacg agcgcaaaac 1080
gcaggaatga tatacacttt gtgtatctgc aacagcccca agtcaactct agtgcgcgag 1140
tcgataatga aatacataac caaatgcggt tcagaagttt ctgttgccag tactaaagca 1200
tttacgtcgc aacttgtggt gttgtatatg cttgcgaacg ttcttgcgaa caaaactgat 1260
gatctgctag gggatcttcc tcaagctatc gagagagtaa tctgtcttac taatgacgaa 1320
atgaagcgtt gggcggatga aatttgtact gccaaaagtg ccatcttctt agggagagga 1380
ctgaacgcac ctgtagcatt tgagggcgcg ctaaagttga aggaaatctc atatatccat 1440
gccgagggtt tcctcggtgg agagttgaag catgggccgc tggctttgtt ggacgataag 1500
atccctgtaa tcgtgactgt tgctgaccac gcttatttgg atcacattaa ggctaacatc 1560
gacgaggtat tggcacgaaa cgttaccgta tacgcgatcg tcgatcagta tgttaatatt 1620
gaaccacagg agcgactgca tgtagtaaaa gtgccgtttg tgagtaaaga gttttctccc 1680
atcatccaca caattccgat gcaattgtta tcgtattatg tcgcgatcaa gctgggcaag 1740
aacgttgaca agccacgtaa cctggcgaaa agtgttacaa cattctaa 1788
<210> 74
<211> 1788
<212> DNA
<213> Chlorella virus
<220>
<223> reencoded nucleic acid sequence of glutamine-fructose-6-phosphate
amidotransferase (GFA1) originating from Chlorella virus 1
(PBCV-1)
<400> 74
atgtgtggca tctttggagc agtgtcaaac aacaactcta tcgaggtgtc aatcaagggt 60
attcagaagc tagaatatcg tgggtatgat tcgtgcggta ttgcgtatac agatgggggt 120
gcgattgagc gtatacgttc tattgacggc attgacgatc tgcgtaagaa aacaatcaca 180
gaatcatcac cagtggccat tgctcactcg cggtggagca ccactggaat tccatcagtg 240
gtgaacgcac atcctcatat ttctcgcgga accagtgggt gtgagtctcg tatcgcggta 300
gtccacaacg gtatcattga aaactatcag cagatccgaa aatatctcat caatcttggt 360
tatacgtttg atagtcaaac ggacacagag gtcattgcgc atttgattga ttctcagtac 420
aatgggaata tcttgcacac cgtccaaatg gctgtcaagc acctgaaggg ctcttatgcc 480
attgcagtta tgtgtcataa agagtctggt aaaatagtcg tggcgaaaca gaagtcaccc 540
ctcgtacttg gaatcggctc agatggtgct tactacatcg cttcggacgt gctggcgctg 600
ccgacaaata aagttgttta tatttcagac ggtttctccg cagaactatc tccagggagt 660
atgaccattt acgatcttga tggaaataaa gtagaatatg aagtagagga cgttgaaatg 720
gaacaaacta gtatgtctct cgataacttt gatcattaca tgattaagga aattaatgag 780
caaccaatca gtattctaaa cactataaaa aataaagggt tctatgcaga aatattcggt 840
gatttggctc atgaaatctt ccaaaaaata gacaacatcc tgatactggc ttgtggtaca 900
agttatcacg ccggtcttgt aggaaaacag tggatagaga ccatctctag aatccccgtg 960
gatgttcaca tcgcgagtga atacgaacct actattccga gagcgaacac attggtaatc 1020
actatttcac agtcgggtga aactgcggac acgatagcgg ctttgcaacg ggcccaaaac 1080
gccgggatga tttatacatt gtgtatttgc aattcaccaa agagcactct tgttcgtgag 1140
agcattatga agtacatcac gaaatgtggt tctgaggtgt cagtggcatc aacgaaggcg 1200
tttacttctc agctcgtagt actgtacatg ctggcaaacg tattggcaaa taaaaccgat 1260
gatttgctgg gagacctccc acaggcaata gaacgggtaa tttgtttgac aaatgacgaa 1320
atgaaacgat gggccgacga aatttgcact gcgaaatccg cgatcttcct gggaagagga 1380
ctaaacgcac cagttgcctt tgagggagcg ttgaagctca aagaaatctc ttacattcat 1440
gcagagggct tcctgggagg tgagttgaaa cacggccccc tcgcactcct tgatgacaag 1500
attcctgtta tcgtaaccgt agcagatcat gcttatttgg accatatcaa agcaaatatc 1560
gacgaagtgc ttgcgaggaa cgttacggta tacgccatag tagaccagta tgtgaacatc 1620
gagccccagg aacgccttca cgtcgtcaag gttccgtttg tatccaaaga attttctccg 1680
ataattcaca ctatcccgat gcaactgctt tcgtattacg tggcaattaa gcttggaaag 1740
aacgttgaca aaccaaggaa tcttgcaaaa tccgtgacta ccttttaa 1788
<210> 75
<211> 717
<212> PRT
<213> Saccharomyces cerevisiae
<220>
<223> amino acid sequence of glutamine-fructose-6-phosphate
amidotransferase (GFA1) originating from Saccharomyces cerevisiae
<400> 75
Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg
1 5 10 15
Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp
35 40 45
Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu
50 55 60
Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His
65 70 75 80
Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu Gln
85 90 95
Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val
100 105 110
Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu
115 120 125
Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile
130 135 140
Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Gln Asn Gly His
145 150 155 160
Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu
195 200 205
Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn
210 215 220
Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly
225 230 235 240
Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala
245 250 255
Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln
260 265 270
Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe
275 280 285
Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val
290 295 300
Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu
305 310 315 320
His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser
325 330 335
Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr
340 345 350
Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe
355 360 365
Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu
370 375 380
Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu
385 390 395 400
Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg
405 410 415
Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala
420 425 430
Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys
435 440 445
Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu
450 455 460
Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser
465 470 475 480
Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn
485 490 495
Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln
500 505 510
Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val
515 520 525
Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile
530 535 540
Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys
545 550 555 560
Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly
565 570 575
Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys
580 585 590
Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys
595 600 605
His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe
610 615 620
Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln
625 630 635 640
Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp
645 650 655
Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu
660 665 670
Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro
675 680 685
Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val
690 695 700
Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu
705 710 715
<210> 76
<211> 595
<212> PRT
<213> Chlorella virus
<220>
<223> amino acid sequence of glutamine-fructose-6-phosphate
amidotransferase (GFA1) originating from Chlorella virus 1
(PBCV-1)
<400> 76
Met Cys Gly Ile Phe Gly Ala Val Ser Asn Asn Asn Ser Ile Glu Val
1 5 10 15
Ser Ile Lys Gly Ile Gln Lys Leu Glu Tyr Arg Gly Tyr Asp Ser Cys
20 25 30
Gly Ile Ala Tyr Thr Asp Gly Gly Ala Ile Glu Arg Ile Arg Ser Ile
35 40 45
Asp Gly Ile Asp Asp Leu Arg Lys Lys Thr Ile Thr Glu Ser Ser Pro
50 55 60
Val Ala Ile Ala His Ser Arg Trp Ser Thr Thr Gly Ile Pro Ser Val
65 70 75 80
Val Asn Ala His Pro His Ile Ser Arg Gly Thr Ser Gly Cys Glu Ser
85 90 95
Arg Ile Ala Val Val His Asn Gly Ile Ile Glu Asn Tyr Gln Gln Ile
100 105 110
Arg Lys Tyr Leu Ile Asn Leu Gly Tyr Thr Phe Asp Ser Gln Thr Asp
115 120 125
Thr Glu Val Ile Ala His Leu Ile Asp Ser Gln Tyr Asn Gly Asn Ile
130 135 140
Leu His Thr Val Gln Met Ala Val Lys His Leu Lys Gly Ser Tyr Ala
145 150 155 160
Ile Ala Val Met Cys His Lys Glu Ser Gly Lys Ile Val Val Ala Lys
165 170 175
Gln Lys Ser Pro Leu Val Leu Gly Ile Gly Ser Asp Gly Ala Tyr Tyr
180 185 190
Ile Ala Ser Asp Val Leu Ala Leu Pro Thr Asn Lys Val Val Tyr Ile
195 200 205
Ser Asp Gly Phe Ser Ala Glu Leu Ser Pro Gly Ser Met Thr Ile Tyr
210 215 220
Asp Leu Asp Gly Asn Lys Val Glu Tyr Glu Val Glu Asp Val Glu Met
225 230 235 240
Glu Gln Thr Ser Met Ser Leu Asp Asn Phe Asp His Tyr Met Ile Lys
245 250 255
Glu Ile Asn Glu Gln Pro Ile Ser Ile Leu Asn Thr Ile Lys Asn Lys
260 265 270
Gly Phe Tyr Ala Glu Ile Phe Gly Asp Leu Ala His Glu Ile Phe Gln
275 280 285
Lys Ile Asp Asn Ile Leu Ile Leu Ala Cys Gly Thr Ser Tyr His Ala
290 295 300
Gly Leu Val Gly Lys Gln Trp Ile Glu Thr Ile Ser Arg Ile Pro Val
305 310 315 320
Asp Val His Ile Ala Ser Glu Tyr Glu Pro Thr Ile Pro Arg Ala Asn
325 330 335
Thr Leu Val Ile Thr Ile Ser Gln Ser Gly Glu Thr Ala Asp Thr Ile
340 345 350
Ala Ala Leu Gln Arg Ala Gln Asn Ala Gly Met Ile Tyr Thr Leu Cys
355 360 365
Ile Cys Asn Ser Pro Lys Ser Thr Leu Val Arg Glu Ser Ile Met Lys
370 375 380
Tyr Ile Thr Lys Cys Gly Ser Glu Val Ser Val Ala Ser Thr Lys Ala
385 390 395 400
Phe Thr Ser Gln Leu Val Val Leu Tyr Met Leu Ala Asn Val Leu Ala
405 410 415
Asn Lys Thr Asp Asp Leu Leu Gly Asp Leu Pro Gln Ala Ile Glu Arg
420 425 430
Val Ile Cys Leu Thr Asn Asp Glu Met Lys Arg Trp Ala Asp Glu Ile
435 440 445
Cys Thr Ala Lys Ser Ala Ile Phe Leu Gly Arg Gly Leu Asn Ala Pro
450 455 460
Val Ala Phe Glu Gly Ala Leu Lys Leu Lys Glu Ile Ser Tyr Ile His
465 470 475 480
Ala Glu Gly Phe Leu Gly Gly Glu Leu Lys His Gly Pro Leu Ala Leu
485 490 495
Leu Asp Asp Lys Ile Pro Val Ile Val Thr Val Ala Asp His Ala Tyr
500 505 510
Leu Asp His Ile Lys Ala Asn Ile Asp Glu Val Leu Ala Arg Asn Val
515 520 525
Thr Val Tyr Ala Ile Val Asp Gln Tyr Val Asn Ile Glu Pro Gln Glu
530 535 540
Arg Leu His Val Val Lys Val Pro Phe Val Ser Lys Glu Phe Ser Pro
545 550 555 560
Ile Ile His Thr Ile Pro Met Gln Leu Leu Ser Tyr Tyr Val Ala Ile
565 570 575
Lys Leu Gly Lys Asn Val Asp Lys Pro Arg Asn Leu Ala Lys Ser Val
580 585 590
Thr Thr Phe
595
<210> 77
<211> 1434
<212> DNA
<213> Saccharomyces cerevisiae
<220>
<223> nucleic acid sequence of UDP-N-acetylglucosamine
pyrophosphorylase (QRI1) originating from Saccharomyces
cerevisiae
<400> 77
atgactgaca caaaacagct attcattgaa gccggacaaa gtcaactttt ccacaattgg 60
gaaagcttgt ctcgcaaaga ccaagaagaa ttgctttcaa acctggagca aatatcttcc 120
aagaggtccc ctgcaaaact actggaagac tgtcaaaatg ctattaaatt ctcactagct 180
aactcttcta aggatactgg cgtcgaaatt tcaccattgc cccctacttc gtacgagtcg 240
cttattggca acagtaagaa agaaaatgaa tactggcgtt taggccttga agctattggc 300
aagggtgaag tcgcagtgat tttaatggct ggcggacaag gtacgcggtt aggatcctct 360
caaccaaagg gctgttacga cattggattg ccttctaaga aatctctttt tcaaattcaa 420
gctgaaaagt tgatcaggtt gcaagatatg gtaaaggaca aaaaggtaga aattccttgg 480
tatattatga catcaggccc cactagagcg gctactgagg catactttca agaacacaat 540
tattttggct tgaataaaga acaaattacg ttcttcaacc agggaaccct gcctgccttt 600
gatttaaccg ggaagcattt cctaatgaaa gacccagtaa acctatctca atcaccagat 660
ggaaatggtg gactctaccg tgccatcaag gaaaacaagt tgaacgaaga ctttgatagg 720
agaggaatca agcatgttta catgtactgt gtcgataatg tcctatctaa aatcgcagac 780
cctgtattta ttggttttgc catcaagcat ggcttcgaac tggccaccaa agccgttaga 840
aagagagatg cgcatgaatc agttgggtta attgctacta aaaacgagaa accatgtgtc 900
atagaatatt ctgaaatttc caatgaattg gctgaagcaa aggataaaga tggcttatta 960
aaactacgcg caggcaacat tgtaaatcat tattacctag tggatttact aaaacgtgat 1020
ttggatcagt ggtgtgagaa tatgccatat cacattgcga agaagaaaat tccagcttat 1080
gatagtgtta ccggcaagta cactaagcct accgaaccaa acggtataaa attagagcaa 1140
ttcatatttg atgtctttga cactgtacca ctgaacaagt ttgggtgctt agaagtagat 1200
agatgcaaag aattttcacc tttaaaaaac ggtcctggtt ctaagaacga taatcctgag 1260
accagcagac tagcatattt gaaactagga acctcgtggt tggaagatgc aggcgctatt 1320
gtaaaagatg gggtactagt cgaagtttcc agcaaattga gttatgcagg tgaaaatcta 1380
tcccagttca aaggtaaagt ctttgacaga agtggtatag tattagaaaa ataa 1434
<210> 78
<211> 477
<212> PRT
<213> Saccharomyces cerevisiae
<220>
<223> amino acid sequence of UDP-N-acetylglucosamine pyrophosphorylase
(QRI1) originating from Saccharomyces cerevisiae
<400> 78
Met Thr Asp Thr Lys Gln Leu Phe Ile Glu Ala Gly Gln Ser Gln Leu
1 5 10 15
Phe His Asn Trp Glu Ser Leu Ser Arg Lys Asp Gln Glu Glu Leu Leu
20 25 30
Ser Asn Leu Glu Gln Ile Ser Ser Lys Arg Ser Pro Ala Lys Leu Leu
35 40 45
Glu Asp Cys Gln Asn Ala Ile Lys Phe Ser Leu Ala Asn Ser Ser Lys
50 55 60
Asp Thr Gly Val Glu Ile Ser Pro Leu Pro Pro Thr Ser Tyr Glu Ser
65 70 75 80
Leu Ile Gly Asn Ser Lys Lys Glu Asn Glu Tyr Trp Arg Leu Gly Leu
85 90 95
Glu Ala Ile Gly Lys Gly Glu Val Ala Val Ile Leu Met Ala Gly Gly
100 105 110
Gln Gly Thr Arg Leu Gly Ser Ser Gln Pro Lys Gly Cys Tyr Asp Ile
115 120 125
Gly Leu Pro Ser Lys Lys Ser Leu Phe Gln Ile Gln Ala Glu Lys Leu
130 135 140
Ile Arg Leu Gln Asp Met Val Lys Asp Lys Lys Val Glu Ile Pro Trp
145 150 155 160
Tyr Ile Met Thr Ser Gly Pro Thr Arg Ala Ala Thr Glu Ala Tyr Phe
165 170 175
Gln Glu His Asn Tyr Phe Gly Leu Asn Lys Glu Gln Ile Thr Phe Phe
180 185 190
Asn Gln Gly Thr Leu Pro Ala Phe Asp Leu Thr Gly Lys His Phe Leu
195 200 205
Met Lys Asp Pro Val Asn Leu Ser Gln Ser Pro Asp Gly Asn Gly Gly
210 215 220
Leu Tyr Arg Ala Ile Lys Glu Asn Lys Leu Asn Glu Asp Phe Asp Arg
225 230 235 240
Arg Gly Ile Lys His Val Tyr Met Tyr Cys Val Asp Asn Val Leu Ser
245 250 255
Lys Ile Ala Asp Pro Val Phe Ile Gly Phe Ala Ile Lys His Gly Phe
260 265 270
Glu Leu Ala Thr Lys Ala Val Arg Lys Arg Asp Ala His Glu Ser Val
275 280 285
Gly Leu Ile Ala Thr Lys Asn Glu Lys Pro Cys Val Ile Glu Tyr Ser
290 295 300
Glu Ile Ser Asn Glu Leu Ala Glu Ala Lys Asp Lys Asp Gly Leu Leu
305 310 315 320
Lys Leu Arg Ala Gly Asn Ile Val Asn His Tyr Tyr Leu Val Asp Leu
325 330 335
Leu Lys Arg Asp Leu Asp Gln Trp Cys Glu Asn Met Pro Tyr His Ile
340 345 350
Ala Lys Lys Lys Ile Pro Ala Tyr Asp Ser Val Thr Gly Lys Tyr Thr
355 360 365
Lys Pro Thr Glu Pro Asn Gly Ile Lys Leu Glu Gln Phe Ile Phe Asp
370 375 380
Val Phe Asp Thr Val Pro Leu Asn Lys Phe Gly Cys Leu Glu Val Asp
385 390 395 400
Arg Cys Lys Glu Phe Ser Pro Leu Lys Asn Gly Pro Gly Ser Lys Asn
405 410 415
Asp Asn Pro Glu Thr Ser Arg Leu Ala Tyr Leu Lys Leu Gly Thr Ser
420 425 430
Trp Leu Glu Asp Ala Gly Ala Ile Val Lys Asp Gly Val Leu Val Glu
435 440 445
Val Ser Ser Lys Leu Ser Tyr Ala Gly Glu Asn Leu Ser Gln Phe Lys
450 455 460
Gly Lys Val Phe Asp Arg Ser Gly Ile Val Leu Glu Lys
465 470 475
<210> 79
<211> 1713
<212> DNA
<213> Saccharomyces cerevisiae
<220>
<223> nucleic acid sequence of Phosphoglucomutase-1 (PGM1) originating
from Saccharomyces cerevisiae
<400> 79
atgtcacttc taatagattc tgtaccaaca gttgcttata aggaccaaaa accgggtact 60
tcaggtttac gtaagaagac caaggttttc atggatgagc ctcattatac tgagaacttc 120
attcaagcaa caatgcaatc tatccctaat ggctcagagg gaaccacttt agttgttgga 180
ggagatggtc gtttctacaa cgatgttatc atgaacaaga ttgccgcagt aggtgctgca 240
aacggtgtca gaaagttagt cattggtcaa ggcggtttac tttcaacacc agctgcttct 300
catataatta gaacatacga ggaaaagtgt accggtggtg gtatcatatt aactgcctca 360
cacaacccag gcggtccaga gaatgattta ggtatcaagt ataatttacc taatggtggg 420
ccagctccag agagtgtcac taacgctatc tgggaagcgt ctaaaaaatt aactcactat 480
aaaattataa agaacttccc caagttgaat ttgaacaagc ttggtaaaaa ccaaaaatat 540
ggcccattgt tagtggacat aattgatcct gccaaagcat acgttcaatt tctgaaggaa 600
atttttgatt ttgacttaat taaaagcttc ttagcgaaac agcgcaaaga caaagggtgg 660
aagttgttgt ttgactcctt aaatggtatt acaggaccat atggtaaggc tatatttgtt 720
gatgaatttg gtttaccggc agaggaagtt cttcaaaatt ggcacccttt acctgatttc 780
ggcggtttac atcccgatcc gaatctaacc tatgcacgaa ctcttgttga cagggttgac 840
cgcgaaaaaa ttgcctttgg agcagcctcc gatggtgatg gtgataggaa tatgatttac 900
ggttatggcc ctgctttcgt ttcgccaggt gattctgttg ccattattgc cgaatatgca 960
cccgaaattc catacttcgc caaacaaggt atttatggct tggcacgttc atttcctaca 1020
tcctcagcca ttgatcgtgt tgcagcaaaa aagggattaa gatgttacga agttccaacc 1080
ggctggaaat tcttctgtgc cttatttgat gctaaaaagc tatcaatctg tggtgaagaa 1140
tccttcggta caggttccaa tcatatcaga gaaaaggacg gtctatgggc cattattgct 1200
tggttaaata tcttggctat ctaccatagg cgtaaccctg aaaaggaagc ttcgatcaaa 1260
actattcagg acgaattttg gaacgagtat ggccgtactt tcttcacaag atacgattac 1320
gaacatatcg aatgcgagca ggccgaaaaa gttgtagctc ttttgagtga atttgtatca 1380
aggccaaacg tttgtggctc ccacttccca gctgatgagt ctttaaccgt tatcgattgt 1440
ggtgattttt cgtatagaga tctagatggc tccatctctg aaaatcaagg ccttttcgta 1500
aagttttcga atgggactaa atttgttttg aggttatccg gcacaggcag ttctggtgca 1560
acaataagat tatacgtaga aaagtatact gataaaaagg agaactatgg ccaaacagct 1620
gacgtcttct tgaaacccgt catcaactcc attgtaaaat tcttaagatt taaagaaatt 1680
ttaggaacag acgaaccaac agtccgcaca tag 1713
<210> 80
<211> 570
<212> PRT
<213> Saccharomyces cerevisiae
<220>
<223> amino acid sequence Phosphoglucomutase-1 (PGM1) originating from
Saccharomyces cerevisiae
<400> 80
Met Ser Leu Leu Ile Asp Ser Val Pro Thr Val Ala Tyr Lys Asp Gln
1 5 10 15
Lys Pro Gly Thr Ser Gly Leu Arg Lys Lys Thr Lys Val Phe Met Asp
20 25 30
Glu Pro His Tyr Thr Glu Asn Phe Ile Gln Ala Thr Met Gln Ser Ile
35 40 45
Pro Asn Gly Ser Glu Gly Thr Thr Leu Val Val Gly Gly Asp Gly Arg
50 55 60
Phe Tyr Asn Asp Val Ile Met Asn Lys Ile Ala Ala Val Gly Ala Ala
65 70 75 80
Asn Gly Val Arg Lys Leu Val Ile Gly Gln Gly Gly Leu Leu Ser Thr
85 90 95
Pro Ala Ala Ser His Ile Ile Arg Thr Tyr Glu Glu Lys Cys Thr Gly
100 105 110
Gly Gly Ile Ile Leu Thr Ala Ser His Asn Pro Gly Gly Pro Glu Asn
115 120 125
Asp Leu Gly Ile Lys Tyr Asn Leu Pro Asn Gly Gly Pro Ala Pro Glu
130 135 140
Ser Val Thr Asn Ala Ile Trp Glu Ala Ser Lys Lys Leu Thr His Tyr
145 150 155 160
Lys Ile Ile Lys Asn Phe Pro Lys Leu Asn Leu Asn Lys Leu Gly Lys
165 170 175
Asn Gln Lys Tyr Gly Pro Leu Leu Val Asp Ile Ile Asp Pro Ala Lys
180 185 190
Ala Tyr Val Gln Phe Leu Lys Glu Ile Phe Asp Phe Asp Leu Ile Lys
195 200 205
Ser Phe Leu Ala Lys Gln Arg Lys Asp Lys Gly Trp Lys Leu Leu Phe
210 215 220
Asp Ser Leu Asn Gly Ile Thr Gly Pro Tyr Gly Lys Ala Ile Phe Val
225 230 235 240
Asp Glu Phe Gly Leu Pro Ala Glu Glu Val Leu Gln Asn Trp His Pro
245 250 255
Leu Pro Asp Phe Gly Gly Leu His Pro Asp Pro Asn Leu Thr Tyr Ala
260 265 270
Arg Thr Leu Val Asp Arg Val Asp Arg Glu Lys Ile Ala Phe Gly Ala
275 280 285
Ala Ser Asp Gly Asp Gly Asp Arg Asn Met Ile Tyr Gly Tyr Gly Pro
290 295 300
Ala Phe Val Ser Pro Gly Asp Ser Val Ala Ile Ile Ala Glu Tyr Ala
305 310 315 320
Pro Glu Ile Pro Tyr Phe Ala Lys Gln Gly Ile Tyr Gly Leu Ala Arg
325 330 335
Ser Phe Pro Thr Ser Ser Ala Ile Asp Arg Val Ala Ala Lys Lys Gly
340 345 350
Leu Arg Cys Tyr Glu Val Pro Thr Gly Trp Lys Phe Phe Cys Ala Leu
355 360 365
Phe Asp Ala Lys Lys Leu Ser Ile Cys Gly Glu Glu Ser Phe Gly Thr
370 375 380
Gly Ser Asn His Ile Arg Glu Lys Asp Gly Leu Trp Ala Ile Ile Ala
385 390 395 400
Trp Leu Asn Ile Leu Ala Ile Tyr His Arg Arg Asn Pro Glu Lys Glu
405 410 415
Ala Ser Ile Lys Thr Ile Gln Asp Glu Phe Trp Asn Glu Tyr Gly Arg
420 425 430
Thr Phe Phe Thr Arg Tyr Asp Tyr Glu His Ile Glu Cys Glu Gln Ala
435 440 445
Glu Lys Val Val Ala Leu Leu Ser Glu Phe Val Ser Arg Pro Asn Val
450 455 460
Cys Gly Ser His Phe Pro Ala Asp Glu Ser Leu Thr Val Ile Asp Cys
465 470 475 480
Gly Asp Phe Ser Tyr Arg Asp Leu Asp Gly Ser Ile Ser Glu Asn Gln
485 490 495
Gly Leu Phe Val Lys Phe Ser Asn Gly Thr Lys Phe Val Leu Arg Leu
500 505 510
Ser Gly Thr Gly Ser Ser Gly Ala Thr Ile Arg Leu Tyr Val Glu Lys
515 520 525
Tyr Thr Asp Lys Lys Glu Asn Tyr Gly Gln Thr Ala Asp Val Phe Leu
530 535 540
Lys Pro Val Ile Asn Ser Ile Val Lys Phe Leu Arg Phe Lys Glu Ile
545 550 555 560
Leu Gly Thr Asp Glu Pro Thr Val Arg Thr
565 570
<210> 81
<211> 1500
<212> DNA
<213> Saccharomyces cerevisiae
<220>
<223> nucleic acid sequence of UTP-glucose-1-phosphate
uridylyltransferase (UGP1) originating from Saccharomyces
cerevisiae
<400> 81
atgtccacta agaagcacac caaaacacat tccacttatg cattcgagag caacacaaac 60
agcgttgctg cctcacaaat gagaaacgcc ttaaacaagt tggcggactc tagtaaactt 120
gacgatgctg ctcgcgctaa gtttgagaac gaactggatt cgtttttcac gcttttcagg 180
agatatttgg tagagaagtc ttctagaacc accttggaat gggacaagat caagtctccc 240
aacccggatg aagtggttaa gtatgaaatt atttctcagc agcccgagaa tgtctcaaac 300
ctttccaaat tggctgtttt gaagttgaac ggtgggctgg gtacctccat gggctgcgtt 360
ggccctaaat ctgttattga agtgagagag ggaaacacct ttttggattt gtctgttcgt 420
caaattgaat acttgaacag acagtacgat agcgacgtgc cattgttatt gatgaattct 480
ttcaacactg acaaggatac ggaacacttg attaagaagt attccgctaa cagaatcaga 540
atcagatctt tcaatcaatc caggttccca agagtctaca aggattcttt attgcctgtc 600
cccaccgaat acgattctcc actggatgct tggtatccac caggtcacgg tgatttgttt 660
gaatctttac acgtatctgg tgaactggat gccttaattg cccaaggaag agaaatatta 720
tttgtttcta acggtgacaa cttgggtgct accgtcgact taaaaatttt aaaccacatg 780
atcgagactg gtgccgaata tataatggaa ttgactgata agaccagagc cgatgttaaa 840
ggtggtactt tgatttctta cgatggtcaa gtccgtttat tggaagtcgc ccaagttcca 900
aaagaacaca ttgacgaatt caaaaatatc agaaagttta ccaacttcaa cacgaataac 960
ttatggatca atctgaaagc agtaaagagg ttgatcgaat cgagcaattt ggagatggaa 1020
atcattccaa accaaaaaac tataacaaga gacggtcatg aaattaatgt cttacaatta 1080
gaaaccgctt gtggtgctgc tatcaggcat tttgatggtg ctcacggtgt tgtcgttcca 1140
agatcaagat tcttgcctgt caagacctgt tccgatttgt tgctggttaa atcagatcta 1200
ttccgtctgg aacacggttc tttgaagtta gacccatccc gttttggtcc aaacccatta 1260
atcaagttgg gctcgcattt caaaaaggtt tctggtttta acgcaagaat ccctcacatc 1320
ccaaaaatcg tcgagctaga tcatttgacc atcactggta acgtcttttt aggtaaagat 1380
gtcactttga ggggtactgt catcatcgtt tgctccgacg gtcataaaat cgatattcca 1440
aacggctcca tattggaaaa tgttgtcgtt actggtaatt tgcaaatctt ggaacattga 1500
<210> 82
<211> 499
<212> PRT
<213> Saccharomyces cerevisiae
<220>
<223> amino acid sequence of UTP--glucose-1-phosphate
uridylyltransferase (UGP1) originating from Saccharomyces
cerevisiae
<400> 82
Met Ser Thr Lys Lys His Thr Lys Thr His Ser Thr Tyr Ala Phe Glu
1 5 10 15
Ser Asn Thr Asn Ser Val Ala Ala Ser Gln Met Arg Asn Ala Leu Asn
20 25 30
Lys Leu Ala Asp Ser Ser Lys Leu Asp Asp Ala Ala Arg Ala Lys Phe
35 40 45
Glu Asn Glu Leu Asp Ser Phe Phe Thr Leu Phe Arg Arg Tyr Leu Val
50 55 60
Glu Lys Ser Ser Arg Thr Thr Leu Glu Trp Asp Lys Ile Lys Ser Pro
65 70 75 80
Asn Pro Asp Glu Val Val Lys Tyr Glu Ile Ile Ser Gln Gln Pro Glu
85 90 95
Asn Val Ser Asn Leu Ser Lys Leu Ala Val Leu Lys Leu Asn Gly Gly
100 105 110
Leu Gly Thr Ser Met Gly Cys Val Gly Pro Lys Ser Val Ile Glu Val
115 120 125
Arg Glu Gly Asn Thr Phe Leu Asp Leu Ser Val Arg Gln Ile Glu Tyr
130 135 140
Leu Asn Arg Gln Tyr Asp Ser Asp Val Pro Leu Leu Leu Met Asn Ser
145 150 155 160
Phe Asn Thr Asp Lys Asp Thr Glu His Leu Ile Lys Lys Tyr Ser Ala
165 170 175
Asn Arg Ile Arg Ile Arg Ser Phe Asn Gln Ser Arg Phe Pro Arg Val
180 185 190
Tyr Lys Asp Ser Leu Leu Pro Val Pro Thr Glu Tyr Asp Ser Pro Leu
195 200 205
Asp Ala Trp Tyr Pro Pro Gly His Gly Asp Leu Phe Glu Ser Leu His
210 215 220
Val Ser Gly Glu Leu Asp Ala Leu Ile Ala Gln Gly Arg Glu Ile Leu
225 230 235 240
Phe Val Ser Asn Gly Asp Asn Leu Gly Ala Thr Val Asp Leu Lys Ile
245 250 255
Leu Asn His Met Ile Glu Thr Gly Ala Glu Tyr Ile Met Glu Leu Thr
260 265 270
Asp Lys Thr Arg Ala Asp Val Lys Gly Gly Thr Leu Ile Ser Tyr Asp
275 280 285
Gly Gln Val Arg Leu Leu Glu Val Ala Gln Val Pro Lys Glu His Ile
290 295 300
Asp Glu Phe Lys Asn Ile Arg Lys Phe Thr Asn Phe Asn Thr Asn Asn
305 310 315 320
Leu Trp Ile Asn Leu Lys Ala Val Lys Arg Leu Ile Glu Ser Ser Asn
325 330 335
Leu Glu Met Glu Ile Ile Pro Asn Gln Lys Thr Ile Thr Arg Asp Gly
340 345 350
His Glu Ile Asn Val Leu Gln Leu Glu Thr Ala Cys Gly Ala Ala Ile
355 360 365
Arg His Phe Asp Gly Ala His Gly Val Val Val Pro Arg Ser Arg Phe
370 375 380
Leu Pro Val Lys Thr Cys Ser Asp Leu Leu Leu Val Lys Ser Asp Leu
385 390 395 400
Phe Arg Leu Glu His Gly Ser Leu Lys Leu Asp Pro Ser Arg Phe Gly
405 410 415
Pro Asn Pro Leu Ile Lys Leu Gly Ser His Phe Lys Lys Val Ser Gly
420 425 430
Phe Asn Ala Arg Ile Pro His Ile Pro Lys Ile Val Glu Leu Asp His
435 440 445
Leu Thr Ile Thr Gly Asn Val Phe Leu Gly Lys Asp Val Thr Leu Arg
450 455 460
Gly Thr Val Ile Ile Val Cys Ser Asp Gly His Lys Ile Asp Ile Pro
465 470 475 480
Asn Gly Ser Ile Leu Glu Asn Val Val Val Thr Gly Asn Leu Gln Ile
485 490 495
Leu Glu His
<210> 83
<211> 480
<212> DNA
<213> Saccharomyces cerevisiae
<220>
<223> nucleic acid sequence of Glucosamine 6-phosphate
N-acetyltransferase (GNA1) originating from Saccharomyces
cerevisiae
<400> 83
atgagcttac ccgatggatt ttatataagg cgaatggaag agggggattt ggaacaggtc 60
actgagacgc taaaggtttt gaccaccgtg ggcactatta cccccgaatc cttcagcaaa 120
ctcataaaat actggaatga agccacagta tggaatgata acgaagataa aaaaataatg 180
caatataacc ccatggtgat tgtggacaag cgcaccgaga cggttgccgc tacggggaat 240
atcatcatcg aaagaaagat cattcatgaa ctggggctat gtggccacat cgaggacatt 300
gcagtaaact ccaagtatca gggccaaggt ttgggcaagc tcttgattga tcaattggta 360
actatcggct ttgactacgg ttgttataag attattttag attgcgatga gaaaaatgtc 420
aaattctatg aaaaatgtgg gtttagcaac gcaggcgtgg aaatgcaaat tagaaaatag 480
<210> 84
<211> 159
<212> PRT
<213> Saccharomyces cerevisiae
<220>
<223> amino acid sequence of Glucosamine 6-phosphate
N-acetyltransferase (GNA1) originating from Saccharomyces
cerevisiae
<400> 84
Met Ser Leu Pro Asp Gly Phe Tyr Ile Arg Arg Met Glu Glu Gly Asp
1 5 10 15
Leu Glu Gln Val Thr Glu Thr Leu Lys Val Leu Thr Thr Val Gly Thr
20 25 30
Ile Thr Pro Glu Ser Phe Ser Lys Leu Ile Lys Tyr Trp Asn Glu Ala
35 40 45
Thr Val Trp Asn Asp Asn Glu Asp Lys Lys Ile Met Gln Tyr Asn Pro
50 55 60
Met Val Ile Val Asp Lys Arg Thr Glu Thr Val Ala Ala Thr Gly Asn
65 70 75 80
Ile Ile Ile Glu Arg Lys Ile Ile His Glu Leu Gly Leu Cys Gly His
85 90 95
Ile Glu Asp Ile Ala Val Asn Ser Lys Tyr Gln Gly Gln Gly Leu Gly
100 105 110
Lys Leu Leu Ile Asp Gln Leu Val Thr Ile Gly Phe Asp Tyr Gly Cys
115 120 125
Tyr Lys Ile Ile Leu Asp Cys Asp Glu Lys Asn Val Lys Phe Tyr Glu
130 135 140
Lys Cys Gly Phe Ser Asn Ala Gly Val Glu Met Gln Ile Arg Lys
145 150 155
<210> 85
<211> 1674
<212> DNA
<213> Saccharomyces cerevisiae
<220>
<223> nucleic acid sequence of phosphoacetylglucosamine mutase (PCM1)
originating from Saccharomyces cerevisiae
<400> 85
atgaaggttg attacgagca attgtgcaaa ctctacgatg acacgtgccg cacaaagaat 60
gtgcagttca gttacggtac ggccggattc agaacgctgg ccaagaattt ggatacggtg 120
atgttcagta ctggtatact ggcggttctc aggtcgctga agcttcaggg tcagtatgtg 180
ggggtgatga tcacggcgtc gcacaaccca taccaggaca acggggtcaa gatcgtggaa 240
ccagacggat cgatgctttt ggccacatgg gagccatatg ccatgcagtt ggccaatgcg 300
gcctcttttg ccactaattt tgaagaattt cgtgttgagt tggccaagct gattgaacac 360
gaaaagattg atttgaatac aaccgtcgtg cctcacatcg tggttgggag agactctagg 420
gaaagtagtc catacttgct gcgctgcttg acttcctcca tggccagcgt cttccacgcg 480
caagttttgg acctaggctg tgtcactacg cctcaattgc attacattac tgatttgtcc 540
aacaggcgga aactggaagg agacacagcg ccagttgcca cagaacagga ctactattcg 600
ttctttatag gagccttcaa cgagctcttc gccacgtatc agctggagaa gaggctgtct 660
gtcccaaaat tgttcataga cacagccaat ggtatcggtg gtccacagtt gaaaaaacta 720
ctggcctccg aagattggga cgtgccagcg gagcaagttg aggtaatcaa cgacaggtcc 780
gatgttccag aactgttgaa ttttgaatgc ggtgcggatt atgtgaagac taaccagaga 840
ttacccaagg gtctttctcc atcctcgttt gattcgctat attgctcctt tgatggtgac 900
gcagacaggg ttgtgttcta ctatgtcgac tcaggatcaa aatttcattt gttggatggt 960
gacaaaattt ccactttgtt tgcaaagttc ttgtctaaac aactagaatt ggcacaccta 1020
gaacattctt tgaagattgg tgttgtgcaa actgcctatg caaacggcag ttccaccgct 1080
tacataaaaa atacgttgca ctgtcccgtg tcttgcacta agacaggtgt taaacacttg 1140
catcatgaag ctgccactca gtacgatatt ggcatttatt tcgaagcaaa tggacatggt 1200
acgattatat tcagcgaaaa atttcatcga actatcaaat ctgaattatc caagtccaag 1260
ttaaatggtg atacgttagc tttgagaact ttgaagtgtt tctctgaatt gattaatcag 1320
accgtgggag atgctatttc agacatgctt gctgtccttg ctactttggc gattttgaaa 1380
atgtcgccaa tggattggga tgaagagtat actgatttgc ccaacaagct ggttaagtgc 1440
atcgttcctg ataggtcaat tttccaaacc acggaccagg aaagaaaatt gctcaatcca 1500
gtggggttgc aagacaagat agatcttgtg gtagccaagt atcccatggg aagaagcttt 1560
gtcagagcca gtggtacgga ggatgcggtg agggtttatg cggaatgtaa ggactcctct 1620
aagttaggtc aattttgtga cgaagtggtg gagcacgtta aggcatctgc ttga 1674
<210> 86
<211> 557
<212> PRT
<213> Saccharomyces cerevisiae
<220>
<223> amino acid sequence of phosphoacetylglucosamine mutase (PCM1)
originating from Saccharomyces cerevisiae
<400> 86
Met Lys Val Asp Tyr Glu Gln Leu Cys Lys Leu Tyr Asp Asp Thr Cys
1 5 10 15
Arg Thr Lys Asn Val Gln Phe Ser Tyr Gly Thr Ala Gly Phe Arg Thr
20 25 30
Leu Ala Lys Asn Leu Asp Thr Val Met Phe Ser Thr Gly Ile Leu Ala
35 40 45
Val Leu Arg Ser Leu Lys Leu Gln Gly Gln Tyr Val Gly Val Met Ile
50 55 60
Thr Ala Ser His Asn Pro Tyr Gln Asp Asn Gly Val Lys Ile Val Glu
65 70 75 80
Pro Asp Gly Ser Met Leu Leu Ala Thr Trp Glu Pro Tyr Ala Met Gln
85 90 95
Leu Ala Asn Ala Ala Ser Phe Ala Thr Asn Phe Glu Glu Phe Arg Val
100 105 110
Glu Leu Ala Lys Leu Ile Glu His Glu Lys Ile Asp Leu Asn Thr Thr
115 120 125
Val Val Pro His Ile Val Val Gly Arg Asp Ser Arg Glu Ser Ser Pro
130 135 140
Tyr Leu Leu Arg Cys Leu Thr Ser Ser Met Ala Ser Val Phe His Ala
145 150 155 160
Gln Val Leu Asp Leu Gly Cys Val Thr Thr Pro Gln Leu His Tyr Ile
165 170 175
Thr Asp Leu Ser Asn Arg Arg Lys Leu Glu Gly Asp Thr Ala Pro Val
180 185 190
Ala Thr Glu Gln Asp Tyr Tyr Ser Phe Phe Ile Gly Ala Phe Asn Glu
195 200 205
Leu Phe Ala Thr Tyr Gln Leu Glu Lys Arg Leu Ser Val Pro Lys Leu
210 215 220
Phe Ile Asp Thr Ala Asn Gly Ile Gly Gly Pro Gln Leu Lys Lys Leu
225 230 235 240
Leu Ala Ser Glu Asp Trp Asp Val Pro Ala Glu Gln Val Glu Val Ile
245 250 255
Asn Asp Arg Ser Asp Val Pro Glu Leu Leu Asn Phe Glu Cys Gly Ala
260 265 270
Asp Tyr Val Lys Thr Asn Gln Arg Leu Pro Lys Gly Leu Ser Pro Ser
275 280 285
Ser Phe Asp Ser Leu Tyr Cys Ser Phe Asp Gly Asp Ala Asp Arg Val
290 295 300
Val Phe Tyr Tyr Val Asp Ser Gly Ser Lys Phe His Leu Leu Asp Gly
305 310 315 320
Asp Lys Ile Ser Thr Leu Phe Ala Lys Phe Leu Ser Lys Gln Leu Glu
325 330 335
Leu Ala His Leu Glu His Ser Leu Lys Ile Gly Val Val Gln Thr Ala
340 345 350
Tyr Ala Asn Gly Ser Ser Thr Ala Tyr Ile Lys Asn Thr Leu His Cys
355 360 365
Pro Val Ser Cys Thr Lys Thr Gly Val Lys His Leu His His Glu Ala
370 375 380
Ala Thr Gln Tyr Asp Ile Gly Ile Tyr Phe Glu Ala Asn Gly His Gly
385 390 395 400
Thr Ile Ile Phe Ser Glu Lys Phe His Arg Thr Ile Lys Ser Glu Leu
405 410 415
Ser Lys Ser Lys Leu Asn Gly Asp Thr Leu Ala Leu Arg Thr Leu Lys
420 425 430
Cys Phe Ser Glu Leu Ile Asn Gln Thr Val Gly Asp Ala Ile Ser Asp
435 440 445
Met Leu Ala Val Leu Ala Thr Leu Ala Ile Leu Lys Met Ser Pro Met
450 455 460
Asp Trp Asp Glu Glu Tyr Thr Asp Leu Pro Asn Lys Leu Val Lys Cys
465 470 475 480
Ile Val Pro Asp Arg Ser Ile Phe Gln Thr Thr Asp Gln Glu Arg Lys
485 490 495
Leu Leu Asn Pro Val Gly Leu Gln Asp Lys Ile Asp Leu Val Val Ala
500 505 510
Lys Tyr Pro Met Gly Arg Ser Phe Val Arg Ala Ser Gly Thr Glu Asp
515 520 525
Ala Val Arg Val Tyr Ala Glu Cys Lys Asp Ser Ser Lys Leu Gly Gln
530 535 540
Phe Cys Asp Glu Val Val Glu His Val Lys Ala Ser Ala
545 550 555
<210> 87
<211> 574
<212> DNA
<213> other sequences
<220>
<223> nucleic acid sequence of promoter pTDH3
<400> 87
ctgctgtaac ccgtacatgc ccaaaatagg gggcgggtta cacagaatat ataacatcgt 60
aggtgtctgg gtgaacagtt tattcctggc atccactaaa tataatggag cccgcttttt 120
aagctggcat ccagaaaaaa aaagaatccc agcaccaaaa tattgttttc ttcaccaacc 180
atcagttcat aggtccattc tcttagcgca actacagaga acaggggcac aaacaggcaa 240
aaaacgggca caacctcaat ggagtgatgc aacctgcctg gagtaaatga tgacacaagg 300
caattgaccc acgcatgtat ctatctcatt ttcttacacc ttctattacc ttctgctctc 360
tctgatttgg aaaaagctga aaaaaaaggt tgaaaccagt tccctgaaat tattccccta 420
cttgactaat aagtatataa agacggtagg tattgattgt aattctgtaa atctatttct 480
taaacttctt aaattctact tttatagtta gtcttttttt tagttttaaa acaccaagaa 540
cttagtttcg aataaacaca cataaacaaa caaa 574
<210> 88
<211> 585
<212> DNA
<213> other sequences
<220>
<223> nucleic acid sequence of promoter pTDH3.Sk
<400> 88
caattcatcg gcccttttag cggctacccg cgccatctaa atgatagggc gggtgacact 60
atggtaaatc ccataattag gtgtctgggt gagtggttct gatgccggca tccactaaat 120
atattggagc ccatttttta cgcgggcttc cagaaaaaaa gagaatccca gcaccaaaag 180
gtggttctct tcaccaacca tcagatcata ggtccacaac cacacataac aggggcacaa 240
aaaggcaaaa aacggacata acctcaatgg agtgatgcaa attgactgga gcaaaagctg 300
acacaaggca ttgattgacc tacgcatgta tctgtattct tttcttacac cttctattac 360
cttctaactc tttgggttgg aaaaaactga aaaaaaaggt tgggacctgg ttcccccaag 420
ttgtccccct acttggttat taaatatata aagacagcaa gtgttgatta taatcttgta 480
aatctatagt tcttaatcta tacttctatt tatattttaa attagtcttt ttatttccaa 540
gtccccaaga acttagtttc gaataaacac acacaaataa acaca 585
<210> 89
<211> 700
<212> DNA
<213> other sequences
<220>
<223> nucleic acid sequence of promoter pTDH3-1.sba
<400> 89
gcagcgcttc ttccgctcta gtttttatag ttattattac taccacctta aaaatacgta 60
aatactcaaa atagtagtga tattcccaac cttattcatc caaggcacat catcatcatc 120
agccattcat ctttcacctg ccattagtaa cccgtcttct cattgagcgg gttacggcag 180
ccacaggcca cattccgaat gtctgggtga gcggtccctt ttccagcatc cactaaatat 240
ctccgatccc gctttttaat ctggcttcct gaaaaaaaga gaatcccagc accaaaaaat 300
ggctctcttc accaaccatc agatcatagg tcccattctc ttaccgcaac cgtacagaac 360
aggggaaaac gggtacaacc tcaatggagt gatgcaaact gactggagca aaaagctgac 420
acaaggcaat cgacctacgt gtctgtctat tttctcacac cttctattac cttctaactc 480
tctgggttgg aaaaaactga aaaaaaggtt gagaccagtt tccacaaatc atccccctgt 540
ttgattaata aatatataaa gacgacaact atcgatcata aactcataaa actataactc 600
ctttacactt cttattttat agttattcta ttttaattct tattgatttt aaaaccccaa 660
gaacttagtt tcgaaaacac acacacacaa acaattaaaa 700
<210> 90
<211> 602
<212> DNA
<213> other sequences
<220>
<223> nucleic acid sequence of promoter pTDH3.Sar
<400> 90
gagctaaata tcagcccttc gggtcctgcc tgctacccgg tcctgttcga ataaaaacgc 60
gggtaacacg acccagtaac acctgtcgtt gggtgtctgg gtcagaagtt ctgataccgg 120
cttccactaa atagattggg ttccgctctt tacgctggct tcctgaaaaa agagattccg 180
ggcaccaaaa aattggtctc tttgccaacc atcagatcat aggtccattc tcttaccata 240
accacacagg ataggggcac cacaggcgaa aatgggcaca aaatctcaat ggagtgatgc 300
aaattagctg gaacaaaagc tgacacaagg caattaacct gcgcatgtat ccatctcctt 360
ttcttacacc ttctcttacg ttctaactgt ttgggttgga aaaattaaaa aaaaaaggtt 420
gagaccagtt tccccaaatc gtccccctac ttgattcata aatatataaa gacgacaact 480
attgattata atcttgtaaa tctataactc tttactttct cctatttata atttaactta 540
atctttttag atttaaaacc ccaagaactt agtttcgaac aaacacacac aaataaacaa 600
aa 602
<210> 91
<211> 550
<212> DNA
<213> other sequences
<220>
<223> nucleic acid sequence of promoter pENO2
<400> 91
cgctcagcat ctgcttcttc ccaaagatga acgcggcgtt atgtcactaa cgacgtgcac 60
caacttgcgg aaagtggaat cccgttccaa aactggcatc cactaattga tacatctaca 120
caccgcacgc cttttttctg aagcccactt tcgtggactt tgccatatgc aaaattcatg 180
aagtgtgata ccaagtcagc atacacctca ctagggtagt ttctttggtt gtattgatca 240
tttggttcat cgtggttcat taattttttt tctccattgc tttctggctt tgatcttact 300
atcatttgga tttttgtcga aggttgtaga attgtatgtg acaagtggca ccaagcatat 360
ataaaaaaaa aaagcattat cttcctacca gagttgattg ttaaaaacgt atttatagca 420
aacgcaattg taattaattc ttattttgta tcttttcttc ccttgtctca atcttttatt 480
tttattttat ttttcttttc ttagtttctt tcataacacc aagcaactaa tactataaca 540
tacaataata 550
<210> 92
<211> 598
<212> DNA
<213> other sequences
<220>
<223> nucleic acid sequence of promoter pTEF3
<400> 92
ggctgataat agcgtataaa caatgcatac tttgtacgtt caaaatacaa tgcagtagat 60
atatttatgc atattacata taatacatat cacataggaa gcaacaggcg cgttggactt 120
ttaattttcg aggaccgcga atccttacat cacacccaat cccccacaag tgatccccca 180
cacaccatag cttcaaaatg tttctactcc ttttttactc ttccagattt tctcggactc 240
cgcgcatcgc cgtaccactt caaaacaccc aagcacagca tactaaattt cccctctttc 300
ttcctctagg gtgtcgttaa ttacccgtac taaaggtttg gaaaagaaaa aagagaccgc 360
ctcgtttctt tttcttcgtc gaaaaaggca ataaaaattt ttatcacgtt tctttttctt 420
gaaaattttt ttttttgatt tttttctctt tcgatgacct cccattgata tttaagttaa 480
taaacggtct tcaatttctc aagtttcagt ttcatttttc ttgttctatt acaacttttt 540
ttacttcttg ctcattagaa agaaagcata gcaatctaat ctaagtttta attacaaa 598
<210> 93
<211> 383
<212> DNA
<213> other sequences
<220>
<223> nucleic acid sequence of promoter pTEF1
<400> 93
gtttagcttg cctcgtcccc gccgggtcac ccggccagcg acatggaggc ccagaatacc 60
ctccttgaca gtcttgacgt gcgcagctca ggggcatgat gtgactgtcg cccgtacatt 120
tagcccatac atccccatgt ataatcattt gcatccatac attttgatgg ccgcacggcg 180
cgaagcaaaa attacggctc ctcgctgcag acctgcgagc agggaaacgc tcccctcaca 240
gacgcgttga attgtcccca cgccgcgccc ctgtagagaa atataaaagg ttaggatttg 300
ccactgaggt tcttctttca tatacttcct tttaaaatct tgctacgata cagttctcac 360
atcacatccg aacataaaca acc 383
<210> 94
<211> 383
<212> DNA
<213> other sequences
<220>
<223> nucleic acid sequence of promoter pTEF1.ago
<400> 94
gtttagcttg cctcgtcccc gccgggtcac ccggccagcg acatggaggc ccagaatacc 60
ctccttgaca gtcttgacgt gcgcagctca ggggcatgat gtgactgtcg cccgtacatt 120
tagcccatac atccccatgt ataatcattt gcatccatac attttgatgg ccgcacggcg 180
cgaagcaaaa attacggctc ctcgctgcag acctgcgagc agggaaacgc tcccctcaca 240
gacgcgttga attgtcccca cgccgcgccc ctgtagagaa atataaaagg ttaggatttg 300
ccactgaggt tcttctttca tatacttcct tttaaaatct tgctacgata cagttctcac 360
atcacatccg aacataaaca acc 383
<210> 95
<211> 498
<212> DNA
<213> other sequences
<220>
<223> nucleic acid sequence of promoter pTEF1.Sba
<400> 95
cgccaacaaa ccttcgaaca ctttaatttt cgaggaccgc agatcctcac atcacaccca 60
cacccaagac tgcttccccc acacaccctg catctgtaca ctttcttctg ctctgttttt 120
ctctccggcg ttctctcggg tcgcccgcat cgccgcgccg gctggaaccg cccacgcacc 180
gcatattgca aatcgcctgc cccctcttgc tcctttttga gggcgcgccg ttacccgcgc 240
ccagggtccg gaaaaagaaa caaggctcta ccgcgtttct ttttccttgt cgaaaaaggc 300
aaaaatgaaa atttttatca cgtttctttt tttttgaaaa attttttttt tggttttttt 360
tctttcgatg gcctcccatt gatatttaag ttaataaatg gttttcagtt ttcaagtttc 420
agtttgtgtt cttctttgct aactttcact tacacctcga aagaaagtat agcaatctaa 480
tcttagtttt aattacaa 498
<210> 96
<211> 700
<212> DNA
<213> other sequences
<220>
<223> nucleic acid sequence of promoter pPDC1
<400> 96
ttatttacct atctctaaac ttcaacacct tatatcataa ctaatatttc ttgagataag 60
cacactgcac ccataccttc cttaaaaacg tagcttccag tttttggtgg ttccggcttc 120
cttcccgatt ccgcccgcta aacgcatatt tttgttgcct ggtggcattt gcaaaatgca 180
taacctatgc atttaaaaga ttatgtatgc tcttctgact tttcgtgtga tgaggctcgt 240
ggaaaaaatg aataatttat gaatttgaga acaattttgt gttgttacgg tattttacta 300
tggaataatc aatcaattga ggattttatg caaatatcgt ttgaatattt ttccgaccct 360
ttgagtactt ttcttcataa ttgcataata ttgtccgctg cccctttttc tgttagacgg 420
tgtcttgatc tacttgctat cgttcaacac caccttattt tctaactatt ttttttttag 480
ctcatttgaa tcagcttatg gtgatggcac atttttgcat aaacctagct gtcctcgttg 540
aacataggaa aaaaaaatat ataaacaagg ctctttcact ctccttgcaa tcagatttgg 600
gtttgttccc tttattttca tatttcttgt catattcctt tctcaattat tattttctac 660
tcataacctc acgcaaaata acacagtcaa atcaatcaaa 700
<210> 97
<211> 924
<212> DNA
<213> other sequences
<220>
<223> nucleic acid sequence of promoter pCCW12
<400> 97
aactgtaaac aggtacaatg cggacccttt tgccacaaaa catacatcat tcattgccgg 60
aaaaagaaag aagtgaagac agcagtgcag ccagccatgt tgcgccaatc taattataga 120
tgctggtgcc ctgaggatgt atctggagcc agccatggca tcatgcgcta ccgccggatg 180
taaaatccga cacgcaaaag aaaaccttcg aggttgcgca cttcgcccac ccatgaacca 240
cacggttagt ccaaaagggg cagttcagat tccagatgcg ggaattagct tgctgccacc 300
ctcacctcac taacgctgcg gtgtgcggat acttcatgct atttatagac gcgcgtgtcg 360
gaatcagcac gcgcaagaac caaatgggaa aatcggaatg ggtccagaac tgctttgagt 420
gctggctatt ggcgtctgat ttccgttttg ggaatccttt gccgcgcgcc cctctcaaaa 480
ctccgcacaa gtcccagaaa gcgggaaaga aataaaacgc caccaaaaaa aaaaataaaa 540
gccaatcctc gaagcgtggg tggtaggccc tggattatcc cgtacaagta tttctcagga 600
gtaaaaaaac cgtttgtttt ggaattcccc atttcgcggc cacctacgcc gctatctttg 660
caacaactat ctgcgataac tcagcaaatt ttgcatattc gtgttgcagt attgcgataa 720
tgggagtctt acttccaaca taacggcaga aagaaatgtg agaaaatttt gcatcctttg 780
cctccgttca agtatataaa gtcggcatgc ttgataatct ttctttccat cctacattgt 840
tctaattatt cttattctcc tttattcttt cctaacatac caagaaatta atcttctgtc 900
attcgcttaa acactatatc aata 924
<210> 98
<211> 976
<212> DNA
<213> other sequences
<220>
<223> nucleic acid sequence of promoter pCCW12.Sm
<400> 98
cgttgtgctg tagtgaagga agactaaaaa ggataatcac agttgtaaag aggtataatg 60
cggacccttt tgccacaaaa cacacatctt tcgtttccaa aataagaaag aagaaagcaa 120
aaagattagc agccacgttg ctgcgatcta attatagacg gtggcgtcat cattctcacc 180
caagattgtg tcttgaacct gccacgggtc ctgcgttatc gccggatgta aaactagaca 240
tgcaaaaaaa ggaccttcca ggtagcgtgc tccacaccac ccatgaccac cacagttagt 300
ccaaaagagg cagcaccact tcccgatggg ggaattagat tgctgccacc ctcacctcac 360
taatgctgcg gtgtgcggat atgccctgct atatatagct ccgcgttttt gaaccagcac 420
agcgcgagca ccaaaaagga aaatcgcata ggcccagaac tgatttcagc acgggctatt 480
ggcgttgggt ttccgttctg ggaaaccttc gccgcgtccc cctcacaaac ctccgcacaa 540
gttcgagcaa gcgggaaaaa acgaaaaacg ccattaatac taaataaagc aaatcctcga 600
agcgtgggtg gcaagcccct ggatttttcc gcacaagtac tcttctcagg agtaaaaaaa 660
cccgtttgtt ttggaattcc ccatttcgcg gccatctacg ccggtatctt cgcaatatct 720
atcagcgata actcagcaat tttaatattc gtgttgcagt gctgcgatag cgggagtctt 780
gtttgtaaca taacggcaga aaggaatgag agaaaatttt ccattctttg gcctccgttc 840
aagtatataa agccggcatg cttggtaatc tttctctctc ttctgtattg tttctataat 900
acttttatct tctaattatt ttctgaaaaa accaagaaat taatcttctg tcattcgctt 960
aaacactata tcaata 976
<210> 99
<211> 750
<212> DNA
<213> other sequences
<220>
<223> nucleic acid sequence of promoter pCCW12.Sk
<400> 99
tgtaaaatcc tacacgcaaa aaacctcttg ggttgcgcgt tttccaccac ccacgacccg 60
cacaatcaat ccaaaagggg caacgccagt tcccaatgcg ggaattagct cctcaccccc 120
ctcacccgct aacgctgcgg tgtgcggaca cgcagcagta tttatagatc ctcgtgttgg 180
aaccagcccg cgtgagcacc aaattggaaa gtcgcaatgg gcccagaacc gctttcagta 240
ctgggccatt ggcgtctagt ttccgttttg agcgtccttc gccgcgtctc tctgtgaaat 300
ccccgcacaa gtctgagcag gcaaaaaaaa aaaacgccac caaaaataaa taaagccaat 360
cctcgaagga tgagtaggaa aggaagcccc tggttttttc ccgcacgaat atttttcagg 420
agtgaaaaaa tccgtttgtt ttggaattcc ccatttcgcg ctcacctacg ccggtatctt 480
tggaacaact atcagcgata actcagcaaa atttgcatat ccgtgctgca atagtgcgat 540
agtgggattg ggagtcttgt tgcatcataa cggcagaaag gaatgaataa aaattttccg 600
ttctttgtct ccgttcaagt atataaagtc ggcatgcttg attatctttt cttctcttct 660
actacatttc tatttcactt tctactctat tcttccctga aaaacccaag aaaataatct 720
tctgtcattc gcttaaacaa tatatcaaaa 750
<210> 100
<211> 750
<212> DNA
<213> other sequences
<220>
<223> nucleic acid sequence of promoter pCCW12.Sba
<400> 100
accatgccac ggtgctggcc ccacttccac ccacgacccg cacggttggc ccgaaagggg 60
caacaccagt tcccaatacg gaaattagtc cgccaccacc ctcacctcgc tagagctgcg 120
gtgtgcgggc gtgcatcgct atttatagac atgcctgctg gcgtcaccgc gcgcgagcac 180
caaacaggaa aatcgcactg ggcccagaac cacgctatgc gctgggccga tggcgtccgg 240
tttccctttg ggagccccct gccacgttcg cctaacaaat ccccgcaccg gcttgagaaa 300
aaagcgaaaa gcgaaaaaaa aaaatcaacg ccaccaaaat taaaaaaaaa gagccatcct 360
cgaagggtga atagtagccc ctgacttttc ccgcacagac agacaccttt caggagtgaa 420
caaaaaagca gtttgttttg gaattccccc atttcgcggt ggcctgcgca ggtatctctg 480
cgtcaactat cagcgataac tcagcaaatt ttgcatattc gtgttgcgat actacgataa 540
tgggagtctg tcgcctaata acggcaacaa ggaatgagag agaaaaattt tcttcattct 600
ccagctcccg ttcaagtata taaggtcggc atggtcgatt gtctttcctt ctcttcagtt 660
acgtctctct atttacatta ttcttatttt tatttaataa aaaccccaag aaattaatct 720
tctgtcattc gcttaaacac tatatcaaaa 750
<210> 101
<211> 750
<212> DNA
<213> other sequences
<220>
<223> nucleic acid sequence of promoter pCCW12.Sar
<400> 101
aaaaaacaac cttctgccaa cctgcgtgct tctcaccacc catgacccac acaattgacc 60
cgaatggggc aactccagtt cccaatacgg gaattaactc gccaccatat ttaccgcgtt 120
gaagctgtgg tgtgcggaca ctccgtacta tttatagacc cacgcggtgg aaccagcacg 180
cgcgcgcact aaacaggaaa atcgcattga gtccagaacc gccaccagca cttggccatt 240
ggcgtctaat ttccgttttc ggcgcccctc accgcgtcct tctaacaaag cgcgcacaag 300
cttgagcaag tgaaaagaaa attaaaaata aaaaaccgcc accaaaacaa ataaagcaat 360
cttcgaagtg tgggttggtg ggaagcccct ggcttttccc gcaccagtcg ttttcaggag 420
taaaaaaata cccgtttgtt ttggaattcc ccatttcgcg gcgacctgcg ccggtatctt 480
tgcaacaact atttgcgata actcagcaaa atttgcatat tcgtgttggg atattgcgat 540
agtgggagtc ttgttgcata ataacggtaa aaagaagtga aggaaaaaaa tttgcatcct 600
ttagtctcag ttcaagtata taaagtcggg atattcaatt atctttcttt ctcttgctca 660
aaggtttcta tatttttttt atagtatttc ttttgttata aaataccaag aaattaatct 720
tctgtcattc gcttaaatac tacatcaata 750
<210> 102
<211> 500
<212> DNA
<213> other sequences
<220>
<223> nucleic acid sequence of promoter pNUP57
<400> 102
tcatctgcgc aatgactatc aagaccttct gcaagaattt caaatctcac tgaaaatctt 60
gaccgaaaag tgtcttgaaa acccatcaag cctgcaaaac ctatctttga cattagtctc 120
cattataaaa acggcatagt tgggagaaaa ctttccatac ttcaattgtg gactgatata 180
agtattttag ttttgcccgc atgatcatcc cacatggcta cagcagttct ctcataggaa 240
aatagtacaa tagctacgtg atataatcta aataattgtt gccaatgtgt aattatatca 300
ttttgaacgt acgcgaaatg gattattttc aaaaattttg tttcttgaaa tgagtaaaag 360
caaaagtcca actctccaag tcgatgtaaa caactttttg ccaaagggac tgaaagacta 420
aatcgaggat tatcccgttc aaactattcc agaaacgctc gttagtaaca aaagacatac 480
cttgttgacc aattgatcac 500
<210> 103
<211> 523
<212> DNA
<213> other sequences
<220>
<223> nucleic acid sequence of promoter pCCW10.ago
<400> 103
ggtaccacgg caacctcgtt cgctgttcat ccccttcgtc acacaggacg ttggatgccg 60
taagcagcgt tgcttttgat cctcaggatc ggccgggtaa cccgcggctg cttctatttt 120
agtattcata tctcaagcac atccattccg gccgtttggg ggcgccgccg cactcgtgtc 180
cattcctacc gtggcactta gggctatcct gtcggagcgc cccgccgacc gccttatcgg 240
caccaaaagt agaagccccg gccccgcgtg gctcagactc accatcggtg ctatttactt 300
ttcgatcaga tcgcggcgcg cggtggccgg catttccgga agcggccacg gagcagaggt 360
ggcgcattcg aatcgcatac gtcttcgcca cgccggaaaa aaaattttcg gctatataag 420
gagaggcggc cgtcttgctg caggcagttt cactttctct aaaaccaaag aacatcgatt 480
tctttagtca ctcgcttcct tacaccgaac tcgaggcggc cgc 523
<210> 104
<211> 943
<212> DNA
<213> other sequences
<220>
<223> nucleic acid sequence of promoter pCWP2
<400> 104
ctagcctccc ctttttattt tgtgcggtca ccgcaaggga caaagctttt cttagaaaac 60
cgtctgagaa gcataacgta cgccatcccc tagacatatt aataatgcta cagatactat 120
gctgctcgtc tttttttgac gaccctttta ttgcaatgtg caactaatgg caaacaacca 180
catagtatca cagtattaca ttgcctccac cgatgcggat gttagggcgc caagtctgtc 240
atgaagcatg ttcctgtcat aatcttgtat gcaaaatacc gcgttctgcg ccactgatat 300
gctaggcagc agcaacctat gcagaagatt gcttttccca cgcctgtttt acgtctccag 360
ggcacttgaa acaatgcagc gatcgccgcc acaacacgcc aaagagaagc gaaagtgggc 420
ctgggcggcc tcagtttcgg cagaggtaaa caacacgaac tgaactgcct tagctccgaa 480
gggcaattcc acaggcactc cgcggggccc ggccaaggcc caaaaggcgt ggaatatgcg 540
cgttttgggg ccataacacc cagtaccacg gccggaacgg gccatataat aagtttttca 600
ctctcaagaa tggtaaacgt aaataggaac atcccactac cctagaaatt gcggaaattt 660
cgcgcttatc attagaaaat ctggaaccgt cctttttcct ctttcttgca tttccctttc 720
cgtattattg ccattcttta actgcatttg gggaaccgta gaccaaaagc caaacagaga 780
aatgtaacgt tctaaaaaaa aaacaacgaa aaaattgaaa aataagatac aataatcgta 840
tataaatcag gcttcttgtt catcattttc aattctcttc ttgccatccc ttttcctatc 900
tttgttcttt tcttctcata atcaagaata aataacttca tca 943
<210> 105
<211> 650
<212> DNA
<213> other sequences
<220>
<223> nucleic acid sequence of promoter pFBA1
<400> 105
acgcaagccc taagaaatga ataacaatac tgacagtact aaataattgc ctacttggct 60
tcacatacgt tgcatacgtc gatatagata ataatgataa tgacagcagg attatcgtaa 120
tacgtaatag ttgaaaatct caaaaatgtg tgggtcatta cgtaaataat gataggaatg 180
ggattcttct atttttcctt tttccattct agcagccgtc gggaaaacgt ggcatcctct 240
ctttcgggct caattggagt cacgctgccg tgagcatcct ctctttccat atctaacaac 300
tgagcacgta accaatggaa aagcatgagc ttagcgttgc tccaaaaaag tattggatgg 360
ttaataccat ttgtctgttc tcttctgact ttgactcctc aaaaaaaaaa aatctacaat 420
caacagatcg cttcaattac gccctcacaa aaactttttt ccttcttctt cgcccacgtt 480
aaattttatc cctcatgttg tctaacggat ttctgcactt gatttattat aaaaagacaa 540
agacataata cttctctatc aatttcagtt attgttcttc cttgcgttat tcttctgttc 600
ttctttttct tttgtcatat ataaccataa ccaagtaata catattcaaa 650
<210> 106
<211> 996
<212> DNA
<213> other sequences
<220>
<223> nucleic acid sequence of promoter pCCW120.Sm
<400> 106
cgttgtgctg tagtgaagga agactaaaaa ggataatcac agttgtaaag aggtataatg 60
cggacccttt tgccacaaaa cacacatctt tcgtttccaa aataagaaag aagaaagcaa 120
aaagattagc agccacgttg ctgcgatcta attatagacg gtggcgtcat cattctcacc 180
caagattgtg tcttgaacct gccacgggtc ctgcgttatc gccggatgta aaactagaca 240
tgcaaaaaaa ggaccttcca ggtagcgtgc tccacaccac ccatgaccac cacagttagt 300
ccaaaagagg cagcaccact tcccgatggg ggaattagat tgctgccacc ctcacctcac 360
taatgctgcg gtgtgcggat atgccctgct atatatagct ccgcgttttt gaaccagcac 420
agcgcgagca ccaaaaagga aaatcgcata ggcccagaac tgatttcagc acgggctatt 480
ggcgttgggt ttccgttctg ggaaaccttc gccgcgtccc cctcacaaac ctccgcacaa 540
gttcgagcaa gcgggaaaaa acgaaaaacg ccattaatac taaataaagc aaatcctcga 600
agcgtgggtg gcaagcccct ggatttttcc gcacaagtac tcttctcagg agtaaaaaaa 660
cccgtttgtt ttggaattcc ccatttcgcg gccatctacg ccggtatctt cgcaatatct 720
atcagcgata actcagcaat tttaatattc gtgttgcagt gctgcgatag cgggagtctt 780
gtttgtaaca taacggcaga aaggaatgag agaaaatttt ccattctttg gcctccgttc 840
aagtatataa agccggcatg cttggtaatc tttctctctc ttctgtattg tttctataat 900
acttttatct tctaattatt ttctgaaaaa accaagaaat taatcttctg tcattcgctt 960
aaacactata tcaatactcg aaatccaagg tggtgt 996
<210> 107
<211> 505
<212> DNA
<213> other sequences
<220>
<223> nucleic acid sequence of promoter pCUP1
<400> 107
cggcaaactt caacgatttc tatgatgcat tttataatta gtaagccgat cccattaccg 60
acatttgggc gctatacgtg catatgttca tgtatgtatc tgtatttaaa acacttttgt 120
attatttttc ctcatatatg tgtataggtt tatacggatg atttaattat tacttcacca 180
ccctttattt caggctgata tcttagcctt gttactagtt agaaaaagac atttttgctg 240
tcagtcactg tcaagagatt cttttgctgg catttcttct agaagcaaaa agagcgatgc 300
gtcttttccg ctgaaccgtt ccagcaaaaa agactaccaa cgcaatatgg attgtcagaa 360
tcatataaaa gagaagcaaa taactccttg tcttgtatca attgcattat aatatcttct 420
tgttagtgca atatcatata gaagtcatcg aaatagatat taagaaaaac aaactgtaca 480
atcaatcaat caatcatcac ataaa 505
<210> 108
<211> 510
<212> DNA
<213> other sequences
<220>
<223> nucleic acid sequence of promoter pMET6
<400> 108
ccacaggaaa tatttcacgt gacttacaaa cagagtcgta cgtcaggacc ggagtcaggt 60
gaaaaaatgt gggccggtaa agggaaaaaa ccagaaacgg gactactatc gaactcgttt 120
agtcgcgaac gtgcaaaagg ccaatatttt tcgctagagt catcgcagtc atggcagctc 180
tttcgctcta tctcccggtc gcaaaactgt ggtagtcata gctcgttctg ctcaattgag 240
aactgtgaat gtgaatatgg aacaaatgcg atagatgcac taatttaagg gaagctagct 300
agttttccca actgcgaaag aaaaaaagga aagaaaaaaa aattctatat aagtgataga 360
tatttccatc tttactagca ttagtttctc ttttacgtat tcaatatttt tgttaaactc 420
ttcctttatc ataaaaaagc aagcatctaa gagcattgac aacactctaa gaaacaaaat 480
accaatataa tttcaaagta catatcaaaa 510
<210> 109
<211> 686
<212> DNA
<213> other sequences
<220>
<223> nucleic acid sequence of promoter pMET25
<400> 109
ttacattatc aatccttgcg tttcagcttc cactaattta gatgactatt tctcatcatt 60
tgcgtcatct tctaacaccg tatatgataa tatactagta acgtaaatac tagttagtag 120
atgatagttg atttttattc caacactaag aaataatttc gccatttctt gaatgtattt 180
aaagatattt aatgctataa tagacattta aatccaattc ttccaacata caatgggagt 240
ttggccgagt ggtttaaggc gtcagattta ggtggattta acctctaaaa tctctgatat 300
cttcggatgc aagggttcga atcccttagc tctcattatt ttttgctttt tctcttgagg 360
tcacatgatc gcaaaatggc aaatggcacg tgaagctgtc gatattgggg aactgtggtg 420
gttggcaaat gactaattaa gttagtcaag gcgccatcct catgaaaact gtgtaacata 480
ataaccgaag tgtcgaaaag gtggcacctt gtccaattga acacgctcga tgaaaaaaat 540
aagatatata taaggttaag taaagcgtct gttagaaagg aagtttttcc tttttcttgc 600
tctcttgtct tttcatctac tatttccttc gtgtaataca gggtcgtcag atacatagat 660
acaattctat tacccccatc cataca 686
<210> 110
<211> 363
<212> DNA
<213> other sequences
<220>
<223> nucleic acid sequence of promoter pSAM1
<400> 110
gaaacggacg taagacggaa atagaatttg aagataaagt tatatatcac tacacacgaa 60
tactttcttt tttttttttc acaggaaaac tgtggtggcg cccttgccta ctagtgcatt 120
tcttttttcg ggttcttgtc tcgacgaaat tttagcctca tcgtagtttt tcactctggt 180
atcgatgaaa aagggaagag taaaaagttt tccgtttagt acttaatggg attggtttgg 240
gacgtatata tcgactggtg ttgtctgtta ttcatcgttg tttttcggtt agcttcgaaa 300
aaaaaataga gtaaaaacca ggaatttacc ctaaaaacaa gaaaaaataa gataaacgaa 360
aat 363
<210> 111
<211> 300
<212> DNA
<213> other sequences
<220>
<223> nucleic acid sequence of terminator tTPI1
<400> 111
gattaatata attatataaa aatattatct tcttttcttt atatctagtg ttatgtaaaa 60
taaattgatg actacggaaa gcttttttat attgtttctt tttcattctg agccacttaa 120
atttcgtgaa tgttcttgta agggacggta gatttacaag tgatacaaca aaaagcaagg 180
cgctttttct aataaaaaga agaaaagcat ttaacaattg aacacctcta tatcaacgaa 240
gaatattact ttgtctctaa atccttgtaa aatgtgtacg atctctatat gggttactca 300
<210> 112
<211> 299
<212> DNA
<213> other sequences
<220>
<223> nucleic acid sequence of terminator tMET25
<400> 112
gtgtgcgtaa tgagttgtaa aattatgtat aaacctactt tctctcacaa gtactatact 60
tttataaaac gaactttatt gaaatgaata tccttttttt cccttgttac atgtcgtgac 120
tcgtactttg aacctaaatt gttctaacat caaagaacag tgttaattcg cagtcgagaa 180
gaaaaatatg gtgaacaaga ctcatctact tcatgagact actttacgcc tcctataaag 240
ctgtcacact ggataaattt attgtaggac caagttacaa aagaggatga tggaggttt 299
<210> 113
<211> 300
<212> DNA
<213> other sequences
<220>
<223> nucleic acid sequence of terminator tDIT1
<400> 113
taaagtaaga gcgctacatt ggtctacctt tttgttcttt tacttaaaca ttagttagtt 60
cgttttcttt ttctcatttt tttatgtttc ccccccaaag ttctgatttt ataatatttt 120
atttcacaca attccattta acagaggggg aatagattct ttagcttaga aaattagtga 180
tcaatatata tttgcctttc ttttcatctt ttcagtgata ttaatggttt cgagacactg 240
caatggccct agttgtctaa gaggatagat gttactgtca aagatgatat tttgaatttc 300
<210> 114
<211> 300
<212> DNA
<213> other sequences
<220>
<223> nucleic acid sequence of terminator tRPL3
<400> 114
gaagttttgt tagaaaataa atcatttttt aattgagcat tcttattcct attttattta 60
aatagtttta tgtattgtta gctacataca acagtttaaa tcaaattttc tttttcccaa 120
gtccaaaatg gaggtttatt ttgatgaccc gcatgcgatt atgttttgaa agtataagac 180
tacatacatg tacatatatt taaacatgta aacccgtcca ttatattgct tactttcttc 240
ttttttgccg ttttgacttg gacctctggt ttgctatttc cttacaatct ttgctacaat 300
<210> 115
<211> 304
<212> DNA
<213> other sequences
<220>
<223> nucleic acid sequence of terminator tRPL3.sm
<400> 115
gaagttttta aagcattttt tagacacttc tcatttttct aagttttttt aaaatagttt 60
tatgtattta ctacgtatca caatttgaaa taattcatct tcccaaaaaa ctaagatttt 120
tatccttgtc acgatccgta accagtttat aatattttag agcttataca cgtacgtata 180
cacacgtgtc ggtacatgag aattacgttc aaaattattc actttttttt tctctgccgt 240
tttacttttg aactctgtct cgctatttcc ttacaatctt cgctacaata ccacttgccc 300
ttgg 304
<210> 116
<211> 299
<212> DNA
<213> other sequences
<220>
<223> nucleic acid sequence of terminator tRPL3.sba
<400> 116
gaagttttct gacaaaaaca taacgttttt tccaatcatt tcttattttt ccggtttatt 60
taaatagttt ttatgtacta ttatacgtat gactatttaa cttaaattct tcctcccaag 120
aaatctccca agtttttcat tatcatggca tacaccacta tcagttacaa aatggtagct 180
caaccatata tatatctcta tatacacata taaatgcaaa caggtccaag tcaccgctca 240
ctgcagtttc ttttgccgtt ttgacttcga tctctgcttg gctattttct cacaatcct 299
<210> 117
<211> 300
<212> DNA
<213> other sequences
<220>
<223> nucleic acid sequence of terminator tRPL41B
<400> 117
gcggattgag agcaaatcgt taagttcagg tcaagtaaaa attgatttcg aaaactaatt 60
tctcttatac aatcctttga ttggaccgtc atcctttcga atataagatt ttgttaagaa 120
tattttagac agagatctac tttatattta atatctagat attacataat ttcctctcta 180
ataaaatatc attaataaaa taaaaatgaa gcgatttgat tttgtgttgt caacttagtt 240
tgccgctatg cctcttgggt aatgctatta ttgaatcgaa gggctttatt atattaccct 300
<210> 118
<211> 301
<212> DNA
<213> other sequences
<220>
<223> nucleic acid sequence of terminator tRPL41B.Sba
<400> 118
gcggattgcg agtgattttt tgagtacaga ccaagtaaaa ttgatctatg cataatcttt 60
tctcatccac aatccctaga atggaccgtc atcctttcta aaatgtttta ttaagaatat 120
ttaaagtgga agtcaggttt atatctatca attaaatatt acataatttc cccttaataa 180
aatactgtta ataaaataac gaaacgttca tagtttttca taaatagtcc tgatgcttac 240
tgcaccggaa cgtactgttt tagtgtattg ctcccttcat tgccattttt cctagttatt 300
g 301
<210> 119
<211> 300
<212> DNA
<213> other sequences
<220>
<223> nucleic acid sequence of terminator tRPL15A
<400> 119
gctggttgat ggaaaatata attttattgg gcaaactttt gtttatctga tgtgttttat 60
actattatct ttttaattaa tgattctata tacaaacctg tatatttttt ctttaaccaa 120
tttttttttt tatagaccta gagctgtact tttattctgc tatcaagcaa acccctaccc 180
cctcttctca atcctcccct caggcagaac ttatctacct gtatcaagga gcggacgagg 240
gagtcctaat tgttctacgt ataccaatgc tagcagctta cataggtggt ggcactacca 300
<210> 120
<211> 299
<212> DNA
<213> other sequences
<220>
<223> nucleic acid sequence of terminator tRPL15A.Sm
<400> 120
gctaattaga accatatata catcgataaa aacacttgaa tgtatttttc tttttcttct 60
tattttttca ttttccttcg ctttctatta gcgtgcgaat ctaaagtgtg cagcgctatc 120
tttgactctt tttttccttt agtgggaacg aacaatatta atcatgccaa gttaagtcat 180
tgaagaagtc agtagtatgt tattcggaga gaagaccctg ctatgtatct cagcctaccc 240
aaaaaatgaa ttgactcctc tcataacttg ttaatattcg gatgagcaca tcacgttcg 299
<210> 121
<211> 300
<212> DNA
<213> other sequences
<220>
<223> nucleic acid sequence of terminator tRPL15A.sba
<400> 121
gctggctgat gaaaaatata gttctgttgg gcaagcattt gtttacctag catctctttt 60
atactattat tatctttata tttgatgatt ttatatacaa gttgtatacc ttttctttaa 120
ccaatttttt tttttctaat ggtgcaccta gaagtacatt ttttctcacc aatagatagt 180
caagatactc ccagcctcta tggcgttacc acggagccga caagggaaag ctgcttatct 240
tacatatgca gatgccaagg cccgttacag gccgccttat tgatgtttag aaatagcttc 300
<210> 122
<211> 300
<212> DNA
<213> other sequences
<220>
<223> nucleic acid sequence of terminator tIDP1
<400> 122
tcgaatttac gtagcccaat ctaccacttt tttttttcat tttttaaagt gttatactta 60
gttatgctct aggataatga actacttttt tttttttttt tttactgtta tcataaatat 120
atatacctta ttgttgtttg caaccgtcgg ttaattcctt atcaaggttc cccaagttcg 180
gatcattacc atcaatttcc aacattttca tgagttcttc ttcttcatta ccgtgtttta 240
gggggctgtt cgcacttcta atagggctat caccaagctg ttctaattcg tccaaaagtt 300
<210> 123
<211> 290
<212> DNA
<213> other sequences
<220>
<223> nucleic acid sequence of terminator tIDP1.Sba
<400> 123
tctgatcttt ggaatgctcc atttactttt ttatttcata tttaggtacg atatatagtt 60
acgcttgaga actatgaact aataacttcc tttttctcta atacatactt acttcagctg 120
atggttgcaa acaacaataa aattccttgt cgaggttccc taaattagga tcattgccat 180
cgacttctaa cattttcatg agatcctcct cttcgttccc attctttaaa agactgtttc 240
cacttctaat agggttatcg cccaattgtt ctagttcgtc tagcaattcg 290
<210> 124
<211> 300
<212> DNA
<213> other sequences
<220>
<223> nucleic acid sequence of terminator tTEF1.sba
<400> 124
ggagattgat aggacttttc tagttgcata tcttttattt ttaaatctta tctattagtt 60
aattttttgt aatttatcct tatatatata gtttggttat tctaaaacat catttcagta 120
tctaaaacct ctcttattca ttaccttttt atttaatggt ttttgctaca ggcaaaaatt 180
taatggtttt tgctacaggc aaaaatcccg ccgtggactt attccacgtt aactcggtta 240
cagggtcatg aaccattttg tcaattatcg aaataacttc ttcaaaagtc cctcttactt 300
<210> 125
<211> 60
<212> DNA
<213> other sequences
<220>
<223> nucleic acid sequence of the secretion sequence added in 5a ?
<400> 125
atgcaattta gcacagtcgc atcagtagcc ttcgttgcct tggccaactt cgtggcagca 60
<210> 126
<211> 20
<212> PRT
<213> other sequences
<220>
<223> amino acid sequence of the secretion sequence added in N-ter
<400> 126
Met Gln Phe Ser Thr Val Ala Ser Val Ala Phe Val Ala Leu Ala Asn
1 5 10 15
Phe Val Ala Ala
20
<210> 127
<211> 213
<212> DNA
<213> other sequences
<220>
<223> nucleic acid sequence of the anchoring sequence added in 3a ?
<400> 127
ggatccgcca tttctcaaat cactgacggt caaatccaag ctactaccac tgctaccacc 60
gaagctacca ccactgctgc cccatcttcc accgttgaaa ctgtttctcc atccagcacc 120
gaaactatct ctcaacaaac tgaaaatggt gctgctaagg ccgctgtcgg tatgggtgcc 180
ggtgctctag ctgctgctgc tatgttgtta taa 213
<210> 128
<211> 68
<212> PRT
<213> other sequences
<220>
<223> amino acid sequence of the anchoring sequence added in C-ter
<400> 128
Ala Ile Ser Gln Ile Thr Asp Gly Gln Ile Gln Ala Thr Thr Thr Ala
1 5 10 15
Thr Thr Glu Ala Thr Thr Thr Ala Ala Pro Ser Ser Thr Val Glu Thr
20 25 30
Val Ser Pro Ser Ser Thr Glu Thr Ile Ser Gln Gln Thr Glu Asn Gly
35 40 45
Ala Ala Lys Ala Ala Val Gly Met Gly Ala Gly Ala Leu Ala Ala Ala
50 55 60
Ala Met Leu Leu
65
Claims (32)
- 콘드로이틴을 생산하는 재조합 효모 세포로서,
(a) 콘드로이틴 신타아제 (HCOS) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산;
(b) UDP-글루코오스 탈수소효소 (UDP-GlcDH 또는 HASB) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산; 및
(c) UDP-글루코오스-4-에피머라아제 (kfoA 또는 GNE1) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산
을 포함하는 재조합 효모 세포. - 제 1 항에 있어서, 재조합 세포가 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산을 포함하고, 콘드로이티나아제 활성을 갖는 폴리펩티드가 분비 신호, 및 임의로는 고정 신호를 포함하는 재조합 세포.
- 콘드로이틴을 생산하는 재조합 숙주 세포로서,
(a) 콘드로이틴 신타아제 (HCOS) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산;
(b) UDP-글루코오스 탈수소효소 (UDP-GlcDH 또는 HASB) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산;
(c) UDP-글루코오스-4-에피머라아제 (kfoA 또는 GNE1) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산; 및
(d) 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산으로서, 콘드로이티나아제 활성을 갖는 폴리펩티드는 분비 신호, 및 임의로는 고정 신호를 포함하여, 콘드로이틴, 특히 원하는 분자량의 콘드로이틴이 숙주 세포에 의해 생산되는 하나 이상의 재조합 핵산
을 포함하는 재조합 숙주 세포. - 제 2 항 또는 제 3 항에 있어서, 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산이 큐피엔니우스 살레이 (Cupiennius salei), 티티우스 세르룰라투스 (Tityus serrulatus), 보스 타우루스 (Bos taurus), 베스파 마그니피카 (Vespa magnifica), 마카카 물라타 (Macaca mulata) 또는 아피스 멜리페라 (Apis mellifera) 중 적어도 하나로부터, 바람직하게는 티티우스 세르룰라투스 (Tityus serrulatus) 로부터 수득되는 또는 유래되는 재조합 숙주 세포.
- 제 2 항 내지 제 4 항 중 어느 한 항에 있어서, 콘드로이틴의 분자량이 50kDa 미만의 범위, 바람직하게는 약 20kDa 내지 약 50kDa 범위인 재조합 세포.
- 제 1 항 내지 제 4 항 중 어느 한 항에 있어서, 콘드로이틴의 분자량이 50kDa 초과의 범위, 바람직하게는 약 50kDa 내지 약 250kDa 범위인 재조합 세포.
- 제 1 항 내지 제 4 항 중 어느 한 항에 있어서, 콘드로이틴의 분자량이 100kDa 초과의 범위, 바람직하게는 약 100kDa 내지 약 1500kDa 범위인 재조합 세포.
- 제 1 항 내지 제 7 항 중 어느 한 항에 있어서, UDP-글루코오스 탈수소효소 (UDP-GlcDH 또는 HASB) 활성을 갖는 폴리펩티드를 코딩하는 핵산이 아라비돕시스 탈리아나 (Arabidopsis thaliana), 클로렐라 바이러스 PBCV1 또는 스트렙토코쿠스 주에피데미쿠스 (Streptococcus zooepidemicus) 중 적어도 하나로부터, 특히 아라비돕시스 탈리아나 (Arabidopsis thaliana) 또는 클로렐라 바이러스 PBCV1 중 적어도 하나로부터 수득되는 또는 유래되는 재조합 세포.
- 제 1 항 내지 제 8 항 중 어느 한 항에 있어서, 콘드로이틴 신타아제 (HCOS) 활성을 갖는 폴리펩티드를 코딩하는 핵산이,
(i) 콘드로이틴 신타아제를 코딩하는 핵산; 또는
(ii) 콘드로이틴 신타아제 활성을 갖는 키메라 폴리펩티드를 코딩하는 핵산
인 재조합 세포. - 제 9 항에 있어서, 핵산이 파스튜렐라 물토시다 (Pasteurella multocida), 클로렐라 바이러스 (Chlorella virus) PBCV1, 마이코박테리움 튜베르쿨로시스 (Mycobacterium tuberculosis), 호모 사피엔스 (Homo sapiens), 에스케리키아 콜라이 (Escherichia coli), 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 또는 페니실룸 옥살리쿰 (Penicillium oxalicum) 중 적어도 하나로부터 수득되는 또는 유래되는 재조합 세포.
- 제 1 항 내지 제 10 항 중 어느 한 항에 있어서, UDP-글루코오스-4-에피머라제 (kfoA 또는 GNE1) 활성을 갖는 폴리펩티드를 코딩하는 핵산이 박테리아로부터, 특히 슈도모나스 아에루기노사 (Pseudomonas aeruginosa), 파스튜렐라 물토시다 (Pasteurella multocida), 및 에스케리키아 콜라이 (Escherichia coli) 로 이루어진 군으로부터 선택되는 박테리아로부터 수득되는 또는 유래되는 재조합 세포.
- 제 1 항 내지 제 11 항 중 어느 한 항에 있어서, 하기:
(i) 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 (GFA1) 활성을 갖는 폴리펩티드; 및/또는
(ii) UDP-N-아세틸글루코사민 피로포스포릴라아제 (QRI1) 활성을 갖는 폴리펩티드
중 하나 이상을 코딩하는 적어도 하나의 재조합 핵산을 추가로 포함하는 재조합 세포. - 제 1 항 내지 제 12 항 중 어느 한 항에 있어서, 하기:
(i) 포스포글루코뮤타아제-1 (PGM1) 활성을 갖는 폴리펩티드;
(ii) UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 (UGP1) 활성을 갖는 폴리펩티드;
(iii) 글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 (GNA1) 활성을 갖는 폴리펩티드; 및/또는
(iv) 포스포아세틸글루코사민 뮤타아제 (PCM1) 활성을 갖는 폴리펩티드
중 하나 이상을 코딩하는 적어도 하나의 재조합 핵산을 추가로 포함하는 재조합 세포. - 제 12 항 또는 제 13 항에 있어서,
- 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 (GFA1) 활성을 갖는 폴리펩티드를 코딩하는 핵산;
- UDP-N-아세틸글루코사민 피로포스포릴라아제 (QRI1) 활성을 갖는 폴리펩티드를 코딩하는 핵산;
- 포스포글루코뮤타아제-1 (PGM1) 활성을 갖는 폴리펩티드를 코딩하는 핵산;
- UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 (UGP1) 활성을 갖는 폴리펩티드를 코딩하는 핵산;
- 글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 (GNA1) 활성을 갖는 폴리펩티드를 코딩하는 핵산; 및/또는
- 포스포아세틸글루코사민 뮤타아제 (PCM1) 를 갖는 폴리펩티드를 코딩하는 핵산
이 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 수득되는 또는 유래되는 재조합 세포. - 제 3 항 내지 제 14 항 중 어느 한 항에 있어서, 재조합 숙주 세포가 효모인 재조합 숙주 세포.
- 제 1 항 내지 제 15 항 중 어느 한 항에 있어서, 재조합 세포가 사카로마이세스 (Saccharomyces) 속, 또는 칸디다 (Candida) 속, 또는 클루이베로마이세스 (Kluyveromyces) 속, 또는 오가타에아 (Ogataea) 속, 또는 야로위아 (Yarrowia) 속, 또는 데바리오마이세스 (Debaryomyces) 속, 또는 아쉬비아 (Ashbya) 속에 속하고, 특히 사카로마이세스 속에 속하는 재조합 세포.
- 제 16 항에 있어서, 재조합 세포가 사카로마이세스 세레비지에 (Saccharomyces cerevisiae), 사카로마이세스 보울라르디이 (Saccharomyces boulardii), 사카로마이세스 바야누스 (Saccharomyces bayanus), 사카로마이세스 파라독수스 (Saccharomyces paradoxus), 사카로마이세스 미카타에 (Saccharomyces mikatae), 사카로마이세스 카스텔리 (Saccharomyces castelli), 칸디다 알비칸스 (Candida albicans), 칸디다 글라브라타 (Candida glabrata), 칸디다 트로피칼리스 (Candida tropicalis), 클루이베로마이세스 락티스 (Kluyveromyces lactis), 클루이베로마이세스 마르시아누스 (Kluyveromyces marxianus), 클루이베로마이세스 폴리스포루스 (Kluyveromyces polysporus), 클루이베로마이세스 테르모톨레렌스 (Kluyveromyces thermotolerens), 오가타에아 폴리모르파 (Ogataea polymorpha), 야로위아 리폴리티카 (Yarrowia lypolytica), 데바리오마이세스 한세니이 (Debaryomyces hansenii) 및 아쉬비아 고시피이 (Ashbya gossypii) 로 이루어지는 군에서 선택되고, 바람직하게는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 인 재조합 세포.
- (a) 제 1 항 내지 제 17 항 중 어느 한 항에 따른 재조합 세포를 원하는 분자량의 콘드로이틴을 생산하기에 충분한 시간 동안 배양 배지에서 배양하는 단계; 및
(b) 임의로는 재조합 세포 및/또는 배양 배지로부터 콘드로이틴을 단리하거나 회수하는 단계
를 포함하는, 원하는 분자량의 콘드로이틴의 생산 방법. - 제 18 항에 있어서, 콘드로이틴이 약 20kDa 내지 약 50kDa 의 분자량을 갖는 생산 방법.
- 제 18 항에 있어서, 콘드로이틴이 약 50kDa 내지 약 150kDa 의 분자량을 갖는 생산 방법.
- 제 18 항에 있어서, 콘드로이틴이 약 150kDa 내지 약 1500kDa 의 분자량을 갖는 생산 방법.
- 제 18 항 내지 제 21 항 중 어느 한 항에 있어서, 재조합 세포가 사카로마이세스 속에 속하는 효모이고, 특히 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 인 생산 방법.
- 제 18 항 내지 제 22 항 중 어느 한 항에 있어서, 원하는 분자량의 콘드로이틴을 생산하기에 충분한 시간이 약 35 시간 내지 약 50 시간, 바람직하게는 약 40 시간 내지 약 50 시간, 바람직하게는 약 48 시간의 기간인 생산 방법.
- 제 18 항 내지 제 23 항 중 어느 한 항에 있어서, 생산된 콘드로이틴의 분자량이 단계 (a) 동안 배양 배지의 pH 를 조절함으로써 제어되는 생산 방법.
- 제 18 항 내지 제 24 항 중 어느 한 항에 있어서, 방법이 산업적 규모로 실행되고, 바람직하게는 배양 배지가 적어도 약 100L 이고, 더욱 바람직하게는 약 1,000L 내지 약 3,000L 범위이고, 더욱 더 바람직하게는 약 10,000L 이거나, 더욱 더 바람직하게는 약 100,000L 이거나, 심지어 약 250,000L 인 생산 방법.
- 제 1 항 내지 제 17 항 중 어느 한 항에 따른 재조합 세포로부터 또는 제 18 항 내지 제 25 항 중 어느 한 항에 따른 방법으로부터 수득가능한 콘드로이틴.
- 제 26 항에 따른 콘드로이틴을 포함하는 배양 배지.
- 제 26 항에 따른 콘드로이틴을 포함하는 조성물.
- (i) 제 5 항 내지 제 7 항 중 어느 한 항에서 정의된 바와 같은 분자량을 갖는 콘드로이틴, (ii) 제 27 항의 배양 배지 또는 (iii) 제 28 항의 조성물을 포함하는 공산품 또는 소비재 또는 소모품.
- 제 29 항에 있어서, 화장품, 향미 제품, 향료 제품, 식료품, 식품, 음료, 식감제, 약학 조성물, 식이 보충제, 기능식품, 세정 제품, 치아 및/또는 구강 위생 조성물인 공산품 또는 소비재 또는 소모품.
- 약 20kDa 내지 약 50kDa, 또는 약 50kDa 내지 약 1000kDa 범위의 분자량을 갖는 콘드로이틴의 생산을 위한 제 2 항 내지 제 17 항 중 어느 한 항에 따른 재조합 세포의 용도.
- (a) 제 1 항 내지 제 17 항 중 어느 한 항에서 정의된 바와 같은 재조합 효모를 배양 배지에서 배양하는 단계; 및
(b) 상기 배양 배지로부터 콘드로이틴을 회수하는 단계
를 포함하는, 콘드로이틴의 생산 방법으로서,
여기서, 단계 (b) 에서 회수된 콘드로이틴은:
- 재조합 효모의 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산의 성질 및 기원,
- 재조합 효모의 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산의 발현을 제어하는 프로모터의 성질 및 기원,
- 재조합 효모의 콘드로이티나아제 활성을 갖는 폴리펩티드와 관련된 고정 및/또는 분비 신호의 존재,
- 재조합 효모를 배양하는 단계 동안 배양 배지의 pH, 및/또는
- 재조합 효모의 배양 지속기간
의 선별을 통해 제어된 분자량을 갖는 생산 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP21166740.7 | 2021-04-01 | ||
EP21166740.7A EP4067487A1 (en) | 2021-04-01 | 2021-04-01 | Chondroitin-producing recombinant cell |
PCT/EP2022/058583 WO2022207797A1 (en) | 2021-04-01 | 2022-03-31 | Chondroitin-producing recombinant cell |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20240007135A true KR20240007135A (ko) | 2024-01-16 |
Family
ID=75362519
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237037339A KR20240007135A (ko) | 2021-04-01 | 2022-03-31 | 콘드로이틴-생산 재조합 세포 |
Country Status (6)
Country | Link |
---|---|
EP (2) | EP4067487A1 (ko) |
JP (1) | JP2024511877A (ko) |
KR (1) | KR20240007135A (ko) |
CN (1) | CN117460824A (ko) |
BR (1) | BR112023019848A2 (ko) |
WO (1) | WO2022207797A1 (ko) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030104601A1 (en) * | 1999-04-01 | 2003-06-05 | Deangelis Paul L. | Chondroitin synthase gene and methods of making and using same |
US8067204B2 (en) | 2005-12-15 | 2011-11-29 | Seikagaku Corporation | Long-chain chondroitin sugar chain and method for producing the same and method for promoting synthesis of chondroitin |
KR101548139B1 (ko) | 2007-04-24 | 2015-08-28 | 세이가가쿠 고교 가부시키가이샤 | 콘드로이틴 생산 세균 및 콘드로이틴 생산 방법 |
KR101848102B1 (ko) | 2010-03-01 | 2018-04-11 | 세이가가쿠 고교 가부시키가이샤 | 콘드로이틴의 박테리아 생산을 위한 조성물 및 방법 |
-
2021
- 2021-04-01 EP EP21166740.7A patent/EP4067487A1/en not_active Withdrawn
-
2022
- 2022-03-31 BR BR112023019848A patent/BR112023019848A2/pt unknown
- 2022-03-31 WO PCT/EP2022/058583 patent/WO2022207797A1/en active Application Filing
- 2022-03-31 CN CN202280039395.9A patent/CN117460824A/zh active Pending
- 2022-03-31 KR KR1020237037339A patent/KR20240007135A/ko unknown
- 2022-03-31 EP EP22713686.8A patent/EP4314270A1/en active Pending
- 2022-03-31 JP JP2023560956A patent/JP2024511877A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
WO2022207797A1 (en) | 2022-10-06 |
BR112023019848A2 (pt) | 2024-01-16 |
JP2024511877A (ja) | 2024-03-15 |
EP4067487A1 (en) | 2022-10-05 |
EP4314270A1 (en) | 2024-02-07 |
CN117460824A (zh) | 2024-01-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10907137B2 (en) | Biosynthesis of oligosaccharides | |
US11739337B2 (en) | Gadusol derivative production in bacteria | |
US20240150742A1 (en) | Gene for efficiently expressing hyaluronic acid hydrolase and expression method thereof | |
US20220112526A1 (en) | Biosynthesis of vanillin from isoeugenol | |
US20220112525A1 (en) | Biosynthesis of vanillin from isoeugenol | |
EP4174175A1 (en) | Hyaluronic acid-producing recombinant cells | |
CN108192899B (zh) | 一种兽疫链球菌乳酸脱氢酶基因突变体及其应用 | |
KR20240007135A (ko) | 콘드로이틴-생산 재조합 세포 | |
Zhang et al. | Metabolic engineering of Aureobasidium melanogenum 9–1 for overproduction of liamocins by enhancing supply of acetyl-CoA and ATP | |
CN109628476B (zh) | 一种利用全细胞转化生产4-羟基异亮氨酸的方法 | |
KR20240007906A (ko) | 히알루론산-생산 재조합 세포 | |
KR20240007134A (ko) | 헤파로산-생산 재조합 세포 | |
EP4067499A1 (en) | Hyaluronic acid-producing recombinant cells | |
US20240052381A1 (en) | Biosynthesis of vanillin from isoeugenol | |
JP7573630B2 (ja) | ヤロウイア属変異体及びそれを用いた脂肪の製造方法 | |
US20240052380A1 (en) | Biosynthesis of vanillin from isoeugenol | |
KR20150134512A (ko) | 메발로네이트 또는 메발로노락톤 생성능을 가지는 재조합 미생물, 및 이를 이용한 메발로네이트 또는 메발로노락톤의 제조방법 | |
KR102605543B1 (ko) | 메티오닌-생산 효모 | |
JP5344517B2 (ja) | 小胞体局在化シグナル付スフィンゴリピッドδ4−デサチュラーゼを用いた形質転換細胞におけるセラミドの製造方法 | |
KR102016050B1 (ko) | 신규한 프로모터 및 이의 용도 | |
KR20050081235A (ko) | 스핑가닌 수산화 효소를 코딩하는 신규한 유전자 및 이유전자를 이용한 스핑고이드 염기의 생산방법 |