KR20190038612A - 레바우디오시드의 고효율 생산을 위한 udp 의존성 글리코실트랜스퍼라제 - Google Patents
레바우디오시드의 고효율 생산을 위한 udp 의존성 글리코실트랜스퍼라제 Download PDFInfo
- Publication number
- KR20190038612A KR20190038612A KR1020197006546A KR20197006546A KR20190038612A KR 20190038612 A KR20190038612 A KR 20190038612A KR 1020197006546 A KR1020197006546 A KR 1020197006546A KR 20197006546 A KR20197006546 A KR 20197006546A KR 20190038612 A KR20190038612 A KR 20190038612A
- Authority
- KR
- South Korea
- Prior art keywords
- seq
- amino acid
- udp
- leu
- glycosyltransferase
- Prior art date
Links
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 54
- 108700023372 Glycosyltransferases Proteins 0.000 title description 15
- 102000051366 Glycosyltransferases Human genes 0.000 title description 15
- 229930188195 rebaudioside Natural products 0.000 title description 12
- 230000001419 dependent effect Effects 0.000 title description 5
- RPYRMTHVSUWHSV-CUZJHZIBSA-N rebaudioside D Chemical compound O([C@H]1[C@H](O)[C@@H](CO)O[C@H]([C@@H]1O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)O[C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(=O)O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O RPYRMTHVSUWHSV-CUZJHZIBSA-N 0.000 claims abstract description 381
- 102000004190 Enzymes Human genes 0.000 claims abstract description 260
- 108090000790 Enzymes Proteins 0.000 claims abstract description 260
- 238000000034 method Methods 0.000 claims abstract description 200
- 235000019202 steviosides Nutrition 0.000 claims abstract description 144
- 150000008144 steviol glycosides Chemical class 0.000 claims abstract description 135
- 239000004383 Steviol glycoside Substances 0.000 claims abstract description 125
- 235000019411 steviol glycoside Nutrition 0.000 claims abstract description 121
- 229930182488 steviol glycoside Natural products 0.000 claims abstract description 121
- 239000000203 mixture Substances 0.000 claims abstract description 86
- 230000037361 pathway Effects 0.000 claims abstract description 60
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 50
- 239000002773 nucleotide Substances 0.000 claims abstract description 48
- -1 but not limited to Chemical class 0.000 claims abstract description 33
- 210000004027 cell Anatomy 0.000 claims description 413
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 378
- 150000007523 nucleic acids Chemical class 0.000 claims description 145
- 102000039446 nucleic acids Human genes 0.000 claims description 140
- 108020004707 nucleic acids Proteins 0.000 claims description 140
- 235000001014 amino acid Nutrition 0.000 claims description 128
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 124
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 123
- 229920001184 polypeptide Polymers 0.000 claims description 122
- 108090000623 proteins and genes Proteins 0.000 claims description 69
- 229940024606 amino acid Drugs 0.000 claims description 57
- 239000008103 glucose Substances 0.000 claims description 55
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims description 49
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 claims description 48
- 238000000855 fermentation Methods 0.000 claims description 48
- 230000004151 fermentation Effects 0.000 claims description 48
- 235000000346 sugar Nutrition 0.000 claims description 46
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 claims description 42
- 229910052799 carbon Inorganic materials 0.000 claims description 42
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 claims description 41
- 229940032084 steviol Drugs 0.000 claims description 39
- QFVOYBUQQBFCRH-UHFFFAOYSA-N Steviol Natural products C1CC2(C3)CC(=C)C3(O)CCC2C2(C)C1C(C)(C(O)=O)CCC2 QFVOYBUQQBFCRH-UHFFFAOYSA-N 0.000 claims description 38
- QFVOYBUQQBFCRH-VQSWZGCSSA-N steviol Chemical compound C([C@@]1(O)C(=C)C[C@@]2(C1)CC1)C[C@H]2[C@@]2(C)[C@H]1[C@](C)(C(O)=O)CCC2 QFVOYBUQQBFCRH-VQSWZGCSSA-N 0.000 claims description 38
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical group NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 claims description 35
- 240000006365 Vitis vinifera Species 0.000 claims description 29
- 150000001875 compounds Chemical class 0.000 claims description 24
- UEDUENGHJMELGK-HYDKPPNVSA-N Stevioside Chemical compound O([C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(=O)O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O UEDUENGHJMELGK-HYDKPPNVSA-N 0.000 claims description 23
- OHHNJQXIOPOJSC-UHFFFAOYSA-N stevioside Natural products CC1(CCCC2(C)C3(C)CCC4(CC3(CCC12C)CC4=C)OC5OC(CO)C(O)C(O)C5OC6OC(CO)C(O)C(O)C6O)C(=O)OC7OC(CO)C(O)C(O)C7O OHHNJQXIOPOJSC-UHFFFAOYSA-N 0.000 claims description 23
- 229940013618 stevioside Drugs 0.000 claims description 23
- 125000000539 amino acid group Chemical group 0.000 claims description 22
- 230000015572 biosynthetic process Effects 0.000 claims description 17
- 239000000758 substrate Substances 0.000 claims description 17
- ONVABDHFQKWOSV-UHFFFAOYSA-N 16-Phyllocladene Natural products C1CC(C2)C(=C)CC32CCC2C(C)(C)CCCC2(C)C31 ONVABDHFQKWOSV-UHFFFAOYSA-N 0.000 claims description 13
- 238000012258 culturing Methods 0.000 claims description 13
- 235000011180 diphosphates Nutrition 0.000 claims description 13
- 238000001727 in vivo Methods 0.000 claims description 13
- 239000002253 acid Substances 0.000 claims description 12
- 102100039291 Geranylgeranyl pyrophosphate synthase Human genes 0.000 claims description 11
- 238000002864 sequence alignment Methods 0.000 claims description 11
- 239000000126 substance Substances 0.000 claims description 11
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 10
- 108010045510 NADPH-Ferrihemoprotein Reductase Proteins 0.000 claims description 10
- 239000001177 diphosphate Substances 0.000 claims description 10
- 235000003599 food sweetener Nutrition 0.000 claims description 10
- 239000003765 sweetening agent Substances 0.000 claims description 10
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 claims description 9
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 claims description 8
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 claims description 8
- 235000013922 glutamic acid Nutrition 0.000 claims description 8
- 239000004220 glutamic acid Substances 0.000 claims description 8
- 239000004474 valine Substances 0.000 claims description 8
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 claims description 7
- 108010007508 Farnesyltranstransferase Proteins 0.000 claims description 6
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 claims description 6
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 claims description 6
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 claims description 5
- 230000013595 glycosylation Effects 0.000 claims description 5
- 238000006206 glycosylation reaction Methods 0.000 claims description 5
- 229960000310 isoleucine Drugs 0.000 claims description 5
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 claims description 5
- 241000196324 Embryophyta Species 0.000 claims description 4
- 108010067758 ent-kaurene oxidase Proteins 0.000 claims description 4
- 210000005253 yeast cell Anatomy 0.000 claims description 4
- 241000238631 Hexapoda Species 0.000 claims description 3
- 108010074633 Mixed Function Oxygenases Proteins 0.000 claims description 3
- 102000008109 Mixed Function Oxygenases Human genes 0.000 claims description 3
- 230000001580 bacterial effect Effects 0.000 claims description 3
- ONVABDHFQKWOSV-HPUSYDDDSA-N ent-kaur-16-ene Chemical compound C1C[C@H](C2)C(=C)C[C@@]32CC[C@@H]2C(C)(C)CCC[C@@]2(C)[C@@H]31 ONVABDHFQKWOSV-HPUSYDDDSA-N 0.000 claims description 3
- 230000001588 bifunctional effect Effects 0.000 claims description 2
- 229920001577 copolymer Polymers 0.000 claims description 2
- 230000002538 fungal effect Effects 0.000 claims description 2
- 241000954177 Bangana ariza Species 0.000 claims 26
- 101100427140 Stevia rebaudiana UGT74G1 gene Proteins 0.000 claims 2
- 101100262416 Stevia rebaudiana UGT76G1 gene Proteins 0.000 claims 2
- 101100048059 Stevia rebaudiana UGT85C2 gene Proteins 0.000 claims 2
- 125000002987 valine group Chemical group [H]N([H])C([H])(C(*)=O)C([H])(C([H])([H])[H])C([H])([H])[H] 0.000 claims 2
- 108010064741 ent-kaurene synthetase A Proteins 0.000 claims 1
- 238000012163 sequencing technique Methods 0.000 claims 1
- 230000002103 transcriptional effect Effects 0.000 claims 1
- GSGVXNMGMKBGQU-PHESRWQRSA-N rebaudioside M Chemical compound C[C@@]12CCC[C@](C)([C@H]1CC[C@@]13CC(=C)[C@@](C1)(CC[C@@H]23)O[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O[C@@H]2O[C@H](CO)[C@@H](O)[C@H](O)[C@H]2O)[C@H]1O[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O)C(=O)O[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O[C@@H]2O[C@H](CO)[C@@H](O)[C@H](O)[C@H]2O)[C@H]1O[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O GSGVXNMGMKBGQU-PHESRWQRSA-N 0.000 abstract description 124
- 230000001976 improved effect Effects 0.000 abstract description 6
- 230000001851 biosynthetic effect Effects 0.000 abstract description 2
- 229940088598 enzyme Drugs 0.000 description 242
- 239000001512 FEMA 4601 Substances 0.000 description 167
- HELXLJCILKEWJH-SEAGSNCFSA-N Rebaudioside A Natural products O=C(O[C@H]1[C@@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1)[C@@]1(C)[C@@H]2[C@](C)([C@H]3[C@@]4(CC(=C)[C@@](O[C@H]5[C@H](O[C@H]6[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O6)[C@@H](O[C@H]6[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O6)[C@H](O)[C@@H](CO)O5)(C4)CC3)CC2)CCC1 HELXLJCILKEWJH-SEAGSNCFSA-N 0.000 description 167
- HELXLJCILKEWJH-UHFFFAOYSA-N entered according to Sigma 01432 Natural products C1CC2C3(C)CCCC(C)(C(=O)OC4C(C(O)C(O)C(CO)O4)O)C3CCC2(C2)CC(=C)C21OC(C1OC2C(C(O)C(O)C(CO)O2)O)OC(CO)C(O)C1OC1OC(CO)C(O)C(O)C1O HELXLJCILKEWJH-UHFFFAOYSA-N 0.000 description 167
- 235000019203 rebaudioside A Nutrition 0.000 description 167
- HELXLJCILKEWJH-NCGAPWICSA-N rebaudioside A Chemical compound O([C@H]1[C@H](O)[C@@H](CO)O[C@H]([C@@H]1O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)O[C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(=O)O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O HELXLJCILKEWJH-NCGAPWICSA-N 0.000 description 158
- 238000006243 chemical reaction Methods 0.000 description 68
- 239000001963 growth medium Substances 0.000 description 65
- ZSLZBFCDCINBPY-ZSJPKINUSA-N acetyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 ZSLZBFCDCINBPY-ZSJPKINUSA-N 0.000 description 60
- 230000000694 effects Effects 0.000 description 46
- 239000000386 donor Substances 0.000 description 45
- 102000004286 Hydroxymethylglutaryl CoA Reductases Human genes 0.000 description 40
- 108090000895 Hydroxymethylglutaryl CoA Reductases Proteins 0.000 description 40
- 239000002609 medium Substances 0.000 description 38
- NUHSROFQTUXZQQ-UHFFFAOYSA-N isopentenyl diphosphate Chemical compound CC(=C)CCO[P@](O)(=O)OP(O)(O)=O NUHSROFQTUXZQQ-UHFFFAOYSA-N 0.000 description 32
- 239000000047 product Substances 0.000 description 30
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 28
- 108091028043 Nucleic acid sequence Proteins 0.000 description 26
- KJTLQQUUPVSXIM-ZCFIWIBFSA-N (R)-mevalonic acid Chemical compound OCC[C@](O)(C)CC(O)=O KJTLQQUUPVSXIM-ZCFIWIBFSA-N 0.000 description 23
- 238000007792 addition Methods 0.000 description 23
- 150000001413 amino acids Chemical class 0.000 description 22
- 102000004169 proteins and genes Human genes 0.000 description 21
- QSIDJGUAAUSPMG-CULFPKEHSA-N steviolmonoside Chemical compound O([C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(O)=O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O QSIDJGUAAUSPMG-CULFPKEHSA-N 0.000 description 21
- 238000006467 substitution reaction Methods 0.000 description 21
- OJFDKHTZOUZBOS-CITAKDKDSA-N acetoacetyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)CC(=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 OJFDKHTZOUZBOS-CITAKDKDSA-N 0.000 description 20
- KJTLQQUUPVSXIM-UHFFFAOYSA-N DL-mevalonic acid Natural products OCCC(O)(C)CC(O)=O KJTLQQUUPVSXIM-UHFFFAOYSA-N 0.000 description 19
- 101710171974 UDP-glycosyltransferase 76G1 Proteins 0.000 description 19
- 108091033319 polynucleotide Proteins 0.000 description 19
- 102000040430 polynucleotide Human genes 0.000 description 19
- 239000002157 polynucleotide Substances 0.000 description 19
- 235000018102 proteins Nutrition 0.000 description 19
- 244000228451 Stevia rebaudiana Species 0.000 description 18
- 244000005700 microbiome Species 0.000 description 18
- 108020004705 Codon Proteins 0.000 description 17
- 230000012010 growth Effects 0.000 description 17
- 241000219195 Arabidopsis thaliana Species 0.000 description 15
- 101710177825 UDP-glycosyltransferase 74G1 Proteins 0.000 description 14
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 14
- 229910052757 nitrogen Inorganic materials 0.000 description 14
- 235000006092 Stevia rebaudiana Nutrition 0.000 description 13
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 13
- 238000004113 cell culture Methods 0.000 description 13
- 108020004414 DNA Proteins 0.000 description 12
- 241000589516 Pseudomonas Species 0.000 description 12
- 125000002791 glucosyl group Chemical group C1([C@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 12
- 108030002854 Acetoacetyl-CoA synthases Proteins 0.000 description 11
- 241000282414 Homo sapiens Species 0.000 description 11
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 11
- 101710172549 UDP-glycosyltransferase 85C2 Proteins 0.000 description 11
- 210000004899 c-terminal region Anatomy 0.000 description 11
- 238000012217 deletion Methods 0.000 description 11
- 230000037430 deletion Effects 0.000 description 11
- CBIDRCWHNCKSTO-UHFFFAOYSA-N prenyl diphosphate Chemical compound CC(C)=CCO[P@](O)(=O)OP(O)(O)=O CBIDRCWHNCKSTO-UHFFFAOYSA-N 0.000 description 11
- 230000008569 process Effects 0.000 description 11
- CABVTRNMFUVUDM-VRHQGPGLSA-N (3S)-3-hydroxy-3-methylglutaryl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)C[C@@](O)(CC(O)=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 CABVTRNMFUVUDM-VRHQGPGLSA-N 0.000 description 10
- 230000035772 mutation Effects 0.000 description 10
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 9
- OINNEUNVOZHBOX-XBQSVVNOSA-N Geranylgeranyl diphosphate Natural products [P@](=O)(OP(=O)(O)O)(OC/C=C(\CC/C=C(\CC/C=C(\CC/C=C(\C)/C)/C)/C)/C)O OINNEUNVOZHBOX-XBQSVVNOSA-N 0.000 description 9
- 229910019142 PO4 Inorganic materials 0.000 description 9
- 238000003780 insertion Methods 0.000 description 9
- 230000037431 insertion Effects 0.000 description 9
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 9
- 239000010452 phosphate Substances 0.000 description 9
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 8
- 241000588724 Escherichia coli Species 0.000 description 8
- LTYOQGRJFJAKNA-KKIMTKSISA-N Malonyl CoA Natural products S(C(=O)CC(=O)O)CCNC(=O)CCNC(=O)[C@@H](O)C(CO[P@](=O)(O[P@](=O)(OC[C@H]1[C@@H](OP(=O)(O)O)[C@@H](O)[C@@H](n2c3ncnc(N)c3nc2)O1)O)O)(C)C LTYOQGRJFJAKNA-KKIMTKSISA-N 0.000 description 8
- 241000187747 Streptomyces Species 0.000 description 8
- 102000002932 Thiolase Human genes 0.000 description 8
- 108060008225 Thiolase Proteins 0.000 description 8
- XCCTYIAWTASOJW-XVFCMESISA-N Uridine-5'-Diphosphate Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(=O)OP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1 XCCTYIAWTASOJW-XVFCMESISA-N 0.000 description 8
- 230000010354 integration Effects 0.000 description 8
- LTYOQGRJFJAKNA-DVVLENMVSA-N malonyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)CC(O)=O)O[C@H]1N1C2=NC=NC(N)=C2N=C1 LTYOQGRJFJAKNA-DVVLENMVSA-N 0.000 description 8
- 230000000813 microbial effect Effects 0.000 description 8
- 230000009466 transformation Effects 0.000 description 8
- OKZYCXHTTZZYSK-ZCFIWIBFSA-N (R)-5-phosphomevalonic acid Chemical compound OC(=O)C[C@@](O)(C)CCOP(O)(O)=O OKZYCXHTTZZYSK-ZCFIWIBFSA-N 0.000 description 7
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 7
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 7
- 241000235648 Pichia Species 0.000 description 7
- 208000032826 Ring chromosome 3 syndrome Diseases 0.000 description 7
- 102000004357 Transferases Human genes 0.000 description 7
- 108090000992 Transferases Proteins 0.000 description 7
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 7
- 229930182470 glycoside Natural products 0.000 description 7
- 230000001965 increasing effect Effects 0.000 description 7
- 239000011777 magnesium Substances 0.000 description 7
- 229910052749 magnesium Inorganic materials 0.000 description 7
- 229910052751 metal Inorganic materials 0.000 description 7
- 239000002184 metal Substances 0.000 description 7
- 150000002739 metals Chemical class 0.000 description 7
- 230000002441 reversible effect Effects 0.000 description 7
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 7
- 229940045145 uridine Drugs 0.000 description 7
- 239000004475 Arginine Substances 0.000 description 6
- 241000588722 Escherichia Species 0.000 description 6
- 108010066605 Geranylgeranyl-Diphosphate Geranylgeranyltransferase Proteins 0.000 description 6
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 6
- 238000011534 incubation Methods 0.000 description 6
- 239000003550 marker Substances 0.000 description 6
- 235000015097 nutrients Nutrition 0.000 description 6
- OINNEUNVOZHBOX-QIRCYJPOSA-K 2-trans,6-trans,10-trans-geranylgeranyl diphosphate(3-) Chemical compound CC(C)=CCC\C(C)=C\CC\C(C)=C\CC\C(C)=C\COP([O-])(=O)OP([O-])([O-])=O OINNEUNVOZHBOX-QIRCYJPOSA-K 0.000 description 5
- 102100031780 Endonuclease Human genes 0.000 description 5
- 108010042407 Endonucleases Proteins 0.000 description 5
- 102000004316 Oxidoreductases Human genes 0.000 description 5
- 108090000854 Oxidoreductases Proteins 0.000 description 5
- 108700023175 Phosphate acetyltransferases Proteins 0.000 description 5
- 241000607768 Shigella Species 0.000 description 5
- XJLXINKUBYWONI-DQQFMEOOSA-N [[(2r,3r,4r,5r)-5-(6-aminopurin-9-yl)-3-hydroxy-4-phosphonooxyoxolan-2-yl]methoxy-hydroxyphosphoryl] [(2s,3r,4s,5s)-5-(3-carbamoylpyridin-1-ium-1-yl)-3,4-dihydroxyoxolan-2-yl]methyl phosphate Chemical compound NC(=O)C1=CC=C[N+]([C@@H]2[C@H]([C@@H](O)[C@H](COP([O-])(=O)OP(O)(=O)OC[C@@H]3[C@H]([C@@H](OP(O)(O)=O)[C@@H](O3)N3C4=NC=NC(N)=C4N=C3)O)O2)O)=C1 XJLXINKUBYWONI-DQQFMEOOSA-N 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 239000008346 aqueous phase Substances 0.000 description 5
- 108010047857 aspartylglycine Proteins 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 5
- 238000013461 design Methods 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 150000002338 glycosides Chemical class 0.000 description 5
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 5
- 108010057821 leucylproline Proteins 0.000 description 5
- XIXADJRWDQXREU-UHFFFAOYSA-M lithium acetate Chemical compound [Li+].CC([O-])=O XIXADJRWDQXREU-UHFFFAOYSA-M 0.000 description 5
- 229930027945 nicotinamide-adenine dinucleotide Natural products 0.000 description 5
- 229920001550 polyprenyl Polymers 0.000 description 5
- 125000001185 polyprenyl group Polymers 0.000 description 5
- 238000000926 separation method Methods 0.000 description 5
- 239000000243 solution Substances 0.000 description 5
- 238000012546 transfer Methods 0.000 description 5
- 241000193830 Bacillus <bacterium> Species 0.000 description 4
- 241000186146 Brevibacterium Species 0.000 description 4
- 241000282326 Felis catus Species 0.000 description 4
- 101000773364 Homo sapiens Beta-alanine-activating enzyme Proteins 0.000 description 4
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 4
- 241000316848 Rhodococcus <scale insect> Species 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- 241000191967 Staphylococcus aureus Species 0.000 description 4
- 229930006000 Sucrose Natural products 0.000 description 4
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 4
- 101150050575 URA3 gene Proteins 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 4
- 230000003115 biocidal effect Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 230000003197 catalytic effect Effects 0.000 description 4
- 230000010261 cell growth Effects 0.000 description 4
- 239000002738 chelating agent Substances 0.000 description 4
- 230000000295 complement effect Effects 0.000 description 4
- 230000002255 enzymatic effect Effects 0.000 description 4
- OINNEUNVOZHBOX-KGODAQDXSA-N geranylgeranyl diphosphate Chemical compound CC(C)=CCC\C(C)=C/CC\C(C)=C\CC\C(C)=C\CO[P@@](O)(=O)OP(O)(O)=O OINNEUNVOZHBOX-KGODAQDXSA-N 0.000 description 4
- 108010050848 glycylleucine Proteins 0.000 description 4
- 238000000338 in vitro Methods 0.000 description 4
- 230000014759 maintenance of location Effects 0.000 description 4
- 108020004999 messenger RNA Proteins 0.000 description 4
- BDAGIHXWWSANSR-UHFFFAOYSA-N methanoic acid Natural products OC=O BDAGIHXWWSANSR-UHFFFAOYSA-N 0.000 description 4
- 150000002772 monosaccharides Chemical group 0.000 description 4
- 239000012071 phase Substances 0.000 description 4
- 239000013612 plasmid Substances 0.000 description 4
- 230000001105 regulatory effect Effects 0.000 description 4
- 150000003839 salts Chemical class 0.000 description 4
- 238000012216 screening Methods 0.000 description 4
- 241000894007 species Species 0.000 description 4
- 239000005720 sucrose Substances 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 229910021654 trace metal Inorganic materials 0.000 description 4
- 239000011782 vitamin Substances 0.000 description 4
- 235000013343 vitamin Nutrition 0.000 description 4
- 229940088594 vitamin Drugs 0.000 description 4
- 229930003231 vitamin Natural products 0.000 description 4
- GHOKWGTUZJEAQD-ZETCQYMHSA-N (D)-(+)-Pantothenic acid Chemical compound OCC(C)(C)[C@@H](O)C(=O)NCCC(O)=O GHOKWGTUZJEAQD-ZETCQYMHSA-N 0.000 description 3
- 101710163881 5,6-dihydroxyindole-2-carboxylic acid oxidase Proteins 0.000 description 3
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 3
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 3
- 102100030981 Beta-alanine-activating enzyme Human genes 0.000 description 3
- 239000002028 Biomass Substances 0.000 description 3
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 3
- 241000193403 Clostridium Species 0.000 description 3
- 108091026890 Coding region Proteins 0.000 description 3
- 241001527609 Cryptococcus Species 0.000 description 3
- 102000057412 Diphosphomevalonate decarboxylases Human genes 0.000 description 3
- 241001465321 Eremothecium Species 0.000 description 3
- 101150094690 GAL1 gene Proteins 0.000 description 3
- 102100028501 Galanin peptides Human genes 0.000 description 3
- INGJLBQKTRJLFO-UKJIMTQDSA-N Glu-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O INGJLBQKTRJLFO-UKJIMTQDSA-N 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 101100246753 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) pyrF gene Proteins 0.000 description 3
- 101100121078 Homo sapiens GAL gene Proteins 0.000 description 3
- 102000002284 Hydroxymethylglutaryl-CoA Synthase Human genes 0.000 description 3
- 108010000775 Hydroxymethylglutaryl-CoA synthase Proteins 0.000 description 3
- 241001138401 Kluyveromyces lactis Species 0.000 description 3
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 3
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 3
- 241000186660 Lactobacillus Species 0.000 description 3
- 241000194036 Lactococcus Species 0.000 description 3
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 3
- QMKFDEUJGYNFMC-AVGNSLFASA-N Leu-Pro-Arg Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QMKFDEUJGYNFMC-AVGNSLFASA-N 0.000 description 3
- 239000004472 Lysine Substances 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 3
- 108700040132 Mevalonate kinases Proteins 0.000 description 3
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 3
- 108010079364 N-glycylalanine Proteins 0.000 description 3
- 238000005481 NMR spectroscopy Methods 0.000 description 3
- 101000958834 Neosartorya fumigata (strain ATCC MYA-4609 / Af293 / CBS 101355 / FGSC A1100) Diphosphomevalonate decarboxylase mvd1 Proteins 0.000 description 3
- 241000320412 Ogataea angusta Species 0.000 description 3
- 101000958925 Panax ginseng Diphosphomevalonate decarboxylase 1 Proteins 0.000 description 3
- KWYUFKZDYYNOTN-UHFFFAOYSA-M Potassium hydroxide Chemical compound [OH-].[K+] KWYUFKZDYYNOTN-UHFFFAOYSA-M 0.000 description 3
- 241000191025 Rhodobacter Species 0.000 description 3
- 208000002991 Ring chromosome 4 syndrome Diseases 0.000 description 3
- 241000235003 Saccharomycopsis Species 0.000 description 3
- 241000607142 Salmonella Species 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- 240000003768 Solanum lycopersicum Species 0.000 description 3
- 241000191940 Staphylococcus Species 0.000 description 3
- 241000187180 Streptomyces sp. Species 0.000 description 3
- QHDXUYOYTPWCSK-RCOVLWMOSA-N Val-Asp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N QHDXUYOYTPWCSK-RCOVLWMOSA-N 0.000 description 3
- 150000007513 acids Chemical class 0.000 description 3
- 238000007259 addition reaction Methods 0.000 description 3
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 3
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 3
- 238000003556 assay Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 239000011575 calcium Substances 0.000 description 3
- 229910052791 calcium Inorganic materials 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000004587 chromatography analysis Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 235000015872 dietary supplement Nutrition 0.000 description 3
- XPPKVPWEQAFLFU-UHFFFAOYSA-N diphosphoric acid Chemical compound OP(O)(=O)OP(O)(O)=O XPPKVPWEQAFLFU-UHFFFAOYSA-N 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 235000013305 food Nutrition 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- GVVPGTZRZFNKDS-JXMROGBWSA-N geranyl diphosphate Chemical compound CC(C)=CCC\C(C)=C\CO[P@](O)(=O)OP(O)(O)=O GVVPGTZRZFNKDS-JXMROGBWSA-N 0.000 description 3
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 3
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 3
- 108010023364 glycyl-histidyl-arginine Proteins 0.000 description 3
- 108010037850 glycylvaline Proteins 0.000 description 3
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 102000002678 mevalonate kinase Human genes 0.000 description 3
- 238000002703 mutagenesis Methods 0.000 description 3
- 231100000350 mutagenesis Toxicity 0.000 description 3
- 229940014662 pantothenate Drugs 0.000 description 3
- 235000019161 pantothenic acid Nutrition 0.000 description 3
- 239000011713 pantothenic acid Substances 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 238000011084 recovery Methods 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 238000000638 solvent extraction Methods 0.000 description 3
- 235000019527 sweetened beverage Nutrition 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- GGKNTGJPGZQNID-UHFFFAOYSA-N (1-$l^{1}-oxidanyl-2,2,6,6-tetramethylpiperidin-4-yl)-trimethylazanium Chemical compound CC1(C)CC([N+](C)(C)C)CC(C)(C)N1[O] GGKNTGJPGZQNID-UHFFFAOYSA-N 0.000 description 2
- OYIFNHCXNCRBQI-UHFFFAOYSA-N 2-aminoadipic acid Chemical compound OC(=O)C(N)CCCC(O)=O OYIFNHCXNCRBQI-UHFFFAOYSA-N 0.000 description 2
- 238000005084 2D-nuclear magnetic resonance Methods 0.000 description 2
- OSWFIVFLDKOXQC-UHFFFAOYSA-N 4-(3-methoxyphenyl)aniline Chemical compound COC1=CC=CC(C=2C=CC(N)=CC=2)=C1 OSWFIVFLDKOXQC-UHFFFAOYSA-N 0.000 description 2
- ZHBXLZQQVCDGPA-UHFFFAOYSA-N 5-[(1,3-dioxo-2-benzofuran-5-yl)sulfonyl]-2-benzofuran-1,3-dione Chemical compound C1=C2C(=O)OC(=O)C2=CC(S(=O)(=O)C=2C=C3C(=O)OC(C3=CC=2)=O)=C1 ZHBXLZQQVCDGPA-UHFFFAOYSA-N 0.000 description 2
- SEHFUALWMUWDKS-UHFFFAOYSA-N 5-fluoroorotic acid Chemical compound OC(=O)C=1NC(=O)NC(=O)C=1F SEHFUALWMUWDKS-UHFFFAOYSA-N 0.000 description 2
- 102100039601 ARF GTPase-activating protein GIT1 Human genes 0.000 description 2
- 101710194905 ARF GTPase-activating protein GIT1 Proteins 0.000 description 2
- 244000178606 Abies grandis Species 0.000 description 2
- 235000017894 Abies grandis Nutrition 0.000 description 2
- 241000589158 Agrobacterium Species 0.000 description 2
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 2
- LSLIRHLIUDVNBN-CIUDSAMLSA-N Ala-Asp-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LSLIRHLIUDVNBN-CIUDSAMLSA-N 0.000 description 2
- NWVVKQZOVSTDBQ-CIUDSAMLSA-N Ala-Glu-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NWVVKQZOVSTDBQ-CIUDSAMLSA-N 0.000 description 2
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 2
- DHBKYZYFEXXUAK-ONGXEEELSA-N Ala-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 DHBKYZYFEXXUAK-ONGXEEELSA-N 0.000 description 2
- VHUUQVKOLVNVRT-UHFFFAOYSA-N Ammonium hydroxide Chemical compound [NH4+].[OH-] VHUUQVKOLVNVRT-UHFFFAOYSA-N 0.000 description 2
- 101100433757 Arabidopsis thaliana ABCG32 gene Proteins 0.000 description 2
- NMRHDSAOIURTNT-RWMBFGLXSA-N Arg-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NMRHDSAOIURTNT-RWMBFGLXSA-N 0.000 description 2
- 235000001405 Artemisia annua Nutrition 0.000 description 2
- 240000000011 Artemisia annua Species 0.000 description 2
- QCVXMEHGFUMKCO-YUMQZZPRSA-N Asp-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O QCVXMEHGFUMKCO-YUMQZZPRSA-N 0.000 description 2
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 2
- YWLDTBBUHZJQHW-KKUMJFAQSA-N Asp-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N YWLDTBBUHZJQHW-KKUMJFAQSA-N 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- 241000193755 Bacillus cereus Species 0.000 description 2
- 244000063299 Bacillus subtilis Species 0.000 description 2
- 235000014469 Bacillus subtilis Nutrition 0.000 description 2
- 241000193365 Bacillus thuringiensis serovar israelensis Species 0.000 description 2
- 241000722885 Brettanomyces Species 0.000 description 2
- 235000006810 Caesalpinia ciliata Nutrition 0.000 description 2
- 241000059739 Caesalpinia ciliata Species 0.000 description 2
- 108700010070 Codon Usage Proteins 0.000 description 2
- 241000186216 Corynebacterium Species 0.000 description 2
- SRBFZHDQGSBBOR-IOVATXLUSA-N D-xylopyranose Chemical compound O[C@@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-IOVATXLUSA-N 0.000 description 2
- 101150074155 DHFR gene Proteins 0.000 description 2
- 241001600129 Delftia Species 0.000 description 2
- 241001600125 Delftia acidovorans Species 0.000 description 2
- 241000588914 Enterobacter Species 0.000 description 2
- 241000233866 Fungi Species 0.000 description 2
- 241000605986 Fusobacterium nucleatum Species 0.000 description 2
- 101150077230 GAL4 gene Proteins 0.000 description 2
- FBEJIDRSQCGFJI-GUBZILKMSA-N Glu-Leu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FBEJIDRSQCGFJI-GUBZILKMSA-N 0.000 description 2
- 102000000340 Glucosyltransferases Human genes 0.000 description 2
- 108010055629 Glucosyltransferases Proteins 0.000 description 2
- TVDHVLGFJSHPAX-UWVGGRQHSA-N Gly-His-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 TVDHVLGFJSHPAX-UWVGGRQHSA-N 0.000 description 2
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 2
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 2
- 241001149669 Hanseniaspora Species 0.000 description 2
- 101710081758 High affinity cationic amino acid transporter 1 Proteins 0.000 description 2
- TVMNTHXFRSXZGR-IHRRRGAJSA-N His-Lys-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O TVMNTHXFRSXZGR-IHRRRGAJSA-N 0.000 description 2
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 2
- HGNUKGZQASSBKQ-PCBIJLKTSA-N Ile-Asp-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N HGNUKGZQASSBKQ-PCBIJLKTSA-N 0.000 description 2
- 108010065958 Isopentenyl-diphosphate Delta-isomerase Proteins 0.000 description 2
- 241000235649 Kluyveromyces Species 0.000 description 2
- 244000285963 Kluyveromyces fragilis Species 0.000 description 2
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 2
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 2
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 2
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- 241000880493 Leptailurus serval Species 0.000 description 2
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 2
- 241001149698 Lipomyces Species 0.000 description 2
- 240000000894 Lupinus albus Species 0.000 description 2
- 235000010649 Lupinus albus Nutrition 0.000 description 2
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 2
- 241000699660 Mus musculus Species 0.000 description 2
- 241000186359 Mycobacterium Species 0.000 description 2
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 2
- 240000007594 Oryza sativa Species 0.000 description 2
- 235000007164 Oryza sativa Nutrition 0.000 description 2
- 101100054296 Oryza sativa subsp. japonica ABCG37 gene Proteins 0.000 description 2
- 101100107593 Oryza sativa subsp. japonica ABCG40 gene Proteins 0.000 description 2
- 239000001888 Peptone Substances 0.000 description 2
- 108010080698 Peptones Proteins 0.000 description 2
- CMHTUJQZQXFNTQ-OEAJRASXSA-N Phe-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O CMHTUJQZQXFNTQ-OEAJRASXSA-N 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 2
- 241000235645 Pichia kudriavzevii Species 0.000 description 2
- OCSACVPBMIYNJE-GUBZILKMSA-N Pro-Arg-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O OCSACVPBMIYNJE-GUBZILKMSA-N 0.000 description 2
- FXGIMYRVJJEIIM-UWVGGRQHSA-N Pro-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FXGIMYRVJJEIIM-UWVGGRQHSA-N 0.000 description 2
- KBUAPZAZPWNYSW-SRVKXCTJSA-N Pro-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KBUAPZAZPWNYSW-SRVKXCTJSA-N 0.000 description 2
- YIPFBJGBRCJJJD-FHWLQOOXSA-N Pro-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@@H]3CCCN3 YIPFBJGBRCJJJD-FHWLQOOXSA-N 0.000 description 2
- 102000001253 Protein Kinase Human genes 0.000 description 2
- JUJWROOIHBZHMG-UHFFFAOYSA-N Pyridine Chemical compound C1=CC=NC=C1 JUJWROOIHBZHMG-UHFFFAOYSA-N 0.000 description 2
- 241000522615 Pyrococcus horikoshii Species 0.000 description 2
- 241000700157 Rattus norvegicus Species 0.000 description 2
- 241000191023 Rhodobacter capsulatus Species 0.000 description 2
- 241000191043 Rhodobacter sphaeroides Species 0.000 description 2
- 241000223252 Rhodotorula Species 0.000 description 2
- 241000030574 Ruegeria pomeroyi Species 0.000 description 2
- 101150037481 SMR1 gene Proteins 0.000 description 2
- 241000235070 Saccharomyces Species 0.000 description 2
- 101100491255 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) YAP1 gene Proteins 0.000 description 2
- 241000235088 Saccharomyces sp. Species 0.000 description 2
- 241000293869 Salmonella enterica subsp. enterica serovar Typhimurium Species 0.000 description 2
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 2
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 2
- 241000194017 Streptococcus Species 0.000 description 2
- 241000187433 Streptomyces clavuligerus Species 0.000 description 2
- QAOWNCQODCNURD-UHFFFAOYSA-N Sulfuric acid Chemical compound OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 2
- 101150006914 TRP1 gene Proteins 0.000 description 2
- 241000204673 Thermoplasma acidophilum Species 0.000 description 2
- 241000489996 Thermoplasma volcanium Species 0.000 description 2
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 2
- 239000004473 Threonine Substances 0.000 description 2
- 241000223230 Trichosporon Species 0.000 description 2
- OGZRZMJASKKMJZ-XIRDDKMYSA-N Trp-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N OGZRZMJASKKMJZ-XIRDDKMYSA-N 0.000 description 2
- PALLCTDPFINNMM-JQHSSLGASA-N Trp-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N PALLCTDPFINNMM-JQHSSLGASA-N 0.000 description 2
- HSCJRCZFDFQWRP-JZMIEXBBSA-N UDP-alpha-D-glucose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1OP(O)(=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C(NC(=O)C=C2)=O)O1 HSCJRCZFDFQWRP-JZMIEXBBSA-N 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- HSCJRCZFDFQWRP-UHFFFAOYSA-N Uridindiphosphoglukose Natural products OC1C(O)C(O)C(CO)OC1OP(O)(=O)OP(O)(=O)OCC1C(O)C(O)C(N2C(NC(=O)C=C2)=O)O1 HSCJRCZFDFQWRP-UHFFFAOYSA-N 0.000 description 2
- 108010064997 VPY tripeptide Proteins 0.000 description 2
- QZKVWWIUSQGWMY-IHRRRGAJSA-N Val-Ser-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QZKVWWIUSQGWMY-IHRRRGAJSA-N 0.000 description 2
- UJMCYJKPDFQLHX-XGEHTFHBSA-N Val-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N)O UJMCYJKPDFQLHX-XGEHTFHBSA-N 0.000 description 2
- 235000014787 Vitis vinifera Nutrition 0.000 description 2
- 241000311098 Yamadazyma Species 0.000 description 2
- 240000008042 Zea mays Species 0.000 description 2
- 235000007244 Zea mays Nutrition 0.000 description 2
- 241000588902 Zymomonas mobilis Species 0.000 description 2
- 239000000370 acceptor Substances 0.000 description 2
- 108010005233 alanylglutamic acid Proteins 0.000 description 2
- 239000000908 ammonium hydroxide Substances 0.000 description 2
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 2
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 2
- 235000011130 ammonium sulphate Nutrition 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 2
- 108010062796 arginyllysine Proteins 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 235000003704 aspartic acid Nutrition 0.000 description 2
- 108010038633 aspartylglutamate Proteins 0.000 description 2
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 2
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 2
- 101150038738 ble gene Proteins 0.000 description 2
- 239000006227 byproduct Substances 0.000 description 2
- 229940041514 candida albicans extract Drugs 0.000 description 2
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 210000000078 claw Anatomy 0.000 description 2
- 239000000701 coagulant Substances 0.000 description 2
- 238000010835 comparative analysis Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000009833 condensation Methods 0.000 description 2
- 230000005494 condensation Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 238000001212 derivatisation Methods 0.000 description 2
- 150000002016 disaccharides Chemical class 0.000 description 2
- 238000004821 distillation Methods 0.000 description 2
- SNRUBQQJIBEYMU-UHFFFAOYSA-N dodecane Chemical compound CCCCCCCCCCCC SNRUBQQJIBEYMU-UHFFFAOYSA-N 0.000 description 2
- 229940096118 ella Drugs 0.000 description 2
- 238000001952 enzyme assay Methods 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 2
- 235000019253 formic acid Nutrition 0.000 description 2
- 108020001507 fusion proteins Proteins 0.000 description 2
- 102000037865 fusion proteins Human genes 0.000 description 2
- 238000012239 gene modification Methods 0.000 description 2
- 230000005017 genetic modification Effects 0.000 description 2
- 235000013617 genetically modified food Nutrition 0.000 description 2
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 2
- 150000004676 glycans Chemical class 0.000 description 2
- 239000000348 glycosyl donor Substances 0.000 description 2
- 108700014210 glycosyltransferase activity proteins Proteins 0.000 description 2
- 108010075431 glycyl-alanyl-phenylalanine Proteins 0.000 description 2
- 108010038983 glycyl-histidyl-lysine Proteins 0.000 description 2
- 108010020688 glycylhistidine Proteins 0.000 description 2
- 235000002532 grape seed extract Nutrition 0.000 description 2
- 150000002402 hexoses Chemical group 0.000 description 2
- 239000005556 hormone Substances 0.000 description 2
- 229940088597 hormone Drugs 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 229910052500 inorganic mineral Inorganic materials 0.000 description 2
- 230000002427 irreversible effect Effects 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- HJOVHMDZYOCNQW-UHFFFAOYSA-N isophorone Chemical compound CC1=CC(=O)CC(C)(C)C1 HJOVHMDZYOCNQW-UHFFFAOYSA-N 0.000 description 2
- 229940039696 lactobacillus Drugs 0.000 description 2
- KWGKDLIKAYFUFQ-UHFFFAOYSA-M lithium chloride Chemical compound [Li+].[Cl-] KWGKDLIKAYFUFQ-UHFFFAOYSA-M 0.000 description 2
- 108010003700 lysyl aspartic acid Proteins 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 2
- 238000009629 microbiological culture Methods 0.000 description 2
- 235000010755 mineral Nutrition 0.000 description 2
- 239000011707 mineral Substances 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 125000000896 monocarboxylic acid group Chemical group 0.000 description 2
- 239000002667 nucleating agent Substances 0.000 description 2
- 235000016709 nutrition Nutrition 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 235000019319 peptone Nutrition 0.000 description 2
- 108010051242 phenylalanylserine Proteins 0.000 description 2
- 229920001282 polysaccharide Polymers 0.000 description 2
- 239000005017 polysaccharide Substances 0.000 description 2
- 125000001500 prolyl group Chemical group [H]N1C([H])(C(=O)[*])C([H])([H])C([H])([H])C1([H])[H] 0.000 description 2
- 108010029020 prolylglycine Proteins 0.000 description 2
- 108010090894 prolylleucine Proteins 0.000 description 2
- 230000001737 promoting effect Effects 0.000 description 2
- 108060006633 protein kinase Proteins 0.000 description 2
- 229920006395 saturated elastomer Polymers 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 125000004079 stearyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 2
- OMHUCGDTACNQEX-OSHKXICASA-N steviolbioside Chemical compound O([C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(O)=O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O OMHUCGDTACNQEX-OSHKXICASA-N 0.000 description 2
- 239000011550 stock solution Substances 0.000 description 2
- 150000008163 sugars Chemical class 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 235000019605 sweet taste sensations Nutrition 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 150000003505 terpenes Chemical class 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- LWIHDJKSTIGBAC-UHFFFAOYSA-K tripotassium phosphate Chemical compound [K+].[K+].[K+].[O-]P([O-])([O-])=O LWIHDJKSTIGBAC-UHFFFAOYSA-K 0.000 description 2
- OOLLAFOLCSJHRE-ZHAKMVSLSA-N ulipristal acetate Chemical compound C1=CC(N(C)C)=CC=C1[C@@H]1C2=C3CCC(=O)C=C3CC[C@H]2[C@H](CC[C@]2(OC(C)=O)C(C)=O)[C@]2(C)C1 OOLLAFOLCSJHRE-ZHAKMVSLSA-N 0.000 description 2
- 239000012138 yeast extract Substances 0.000 description 2
- HDTRYLNUVZCQOY-UHFFFAOYSA-N α-D-glucopyranosyl-α-D-glucopyranoside Natural products OC1C(O)C(O)C(CO)OC1OC1C(O)C(O)C(O)C(CO)O1 HDTRYLNUVZCQOY-UHFFFAOYSA-N 0.000 description 1
- 101710165761 (2E,6E)-farnesyl diphosphate synthase Proteins 0.000 description 1
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 1
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 1
- GVEZIHKRYBHEFX-MNOVXSKESA-N 13C-Cerulenin Natural products CC=CCC=CCCC(=O)[C@H]1O[C@@H]1C(N)=O GVEZIHKRYBHEFX-MNOVXSKESA-N 0.000 description 1
- ZSYRDSTUBZGDKI-UHFFFAOYSA-N 3-(4-bromophenyl)pentanedioic acid Chemical compound OC(=O)CC(CC(O)=O)C1=CC=C(Br)C=C1 ZSYRDSTUBZGDKI-UHFFFAOYSA-N 0.000 description 1
- 102100029077 3-hydroxy-3-methylglutaryl-coenzyme A reductase Human genes 0.000 description 1
- HIQIXEFWDLTDED-UHFFFAOYSA-N 4-hydroxy-1-piperidin-4-ylpyrrolidin-2-one Chemical compound O=C1CC(O)CN1C1CCNCC1 HIQIXEFWDLTDED-UHFFFAOYSA-N 0.000 description 1
- FPQMGQZTBWIHDN-UHFFFAOYSA-N 5-fluoroanthranilic acid Chemical compound NC1=CC=C(F)C=C1C(O)=O FPQMGQZTBWIHDN-UHFFFAOYSA-N 0.000 description 1
- ZCYVEMRRCGMTRW-UHFFFAOYSA-N 7553-56-2 Chemical compound [I] ZCYVEMRRCGMTRW-UHFFFAOYSA-N 0.000 description 1
- 101150096273 ADE2 gene Proteins 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 1
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical group CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 1
- 108010006229 Acetyl-CoA C-acetyltransferase Proteins 0.000 description 1
- 102000005345 Acetyl-CoA C-acetyltransferase Human genes 0.000 description 1
- 241000159572 Aciculoconidium Species 0.000 description 1
- 241000187712 Actinoplanes sp. Species 0.000 description 1
- 102000057234 Acyl transferases Human genes 0.000 description 1
- 108700016155 Acyl transferases Proteins 0.000 description 1
- 206010067484 Adverse reaction Diseases 0.000 description 1
- 241000567147 Aeropyrum Species 0.000 description 1
- 241000567139 Aeropyrum pernix Species 0.000 description 1
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 1
- AAQGRPOPTAUUBM-ZLUOBGJFSA-N Ala-Ala-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O AAQGRPOPTAUUBM-ZLUOBGJFSA-N 0.000 description 1
- UWQJHXKARZWDIJ-ZLUOBGJFSA-N Ala-Ala-Cys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(O)=O UWQJHXKARZWDIJ-ZLUOBGJFSA-N 0.000 description 1
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 1
- PIPTUBPKYFRLCP-NHCYSSNCSA-N Ala-Ala-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PIPTUBPKYFRLCP-NHCYSSNCSA-N 0.000 description 1
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 1
- LZRNYBIJOSKKRJ-XVYDVKMFSA-N Ala-Asp-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N LZRNYBIJOSKKRJ-XVYDVKMFSA-N 0.000 description 1
- HFBFSOAKPUZCCO-ZLUOBGJFSA-N Ala-Cys-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O)N HFBFSOAKPUZCCO-ZLUOBGJFSA-N 0.000 description 1
- YIGLXQRFQVWFEY-NRPADANISA-N Ala-Gln-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O YIGLXQRFQVWFEY-NRPADANISA-N 0.000 description 1
- WKOBSJOZRJJVRZ-FXQIFTODSA-N Ala-Glu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WKOBSJOZRJJVRZ-FXQIFTODSA-N 0.000 description 1
- PAIHPOGPJVUFJY-WDSKDSINSA-N Ala-Glu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PAIHPOGPJVUFJY-WDSKDSINSA-N 0.000 description 1
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 1
- PUBLUECXJRHTBK-ACZMJKKPSA-N Ala-Glu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O PUBLUECXJRHTBK-ACZMJKKPSA-N 0.000 description 1
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 1
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 1
- OBVSBEYOMDWLRJ-BFHQHQDPSA-N Ala-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N OBVSBEYOMDWLRJ-BFHQHQDPSA-N 0.000 description 1
- CBCCCLMNOBLBSC-XVYDVKMFSA-N Ala-His-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O CBCCCLMNOBLBSC-XVYDVKMFSA-N 0.000 description 1
- CKLDHDOIYBVUNP-KBIXCLLPSA-N Ala-Ile-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O CKLDHDOIYBVUNP-KBIXCLLPSA-N 0.000 description 1
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 1
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 1
- MFMDKJIPHSWSBM-GUBZILKMSA-N Ala-Lys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFMDKJIPHSWSBM-GUBZILKMSA-N 0.000 description 1
- VCSABYLVNWQYQE-SRVKXCTJSA-N Ala-Lys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O VCSABYLVNWQYQE-SRVKXCTJSA-N 0.000 description 1
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 1
- NLOMBWNGESDVJU-GUBZILKMSA-N Ala-Met-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NLOMBWNGESDVJU-GUBZILKMSA-N 0.000 description 1
- OMDNCNKNEGFOMM-BQBZGAKWSA-N Ala-Met-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O OMDNCNKNEGFOMM-BQBZGAKWSA-N 0.000 description 1
- BFMIRJBURUXDRG-DLOVCJGASA-N Ala-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 BFMIRJBURUXDRG-DLOVCJGASA-N 0.000 description 1
- ZBLQIYPCUWZSRZ-QEJZJMRPSA-N Ala-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 ZBLQIYPCUWZSRZ-QEJZJMRPSA-N 0.000 description 1
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 1
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 1
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 1
- WQKAQKZRDIZYNV-VZFHVOOUSA-N Ala-Ser-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WQKAQKZRDIZYNV-VZFHVOOUSA-N 0.000 description 1
- HCBKAOZYACJUEF-XQXXSGGOSA-N Ala-Thr-Gln Chemical compound N[C@@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCC(N)=O)C(=O)O HCBKAOZYACJUEF-XQXXSGGOSA-N 0.000 description 1
- KTXKIYXZQFWJKB-VZFHVOOUSA-N Ala-Thr-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O KTXKIYXZQFWJKB-VZFHVOOUSA-N 0.000 description 1
- KUFVXLQLDHJVOG-SHGPDSBTSA-N Ala-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C)N)O KUFVXLQLDHJVOG-SHGPDSBTSA-N 0.000 description 1
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 1
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 1
- 241001147780 Alicyclobacillus Species 0.000 description 1
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 1
- 241001508809 Ambrosiozyma Species 0.000 description 1
- 239000004254 Ammonium phosphate Substances 0.000 description 1
- 241000944022 Amyris Species 0.000 description 1
- 241000192542 Anabaena Species 0.000 description 1
- 240000001436 Antirrhinum majus Species 0.000 description 1
- 241000276442 Aquifex aeolicus VF5 Species 0.000 description 1
- 101001094837 Arabidopsis thaliana Pectinesterase 5 Proteins 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- 241000205042 Archaeoglobus fulgidus Species 0.000 description 1
- HULHGJZIZXCPLD-FXQIFTODSA-N Arg-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N HULHGJZIZXCPLD-FXQIFTODSA-N 0.000 description 1
- SBVJJNJLFWSJOV-UBHSHLNASA-N Arg-Ala-Phe Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SBVJJNJLFWSJOV-UBHSHLNASA-N 0.000 description 1
- RWWPBOUMKFBHAL-FXQIFTODSA-N Arg-Asn-Cys Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(O)=O RWWPBOUMKFBHAL-FXQIFTODSA-N 0.000 description 1
- PBSOQGZLPFVXPU-YUMQZZPRSA-N Arg-Glu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PBSOQGZLPFVXPU-YUMQZZPRSA-N 0.000 description 1
- QAXCZGMLVICQKS-SRVKXCTJSA-N Arg-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N QAXCZGMLVICQKS-SRVKXCTJSA-N 0.000 description 1
- OGUPCHKBOKJFMA-SRVKXCTJSA-N Arg-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N OGUPCHKBOKJFMA-SRVKXCTJSA-N 0.000 description 1
- QKSAZKCRVQYYGS-UWVGGRQHSA-N Arg-Gly-His Chemical compound N[C@@H](CCCN=C(N)N)C(=O)NCC(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O QKSAZKCRVQYYGS-UWVGGRQHSA-N 0.000 description 1
- NKNILFJYKKHBKE-WPRPVWTQSA-N Arg-Gly-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NKNILFJYKKHBKE-WPRPVWTQSA-N 0.000 description 1
- OOIMKQRCPJBGPD-XUXIUFHCSA-N Arg-Ile-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O OOIMKQRCPJBGPD-XUXIUFHCSA-N 0.000 description 1
- JEOCWTUOMKEEMF-RHYQMDGZSA-N Arg-Leu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEOCWTUOMKEEMF-RHYQMDGZSA-N 0.000 description 1
- BTJVOUQWFXABOI-IHRRRGAJSA-N Arg-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCNC(N)=N BTJVOUQWFXABOI-IHRRRGAJSA-N 0.000 description 1
- GRRXPUAICOGISM-RWMBFGLXSA-N Arg-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O GRRXPUAICOGISM-RWMBFGLXSA-N 0.000 description 1
- ZRNWJUAQKFUUKV-SRVKXCTJSA-N Arg-Met-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(O)=O ZRNWJUAQKFUUKV-SRVKXCTJSA-N 0.000 description 1
- UGZUVYDKAYNCII-ULQDDVLXSA-N Arg-Phe-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UGZUVYDKAYNCII-ULQDDVLXSA-N 0.000 description 1
- OVQJAKFLFTZDNC-GUBZILKMSA-N Arg-Pro-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O OVQJAKFLFTZDNC-GUBZILKMSA-N 0.000 description 1
- VUGWHBXPMAHEGZ-SRVKXCTJSA-N Arg-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N VUGWHBXPMAHEGZ-SRVKXCTJSA-N 0.000 description 1
- AIFHRTPABBBHKU-RCWTZXSCSA-N Arg-Thr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AIFHRTPABBBHKU-RCWTZXSCSA-N 0.000 description 1
- YHZQOSXDTFRZKU-WDSOQIARSA-N Arg-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N)=CNC2=C1 YHZQOSXDTFRZKU-WDSOQIARSA-N 0.000 description 1
- ULBHWNVWSCJLCO-NHCYSSNCSA-N Arg-Val-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N ULBHWNVWSCJLCO-NHCYSSNCSA-N 0.000 description 1
- CPTXATAOUQJQRO-GUBZILKMSA-N Arg-Val-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O CPTXATAOUQJQRO-GUBZILKMSA-N 0.000 description 1
- 241001638540 Arthroascus Species 0.000 description 1
- 241000186063 Arthrobacter Species 0.000 description 1
- 241001508785 Arxiozyma Species 0.000 description 1
- PFOYSEIHFVKHNF-FXQIFTODSA-N Asn-Ala-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PFOYSEIHFVKHNF-FXQIFTODSA-N 0.000 description 1
- PDQBXRSOSCTGKY-ACZMJKKPSA-N Asn-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PDQBXRSOSCTGKY-ACZMJKKPSA-N 0.000 description 1
- SLKLLQWZQHXYSV-CIUDSAMLSA-N Asn-Ala-Lys Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O SLKLLQWZQHXYSV-CIUDSAMLSA-N 0.000 description 1
- GXMSVVBIAMWMKO-BQBZGAKWSA-N Asn-Arg-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N GXMSVVBIAMWMKO-BQBZGAKWSA-N 0.000 description 1
- MEFGKQUUYZOLHM-GMOBBJLQSA-N Asn-Arg-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MEFGKQUUYZOLHM-GMOBBJLQSA-N 0.000 description 1
- XVVOVPFMILMHPX-ZLUOBGJFSA-N Asn-Asp-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XVVOVPFMILMHPX-ZLUOBGJFSA-N 0.000 description 1
- IYVSIZAXNLOKFQ-BYULHYEWSA-N Asn-Asp-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IYVSIZAXNLOKFQ-BYULHYEWSA-N 0.000 description 1
- NKLRWRRVYGQNIH-GHCJXIJMSA-N Asn-Ile-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O NKLRWRRVYGQNIH-GHCJXIJMSA-N 0.000 description 1
- PHJPKNUWWHRAOC-PEFMBERDSA-N Asn-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PHJPKNUWWHRAOC-PEFMBERDSA-N 0.000 description 1
- NPZJLGMWMDNQDD-GHCJXIJMSA-N Asn-Ser-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NPZJLGMWMDNQDD-GHCJXIJMSA-N 0.000 description 1
- VTYQAQFKMQTKQD-ACZMJKKPSA-N Asp-Ala-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O VTYQAQFKMQTKQD-ACZMJKKPSA-N 0.000 description 1
- XEDQMTWEYFBOIK-ACZMJKKPSA-N Asp-Ala-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XEDQMTWEYFBOIK-ACZMJKKPSA-N 0.000 description 1
- AXXCUABIFZPKPM-BQBZGAKWSA-N Asp-Arg-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O AXXCUABIFZPKPM-BQBZGAKWSA-N 0.000 description 1
- SDHFVYLZFBDSQT-DCAQKATOSA-N Asp-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N SDHFVYLZFBDSQT-DCAQKATOSA-N 0.000 description 1
- FRSGNOZCTWDVFZ-ACZMJKKPSA-N Asp-Asp-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O FRSGNOZCTWDVFZ-ACZMJKKPSA-N 0.000 description 1
- BFOYULZBKYOKAN-OLHMAJIHSA-N Asp-Asp-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BFOYULZBKYOKAN-OLHMAJIHSA-N 0.000 description 1
- HRGGPWBIMIQANI-GUBZILKMSA-N Asp-Gln-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HRGGPWBIMIQANI-GUBZILKMSA-N 0.000 description 1
- PDECQIHABNQRHN-GUBZILKMSA-N Asp-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(O)=O PDECQIHABNQRHN-GUBZILKMSA-N 0.000 description 1
- KHBLRHKVXICFMY-GUBZILKMSA-N Asp-Glu-Lys Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O KHBLRHKVXICFMY-GUBZILKMSA-N 0.000 description 1
- JUWZKMBALYLZCK-WHFBIAKZSA-N Asp-Gly-Asn Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O JUWZKMBALYLZCK-WHFBIAKZSA-N 0.000 description 1
- WSXDIZFNQYTUJB-SRVKXCTJSA-N Asp-His-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O WSXDIZFNQYTUJB-SRVKXCTJSA-N 0.000 description 1
- HOBNTSHITVVNBN-ZPFDUUQYSA-N Asp-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N HOBNTSHITVVNBN-ZPFDUUQYSA-N 0.000 description 1
- PYXXJFRXIYAESU-PCBIJLKTSA-N Asp-Ile-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PYXXJFRXIYAESU-PCBIJLKTSA-N 0.000 description 1
- AYFVRYXNDHBECD-YUMQZZPRSA-N Asp-Leu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AYFVRYXNDHBECD-YUMQZZPRSA-N 0.000 description 1
- MYOHQBFRJQFIDZ-KKUMJFAQSA-N Asp-Leu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MYOHQBFRJQFIDZ-KKUMJFAQSA-N 0.000 description 1
- RXBGWGRSWXOBGK-KKUMJFAQSA-N Asp-Lys-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RXBGWGRSWXOBGK-KKUMJFAQSA-N 0.000 description 1
- BKOIIURTQAJHAT-GUBZILKMSA-N Asp-Pro-Pro Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 BKOIIURTQAJHAT-GUBZILKMSA-N 0.000 description 1
- GXHDGYOXPNQCKM-XVSYOHENSA-N Asp-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O GXHDGYOXPNQCKM-XVSYOHENSA-N 0.000 description 1
- KACWACLNYLSVCA-VHWLVUOQSA-N Asp-Trp-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KACWACLNYLSVCA-VHWLVUOQSA-N 0.000 description 1
- 241000228212 Aspergillus Species 0.000 description 1
- BSYNRYMUTXBXSQ-UHFFFAOYSA-N Aspirin Chemical compound CC(=O)OC1=CC=CC=C1C(O)=O BSYNRYMUTXBXSQ-UHFFFAOYSA-N 0.000 description 1
- 101710177204 Atrochrysone carboxyl ACP thioesterase Proteins 0.000 description 1
- 241000972773 Aulopiformes Species 0.000 description 1
- 241001446312 Austwickia chelonae Species 0.000 description 1
- 241000193744 Bacillus amyloliquefaciens Species 0.000 description 1
- 241000194110 Bacillus sp. (in: Bacteria) Species 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 241000235114 Bensingtonia Species 0.000 description 1
- 241000235553 Blakeslea trispora Species 0.000 description 1
- 241000680806 Blastobotrys adeninivorans Species 0.000 description 1
- 108010006654 Bleomycin Proteins 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 241000178289 Botryozyma Species 0.000 description 1
- 241000274790 Bradyrhizobium diazoefficiens USDA 110 Species 0.000 description 1
- 241000589174 Bradyrhizobium japonicum Species 0.000 description 1
- 235000006463 Brassica alba Nutrition 0.000 description 1
- 244000140786 Brassica hirta Species 0.000 description 1
- 241000995051 Brenda Species 0.000 description 1
- 244000027711 Brettanomyces bruxellensis Species 0.000 description 1
- 235000000287 Brettanomyces bruxellensis Nutrition 0.000 description 1
- 241000195940 Bryophyta Species 0.000 description 1
- 241000235172 Bullera Species 0.000 description 1
- 241000033328 Bulleromyces Species 0.000 description 1
- 101100494773 Caenorhabditis elegans ctl-2 gene Proteins 0.000 description 1
- 101100351811 Caenorhabditis elegans pgal-1 gene Proteins 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 240000001829 Catharanthus roseus Species 0.000 description 1
- 241000321369 Cephalopholis fulva Species 0.000 description 1
- 229930186147 Cephalosporin Natural products 0.000 description 1
- 229920002101 Chitin Polymers 0.000 description 1
- 102100040428 Chitobiosyldiphosphodolichol beta-mannosyltransferase Human genes 0.000 description 1
- 241000190831 Chromatium Species 0.000 description 1
- 241001508787 Citeromyces Species 0.000 description 1
- 240000002319 Citrus sinensis Species 0.000 description 1
- 235000005976 Citrus sinensis Nutrition 0.000 description 1
- 241001508790 Clarkia breweri Species 0.000 description 1
- 241001508811 Clavispora Species 0.000 description 1
- 241000193464 Clostridium sp. Species 0.000 description 1
- 102100030563 Coagulation factor XI Human genes 0.000 description 1
- 241000723375 Colchicum Species 0.000 description 1
- 241001059394 Copelandia Species 0.000 description 1
- 241000186145 Corynebacterium ammoniagenes Species 0.000 description 1
- 241000186249 Corynebacterium sp. Species 0.000 description 1
- 241001135265 Cronobacter sakazakii Species 0.000 description 1
- 241000235646 Cyberlindnera jadinii Species 0.000 description 1
- UPJGYXRAPJWIHD-CIUDSAMLSA-N Cys-Asn-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UPJGYXRAPJWIHD-CIUDSAMLSA-N 0.000 description 1
- JDHMXPSXWMPYQZ-AAEUAGOBSA-N Cys-Gly-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CS)N JDHMXPSXWMPYQZ-AAEUAGOBSA-N 0.000 description 1
- OXFOKRAFNYSREH-BJDJZHNGSA-N Cys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CS)N OXFOKRAFNYSREH-BJDJZHNGSA-N 0.000 description 1
- BLGNLNRBABWDST-CIUDSAMLSA-N Cys-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N BLGNLNRBABWDST-CIUDSAMLSA-N 0.000 description 1
- NDNZRWUDUMTITL-FXQIFTODSA-N Cys-Ser-Val Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NDNZRWUDUMTITL-FXQIFTODSA-N 0.000 description 1
- OEDPLIBVQGRKGZ-AVGNSLFASA-N Cys-Tyr-Glu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O OEDPLIBVQGRKGZ-AVGNSLFASA-N 0.000 description 1
- 241000222039 Cystofilobasidium Species 0.000 description 1
- GUBGYTABKSRVRQ-CUHNMECISA-N D-Cellobiose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-CUHNMECISA-N 0.000 description 1
- MTCFGRXMJLQNBG-UWTATZPHSA-N D-Serine Chemical compound OC[C@@H](N)C(O)=O MTCFGRXMJLQNBG-UWTATZPHSA-N 0.000 description 1
- 229930195711 D-Serine Natural products 0.000 description 1
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 241000235035 Debaryomyces Species 0.000 description 1
- DORPKYRPJIIARM-UHFFFAOYSA-N Decaffeoylacteoside Natural products OC1C(O)C(O)C(C)OC1OC1C(O)C(OCCC=2C=C(O)C(O)=CC=2)OC(CO)C1O DORPKYRPJIIARM-UHFFFAOYSA-N 0.000 description 1
- 241001306278 Diaporthe amygdali Species 0.000 description 1
- 241001123630 Dipodascopsis Species 0.000 description 1
- 241001123635 Dipodascus Species 0.000 description 1
- 241000255601 Drosophila melanogaster Species 0.000 description 1
- 229930186291 Dulcoside Natural products 0.000 description 1
- CANAPGLEBDTCAF-QHSHOEHESA-N Dulcoside A Natural products C[C@@H]1O[C@H](O[C@@H]2[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]2O[C@]34CC[C@H]5[C@]6(C)CCC[C@](C)([C@H]6CC[C@@]5(CC3=C)C4)C(=O)O[C@@H]7O[C@H](CO)[C@@H](O)[C@H](O)[C@H]7O)[C@H](O)[C@H](O)[C@H]1O CANAPGLEBDTCAF-QHSHOEHESA-N 0.000 description 1
- CANAPGLEBDTCAF-NTIPNFSCSA-N Dulcoside A Chemical compound O[C@@H]1[C@H](O)[C@@H](O)[C@H](C)O[C@H]1O[C@H]1[C@H](O[C@]23C(C[C@]4(C2)[C@H]([C@@]2(C)[C@@H]([C@](CCC2)(C)C(=O)O[C@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O2)O)CC4)CC3)=C)O[C@H](CO)[C@@H](O)[C@@H]1O CANAPGLEBDTCAF-NTIPNFSCSA-N 0.000 description 1
- 241000147019 Enterobacter sp. Species 0.000 description 1
- 241000194031 Enterococcus faecium Species 0.000 description 1
- 241000235167 Eremascus Species 0.000 description 1
- 241000588698 Erwinia Species 0.000 description 1
- 239000004386 Erythritol Substances 0.000 description 1
- UNXHWFMMPAWVPI-UHFFFAOYSA-N Erythritol Natural products OCC(O)C(O)CO UNXHWFMMPAWVPI-UHFFFAOYSA-N 0.000 description 1
- 241000222042 Erythrobasidium Species 0.000 description 1
- 241001646716 Escherichia coli K-12 Species 0.000 description 1
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 101710156207 Farnesyl diphosphate synthase Proteins 0.000 description 1
- 102100035111 Farnesyl pyrophosphate synthase Human genes 0.000 description 1
- 101710125754 Farnesyl pyrophosphate synthase Proteins 0.000 description 1
- 101710089428 Farnesyl pyrophosphate synthase erg20 Proteins 0.000 description 1
- 108010022535 Farnesyl-Diphosphate Farnesyltransferase Proteins 0.000 description 1
- 101100112369 Fasciola hepatica Cat-1 gene Proteins 0.000 description 1
- 241000222840 Fellomyces Species 0.000 description 1
- 241000221207 Filobasidium Species 0.000 description 1
- BDAGIHXWWSANSR-UHFFFAOYSA-M Formate Chemical compound [O-]C=O BDAGIHXWWSANSR-UHFFFAOYSA-M 0.000 description 1
- 241000187808 Frankia sp. Species 0.000 description 1
- 229930091371 Fructose Natural products 0.000 description 1
- 239000005715 Fructose Substances 0.000 description 1
- RFSUNEUAIZKAJO-ARQDHWQXSA-N Fructose Chemical compound OC[C@H]1O[C@](O)(CO)[C@@H](O)[C@@H]1O RFSUNEUAIZKAJO-ARQDHWQXSA-N 0.000 description 1
- 241000221778 Fusarium fujikuroi Species 0.000 description 1
- 101150038242 GAL10 gene Proteins 0.000 description 1
- 101150103317 GAL80 gene Proteins 0.000 description 1
- 241001123633 Galactomyces Species 0.000 description 1
- 102100024637 Galectin-10 Human genes 0.000 description 1
- 241000193385 Geobacillus stearothermophilus Species 0.000 description 1
- 241000159512 Geotrichum Species 0.000 description 1
- GVVPGTZRZFNKDS-YFHOEESVSA-N Geranyl diphosphate Natural products CC(C)=CCC\C(C)=C/COP(O)(=O)OP(O)(O)=O GVVPGTZRZFNKDS-YFHOEESVSA-N 0.000 description 1
- 244000194101 Ginkgo biloba Species 0.000 description 1
- 235000008100 Ginkgo biloba Nutrition 0.000 description 1
- RGXXLQWXBFNXTG-CIUDSAMLSA-N Gln-Arg-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O RGXXLQWXBFNXTG-CIUDSAMLSA-N 0.000 description 1
- MWLYSLMKFXWZPW-ZPFDUUQYSA-N Gln-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCC(N)=O MWLYSLMKFXWZPW-ZPFDUUQYSA-N 0.000 description 1
- PRBLYKYHAJEABA-SRVKXCTJSA-N Gln-Arg-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O PRBLYKYHAJEABA-SRVKXCTJSA-N 0.000 description 1
- ZPDVKYLJTOFQJV-WDSKDSINSA-N Gln-Asn-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O ZPDVKYLJTOFQJV-WDSKDSINSA-N 0.000 description 1
- IVCOYUURLWQDJQ-LPEHRKFASA-N Gln-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O IVCOYUURLWQDJQ-LPEHRKFASA-N 0.000 description 1
- ZQPOVSJFBBETHQ-CIUDSAMLSA-N Gln-Glu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZQPOVSJFBBETHQ-CIUDSAMLSA-N 0.000 description 1
- MAGNEQBFSBREJL-DCAQKATOSA-N Gln-Glu-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N MAGNEQBFSBREJL-DCAQKATOSA-N 0.000 description 1
- ITZWDGBYBPUZRG-KBIXCLLPSA-N Gln-Ile-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O ITZWDGBYBPUZRG-KBIXCLLPSA-N 0.000 description 1
- VUVKKXPCKILIBD-AVGNSLFASA-N Gln-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N VUVKKXPCKILIBD-AVGNSLFASA-N 0.000 description 1
- ZBKUIQNCRIYVGH-SDDRHHMPSA-N Gln-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZBKUIQNCRIYVGH-SDDRHHMPSA-N 0.000 description 1
- HMIXCETWRYDVMO-GUBZILKMSA-N Gln-Pro-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O HMIXCETWRYDVMO-GUBZILKMSA-N 0.000 description 1
- OREPWMPAUWIIAM-ZPFDUUQYSA-N Gln-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N OREPWMPAUWIIAM-ZPFDUUQYSA-N 0.000 description 1
- HGBHRZBXOOHRDH-JBACZVJFSA-N Gln-Tyr-Trp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O HGBHRZBXOOHRDH-JBACZVJFSA-N 0.000 description 1
- QGWXAMDECCKGRU-XVKPBYJWSA-N Gln-Val-Gly Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(N)=O)C(=O)NCC(O)=O QGWXAMDECCKGRU-XVKPBYJWSA-N 0.000 description 1
- WZZSKAJIHTUUSG-ACZMJKKPSA-N Glu-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O WZZSKAJIHTUUSG-ACZMJKKPSA-N 0.000 description 1
- WOMUDRVDJMHTCV-DCAQKATOSA-N Glu-Arg-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WOMUDRVDJMHTCV-DCAQKATOSA-N 0.000 description 1
- KKCUFHUTMKQQCF-SRVKXCTJSA-N Glu-Arg-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O KKCUFHUTMKQQCF-SRVKXCTJSA-N 0.000 description 1
- SRZLHYPAOXBBSB-HJGDQZAQSA-N Glu-Arg-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SRZLHYPAOXBBSB-HJGDQZAQSA-N 0.000 description 1
- ILGFBUGLBSAQQB-GUBZILKMSA-N Glu-Glu-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ILGFBUGLBSAQQB-GUBZILKMSA-N 0.000 description 1
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 1
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 1
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 1
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 1
- IQACOVZVOMVILH-FXQIFTODSA-N Glu-Glu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O IQACOVZVOMVILH-FXQIFTODSA-N 0.000 description 1
- AIGROOHQXCACHL-WDSKDSINSA-N Glu-Gly-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O AIGROOHQXCACHL-WDSKDSINSA-N 0.000 description 1
- PXXGVUVQWQGGIG-YUMQZZPRSA-N Glu-Gly-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N PXXGVUVQWQGGIG-YUMQZZPRSA-N 0.000 description 1
- OGNJZUXUTPQVBR-BQBZGAKWSA-N Glu-Gly-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OGNJZUXUTPQVBR-BQBZGAKWSA-N 0.000 description 1
- OAGVHWYIBZMWLA-YFKPBYRVSA-N Glu-Gly-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)NCC(O)=O OAGVHWYIBZMWLA-YFKPBYRVSA-N 0.000 description 1
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 1
- NWOUBJNMZDDGDT-AVGNSLFASA-N Glu-Leu-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 NWOUBJNMZDDGDT-AVGNSLFASA-N 0.000 description 1
- VGBSZQSKQRMLHD-MNXVOIDGSA-N Glu-Leu-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VGBSZQSKQRMLHD-MNXVOIDGSA-N 0.000 description 1
- KXTAGESXNQEZKB-DZKIICNBSA-N Glu-Phe-Val Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 KXTAGESXNQEZKB-DZKIICNBSA-N 0.000 description 1
- AAJHGGDRKHYSDH-GUBZILKMSA-N Glu-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O AAJHGGDRKHYSDH-GUBZILKMSA-N 0.000 description 1
- DXVOKNVIKORTHQ-GUBZILKMSA-N Glu-Pro-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O DXVOKNVIKORTHQ-GUBZILKMSA-N 0.000 description 1
- MRWYPDWDZSLWJM-ACZMJKKPSA-N Glu-Ser-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O MRWYPDWDZSLWJM-ACZMJKKPSA-N 0.000 description 1
- JWNZHMSRZXXGTM-XKBZYTNZSA-N Glu-Ser-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWNZHMSRZXXGTM-XKBZYTNZSA-N 0.000 description 1
- DMYACXMQUABZIQ-NRPADANISA-N Glu-Ser-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O DMYACXMQUABZIQ-NRPADANISA-N 0.000 description 1
- BPCLDCNZBUYGOD-BPUTZDHNSA-N Glu-Trp-Glu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 BPCLDCNZBUYGOD-BPUTZDHNSA-N 0.000 description 1
- 241001121139 Gluconobacter oxydans 621H Species 0.000 description 1
- 102000004366 Glucosidases Human genes 0.000 description 1
- 108010056771 Glucosidases Proteins 0.000 description 1
- MFVQGXGQRIXBPK-WDSKDSINSA-N Gly-Ala-Glu Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFVQGXGQRIXBPK-WDSKDSINSA-N 0.000 description 1
- YMUFWNJHVPQNQD-ZKWXMUAHSA-N Gly-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN YMUFWNJHVPQNQD-ZKWXMUAHSA-N 0.000 description 1
- MZZSCEANQDPJER-ONGXEEELSA-N Gly-Ala-Phe Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MZZSCEANQDPJER-ONGXEEELSA-N 0.000 description 1
- JRDYDYXZKFNNRQ-XPUUQOCRSA-N Gly-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN JRDYDYXZKFNNRQ-XPUUQOCRSA-N 0.000 description 1
- UXJHNZODTMHWRD-WHFBIAKZSA-N Gly-Asn-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O UXJHNZODTMHWRD-WHFBIAKZSA-N 0.000 description 1
- XEJTYSCIXKYSHR-WDSKDSINSA-N Gly-Asp-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN XEJTYSCIXKYSHR-WDSKDSINSA-N 0.000 description 1
- XBWMTPAIUQIWKA-BYULHYEWSA-N Gly-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN XBWMTPAIUQIWKA-BYULHYEWSA-N 0.000 description 1
- YYQGVXNKAXUTJU-YUMQZZPRSA-N Gly-Cys-His Chemical compound NCC(=O)N[C@@H](CS)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O YYQGVXNKAXUTJU-YUMQZZPRSA-N 0.000 description 1
- VOCMRCVMAPSSAL-IUCAKERBSA-N Gly-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN VOCMRCVMAPSSAL-IUCAKERBSA-N 0.000 description 1
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 1
- MVORZMQFXBLMHM-QWRGUYRKSA-N Gly-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 MVORZMQFXBLMHM-QWRGUYRKSA-N 0.000 description 1
- YFGONBOFGGWKKY-VHSXEESVSA-N Gly-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)CN)C(=O)O YFGONBOFGGWKKY-VHSXEESVSA-N 0.000 description 1
- ALOBJFDJTMQQPW-ONGXEEELSA-N Gly-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)CN ALOBJFDJTMQQPW-ONGXEEELSA-N 0.000 description 1
- SWQALSGKVLYKDT-ZKWXMUAHSA-N Gly-Ile-Ala Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SWQALSGKVLYKDT-ZKWXMUAHSA-N 0.000 description 1
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 1
- HAXARWKYFIIHKD-ZKWXMUAHSA-N Gly-Ile-Ser Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HAXARWKYFIIHKD-ZKWXMUAHSA-N 0.000 description 1
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 1
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 1
- MIIVFRCYJABHTQ-ONGXEEELSA-N Gly-Leu-Val Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O MIIVFRCYJABHTQ-ONGXEEELSA-N 0.000 description 1
- VEPBEGNDJYANCF-QWRGUYRKSA-N Gly-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN VEPBEGNDJYANCF-QWRGUYRKSA-N 0.000 description 1
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 1
- WZSHYFGOLPXPLL-RYUDHWBXSA-N Gly-Phe-Glu Chemical compound NCC(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CCC(O)=O)C(O)=O WZSHYFGOLPXPLL-RYUDHWBXSA-N 0.000 description 1
- SCJJPCQUJYPHRZ-BQBZGAKWSA-N Gly-Pro-Asn Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O SCJJPCQUJYPHRZ-BQBZGAKWSA-N 0.000 description 1
- OHUKZZYSJBKFRR-WHFBIAKZSA-N Gly-Ser-Asp Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O OHUKZZYSJBKFRR-WHFBIAKZSA-N 0.000 description 1
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 1
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 1
- FFALDIDGPLUDKV-ZDLURKLDSA-N Gly-Thr-Ser Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O FFALDIDGPLUDKV-ZDLURKLDSA-N 0.000 description 1
- TVTZEOHWHUVYCG-KYNKHSRBSA-N Gly-Thr-Thr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O TVTZEOHWHUVYCG-KYNKHSRBSA-N 0.000 description 1
- RCHFYMASWAZQQZ-ZANVPECISA-N Gly-Trp-Ala Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)CN)=CNC2=C1 RCHFYMASWAZQQZ-ZANVPECISA-N 0.000 description 1
- UMRIXLHPZZIOML-OALUTQOASA-N Gly-Trp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)CN UMRIXLHPZZIOML-OALUTQOASA-N 0.000 description 1
- MUGLKCQHTUFLGF-WPRPVWTQSA-N Gly-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)CN MUGLKCQHTUFLGF-WPRPVWTQSA-N 0.000 description 1
- 229920002527 Glycogen Polymers 0.000 description 1
- 101150009006 HIS3 gene Proteins 0.000 description 1
- 241000168517 Haematococcus lacustris Species 0.000 description 1
- 241001235200 Haemophilus influenzae Rd KW20 Species 0.000 description 1
- 241000205062 Halobacterium Species 0.000 description 1
- 241000204942 Halobacterium sp. Species 0.000 description 1
- 244000020551 Helianthus annuus Species 0.000 description 1
- 235000003222 Helianthus annuus Nutrition 0.000 description 1
- 244000043261 Hevea brasiliensis Species 0.000 description 1
- SQUHHTBVTRBESD-UHFFFAOYSA-N Hexa-Ac-myo-Inositol Natural products CC(=O)OC1C(OC(C)=O)C(OC(C)=O)C(OC(C)=O)C(OC(C)=O)C1OC(C)=O SQUHHTBVTRBESD-UHFFFAOYSA-N 0.000 description 1
- MWAJSVTZZOUOBU-IHRRRGAJSA-N His-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC1=CN=CN1 MWAJSVTZZOUOBU-IHRRRGAJSA-N 0.000 description 1
- OHOXVDFVRDGFND-YUMQZZPRSA-N His-Cys-Gly Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CS)C(=O)NCC(O)=O OHOXVDFVRDGFND-YUMQZZPRSA-N 0.000 description 1
- HQKADFMLECZIQJ-HVTMNAMFSA-N His-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N HQKADFMLECZIQJ-HVTMNAMFSA-N 0.000 description 1
- XWUIHCZETFNRPA-IHPCNDPISA-N His-His-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CN=CN1 XWUIHCZETFNRPA-IHPCNDPISA-N 0.000 description 1
- MPXGJGBXCRQQJE-MXAVVETBSA-N His-Ile-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O MPXGJGBXCRQQJE-MXAVVETBSA-N 0.000 description 1
- IWXMHXYOACDSIA-PYJNHQTQSA-N His-Ile-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O IWXMHXYOACDSIA-PYJNHQTQSA-N 0.000 description 1
- YAALVYQFVJNXIV-KKUMJFAQSA-N His-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 YAALVYQFVJNXIV-KKUMJFAQSA-N 0.000 description 1
- RNAYRCNHRYEBTH-IHRRRGAJSA-N His-Met-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O RNAYRCNHRYEBTH-IHRRRGAJSA-N 0.000 description 1
- VCBWXASUBZIFLQ-IHRRRGAJSA-N His-Pro-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O VCBWXASUBZIFLQ-IHRRRGAJSA-N 0.000 description 1
- UIRUVUUGUYCMBY-KCTSRDHCSA-N His-Trp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC3=CN=CN3)N UIRUVUUGUYCMBY-KCTSRDHCSA-N 0.000 description 1
- GBMSSORHVHAYLU-QTKMDUPCSA-N His-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CN=CN1)N)O GBMSSORHVHAYLU-QTKMDUPCSA-N 0.000 description 1
- DRKZDEFADVYTLU-AVGNSLFASA-N His-Val-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O DRKZDEFADVYTLU-AVGNSLFASA-N 0.000 description 1
- 241001236629 Holtermannia Species 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000884385 Homo sapiens Arylamine N-acetyltransferase 1 Proteins 0.000 description 1
- 101000891557 Homo sapiens Chitobiosyldiphosphodolichol beta-mannosyltransferase Proteins 0.000 description 1
- 101001034811 Homo sapiens Eukaryotic translation initiation factor 4 gamma 2 Proteins 0.000 description 1
- 101000639975 Homo sapiens Sodium-dependent noradrenaline transporter Proteins 0.000 description 1
- GRRNUXAQVGOGFE-UHFFFAOYSA-N Hygromycin-B Natural products OC1C(NC)CC(N)C(O)C1OC1C2OC3(C(C(O)C(O)C(C(N)CO)O3)O)OC2C(O)C(CO)O1 GRRNUXAQVGOGFE-UHFFFAOYSA-N 0.000 description 1
- 241000376403 Hyphopichia Species 0.000 description 1
- JXUGDUWBMKIJDC-NAKRPEOUSA-N Ile-Ala-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JXUGDUWBMKIJDC-NAKRPEOUSA-N 0.000 description 1
- JRHFQUPIZOYKQP-KBIXCLLPSA-N Ile-Ala-Glu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O JRHFQUPIZOYKQP-KBIXCLLPSA-N 0.000 description 1
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 1
- DXUJSRIVSWEOAG-NAKRPEOUSA-N Ile-Arg-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N DXUJSRIVSWEOAG-NAKRPEOUSA-N 0.000 description 1
- XENGULNPUDGALZ-ZPFDUUQYSA-N Ile-Asn-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N XENGULNPUDGALZ-ZPFDUUQYSA-N 0.000 description 1
- WEWCEPOYKANMGZ-MMWGEVLESA-N Ile-Cys-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N WEWCEPOYKANMGZ-MMWGEVLESA-N 0.000 description 1
- LKACSKJPTFSBHR-MNXVOIDGSA-N Ile-Gln-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N LKACSKJPTFSBHR-MNXVOIDGSA-N 0.000 description 1
- MTFVYKQRLXYAQN-LAEOZQHASA-N Ile-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O MTFVYKQRLXYAQN-LAEOZQHASA-N 0.000 description 1
- UBHUJPVCJHPSEU-GRLWGSQLSA-N Ile-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N UBHUJPVCJHPSEU-GRLWGSQLSA-N 0.000 description 1
- CDGLBYSAZFIIJO-RCOVLWMOSA-N Ile-Gly-Gly Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O CDGLBYSAZFIIJO-RCOVLWMOSA-N 0.000 description 1
- UASTVUQJMLZWGG-PEXQALLHSA-N Ile-His-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)NCC(=O)O)N UASTVUQJMLZWGG-PEXQALLHSA-N 0.000 description 1
- QZZIBQZLWBOOJH-PEDHHIEDSA-N Ile-Ile-Val Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(=O)O QZZIBQZLWBOOJH-PEDHHIEDSA-N 0.000 description 1
- YGDWPQCLFJNMOL-MNXVOIDGSA-N Ile-Leu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YGDWPQCLFJNMOL-MNXVOIDGSA-N 0.000 description 1
- XDUVMJCBYUKNFJ-MXAVVETBSA-N Ile-Lys-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N XDUVMJCBYUKNFJ-MXAVVETBSA-N 0.000 description 1
- RVNOXPZHMUWCLW-GMOBBJLQSA-N Ile-Met-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N RVNOXPZHMUWCLW-GMOBBJLQSA-N 0.000 description 1
- IIWQTXMUALXGOV-PCBIJLKTSA-N Ile-Phe-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N IIWQTXMUALXGOV-PCBIJLKTSA-N 0.000 description 1
- FHPZJWJWTWZKNA-LLLHUVSDSA-N Ile-Phe-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N FHPZJWJWTWZKNA-LLLHUVSDSA-N 0.000 description 1
- IVXJIMGDOYRLQU-XUXIUFHCSA-N Ile-Pro-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O IVXJIMGDOYRLQU-XUXIUFHCSA-N 0.000 description 1
- XOZOSAUOGRPCES-STECZYCISA-N Ile-Pro-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XOZOSAUOGRPCES-STECZYCISA-N 0.000 description 1
- ZDNNDIJTUHQCAM-MXAVVETBSA-N Ile-Ser-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N ZDNNDIJTUHQCAM-MXAVVETBSA-N 0.000 description 1
- ZUWSVOYKBCHLRR-MGHWNKPDSA-N Ile-Tyr-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZUWSVOYKBCHLRR-MGHWNKPDSA-N 0.000 description 1
- YJRSIJZUIUANHO-NAKRPEOUSA-N Ile-Val-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(=O)O)N YJRSIJZUIUANHO-NAKRPEOUSA-N 0.000 description 1
- BCISUQVFDGYZBO-QSFUFRPTSA-N Ile-Val-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O BCISUQVFDGYZBO-QSFUFRPTSA-N 0.000 description 1
- YWCJXQKATPNPOE-UKJIMTQDSA-N Ile-Val-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YWCJXQKATPNPOE-UKJIMTQDSA-N 0.000 description 1
- JZBVBOKASHNXAD-NAKRPEOUSA-N Ile-Val-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N JZBVBOKASHNXAD-NAKRPEOUSA-N 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- 102000014150 Interferons Human genes 0.000 description 1
- 108010050904 Interferons Proteins 0.000 description 1
- 241001473007 Ips pini Species 0.000 description 1
- 102100027665 Isopentenyl-diphosphate Delta-isomerase 1 Human genes 0.000 description 1
- 241000235644 Issatchenkia Species 0.000 description 1
- 241000204082 Kitasatospora griseola Species 0.000 description 1
- 241000588747 Klebsiella pneumoniae Species 0.000 description 1
- 235000014663 Kluyveromyces fragilis Nutrition 0.000 description 1
- 241000235058 Komagataella pastoris Species 0.000 description 1
- 241001489120 Kondoa Species 0.000 description 1
- 241001304304 Kuraishia Species 0.000 description 1
- 241000222661 Kurtzmanomyces Species 0.000 description 1
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 1
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 1
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- 101150044775 LYS1 gene Proteins 0.000 description 1
- 241000481961 Lachancea thermotolerans Species 0.000 description 1
- 241001582342 Lactobacillus sakei subsp. sakei Species 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- 241000589902 Leptospira Species 0.000 description 1
- 241000589929 Leptospira interrogans Species 0.000 description 1
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 1
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 1
- UCOCBWDBHCUPQP-DCAQKATOSA-N Leu-Arg-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O UCOCBWDBHCUPQP-DCAQKATOSA-N 0.000 description 1
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 1
- JKGHDYGZRDWHGA-SRVKXCTJSA-N Leu-Asn-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JKGHDYGZRDWHGA-SRVKXCTJSA-N 0.000 description 1
- BPANDPNDMJHFEV-CIUDSAMLSA-N Leu-Asp-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O BPANDPNDMJHFEV-CIUDSAMLSA-N 0.000 description 1
- ZURHXHNAEJJRNU-CIUDSAMLSA-N Leu-Asp-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZURHXHNAEJJRNU-CIUDSAMLSA-N 0.000 description 1
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 1
- ULXYQAJWJGLCNR-YUMQZZPRSA-N Leu-Asp-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O ULXYQAJWJGLCNR-YUMQZZPRSA-N 0.000 description 1
- GLBNEGIOFRVRHO-JYJNAYRXSA-N Leu-Gln-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GLBNEGIOFRVRHO-JYJNAYRXSA-N 0.000 description 1
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 1
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 1
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 1
- VZBIUJURDLFFOE-IHRRRGAJSA-N Leu-His-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VZBIUJURDLFFOE-IHRRRGAJSA-N 0.000 description 1
- DBSLVQBXKVKDKJ-BJDJZHNGSA-N Leu-Ile-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O DBSLVQBXKVKDKJ-BJDJZHNGSA-N 0.000 description 1
- HGFGEMSVBMCFKK-MNXVOIDGSA-N Leu-Ile-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HGFGEMSVBMCFKK-MNXVOIDGSA-N 0.000 description 1
- ZALAVHVPPOHAOL-XUXIUFHCSA-N Leu-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(C)C)N ZALAVHVPPOHAOL-XUXIUFHCSA-N 0.000 description 1
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 1
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 1
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 1
- FZMNAYBEFGZEIF-AVGNSLFASA-N Leu-Met-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(=O)O)N FZMNAYBEFGZEIF-AVGNSLFASA-N 0.000 description 1
- MJTOYIHCKVQICL-ULQDDVLXSA-N Leu-Met-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N MJTOYIHCKVQICL-ULQDDVLXSA-N 0.000 description 1
- JVTYXRRFZCEPPK-RHYQMDGZSA-N Leu-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC(C)C)N)O JVTYXRRFZCEPPK-RHYQMDGZSA-N 0.000 description 1
- LQUIENKUVKPNIC-ULQDDVLXSA-N Leu-Met-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LQUIENKUVKPNIC-ULQDDVLXSA-N 0.000 description 1
- SYRTUBLKWNDSDK-DKIMLUQUSA-N Leu-Phe-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYRTUBLKWNDSDK-DKIMLUQUSA-N 0.000 description 1
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 1
- VULJUQZPSOASBZ-SRVKXCTJSA-N Leu-Pro-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O VULJUQZPSOASBZ-SRVKXCTJSA-N 0.000 description 1
- MUCIDQMDOYQYBR-IHRRRGAJSA-N Leu-Pro-His Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N MUCIDQMDOYQYBR-IHRRRGAJSA-N 0.000 description 1
- YUTNOGOMBNYPFH-XUXIUFHCSA-N Leu-Pro-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YUTNOGOMBNYPFH-XUXIUFHCSA-N 0.000 description 1
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 1
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 1
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 1
- FGZVGOAAROXFAB-IXOXFDKPSA-N Leu-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(C)C)N)O FGZVGOAAROXFAB-IXOXFDKPSA-N 0.000 description 1
- CGHXMODRYJISSK-NHCYSSNCSA-N Leu-Val-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O CGHXMODRYJISSK-NHCYSSNCSA-N 0.000 description 1
- QESXLSQLQHHTIX-RHYQMDGZSA-N Leu-Val-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QESXLSQLQHHTIX-RHYQMDGZSA-N 0.000 description 1
- 241000221479 Leucosporidium Species 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 241000209510 Liliopsida Species 0.000 description 1
- 108010071324 Livagen Proteins 0.000 description 1
- 241001508815 Lodderomyces Species 0.000 description 1
- YIBOAHAOAWACDK-QEJZJMRPSA-N Lys-Ala-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YIBOAHAOAWACDK-QEJZJMRPSA-N 0.000 description 1
- MLLKLNYPZRDIQG-GUBZILKMSA-N Lys-Cys-Gln Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N MLLKLNYPZRDIQG-GUBZILKMSA-N 0.000 description 1
- RZHLIPMZXOEJTL-AVGNSLFASA-N Lys-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N RZHLIPMZXOEJTL-AVGNSLFASA-N 0.000 description 1
- KEPWSUPUFAPBRF-DKIMLUQUSA-N Lys-Ile-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KEPWSUPUFAPBRF-DKIMLUQUSA-N 0.000 description 1
- IZJGPPIGYTVXLB-FQUUOJAGSA-N Lys-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IZJGPPIGYTVXLB-FQUUOJAGSA-N 0.000 description 1
- MYZMQWHPDAYKIE-SRVKXCTJSA-N Lys-Leu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O MYZMQWHPDAYKIE-SRVKXCTJSA-N 0.000 description 1
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 1
- OIQSIMFSVLLWBX-VOAKCMCISA-N Lys-Leu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OIQSIMFSVLLWBX-VOAKCMCISA-N 0.000 description 1
- JQSIGLHQNSZZRL-KKUMJFAQSA-N Lys-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N JQSIGLHQNSZZRL-KKUMJFAQSA-N 0.000 description 1
- WKUXWMWQTOYTFI-SRVKXCTJSA-N Lys-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N WKUXWMWQTOYTFI-SRVKXCTJSA-N 0.000 description 1
- ZJSZPXISKMDJKQ-JYJNAYRXSA-N Lys-Phe-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(O)=O)CC1=CC=CC=C1 ZJSZPXISKMDJKQ-JYJNAYRXSA-N 0.000 description 1
- OBZHNHBAAVEWKI-DCAQKATOSA-N Lys-Pro-Asn Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O OBZHNHBAAVEWKI-DCAQKATOSA-N 0.000 description 1
- UQJOKDAYFULYIX-AVGNSLFASA-N Lys-Pro-Pro Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 UQJOKDAYFULYIX-AVGNSLFASA-N 0.000 description 1
- YSPZCHGIWAQVKQ-AVGNSLFASA-N Lys-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN YSPZCHGIWAQVKQ-AVGNSLFASA-N 0.000 description 1
- IMDJSVBFQKDDEQ-MGHWNKPDSA-N Lys-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCCCN)N IMDJSVBFQKDDEQ-MGHWNKPDSA-N 0.000 description 1
- QLFAPXUXEBAWEK-NHCYSSNCSA-N Lys-Val-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QLFAPXUXEBAWEK-NHCYSSNCSA-N 0.000 description 1
- VKCPHIOZDWUFSW-ONGXEEELSA-N Lys-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN VKCPHIOZDWUFSW-ONGXEEELSA-N 0.000 description 1
- 101150068888 MET3 gene Proteins 0.000 description 1
- 241000555676 Malassezia Species 0.000 description 1
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 206010026749 Mania Diseases 0.000 description 1
- 241000219823 Medicago Species 0.000 description 1
- 235000004357 Mentha x piperita Nutrition 0.000 description 1
- 241001479543 Mentha x piperita Species 0.000 description 1
- 241000970829 Mesorhizobium Species 0.000 description 1
- 241000589195 Mesorhizobium loti Species 0.000 description 1
- HUKLXYYPZWPXCC-KZVJFYERSA-N Met-Ala-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HUKLXYYPZWPXCC-KZVJFYERSA-N 0.000 description 1
- UZVWDRPUTHXQAM-FXQIFTODSA-N Met-Asp-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O UZVWDRPUTHXQAM-FXQIFTODSA-N 0.000 description 1
- ZMYHJISLFYTQGK-FXQIFTODSA-N Met-Asp-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZMYHJISLFYTQGK-FXQIFTODSA-N 0.000 description 1
- FJVJLMZUIGMFFU-BQBZGAKWSA-N Met-Asp-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O FJVJLMZUIGMFFU-BQBZGAKWSA-N 0.000 description 1
- FWTBMGAKKPSTBT-GUBZILKMSA-N Met-Gln-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FWTBMGAKKPSTBT-GUBZILKMSA-N 0.000 description 1
- LBNFTWKGISQVEE-AVGNSLFASA-N Met-Leu-Met Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCSC LBNFTWKGISQVEE-AVGNSLFASA-N 0.000 description 1
- SMVTWPOATVIXTN-NAKRPEOUSA-N Met-Ser-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SMVTWPOATVIXTN-NAKRPEOUSA-N 0.000 description 1
- LBSWWNKMVPAXOI-GUBZILKMSA-N Met-Val-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O LBSWWNKMVPAXOI-GUBZILKMSA-N 0.000 description 1
- 241000202974 Methanobacterium Species 0.000 description 1
- 241000203407 Methanocaldococcus jannaschii Species 0.000 description 1
- 241000203353 Methanococcus Species 0.000 description 1
- 241001302042 Methanothermobacter thermautotrophicus Species 0.000 description 1
- 241000589323 Methylobacterium Species 0.000 description 1
- 241001123674 Metschnikowia Species 0.000 description 1
- 241000235048 Meyerozyma guilliermondii Species 0.000 description 1
- 241001467578 Microbacterium Species 0.000 description 1
- 241000191938 Micrococcus luteus Species 0.000 description 1
- 241001149967 Mrakia Species 0.000 description 1
- 241000306281 Mucor ambiguus Species 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 101100533725 Mus musculus Smr3a gene Proteins 0.000 description 1
- 241000187492 Mycobacterium marinum Species 0.000 description 1
- 241000187917 Mycobacterium ulcerans Species 0.000 description 1
- 102000003505 Myosin Human genes 0.000 description 1
- 108060008487 Myosin Proteins 0.000 description 1
- 241000529863 Myxozyma Species 0.000 description 1
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 1
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 1
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 1
- 101150082943 NAT1 gene Proteins 0.000 description 1
- 241000193596 Nadsonia Species 0.000 description 1
- 241001099335 Nakazawaea Species 0.000 description 1
- 241000988233 Neisseria gonorrhoeae FA 1090 Species 0.000 description 1
- 241000233892 Neocallimastix Species 0.000 description 1
- 241000221960 Neurospora Species 0.000 description 1
- 241000221961 Neurospora crassa Species 0.000 description 1
- 101100392389 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) al-3 gene Proteins 0.000 description 1
- 101100005271 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) cat-1 gene Proteins 0.000 description 1
- 101100022915 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) cys-11 gene Proteins 0.000 description 1
- GRYLNZFGIOXLOG-UHFFFAOYSA-N Nitric acid Chemical compound O[N+]([O-])=O GRYLNZFGIOXLOG-UHFFFAOYSA-N 0.000 description 1
- 241001503696 Nocardia brasiliensis Species 0.000 description 1
- 241000203619 Nocardiopsis dassonvillei Species 0.000 description 1
- 108091005461 Nucleic proteins Chemical group 0.000 description 1
- 208000008589 Obesity Diseases 0.000 description 1
- 241001112159 Ogataea Species 0.000 description 1
- 241000159576 Oosporidium Species 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 241001502335 Orpinomyces Species 0.000 description 1
- BPQQTUXANYXVAA-UHFFFAOYSA-N Orthosilicate Chemical compound [O-][Si]([O-])([O-])[O-] BPQQTUXANYXVAA-UHFFFAOYSA-N 0.000 description 1
- 241000235652 Pachysolen Species 0.000 description 1
- 241000588912 Pantoea agglomerans Species 0.000 description 1
- 241000588696 Pantoea ananatis Species 0.000 description 1
- 241000589597 Paracoccus denitrificans Species 0.000 description 1
- 241001117114 Paracoccus zeaxanthinifaciens Species 0.000 description 1
- 241001495453 Parthenium argentatum Species 0.000 description 1
- 229930182555 Penicillin Natural products 0.000 description 1
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 1
- 241001557897 Phaeosphaeria sp. Species 0.000 description 1
- 241001542817 Phaffia Species 0.000 description 1
- KJJROSNFBRWPHS-JYJNAYRXSA-N Phe-Glu-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KJJROSNFBRWPHS-JYJNAYRXSA-N 0.000 description 1
- BFYHIHGIHGROAT-HTUGSXCWSA-N Phe-Glu-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BFYHIHGIHGROAT-HTUGSXCWSA-N 0.000 description 1
- JEBWZLWTRPZQRX-QWRGUYRKSA-N Phe-Gly-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O JEBWZLWTRPZQRX-QWRGUYRKSA-N 0.000 description 1
- XEXSSIBQYNKFBX-KBPBESRZSA-N Phe-Gly-His Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CC=CC=C1 XEXSSIBQYNKFBX-KBPBESRZSA-N 0.000 description 1
- KDYPMIZMXDECSU-JYJNAYRXSA-N Phe-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 KDYPMIZMXDECSU-JYJNAYRXSA-N 0.000 description 1
- HQPWNHXERZCIHP-PMVMPFDFSA-N Phe-Leu-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 HQPWNHXERZCIHP-PMVMPFDFSA-N 0.000 description 1
- RTUWVJVJSMOGPL-KKUMJFAQSA-N Phe-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N RTUWVJVJSMOGPL-KKUMJFAQSA-N 0.000 description 1
- WURZLPSMYZLEGH-UNQGMJICSA-N Phe-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CC=CC=C1)N)O WURZLPSMYZLEGH-UNQGMJICSA-N 0.000 description 1
- YMTMNYNEZDAGMW-RNXOBYDBSA-N Phe-Phe-Trp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)O)N YMTMNYNEZDAGMW-RNXOBYDBSA-N 0.000 description 1
- XOHJOMKCRLHGCY-UNQGMJICSA-N Phe-Pro-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOHJOMKCRLHGCY-UNQGMJICSA-N 0.000 description 1
- BONHGTUEEPIMPM-AVGNSLFASA-N Phe-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O BONHGTUEEPIMPM-AVGNSLFASA-N 0.000 description 1
- GMWNQSGWWGKTSF-LFSVMHDDSA-N Phe-Thr-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O GMWNQSGWWGKTSF-LFSVMHDDSA-N 0.000 description 1
- BQMFWUKNOCJDNV-HJWJTTGWSA-N Phe-Val-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BQMFWUKNOCJDNV-HJWJTTGWSA-N 0.000 description 1
- JTKGCYOOJLUETJ-ULQDDVLXSA-N Phe-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JTKGCYOOJLUETJ-ULQDDVLXSA-N 0.000 description 1
- IEIFEYBAYFSRBQ-IHRRRGAJSA-N Phe-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N IEIFEYBAYFSRBQ-IHRRRGAJSA-N 0.000 description 1
- 241000192608 Phormidium Species 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 241000195887 Physcomitrella patens Species 0.000 description 1
- 240000000020 Picea glauca Species 0.000 description 1
- 235000008127 Picea glauca Nutrition 0.000 description 1
- 241000364051 Pima Species 0.000 description 1
- 241000235379 Piromyces Species 0.000 description 1
- 240000004713 Pisum sativum Species 0.000 description 1
- 235000010582 Pisum sativum Nutrition 0.000 description 1
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 1
- OOLOTUZJUBOMAX-GUBZILKMSA-N Pro-Ala-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O OOLOTUZJUBOMAX-GUBZILKMSA-N 0.000 description 1
- SSSFPISOZOLQNP-GUBZILKMSA-N Pro-Arg-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SSSFPISOZOLQNP-GUBZILKMSA-N 0.000 description 1
- GRIRJQGZZJVANI-CYDGBPFRSA-N Pro-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H]1CCCN1 GRIRJQGZZJVANI-CYDGBPFRSA-N 0.000 description 1
- SGCZFWSQERRKBD-BQBZGAKWSA-N Pro-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 SGCZFWSQERRKBD-BQBZGAKWSA-N 0.000 description 1
- ZYBUKTMPPFQSHL-JYJNAYRXSA-N Pro-Asp-Trp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ZYBUKTMPPFQSHL-JYJNAYRXSA-N 0.000 description 1
- FKKHDBFNOLCYQM-FXQIFTODSA-N Pro-Cys-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O FKKHDBFNOLCYQM-FXQIFTODSA-N 0.000 description 1
- NOXSEHJOXCWRHK-DCAQKATOSA-N Pro-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@@H]1CCCN1 NOXSEHJOXCWRHK-DCAQKATOSA-N 0.000 description 1
- HJSCRFZVGXAGNG-SRVKXCTJSA-N Pro-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1 HJSCRFZVGXAGNG-SRVKXCTJSA-N 0.000 description 1
- NMELOOXSGDRBRU-YUMQZZPRSA-N Pro-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)O)NC(=O)[C@@H]1CCCN1 NMELOOXSGDRBRU-YUMQZZPRSA-N 0.000 description 1
- LXVLKXPFIDDHJG-CIUDSAMLSA-N Pro-Glu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O LXVLKXPFIDDHJG-CIUDSAMLSA-N 0.000 description 1
- BCNRNJWSRFDPTQ-HJWJTTGWSA-N Pro-Ile-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BCNRNJWSRFDPTQ-HJWJTTGWSA-N 0.000 description 1
- YXHYJEPDKSYPSQ-AVGNSLFASA-N Pro-Leu-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 YXHYJEPDKSYPSQ-AVGNSLFASA-N 0.000 description 1
- MCWHYUWXVNRXFV-RWMBFGLXSA-N Pro-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 MCWHYUWXVNRXFV-RWMBFGLXSA-N 0.000 description 1
- SUENWIFTSTWUKD-AVGNSLFASA-N Pro-Leu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SUENWIFTSTWUKD-AVGNSLFASA-N 0.000 description 1
- RPLMFKUKFZOTER-AVGNSLFASA-N Pro-Met-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@@H]1CCCN1 RPLMFKUKFZOTER-AVGNSLFASA-N 0.000 description 1
- WHNJMTHJGCEKGA-ULQDDVLXSA-N Pro-Phe-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WHNJMTHJGCEKGA-ULQDDVLXSA-N 0.000 description 1
- KDBHVPXBQADZKY-GUBZILKMSA-N Pro-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KDBHVPXBQADZKY-GUBZILKMSA-N 0.000 description 1
- JLMZKEQFMVORMA-SRVKXCTJSA-N Pro-Pro-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 JLMZKEQFMVORMA-SRVKXCTJSA-N 0.000 description 1
- HWLKHNDRXWTFTN-GUBZILKMSA-N Pro-Pro-Cys Chemical compound C1C[C@H](NC1)C(=O)N2CCC[C@H]2C(=O)N[C@@H](CS)C(=O)O HWLKHNDRXWTFTN-GUBZILKMSA-N 0.000 description 1
- RFWXYTJSVDUBBZ-DCAQKATOSA-N Pro-Pro-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RFWXYTJSVDUBBZ-DCAQKATOSA-N 0.000 description 1
- SXJOPONICMGFCR-DCAQKATOSA-N Pro-Ser-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O SXJOPONICMGFCR-DCAQKATOSA-N 0.000 description 1
- SNGZLPOXVRTNMB-LPEHRKFASA-N Pro-Ser-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N2CCC[C@@H]2C(=O)O SNGZLPOXVRTNMB-LPEHRKFASA-N 0.000 description 1
- AJJDPGVVNPUZCR-RHYQMDGZSA-N Pro-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1)O AJJDPGVVNPUZCR-RHYQMDGZSA-N 0.000 description 1
- FZXSYIPVAFVYBH-KKUMJFAQSA-N Pro-Tyr-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O FZXSYIPVAFVYBH-KKUMJFAQSA-N 0.000 description 1
- FHJQROWZEJFZPO-SRVKXCTJSA-N Pro-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FHJQROWZEJFZPO-SRVKXCTJSA-N 0.000 description 1
- 101710150389 Probable farnesyl diphosphate synthase Proteins 0.000 description 1
- 241000589517 Pseudomonas aeruginosa Species 0.000 description 1
- 241001453299 Pseudomonas mevalonii Species 0.000 description 1
- 101100132333 Pseudomonas mevalonii mvaA gene Proteins 0.000 description 1
- 241000432378 Pseudomonas pudica Species 0.000 description 1
- 241000589774 Pseudomonas sp. Species 0.000 description 1
- 241000205160 Pyrococcus Species 0.000 description 1
- 241001148023 Pyrococcus abyssi Species 0.000 description 1
- 241000589771 Ralstonia solanacearum Species 0.000 description 1
- 101100149716 Rattus norvegicus Vcsa1 gene Proteins 0.000 description 1
- GIPHUOWOTCAJSR-UHFFFAOYSA-N Rebaudioside A. Natural products C1CC2C3(C)CCCC(C)(C(=O)OC4C(C(O)C(O)C(CO)O4)O)C3CCC2(C2)CC(=C)C21OC1OC(CO)C(O)C(O)C1OC(C1O)OC(CO)C(O)C1OC1OC(CO)C(O)C(O)C1O GIPHUOWOTCAJSR-UHFFFAOYSA-N 0.000 description 1
- RLLCWNUIHGPAJY-RYBZXKSASA-N Rebaudioside E Natural products O=C(O[C@H]1[C@H](O[C@H]2[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O2)[C@@H](O)[C@@H](O)[C@H](CO)O1)[C@]1(C)[C@@H]2[C@@](C)([C@@H]3[C@@]4(CC(=C)[C@@](O[C@@H]5[C@@H](O[C@@H]6[C@@H](O)[C@H](O)[C@@H](O)[C@H](CO)O6)[C@H](O)[C@@H](O)[C@H](CO)O5)(C4)CC3)CC2)CCC1 RLLCWNUIHGPAJY-RYBZXKSASA-N 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 241000589187 Rhizobium sp. Species 0.000 description 1
- 241000190932 Rhodopseudomonas Species 0.000 description 1
- 101100394989 Rhodopseudomonas palustris (strain ATCC BAA-98 / CGA009) hisI gene Proteins 0.000 description 1
- 241000190967 Rhodospirillum Species 0.000 description 1
- 241000190984 Rhodospirillum rubrum Species 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 208000032825 Ring chromosome 2 syndrome Diseases 0.000 description 1
- YWPVROCHNBYFTP-UHFFFAOYSA-N Rubusoside Natural products C1CC2C3(C)CCCC(C)(C(=O)OC4C(C(O)C(O)C(CO)O4)O)C3CCC2(C2)CC(=C)C21OC1OC(CO)C(O)C(O)C1O YWPVROCHNBYFTP-UHFFFAOYSA-N 0.000 description 1
- 101100286750 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) ILV2 gene Proteins 0.000 description 1
- 101100386089 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) MET17 gene Proteins 0.000 description 1
- 241000582914 Saccharomyces uvarum Species 0.000 description 1
- 241001489223 Saccharomycodes Species 0.000 description 1
- 241000222838 Saitoella Species 0.000 description 1
- 241001514651 Sakaguchia Species 0.000 description 1
- 241001138501 Salmonella enterica Species 0.000 description 1
- 241000293871 Salmonella enterica subsp. enterica serovar Typhi Species 0.000 description 1
- 241000607149 Salmonella sp. Species 0.000 description 1
- 241001149673 Saturnispora Species 0.000 description 1
- 241000159586 Schizoblastosporion Species 0.000 description 1
- 241000235346 Schizosaccharomyces Species 0.000 description 1
- 101100022918 Schizosaccharomyces pombe (strain 972 / ATCC 24843) sua1 gene Proteins 0.000 description 1
- 241000311088 Schwanniomyces Species 0.000 description 1
- SRTCFKGBYBZRHA-ACZMJKKPSA-N Ser-Ala-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SRTCFKGBYBZRHA-ACZMJKKPSA-N 0.000 description 1
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 1
- VAUMZJHYZQXZBQ-WHFBIAKZSA-N Ser-Asn-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O VAUMZJHYZQXZBQ-WHFBIAKZSA-N 0.000 description 1
- KNZQGAUEYZJUSQ-ZLUOBGJFSA-N Ser-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N KNZQGAUEYZJUSQ-ZLUOBGJFSA-N 0.000 description 1
- MMAPOBOTRUVNKJ-ZLUOBGJFSA-N Ser-Asp-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CO)N)C(=O)O MMAPOBOTRUVNKJ-ZLUOBGJFSA-N 0.000 description 1
- BTPAWKABYQMKKN-LKXGYXEUSA-N Ser-Asp-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BTPAWKABYQMKKN-LKXGYXEUSA-N 0.000 description 1
- DSSOYPJWSWFOLK-CIUDSAMLSA-N Ser-Cys-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O DSSOYPJWSWFOLK-CIUDSAMLSA-N 0.000 description 1
- SMIDBHKWSYUBRZ-ACZMJKKPSA-N Ser-Glu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O SMIDBHKWSYUBRZ-ACZMJKKPSA-N 0.000 description 1
- YQQKYAZABFEYAF-FXQIFTODSA-N Ser-Glu-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQQKYAZABFEYAF-FXQIFTODSA-N 0.000 description 1
- DSGYZICNAMEJOC-AVGNSLFASA-N Ser-Glu-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DSGYZICNAMEJOC-AVGNSLFASA-N 0.000 description 1
- UFKPDBLKLOBMRH-XHNCKOQMSA-N Ser-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)C(=O)O UFKPDBLKLOBMRH-XHNCKOQMSA-N 0.000 description 1
- OHKFXGKHSJKKAL-NRPADANISA-N Ser-Glu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OHKFXGKHSJKKAL-NRPADANISA-N 0.000 description 1
- IXCHOHLPHNGFTJ-YUMQZZPRSA-N Ser-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N IXCHOHLPHNGFTJ-YUMQZZPRSA-N 0.000 description 1
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 1
- JFWDJFULOLKQFY-QWRGUYRKSA-N Ser-Gly-Phe Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JFWDJFULOLKQFY-QWRGUYRKSA-N 0.000 description 1
- XXXAXOWMBOKTRN-XPUUQOCRSA-N Ser-Gly-Val Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXXAXOWMBOKTRN-XPUUQOCRSA-N 0.000 description 1
- HMRAQFJFTOLDKW-GUBZILKMSA-N Ser-His-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O HMRAQFJFTOLDKW-GUBZILKMSA-N 0.000 description 1
- CICQXRWZNVXFCU-SRVKXCTJSA-N Ser-His-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O CICQXRWZNVXFCU-SRVKXCTJSA-N 0.000 description 1
- MOQDPPUMFSMYOM-KKUMJFAQSA-N Ser-His-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CO)N MOQDPPUMFSMYOM-KKUMJFAQSA-N 0.000 description 1
- QYSFWUIXDFJUDW-DCAQKATOSA-N Ser-Leu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYSFWUIXDFJUDW-DCAQKATOSA-N 0.000 description 1
- UGTZYIPOBYXWRW-SRVKXCTJSA-N Ser-Phe-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O UGTZYIPOBYXWRW-SRVKXCTJSA-N 0.000 description 1
- BUYHXYIUQUBEQP-AVGNSLFASA-N Ser-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CO)N BUYHXYIUQUBEQP-AVGNSLFASA-N 0.000 description 1
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 1
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 1
- JURQXQBJKUHGJS-UHFFFAOYSA-N Ser-Ser-Ser-Ser Chemical compound OCC(N)C(=O)NC(CO)C(=O)NC(CO)C(=O)NC(CO)C(O)=O JURQXQBJKUHGJS-UHFFFAOYSA-N 0.000 description 1
- SQHKXWODKJDZRC-LKXGYXEUSA-N Ser-Thr-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQHKXWODKJDZRC-LKXGYXEUSA-N 0.000 description 1
- VLMIUSLQONKLDV-HEIBUPTGSA-N Ser-Thr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VLMIUSLQONKLDV-HEIBUPTGSA-N 0.000 description 1
- STIAINRLUUKYKM-WFBYXXMGSA-N Ser-Trp-Ala Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CO)=CNC2=C1 STIAINRLUUKYKM-WFBYXXMGSA-N 0.000 description 1
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 1
- JZRYFUGREMECBH-XPUUQOCRSA-N Ser-Val-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O JZRYFUGREMECBH-XPUUQOCRSA-N 0.000 description 1
- HNDMFDBQXYZSRM-IHRRRGAJSA-N Ser-Val-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HNDMFDBQXYZSRM-IHRRRGAJSA-N 0.000 description 1
- HSWXBJCBYSWBPT-GUBZILKMSA-N Ser-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)C(O)=O HSWXBJCBYSWBPT-GUBZILKMSA-N 0.000 description 1
- 241000607720 Serratia Species 0.000 description 1
- 241000607715 Serratia marcescens Species 0.000 description 1
- 241000607764 Shigella dysenteriae Species 0.000 description 1
- 241000607762 Shigella flexneri Species 0.000 description 1
- 241000607760 Shigella sonnei Species 0.000 description 1
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 1
- 102100033929 Sodium-dependent noradrenaline transporter Human genes 0.000 description 1
- 235000002560 Solanum lycopersicum Nutrition 0.000 description 1
- 244000061456 Solanum tuberosum Species 0.000 description 1
- 235000002595 Solanum tuberosum Nutrition 0.000 description 1
- 241001575049 Sonia Species 0.000 description 1
- 241000228389 Sporidiobolus Species 0.000 description 1
- 241000222068 Sporobolomyces <Sporidiobolaceae> Species 0.000 description 1
- 241000193640 Sporopachydermia Species 0.000 description 1
- 102100037997 Squalene synthase Human genes 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 241000222665 Sterigmatomyces Species 0.000 description 1
- 241000040567 Sterigmatosporidium Species 0.000 description 1
- 101100101356 Stevia rebaudiana UGT91D2 gene Proteins 0.000 description 1
- 241000203644 Streptoalloteichus hindustanus Species 0.000 description 1
- 244000057717 Streptococcus lactis Species 0.000 description 1
- 235000014897 Streptococcus lactis Nutrition 0.000 description 1
- 241000194019 Streptococcus mutans Species 0.000 description 1
- 241000694196 Streptococcus pneumoniae R6 Species 0.000 description 1
- 241000103160 Streptococcus pyogenes MGAS10750 Species 0.000 description 1
- 241000103154 Streptococcus pyogenes MGAS2096 Species 0.000 description 1
- 241000186986 Streptomyces anulatus Species 0.000 description 1
- 241000187310 Streptomyces noursei Species 0.000 description 1
- 241000828294 Streptomyces roseosporus NRRL 15998 Species 0.000 description 1
- 241000187191 Streptomyces viridochromogenes Species 0.000 description 1
- 241000267323 Streptomyces viridochromogenes DSM 40736 Species 0.000 description 1
- 241000205101 Sulfolobus Species 0.000 description 1
- LSNNMFCWUKXFEE-UHFFFAOYSA-N Sulfurous acid Chemical compound OS(O)=O LSNNMFCWUKXFEE-UHFFFAOYSA-N 0.000 description 1
- 241000122237 Symbiotaphrina Species 0.000 description 1
- 241000159597 Sympodiomyces Species 0.000 description 1
- 241001523623 Sympodiomycopsis Species 0.000 description 1
- 241000192707 Synechococcus Species 0.000 description 1
- 241000192560 Synechococcus sp. Species 0.000 description 1
- 241000557627 Syntrophus aciditrophicus SB Species 0.000 description 1
- 241001491687 Thalassiosira pseudonana Species 0.000 description 1
- 241000383558 Thalia <angiosperm> Species 0.000 description 1
- 241000204667 Thermoplasma Species 0.000 description 1
- FQPQPTHMHZKGFM-XQXXSGGOSA-N Thr-Ala-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O FQPQPTHMHZKGFM-XQXXSGGOSA-N 0.000 description 1
- DWYAUVCQDTZIJI-VZFHVOOUSA-N Thr-Ala-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DWYAUVCQDTZIJI-VZFHVOOUSA-N 0.000 description 1
- TWLMXDWFVNEFFK-FJXKBIBVSA-N Thr-Arg-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O TWLMXDWFVNEFFK-FJXKBIBVSA-N 0.000 description 1
- YLXAMFZYJTZXFH-OLHMAJIHSA-N Thr-Asn-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O YLXAMFZYJTZXFH-OLHMAJIHSA-N 0.000 description 1
- QILPDQCTQZDHFM-HJGDQZAQSA-N Thr-Gln-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QILPDQCTQZDHFM-HJGDQZAQSA-N 0.000 description 1
- UHBPFYOQQPFKQR-JHEQGTHGSA-N Thr-Gln-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O UHBPFYOQQPFKQR-JHEQGTHGSA-N 0.000 description 1
- FDALPRWYVKJCLL-PMVVWTBXSA-N Thr-His-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)NCC(O)=O FDALPRWYVKJCLL-PMVVWTBXSA-N 0.000 description 1
- XTCNBOBTROGWMW-RWRJDSDZSA-N Thr-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XTCNBOBTROGWMW-RWRJDSDZSA-N 0.000 description 1
- VTVVYQOXJCZVEB-WDCWCFNPSA-N Thr-Leu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VTVVYQOXJCZVEB-WDCWCFNPSA-N 0.000 description 1
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 1
- UJQVSMNQMQHVRY-KZVJFYERSA-N Thr-Met-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O UJQVSMNQMQHVRY-KZVJFYERSA-N 0.000 description 1
- WVVOFCVMHAXGLE-LFSVMHDDSA-N Thr-Phe-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O WVVOFCVMHAXGLE-LFSVMHDDSA-N 0.000 description 1
- GYUUYCIXELGTJS-MEYUZBJRSA-N Thr-Phe-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O GYUUYCIXELGTJS-MEYUZBJRSA-N 0.000 description 1
- MUAFDCVOHYAFNG-RCWTZXSCSA-N Thr-Pro-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MUAFDCVOHYAFNG-RCWTZXSCSA-N 0.000 description 1
- DEGCBBCMYWNJNA-RHYQMDGZSA-N Thr-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O DEGCBBCMYWNJNA-RHYQMDGZSA-N 0.000 description 1
- YRJOLUDFVAUXLI-GSSVUCPTSA-N Thr-Thr-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O YRJOLUDFVAUXLI-GSSVUCPTSA-N 0.000 description 1
- XGFYGMKZKFRGAI-RCWTZXSCSA-N Thr-Val-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XGFYGMKZKFRGAI-RCWTZXSCSA-N 0.000 description 1
- RTAQQCXQSZGOHL-UHFFFAOYSA-N Titanium Chemical compound [Ti] RTAQQCXQSZGOHL-UHFFFAOYSA-N 0.000 description 1
- 241000235006 Torulaspora Species 0.000 description 1
- 241001495125 Torulaspora pretoriensis Species 0.000 description 1
- HDTRYLNUVZCQOY-WSWWMNSNSA-N Trehalose Natural products O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-WSWWMNSNSA-N 0.000 description 1
- 241000400381 Trichosporiella Species 0.000 description 1
- 241001480014 Trigonopsis Species 0.000 description 1
- CXPJPTFWKXNDKV-NUTKFTJISA-N Trp-Leu-Ala Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 CXPJPTFWKXNDKV-NUTKFTJISA-N 0.000 description 1
- WLQRIHCMPFHGKP-PMVMPFDFSA-N Trp-Leu-Phe Chemical compound C([C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)CC(C)C)C(O)=O)C1=CC=CC=C1 WLQRIHCMPFHGKP-PMVMPFDFSA-N 0.000 description 1
- UKWSFUSPGPBJGU-VFAJRCTISA-N Trp-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O UKWSFUSPGPBJGU-VFAJRCTISA-N 0.000 description 1
- LVTKHGUGBGNBPL-UHFFFAOYSA-N Trp-P-1 Chemical compound N1C2=CC=CC=C2C2=C1C(C)=C(N)N=C2C LVTKHGUGBGNBPL-UHFFFAOYSA-N 0.000 description 1
- BOBZBMOTRORUPT-XIRDDKMYSA-N Trp-Ser-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 BOBZBMOTRORUPT-XIRDDKMYSA-N 0.000 description 1
- BABINGWMZBWXIX-BPUTZDHNSA-N Trp-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N BABINGWMZBWXIX-BPUTZDHNSA-N 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 241000222671 Tsuchiyaea Species 0.000 description 1
- BARBHMSSVWPKPZ-IHRRRGAJSA-N Tyr-Asp-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BARBHMSSVWPKPZ-IHRRRGAJSA-N 0.000 description 1
- CTDPLKMBVALCGN-JSGCOSHPSA-N Tyr-Gly-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O CTDPLKMBVALCGN-JSGCOSHPSA-N 0.000 description 1
- KIJLSRYAUGGZIN-CFMVVWHZSA-N Tyr-Ile-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KIJLSRYAUGGZIN-CFMVVWHZSA-N 0.000 description 1
- XDGPTBVOSHKDFT-KKUMJFAQSA-N Tyr-Met-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O XDGPTBVOSHKDFT-KKUMJFAQSA-N 0.000 description 1
- MDXLPNRXCFOBTL-BZSNNMDCSA-N Tyr-Ser-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MDXLPNRXCFOBTL-BZSNNMDCSA-N 0.000 description 1
- BXJQKVDPRMLGKN-PMVMPFDFSA-N Tyr-Trp-Leu Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(O)=O)C1=CC=C(O)C=C1 BXJQKVDPRMLGKN-PMVMPFDFSA-N 0.000 description 1
- DQQDLYVHOTZLOR-OCIMBMBZSA-N UDP-alpha-D-xylose Chemical compound C([C@@H]1[C@H]([C@H]([C@@H](O1)N1C(NC(=O)C=C1)=O)O)O)OP(O)(=O)OP(O)(=O)O[C@H]1OC[C@@H](O)[C@H](O)[C@H]1O DQQDLYVHOTZLOR-OCIMBMBZSA-N 0.000 description 1
- DQQDLYVHOTZLOR-UHFFFAOYSA-N UDP-alpha-D-xylose Natural products O1C(N2C(NC(=O)C=C2)=O)C(O)C(O)C1COP(O)(=O)OP(O)(=O)OC1OCC(O)C(O)C1O DQQDLYVHOTZLOR-UHFFFAOYSA-N 0.000 description 1
- DRDCJEIZVLVWNC-SLBWPEPYSA-N UDP-beta-L-rhamnose Chemical compound O[C@@H]1[C@H](O)[C@@H](O)[C@H](C)O[C@@H]1OP(O)(=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C(NC(=O)C=C2)=O)O1 DRDCJEIZVLVWNC-SLBWPEPYSA-N 0.000 description 1
- 241000145580 Udeniomyces Species 0.000 description 1
- 241000221566 Ustilago Species 0.000 description 1
- SMKXLHVZIFKQRB-GUBZILKMSA-N Val-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](C(C)C)N SMKXLHVZIFKQRB-GUBZILKMSA-N 0.000 description 1
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 1
- HZYOWMGWKKRMBZ-BYULHYEWSA-N Val-Asp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZYOWMGWKKRMBZ-BYULHYEWSA-N 0.000 description 1
- FPCIBLUVDNXPJO-XPUUQOCRSA-N Val-Cys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O FPCIBLUVDNXPJO-XPUUQOCRSA-N 0.000 description 1
- QHFQQRKNGCXTHL-AUTRQRHGSA-N Val-Gln-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QHFQQRKNGCXTHL-AUTRQRHGSA-N 0.000 description 1
- UZDHNIJRRTUKKC-DLOVCJGASA-N Val-Gln-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N UZDHNIJRRTUKKC-DLOVCJGASA-N 0.000 description 1
- ROLGIBMFNMZANA-GVXVVHGQSA-N Val-Glu-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N ROLGIBMFNMZANA-GVXVVHGQSA-N 0.000 description 1
- RHYOAUJXSRWVJT-GVXVVHGQSA-N Val-His-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RHYOAUJXSRWVJT-GVXVVHGQSA-N 0.000 description 1
- PYPZMFDMCCWNST-NAKRPEOUSA-N Val-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N PYPZMFDMCCWNST-NAKRPEOUSA-N 0.000 description 1
- IJGPOONOTBNTFS-GVXVVHGQSA-N Val-Lys-Glu Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O IJGPOONOTBNTFS-GVXVVHGQSA-N 0.000 description 1
- IOETTZIEIBVWBZ-GUBZILKMSA-N Val-Met-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CS)C(=O)O)N IOETTZIEIBVWBZ-GUBZILKMSA-N 0.000 description 1
- RQOMPQGUGBILAG-AVGNSLFASA-N Val-Met-Leu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O RQOMPQGUGBILAG-AVGNSLFASA-N 0.000 description 1
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 1
- YTNGABPUXFEOGU-SRVKXCTJSA-N Val-Pro-Arg Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O YTNGABPUXFEOGU-SRVKXCTJSA-N 0.000 description 1
- QIVPZSWBBHRNBA-JYJNAYRXSA-N Val-Pro-Phe Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O QIVPZSWBBHRNBA-JYJNAYRXSA-N 0.000 description 1
- QWCZXKIFPWPQHR-JYJNAYRXSA-N Val-Pro-Tyr Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QWCZXKIFPWPQHR-JYJNAYRXSA-N 0.000 description 1
- QSPOLEBZTMESFY-SRVKXCTJSA-N Val-Pro-Val Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O QSPOLEBZTMESFY-SRVKXCTJSA-N 0.000 description 1
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 1
- MNSSBIHFEUUXNW-RCWTZXSCSA-N Val-Thr-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N MNSSBIHFEUUXNW-RCWTZXSCSA-N 0.000 description 1
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 1
- OEVFFOBAXHBXKM-HSHDSVGOSA-N Val-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](C(C)C)N)O OEVFFOBAXHBXKM-HSHDSVGOSA-N 0.000 description 1
- ZNGPROMGGGFOAA-JYJNAYRXSA-N Val-Tyr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=C(O)C=C1 ZNGPROMGGGFOAA-JYJNAYRXSA-N 0.000 description 1
- YKZVPMUGEJXEOR-JYJNAYRXSA-N Val-Val-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N YKZVPMUGEJXEOR-JYJNAYRXSA-N 0.000 description 1
- DORPKYRPJIIARM-GYAWPQPFSA-N Verbasoside Chemical compound O[C@@H]1[C@H](O)[C@@H](O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](O)[C@H](OCCC=2C=C(O)C(O)=CC=2)O[C@H](CO)[C@H]1O DORPKYRPJIIARM-GYAWPQPFSA-N 0.000 description 1
- 241001253549 Vibrio fischeri ES114 Species 0.000 description 1
- 241000193620 Wickerhamia Species 0.000 description 1
- 241000193624 Wickerhamiella Species 0.000 description 1
- 241000235152 Williopsis Species 0.000 description 1
- 241001075308 Xylella fastidiosa Temecula1 Species 0.000 description 1
- 241000235013 Yarrowia Species 0.000 description 1
- 241000235015 Yarrowia lipolytica Species 0.000 description 1
- 229910021536 Zeolite Inorganic materials 0.000 description 1
- 241000222676 Zygoascus Species 0.000 description 1
- 241000235017 Zygosaccharomyces Species 0.000 description 1
- 241000685534 Zygowilliopsis Species 0.000 description 1
- 241000193645 Zygozyma Species 0.000 description 1
- 241000588901 Zymomonas Species 0.000 description 1
- HINSNOJRHFIMKB-DJDMUFINSA-N [(2S,3R,4S,5S,6R)-4,5-dihydroxy-6-(hydroxymethyl)-3-[(2S,3R,4R,5R,6S)-3,4,5-trihydroxy-6-methyloxan-2-yl]oxyoxan-2-yl] (1R,4S,5R,9S,10R,13S)-13-[(2S,3R,4S,5R,6R)-5-hydroxy-6-(hydroxymethyl)-3,4-bis[[(2S,3R,4S,5S,6R)-3,4,5-trihydroxy-6-(hydroxymethyl)oxan-2-yl]oxy]oxan-2-yl]oxy-5,9-dimethyl-14-methylidenetetracyclo[11.2.1.01,10.04,9]hexadecane-5-carboxylate Chemical compound [H][C@@]1(O[C@@H]2[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]2OC(=O)[C@]2(C)CCC[C@@]3(C)[C@]4([H])CC[C@@]5(C[C@]4(CC5=C)CC[C@]23[H])O[C@]2([H])O[C@H](CO)[C@@H](O)[C@H](O[C@]3([H])O[C@H](CO)[C@@H](O)[C@H](O)[C@H]3O)[C@H]2O[C@]2([H])O[C@H](CO)[C@@H](O)[C@H](O)[C@H]2O)O[C@@H](C)[C@H](O)[C@@H](O)[C@H]1O HINSNOJRHFIMKB-DJDMUFINSA-N 0.000 description 1
- 241000634340 [Haemophilus] ducreyi 35000HP Species 0.000 description 1
- IKHGUXGNUITLKF-XPULMUKRSA-N acetaldehyde Chemical compound [14CH]([14CH3])=O IKHGUXGNUITLKF-XPULMUKRSA-N 0.000 description 1
- 229940100228 acetyl coenzyme a Drugs 0.000 description 1
- LIPOUNRJVLNBCD-UHFFFAOYSA-N acetyl dihydrogen phosphate Chemical compound CC(=O)OP(O)(O)=O LIPOUNRJVLNBCD-UHFFFAOYSA-N 0.000 description 1
- 229960001138 acetylsalicylic acid Drugs 0.000 description 1
- 230000010933 acylation Effects 0.000 description 1
- 238000005917 acylation reaction Methods 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000005377 adsorption chromatography Methods 0.000 description 1
- 230000006838 adverse reaction Effects 0.000 description 1
- 239000000443 aerosol Substances 0.000 description 1
- 238000013019 agitation Methods 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 1
- 108010041407 alanylaspartic acid Proteins 0.000 description 1
- 108010044940 alanylglutamine Proteins 0.000 description 1
- 108010047495 alanylglycine Proteins 0.000 description 1
- 108010087924 alanylproline Proteins 0.000 description 1
- HDTRYLNUVZCQOY-LIZSDCNHSA-N alpha,alpha-trehalose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-LIZSDCNHSA-N 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- WQZGKKKJIJFFOK-PHYPRBDBSA-N alpha-D-galactose Chemical compound OC[C@H]1O[C@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-PHYPRBDBSA-N 0.000 description 1
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 1
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 1
- 229910021529 ammonia Inorganic materials 0.000 description 1
- 229910000148 ammonium phosphate Inorganic materials 0.000 description 1
- 235000019289 ammonium phosphates Nutrition 0.000 description 1
- 150000003863 ammonium salts Chemical class 0.000 description 1
- 229940044197 ammonium sulfate Drugs 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000002399 angioplasty Methods 0.000 description 1
- 150000001450 anions Chemical class 0.000 description 1
- 239000012736 aqueous medium Substances 0.000 description 1
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 1
- 108010013835 arginine glutamate Proteins 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 1
- 229930101531 artemisinin Natural products 0.000 description 1
- BLUAFEHZUWYNDE-NNWCWBAJSA-N artemisinin Chemical compound C([C@](OO1)(C)O2)C[C@H]3[C@H](C)CC[C@@H]4[C@@]31[C@@H]2OC(=O)[C@@H]4C BLUAFEHZUWYNDE-NNWCWBAJSA-N 0.000 description 1
- 229960004191 artemisinin Drugs 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 239000010425 asbestos Substances 0.000 description 1
- 229940009098 aspartate Drugs 0.000 description 1
- 108010092854 aspartyllysine Proteins 0.000 description 1
- 108010068265 aspartyltyrosine Proteins 0.000 description 1
- 230000001651 autotrophic effect Effects 0.000 description 1
- 239000003782 beta lactam antibiotic agent Substances 0.000 description 1
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 1
- GUBGYTABKSRVRQ-QUYVBRFLSA-N beta-maltose Chemical compound OC[C@H]1O[C@H](O[C@H]2[C@H](O)[C@@H](O)[C@H](O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@@H]1O GUBGYTABKSRVRQ-QUYVBRFLSA-N 0.000 description 1
- 235000013361 beverage Nutrition 0.000 description 1
- 238000010364 biochemical engineering Methods 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 238000013452 biotechnological production Methods 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 101150049515 bla gene Proteins 0.000 description 1
- 229960001561 bleomycin Drugs 0.000 description 1
- OYVAGSVQBOHSSS-UAPAGMARSA-O bleomycin A2 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC=C(N=1)C=1SC=C(N=1)C(=O)NCCC[S+](C)C)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C OYVAGSVQBOHSSS-UAPAGMARSA-O 0.000 description 1
- 150000005693 branched-chain amino acids Chemical class 0.000 description 1
- 238000009395 breeding Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 235000014121 butter Nutrition 0.000 description 1
- GVEZIHKRYBHEFX-UHFFFAOYSA-N caerulein A Natural products CC=CCC=CCCC(=O)C1OC1C(N)=O GVEZIHKRYBHEFX-UHFFFAOYSA-N 0.000 description 1
- 229960005069 calcium Drugs 0.000 description 1
- 235000001465 calcium Nutrition 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- LLSDKQJKOVVTOJ-UHFFFAOYSA-L calcium chloride dihydrate Chemical compound O.O.[Cl-].[Cl-].[Ca+2] LLSDKQJKOVVTOJ-UHFFFAOYSA-L 0.000 description 1
- 238000011088 calibration curve Methods 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 235000013877 carbamide Nutrition 0.000 description 1
- YZBQHRLRFGPBSL-RXMQYKEDSA-N carbapenem Chemical compound C1C=CN2C(=O)C[C@H]21 YZBQHRLRFGPBSL-RXMQYKEDSA-N 0.000 description 1
- 101150055766 cat gene Proteins 0.000 description 1
- 230000001925 catabolic effect Effects 0.000 description 1
- 230000006652 catabolic pathway Effects 0.000 description 1
- 239000006143 cell culture medium Substances 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 229940124587 cephalosporin Drugs 0.000 description 1
- 150000001780 cephalosporins Chemical class 0.000 description 1
- UCKZMPLVLCKKMO-LHLIQPBNSA-N cephamycin Chemical compound S1CC(C)=C(C(O)=O)N2C(=O)[C@@H](C)[C@]21OC UCKZMPLVLCKKMO-LHLIQPBNSA-N 0.000 description 1
- GVEZIHKRYBHEFX-NQQPLRFYSA-N cerulenin Chemical compound C\C=C\C\C=C\CCC(=O)[C@H]1O[C@H]1C(N)=O GVEZIHKRYBHEFX-NQQPLRFYSA-N 0.000 description 1
- 229950005984 cerulenin Drugs 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 239000011436 cob Substances 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 235000009508 confectionery Nutrition 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 238000002425 crystallisation Methods 0.000 description 1
- 230000008025 crystallization Effects 0.000 description 1
- 238000012136 culture method Methods 0.000 description 1
- 239000012228 culture supernatant Substances 0.000 description 1
- 125000000753 cycloalkyl group Chemical group 0.000 description 1
- 108010004073 cysteinylcysteine Proteins 0.000 description 1
- 108010060199 cysteinylproline Proteins 0.000 description 1
- 238000006114 decarboxylation reaction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 239000013530 defoamer Substances 0.000 description 1
- 230000003412 degenerative effect Effects 0.000 description 1
- 239000008121 dextrose Substances 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- MNNHAPBLZZVQHP-UHFFFAOYSA-N diammonium hydrogen phosphate Chemical compound [NH4+].[NH4+].OP([O-])([O-])=O MNNHAPBLZZVQHP-UHFFFAOYSA-N 0.000 description 1
- RAABOESOVLLHRU-UHFFFAOYSA-N diazene Chemical compound N=N RAABOESOVLLHRU-UHFFFAOYSA-N 0.000 description 1
- 229910000071 diazene Inorganic materials 0.000 description 1
- 229940061607 dibasic sodium phosphate Drugs 0.000 description 1
- 150000004683 dihydrates Chemical class 0.000 description 1
- HNPSIPDUKPIQMN-UHFFFAOYSA-N dioxosilane;oxo(oxoalumanyloxy)alumane Chemical compound O=[Si]=O.O=[Al]O[Al]=O HNPSIPDUKPIQMN-UHFFFAOYSA-N 0.000 description 1
- 108010054813 diprotin B Proteins 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- BNIILDVGGAEEIG-UHFFFAOYSA-L disodium hydrogen phosphate Chemical compound [Na+].[Na+].OP([O-])([O-])=O BNIILDVGGAEEIG-UHFFFAOYSA-L 0.000 description 1
- 238000004090 dissolution Methods 0.000 description 1
- 238000011143 downstream manufacturing Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- QYDYPVFESGNLHU-UHFFFAOYSA-N elaidic acid methyl ester Natural products CCCCCCCCC=CCCCCCCCC(=O)OC QYDYPVFESGNLHU-UHFFFAOYSA-N 0.000 description 1
- 238000000909 electrodialysis Methods 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 108010064739 ent-kaurene synthetase B Proteins 0.000 description 1
- 230000009483 enzymatic pathway Effects 0.000 description 1
- 101150116391 erg9 gene Proteins 0.000 description 1
- 229940009714 erythritol Drugs 0.000 description 1
- UNXHWFMMPAWVPI-ZXZARUISSA-N erythritol Chemical compound OC[C@H](O)[C@H](O)CO UNXHWFMMPAWVPI-ZXZARUISSA-N 0.000 description 1
- 235000019414 erythritol Nutrition 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 238000001704 evaporation Methods 0.000 description 1
- 230000008020 evaporation Effects 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 239000000796 flavoring agent Substances 0.000 description 1
- 235000019634 flavors Nutrition 0.000 description 1
- 239000011888 foil Substances 0.000 description 1
- 239000012737 fresh medium Substances 0.000 description 1
- 238000010230 functional analysis Methods 0.000 description 1
- 229930182830 galactose Natural products 0.000 description 1
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 1
- 238000001423 gas--liquid extraction Methods 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 235000019420 glucose oxidase Nutrition 0.000 description 1
- 229930182478 glucoside Natural products 0.000 description 1
- 150000008131 glucosides Chemical class 0.000 description 1
- 108010078144 glutaminyl-glycine Proteins 0.000 description 1
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 1
- 108010049041 glutamylalanine Proteins 0.000 description 1
- 229940096919 glycogen Drugs 0.000 description 1
- 239000000937 glycosyl acceptor Substances 0.000 description 1
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 1
- 108010074027 glycyl-seryl-phenylalanine Proteins 0.000 description 1
- 108010015792 glycyllysine Proteins 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 108010036413 histidylglycine Proteins 0.000 description 1
- 108010025306 histidylleucine Proteins 0.000 description 1
- 108010092114 histidylphenylalanine Proteins 0.000 description 1
- 101150029559 hph gene Proteins 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- GRRNUXAQVGOGFE-NZSRVPFOSA-N hygromycin B Chemical compound O[C@@H]1[C@@H](NC)C[C@@H](N)[C@H](O)[C@H]1O[C@H]1[C@H]2O[C@@]3([C@@H]([C@@H](O)[C@@H](O)[C@@H](C(N)CO)O3)O)O[C@H]2[C@@H](O)[C@@H](CO)O1 GRRNUXAQVGOGFE-NZSRVPFOSA-N 0.000 description 1
- 229940097277 hygromycin b Drugs 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 230000000415 inactivating effect Effects 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 239000002054 inoculum Substances 0.000 description 1
- CDAISMWEOUEBRE-GPIVLXJGSA-N inositol Chemical compound O[C@H]1[C@H](O)[C@@H](O)[C@H](O)[C@H](O)[C@@H]1O CDAISMWEOUEBRE-GPIVLXJGSA-N 0.000 description 1
- 229960000367 inositol Drugs 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 229940079322 interferon Drugs 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 229910052740 iodine Inorganic materials 0.000 description 1
- 239000011630 iodine Substances 0.000 description 1
- 108010053037 kyotorphin Proteins 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000000622 liquid--liquid extraction Methods 0.000 description 1
- OAIJSZIZWZSQBC-GYZMGTAESA-N lycopene Chemical compound CC(C)=CCC\C(C)=C\C=C\C(\C)=C\C=C\C(\C)=C\C=C\C=C(/C)\C=C\C=C(/C)\C=C\C=C(/C)CCC=C(C)C OAIJSZIZWZSQBC-GYZMGTAESA-N 0.000 description 1
- WRUGWIBCXHJTDG-UHFFFAOYSA-L magnesium sulfate heptahydrate Chemical compound O.O.O.O.O.O.O.[Mg+2].[O-]S([O-])(=O)=O WRUGWIBCXHJTDG-UHFFFAOYSA-L 0.000 description 1
- 229940061634 magnesium sulfate heptahydrate Drugs 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000012092 media component Substances 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 230000007102 metabolic function Effects 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 108010063431 methionyl-aspartyl-glycine Proteins 0.000 description 1
- 108700023046 methionyl-leucyl-phenylalanine Proteins 0.000 description 1
- 108010056582 methionylglutamic acid Proteins 0.000 description 1
- 108010005942 methionylglycine Proteins 0.000 description 1
- 108010068488 methionylphenylalanine Proteins 0.000 description 1
- 229960000485 methotrexate Drugs 0.000 description 1
- QYDYPVFESGNLHU-KHPPLWFESA-N methyl oleate Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OC QYDYPVFESGNLHU-KHPPLWFESA-N 0.000 description 1
- 229940073769 methyl oleate Drugs 0.000 description 1
- 239000013586 microbial product Substances 0.000 description 1
- 108091005573 modified proteins Proteins 0.000 description 1
- 102000035118 modified proteins Human genes 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 239000012452 mother liquor Substances 0.000 description 1
- 101150016209 mvaA gene Proteins 0.000 description 1
- 229930014626 natural product Natural products 0.000 description 1
- RJMUSRYZPJIFPJ-UHFFFAOYSA-N niclosamide Chemical compound OC1=CC=C(Cl)C=C1C(=O)NC1=CC=C([N+]([O-])=O)C=C1Cl RJMUSRYZPJIFPJ-UHFFFAOYSA-N 0.000 description 1
- 229910017604 nitric acid Inorganic materials 0.000 description 1
- 230000006911 nucleation Effects 0.000 description 1
- 238000010899 nucleation Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 235000020824 obesity Nutrition 0.000 description 1
- 238000002436 one-dimensional nuclear magnetic resonance spectrum Methods 0.000 description 1
- 125000001477 organic nitrogen group Chemical group 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- 230000003204 osmotic effect Effects 0.000 description 1
- 230000001590 oxidative effect Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 101150113864 pat gene Proteins 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 229940049954 penicillin Drugs 0.000 description 1
- 239000000825 pharmaceutical preparation Substances 0.000 description 1
- 229940127557 pharmaceutical product Drugs 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 108010024607 phenylalanylalanine Proteins 0.000 description 1
- 108010012581 phenylalanylglutamate Proteins 0.000 description 1
- 108010073101 phenylalanylleucine Proteins 0.000 description 1
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 229920002523 polyethylene Glycol 1000 Polymers 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 229910000160 potassium phosphate Inorganic materials 0.000 description 1
- 235000011009 potassium phosphates Nutrition 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 239000013587 production medium Substances 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 108700042769 prolyl-leucyl-glycine Proteins 0.000 description 1
- 108010077112 prolyl-proline Proteins 0.000 description 1
- 108010031719 prolyl-serine Proteins 0.000 description 1
- 108010070643 prolylglutamic acid Proteins 0.000 description 1
- 239000003531 protein hydrolysate Substances 0.000 description 1
- UMJSCPRVCHMLSP-UHFFFAOYSA-N pyridine Natural products COC1=CC=CN=C1 UMJSCPRVCHMLSP-UHFFFAOYSA-N 0.000 description 1
- ZUFQODAHGAHPFQ-UHFFFAOYSA-N pyridoxine hydrochloride Chemical compound Cl.CC1=NC=C(CO)C(CO)=C1O ZUFQODAHGAHPFQ-UHFFFAOYSA-N 0.000 description 1
- 235000019171 pyridoxine hydrochloride Nutrition 0.000 description 1
- 239000011764 pyridoxine hydrochloride Substances 0.000 description 1
- RLLCWNUIHGPAJY-SFUUMPFESA-N rebaudioside E Chemical compound O([C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(=O)O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O RLLCWNUIHGPAJY-SFUUMPFESA-N 0.000 description 1
- QRGRAFPOLJOGRV-UHFFFAOYSA-N rebaudioside F Natural products CC12CCCC(C)(C1CCC34CC(=C)C(CCC23)(C4)OC5OC(CO)C(O)C(OC6OCC(O)C(O)C6O)C5OC7OC(CO)C(O)C(O)C7O)C(=O)OC8OC(CO)C(O)C(O)C8O QRGRAFPOLJOGRV-UHFFFAOYSA-N 0.000 description 1
- HYLAUKAHEAUVFE-AVBZULRRSA-N rebaudioside f Chemical compound O([C@H]1[C@H](O)[C@@H](CO)O[C@H]([C@@H]1O[C@H]1[C@@H]([C@@H](O)[C@H](O)CO1)O)O[C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(=O)O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O HYLAUKAHEAUVFE-AVBZULRRSA-N 0.000 description 1
- 230000000754 repressing effect Effects 0.000 description 1
- 230000004202 respiratory function Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000001223 reverse osmosis Methods 0.000 description 1
- 229910052895 riebeckite Inorganic materials 0.000 description 1
- YWPVROCHNBYFTP-OSHKXICASA-N rubusoside Chemical compound O([C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(=O)O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O YWPVROCHNBYFTP-OSHKXICASA-N 0.000 description 1
- 235000019515 salmon Nutrition 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- CDAISMWEOUEBRE-UHFFFAOYSA-N scyllo-inosotol Natural products OC1C(O)C(O)C(O)C(O)C1O CDAISMWEOUEBRE-UHFFFAOYSA-N 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 239000006152 selective media Substances 0.000 description 1
- 108010026333 seryl-proline Proteins 0.000 description 1
- 229940007046 shigella dysenteriae Drugs 0.000 description 1
- 229940115939 shigella sonnei Drugs 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 230000037432 silent mutation Effects 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- 239000004296 sodium metabisulphite Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 210000000130 stem cell Anatomy 0.000 description 1
- 239000008223 sterile water Substances 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 229960003495 thiamine Drugs 0.000 description 1
- DPJRMOMPQZCRJU-UHFFFAOYSA-M thiamine hydrochloride Chemical compound Cl.[Cl-].CC1=C(CCO)SC=[N+]1CC1=CN=C(C)N=C1N DPJRMOMPQZCRJU-UHFFFAOYSA-M 0.000 description 1
- 235000019190 thiamine hydrochloride Nutrition 0.000 description 1
- 239000011747 thiamine hydrochloride Substances 0.000 description 1
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 1
- 239000010936 titanium Substances 0.000 description 1
- 229910052719 titanium Inorganic materials 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- HRXKRNGNAMMEHJ-UHFFFAOYSA-K trisodium citrate Chemical compound [Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O HRXKRNGNAMMEHJ-UHFFFAOYSA-K 0.000 description 1
- 229940038773 trisodium citrate Drugs 0.000 description 1
- 108010080629 tryptophan-leucine Proteins 0.000 description 1
- 238000002495 two-dimensional nuclear magnetic resonance spectrum Methods 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 108010003137 tyrosyltyrosine Proteins 0.000 description 1
- DRSKVOAJKLUMCL-MMUIXFKXSA-N u2n4xkx7hp Chemical compound O([C@H]1[C@H](O)[C@@H](CO)O[C@H]([C@@H]1O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)O[C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(O)=O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O DRSKVOAJKLUMCL-MMUIXFKXSA-N 0.000 description 1
- 101150016042 udp gene Proteins 0.000 description 1
- 238000000108 ultra-filtration Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 229940045136 urea Drugs 0.000 description 1
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 1
- 108010073969 valyllysine Proteins 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
- 229940011671 vitamin b6 Drugs 0.000 description 1
- 239000007222 ypd medium Substances 0.000 description 1
- 239000010457 zeolite Substances 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1048—Glycosyltransferases (2.4)
- C12N9/1051—Hexosyltransferases (2.4.1)
-
- A—HUMAN NECESSITIES
- A23—FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
- A23L—FOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
- A23L2/00—Non-alcoholic beverages; Dry compositions or concentrates therefor; Their preparation
- A23L2/52—Adding ingredients
- A23L2/60—Sweeteners
-
- A—HUMAN NECESSITIES
- A23—FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
- A23L—FOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
- A23L27/00—Spices; Flavouring agents or condiments; Artificial sweetening agents; Table salts; Dietetic salt substitutes; Preparation or treatment thereof
- A23L27/30—Artificial sweetening agents
- A23L27/33—Artificial sweetening agents containing sugars or derivatives
- A23L27/36—Terpene glycosides
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/18—Preparation of compounds containing saccharide radicals produced by the action of a glycosyl transferase, e.g. alpha-, beta- or gamma-cyclodextrins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/44—Preparation of O-glycosides, e.g. glucosides
- C12P19/56—Preparation of O-glycosides, e.g. glucosides having an oxygen atom of the saccharide radical directly bound to a condensed ring system having three or more carbocyclic rings, e.g. daunomycin, adriamycin
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y204/00—Glycosyltransferases (2.4)
- C12Y204/01—Hexosyltransferases (2.4.1)
- C12Y204/01017—Glucuronosyltransferase (2.4.1.17)
-
- A—HUMAN NECESSITIES
- A23—FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
- A23L—FOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
- A23L27/00—Spices; Flavouring agents or condiments; Artificial sweetening agents; Table salts; Dietetic salt substitutes; Preparation or treatment thereof
- A23L27/30—Artificial sweetening agents
- A23L27/33—Artificial sweetening agents containing sugars or derivatives
-
- A—HUMAN NECESSITIES
- A23—FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
- A23V—INDEXING SCHEME RELATING TO FOODS, FOODSTUFFS OR NON-ALCOHOLIC BEVERAGES AND LACTIC OR PROPIONIC ACID BACTERIA USED IN FOODSTUFFS OR FOOD PREPARATION
- A23V2002/00—Food compositions, function of food ingredients or processes for food or foodstuffs
-
- A—HUMAN NECESSITIES
- A23—FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
- A23V—INDEXING SCHEME RELATING TO FOODS, FOODSTUFFS OR NON-ALCOHOLIC BEVERAGES AND LACTIC OR PROPIONIC ACID BACTERIA USED IN FOODSTUFFS OR FOOD PREPARATION
- A23V2250/00—Food ingredients
- A23V2250/24—Non-sugar sweeteners
- A23V2250/262—Stevioside
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Mycology (AREA)
- Food Science & Technology (AREA)
- Polymers & Plastics (AREA)
- Nutrition Science (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Enzymes And Modification Thereof (AREA)
- Seasonings (AREA)
Abstract
본 명세서에서 숙주 세포에서 스테비올 글리코시드의 개선된 생산을 위한 조성물 및 방법을 제공한다. 일부 실시태양에서, 상기 숙주 세포를 세타리아 이탈리카 UDP-글리코실트랜스퍼라제 40087 또는 그의 변형 UDP-글리코실트랜스퍼라제를 암호화하는 이종 뉴클레오티드 서열을 포함하도록 유전자 변형시킨다. 일부 실시태양에서, 상기 숙주 세포를 UDP-글리코실트랜스퍼라제 sr.UGT_9252778, Bd_UGT10850, 및/또는 Ob_UGT91B1_유사를 암호화하는 이종 뉴클레오티드 서열을 포함하도록 유전자 변형시킨다. 일부 실시태양에서, 상기 숙주 세포는 상기 숙주 세포에서 스테비올 글리코시드를 생산할 수 있는 경로의 추가의 효소들을 암호화하는 하나 이상의 이종 뉴클레오티드 서열을 추가로 포함한다. 본 명세서에 기재된 조성물 및 방법은 비제한적으로 레바우디오시드 D 및 레바우디오시드 M을 포함한 스테비올 글리코시드의 이종 생산에 효율적인 경로를 제공한다.
Description
1. 관련 출원에 대한 상호참조
본 출원은 2016년 8월 12일자로 출원된 미국 가 출원 제 62/374,408 호의 이득을 주장하며, 상기 출원은 내용 전체가 본 명세서에 참고로 인용된다.
2. 발명의 분야
본 명세는 몇몇 유리딘 디포스페이트-의존성 글리코실트랜스퍼라제(UGT), 이를 포함하는 조성물, 이를 포함하는 숙주 세포, 및 레바우디오시드 D 및 레바우디오시드 M을 포함한 레바우디오시드의 생산을 위한 그의 사용 방법에 관한 것이다.
3. 배경
천연 공급원으로부터 유래된 제로-칼로리 감미료는 높은-당 소비의 부작용(예를 들어 당뇨병 및 비만증)을 제한하는 것을 목적으로 한다. 레바우디오시드 M(RebM)은 스테비아 식물(스테비아 레바우디아나 베르토니(Stevia rebaudiana Bertoni))에 의해 생산되는 많은 단맛 화합물들 중 하나이다. 모든 레바우디오시드 중에서, RebM이 가장 높은 효능을 가지며(슈크로스보다 약 200-300배 더 달다) 깔끔한 맛을 갖는다. 그러나, RebM은 상기 스테비아 식물에 의해 단지 소량으로만 생산되며, 전체 스테비올 글리코시드 함량의 단지 작은 부분(<1.0%)일 뿐이다. Ohta et al., 2010, J. Appl. Glycosci., 57, 199-209 (2010). 이와 같이 대량의 고순도 생산을 허용하는 생물공학적 경로를 사용하여 RebM을 생산하는 것이 바람직할 수 있다.
생물공학을 이용하여 생성물을 경제적으로 생산하기 위해서, 공급원료로부터 생성물로의 생물전환의 각 단계는 높은 전환효율(이상적으로는 >90%)을 갖는 것이 유리하다. RebM을 생산하기 위한 효모의 공학에서, 끝에서 두 번째 생합성 단계, 즉 레바우디오시드 A(RebA)에서 레바우디오시드 D(RebD)로의 전환에서 한계가 확인되었다. 도 1A를 참조하시오. 고유 효소(Ono, EP 2 826 861 A1, UGT91D_유사3, 또는 근접 상동체)는 RebA의 약 3%를 RebD로 전환시키는 것으로 관찰되었다. RebA를 RebD로 전환시킬 수 있는 2개의 다른 UGT 효소들이 동정되었다. 하나는 오리자 사티바(Oryza sativa)로부터의 Os_UGT_91C1(또한 휴튼 라르센(Houghton-Larsen) 등의 WO 2013/022989 A2에서 EUGT11이라 지칭된다)이고, 다른 하나는 솔라눔 라이코페르시쿰(Solanum lycopersicum)으로부터의 Sl_UGT_101249881(또한 마코시안(Markosyan) 등의 WO2014/193888 A1에서 UGTSL2라 지칭된다)이다. 그러나, Os_UGT_91C1 및 Sl_UGT_101249881은 모두 처음에는 본 발명자들에 의해 각각 약 53% 및 70%의 목적하는 것보다 더 낮은 전환 효율을 갖는 것으로 관찰되었다. 이들 3개의 효소 UGT91D_유사(like)3, Os_UGT_91C1, 및 SL_UGT_101249881은 모두 글루코스 부분을, 베타(1->2) 결합의 형성을 통해 19-O-글루코스 잔기의 C-2' 위치로 전달하는 유리딘 디포스페이트-의존성 글리코실트랜스퍼라제(UGT)이다(도 1A).
RebM을 효율적이고 고순도로 생산하기 위해서, RebA를 RebD로 고효율로 전환시킬 수 있는 개선된 효소가 필요하다. 본 명세서에 제공된 조성물 및 방법은 이러한 필요성을 다루고 있으며 또한 관련된 장점들을 제공한다.
4. 발명의 요약
본 명세서에서 RebA의 RebD로의 개선된 전환 및 RebD 및/또는 RebM의 개선된 생산을 위한 조성물 및 방법을 제공한다. 상기 조성물 및 방법은 부분적으로 몇몇 유리딘 디포스페이트-의존성 글리코실트랜스퍼라제(UGT)가 현저하게 높은 효율로 RebA를 RebD로 전환시킬 수 있다는 놀라운 발견을 기본으로 한다. 심지어 신규의 UGT에 의한 균주 수행능의 보통의 개선(예를 들어 10 퍼센트)조차, RebM에 대한 시장 수요가 매년 50억톤인 것으로 추정할 때, 잠재적으로는 차후의 생산 비용을 천만달러 이상 절감시킬 수 있다.
본 명세서에 기재된 몇몇 UGT들은 또한 RebM을 RebM2 부산물(즉 RebM의 이성질체)과 같은 비천연 글리코시드 없이 또는 거의 없이 RebM을 생산할 수 있다. 현재 공지된 스테비아 글리코시드의 목록에 대해서 문헌[Ceunen S. et al. Steviol Glycosides: Chemical Diversity, Metabolism, and Function. J. Nat. Prod., 76, 1201-1228 (2013)]을 참조하시오. 이와 같이, 몇몇 실시태양에서, 본 명세서에 기재된 조성물 및 방법은 고순도 RebM을 갖는 조성물을 수득하기 위한 하류부분 처리 비용을 감소시킬 수 있다.
또한 본 명세서는 이전에 공지된 UGT와 상이한 기질 특이성을 갖는 스테비올 글리코시드를 생산할 수 있는 대체 효소에 대한 조성물 및 방법을 제공한다. 상기 신규의 대체 효소는 잠재적으로는 다른 공지된 효소에 의해 생산된 것들과 비교하여 상이한 혼합물 또는 비율의 스테비올 글리코시드를 생산할 수 있다. 상이한 혼합물 또는 비율의 스테비올 글리코시드를 갖는 조성물들은 잠재적으로는 대안의 단맛 프로파일을 부여할 수 있으며, 이는 다양한 소모품 또는 식품의 제형화에 유용할 수 있다.
따라서, 본 명세서는 유전자 변형된 숙주 세포 및 산업적으로 유용한 화합물의 생산을 위한 그의 사용 방법을 제공한다. 하나의 태양에서, 본 명세서는 UDP-글리코실트랜스퍼라제(UGT400087, 또한 Si_UGT_400087이라 칭한다)를 암호화하는 이종 핵산을 포함하는 유전자 변형된 숙주 세포를 제공한다. 일부 실시태양에서, 상기 유전자 변형된 숙주 세포는 스테비올 및/또는 스테비올 글리코시드를 생산할 수 있는 하나 이상의 효소 경로를 추가로 포함한다.
몇몇 실시태양에서, 본 명세서는 UGT40087의 서열(예를 들어 서열번호 1 또는 서열번호 11)에 적어도 80%, 85%, 90% 또는 95% 서열 동일성(sequence identity)을 갖는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 암호화하는 이종 핵산을 포함하는 유전자 변형된 숙주 세포를 제공한다. 몇몇 실시태양에서, 상기 유전자 변형된 숙주 세포는 RebA를 RebD로 90%, 95%, 96% 또는 97%를 초과하는 효율로 전환시킬 수 있다. 몇몇 실시태양에서, 상기 유전자 변형된 숙주 세포는 당 수용체 도메인을 포함하는 UDP-글리코실트랜스퍼라제를 포함하며, 여기에서 상기 당 수용체 도메인의 아미노산 서열은 서열번호 1 또는 서열번호 11의 당 수용체 도메인의 아미노산 서열에 적어도 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는다. 몇몇 실시태양에서, 상기 유전자 변형된 숙주 세포는 고리1 아미노산 서열, 변형 고리1 아미노산 서열, 고리2 아미노산 서열, 변형 고리2 아미노산 서열, 고리3_1 아미노산 서열, 변형 고리3_1 아미노산 서열, 고리3_2 아미노산 서열, 변형 고리3_2 아미노산 서열, 고리4_1 아미노산 서열, 변형 고리4_1 아미노산 서열, 고리4_2 아미노산 서열 또는 이들의 임의의 조합을 포함하는 UDP-글리코실트랜스퍼라제를 포함한다. 몇몇 실시태양에서, 상기 유전자 변형된 숙주 세포는 서열번호 1 또는 서열번호 11의 당 수용체 도메인에 적어도 61%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 포함하고, 서열번호 1 또는 서열번호 11의 고리4_1 아미노산 서열을 추가로 포함한다.
몇몇 실시태양에서, 본 명세서는 서열번호 2, 5 또는 6의 서열에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 암호화하는 이종 핵산을 포함하는 유전자 변형된 숙주 세포를 제공한다. 몇몇 실시태양에서, 상기 유전자 변형된 숙주 세포는 RebA를 RebD로 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96% 또는 97%를 초과하는 효율로 전환시킬 수 있다. 몇몇 실시태양에서, 상기 유전자 변형된 숙주 세포는 당 수용체 도메인을 포함하는 UDP-글리코실트랜스퍼라제를 포함하며, 여기에서 상기 당 수용체 도메인의 아미노산 서열은 서열번호 2, 5 또는 6의 당 수용체 도메인의 아미노산 서열에 적어도 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는다. 몇몇 실시태양에서, 상기 유전자 변형된 숙주 세포는 고리1 아미노산 서열, 변형 고리1 아미노산 서열, 고리2 아미노산 서열, 변형 고리2 아미노산 서열, 고리3_1 아미노산 서열, 변형 고리3_1 아미노산 서열, 고리3_2 아미노산 서열, 변형 고리3_2 아미노산 서열, 고리4_1 아미노산 서열, 변형 고리4_1 아미노산 서열, 고리4_2 아미노산 서열 또는 이들의 임의의 조합을 포함하는 UDP-글리코실트랜스퍼라제를 포함한다. 몇몇 실시태양에서, 상기 유전자 변형된 숙주 세포는 서열번호 2, 5 또는 6의 당 수용체 도메인에 적어도 61%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 포함하고, 서열번호 2, 5 또는 6의 고리4_1 아미노산 서열을 추가로 포함한다.
또 다른 태양에서, 본 명세서는 이종 스테비올 글리코시드를 생산하는 방법을 제공하며, 상기 방법은 본 명세서에 기재된 바와 같이 스테비올 글리코시드를 생산할 수 있는, 본 명세서에 제공된 유전자 변형된 숙주 세포의 집단을, 상기 스테비올 글리코시드 화합물 생성에 적합한 조건하에서 탄소원(carbon source)을 갖는 배지에서 배양하고; 상기 배지로부터 상기 스테비올 글리코시드를 회수함을 포함한다. 일부 실시태양에서, 상기 이종 스테비올 글리코시드는 RebD 및 RebM으로 이루어지는 그룹 중에서 선택된다.
또 다른 태양에서, 본 명세서는 숙주 세포에서 스테비올 글리코시드 화합물의 생산을 증가시키는 방법을 제공하며, 상기 방법은 상기 숙주 세포에서 UGT40087을 암호화하는 이종 핵산을 발현시키고; 상기 숙주 세포를 상기 스테비올 글리코시드를 생산하기에 적합한 조건하에서 배양함을 포함한다. 일부 실시태양에서, 상기 숙주 세포는 UGT91D_유사3 효소, Os_UGT_91 효소, 또는 Sl_UGT_101249881 효소를 포함하지 않는다.
또 다른 태양에서, 본 명세서는 RebD의 생산 방법을 제공하며, 상기 방법은 본 명세서에 기재된 바와 같이 RebD를 생산할 수 있는, 본 명세서에 제공된 유전자 변형된 숙주 세포의 집단을, 상기 RebD 생성에 적합한 조건하에서 탄소원을 갖는 배지에서 배양하고; 상기 배지로부터 상기 RebD를 회수함을 포함한다.
또 다른 태양에서, 본 명세서는 RebM의 생산 방법을 제공하며, 상기 방법은 본 명세서에 기재된 바와 같이 RebM을 생산할 수 있는, 본 명세서에 제공된 유전자 변형된 숙주 세포의 집단을, 상기 RebM 생성에 적합한 조건하에서 탄소원을 갖는 배지에서 배양하고; 상기 배지로부터 상기 RebM을 회수함을 포함한다.
또 다른 태양에서, 본 명세서는 RebD의 생산 방법을 제공하며, 상기 방법은 RebA를 글루코스, 및 RebD의 형성에 적합한 조건하에서 RebA를 RebD로 전환시킬 수 있는, 본 명세서에 기재된 UDP-글리코실트랜스퍼라제와 접촉시킴을 포함한다.
또 다른 태양에서, 본 명세서는 RebM의 생산 방법을 제공하며, 상기 방법은 RebM을 글루코스, 및 RebD의 형성에 적합한 조건하에서 RebA를 RebD로 전환시킬 수 있는, 본 명세서에 기재된 UDP-글리코실트랜스퍼라제, 및 RebD를 RebM으로 전환시킬 수 있는, 본 명세서에 기재된 UDP-글리코실트랜스퍼라제와 접촉시킴을 포함한다.
일부 실시태양에서, 상기 숙주 세포는 효모 세포이다. 일부 실시태양에서, 상기 효모는 사카로마이세스 세레비지아에(Saccharomyces cerevisiae)이다. 일부 실시태양에서, 상기 숙주 세포는 RebD 또는 RebM을 고효율로 생산한다. 일부 실시태양에서, 상기 숙주 세포는 상기 UGT40087 효소를 포함하지 않는 효모 세포에 비해 증가된 양의 RebD 또는 RebM을 생산한다. 일부 실시태양에서, 상기 숙주 세포는 상기 UGT40087 효소를 포함하지 않는 효모 세포에 비해 증가된 양의, RebM2에 비해 RebM을 생산한다.
또 다른 태양에서, 본 명세서에 제공된 다른 UDG-글리코실트랜스퍼라제를, UGT40087 외에 또는 상기에 대한 대안으로 사용할 수 있다. 여기에는 예를 들어 sr.UGT_9252778, Bd_UGT10840, Hv_UGT_V1, Bd_UGT10850, 및 Ob_UGT91B1_유사가 포함된다.
도 1A는 RebA에서 RebD에서 RebM으로의 전환에 대한 도식적인 표현을 제공한다.
도 1B는 RebM2의 구조를 제공한다.
도 1C는 메발로네이트 경로의 개략도를 제공한다.
도 2A는 파르네실 피로포스페이트(FPP)의 스테비올로의 예시적인 경로를 제공한다.
도 2B는 스테비올의 RebM으로의 예시적인 경로를 제공한다.
도 2C는 RebM의 효소적 생산에 대한 예시적인 경로를 제공한다.
도 3은 Reb(D+M)의 마이크로몰/Reb(A+D+M)의 마이크로몰에 의해 측정된 바와 같은, 생체내 RebA의 RebD로의 전환비를 제공한다. 모 대조용 균주는 91D_유사3(스테비아 레바우디아나(Stevia rebaudiana)로부터)으로 표지되며; 상기 균주는 빈 랜딩 패드 외에, 단지 UGT: 85C2, 74G1, 91D_유사3 및 76G1만을 함유한다. 91D_유사3은 매우 낮은 RebA에서 RebD로의 전환을 가짐이 주목된다(∼3% 표 5 참조). 각 UGT 효소의 단일 사본을 상기 모 대조용 균주내에 삽입시키고 개선된 RebA에서 RebD로의 전환에 대해 선별하였다. 6개의 UGT 효소가, 앞서 공지된 효소 Os_UGT_91C1 및 Sl_UGT_101249881과 적어도 동등하거나 또는 더 양호한 RebA에서 RebD로의 전환을 갖는 것으로 보인다. 3개의 UGT 효소(Si_UGT_40087, Ob_UGT91B1_유사, 및 Hv_UGT_V1)가 RebA에서 RebD로의 전환에 있어서 앞서 식별된 2개의 UGT 효소 모두보다 양호하다. 오차 막대는 표준 오차이다.
도 4는 효모에서 RebA에서 RebD로의 전환을 선별하기 위해서 개별적인 UGT 효소를 삽입시키는데 사용된 "랜딩 패드" 디자인의 개략도를 제공한다.
도 5a-h는 표 5 및 도 3에 기재된 데이터를 생성시키는데 사용된 각 UGT 유전자에 대한 생체내 생산된 RebA, RebD, RebM, RebM2의 크로마토그램을 예시한다. 상기 크로마토그램 피크들은 RebA, RebD, RebM, 및 RebM2와 관련된 피크들을 나타내도록 선택된다. 각각의 도면은 체류 시간 대 진성 표준, 대조용 모 균주 Y31062, 및 추가적인 UGT 효소를 갖는 Y31062에 대한 강도%를 도시한다. Y31062는 모 대조용 균주이며 빈 랜딩 패드와 함께 UGT74G1, UGT85C2, UGT91D_유사3, 및 UGT76G1을 함유한다. 도 5a: Si_UGT_40087에 대한 데이터; 상기 도면은 또한 RebE 진성 표준에 대한 크로마토그램을 포함한다. 도 5b: Ob_UGT91B1_유사에 대한 데이터. 도 5c: Hv_UGT_V1에 대한 데이터. 도 5d: Sl_UGT_101249881에 대한 데이터. 도 5e: UGT_g252778에 대한 데이터. 도 5f: Os_UGT_91C1에 대한 데이터. 도 5g: Bd_UGT10850에 대한 데이터. 도 5h: Bd_UGT10840에 대한 데이터. 도 5i는 피크가 RebE임을 입증하는, 진성 표준에 대한 오직 Si_UGT_40087의 RebE 피크에 대한 크로마토그램의 확대도를 도시한다.
도 6은 UGT40087 구조의 상동 모델을 예시한다. 그의 N- 및 C-말단 도메인을 밝고 진한 회색으로 나타내며, 고리 교환(swapping) 실험에 사용된 4개의 고리가 또한 상기 구조상에 표지된다.
도 7은 UGT 도메인 교환 구성의 개략적인 개요를 예시한다.
도 8은 4개의 UDP-글리코실트랜스퍼라제(UGT40087(서열번호 1); Os_UGT_91C1(서열번호 8); 91D유사3(서열번호 7); Si91D유사(서열번호 12))의 서열 정렬을 예시한다.
도 9a는 모 대조용 세포(UGT74G1, UT85C2, UGT76G1, 및 UGT91D_유사3 포함)에 대한 생체내 생산된 스테비올 글리코시드의 크로마토그램을 예시한다. 도 9b는 UGT40087을 갖는 모 대조용 균주에 대한 생체내 생산된 스테비올 글리코시드의 크로마토그램을 예시한다. 도 9c는 Ob_UGT91B1-유사를 갖는 모 대조용 균주에 대한 생체내 생산된 스테비올 글리코시드의 크로마토그램을 예시한다.
도 1B는 RebM2의 구조를 제공한다.
도 1C는 메발로네이트 경로의 개략도를 제공한다.
도 2A는 파르네실 피로포스페이트(FPP)의 스테비올로의 예시적인 경로를 제공한다.
도 2B는 스테비올의 RebM으로의 예시적인 경로를 제공한다.
도 2C는 RebM의 효소적 생산에 대한 예시적인 경로를 제공한다.
도 3은 Reb(D+M)의 마이크로몰/Reb(A+D+M)의 마이크로몰에 의해 측정된 바와 같은, 생체내 RebA의 RebD로의 전환비를 제공한다. 모 대조용 균주는 91D_유사3(스테비아 레바우디아나(Stevia rebaudiana)로부터)으로 표지되며; 상기 균주는 빈 랜딩 패드 외에, 단지 UGT: 85C2, 74G1, 91D_유사3 및 76G1만을 함유한다. 91D_유사3은 매우 낮은 RebA에서 RebD로의 전환을 가짐이 주목된다(∼3% 표 5 참조). 각 UGT 효소의 단일 사본을 상기 모 대조용 균주내에 삽입시키고 개선된 RebA에서 RebD로의 전환에 대해 선별하였다. 6개의 UGT 효소가, 앞서 공지된 효소 Os_UGT_91C1 및 Sl_UGT_101249881과 적어도 동등하거나 또는 더 양호한 RebA에서 RebD로의 전환을 갖는 것으로 보인다. 3개의 UGT 효소(Si_UGT_40087, Ob_UGT91B1_유사, 및 Hv_UGT_V1)가 RebA에서 RebD로의 전환에 있어서 앞서 식별된 2개의 UGT 효소 모두보다 양호하다. 오차 막대는 표준 오차이다.
도 4는 효모에서 RebA에서 RebD로의 전환을 선별하기 위해서 개별적인 UGT 효소를 삽입시키는데 사용된 "랜딩 패드" 디자인의 개략도를 제공한다.
도 5a-h는 표 5 및 도 3에 기재된 데이터를 생성시키는데 사용된 각 UGT 유전자에 대한 생체내 생산된 RebA, RebD, RebM, RebM2의 크로마토그램을 예시한다. 상기 크로마토그램 피크들은 RebA, RebD, RebM, 및 RebM2와 관련된 피크들을 나타내도록 선택된다. 각각의 도면은 체류 시간 대 진성 표준, 대조용 모 균주 Y31062, 및 추가적인 UGT 효소를 갖는 Y31062에 대한 강도%를 도시한다. Y31062는 모 대조용 균주이며 빈 랜딩 패드와 함께 UGT74G1, UGT85C2, UGT91D_유사3, 및 UGT76G1을 함유한다. 도 5a: Si_UGT_40087에 대한 데이터; 상기 도면은 또한 RebE 진성 표준에 대한 크로마토그램을 포함한다. 도 5b: Ob_UGT91B1_유사에 대한 데이터. 도 5c: Hv_UGT_V1에 대한 데이터. 도 5d: Sl_UGT_101249881에 대한 데이터. 도 5e: UGT_g252778에 대한 데이터. 도 5f: Os_UGT_91C1에 대한 데이터. 도 5g: Bd_UGT10850에 대한 데이터. 도 5h: Bd_UGT10840에 대한 데이터. 도 5i는 피크가 RebE임을 입증하는, 진성 표준에 대한 오직 Si_UGT_40087의 RebE 피크에 대한 크로마토그램의 확대도를 도시한다.
도 6은 UGT40087 구조의 상동 모델을 예시한다. 그의 N- 및 C-말단 도메인을 밝고 진한 회색으로 나타내며, 고리 교환(swapping) 실험에 사용된 4개의 고리가 또한 상기 구조상에 표지된다.
도 7은 UGT 도메인 교환 구성의 개략적인 개요를 예시한다.
도 8은 4개의 UDP-글리코실트랜스퍼라제(UGT40087(서열번호 1); Os_UGT_91C1(서열번호 8); 91D유사3(서열번호 7); Si91D유사(서열번호 12))의 서열 정렬을 예시한다.
도 9a는 모 대조용 세포(UGT74G1, UT85C2, UGT76G1, 및 UGT91D_유사3 포함)에 대한 생체내 생산된 스테비올 글리코시드의 크로마토그램을 예시한다. 도 9b는 UGT40087을 갖는 모 대조용 균주에 대한 생체내 생산된 스테비올 글리코시드의 크로마토그램을 예시한다. 도 9c는 Ob_UGT91B1-유사를 갖는 모 대조용 균주에 대한 생체내 생산된 스테비올 글리코시드의 크로마토그램을 예시한다.
6. 실시태양들의 상세한 기재
6.1 용어
본 명세서에 사용되는 바와 같이, "이종"이란 용어는 자연에서 통상적으로 발견되지 않는 것을 지칭한다. "이종 뉴클레오티드 서열"이란 용어는 자연에서 주어진 세포에서 통상적으로 발견되지 않는 뉴클레오티드 서열을 지칭한다. 이와 같이, 이종 뉴클레오티드 서열은 (a) 그의 숙주 세포에 대해 이질성(즉 상기 세포에 대해 "외인성")이거나; (b) 숙주 세포에서 자연적으로 발견되지만(즉 "내인성") 상기 세포 중에 자연적이지 않은 양(즉 상기 숙주 세포에서 자연적으로 발견되는 것보다 많거나 적은 양)으로 존재하거나; 또는 (c) 상기 숙주 세포에서 자연적으로 발견되지만 그의 자연적인 유전자좌의 밖에 위치할 수 있다. "이종 효소"란 용어는 자연에서 주어진 세포에서 통상적으로 발견되지 않는 효소를 지칭한다. 상기 용어는 (a) 주어진 세포에 대해 외인성이고(즉 숙주 세포 중에 자연적으로 존재하지 않거나 또는 상기 숙주 세포 중의 주어진 상황에 자연적으로 존재하지 않는 뉴클레오티드 서열에 의해 암호화되고); (b) 숙주 세포에서 자연적으로 발견되지만(예를 들어 상기 효소는 상기 세포에 내인성인 뉴클레오티드 서열에 의해 암호화된다) 상기 숙주 세포 중에 자연적이지 않은 양(즉 자연적으로 발견되는 것보다 많거나 적은 양)으로 생산되는 효소를 포함한다.
다른 한편으로, 분자, 및 특히 효소 및 핵산과 관련하여 본 명세서에 사용되는 바와 같은 "고유" 또는 "내인성"이란 용어는, 고유 미생물에서 상기 분자의 발현수준보다 낮거나, 상기 수준과 같거나 또는 상기 수준보다 더 높을 수 있는 발현 수준과 별개로, 이들이 기원하는 유기체에서 발현되거나 자연에서 발견되는 분자를 가리킨다. 고유 효소 또는 폴리뉴클레오티드의 발현은 재조합 미생물에서 변경될 수 있는 것으로 생각된다.
본 명세서에 사용되는 바와 같이, "모 세포"란 용어는, 변형된 숙주 세포내로 조작된 하나 이상의 특정한 유전자 변형, 예를 들어 하기로 이루어지는 그룹 중에서 선택된 하나 이상의 변형을 포함하지 않음을 제외하고, 본 명세서에 개시된 유전자 변형된 숙주 세포와 동일한 유전적 배경을 갖는 세포를 지칭한다: 스테비올 경로의 효소의 이종 발현, 스테비올 글리코시드 경로의 효소의 이종 발현, 제라닐제라닐 디포스페이트 신타제의 이종 발현, 코팔릴 디포스페이트 신타제의 이종 발현, 카우렌 신타제의 이종 발현, 카우렌 옥시다제의 이종 발현, 스테비올 신타제(카우렌산 하이드록실라제)의 이종 발현, 시토크롬 P450 리덕타제의 이종 발현, UGT74G1의 이종 발현, UGT76G1의 이종 발현, UGT85C2의 이종 발현, UGT91D의 이종 발현, 및 UGT40087의 이종 발현.
본 명세서에 사용되는 바와 같이, "천연"이란 용어는 자연에서 발견되는 것을 지칭한다. 예를 들어 자연의 공급원으로부터 단리될 수 있고 실험실에서 인간에 의해 의도적으로 변형되지 않은 유기체 중에 존재하는 UDP-글리코실트랜스퍼라제가 천연 UDP-글리코실트랜스퍼라제이다. 환언하면, 본 명세서에 사용되는 바와 같이, "비-천연"이란 용어는 자연에서 발견되지 않고 인간 개입에 의해 생성되는 것을 지칭한다.
"배지"란 용어는 배양 배지 및/또는 발효 배지를 지칭한다.
"발효 조성물"이란 용어는 유전자 변형된 숙주 세포 및 상기 유전자 변형된 숙주 세포에 의해 생산된 생성물 또는 대사산물을 포함하는 조성물을 지칭한다. 발효 조성물의 일례는 완전세포 브로쓰(broth)이며, 상기는 세포, 수성상, 및 상기 유전자 변형된 숙주 세포로부터 생산된 화합물을 포함하여, 용기(예를 들어 플라스크, 플레이트 또는 발효기)의 전체 내용물일 수 있다.
본 명세서에 사용되는 바와 같이, "생산"이란 용어는 일반적으로 본 명세서에 제공된 유전자 변형된 숙주 세포에 의해 생산된 스테비올 또는 스테비올 글리코시드의 양을 지칭한다. 일부 실시태양에서, 생산을 상기 숙주 세포에 의한 스테비올 또는 스테비올 글리코시드의 수율로서 나타낸다. 다른 실시태양에서, 생산을 상기 스테비올 또는 스테비올 글리코시드의 생산에 있어서 상기 숙주 세포의 생산성으로서 나타낸다.
본 명세서에 사용되는 바와 같이, "생산성"이란 용어는 시간에 걸쳐(시간당) 숙주 세포가 배양되는 발효 브로쓰의 양(부피 기준) 당 생산된 스테비올 또는 스테비올 글리코시드의 양(중량 기준)으로서 나타내는, 상기 숙주 세포에 의한 스테비올 또는 스테비올 글리코시드의 생산을 지칭한다.
본 명세서에 사용되는 바와 같이, "수율"이란 용어는 숙주 세포에 의해 소비되는 탄소원의 양(중량 기준) 당 생산된 스테비올 또는 스테비올 글리코시드의 양으로서 나타내는, 상기 숙주 세포에 의한 스테비올 또는 스테비올 글리코시드의 생산을 지칭한다.
본 명세서에 사용되는 바와 같이, 화합물(예를 들어 RebM2, 스테비올 글리코시드 또는 다른 화합물들)의 "검출할 수 없는 수준"이란 용어는 상기 화합물을 측정하기 위한 표준 기법에 의해 측정하고/하거나 분석하기에 너무 낮은 화합물의 수준을 의미한다. 예를 들어, 상기 용어는 실시예 7에 기재된 분석 방법에 의해 검출할 수 없는 화합물의 수준을 포함한다.
본 명세서에 사용되는 바와 같이, "스테비올 글리코시드(들)"란 용어는 스테비올의 하나 이상의 당 부분, 예를 들어 글리코시드의 첨가에 의해 효소적으로 변경된 스테비올, 예를 들어 비제한적으로 천연 스테비올 글리코시드, 예를 들어 스테비올모노시드, 스테비올비오시드, 루부소시드, 둘코시드 B, 둘코시드 A, 레바우디오시드 B, 레바우디오시드 G, 스테비오시드, 레바우디오시드 C, 레바우디오시드 F, 레바우디오시드 A, 레바우디오시드 I, 레바우디오시드 E, 레바우디오시드 H, 레바우디오시드 L, 레바우디오시드 K, 레바우디오시드 J, 레바우디오시드 M, 레바우디오시드 D, 레바우디오시드 N, 레바우디오시드 O, 합성 스테비올 글리코시드, 예를 들어 효소적으로 글루코실화된 스테비올 글리코시드 및 이들의 조합을 지칭한다.
본 명세서에 사용되는 바와 같이, "유리딘 디포스페이트(UDP)-글리코실트랜스퍼라제" 또는 "UDP-의존성 글리코실트랜스퍼라제"란 용어는 모노사카라이드 부분을 글리코실 공여체로부터 글리코실 수용체로 전달하는 활성을 갖는 효소, 특히 글리코실 공여체로서 UDP-당을 사용하는 효소를 지칭한다. "UDP-글리코실트랜스퍼라제"란 용어는 "UGT"와 호환 가능하게 사용될 수 있다.
본 명세서에 사용되는 바와 같이, "기능성 도메인"이란 용어는 UDP-글리코실트랜스퍼라제의 "당 수용체 도메인" 또는 "당 공여체 도메인"을 의미한다. 식물 UDP-글리코실트랜스퍼라제(UGT)는 글리코실트랜스퍼라제 상과의 1과에 속한다. 상기는 GT-B 구조적 폴드를 채용한다. 상기 UGT에 의해 공유된 구조적 특징은 도메인-간 링커에 의해 분리된, 유사한 로스만-유사 폴드를 갖는 2개의 도메인, C-말단 및 N-말단 도메인으로 이루어진다. 상기 C-말단 도메인은 UDP-글루코스("당 공여체")에 결합하고 따라서 당 공여체 도메인이라고도 지칭되는 반면, 상기 N-말단 도메인은 비-당 기질("수용체")에 결합하고 따라서 수용체 도메인이라고도 지칭된다.
본 명세서에 사용되는 바와 같이, "변체"란 용어는 아미노산 삽입, 결실, 돌연변이, 및/또는 치환에 의해, 특정하게 인용된 "참조" 폴리펩티드(예를 들어 야생형 서열)와 상이하지만 상기 참조 폴리펩티드와 실질적으로 유사한 활성을 유지하는 폴리펩티드를 지칭한다. 예를 들어, 변형 UGT40087은, 상기 변형 UGT40087이 RebA를 RebD로 및/또는 스테비오시드를 RebE로 전환시키는 반응을 또한 촉매화할 수 있다는 점에서 서열번호 11을 갖는 참조 UGT40087과 실질적으로 유사한 활성을 유지한다. 일부 실시태양에서, 상기 변체는 재조합 DNA 기법, 예를 들어 돌연변이유발에 의해 생성된다. 일부 실시태양에서, 변형 폴리펩티드는 또 다른 것에 대한 하나의 염기성 잔기의 치환(즉 Lys에 대한 Arg), 또 다른 것에 대한 하나의 소수성 잔기의 치환(즉 Ile에 대한 Leu), 또는 또 다른 것에 대한 하나의 방향족 잔기의 치환(즉 Tyr에 대한 Phe) 등에 의해 그의 참조 폴리펩티드와 상이하다. 일부 실시태양에서, 변체는 참조 서열의 실질적인 구조적 유사성을 생성시키는 보존적 치환이 획득되는 유사체를 포함한다. 상기와 같은 보존적 치환의 예는 비제한적으로 아스파트산에 대한 글루탐산 및 이와 역; 아스파라진에 대한 글루타민 및 이와 역; 쓰레오닌에 대한 세린 및 이와 역; 아르기닌에 대한 리신 및 이와 역; 또는 서로에 대한 이소류신, 발린 또는 류신 중 어느 하나를 포함한다.
본 명세서에 사용되는 바와 같이, "변형 고리1"이란 용어는 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 아미노산 삽입, 결실, 돌연변이 및/또는 치환에 의해 서열번호 1 또는 서열번호 11의 참조 고리1 아미노산 서열(또는 서열번호 28의 서열을 갖는 UGT40087의 변형된 고리1 서열)과 상이하지만, 각각 서열번호 1 또는 서열번호 11의 고리1 아미노산 서열 위치에 상응하는 위치에 삽입된, 변형 고리1 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제가 RebA의 RebD로의 및/또는 스테비오시드의 RebE로의 전환을 촉진하게 하는 아미노산 서열을 지칭한다.
본 명세서에 사용되는 바와 같이, "변형 고리2"란 용어는 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 아미노산 삽입, 결실, 돌연변이 및/또는 치환에 의해 서열번호 1 또는 서열번호 11의 참조 고리 2 아미노산 서열과 상이하지만, 각각 서열번호 1 또는 서열번호 11의 고리2 아미노산 서열 위치에 상응하는 위치에 삽입된, 변형 고리2 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제가 RebA의 RebD로의 및/또는 스테비오시드의 RebE로의 전환을 촉진하게 하는 아미노산 서열을 지칭한다.
본 명세서에 사용되는 바와 같이, "변형 고리3_1"이란 용어는 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 아미노산 삽입, 결실, 돌연변이 및/또는 치환에 의해 서열번호 1 또는 서열번호 11의 참조 고리3_1 아미노산 서열과 상이하지만, 각각 서열번호 1 또는 서열번호 11의 고리3_1 아미노산 서열 위치에 상응하는 위치에 삽입된, 변형 고리3_1 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제가 RebA의 RebD로의 및/또는 스테비오시드의 RebE로의 전환을 촉진하게 하는 아미노산 서열을 지칭한다. 본 명세서에 사용되는 바와 같이, "변형 고리3_2"란 용어는 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 아미노산 삽입, 결실, 돌연변이 및/또는 치환에 의해 서열번호 1 또는 서열번호 11의 참조 고리3_2 아미노산 서열과 상이하지만, 각각 서열번호 1 또는 서열번호 11의 고리3_2 아미노산 서열 위치에 상응하는 위치에 삽입된, 변형 고리3_2 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제가 RebA의 RebD로의 및/또는 스테비오시드의 RebE로의 전환을 촉진하게 하는 아미노산 서열을 지칭한다. 몇몇 실시태양에서, 변형 고리3_2 아미노산 서열은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 30개 이하의 아미노산 삽입, 결실, 돌연변이 및/또는 치환에 의해 참조 고리3_2 아미노산 서열과 상이하다.
본 명세서에 사용되는 바와 같이, "변형 고리4_1"이란 용어는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 30개 이하의 아미노산 삽입, 결실, 돌연변이 및/또는 치환에 의해 서열번호 1 또는 서열번호 11의 참조 고리4_1 아미노산 서열과 상이하지만, 서열번호 11의 고리4_1 아미노산 서열 위치에 상응하는 위치에 삽입된, 변형 고리4_1 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제가 RebA의 RebD로의 및/또는 스테비오시드의 RebE로의 전환을 촉진하게 하는 아미노산 서열을 지칭한다. 본 명세서에 사용되는 바와 같이, 상기의 상황에서 또는 2개 이상의 핵산 또는 단백질 서열에서 "서열 동일성" 또는 "동일성 퍼센트"란 용어는 동일하거나, 또는 동일한 아미노산 잔기 또는 뉴클레오티드의 명시된 백분율을 갖는 2개 이상의 서열 또는 하위서열을 지칭한다. 예를 들어, 상기 서열은 비교창, 또는 서열 비교 알고리즘을 사용하여 측정된 바와 같은 지정된 영역에 걸쳐 또는 수동 정렬 및 시각적 검사에 의해 최대의 관련성을 위해 비교 및 정렬시 참조 서열에 대해 명시된 영역에 걸쳐 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91% 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 이상의 동일성의 동일성 퍼센트를 가질 수 있다. 예를 들어, 동일성 퍼센트를, 전체 뉴클레오티드(또는 아미노산 잔기)의 길이 마이너스 임의의 끊김 길이로 나눈 서열 중 일치하는 뉴클레오티드(또는 아미노산 잔기)의 수의 비를 계산함으로써 측정한다.
편의상, 2개 서열간의 동일성 정도를 당해 분야에 공지된 컴퓨터 프로그램 및 수학적 알고리즘을 사용하여 확인할 수 있다. 서열 동일성 퍼센트를 계산하는 상기와 같은 알고리즘은 일반적으로 서열 끊김 및 비교 영역에 걸친 오합치를 설명한다. 클러스탈(Clustal) W(Thompson et al., (1994) Nucleic Acids Res., 22: 4673-4680), 클러스탈 오메가(Clustal Omega)(Sievers et al., (2011) Molecular Systems Biology., 7:539), ALIGN(Myers et al., (1988) CABIOS, 4: 11-17), FASTA(Pearson et al., (1988) PNAS, 85:2444-2448; Pearson (1990), Methods Enzymol., 183: 63-98) 및 끊긴 BLAST(Altschul et al., (1997) Nucleic Acids Res., 25: 3389-3402)와 같은, 서열을 비교 및 정렬하는 프로그램들이 상기 목적에 유용하다. BLAST 또는 BLAST 2.0(Altschul et al., J. Mol. Biol. 215:403-10, 1990)을 다수의 출처, 예를 들어 국립 생물정보 센터(NCBI)로부터 및 인터넷상에서, 서열 분석 프로그램 BLASTP, BLASTN, BLASTX, TBLASTN, 및 TBLASTX와 관련하여 사용하기 위해 입수할 수 있다. 추가적인 정보를 NCBI 웹 사이트에서 찾을 수 있다.
몇몇 실시태양에서, 서열 정렬 및 동일성 퍼센트 계산을 그의 표준, 디폴트 매개변수를 사용하여 BLAST 프로그램으로 측정할 수 있다. 뉴클레오티드 서열 정렬 및 서열 동일성 계산을 위해서, 상기 BLASTN 프로그램을 그의 디폴트 매개변수(끊김 벌점 = 5, 끊김 확장 벌점 = 2, 뉴클레익 합치 = 2, 뉴클레익 오합치 = 3, 예상치 = 10.0, 워드 크기 = 11, 조회 범위 중 최대 합치 = 0)와 함께 사용한다. 몇몇 실시태양에서, 뉴클레오티드 서열 정렬 및 서열 동일성 계산을 위해서, 상기 BLASTN 프로그램을 이들 매개변수(끊김 벌점 = 5, 끊김 확장 벌점 = 2, 뉴클레익 합치 = 1, 뉴클레익 오합치 = 3, 예상치 = 10.0, 워드 크기 = 11)와 함께 사용한다. 폴리펩티드 서열 정렬 및 서열 동일성 계산을 위해서, BLASTP 프로그램을 그의 디폴트 매개변수(정렬 행렬 = BLOSUM62; 끊김 비용: 존재 = 11, 확장 = 1; 조성 조정 = 조건적 조성 조정, 행렬 조정; 예상치 = 10.0; 워드 크기 = 6; 조회 범위 중 최대 합치 = 0)와 함께 사용한다. 한편으로 하기의 프로그램 및 매개변수들이 사용된다: 얼라인 플러스 소프트웨어 오브 클론 매니저 스위트(Align Plus software of Clone Manager Suite), 버전 5(Sci-Ed 소프트웨어); DNA 비교: 전체적인 비교, 표준 선형 채점 행렬, 오합치 벌점 = 2, 끊김 벌점 = 4, 확장 끊김 벌점 = 1. 본 명세서에 기재된 실시태양들에서, 상기 서열 동일성을 디폴트 매개변수들과 함께 BLASTN 또는 BLASTP 프로그램을 사용하여 계산한다. 본 명세서에 기재된 실시태양들에서, 2개 이상 서열의 서열 정렬을 추천된 디폴트 매개변수들을 사용하여 클러스탈 오메가로 수행한다(탈정렬 입력 서열: 없음; Mbed-유사 클러스터링 가이드 트리: 있음; Mbed-유사 클러스터링 반복: 있음; 병행된 반복의 수: 디폴트(0); 최대 가이드 트리 반복: 디폴트; 최대 HMM 반복: 디폴트; 순서: 정렬됨).
6.2 숙주 세포
본 명세서에서 레바우디오시드 A(RebA)로부터 레바우디오시드 D(RebD)를 고효율로 생산할 수 있는 숙주 세포를 제공한다. 몇몇 실시태양에서, 상기 숙주 세포는 출발 물질로서 RebA로부터 RebD를 생산할 수 있다. 바람직한 실시태양에서, 상기 숙주 세포는 배양 배지에서 탄소원으로부터 RebA를 생산할 수 있고 상기 RebA로부터 RebD를 추가로 생산할 수 있다. 특정한 실시태양에서, 상기 숙주 세포는 상기 RebD로부터 레바우디오시드 M(RebM)을 추가로 생산할 수 있다.
특정한 실시태양에서, 상기 숙주 세포는 유리딘 디포스페이트 글리코실트랜스퍼라제 87(UGT40087)의 효소 활성을 포함한다. UGT40087 효소는 RebA를 RebD로 고효율로 전환시킬 수 있다. 몇몇 실시태양에서 UGT40087 효소는 RebA를 RebD로 80% 초과 효율로 전환시킬 수 있다. 몇몇 실시태양에서 UGT40087 효소는 RebA를 RebD로 85% 초과 효율로 전환시킬 수 있다. 몇몇 실시태양에서 UGT40087 효소는 RebA를 RebD로 90% 초과 효율로 전환시킬 수 있다. 몇몇 실시태양에서 UGT40087 효소는 RebA를 RebD로 95% 초과 효율로 전환시킬 수 있다. 몇몇 실시태양에서 UGT40087 효소는 RebA를 RebD로 96% 초과 효율로 전환시킬 수 있다. 몇몇 실시태양에서 UGT40087 효소는 RebA를 RebD로 약 97% 효율로 전환시킬 수 있다. 몇몇 실시태양에서 UGT40087 효소는 스테비오시드를 RebE로 전환시킬 수 있다.
몇몇 실시태양에서, 상기 숙주 세포는 RebA를 RebD로 80% 초과 효율로 전환시킬 수 있다. 몇몇 실시태양에서, 상기 숙주 세포는 RebA를 RebD로 85% 초과 효율로 전환시킬 수 있다. 몇몇 실시태양에서 상기 숙주 세포는 RebA를 RebD로 90% 초과 효율로 전환시킬 수 있다. 몇몇 실시태양에서 상기 숙주 세포는 RebA를 RebD로 95% 초과 효율로 전환시킬 수 있다. 몇몇 실시태양에서 상기 숙주 세포는 RebA를 RebD로 96% 초과 효율로 전환시킬 수 있다. 몇몇 실시태양에서 상기 숙주 세포는 RebA를 RebD로 약 97% 효율로 전환시킬 수 있다. 몇몇 실시태양에서 상기 숙주 세포는 스테비오시드를 RebE로 전환시킬 수 있다.
전환 효율을 당해 분야의 숙련가들에게 자명한 임의의 기법에 의해 측정할 수 있다. 몇몇 실시태양에서, 전환 효율을 RebA를 RebD 형성에 적합한 조건하에서 효소 또는 숙주 세포와 접촉시킴으로써 측정할 수 있다. 효율을, 비교되는 생성된 RebD의 몰량을 생성 조성물 중의 RebA 및 RebD의 총량과 비교함으로써 측정할 수 있다. 효율을 또한 RebD 및 RebD의 하류 생성물의 총량을 생성 조성물 중의 RebA, RebD, 및 RebD의 하류 생성물의 총량에 비교함으로써 측정할 수 있다. 예를 들어, 효율을 또한 비교되는 RebD, RebM, 및 RebM2의 총량을 생성 조성물 중의 RebA, RebD, RebM 및 RebM2의 총량에 비교함으로써 측정할 수 있다.
몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열을 포함하는 UGT40087을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 실질적으로 일치하는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 60% 일치하는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 65% 일치하는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 70% 일치하는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 75% 일치하는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 80% 일치하는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 85% 일치하는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 90% 일치하는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 95% 일치하는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 96% 일치하는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 97% 일치하는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 98% 일치하는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 99% 일치하는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 60%, 적어도 99%, 또는 적어도 60% 내지 99% 중 임의의 백분율로 일치하는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 포함하는 숙주 세포를 제공한다.
몇몇 실시태양에서, 본 명세서에서 본 명세서에 기재된 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 포함하고 RebA를 RebD로 전환시킬 수 있는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 본 명세서에 기재된 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 포함하고 스테비올 글리코시드의 19-O 글루코스의 C2' 위치에 대해 베타 1,2 글리코실화시킬 수 있는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 RebA를 RebD로 90%, 95%, 96%, 또는 97% 초과 효율로 전환시킬 수 있는 UDP-글리코실트랜스퍼라제를 포함하는 숙주 세포를 제공하며, 여기에서 상기 UDP-글리코실트랜스퍼라제는 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함한다.
몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열을 포함하는 UGT40087을 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 실질적으로 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 60% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 65% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 70% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 75% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 80% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 85% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 90% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 95% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 96% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 97% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 98% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 99% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열에 적어도 60%, 적어도 99%, 또는 60% 내지 99% 중 임의의 백분율로 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다.
몇몇 실시태양에서, 본 명세서에서 서열번호 11의 서열을 갖는 UGT40087을 암호화하는 서열번호 13의 뉴클레오티드 서열을 포함하는 이종 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 13의 뉴클레오티드 서열에 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 일치하는 뉴클레오티드 서열을 포함하는 이종 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 11의 뉴클레오티드 서열에 적어도 90%, 적어도 99%, 또는 60% 내지 99% 중 임의의 백분율로 일치하는 뉴클레오티드 서열을 포함하는 이종 핵산을 포함하는 숙주 세포를 제공한다.
몇몇 실시태양에서, 본 명세서에서 UGT40087의 기능성 도메인을 포함하는 숙주 세포를 제공하며, 여기에서 상기 UGT40087은 서열번호 1 또는 서열번호 11의 아미노산 서열을 포함한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열을 포함하는 UGT40087의 N-말단 당 수용체 도메인을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 아미노산 서열을 포함하는 UGT40087의 C-말단 당 공여체 도메인을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, UGT40087의 당 수용체 도메인은 서열번호 11의 대략 아미노산 위치 1 내지 214(서열번호 1의 아미노산 위치 1 내지 215에 상응한다)를 포함한다. 몇몇 실시태양에서, UGT40087의 당 공여체 도메인은 서열번호 11의 대략 아미노산 위치 215 내지 435(서열번호 1의 아미노산 위치 216 내지 436에 상응한다)를 포함한다. 몇몇 실시태양에서, UGT40087의 당 수용체 도메인은 서열번호 1의 대략 아미노산 위치 1 내지 215를 포함한다. 몇몇 실시태양에서, UGT40087의 당 공여체 도메인은 서열번호 1의 대략 아미노산 위치 216 내지 436을 포함한다. 몇몇 실시태양에서, UGT40087의 상기 당 수용체 도메인 및 당 공여체 도메인은 서열번호 11과 관련하여, 각각 1 내지 214 또는 215 내지 435보다 더 좁은 범위의 아미노산 잔기를 포함한다. 몇몇 실시태양에서, UGT40087의 상기 당 수용체 도메인 및 당 공여체 도메인은 서열번호 1과 관련하여, 각각 1 내지 215 또는 216 내지 436보다 더 좁은 범위의 아미노산 잔기를 포함한다.
몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 실질적으로 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 60% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 65% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 70% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 75% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 80% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 85% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 90% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 95% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 96% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 97% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 98% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 99% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 60%, 적어도 99%, 또는 60% 내지 99% 중 임의의 백분율로 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다.
몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열을 포함하는 UGT40087을 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 실질적으로 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 60% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 65% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 70% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 75% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 80% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 85% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 90% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 95% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 96% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 97% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 98% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 99% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다.
몇몇 실시태양에서, UGT40087 및 또 다른 UDP-글리코실트랜스퍼라제의 3차원 모델 구조를 비교 분석시, N 말단 당 수용체 도메인에서 현저한 입체형태적 차이를 갖는 4개의 고리(즉 고리1, 고리2, 고리3 및 고리4)가 밝혀졌다. 도 6 및 실시예 12를 참조하시오. 2개의 UGT간의 상응하는 고리 서열의 교환으로부터의 실험 결과는 UGT40087의 고리1, 고리2, 고리3_1, 고리3_2 및 고리4_1이 RebA를 RebD로 전환시킬 수 있는 다른 UDP-글리코실트랜스퍼라제로부터의 그들 각각의 상응하는 고리 서열로 치환될 수 있음을 가리켰다. 이들 실시태양에서, 2개의 가능한 고리 길이를 설명하기 위해 2가지 버전의 고리3(즉 고리3_1 및 고리3_2) 및 고리4(즉 고리4_1 및 고리4_2)가 설계되었다.
따라서, 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 일치하는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 일치하는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 암호화하는 이종 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 상기 UDP-글리코실트랜스퍼라제는 각각 서열번호 1 또는 서열번호 11의 고리1 위치(loop1 location)에 상응하는 UDP-글리코실트랜스퍼라제의 위치에 UGT40087(즉 서열번호 1 또는 서열번호 11)의 고리1 아미노산 서열을 추가로 포함한다. 몇몇 실시태양에서, 상기 서열번호 1 또는 서열번호 11의 고리1 아미노산 서열은 서열번호 30의 아미노산 서열을 갖는다. 몇몇 실시태양에서, 상기 고리1 아미노산 서열은 서열번호 28의 서열을 갖는다. 몇몇 실시태양에서, 상기 UDP-글리코실트랜스퍼라제는 각각 서열번호 1 또는 서열번호 11의 고리1 위치에 상응하는 UDP-글리코실트랜스퍼라제의 위치에 변형 고리1 아미노산 서열을 추가로 포함한다. 상기 변형 고리1 아미노산 서열은, 서열번호 1 또는 서열번호 11의 참조 고리1 아미노산 서열 또는 서열번호 28을 갖는 고리1 아미노산 서열과 상이하지만 상기 변형 고리1 아미노산을 포함하는 UDP-글리코실트랜스퍼라제가 RebA를 RebD로 전환시키고/시키거나 스테비오시드를 RebE로 전환시키는 그의 활성을 유지하게 하는 아미노산 서열을 지칭한다.
몇몇 실시태양에서, 상기 UDP-글리코실트랜스퍼라제는 각각 서열번호 1 또는 서열번호 11의 고리2 위치에 상응하는 UDP-글리코실트랜스퍼라제의 위치에 UGT40087(즉 서열번호 1 또는 서열번호 11)의 고리2 아미노산 서열을 추가로 포함한다. 몇몇 실시태양에서, 상기 서열번호 1 또는 서열번호 1의 고리2 아미노산 서열은 서열번호 19의 아미노산 서열을 갖는다. 몇몇 실시태양에서, 상기 UDP-글리코실트랜스퍼라제는 각각 서열번호 1 또는 서열번호 11의 고리2 위치에 상응하는 UDP-글리코실트랜스퍼라제의 위치에 변형 고리2 아미노산 서열을 추가로 포함한다. 상기 변형 고리2 아미노산 서열은, 서열번호 1 또는 서열번호 11의 참조 고리2 아미노산 서열과 상이하지만 상기 변형 고리2 아미노산을 포함하는 UDP-글리코실트랜스퍼라제가 RebA를 RebD로 전환시키고/시키거나 스테비오시드를 RebE로 전환시키는 그의 활성을 유지하게 하는 아미노산 서열을 지칭한다.
몇몇 실시태양에서, 상기 UDP-글리코실트랜스퍼라제는 각각 서열번호 1 또는 서열번호 11의 고리3_1 위치에 상응하는 UDP-글리코실트랜스퍼라제의 위치에 UGT40087(즉 서열번호 1 또는 서열번호 11)의 고리3_1 아미노산 서열을 추가로 포함한다. 몇몇 실시태양에서, 상기 서열번호 1 또는 서열번호 11의 고리3_1 아미노산 서열은 서열번호 20의 아미노산 서열을 갖는다. 몇몇 실시태양에서, 상기 UDP-글리코실트랜스퍼라제는 각각 서열번호 1 또는 서열번호 11의 고리3_1 위치에 상응하는 UDP-글리코실트랜스퍼라제의 위치에 변형 고리3_1 아미노산 서열을 추가로 포함한다. 상기 변형 고리3_1 아미노산 서열은, 서열번호 1 또는 서열번호 11의 참조 고리3_1 아미노산 서열과 상이하지만 상기 변형 고리3_1 아미노산을 포함하는 UDP-글리코실트랜스퍼라제가 RebA를 RebD로 전환시키고/시키거나 스테비오시드를 RebE로 전환시키는 그의 활성을 유지하게 하는 아미노산 서열을 지칭한다.
몇몇 실시태양에서, 상기 UDP-글리코실트랜스퍼라제는 각각 서열번호 1 또는 서열번호 11의 고리3_2 위치에 상응하는 UDP-글리코실트랜스퍼라제의 위치에 UGT40087(즉 서열번호 1 또는 서열번호 11)의 고리3_2 아미노산 서열을 추가로 포함한다. 몇몇 실시태양에서, 상기 서열번호 1 또는 서열번호 11의 고리3_2 아미노산 서열은 서열번호 21의 아미노산 서열을 갖는다. 몇몇 실시태양에서, 상기 UDP-글리코실트랜스퍼라제는 각각 서열번호 1 또는 서열번호 11의 고리3_2 위치에 상응하는 UDP-글리코실트랜스퍼라제의 위치에 변형 고리3_2 아미노산 서열을 추가로 포함한다. 상기 변형 고리3_2 아미노산 서열은, 서열번호 1 또는 서열번호 11의 참조 고리3_2 아미노산 서열과 상이하지만 상기 변형 고리3_2 아미노산을 포함하는 UDP-글리코실트랜스퍼라제가 RebA를 RebD로 전환시키고/시키거나 스테비오시드를 RebE로 전환시키는 그의 활성을 유지하게 하는 아미노산 서열을 지칭한다.
몇몇 실시태양에서, 상기 UDP-글리코실트랜스퍼라제는 각각 서열번호 1 또는 서열번호 11의 고리4_1 위치에 상응하는 UDP-글리코실트랜스퍼라제의 위치에 UGT40087(즉 서열번호 1 또는 서열번호 11)의 고리4_1 아미노산 서열을 추가로 포함한다. 몇몇 실시태양에서, 상기 서열번호 1 또는 서열번호 11의 고리4_1 아미노산 서열은 서열번호 22의 아미노산 서열을 갖는다. 몇몇 실시태양에서, 상기 UDP-글리코실트랜스퍼라제는 각각 서열번호 1 또는 서열번호 11의 고리4_1 위치에 상응하는 UDP-글리코실트랜스퍼라제의 위치에 변형 고리4_1 아미노산 서열을 추가로 포함한다. 상기 변형 고리4_1 아미노산 서열은, 서열번호 1 또는 서열번호 11의 참조 고리4_1 아미노산 서열과 상이하지만 상기 변형 고리4_1 아미노산을 포함하는 UDP-글리코실트랜스퍼라제가 RebA를 RebD로 전환시키고/시키거나 스테비오시드를 RebE로 전환시키는 그의 활성을 유지하게 하는 아미노산 서열을 지칭한다.
몇몇 실시태양에서, 상기 UDP-글리코실트랜스퍼라제는 각각 서열번호 1 또는 서열번호 11의 고리4_2 위치에 상응하는 UDP-글리코실트랜스퍼라제의 위치에 UGT40087(즉 서열번호 1 또는 서열번호 11)의 고리4_2 아미노산 서열을 추가로 포함한다. 상기 서열번호 1 또는 서열번호 11의 고리4_2 아미노산 서열은 서열번호 23의 아미노산 서열을 갖는다.
몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 일치하는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제, 또는 그의 UDP-글리코실트랜스퍼라제를 암호화하는 이종 핵산을 포함하고, 하기 중 임의의 조합을 추가로 포함하는 숙주 세포를 제공한다:
(a) 각각 서열번호 1 또는 서열번호 11의 고리1 위치에 상응하는 UDP-글리코실트랜스퍼라제의 위치에, 서열번호 1 또는 서열번호 11의 고리1 아미노산 서열, 서열번호 28의 아미노산 서열, 또는 변형 고리1 아미노산 서열;
(b) 각각 서열번호 1 또는 서열번호 11의 고리2 위치에 상응하는 UDP-글리코실트랜스퍼라제의 위치에, 서열번호 1 또는 서열번호 11의 고리2 아미노산 서열, 또는 변형 고리2 아미노산 서열;
(c) 각각 서열번호 1 또는 서열번호 11의 고리3_1 위치에 상응하는 UDP-글리코실트랜스퍼라제의 위치에, 서열번호 1 또는 서열번호 11의 고리3_1 아미노산 서열, 또는 변형 고리3_1 아미노산 서열;
(d) 각각 서열번호 1 또는 서열번호 11의 고리3_2 위치에 상응하는 UDP-글리코실트랜스퍼라제의 위치에, 서열번호 1 또는 서열번호 11의 고리3_2 아미노산 서열, 또는 변형 고리3_2 아미노산 서열;
(e) 각각 서열번호 1 또는 서열번호 11의 고리4_1 위치에 상응하는 UDP-글리코실트랜스퍼라제의 위치에, 서열번호 1 또는 서열번호 11의 고리4_1 아미노산 서열, 또는 변형 고리4_1 아미노산 서열; 및
(f) 각각 서열번호 1 또는 서열번호 11의 고리4_2 위치에 상응하는 UDP-글리코실트랜스퍼라제의 위치에, 서열번호 1 또는 서열번호 11의 고리4_2 아미노산 서열.
몇몇 실시태양에서, RebA를 RebD로 전환시킬 수 있는 UDP-글리코실트랜스퍼라제의 3차원 모델 구조를 비교 분석시, UGT40087의 고리4_1은 또 다른 UDP-글리코실트랜스퍼라제의 상응하는 고리4_1 위치에 통합될 때(및 그의 고유 고리4_1 아미노산 서열의 교체시) RebA를 RebD로 전환시키는 그의 능력의 면에서 변형 DUP-글리코실트랜스퍼라제의 우수한 활성을 유도함을 발견하였다. 실시예 12를 참조하시오. 상기 결과는 임의의 적합한 UDP-글리코실트랜스퍼라제의 고리4_1 아미노산 서열을 서열번호 1 또는 서열번호 11의 고리4_1 아미노산 서열로 치환시켜 RebA를 RebD로 전환시킬 수 있음을 가리킨다.
따라서, 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 61%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 일치하는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 포함하고, UGT40087(즉 서열번호 1 또는 서열번호 11)의 고리4_1 아미노산 서열(즉 서열번호 22)을 추가로 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 61%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 일치하는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 암호화하는 이종 핵산을 포함하고, 서열번호 1 또는 서열번호 11의 고리4_1 아미노산 서열(즉 서열번호 22)을 추가로 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 서열번호 1 또는 서열번호 11에 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95%인 아미노산 서열을 포함하는 임의의 적합한 UDP-글리코실트랜스퍼라제를 사용하여, 그의 상응하는 고리4_1 위치에 서열번호 1 또는 서열번호 11의 고리4_1 아미노산 서열을 통합시킬 수 있다(그의 고유 고리4_1 아미노산 서열을 교체함). 예를 들어 Ob_UGT91B_유사, Hv_UGT_V1, Sl_UGT_101249881, Sr.UGT_g252778, Os_UGT_91C1, Bd_UGT10840, Bd_UGT10850, 또는 Si91D유사를 염기로서 사용하여 그의 상응하는 고리4_1 위치에 서열번호 1 또는 서열번호 11의 고리4_1 아미노산 서열을 통합시킬 수 있다. 몇몇 실시태양에서, 상기 UDP-글리코실트랜스퍼라제는 서열번호 25의 아미노산 서열을 포함한다.
몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 실질적으로 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 적어도 60% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 적어도 65% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 적어도 70% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 적어도 75% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 적어도 80% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 적어도 85% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 적어도 90% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 적어도 95% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 적어도 96% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 적어도 97% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 적어도 98% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 적어도 99% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다.
몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열을 포함하는 UGT40087을 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 실질적으로 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 적어도 60% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 적어도 65% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 적어도 70% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 적어도 75% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 적어도 80% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 적어도 85% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 적어도 90% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 적어도 95% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 적어도 96% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 적어도 97% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 적어도 98% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 적어도 99% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산을 포함하는 숙주 세포를 제공한다.
몇몇 실시태양에서, 상기 N-말단 당 수용체 도메인 및 상기 C-말단 당 공여체 도메인은 재조합하여 기질 특이성 또는 촉매 활성을 변경시켰다. 실시예 11에 상세히 기재된 바와 같이, RebA를 RebD로 전환시킬 수 있는 또 다른 UDP-글리코실트랜스퍼라제로부터의 당 공여체 도메인을 서열번호 1 또는 서열번호 11의 당 수용체 도메인과 재조합시켰을 때, 상기 키메릭 UDP-글리코실트랜스퍼라제는 RebA를 RebD로 전환시키는 그의 능력을 유지하는 것으로 밝혀졌다.
따라서, 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 일치하는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 1 또는 서열번호 11의 C-말단 당 공여체 도메인의 아미노산 서열에 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 일치하는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 암호화하는 이종 핵산을 포함하는 숙주 세포를 제공한다. 실시예 11에 나타낸 바와 같이, 상기 C-말단 당 공여체 도메인은 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95%의 서열 동일성을 포함하는 다른 UDP-글리코실트랜스퍼라제와 상대적으로 교환 가능하다. 몇몇 실시태양에서, 상기 UDP-글리코실트랜스퍼라제는 다른 UDP-글리코실트랜스퍼라제로부터의 C-말단 당 공여체 도메인을 추가로 포함한다. 적합한 C-말단 당 공여체 도메인을 갖는 다른 UDP-글리코실트랜스퍼라제의 예는 Ob_UGT91B_유사, Hv_UGT_V1, SI_UGT_101249881, Sr.UGT_g252778, Os_UGT_91C1, Bd_UGT10840, Bd_UGT10850, 또는 Si91D유사를 포함한다.
몇몇 실시태양에서, 상기 N-말단 당 수용체 도메인 중의 몇몇 아미노산 잔기는 비-기능성의 추정적인 UDP-글리코실트랜스퍼라제의 촉매 활성을 활성의 UDP-글리코실트랜스퍼라제로 복원시킬 수 있음이 발견되었다. 따라서, 본 명세서에서 서열번호 1 또는 서열번호 11의 N-말단 당 수용체 도메인의 아미노산 서열에 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 일치하는 아미노산 서열을 포함하고, 하기의 아미노산 잔기 중 하나 이상을 추가로 포함하는 UDP-글리코실트랜스퍼라제를 포함하는 숙주 세포를 제공하며:
(a) 서열번호 11의 아미노산 위치 11에 상응하는 UDP-글리코실트랜스퍼라제의 아미노산 위치에 발린;
(b) 서열번호 11의 아미노산 위치 12에 상응하는 UDP-글리코실트랜스퍼라제의 아미노산 위치에 이소류신;
(c) 서열번호 11의 아미노산 위치 55에 상응하는 UDP-글리코실트랜스퍼라제의 아미노산 위치에 프롤린;
(d) 서열번호 11의 아미노산 위치 90에 상응하는 UDP-글리코실트랜스퍼라제의 아미노산 위치에 글루탐산;
(e) 서열번호 11의 아미노산 위치 203에 상응하는 UDP-글리코실트랜스퍼라제의 아미노산 위치에 세린;
(f) 서열번호 11의 아미노산 위치 223에 상응하는 UDP-글리코실트랜스퍼라제의 아미노산 위치에 글루탐산; 또는
(g) 서열번호 11의 아미노산 위치 413에 상응하는 UDP-글리코실트랜스퍼라제의 아미노산 위치에 발린,
여기에서 상기 서열번호 11의 아미노산 위치에 상응하는 UDP-글리코실트랜스퍼라제의 아미노산 위치들은 서열 정렬에 의해 측정된다.
몇몇 실시태양에서, 본 명세서에서 서열번호 24의 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 포함하는 숙주 세포를 제공한다.
몇몇 실시태양에서, 상기 숙주 세포는 상술한 UGT40087 폴리펩티드의 변체를 포함한다. 몇몇 실시태양에서, 상기 변체는 상기 UGT40087 폴리펩티드에 대해 15, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 아미노산 치환을 포함할 수 있다. 몇몇 실시태양에서, 상기 변체는 상기 UGT40087 폴리펩티드에 대해 15, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1 개 이하의 보존적 아미노산 치환을 포함할 수 있다. 몇몇 실시태양에서, 본 명세서에 기재된 핵산 중 어느 하나를 숙주 세포에 대해 최적화할 수 있다, 예를 들어 코돈 최적화할 수 있다.
본 명세서에 기재된 실시태양에서, 임의의 적합한 방법을 사용하여 2개의 폴리펩티드의 상응하는 아미노산 위치 또는 상응하는 고리 위치를 측정할 수 있다. 몇몇 실시태양에서, UDP-글리코실트랜스퍼라제 및 참조 서열 서열번호 11의 서열들을 디폴트 매개변수를 사용하여 클러스탈 오메가로 정렬시킬 수 있다. 다른 실시태양에서, UDP-글리코실트랜스퍼라제 및 참조 서열 서열번호 11의 서열들을 SWISS-MODEL(상기는 단백질 구조 상동성-모델링 서버이며, ExPASy 웹 서버를 통해 또는 프로그램 DeepView(Swiss Pdb-Viewer)로부터 입수할 수 있다)과 같은 구조 정렬을 사용하여 정렬시킬 수 있다.
서열번호 11을 UDP-글리코실트랜스퍼라제에 대한 상응하는 아미노산 위치 또는 고리 위치의 측정을 위한 참조 서열이라 칭하지만, 몇몇 실시태양에서 서열번호 1을 또한 서열 정렬을 위한 참조 서열로서 사용할 수 있다.
몇몇 실시태양에서, RebA는 도 1A에 나타낸 바와 같다. 몇몇 실시태양에서, UGT40087 또는 변형 UGT40087은 도 1A에 나타낸 바와 같이 RebA의 19-O-글루코스의 C-2' 위치에 대해 β 결합을 형성하여 RebD를 생성시키는 당 잔기의 반응을 촉매화할 수 있다. 몇몇 실시태양에서, 상기 UGT40087 또는 변형 UGT40087은 RebA의 19-O-글루코스의 C-2' 위치에 대한, β 형성에서, 헥소스 잔기의 반응을 촉매화할 수 있다. 몇몇 실시태양에서, 상기 UGT40087은 RebA의 19-O-글루코스의 C-2' 위치에 대한, β 형성에서, 글루코스 잔기의 반응을 촉매화할 수 있다.
몇몇 실시태양에서, RebE는 도 2B에 나타낸 바와 같다. 몇몇 실시태양에서, UGT40087 또는 변형 UGT40087은 도 2B에 나타낸 바와 같이 스테비오시드의 19-O-글루코스의 C-2' 위치에 대해 β 결합을 형성하여 RebE를 생성시키는 당 잔기의 반응을 촉매화할 수 있다. 몇몇 실시태양에서, 상기 UGT40087 또는 변형 UGT40087은 스테비오시드의 19-O-글루코스의 C-2' 위치에 대한, β 형성에서, 헥소스 잔기의 반응을 촉매화할 수 있다. 몇몇 실시태양에서, 상기 UGT40087 또는 변형 UGT40087은 스테비오시드의 19-O-글루코스의 C-2' 위치에 대한, β 형성에서, 글루코스 잔기의 반응을 촉매화할 수 있다.
몇몇 실시태양에서, UGT40087 또는 변형 UGT40087은 스테비올모노시드(즉 13-O-스테비올 글리코시드)에의 제2 당 부분의 첨가 반응을 검출 가능한 수준으로 촉매화하지 않는다. 몇몇 실시태양에서, 상기 UGT40087 또는 변형 UGT40087은 루부소시드(즉 19-O-스테비올 글리코시드)에의 제2 당 부분의 첨가 반응을 검출 가능한 수준으로 촉매화하지 않는다.
몇몇 실시태양에서, RebD는 도 1A에 나타낸 바와 같다. 몇몇 실시태양에서, 상기 숙주 세포는 RebA를 RebD로 전환시킬 수 있는 하나 이상의 효소를 추가로 포함한다. 몇몇 실시태양에서, 상기 숙주 세포는 RebA의 RebD로의 전환을 위해 UGT40087 및/또는 변형 UGT40087을 포함한다.
몇몇 실시태양에서, UGT76G1은 도 1A에 나타낸 바와 같이 RebD를 RebM으로 전환시키는 당 잔기의 반응을 촉매화할 수 있다. 몇몇 실시태양에서, 상기 숙주 세포는 RebD를 RebM으로 전환시킬 수 있는 하나 이상의 효소를 추가로 포함한다. 몇몇 실시태양에서, 상기 숙주 세포는 RebD를 RebM으로 전환시킬 수 있는 UGT76G1을 추가로 포함한다.
몇몇 실시태양에서, RebM2는 도 1B에 나타낸 바와 같다. RebM2는 도 1B에 나타낸 바와 같이 단일의 잘못된 글루코스 결합을 갖는 RebM의 이성질체이다. RebM2는 19번 탄소 위치(COOH)에 RebM에 대한 목적하는 Glcβ(1-2)[Glcβ(1-3)]Glcβ1 대신에 Glcβ(1-2)[Glcβ(1-6)]Glcβ1을 갖는다.
숙련가들은 몇몇 용도에서 RebM2가 바람직하지 못한 부산물일 수도 있음을 알 것이다. 유리하게, 몇몇 실시태양에서, 본 명세서에서 제공된 상기 UGT40087(또는 변형 UGT40087) 및 숙주 세포는 RebM2를 거의 또는 전혀 생산할 수 없다. 상기 RebM2의 양을 RebM 대 RebM2의 비로서 나타낼 수 있다. 몇몇 실시태양에서 RebM 대 RebM2의 비는 적어도 2:1이다. 몇몇 실시태양에서 RebM 대 RebM2의 비는 적어도 3:1이다. 몇몇 실시태양에서 RebM 대 RebM2의 비는 적어도 4:1이다. 몇몇 실시태양에서 RebM 대 RebM2의 비는 적어도 5:1이다. 몇몇 실시태양에서 RebM 대 RebM2의 비는 적어도 10:1이다. 몇몇 실시태양에서 RebM 대 RebM2의 비는 적어도 100:1이다. 몇몇 실시태양에서 RebM 대 RebM2의 비는 적어도 1000:1이다. 몇몇 실시태양에서 RebM 대 RebM2의 비는 적어도 10000:1이다. 몇몇 실시태양에서, 본 명세서에서 제공된 상기 UGT40087(또는 변형 UGT40087) 및 숙주 세포는 RebM2를 검출할 수 없는 수준으로 생산한다.
상기 숙주 세포의 UGT40087 또는 임의의 변형 UGT40087은 기질로서 RebA를 수용하지만, RebA의 공급원은 숙련가들에게 적합한 것으로 여겨지는 임의의 공급원일 수 있다. 몇몇 실시태양에서, 상기 UGT40087 또는 임의의 변형 UGT40087을 RebA와 접촉시킬 수 있다. 몇몇 실시태양에서, 상기 숙주 세포를 RebA와 접촉시킬 수 있다. 몇몇 실시태양에서, 상기 UGT40087 또는 UGT40087의 임의의 변체를 하나 이상의 스테비올 글리코시드를 포함하는 조성물과 접촉시킬 수 있다. 몇몇 실시태양에서, 상기 조성물은 RebA를 포함한다. 몇몇 실시태양에서, 상기 조성물은 스테비오시드를 포함한다. 몇몇 실시태양에서, 상기 조성물은 스테비아 레바우디아나 잎으로부터 단리된 천연 생성물로부터 유래된다. 몇몇 실시태양에서, 상기 조성물은 미생물에 의해 유래된다. 몇몇 실시태양에서, 상기 숙주 세포를 하나 이상의 스테비올 글리코시드를 포함하는 조성물과 접촉시킬 수 있다.
몇몇 실시태양에서, 목적하는 반응을 촉매화하기에 적합한 임의의 변형 UGT40087을 당해 분야에 공지된 임의의 적합한 방법에 의해 선별할 수 있다. 예를 들어, 적합한 변형 UGT40087을, 변형 UGT40087을 암호화하는 이종 핵산을 발현시키고 기질의 목적하는 위치(예를 들어 스테비올 글리코시드 또는 다른 기질의 19-O-글루코스의 C2' 위치)에서 당을 첨가할 수 있는 기능성 변형 UGT40087을 생산하는 세포를 선별함으로써 분석할 수 있다. 예시적인 선별 방법들을 하기 실시예 3 내지 7에 기재한다. 또 다른 예에서, 적합한 변형 UGT40087을, 변형 UGT40087을 RebA와 같은 기질과 접촉시킴으로써 시험관내에서 선별할 수 있다. 상기 예에서, RebD의 존재에 대한 분석을, 변형 UGT40087이 적합한 효소인지의 여부를 결정하기 위한 시험으로서 사용할 수 있다. 상기 반응을 LC-MS 또는 당해 분야에 공지된 다른 방법들에 의해 분석할 수 있다. 예를 들어 WO 2013/022989를 참조하시오.
몇몇 실시태양에서, 변형 UGT40087이 생체내에서 RebA를 RebD로 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 96%, 또는 97% 초과 효율로 전환시킬 수 있는 경우 상기는 RebA를 RebD로(또는 글리코실화에 의해 임의의 적합한 기질로부터 그의 생성물로) 전환시키기에 적합한 것으로 간주된다.
일부 실시태양에서, 본 출원에서 발견되는 다른 적합한 UDP-글리코실트랜스퍼라제를 UGT40087 외에 또는 상기에 대한 대안으로 사용할 수 있다. 여기에는 예를 들어 UDP-글리코실트랜스퍼라제 sr.UGT_9252778, Bd_UGT10840, Hv_UGT_V1, Bd_UGT10850, 및 Ob_UGT91B1_유사가 포함된다. 몇몇 실시태양에서 UDP-글리코실트랜스퍼라제 sr.UGT_9252778은 서열번호 2를 포함한다. 몇몇 실시태양에서 UDP-글리코실트랜스퍼라제 Bd_UGT10840은 서열번호 3을 포함한다. 몇몇 실시태양에서 UDP-글리코실트랜스퍼라제 Hv_UGT_V1은 서열번호 4를 포함한다. 몇몇 실시태양에서 UDP-글리코실트랜스퍼라제 Bd_UGT10850은 서열번호 5를 포함한다. 몇몇 실시태양에서 UDP-글리코실트랜스퍼라제 Ob_UGT91B1_유사는 서열번호 6을 포함한다. 본 명세서에 기재된 UGT40087에 적합한 조성물 및 방법에 관한 임의의 논의를 또한 이들 다른 UDP-글리코실트랜스퍼라제에도 적용할 수 있다.
예를 들어, 일부 실시태양에서, 상기 숙주 세포는 유리딘 디포스페이트 글리코실트랜스퍼라제 sr.UGT_9252778, Bd_UGT10840, Hv_UGT_V1, Bd_UGT10850, 및/또는 Ob_UGT91B1_유사의 효소 활성을 포함한다. 몇몇 실시태양에서, 이들 효소 중 하나 이상은 RebA를 RebD로 40% 초과 효율로 전환시킬 수 있다. 몇몇 실시태양에서, 이들 효소 중 하나 이상은 RebA를 RebD로 45% 초과 효율로 전환시킬 수 있다. 몇몇 실시태양에서, 이들 효소 중 하나 이상은 RebA를 RebD로 50% 초과 효율로 전환시킬 수 있다. 몇몇 실시태양에서, 이들 효소 중 하나 이상은 RebA를 RebD로 55% 초과 효율로 전환시킬 수 있다. 몇몇 실시태양에서, 이들 효소 중 하나 이상은 RebA를 RebD로 60% 초과 효율로 전환시킬 수 있다. 몇몇 실시태양에서, 이들 효소 중 하나 이상은 RebA를 RebD로 65% 초과 효율로 전환시킬 수 있다. 몇몇 실시태양에서, 이들 효소 중 하나 이상은 RebA를 RebD로 70% 초과 효율로 전환시킬 수 있다. 몇몇 실시태양에서, 이들 효소 중 하나 이상은 RebA를 RebD로 75% 초과 효율로 전환시킬 수 있다. 몇몇 실시태양에서, 이들 효소 중 하나 이상은 RebA를 RebD로 80% 초과 효율로 전환시킬 수 있다. 몇몇 실시태양에서, 이들 효소 중 하나 이상은 RebA를 RebD로 85% 초과 효율로 전환시킬 수 있다. 몇몇 실시태양에서, 이들 효소 중 하나 이상은 RebA를 RebD로 90% 초과 효율로 전환시킬 수 있다. 몇몇 실시태양에서, 이들 효소 중 하나 이상은 RebA를 RebD로 95% 초과 효율로 전환시킬 수 있다.
몇몇 실시태양에서, 본 명세서에서 각각 서열번호 2, 3, 4, 5 또는 6의 아미노산 서열을 포함하는 sr.UGT_9252778, Bd_UGT10840, Hv_UGT_V1, Bd_UGT10850, 및/또는 Ob_UGT91B1_유사 중 임의의 하나 이상을 포함하는 숙주 세포를 제공한다. 몇몇 실시태양에서, 본 명세서에서 서열번호 2, 3, 4, 5 또는 6의 아미노산 서열에 적어도 60%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포를 제공한다.
유리한 실시태양에서, 상기 숙주 세포는 RebA를 생성시킬 수 있는 하나 이상의 효소 경로를 포함할 수 있으며, 상기 경로는 개별적으로 또는 함께 고려된다. 몇몇 실시태양에서, 상기 숙주 세포는 제라닐제라닐 디포스페이트를 RebA로 전환시킬 수 있는 하나 이상의 효소를 포함한다. 유용한 효소 및 상기 효소를 암호화하는 핵산은 당해 분야의 숙련가들에게 공지되어 있다. 특히 유용한 효소 및 핵산들이 하기의 섹션들에 기재되어 있으며 예를 들어 US 2014/0329281 A1, US 2014/0357588 A1, US 2015/0159188, WO 2016/038095 A2, 및 US 2016/0198748 A1에 추가로 기재되어 있다.
추가의 실시태양에서, 상기 숙주 세포는 탄소원으로부터 제라닐제라닐 디포스페이트를 생성시킬 수 있는 하나 이상의 효소를 추가로 포함한다. 여기에는 DXP 경로의 효소들 및 MEV 경로의 효소들이 포함된다. 유용한 효소 및 상기 효소를 암호화하는 핵산은 당해 분야의 숙련가들에게 공지되어 있다. 각 경로의 예시적인 효소들은 하기에 기재되어 있으며 예를 들어 US 2016/0177341 A1에 추가로 기재되어 있다. MEV 경로를 또한 도 1C에 나타낸다.
몇몇 실시태양에서, 상기 추가적인 효소들은 고유하다. 유리한 실시태양에서, 상기 추가적인 효소들은 이종성이다. 몇몇 실시태양에서, 2개의 효소가 하나의 폴리펩티드로 조합될 수 있다.
6.3 비-천연 UDP-글리코실트랜스퍼라제 폴리펩티드 및 핵산
또 다른 태양에서, 본 명세서는 참조 서열(예를 들어 서열번호 1)에 비해 아미노산 잔기의 변형(들)을 포함하고 UDP-글리코실트랜스퍼라제로서 RebA를 RebD로 및/또는 스테비오시드로부터 RebE로 전환시키는 활성을 여전히 유지하는 비-천연, 변형 UDP-글리코실트랜스퍼라제를 제공한다. 몇몇 실시태양에서, 비-천연, 변형 UDP-글리코실트랜스퍼라제는 참조 서열(예를 들어 서열번호 1 또는 서열번호 11)에 비해 몇몇 아미노산 위치 또는 장소에서 30, 25, 20, 15, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 아미노산 치환, 결실, 부가, 및/또는 삽입을 포함할 수 있다. 몇몇 실시태양에서, 비-천연, 변형 UDP-글리코실트랜스퍼라제는 본 명세서에 기재된 변형 UDP-글리코실트랜스퍼라제 중 어느 하나, 특히 섹션 6.2에 기재된 것들을 포함한다.
또 다른 태양에서, 본 명세서는 참조 서열(예를 들어 서열번호 26)에 비해 핵산 잔기의 변형(들)을 포함하고, 단백질로 번역시, 상기 단백질이 UDP-글리코실트랜스퍼라제로서 RebA를 RebD로 및/또는 스테비오시드를 RebE로 전환시키는 활성을 유지하는 비-천연, 변형 UDP-글리코실트랜스퍼라제를 제공한다. 몇몇 실시태양에서, 비-천연, 변형 UDP-글리코실트랜스퍼라제는 본 명세서에 기재된 변형 UDP-글리코실트랜스퍼라제 중 어느 하나, 특히 섹션 6.2에 기재된 것들을 암호화할 수 있다.
6.4 세포 균주
본 명세서에 제공된 조성물 및 방법에 유용한 숙주 세포는 고세균, 원핵 또는 진핵 세포를 포함한다.
적합한 원핵생물 숙주는 비제한적으로 다양한 그람-양성, 그람-음성, 또는 그람-가변성 세균 중 어느 하나를 포함한다. 예로서 비제한적으로 하기 속에 속하는 세포들을 포함한다: 아그로박테리움(Agrobacterium), 알리시클로바실러스(Alicyclobacillus), 아나바에나(Anabaena), 아나시스티스(Anacystis), 아르쓰로박터(Arthrobacter), 아조박터(Azobacter), 바실러스(Bacillus), 브레비박테리움(Brevibacterium), 크로마티움(Chromatium), 클로스트리디움(Clostridium), 코리네박테리움(Corynebacterium), 엔테로박터(Enterobacter), 에르위니아(Erwinia), 에스케리키아(Escherichia), 락토바실러스(Lactobacillus), 락토코커스(Lactococcus), 메소리조비움(Mesorhizobium), 메틸로박테리움(Methylobacterium), 미크로박테리움(Microbacterium), 포르미디움(Phormidium), 슈도모나스(Pseudomonas), 로도박터(Rhodobacter), 로도슈도모나스(Rhodopseudomonas), 로도스피릴룸(Rhodospirillum), 로도코커스(Rhodococcus), 살모넬라(Salmonella), 세네데스문(Scenedesmun), 세라티아(Serratia), 시겔라(Shigella), 스타필로코커스(Staphlococcus), 스트렙토마이세스(Strepromyces), 시네코커스(Synnecoccus) 및 지모모나스(Zymomonas). 원핵생물 균주의 예는 비제한적으로 바실러스 서브틸리스(Bacillus subtilis), 바실러스 아밀로리쿠에파시엔스(Bacillus amyloliquefacines), 브레비박테리움 암모니아게네스(Brevibacterium ammoniagenes), 브레비박테리움 임마리오필룸(Brevibacterium immariophilum), 클로스트리디움 베이제린키이(Clostridium beigerinckii), 엔테로박터 사카자키이(Enterobacter sakazakii), 에스케리키아 콜라이(Escherichia coli), 락토코커스 락티스(Lactococcus lactis), 메소리조비움 로티(Mesorhizobium loti), 슈도모나스 아에루기노사(Pseudomonas aeruginosa), 슈도모나스 메발로니이(Pseudomonas mevalonii), 슈도모나스 푸디카(Pseudomonas pudica), 로도박터 캅슐라투스(Rhodobacter capsulatus), 로도박터 스파에로이데스(Rhodobacter sphaeroides), 로도스피릴룸 루브룸(Rhodospirillum rubrum), 살모넬라 엔테리카(Salmonella enterica), 살모넬라 티피(Salmonella typhi), 살모넬라 티피무리움(Salmonella typhimurium), 시겔라 디센테리아에(Shigella dysenteriae), 시겔라 플렉스네리(Shigella flexneri), 시겔라 손네이(Shigella sonnei) 및 스타필로코커스 아우레우스(Staphylococcus aureus)를 포함한다. 특정한 실시태양에서, 상기 숙주 세포는 에스케리키아 콜라이 세포이다.
적합한 고세균 숙주는 비제한적으로 하기 속에 속하는 세포들을 포함한다: 아에로피룸(Aeropyrum), 알카에글로부스(Archaeglobus), 할로박테리움(Halobacterium), 메타노코커스(Methanococcus), 메타노박테리움(Methanobacterium), 피로코커스(Pyrococcus), 설포로부스(Sulfolobus) 및 써모플라스마(Thermoplasma). 고세균 균주의 예는 비제한적으로 하기를 포함한다: 알카에오글로부스 풀기두스(Archaeoglobus fulgidus), 할로박테리움 스페시즈(Halobacterium sp.), 메타노코커스 자나스키이(Methanococcus jannaschii), 메타노박테리움 써모아우토트로피쿰(Methanobacterium thermoautotrophicum), 써모플라스마 아시도필룸(Thermoplasma acidophilum), 써모플라스마 볼카니움(Thermoplasma volcanium), 피로코커스 호리코시이(Pyrococcus horikoshii), 피로코커스 아비씨(Pyrococcus abyssi) 및 아에로피룸 페르닉스(Aeropyrum pernix).
적합한 진핵생물 숙주는 비제한적으로 진균 세포, 조류 세포(algal cell), 곤충 세포, 및 식물 세포를 포함한다. 일부 실시태양에서, 본 방법에 유용한 효모는 미생물 기탁기관(예를 들어 IFO, ATCC 등)에 기탁되었으며 특히 하기 속에 속한 효모를 포함한다: 아시쿨로코니디움(Aciculoconidium), 암브로시오지마(Ambrosiozyma), 아르쓰로아스쿠스(Arthroascus), 아르시오지마(Arxiozyma), 아쉬비야(Ashbya), 바브제비아(Babjevia), 벤싱토니아(Bensingtonia), 보트리오아스쿠스(Botryoascus), 보트리오지마(Botryozyma), 브레타노마이세스(Brettanomyces), 불레라(Bullera), 불레로마이세스(Bulleromyces), 칸디다(Candida), 시테로마이세스(Citeromyces), 클라비스포라(Clavispora), 크립토코커스(Cryptococcus), 시스토필로바시디움(Cystofilobasidium), 데바리오마이세스(Debaryomyces), 덱카라(Dekkara), 디포다스코프시스(Dipodascopsis), 디포다스쿠스(Dipodascus), 에에니엘라(Eeniella), 엔도마이코프셀라(Endomycopsella), 에레마스쿠스(Eremascus), 에레모쎄시움(Eremothecium), 에리쓰로바시디움(Erythrobasidium), 펠로마이세스(Fellomyces), 필로바시디움(Filobasidium), 갈락토마이세스(Galactomyces), 제오트리쿰(Geotrichum), 귈리에르몬델라(Guilliermondella), 한세니아스포라(Hanseniaspora), 한세눌라(Hansenula), 하세가와에아(Hasegawaea), 홀테르마니아(Holtermannia), 호르모아스쿠스(Hormoascus), 히포피키아(Hyphopichia), 이싸트켄키아(Issatchenkia), 클로에케라(Kloeckera), 클로에케라스포라(Kloeckeraspora), 글루이베로마이세스(Kluyveromyces), 콘도아(Kondoa), 쿠라이시아(Kuraishia), 쿠르츠마노마이세스(Kurtzmanomyces), 류코스포리디움(Leucosporidium), 리포마이세스(Lipomyces), 로데로마이세스(Lodderomyces), 말라세지아(Malassezia), 메츠크니코위아(Metschnikowia), 므라키아(Mrakia), 믹소지마(Myxozyma), 나드소니아(Nadsonia), 나카자와에아(Nakazawaea), 네마토스포라(Nematospora), 오가타에아(Ogataea), 오오스포리디움(Oosporidium), 파키소렌(Pachysolen), 파키티코스포라(Phachytichospora), 파피아(Phaffia), 피키아(Pichia), 로도스포리디움(Rhodosporidium), 로도토루라(Rhodotorula), 사카로마이세스(Saccharomyces), 사카로마이코데스(Saccharomycodes), 사카로마이코프시스(Saccharomycopsis), 사이토엘라(Saitoella), 사카구치아(Sakaguchia), 사투르노스포라(Saturnospora), 스키조블라스토스포리온(Schizoblastosporion), 스키조사카로마이세스(Schizosaccharomyces), 슈와니오마이세스(Schwanniomyces), 스포리디오볼루스(Sporidiobolus), 스포로볼로마이세스(Sporobolomyces), 스포로파키데르미아(Sporopachydermia), 스테파노아스쿠스(Stephanoascus), 스테리그마토마이세스(Sterigmatomyces), 스테리그마토스포리디움(Sterigmatosporidium), 심비오타프리나(Symbiotaphrina), 심포디오마이세스(Sympodiomyces), 심포디오마이코프시스(Sympodiomycopsis), 토룰라스포라(Torulaspora), 트리코스포리엘라(Trichosporiella), 트리코스포론(Trichosporon), 트리고노프시스(Trigonopsis), 추키야에아(Tsuchiyaea), 우데니오마이세스(Udeniomyces), 왈토마이세스(Waltomyces), 위케라미아(Wickerhamia), 위케라미엘라(Wickerhamiella), 윌리오프시스(Williopsis), 야마다지마(Yamadazyma), 야로위아(Yarrowia), 지고아스쿠스(Zygoascus), 지고사카로마이세스(Zygosaccharomyces), 지고윌리오프시스(Zygowilliopsis) 및 지고지마(Zygozyma).
일부 실시태양에서, 상기 숙주 미생물은 사카로마이세스 세레비지아에(Saccharomyces cerevisiae), 피키아 파스토리스(Pichia pastoris), 스키조사카로마이세스 폼베(Schizosaccharomyces pombe), 데케라 브룩셀렌시스(Dekkera bruxellensis), 클루이베로마이세스 락티스(Kluyveromyces lactis(이전에는 사카로마이세스 락티스라 지칭되었다), 클루이베로마이세스 마르시아누스(Kluveromyces marxianus), 아룩슐라 아데니니보란스(Arxula adeninivorans) 또는 한세눌라 폴리모르파(Hansenula polymorpha)(현재 피키아 안구스타(Pichia angusta)로서 공지됨)이다. 일부 실시태양에서, 상기 숙주 미생물은 칸디다 속의 균주, 예를 들어 칸디다 리포리티카(Candida lipolytica), 칸디다 귈리에르몬디이(Candida guilliermondii), 칸디다 크루제이(Candida krusei), 칸디다 슈도트로피칼리스(Candida pseudotropicalis) 또는 칸디다 유틸리스(Candida utilis)이다.
특정한 실시태양에서, 상기 숙주 미생물은 사카로마이세스 세레비지아에이다. 일부 실시태양에서, 상기 숙주는 베이커 효모, CBS 7959, CBS 7960, CBS 7961, CBS 7962, CBS 7963, CBS 7964, IZ-1904, TA, BG-1, CR-1, SA-1, M-26, Y-904, PE-2, PE-5, VR-1, BR-1, BR-2, ME-2, VR-2, MA-3, MA-4, CAT-1, CB-1, NR-1, BT-1, 및 AL-1로 이루어지는 그룹 중에서 선택된 사카로마이세스 세레비지아에의 균주이다. 일부 실시태양에서, 상기 숙주 미생물은 PE-2, CAT-1, VR-1, BG-1, CR-1, 및 SA-1로 이루어지는 그룹 중에서 선택된 사카로마이세스 세레비지아에의 균주이다. 특정한 실시태양에서, 상기 사카로마이세스 세레비지아에의 균주는 PE-2이다. 특정한 실시태양에서, 상기 사카로마이세스 세레비지아에의 균주는 CAT-1이다. 특정한 실시태양에서, 상기 사카로마이세스 세레비지아에의 균주는 BG-1이다.
일부 실시태양에서, 상기 숙주 미생물은 발효 공업에 적합한 미생물이다. 특정한 실시태양에서, 상기 미생물은 발효 공업 환경에 인식되는 스트레스 조건인 높은 용매 농도, 고온, 확장된 기질 이용, 영양소 제한, 당 및 염으로 인한 삼투압, 산도, 설파이트 및 세균 오염, 또는 이들의 조합하에서 유효하도록 조절된다.
6.5 스테비올 및 스테비올 글리코시드 생합성 경로
일부 실시태양에서, 스테비올 생합성 경로 및/또는 스테비올 글리코시드 생합성 경로는, 세포를 상기 경로의 하나 이상의 효소를 암호화하는 폴리뉴클레오티드 및/또는 폴리펩티드를 발현하도록 조작함으로써 본 명세서에 제공된 유전자 변형된 숙주 세포에서 활성화된다. 도 2A는 예시적인 스테비올 생합성 경로를 예시한다. 도 2B는 스테비올로부터 출발하여 다양한 스테비올 글리코시드로의 예시적인 스테비올 글리코시드 생합성 경로를 예시한다.
따라서, 일부 실시태양에서, 본 명세서에 제공된 유전자 변형된 숙주 세포는 제라닐제라닐 디포스페이트 신타제(GGPPS) 활성을 갖는 폴리펩티드를 암호화하는 이종 폴리뉴클레오티드를 포함한다. 일부 실시태양에서, 본 명세서에 제공된 유전자 변형된 숙주 세포는 코팔릴 디포스페이트 신타제 또는 ent-코팔릴 피로포스페이트 신타제(CDPS; 또한 ent-코팔릴 피로포스페이트 신타제 또는 CPS라 지칭된다) 활성을 갖는 폴리펩티드를 암호화하는 이종 폴리뉴클레오티드를 포함한다. 일부 실시태양에서, 본 명세서에 제공된 유전자 변형된 숙주 세포는 카우렌 신타제(KS; 또한 ent-카우렌 신타제라 지칭된다) 활성을 갖는 폴리펩티드를 암호화하는 이종 폴리뉴클레오티드를 포함한다. 일부 실시태양에서, 본 명세서에 제공된 유전자 변형된 숙주 세포는 카우렌 옥시다제(KO; 또한 ent-카우렌 19-옥시다제라 지칭된다) 활성을 갖는 폴리펩티드를 암호화하는 이종 폴리뉴클레오티드를 포함한다. 일부 실시태양에서, 본 명세서에 제공된 유전자 변형된 숙주 세포는 스테비올 신타제(또한 ent-카우렌산 13-하이드록실라제 또는 KAH라 지칭된다) 활성을 갖는 폴리펩티드를 암호화하는 이종 폴리뉴클레오티드를 포함한다. 일부 실시태양에서, 본 명세서에 제공된 유전자 변형된 숙주 세포는 시토크롬 P450 리덕타제(CPR) 활성을 갖는 폴리펩티드를 암호화하는 이종 폴리뉴클레오티드를 포함한다.
일부 실시태양에서, 본 명세서에 제공된 유전자 변형된 숙주 세포는 UGT74G1 활성을 갖는 폴리펩티드를 암호화하는 이종 폴리뉴클레오티드를 포함한다. 일부 실시태양에서, 본 명세서에 제공된 유전자 변형된 숙주 세포는 UGT76G1 활성을 갖는 폴리펩티드를 암호화하는 이종 폴리뉴클레오티드를 포함한다. 일부 실시태양에서, 본 명세서에 제공된 유전자 변형된 숙주 세포는 UGT85C2 활성을 갖는 폴리펩티드를 암호화하는 이종 폴리뉴클레오티드를 포함한다. 일부 실시태양에서, 본 명세서에 제공된 유전자 변형된 숙주 세포는 UGT91D 활성을 갖는 폴리펩티드를 암호화하는 이종 폴리뉴클레오티드를 포함한다. 일부 실시태양에서, 본 명세서에 제공된 유전자 변형된 숙주 세포는 UGT40087 활성을 갖는 폴리펩티드를 암호화하는 이종 폴리뉴클레오티드를 포함한다.
몇몇 실시태양에서, 상기 숙주 세포는 변체를 포함한다. 몇몇 실시태양에서, 상기 변체는 관련된 폴리펩티드에 비해 15, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 아미노산 치환을 포함할 수 있다. 몇몇 실시태양에서, 상기 변체는 참조 폴리펩티드에 비해 15, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 보존적 아미노산 치환을 포함할 수 있다. 몇몇 실시태양에서, 본 명세서에 기재된 핵산 중 어느 하나를 숙주 세포에 대해 최적화할 수 있다, 예를 들어 코돈 최적화할 수 있다.
스테비올 생합성 경로 및/또는 스테비올 글리코시드 생합성 경로의 예시적인 핵산 및 효소들을 하기에 기재한다.
6.5.1. 제라닐제라닐 디포스페이트 신타제(GGPPS)
제라닐제라닐 디포스페이트 신타제(EC 2.5.1.29)는 파르네실 피로포스페이트의 제라닐제라닐 디포스페이트(또한 제라닐제라닐 피로포스페이트로서 공지됨)로의 전환을 촉매화한다. 효소의 예시적인 예는 스테비아 레바우디아나(Stevia rebaudiana)(수납 번호 ABD92926), 지베렐라 푸지쿠로이(Gibberella fujikuroi)(수납 번호 CAA75568), 무스 무스쿨루스(Mus musculus)(수납 번호 AAH69913), 탈라씨오시라 슈도나나(Thalassiosira pseudonana)(수납 번호 XP_002288339), 스트렙토마이세스 클라불리제루스(Streptomyces clavuligerus)(수납 번호 ZP_05004570), 설풀로부스 아시도칼다리우스(Sulfulobus acidocaldarius)(수납 번호 BAA43200), 시네코코커스 스페시즈(Synechococcus sp.)(수납 번호 ABC98596), 아라비도프시스 탈리아나(Arabidopsis thaliana)(수납 번호 NP_195399), 블라케슬레아 트리스포라(Blakeslea trispora)(수납 번호 AFC92798.1) 및 US 2014/0329281 A1의 효소들을 포함한다. 이들 효소를 암호화하는 핵산은 본 명세서에 제공된 세포 및 방법들에 유용하다. 몇몇 실시태양에서, 본 명세서에서 이들 GGPPS 핵산 중 적어도 하나에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 핵산을 사용하는 세포 및 방법을 제공한다. 몇몇 실시태양에서, 본 명세서에서 이들 GGPPS 효소 중 적어도 하나에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 폴리펩티드를 암호화하는 핵산을 사용하는 세포 및 방법을 제공한다.
6.5.2 코팔릴 디포스페이트 신타제(CDPS)
코팔릴 디포스페이트 신타제(EC 5.5.1.13)는 제라닐제라닐 디포스페이트의 코팔릴 디포스페이트로의 전환을 촉매화한다. 효소의 예시적인 예는 스테비아 레바우디아나(수납 번호 AAB87091), 스트렙토마이세스 클라불리제루스(Streptomyces clavuligerus)(수납 번호 EDY51667), 브라디리조비움 자포니쿰(Bradyrhizobium japonicum)(수납 번호 AAC28895.1), 제아 마이스(Zea mays)(수납 번호 AY562490), 아라비도프시스 탈리아나(수납 번호 NM_116512), 오리자 사티바(Oryza sativa)(수납 번호 Q5MQ85.1) 및 US 2014/0329281 A1의 효소들을 포함한다. 이들 효소를 암호화하는 핵산은 본 명세서에 제공된 세포 및 방법들에 유용하다. 몇몇 실시태양에서, 본 명세서에서 이들 CDPS 핵산 중 적어도 하나에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 핵산을 사용하는 세포 및 방법을 제공한다. 몇몇 실시태양에서, 본 명세서에서 이들 CDPS 효소 중 적어도 하나에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 폴리펩티드를 암호화하는 핵산을 사용하는 세포 및 방법을 제공한다.
6.5.3 카우렌 신타제(KS)
카우렌 신타제(EC 4.2.3.19)는 코팔릴 디포스페이트의 카우렌 및 디포스페이트로의 전환을 촉매화한다. 효소의 예시적인 예는 브라디리조비움 자포니쿰(수납 번호 AAC28895.1), 파에오스파에리아 스페시즈(Phaeosphaeria sp.)(수납 번호 O13284), 아라비도프시스 탈리아나(수납 번호 Q9SAK2), 피세아 글라우카(Picea glauca)(수납 번호 ADB55711.1) 및 US 2014/0329281 A1의 효소들을 포함한다. 이들 효소를 암호화하는 핵산은 본 명세서에 제공된 세포 및 방법들에 유용하다. 몇몇 실시태양에서, 본 명세서에서 이들 KS 핵산 중 적어도 하나에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 핵산을 사용하는 세포 및 방법을 제공한다. 몇몇 실시태양에서, 본 명세서에서 이들 KS 효소 중 적어도 하나에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 폴리펩티드를 암호화하는 핵산을 사용하는 세포 및 방법을 제공한다.
6.5.4 이작용기(bifunctional) 코팔릴 디포스페이트 신타제(CDPS) 및 카우렌 신타제(KS)
CDPS-KS 이작용기 효소(EC 5.5.1.13 및 EC 4.2.3.19)를 또한 사용할 수 있다. 효소의 예시적인 예는 포모프시스 아미그달리(Phomopsis amygdali)(수납 번호 BAG30962), 피스코미트렐라 파텐스(Physcomitrella patens)(수납 번호 BAF61135), 지베렐라 푸지쿠로이(수납 번호 Q9UVY5.1), 및 US 2014/0329281 A1, US 2014/0357588 A1, US 2015/0159188, 및 WO 2016/038095 A2의 효소들을 포함한다. 이들 효소를 암호화하는 핵산은 본 명세서에 제공된 세포 및 방법들에 유용하다. 몇몇 실시태양에서, 본 명세서에서 이들 CDPS-KS 핵산 중 적어도 하나에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 핵산을 사용하는 세포 및 방법을 제공한다. 몇몇 실시태양에서, 본 명세서에서 이들 CDPS-KS 효소 중 적어도 하나에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 폴리펩티드를 암호화하는 핵산을 사용하는 세포 및 방법을 제공한다.
6.5.5 Ent-카우렌 옥시다제(KO)
Ent-카우렌 옥시다제(EC 1.14.13.78; 또한 본 명세서에서 카우렌 옥시다제라 지칭된다)는 카우렌의 카우렌산으로의 전환을 촉매화한다. 효소의 예시적인 예는 오리자 사티바(수납 번호 Q5Z5R4), 지베랄레 푸지쿠로이(수납 번호 O94142), 아라비도프시스 탈리아나(수납 번호 Q93ZB2), 스테비아 레바우디아나(수납 번호 AAQ63464.1), 피숨 사티붐(Pisum sativum)(Uniprot no. Q6XAF4) 및 US 2014/0329281 A1, US 2014/0357588 A1, US 2015/0159188, 및 WO 2016/038095 A2의 효소들을 포함한다. 이들 효소를 암호화하는 핵산은 본 명세서에 제공된 세포 및 방법들에 유용하다. 몇몇 실시태양에서, 본 명세서에서 이들 KO 핵산 중 적어도 하나에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 핵산을 사용하는 세포 및 방법을 제공한다. 몇몇 실시태양에서, 본 명세서에서 이들 KO 효소 중 적어도 하나에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 폴리펩티드를 암호화하는 핵산을 사용하는 세포 및 방법을 제공한다.
6.5.6 스테비올 신타제(KAH)
스테비올 신타제, 또는 카우렌산 하이드록실라제(KAH)(EC 1.14.13)는 카우렌산의 스테비올로의 전환을 촉매화한다. 효소의 예시적인 효소는 스테비아 레바우디아나(수납 번호 ACD93722), 스테비아 레바우디아나(서열번호 10) 아라비도프시스 탈리아나(수납 번호 NP_197872), 비티스 비니페라(Vitis vinifera)(수납 번호 XP_002282091), 메디카고 트룬쿨라타(Medicago trunculata)(수납 번호 ABC59076), 및 US 2014/0329281 A1, US 2014/0357588 A1, US 2015/0159188, 및 WO 2016/038095 A2의 효소들을 포함한다. 이들 효소를 암호화하는 핵산은 본 명세서에 제공된 세포 및 방법들에 유용하다. 몇몇 실시태양에서, 본 명세서에서 이들 KAH 핵산 중 적어도 하나에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 핵산을 사용하는 세포 및 방법을 제공한다. 몇몇 실시태양에서, 본 명세서에서 이들 KAH 효소 중 적어도 하나에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 폴리펩티드를 암호화하는 핵산을 사용하는 세포 및 방법을 제공한다.
6.5.7 시토크롬 P450 리덕타제(CPR)
시토크롬 P450 리덕타제(EC 1.6.2.4)는 상기 KO 및/또는 KAH의 활성을 지원하거나 촉진시킬 수 있다. 효소의 예시적인 예는 스테비아 레바우디아나(수납 번호 ABB88839) 아라비도프시스 탈리아나(수납 번호 NP_194183), 지베렐라 푸지쿠로이(수납 번호 CAE09055), 아르테미시아 안누아(Artemisia annua)(수납 번호 ABC47946.1) 및 US 2014/0329281 A1, US 2014/0357588 A1, US 2015/0159188, 및 WO 2016/038095 A2의 효소들을 포함한다. 이들 효소를 암호화하는 핵산은 본 명세서에 제공된 세포 및 방법들에 유용하다. 몇몇 실시태양에서, 본 명세서에서 이들 CPR 핵산 중 적어도 하나에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 핵산을 사용하는 세포 및 방법을 제공한다. 몇몇 실시태양에서, 본 명세서에서 이들 CPR 효소 중 적어도 하나에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 폴리펩티드를 암호화하는 핵산을 사용하는 세포 및 방법을 제공한다.
6.5.8 UDP 글리코실트랜스퍼라제 74G1(UGT74G1)
UGT74G1은 유리딘 5'-디포스포 글루코실:스테비올 19-COOH 트랜스퍼라제로서 및 유리딘 5'-디포스포 글루코실:스테비올-13-O-글루코시드 19-COOH 트랜스퍼라제로서 기능할 수 있다. 도 2B에 나타낸 바와 같이, UGT74G1은 스테비올을 19-글리코시드로 전환시킬 수 있다. UGT74G1은 또한 스테비올모노시드를 루부소시드로 전환시킬 수 있다. UGT74G1은 또한 스테비올비오시드를 스테비오시드로 전환시킬 수도 있다. 효소의 예시적인 예는 스테비아 레바우디아나의 효소(예를 들어 문헌[Richman et al., 2005, Plant J. 41: 56-67] 및 US 2014/0329281 및 WO 2016/038095 A2 및 수납 번호 AAR06920.1의 효소들)를 포함한다. 이들 효소를 암호화하는 핵산은 본 명세서에 제공된 세포 및 방법들에 유용하다. 몇몇 실시태양에서, 본 명세서에서 이들 UGT74G1 핵산 중 적어도 하나에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 핵산을 사용하는 세포 및 방법을 제공한다. 몇몇 실시태양에서, 본 명세서에서 이들 UGT74G1 효소 중 적어도 하나에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 폴리펩티드를 암호화하는 핵산을 사용하는 세포 및 방법을 제공한다.
6.5.9 UDP 글리코실트랜스퍼라제 76G1(UGT76G1)
UGT76G1은 글루코스 부분을 수용체 분자, 스테비올 1,2 글리코시드의 C-13-O-글루코스의 C-3'로 전달할 수 있다. 따라서, UGT76G1은 유리딘 5'-디포스포 글루코실:스테비올 13-O-1,2 글루코시드 C-3' 글루코실 트랜스퍼라제로서 및 유리딘 5'-디포스포 글루코실:스테비올-19-O-글루코스, 13-O-1,2 비오시드 C-3' 글루코실 트랜스퍼라제로서 기능할 수 있다. 도 2A에 나타낸 바와 같이, UGT76G1은 스테비올비오시드를 RebB로 전환시킬 수 있다. UGT76G1은 또한 스테비오시드를 RebA로 전환시킬 수 있다. UGT76G1은 또한 RebD를 RebM으로 전환시킬 수도 있다. 효소의 예시적인 예는 스테비아 레바우디아나의 효소(예를 들어 문헌[Richman et al., 2005, Plant J. 41: 56-67] 및 US 2014/0329281 A1 및 WO 2016/038095 A2 및 수납 번호 AAR06912.1의 효소들)를 포함한다. 이들 효소를 암호화하는 핵산은 본 명세서에 제공된 세포 및 방법들에 유용하다. 몇몇 실시태양에서, 본 명세서에서 이들 UGT76G1 핵산 중 적어도 하나에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 핵산을 사용하는 세포 및 방법을 제공한다. 몇몇 실시태양에서, 본 명세서에서 이들 UGT76G1 효소 중 적어도 하나에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 폴리펩티드를 암호화하는 핵산을 사용하는 세포 및 방법을 제공한다.
6.5.10. UDP 글리코실트랜스퍼라제 85C2(UGT85C2)
UGT85C2는 유리딘 5'-디포스포 글루코실:스테비올 13-OH 트랜스퍼라제로서 및 유리딘 5'-디포스포 글루코실:스테비올-19-O-글루코스 13-OH 트랜스퍼라제로서 기능할 수 있다. 따라서, 도 2B에 나타낸 바와 같이, UGT85C2는 스테비올을 스테비올모노시드로 전환시킬 수 있고 또한 19-글리코시드를 루부소시드로 전환시킬 수 있다. 효소의 예시적인 예는 스테비아 레바우디아나의 효소(예를 들어 문헌[Richman et al., 2005, Plant J. 41: 56-67] 및 US 2014/0329281 A1 및 WO 2016/038095 A2 및 수납 번호 AAR06916.1의 효소들)를 포함한다. 이들 효소를 암호화하는 핵산은 본 명세서에 제공된 세포 및 방법들에 유용하다. 몇몇 실시태양에서, 본 명세서에서 이들 UGT85C2 핵산 중 적어도 하나에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 핵산을 사용하는 세포 및 방법을 제공한다. 몇몇 실시태양에서, 본 명세서에서 이들 UGT85C2 효소 중 적어도 하나에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 폴리펩티드를 암호화하는 핵산을 사용하는 세포 및 방법을 제공한다.
6.5.11 UDP-글리코실트랜스퍼라제 91D(UGT91D)
UGT91D는 글루코스 부분을 수용체 분자, 스테비올-13-O-글루코스(스테비올모노시드)의 13-O-글루코스의 C-2'로 전달하여 스테비오비오시드를 생성시키는 유리딘 5'-디포스포글루코실:스테비올-13-글루코시드 트랜스퍼라제로서 기능한다. UGT91D는 또한 도 2B에 나타낸 바와 같이 글루코스 부분을 수용체 분자, 루부소시드의 13-O-글루코스의 C-2'로 전달하여 스테비오시드를 제공하는 유리딘 5'-디포스포 글루코실:루부소시드 트랜스퍼라제로서 기능할 수 있다. UGT91D는 또한 도 2B에 나타낸 바와 같이 글루코스 부분을 RebA의 19-O-글루코스의 C-2' 위치로 전달하여 RebD를 생성시킬 수 있다. UGT91D는 또한 UGT91D2, UGT91D2e, 또는 UGT91D-유사3이라 지칭된다. UGT91D 효소의 예시적인 예는 스테비아 레바우디아나의 효소(예를 들어 수납 번호 ACE87855.1, US 2014/0329281 A1, WO 2016/038095 A2, 및 서열번호 7을 갖는 UGT 서열의 효소들)를 포함한다. 이들 효소를 암호화하는 핵산은 본 명세서에 제공된 세포 및 방법들에 유용하다. 몇몇 실시태양에서, 본 명세서에서 이들 UGT91D 핵산 중 적어도 하나에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 핵산을 사용하는 세포 및 방법을 제공한다. 몇몇 실시태양에서, 본 명세서에서 이들 UGT91D 효소 중 적어도 하나에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 폴리펩티드를 암호화하는 핵산을 사용하는 세포 및 방법을 제공한다.
6.5.12 UDP-글리코실트랜스퍼라제 40087(UGT40087)
UGT40087은 도 2B에 나타낸 바와 같이 글루코스 부분을 RebA의 19-O-글루코스의 C-2' 위치로 전달하여 RebD를 생성시킬 수 있다. UGT40087은 또한 글루코스 부분을 스테비오시드의 19-O-글루코스의 C-2' 위치로 전달하여 RebE를 생성시킬 수 있다. UGT40087의 예시적인 예들은 상기 섹션 5.2에 기재되어 있다. 본 명세서에 기재된 임의의 UGT40087 변체를 본 명세서에 기재된 조성물 및 방법에 사용할 수 있다. 이들 효소를 암호화하는 핵산은 본 명세서에 제공된 세포 및 방법들에 유용하다. 몇몇 실시태양에서, 본 명세서에서 이들 UGT40087 효소 중 적어도 하나에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 핵산을 사용하는 세포 및 방법을 제공한다. 몇몇 실시태양에서, 본 명세서에서 이들 UGT40087 효소 중 적어도 하나에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 폴리펩티드를 암호화하는 핵산을 사용하는 세포 및 방법을 제공한다. 몇몇 실시태양에서, 본 명세서에서 본 명세서에 기재된 UGT40087 변체를 암호화하는 핵산을 제공한다.
6.6 MEV 경로 FPP 및/또는 GGPP 생산
일부 실시태양에서, 본 명세서에 제공된 유전자 변형된 숙주 세포는 FPP 및/또는 GGPP의 형성에 유용한, MEV 경로의 하나 이상의 이종 효소를 포함한다. 일부 실시태양에서, 상기 MEV 경로의 하나 이상의 효소는 아세틸-CoA를 말로닐-CoA와 축합시켜 아세토아세틸-CoA를 형성시키는 효소를 포함한다. 일부 실시태양에서, 상기 MEV 경로의 하나 이상의 효소는 아세틸-CoA의 2개 분자를 축합시켜 아세토아세틸-CoA를 형성시키는 효소를 포함한다. 일부 실시태양에서, 상기 MEV 경로의 하나 이상의 효소는 아세토아세틸-CoA를 아세틸-CoA와 축합시켜 HMG-CoA를 형성시키는 효소를 포함한다. 일부 실시태양에서, 상기 MEV 경로의 하나 이상의 효소는 HMG-CoA를 메발로네이트로 전환시키는 효소를 포함한다. 일부 실시태양에서, 상기 MEV 경로의 하나 이상의 효소는 메발로네이트를 메발로네이트 5-포스페이트로 인산화시키는 효소를 포함한다. 일부 실시태양에서, 상기 MEV 경로의 하나 이상의 효소는 메발로네이트 5-포스페이트를 메발로네이트 5-피로포스페이트로 전환시키는 효소를 포함한다. 일부 실시태양에서, 상기 MEV 경로의 하나 이상의 효소는 메발로네이트 5-피로포스페이트를 이소펜테닐 피로포스페이트로 전환시키는 효소를 포함한다.
일부 실시태양에서, 상기 MEV 경로의 하나 이상의 효소는 아세틸-CoA 티올라제, 아세토아세틸-CoA 신시타제, HMG-CoA 신타제, HMG-CoA 리덕타제, 메발로네이트 키나제, 포스포메발로네이트 키나제 및 메발로네이트 피로포스페이트 데카복실라제로 이루어지는 그룹 중에서 선택된다. 일부 실시태양에서, 아세토아세틸-CoA의 형성을 촉매화할 수 있는 MEV 경로의 효소에 관하여, 상기 유전자 변형된 숙주 세포는 아세틸-CoA의 2개 분자를 축합시켜 아세토아세틸-CoA를 형성시키는 효소, 예를 들어 아세틸-CoA 티올라제; 또는 아세틸-CoA를 말로닐-CoA와 축합시켜 아세토아세틸-CoA를 형성시키는 효소, 예를 들어 아세토아세틸-CoA 신타제를 포함한다. 일부 실시태양에서, 상기 유전자 변형된 숙주 세포는 아세틸-CoA의 2개 분자를 축합시켜 아세토아세틸-CoA를 형성시키는 효소, 예를 들어 아세틸-CoA 티올라제; 또는 아세틸-CoA를 말로닐-CoA와 축합시켜 아세토아세틸-CoA를 형성시키는 효소, 예를 들어 아세토아세틸-CoA 신타제를 모두 포함한다.
일부 실시태양에서, 상기 숙주 세포는 상기 MEV 경로의 하나 초과의 효소를 암호화하는 하나 이상의 이종 뉴클레오티드 서열을 포함한다. 일부 실시태양에서, 상기 숙주 세포는 상기 MEV 경로의 2개 효소를 암호화하는 하나 이상의 이종 뉴클레오티드 서열을 포함한다. 일부 실시태양에서, 상기 숙주 세포는 HMG-CoA를 메발로네이트로 전환시킬 수 있는 효소 및 메발로네이트를 메발로네이트 5-포스페이트로 전환시킬 수 있는 효소를 암호화하는 하나 이상의 이종 뉴클레오티드 서열을 포함한다. 일부 실시태양에서, 상기 숙주 세포는 상기 MEV 경로의 3개 효소를 암호화하는 하나 이상의 이종 뉴클레오티드 서열을 포함한다. 일부 실시태양에서, 상기 숙주 세포는 상기 MEV 경로의 4개 효소를 암호화하는 하나 이상의 이종 뉴클레오티드 서열을 포함한다. 일부 실시태양에서, 상기 숙주 세포는 상기 MEV 경로의 5개 효소를 암호화하는 하나 이상의 이종 뉴클레오티드 서열을 포함한다. 일부 실시태양에서, 상기 숙주 세포는 상기 MEV 경로의 6개 효소를 암호화하는 하나 이상의 이종 뉴클레오티드 서열을 포함한다. 일부 실시태양에서, 상기 숙주 세포는 상기 MEV 경로의 7개 효소를 암호화하는 하나 이상의 이종 뉴클레오티드 서열을 포함한다. 일부 실시태양에서, 상기 숙주 세포는 상기 MEV 경로의 효소들을 모두 암호화하는 다수의 이종 핵산을 포함한다.
일부 실시태양에서, 상기 유전자 변형된 숙주 세포는 이소펜테닐 피로포스페이트(IPP)를 디메틸알릴 피로포스페이트(DMAPP)로 전환시킬 수 있는 효소를 암호화하는 이종 핵산을 추가로 포함한다. 일부 실시태양에서, 상기 유전자 변형된 숙주 세포는 IPP 및/또는 DMAPP 분자를 축합시켜 폴리프레닐 화합물을 형성시킬 수 있는 효소를 암호화하는 이종 핵산을 추가로 포함한다. 일부 실시태양에서, 상기 유전자 변형된 숙주 세포는 IPP 또는 폴리프레닐을 변형시켜 이소프레노이드 화합물, 예를 들어 파르네신을 형성시킬 수 있는 효소를 암호화하는 이종 핵산을 추가로 포함한다.
6.6.1 아세틸-CoA의 아세토아세틸-CoA로의 전환
일부 실시태양에서, 상기 유전자 변형된 숙주 세포는 아세틸-조효소 A의 2개 분자를 축합시켜 아세토아세틸-CoA를 형성시킬 수 있는 효소, 예를 들어 아세틸-CoA 티올라제를 암호화하는 이종 뉴클레오티드 서열을 포함한다. 상기와 같은 효소를 암호화하는 뉴클레오티드 서열의 예시적인 예는 비제한적으로 (NC_000913 REGION: 2324131.2325315; 에스케리키아 콜라이), (D49362; 파라코커스 데니트리피칸스(Paracoccus denitrificans)), 및 (L20428; 사카로마이세스 세레비지아에)를 포함한다.
아세틸-CoA 티올라제는 아세토아세틸-CoA를 생성시키는 아세틸-CoA의 2개 분자의 가역적인 축합을 촉매화하지만, 상기 반응은 열역학적으로 불리하며; 아세토아세틸-CoA 티올분해가 아세토아세틸-CoA 합성보다 유리하다. 아세토아세틸-CoA 신타제(AACS)(교대로 아세틸-CoA:말로닐-CoA 아실트랜스퍼라제; EC 2.3.1.194라고도 지칭됨)는 아세틸-CoA를 말로닐-CoA와 축합시켜 아세토아세틸-CoA를 형성시킨다. 아세틸-CoA 티올라제와 대조적으로, AACS-촉매화된 아세토아세틸-CoA 합성은 말로닐-CoA의 관련된 데카복실화로 인해 필수적으로 에너지-유리한 반응이다. 또한, AACS는 아세토아세틸-CoA에 대해 티올분해 활성을 나타내지 않으며, 따라서 상기 반응은 비가역적이다.
아세틸-CoA 티올라제 및 이종 ADA 및/또는 포스포트랜스아세틸라제(PTA)를 포함하는 숙주 세포에서, 아세토아세틸-CoA 티올분해를 촉진하는 아세틸-CoA 티올라제에 의해 촉매화된 가역적인 반응은 큰 아세틸-CoA 풀(pool)을 생성시킬 수 있다. ADA의 가역적인 활성에 비추어, 상기 아세틸-CoA 풀은 차례로 ADA를, 아세틸-CoA를 아세트알데히드로 전환시키는 역반응을 향해 구동시키고, 이에 의해 아세틸-CoA 생산을 향해 ADA에 의해 제공된 이득을 감소시킬 수 있다. 유사하게, PTA의 활성은 가역적이며, 따라서 큰 아세틸-CoA 풀은 PTA를, 아세틸-CoA를 아세틸 포스페이트로 전환시키는 역반응을 향해 구동시킬 수 있다. 따라서, 일부 실시태양에서, ADA 및 PTA의 순방향 반응을 구동시키는 아세틸-CoA에 강한 끌림을 제공하기 위해서, 본 명세서에 제공된 유전자 변형된 숙주 세포의 MEV 경로는 아세토아세틸-CoA 신타제를 사용하여 아세틸-CoA 및 말로닐-CoA로부터 아세토아세틸-CoA를 형성시킨다.
일부 실시태양에서, 상기 AACS는 스트렙토마이세스 스페시즈 균주 CL190으로부터 유래한다(Okamura et al., Proc Natl Acad Sci USA 107(25):11265-70 (2010). 스트렙토마이세스 스페시즈 균주 CL190의 전형적인 AACS 뉴클레오티드 서열은 수납 번호 AB540131.1을 포함한다. 스트렙토마이세스 스페시즈 균주 CL190의 전형적인 AACS 단백질 서열은 수납 번호 D7URV0, BAJ10048을 포함한다. 본 명세서에 제공된 조성물 및 방법에 유용한 다른 아세토아세틸-CoA 신타제는 비제한적으로 스트렙토마이세스 스페시즈(AB183750; KO-3988 BAD86806); 에스 아눌라투스(S. anulatus) 균주 9663(FN178498; CAX48662); 스트렙토마이세스 스페시즈 KO-3988(AB212624; BAE78983); 액티노플라네스 스페시즈(Actinoplanes sp.) A40644(AB113568; BAD07381); 스트렙토마이세스 스페시즈 C(NZ_ACEW010000640; ZP_05511702); 노카르디오프시스 다쏜빌레이(Nocardiopsis dassonvillei) DSM 43111(NZ_ABUI01000023; ZP_04335288); 마이코박테리움 울세란스(Mycobacterium ulcerans) Agy99(NC_008611; YP_907152); 마이코박테리움 마리눔(Mycobacterium marinum) M(NC_010612; YP_001851502); 스트렙토마이세스 스페시즈 Mg1(NZ_DS570501; ZP_05002626); 스트렙토마이세스 스페시즈 AA4(NZ_ACEV01000037; ZP_05478992); 에스 로세오스포루스(S. roseosporus) NRRL 15998(NZ_ABYB01000295; ZP_04696763); 스트렙토마이세스 스페시즈 ACTE(NZ_ADFD01000030; ZP_06275834); 에스 비리도크로모게네스(S. viridochromogenes) DSM 40736(NZ_ACEZ01000031; ZP_05529691); 프랑키아 스페시즈(Frankia sp.) CcI3 (NC_007777; YP_480101); 노카르디아 브라실리엔시스(Nocardia brasiliensis)(NC_018681; YP_006812440.1); 및 아우스트윅키아 켈로나에(Austwickia chelonae)(NZ_BAGZ01000005; ZP_10950493.1)를 포함한다. 추가적인 적합한 아세토아세틸-CoA 신타제는 미국특허 출원 공보 제 2010/0285549 호 및 제 2011/0281315 호에 기재된 것들을 포함하며, 이들의 내용은 전체가 참고로 인용된다.
본 명세서에 제공된 조성물 및 방법에 또한 유용한 아세토아세틸-CoA 신타제는 본 명세서에 기재된 아세토아세틸-CoA 신타제 중 어느 하나의 "유도체"라고 하는 분자들을 포함한다. 상기와 같은 "유도체"는 하기의 특징들을 갖는다: (1) 상기는 본 명세서에 기재된 아세토아세틸-CoA 신타제 중 어느 하나와 상당한 상동성을 공유하고; (2) 상기는 아세틸-CoA와 말로닐-CoA와의 비가역적인 축합을 촉매화하여 아세토아세틸-CoA를 형성시킬 수 있다. 아세토아세틸-CoA 신타제의 유도체는 상기 유도체의 아미노산 서열이 아세토아세틸-CoA 신타제의 서열과 적어도 80%, 및 보다 바람직하게 적어도 90%, 및 가장 바람직하게 적어도 95% 동일한 경우 아세토아세틸-CoA 신타제와 "상당한 상동성"을 공유한다고 한다.
6.6.2 아세토아세틸-CoA의 HMG-CoA로의 전환
일부 실시태양에서, 상기 숙주 세포는 아세토아세틸-CoA를 아세틸-CoA의 또 다른 분자와 축합시켜 3-하이드록시-3-메틸글루타릴-CoA(HMG-CoA)를 형성시킬 수 있는 효소, 예를 들어 HMG-CoA 신타제를 암호화하는 이종 뉴클레오티드 서열을 포함한다. 상기와 같은 효소를 암호화하는 뉴클레오티드 서열의 예시적인 예는 비제한적으로 (NC_001145. 보체 19061.20536; 사카로마이세스 세레비지아에), (X96617; 사카로마이세스 세레비지아에), (X83882; 아라비도프시스 탈리아나), (AB037907; 키타사토스포라 그리세올라(Kitasatospora griseola)), (BT007302; 호모 사피엔스(Homo sapiens)), 및 (NC_002758, 유전자좌 태그 SAV2546, 유전자ID 1122571; 스타필로코커스 아우레우스(Staphylococcus aureus))를 포함한다.
6.6.3 HMG-CoA의 메발로네이트로의 전환
일부 실시태양에서, 상기 숙주 세포는 HMG-CoA를 메발로네이트로 전환시킬 수 있는 효소, 예를 들어 HMG-CoA 리덕타제를 암호화하는 이종 뉴클레오티드 서열을 포함한다. 일부 실시태양에서, HMG-CoA 리덕타제는 NADH-사용 하이드록시메틸글루타릴-CoA 리덕타제-CoA 리덕타제이다. HMG-CoA 리덕타제(EC 1.1.1.34; EC 1.1.1.88)는 (S)-HMG-CoA의 (R)-메발로네이트로의 환원적 데아실화를 촉매화하며 2개의 부류, I 부류 및 II 부류 HMG로 분류될 수 있다. I 부류는 진핵생물 및 대부분의 고세균으로부터의 효소를 포함하고, II 부류는 몇몇 원핵생물 및 고세균의 HMG-CoA 리덕타제를 포함한다. 상기 서열의 차이 외에, 상기 두 부류의 효소들은 또한 그들의 보조인자 특이성에 관하여 상이하다. NADPH를 독점적으로 사용하는 I 부류 효소와 달리, II 부류 HMG-CoA 리덕타제는 NADPH와 NADH를 식별하는 능력이 서로 다르다. 예를 들어 문헌[Hedl et al., Journal of Bacteriology 186 (7): 1927-1932 (2004)]을 참조하시오. II 부류 HMG-CoA 리덕타제 선택에 대한 보조인자 특이성을 하기에 제공한다.
[표 1]
본 명세서에 제공된 조성물 및 방법에 유용한 HMG-CoA 리덕타제는 보조인자로서 NADH를 사용할 수 있는 HMG-CoA 리덕타제, 예를 들어 피 메발로니이, 에이 풀기두스 또는 에스 아우레우스로부터의 HMG-CoA 리덕타제를 포함한다. 특정한 실시태양에서, 상기 HMG-CoA 리덕타제, 예를 들어 피 메발로니이, 에스 포메로이(S. pomeroyi) 또는 디 아시도보란스(D. acidovorans)로부터의 HMG-CoA 리덕타제는 보조인자로서 오직 NADH만을 사용할 수 있다.
일부 실시태양에서, 상기 NADH-사용 HMG-CoA 리덕타제는 슈도모나스 메발로니이로부터 유래된다. 슈도모나스 메발로니이의 야생형 mvaA 유전자(HMG-CoA 리덕타제(EC 1.1.1.88)를 암호화한다)의 서열은 앞서 기재되었다. 문헌[Beach and Rodwell, J. Bacteriol. 171:2994-3001 (1989)]을 참조하시오. 슈도모나스 메발로니이의 전형적인 mvaA 뉴클레오티드 서열은 수납 번호 M24015를 포함한다. 슈도모나스 메발로니이의 전형적인 HMG-CoA 리덕타제 단백질 서열은 수납 번호 AAA25837, P13702, MVAA_PSEMV를 포함한다.
일부 실시태양에서, 상기 NADH-사용 MHG-CoA 리덕타제는 실리시박터 포메로이(Silicibacter pomeroyi)로부터 유래된다. 실리시박터 포메로이의 전형적인 HMG-CoA 리덕타제 뉴클레오티드 서열은 수납 번호 NC_006569.1을 포함한다. 실리시박터 포메로이의 전형적인 HMG-CoA 리덕타제 단백질 서열은 수납 번호 YP_164994를 포함한다.
일부 실시태양에서, 상기 NADH-사용 HMG-CoA 리덕타제는 델프티아 아시도보란스(Delftia acidovorans)로부터 유래된다. 델프티아 아시도보란스의 전형적인 HMG-CoA 리덕타제 뉴클레오티드 서열은 NC_010002 REGION: 보체(319980..321269)를 포함한다. 델프티아 아시도보란스의 전형적인 HMG-CoA 리덕타제 단백질 서열은 수납 번호 YP_001561318을 포함한다.
일부 실시태양에서, 상기 NADH-사용 HMG-CoA 리덕타제는 솔라눔 투베로숨(Solanum tuberosum)으로부터 유래된다(Crane et al., J. Plant Physiol. 159:1301-1307(2002)).
본 명세서에 제공된 조성물 및 방법에 또한 유용한 NADH-사용 HMG-CoA 리덕타제는 예를 들어 피 메발로니이, 에스 포메로이 및 디 아시도보란스로부터의, 본 명세서에 기재된 NADH-사용 HMG-CoA 리덕타제 중 어느 하나의 "유도체"라고 하는 분자들을 포함한다. 상기와 같은 "유도체"는 하기의 특징들을 갖는다: (1) 상기는 본 명세서에 기재된 NADH-사용 HMG-COA 리덕타제 중 어느 하나와 상당한 상동성을 공유하고; (2) 상기는 보조인자로서 NADH를 우선적으로 사용하면서 (S)-HMG-CoA의 (R)-메발로네이트로의 환원적 데아실화를 촉매화할 수 있다. NADH-사용 HMG-CoA 리덕타제의 유도체는 상기 유도체의 아미노산 서열이 NADH-사용 HMG-CoA 리덕타제의 서열과 적어도 80%, 및 보다 바람직하게 적어도 90%, 및 가장 바람직하게 적어도 95% 동일한 경우 NADH-사용 HMG-CoA 리덕타제와 "상당한 상동성"을 공유한다고 한다.
본 명세서에 사용되는 바와 같이, "NADH-사용"이란 어구는 상기 NADH-사용 HMG-CoA 리덕타제가, 예를 들어 NADPH의 경우보다 NADH에 대해 더 높은 비활성을 나타냄으로써, 보조인자로서 NADPH보다 NADH에 대해 선택성임을 의미한다. 일부 실시태양에서, 보조인자로서 NADH에 대한 선택성을 k cat (NADH)/k cat (NADPH) 비로서 나타낸다. 일부 실시태양에서, 상기 NADH-사용 HMG-CoA 리덕타제는 적어도 5, 10, 15, 20, 25 또는 25 초과의 k cat (NADH)/k cat (NADPH) 비를 갖는다. 일부 실시태양에서, 상기 NADH-사용 HMG-CoA 리덕타제는 NADH를 독점적으로 사용한다. 예를 들어, NADH를 독점적으로 사용하는 NADH-사용 HMG-CoA 리덕타제는 시험관내에서 유일한 보조인자로서 공급되는 NADH와 약간의 활성을 나타며, NADPH가 유일한 보조인자로서 공급되는 경우에는 검출 가능한 활성을 나타내지 않는다. 당해 분야에 공지된 보조인자 특이성의 임의의 측정 방법, 예를 들어 문헌[Kim et al., Protein Science 9:1226-1234 (2000)]; 및 문헌[Wilding et al., J. Bacteriol. 182(18):5147-52 (2000)](이들의 내용은 전체가 참고로 인용된다)에 기재된 방법들을 사용하여 보조인자로서 NADH를 선호하는 HMG-CoA 리덕타제를 식별할 수 있다.
일부 실시태양에서, 상기 NADH-사용 HMG-CoA 리덕타제를, 예를 들어 보조인자-결합 포켓의 부위-지향된 돌연변이유발을 통해 NAPDH보다 NADH에 대해 선택성이도록 조작한다. NADH-선택성 조작 방법은 문헌[Watanabe et al., Microbiology 153:3044-3054 (2007)]에 기재되어 있고, HMG-CoA 리덕타제의 보조인자 선택성 측정 방법은 문헌[Kim et al., Protein Sci. 9:1226-1234 (2000)](이들의 내용은 전체가 본 명세서에 참고로 인용된다)에 기재되어 있다.
일부 실시태양에서, 상기 NADH-사용 HMG-CoA 리덕타제는 메발로네이트 분해 경로를 고유로 포함하는 숙주 종들, 예를 들어 유일한 탄소원으로서 메발로네이트를 이화하는 숙주 종들로부터 유래된다. 이들 실시태양 내에서, 상기 NADH-사용 HMG-CoA 리덕타제(상기는 그의 고유 숙주 세포내에서 내면화된 (R)-메발로네이트의 (S)-HMG-CoA로의 산화적 아실화를 통상적으로 촉매화한다)를 사용하여 유전자 변형된 숙주 세포에서 메발로네이트 생합성 경로를 포함하는 상기 역 반응, 즉 (S)-HMG-CoA의 (R)-메발로네이트로의 환원적 데아실화를 촉매화한다. 유일한 탄소원으로서 메발로네이트상에서 생육할 수 있는 원핵생물들이 하기 문헌들에 기재되었다: Anderson et al., J. Bacteriol, 171(12):6468-6472 (1989); Beach et al., J. Bacteriol. 171:2994-3001 (1989); Bensch et al., J. Biol. Chem. 245:3755-3762; Fimongnari et al., Biochemistry 4:2086-2090 (1965); Siddiqi et al., Biochem. Biophys. Res. Commun. 8:110-113 (1962); Siddiqi et al., J. Bacteriol. 93:207-214 (1967); 및 Takatsuji et al., Biochem. Biophys. Res. Commun.110:187-193 (1983)(이들 문헌의 내용은 전체가 본 명세서에 참고로 인용된다).
본 명세서에 제공된 조성물 및 방법의 일부 실시태양에서, 상기 숙주 세포는 NADH-사용 HMGr 및 NADPH-사용 HMG-CoA 리덕타제를 모두 포함한다. NADPH-사용 HMG-CoA 리덕타제를 암호화하는 뉴클레오티드 서열의 예시적인 예는 비제한적으로 (NM_206548; 드로소필라 멜라노가스테르(Drosophila melanogaster)), (NC_002758, 유전자좌 태그 SAV2545, 유전자ID 1122570; 스타필로코커스 아우레우스(Staphylococcus aureus)), (AB015627; 스트렙토마이세스 스페시즈 KO 3988), (AX128213, 절두된 HMG-CoA 리덕타제를 암호화하는 서열을 제공한다; 사카로마이세스 세레비지아에), 및 (NC_001145: 보체(115734.118898; 사카로마이세스 세레비지아에)를 포함한다.
6.6.4 메발로네이트의 메발로네이트-5-포스페이트로의 전환
일부 실시태양에서, 상기 숙주 세포는 메발로네이트를 메발로네이트 5-포스페이트로 전환시킬 수 있는 효소, 예를 들어 메발로네이트 키나제를 암호화하는 이종 뉴클레오티드 서열을 포함한다. 상기와 같은 효소를 암호화하는 뉴클레오티드 서열의 예시적인 예는 비제한적으로 (L77688; 아라비도프시스 탈리아나) 및 (X55875; 사카로마이세스 세레비지아에)를 포함한다.
6.6.5 메발로네이트-5-포스페이트의 메발로네이트-5-피로포스페이트로의 전환
일부 실시태양에서, 상기 숙주 세포는 메발로네이트 5-포스페이트를 메발로네이트 5-피로포스페이트로 전환시킬 수 있는 효소, 예를 들어 포스포메발로네이트 키나제를 암호화하는 이종 뉴클레오티드 서열을 포함한다. 상기와 같은 효소를 암호화하는 뉴클레오티드 서열의 예시적인 예는 비제한적으로 (AF429385; 헤베아 브라실리엔시스(Hevea brasiliensis), (NM_006556; 호모 사피엔스), 및 (NC_001145. 보체 712315.713670; 사카로마이세스 세레비지아에)를 포함한다.
6.6.6 메발로네이트-5-피로포스페이트의 IPP로의 전환
일부 실시태양에서, 상기 숙주 세포는 메발로네이트-5-피로포스페이트를 이소펜테닐 디포스페이트(IPP)로 전환시킬 수 있는 효소, 예를 들어 메발로네이트 피로포스페이트 데카복실라제를 암호화하는 이종 뉴클레오티드 서열을 포함한다. 상기와 같은 효소를 암호화하는 뉴클레오티드 서열의 예시적인 예는 비제한적으로 (X97557; 사카로마이세스 세레비지아에), (AF290095; 엔테로코커스 파에시움), 및 (U49260; 호모 사피엔스)를 포함한다.
6.6.7 IPP의 DMAPP로의 전환
일부 실시태양에서, 상기 숙주 세포는 MEV 경로를 통해 생성된 IPP를 디메틸알릴 피로포스페이트(DMAPP)로 전환시킬 수 있는 효소, 예를 들어 IPP 이소머라제를 암호화하는 이종 뉴클레오티드 서열을 추가로 포함한다. 상기와 같은 효소를 암호화하는 뉴클레오티드 서열의 예시적인 예는 비제한적으로 (NC_000913, 3031087.3031635; 에스케리키아 콜라이), 및 (AF082326; 하에마토코커스 플루비알리스(Haematococcus pluvialis))를 포함한다.
6.6.8 폴리프레닐 신타제
일부 실시태양에서, 상기 숙주 세포는 IPP 및/또는 DMAPP 분자를 축합시켜 5개 초과의 탄소를 함유하는 폴리프레닐 화합물을 형성시킬 수 있는 폴리프레닐 신타제를 암호화하는 이종 뉴클레오티드 서열을 추가로 포함한다.
일부 실시태양에서, 상기 숙주 세포는 한 분자의 IPP와 한 분자의 DMAPP를 축합시켜 한 분자의 제라닐 피로포스페이트("GPP")를 형성시킬 수 있는 효소, 예를 들어 GPP 신타제를 암호화하는 이종 뉴클레오티드 서열을 포함한다. 상기와 같은 효소를 암호화하는 뉴클레오티드 서열의 예시적인 예는 비제한적으로 하기를 포함한다: (AF513111; 아비에스 그란디스(Abies grandis)), (AF513112; 아비에스 그란디스), (AF513113; 아비에스 그란디스), (AY534686; 안티리눔 마주스(Antirrhinum majus)), (AY534687; 안티리눔 마주스), (Y17376; 아라비도프시스 탈리아나), (AE016877, 유전자좌 AP11092; 바실러스 세레우스(Bacillus cereus); ATCC 14579), (AJ243739; 시트루스 시넨시스(Citrus sinensis)), (AY534745; 클라르키아 브레웨리(Clarkia breweri)), (AY953508; 입스 피니(Ips pini)), (DQ286930; 라이코페르시콘 에스쿨렌툼(Lycopersicon esculentum)), (AF182828; 멘타 엑스 피페리타(Mentha x piperita)), (AF182827; 멘타 엑스 피페리타), (MPI249453; 멘타 엑스 피페리타), (PZE431697, 유전자좌 CAD24425; 파라코커스 제아잔티니파시엔스(Paracoccus zeaxanthinifaciens)), (AY866498; 피크로리자 쿠루아(Picrorhiza kurrooa)), (AY351862; 비티스 비니페라(Vitis vinifera)), 및 (AF203881, 유전자좌 AAF12843; 지모모나스 모빌리스(Zymomonas mobilis)).
일부 실시태양에서, 상기 숙주 세포는 2 분자의 IPP를 한 분자의 DMAPP와 축합시키거나 또는 한 분자의 IPP를 한 분자의 GPP에 가하여 한 분자의 파르네실 피로포스페이트("FPP")를 형성시킬 수 있는 효소, 예를 들어 FPP 신타제를 암호화하는 이종 뉴클레오티드 서열을 포함한다. 상기와 같은 효소를 암호화하는 뉴클레오티드 서열의 예시적인 예는 비제한적으로 (ATU80605; 아라비도프시스 탈리아나), (ATHFPS2R; 아라비도프시스 탈리아나), (AAU36376; 아르테미시아 안누아(Artemisia annua)), (AF461050; 보스 타우루스(Bos taurus)), (D00694; 에스케리키아 콜라이 K-12), (AE009951, 유전자좌 AAL95523; 푸소박테리움 누클레아툼 서브스페시즈 누클레아툼(Fusobacterium nucleatum subsp. nucleatum) ATCC 25586), (GFFPPSGEN; 지베렐라 푸지쿠로이), (CP000009, 유전자좌 AAW60034; 글루코노박터 옥시단스(Gluconobacter oxydans) 621H), (AF019892; 헬리안투스 안누스(Helianthus annuus)), (HUMFAPS; 호모 사피엔스), (KLPFPSQCR; 클루이베로마이세스 락티스), (LAU15777; 루피누스 알부스(Lupinus albus)), (LAU20771; 루피누스 알부스), (AF309508; 무스 무스쿨루스), (NCFPPSGEN; 뉴로스포라 크라싸(Neurospora crassa)), (PAFPS1; 파르테니움 아르젠타툼(Parthenium argentatum)), (PAFPS2; 파르테니움 아르젠타움), (RATFAPS; 라투스 노르베기쿠스(Rattus norvegicus)), (YSCFPP; 사카로마이세스 세레비지아에), (D89104; 스키조사카로마이세스 폼베(Schizosaccharomyces pombe)), (CP000003, 유전자좌 AAT87386; 스트렙토코커스 피오게네스), (CP000017, Locus AAZ51849; 스트렙토코커스 피오게네스), (NC_008022, 유전자좌 YP_598856; 스트렙토코커스 피오게네스 MGAS10270), (NC_008023, 유전자좌 YP_600845; 스트렙토코커스 피오게네스 MGAS2096), (NC_008024, 유전자좌 YP_602832; 스트렙토코커스 피오게네스 MGAS10750), (MZEFPS; 제아 마이스), (AE000657, 유전자좌 AAC06913; 아퀴펙스 아에올리쿠스(Aquifex aeolicus) VF5), (NM_202836; 아라비도프시스 탈리아나), (D84432, 유전자좌 BAA12575; 바실러스 서브틸리스(Bacillus subtilis)), (U12678, 유전자좌 AAC28894; 브래디리조비움 자포니쿰(Bradyrhizobium japonicum) USDA 110), (BACFDPS; 제오바실러스 스테아로써모필루스(Geobacillus stearothermophilus)), (NC_002940, 유전자좌 NP_873754; 하에모필루스 듀크레이(Haemophilus ducreyi) 35000HP), (L42023, 유전자좌 AAC23087; 하에모필루스 인플루엔자에(Haemophilus influenzae) Rd KW20), (J05262; 호모 사피엔스), (YP_395294; 락토바실러스 사케이 서브스페시즈 사케이(Lactobacillus sakei subsp. sakei) 23K), (NC_005823, 유전자좌 YP_000273; 렙토스피라 인테로간스 혈청형 코펜하게니 균주 피오크루즈(Leptospira interrogans serovar Copenhageni str. Fiocruz) L1-130), (AB003187; 미크로코커스 루테우스(Micrococcus luteus)), (NC_002946, 유전자좌 YP_208768; 네이쎄리아 고노로에아에(Neisseria gonorrhoeae) FA 1090), (U00090, 유전자좌 AAB91752; 리조비움 스페시즈(Rhizobium sp.) NGR234), (J05091; 사카로마이세스 세레비지아에), (CP000031, 유전자좌 AAV93568; 실리시박터 포메로이 DSS-3), (AE008481, 유전자좌 AAK99890; 스트렙토코커스 뉴모니아에(Streptococcus pneumoniae) R6), 및 (NC_004556, 유전자좌 NP 779706; 자일렐라 파스티디오사 테메쿨라1(Xylella fastidiosa Temecula1))을 포함한다.
일부 실시태양에서, 상기 숙주 세포는 IPP 및 DMAPP 또는 IPP 및 FPP를 조합하여 제라닐제라닐 피로포스페이트("GGPP")를 형성시킬 수 있는 효소를 암호화하는 이종 뉴클레오티드 서열을 추가로 포함한다. 상기와 같은 효소를 암호화하는 뉴클레오티드 서열의 예시적인 예는 비제한적으로 하기를 포함한다: (ATHGERPYRS; 아라비도프시스 탈리아나), (BT005328; 아라비도프시스 탈리아나), (NM_119845; 아라비도프시스 탈리아나), (NZ_AAJM01000380, 유전자좌 ZP_00743052; 바실러스 튜린지엔시스 혈청형 이스라엘렌시스(Bacillus thuringiensis serovar israelensis), ATCC 35646 sq1563), (CRGGPPS; 카타란투스 로제우스(Catharanthus roseus)), (NZ_AABF02000074, 유전자좌 ZP_00144509; 푸소박테리움 누클레아툼 서브스페시즈 빈센티이(Fusobacterium nucleatum subsp. vincentii), ATCC 49256), (GFGGPPSGN; 지베렐라 푸지쿠로이), (AY371321; 징코 빌로바(Ginkgo biloba)), (AB055496; 헤베아 브라실리엔시스), (AB017971; 호모 사피엔스), (MCI276129; 뮤코르 시르시넬로이데스 에프 루시타니쿠스(Mucor circinelloides f. lusitanicus)), (AB016044; 무스 무스쿨루스(Mus musculus)), (AABX01000298, 유전자좌 NCU01427; 뉴로스포라 크라싸), (NCU20940; 뉴로스포라 크라싸), (NZ_AAKL01000008, 유전자좌 ZP_00943566; 랄스토니아 솔라나세아룸(Ralstonia solanacearum) UW551), (AB118238; 라투스 노르베기쿠스(Rattus norvegicus)), (SCU31632; 사카로마이세스 세레비지아에), (AB016095; 시네코코커스 신장물), (SAGGPS; 시나피스 알바(Sinapis alba)), (SSOGDS; 설포로부스 아시도칼다리우스), (NC_007759, 유전자좌 YP_461832; 신트로푸스 아시디트로피쿠스(Syntrophus aciditrophicus) SB), (NC_006840, 유전자좌 YP_204095; 비브리오 피스케리(Vibrio fischeri) ES114), (NM_112315; 아라비도프시스 탈리아나), (ERWCRTE; 판토에아 아글로메란스(Pantoea agglomerans)), (D90087, 유전자좌 BAA14124; 판토에아 아나나티스(Pantoea ananatis)), (X52291, 유전자좌 CAA36538; 로도박터 캅술라투스(Rhodobacter capsulatus)), (AF195122, 유전자좌 AAF24294; 로도박터 스파에로이데스(Rhodobacter sphaeroides)), 및 (NC_004350, 유전자좌 NP_721015; 스트렙토코커스 뮤탄스(Streptococcus mutans)UA159).
상기 메발로네이트 경로의 효소들의 예를 상기에 기재하지만, 몇몇 실시태양에서 상기 DXP 경로의 효소들을 대안의 또는 추가적인 경로로서 사용하여 본 명세서에 기재된 숙주 세포, 조성물 및 방법에서 DMAPP 및 IPP를 생성시킬 수 있다. 상기 DXP 경로의 효소들을 암호화하는 효소 및 핵산들은 당해 분야에 주지되어 있고 특성화되어 있다. WO 2012/135591 A2.
6.7 스테비올 글리코시드의 생산 방법
또 다른 태양에서, 본 명세서는 본 명세서에 기재된 임의의 UDP-글리코실트랜스퍼라제(예를 들어 UGT40087 또는 임의의 변형 UGT40087)를 사용하여 하나의 스테비올 글리코시드를 또 다른 스테비올 글리코시드로 전환시킴으로서 스테비올 글리코시드를 생산하는 방법을 제공한다. 몇몇 실시태양에서, 본 명세서는 RebA를 RebD로 전환시킬 수 있는, 본 명세서에 기재된 UDP-글리코실트랜스퍼라제 중 어느 하나를 사용하여 RebA를 RebD로 전환시킴을 포함하는 RebD의 생산 방법을 제공한다. 몇몇 실시태양에서, 본 명세서는 RebA를 RebD로 전환시킬 수 있는, 본 명세서에 기재된 UDP-글리코실트랜스퍼라제 중 어느 하나를 사용하여 RebA를 RebD로 전환시킴; 및 RebD를 RebM으로 전환시킬 수 있는 UDP-글리코실트랜스퍼라제를 사용하여 RebD를 RebM으로 전환시킴을 포함하는 RebM의 생산 방법을 제공한다.
몇몇 실시태양에서, 스테비올 글리코시드(예를 들어 RebA 또는 RebD) 또는 스테비올 글리코시드를 포함하는 조성물을 적합한 조건하에서 본 명세서에 기재된 UDP-글리코실트랜스퍼라제 중 어느 하나 및 UDP-당과 접촉시켜 목적하는 스테비올 글리코시드(예를 들어 RebM)를 생산할 수 있다. 상기와 같은 방법을 생체내에서 또는 시험관내에서 수행할 수 있다. 예시적인 UDP-당은 UDP-글리코스, UDP-자일로스 또는 UDP-람노스를 포함한다.
또 다른 태양에서, 본 명세서는 스테비올 글리코시드의 생산 방법을 제공하며, 상기 방법은 (a) 스테비올 글리코시드 화합물 생성에 적합한 조건하에서 탄소원을 갖는 배지 중에서 스테비올 글리코시드를 생산할 수 있는 본 명세서에 기재된 유전자 변형된 숙주 세포 중 어느 하나의 집단을 배양하고; (b) 상기 배지로부터 상기 스테비올 글리코시드 화합물을 회수하는 단계를 포함한다.
일부 실시태양에서, 상기 유전자 변형된 숙주 세포는 하나 이상의 변형을 포함하지 않는 모 세포, 또는 유전자 변형된 숙주 세포의 하나 이상의 변형의 단지 부분집합만을 포함하지만 달리 유전학적으로는 동일한 모 세포에 비해 증가량의 스테비올 글리코시드를 생산한다. 일부 실시태양에서, 상기 증가량은 예를 들어 수율, 생산, 생산성, 세포 배양물의 리터당 그램, 건조 세포 중량의 그램당 밀리그램으로, 세포 배양물 기준 단위 부피에 따라, 단위 건조 세포 중량 기준에 따라, 단위 시간 기준 세포 배양물의 단위 부피에 따라, 또는 단위 시간 기준 단위 건조 세포 중량에 따라 측정시, 적어도 1%, 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 100% 또는 100% 초과이다.
일부 실시태양에서, 상기 숙주 세포는 발효 배지 리터당 약 10 그램 초과의 상승된 수준의 스테비올 글리코시드를 생산한다. 일부 상기와 같은 실시태양에서, 상기 스테비올 글리코시드는 세포 배양물 리터당 약 10 내지 약 50 그램, 세포 배양물 리터당 약 15 그램 초과, 세포 배양물 리터당 약 20 그램 초과, 세포 배양물 리터당 약 25 그램 초과, 세포 배양물 리터당 약 30 그램 초과, 세포 배양물 리터당 약 35 그램 초과, 세포 배양물 리터당 약 40 그램 초과, 세포 배양물 리터당 약 45 그램 초과, 또는 세포 배양물 리터당 약 50 그램 초과의 양으로 생산된다.
일부 실시태양에서, 상기 숙주 세포는 건조 세포 중량 그램당 약 50 밀리그램 초과의 상승된 수준의 스테비올 글리코시드를 생산한다. 일부 상기와 같은 실시태양에서, 상기 스테비올 글리코시드는 건조 세포 중량 그램당 약 50 내지 약 1500 밀리그램, 약 100 밀리그램 초과, 약 150 밀리그램 초과, 약 200 밀리그램 초과, 약 250 밀리그램 초과, 약 500 밀리그램 초과, 약 750 밀리그램 초과, 또는 약 1000 밀리그램 초과의 양으로 생산된다.
일부 실시태양에서, 상기 숙주 세포는 세포 배양 기준 단위 부피에 따라, 모 세포에 의해 생산된 스테비올 글리코시드의 수준의 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 5배, 적어도 약 10배, 적어도 약 20배, 적어도 약 30배, 적어도 약 40배, 적어도 약 50배, 적어도 약 75배, 적어도 약 100배, 적어도 약 200배, 적어도 약 300배, 적어도 약 400배, 적어도 약 500배, 또는 적어도 약 1,000배 초과, 또는 그 이상의 상승된 수준의 스테비올 글리코시드를 생산한다.
일부 실시태양에서, 상기 숙주 세포는 단위 건조 세포 중량 기준에 따라, 모 세포에 의해 생산된 스테비올 글리코시드의 수준의 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 5배, 적어도 약 10배, 적어도 약 20배, 적어도 약 30배, 적어도 약 40배, 적어도 약 50배, 적어도 약 75배, 적어도 약 100배, 적어도 약 200배, 적어도 약 300배, 적어도 약 400배, 적어도 약 500배, 또는 적어도 약 1,000배 초과 또는 그 이상의 상승된 수준의 스테비올 글리코시드를 생산한다.
일부 실시태양에서, 상기 숙주 세포는 단위 시간 기준당 세포 배양물의 단위 부피에 따라, 모 세포에 의해 생산된 스테비올 글리코시드의 수준의 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 5배, 적어도 약 10배, 적어도 약 20배, 적어도 약 30배, 적어도 약 40배, 적어도 약 50배, 적어도 약 75배, 적어도 약 100배, 적어도 약 200배, 적어도 약 300배, 적어도 약 400배, 적어도 약 500배, 또는 적어도 약 1,000배 초과, 또는 그 이상의 상승된 수준의 스테비올 글리코시드를 생산한다.
일부 실시태양에서, 상기 숙주 세포는 단위 시간 기준당 단위 건조 세포 중량에 따라, 모 세포에 의해 생산된 스테비올 글리코시드의 수준의 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 5배, 적어도 약 10배, 적어도 약 20배, 적어도 약 30배, 적어도 약 40배, 적어도 약 50배, 적어도 약 75배, 적어도 약 100배, 적어도 약 200배, 적어도 약 300배, 적어도 약 400배, 적어도 약 500배, 또는 적어도 약 1,000배 초과, 또는 그 이상의 상승된 수준의 스테비올 글리코시드를 생산한다.
대부분의 실시태양에서, 상기 숙주 세포에 의한 상승된 수준의 스테비올 글리코시드의 생산은 억압(repressing) 화합물에 의해 조절된다. 상기와 같은 숙주 세포는 상기 억압 화합물의 존재하에서 용이하게 조작될 수 있다. 이어서 상기 억압 화합물을 제거하여 상기 숙주 세포에 의한 상승된 수준의 스테비올 글리코시드의 생산을 유도한다. 다른 실시태양에서, 상기 숙주 세포에 의한 상승된 수준의 스테비올 글리코시드의 생산은 배양 조건, 예를 들어 생육 온도, 배지 구성성분 등의 변화에 의해 유도될 수 있다.
6.8 배양 배지 및 조건
미생물 배양물의 유지 및 생육을 위한 물질 및 방법은 미생물학 또는 발효과학 분야의 숙련가들에게 주지되어 있다(예를 들어 문헌[Bailey et al., Biochemical Engineering Fundamentals, second edition, McGraw Hill, New York, 1986]을 참조하시오). 상기 숙주 세포, 발효 및 공정의 특정한 요건에 따라, 적합한 배양 배지, pH, 온도, 및 호기성, 미세호기성, 또는 혐기성 조건에 대한 요구를 고려해야 한다.
본 명세서에 제공된 스테비올 글리코시드의 생산 방법을 적합한 용기, 예를 들어 비제한적으로 세포 배양 플레이트, 플라스크 또는 발효기에서 적합한 배양 배지(예를 들어 판토테네이트 보충이 있거나 없는)에서 수행할 수 있다. 더욱이, 상기 방법들을 미생물 제품의 산업적인 생산을 지지하는 것으로 당해 분야에 공지된 임의의 발효 규모로 수행할 수 있다. 교반식 탱크 발효기, 에어리프트 발효기, 버블 발효기, 또는 이들의 임의의 조합을 포함하는 임의의 적합한 발효기를 사용할 수 있다. 숙주 세포로서 사카로마이세스 세레비지아에를 사용하는 특정한 실시태양에서, 균주를 문헌[Kosaric, et al, in Ullmann's Encyclopedia of Industrial Chemistry, Sixth Edition, Volume 12, pages 398-473, Wiley-VCH Verlag GmbH & Co. KDaA, Weinheim, Germany]에 상세히 기재된 발효기에서 생육시킬 수 있다.
일부 실시태양에서, 상기 배양 배지는 스테비올 글리코시드를 생산할 수 있는 유전자 변형된 미생물이 존속될 수 있는, 즉 생육 및 생육성을 유지할 수 있는 임의의 배양 배지이다. 일부 실시태양에서, 상기 배양 배지는 동화가능 탄소, 질소 및 포스페이트 공급원을 포함하는 수성 배지이다. 상기와 같은 배지는 또한 적합한 염, 무기물, 금속 및 다른 영양소를 포함할 수 있다. 일부 실시태양에서, 상기 탄소원 및 각각의 필수 세포 영양소를 상기 발효 배지에 증분적으로 또는 연속적으로 첨가하며, 각각의 요구되는 영양소를, 세포를 예를 들어 상기 탄소원을 바이오매스로 전환시키는 상기 세포의 대사 또는 호흡기능에 기반한 소정의 세포 생육 곡선에 따라 생육시킴으로써 효율적인 동화에 필요한 필수적으로 최소 수준으로 유지시킨다.
미생물 배양에 적합한 조건 및 적합한 배지는 당해 분야에 주지되어 있다. 일부 실시태양에서, 상기 적합한 배지에는 하나 이상의 추가적인 인자들, 예를 들어 유도인자(예를 들어 유전자 산물을 암호화하는 하나 이상의 뉴클레오티드 서열이 유도성 프로모터의 조절하에 있는 경우), 억제인자(예를 들어 유전자 산물을 암호화하는 하나 이상의 뉴클레오티드 서열이 억제성 프로모터의 조절하에 있는 경우), 또는 선택인자(예를 들어 유전자 변형을 포함하는 미생물을 선택하기 위한 항생제)가 보충된다.
일부 실시태양에서, 상기 탄소원은 모노사카라이드(단당류), 디사카라이드, 폴리사카라이드, 비-발효성 탄소원, 또는 이들의 하나 이상의 조합이다. 적합한 모노사카라이드의 비제한적인 예는 글루코스, 만노스, 프럭토스, 자일로스, 리보스 및 이들의 조합을 포함한다. 적합한 디사카라이드의 비제한적인 예는 슈크로스, 락토스, 말토스, 갈락토스, 트레할로스, 셀로비오스 및 이들의 조합을 포함한다. 적합한 폴리사카라이드의 비제한적인 예는 전분, 글리코겐, 셀룰로스, 키틴 및 이들의 조합을 포함한다. 적합한 비발효성 탄소원의 비제한적인 예는 아세테이트 및 글리세롤을 포함한다.
상기 배양 배지 중의 탄소원, 예를 들어 글루코스의 농도는 세포 생육을 촉진해야 하지만, 상기 사용되는 미생물의 생육을 억제할 정도로 너무 높아서는 안 된다. 전형적으로, 발효 배양물은, 목적하는 수준의 생육 및 바이오매스를 성취하는 수준이지만 검출할 수 없는 수준(검출 한계는 약 <0.1 g/ℓ이다)으로 첨가되는 탄소원, 예를 들어 글루코스를 받아들인다. 다른 실시태양에서, 상기 배양 배지 중의 탄소원, 예를 들어 글루코스의 농도는 약 1 g/ℓ 초과, 바람직하게는 약 2 g/ℓ 초과, 및 보다 바람직하게는 약 5 g/ℓ 초과이다. 또한, 상기 배양 배지 중의 탄소원, 예를 들어 글루코스의 농도는 전형적으로 약 100 g/ℓ 미만, 바람직하게는 약 50 g/ℓ 미만, 및 보다 바람직하게는 약 20 g/ℓ 미만이다. 배양 성분 농도에 대한 언급은 초기 및/또는 진행중인 성분 농도 모두를 지칭할 수 있음에 유의해야 한다. 일부의 경우에, 상기 배양 배지는 배양 동안 탄소원이 고갈되게 하는 것이 바람직할 수도 있다.
적합한 배양 배지에 사용될 수 있는 동화가능 질소원은 비제한적으로 단순 질소원, 유기 질소원 및 복합 질소원을 포함한다. 상기와 같은 질소원은 무수 암모니아, 암모늄염 및 동물, 식물 및/또는 미생물 기원의 물질을 포함한다. 적합한 질소원은 비제한적으로 단백질 가수분해산물, 미생물 바이오매스 가수분해산물, 펩톤, 효모 추출물, 암모늄 설페이트, 우레아 및 아미노산을 포함한다. 전형적으로, 상기 배양 배지 중 질소원의 농도는 약 0.1 g/ℓ 초과, 바람직하게 약 0.25 g/ℓ 초과, 및 보다 바람직하게 약 1.0 g/ℓ 초과이다. 그러나, 일정 농도를 벗어난, 배양 배지에의 질소원의 첨가는 미생물 생육에 유리하지 않다. 그 결과, 상기 배양 배지 중 질소원의 농도는 약 20 g/ℓ 미만, 바람직하게는 약 10 g/ℓ 미만, 및 보다 바람직하게는 약 5 g/ℓ 미만이다. 더욱이, 일부의 경우에 상기 배양 배지는 배양 동안 질소원이 고갈되게 하는 것이 바람직할 수도 있다.
유효 배양 배지는 다른 화합물, 예를 들어 무기염, 비타민, 미량금속 또는 성장 촉진제를 함유할 수 있다. 상기와 같은 다른 화합물은 또한 상기 유효 배지 중에 탄소, 질소 또는 무기물 공급원 중에 존재하거나, 또는 상기 배지 중에 특별히 첨가될 수 있다.
상기 배양 배지는 또한 적합한 포스페이트원을 함유할 수 있다. 상기와 같은 포스페이트원은 무기 및 유기 포스페이트원을 모두 포함한다. 바람직한 포스페이트원은 비제한적으로 포스페이트염, 예를 들어 일 또는 이염기성 나트륨 및 칼륨 포스페이트, 암모늄 포스페이트 및 이들의 혼합물을 포함한다. 전형적으로, 상기 배양 배지 중의 포스페이트의 농도는 약 1.0 g/ℓ 초과, 바람직하게는 약 2.0 g/ℓ 초과 및 보다 바람직하게는 약 5.0 g/ℓ 초과이다. 그러나, 일정 농도를 벗어난, 배양 배지에의 포스페이트의 첨가는 미생물 생육에 유리하지 않다. 상응하게, 상기 배양 배지 중 포스페이트의 농도는 약 20 g/ℓ 미만, 바람직하게는 약 15 g/ℓ 미만, 및 보다 바람직하게는 약 10 g/ℓ 미만이다.
적합한 배양 배지는 또한 마그네슘원을, 바람직하게는 생리학적으로 허용 가능한 염의 형태, 예를 들어 마그네슘 설페이트 헵타하이드레이트로 포함할 수 있지만, 유사한 양의 마그네슘에 기여하는 농도의 다른 마그네슘원을 사용할 수 있다. 전형적으로, 상기 배양 배지 중 마그네슘의 농도는 약 0.5 g/ℓ 초과, 바람직하게는 약 1.0 g/ℓ 초과, 및 보다 바람직하게는 약 2.0 g/ℓ 초과이다. 그러나, 일정 농도를 벗어난, 배양 배지에의 마그네슘의 첨가는 미생물 생육에 유리하지 않다. 상응하게, 상기 배양 배지 중 마그네슘의 농도는 전형적으로 약 10 g/ℓ 미만, 바람직하게는 약 5 g/ℓ 미만, 및 보다 바람직하게는 약 3 g/ℓ 미만이다. 더욱이, 일부의 경우에 상기 배양 배지는 배양 동안 마그네슘원이 고갈되게 하는 것이 바람직할 수도 있다.
일부 실시태양에서, 상기 배양 배지는 또한 생물학적으로 허용 가능한 킬레이트제, 예를 들어 삼나트륨 시트레이트의 디하이드레이트를 포함할 수 있다. 상기와 같은 경우에, 상기 배양 배지 중 킬레이트제의 농도는 약 0.2 g/ℓ 초과, 바람직하게는 약 0.5 g/ℓ 초과 및 보다 바람직하게는 약 1 g/ℓ 초과이다. 그러나, 일정 농도를 벗어난, 배양 배지에의 킬레이트제의 첨가는 미생물 생육에 유리하지 않다. 상응하게, 상기 배양 배지 중 킬레이트제의 농도는 전형적으로 약 10 g/ℓ 미만, 바람직하게는 약 5 g/ℓ 미만, 및 보다 바람직하게는 약 2 g/ℓ 미만이다.
상기 배양 배지는 또한 처음에 상기 배양 배지의 목적하는 pH를 유지시키기 위해 생물학적으로 허용 가능한 산 또는 염기를 포함할 수 있다. 생물학적으로 허용 가능한 산은 비제한적으로 염산, 황산, 질산, 인산 및 이들의 혼합물을 포함한다. 생물학적으로 허용 가능한 염기는 비제한적으로 수산화 암모늄, 수산화 나트륨, 수산화 칼륨 및 이들의 혼합물을 포함한다. 일부 실시태양에서, 상기 사용되는 염기는 수산화 암모늄이다.
상기 배양 배지는 또한 생물학적으로 허용 가능한 칼슘원, 예를 들어 비제한적으로 염화 칼슘을 포함할 수 있다. 전형적으로, 상기 배양 배지 중 칼슘원, 예를 들어 염화 칼슘, 디하이드레이트의 농도는 약 5 ㎎/ℓ 내지 약 2000 ㎎/ℓ의 범위 이내, 바람직하게는 약 20 ㎎/ℓ 내지 약 1000 ㎎/ℓ의 범위 이내, 및 보다 바람직하게는 약 50 ㎎/ℓ 내지 약 500 ㎎/ℓ의 범위 이내이다.
상기 배양 배지는 또한 염화 나트륨을 포함할 수 있다. 전형적으로, 상기 배양 배지 중 염화 나트륨의 농도는 약 0.1 g/ℓ 내지 약 5 g/ℓ의 범위 이내, 바람직하게는 약 1 g/ℓ 내지 약 4 g/ℓ의 범위 이내, 및 보다 바람직하게는 약 2 g/ℓ 내지 약 4 g/ℓ의 범위 이내이다.
일부 실시태양에서, 상기 배양 배지는 또한 미량 금속을 포함할 수 있다. 상기와 같은 미량 금속을, 편의상 상기 배양 배지의 나머지와 별도로 제조될 수 있는 모액으로서 상기 배양 배지에 첨가할 수 있다. 전형적으로, 상기 배양 배지에 첨가되는 상기와 같은 미량 금속의 양은 약 1 ㎖/ℓ 초과, 바람직하게는 약 5 ㎖/ℓ 초과, 및 보다 바람직하게는 약 10 ㎖/ℓ 초과이다. 그러나, 일정 농도를 벗어난, 배양 배지에의 미량 금속의 첨가는 미생물 생육에 유리하지 않다. 상응하게, 상기 배양 배지에 첨가되는 미량 금속 용액의 양은 전형적으로 약 100 ㎖/ℓ 미만, 바람직하게는 약 50 ㎖/ℓ 미만, 및 보다 바람직하게는 약 30 ㎖/ℓ 미만이다. 모액에 미량 금속을 첨가하는 외에, 개별적인 성분들을 별도로 첨가할 수 있으며, 이들은 각각 상기 미량 금속 용액의 범위에 의해 지시되는 성분들의 양과 독립적으로 상응하는 범위이내임에 유의해야 한다.
상기 배양 배지는 다른 비타민, 예를 들어 판토테네이트, 비오틴, 칼슘, 판토테네이트, 이노시톨, 피리독신-HCl, 및 티아민-HCl을 포함할 수 있다. 상기와 같은 비타민을, 편의상 상기 배양 배지의 나머지와 별도로 제조될 수 있는 모액으로서 상기 배양 배지에 첨가할 수 있다. 그러나, 일정 농도를 벗어난, 배양 배지에의 비타민의 첨가는 미생물 생육에 유리하지 않다.
본 명세서에 기재된 발효 방법을 통상적인 배양 방식(비제한적으로 배치, 유가, 세포 재순환, 연속 및 반-연속 방식을 포함한다)으로 수행할 수 있다. 일부 실시태양에서, 상기 발효를 유가 방식으로 수행한다. 상기와 같은 경우에, 상기 배지의 성분들 중 일부가 배양 중에, 예를 들어 상기 발효의 생산 단계 동안 판토테네이트가 고갈된다. 일부 실시태양에서, 상기 배양물에, 생육 및/또는 스테비올 글리코시드 생산이 첨가가 요구되기 전의 기간 동안 지지되도록, 예를 들어 생산 단계의 시작시 비교적 높은 농도의 상기와 같은 성분들을 보충할 수 있다. 이들 성분의 바람직한 범위를, 배양 전체를 통해 배양에 의해 고갈되는 수준만큼 첨가함으로써 유지시킨다. 상기 배양 배지 중 성분들의 수준을, 예를 들어 상기 배양 배지를 주기적으로 샘플링하고 농도를 분석함으로써 모니터할 수 있다. 한편으로, 일단 표준 배양 과정이 전개되면, 상기 배양 전체를 통해 특정한 시기에 공지된 수준에 상응하는 시간 간격으로 첨가를 수행할 수 있다. 당해 분야의 숙련가들에 의해 인식되는 바와 같이, 영양소의 소비율은 배양 동안 배지의 세포 밀도가 증가함에 따라 증가한다. 더욱이, 상기 배양 배지내로 외부 미생물의 도입을 피하기 위해서, 당해 분야에 공지된 바와 같은 무균 첨가 방법을 사용하여 첨가를 수행한다. 또한, 소량의 소포제를 상기 배양 중에 첨가할 수도 있다.
상기 배양 배지의 온도는 상기 유전자 변형된 세포의 생육 및/또는 스테비올 글리코시드의 생산에 적합한 임의의 온도일 수 있다. 예를 들어, 상기 배양 배지를 접종물로 접종하기에 앞서, 상기 배양 배지를 약 20 ℃ 내지 약 45 ℃ 범위의 온도, 바람직하게는 약 25 ℃ 내지 약 40 ℃ 범위, 및 보다 바람직하게는 약 28 ℃ 내지 약 32 ℃ 범위의 온도로 만들어 유지시킬 수 있다.
상기 배양 배지의 pH는 상기 배양 배지에 산 또는 염기를 가하여 조절할 수 있다. 상기와 같은 경우에 암모니아를 사용하여 pH를 조절하는 경우, 편의상 상기를 배양 배지에 질소원으로서 제공한다. 바람직하게는, 상기 pH를 약 3.0 내지 약 8.0, 보다 바람직하게는 약 3.5 내지 약 7.0, 및 가장 바람직하게는 약 4.0 내지 약 6.5로 유지시킨다.
일부 실시태양에서, 상기 배양 배지의 탄소원 농도, 예를 들어 글루코스 농도를 배양 중 모니터한다. 상기 배양 배지의 글루코스 농도를 공지된 기법, 예를 들어 글루코스 옥시다제 효소 시험 또는 고압 액체 크로마토그래피(상기는 상등액 중의 글루코스 농도, 예를 들어 배양 배지 중 무세포 성분을 모니터하는데 사용될 수 있다)를 사용하여 모니터할 수 있다. 앞서 서술된 바와 같이, 상기 탄소원 농도를 세포 생육 억제가 일어나는 수준 미만에서 유지시켜야 한다. 상기와 같은 농도는 유기체마다 다를 수 있지만, 탄소원으로서 글루코스의 경우 세포 생육 억제는 약 60 g/ℓ를 초과하는 글루코스 농도에서 발생하며, 이는 시험에 의해 쉽게 측정될 수 있다. 상응하게, 글루코스를 탄소원으로서 사용하는 경우, 상기 글루코스를 바람직하게는 발효기에 공급하여 검출 한계 미만에서 유지시킨다. 한편으로, 상기 배양 배지 중 글루코스 농도를 약 1 g/ℓ 내지 약 100 g/ℓ의 범위, 보다 바람직하게는 약 2 g/ℓ 내지 약 50 g/ℓ의 범위, 및 더욱 더 바람직하게는 약 5 g/ℓ 내지 약 20 g/ℓ의 범위에서 유지시킨다. 상기 탄소원 농도를 예를 들어 실질적으로 순수한 글루코스 용액의 첨가에 의해 목적하는 수준 이내에서 유지시킬 수 있지만, 원래 배양 배지의 분액의 첨가에 의해 상기 배양 배지의 탄소원 농도를 유지시키는 것이 허용 가능하며 바람직할 수 있다. 상기 원래 배양 배지의 분액의 사용은 상기 배지 중 다른 영양소(예를 들어 질소 및 포스페이트원)의 농도를 동시에 유지시킬 수 있기 때문에 바람직하다. 마찬가지로, 상기 미량금속 농도를 상기 미량금속 용액의 분액의 첨가에 의해 상기 배양 배지 중에서 유지시킬 수 있다.
다른 적합한 발효 배지 및 방법은 예를 들어 WO 2016/196321에 기재되어 있다.
6.9 발효 조성물
또 다른 태양에서, 본 명세서는 본 명세서에 기재된 유전자 변형된 숙주 세포 및 유전자 변형된 숙주 세포로부터 생산된 스테비올 글리코시드를 포함하는 발효 조성물을 제공한다. 상기 발효 조성물은 배지를 추가로 포함할 수 있다. 몇몇 실시태양에서, 상기 발효 조성물은 유전자 변형된 숙주 세포를 포함하고, RebA, RebD 및 RebM을 추가로 포함한다. 몇몇 실시태양에서, 본 명세서에 제공된 발효 조성물은 상기 유전자 변형된 숙주 세포로부터 생산된 스테비올 글리코시드의 주성분으로서 RebM을 포함한다. 몇몇 실시태양에서, 상기 발효 조성물은 RebA, RebD 및 RebM을 적어도 1:7:50의 비로 포함한다. 다른 실시태양에서, 상기 발효 조성물은 적어도 8:50의 비로 (RebA+RebD) 및 RebM을 포함한다. 몇몇 실시태양에서, 상기 발효 조성물은 RebA, RebD 및 RebM을 적어도 1:7:50 내지 1:100:1000의 비로 포함한다. 다른 실시태양에서, 상기 발효 조성물은 (RebA+RebD) 및 RebM을 적어도 8:50 내지 101:1000의 비로 포함한다. 다른 실시태양에서, 상기 발효 조성물은 적어도 1:7:50 내지 1:200:2000의 비로 포함한다. 다른 실시태양에서, 상기 발효 조성물은 (RebA+RebD) 및 RebM을 적어도 8:50 내지 201:2000의 비로 포함한다. 몇몇 실시태양에서, 상기 RebA, RebD 및 RebM의 비는 상기 유전자 변형된 숙주 세포 및 배지와 관련된 이들 3개의 스테비올 글리코시드의 총 함량을 기준으로 한다. 몇몇 실시태양에서, 상기 RebA, RebD 및 RebM의 비는 상기 배지 중의 이들 3개의 스테비올 글리코시드의 총 함량을 기준으로 한다. 몇몇 실시태양에서, 상기 RebA, RebD 및 RebM의 비는 상기 유전자 변형된 숙주 세포와 관련된 이들 3개의 스테비올 글리코시드의 총 함량을 기준으로 한다.
다른 실시태양에서, 상기 발효 조성물은 유전자 변형된 숙주 세포를 포함하고, RebA 및 RebM을 추가로 포함한다. 몇몇 실시태양에서, 상기 발효 조성물은 RebA 및 RebM을 적어도 1:50의 RebA:RebM 비로 포함한다. 몇몇 실시태양에서, 상기 발효 조성물은 RebA 및 RebM을 적어도 1:50 내지 1:1000의 RebA:RebM 비로 포함한다. 몇몇 실시태양에서, 상기 발효 조성물은 RebA 및 RebM을 적어도 1:50 내지 1:2000의 RebA:RebM 비로 포함한다. 몇몇 실시태양에서, 상기 RebA 및 RebM의 비는 상기 유전자 변형된 숙주 세포 및 배지와 관련된 이들 2개의 스테비올 글리코시드의 총 함량을 기준으로 한다. 몇몇 실시태양에서, 상기 RebA 및 RebM의 비는 상기 배지 중의 이들 2개의 스테비올 글리코시드의 총 함량을 기준으로 한다. 몇몇 실시태양에서, 상기 RebA 및 RebM의 비는 상기 유전자 변형된 숙주 세포와 관련된 이들 2개의 스테비올 글리코시드의 총 함량을 기준으로 한다.
추가의 실시태양에서, 상기 발효 조성물은 유전자 변형된 숙주 세포를 포함하고, RebD 및 RebM을 추가로 포함한다. 몇몇 실시태양에서, 상기 발효 조성물은 RebD 및 RebM을 적어도 7:50의 RebD:RebM 비로 포함한다. 몇몇 실시태양에서, 상기 발효 조성물은 RebD 및 RebM을 적어도 7:50 내지 7:100의 RebD:RebM 비로 포함한다. 몇몇 실시태양에서, 상기 발효 조성물은 RebD 및 RebM을 적어도 7:50 내지 7:200의 RebD:RebM 비로 포함한다. 몇몇 실시태양에서, 상기 RebA, RebD 및 RebM의 비는 상기 유전자 변형된 숙주 세포 및 배지와 관련된 이들 2개의 스테비올 글리코시드의 총 함량을 기준으로 한다. 몇몇 실시태양에서, 상기 RebD 및 RebM의 비는 상기 배지 중의 이들 2개의 스테비올 글리코시드의 총 함량을 기준으로 한다. 몇몇 실시태양에서, 상기 RebD 및 RebM의 비는 상기 유전자 변형된 숙주 세포와 관련된 이들 2개의 스테비올 글리코시드의 총 함량을 기준으로 한다.
몇몇 실시태양에서, 본 명세서에 제공된 발효 조성물은 RebM2를 검출 가능하지 않은 수준으로 함유한다. 몇몇 실시태양에서, 본 명세서에 제공된 발효 조성물은 비-천연 스테비올 글리코시드를 검출 가능하지 않은 수준으로 함유한다. 몇몇 실시태양에서, 본 명세서에 제공된 발효 조성물은 GC-크로마토그래피 수행시 RebA 피크와 RebB 사이에 "스테비올+2 글루코스" 피크를 검출 가능한 수준으로 생산하지 않는다.
6.10 스테비올 글리코시드의 회수
일단 상기 스테비올 글리코시드가 숙주 세포에 의해 생산되면, 상기를 후속 사용을 위해, 당해 분야에 공지된 임의의 적합한 분리 및 정제 방법, 예를 들어 임의의 적합한 스테비올 글리코시드 분리 및 정제 방법을 사용하여 회수하거나 단리할 수 있다. 적합한 방법은 예를 들어 미국특허 제 7,838,044 호 및 제 8,981,081 호; 미국특허 출원 제 14/603,941, 14/033,563, 14/362,275, 14/613,615, 14/615,888 호; PCT 출원 제 PCT/US12/070562 호, 및 제 PCT/US14/031129 호에 기재되어 있다. 이들 문서의 내용은 전체가 본 명세서에 참고로 인용된다. 일부 실시태양에서, 상기 스테비올 글리코시드를 포함하는 수성상을 원심분리에 의해 상기 발효로부터 분리시킨다. 다른 실시태양에서, 상기 스테비올 글리코시드를 포함하는 수성상을 상기 발효로부터 자발적으로 분리시킨다. 다른 실시태양에서, 상기 스테비올 글리코시드를 포함하는 수성상을, 상기 발효 반응에 해유화제(demulsifier) 및/또는 핵형성제를 첨가함으로써 상기 발효로부터 분리시킨다. 해유화제의 예시적인 예는 응집제 및 응고제를 포함한다. 핵형성제의 예시적인 예는 상기 스테비올 글리코시드 자체의 소적 및 유기 용매, 예를 들어 도데칸, 이소프로필 미리스트레이트 및 메틸 올리에이트를 포함한다.
이들 세포에서 생산된 스테비올 글리코시드는 상기 배양 상등액 중에 존재하고/하거나 숙주 세포와 결합될 수 있다. 상기 스테비올 글리코시드가 숙주 세포와 결합되어 있는 실시태양에서, 상기 스테비올 글리코시드의 회수는 상기 세포의 삼투 또는 용해 방법을 포함할 수 있다. 한편으로 또는 동시에, 상기 배양 배지 중의 스테비올 글리코시드를 회수 공정, 예를 들어 비제한적으로 크로마토그래피, 흡착 크로마토그래피, 추출, 용매 추출, 막 분리, 전기투석, 역삼투, 증류, 화학적 유도체화 및 결정화를 사용하여 회수할 수 있다.
일부 실시태양에서, 상기 스테비올 글리코시드를 상기 수성상 중에 존재할 수 있는 다른 생성물들로부터 분리시킨다. 일부 실시태양에서, 분리를 흡착, 증류, 기체-액체 추출(스트립핑), 액체-액체 추출(용매 추출), 진공 추출, 증발, 한외여과, 및 표준 크로마토그래피 기법을 사용하여 성취한다. 다른 적합한 발효 배지 및 방법들이 예를 들어 미국특허 출원 공보 제 2016/0185813, 2017/0190728, WO/2017/093895 호에 기재되어 있다. 다른 적합한 방법들이 예를 들어 미국특허 제 7,838,044 호 및 제 8,981,081 호; 미국특허 출원 제 14/603,941, 14/033,563, 14/362,275, 14/613,615 및 14/615,888 호; PCT 출원 제 PCT/US12/070562, 및 PCT/US14/031129 호에 기재되어 있다. 이들 문서의 내용은 전체가 본 명세서에 참고로 인용된다.
몇몇 실시태양에서, 상기 회수된 스테비올 글리코시드(들)를 다양한 최종 제품에 사용할 수 있다. 예를 들어, 정제된 RebM 화합물 또는 RebM을 포함하는 조성물을 임의의 상품, 예를 들어 식품, 약학 제품, 식이성 보충제, 또는 영양 보충제에 사용할 수 있다. 특정한 실시태양에서, RebM을 포함하는 상품을, RebM 생성에 적합한 조건하에서 탄소원이 있는 배지 중에서 선행 청구항들 중 어느 한 항의 유전자 변형된 숙주 세포의 집단을 배양하고; 상기 배지로부터 상기 RebM 화합물을 회수하는 공정에 의해 제조한다.
본 명세서에 사용되는 바와 같은 감미료(sweetener) 조성물은 적어도 하나의 감미 성분을 적어도 하나의 다른 물질, 예를 들어 또 다른 감미료 또는 첨가제와 함께 함유하는 조성물을 의미한다.
본 명세서에 사용되는 바와 같은 감미가능한 조성물은 인간이나 동물의 입과 접촉하는 물질, 예를 들어 입으로 섭취되고 후속적으로 상기 입으로부터 배출되는 물질 및 마시거나, 먹거나, 삼키거나 또는 달리 섭취되며 일반적으로 허용 가능한 범위로 사용될 때 인간이나 동물 소비에 안전한 물질을 의미한다.
본 명세서에 사용되는 바와 같은 감미된 조성물은 감미가능한 조성물 및 감미료 또는 감미료 조성물을 모두 함유하는 물질을 의미한다. 예를 들어, 감미료 성분이 없는 음료는 일종의 감미가능한 조성물이다. 본 발명의 방법에 의해 생성된 RebM을 포함하는 감미료 조성물, 및 에리쓰리톨을 상기 감미되지 않은 음료에 가할 수 있으며, 이에 의해 감미된 음료를 제공할 수 있다. 상기 감미된 음료는 일종의 감미된 조성물이다. 적합한 감미료 조성물, 감미된 조성물 및 이의 제조 방법은 예를 들어 PCT 출원 PCT/US12/070562에 기재되어 있으며, 이의 내용은 전체가 본 명세서에 참고로 인용된다.
하나의 실시태양에서, RebM을 포함하는 감미료를, RebM 생성에 적합한 조건하에서 탄소원이 있는 배지 중에서 선행 청구항들 중 어느 한 항의 유전자 변형된 숙주 세포의 집단을 배양하고; 상기 배지로부터 상기 RebM 화합물을 회수하는 공정에 의해 제조한다. 또 다른 실시태양에서, 적어도 하나의 다른 물질 및 RebM을 포함하는 감미료 조성물을, RebM 생성에 적합한 조건하에서 탄소원이 있는 배지 중에서 선행 청구항들 중 어느 한 항의 유전자 변형된 숙주 세포의 집단을 배양하고; 상기 배지로부터 상기 RebM 화합물을 회수하는 공정에 의해 제조한다. 또 다른 실시태양에서, RebM을 포함하는 감미된 조성물을, RebM 생성에 적합한 조건하에서 탄소원이 있는 배지 중에서 선행 청구항들 중 어느 한 항의 유전자 변형된 숙주 세포의 집단을 배양하고; 상기 배지로부터 상기 RebM 화합물을 회수하는 공정에 의해 제조한다. 하나의 실시태양은, RebM 생성에 적합한 조건하에서 탄소원이 있는 배지 중에서 선행 청구항들 중 어느 한 항의 유전자 변형된 숙주 세포의 집단을 배양하고; 상기 배지로부터 상기 RebM 화합물을 회수하는 공정에 의해 제조된, RebM을 적어도 하나의 다른 물질과 조합함을 포함하는 감미료 조성물의 제조 방법을 포함한다. 또 다른 실시태양은, RebM 생성에 적합한 조건하에서 탄소원이 있는 배지 중에서 선행 청구항들 중 어느 한 항의 유전자 변형된 숙주 세포의 집단을 배양하고; 상기 배지로부터 상기 RebM 화합물을 회수하는 공정에 의해 제조된, RebM을 적어도 하나의 감미가능한 조성물과 조합함을 포함하는 감미된 조성물의 제조 방법을 포함한다.
6.11 유전자 변형된 세포의 생성 방법
본 명세서는 또한 상기 기재된 변형들 중 하나 이상, 예를 들어 스테비올 글리코시드 화합물의 경우, UGT40087 및/또는 생합성 경로 효소를 암호화하는 하나 이상의 이종 핵산을 포함하도록 유전자 조작된 숙주 세포의 생성 방법을 제공한다. 숙주 세포에서 이종 효소의 발현을, 상기 숙주 세포에 상기 숙주 세포에서 발현을 허용하는 조절 요소의 조절하에서 상기 효소를 암호화하는 뉴클레오티드 서열을 포함하는 핵산을 도입시킴으로써 수행할 수 있다. 일부 실시태양에서, 상기 핵산은 염색체외 플라스미드이다. 다른 실시태양에서, 상기 핵산을 상기 숙주 세포의 염색체내에 통합시킨다.
단백질을 암호화하는 핵산을 비제한적으로 당해 분야의 숙련가에게 공지된 임의의 방법에 의해 숙주 세포내에 도입시킬 수 있다(예를 들어 하기 문헌들을 참조하시오: Hinnen et al. (1978) Proc. Natl. Acad. Sci. USA 75:1292-3; Cregg et al. (1985) Mol. Cell. Biol. 5:3376-3385; Goeddel et al. eds, 1990, Methods in Enzymology, vol. 185, Academic Press, Inc., CA; Krieger, 1990, Gene Transfer and Expression -- A Laboratory Manual, Stockton Press, NY; Sambrook et al. , 1989, Molecular Cloning -- A Laboratory Manual, Cold Spring Harbor Laboratory, NY; 및 Ausubel et al., eds., Current Edition, Current Protocols in Molecular Biology, Greene Publishing Associates and Wiley Interscience, NY). 예시적인 기법은 비제한적으로 스페로플라스팅, 일렉트로포레이션, PEG 1000 매개된 형질전환, 및 리튬 아세테이트 또는 리튬 클로라이드 매개된 형질전환을 포함한다.
숙주 세포에서 효소의 활성을 상기 효소를 암호화하는 유전자의 전사를 변형시킴으로써 변경시킬 수 있다. 이를 예를 들어 상기 효소를 암호화하는 뉴클레오티드 서열의 사본수를 변형시킴으로써(예를 들어 상기 뉴클레오티드 서열을 포함하는 보다 높거나 보다 낮은 사본수의 발현 벡터를 사용함으로써, 또는 상기 뉴클레오티드 서열의 추가적인 사본을 상기 숙주 세포의 게놈에 도입시킴으로써 또는 상기 뉴클레오티드 서열을 상기 숙주 세포의 게놈 중에서 결실시키거나 파괴시킴으로써), 오페론의 폴리시스트론성 mRNA상의 암호화 서열들의 순서를 바꾸거나 또는 각각 자신의 조절 요소를 갖는 개별적인 유전자로 오페론을 분해시킴으로써, 또는 뉴클레오티드 서열이 작동적으로 연결된 프로모터 또는 오퍼레이터의 강도를 증가시킴으로써) 성취할 수 있다. 한편으로 또는 또한, 숙주 세포에서 효소의 활성을, 상기 효소를 암호화하는 mRNA의 번역 수준을 변형시킴으로써 변경시킬 수 있다. 이를, 예를 들어 상기 mRNA의 안정성을 변형시키고, 리보솜 결합 부위의 서열을 변형시키고, 상기 리보솜 결합 부위와 상기 효소 암호화 서열의 출발 코돈간의 거리 또는 서열을 변형시키고, 상기 효소 암호화 영역의 출발 코돈의 "상류"에 위치하거나 또는 5' 쪽에 인접한 전체 시스트론사이 영역을 변형시키고, 헤어핀 및 전문화된 서열을 사용하여 mRNA 전사물의 3'-단부를 안정화시키고, 효소의 코돈 사용을 변형시키고, 상기 효소의 생합성에 사용된 희귀 코돈 tRNA의 발현을 변경시키고, 및/또는 예를 들어 암호화 서열의 돌연변이를 통해 상기 효소의 안정성을 증가시킴으로서 성취할 수 있다.
숙주 세포에서 효소의 활성을 다수의 방식으로, 예를 들어 비제한적으로 상기 숙주 세포에서 증가되거나 감소된 용해도를 나타내는 효소의 변형된 형태를 발현시키거나, 상기 효소 활성의 억제를 통해 도메인이 결여된 효소의 변경된 형태를 발현시키거나, 기질에 대해 보다 높거나 낮은 Kcat 또는 보다 낮거나 높은 Km을 갖는 효소의 변형된 형태를 발현시키거나, 또는 상기 경로에서 또 다른 분자에 의한 피드백 또는 피드포워드 조절에 의해 다소 영향을 받는 효소의 변경된 형태를 발현시켜 변경시킬 수 있다.
일부 실시태양에서, 숙주 세포를 유전자 변형시키는데 사용되는 핵산은 형질전환된 숙주 세포의 선택 및 외부 DNA를 유지시키기 위해 숙주 세포상에 선택압을 놓기에 유용한 하나 이상의 선택성 마커를 포함한다.
일부 실시태양에서, 상기 선택성 마커는 항생제 내성 마커이다. 항생제 내성 마커의 예시적인 예는 비제한적으로 BLA, NAT1, PAT, AUR1-C, PDR4, SMR1, CAT, 마우스 dhfr, HPH, DSDA, KAN R , 및 SH BLE 유전자 산물을 포함한다. 이 콜라이로부터의 BLA 유전자 산물은 베타-락탐 항생제(예를 들어 좁은 범위 세팔로스포린, 세파마이신, 및 카바페넴(에르타페넴), 세파만돌, 및 세포페라존), 및 테모실린을 제외한 모든 항-그람-음성-세균 페니실린에 대한 내성을 부여하고; 에스 노우르제이(S. noursei)로부터의 NAT1 유전자 산물은 나우르세오트리신에 대한 내성을 부여하며; 에스 비리도크로모게네스(S. viridochromogenes) Tu94로부터의 PAT 유전자 산물은 비알로포스에 대한 내성을 부여하고; 사카로마이세스 세레비지아에로부터의 AUR1-C 유전자 산물은 아우에로바시딘 A(AbA)에 대한 내성을 부여하며; PDR4 유전자 산물은 세룰레닌에 대한 내성을 부여하고; SMR1 유전자 산물은 설포메투론 메틸에 대한 내성을 부여하며; Tn9 트랜스포손으로부터의 CAT 유전자 산물은 클로람페니콜에 대한 내성을 부여하고; 마우스 dhfr 유전자 산물은 메토트렉세이트에 대한 내성을 부여하고; 클렙시엘라 뉴모니아의 HPH 유전자 산물은 하이그로마이신 B에 대한 내성을 부여하며; 이 콜라이의 DSDA 유전자 산물은 세포가 유일한 질소원으로서 D-세린을 갖는 플레이트상에서 생육될 수 있게 하고; Tn903 트랜스포손의 KAN R 유전자는 G418에 대한 내성을 부여하며; 스트렙토알로테이쿠스 힌두스타누스(Streptoalloteichus hindustanus)로부터의 SH BLE 유전자 산물은 제오신(블레오마이신)에 대한 내성을 부여한다. 일부 실시태양에서, 상기 항생제 내성 마커를 본 명세서에 개시된 유전자 변형된 숙주 세포 단리 후에 결실시킨다.
일부 실시태양에서, 상기 선택성 마커는 상기 유전자 변형된 미생물에서 영양요구성(예를 들어 영양소 영양요구성)을 구제한다. 상기와 같은 실시태양에서, 모 미생물은, 아미노산 또는 뉴클레오티드 생합성 경로에서 기능하고 비-기능성인 경우 모 세포를 하나 이상의 영양소 보충이 없는 배지에서 생육할 수 없게 만드는 하나 이상의 유전자 산물에서의 기능적 붕괴를 포함한다. 상기와 같은 유전자 산물은 비제한적으로 효모에서 HIS3, LEU2, LYS1, LYS2, MET15, TRP1, ADE2, 및 URA3 유전자 산물을 포함한다. 이어서 상기 영양요구성 표현형은 상기 모 세포를 상기 붕괴된 유전자 산물의 기능성 사본을 암호화하는 발현 벡터 또는 염색체 통합 구조물로 형질전환시킴으로써 구제될 수 있으며, 상기 생성된 유전자 변형된 숙주 세포를 상기 모세포의 영양요구성 표현형의 상실을 근거로 선택할 수 있다. 선택성 마커로서 URA3, TRP1, 및 LYS2 유전자의 사용은 양성 및 음성 선택을 모두 가능하게 하기 때문에 현저한 장점을 갖는다. 양성 선택은 상기 URA3, TRP1, 및 LYS2 돌연변이의 영양요구성 상보성에 의해 수행되는 반면, 음성 선택은 독립영양성 균주의 생육은 방지하지만 각각 상기 URA3, TRP1, 및 LYS2 돌연변이체의 생육은 허용하는 특정한 억제제, 즉 각각 5-플루오로-오로트산(FOA), 5-플루오로안트라닐산 및 아미노아디프산(aAA)에 기반한다. 다른 실시태양에서, 상기 선택성 마커는 공지된 선택 방법에 의해 식별될 수 있는 다른 비-치명적인 결함 또는 표현형들을 구제한다.
본 명세서는 본 명세의 방법, 조성물 및 유기체에 유용한 특정한 유전자 및 단백질을 기재하지만; 상기와 같은 유전자에 대한 절대적인 동일성이 필요한 것은 아님을 알 것이다. 예를 들어, 폴리펩티드 또는 효소를 암호화하는 서열을 포함하는 특정 유전자 또는 폴리뉴클레오티드의 변화를 수행할 수 있으며 활성에 대해 선별할 수 있다. 전형적으로 상기와 같은 변화는 보존적 돌연변이 및 침묵 돌연변이를 포함한다. 상기와 같은 변형되거나 돌연변이된 폴리뉴클레오티드 및 폴리펩티드를 당해 분야에 공지된 방법을 사용하여 기능성 효소의 발현에 대해 선별할 수 있다.
유전자 암호의 내재하는 축퇴성으로 인해, 실질적으로 동일하거나 기능상 균등한 폴리펩티드를 암호화하는 다른 폴리뉴클레오티드를 또한 사용하여 상기와 같은 효소를 암호화하는 폴리뉴클레오티드를 클로닝하고 발현시킬 수 있다.
당해 분야의 숙련가들에 의해 이해되는 바와 같이, 특정한 숙주에서 발현을 증대시키도록 암호화 서열을 변형시키는 것이 유리할 수 있다. 상기 유전자 암호는 64개의 가능한 코돈이 불필요하지만, 대부분의 유기체는 전형적으로 이들 코돈의 부분집합을 사용한다. 하나의 종에서 가장 종종 사용되는 코돈을 최적 코돈이라 칭하며, 그다지 종종 사용되지 않는 코돈은 희귀 또는 저사용 코돈으로 분류된다. 때때로 "코돈 최적화" 또는 "종 코돈 편향을 위한 조절"이라 칭하는 공정에서 숙주의 바람직한 코돈 사용빈도를 반영하도록 코돈을 치환시킬 수 있다. 다른 숙주 세포에 대한 코돈 최적화를 코돈 사용빈도표를 사용하여 쉽게 측정하거나 또는 상업적으로 입수할 수 있는 소프트웨어, 예를 들어 인티그레이티드 DNA 테크놀로지스(Integrated DNA Technologies)로부터의 CodonOp(www.idtdna.com/CodonOptfrom)를 사용하여 수행할 수 있다.
특정한 원핵생물 또는 진핵생물 숙주에 의해 바람직한 코돈을 함유하는 최적화된 암호화 서열(Murray et al., 1989, Nucl Acids Res. 17: 477-508)을, 예를 들어 번역속도를 증가시키거나 또는 목적하는 성질, 예를 들어 최적화되지 않은 서열로부터 생성된 전사물에 비해 보다 긴 반감기를 갖는 재조합 RNA 전사물을 생성시키기 위해 제조할 수 있다. 번역 정지 코돈을 또한 숙주 선호를 반영하도록 변형시킬 수 있다. 예를 들어 에스 세레비지아에 및 포유동물에 전형적인 정지 코돈은 각각 UAA 및 UGA이다. 외떡잎 식물에 전형적인 정지 코돈은 UGA인 반면, 곤충 및 이 콜라이는 통상적으로 정지 코돈으로서 UAA를 사용한다(Dalphin et al., 1996, Nucl Acids Res. 24: 216-8).
당해 분야의 숙련가들은 상기 유전자 암호의 축퇴 성질로 인해, 뉴클레오티드 서열이 상이한 다양한 DNA 분자들을 사용하여 본 명세의 주어진 효소를 암호화할 수 있음을 알 것이다. 상술한 생합성 효소들을 암호화하는 고유 DNA 서열은 단지 본 명세의 실시태양을 예시하기 위해 본 발명에 참조되며, 본 명세는 본 명세의 방법에 사용되는 효소들의 폴리펩티드 및 단백질의 아미노산 서열을 암호화하는 임의의 서열의 DNA 분자들을 포함한다. 유사한 방식으로, 폴리펩티드는 전형적으로 목적하는 활성의 상실 또는 현저한 상실 없이 그의 아미노산 서열의 하나 이상의 아미노산 치환, 결실 및 삽입을 허용할 수 있다. 본 명세는 상기 변형된 또는 변형 폴리펩티드가 상기 참조 폴리펩티드의 효소적 동화 또는 이화 활성을 갖는 한, 본 명세서에 기재된 특정한 단백질들과 상이한 아미노산 서열을 갖는 상기와 같은 폴리펩티드를 포함한다. 더욱 또한, 본 명세서에 나타낸 DNA 서열에 의해 암호화된 아미노산 서열은 단지 본 명세의 실시태양들을 예시한다.
또한, 본 명세서에 제공된 조성물 및 방법에 유용한 효소들의 상동체가 본 명세에 의해 포함된다. 일부 실시태양에서, 2개의 단백질(또는 상기 단백질들의 일부)은 아미노산 서열이 적어도 약 30%, 40%, 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 경우 실질적으로 상동성이다. 2개의 아미노산 서열 또는 2개의 핵산 서열의 동일성 퍼센트를 측정하기 위해서, 상기 서열들을 최적의 비교를 목적으로 정렬시킨다(예를 들어 최적의 정렬을 위해 제1 및 제2 아미노산 또는 핵산 서열 중 하나 또는 둘 다에 끊김을 도입시키며 비-상동성 서열을 비교 목적으로 무시할 수 있다). 하나의 실시태양에서, 비교 목적으로 정렬된 참조 서열의 길이는 상기 참조 서열의 길이의 적어도 30%, 전형적으로는 적어도 40%, 보다 전형적으로는 적어도 50%, 훨씬 더 전형적으로는 적어도 60%, 및 훨씬 더 전형적으로는 적어도 70%, 80%, 90%, 100%이다. 이어서 상응하는 아미노산 위치 또는 뉴클레오티드 위치에서 아미노산 잔기 또는 뉴클레오티드를 비교한다. 상기 제1 서열 중 하나의 위치를 제2 서열 중의 상응하는 위치로서 동일한 아미노산 잔기 또는 뉴클레오티드가 점유하는 경우, 상기 분자는 상기 위치에서 일치한다(본 명세서에 사용되는 바와 같이 아미노산 또는 핵산 "동일성"은 아미노산 또는 핵산 "상동성"과 같다). 상기 2개 서열간의 동일성 퍼센트는 상기 2개 서열의 최적의 정렬을 위해 도입시킬 필요가 있는 끊김의 수, 및 각 끊김의 길이를 고려하여, 상기 서열들에 의해 공유된 일치하는 위치들의 수의 함수이다.
"상동성"이 단백질 또는 펩티드와 관련하여 사용되는 경우, 일치하지 않는 잔기 위치들이 종종 보존적 아미노산 치환에 의해 상이한 것으로 인식된다. "보존적 아미노산 치환"은 아미노산 잔기가, 유사한 화학적 성질(예를 들어 전하 또는 소수성)을 갖는 측쇄(R 기)를 갖는 또 다른 아미노산 잔기에 의해 치환된 것이다. 일반적으로, 보존적 아미노산 치환은 단백질의 기능적 성질을 실질적으로 변화시키지 않을 것이다. 2개 이상의 아미노산 서열이 보존적 치환에 의해 서로 상이한 경우, 서열 동일성 퍼센트 또는 상동성 정도를 상기 치환의 보존적 성질을 보정하는 쪽으로 조절할 수 있다. 이러한 조절을 수행하는 수단은 당해 분야의 숙련가들에게 주지되어 있다(예를 들어 문헌[Pearson W. R., 1994, Methods in Mol Biol 25: 365-89]을 참조하시오).
하기의 6개 그룹은 각각 서로에 대해 보존적인 치환인 아미노산들을 함유한다: 1) 세린(S), 쓰레오닌(T); 2) 아스파트산(D), 글루탐산(E); 3) 아스파라진(N), 글루타민(Q); 4) 아르기닌(R), 리신(K); 5) 이소류신(I), 류신(L), 알라닌(A), 발린(V), 및 6) 페닐알라닌(F), 티로신(Y), 트립토판(W).
폴리펩티드에 대한 서열 상동성(또한 서열 동일성 퍼센트라 칭한다)을 전형적으로는 서열 분석 소프트웨어를 사용하여 측정한다. 분자 서열을 상이한 유기체들로부터의 다수의 서열을 함유하는 데이터베이스와 비교하는데 사용되는 전형적인 알고리즘은 컴퓨터 프로그램 BLAST이다. 다수의 상이한 유기체들로부터의 서열을 함유하는 데이터베이스를 검색하는 경우, 아미노산 서열들을 비교하는 것이 전형적이다.
더욱 또한, 외부 효소(또는 본 명세서에서 언급된 임의의 다른 효소(또는 그의 발현을 조절하거나 조정하는 조절 요소들 중 어느 하나))를 암호화하는 유전자들 중 어느 하나를 당해 분야의 통상적인 숙련가들에게 공지된 유전자/단백질 조작 기법, 예를 들어 유도 진화 또는 합리적인 돌연변이유발에 의해 최적화할 수 있다. 상기와 같은 행위는 당해 분야의 통상적인 숙련가들로 하여금 효모 중 상기 효소들을 발현 및 활성에 최적화하게 한다.
또한, 이들 효소를 암호화하는 유전자를 다른 진균 및 세균 종들로부터 식별할 수 있으며 상기 경로의 조절을 위해 발현시킬 수 있다. 다양한 유기체들, 예를 들어 비제한적으로 사카로마이세스 스페시즈, 예를 들어 에스 세레비지아에 및 에스 우바룸(S. uvarum), 클루이베로마이세스 스페시즈(Kluyveromyces spp.), 예를 들어 케이 써모톨레란스(K. thermotolerans), 케이 락티스(K. lactis) 및 케이 마르시아누스(K. marxianus), 피키아 스페시즈(Pichia spp.), 한세눌라 스페시즈(Hansenula spp.), 예를 들어 에이치 폴리모르파(H. polymorpha), 칸디다 스페시즈(Candida spp.), 트리코스포론 스페시즈(Trichosporon spp.), 야마다지마 스페시즈(Yamadazyma spp.), 예를 들어 와이 스페시즈 스티피티스(Y. spp. stipitis), 토룰라스포라 프레토리엔시스(Torulaspora pretoriensis), 이사트첸키아 오리엔탈리스(Issatchenkia orientalis), 스키조사카로마이세스 스페시즈, 예를 들어 에스 폼베(S. pombe), 크립토코커스 스페시즈(Cryptococcus spp.), 아스퍼질러스 스페시즈(Aspergillus spp.), 뉴로스포라 스페시즈(Neurospora spp.) 또는 우스틸라고 스페시즈(Ustilago spp.)가 이들 효소에 대한 공급원으로서 작용할 수 있다. 혐기성 진균으로부터의 유전자의 공급원은 비제한적으로 피로마이세스 스페시즈(Piromyces spp.), 오르피노마이세스 스페시즈(Orpinomyces spp.), 또는 네오칼리마스틱스 스페시즈(Neocallimastix spp.)를 포함한다. 유용한 원핵생물 효소의 공급원은 비제한적으로 에스케리키아 콜라이, 지모모나스 모빌리스, 스타필로코커스 아우레우스, 바실러스 스페시즈, 클로스트리디움 스페시즈, 코리네박테리움 스페시즈, 슈도모나스 스페시즈, 락토코커스 스페시즈, 엔테로박터 스페시즈 및 살모넬라 스페시즈를 포함한다.
당해 분야의 숙련가들에게 공지된 기법이 추가적인 상동성 유전자 및 상동성 효소를 식별하기에 적합할 수 있다. 일반적으로, 유사한 유전자 및/또는 유사한 효소들을 기능성 분석에 의해 식별할 수 있으며 이들은 기능적 유사성을 가질 것이다. 당해 분야의 숙련가들에게 공지된 기법이 유사한 유전자 및 유사한 효소를 식별하기에 적합할 수 있다. 예를 들어, 상동성 또는 유사성 UDP 글리코실트랜스퍼라제, PTA, 또는 임의의 생합성 경로 유전자, 단백질 또는 효소를 식별하기 위한 기법들은 비제한적으로 관심 유전자/효소의 공개된 서열을 기본으로 하는 프라이머를 사용하는 PCR에 의한, 또는 관심 유전자 가운데 보존된 영역을 증폭하도록 설계된 축퇴 프라이머를 사용하는 축퇴 PCR에 의한 유전자 클로닝을 포함할 수 있다. 더욱이, 당해 분야의 숙련가는 기능적 상동성 또는 유사성을 갖는 상동성 또는 유사성 유전자, 단백질 또는 효소를 식별하기 위한 기법을 사용할 수 있다. 기법은 세포 또는 세포 배양물을, 효소의 촉매 활성에 대한 시험관내 효소 분석을 통해 상기 활성에 대해 검사하고(예를 들어 본 명세서 또는 문헌[Kiritani, K., Branched-Chain Amino Acids Methods Enzymology, 1970]에 기재된 바와 같이), 이어서 상기 활성을 갖는 효소를 정제를 통해 단리하고, Edman 분해, 있음직한 핵산 서열에 대한 PCR 프라이머의 설계, PCR을 통한 상기 DNA 서열의 증폭, 및 상기 핵산 서열의 클로닝과 같은 기법을 통해 상기 효소의 단백질 서열을 측정함을 포함한다. 상동성 또는 유사한 유전자 및/또는 상동성 또는 유사한 효소, 유사한 유전자 및/또는 유사한 효소 또는 단백질을 식별하기 위해서, 기법들은 또한 후보 유전자 또는 효소에 관한 데이터와 BRENDA, KEGG 또는 MetaCYC와 같은 데이터베이스와의 비교를 포함한다. 상기 후보 유전자 또는 효소를 본 명세서의 교시에 따라 상기 언급된 데이터베이스내에서 식별할 수 있다.
7. 실시예
실시예 1: 파르네실피로포스페이트(FPP) 및 이소프레노이드 파르네신으로 고도로 흐를 수 있는 염기성 효모 균주의 생성
파르네신 생산 균주를 GAL1 또는 GAL10 프로모터의 조절하에서 메발로네이트 경로(도 1C)의 유전자를 발현시킴으로써 야생형 사카로마이세스 세레비지아에 균주(CEN.PK2)로부터 생성시켰다. 상기 균주는 하기의 에스 세레비지아에로부터의 염색체 통합된 메발로네이트 경로 유전자들을 포함하였다: 아세틸-CoA 티올라제, HMG-CoA 신타제, HMG-CoA 리덕타제, 메발로네이트 키나제, 포스포메발로네이트 키나제, 메발로네이트 피로포스페이트 데카복실라제, 및 IPP:DMAPP 이소머라제. 본 명세서에 기재된 모든 유전자들은 공개적으로 입수할 수 있거나 다른 적합한 알고리즘을 사용하여 코돈 최적화되었다. 또한, 상기 균주는 또한 GAL1 또는 GLA10 프로모터의 조절하에서 아르테미시닌 안누아(Artemisinin annua)로부터의 파르네신 신타제의 6개 사본을 함유하였다. 상기 균주는 또한 GAL4oc 프로모터하에서 GAL4의 추가적인 사본 및 GAL80 유전자의 결실을 함유하였으며, 여기에서 상기 사카로마이세스 세레비지아에의 GAL4 유전자의 암호화 서열은 그의 고유 프로모터(PGAL4oc; 예를 들어 문헌[Griggs & Johnston (1991) PNAS 88(19):8597-8601]을 참조하시오)의 "작동성 구성" 버전의 조절성 조절하에 있다. 마지막으로 스쿠알렌 신타제를 암호화하는 ERG9 유전자를, 상기 고유 프로모터를 효모 유전자 MET3의 프로모터(Westfall et al PNAS 2012)로 교체시킴으로써 하향조절한다.
실시예 2. RebA로 고도로 흐를 수 있는 염기성 효모 균주의 생성
도 2A는 FPP에서 스테비올로의 예시적인 생합성 경로를 도시한다. 도 2B는 스테비올에서 글리코시드 RebM으로의 예시적인 생합성 경로를 도시한다. 상술한 파르네신 염기성 균주를 C-20 이소프레노이드 카우렌으로 고도로 흐르도록 전환시키기 위해서, 제라닐제라닐피로포스페이트 신타제(GGPPS)의 6개 사본을 게놈내에 통합시킨 다음, 각각 코팔릴디포스페이트 신타제 및 카우렌 신타제의 4개 사본을 통합시켰다. 이 시점에서 파르네신 신타제의 6개 사본을 상기 균주로부터 제거하였다. 일단 상기 새로운 균주가 ent-카우렌을 생성시키는 것으로 확인되었으면, ent-카우렌을 RebA로 전환시키는 나머지 유전자들을 상기 게놈내에 삽입하였다. 표 4는 FPP를 RebA로 전환시키는데 사용된 모든 유전자 및 프로모터를 나열한다. 카우렌 신타제 뒤의 각각의 유전자를, 2개의 사본을 갖는 Sr.KAH 효소를 제외하고, 단일 사본과 통합시켰다(표 4). 표 1에 기재된 모든 유전자를 함유하는 균주는 주로 RebA를 생성시켰다. 효소 UGT91D_유사3은 RebA에서 레바우디오시드 D(RebD)로의 약간 낮은 활성을 갖는다. 우리는 UGT91D_유사3의 단일 사본이 상기 기재된 효모 균주 중에서 생체내에서 상기 균주 중 RebA의 대략 3%를 RebD로 전환시킬 수 있음을 측정하였다(도 3 및 표 5). 이어서 UGT76G1은 RebD를 최종 생성물 RebM으로 전환시킬 수 있다.
실시예 3. RebA를 RebD로 전환시키는 신규의 UDP-글리코실트랜스퍼라제(UGT) 효소를 선별하기 위한 균주의 생성
생체내에서 RebA의 RebD로의 전환을 신속하게 선별하기 위한 선별 균주를 생성시키기 위해서, 랜딩 패드(landing pad)를 상술한 RebA 균주내에 삽입하였다. 상기 랜딩 패드는 ALG1 개방 판독 프레임의 하류 게놈 영역에 대한 상기 구조물의 어느 한 단부상에 500 bp의 유전자좌-표적화 DNA 서열들로 이루어졌다(도 4). 내부적으로, 상기 랜딩 패드는 PGAL1 프로모터 및 엔도뉴클레아제 인식 부위(F-CphI)의 측면에 인접한 효모 종결자를 함유하였다.
실시예 4. 생체내에서 RebA를 RebD로 고효율로 전환시키는 UGT 유전자에 대한 선별
진뱅크(Genbank)로부터 수득한 100개의 UGT 효소에 대해서 에스 세레비지아에에서의 최적 발현을 위해 코돈 최적화하고 상술한 랜딩 패드에서 F-CphI 서열에 측면 인접한 효모 종결자 및 PGAL1에 대해 60 bp의 서열 상동성으로 합성하였다. 각각의 합성된 UGT 유전자를, 상술한 효모 균주에서 생체내에서 RebA를 RebD로 전환시키는 능력에 대해 단일 사본으로 개별적으로 시험하였다. 효모를 UGT 공여체 DNA 및 엔도뉴클레아제 F-CphI를 함유하는 플라스미드로 형질전환시켜 상기 랜딩 패드 중의 상기 DNA를 절단하였다. 정확한 통합을 각각의 형질전환에서 특정한 UGT 유전자 내부의 역방향 프라이머 및 ALG1 ORF의 단부의 범용 순방향 프라이머를 사용하여 콜로니 PCR에 의해 확인하였다.
실시예 5. 효모 형질전환 방법
각각의 DNA 구조물을 최적화된 리튬 아세테이트(LiAc) 형질전환에서 표준 분자 생물학 기법으로 사카로마이세스 세레비지아에(CEN.PK2)에 통합시켰다. 간단히, 세포를, 100 ㎖ YPD 중에서 0.1의 OD600으로 희석한 효모 추출물 펩톤 덱스트로스(YPD) 배지에서 30 ℃에서 진탕시키면서(200 rpm) 밤새 생육시키고, 0.6 내지 0.8의 OD600으로 증식시켰다. 각각의 형질전환에 대해서, 5 ㎖의 배양물을 원심분리에 의해 수확하고, 5 ㎖의 멸균수로 세척하고, 다시 회전시키고, 1 ㎖의 100 mM LiAc에 재현탁시키고, 미세원심분리기 튜브로 옮겼다. 세포를 30초 동안 회전시키고(13,000xg), 상등액을 제거하고, 세포를 240 ㎕ 50% PEG, 36 ㎕ 1 M LiAc, 10 ㎕ 끓인 연어 정자 DNA, 및 74 ㎕의 공여체 DNA로 이루어진 형질전환 믹스에 재현탁시켰다. 엔도뉴클레아제 F-Cph1의 발현이 필요한 형질전환의 경우, 상기 공여체 DNA는 발현을 위해 효모 TDH3 프로모터하에서 발현되는 F-CphI 유전자를 갖는 플라스미드를 포함하였다. 상기는 랜딩 패드 중 F-CphI 엔도뉴클레아제 인식 부위를 절단하여 상기 UGT 유전자의 통합을 용이하게 할 것이다. 42 ℃에서 40분간 열충격에 이어서, 세포를 선택성 배지상에 도말 전에 YPD 배지에서 밤새 회수하였다. DNA 통합을 상기 통합에 특이적인 프라이머와 함께 콜로니 PCR에 의해 확인하였다.
실시예 6. 효모 배양 조건
예상되는 UGT 유전자를 함유하는 것으로 확인된 효모 콜로니를, 20 g/ℓ 슈크로스 및 37.5 g/ℓ 암모늄 설페이트와 함께 버드 시드 배지(BSM, 문헌[van Hoek et al., Biotechnology and Bioengineering 68(5), 2000, pp. 517-523]에 최초로 기재됨)를 함유하는 96-웰 미세적정 플레이트에 채집하였다. 세포를 30 ℃ 및 80% 습도에서 1000 rpm에서 진탕하는 고용량 미세적정 플레이트 배양기에서 3일간 배양물이 탄소 고갈에 도달할 때까지 배양하였다. 상기 증식-포화된 배양물을 40 g/ℓ 슈크로스 및 150 g/ℓ 암모늄 설페이트와 함께 BSM을 함유하는 신선한 플레이트내로, 상기 포화된 배양물로부터 14.4 ㎕를 취하고 360 ㎕의 신선한 배지에 희석함으로써 계대배양하였다. 상기 생산 배지 중의 세포를 추출 및 분석에 앞서 1000 rpm 및 80% 습도에서 추가로 3일 동안 고용량 미세적정 플레이트 진탕기에서 30 ℃에서 배양하였다. 종료시 상기 전세포 브로쓰를 360 uL의 100% 에탄올로 희석하고, 호일 씰로 밀봉하고, 1250 rpm에서 30분간 진탕시켜 스테비올 글리코시드를 추출하였다. 490 uL의 50:50 에탄올:수를 새로운 1.1 ㎖ 분석 플레이트에 가하고 10 uL의 배양물/에탄올 혼합물을 상기 분석 플레이트에 가한다. 상기 혼합물을 원심분리시켜 임의의 고체를 펠릿화하고, 400 uL의 상기 용액을 새로운 1.1 ㎖ 플레이트로 옮기고 LC-MS에 의해 분석하였다.
실시예 7. 분석 방법
샘플을 하기의 구배(이동상 A: H2O 중 0.1% 포름산; 이동상 B: 아세토니트릴 중 0.1% 포름산)로 시그마 아센티스 익스프레스 펩티드(Sigma Ascentis Express Peptide) ES-C18(5 ㎝, 2.1 ㎜, 2.7 um; 파트 #53301-U)를 사용하여 LC-MS 질량 분광계(AB QTrap 4000)에 의해 분석하였다:
[표 2]
상기 질량 분광계를 음이온 다중 반응 모니터링 방식으로 작동시켰다. 각각의 레바우디오시드 이성질체를, 진성 표준 및 MRM 이행으로부터 측정된 체류 시간에 의해 식별하였다:
[표 3]
질량 분광계로부터의 크로마토그램으로부터 피크 면적을 사용하여 보정 곡선을 생성시켰다. 관련 화합물들(즉 RebA, RebD, RebM)의 몰비를, 진성 표준을 사용하여 외부 보정을 통해 각 화합물의 몰량을 정량분석하고 이어서 적합한 비를 취함으로써 측정하였다.
NMR 분석을 수행하여 RebM이 유전자 변형된 균주로부터 생산되었음을 확인하였다. 발효 후에, 균주를 발효 브로쓰로부터 제거하였다. 스테비올 글리코시드를 남아있는 액체 배지로부터 정제하였다. NMR 분석에 적합한 임의의 방법, 예를 들어 WO/2017/093895 및 WO/2016/028899에 기재된 것들을 사용할 수 있다.
실시예 8. RebA를 RebD로 전환시키는 능력이 큰 것으로 밝혀진 UGT 효소들
6개의 UGT 효소가 RebA를 RebD로 전환시키는 능력이 큰 것으로 밝혀졌다(도 3). 이들 효소의 성능을, 또한 RebA의 RebD로의 전환을 수행하는 것으로서 문헌에 기재된 2개의 다른 UGT 효소, Os_UGT_91C1(즉 WO 2013/022989 A2에 기재된 EUGT11) 및 Sl_UGT_101249881(즉 WO2014/193888 A1에 기재된 UGTSL2)에 대해 벤치마킹하였다. 표 5는 [Reb(D+M)의 마이크로몰/(A+D+M)의 마이크로몰]의 중간비를 나열하며; RebA, RebD, 및 RebM을 상술한 바와 같이 생체내에서 측정하였다. 상기 비는 RebA에서 RebD로의 전환 효율의 척도이다. [Reb(A+D+M)]의 uM의 합은 세포에서 생성되었던 총 RebA이다. [Reb(D+M)]의 uM의 합은 세포에서 생성되었던 총 RebD이다. 도 5a-i는 도 3 및 표 2의 모든 UGT 유전자들에 대한 RebE, RebA, RebD, RebM, 및 RebM2의 크로마토그램을 나타낸다. RebM2는 단일의 잘못된 글루코스 결합을 갖는 RebM의 이성질체이다. RebM2는 19번 탄소 위치(COOH)에 RebM에 대한 목적하는 Glcβ(1-2)[Glcβ(1-3)]Glcβ1- 대신에 Glcβ(1-2)[Glcβ(1-6)]Glcβ1-을 갖는다.
실시예 7에 기재된 NMR 방법을 사용하여, UGT40087을 포함하는 균주로부터 생성된 샘플 생성물을 ID 및 2D NMR 분광학에 대해 표준 RebM과 비교하였다. 메탄올 및 피리딘 중에서 기록된 1D 및 2D NMR 스펙트럼의 오버레이는 상기 두 화합물이 모두 일치함을 입증하였다. 2D NMR 데이터의 상세한 해석 및 문헌에 공개된 데이터와의 비교는 상기 두 샘플이 모두 RebM임을 입증하였다.
0.5 또는 2.0 리터의 발효 용기에서, UGT40087은 상이한 균주 배경에서 발현시, RebA, RebD 및 RebM을 약 1:7:50의 약 RebA:RebD:RebM의 비로 생성시켰다.
[표 4]
[표 5]
실시예 9: RebA를 RebD로 전환시키는 표 5의 효소들의 특이성
표 5에 나열된 효소들은 베타-1,2-연결된 글리코시드 결합의 형성을 통해 RebA의 19-O-글루코스의 C-2' 위치상에 글루코스 당의 첨가에 의해 RebA의 RebD로의 전환을 촉매화할 수 있다. 몇몇 실시태양에서, 이종 숙주에서 RebM의 생물공학적 생산은 RebM을 (1) 고순도로 (2) 임의의 "비-천연" 스테비올 글리코시드의 생산 없이 생산하는 것이 바람직할 수 있다. 시중에 판매된 임의의 제품은 아마도 최상의 풍미 프로파일을 보장하고 다수의 인간 식품 규제 표준을 충족시키기 위해 대단히 높은 순도를 요할 것이다. RebM 이외의 스테비올 글리코시드의 존재는 아마도 고도로 순수한 RebM을 수득하기 위한 하류 가공 비용을 증가시킬 것이다. 상당량의 비-RebM 스테비올 글리코시드가 존재한다면, 이는 상기 RebM 생성물의 최종 순도를 잠재적으로 훼손시킬 수 있을 것이다. 몇몇 실시태양에서, 이종 효소가 어떠한 "비-천연" 스테비올 글리코시드도 생산하지 않는 것이 유리할 수 있을 것이다. "비-천연" 스테비올 글리코시드는 본 명세서에서 스테비아 레바우디아나 식물에서 자연적으로 발생하지 않는 것으로 공지된 임의의 스테비올 글리코시드로서 정의된다.
상술한 이유들로 인해, 표 5에 나열된 모든 효소를 그들의 불순도 프로파일에 대해 검사하여, 이들이 임의의 예상치않은 또는 비-천연 스테비올 글리코시드를 생성시키는 지의 여부를 측정하였다(도 2B에 나타내지 않는다). 표 2에 나열된 모든 효소에 대한 보다 긴 체류 시간 동안의 크로마토그래피 자취를 추가로 분석하였다. 50%를 초과하는 전환 효율을 갖는 모든 효소 중에서, 예상치않은 생성물을 생성시키지 않은 유일한 효소들은 UGT40087 및 Os_UGT_91C1(EUGT11)이었다. 예상된 바와 같이, UGT91D_유사3은 상기 크로마토그램 중에 예상치않은 피크들을 생성시키지 않았다.
50%를 초과하는 전환 효율을 갖는 효소들 중에서, 이들 효소의 크로마토그래픽 자취는 비천연 글리코시드와 관련된 하나 이상의 예상치않은 피크들을 생성시켰다. 예를 들어, Ob_UGT91B1_유사의 크로마토그래픽 자취는 약 6.61분의 체류 시간에서 RebA 피크와 RebB 피크간에 예상치않은 피크(스테비올+2 글루코스)를 생성시켰다. 상기 Ob_UGT91B1_유사의 예상치않은 피크의 강도는 RebA 피크의 경우보다 적어도 31배는 더 컸다. 도 9c를 참조하시오. 상기 예상치않은 피크(스테비올+2 글루코스)는 모 대조용 균주(UGT74G1, UGT85C2, UGT76G1, 및 UGT91D_유사3)로부터 또는 UGT40087을 포함하는 균주로부터의 크로마토그래픽 자취 중에 존재하지 않는다. 도 9b 및 9c를 참조하시오. 또 다른 예에서, Hv_UGT_V1의 크로마토그래픽 자취는 약 6.61분의 체류 시간에서 RebA 피크와 RebB 피크간에 예상치않은 피크(스테비올+2 글루코스)를 생성시켰다. 상기 Hv_UGT_V1의 예상치않은 피크의 강도는 RebA 피크의 경우보다 0.6 인자 더 낮았다. 또 다른 예에서, Sl_UGT_101249881의 크로마토그래픽 자취는 약 6.67분의 체류 시간에서 RebA 피크와 RebB 피크간에 예상치않은 피크(스테비올+2 글루코스)를 생성시켰다. 상기 Sl_UGT101249881의 예상치않은 피크의 강도는 RebA 피크의 경우보다 약 1.11배 더 컸다. 또 다른 예에서, Sr.UGT_g252778의 크로마토그래픽 자취는 약 6.67분의 체류 시간에서 RebA 피크와 RebB 피크간에 예상치않은 피크(스테비올+2 글루코스)를 생성시켰다. 상기 Sr.UGT_g252778의 예상치않은 피크의 강도는 RebA 피크의 경우보다 약 0.96인자 더 낮았다. 이들 효소 중 일부는 또한 추가적인 예상치않은 피크들을 생성시켰다. Hv_UGT_V1, Sl_UGT_101249881, 및 Sr.UGT_g252778에 대한 크로마토그래픽 자취는 생략된다.
이들 결과는 상기 2개 효소 UGT40087 및 Os_UGT_91C1(EUGT11)에 비해, 50% 초과의 A에서 D로의 전환 효율을 갖는 다른 3개의 효소(즉 Hv_UGTV1, SI_UGT_101249881, 및 Sr.UGT_g252778)가 추가적인 반응들을 촉매화하여, 스테비아 레바우디아나 식물에서 RebM으로의 경로에서 통상적으로 생성되지 않는 스테비올 글리코시드를 잠재적으로 생산할 수 있음을 가리킨다.
[표 6]
실시예 10: UGT40087 효소 활성은 19-O-글루코스 스테비올 글리코시드의 C-2' 위치에 특이성이다.
UGT40087은 스테비오시드 또는 RebA의 19-O-글루코스의 C-2'에의 제2 당 부분의 부가 반응을 촉매화한다. 도 5a 및 5i에 나타낸 바와 같이, UGT40087이 없는 모 대조용 균주(실시예 2에 기재된 바와 같은)는 RebA를 생성시킬 수 있지만, 검출 가능한 양의 RebE, RebD 또는 RebM은 생성시키지 못한다. 이제 상기 모 세포에의 UGT40087의 첨가는 검출 가능한 양의 RebE를 생성시키며, 이는 UGT40087이 스테비오시드의 베타-1,2 결합에서 19-O-글루코스의 C-2' 위치에 제2 글루코스 부분의 첨가를 촉매화하여 RebE를 생성시킴을 가리킨다. 또한, RebD 및 RebM에 대한 2개의 새로운 피크가 UGT40087을 함유하는 균주에 대한 크로마토그램에 나타나는 반면, RebA에 대한 피크는 UGT40087이 없는 모 균주에 비해 현저하게 감소된다. 따라서, UGT40087은 레바우디오시드 A의 레바우디오시드 D에의 베타-1,2 결합에서 19-O-글루코스의 C-2' 위치에 제2 글루코스 부분의 첨가를 촉매화할 수 있다. 상기 균주 중의 UGT76G1의 존재는 최종 글루코수 첨가를 촉매화하여 RebD를 RebM으로 전환시킨다.
스테비올모노시드 또는 루부소시드의 베타-1,2 결합에서 13-O-글루코스의 C-2' 위치에 당을 첨가하는 능력을 선별하기 위해서, 오직 루보소시드로만 고도의 흐름을 갖는 염기성 균주를 제조하였다. 상기 루부소시드 염기성 균주는, 상기 루부소시드 염기성 균주가 효소 UGT91D_유사3을 함유하지 않음을 제외하고, 실시예 2에 기재된 RebA 염기성 균주와 유전학적으로 동일성이다. 표 7에 나타낸 바와 같이, UGT74G1, UGT85C2, 및 UGT76G1을 갖는 루부소시드 염기성 균주는 오직 19-글리코시드, 스테비올모노시드 및 루부소시드를 생성시킬 수 있을 뿐이다. 상기 균주에 UGT40087을 첨가하는 것은 상기 프로파일을 전혀 변화시키지 않는다. UGT40087이 스테비올모노시드 또는 루부소시드의 베타-1,2 결합에서 13-O-글루코스의 C-2' 위치에 당을 첨가할 수 있었다면, 스테비올비오시드 또는 스테비오시드 중 어느 하나 또는 둘 다는 검출가능한 양으로 존재해야 한다. 스테비올비오시드, 스테비오시드 및 또한 RebA는 상기 균주를 UGT91D_유사3(상기는 스테비올모노시드 및 루부소시드 모두의 베타-1,2 결합에서 13-O-글루코스의 C-2' 위치에 당을 첨가할 수 있다)으로 형절전환시킬 때 나타난다.
EUGT 11(Os_UGT_91C1)은 앞서 19-O-스테비올 글리코시드 또는 13-O-스테비올 글리코시드의 C-2' 위치에 제2 당 부분의 첨가를 촉매화하는 다른 것들에 의해 특성화되었다. WO 2013/022989의 도 5를 참조하시오. 상기에 나타낸 바와 같이, UGT40087은 스테비올모노시드 또는 루부소시드의 베타-1,2 결합에서 13-O-글루코스의 C-2' 위치에의 당 첨가를 검출 가능한 수준으로 촉매화하는 것으로 보이지 않는다. 이러한 결과는 UGT40087이 EUGT11에 비해 기능적으로 구별가능하고 상이한 결과를 생성시키는 UDP-글리코실트랜스퍼라제임을 가리킨다.
[표 7]
실시예 11. N-말단 도메인 교환에 의한 UGT 키메라의 조작
식물 UDP-글리코실트랜스퍼라제(UGT)들은 비교적 낮은 아미노산 서열 상동성을 갖는다 하더라도 고도로 보존된 단백질 구조를 공유한다. 이들 UGT(소위 GT-B 구조적 폴드를 채용한다)는 2개의 도메인으로 이루어지며, 그들의 1차 아미노산 서열의 중간-점에서 대충 끊긴다. N-말단 도메인은 주로 기질 특이성을 결정하는 당 수용체 도메인이다. 예상되는 바와 같이, 상기 도메인은 그의 아미노산 서열의 면에서 보다 가변적인 도메인이며, UGT에 의해 글리코실화될 수 있는 다양한 기질들을 반영한다. 보다 보존된 C-말단 도메인은 당 공여체 도메인이며, 여기에서 UDP-글루코스가 결합된다. 상기 두 도메인은 대개 가요성 링커에 의해 연결되어 도메인 교환 디자인을 위해 상기 단백질을 분할하기에 이상적인 영역을 생성시킨다(도 6). UGT의 고도로 보존된 도메인 구조의 성질이 주어진다면, 임의의 2개의 UGT로부터의 도메인들을 재조합시켜 기질 특이성을 변경시키거나 목적하는 기능, 예를 들어 촉매 활성을 증대시킬 수 있을 것이다. 본 실시예에서, 우리는 다수의 UGT 키메라를 도메인 교환을 통해 설계함으로써 기질 특이성, 즉 RebA를 RebD로 전환시키는 활성에 관하여 UGT40087의 N-말단 도메인의 역할을 조사하였다.
도메인 교환 실험을 설계하기 위해 고려되는 일반적인 접근법은 하기의 단계들을 수반한다: 1) 교환 후보 쌍을 선택하고, 2) 상기 UGT 쌍 사이에 키메라를 생성시키기 위한 도메인 교환 부위를 선택하고(임의로 표적화된 기질과의 상호작용을 개선시키기 위한 C-말단 도메인 및 N-말단 도메인을 돌연변이시키기 위해), 3) 목적하는 활성을 위해 키메릭 단백질을 생성시키고, 시험하고 전개시킨다. 상기 접근법은 본 실시예에서 하기에 기재되는 바와 같은 도메인 교환을 수행하기 위해 고려되었다.
4개의 UGT를 키메라 구성을 위한 모체로서 선택하였다: UGT40087 (서열번호 11), UGT Si91D유사 (서열번호 12), OS_UGT_91C1 (서열번호 8), 및 91D유사3 (서열번호 7). UGT40087의 N-말단 도메인을 사용하여 Si91D유사, OS_UGT_91C1 및 91D유사3의 N-말단 도메인을 교체시켜, UGT40087에 대해 각각 97%, 79% 및 71%의 전체 서열 동일성을 갖는 3개의 키메라를 생성시켰다.
SWISS-MODEL을 사용하여 4개의 UGT 모두에 대한 구조적 모델을 생성시켰다. 정확한 아미노산 위치("교환 부위")를 구조적 정렬 및 서열 정렬에 기반하여 선택하였다. 상기 키메릭 단백질의 3차원 폴딩에 대한 동요를 최소화하기 위해서, 상기 효소의 2개의 분명한 절반을 구성하는 N- 및 C-말단 도메인 사이에 위치한 가요성 영역(도 6)을 교환 부위에 사용하였다. 상기 영역 중 Gly215 및 Leu216(아미노산 번호는 UGT40087에 관한 것이다)는 본 실시예에서 4개의 UGT를 포함하여 모든 UGT에서 고도로 보존된다. 따라서, 상기 2개의 도메인은 도메인 교환을 위해 상기 2개 잔기 사이에서 분할되었다(도 6).
도메인 교환 효과를 시험하기 위해서, 상이한 UGT를 포함함을 제외하고 유전학적으로 일치하는 효모 균주들에서 실험을 수행하였다. 상기 효모 균주는 그러나 실시예 4에 기재된 UGT 다양성 선별에 사용된 것들과 유전학적으로 상이하다. 실시예 4 내지 7에 기재된 일반적인 방법을 균주 형질전환, 배양 및 분석에 사용하였다. 다양한 도메인 교환 디자인의 RebA에서 RebD로의 전환비를 하기 표 8에 나타낸다.
[표 8]
UGT40087은 Si91D유사, Os_UGT_91C1 및 91D유사3과 각각 90%, 54% 및 36%의 전체적인 서열 동일성을 공유한다. 91D유사3(UGT40087에 대해 N- 및 C-말단 서열 모두에서 대략적으로 40%의 서열 동일성을 갖는다)을 제외하고, 상기 Si91D유사 및 Os_UGT_91C1의 UGT40087 N-말단 도메인 및 C-말단 도메인의 키메라들은 RebA에서 RebD로의 전환에서 활성이다(표 8). Si91D유사가 검출 가능한 활성을 갖지 않는다 하더라도, 그의 N-말단 도메인의 UGT40087의 N-말단 도메인에 의한 교체는 상기 UGT40087 활성의 전부를 부여하였으며, 이는 UGT40087의 N-말단 도메인이 RebA에서 RebD로의 전환에 중요함을 가리킨다.
상기 4개의 모 UGT의 정렬은 또한, RebA에서 RebD로의 전환에 대해서 2개의 활성 효소(UGT40087 및 Os_UGT_91C1)에 의해 공유되지만 2개의 불활성 효소(Si9D유사 및 91D유사3)의 경우와 상이한 6개의 N-말단 아미노산 잔기(UGT40087에서 V11, I12, P55, E90, S203, E223, 및 V413; 도 8 - 서열 정렬 도면)를 밝혀낸다.
실시예 12. N-말단 고리 교환에 의한 UGT 변체의 조작
UGT40087 및 Os_UGT_91C1의 모델 구조의 비교는 N 말단 당 수용체 도메인에서 현저한 입체형태적 차이를 갖는 4개의 고리를 밝혀내었다. 상기 고리 위치를 도 6에 나타낸다. RebA에서 RebD로의 전환에 대한 UGT40087의 우수한 활성에 기여할 수 있는 고리들을 식별하기 위해서, 이들 각각의 고리를 상기 2개의 단백질에서 교환하여 총 12개의 UGT 변체를 생성시켰다. 고리_3 및 고리_4의 2개의 버전을, 2개의 가능한 고리 길이를 설명하기 위해 설계하였다. 상세한 디자인들을 표 9 및 10에 나열한다.
[표 9]
표 9에서, 아래첨자를 갖는 2개의 아미노산 잔기들간의 서열 ID 번호를 갖는 아미노산 서열은 Os_UGT_91C에서부터 UGT40087 염기로 교환되는 고리 영역이다. Os_UGT_91C로부터 교환된 고리 영역에 인접한 아래첨자를 갖는 2개 아미노산 잔기 및 아래첨자 번호는 각각, 상기 교환된 고리 영역의 통합 전에 UGT40087의 아미노산 잔기 및 아미노산 위치에 상응한다. 표 9에 나열된 새로운 키메릭 UGT에서, Os_UGT_91C로부터의 교환된 고리 영역은 상기 UGT40087 염기의 상응하는 고리 영역과 교체되었다.
UGT40087_고리1에 통합된, 교환된 고리 영역인 서열번호 27의 아미노산 서열은 Os_UGT_91C1의 원래 고리 1의 변형된 버전임에 유의한다. 보다 구체적으로, 서열번호 27의 서열 중 12번째 아미노산 잔기는 프롤린(서열번호 8을 갖는 Os_UGT_91C의 원래 고리1 중 상응하는 위치에 존재하는 아르기닌 대신에)이다. 따라서, UGT40087_고리1에서, 서열번호 11을 갖는 UGT40087의 원래 서열에 비해, 51번 위치에 단일 아미노산 치환, 프롤린이 존재한다. UGT40087_고리1 중 51번 위치에서 치환된 프롤린의 위치를 표 9에 굵은 글씨로 나타낸다.
[표 10]
표 10에서, 아래첨자를 갖는 2개의 아미노산 잔기들간의 서열 ID 번호를 갖는 아미노산 서열은 UGT40087에서 Os_UGT_91C1 염기로 교환되는 고리 영역이다. UGT40087로부터 교환된 고리 영역에 인접한 아래첨자를 갖는 2개 아미노산 잔기 및 아래첨자 번호는 각각, 상기 교환된 고리 영역의 통합 전에 Os_UGT_91C1의 아미노산 잔기 및 아미노산 위치에 상응한다. 표 10에 나열된 새로운 키메릭 UGT에서, UGT40087로부터의 교환된 고리 영역은 상기 Os_UGT_91C1 염기의 상응하는 고리 영역과 교체되었다.
Os_UGT_91C1_고리1에 통합된, 교환된 고리 영역인 서열번호 28의 아미노산 서열은 UGT40087의 원래 고리 1의 변형된 버전임에 유의한다. 보다 구체적으로, 서열번호 28의 서열 중 12번째 아미노산 잔기는 아르기닌(서열번호 11을 갖는 UGT40087의 원래 고리1 중 상응하는 위치에 존재하는 프롤린 대신에)이다. 따라서, Os_UGT_91C1_고리1에서, 서열번호 8을 갖는 Os_UGT_91C1의 원래 서열에 비해, 58번 위치에 단일 아미노산 치환, 아르기닌이 존재한다. Os_UGT_91C1_고리1 중 58번 위치에서 치환된 아르기닌의 위치를 표 10에 굵은 글씨로 나타낸다.
상기 변형 단백질들을 실시예 4에 기재된 랜딩 패드 중의 GAL1 프로모터 및 F-CphI 서열에 측면 인접하는 효모 종결자에 상동성인 60 bp의 서열로 트위스트 바이오사이언스(Twist Bioscience)에 의해 합성하였다. 각각의 합성된 UGT 변체를 UGT 도메인 교환 키메라 실험을 위해 실시예 11에서와 동일한 균주 배경에서 RebA에서 RebD로의 전환에 대한 그의 활성에 대해서 단일 염색체 사본으로서 개별적으로 시험하였다. 상기 균주를 생성시키기 위해서, UGT 키메라 공여체 DNA 및 엔도뉴클레아제 F-CphI를 함유하는 플라스미드를 상기 효모 숙주내로 형질전환시켰다. 상기 통합 유전자좌의 단부에서 범용 순방향 프라이머 및 특이적인 UGT 유전자 내부의 역방향 프라이머를 사용하여 콜로니 PCR에 의해 정확한 통합을 확인하였다. 상기 확인된 균주들을 상술한 바와 같이 RebA에서 RebD로의 전환에 대해 시험하였다.
[표 11]
[표 12]
모체로서 UGT40087을 사용하는 경우, 상기 고리-교환 변체는, UGT40087_고리4_2를 제외하고, 모두 RebA에서 RebD로의 전환에 활성이었다(표 11). 고리4_2는 N- 및 C-말단 도메인 계면에 가깝게 위치하는 긴 서열이며, 그의 교체는 상기 변체의 전체적인 구조에 현저한 동요를 생성시킬 수 있다. 상기 모든 활성 변체 중에서, UGT40087에 대한 N-말단 서열 동일성 범위는 84%(고리4_1) 내지 99%(고리1)이다.
모체로서 Os_UGT_91C1을 사용하는 경우, 상기 고리-교환 변체의 대부분은 또한 RebA에서 RebD로의 전환에 활성을 나타내었다(표 12). 다시, 고리4_2 교환은 상기 활성을 없앴으며, 이는 그의 교체가 상기 변체의 구조적 완전성에 영향을 미칠 수 있다는 가설을 지지한다. 현저하게, 상기 고리4_1의 통합은 증가된 RebA에서 RebD로의 전환(88%에서 97%로)을 도출하였으며, 이는 고리4_1이 UGT40087의 우수한 활성 부여에 기여함을 가리킨다. 또한, 모체로서 상기 두 단백질 모두를 사용한 고리 교환 실험으로부터의 결과는 또한 이들 고리 영역이 RebA에서 RebD로의 활성을 갖는 UGT의 활성 및 기질 특이성에 있어서 차이를 부여하는데 중요하며, 이들 고리 영역의 상동성 고리 변체의 추가적인 교환 또는 돌연변이유발을 사용하여 RebA의 RebD로의 전환에 개선된 UGT 변체를 생성시킬 수 있음을 입증하였다.
본 명세서에 인용된 모든 공보, 특허 및 특허 출원들은 각각의 개별적인 공보 또는 특허 출원이 구체적이고 개별적으로 참고로 인용됨을 가리키는 바와 같이 본 명세서에 참고로 인용된다. 상기 발명을 이해의 명확성을 위해 예시 및 실시예에 의해 일부 상세히 기재하였지만, 당해 분야의 숙련가들에게는 본 발명의 교시에 비추어 첨부된 청구항들의 진의 또는 범위로부터 이탈됨 없이 본 발명에 대해 몇몇 변화 및 변형을 수행할 수 있음이 쉽게 자명할 것이다.
SEQUENCE LISTING
<110> AMYRIS, INC.
<120> UDP-DEPENDENT GLYCOSYLTRANSFERASE FOR HIGH EFFICIENCY PRODUCTION
OF REBAUDIOSIDES
<130> IPA190070-US
<150> US 62/374,408
<151> 2016-08-12
<160> 30
<170> PatentIn version 3.5
<210> 1
<211> 436
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic: UGT40087 version 1
<400> 1
Met Asp Ala Ser Asp Ser Ser Pro Leu His Ile Val Ile Phe Pro Trp
1 5 10 15
Leu Ala Phe Gly His Met Leu Ala Ser Leu Glu Leu Ala Glu Arg Leu
20 25 30
Ala Ala Arg Gly His Arg Val Ser Phe Val Ser Thr Pro Arg Asn Ile
35 40 45
Ser Arg Leu Arg Pro Val Pro Pro Ala Leu Ala Pro Leu Ile Asp Phe
50 55 60
Val Ala Leu Pro Leu Pro Arg Val Asp Gly Leu Pro Asp Gly Ala Glu
65 70 75 80
Ala Thr Ser Asp Ile Pro Pro Gly Lys Thr Glu Leu His Leu Lys Ala
85 90 95
Leu Asp Gly Leu Ala Ala Pro Phe Ala Ala Phe Leu Asp Ala Ala Cys
100 105 110
Ala Asp Gly Ser Thr Asn Lys Val Asp Trp Leu Phe Leu Asp Asn Phe
115 120 125
Gln Tyr Trp Ala Ala Ala Ala Ala Ala Asp His Lys Ile Pro Cys Ala
130 135 140
Leu Asn Leu Thr Phe Ala Ala Ser Thr Ser Ala Glu Tyr Gly Val Pro
145 150 155 160
Arg Val Glu Pro Pro Val Asp Gly Ser Thr Ala Ser Ile Leu Gln Arg
165 170 175
Phe Val Leu Thr Leu Glu Lys Cys Gln Phe Val Ile Gln Arg Ala Cys
180 185 190
Phe Glu Leu Glu Pro Glu Pro Leu Pro Leu Leu Ser Asp Ile Phe Gly
195 200 205
Lys Pro Val Ile Pro Tyr Gly Leu Val Pro Pro Cys Pro Pro Ala Glu
210 215 220
Gly His Lys Arg Glu His Gly Asn Ala Ala Leu Ser Trp Leu Asp Lys
225 230 235 240
Gln Gln Pro Glu Ser Val Leu Phe Ile Ala Leu Gly Ser Glu Pro Pro
245 250 255
Val Thr Val Glu Gln Leu His Glu Ile Ala Leu Gly Leu Glu Leu Ala
260 265 270
Gly Thr Thr Phe Leu Trp Ala Leu Lys Lys Pro Asn Gly Leu Leu Leu
275 280 285
Glu Ala Asp Gly Asp Ile Leu Pro Pro Gly Phe Glu Glu Arg Thr Arg
290 295 300
Asp Arg Gly Leu Val Ala Met Gly Trp Val Pro Gln Pro Ile Ile Leu
305 310 315 320
Ala His Ser Ser Val Gly Ala Phe Leu Thr His Gly Gly Trp Ala Ser
325 330 335
Thr Ile Glu Gly Val Met Ser Gly His Pro Met Leu Phe Leu Thr Phe
340 345 350
Leu Asp Glu Gln Arg Ile Asn Ala Gln Leu Ile Glu Arg Lys Lys Ala
355 360 365
Gly Leu Arg Val Pro Arg Arg Glu Lys Asp Gly Ser Tyr Asp Arg Gln
370 375 380
Gly Ile Ala Gly Ala Ile Arg Ala Val Met Cys Glu Glu Glu Ser Lys
385 390 395 400
Ser Val Phe Ala Ala Asn Ala Lys Lys Met Gln Glu Ile Val Ser Asp
405 410 415
Arg Asn Cys Gln Glu Lys Tyr Ile Asp Glu Leu Ile Gln Arg Leu Gly
420 425 430
Ser Phe Glu Lys
435
<210> 2
<211> 449
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic: sr.UGT_g252778
<400> 2
Met Ala Thr Asn Asp Asp Asp Arg Lys Gln Leu His Val Ala Met Phe
1 5 10 15
Pro Trp Leu Ala Phe Gly His Ile Leu Pro Phe Leu Glu Leu Ser Lys
20 25 30
Leu Ile Ala Gln Asn Gly His Lys Val Ser Phe Leu Ser Thr Thr Arg
35 40 45
Asn Ile Gln Arg Leu Pro Ser His Leu Thr Pro Leu Ile Asn Leu Val
50 55 60
Lys Leu Thr Leu Pro Arg Val Gln Glu Leu Pro Glu Asp Ala Glu Ala
65 70 75 80
Thr Thr Asp Ile Lys His Asp Asp Gln Asp His Leu Leu Asn Ala Ser
85 90 95
Asp Gly Leu Gln Pro Glu Val Thr Arg Phe Leu Glu Glu Glu Ser Pro
100 105 110
Asp Trp Ile Ile Phe Asp Tyr Ser Tyr Tyr Trp Leu Pro Pro Val Ala
115 120 125
Ala Glu Leu Gly Ile Ser Arg Ala Phe Phe Met Thr Phe Pro Thr Trp
130 135 140
Thr Met Ala Leu Thr Arg Leu Pro Ser Asp Gln Leu Thr Ala Glu Asp
145 150 155 160
Leu Met Thr Leu Ser Lys Ile Ser Phe Lys Lys His Glu Ile Val Asn
165 170 175
Leu Met Tyr Gly Thr Ser Thr Gln Gly Asp Leu Tyr Arg Leu Thr Met
180 185 190
Ala Cys Asn Gly Ser Asp Cys Ile Leu Ile Arg Cys Cys Tyr Glu Phe
195 200 205
Glu Pro Gln Trp Leu Thr Leu Leu Glu Lys Leu Leu Pro Val Pro Val
210 215 220
Val Pro Val Gly Leu Leu Pro Pro Glu Ile His Gly Asp Glu Lys Asp
225 230 235 240
Asp Asp Thr Trp Val Ser Val Lys Glu Trp Leu Asp Gly Gln His Lys
245 250 255
Gly His Val Val Tyr Val Ala Leu Gly Ser Glu Ala Met Val Ser Lys
260 265 270
Asp Glu Leu Gly Glu Leu Ala Leu Gly Leu Glu Leu Ser Gly Leu Pro
275 280 285
Phe Phe Trp Ala Leu Arg Lys Pro Pro Gly Ser Thr Glu Ser Asp Ser
290 295 300
Val Glu Leu Pro Asp Gly Phe Met Glu Arg Thr Arg Asn Arg Gly Val
305 310 315 320
Val Trp Thr Ser Trp Ala Pro Gln Leu Arg Ile Leu Ser His Glu Ser
325 330 335
Val Cys Gly Phe Leu Thr His Cys Gly Val Ser Ser Ile Val Glu Gly
340 345 350
Leu Met Phe Gly His Pro Leu Ile Met Leu Pro Ile Phe Gly Asp Gln
355 360 365
Ile Met Asn Ala Gln Val Leu Ala Asp Lys Gln Val Gly Ile Glu Ile
370 375 380
Pro Arg Asn Glu Glu Asp Gly Trp Phe Thr Lys Glu Ser Val Ala Lys
385 390 395 400
Ser Leu Arg Ser Val Val Val Asp Asp Glu Gly Glu Ile Tyr Lys Ala
405 410 415
Asn Ala Arg Glu Leu Ser Lys Ile Phe Ser Asp Thr Asp Leu Gly Lys
420 425 430
Lys Tyr Ile Ser His Phe Ile Asp Phe Leu Met Met Glu Ile Val Lys
435 440 445
Thr
<210> 3
<211> 460
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic: Bd_UGT10840
<400> 3
Met Asp Asn Gly Ser Ser Ser Ser Ser Ser Ser Pro Leu His Val Val
1 5 10 15
Ile Cys Pro Trp Leu Ala Phe Gly His Gln Leu Pro Cys Leu Asp Leu
20 25 30
Ala Glu Arg Leu Ala Leu Arg Gly His Arg Val Ser Phe Val Ser Thr
35 40 45
Pro Arg Ile Ile Ala Arg Leu Pro Pro Val Arg Pro Val Ala Ala Ser
50 55 60
Leu Val Asp Leu Val Ala Leu Pro Leu Pro Arg Val Asp Gly Leu Pro
65 70 75 80
Glu Gly Ala Glu Ser Thr Asn Asp Val Pro Tyr Glu Lys Phe Glu Leu
85 90 95
His Arg Lys Ala Phe Asp Gly Leu Ala Val Pro Phe Ser Glu Phe Leu
100 105 110
Arg Ala Ala Cys Ala Glu Glu Gly Lys Lys Pro Asp Trp Ile Ile Val
115 120 125
Asp Thr Phe His His Trp Ala Ala Ala Ala Ala Ile Glu His Lys Val
130 135 140
Pro Cys Ala Met Leu Met Leu Gly Ala Ala Gly Leu Ile Val Ala Trp
145 150 155 160
Ala Thr Gln Pro Ser Lys His Val Thr Ser Glu Gln Gln Glu Gln Ser
165 170 175
Ala Ala Glu Pro Pro Arg Phe Glu Thr Glu Arg Arg Lys Leu Ala Thr
180 185 190
Thr Gln Arg Ala Ser Gly Met Ser Ile Ala Glu Arg Cys Ser Val Thr
195 200 205
Leu Glu Arg Cys Asn Leu Val Ala Met Arg Ser Cys Leu Glu Trp Glu
210 215 220
Pro Glu Ser Ile Pro Leu Ala Thr Thr Ile Gly Gly Lys Gln Leu Val
225 230 235 240
Pro Leu Gly Leu Leu Pro Pro Ser Pro Glu Gly Gly Arg Gly Val Ser
245 250 255
Lys Glu Asp Ala Thr Val Arg Trp Leu Asp Ala Gln Pro Thr Lys Ser
260 265 270
Val Val Tyr Val Ala Leu Gly Ser Glu Val Pro Leu Gly Ala Lys Glu
275 280 285
Val His Glu Leu Ala Leu Gly Leu Glu Leu Ala Gly Thr Arg Phe Leu
290 295 300
Trp Ser Leu Arg Lys Pro Ser Gly Val Ser Asp Ala Asp Ile Leu Pro
305 310 315 320
Ser Gly Phe Glu Glu Arg Thr Arg Gly Arg Gly Leu Val Thr Met Gly
325 330 335
Trp Val Pro Gln Ile Ser Val Leu Ala His Gly Ala Val Gly Ala Phe
340 345 350
Leu Thr His Cys Gly Trp Asn Ser Ile Ile Glu Gly Leu Gln Phe Gly
355 360 365
His Pro Leu Val Met Leu Pro Ile Phe Gly Asp Gln Gly Pro Asn Ala
370 375 380
Arg Met Met Glu Gly Arg Lys Val Gly Val Gln Val Pro Arg Asp Glu
385 390 395 400
Ser Asn Gly Ser Phe Asp Arg Glu Gly Val Ala Thr Thr Val Arg Ala
405 410 415
Val Ala Val Glu Glu Glu Gly Asn Arg Ile Phe Thr Ala Asn Ala Lys
420 425 430
Lys Met Gln Glu Ile Val Ala Asp Lys Gly Cys His Asp Lys Tyr Val
435 440 445
Asp Lys Phe Ile Gln Lys Leu Arg Ser Tyr Met Glu
450 455 460
<210> 4
<211> 463
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic: Hv_UGT_V1
<400> 4
Met Asp Gly Asp Gly Asn Ser Ser Ser Ser Ser Ser Pro Leu His Val
1 5 10 15
Val Ile Cys Pro Trp Leu Ala Leu Gly His Leu Leu Pro Cys Leu Asp
20 25 30
Ile Ala Glu Arg Leu Ala Ser Arg Gly His Arg Val Ser Phe Val Ser
35 40 45
Thr Pro Arg Asn Ile Ala Arg Leu Pro Pro Leu Arg Pro Ala Val Ala
50 55 60
Pro Leu Val Glu Phe Val Ala Leu Pro Leu Pro His Val Asp Gly Leu
65 70 75 80
Pro Glu Gly Ala Glu Ser Thr Asn Asp Val Pro Tyr Asp Lys Phe Glu
85 90 95
Leu His Arg Lys Ala Phe Asp Gly Leu Ala Ala Pro Phe Ser Glu Phe
100 105 110
Leu Arg Ala Ala Cys Ala Glu Gly Ala Gly Ser Arg Pro Asp Trp Leu
115 120 125
Ile Val Asp Thr Phe His His Trp Ala Ala Ala Ala Ala Val Glu Asn
130 135 140
Lys Val Pro Cys Val Met Leu Leu Leu Gly Ala Ala Thr Val Ile Ala
145 150 155 160
Gly Phe Ala Arg Gly Val Ser Glu His Ala Ala Ala Ala Val Gly Lys
165 170 175
Glu Arg Pro Ala Ala Glu Ala Pro Ser Phe Glu Thr Glu Arg Arg Lys
180 185 190
Leu Met Thr Thr Gln Asn Ala Ser Gly Met Thr Val Ala Glu Arg Tyr
195 200 205
Phe Leu Thr Leu Met Arg Ser Asp Leu Val Ala Ile Arg Ser Cys Ala
210 215 220
Glu Trp Glu Pro Glu Ser Val Ala Ala Leu Thr Thr Leu Ala Gly Lys
225 230 235 240
Pro Val Val Pro Leu Gly Leu Leu Pro Pro Ser Pro Glu Gly Gly Arg
245 250 255
Gly Val Ser Lys Glu Asp Ala Ala Val Arg Trp Leu Asp Ala Gln Pro
260 265 270
Ala Lys Ser Val Val Tyr Val Ala Leu Gly Ser Glu Val Pro Leu Arg
275 280 285
Ala Glu Gln Val His Glu Leu Ala Leu Gly Leu Glu Leu Ser Gly Ala
290 295 300
Arg Phe Leu Trp Ala Leu Arg Lys Pro Thr Asp Ala Pro Asp Ala Ala
305 310 315 320
Val Leu Pro Pro Gly Phe Glu Glu Arg Thr Arg Gly Arg Gly Leu Val
325 330 335
Val Thr Gly Trp Val Pro Gln Ile Gly Val Leu Ala His Gly Ala Val
340 345 350
Ala Ala Phe Leu Thr His Cys Gly Trp Asn Ser Thr Ile Glu Gly Leu
355 360 365
Leu Phe Gly His Pro Leu Ile Met Leu Pro Ile Ser Ser Asp Gln Gly
370 375 380
Pro Asn Ala Arg Leu Met Glu Gly Arg Lys Val Gly Met Gln Val Pro
385 390 395 400
Arg Asp Glu Ser Asp Gly Ser Phe Arg Arg Glu Asp Val Ala Ala Thr
405 410 415
Val Arg Ala Val Ala Val Glu Glu Asp Gly Arg Arg Val Phe Thr Ala
420 425 430
Asn Ala Lys Lys Met Gln Glu Ile Val Ala Asp Gly Ala Cys His Glu
435 440 445
Arg Cys Ile Asp Gly Phe Ile Gln Gln Leu Arg Ser Tyr Lys Ala
450 455 460
<210> 5
<211> 464
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic: Bd_UGT10850
<400> 5
Met Asp Ala Ala Gly Ser Ser Ser Pro Met His Ile Val Ile Phe Pro
1 5 10 15
Trp Leu Ala Ser Gly His Leu Leu Pro Cys Leu Glu Leu Ala Glu Arg
20 25 30
Leu Ala Ala Arg Gly His Leu Val Ser Phe Val Ser Thr Pro Arg Asn
35 40 45
Leu Ala Arg Leu Pro Pro Val Ser Pro Ala Leu Ala Pro Leu Val Asp
50 55 60
Leu Val Ala Leu Pro Leu Pro Arg Val Ala Gly Leu Pro Asp Gly Ala
65 70 75 80
Glu Ser Thr Ala Asp Val Pro Ala Asp Lys Phe Asp Leu His Arg Gln
85 90 95
Ala Phe Asp Gly Leu Ala Ala Pro Phe Ala Ala Phe Leu Asp Ala Asp
100 105 110
Val Gly Lys Lys Lys Lys Pro Asp Trp Ile Val Ala Asp Phe Val His
115 120 125
His Trp Val Ala Ala Ala Ala Gln Glu Arg Glu Val Pro Cys Ala Met
130 135 140
Leu Val Pro Cys Ala Ala Ala Val Ala Val Leu Ala Gly Pro Pro Pro
145 150 155 160
Glu Ser Ile Ser Asn Ala Asp Glu Arg Gln Val Ile Val Lys Val Met
165 170 175
Asp Ala Ala Pro Arg Phe Glu Ala Glu Gln Ala Met Glu Glu Phe Ala
180 185 190
Ala Glu Asp Ala Ser Gly Ser Ser Ser Gly Leu Ser Val Leu Ser Arg
195 200 205
Phe Tyr Met Thr Leu Lys Arg Cys Lys Val Val Ala Leu Arg Ser Cys
210 215 220
Pro Glu Leu Glu Pro Asp Ala Phe Pro Leu Leu Thr Arg Leu Tyr Gly
225 230 235 240
Lys Pro Ala Val Pro Leu Gly Leu Leu Pro Pro Pro Pro Asn Gly Thr
245 250 255
Arg Ser Arg Gly Met Asp Asp Glu Ala Ile Ile Arg Trp Leu Asn Ala
260 265 270
Gln Pro Ala Ser Ser Val Val Tyr Val Ala Leu Gly Ser Glu Ala Pro
275 280 285
Leu Arg Ala Glu Leu Leu Arg Glu Leu Ala His Gly Leu Glu Leu Ala
290 295 300
Gly Thr Arg Phe Leu Trp Ala Leu Arg Lys Pro Val Gly Val Gln Asp
305 310 315 320
Gly Asp Ser Val Leu Pro Asp Gly Phe Val Glu Arg Thr Ser Arg Arg
325 330 335
Gly Leu Val Val Ala Arg Trp Val Ser Gln Val Ser Ile Leu Ala His
340 345 350
Gly Ala Val Gly Ala Phe Leu Thr His Cys Gly Trp Gly Ser Val Val
355 360 365
Glu Gly Leu Gln Phe Gly Arg Pro Leu Ile Met Leu Pro Ile Ala Gly
370 375 380
Asp Gln Gly Pro Asn Ala Arg Leu Met Glu Glu Arg Lys Val Gly Val
385 390 395 400
Ser Val Pro Arg Asp Glu Lys Asp Gly Ser Phe Thr Arg Gly Gly Val
405 410 415
Ala Gly Ala Ile Arg Ala Val Val Val Glu Glu Asp Gly Arg Leu Phe
420 425 430
Ala Ala Asn Ala Glu Lys Leu Arg Glu Ile Val Ala Ser Arg Glu Cys
435 440 445
His Glu Arg Cys Ile Asp Gly Phe Ile Gln His Leu Arg Cys Cys Lys
450 455 460
<210> 6
<211> 464
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic: Ob_UGT91B1_like
<400> 6
Met Glu Asn Gly Ser Ser Pro Leu His Val Val Ile Phe Pro Trp Leu
1 5 10 15
Ala Phe Gly His Leu Leu Pro Phe Leu Asp Leu Ala Glu Arg Leu Ala
20 25 30
Ala Arg Gly His Arg Val Ser Phe Val Ser Thr Pro Arg Asn Leu Ala
35 40 45
Arg Leu Arg Pro Val Arg Pro Ala Leu Arg Gly Leu Val Asp Leu Val
50 55 60
Ala Leu Pro Leu Pro Arg Val His Gly Leu Pro Asp Gly Ala Glu Ala
65 70 75 80
Thr Ser Asp Val Pro Phe Glu Lys Phe Glu Leu His Arg Lys Ala Phe
85 90 95
Asp Gly Leu Ala Ala Pro Phe Ser Ala Phe Leu Asp Ala Ala Cys Ala
100 105 110
Gly Asp Lys Arg Pro Asp Trp Val Ile Pro Asp Phe Met His Tyr Trp
115 120 125
Val Ala Ala Ala Ala Gln Lys Arg Gly Val Pro Cys Ala Val Leu Ile
130 135 140
Pro Cys Ser Ala Asp Val Met Ala Leu Tyr Gly Gln Pro Thr Glu Thr
145 150 155 160
Ser Thr Glu Gln Pro Glu Ala Ile Ala Arg Ser Met Ala Ala Glu Ala
165 170 175
Pro Ser Phe Glu Ala Glu Arg Asn Thr Glu Glu Tyr Gly Thr Ala Gly
180 185 190
Ala Ser Gly Val Ser Ile Met Thr Arg Phe Ser Leu Thr Leu Lys Trp
195 200 205
Ser Lys Leu Val Ala Leu Arg Ser Cys Pro Glu Leu Glu Pro Gly Val
210 215 220
Phe Thr Thr Leu Thr Arg Val Tyr Ser Lys Pro Val Val Pro Phe Gly
225 230 235 240
Leu Leu Pro Pro Arg Arg Asp Gly Ala His Gly Val Arg Lys Asn Gly
245 250 255
Glu Asp Asp Gly Ala Ile Ile Arg Trp Leu Asp Glu Gln Pro Ala Lys
260 265 270
Ser Val Val Tyr Val Ala Leu Gly Ser Glu Ala Pro Val Ser Ala Asp
275 280 285
Leu Leu Arg Glu Leu Ala His Gly Leu Glu Leu Ala Gly Thr Arg Phe
290 295 300
Leu Trp Ala Leu Arg Arg Pro Ala Gly Val Asn Asp Gly Asp Ser Ile
305 310 315 320
Leu Pro Asn Gly Phe Leu Glu Arg Thr Gly Glu Arg Gly Leu Val Thr
325 330 335
Thr Gly Trp Val Pro Gln Val Ser Ile Leu Ala His Ala Ala Val Cys
340 345 350
Ala Phe Leu Thr His Cys Gly Trp Gly Ser Val Val Glu Gly Leu Gln
355 360 365
Phe Gly His Pro Leu Ile Met Leu Pro Ile Ile Gly Asp Gln Gly Pro
370 375 380
Asn Ala Arg Phe Leu Glu Gly Arg Lys Val Gly Val Ala Val Pro Arg
385 390 395 400
Asn His Ala Asp Gly Ser Phe Asp Arg Ser Gly Val Ala Gly Ala Val
405 410 415
Arg Ala Val Ala Val Glu Glu Glu Gly Lys Ala Phe Ala Ala Asn Ala
420 425 430
Arg Lys Leu Gln Glu Ile Val Ala Asp Arg Glu Arg Asp Glu Arg Cys
435 440 445
Thr Asp Gly Phe Ile His His Leu Thr Ser Trp Asn Glu Leu Glu Ala
450 455 460
<210> 7
<211> 485
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic: UGT91D_like3
<400> 7
Met Tyr Asn Val Thr Tyr His Gln Asn Ser Lys Ala Met Ala Thr Ser
1 5 10 15
Asp Ser Ile Val Asp Asp Arg Lys Gln Leu His Val Ala Thr Phe Pro
20 25 30
Trp Leu Ala Phe Gly His Ile Leu Pro Tyr Leu Gln Leu Ser Lys Leu
35 40 45
Ile Ala Glu Lys Gly His Lys Val Ser Phe Leu Ser Thr Thr Arg Asn
50 55 60
Ile Gln Arg Leu Ser Ser His Ile Ser Pro Leu Ile Asn Val Val Gln
65 70 75 80
Leu Thr Leu Pro Arg Val Gln Glu Leu Pro Glu Asp Ala Glu Ala Thr
85 90 95
Thr Asp Val His Pro Glu Asp Ile Pro Tyr Leu Lys Lys Ala Ser Asp
100 105 110
Gly Leu Gln Pro Glu Val Thr Arg Phe Leu Glu Gln His Ser Pro Asp
115 120 125
Trp Ile Ile Tyr Asp Tyr Thr His Tyr Trp Leu Pro Ser Ile Ala Ala
130 135 140
Ser Leu Gly Ile Ser Arg Ala His Phe Ser Val Thr Thr Pro Trp Ala
145 150 155 160
Ile Ala Tyr Met Gly Pro Ser Ala Asp Ala Met Ile Asn Gly Ser Asp
165 170 175
Gly Arg Thr Thr Val Glu Asp Leu Thr Thr Pro Pro Lys Trp Phe Pro
180 185 190
Phe Pro Thr Lys Val Cys Trp Arg Lys His Asp Leu Ala Arg Leu Val
195 200 205
Pro Tyr Lys Ala Pro Gly Ile Ser Asp Gly Tyr Arg Met Gly Leu Val
210 215 220
Leu Lys Gly Ser Asp Cys Leu Leu Ser Lys Cys Tyr His Glu Phe Gly
225 230 235 240
Thr Gln Trp Leu Pro Leu Leu Glu Thr Leu His Gln Val Pro Val Val
245 250 255
Pro Val Gly Leu Leu Pro Pro Glu Ile Pro Gly Asp Glu Lys Asp Glu
260 265 270
Thr Trp Val Ser Ile Lys Lys Trp Leu Asp Gly Lys Gln Lys Gly Ser
275 280 285
Val Val Tyr Val Ala Leu Gly Ser Glu Val Leu Val Ser Gln Thr Glu
290 295 300
Val Val Glu Leu Ala Leu Gly Leu Glu Leu Ser Gly Leu Pro Phe Val
305 310 315 320
Trp Ala Tyr Arg Lys Pro Lys Gly Pro Ala Lys Ser Asp Ser Val Glu
325 330 335
Leu Pro Asp Gly Phe Val Glu Arg Thr Arg Asp Arg Gly Leu Val Trp
340 345 350
Thr Ser Trp Ala Pro Gln Leu Arg Ile Leu Ser His Glu Ser Val Cys
355 360 365
Gly Phe Leu Thr His Cys Gly Ser Gly Ser Ile Val Glu Gly Leu Met
370 375 380
Phe Gly His Pro Leu Ile Met Leu Pro Ile Phe Gly Asp Gln Pro Leu
385 390 395 400
Asn Ala Arg Leu Leu Glu Asp Lys Gln Val Gly Ile Glu Ile Pro Arg
405 410 415
Asn Glu Glu Asp Gly Cys Leu Thr Lys Glu Ser Val Ala Arg Ser Leu
420 425 430
Arg Ser Val Val Val Glu Lys Glu Gly Glu Ile Tyr Lys Ala Asn Ala
435 440 445
Arg Glu Leu Ser Lys Ile Tyr Asn Asp Thr Lys Val Glu Lys Glu Tyr
450 455 460
Val Ser Gln Phe Val Asp Tyr Leu Glu Lys Asn Ala Arg Ala Val Ala
465 470 475 480
Ile Asp His Glu Ser
485
<210> 8
<211> 462
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic: Os_UGT_91C1
<400> 8
Met Asp Ser Gly Tyr Ser Ser Ser Tyr Ala Ala Ala Ala Gly Met His
1 5 10 15
Val Val Ile Cys Pro Trp Leu Ala Phe Gly His Leu Leu Pro Cys Leu
20 25 30
Asp Leu Ala Gln Arg Leu Ala Ser Arg Gly His Arg Val Ser Phe Val
35 40 45
Ser Thr Pro Arg Asn Ile Ser Arg Leu Pro Pro Val Arg Pro Ala Leu
50 55 60
Ala Pro Leu Val Ala Phe Val Ala Leu Pro Leu Pro Arg Val Glu Gly
65 70 75 80
Leu Pro Asp Gly Ala Glu Ser Thr Asn Asp Val Pro His Asp Arg Pro
85 90 95
Asp Met Val Glu Leu His Arg Arg Ala Phe Asp Gly Leu Ala Ala Pro
100 105 110
Phe Ser Glu Phe Leu Gly Thr Ala Cys Ala Asp Trp Val Ile Val Asp
115 120 125
Val Phe His His Trp Ala Ala Ala Ala Ala Leu Glu His Lys Val Pro
130 135 140
Cys Ala Met Met Leu Leu Gly Ser Ala His Met Ile Ala Ser Ile Ala
145 150 155 160
Asp Arg Arg Leu Glu Arg Ala Glu Thr Glu Ser Pro Ala Ala Ala Gly
165 170 175
Gln Gly Arg Pro Ala Ala Ala Pro Thr Phe Glu Val Ala Arg Met Lys
180 185 190
Leu Ile Arg Thr Lys Gly Ser Ser Gly Met Ser Leu Ala Glu Arg Phe
195 200 205
Ser Leu Thr Leu Ser Arg Ser Ser Leu Val Val Gly Arg Ser Cys Val
210 215 220
Glu Phe Glu Pro Glu Thr Val Pro Leu Leu Ser Thr Leu Arg Gly Lys
225 230 235 240
Pro Ile Thr Phe Leu Gly Leu Met Pro Pro Leu His Glu Gly Arg Arg
245 250 255
Glu Asp Gly Glu Asp Ala Thr Val Arg Trp Leu Asp Ala Gln Pro Ala
260 265 270
Lys Ser Val Val Tyr Val Ala Leu Gly Ser Glu Val Pro Leu Gly Val
275 280 285
Glu Lys Val His Glu Leu Ala Leu Gly Leu Glu Leu Ala Gly Thr Arg
290 295 300
Phe Leu Trp Ala Leu Arg Lys Pro Thr Gly Val Ser Asp Ala Asp Leu
305 310 315 320
Leu Pro Ala Gly Phe Glu Glu Arg Thr Arg Gly Arg Gly Val Val Ala
325 330 335
Thr Arg Trp Val Pro Gln Met Ser Ile Leu Ala His Ala Ala Val Gly
340 345 350
Ala Phe Leu Thr His Cys Gly Trp Asn Ser Thr Ile Glu Gly Leu Met
355 360 365
Phe Gly His Pro Leu Ile Met Leu Pro Ile Phe Gly Asp Gln Gly Pro
370 375 380
Asn Ala Arg Leu Ile Glu Ala Lys Asn Ala Gly Leu Gln Val Ala Arg
385 390 395 400
Asn Asp Gly Asp Gly Ser Phe Asp Arg Glu Gly Val Ala Ala Ala Ile
405 410 415
Arg Ala Val Ala Val Glu Glu Glu Ser Ser Lys Val Phe Gln Ala Lys
420 425 430
Ala Lys Lys Leu Gln Glu Ile Val Ala Asp Met Ala Cys His Glu Arg
435 440 445
Tyr Ile Asp Gly Phe Ile Gln Gln Leu Arg Ser Tyr Lys Asp
450 455 460
<210> 9
<211> 442
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic: Sl_UGT_101249881
<400> 9
Met Ala Thr Asn Leu Arg Val Leu Met Phe Pro Trp Leu Ala Tyr Gly
1 5 10 15
His Ile Ser Pro Phe Leu Asn Ile Ala Lys Gln Leu Ala Asp Arg Gly
20 25 30
Phe Leu Ile Tyr Leu Cys Ser Thr Arg Ile Asn Leu Glu Ser Ile Ile
35 40 45
Lys Lys Ile Pro Glu Lys Tyr Ala Asp Ser Ile His Leu Ile Glu Leu
50 55 60
Gln Leu Pro Glu Leu Pro Glu Leu Pro Pro His Tyr His Thr Thr Asn
65 70 75 80
Gly Leu Pro Pro His Leu Asn Pro Thr Leu His Lys Ala Leu Lys Met
85 90 95
Ser Lys Pro Asn Phe Ser Arg Ile Leu Gln Asn Leu Lys Pro Asp Leu
100 105 110
Leu Ile Tyr Asp Val Leu Gln Pro Trp Ala Glu His Val Ala Asn Glu
115 120 125
Gln Asn Ile Pro Ala Gly Lys Leu Leu Thr Ser Cys Ala Ala Val Phe
130 135 140
Ser Tyr Phe Phe Ser Phe Arg Lys Asn Pro Gly Val Glu Phe Pro Phe
145 150 155 160
Pro Ala Ile His Leu Pro Glu Val Glu Lys Val Lys Ile Arg Glu Ile
165 170 175
Leu Ala Lys Glu Pro Glu Glu Gly Gly Arg Leu Asp Glu Gly Asn Lys
180 185 190
Gln Met Met Leu Met Cys Thr Ser Arg Thr Ile Glu Ala Lys Tyr Ile
195 200 205
Asp Tyr Cys Thr Glu Leu Cys Asn Trp Lys Val Val Pro Val Gly Pro
210 215 220
Pro Phe Gln Asp Leu Ile Thr Asn Asp Ala Asp Asn Lys Glu Leu Ile
225 230 235 240
Asp Trp Leu Gly Thr Lys His Glu Asn Ser Thr Val Phe Val Ser Phe
245 250 255
Gly Ser Glu Tyr Phe Leu Ser Lys Glu Asp Met Glu Glu Val Ala Phe
260 265 270
Ala Leu Glu Leu Ser Asn Val Asn Phe Ile Trp Val Ala Arg Phe Pro
275 280 285
Lys Gly Glu Glu Arg Asn Leu Glu Asp Ala Leu Pro Lys Gly Phe Leu
290 295 300
Glu Arg Ile Gly Glu Arg Gly Arg Val Leu Asp Lys Phe Ala Pro Gln
305 310 315 320
Pro Arg Ile Leu Asn His Pro Ser Thr Gly Gly Phe Ile Ser His Cys
325 330 335
Gly Trp Asn Ser Ala Met Glu Ser Ile Asp Phe Gly Val Pro Ile Ile
340 345 350
Ala Met Pro Ile His Asn Asp Gln Pro Ile Asn Ala Lys Leu Met Val
355 360 365
Glu Leu Gly Val Ala Val Glu Ile Val Arg Asp Asp Asp Gly Lys Ile
370 375 380
His Arg Gly Glu Ile Ala Glu Thr Leu Lys Ser Val Val Thr Gly Glu
385 390 395 400
Thr Gly Glu Ile Leu Arg Ala Lys Val Arg Glu Ile Ser Lys Asn Leu
405 410 415
Lys Ser Ile Arg Asp Glu Glu Met Asp Ala Val Ala Glu Glu Leu Ile
420 425 430
Gln Leu Cys Arg Asn Ser Asn Lys Ser Lys
435 440
<210> 10
<211> 500
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic: Sr.KAH
<400> 10
Met Glu Ala Ser Tyr Leu Tyr Ile Ser Ile Leu Leu Leu Leu Ala Ser
1 5 10 15
Tyr Leu Phe Thr Thr Gln Leu Arg Arg Lys Ser Ala Asn Leu Pro Pro
20 25 30
Thr Val Phe Pro Ser Ile Pro Ile Ile Gly His Leu Tyr Leu Leu Lys
35 40 45
Lys Pro Leu Tyr Arg Thr Leu Ala Lys Ile Ala Ala Lys Tyr Gly Pro
50 55 60
Ile Leu Gln Leu Gln Leu Gly Tyr Arg Arg Val Leu Val Ile Ser Ser
65 70 75 80
Pro Ser Ala Ala Glu Glu Cys Phe Thr Asn Asn Asp Val Ile Phe Ala
85 90 95
Asn Arg Pro Lys Thr Leu Phe Gly Lys Ile Val Gly Gly Thr Ser Leu
100 105 110
Gly Ser Leu Ser Tyr Gly Asp Gln Trp Arg Asn Leu Arg Arg Val Ala
115 120 125
Ser Ile Glu Ile Leu Ser Val His Arg Leu Asn Glu Phe His Asp Ile
130 135 140
Arg Val Asp Glu Asn Arg Leu Leu Ile Arg Lys Leu Arg Ser Ser Ser
145 150 155 160
Ser Pro Val Thr Leu Ile Thr Val Phe Tyr Ala Leu Thr Leu Asn Val
165 170 175
Ile Met Arg Met Ile Ser Gly Lys Arg Tyr Phe Asp Ser Gly Asp Arg
180 185 190
Glu Leu Glu Glu Glu Gly Lys Arg Phe Arg Glu Ile Leu Asp Glu Thr
195 200 205
Leu Leu Leu Ala Gly Ala Ser Asn Val Gly Asp Tyr Leu Pro Ile Leu
210 215 220
Asn Trp Leu Gly Val Lys Ser Leu Glu Lys Lys Leu Ile Ala Leu Gln
225 230 235 240
Lys Lys Arg Asp Asp Phe Phe Gln Gly Leu Ile Glu Gln Val Arg Lys
245 250 255
Ser Arg Gly Ala Lys Val Gly Lys Gly Arg Lys Thr Met Ile Glu Leu
260 265 270
Leu Leu Ser Leu Gln Glu Ser Glu Pro Glu Tyr Tyr Thr Asp Ala Met
275 280 285
Ile Arg Ser Phe Val Leu Gly Leu Leu Ala Ala Gly Ser Asp Thr Ser
290 295 300
Ala Gly Thr Met Glu Trp Ala Met Ser Leu Leu Val Asn His Pro His
305 310 315 320
Val Leu Lys Lys Ala Gln Ala Glu Ile Asp Arg Val Ile Gly Asn Asn
325 330 335
Arg Leu Ile Asp Glu Ser Asp Ile Gly Asn Ile Pro Tyr Ile Gly Cys
340 345 350
Ile Ile Asn Glu Thr Leu Arg Leu Tyr Pro Ala Gly Pro Leu Leu Phe
355 360 365
Pro His Glu Ser Ser Ala Asp Cys Val Ile Ser Gly Tyr Asn Ile Pro
370 375 380
Arg Gly Thr Met Leu Ile Val Asn Gln Trp Ala Ile His His Asp Pro
385 390 395 400
Lys Val Trp Asp Asp Pro Glu Thr Phe Lys Pro Glu Arg Phe Gln Gly
405 410 415
Leu Glu Gly Thr Arg Asp Gly Phe Lys Leu Met Pro Phe Gly Ser Gly
420 425 430
Arg Arg Gly Cys Pro Gly Glu Gly Leu Ala Ile Arg Leu Leu Gly Met
435 440 445
Thr Leu Gly Ser Val Ile Gln Cys Phe Asp Trp Glu Arg Val Gly Asp
450 455 460
Glu Met Val Asp Met Thr Glu Gly Leu Gly Val Thr Leu Pro Lys Ala
465 470 475 480
Val Pro Leu Val Ala Lys Cys Lys Pro Arg Ser Glu Met Thr Asn Leu
485 490 495
Leu Ser Glu Leu
500
<210> 11
<211> 435
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic: UGT40087 version 2
<400> 11
Met Asp Ala Ser Ser Ser Pro Leu His Ile Val Ile Phe Pro Trp Leu
1 5 10 15
Ala Phe Gly His Met Leu Ala Ser Leu Glu Leu Ala Glu Arg Leu Ala
20 25 30
Ala Arg Gly His Arg Val Ser Phe Val Ser Thr Pro Arg Asn Ile Ser
35 40 45
Arg Leu Arg Pro Val Pro Pro Ala Leu Ala Pro Leu Ile Asp Phe Val
50 55 60
Ala Leu Pro Leu Pro Arg Val Asp Gly Leu Pro Asp Gly Ala Glu Ala
65 70 75 80
Thr Ser Asp Ile Pro Pro Gly Lys Thr Glu Leu His Leu Lys Ala Leu
85 90 95
Asp Gly Leu Ala Ala Pro Phe Ala Ala Phe Leu Asp Ala Ala Cys Ala
100 105 110
Asp Gly Ser Thr Asn Lys Val Asp Trp Leu Phe Leu Asp Asn Phe Gln
115 120 125
Tyr Trp Ala Ala Ala Ala Ala Ala Asp His Lys Ile Pro Cys Ala Leu
130 135 140
Asn Leu Thr Phe Ala Ala Ser Thr Ser Ala Glu Tyr Gly Val Pro Arg
145 150 155 160
Val Glu Pro Pro Val Asp Gly Ser Thr Ala Ser Ile Leu Gln Arg Phe
165 170 175
Val Leu Thr Leu Glu Lys Cys Gln Phe Val Ile Gln Arg Ala Cys Phe
180 185 190
Glu Leu Glu Pro Glu Pro Leu Pro Leu Leu Ser Asp Ile Phe Gly Lys
195 200 205
Pro Val Ile Pro Tyr Gly Leu Val Pro Pro Cys Pro Pro Ala Glu Gly
210 215 220
His Lys Arg Glu His Gly Asn Ala Ala Leu Ser Trp Leu Asp Lys Gln
225 230 235 240
Gln Pro Glu Ser Val Leu Phe Ile Ala Leu Gly Ser Glu Pro Pro Val
245 250 255
Thr Val Glu Gln Leu His Glu Ile Ala Leu Gly Leu Glu Leu Ala Gly
260 265 270
Thr Thr Phe Leu Trp Ala Leu Lys Lys Pro Asn Gly Leu Leu Leu Glu
275 280 285
Ala Asp Gly Asp Ile Leu Pro Pro Gly Phe Glu Glu Arg Thr Arg Asp
290 295 300
Arg Gly Leu Val Ala Met Gly Trp Val Pro Gln Pro Ile Ile Leu Ala
305 310 315 320
His Ser Ser Val Gly Ala Phe Leu Thr His Gly Gly Trp Ala Ser Thr
325 330 335
Ile Glu Gly Val Met Ser Gly His Pro Met Leu Phe Leu Thr Phe Leu
340 345 350
Asp Glu Gln Arg Ile Asn Ala Gln Leu Ile Glu Arg Lys Lys Ala Gly
355 360 365
Leu Arg Val Pro Arg Arg Glu Lys Asp Gly Ser Tyr Asp Arg Gln Gly
370 375 380
Ile Ala Gly Ala Ile Arg Ala Val Met Cys Glu Glu Glu Ser Lys Ser
385 390 395 400
Val Phe Ala Ala Asn Ala Lys Lys Met Gln Glu Ile Val Ser Asp Arg
405 410 415
Asn Cys Gln Glu Lys Tyr Ile Asp Glu Leu Ile Gln Arg Leu Gly Ser
420 425 430
Phe Glu Lys
435
<210> 12
<211> 435
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic: Si91Dlike
<400> 12
Met Asp Ser Ser Gln Ser Pro Pro Leu His Ile Ala Val Phe Pro Trp
1 5 10 15
Leu Ala Phe Gly His Leu Leu Pro Asn Leu Glu Leu Ala Glu Arg Leu
20 25 30
Ala Ala Arg Gly His Arg Val Ser Phe Val Ser Thr Pro Arg Ile Ile
35 40 45
Ser Arg Leu Arg Pro Val Pro Leu Ala Leu Ala Pro Leu Ile Asp Phe
50 55 60
Val Ala Leu Pro Leu Pro Arg Val Asp Gly Leu Pro Asp Gly Ala Glu
65 70 75 80
Ala Thr Ser Asp Ile Pro Pro Gly Lys Thr Asp Leu His Leu Lys Ala
85 90 95
Leu Asp Gly Leu Ala Ala Pro Phe Ala Ala Phe Leu Asp Ala Ala Cys
100 105 110
Ala Asp Gly Ser Thr Asn Lys Val Asp Trp Leu Phe Val Asp Ser Phe
115 120 125
Gln Tyr Trp Ala Ala Ala Ala Ala Ala Asp Arg Lys Ile Pro Cys Ala
130 135 140
Leu Ile Leu Pro Phe Ala Ser Ser Thr Leu Ala Glu Phe Gly Val Pro
145 150 155 160
Arg Leu Glu Pro Pro Val Glu Gly Ser Thr Ala Ser Ile Leu Gln Arg
165 170 175
Phe Val Leu Thr Phe Glu Lys Cys Gln Leu Val Ile His Arg Ala Cys
180 185 190
Ser Glu Leu Glu Pro Glu His Thr Pro Leu Leu Pro Gly Ile Phe Gly
195 200 205
Lys Pro Val Ile Gln Tyr Gly Leu Val Pro Pro Cys Pro Pro Ala Gln
210 215 220
Gly His Ile Glu His Asp Asn Ala Ala Leu Ser Trp Leu Asp Lys Gln
225 230 235 240
Gln Pro Glu Ser Val Leu Phe Ile Ala Leu Gly Ser Glu Pro Pro Val
245 250 255
Thr Val Glu Gln Leu His Glu Ile Ala Leu Gly Leu Glu Leu Ala Gly
260 265 270
Thr Thr Phe Leu Trp Ala Leu Lys Lys Pro Asn Gly Leu Leu Leu Glu
275 280 285
Ala Asp Gly Asp Ile Leu Pro Pro Gly Phe Glu Glu Arg Thr Arg Asp
290 295 300
Arg Gly Leu Val Ala Met Gly Trp Val Pro Gln Leu Ser Ile Leu Ala
305 310 315 320
His Ser Ser Val Gly Ala Phe Leu Thr His Gly Gly Trp Ser Ser Thr
325 330 335
Ile Glu Gly Ala Met Ser Gly His Pro Met Val Phe Leu Thr Phe Leu
340 345 350
Asp Glu Gln Arg Ile Asn Ala Gln Leu Ile Glu Arg Lys Lys Ala Gly
355 360 365
Leu Arg Val Pro Arg Cys Glu Lys Asp Gly Ser Tyr Asp Arg Gln Gly
370 375 380
Ile Ala Gly Ala Ile Arg Ala Val Met Cys Glu Glu Glu Ser Lys Ser
385 390 395 400
Val Phe Ala Ala Asn Ala Lys Lys Met Gln Glu Ile Ile Asn Asp Arg
405 410 415
Lys Cys Gln Glu Arg Tyr Ile Asp Glu Leu Ile Gln Arg Leu Arg Ser
420 425 430
Phe Glu Lys
435
<210> 13
<211> 1308
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: UGT40087-1 codon optimized nucleic acid sequence
<400> 13
atggatgctt ccagtagtcc tttacacatc gttatctttc catggttagc tttcggtcat 60
atgttggctt ccttggaatt ggctgagaga ttggctgctc gtggtcacag agtctccttc 120
gtttccaccc ctagaaacat ctctagatta cgtccagttc caccagcttt agctccattg 180
attgattttg tcgctttgcc attgcctaga gtcgatggtt taccagatgg tgccgaagct 240
acctctgaca ttccaccagg taagaccgaa ttacacttga aggctttgga cggtttggct 300
gctccattcg ccgctttttt ggacgctgcc tgtgctgatg gttccaccaa caaggttgat 360
tggttgtttt tggacaactt ccaatactgg gctgccgctg ccgctgctga tcacaaaatt 420
ccttgcgcct taaacttgac ttttgccgct tccacctccg ctgaatacgg tgttccacgt 480
gttgaaccac cagttgacgg ttccactgcc tccatcttac aaagatttgt cttaacctta 540
gaaaaatgtc aattcgttat ccaaagagct tgtttcgaat tggaacctga accattgcca 600
ttgttgtccg acattttcgg taagccagtc atcccatacg gtttagttcc tccatgtcca 660
ccagctgaag gtcacaaaag agaacacggt aacgctgctt tgtcctggtt ggataagcaa 720
caaccagaat ctgttttgtt catcgctttg ggttctgaac cacctgttac cgtcgaacaa 780
ttgcacgaaa tcgctttggg tttagaattg gccggtacca ccttcttgtg ggccttgaaa 840
aagccaaacg gtttgttgtt agaagccgat ggtgatattt tgccaccagg tttcgaagaa 900
agaactagag atagaggttt agtcgctatg ggttgggttc cacaaccaat tatcttggcc 960
cattcctctg ttggtgcctt tttgactcac ggtggttggg cctccactat tgaaggtgtc 1020
atgtccggtc accctatgtt gttcttaacc ttcttggacg aacaacgtat caacgcccaa 1080
ttgatcgaaa gaaaaaaggc tggtttaaga gtcccaagaa gagaaaagga tggttcctac 1140
gacagacaag gtattgctgg tgctattaga gccgtcatgt gtgaagaaga atctaagtct 1200
gtcttcgctg ctaacgctaa gaaaatgcaa gagatcgttt ctgacagaaa ctgtcaagaa 1260
aagtacatcg acgaattgat tcaaagattg ggttctttcg aaaagtaa 1308
<210> 14
<211> 21
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic: loop2 from Os_UGT_91C1
<400> 14
Glu Gly Leu Pro Asp Gly Ala Glu Ser Thr Asn Asp Val Pro His Asp
1 5 10 15
Arg Pro Asp Met Val
20
<210> 15
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic: loop3_1 from Os_UGT_91C1
<400> 15
Ser Glu Phe Leu Gly Thr Ala Cys Ala Asp
1 5 10
<210> 16
<211> 19
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic: loop3_2 from Os_UGT_91C1
<400> 16
Ser Glu Phe Leu Gly Thr Ala Cys Ala Asp Trp Val Ile Val Asp Val
1 5 10 15
Phe His His
<210> 17
<211> 43
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic: loop4_1 from Os_UGT_91C1
<400> 17
Ala Asp Arg Arg Leu Glu Arg Ala Glu Thr Glu Ser Pro Ala Ala Ala
1 5 10 15
Gly Gln Gly Arg Pro Ala Ala Ala Pro Thr Phe Glu Val Ala Arg Met
20 25 30
Lys Leu Ile Arg Thr Lys Gly Ser Ser Gly Met
35 40
<210> 18
<211> 56
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic: loop4_2 from Os_UGT_91C1
<400> 18
Met Met Leu Leu Gly Ser Ala His Met Ile Ala Ser Ile Ala Asp Arg
1 5 10 15
Arg Leu Glu Arg Ala Glu Thr Glu Ser Pro Ala Ala Ala Gly Gln Gly
20 25 30
Arg Pro Ala Ala Ala Pro Thr Phe Glu Val Ala Arg Met Lys Leu Ile
35 40 45
Arg Thr Lys Gly Ser Ser Gly Met
50 55
<210> 19
<211> 18
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic: loop2 from UGT40087
<400> 19
Asp Gly Leu Pro Asp Gly Ala Glu Ala Thr Ser Asp Ile Pro Pro Gly
1 5 10 15
Lys Thr
<210> 20
<211> 17
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic: loop3_1 from UGT40087
<400> 20
Ala Ala Phe Leu Asp Ala Ala Cys Ala Asp Gly Ser Thr Asn Lys Val
1 5 10 15
Asp
<210> 21
<211> 26
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic: loop3_2 from UGT40087
<400> 21
Ala Ala Phe Leu Asp Ala Ala Cys Ala Asp Gly Ser Thr Asn Lys Val
1 5 10 15
Asp Trp Leu Phe Leu Asp Asn Phe Gln Tyr
20 25
<210> 22
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic: loop4_1 from UGT40087
<400> 22
Gly Val Pro Arg Val Glu Pro Pro Val Asp Gly Ser Thr Ala
1 5 10
<210> 23
<211> 27
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic: loop4_2 from UGT40087
<400> 23
Leu Asn Leu Thr Phe Ala Ala Ser Thr Ser Ala Glu Tyr Gly Val Pro
1 5 10 15
Arg Val Glu Pro Pro Val Asp Gly Ser Thr Ala
20 25
<210> 24
<211> 434
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic: UGT40087/Si91Dlike chimera
<400> 24
Met Asp Ala Ser Ser Ser Pro Leu His Ile Val Ile Phe Pro Trp Leu
1 5 10 15
Ala Phe Gly His Met Leu Ala Ser Leu Glu Leu Ala Glu Arg Leu Ala
20 25 30
Ala Arg Gly His Arg Val Ser Phe Val Ser Thr Pro Arg Asn Ile Ser
35 40 45
Arg Leu Arg Pro Val Pro Pro Ala Leu Ala Pro Leu Ile Asp Phe Val
50 55 60
Ala Leu Pro Leu Pro Arg Val Asp Gly Leu Pro Asp Gly Ala Glu Ala
65 70 75 80
Thr Ser Asp Ile Pro Pro Gly Lys Thr Glu Leu His Leu Lys Ala Leu
85 90 95
Asp Gly Leu Ala Ala Pro Phe Ala Ala Phe Leu Asp Ala Ala Cys Ala
100 105 110
Asp Gly Ser Thr Asn Lys Val Asp Trp Leu Phe Leu Asp Asn Phe Gln
115 120 125
Tyr Trp Ala Ala Ala Ala Ala Ala Asp His Lys Ile Pro Cys Ala Leu
130 135 140
Asn Leu Thr Phe Ala Ala Ser Thr Ser Ala Glu Tyr Gly Val Pro Arg
145 150 155 160
Val Glu Pro Pro Val Asp Gly Ser Thr Ala Ser Ile Leu Gln Arg Phe
165 170 175
Val Leu Thr Leu Glu Lys Cys Gln Phe Val Ile Gln Arg Ala Cys Phe
180 185 190
Glu Leu Glu Pro Glu Pro Leu Pro Leu Leu Ser Asp Ile Phe Gly Lys
195 200 205
Pro Val Ile Pro Tyr Gly Leu Val Pro Pro Cys Pro Pro Ala Gln Gly
210 215 220
His Ile Glu His Asp Asn Ala Ala Leu Ser Trp Leu Asp Lys Gln Gln
225 230 235 240
Pro Glu Ser Val Leu Phe Ile Ala Leu Gly Ser Glu Pro Pro Val Thr
245 250 255
Val Glu Gln Leu His Glu Ile Ala Leu Gly Leu Glu Leu Ala Gly Thr
260 265 270
Thr Phe Leu Trp Ala Leu Lys Lys Pro Asn Gly Leu Leu Leu Glu Ala
275 280 285
Asp Gly Asp Ile Leu Pro Pro Gly Phe Glu Glu Arg Thr Arg Asp Arg
290 295 300
Gly Leu Val Ala Met Gly Trp Val Pro Gln Leu Ser Ile Leu Ala His
305 310 315 320
Ser Ser Val Gly Ala Phe Leu Thr His Gly Gly Trp Ser Ser Thr Ile
325 330 335
Glu Gly Ala Met Ser Gly His Pro Met Val Phe Leu Thr Phe Leu Asp
340 345 350
Glu Gln Arg Ile Asn Ala Gln Leu Ile Glu Arg Lys Lys Ala Gly Leu
355 360 365
Arg Val Pro Arg Cys Glu Lys Asp Gly Ser Tyr Asp Arg Gln Gly Ile
370 375 380
Ala Gly Ala Ile Arg Ala Val Met Cys Glu Glu Glu Ser Lys Ser Val
385 390 395 400
Phe Ala Ala Asn Ala Lys Lys Met Gln Glu Ile Ile Asn Asp Arg Lys
405 410 415
Cys Gln Glu Arg Tyr Ile Asp Glu Leu Ile Gln Arg Leu Arg Ser Phe
420 425 430
Glu Lys
<210> 25
<211> 433
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic: Os_UGT_91C1_loop4_1
<400> 25
Met Asp Ser Gly Tyr Ser Ser Ser Tyr Ala Ala Ala Ala Gly Met His
1 5 10 15
Val Val Ile Cys Pro Trp Leu Ala Phe Gly His Leu Leu Pro Cys Leu
20 25 30
Asp Leu Ala Gln Arg Leu Ala Ser Arg Gly His Arg Val Ser Phe Val
35 40 45
Ser Thr Pro Arg Asn Ile Ser Arg Leu Pro Pro Val Arg Pro Ala Leu
50 55 60
Ala Pro Leu Val Ala Phe Val Ala Leu Pro Leu Pro Arg Val Glu Gly
65 70 75 80
Leu Pro Asp Gly Ala Glu Ser Thr Asn Asp Val Pro His Asp Arg Pro
85 90 95
Asp Met Val Glu Leu His Arg Arg Ala Phe Asp Gly Leu Ala Ala Pro
100 105 110
Phe Ser Glu Phe Leu Gly Thr Ala Cys Ala Asp Trp Val Ile Val Asp
115 120 125
Val Phe His His Trp Ala Ala Ala Ala Ala Leu Glu His Lys Val Pro
130 135 140
Cys Ala Met Met Leu Leu Gly Ser Ala His Met Ile Ala Ser Ile Gly
145 150 155 160
Val Pro Arg Val Glu Pro Pro Val Asp Gly Ser Thr Ala Ser Leu Ala
165 170 175
Glu Arg Phe Ser Leu Thr Leu Ser Arg Ser Ser Leu Val Val Gly Arg
180 185 190
Ser Cys Val Glu Phe Glu Pro Glu Thr Val Pro Leu Leu Ser Thr Leu
195 200 205
Arg Gly Lys Pro Ile Thr Phe Leu Gly Leu Met Pro Pro Leu His Glu
210 215 220
Gly Arg Arg Glu Asp Gly Glu Asp Ala Thr Val Arg Trp Leu Asp Ala
225 230 235 240
Gln Pro Ala Lys Ser Val Val Tyr Val Ala Leu Gly Ser Glu Val Pro
245 250 255
Leu Gly Val Glu Lys Val His Glu Leu Ala Leu Gly Leu Glu Leu Ala
260 265 270
Gly Thr Arg Phe Leu Trp Ala Leu Arg Lys Pro Thr Gly Val Ser Asp
275 280 285
Ala Asp Leu Leu Pro Ala Gly Phe Glu Glu Arg Thr Arg Gly Arg Gly
290 295 300
Val Val Ala Thr Arg Trp Val Pro Gln Met Ser Ile Leu Ala His Ala
305 310 315 320
Ala Val Gly Ala Phe Leu Thr His Cys Gly Trp Asn Ser Thr Ile Glu
325 330 335
Gly Leu Met Phe Gly His Pro Leu Ile Met Leu Pro Ile Phe Gly Asp
340 345 350
Gln Gly Pro Asn Ala Arg Leu Ile Glu Ala Lys Asn Ala Gly Leu Gln
355 360 365
Val Ala Arg Asn Asp Gly Asp Gly Ser Phe Asp Arg Glu Gly Val Ala
370 375 380
Ala Ala Ile Arg Ala Val Ala Val Glu Glu Glu Ser Ser Lys Val Phe
385 390 395 400
Gln Ala Lys Ala Lys Lys Leu Gln Glu Ile Val Ala Asp Met Ala Cys
405 410 415
His Glu Arg Tyr Ile Asp Gly Phe Ile Gln Gln Leu Arg Ser Tyr Lys
420 425 430
Asp
<210> 26
<211> 1621
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: unoptimized nucleic acid sequence of UGT40087 having
SEQ ID NO:1
<400> 26
tcgtgacgca acagagcaac tctcgccggc accggtcgcc ccttccgcag gcaggcagca 60
ggctcgcgcg catggacgcc tccgactcct ccccgctgca catcgtcatc ttcccgtggc 120
tcgcgttcgg ccacatgctc gccagcctgg agctcgccga gcgcctggcc gcgcgaggcc 180
accgcgtgtc cttcgtctcc accccgcgca acatcagccg cctccgcccg gtcccgcccg 240
cgctggcgcc gctcatcgac ttcgtggcgc tgccgctgcc gcgcgtcgac ggcctccccg 300
acggcgcgga ggccaccagc gacatcccgc ccggcaagac cgagctccac ctcaaggccc 360
tagacggcct cgccgcgccc ttcgcagctt tcctcgacgc cgcctgcgcc gacgggagca 420
ccaacaaggt ggactggctc ttcctcgaca acttccaata ctgggccgcc gccgccgctg 480
ccgaccataa gataccctgc gcgctgaacc tgacattcgc agcgtcgacg tcagcggagt 540
acggtgtgcc acgcgttgag ccgccggtgg atggctcaac agcctcaata ctccagcgat 600
ttgtgctaac cttggagaaa tgccagtttg tcatccaacg cgcctgcttc gagctggagc 660
cggagcccct gcctctcctg tcagacatct tcggcaagcc ggtgatcccg tacggcctag 720
tcccgccgtg tccccccgca gaaggtcaca aaagagagca cggcaacgca gctctgtcat 780
ggctcgacaa gcagcagccc gagtctgtcc tgttcattgc tctgggaagc gagcctccgg 840
tgaccgtcga acagctgcac gagatcgcgc ttgggctgga gctcgccggg acgacattcc 900
tctgggctct gaagaagcct aacggcctcc tcctcgaggc ggacggcgac atcctgcccc 960
caggtttcga ggagcggacg cgtgaccgtg ggctcgtggc catgggctgg gttcctcagc 1020
ccatcatact ggctcacagc tccgtgggcg cgttcctgac gcacggcgga tgggcctcca 1080
ccattgaagg ggttatgtcc gggcatccca tgctcttcct gacgttctta gatgaacaga 1140
ggataaacgc gcaactgatc gagaggaaga aggccgggtt gcgagtgcca aggcgtgaga 1200
aggacggctc gtacgatcgc caaggcatcg ccggagcgat ccgggctgtc atgtgcgagg 1260
aagaaagtaa gagcgtcttc gcggctaatg ccaagaagat gcaggagatt gtgagcgaca 1320
ggaattgcca ggagaagtac atcgacgagc ttatccagcg tctgggatcc ttcgagaagt 1380
gaaataaggt gaaatatcct acaataaccg cctgttgatg gcttgatgca acgatgtagg 1440
tggccattcg cgcctctgat ctccatgttc cggcaataaa tccaccatat gttatggctc 1500
tgacttactg aatttcctaa tatgtatgcc caaacacatg cataggttgc tagttgcccc 1560
tcgcgccggc attagcgata atgtcaccgc agtcgccagc acaggtgtag caatttgaca 1620
t 1621
<210> 27
<211> 17
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic: modified loop1 from Os_UGT_91C1 present in
UGT40087_loop1
<400> 27
Thr Pro Arg Asn Ile Ser Arg Leu Pro Pro Val Pro Pro Ala Leu Ala
1 5 10 15
Pro
<210> 28
<211> 17
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic: modified loop1 from UGT40087 present in
Os_UGT_91C1_loop1
<400> 28
Thr Pro Arg Asn Ile Ser Arg Leu Arg Pro Val Arg Pro Ala Leu Ala
1 5 10 15
Pro
<210> 29
<211> 17
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic: loop1 from Os_UGT_91C1 having SEQ ID NO:8
<400> 29
Thr Pro Arg Asn Ile Ser Arg Leu Pro Pro Val Arg Pro Ala Leu Ala
1 5 10 15
Pro
<210> 30
<211> 17
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic: loop1 from UGT40087 having SEQ ID NO:11
<400> 30
Thr Pro Arg Asn Ile Ser Arg Leu Arg Pro Val Pro Pro Ala Leu Ala
1 5 10 15
Pro
Claims (89)
- 서열번호 1 또는 서열번호 11에 적어도 80%, 85%, 90% 또는 95% 서열 동일성(sequence identity)을 갖는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 암호화하는 이종 핵산을 포함하는 유전자 변형된 숙주 세포.
- 제1항에 있어서,
RebA를 RebD로 90%, 95%, 96% 또는 97%를 초과하는 효율로 전환시킬 수 있는 유전자 변형된 숙주 세포. - 제1항 또는 제2항에 있어서,
UDP-글리코실트랜스퍼라제가 서열번호 1 또는 서열번호 11의 서열을 갖는 아미노산 서열을 포함하는 유전자 변형된 숙주 세포. - 제1항 내지 제3항 중 어느 한 항에 있어서,
UDP-글리코실트랜스퍼라제가, 스테비올 글리코시드의 19-O 글루코스의 C2' 위치에 대해 베타 1,2 글리코실화시킬 수 있는 유전자 변형된 숙주 세포. - 제1항 내지 제4항 중 어느 한 항에 있어서,
UDP-글리코실트랜스퍼라제가 이종 핵산에 의해 암호화되고, 상기 이종 핵산이 서열번호 13에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하는 유전자 변형된 숙주 세포. - 제1항 내지 제5항 중 어느 한 항에 있어서,
UDP-글리코실트랜스퍼라제가 서열번호 13의 서열을 갖는 이종 핵산에 의해 암호화되는 유전자 변형된 숙주 세포. - 제1항 내지 제6항 중 어느 한 항에 있어서,
RebA를 RebD로 90%, 95%, 96% 또는 97%를 초과하는 효율로 전환시킬 수 있고, UDP-글리코실트랜스퍼라제가 서열번호 1 또는 서열번호 11에 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 유전자 변형된 숙주 세포. - 제1항 내지 제7항 중 어느 한 항에 있어서,
UDP-글리코실트랜스퍼라제가, 서열번호 1 또는 서열번호 11의 기능성 도메인에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 기능성 도메인을 갖는 폴리펩티드인 유전자 변형된 숙주 세포. - 제8항에 있어서,
기능성 도메인이 당 수용체 도메인인 유전자 변형된 숙주 세포. - 제9항에 있어서,
당 수용체 도메인이 UDP-글리코실트랜스퍼라제의 N-말단에 위치하는 유전자 변형된 숙주 세포. - 제1항 내지 제10항 중 어느 한 항에 있어서,
UDP-글리코실트랜스퍼라제가 서열번호 1 또는 서열번호 11의 당 수용체 도메인을 포함하는 유전자 변형된 숙주 세포. - 제1항 내지 제11항 중 어느 한 항에 있어서,
UDP-글리코실트랜스퍼라제가 당 수용체 도메인을 포함하고, 상기 당 수용체 도메인의 아미노산 서열이 서열번호 1 또는 서열번호 11의 당 수용체 도메인의 아미노산 서열에 적어도 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 유전자 변형된 숙주 세포. - 제12항에 있어서,
UDP-글리코실트랜스퍼라제가
(a) 각각 서열번호 1 또는 서열번호 11의 고리1 위치(loop1 location)에 상응하는 UDP-글리코실트랜스퍼라제의 위치에, 서열번호 1 또는 서열번호 11의 고리1 아미노산 서열, 서열번호 28의 서열, 또는 변형 고리1 아미노산 서열;
(b) 각각 서열번호 1 또는 서열번호 11의 고리2 위치에 상응하는 UDP-글리코실트랜스퍼라제의 위치에, 서열번호 1 또는 서열번호 11의 고리2 아미노산 서열, 또는 변형 고리2 아미노산 서열;
(c) 각각 서열번호 1 또는 서열번호 11의 고리3_1 위치에 상응하는 UDP-글리코실트랜스퍼라제의 위치에, 서열번호 1 또는 서열번호 11의 고리3_1 아미노산 서열, 또는 변형 고리3_1 아미노산 서열;
(d) 각각 서열번호 1 또는 서열번호 11의 고리3_2 위치에 상응하는 UDP-글리코실트랜스퍼라제의 위치에, 서열번호 1 또는 서열번호 11의 고리3_2 아미노산 서열, 또는 변형 고리3_2 아미노산 서열;
(e) 각각 서열번호 1 또는 서열번호 11의 고리4_1 위치에 상응하는 위치에, 서열번호 1 또는 서열번호 11의 고리4_1 아미노산 서열, 또는 변형 고리4_1 아미노산 서열;
(f) 각각 서열번호 1 또는 서열번호 11의 고리4_2 위치에 상응하는 위치에, 서열번호 1 또는 서열번호 11의 고리4_2 아미노산 서열; 또는
(g) (a) 내지 (f)의 임의의 조합
을 포함하는 유전자 변형된 숙주 세포. - 제13항에 있어서,
변형 고리1 아미노산 서열, 변형 고리2 아미노산 서열, 변형 고리3_1 아미노산 서열, 변형 고리3_2 아미노산 서열, 및 변형 고리4_1 아미노산 서열 중 어느 하나가 그들 각각의, 서열번호 1 또는 서열번호 11과 상이한 또 다른 UDP-글리코실트랜스퍼라제의 상응하는 고리 위치들로부터 획득되고, 상기 또 다른 UDP-글리코실트랜스퍼라제가 서열번호 1 또는 서열번호 11에 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 유전자 변형된 숙주 세포. - 제14항에 있어서,
또 다른 UDP-글리코실트랜스퍼라제가, 스테비올 글리코시드의 19-O-글루코스의 C'2 위치에 대해 베타 1,2 글리코실화시킬 수 있는 유전자 변형된 숙주 세포. - 제15항에 있어서,
또 다른 UDP-글리코실트랜스퍼라제가 Os_UGT_91C1인 유전자 변형된 숙주 세포. - 제1항 내지 제16항 중 어느 한 항에 있어서,
UDP-글리코실트랜스퍼라제가
(a) 서열번호 1 또는 서열번호 11의 당 수용체 도메인에 적어도 61%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 또 다른 UDP-글리코실트랜스퍼라제의 당 수용체 도메인; 및
(b) 각각 서열번호 1 또는 서열번호 11의 고리4_1 위치에 상응하는 또 다른 UDP-글리코실트랜스퍼라제의 위치에 서열번호 1 또는 서열번호 11의 고리4_1 아미노산 서열
을 포함하는 유전자 변형된 숙주 세포. - 제1항 내지 제17항 중 어느 한 항에 있어서,
UDP-글리코실트랜스퍼라제가 당 수용체 도메인으로서 서열번호 22의 서열을 포함하는 유전자 변형된 숙주 세포. - 제1항 내지 제18항 중 어느 한 항에 있어서,
UDP-글리코실트랜스퍼라제가 서열번호 1 또는 서열번호 11에 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 서열 동일성을 갖는 아미노산 서열을 포함하고 각각 서열번호 1 또는 서열번호 11의 고리4_1 위치에 상응하는 위치에 서열번호 1 또는 서열번호 11의 고리4_1 아미노산 서열을 갖는 유전자 변형된 숙주 세포. - 제1항 내지 제19항 중 어느 한 항에 있어서,
UDP-글리코실트랜스퍼라제가 서열번호 25의 서열을 포함하는 유전자 변형된 숙주 세포. - 제1항 내지 제20항 중 어느 한 항에 있어서,
UDP-글리코실트랜스퍼라제가 하기 아미노산 잔기:
(a) 서열번호 11의 아미노산 위치 11에 상응하는 UDP-글리코실트랜스퍼라제의 아미노산 위치에 발린;
(b) 서열번호 11의 아미노산 위치 12에 상응하는 UDP-글리코실트랜스퍼라제의 아미노산 위치에 이소류신;
(c) 서열번호 11의 아미노산 위치 55에 상응하는 UDP-글리코실트랜스퍼라제의 아미노산 위치에 프롤린;
(d) 서열번호 11의 아미노산 위치 90에 상응하는 UDP-글리코실트랜스퍼라제의 아미노산 위치에 글루탐산;
(e) 서열번호 11의 아미노산 위치 203에 상응하는 UDP-글리코실트랜스퍼라제의 아미노산 위치에 세린;
(f) 서열번호 11의 아미노산 위치 223에 상응하는 UDP-글리코실트랜스퍼라제의 아미노산 위치에 글루탐산; 또는
(g) 서열번호 11의 아미노산 위치 413에 상응하는 UDP-글리코실트랜스퍼라제의 아미노산 위치에 발린
중 하나 이상을 포함하고,
여기서 서열번호 11의 아미노산 위치에 상응하는 UDP-글리코실트랜스퍼라제의 아미노산 위치가 서열 정렬에 의해 측정되는 유전자 변형된 숙주 세포 - 제1항 내지 제21항 중 어느 한 항에 있어서,
UDP-글리코실트랜스퍼라제가 서열번호 24의 아미노산 서열을 포함하는 유전자 변형된 숙주 세포. - 제1항 내지 제22항 중 어느 한 항에 있어서,
UDP-글리코실트랜스퍼라제가 당 공여체 도메인을 포함하고, 상기 당 공여체 도메인이 서열번호 1 또는 서열번호 11의 당 공여체 도메인의 아미노산 서열에 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하는 유전자 변형된 숙주 세포. - 제1항 내지 제23항 중 어느 한 항에 있어서,
당 공여체 도메인이 UDP-글리코실트랜스퍼라제의 C-말단에 위치하는 유전자 변형된 숙주 세포. - 제1항 내지 제24항 중 어느 한 항에 있어서,
UDP-글리코실트랜스퍼라제가 서열번호 1 또는 서열번호 11에 적어도 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하는 유전자 변형된 숙주 세포. - 서열번호 2에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 암호화하는 이종 핵산을 포함하는 유전자 변형된 숙주 세포.
- 제26항에 있어서,
RebA를 RebD로 50%를 초과하는 효율로 전환시킬 수 있는 유전자 변형된 숙주 세포. - 제26항 또는 제27항에 있어서,
UDP-글리코실트랜스퍼라제가 서열번호 2의 서열을 갖는 폴리펩티드인 유전자 변형된 숙주 세포. - 제26항 내지 제28항 중 어느 한 항에 있어서,
UDP-글리코실트랜스퍼라제가 서열번호 2의 기능성 도메인에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 기능성 도메인을 포함하는 폴리펩티드인 유전자 변형된 숙주 세포. - 서열번호 5에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 암호화하는 이종 핵산을 포함하는 유전자 변형된 숙주 세포.
- 제30항에 있어서,
RebA를 RebD로 40%를 초과하는 효율로 전환시킬 수 있는 유전자 변형된 숙주 세포. - 제30항 또는 제31항에 있어서,
UDP-글리코실트랜스퍼라제가 서열번호 5의 서열을 갖는 아미노산 서열을 포함하는 유전자 변형된 숙주 세포. - 제30항 내지 제32항 중 어느 한 항에 있어서,
UDP-글리코실트랜스퍼라제가 서열번호 5의 기능성 도메인에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 기능성 도메인을 갖는 폴리펩티드를 포함하는 유전자 변형된 숙주 세포. - 서열번호 6에 적어도 85%, 90% 또는 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제를 암호화하는 이종 핵산을 포함하는 유전자 변형된 숙주 세포.
- 제34항에 있어서,
RebA를 RebD로 85% 또는 90%를 초과하는 효율로 전환시킬 수 있는 유전자 변형된 숙주 세포. - 제34항 또는 제35항에 있어서,
UDP-글리코실트랜스퍼라제가 서열번호 6의 서열을 갖는 폴리펩티드인 유전자 변형된 숙주 세포. - 제34항 내지 제36항 중 어느 한 항에 있어서,
UDP-글리코실트랜스퍼라제가 서열번호 6의 기능성 도메인에 적어도 80%, 85%, 90% 또는 95% 서열 동일성을 갖는 기능성 도메인을 갖는 폴리펩티드를 포함하는 유전자 변형된 숙주 세포. - 제29항, 제33항 및 제37항 중 어느 한 항에 있어서,
기능성 도메인이 당 수용체 도메인인 유전자 변형된 숙주 세포. - 제1항 내지 제38항 중 어느 한 항에 있어서,
RebD를 생산할 수 있는 유전자 변형된 숙주 세포. - 제1항 내지 제39항 중 어느 한 항에 있어서,
RebM을 생산할 수 있는 유전자 변형된 숙주 세포. - 제1항 내지 제40항 중 어느 한 항에 있어서,
RebM 및 RebM2를 적어도 10:1, 100:1 또는 1000:1의 비로 생산할 수 있는 유전자 변형된 숙주 세포. - 제1항 내지 제41항 중 어느 한 항에 있어서,
검출할 수 없는 수준의 RebM2를 생산하는 유전자 변형된 숙주 세포. - 제1항 내지 제42항 중 어느 한 항에 있어서,
스테비오시드를 RebE로 전환시킬 수 있는 유전자 변형된 숙주 세포. - 제1항 내지 제43항 중 어느 한 항에 있어서,
스테비올 생성 경로의 하나 이상의 효소를 암호화하는 하나 이상의 이종 핵산을 추가로 포함하는 유전자 변형된 숙주 세포. - 제1항 내지 제44항 중 어느 한 항에 있어서,
스테비올 글리코시드 생성 경로의 하나 이상의 효소를 암호화하는 하나 이상의 이종 핵산을 추가로 포함하는 유전자 변형된 숙주 세포. - 제1항 내지 제45항 중 어느 한 항에 있어서,
RebA 생성 경로의 하나 이상의 효소를 암호화하는 하나 이상의 이종 핵산을 추가로 포함하는 유전자 변형된 숙주 세포. - 제1항 내지 제46항 중 어느 한 항에 있어서,
RebM 생성 경로의 하나 이상의 효소를 암호화하는 하나 이상의 이종 핵산을 추가로 포함하는 유전자 변형된 숙주 세포. - 제1항 내지 제47항 중 어느 한 항에 있어서,
RebE 생성 경로의 하나 이상의 효소를 암호화하는 하나 이상의 이종 핵산을 추가로 포함하는 유전자 변형된 숙주 세포. - 제1항 내지 제48항 중 어느 한 항에 있어서,
경로의 하나 이상의 효소가 제라닐제라닐 디포스페이트 신타제를 포함하는 유전자 변형된 숙주 세포. - 제1항 내지 제49항 중 어느 한 항에 있어서,
경로의 하나 이상의 효소가 코팔릴 디포스페이트 신타제를 포함하는 유전자 변형된 숙주 세포. - 제1항 내지 제50항 중 어느 한 항에 있어서,
경로의 하나 이상의 효소가 ent-카우렌 신타제를 포함하는 유전자 변형된 숙주 세포. - 제1항 내지 제51항 중 어느 한 항에 있어서,
경로의 하나 이상의 효소가 카우렌 옥시다제를 포함하는 유전자 변형된 숙주 세포. - 제1항 내지 제52항 중 어느 한 항에 있어서,
경로의 하나 이상의 효소가 카우렌산 하이드록실라제를 포함하는 유전자 변형된 숙주 세포. - 제1항 내지 제53항 중 어느 한 항에 있어서,
경로의 하나 이상의 효소가 시토크롬 P450 리덕타제를 포함하는 유전자 변형된 숙주 세포. - 제1항 내지 제54항 중 어느 한 항에 있어서,
경로의 하나 이상의 효소가 유리딘 5'-디포스포 글리코실트랜스퍼라제를 포함하는 유전자 변형된 숙주 세포. - 제1항 내지 제55항 중 어느 한 항에 있어서,
경로의 하나 이상의 효소가 UGT74G1, UGT76G1, UGT85C2, 및 UGT91D를 포함하는 유전자 변형된 숙주 세포. - 제1항 내지 제56항 중 어느 한 항에 있어서,
경로의 하나 이상의 효소가 제라닐제라닐 디포스페이트 신타제, 코팔릴 디포스페이트 신타제, ent-카우렌 신타제, 카우렌 옥시다제, 카우렌산 하이드록실라제, 시토크롬 P450 리덕타제, UGT74G1, UGT76G1, UGT85C2, 및 UGT91D를 포함하는 유전자 변형된 숙주 세포. - 제1항 내지 제57항 중 어느 한 항에 있어서,
경로의 하나 이상의 효소가 이작용기(bifunctional) 코팔릴 디포스페이트 신타제 및 카우렌 신타제를 포함하는 유전자 변형된 숙주 세포. - 제1항 내지 제58항 중 어느 한 항에 있어서,
경로의 하나 이상의 효소를 암호화하는 하나 이상의 이종 핵산이 단일의 전사 조절제의 조절하에 있는 유전자 변형된 숙주 세포. - 제1항 내지 제59항 중 어느 한 항에 있어서,
경로의 하나 이상의 효소를 암호화하는 하나 이상의 이종 핵산이 다수의 이종 전사 조절제의 조절하에 있는 유전자 변형된 숙주 세포. - 제1항 내지 제60항 중 어느 한 항에 있어서,
세균 세포, 진균 세포, 조류 세포(algal cell), 곤충 세포, 및 식물 세포로 이루어지는 그룹 중에서 선택되는 유전자 변형된 숙주 세포. - 제1항 내지 제61항 중 어느 한 항에 있어서,
효모 세포인 유전자 변형된 숙주 세포. - 제1항 내지 제62항 중 어느 한 항에 있어서,
효모가 사카로마이세스 세레비지아에(Saccharomyces cerevisiae)인 유전자 변형된 숙주 세포. - (a) 제1항 내지 제63항 중 어느 한 항의 유전자 변형된 숙주 세포의 집단을 RebD 생성에 적합한 조건하에서 탄소원(carbon source)이 있는 배지에서 배양하고;
(b) 상기 배지로부터 상기 RebD 화합물을 회수하는,
RebD의 생산 방법. - (a) 제1항 내지 제64항 중 어느 한 항의 유전자 변형된 숙주 세포의 집단을 RebM 생성에 적합한 조건하에서 탄소원이 있는 배지에서 배양하고;
(b) 상기 배지로부터 상기 RebM 화합물을 회수하는,
RebM의 생산 방법. - (a) RebA를, RebD 형성에 적합한 조건하에서 글루코스, 및 RebA를 RebD로 전환시킬 수 있는, 제1항 내지 제63항 중 어느 한 항의 UDP-글리코실트랜스퍼라제와 접촉시키고;
(b) 상기 배지로부터 상기 RebD 화합물을 회수하는,
RebD의 생산 방법. - (a) RebM 형성에 적합한 조건하에서 기질을 글루코스 또는 UDP-당 및
(i) RebA를 RebD로 전환시킬 수 있는, 제1항 내지 제63항 중 어느 한 항의 UDP-글리코실트랜스퍼라제; 및
(ii) RebD를 RebM으로 전환시킬 수 있는 UDP-글리코실트랜스퍼라제
와 접촉시키는, RebM의 생산 방법. - RebA를 RebD로 전환시킬 수 있는, 제1항 내지 제63항 중 어느 한 항의 UDP-글리코실트랜스퍼라제 중 어느 하나를 사용하여 RebA를 RebD로 전환시킴을 포함하는 RebD의 생성 방법.
- (a) RebA를 RebD로 전환시킬 수 있는, 제1항 내지 제63항 중 어느 한 항의 UDP-글리코실트랜스퍼라제 중 어느 하나를 사용하여 RebA를 RebD로 전환시키고;
(b) RebD를 RebM으로 전환시킬 수 있는 UDP-글리코실트랜스퍼라제를 사용하여 RebD를 RebM으로 전환시킴
을 포함하는, RebM의 생성 방법. - (a) (i) RebA를 RebD로 전환시킬 수 있는, 제1항 내지 제63항 중 어느 한 항의 UDP-글리코실트랜스퍼라제를 암호화하는 이종 핵산을 포함하는 유전자 변형된 숙주 세포; 및
(b) 상기 유전자 변형된 숙주 세포로부터 생산된 스테비올 글리코시드
를 포함하는 발효 조성물. - 스테비올 글리코시드를 포함하는, 제1항 내지 제63항 중 어느 한 항의 유전자 변형된 숙주 세포에 의해 생산된 발효 조성물로서, 상기 스테비올 글리코시드가 적어도 1:7:50의 RebA:RebD:RebM 비로 RebA, RebD 및 RebM을 포함하는 발효 조성물.
- 제71항에 있어서,
스테비올 글리코시드가 적어도 1:7:50 내지 1:100:1000의 RebA:RebD:RebM 비로 RebA, RebD 및 RebM을 포함하는 발효 조성물. - 제71항에 있어서,
스테비올 글리코시드가 적어도 1:7:50 내지 1:200:2000의 RebA:RebD:RebM 비로 RebA, RebD 및 RebM을 포함하는 발효 조성물. - 스테비올 글리코시드를 포함하는, 제1항 내지 제63항 중 어느 한 항의 유전자 변형된 숙주 세포에 의해 생산된 발효 조성물로서, 상기 스테비올 글리코시드가 적어도 7:50의 RebD:RebM 비로 RebD 및 RebM을 포함하는 발효 조성물.
- 제74항에 있어서,
스테비올 글리코시드가 적어도 7:50 내지 7:100의 RebD:RebM 비로 RebD 및 RebM을 포함하는 발효 조성물. - 제74항에 있어서,
스테비올 글리코시드가 적어도 7:50 내지 7:200의 RebD:RebM 비로 RebD 및 RebM을 포함하는 발효 조성물. - 스테비올 글리코시드를 포함하는, 제1항 내지 제63항 중 어느 한 항의 유전자 변형된 숙주 세포에 의해 생산된 발효 조성물로서, 상기 스테비올 글리코시드가 적어도 1:50의 RebA:RebM 비로 RebA 및 RebM을 포함하는 발효 조성물.
- 제77항에 있어서,
스테비올 글리코시드가 적어도 1:50 내지 1:1000의 RebA:RebM 비로 RebA 및 RebM을 포함하는 발효 조성물. - 제77항에 있어서,
스테비올 글리코시드가 적어도 1:50 내지 1:2000의 RebA:RebM 비로 RebA 및 RebM을 포함하는 발효 조성물. - 서열번호 1 또는 서열번호 11에 적어도 80%, 85%, 90%, 95% 서열 동일성을 갖는 비-천연 UDP-글리코실트랜스퍼라제.
- 생체내에서 RebA를 RebD로 90%, 95%, 96% 또는 97%를 초과하는 효율로 전환시킬 수 있는 비-천연 UDP-글리코실트랜스퍼라제.
- 비-천연 UDP-글리코실트랜스퍼라제로서,
(a) 서열번호 1 또는 서열번호 11의 고리4_1 위치에 상응하는 UDP-글리코실트랜스퍼라제의 위치에 서열번호 22를 갖는 고리4_1 아미노산 서열을 포함하고;
(b) 스테비올 글리코시드의 19-O-글루코스의 C2' 위치에 대해 베타 1,2 글리코실화시킬 수 있는
상기 UDP-글리코실트랜스퍼라제. - 제80항 내지 제82항 중 어느 한 항에 있어서,
하기 아미노산 잔기:
(a) 서열번호 11의 아미노산 위치 11에 상응하는 UDP-글리코실트랜스퍼라제의 아미노산 위치에 발린;
(b) 서열번호 11의 아미노산 위치 12에 상응하는 UDP-글리코실트랜스퍼라제의 아미노산 위치에 이소류신;
(c) 서열번호 11의 아미노산 위치 55에 상응하는 UDP-글리코실트랜스퍼라제의 아미노산 위치에 프롤린;
(d) 서열번호 11의 아미노산 위치 90에 상응하는 UDP-글리코실트랜스퍼라제의 아미노산 위치에 글루탐산;
(e) 서열번호 11의 아미노산 위치 203에 상응하는 UDP-글리코실트랜스퍼라제의 아미노산 위치에 세린;
(f) 서열번호 11의 아미노산 위치 223에 상응하는 UDP-글리코실트랜스퍼라제의 아미노산 위치에 글루탐산; 또는
(g) 서열번호 11의 아미노산 위치 413에 상응하는 UDP-글리코실트랜스퍼라제의 아미노산 위치에 발린
중 하나 이상을 포함하고,
서열번호 11의 아미노산 위치에 상응하는 UDP-글리코실트랜스퍼라제의 아미노산 위치가 서열 정렬에 의해 측정되는 비-천연 UDP-글리코실트랜스퍼라제. - 제80항 내지 제82항 중 어느 한 항의 비-천연 UDP-글리코실트랜스퍼라제를 암호화하는 비-천연 핵산.
- (a) 제1항 내지 제63항 중 어느 한 항의 유전자 변형된 숙주 세포의 집단을 RebM 생성에 적합한 조건하에서 탄소원이 있는 배지에서 배양하고;
(b) 상기 배지로부터 상기 RebM 화합물을 회수하는
방법에 의해 제조된 RebM을 포함하는 감미료(sweetener). - (a) 제1항 내지 제63항 중 어느 한 항의 유전자 변형된 숙주 세포의 집단을 RebM 생성에 적합한 조건하에서 탄소원이 있는 배지에서 배양하고;
(b) 상기 배지로부터 상기 RebM 화합물을 회수하는
방법에 의해 제조된 RebM 및 적어도 하나의 다른 물질을 포함하는 감미료 조성물. - (a) 제1항 내지 제63항 중 어느 한 항의 유전자 변형된 숙주 세포의 집단을 RebM 생성에 적합한 조건하에서 탄소원이 있는 배지에서 배양하고;
(b) 상기 배지로부터 상기 RebM 화합물을 회수하는
방법에 의해 제조된 RebM을 포함하는 감미된 조성물. - (a) 제1항 내지 제63항 중 어느 한 항의 유전자 변형된 숙주 세포의 집단을 RebM 생성에 적합한 조건하에서 탄소원이 있는 배지에서 배양하고;
(b) 상기 배지로부터 상기 RebM 화합물을 회수하는
방법에 의해 제조된 RebM을 적어도 하나의 다른 물질과 조합함을 포함하는 감미료 조성물의 생성 방법. - (a) 제1항 내지 제63항 중 어느 한 항의 유전자 변형된 숙주 세포의 집단을 RebM 생성에 적합한 조건하에서 탄소원이 있는 배지에서 배양하고;
(b) 상기 배지로부터 상기 RebM 화합물을 회수하는
방법에 의해 제조된 RebM을 적어도 하나의 감미가능한 조성물과 조합함을 포함하는 감미된 조성물의 생성 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662374408P | 2016-08-12 | 2016-08-12 | |
US62/374,408 | 2016-08-12 | ||
PCT/US2017/046637 WO2018031955A2 (en) | 2016-08-12 | 2017-08-11 | Udp-dependent glycosyltransferase for high efficiency production of rebaudiosides |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20190038612A true KR20190038612A (ko) | 2019-04-08 |
KR102331018B1 KR102331018B1 (ko) | 2021-11-26 |
Family
ID=59700219
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020197006546A KR102331018B1 (ko) | 2016-08-12 | 2017-08-11 | 레바우디오시드의 고효율 생산을 위한 udp 의존성 글리코실트랜스퍼라제 |
Country Status (14)
Country | Link |
---|---|
US (3) | US11091743B2 (ko) |
EP (1) | EP3497222B1 (ko) |
JP (2) | JP7404068B2 (ko) |
KR (1) | KR102331018B1 (ko) |
CN (1) | CN109804073B (ko) |
AU (1) | AU2017308143B2 (ko) |
BR (1) | BR112018074999A2 (ko) |
CA (1) | CA3031162A1 (ko) |
ES (1) | ES2906310T3 (ko) |
MX (1) | MX2019001631A (ko) |
MY (1) | MY194280A (ko) |
PT (1) | PT3497222T (ko) |
SG (1) | SG11201900930UA (ko) |
WO (1) | WO2018031955A2 (ko) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20230055732A (ko) * | 2021-10-19 | 2023-04-26 | 씨제이제일제당 (주) | 신규한 당전이효소 및 이의 용도 |
WO2023121426A1 (ko) * | 2021-12-24 | 2023-06-29 | 주식회사 삼양사 | 레바우디오사이드의 생산 |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113549664A (zh) | 2014-09-19 | 2021-10-26 | 谱赛科有限责任公司 | 高纯度甜菊醇糖苷 |
ES2906310T3 (es) * | 2016-08-12 | 2022-04-18 | Amyris Inc | Glicosiltransferasa dependiente de UDP para la producción de alta eficiencia de rebaudiósidos |
CA3175070A1 (en) | 2017-02-03 | 2018-08-09 | Codexis, Inc. | Engineered glycosyltransferases and steviol glycoside glucosylation methods |
CN111093390A (zh) * | 2017-05-15 | 2020-05-01 | 谱赛科美国股份有限公司 | 高纯度甜菊醇糖苷 |
EP3765627A4 (en) * | 2018-03-12 | 2021-10-13 | Conagen Inc. | BIOSYNTHETIC PRODUCTION OF STEVIOL GLYCOSIDES REBAUDIOSIDE J AND REBAUDIOSIDE N |
EP3788059A1 (en) * | 2018-04-30 | 2021-03-10 | DSM IP Assets B.V. | Steviol glycoside transport |
WO2020081468A1 (en) | 2018-10-15 | 2020-04-23 | Amyris, Inc. | Stevia rebaudiana kaurenoic acid hydroxylase variants for high efficiency production of rebaudiosides |
US20220106619A1 (en) | 2019-01-24 | 2022-04-07 | Amyris, Inc. | Abc transporters for the high efficiency production of rebaudiosides |
CA3171399A1 (en) * | 2020-03-13 | 2021-09-16 | Stanley W. HERRMANN | Rebaudioside m sweetener compositions |
CN111424065B (zh) * | 2020-03-24 | 2022-08-16 | 金禾益康(北京)生物科技有限公司 | 使用糖基转移酶对甜菊糖苷类化合物进行糖基化方法 |
CN111518782B (zh) * | 2020-03-24 | 2022-09-02 | 广东广业清怡食品科技股份有限公司 | 一种糖基转移酶ugtzj1突变体及其应用 |
WO2022216922A1 (en) * | 2021-04-08 | 2022-10-13 | Conagen Inc. | Biosynthetic production of steviol glycosides |
CN115478060B (zh) * | 2021-06-16 | 2023-11-28 | 弈柯莱生物科技(集团)股份有限公司 | 一种糖基转移酶及其应用 |
AU2022373017A1 (en) * | 2021-10-19 | 2024-05-30 | Cj Cheiljedang Corporation | Method for producing rebaudioside d and rebaudioside m |
CN114045273B (zh) * | 2021-11-15 | 2022-07-22 | 四川大学 | 糖基转移酶OsUGT91C1突变体及其应用 |
WO2023225604A1 (en) * | 2022-05-19 | 2023-11-23 | Amyris, Inc. | Compositions and methods for improved production of steviol glycosides |
WO2024042405A1 (en) | 2022-08-26 | 2024-02-29 | Amyris Bio Products Portugal, Unipessoal, Ltda. | Compositions and methods for the synthesis of bio-based polymers |
WO2024042486A1 (en) | 2022-08-26 | 2024-02-29 | Amyris Bio Products Portugal, Unipessoal, Ltda. | Compositions and methods for the production of polyurethanes |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013022989A2 (en) * | 2011-08-08 | 2013-02-14 | Evolva Sa | Recombinant production of steviol glycosides |
WO2014193888A1 (en) * | 2013-05-28 | 2014-12-04 | Purecircle Sdn Bhd | High-purity steviol glycosides |
Family Cites Families (51)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7838044B2 (en) | 2004-12-21 | 2010-11-23 | Purecircle Sdn Bhd | Extraction, separation and modification of sweet glycosides from the Stevia rebaudiana plant |
WO2010038911A1 (en) | 2008-10-03 | 2010-04-08 | Morita Kagaku Kogyo Co., Ltd. | New steviol glycoside |
JP4760951B2 (ja) | 2009-05-08 | 2011-08-31 | トヨタ自動車株式会社 | ブタノール生産能を有する組換え微生物及びブタノールの製造方法 |
BR112012011382B1 (pt) | 2009-11-12 | 2018-02-06 | Purecircle Usa Inc. | Método para produzir um adoçante e adoçante de stevia granulado |
US10888099B2 (en) | 2009-11-12 | 2021-01-12 | Purecircle Sdn Bhd. | Granulation of a Stevia sweetener |
WO2011112892A1 (en) | 2010-03-12 | 2011-09-15 | Purecircle Usa Inc. | High-purity steviol glycosides |
JP5056897B2 (ja) | 2010-05-14 | 2012-10-24 | トヨタ自動車株式会社 | 2−ブタノールの製造方法及び2−ブタノール生産能を有する組換え微生物 |
BR112012030836B8 (pt) | 2010-06-02 | 2024-02-06 | Evolva Nutrition Inc | Hospedeiro recombinante que compreende genes recombinantes para produção de esteviol ou glicosídeo de esteviol, método para produzir esteviol, glicosídeo de esteviol ou composição de glicosídeo de esteviol e método para sintetizar esteviol ou glicosídeo de esteviol |
WO2012135591A2 (en) | 2011-03-30 | 2012-10-04 | Amyris, Inc. | Microbial isoprenoid production using a heterologous dxp pathway |
US20150031868A1 (en) | 2012-01-23 | 2015-01-29 | Dsm Ip Assets B.V. | Diterpene production |
JP6251669B2 (ja) | 2012-03-16 | 2017-12-20 | サントリーホールディングス株式会社 | ステビオール配糖体化酵素およびそれをコードする遺伝子 |
JP6189828B2 (ja) | 2012-03-27 | 2017-08-30 | サントリーホールディングス株式会社 | ステビオール配糖体の製造方法 |
WO2013176738A1 (en) | 2012-05-22 | 2013-11-28 | Purecircle Sdn Bhd | High-purity steviol glycosides |
TW201402599A (zh) | 2012-05-30 | 2014-01-16 | Suntory Holdings Ltd | 甜菊糖苷糖苷轉化酵素及編碼該酵素之基因 |
MY190346A (en) * | 2013-02-06 | 2022-04-15 | Evolva Sa | Methods for improved production of rebaudioside d and rebaudioside m |
BR112015019160A2 (pt) | 2013-02-11 | 2017-08-22 | Dalgaard Mikkelsen Michael | Produção de glicosídeos de esteviol em hospedeiros recombinantes |
KR101404728B1 (ko) | 2013-02-28 | 2014-06-09 | 씨제이제일제당 (주) | 스테비오사이드로부터 리바우디오사이드 a를 제조하는 방법 |
WO2014146084A1 (en) | 2013-03-15 | 2014-09-18 | Cargill, Incorporated | Stevia plants with an increased rebaudioside d content |
EP3502264A3 (en) | 2013-05-31 | 2019-11-06 | DSM IP Assets B.V. | Microorganisms for diterpene production |
WO2015007748A1 (en) | 2013-07-15 | 2015-01-22 | Dsm Ip Assets B.V. | Diterpene production |
BR112016002092B1 (pt) | 2013-07-31 | 2020-12-15 | Dsm Ip Assets B.V. | Recuperação de glicosídeos de esteviol |
BR112016002526B1 (pt) | 2013-08-07 | 2021-11-23 | Total Marketing Services | Método para produção de um composto heterólogo não catabólico, e, composição de fermentação |
SG10201901007PA (en) | 2014-08-11 | 2019-03-28 | Evolva Sa | Production of steviol glycosides in recombinant hosts |
EP3683315A1 (en) | 2014-08-19 | 2020-07-22 | Purecircle SDN BHD | Method for preparing rebaudioside m |
WO2016038095A2 (en) * | 2014-09-09 | 2016-03-17 | Evolva Sa | Production of steviol glycosides in recombinant hosts |
MX2017004248A (es) | 2014-10-03 | 2017-05-19 | Conagen Inc | Edulcorantes no caloricos y metodos para sintetizar. |
US10463062B2 (en) | 2014-11-05 | 2019-11-05 | Manus Bio Inc. | Microbial production of steviol glycosides |
CN108337892B (zh) | 2015-01-30 | 2022-06-24 | 埃沃尔瓦公司 | 在重组宿主中生产甜菊醇糖苷 |
CN104726523B (zh) * | 2015-03-28 | 2018-08-10 | 南京工业大学 | 一种酶法制备莱鲍迪苷m的方法 |
WO2016196345A1 (en) | 2015-05-29 | 2016-12-08 | Cargill, Incorporated | Heat treatment to produce glycosides |
JP2018516600A (ja) | 2015-05-29 | 2018-06-28 | カーギル・インコーポレイテッド | 高いpHを使用してステビオールグリコシドを産生するための発酵方法及びそこから得られる組成物 |
BR112018000550B1 (pt) | 2015-07-10 | 2022-05-10 | Dsm Ip Assets B.V. | Método para preparar uma composição de glicosídeo de esteviol |
BR112018000298B1 (pt) | 2015-07-10 | 2022-06-07 | Dsm Ip Assets B.V. | Método para reduzir o teor de ácido caurenóico de uma composição de glicosídeo de esteviol |
CN107922913B (zh) | 2015-08-13 | 2022-04-05 | 帝斯曼知识产权资产管理有限公司 | 甜菊醇糖苷转运 |
US20200308616A1 (en) | 2015-11-30 | 2020-10-01 | Purecircle Sdn Bhd | Process for producing high purity steviol glycosides |
CN108473995B (zh) | 2015-12-10 | 2022-10-18 | 埃沃尔瓦公司 | 在重组宿主中产生甜菊醇糖苷 |
KR20180118677A (ko) * | 2016-03-01 | 2018-10-31 | 유니베이션 테크놀로지즈, 엘엘씨 | 지글러-나타 촉매 활성을 향상시키는 방법 |
CN109195457A (zh) | 2016-04-13 | 2019-01-11 | 埃沃尔瓦公司 | 在重组宿主中产生甜菊醇糖苷 |
CA3023399A1 (en) | 2016-05-16 | 2017-11-23 | Evolva Sa | Production of steviol glycosides in recombinant hosts |
US10815514B2 (en) | 2016-05-16 | 2020-10-27 | Evolva Sa | Production of steviol glycosides in recombinant hosts |
BR112019002417B1 (pt) | 2016-08-09 | 2023-05-02 | Dsm Ip Assets B.V. | Cristalização de glicosídeos de esteviol |
ES2906310T3 (es) * | 2016-08-12 | 2022-04-18 | Amyris Inc | Glicosiltransferasa dependiente de UDP para la producción de alta eficiencia de rebaudiósidos |
CN110100006A (zh) | 2016-11-07 | 2019-08-06 | 埃沃尔瓦公司 | 重组宿主中甜菊糖苷的生产 |
CN111093390A (zh) | 2017-05-15 | 2020-05-01 | 谱赛科美国股份有限公司 | 高纯度甜菊醇糖苷 |
JP7487099B2 (ja) * | 2017-08-11 | 2024-05-20 | アミリス, インコーポレイテッド | レバウジオシドの高効率生成のためのエンドウ(pisum sativum)カウレンオキシダーゼ |
WO2019099649A1 (en) | 2017-11-20 | 2019-05-23 | Manus Bio, Inc. | Microbial host cells for production of steviol glycosides |
US20190270971A1 (en) | 2018-03-01 | 2019-09-05 | Jason Donald | Increasing productivity of microbial host cells that functionally express p450 enzymes |
GB201805576D0 (en) | 2018-04-04 | 2018-05-16 | Optibiotix Ltd | Sweeteners and methods of production thereof |
EP3788059A1 (en) | 2018-04-30 | 2021-03-10 | DSM IP Assets B.V. | Steviol glycoside transport |
WO2020028039A1 (en) | 2018-07-30 | 2020-02-06 | Codexis, Inc. | Engineered glycosyltransferases and steviol glycoside glucosylation methods |
CA3144658A1 (en) | 2019-06-25 | 2020-12-30 | Manus Bio, Inc. | Uridine diphosphate-dependent glycosyltransferase enzyme |
-
2017
- 2017-08-11 ES ES17757641T patent/ES2906310T3/es active Active
- 2017-08-11 MX MX2019001631A patent/MX2019001631A/es unknown
- 2017-08-11 MY MYPI2019000757A patent/MY194280A/en unknown
- 2017-08-11 CA CA3031162A patent/CA3031162A1/en active Pending
- 2017-08-11 SG SG11201900930UA patent/SG11201900930UA/en unknown
- 2017-08-11 CN CN201780049312.3A patent/CN109804073B/zh active Active
- 2017-08-11 JP JP2019507224A patent/JP7404068B2/ja active Active
- 2017-08-11 US US16/323,756 patent/US11091743B2/en active Active
- 2017-08-11 PT PT177576410T patent/PT3497222T/pt unknown
- 2017-08-11 AU AU2017308143A patent/AU2017308143B2/en active Active
- 2017-08-11 KR KR1020197006546A patent/KR102331018B1/ko active IP Right Grant
- 2017-08-11 BR BR112018074999-0A patent/BR112018074999A2/pt unknown
- 2017-08-11 WO PCT/US2017/046637 patent/WO2018031955A2/en unknown
- 2017-08-11 EP EP17757641.0A patent/EP3497222B1/en active Active
-
2021
- 2021-07-22 US US17/382,963 patent/US11866738B2/en active Active
-
2022
- 2022-06-17 JP JP2022097959A patent/JP2022137061A/ja active Pending
-
2023
- 2023-11-30 US US18/525,234 patent/US20240174987A1/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013022989A2 (en) * | 2011-08-08 | 2013-02-14 | Evolva Sa | Recombinant production of steviol glycosides |
WO2014193888A1 (en) * | 2013-05-28 | 2014-12-04 | Purecircle Sdn Bhd | High-purity steviol glycosides |
Non-Patent Citations (1)
Title |
---|
UniProtKB, accession number #K4AME6(2012. 11. 28. 공개)* * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20230055732A (ko) * | 2021-10-19 | 2023-04-26 | 씨제이제일제당 (주) | 신규한 당전이효소 및 이의 용도 |
WO2023068472A1 (ko) * | 2021-10-19 | 2023-04-27 | 씨제이제일제당 (주) | 신규한 당전이효소 및 이의 용도 |
WO2023121426A1 (ko) * | 2021-12-24 | 2023-06-29 | 주식회사 삼양사 | 레바우디오사이드의 생산 |
Also Published As
Publication number | Publication date |
---|---|
US20210355458A1 (en) | 2021-11-18 |
JP2022137061A (ja) | 2022-09-21 |
WO2018031955A2 (en) | 2018-02-15 |
PT3497222T (pt) | 2022-02-09 |
US11091743B2 (en) | 2021-08-17 |
BR112018074999A2 (pt) | 2019-03-12 |
CN109804073A (zh) | 2019-05-24 |
US20190185826A1 (en) | 2019-06-20 |
EP3497222B1 (en) | 2021-12-22 |
SG11201900930UA (en) | 2019-02-27 |
JP2019524134A (ja) | 2019-09-05 |
ES2906310T3 (es) | 2022-04-18 |
US20240174987A1 (en) | 2024-05-30 |
AU2017308143B2 (en) | 2022-04-07 |
RU2019104496A (ru) | 2020-09-14 |
AU2017308143A1 (en) | 2019-02-07 |
MX2019001631A (es) | 2019-08-05 |
KR102331018B1 (ko) | 2021-11-26 |
RU2019104496A3 (ko) | 2021-04-09 |
CN109804073B (zh) | 2023-05-16 |
WO2018031955A3 (en) | 2018-03-15 |
CA3031162A1 (en) | 2018-02-15 |
US11866738B2 (en) | 2024-01-09 |
EP3497222A2 (en) | 2019-06-19 |
MY194280A (en) | 2022-11-25 |
JP7404068B2 (ja) | 2023-12-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11866738B2 (en) | UDP-dependent glycosyltransferase for high efficiency production of rebaudiosides | |
JP7487099B2 (ja) | レバウジオシドの高効率生成のためのエンドウ(pisum sativum)カウレンオキシダーゼ | |
US20210371892A1 (en) | Stevia rebaudiana kaurenoic acid hydroxylase variants for high efficiency production of rebaudiosides | |
RU2777901C2 (ru) | Udp-зависимая гликозилтрансфераза для высокоэффективного продуцирования ребаудиозидов | |
RU2795855C2 (ru) | Аbc-транспортеры для высокоэффективного производства ребаудиозидов | |
RU2795550C2 (ru) | Применение кауреноксидазы pisum sativum для высокоэффективного производства ребаудиозидов | |
US20220282228A1 (en) | Kaurenoic acid 13-hydroxylase (kah) variants and uses thereof | |
US20220106619A1 (en) | Abc transporters for the high efficiency production of rebaudiosides | |
WO2023225604A1 (en) | Compositions and methods for improved production of steviol glycosides |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
AMND | Amendment | ||
X701 | Decision to grant (after re-examination) | ||
GRNT | Written decision to grant |