KR20200035981A - 레바우디오사이드의 고효율 생산을 위한 피숨 사티붐 카우렌 산화효소 - Google Patents
레바우디오사이드의 고효율 생산을 위한 피숨 사티붐 카우렌 산화효소 Download PDFInfo
- Publication number
- KR20200035981A KR20200035981A KR1020207005218A KR20207005218A KR20200035981A KR 20200035981 A KR20200035981 A KR 20200035981A KR 1020207005218 A KR1020207005218 A KR 1020207005218A KR 20207005218 A KR20207005218 A KR 20207005218A KR 20200035981 A KR20200035981 A KR 20200035981A
- Authority
- KR
- South Korea
- Prior art keywords
- host cell
- leu
- genetically modified
- glu
- ala
- Prior art date
Links
- 108090000854 Oxidoreductases Proteins 0.000 title claims abstract description 105
- 102000004316 Oxidoreductases Human genes 0.000 title claims abstract description 104
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 48
- 241000219843 Pisum Species 0.000 title abstract description 19
- 229930188195 rebaudioside Natural products 0.000 title description 14
- 102000004190 Enzymes Human genes 0.000 claims abstract description 255
- 108090000790 Enzymes Proteins 0.000 claims abstract description 255
- 238000000034 method Methods 0.000 claims abstract description 165
- 235000019202 steviosides Nutrition 0.000 claims abstract description 99
- RPYRMTHVSUWHSV-CUZJHZIBSA-N rebaudioside D Chemical compound O([C@H]1[C@H](O)[C@@H](CO)O[C@H]([C@@H]1O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)O[C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(=O)O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O RPYRMTHVSUWHSV-CUZJHZIBSA-N 0.000 claims abstract description 96
- 239000004383 Steviol glycoside Substances 0.000 claims abstract description 84
- 235000019411 steviol glycoside Nutrition 0.000 claims abstract description 84
- 229930182488 steviol glycoside Natural products 0.000 claims abstract description 84
- 150000008144 steviol glycosides Chemical class 0.000 claims abstract description 78
- 230000037361 pathway Effects 0.000 claims abstract description 53
- 239000002773 nucleotide Substances 0.000 claims abstract description 40
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 40
- -1 but not limited to Chemical class 0.000 claims abstract description 19
- 210000004027 cell Anatomy 0.000 claims description 414
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 325
- 150000007523 nucleic acids Chemical class 0.000 claims description 148
- 102000039446 nucleic acids Human genes 0.000 claims description 142
- 108020004707 nucleic acids Proteins 0.000 claims description 142
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 122
- 229920001184 polypeptide Polymers 0.000 claims description 120
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 120
- NIKHGUQULKYIGE-UHFFFAOYSA-N kaurenoic acid Natural products C1CC2(CC3=C)CC3CCC2C2(C)C1C(C)(C(O)=O)CCC2 NIKHGUQULKYIGE-UHFFFAOYSA-N 0.000 claims description 85
- NIKHGUQULKYIGE-OTCXFQBHSA-N ent-kaur-16-en-19-oic acid Chemical compound C([C@@H]1C[C@]2(CC1=C)CC1)C[C@H]2[C@@]2(C)[C@H]1[C@](C)(C(O)=O)CCC2 NIKHGUQULKYIGE-OTCXFQBHSA-N 0.000 claims description 82
- 108010067758 ent-kaurene oxidase Proteins 0.000 claims description 59
- 241000235070 Saccharomyces Species 0.000 claims description 54
- 229940032084 steviol Drugs 0.000 claims description 46
- ONVABDHFQKWOSV-UHFFFAOYSA-N 16-Phyllocladene Natural products C1CC(C2)C(=C)CC32CCC2C(C)(C)CCCC2(C)C31 ONVABDHFQKWOSV-UHFFFAOYSA-N 0.000 claims description 45
- QFVOYBUQQBFCRH-UHFFFAOYSA-N Steviol Natural products C1CC2(C3)CC(=C)C3(O)CCC2C2(C)C1C(C)(C(O)=O)CCC2 QFVOYBUQQBFCRH-UHFFFAOYSA-N 0.000 claims description 45
- QFVOYBUQQBFCRH-VQSWZGCSSA-N steviol Chemical compound C([C@@]1(O)C(=C)C[C@@]2(C1)CC1)C[C@H]2[C@@]2(C)[C@H]1[C@](C)(C(O)=O)CCC2 QFVOYBUQQBFCRH-VQSWZGCSSA-N 0.000 claims description 45
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims description 38
- 241000954177 Bangana ariza Species 0.000 claims description 37
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 claims description 37
- 229910052799 carbon Inorganic materials 0.000 claims description 37
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 claims description 36
- 230000008569 process Effects 0.000 claims description 33
- 150000001875 compounds Chemical class 0.000 claims description 28
- JCAVDWHQNFTFBW-UHFFFAOYSA-N ent-kaurenal Natural products C1CC(C2)C(=C)CC32CCC2C(C)(C=O)CCCC2(C)C31 JCAVDWHQNFTFBW-UHFFFAOYSA-N 0.000 claims description 27
- JCAVDWHQNFTFBW-XRNRSJMDSA-N Kaur-16-en-18-al Chemical compound C1C[C@H](C2)C(=C)C[C@@]32CC[C@@H]2[C@](C)(C=O)CCC[C@@]2(C)[C@@H]31 JCAVDWHQNFTFBW-XRNRSJMDSA-N 0.000 claims description 26
- 125000004093 cyano group Chemical group *C#N 0.000 claims description 26
- 125000002947 alkylene group Chemical group 0.000 claims description 25
- TUJQVRFWMWRMIO-XRNRSJMDSA-N Kaur-16-en-18-ol Chemical compound C1C[C@H](C2)C(=C)C[C@@]32CC[C@@H]2[C@](C)(CO)CCC[C@@]2(C)[C@@H]31 TUJQVRFWMWRMIO-XRNRSJMDSA-N 0.000 claims description 23
- TUJQVRFWMWRMIO-UHFFFAOYSA-N kaurenol Natural products C1CC(C2)C(=C)CC32CCC2C(C)(CO)CCCC2(C)C31 TUJQVRFWMWRMIO-UHFFFAOYSA-N 0.000 claims description 23
- 239000002253 acid Substances 0.000 claims description 19
- 101100262416 Stevia rebaudiana UGT76G1 gene Proteins 0.000 claims description 15
- ONVABDHFQKWOSV-HPUSYDDDSA-N ent-kaur-16-ene Chemical compound C1C[C@H](C2)C(=C)C[C@@]32CC[C@@H]2C(C)(C)CCC[C@@]2(C)[C@@H]31 ONVABDHFQKWOSV-HPUSYDDDSA-N 0.000 claims description 15
- 240000006365 Vitis vinifera Species 0.000 claims description 14
- 108010075920 UDP-galactose translocator Proteins 0.000 claims description 13
- 108010007508 Farnesyltranstransferase Proteins 0.000 claims description 12
- 102100039291 Geranylgeranyl pyrophosphate synthase Human genes 0.000 claims description 12
- 101100427140 Stevia rebaudiana UGT74G1 gene Proteins 0.000 claims description 12
- 108010045510 NADPH-Ferrihemoprotein Reductase Proteins 0.000 claims description 10
- 101100048059 Stevia rebaudiana UGT85C2 gene Proteins 0.000 claims description 10
- 230000015572 biosynthetic process Effects 0.000 claims description 10
- 238000001727 in vivo Methods 0.000 claims description 10
- 241000196324 Embryophyta Species 0.000 claims description 9
- 235000011180 diphosphates Nutrition 0.000 claims description 9
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical class O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 claims description 8
- 238000012258 culturing Methods 0.000 claims description 8
- XCCTYIAWTASOJW-XVFCMESISA-N Uridine-5'-Diphosphate Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(=O)OP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1 XCCTYIAWTASOJW-XVFCMESISA-N 0.000 claims description 7
- 108010064741 ent-kaurene synthetase A Proteins 0.000 claims description 7
- 102000051366 Glycosyltransferases Human genes 0.000 claims description 5
- 108700023372 Glycosyltransferases Proteins 0.000 claims description 5
- 210000005253 yeast cell Anatomy 0.000 claims description 5
- 108010074633 Mixed Function Oxygenases Proteins 0.000 claims description 4
- 102000008109 Mixed Function Oxygenases Human genes 0.000 claims description 4
- 150000001720 carbohydrates Chemical class 0.000 claims description 4
- 238000001514 detection method Methods 0.000 claims description 4
- 239000001177 diphosphate Substances 0.000 claims description 4
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 claims description 4
- 230000001590 oxidative effect Effects 0.000 claims description 4
- 241000238631 Hexapoda Species 0.000 claims description 3
- 230000001580 bacterial effect Effects 0.000 claims description 3
- 230000001588 bifunctional effect Effects 0.000 claims description 3
- 108010064739 ent-kaurene synthetase B Proteins 0.000 claims description 3
- 230000002538 fungal effect Effects 0.000 claims description 3
- 238000012239 gene modification Methods 0.000 claims description 3
- 230000005017 genetic modification Effects 0.000 claims description 3
- 235000013617 genetically modified food Nutrition 0.000 claims description 3
- 230000001419 dependent effect Effects 0.000 claims description 2
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 claims 2
- 229910052698 phosphorus Inorganic materials 0.000 claims 2
- 239000011574 phosphorus Substances 0.000 claims 2
- 241000271566 Aves Species 0.000 claims 1
- 108010015742 Cytochrome P-450 Enzyme System Proteins 0.000 claims 1
- 102000002004 Cytochrome P-450 Enzyme System Human genes 0.000 claims 1
- 102000040945 Transcription factor Human genes 0.000 claims 1
- 108091023040 Transcription factor Proteins 0.000 claims 1
- XCCTYIAWTASOJW-UHFFFAOYSA-N UDP-Glc Natural products OC1C(O)C(COP(O)(=O)OP(O)(O)=O)OC1N1C(=O)NC(=O)C=C1 XCCTYIAWTASOJW-UHFFFAOYSA-N 0.000 claims 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-M hydroxide Chemical compound [OH-] XLYOFNOQVPJJNP-UHFFFAOYSA-M 0.000 claims 1
- 125000000383 tetramethylene group Chemical group [H]C([H])([*:1])C([H])([H])C([H])([H])C([H])([H])[*:2] 0.000 claims 1
- 230000002103 transcriptional effect Effects 0.000 claims 1
- GSGVXNMGMKBGQU-PHESRWQRSA-N rebaudioside M Chemical compound C[C@@]12CCC[C@](C)([C@H]1CC[C@@]13CC(=C)[C@@](C1)(CC[C@@H]23)O[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O[C@@H]2O[C@H](CO)[C@@H](O)[C@H](O)[C@H]2O)[C@H]1O[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O)C(=O)O[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O[C@@H]2O[C@H](CO)[C@@H](O)[C@H](O)[C@H]2O)[C@H]1O[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O GSGVXNMGMKBGQU-PHESRWQRSA-N 0.000 abstract description 62
- 239000000203 mixture Substances 0.000 abstract description 53
- 108091028043 Nucleic acid sequence Proteins 0.000 abstract description 31
- 235000010582 Pisum sativum Nutrition 0.000 abstract description 5
- 240000004713 Pisum sativum Species 0.000 abstract description 5
- 229940088598 enzyme Drugs 0.000 description 235
- 102000004357 Transferases Human genes 0.000 description 76
- 108090000992 Transferases Proteins 0.000 description 76
- 235000001014 amino acid Nutrition 0.000 description 75
- 239000001963 growth medium Substances 0.000 description 69
- 108090000623 proteins and genes Proteins 0.000 description 63
- ZSLZBFCDCINBPY-ZSJPKINUSA-N acetyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 ZSLZBFCDCINBPY-ZSJPKINUSA-N 0.000 description 60
- 241000283690 Bos taurus Species 0.000 description 45
- 108090000895 Hydroxymethylglutaryl CoA Reductases Proteins 0.000 description 41
- 102000004286 Hydroxymethylglutaryl CoA Reductases Human genes 0.000 description 41
- 229940024606 amino acid Drugs 0.000 description 39
- 238000006243 chemical reaction Methods 0.000 description 36
- 230000000694 effects Effects 0.000 description 36
- 235000000346 sugar Nutrition 0.000 description 34
- 210000004899 c-terminal region Anatomy 0.000 description 32
- KJTLQQUUPVSXIM-ZCFIWIBFSA-N (R)-mevalonic acid Chemical compound OCC[C@](O)(C)CC(O)=O KJTLQQUUPVSXIM-ZCFIWIBFSA-N 0.000 description 31
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 28
- 238000000855 fermentation Methods 0.000 description 28
- 230000004151 fermentation Effects 0.000 description 28
- KJTLQQUUPVSXIM-UHFFFAOYSA-N DL-mevalonic acid Natural products OCCC(O)(C)CC(O)=O KJTLQQUUPVSXIM-UHFFFAOYSA-N 0.000 description 27
- 239000008280 blood Substances 0.000 description 27
- 210000004369 blood Anatomy 0.000 description 27
- 239000008103 glucose Substances 0.000 description 26
- 239000000047 product Substances 0.000 description 25
- 238000006467 substitution reaction Methods 0.000 description 24
- 244000005700 microbiome Species 0.000 description 23
- 239000002609 medium Substances 0.000 description 22
- 229930027945 nicotinamide-adenine dinucleotide Natural products 0.000 description 22
- 150000001413 amino acids Chemical class 0.000 description 21
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 20
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 20
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical group NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 description 19
- 244000228451 Stevia rebaudiana Species 0.000 description 19
- 102000004169 proteins and genes Human genes 0.000 description 19
- 108020004705 Codon Proteins 0.000 description 18
- OJFDKHTZOUZBOS-CITAKDKDSA-N acetoacetyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)CC(=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 OJFDKHTZOUZBOS-CITAKDKDSA-N 0.000 description 18
- NUHSROFQTUXZQQ-UHFFFAOYSA-N isopentenyl diphosphate Chemical compound CC(=C)CCO[P@](O)(=O)OP(O)(O)=O NUHSROFQTUXZQQ-UHFFFAOYSA-N 0.000 description 18
- 235000018102 proteins Nutrition 0.000 description 18
- 102100022523 Acetoacetyl-CoA synthetase Human genes 0.000 description 16
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 16
- 230000004907 flux Effects 0.000 description 16
- 108091033319 polynucleotide Proteins 0.000 description 16
- 102000040430 polynucleotide Human genes 0.000 description 16
- 239000002157 polynucleotide Substances 0.000 description 16
- UEDUENGHJMELGK-HYDKPPNVSA-N Stevioside Chemical compound O([C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(=O)O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O UEDUENGHJMELGK-HYDKPPNVSA-N 0.000 description 15
- OHHNJQXIOPOJSC-UHFFFAOYSA-N stevioside Natural products CC1(CCCC2(C)C3(C)CCC4(CC3(CCC12C)CC4=C)OC5OC(CO)C(O)C(O)C5OC6OC(CO)C(O)C(O)C6O)C(=O)OC7OC(CO)C(O)C(O)C7O OHHNJQXIOPOJSC-UHFFFAOYSA-N 0.000 description 15
- 229940013618 stevioside Drugs 0.000 description 15
- VWFJDQUYCIWHTN-UHFFFAOYSA-N Farnesyl pyrophosphate Natural products CC(C)=CCCC(C)=CCCC(C)=CCOP(O)(=O)OP(O)(O)=O VWFJDQUYCIWHTN-UHFFFAOYSA-N 0.000 description 14
- 230000012010 growth Effects 0.000 description 14
- 230000035772 mutation Effects 0.000 description 14
- BOPGDPNILDQYTO-NNYOXOHSSA-N nicotinamide-adenine dinucleotide Chemical compound C1=CCC(C(=O)N)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OC[C@@H]2[C@H]([C@@H](O)[C@@H](O2)N2C3=NC=NC(N)=C3N=C2)O)O1 BOPGDPNILDQYTO-NNYOXOHSSA-N 0.000 description 14
- 229910052757 nitrogen Inorganic materials 0.000 description 14
- OINNEUNVOZHBOX-XBQSVVNOSA-N Geranylgeranyl diphosphate Natural products [P@](=O)(OP(=O)(O)O)(OC/C=C(\CC/C=C(\CC/C=C(\CC/C=C(\C)/C)/C)/C)/C)O OINNEUNVOZHBOX-XBQSVVNOSA-N 0.000 description 13
- HELXLJCILKEWJH-NCGAPWICSA-N rebaudioside A Chemical compound O([C@H]1[C@H](O)[C@@H](CO)O[C@H]([C@@H]1O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)O[C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(=O)O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O HELXLJCILKEWJH-NCGAPWICSA-N 0.000 description 13
- 241000589516 Pseudomonas Species 0.000 description 12
- 125000000539 amino acid group Chemical group 0.000 description 12
- 238000012216 screening Methods 0.000 description 12
- 241000219194 Arabidopsis Species 0.000 description 11
- 229910019142 PO4 Inorganic materials 0.000 description 11
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 11
- 108010050848 glycylleucine Proteins 0.000 description 11
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 11
- 239000010452 phosphate Substances 0.000 description 11
- 235000021317 phosphate Nutrition 0.000 description 11
- CBIDRCWHNCKSTO-UHFFFAOYSA-N prenyl diphosphate Chemical compound CC(C)=CCO[P@](O)(=O)OP(O)(O)=O CBIDRCWHNCKSTO-UHFFFAOYSA-N 0.000 description 11
- JSNRRGGBADWTMC-UHFFFAOYSA-N (6E)-7,11-dimethyl-3-methylene-1,6,10-dodecatriene Chemical compound CC(C)=CCCC(C)=CCCC(=C)C=C JSNRRGGBADWTMC-UHFFFAOYSA-N 0.000 description 10
- 108090000364 Ligases Proteins 0.000 description 10
- 102000003960 Ligases Human genes 0.000 description 10
- 108010012842 acetoacetyl-CoA synthetase Proteins 0.000 description 10
- 238000012217 deletion Methods 0.000 description 10
- 230000037430 deletion Effects 0.000 description 10
- 230000003647 oxidation Effects 0.000 description 10
- 238000007254 oxidation reaction Methods 0.000 description 10
- QSIDJGUAAUSPMG-CULFPKEHSA-N steviolmonoside Chemical compound O([C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(O)=O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O QSIDJGUAAUSPMG-CULFPKEHSA-N 0.000 description 10
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 9
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 9
- ZJPGOXWRFNKIQL-JYJNAYRXSA-N Phe-Pro-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=CC=C1 ZJPGOXWRFNKIQL-JYJNAYRXSA-N 0.000 description 9
- 238000004113 cell culture Methods 0.000 description 9
- ONVABDHFQKWOSV-YQXATGRUSA-N ent-Kaur-16-ene Natural products C1C[C@@H](C2)C(=C)C[C@@]32CC[C@@H]2C(C)(C)CCC[C@@]2(C)[C@@H]31 ONVABDHFQKWOSV-YQXATGRUSA-N 0.000 description 9
- UIXMIBNGPQGJJJ-UHFFFAOYSA-N ent-kaurene Natural products CC1CC23CCC4C(CCCC4(C)C)C2CCC1C3 UIXMIBNGPQGJJJ-UHFFFAOYSA-N 0.000 description 9
- 230000001965 increasing effect Effects 0.000 description 9
- 238000003780 insertion Methods 0.000 description 9
- 230000037431 insertion Effects 0.000 description 9
- 239000000243 solution Substances 0.000 description 9
- CABVTRNMFUVUDM-VRHQGPGLSA-N (3S)-3-hydroxy-3-methylglutaryl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)C[C@@](O)(CC(O)=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 CABVTRNMFUVUDM-VRHQGPGLSA-N 0.000 description 8
- OKZYCXHTTZZYSK-ZCFIWIBFSA-N (R)-5-phosphomevalonic acid Chemical compound OC(=O)C[C@@](O)(C)CCOP(O)(O)=O OKZYCXHTTZZYSK-ZCFIWIBFSA-N 0.000 description 8
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 8
- 108020004414 DNA Proteins 0.000 description 8
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 8
- 241000187180 Streptomyces sp. Species 0.000 description 8
- XJLXINKUBYWONI-DQQFMEOOSA-N [[(2r,3r,4r,5r)-5-(6-aminopurin-9-yl)-3-hydroxy-4-phosphonooxyoxolan-2-yl]methoxy-hydroxyphosphoryl] [(2s,3r,4s,5s)-5-(3-carbamoylpyridin-1-ium-1-yl)-3,4-dihydroxyoxolan-2-yl]methyl phosphate Chemical compound NC(=O)C1=CC=C[N+]([C@@H]2[C@H]([C@@H](O)[C@H](COP([O-])(=O)OP(O)(=O)OC[C@@H]3[C@H]([C@@H](OP(O)(O)=O)[C@@H](O3)N3C4=NC=NC(N)=C4N=C3)O)O2)O)=C1 XJLXINKUBYWONI-DQQFMEOOSA-N 0.000 description 8
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 8
- 125000002791 glucosyl group Chemical group C1([C@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 8
- 239000011777 magnesium Substances 0.000 description 8
- 229910052749 magnesium Inorganic materials 0.000 description 8
- 235000015097 nutrients Nutrition 0.000 description 8
- 230000002441 reversible effect Effects 0.000 description 8
- 239000000523 sample Substances 0.000 description 8
- 238000000926 separation method Methods 0.000 description 8
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 8
- 229940045145 uridine Drugs 0.000 description 8
- OINNEUNVOZHBOX-QIRCYJPOSA-K 2-trans,6-trans,10-trans-geranylgeranyl diphosphate(3-) Chemical compound CC(C)=CCC\C(C)=C\CC\C(C)=C\CC\C(C)=C\COP([O-])(=O)OP([O-])([O-])=O OINNEUNVOZHBOX-QIRCYJPOSA-K 0.000 description 7
- 241000193830 Bacillus <bacterium> Species 0.000 description 7
- 241000588724 Escherichia coli Species 0.000 description 7
- BDAGIHXWWSANSR-UHFFFAOYSA-N Formic acid Chemical compound OC=O BDAGIHXWWSANSR-UHFFFAOYSA-N 0.000 description 7
- 241000282414 Homo sapiens Species 0.000 description 7
- LTYOQGRJFJAKNA-KKIMTKSISA-N Malonyl CoA Natural products S(C(=O)CC(=O)O)CCNC(=O)CCNC(=O)[C@@H](O)C(CO[P@](=O)(O[P@](=O)(OC[C@H]1[C@@H](OP(=O)(O)O)[C@@H](O)[C@@H](n2c3ncnc(N)c3nc2)O1)O)O)(C)C LTYOQGRJFJAKNA-KKIMTKSISA-N 0.000 description 7
- 230000009286 beneficial effect Effects 0.000 description 7
- LTYOQGRJFJAKNA-DVVLENMVSA-N malonyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)CC(O)=O)O[C@H]1N1C2=NC=NC(N)=C2N=C1 LTYOQGRJFJAKNA-DVVLENMVSA-N 0.000 description 7
- 229910021654 trace metal Inorganic materials 0.000 description 7
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 6
- 101000678027 Homo sapiens Acetoacetyl-CoA synthetase Proteins 0.000 description 6
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 6
- 241000606860 Pasteurella Species 0.000 description 6
- 108700023175 Phosphate acetyltransferases Proteins 0.000 description 6
- 241000235648 Pichia Species 0.000 description 6
- 241000194017 Streptococcus Species 0.000 description 6
- 229930006000 Sucrose Natural products 0.000 description 6
- 102000002932 Thiolase Human genes 0.000 description 6
- 108060008225 Thiolase Proteins 0.000 description 6
- 238000007792 addition Methods 0.000 description 6
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 6
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Chemical compound NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 6
- 230000001939 inductive effect Effects 0.000 description 6
- 239000000543 intermediate Substances 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 239000012074 organic phase Substances 0.000 description 6
- 229960004793 sucrose Drugs 0.000 description 6
- CXENHBSYCFFKJS-UHFFFAOYSA-N (3E,6E)-3,7,11-Trimethyl-1,3,6,10-dodecatetraene Natural products CC(C)=CCCC(C)=CCC=C(C)C=C CXENHBSYCFFKJS-UHFFFAOYSA-N 0.000 description 5
- VWFJDQUYCIWHTN-YFVJMOTDSA-N 2-trans,6-trans-farnesyl diphosphate Chemical compound CC(C)=CCC\C(C)=C\CC\C(C)=C\CO[P@](O)(=O)OP(O)(O)=O VWFJDQUYCIWHTN-YFVJMOTDSA-N 0.000 description 5
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 5
- CLICCYPMVFGUOF-IHRRRGAJSA-N Arg-Lys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O CLICCYPMVFGUOF-IHRRRGAJSA-N 0.000 description 5
- 102100029398 Calpain small subunit 1 Human genes 0.000 description 5
- 101710131373 Calpain small subunit 1 Proteins 0.000 description 5
- 241000193403 Clostridium Species 0.000 description 5
- 108091026890 Coding region Proteins 0.000 description 5
- 101710120485 Cyclo(L-leucyl-L-leucyl) synthase Proteins 0.000 description 5
- 101710116120 Cyclo(L-tyrosyl-L-tyrosyl) synthase Proteins 0.000 description 5
- 241000282326 Felis catus Species 0.000 description 5
- 101150094690 GAL1 gene Proteins 0.000 description 5
- 102100028501 Galanin peptides Human genes 0.000 description 5
- 101100121078 Homo sapiens GAL gene Proteins 0.000 description 5
- 101150094051 KO gene Proteins 0.000 description 5
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 5
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 5
- NTSPQIONFJUMJV-AVGNSLFASA-N Lys-Arg-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O NTSPQIONFJUMJV-AVGNSLFASA-N 0.000 description 5
- 241000191025 Rhodobacter Species 0.000 description 5
- 241000607768 Shigella Species 0.000 description 5
- 241000191967 Staphylococcus aureus Species 0.000 description 5
- RTAQQCXQSZGOHL-UHFFFAOYSA-N Titanium Chemical compound [Ti] RTAQQCXQSZGOHL-UHFFFAOYSA-N 0.000 description 5
- 108010044940 alanylglutamine Proteins 0.000 description 5
- 108010062796 arginyllysine Proteins 0.000 description 5
- 108010068265 aspartyltyrosine Proteins 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 5
- 229930009668 farnesene Natural products 0.000 description 5
- 230000002068 genetic effect Effects 0.000 description 5
- OINNEUNVOZHBOX-KGODAQDXSA-N geranylgeranyl diphosphate Chemical compound CC(C)=CCC\C(C)=C/CC\C(C)=C\CC\C(C)=C\CO[P@@](O)(=O)OP(O)(O)=O OINNEUNVOZHBOX-KGODAQDXSA-N 0.000 description 5
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 5
- 239000003550 marker Substances 0.000 description 5
- 108020004999 messenger RNA Proteins 0.000 description 5
- 229920001550 polyprenyl Polymers 0.000 description 5
- 125000001185 polyprenyl group Polymers 0.000 description 5
- 108010053725 prolylvaline Proteins 0.000 description 5
- 238000002864 sequence alignment Methods 0.000 description 5
- 241000894007 species Species 0.000 description 5
- 239000000758 substrate Substances 0.000 description 5
- 239000010936 titanium Substances 0.000 description 5
- 229910052719 titanium Inorganic materials 0.000 description 5
- GHOKWGTUZJEAQD-ZETCQYMHSA-N (D)-(+)-Pantothenic acid Chemical compound OCC(C)(C)[C@@H](O)C(=O)NCCC(O)=O GHOKWGTUZJEAQD-ZETCQYMHSA-N 0.000 description 4
- 108030002854 Acetoacetyl-CoA synthases Proteins 0.000 description 4
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 4
- 241000203069 Archaea Species 0.000 description 4
- 241000186146 Brevibacterium Species 0.000 description 4
- 108700010070 Codon Usage Proteins 0.000 description 4
- 241000186216 Corynebacterium Species 0.000 description 4
- 241000588914 Enterobacter Species 0.000 description 4
- 229930191978 Gibberellin Natural products 0.000 description 4
- YQAQQKPWFOBSMU-WDCWCFNPSA-N Glu-Thr-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O YQAQQKPWFOBSMU-WDCWCFNPSA-N 0.000 description 4
- BKOVCRUIXDIWFV-IXOXFDKPSA-N His-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CN=CN1 BKOVCRUIXDIWFV-IXOXFDKPSA-N 0.000 description 4
- 101000773364 Homo sapiens Beta-alanine-activating enzyme Proteins 0.000 description 4
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical group CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 4
- WYEXWKAWMNJKPN-UBHSHLNASA-N Met-Ala-Phe Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCSC)N WYEXWKAWMNJKPN-UBHSHLNASA-N 0.000 description 4
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 4
- 241000316848 Rhodococcus <scale insect> Species 0.000 description 4
- YWPVROCHNBYFTP-UHFFFAOYSA-N Rubusoside Natural products C1CC2C3(C)CCCC(C)(C(=O)OC4C(C(O)C(O)C(CO)O4)O)C3CCC2(C2)CC(=C)C21OC1OC(CO)C(O)C(O)C1O YWPVROCHNBYFTP-UHFFFAOYSA-N 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- 108020005038 Terminator Codon Proteins 0.000 description 4
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Chemical group CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 4
- 108010069490 alanyl-glycyl-seryl-glutamic acid Proteins 0.000 description 4
- 108010047495 alanylglycine Proteins 0.000 description 4
- 108010077245 asparaginyl-proline Proteins 0.000 description 4
- 108010093581 aspartyl-proline Proteins 0.000 description 4
- 108010092854 aspartyllysine Proteins 0.000 description 4
- 239000003054 catalyst Substances 0.000 description 4
- 230000010261 cell growth Effects 0.000 description 4
- 239000002738 chelating agent Substances 0.000 description 4
- 230000000295 complement effect Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- XPPKVPWEQAFLFU-UHFFFAOYSA-N diphosphoric acid Chemical compound OP(O)(=O)OP(O)(O)=O XPPKVPWEQAFLFU-UHFFFAOYSA-N 0.000 description 4
- 108010054813 diprotin B Proteins 0.000 description 4
- IXORZMNAPKEEDV-UHFFFAOYSA-N gibberellic acid GA3 Natural products OC(=O)C1C2(C3)CC(=C)C3(O)CCC2C2(C=CC3O)C1C3(C)C(=O)O2 IXORZMNAPKEEDV-UHFFFAOYSA-N 0.000 description 4
- 239000003448 gibberellin Substances 0.000 description 4
- 235000013922 glutamic acid Nutrition 0.000 description 4
- 239000004220 glutamic acid Substances 0.000 description 4
- 229930182470 glycoside Natural products 0.000 description 4
- 150000002338 glycosides Chemical class 0.000 description 4
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 4
- 108010090037 glycyl-alanyl-isoleucine Proteins 0.000 description 4
- 108010015792 glycyllysine Proteins 0.000 description 4
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 4
- 108010054155 lysyllysine Proteins 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 229910052751 metal Inorganic materials 0.000 description 4
- 239000002184 metal Substances 0.000 description 4
- 150000002739 metals Chemical class 0.000 description 4
- 125000000956 methoxy group Chemical group [H]C([H])([H])O* 0.000 description 4
- 229940014662 pantothenate Drugs 0.000 description 4
- 235000019161 pantothenic acid Nutrition 0.000 description 4
- 239000011713 pantothenic acid Substances 0.000 description 4
- 239000008188 pellet Substances 0.000 description 4
- 239000012071 phase Substances 0.000 description 4
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 4
- 108010012581 phenylalanylglutamate Proteins 0.000 description 4
- 108010079317 prolyl-tyrosine Proteins 0.000 description 4
- 230000002829 reductive effect Effects 0.000 description 4
- 150000003839 salts Chemical class 0.000 description 4
- 239000002904 solvent Substances 0.000 description 4
- 239000005720 sucrose Substances 0.000 description 4
- 230000007704 transition Effects 0.000 description 4
- 238000011144 upstream manufacturing Methods 0.000 description 4
- 239000004474 valine Chemical group 0.000 description 4
- 229940088594 vitamin Drugs 0.000 description 4
- 235000013343 vitamin Nutrition 0.000 description 4
- 239000011782 vitamin Substances 0.000 description 4
- 229930003231 vitamin Natural products 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- GGKNTGJPGZQNID-UHFFFAOYSA-N (1-$l^{1}-oxidanyl-2,2,6,6-tetramethylpiperidin-4-yl)-trimethylazanium Chemical compound CC1(C)CC([N+](C)(C)C)CC(C)(C)N1[O] GGKNTGJPGZQNID-UHFFFAOYSA-N 0.000 description 3
- OSWFIVFLDKOXQC-UHFFFAOYSA-N 4-(3-methoxyphenyl)aniline Chemical compound COC1=CC=CC(C=2C=CC(N)=CC=2)=C1 OSWFIVFLDKOXQC-UHFFFAOYSA-N 0.000 description 3
- 102100039601 ARF GTPase-activating protein GIT1 Human genes 0.000 description 3
- 101710194905 ARF GTPase-activating protein GIT1 Proteins 0.000 description 3
- AWAXZRDKUHOPBO-GUBZILKMSA-N Ala-Gln-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O AWAXZRDKUHOPBO-GUBZILKMSA-N 0.000 description 3
- MFMDKJIPHSWSBM-GUBZILKMSA-N Ala-Lys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFMDKJIPHSWSBM-GUBZILKMSA-N 0.000 description 3
- 241000219195 Arabidopsis thaliana Species 0.000 description 3
- QHUOOCKNNURZSL-IHRRRGAJSA-N Arg-Tyr-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O QHUOOCKNNURZSL-IHRRRGAJSA-N 0.000 description 3
- 241000894006 Bacteria Species 0.000 description 3
- 102100030981 Beta-alanine-activating enzyme Human genes 0.000 description 3
- 239000002028 Biomass Substances 0.000 description 3
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 3
- JCAIWDXKLCEQEO-LXOWHHAPSA-N Copalyl diphosphate Natural products [P@@](=O)(OP(=O)(O)O)(OC/C=C(\CC[C@H]1C(=C)CC[C@H]2C(C)(C)CCC[C@@]12C)/C)O JCAIWDXKLCEQEO-LXOWHHAPSA-N 0.000 description 3
- 241001527609 Cryptococcus Species 0.000 description 3
- AEJSNWMRPXAKCW-WHFBIAKZSA-N Cys-Ala-Gly Chemical compound SC[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O AEJSNWMRPXAKCW-WHFBIAKZSA-N 0.000 description 3
- 241001600129 Delftia Species 0.000 description 3
- 102000057412 Diphosphomevalonate decarboxylases Human genes 0.000 description 3
- 101100186820 Drosophila melanogaster sicily gene Proteins 0.000 description 3
- 241001465321 Eremothecium Species 0.000 description 3
- XEKOWRVHYACXOJ-UHFFFAOYSA-N Ethyl acetate Chemical compound CCOC(C)=O XEKOWRVHYACXOJ-UHFFFAOYSA-N 0.000 description 3
- JDUKCSSHWNIQQZ-IHRRRGAJSA-N Glu-Phe-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JDUKCSSHWNIQQZ-IHRRRGAJSA-N 0.000 description 3
- SOEATRRYCIPEHA-BQBZGAKWSA-N Gly-Glu-Glu Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SOEATRRYCIPEHA-BQBZGAKWSA-N 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 101710081758 High affinity cationic amino acid transporter 1 Proteins 0.000 description 3
- MPXGJGBXCRQQJE-MXAVVETBSA-N His-Ile-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O MPXGJGBXCRQQJE-MXAVVETBSA-N 0.000 description 3
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 3
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 3
- 241000186660 Lactobacillus Species 0.000 description 3
- 241000194036 Lactococcus Species 0.000 description 3
- YFBBUHJJUXXZOF-UWVGGRQHSA-N Leu-Gly-Pro Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O YFBBUHJJUXXZOF-UWVGGRQHSA-N 0.000 description 3
- HYMLKESRWLZDBR-WEDXCCLWSA-N Leu-Gly-Thr Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HYMLKESRWLZDBR-WEDXCCLWSA-N 0.000 description 3
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 3
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 3
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 3
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 3
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 3
- WGAZVKFCPHXZLO-SZMVWBNQSA-N Leu-Trp-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N WGAZVKFCPHXZLO-SZMVWBNQSA-N 0.000 description 3
- 241000699666 Mus <mouse, genus> Species 0.000 description 3
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 3
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 3
- 108010066427 N-valyltryptophan Proteins 0.000 description 3
- 101000958834 Neosartorya fumigata (strain ATCC MYA-4609 / Af293 / CBS 101355 / FGSC A1100) Diphosphomevalonate decarboxylase mvd1 Proteins 0.000 description 3
- 101000958925 Panax ginseng Diphosphomevalonate decarboxylase 1 Proteins 0.000 description 3
- 102000045595 Phosphoprotein Phosphatases Human genes 0.000 description 3
- 108700019535 Phosphoprotein Phosphatases Proteins 0.000 description 3
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 3
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 3
- 241000235645 Pichia kudriavzevii Species 0.000 description 3
- KWYUFKZDYYNOTN-UHFFFAOYSA-M Potassium hydroxide Chemical compound [OH-].[K+] KWYUFKZDYYNOTN-UHFFFAOYSA-M 0.000 description 3
- YHUBAXGAAYULJY-ULQDDVLXSA-N Pro-Tyr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O YHUBAXGAAYULJY-ULQDDVLXSA-N 0.000 description 3
- 241000235003 Saccharomycopsis Species 0.000 description 3
- 241000607142 Salmonella Species 0.000 description 3
- 241000293869 Salmonella enterica subsp. enterica serovar Typhimurium Species 0.000 description 3
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- 235000006092 Stevia rebaudiana Nutrition 0.000 description 3
- OMHUCGDTACNQEX-OSHKXICASA-N Steviolbioside Natural products O([C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(O)=O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O OMHUCGDTACNQEX-OSHKXICASA-N 0.000 description 3
- 241000187747 Streptomyces Species 0.000 description 3
- 241000204667 Thermoplasma Species 0.000 description 3
- KZSYAEWQMJEGRZ-RHYQMDGZSA-N Thr-Leu-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O KZSYAEWQMJEGRZ-RHYQMDGZSA-N 0.000 description 3
- RGJZPXFZIUUQDN-BPNCWPANSA-N Tyr-Val-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O RGJZPXFZIUUQDN-BPNCWPANSA-N 0.000 description 3
- PAPWZOJOLKZEFR-AVGNSLFASA-N Val-Arg-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N PAPWZOJOLKZEFR-AVGNSLFASA-N 0.000 description 3
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 3
- UEPLNXPLHJUYPT-AVGNSLFASA-N Val-Met-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O UEPLNXPLHJUYPT-AVGNSLFASA-N 0.000 description 3
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 3
- QSPOLEBZTMESFY-SRVKXCTJSA-N Val-Pro-Val Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O QSPOLEBZTMESFY-SRVKXCTJSA-N 0.000 description 3
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 3
- 150000007513 acids Chemical class 0.000 description 3
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 3
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 3
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 3
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 3
- 235000011130 ammonium sulphate Nutrition 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 3
- 238000003556 assay Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 3
- 230000003115 biocidal effect Effects 0.000 description 3
- 239000011575 calcium Substances 0.000 description 3
- 229910052791 calcium Inorganic materials 0.000 description 3
- 235000001465 calcium Nutrition 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 230000003197 catalytic effect Effects 0.000 description 3
- JLPRGBMUVNVSKP-AHUXISJXSA-M chembl2368336 Chemical compound [Na+].O([C@H]1[C@@H](O)[C@H](O)[C@H](CO)O[C@H]1O[C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C([O-])=O)[C@@H]1O[C@@H](CO)[C@@H](O)[C@H](O)[C@@H]1O JLPRGBMUVNVSKP-AHUXISJXSA-M 0.000 description 3
- 238000010367 cloning Methods 0.000 description 3
- 238000005947 deacylation reaction Methods 0.000 description 3
- 230000009483 enzymatic pathway Effects 0.000 description 3
- 235000019253 formic acid Nutrition 0.000 description 3
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 3
- GVVPGTZRZFNKDS-JXMROGBWSA-N geranyl diphosphate Chemical compound CC(C)=CCC\C(C)=C\CO[P@](O)(=O)OP(O)(O)=O GVVPGTZRZFNKDS-JXMROGBWSA-N 0.000 description 3
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 3
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 3
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 3
- 238000000338 in vitro Methods 0.000 description 3
- 238000009776 industrial production Methods 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 238000011835 investigation Methods 0.000 description 3
- 229960000310 isoleucine Drugs 0.000 description 3
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 3
- 108010034529 leucyl-lysine Proteins 0.000 description 3
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 3
- 108010057952 lysyl-phenylalanyl-lysine Proteins 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 108010073101 phenylalanylleucine Proteins 0.000 description 3
- 108010070643 prolylglutamic acid Proteins 0.000 description 3
- 238000011084 recovery Methods 0.000 description 3
- 230000001105 regulatory effect Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- YWPVROCHNBYFTP-OSHKXICASA-N rubusoside Chemical compound O([C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(=O)O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O YWPVROCHNBYFTP-OSHKXICASA-N 0.000 description 3
- 108010071207 serylmethionine Proteins 0.000 description 3
- 239000011550 stock solution Substances 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 150000003505 terpenes Chemical class 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- COEXAQSTZUWMRI-STQMWFEESA-N (2s)-1-[2-[[(2s)-2-amino-3-(4-hydroxyphenyl)propanoyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound C([C@H](N)C(=O)NCC(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=C(O)C=C1 COEXAQSTZUWMRI-STQMWFEESA-N 0.000 description 2
- VLAFRQCSFRYCLC-FXQIFTODSA-N (2s)-2-[[(2s)-2-[[2-[[(2s)-2-aminopropanoyl]amino]acetyl]amino]-3-hydroxypropanoyl]amino]pentanedioic acid Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O VLAFRQCSFRYCLC-FXQIFTODSA-N 0.000 description 2
- OYIFNHCXNCRBQI-UHFFFAOYSA-N 2-aminoadipic acid Chemical compound OC(=O)C(N)CCCC(O)=O OYIFNHCXNCRBQI-UHFFFAOYSA-N 0.000 description 2
- ZHBXLZQQVCDGPA-UHFFFAOYSA-N 5-[(1,3-dioxo-2-benzofuran-5-yl)sulfonyl]-2-benzofuran-1,3-dione Chemical compound C1=C2C(=O)OC(=O)C2=CC(S(=O)(=O)C=2C=C3C(=O)OC(C3=CC=2)=O)=C1 ZHBXLZQQVCDGPA-UHFFFAOYSA-N 0.000 description 2
- SEHFUALWMUWDKS-UHFFFAOYSA-N 5-fluoroorotic acid Chemical compound OC(=O)C=1NC(=O)NC(=O)C=1F SEHFUALWMUWDKS-UHFFFAOYSA-N 0.000 description 2
- 101150064299 AUR1 gene Proteins 0.000 description 2
- 108010006229 Acetyl-CoA C-acetyltransferase Proteins 0.000 description 2
- 102000005345 Acetyl-CoA C-acetyltransferase Human genes 0.000 description 2
- 241000589158 Agrobacterium Species 0.000 description 2
- UQJUGHFKNKGHFQ-VZFHVOOUSA-N Ala-Cys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UQJUGHFKNKGHFQ-VZFHVOOUSA-N 0.000 description 2
- ROLXPVQSRCPVGK-XDTLVQLUSA-N Ala-Glu-Tyr Chemical compound N[C@@H](C)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O ROLXPVQSRCPVGK-XDTLVQLUSA-N 0.000 description 2
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 2
- GRPHQEMIFDPKOE-HGNGGELXSA-N Ala-His-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O GRPHQEMIFDPKOE-HGNGGELXSA-N 0.000 description 2
- QCTFKEJEIMPOLW-JURCDPSOSA-N Ala-Ile-Phe Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QCTFKEJEIMPOLW-JURCDPSOSA-N 0.000 description 2
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 2
- AWNAEZICPNGAJK-FXQIFTODSA-N Ala-Met-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O AWNAEZICPNGAJK-FXQIFTODSA-N 0.000 description 2
- FVNAUOZKIPAYNA-BPNCWPANSA-N Ala-Met-Tyr Chemical compound CSCC[C@H](NC(=O)[C@H](C)N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FVNAUOZKIPAYNA-BPNCWPANSA-N 0.000 description 2
- DRARURMRLANNLS-GUBZILKMSA-N Ala-Met-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O DRARURMRLANNLS-GUBZILKMSA-N 0.000 description 2
- OLVCTPPSXNRGKV-GUBZILKMSA-N Ala-Pro-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OLVCTPPSXNRGKV-GUBZILKMSA-N 0.000 description 2
- XSLGWYYNOSUMRM-ZKWXMUAHSA-N Ala-Val-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XSLGWYYNOSUMRM-ZKWXMUAHSA-N 0.000 description 2
- 108700028369 Alleles Proteins 0.000 description 2
- VHUUQVKOLVNVRT-UHFFFAOYSA-N Ammonium hydroxide Chemical compound [NH4+].[OH-] VHUUQVKOLVNVRT-UHFFFAOYSA-N 0.000 description 2
- 101100433757 Arabidopsis thaliana ABCG32 gene Proteins 0.000 description 2
- UISQLSIBJKEJSS-GUBZILKMSA-N Arg-Arg-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(O)=O UISQLSIBJKEJSS-GUBZILKMSA-N 0.000 description 2
- CPSHGRGUPZBMOK-CIUDSAMLSA-N Arg-Asn-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O CPSHGRGUPZBMOK-CIUDSAMLSA-N 0.000 description 2
- OZNSCVPYWZRQPY-CIUDSAMLSA-N Arg-Asp-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OZNSCVPYWZRQPY-CIUDSAMLSA-N 0.000 description 2
- TTXYKSADPSNOIF-IHRRRGAJSA-N Arg-Asp-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O TTXYKSADPSNOIF-IHRRRGAJSA-N 0.000 description 2
- PTVGLOCPAVYPFG-CIUDSAMLSA-N Arg-Gln-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O PTVGLOCPAVYPFG-CIUDSAMLSA-N 0.000 description 2
- XLWSGICNBZGYTA-CIUDSAMLSA-N Arg-Glu-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XLWSGICNBZGYTA-CIUDSAMLSA-N 0.000 description 2
- GXXWTNKNFFKTJB-NAKRPEOUSA-N Arg-Ile-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O GXXWTNKNFFKTJB-NAKRPEOUSA-N 0.000 description 2
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 2
- IGFJVXOATGZTHD-UHFFFAOYSA-N Arg-Phe-His Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccccc1)C(=O)NC(Cc2c[nH]cn2)C(=O)O IGFJVXOATGZTHD-UHFFFAOYSA-N 0.000 description 2
- FIQKRDXFTANIEJ-ULQDDVLXSA-N Arg-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FIQKRDXFTANIEJ-ULQDDVLXSA-N 0.000 description 2
- OQPAZKMGCWPERI-GUBZILKMSA-N Arg-Ser-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OQPAZKMGCWPERI-GUBZILKMSA-N 0.000 description 2
- RYQSYXFGFOTJDJ-RHYQMDGZSA-N Arg-Thr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RYQSYXFGFOTJDJ-RHYQMDGZSA-N 0.000 description 2
- FXGMURPOWCKNAZ-JYJNAYRXSA-N Arg-Val-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FXGMURPOWCKNAZ-JYJNAYRXSA-N 0.000 description 2
- 239000004475 Arginine Substances 0.000 description 2
- 235000001405 Artemisia annua Nutrition 0.000 description 2
- 240000000011 Artemisia annua Species 0.000 description 2
- PDQBXRSOSCTGKY-ACZMJKKPSA-N Asn-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PDQBXRSOSCTGKY-ACZMJKKPSA-N 0.000 description 2
- JQBCANGGAVVERB-CFMVVWHZSA-N Asn-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N JQBCANGGAVVERB-CFMVVWHZSA-N 0.000 description 2
- GLWFAWNYGWBMOC-SRVKXCTJSA-N Asn-Leu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GLWFAWNYGWBMOC-SRVKXCTJSA-N 0.000 description 2
- OROMFUQQTSWUTI-IHRRRGAJSA-N Asn-Phe-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N OROMFUQQTSWUTI-IHRRRGAJSA-N 0.000 description 2
- BEHQTVDBCLSCBY-CFMVVWHZSA-N Asn-Tyr-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BEHQTVDBCLSCBY-CFMVVWHZSA-N 0.000 description 2
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 2
- VILLWIDTHYPSLC-PEFMBERDSA-N Asp-Glu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VILLWIDTHYPSLC-PEFMBERDSA-N 0.000 description 2
- GISFCCXBVJKGEO-QEJZJMRPSA-N Asp-Glu-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O GISFCCXBVJKGEO-QEJZJMRPSA-N 0.000 description 2
- YDJVIBMKAMQPPP-LAEOZQHASA-N Asp-Glu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O YDJVIBMKAMQPPP-LAEOZQHASA-N 0.000 description 2
- PZXPWHFYZXTFBI-YUMQZZPRSA-N Asp-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PZXPWHFYZXTFBI-YUMQZZPRSA-N 0.000 description 2
- KYQNAIMCTRZLNP-QSFUFRPTSA-N Asp-Ile-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O KYQNAIMCTRZLNP-QSFUFRPTSA-N 0.000 description 2
- DONWIPDSZZJHHK-HJGDQZAQSA-N Asp-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N)O DONWIPDSZZJHHK-HJGDQZAQSA-N 0.000 description 2
- GYWQGGUCMDCUJE-DLOVCJGASA-N Asp-Phe-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O GYWQGGUCMDCUJE-DLOVCJGASA-N 0.000 description 2
- UCHSVZYJKJLPHF-BZSNNMDCSA-N Asp-Phe-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O UCHSVZYJKJLPHF-BZSNNMDCSA-N 0.000 description 2
- LGGHQRZIJSYRHA-GUBZILKMSA-N Asp-Pro-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)O)N LGGHQRZIJSYRHA-GUBZILKMSA-N 0.000 description 2
- RSMZEHCMIOKNMW-GSSVUCPTSA-N Asp-Thr-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RSMZEHCMIOKNMW-GSSVUCPTSA-N 0.000 description 2
- YODBPLSWNJMZOJ-BPUTZDHNSA-N Asp-Trp-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N YODBPLSWNJMZOJ-BPUTZDHNSA-N 0.000 description 2
- NJLLRXWFPQQPHV-SRVKXCTJSA-N Asp-Tyr-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O NJLLRXWFPQQPHV-SRVKXCTJSA-N 0.000 description 2
- WAEDSQFVZJUHLI-BYULHYEWSA-N Asp-Val-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WAEDSQFVZJUHLI-BYULHYEWSA-N 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- 241000228212 Aspergillus Species 0.000 description 2
- 241000193755 Bacillus cereus Species 0.000 description 2
- 108010006654 Bleomycin Proteins 0.000 description 2
- 241000722885 Brettanomyces Species 0.000 description 2
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 2
- SQJSYLDKQBZQTG-FXQIFTODSA-N Cys-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CS)N SQJSYLDKQBZQTG-FXQIFTODSA-N 0.000 description 2
- SRBFZHDQGSBBOR-IOVATXLUSA-N D-xylopyranose Chemical compound O[C@@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-IOVATXLUSA-N 0.000 description 2
- 241001600125 Delftia acidovorans Species 0.000 description 2
- 241000588722 Escherichia Species 0.000 description 2
- 241000221778 Fusarium fujikuroi Species 0.000 description 2
- 101150038242 GAL10 gene Proteins 0.000 description 2
- 102100024637 Galectin-10 Human genes 0.000 description 2
- 241000626621 Geobacillus Species 0.000 description 2
- 235000008100 Ginkgo biloba Nutrition 0.000 description 2
- 244000194101 Ginkgo biloba Species 0.000 description 2
- PRBLYKYHAJEABA-SRVKXCTJSA-N Gln-Arg-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O PRBLYKYHAJEABA-SRVKXCTJSA-N 0.000 description 2
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 2
- HDUDGCZEOZEFOA-KBIXCLLPSA-N Gln-Ile-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HDUDGCZEOZEFOA-KBIXCLLPSA-N 0.000 description 2
- JRHPEMVLTRADLJ-AVGNSLFASA-N Gln-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JRHPEMVLTRADLJ-AVGNSLFASA-N 0.000 description 2
- UTOQQOMEJDPDMX-ACZMJKKPSA-N Gln-Ser-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O UTOQQOMEJDPDMX-ACZMJKKPSA-N 0.000 description 2
- LTUVYLVIZHJCOQ-KKUMJFAQSA-N Glu-Arg-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LTUVYLVIZHJCOQ-KKUMJFAQSA-N 0.000 description 2
- SBCYJMOOHUDWDA-NUMRIWBASA-N Glu-Asp-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SBCYJMOOHUDWDA-NUMRIWBASA-N 0.000 description 2
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 2
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 2
- OAGVHWYIBZMWLA-YFKPBYRVSA-N Glu-Gly-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)NCC(O)=O OAGVHWYIBZMWLA-YFKPBYRVSA-N 0.000 description 2
- COSBSYQVPSODFX-GUBZILKMSA-N Glu-His-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N COSBSYQVPSODFX-GUBZILKMSA-N 0.000 description 2
- HRBYTAIBKPNZKQ-AVGNSLFASA-N Glu-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O HRBYTAIBKPNZKQ-AVGNSLFASA-N 0.000 description 2
- SYAYROHMAIHWFB-KBIXCLLPSA-N Glu-Ser-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYAYROHMAIHWFB-KBIXCLLPSA-N 0.000 description 2
- MXJYXYDREQWUMS-XKBZYTNZSA-N Glu-Thr-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O MXJYXYDREQWUMS-XKBZYTNZSA-N 0.000 description 2
- ZQNCUVODKOBSSO-XEGUGMAKSA-N Glu-Trp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O ZQNCUVODKOBSSO-XEGUGMAKSA-N 0.000 description 2
- HGJREIGJLUQBTJ-SZMVWBNQSA-N Glu-Trp-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(C)C)C(O)=O HGJREIGJLUQBTJ-SZMVWBNQSA-N 0.000 description 2
- YOTHMZZSJKKEHZ-SZMVWBNQSA-N Glu-Trp-Lys Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CCC(O)=O)=CNC2=C1 YOTHMZZSJKKEHZ-SZMVWBNQSA-N 0.000 description 2
- YPHPEHMXOYTEQG-LAEOZQHASA-N Glu-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O YPHPEHMXOYTEQG-LAEOZQHASA-N 0.000 description 2
- 102000000340 Glucosyltransferases Human genes 0.000 description 2
- 108010055629 Glucosyltransferases Proteins 0.000 description 2
- YMUFWNJHVPQNQD-ZKWXMUAHSA-N Gly-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN YMUFWNJHVPQNQD-ZKWXMUAHSA-N 0.000 description 2
- JRDYDYXZKFNNRQ-XPUUQOCRSA-N Gly-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN JRDYDYXZKFNNRQ-XPUUQOCRSA-N 0.000 description 2
- 241000606768 Haemophilus influenzae Species 0.000 description 2
- 241001149669 Hanseniaspora Species 0.000 description 2
- 244000043261 Hevea brasiliensis Species 0.000 description 2
- 101000884385 Homo sapiens Arylamine N-acetyltransferase 1 Proteins 0.000 description 2
- 101001034811 Homo sapiens Eukaryotic translation initiation factor 4 gamma 2 Proteins 0.000 description 2
- 101000639975 Homo sapiens Sodium-dependent noradrenaline transporter Proteins 0.000 description 2
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 2
- WUKLZPHVWAMZQV-UKJIMTQDSA-N Ile-Glu-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N WUKLZPHVWAMZQV-UKJIMTQDSA-N 0.000 description 2
- CDGLBYSAZFIIJO-RCOVLWMOSA-N Ile-Gly-Gly Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O CDGLBYSAZFIIJO-RCOVLWMOSA-N 0.000 description 2
- SJLVSMMIFYTSGY-GRLWGSQLSA-N Ile-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SJLVSMMIFYTSGY-GRLWGSQLSA-N 0.000 description 2
- UWLHDGMRWXHFFY-HPCHECBXSA-N Ile-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N1CCC[C@@H]1C(=O)O)N UWLHDGMRWXHFFY-HPCHECBXSA-N 0.000 description 2
- KLBVGHCGHUNHEA-BJDJZHNGSA-N Ile-Leu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)O)N KLBVGHCGHUNHEA-BJDJZHNGSA-N 0.000 description 2
- DSDPLOODKXISDT-XUXIUFHCSA-N Ile-Leu-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O DSDPLOODKXISDT-XUXIUFHCSA-N 0.000 description 2
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 2
- SNHYFFQZRFIRHO-CYDGBPFRSA-N Ile-Met-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(=O)O)N SNHYFFQZRFIRHO-CYDGBPFRSA-N 0.000 description 2
- VOCZPDONPURUHV-QEWYBTABSA-N Ile-Phe-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VOCZPDONPURUHV-QEWYBTABSA-N 0.000 description 2
- XHBYEMIUENPZLY-GMOBBJLQSA-N Ile-Pro-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O XHBYEMIUENPZLY-GMOBBJLQSA-N 0.000 description 2
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 2
- PRTZQMBYUZFSFA-XEGUGMAKSA-N Ile-Tyr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)NCC(=O)O)N PRTZQMBYUZFSFA-XEGUGMAKSA-N 0.000 description 2
- ZGKVPOSSTGHJAF-HJPIBITLSA-N Ile-Tyr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CO)C(=O)O)N ZGKVPOSSTGHJAF-HJPIBITLSA-N 0.000 description 2
- 108010065958 Isopentenyl-diphosphate Delta-isomerase Proteins 0.000 description 2
- 241000235649 Kluyveromyces Species 0.000 description 2
- 241001138401 Kluyveromyces lactis Species 0.000 description 2
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- 241000880493 Leptailurus serval Species 0.000 description 2
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 2
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 2
- DLCXCECTCPKKCD-GUBZILKMSA-N Leu-Gln-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DLCXCECTCPKKCD-GUBZILKMSA-N 0.000 description 2
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 2
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 2
- HRTRLSRYZZKPCO-BJDJZHNGSA-N Leu-Ile-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HRTRLSRYZZKPCO-BJDJZHNGSA-N 0.000 description 2
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 2
- BJWKOATWNQJPSK-SRVKXCTJSA-N Leu-Met-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N BJWKOATWNQJPSK-SRVKXCTJSA-N 0.000 description 2
- INCJJHQRZGQLFC-KBPBESRZSA-N Leu-Phe-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O INCJJHQRZGQLFC-KBPBESRZSA-N 0.000 description 2
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 2
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 2
- BTEMNFBEAAOGBR-BZSNNMDCSA-N Leu-Tyr-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BTEMNFBEAAOGBR-BZSNNMDCSA-N 0.000 description 2
- MVJRBCJCRYGCKV-GVXVVHGQSA-N Leu-Val-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MVJRBCJCRYGCKV-GVXVVHGQSA-N 0.000 description 2
- VKVDRTGWLVZJOM-DCAQKATOSA-N Leu-Val-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 2
- QESXLSQLQHHTIX-RHYQMDGZSA-N Leu-Val-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QESXLSQLQHHTIX-RHYQMDGZSA-N 0.000 description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Chemical group CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 2
- 241001149698 Lipomyces Species 0.000 description 2
- NDSNUWJPZKTFAR-DCAQKATOSA-N Lys-Cys-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CCCCN NDSNUWJPZKTFAR-DCAQKATOSA-N 0.000 description 2
- GJJQCBVRWDGLMQ-GUBZILKMSA-N Lys-Glu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O GJJQCBVRWDGLMQ-GUBZILKMSA-N 0.000 description 2
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 2
- IMAKMJCBYCSMHM-AVGNSLFASA-N Lys-Glu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN IMAKMJCBYCSMHM-AVGNSLFASA-N 0.000 description 2
- PGLGNCVOWIORQE-SRVKXCTJSA-N Lys-His-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O PGLGNCVOWIORQE-SRVKXCTJSA-N 0.000 description 2
- MXMDJEJWERYPMO-XUXIUFHCSA-N Lys-Ile-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MXMDJEJWERYPMO-XUXIUFHCSA-N 0.000 description 2
- ZJWIXBZTAAJERF-IHRRRGAJSA-N Lys-Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZJWIXBZTAAJERF-IHRRRGAJSA-N 0.000 description 2
- YXPJCVNIDDKGOE-MELADBBJSA-N Lys-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N)C(=O)O YXPJCVNIDDKGOE-MELADBBJSA-N 0.000 description 2
- KFSALEZVQJYHCE-AVGNSLFASA-N Lys-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCCCN)N KFSALEZVQJYHCE-AVGNSLFASA-N 0.000 description 2
- AFLBTVGQCQLOFJ-AVGNSLFASA-N Lys-Pro-Arg Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AFLBTVGQCQLOFJ-AVGNSLFASA-N 0.000 description 2
- MSSABBQOBUZFKZ-IHRRRGAJSA-N Lys-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCCCN)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O MSSABBQOBUZFKZ-IHRRRGAJSA-N 0.000 description 2
- TVHCDSBMFQYPNA-RHYQMDGZSA-N Lys-Thr-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TVHCDSBMFQYPNA-RHYQMDGZSA-N 0.000 description 2
- YCJCEMKOZOYBEF-OEAJRASXSA-N Lys-Thr-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YCJCEMKOZOYBEF-OEAJRASXSA-N 0.000 description 2
- 239000004472 Lysine Substances 0.000 description 2
- DTICLBJHRYSJLH-GUBZILKMSA-N Met-Ala-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O DTICLBJHRYSJLH-GUBZILKMSA-N 0.000 description 2
- WGBMNLCRYKSWAR-DCAQKATOSA-N Met-Asp-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN WGBMNLCRYKSWAR-DCAQKATOSA-N 0.000 description 2
- YORIKIDJCPKBON-YUMQZZPRSA-N Met-Glu-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YORIKIDJCPKBON-YUMQZZPRSA-N 0.000 description 2
- ZIIMORLEZLVRIP-SRVKXCTJSA-N Met-Leu-Gln Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZIIMORLEZLVRIP-SRVKXCTJSA-N 0.000 description 2
- OSZTUONKUMCWEP-XUXIUFHCSA-N Met-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCSC OSZTUONKUMCWEP-XUXIUFHCSA-N 0.000 description 2
- UDOYVQQKQHZYMB-DCAQKATOSA-N Met-Met-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDOYVQQKQHZYMB-DCAQKATOSA-N 0.000 description 2
- WYDFQSJOARJAMM-GUBZILKMSA-N Met-Pro-Asp Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O WYDFQSJOARJAMM-GUBZILKMSA-N 0.000 description 2
- RDLSEGZJMYGFNS-FXQIFTODSA-N Met-Ser-Asp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RDLSEGZJMYGFNS-FXQIFTODSA-N 0.000 description 2
- YGNUDKAPJARTEM-GUBZILKMSA-N Met-Val-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O YGNUDKAPJARTEM-GUBZILKMSA-N 0.000 description 2
- 241000186359 Mycobacterium Species 0.000 description 2
- 108010079364 N-glycylalanine Proteins 0.000 description 2
- 241000221960 Neurospora Species 0.000 description 2
- 241000320412 Ogataea angusta Species 0.000 description 2
- 101100054296 Oryza sativa subsp. japonica ABCG37 gene Proteins 0.000 description 2
- 101100107593 Oryza sativa subsp. japonica ABCG40 gene Proteins 0.000 description 2
- 241001057811 Paracoccus <mealybug> Species 0.000 description 2
- CSDMCMITJLKBAH-SOUVJXGZSA-N Phe-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O CSDMCMITJLKBAH-SOUVJXGZSA-N 0.000 description 2
- JJHVFCUWLSKADD-ONGXEEELSA-N Phe-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O JJHVFCUWLSKADD-ONGXEEELSA-N 0.000 description 2
- NAXPHWZXEXNDIW-JTQLQIEISA-N Phe-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 NAXPHWZXEXNDIW-JTQLQIEISA-N 0.000 description 2
- ISYSEOWLRQKQEQ-JYJNAYRXSA-N Phe-His-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O ISYSEOWLRQKQEQ-JYJNAYRXSA-N 0.000 description 2
- WKTSCAXSYITIJJ-PCBIJLKTSA-N Phe-Ile-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O WKTSCAXSYITIJJ-PCBIJLKTSA-N 0.000 description 2
- OQTDZEJJWWAGJT-KKUMJFAQSA-N Phe-Lys-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O OQTDZEJJWWAGJT-KKUMJFAQSA-N 0.000 description 2
- ODGNUUUDJONJSC-UFYCRDLUSA-N Phe-Pro-Tyr Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O ODGNUUUDJONJSC-UFYCRDLUSA-N 0.000 description 2
- GKRCCTYAGQPMMP-IHRRRGAJSA-N Phe-Ser-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O GKRCCTYAGQPMMP-IHRRRGAJSA-N 0.000 description 2
- LTAWNJXSRUCFAN-UNQGMJICSA-N Phe-Thr-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LTAWNJXSRUCFAN-UNQGMJICSA-N 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 2
- FRKBNXCFJBPJOL-GUBZILKMSA-N Pro-Glu-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FRKBNXCFJBPJOL-GUBZILKMSA-N 0.000 description 2
- 108010009736 Protein Hydrolysates Proteins 0.000 description 2
- 108010025216 RVF peptide Proteins 0.000 description 2
- 241000223252 Rhodotorula Species 0.000 description 2
- 241000030574 Ruegeria pomeroyi Species 0.000 description 2
- 101150037481 SMR1 gene Proteins 0.000 description 2
- 101100491255 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) YAP1 gene Proteins 0.000 description 2
- BGOWRLSWJCVYAQ-CIUDSAMLSA-N Ser-Asp-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BGOWRLSWJCVYAQ-CIUDSAMLSA-N 0.000 description 2
- ULVMNZOKDBHKKI-ACZMJKKPSA-N Ser-Gln-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ULVMNZOKDBHKKI-ACZMJKKPSA-N 0.000 description 2
- SMIDBHKWSYUBRZ-ACZMJKKPSA-N Ser-Glu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O SMIDBHKWSYUBRZ-ACZMJKKPSA-N 0.000 description 2
- BRGQQXQKPUCUJQ-KBIXCLLPSA-N Ser-Glu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRGQQXQKPUCUJQ-KBIXCLLPSA-N 0.000 description 2
- VQBCMLMPEWPUTB-ACZMJKKPSA-N Ser-Glu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VQBCMLMPEWPUTB-ACZMJKKPSA-N 0.000 description 2
- HBTCFCHYALPXME-HTFCKZLJSA-N Ser-Ile-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HBTCFCHYALPXME-HTFCKZLJSA-N 0.000 description 2
- UIPXCLNLUUAMJU-JBDRJPRFSA-N Ser-Ile-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UIPXCLNLUUAMJU-JBDRJPRFSA-N 0.000 description 2
- GJFYFGOEWLDQGW-GUBZILKMSA-N Ser-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GJFYFGOEWLDQGW-GUBZILKMSA-N 0.000 description 2
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 2
- ASGYVPAVFNDZMA-GUBZILKMSA-N Ser-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CO)N ASGYVPAVFNDZMA-GUBZILKMSA-N 0.000 description 2
- BDMWLJLPPUCLNV-XGEHTFHBSA-N Ser-Thr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BDMWLJLPPUCLNV-XGEHTFHBSA-N 0.000 description 2
- HAYADTTXNZFUDM-IHRRRGAJSA-N Ser-Tyr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O HAYADTTXNZFUDM-IHRRRGAJSA-N 0.000 description 2
- 102100033929 Sodium-dependent noradrenaline transporter Human genes 0.000 description 2
- 240000003768 Solanum lycopersicum Species 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- 244000057717 Streptococcus lactis Species 0.000 description 2
- 235000014897 Streptococcus lactis Nutrition 0.000 description 2
- 241000194019 Streptococcus mutans Species 0.000 description 2
- QAOWNCQODCNURD-UHFFFAOYSA-N Sulfuric acid Chemical compound OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 2
- 241000192707 Synechococcus Species 0.000 description 2
- NJEMRSFGDNECGF-GCJQMDKQSA-N Thr-Ala-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O NJEMRSFGDNECGF-GCJQMDKQSA-N 0.000 description 2
- PXQUBKWZENPDGE-CIQUZCHMSA-N Thr-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)O)N PXQUBKWZENPDGE-CIQUZCHMSA-N 0.000 description 2
- XSLXHSYIVPGEER-KZVJFYERSA-N Thr-Ala-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O XSLXHSYIVPGEER-KZVJFYERSA-N 0.000 description 2
- TWLMXDWFVNEFFK-FJXKBIBVSA-N Thr-Arg-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O TWLMXDWFVNEFFK-FJXKBIBVSA-N 0.000 description 2
- UDQBCBUXAQIZAK-GLLZPBPUSA-N Thr-Glu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDQBCBUXAQIZAK-GLLZPBPUSA-N 0.000 description 2
- LHEZGZQRLDBSRR-WDCWCFNPSA-N Thr-Glu-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LHEZGZQRLDBSRR-WDCWCFNPSA-N 0.000 description 2
- ZTPXSEUVYNNZRB-CDMKHQONSA-N Thr-Gly-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZTPXSEUVYNNZRB-CDMKHQONSA-N 0.000 description 2
- RFKVQLIXNVEOMB-WEDXCCLWSA-N Thr-Leu-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N)O RFKVQLIXNVEOMB-WEDXCCLWSA-N 0.000 description 2
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 2
- UJQVSMNQMQHVRY-KZVJFYERSA-N Thr-Met-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O UJQVSMNQMQHVRY-KZVJFYERSA-N 0.000 description 2
- GFRIEEKFXOVPIR-RHYQMDGZSA-N Thr-Pro-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O GFRIEEKFXOVPIR-RHYQMDGZSA-N 0.000 description 2
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 2
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 2
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 2
- 239000004473 Threonine Substances 0.000 description 2
- 241000235006 Torulaspora Species 0.000 description 2
- CMXACOZDEJYZSK-XIRDDKMYSA-N Trp-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N CMXACOZDEJYZSK-XIRDDKMYSA-N 0.000 description 2
- WKCFCVBOFKEVKY-HSCHXYMDSA-N Trp-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N WKCFCVBOFKEVKY-HSCHXYMDSA-N 0.000 description 2
- NWQCKAPDGQMZQN-IHPCNDPISA-N Trp-Lys-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O NWQCKAPDGQMZQN-IHPCNDPISA-N 0.000 description 2
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 2
- TVOGEPLDNYTAHD-CQDKDKBSSA-N Tyr-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TVOGEPLDNYTAHD-CQDKDKBSSA-N 0.000 description 2
- BEIGSKUPTIFYRZ-SRVKXCTJSA-N Tyr-Asp-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O BEIGSKUPTIFYRZ-SRVKXCTJSA-N 0.000 description 2
- NZFCWALTLNFHHC-JYJNAYRXSA-N Tyr-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NZFCWALTLNFHHC-JYJNAYRXSA-N 0.000 description 2
- RIFVTNDKUMSSMN-ULQDDVLXSA-N Tyr-His-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](Cc1c[nH]cn1)NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(O)=O RIFVTNDKUMSSMN-ULQDDVLXSA-N 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- OVLIFGQSBSNGHY-KKHAAJSZSA-N Val-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N)O OVLIFGQSBSNGHY-KKHAAJSZSA-N 0.000 description 2
- FPCIBLUVDNXPJO-XPUUQOCRSA-N Val-Cys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O FPCIBLUVDNXPJO-XPUUQOCRSA-N 0.000 description 2
- WDIGUPHXPBMODF-UMNHJUIQSA-N Val-Glu-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N WDIGUPHXPBMODF-UMNHJUIQSA-N 0.000 description 2
- WNZSAUMKZQXHNC-UKJIMTQDSA-N Val-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N WNZSAUMKZQXHNC-UKJIMTQDSA-N 0.000 description 2
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 2
- GVJUTBOZZBTBIG-AVGNSLFASA-N Val-Lys-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N GVJUTBOZZBTBIG-AVGNSLFASA-N 0.000 description 2
- UXODSMTVPWXHBT-ULQDDVLXSA-N Val-Phe-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N UXODSMTVPWXHBT-ULQDDVLXSA-N 0.000 description 2
- HJSLDXZAZGFPDK-ULQDDVLXSA-N Val-Phe-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C(C)C)N HJSLDXZAZGFPDK-ULQDDVLXSA-N 0.000 description 2
- SJRUJQFQVLMZFW-WPRPVWTQSA-N Val-Pro-Gly Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SJRUJQFQVLMZFW-WPRPVWTQSA-N 0.000 description 2
- NHXZRXLFOBFMDM-AVGNSLFASA-N Val-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C NHXZRXLFOBFMDM-AVGNSLFASA-N 0.000 description 2
- JSOXWWFKRJKTMT-WOPDTQHZSA-N Val-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N JSOXWWFKRJKTMT-WOPDTQHZSA-N 0.000 description 2
- 235000014787 Vitis vinifera Nutrition 0.000 description 2
- 241000193620 Wickerhamia Species 0.000 description 2
- 241000193624 Wickerhamiella Species 0.000 description 2
- 241000311098 Yamadazyma Species 0.000 description 2
- 108010084455 Zeocin Proteins 0.000 description 2
- 241000588902 Zymomonas mobilis Species 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 2
- 108010070944 alanylhistidine Proteins 0.000 description 2
- 229910021529 ammonia Inorganic materials 0.000 description 2
- 239000000908 ammonium hydroxide Substances 0.000 description 2
- 239000012491 analyte Substances 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 239000008346 aqueous phase Substances 0.000 description 2
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 2
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 2
- 108010038850 arginyl-isoleucyl-tyrosine Proteins 0.000 description 2
- 229930101531 artemisinin Natural products 0.000 description 2
- BLUAFEHZUWYNDE-NNWCWBAJSA-N artemisinin Chemical compound C([C@](OO1)(C)O2)C[C@H]3[C@H](C)CC[C@@H]4[C@@]31[C@@H]2OC(=O)[C@@H]4C BLUAFEHZUWYNDE-NNWCWBAJSA-N 0.000 description 2
- 229960004191 artemisinin Drugs 0.000 description 2
- 125000003118 aryl group Chemical group 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 235000003704 aspartic acid Nutrition 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N aspartic acid group Chemical group N[C@@H](CC(=O)O)C(=O)O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 2
- 108010047857 aspartylglycine Proteins 0.000 description 2
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 230000001851 biosynthetic effect Effects 0.000 description 2
- 101150038738 ble gene Proteins 0.000 description 2
- 229960001561 bleomycin Drugs 0.000 description 2
- OYVAGSVQBOHSSS-UAPAGMARSA-O bleomycin A2 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC=C(N=1)C=1SC=C(N=1)C(=O)NCCC[S+](C)C)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C OYVAGSVQBOHSSS-UAPAGMARSA-O 0.000 description 2
- UORVGPXVDQYIDP-UHFFFAOYSA-N borane Chemical compound B UORVGPXVDQYIDP-UHFFFAOYSA-N 0.000 description 2
- 239000001110 calcium chloride Substances 0.000 description 2
- 229910001628 calcium chloride Inorganic materials 0.000 description 2
- 239000002775 capsule Substances 0.000 description 2
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000004587 chromatography analysis Methods 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000006482 condensation reaction Methods 0.000 description 2
- 108010016616 cysteinylglycine Proteins 0.000 description 2
- 108010069495 cysteinyltyrosine Proteins 0.000 description 2
- 230000020176 deacylation Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 235000013681 dietary sucrose Nutrition 0.000 description 2
- 150000004683 dihydrates Chemical class 0.000 description 2
- 150000002016 disaccharides Chemical class 0.000 description 2
- 238000004821 distillation Methods 0.000 description 2
- SNRUBQQJIBEYMU-UHFFFAOYSA-N dodecane Chemical compound CCCCCCCCCCCC SNRUBQQJIBEYMU-UHFFFAOYSA-N 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- ZXQYGBMAQZUVMI-GCMPRSNUSA-N gamma-cyhalothrin Chemical compound CC1(C)[C@@H](\C=C(/Cl)C(F)(F)F)[C@H]1C(=O)O[C@H](C#N)C1=CC=CC(OC=2C=CC=CC=2)=C1 ZXQYGBMAQZUVMI-GCMPRSNUSA-N 0.000 description 2
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 2
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 2
- 150000004676 glycans Chemical class 0.000 description 2
- 125000003147 glycosyl group Chemical group 0.000 description 2
- 108010089804 glycyl-threonine Proteins 0.000 description 2
- 108010087823 glycyltyrosine Proteins 0.000 description 2
- 235000002532 grape seed extract Nutrition 0.000 description 2
- 229940047650 haemophilus influenzae Drugs 0.000 description 2
- 108010085325 histidylproline Proteins 0.000 description 2
- 238000002744 homologous recombination Methods 0.000 description 2
- 230000006801 homologous recombination Effects 0.000 description 2
- 125000001165 hydrophobic group Chemical group 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000009655 industrial fermentation Methods 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 229910052500 inorganic mineral Inorganic materials 0.000 description 2
- 230000002427 irreversible effect Effects 0.000 description 2
- 108010031424 isoleucyl-prolyl-proline Proteins 0.000 description 2
- HJOVHMDZYOCNQW-UHFFFAOYSA-N isophorone Chemical compound CC1=CC(=O)CC(C)(C)C1 HJOVHMDZYOCNQW-UHFFFAOYSA-N 0.000 description 2
- 229940039696 lactobacillus Drugs 0.000 description 2
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 2
- 108010057821 leucylproline Proteins 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- KWGKDLIKAYFUFQ-UHFFFAOYSA-M lithium chloride Chemical compound [Li+].[Cl-] KWGKDLIKAYFUFQ-UHFFFAOYSA-M 0.000 description 2
- 108010003700 lysyl aspartic acid Proteins 0.000 description 2
- 108010009298 lysylglutamic acid Proteins 0.000 description 2
- 108010064235 lysylglycine Proteins 0.000 description 2
- 108010017391 lysylvaline Proteins 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 239000002207 metabolite Substances 0.000 description 2
- 108010085203 methionylmethionine Proteins 0.000 description 2
- 230000000813 microbial effect Effects 0.000 description 2
- 235000010755 mineral Nutrition 0.000 description 2
- 239000011707 mineral Substances 0.000 description 2
- 150000002772 monosaccharides Chemical class 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- 239000002667 nucleating agent Substances 0.000 description 2
- CWCMIVBLVUHDHK-ZSNHEYEWSA-N phleomycin D1 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC[C@@H](N=1)C=1SC=C(N=1)C(=O)NCCCCNC(N)=N)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C CWCMIVBLVUHDHK-ZSNHEYEWSA-N 0.000 description 2
- 239000003375 plant hormone Substances 0.000 description 2
- 239000013612 plasmid Substances 0.000 description 2
- 229920001282 polysaccharide Polymers 0.000 description 2
- 239000005017 polysaccharide Substances 0.000 description 2
- LWIHDJKSTIGBAC-UHFFFAOYSA-K potassium phosphate Substances [K+].[K+].[K+].[O-]P([O-])([O-])=O LWIHDJKSTIGBAC-UHFFFAOYSA-K 0.000 description 2
- 108010025826 prolyl-leucyl-arginine Proteins 0.000 description 2
- 108010029020 prolylglycine Proteins 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- ZUFQODAHGAHPFQ-UHFFFAOYSA-N pyridoxine hydrochloride Chemical compound Cl.CC1=NC=C(CO)C(CO)=C1O ZUFQODAHGAHPFQ-UHFFFAOYSA-N 0.000 description 2
- 235000019171 pyridoxine hydrochloride Nutrition 0.000 description 2
- 239000011764 pyridoxine hydrochloride Substances 0.000 description 2
- QSRAJVGDWKFOGU-WBXIDTKBSA-N rebaudioside c Chemical compound O[C@@H]1[C@H](O)[C@@H](O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](O[C@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O2)O)[C@H](O)[C@@H](CO)O[C@H]1O[C@]1(CC[C@H]2[C@@]3(C)[C@@H]([C@](CCC3)(C)C(=O)O[C@H]3[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O3)O)CC3)C(=C)C[C@]23C1 QSRAJVGDWKFOGU-WBXIDTKBSA-N 0.000 description 2
- 229910052703 rhodium Inorganic materials 0.000 description 2
- 239000010948 rhodium Substances 0.000 description 2
- MHOVAHRLVXNVSD-UHFFFAOYSA-N rhodium atom Chemical compound [Rh] MHOVAHRLVXNVSD-UHFFFAOYSA-N 0.000 description 2
- 229920006395 saturated elastomer Polymers 0.000 description 2
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 2
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 230000009469 supplementation Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 229960003495 thiamine Drugs 0.000 description 2
- DPJRMOMPQZCRJU-UHFFFAOYSA-M thiamine hydrochloride Chemical compound Cl.[Cl-].CC1=C(CCO)SC=[N+]1CC1=CN=C(C)N=C1N DPJRMOMPQZCRJU-UHFFFAOYSA-M 0.000 description 2
- 235000019190 thiamine hydrochloride Nutrition 0.000 description 2
- 239000011747 thiamine hydrochloride Substances 0.000 description 2
- 238000007079 thiolysis reaction Methods 0.000 description 2
- 108010061238 threonyl-glycine Proteins 0.000 description 2
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 2
- 108010073969 valyllysine Proteins 0.000 description 2
- 229940011671 vitamin b6 Drugs 0.000 description 2
- HDTRYLNUVZCQOY-UHFFFAOYSA-N α-D-glucopyranosyl-α-D-glucopyranoside Natural products OC1C(O)C(O)C(CO)OC1OC1C(O)C(O)C(O)C(CO)O1 HDTRYLNUVZCQOY-UHFFFAOYSA-N 0.000 description 1
- 101710165761 (2E,6E)-farnesyl diphosphate synthase Proteins 0.000 description 1
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 1
- CWFMWBHMIMNZLN-NAKRPEOUSA-N (2s)-1-[(2s)-2-[[(2s,3s)-2-amino-3-methylpentanoyl]amino]propanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CWFMWBHMIMNZLN-NAKRPEOUSA-N 0.000 description 1
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 1
- GVEZIHKRYBHEFX-MNOVXSKESA-N 13C-Cerulenin Natural products CC=CCC=CCCC(=O)[C@H]1O[C@@H]1C(N)=O GVEZIHKRYBHEFX-MNOVXSKESA-N 0.000 description 1
- YEJQWBFDKKTPNO-UHFFFAOYSA-N 2-[[2-[[1-(2-amino-3-methylbutanoyl)pyrrolidine-2-carbonyl]amino]acetyl]amino]-3-methylbutanoic acid Chemical compound CC(C)C(N)C(=O)N1CCCC1C(=O)NCC(=O)NC(C(C)C)C(O)=O YEJQWBFDKKTPNO-UHFFFAOYSA-N 0.000 description 1
- JUEUYDRZJNQZGR-UHFFFAOYSA-N 2-[[2-[[2-[(2-amino-4-methylpentanoyl)amino]-4-methylpentanoyl]amino]acetyl]amino]-3-phenylpropanoic acid Chemical compound CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JUEUYDRZJNQZGR-UHFFFAOYSA-N 0.000 description 1
- ZSYRDSTUBZGDKI-UHFFFAOYSA-N 3-(4-bromophenyl)pentanedioic acid Chemical compound OC(=O)CC(CC(O)=O)C1=CC=C(Br)C=C1 ZSYRDSTUBZGDKI-UHFFFAOYSA-N 0.000 description 1
- PHPFNDMWFSVIPC-WLRAPFKRSA-N 3-[2-[3-[[(2R)-4-[[[(2R,3S,4R,5R)-5-(6-aminopurin-9-yl)-4-hydroxy-3-phosphonooxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-hydroxyphosphoryl]oxy-2-hydroxy-3,3-dimethylbutanoyl]amino]propanoylamino]ethylsulfanyl]-3-oxopropanoic acid Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)CC(O)=O)O[C@H]1N1C2=NC=NC(N)=C2N=C1.O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)CC(O)=O)O[C@H]1N1C2=NC=NC(N)=C2N=C1 PHPFNDMWFSVIPC-WLRAPFKRSA-N 0.000 description 1
- 102100029077 3-hydroxy-3-methylglutaryl-coenzyme A reductase Human genes 0.000 description 1
- ZUQOBHTUMCEQBG-UHFFFAOYSA-N 4-amino-5-hydroxynaphthalene-1,7-disulfonic acid Chemical compound OS(=O)(=O)C1=CC(O)=C2C(N)=CC=C(S(O)(=O)=O)C2=C1 ZUQOBHTUMCEQBG-UHFFFAOYSA-N 0.000 description 1
- 101710163881 5,6-dihydroxyindole-2-carboxylic acid oxidase Proteins 0.000 description 1
- FPQMGQZTBWIHDN-UHFFFAOYSA-N 5-fluoroanthranilic acid Chemical compound NC1=CC=C(F)C=C1C(O)=O FPQMGQZTBWIHDN-UHFFFAOYSA-N 0.000 description 1
- JCAIWDXKLCEQEO-ATPOGHATSA-N 5alpha,9alpha,10beta-labda-8(20),13-dien-15-yl diphosphate Chemical compound CC1(C)CCC[C@]2(C)[C@@H](CCC(/C)=C/COP(O)(=O)OP(O)(O)=O)C(=C)CC[C@H]21 JCAIWDXKLCEQEO-ATPOGHATSA-N 0.000 description 1
- 241000218642 Abies Species 0.000 description 1
- 235000017894 Abies grandis Nutrition 0.000 description 1
- 244000178606 Abies grandis Species 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 1
- 235000007754 Achillea millefolium Nutrition 0.000 description 1
- 240000000073 Achillea millefolium Species 0.000 description 1
- 241000159572 Aciculoconidium Species 0.000 description 1
- 241000187712 Actinoplanes sp. Species 0.000 description 1
- 108700016155 Acyl transferases Proteins 0.000 description 1
- 102000057234 Acyl transferases Human genes 0.000 description 1
- 241000567147 Aeropyrum Species 0.000 description 1
- 241000567139 Aeropyrum pernix Species 0.000 description 1
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 1
- YAXNATKKPOWVCP-ZLUOBGJFSA-N Ala-Asn-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O YAXNATKKPOWVCP-ZLUOBGJFSA-N 0.000 description 1
- ZIBWKCRKNFYTPT-ZKWXMUAHSA-N Ala-Asn-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZIBWKCRKNFYTPT-ZKWXMUAHSA-N 0.000 description 1
- WQVYAWIMAWTGMW-ZLUOBGJFSA-N Ala-Asp-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N WQVYAWIMAWTGMW-ZLUOBGJFSA-N 0.000 description 1
- HFBFSOAKPUZCCO-ZLUOBGJFSA-N Ala-Cys-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O)N HFBFSOAKPUZCCO-ZLUOBGJFSA-N 0.000 description 1
- VIGKUFXFTPWYER-BIIVOSGPSA-N Ala-Cys-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N VIGKUFXFTPWYER-BIIVOSGPSA-N 0.000 description 1
- SFNFGFDRYJKZKN-XQXXSGGOSA-N Ala-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C)N)O SFNFGFDRYJKZKN-XQXXSGGOSA-N 0.000 description 1
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 1
- BEMGNWZECGIJOI-WDSKDSINSA-N Ala-Gly-Glu Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O BEMGNWZECGIJOI-WDSKDSINSA-N 0.000 description 1
- BLIMFWGRQKRCGT-YUMQZZPRSA-N Ala-Gly-Lys Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN BLIMFWGRQKRCGT-YUMQZZPRSA-N 0.000 description 1
- JDIQCVUDDFENPU-ZKWXMUAHSA-N Ala-His-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CNC=N1 JDIQCVUDDFENPU-ZKWXMUAHSA-N 0.000 description 1
- IFKQPMZRDQZSHI-GHCJXIJMSA-N Ala-Ile-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O IFKQPMZRDQZSHI-GHCJXIJMSA-N 0.000 description 1
- CKLDHDOIYBVUNP-KBIXCLLPSA-N Ala-Ile-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O CKLDHDOIYBVUNP-KBIXCLLPSA-N 0.000 description 1
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 1
- TZDNWXDLYFIFPT-BJDJZHNGSA-N Ala-Ile-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O TZDNWXDLYFIFPT-BJDJZHNGSA-N 0.000 description 1
- OKIKVSXTXVVFDV-MMWGEVLESA-N Ala-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N OKIKVSXTXVVFDV-MMWGEVLESA-N 0.000 description 1
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 1
- WUHJHHGYVVJMQE-BJDJZHNGSA-N Ala-Leu-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WUHJHHGYVVJMQE-BJDJZHNGSA-N 0.000 description 1
- QPBSRMDNJOTFAL-AICCOOGYSA-N Ala-Leu-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QPBSRMDNJOTFAL-AICCOOGYSA-N 0.000 description 1
- AJBVYEYZVYPFCF-CIUDSAMLSA-N Ala-Lys-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O AJBVYEYZVYPFCF-CIUDSAMLSA-N 0.000 description 1
- OQWQTGBOFPJOIF-DLOVCJGASA-N Ala-Lys-His Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N OQWQTGBOFPJOIF-DLOVCJGASA-N 0.000 description 1
- XHNLCGXYBXNRIS-BJDJZHNGSA-N Ala-Lys-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XHNLCGXYBXNRIS-BJDJZHNGSA-N 0.000 description 1
- OINVDEKBKBCPLX-JXUBOQSCSA-N Ala-Lys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OINVDEKBKBCPLX-JXUBOQSCSA-N 0.000 description 1
- IHRGVZXPTIQNIP-NAKRPEOUSA-N Ala-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C)N IHRGVZXPTIQNIP-NAKRPEOUSA-N 0.000 description 1
- XSTZMVAYYCJTNR-DCAQKATOSA-N Ala-Met-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O XSTZMVAYYCJTNR-DCAQKATOSA-N 0.000 description 1
- DHBKYZYFEXXUAK-ONGXEEELSA-N Ala-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 DHBKYZYFEXXUAK-ONGXEEELSA-N 0.000 description 1
- BTRULDJUUVGRNE-DCAQKATOSA-N Ala-Pro-Lys Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O BTRULDJUUVGRNE-DCAQKATOSA-N 0.000 description 1
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 1
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 1
- YNOCMHZSWJMGBB-GCJQMDKQSA-N Ala-Thr-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O YNOCMHZSWJMGBB-GCJQMDKQSA-N 0.000 description 1
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 1
- ZCUFMRIQCPNOHZ-NRPADANISA-N Ala-Val-Gln Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N ZCUFMRIQCPNOHZ-NRPADANISA-N 0.000 description 1
- NLYYHIKRBRMAJV-AEJSXWLSSA-N Ala-Val-Pro Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N NLYYHIKRBRMAJV-AEJSXWLSSA-N 0.000 description 1
- 241001147780 Alicyclobacillus Species 0.000 description 1
- 241000607620 Aliivibrio fischeri Species 0.000 description 1
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 1
- 241001508809 Ambrosiozyma Species 0.000 description 1
- 239000004254 Ammonium phosphate Substances 0.000 description 1
- 241000944022 Amyris Species 0.000 description 1
- 241000192542 Anabaena Species 0.000 description 1
- 241000272525 Anas platyrhynchos Species 0.000 description 1
- 240000001436 Antirrhinum majus Species 0.000 description 1
- 241000893512 Aquifex aeolicus Species 0.000 description 1
- 101001094837 Arabidopsis thaliana Pectinesterase 5 Proteins 0.000 description 1
- 241000205042 Archaeoglobus fulgidus Species 0.000 description 1
- PEFFAAKJGBZBKL-NAKRPEOUSA-N Arg-Ala-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PEFFAAKJGBZBKL-NAKRPEOUSA-N 0.000 description 1
- BIOCIVSVEDFKDJ-GUBZILKMSA-N Arg-Arg-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O BIOCIVSVEDFKDJ-GUBZILKMSA-N 0.000 description 1
- JGDGLDNAQJJGJI-AVGNSLFASA-N Arg-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N JGDGLDNAQJJGJI-AVGNSLFASA-N 0.000 description 1
- KWTVWJPNHAOREN-IHRRRGAJSA-N Arg-Asn-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KWTVWJPNHAOREN-IHRRRGAJSA-N 0.000 description 1
- IGULQRCJLQQPSM-DCAQKATOSA-N Arg-Cys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O IGULQRCJLQQPSM-DCAQKATOSA-N 0.000 description 1
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 1
- HPKSHFSEXICTLI-CIUDSAMLSA-N Arg-Glu-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HPKSHFSEXICTLI-CIUDSAMLSA-N 0.000 description 1
- PBSOQGZLPFVXPU-YUMQZZPRSA-N Arg-Glu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PBSOQGZLPFVXPU-YUMQZZPRSA-N 0.000 description 1
- NKBQZKVMKJJDLX-SRVKXCTJSA-N Arg-Glu-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NKBQZKVMKJJDLX-SRVKXCTJSA-N 0.000 description 1
- GOWZVQXTHUCNSQ-NHCYSSNCSA-N Arg-Glu-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GOWZVQXTHUCNSQ-NHCYSSNCSA-N 0.000 description 1
- ITHMWNNUDPJJER-ULQDDVLXSA-N Arg-His-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ITHMWNNUDPJJER-ULQDDVLXSA-N 0.000 description 1
- YQGZIRIYGHNSQO-ZPFDUUQYSA-N Arg-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YQGZIRIYGHNSQO-ZPFDUUQYSA-N 0.000 description 1
- FNXCAFKDGBROCU-STECZYCISA-N Arg-Ile-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FNXCAFKDGBROCU-STECZYCISA-N 0.000 description 1
- NIUDXSFNLBIWOB-DCAQKATOSA-N Arg-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NIUDXSFNLBIWOB-DCAQKATOSA-N 0.000 description 1
- WMEVEPXNCMKNGH-IHRRRGAJSA-N Arg-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N WMEVEPXNCMKNGH-IHRRRGAJSA-N 0.000 description 1
- JEOCWTUOMKEEMF-RHYQMDGZSA-N Arg-Leu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEOCWTUOMKEEMF-RHYQMDGZSA-N 0.000 description 1
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 1
- BNYNOWJESJJIOI-XUXIUFHCSA-N Arg-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N BNYNOWJESJJIOI-XUXIUFHCSA-N 0.000 description 1
- BTJVOUQWFXABOI-IHRRRGAJSA-N Arg-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCNC(N)=N BTJVOUQWFXABOI-IHRRRGAJSA-N 0.000 description 1
- MTYLORHAQXVQOW-AVGNSLFASA-N Arg-Lys-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O MTYLORHAQXVQOW-AVGNSLFASA-N 0.000 description 1
- QBQVKUNBCAFXSV-ULQDDVLXSA-N Arg-Lys-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QBQVKUNBCAFXSV-ULQDDVLXSA-N 0.000 description 1
- KSUALAGYYLQSHJ-RCWTZXSCSA-N Arg-Met-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KSUALAGYYLQSHJ-RCWTZXSCSA-N 0.000 description 1
- ZEBDYGZVMMKZNB-SRVKXCTJSA-N Arg-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCCN=C(N)N)N ZEBDYGZVMMKZNB-SRVKXCTJSA-N 0.000 description 1
- YTMKMRSYXHBGER-IHRRRGAJSA-N Arg-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YTMKMRSYXHBGER-IHRRRGAJSA-N 0.000 description 1
- VEAIMHJZTIDCIH-KKUMJFAQSA-N Arg-Phe-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VEAIMHJZTIDCIH-KKUMJFAQSA-N 0.000 description 1
- UGZUVYDKAYNCII-ULQDDVLXSA-N Arg-Phe-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UGZUVYDKAYNCII-ULQDDVLXSA-N 0.000 description 1
- RATVAFHGEFAWDH-JYJNAYRXSA-N Arg-Phe-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCCN=C(N)N)N RATVAFHGEFAWDH-JYJNAYRXSA-N 0.000 description 1
- SLQQPJBDBVPVQV-JYJNAYRXSA-N Arg-Phe-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O SLQQPJBDBVPVQV-JYJNAYRXSA-N 0.000 description 1
- WKPXXXUSUHAXDE-SRVKXCTJSA-N Arg-Pro-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O WKPXXXUSUHAXDE-SRVKXCTJSA-N 0.000 description 1
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 1
- YFHATWYGAAXQCF-JYJNAYRXSA-N Arg-Pro-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YFHATWYGAAXQCF-JYJNAYRXSA-N 0.000 description 1
- KMFPQTITXUKJOV-DCAQKATOSA-N Arg-Ser-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O KMFPQTITXUKJOV-DCAQKATOSA-N 0.000 description 1
- UZSQXCMNUPKLCC-FJXKBIBVSA-N Arg-Thr-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UZSQXCMNUPKLCC-FJXKBIBVSA-N 0.000 description 1
- DRDWXKWUSIKKOB-PJODQICGSA-N Arg-Trp-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O DRDWXKWUSIKKOB-PJODQICGSA-N 0.000 description 1
- POZKLUIXMHIULG-FDARSICLSA-N Arg-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCCN=C(N)N)N POZKLUIXMHIULG-FDARSICLSA-N 0.000 description 1
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 1
- NVPHRWNWTKYIST-BPNCWPANSA-N Arg-Tyr-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 NVPHRWNWTKYIST-BPNCWPANSA-N 0.000 description 1
- XMZZGVGKGXRIGJ-JYJNAYRXSA-N Arg-Tyr-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O XMZZGVGKGXRIGJ-JYJNAYRXSA-N 0.000 description 1
- FTMRPIVPSDVGCC-GUBZILKMSA-N Arg-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FTMRPIVPSDVGCC-GUBZILKMSA-N 0.000 description 1
- SUMJNGAMIQSNGX-TUAOUCFPSA-N Arg-Val-Pro Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N1CCC[C@@H]1C(O)=O SUMJNGAMIQSNGX-TUAOUCFPSA-N 0.000 description 1
- QLSRIZIDQXDQHK-RCWTZXSCSA-N Arg-Val-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QLSRIZIDQXDQHK-RCWTZXSCSA-N 0.000 description 1
- 241001638540 Arthroascus Species 0.000 description 1
- 241000186063 Arthrobacter Species 0.000 description 1
- 241001508785 Arxiozyma Species 0.000 description 1
- MEFGKQUUYZOLHM-GMOBBJLQSA-N Asn-Arg-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MEFGKQUUYZOLHM-GMOBBJLQSA-N 0.000 description 1
- NLCDVZJDEXIDDL-BIIVOSGPSA-N Asn-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N)C(=O)O NLCDVZJDEXIDDL-BIIVOSGPSA-N 0.000 description 1
- OGMDXNFGPOPZTK-GUBZILKMSA-N Asn-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N OGMDXNFGPOPZTK-GUBZILKMSA-N 0.000 description 1
- MSBDSTRUMZFSEU-PEFMBERDSA-N Asn-Glu-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MSBDSTRUMZFSEU-PEFMBERDSA-N 0.000 description 1
- ASCGFDYEKSRNPL-CIUDSAMLSA-N Asn-Glu-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O ASCGFDYEKSRNPL-CIUDSAMLSA-N 0.000 description 1
- HYQYLOSCICEYTR-YUMQZZPRSA-N Asn-Gly-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O HYQYLOSCICEYTR-YUMQZZPRSA-N 0.000 description 1
- NKLRWRRVYGQNIH-GHCJXIJMSA-N Asn-Ile-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O NKLRWRRVYGQNIH-GHCJXIJMSA-N 0.000 description 1
- SEKBHZJLARBNPB-GHCJXIJMSA-N Asn-Ile-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O SEKBHZJLARBNPB-GHCJXIJMSA-N 0.000 description 1
- IBLAOXSULLECQZ-IUKAMOBKSA-N Asn-Ile-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC(N)=O IBLAOXSULLECQZ-IUKAMOBKSA-N 0.000 description 1
- COWITDLVHMZSIW-CIUDSAMLSA-N Asn-Lys-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O COWITDLVHMZSIW-CIUDSAMLSA-N 0.000 description 1
- MDDXKBHIMYYJLW-FXQIFTODSA-N Asn-Met-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N MDDXKBHIMYYJLW-FXQIFTODSA-N 0.000 description 1
- KEUNWIXNKVWCFL-FXQIFTODSA-N Asn-Met-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O KEUNWIXNKVWCFL-FXQIFTODSA-N 0.000 description 1
- HZZIFFOVHLWGCS-KKUMJFAQSA-N Asn-Phe-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O HZZIFFOVHLWGCS-KKUMJFAQSA-N 0.000 description 1
- YRTOMUMWSTUQAX-FXQIFTODSA-N Asn-Pro-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O YRTOMUMWSTUQAX-FXQIFTODSA-N 0.000 description 1
- YUOXLJYVSZYPBJ-CIUDSAMLSA-N Asn-Pro-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O YUOXLJYVSZYPBJ-CIUDSAMLSA-N 0.000 description 1
- MYTHOBCLNIOFBL-SRVKXCTJSA-N Asn-Ser-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MYTHOBCLNIOFBL-SRVKXCTJSA-N 0.000 description 1
- WLVLIYYBPPONRJ-GCJQMDKQSA-N Asn-Thr-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O WLVLIYYBPPONRJ-GCJQMDKQSA-N 0.000 description 1
- HCZQKHSRYHCPSD-IUKAMOBKSA-N Asn-Thr-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HCZQKHSRYHCPSD-IUKAMOBKSA-N 0.000 description 1
- UXHYOWXTJLBEPG-GSSVUCPTSA-N Asn-Thr-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UXHYOWXTJLBEPG-GSSVUCPTSA-N 0.000 description 1
- JPPLRQVZMZFOSX-UWJYBYFXSA-N Asn-Tyr-Ala Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 JPPLRQVZMZFOSX-UWJYBYFXSA-N 0.000 description 1
- JZLFYAAGGYMRIK-BYULHYEWSA-N Asn-Val-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O JZLFYAAGGYMRIK-BYULHYEWSA-N 0.000 description 1
- AECPDLSSUMDUAA-ZKWXMUAHSA-N Asn-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N AECPDLSSUMDUAA-ZKWXMUAHSA-N 0.000 description 1
- CBHVAFXKOYAHOY-NHCYSSNCSA-N Asn-Val-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O CBHVAFXKOYAHOY-NHCYSSNCSA-N 0.000 description 1
- GHWWTICYPDKPTE-NGZCFLSTSA-N Asn-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N GHWWTICYPDKPTE-NGZCFLSTSA-N 0.000 description 1
- PBVLJOIPOGUQQP-CIUDSAMLSA-N Asp-Ala-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O PBVLJOIPOGUQQP-CIUDSAMLSA-N 0.000 description 1
- HMQDRBKQMLRCCG-GMOBBJLQSA-N Asp-Arg-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HMQDRBKQMLRCCG-GMOBBJLQSA-N 0.000 description 1
- XAJRHVUUVUPFQL-ACZMJKKPSA-N Asp-Glu-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XAJRHVUUVUPFQL-ACZMJKKPSA-N 0.000 description 1
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 1
- JUWZKMBALYLZCK-WHFBIAKZSA-N Asp-Gly-Asn Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O JUWZKMBALYLZCK-WHFBIAKZSA-N 0.000 description 1
- VIRHEUMYXXLCBF-WDSKDSINSA-N Asp-Gly-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O VIRHEUMYXXLCBF-WDSKDSINSA-N 0.000 description 1
- QCVXMEHGFUMKCO-YUMQZZPRSA-N Asp-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O QCVXMEHGFUMKCO-YUMQZZPRSA-N 0.000 description 1
- UBPMOJLRVMGTOQ-GARJFASQSA-N Asp-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC(=O)O)N)C(=O)O UBPMOJLRVMGTOQ-GARJFASQSA-N 0.000 description 1
- LDLZOAJRXXBVGF-GMOBBJLQSA-N Asp-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)O)N LDLZOAJRXXBVGF-GMOBBJLQSA-N 0.000 description 1
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 1
- HKEZZWQWXWGASX-KKUMJFAQSA-N Asp-Leu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 HKEZZWQWXWGASX-KKUMJFAQSA-N 0.000 description 1
- XWSIYTYNLKCLJB-CIUDSAMLSA-N Asp-Lys-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O XWSIYTYNLKCLJB-CIUDSAMLSA-N 0.000 description 1
- CTWCFPWFIGRAEP-CIUDSAMLSA-N Asp-Lys-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O CTWCFPWFIGRAEP-CIUDSAMLSA-N 0.000 description 1
- YVHGKXAOSVBGJV-CIUDSAMLSA-N Asp-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N YVHGKXAOSVBGJV-CIUDSAMLSA-N 0.000 description 1
- MYLZFUMPZCPJCJ-NHCYSSNCSA-N Asp-Lys-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MYLZFUMPZCPJCJ-NHCYSSNCSA-N 0.000 description 1
- VWWAFGHMPWBKEP-GMOBBJLQSA-N Asp-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC(=O)O)N VWWAFGHMPWBKEP-GMOBBJLQSA-N 0.000 description 1
- LIJXJYGRSRWLCJ-IHRRRGAJSA-N Asp-Phe-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LIJXJYGRSRWLCJ-IHRRRGAJSA-N 0.000 description 1
- YRZIYQGXTSBRLT-AVGNSLFASA-N Asp-Phe-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O YRZIYQGXTSBRLT-AVGNSLFASA-N 0.000 description 1
- KRQFMDNIUOVRIF-KKUMJFAQSA-N Asp-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)O)N KRQFMDNIUOVRIF-KKUMJFAQSA-N 0.000 description 1
- ZKAOJVJQGVUIIU-GUBZILKMSA-N Asp-Pro-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZKAOJVJQGVUIIU-GUBZILKMSA-N 0.000 description 1
- XXAMCEGRCZQGEM-ZLUOBGJFSA-N Asp-Ser-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O XXAMCEGRCZQGEM-ZLUOBGJFSA-N 0.000 description 1
- QOCFFCUFZGDHTP-NUMRIWBASA-N Asp-Thr-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QOCFFCUFZGDHTP-NUMRIWBASA-N 0.000 description 1
- UEFODXNXUAVPTC-VEVYYDQMSA-N Asp-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O UEFODXNXUAVPTC-VEVYYDQMSA-N 0.000 description 1
- XMKXONRMGJXCJV-LAEOZQHASA-N Asp-Val-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XMKXONRMGJXCJV-LAEOZQHASA-N 0.000 description 1
- 101710177204 Atrochrysone carboxyl ACP thioesterase Proteins 0.000 description 1
- QLRRUWXMMVXORS-UHFFFAOYSA-N Augustine Natural products C12=CC=3OCOC=3C=C2CN2C3CC(OC)C4OC4C31CC2 QLRRUWXMMVXORS-UHFFFAOYSA-N 0.000 description 1
- 241001446312 Austwickia chelonae Species 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 241000193365 Bacillus thuringiensis serovar israelensis Species 0.000 description 1
- 241000235114 Bensingtonia Species 0.000 description 1
- 241000235553 Blakeslea trispora Species 0.000 description 1
- 241000680806 Blastobotrys adeninivorans Species 0.000 description 1
- 241000178289 Botryozyma Species 0.000 description 1
- 241000589174 Bradyrhizobium japonicum Species 0.000 description 1
- 235000006463 Brassica alba Nutrition 0.000 description 1
- 244000140786 Brassica hirta Species 0.000 description 1
- 241000995051 Brenda Species 0.000 description 1
- 235000000287 Brettanomyces bruxellensis Nutrition 0.000 description 1
- 244000027711 Brettanomyces bruxellensis Species 0.000 description 1
- 241000235172 Bullera Species 0.000 description 1
- 241000033328 Bulleromyces Species 0.000 description 1
- 101100351811 Caenorhabditis elegans pgal-1 gene Proteins 0.000 description 1
- 235000006810 Caesalpinia ciliata Nutrition 0.000 description 1
- 241000059739 Caesalpinia ciliata Species 0.000 description 1
- 235000009025 Carya illinoensis Nutrition 0.000 description 1
- 244000068645 Carya illinoensis Species 0.000 description 1
- 240000001829 Catharanthus roseus Species 0.000 description 1
- 241000321369 Cephalopholis fulva Species 0.000 description 1
- 229930186147 Cephalosporin Natural products 0.000 description 1
- 241000282994 Cervidae Species 0.000 description 1
- 229920002101 Chitin Polymers 0.000 description 1
- 241000511343 Chondrostoma nasus Species 0.000 description 1
- 241000190831 Chromatium Species 0.000 description 1
- 241001508787 Citeromyces Species 0.000 description 1
- 241000207199 Citrus Species 0.000 description 1
- 240000002319 Citrus sinensis Species 0.000 description 1
- 235000005976 Citrus sinensis Nutrition 0.000 description 1
- 241000219930 Clarkia Species 0.000 description 1
- 241001508790 Clarkia breweri Species 0.000 description 1
- 241001508811 Clavispora Species 0.000 description 1
- 244000205754 Colocasia esculenta Species 0.000 description 1
- 235000006481 Colocasia esculenta Nutrition 0.000 description 1
- 241000186145 Corynebacterium ammoniagenes Species 0.000 description 1
- 241001135265 Cronobacter sakazakii Species 0.000 description 1
- 235000009849 Cucumis sativus Nutrition 0.000 description 1
- 240000008067 Cucumis sativus Species 0.000 description 1
- 240000001980 Cucurbita pepo Species 0.000 description 1
- 235000009852 Cucurbita pepo Nutrition 0.000 description 1
- 235000018453 Curcuma amada Nutrition 0.000 description 1
- 241001512940 Curcuma amada Species 0.000 description 1
- 241000235646 Cyberlindnera jadinii Species 0.000 description 1
- CVOZXIPULQQFNY-ZLUOBGJFSA-N Cys-Ala-Cys Chemical compound C[C@H](NC(=O)[C@@H](N)CS)C(=O)N[C@@H](CS)C(O)=O CVOZXIPULQQFNY-ZLUOBGJFSA-N 0.000 description 1
- YMBAVNPKBWHDAW-CIUDSAMLSA-N Cys-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N YMBAVNPKBWHDAW-CIUDSAMLSA-N 0.000 description 1
- XTHUKRLJRUVVBF-WHFBIAKZSA-N Cys-Gly-Ser Chemical compound SC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O XTHUKRLJRUVVBF-WHFBIAKZSA-N 0.000 description 1
- BNCKELUXXUYRNY-GUBZILKMSA-N Cys-Lys-Glu Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N BNCKELUXXUYRNY-GUBZILKMSA-N 0.000 description 1
- PGBLJHDDKCVSTC-CIUDSAMLSA-N Cys-Met-Gln Chemical compound CSCC[C@H](NC(=O)[C@@H](N)CS)C(=O)N[C@@H](CCC(N)=O)C(O)=O PGBLJHDDKCVSTC-CIUDSAMLSA-N 0.000 description 1
- UGPCUUWZXRMCIJ-KKUMJFAQSA-N Cys-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CS)N UGPCUUWZXRMCIJ-KKUMJFAQSA-N 0.000 description 1
- VRJZMZGGAKVSIQ-SRVKXCTJSA-N Cys-Tyr-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O VRJZMZGGAKVSIQ-SRVKXCTJSA-N 0.000 description 1
- 241000222039 Cystofilobasidium Species 0.000 description 1
- GUBGYTABKSRVRQ-CUHNMECISA-N D-Cellobiose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-CUHNMECISA-N 0.000 description 1
- MTCFGRXMJLQNBG-UWTATZPHSA-N D-Serine Chemical compound OC[C@@H](N)C(O)=O MTCFGRXMJLQNBG-UWTATZPHSA-N 0.000 description 1
- 229930195711 D-Serine Natural products 0.000 description 1
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 101150074155 DHFR gene Proteins 0.000 description 1
- 241000235035 Debaryomyces Species 0.000 description 1
- DORPKYRPJIIARM-UHFFFAOYSA-N Decaffeoylacteoside Natural products OC1C(O)C(O)C(C)OC1OC1C(O)C(OCCC=2C=C(O)C(O)=CC=2)OC(CO)C1O DORPKYRPJIIARM-UHFFFAOYSA-N 0.000 description 1
- 241001306278 Diaporthe amygdali Species 0.000 description 1
- 241001123630 Dipodascopsis Species 0.000 description 1
- 241001123635 Dipodascus Species 0.000 description 1
- 241000255601 Drosophila melanogaster Species 0.000 description 1
- 229930186291 Dulcoside Natural products 0.000 description 1
- CANAPGLEBDTCAF-QHSHOEHESA-N Dulcoside A Natural products C[C@@H]1O[C@H](O[C@@H]2[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]2O[C@]34CC[C@H]5[C@]6(C)CCC[C@](C)([C@H]6CC[C@@]5(CC3=C)C4)C(=O)O[C@@H]7O[C@H](CO)[C@@H](O)[C@H](O)[C@H]7O)[C@H](O)[C@H](O)[C@H]1O CANAPGLEBDTCAF-QHSHOEHESA-N 0.000 description 1
- CANAPGLEBDTCAF-NTIPNFSCSA-N Dulcoside A Chemical compound O[C@@H]1[C@H](O)[C@@H](O)[C@H](C)O[C@H]1O[C@H]1[C@H](O[C@]23C(C[C@]4(C2)[C@H]([C@@]2(C)[C@@H]([C@](CCC2)(C)C(=O)O[C@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O2)O)CC4)CC3)=C)O[C@H](CO)[C@@H](O)[C@@H]1O CANAPGLEBDTCAF-NTIPNFSCSA-N 0.000 description 1
- 241000435122 Echinopsis terscheckii Species 0.000 description 1
- 102100031780 Endonuclease Human genes 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 241000194033 Enterococcus Species 0.000 description 1
- 241000194031 Enterococcus faecium Species 0.000 description 1
- 241000235167 Eremascus Species 0.000 description 1
- 241000588698 Erwinia Species 0.000 description 1
- 241000222042 Erythrobasidium Species 0.000 description 1
- 241001646716 Escherichia coli K-12 Species 0.000 description 1
- 241000488157 Escherichia sp. Species 0.000 description 1
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 239000001512 FEMA 4601 Substances 0.000 description 1
- 239000001776 FEMA 4720 Substances 0.000 description 1
- 101710156207 Farnesyl diphosphate synthase Proteins 0.000 description 1
- 102100035111 Farnesyl pyrophosphate synthase Human genes 0.000 description 1
- 101710125754 Farnesyl pyrophosphate synthase Proteins 0.000 description 1
- 101710089428 Farnesyl pyrophosphate synthase erg20 Proteins 0.000 description 1
- 108010022535 Farnesyl-Diphosphate Farnesyltransferase Proteins 0.000 description 1
- 241000222840 Fellomyces Species 0.000 description 1
- 241000221207 Filobasidium Species 0.000 description 1
- 241000187808 Frankia sp. Species 0.000 description 1
- 229930091371 Fructose Natural products 0.000 description 1
- 239000005715 Fructose Substances 0.000 description 1
- RFSUNEUAIZKAJO-ARQDHWQXSA-N Fructose Chemical compound OC[C@H]1O[C@](O)(CO)[C@@H](O)[C@@H]1O RFSUNEUAIZKAJO-ARQDHWQXSA-N 0.000 description 1
- 241000233732 Fusarium verticillioides Species 0.000 description 1
- 241000605986 Fusobacterium nucleatum Species 0.000 description 1
- 241001291923 Fusobacterium nucleatum subsp. nucleatum Species 0.000 description 1
- 241000009790 Fusobacterium nucleatum subsp. vincentii Species 0.000 description 1
- 101150077230 GAL4 gene Proteins 0.000 description 1
- 101150103317 GAL80 gene Proteins 0.000 description 1
- 241001123633 Galactomyces Species 0.000 description 1
- 102100039556 Galectin-4 Human genes 0.000 description 1
- 241000159512 Geotrichum Species 0.000 description 1
- GVVPGTZRZFNKDS-YFHOEESVSA-N Geranyl diphosphate Natural products CC(C)=CCC\C(C)=C/COP(O)(=O)OP(O)(O)=O GVVPGTZRZFNKDS-YFHOEESVSA-N 0.000 description 1
- 108010066605 Geranylgeranyl-Diphosphate Geranylgeranyltransferase Proteins 0.000 description 1
- 101100297762 Gibberella zeae (strain ATCC MYA-4620 / CBS 123657 / FGSC 9075 / NRRL 31084 / PH-1) PKS12 gene Proteins 0.000 description 1
- REJJNXODKSHOKA-ACZMJKKPSA-N Gln-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N REJJNXODKSHOKA-ACZMJKKPSA-N 0.000 description 1
- KVYVOGYEMPEXBT-GUBZILKMSA-N Gln-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O KVYVOGYEMPEXBT-GUBZILKMSA-N 0.000 description 1
- NUMFTVCBONFQIQ-DRZSPHRISA-N Gln-Ala-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NUMFTVCBONFQIQ-DRZSPHRISA-N 0.000 description 1
- KWUSGAIFNHQCBY-DCAQKATOSA-N Gln-Arg-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O KWUSGAIFNHQCBY-DCAQKATOSA-N 0.000 description 1
- JFOKLAPFYCTNHW-SRVKXCTJSA-N Gln-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N JFOKLAPFYCTNHW-SRVKXCTJSA-N 0.000 description 1
- KJRXLVZYJJLUCV-DCAQKATOSA-N Gln-Arg-Met Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O KJRXLVZYJJLUCV-DCAQKATOSA-N 0.000 description 1
- CKNUKHBRCSMKMO-XHNCKOQMSA-N Gln-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O CKNUKHBRCSMKMO-XHNCKOQMSA-N 0.000 description 1
- BTSPOOHJBYJRKO-CIUDSAMLSA-N Gln-Asp-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BTSPOOHJBYJRKO-CIUDSAMLSA-N 0.000 description 1
- LFIVHGMKWFGUGK-IHRRRGAJSA-N Gln-Glu-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N LFIVHGMKWFGUGK-IHRRRGAJSA-N 0.000 description 1
- VOLVNCMGXWDDQY-LPEHRKFASA-N Gln-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O VOLVNCMGXWDDQY-LPEHRKFASA-N 0.000 description 1
- VGTDBGYFVWOQTI-RYUDHWBXSA-N Gln-Gly-Phe Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VGTDBGYFVWOQTI-RYUDHWBXSA-N 0.000 description 1
- KQOPMGBHNQBCEL-HVTMNAMFSA-N Gln-His-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KQOPMGBHNQBCEL-HVTMNAMFSA-N 0.000 description 1
- GQZDDFRXSDGUNG-YVNDNENWSA-N Gln-Ile-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O GQZDDFRXSDGUNG-YVNDNENWSA-N 0.000 description 1
- ITZWDGBYBPUZRG-KBIXCLLPSA-N Gln-Ile-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O ITZWDGBYBPUZRG-KBIXCLLPSA-N 0.000 description 1
- CAXXTYYGFYTBPV-IUCAKERBSA-N Gln-Leu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CAXXTYYGFYTBPV-IUCAKERBSA-N 0.000 description 1
- IULKWYSYZSURJK-AVGNSLFASA-N Gln-Leu-Lys Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O IULKWYSYZSURJK-AVGNSLFASA-N 0.000 description 1
- ZBKUIQNCRIYVGH-SDDRHHMPSA-N Gln-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZBKUIQNCRIYVGH-SDDRHHMPSA-N 0.000 description 1
- YPMDZWPZFOZYFG-GUBZILKMSA-N Gln-Leu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YPMDZWPZFOZYFG-GUBZILKMSA-N 0.000 description 1
- KSKFIECUYMYWNS-AVGNSLFASA-N Gln-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N KSKFIECUYMYWNS-AVGNSLFASA-N 0.000 description 1
- DQLVHRFFBQOWFL-JYJNAYRXSA-N Gln-Lys-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N)O DQLVHRFFBQOWFL-JYJNAYRXSA-N 0.000 description 1
- FALJZCPMTGJOHX-SRVKXCTJSA-N Gln-Met-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O FALJZCPMTGJOHX-SRVKXCTJSA-N 0.000 description 1
- XQDGOJPVMSWZSO-SRVKXCTJSA-N Gln-Pro-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N XQDGOJPVMSWZSO-SRVKXCTJSA-N 0.000 description 1
- OKARHJKJTKFQBM-ACZMJKKPSA-N Gln-Ser-Asn Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OKARHJKJTKFQBM-ACZMJKKPSA-N 0.000 description 1
- OTQSTOXRUBVWAP-NRPADANISA-N Gln-Ser-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OTQSTOXRUBVWAP-NRPADANISA-N 0.000 description 1
- YMCPEHDGTRUOHO-SXNHZJKMSA-N Gln-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCC(=O)N)N YMCPEHDGTRUOHO-SXNHZJKMSA-N 0.000 description 1
- VYOILACOFPPNQH-UMNHJUIQSA-N Gln-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N VYOILACOFPPNQH-UMNHJUIQSA-N 0.000 description 1
- WZZSKAJIHTUUSG-ACZMJKKPSA-N Glu-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O WZZSKAJIHTUUSG-ACZMJKKPSA-N 0.000 description 1
- JJKKWYQVHRUSDG-GUBZILKMSA-N Glu-Ala-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O JJKKWYQVHRUSDG-GUBZILKMSA-N 0.000 description 1
- KKCUFHUTMKQQCF-SRVKXCTJSA-N Glu-Arg-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O KKCUFHUTMKQQCF-SRVKXCTJSA-N 0.000 description 1
- VPKBCVUDBNINAH-GARJFASQSA-N Glu-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O VPKBCVUDBNINAH-GARJFASQSA-N 0.000 description 1
- ZOXBSICWUDAOHX-GUBZILKMSA-N Glu-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O ZOXBSICWUDAOHX-GUBZILKMSA-N 0.000 description 1
- RJONUNZIMUXUOI-GUBZILKMSA-N Glu-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N RJONUNZIMUXUOI-GUBZILKMSA-N 0.000 description 1
- VAZZOGXDUQSVQF-NUMRIWBASA-N Glu-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)O VAZZOGXDUQSVQF-NUMRIWBASA-N 0.000 description 1
- VAIWPXWHWAPYDF-FXQIFTODSA-N Glu-Asp-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O VAIWPXWHWAPYDF-FXQIFTODSA-N 0.000 description 1
- IESFZVCAVACGPH-PEFMBERDSA-N Glu-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O IESFZVCAVACGPH-PEFMBERDSA-N 0.000 description 1
- PBFGQTGPSKWHJA-QEJZJMRPSA-N Glu-Asp-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O PBFGQTGPSKWHJA-QEJZJMRPSA-N 0.000 description 1
- XHUCVVHRLNPZSZ-CIUDSAMLSA-N Glu-Gln-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XHUCVVHRLNPZSZ-CIUDSAMLSA-N 0.000 description 1
- QQLBPVKLJBAXBS-FXQIFTODSA-N Glu-Glu-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QQLBPVKLJBAXBS-FXQIFTODSA-N 0.000 description 1
- HNVFSTLPVJWIDV-CIUDSAMLSA-N Glu-Glu-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HNVFSTLPVJWIDV-CIUDSAMLSA-N 0.000 description 1
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 1
- AIGROOHQXCACHL-WDSKDSINSA-N Glu-Gly-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O AIGROOHQXCACHL-WDSKDSINSA-N 0.000 description 1
- JGHNIWVNCAOVRO-DCAQKATOSA-N Glu-His-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JGHNIWVNCAOVRO-DCAQKATOSA-N 0.000 description 1
- DVLZZEPUNFEUBW-AVGNSLFASA-N Glu-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N DVLZZEPUNFEUBW-AVGNSLFASA-N 0.000 description 1
- ZCOJVESMNGBGLF-GRLWGSQLSA-N Glu-Ile-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZCOJVESMNGBGLF-GRLWGSQLSA-N 0.000 description 1
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 1
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 1
- WNRZUESNGGDCJX-JYJNAYRXSA-N Glu-Leu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WNRZUESNGGDCJX-JYJNAYRXSA-N 0.000 description 1
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 1
- MFNUFCFRAZPJFW-JYJNAYRXSA-N Glu-Lys-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MFNUFCFRAZPJFW-JYJNAYRXSA-N 0.000 description 1
- RXESHTOTINOODU-JYJNAYRXSA-N Glu-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)O)N RXESHTOTINOODU-JYJNAYRXSA-N 0.000 description 1
- QNJNPKSWAHPYGI-JYJNAYRXSA-N Glu-Phe-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=CC=C1 QNJNPKSWAHPYGI-JYJNAYRXSA-N 0.000 description 1
- JYXKPJVDCAWMDG-ZPFDUUQYSA-N Glu-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)O)N JYXKPJVDCAWMDG-ZPFDUUQYSA-N 0.000 description 1
- SYWCGQOIIARSIX-SRVKXCTJSA-N Glu-Pro-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O SYWCGQOIIARSIX-SRVKXCTJSA-N 0.000 description 1
- DAHLWSFUXOHMIA-FXQIFTODSA-N Glu-Ser-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O DAHLWSFUXOHMIA-FXQIFTODSA-N 0.000 description 1
- GMVCSRBOSIUTFC-FXQIFTODSA-N Glu-Ser-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMVCSRBOSIUTFC-FXQIFTODSA-N 0.000 description 1
- HMJULNMJWOZNFI-XHNCKOQMSA-N Glu-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N)C(=O)O HMJULNMJWOZNFI-XHNCKOQMSA-N 0.000 description 1
- WXONSNSSBYQGNN-AVGNSLFASA-N Glu-Ser-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O WXONSNSSBYQGNN-AVGNSLFASA-N 0.000 description 1
- DMYACXMQUABZIQ-NRPADANISA-N Glu-Ser-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O DMYACXMQUABZIQ-NRPADANISA-N 0.000 description 1
- RGJKYNUINKGPJN-RWRJDSDZSA-N Glu-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(=O)O)N RGJKYNUINKGPJN-RWRJDSDZSA-N 0.000 description 1
- CQGBSALYGOXQPE-HTUGSXCWSA-N Glu-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O CQGBSALYGOXQPE-HTUGSXCWSA-N 0.000 description 1
- VHPVBPCCWVDGJL-IRIUXVKKSA-N Glu-Thr-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VHPVBPCCWVDGJL-IRIUXVKKSA-N 0.000 description 1
- HJTSRYLPAYGEEC-SIUGBPQLSA-N Glu-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)O)N HJTSRYLPAYGEEC-SIUGBPQLSA-N 0.000 description 1
- KIEICAOUSNYOLM-NRPADANISA-N Glu-Val-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KIEICAOUSNYOLM-NRPADANISA-N 0.000 description 1
- RMWAOBGCZZSJHE-UMNHJUIQSA-N Glu-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N RMWAOBGCZZSJHE-UMNHJUIQSA-N 0.000 description 1
- WGYHAAXZWPEBDQ-IFFSRLJSSA-N Glu-Val-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGYHAAXZWPEBDQ-IFFSRLJSSA-N 0.000 description 1
- 241001121139 Gluconobacter oxydans 621H Species 0.000 description 1
- 239000004366 Glucose oxidase Substances 0.000 description 1
- 108010015776 Glucose oxidase Proteins 0.000 description 1
- BRFJMRSRMOMIMU-WHFBIAKZSA-N Gly-Ala-Asn Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O BRFJMRSRMOMIMU-WHFBIAKZSA-N 0.000 description 1
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 1
- QSDKBRMVXSWAQE-BFHQHQDPSA-N Gly-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN QSDKBRMVXSWAQE-BFHQHQDPSA-N 0.000 description 1
- UPOJUWHGMDJUQZ-IUCAKERBSA-N Gly-Arg-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UPOJUWHGMDJUQZ-IUCAKERBSA-N 0.000 description 1
- CLODWIOAKCSBAN-BQBZGAKWSA-N Gly-Arg-Asp Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O CLODWIOAKCSBAN-BQBZGAKWSA-N 0.000 description 1
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 1
- KRRMJKMGWWXWDW-STQMWFEESA-N Gly-Arg-Phe Chemical compound NC(=N)NCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KRRMJKMGWWXWDW-STQMWFEESA-N 0.000 description 1
- JVWPPCWUDRJGAE-YUMQZZPRSA-N Gly-Asn-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JVWPPCWUDRJGAE-YUMQZZPRSA-N 0.000 description 1
- JPWIMMUNWUKOAD-STQMWFEESA-N Gly-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN JPWIMMUNWUKOAD-STQMWFEESA-N 0.000 description 1
- QGZSAHIZRQHCEQ-QWRGUYRKSA-N Gly-Asp-Tyr Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QGZSAHIZRQHCEQ-QWRGUYRKSA-N 0.000 description 1
- YDWZGVCXMVLDQH-WHFBIAKZSA-N Gly-Cys-Asn Chemical compound NCC(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC(N)=O YDWZGVCXMVLDQH-WHFBIAKZSA-N 0.000 description 1
- BYYNJRSNDARRBX-YFKPBYRVSA-N Gly-Gln-Gly Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O BYYNJRSNDARRBX-YFKPBYRVSA-N 0.000 description 1
- JLJLBWDKDRYOPA-RYUDHWBXSA-N Gly-Gln-Tyr Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 JLJLBWDKDRYOPA-RYUDHWBXSA-N 0.000 description 1
- INLIXXRWNUKVCF-JTQLQIEISA-N Gly-Gly-Tyr Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 INLIXXRWNUKVCF-JTQLQIEISA-N 0.000 description 1
- ORXZVPZCPMKHNR-IUCAKERBSA-N Gly-His-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CNC=N1 ORXZVPZCPMKHNR-IUCAKERBSA-N 0.000 description 1
- ADZGCWWDPFDHCY-ZETCQYMHSA-N Gly-His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 ADZGCWWDPFDHCY-ZETCQYMHSA-N 0.000 description 1
- SWQALSGKVLYKDT-ZKWXMUAHSA-N Gly-Ile-Ala Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SWQALSGKVLYKDT-ZKWXMUAHSA-N 0.000 description 1
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 1
- HMHRTKOWRUPPNU-RCOVLWMOSA-N Gly-Ile-Gly Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O HMHRTKOWRUPPNU-RCOVLWMOSA-N 0.000 description 1
- BHPQOIPBLYJNAW-NGZCFLSTSA-N Gly-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN BHPQOIPBLYJNAW-NGZCFLSTSA-N 0.000 description 1
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 1
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 1
- LOEANKRDMMVOGZ-YUMQZZPRSA-N Gly-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O LOEANKRDMMVOGZ-YUMQZZPRSA-N 0.000 description 1
- GMTXWRIDLGTVFC-IUCAKERBSA-N Gly-Lys-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMTXWRIDLGTVFC-IUCAKERBSA-N 0.000 description 1
- IEGFSKKANYKBDU-QWHCGFSZSA-N Gly-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)CN)C(=O)O IEGFSKKANYKBDU-QWHCGFSZSA-N 0.000 description 1
- SSFWXSNOKDZNHY-QXEWZRGKSA-N Gly-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN SSFWXSNOKDZNHY-QXEWZRGKSA-N 0.000 description 1
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 1
- FGPLUIQCSKGLTI-WDSKDSINSA-N Gly-Ser-Glu Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O FGPLUIQCSKGLTI-WDSKDSINSA-N 0.000 description 1
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 1
- FKESCSGWBPUTPN-FOHZUACHSA-N Gly-Thr-Asn Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O FKESCSGWBPUTPN-FOHZUACHSA-N 0.000 description 1
- KBBFOULZCHWGJX-KBPBESRZSA-N Gly-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)CN)O KBBFOULZCHWGJX-KBPBESRZSA-N 0.000 description 1
- OCRQUYDOYKCOQG-IRXDYDNUSA-N Gly-Tyr-Phe Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 OCRQUYDOYKCOQG-IRXDYDNUSA-N 0.000 description 1
- SYOJVRNQCXYEOV-XVKPBYJWSA-N Gly-Val-Glu Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SYOJVRNQCXYEOV-XVKPBYJWSA-N 0.000 description 1
- YGHSQRJSHKYUJY-SCZZXKLOSA-N Gly-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN YGHSQRJSHKYUJY-SCZZXKLOSA-N 0.000 description 1
- AFMOTCMSEBITOE-YEPSODPASA-N Gly-Val-Thr Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AFMOTCMSEBITOE-YEPSODPASA-N 0.000 description 1
- 229920002527 Glycogen Polymers 0.000 description 1
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 1
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 1
- 101150009006 HIS3 gene Proteins 0.000 description 1
- 241000606790 Haemophilus Species 0.000 description 1
- 241001074968 Halobacteria Species 0.000 description 1
- 241000205062 Halobacterium Species 0.000 description 1
- 241000204942 Halobacterium sp. Species 0.000 description 1
- 241001236294 Hebe Species 0.000 description 1
- 235000003222 Helianthus annuus Nutrition 0.000 description 1
- 244000020551 Helianthus annuus Species 0.000 description 1
- SQUHHTBVTRBESD-UHFFFAOYSA-N Hexa-Ac-myo-Inositol Natural products CC(=O)OC1C(OC(C)=O)C(OC(C)=O)C(OC(C)=O)C(OC(C)=O)C1OC(C)=O SQUHHTBVTRBESD-UHFFFAOYSA-N 0.000 description 1
- MBSSHYPAEHPSGY-LSJOCFKGSA-N His-Ala-Met Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O MBSSHYPAEHPSGY-LSJOCFKGSA-N 0.000 description 1
- HDXNWVLQSQFJOX-SRVKXCTJSA-N His-Arg-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HDXNWVLQSQFJOX-SRVKXCTJSA-N 0.000 description 1
- PQKCQZHAGILVIM-NKIYYHGXSA-N His-Glu-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)Cc1cnc[nH]1)C(O)=O PQKCQZHAGILVIM-NKIYYHGXSA-N 0.000 description 1
- IWXMHXYOACDSIA-PYJNHQTQSA-N His-Ile-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O IWXMHXYOACDSIA-PYJNHQTQSA-N 0.000 description 1
- VYUXYMRNGALHEA-DLOVCJGASA-N His-Leu-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O VYUXYMRNGALHEA-DLOVCJGASA-N 0.000 description 1
- YAALVYQFVJNXIV-KKUMJFAQSA-N His-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 YAALVYQFVJNXIV-KKUMJFAQSA-N 0.000 description 1
- SKOKHBGDXGTDDP-MELADBBJSA-N His-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N SKOKHBGDXGTDDP-MELADBBJSA-N 0.000 description 1
- UXSATKFPUVZVDK-KKUMJFAQSA-N His-Lys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CN=CN1)N UXSATKFPUVZVDK-KKUMJFAQSA-N 0.000 description 1
- GIRSNERMXCMDBO-GARJFASQSA-N His-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O GIRSNERMXCMDBO-GARJFASQSA-N 0.000 description 1
- YSMZBYPVVYSGOT-SZMVWBNQSA-N His-Trp-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC3=CN=CN3)N YSMZBYPVVYSGOT-SZMVWBNQSA-N 0.000 description 1
- CKONPJHGMIDMJP-IHRRRGAJSA-N His-Val-His Chemical compound C([C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 CKONPJHGMIDMJP-IHRRRGAJSA-N 0.000 description 1
- FFYYUUWROYYKFY-IHRRRGAJSA-N His-Val-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O FFYYUUWROYYKFY-IHRRRGAJSA-N 0.000 description 1
- 241001236629 Holtermannia Species 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000608765 Homo sapiens Galectin-4 Proteins 0.000 description 1
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- GRRNUXAQVGOGFE-UHFFFAOYSA-N Hygromycin-B Natural products OC1C(NC)CC(N)C(O)C1OC1C2OC3(C(C(O)C(O)C(C(N)CO)O3)O)OC2C(O)C(CO)O1 GRRNUXAQVGOGFE-UHFFFAOYSA-N 0.000 description 1
- 241000376403 Hyphopichia Species 0.000 description 1
- NKVZTQVGUNLLQW-JBDRJPRFSA-N Ile-Ala-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)O)N NKVZTQVGUNLLQW-JBDRJPRFSA-N 0.000 description 1
- CISBRYJZMFWOHJ-JBDRJPRFSA-N Ile-Ala-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(=O)O)N CISBRYJZMFWOHJ-JBDRJPRFSA-N 0.000 description 1
- QICVAHODWHIWIS-HTFCKZLJSA-N Ile-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N QICVAHODWHIWIS-HTFCKZLJSA-N 0.000 description 1
- HDOYNXLPTRQLAD-JBDRJPRFSA-N Ile-Ala-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)O)N HDOYNXLPTRQLAD-JBDRJPRFSA-N 0.000 description 1
- BOTVMTSMOUSDRW-GMOBBJLQSA-N Ile-Arg-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O BOTVMTSMOUSDRW-GMOBBJLQSA-N 0.000 description 1
- CWJQMCPYXNVMBS-STECZYCISA-N Ile-Arg-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N CWJQMCPYXNVMBS-STECZYCISA-N 0.000 description 1
- SCHZQZPYHBWYEQ-PEFMBERDSA-N Ile-Asn-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SCHZQZPYHBWYEQ-PEFMBERDSA-N 0.000 description 1
- NBJAAWYRLGCJOF-UGYAYLCHSA-N Ile-Asp-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NBJAAWYRLGCJOF-UGYAYLCHSA-N 0.000 description 1
- DCQMJRSOGCYKTR-GHCJXIJMSA-N Ile-Asp-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O DCQMJRSOGCYKTR-GHCJXIJMSA-N 0.000 description 1
- AQTWDZDISVGCAC-CFMVVWHZSA-N Ile-Asp-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N AQTWDZDISVGCAC-CFMVVWHZSA-N 0.000 description 1
- KMBPQYKVZBMRMH-PEFMBERDSA-N Ile-Gln-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O KMBPQYKVZBMRMH-PEFMBERDSA-N 0.000 description 1
- LJKDGRWXYUTRSH-YVNDNENWSA-N Ile-Gln-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N LJKDGRWXYUTRSH-YVNDNENWSA-N 0.000 description 1
- BEWFWZRGBDVXRP-PEFMBERDSA-N Ile-Glu-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O BEWFWZRGBDVXRP-PEFMBERDSA-N 0.000 description 1
- PNDMHTTXXPUQJH-RWRJDSDZSA-N Ile-Glu-Thr Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@H](O)C)C(=O)O PNDMHTTXXPUQJH-RWRJDSDZSA-N 0.000 description 1
- NHJKZMDIMMTVCK-QXEWZRGKSA-N Ile-Gly-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N NHJKZMDIMMTVCK-QXEWZRGKSA-N 0.000 description 1
- SLQVFYWBGNNOTK-BYULHYEWSA-N Ile-Gly-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N SLQVFYWBGNNOTK-BYULHYEWSA-N 0.000 description 1
- KFVUBLZRFSVDGO-BYULHYEWSA-N Ile-Gly-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O KFVUBLZRFSVDGO-BYULHYEWSA-N 0.000 description 1
- AREBLHSMLMRICD-PYJNHQTQSA-N Ile-His-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N AREBLHSMLMRICD-PYJNHQTQSA-N 0.000 description 1
- KYLIZSDYWQQTFM-PEDHHIEDSA-N Ile-Ile-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N KYLIZSDYWQQTFM-PEDHHIEDSA-N 0.000 description 1
- SVBAHOMTJRFSIC-SXTJYALSSA-N Ile-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SVBAHOMTJRFSIC-SXTJYALSSA-N 0.000 description 1
- MTONDYJJCIBZTK-PEDHHIEDSA-N Ile-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(=O)O)N MTONDYJJCIBZTK-PEDHHIEDSA-N 0.000 description 1
- QZZIBQZLWBOOJH-PEDHHIEDSA-N Ile-Ile-Val Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(=O)O QZZIBQZLWBOOJH-PEDHHIEDSA-N 0.000 description 1
- UIEZQYNXCYHMQS-BJDJZHNGSA-N Ile-Lys-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)O)N UIEZQYNXCYHMQS-BJDJZHNGSA-N 0.000 description 1
- WVUDHMBJNBWZBU-XUXIUFHCSA-N Ile-Lys-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)O)N WVUDHMBJNBWZBU-XUXIUFHCSA-N 0.000 description 1
- GLYJPWIRLBAIJH-FQUUOJAGSA-N Ile-Lys-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N GLYJPWIRLBAIJH-FQUUOJAGSA-N 0.000 description 1
- AKOYRLRUFBZOSP-BJDJZHNGSA-N Ile-Lys-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N AKOYRLRUFBZOSP-BJDJZHNGSA-N 0.000 description 1
- CKRFDMPBSWYOBT-PPCPHDFISA-N Ile-Lys-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N CKRFDMPBSWYOBT-PPCPHDFISA-N 0.000 description 1
- SAVXZJYTTQQQDD-QEWYBTABSA-N Ile-Phe-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SAVXZJYTTQQQDD-QEWYBTABSA-N 0.000 description 1
- XQLGNKLSPYCRMZ-HJWJTTGWSA-N Ile-Phe-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(=O)O)N XQLGNKLSPYCRMZ-HJWJTTGWSA-N 0.000 description 1
- IITVUURPOYGCTD-NAKRPEOUSA-N Ile-Pro-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IITVUURPOYGCTD-NAKRPEOUSA-N 0.000 description 1
- IVXJIMGDOYRLQU-XUXIUFHCSA-N Ile-Pro-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O IVXJIMGDOYRLQU-XUXIUFHCSA-N 0.000 description 1
- AGGIYSLVUKVOPT-HTFCKZLJSA-N Ile-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N AGGIYSLVUKVOPT-HTFCKZLJSA-N 0.000 description 1
- VGSPNSSCMOHRRR-BJDJZHNGSA-N Ile-Ser-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N VGSPNSSCMOHRRR-BJDJZHNGSA-N 0.000 description 1
- QQVXERGIFIRCGW-NAKRPEOUSA-N Ile-Ser-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)O)N QQVXERGIFIRCGW-NAKRPEOUSA-N 0.000 description 1
- RQJUKVXWAKJDBW-SVSWQMSJSA-N Ile-Ser-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N RQJUKVXWAKJDBW-SVSWQMSJSA-N 0.000 description 1
- COWHUQXTSYTKQC-RWRJDSDZSA-N Ile-Thr-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N COWHUQXTSYTKQC-RWRJDSDZSA-N 0.000 description 1
- DTPGSUQHUMELQB-GVARAGBVSA-N Ile-Tyr-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 DTPGSUQHUMELQB-GVARAGBVSA-N 0.000 description 1
- WRDTXMBPHMBGIB-STECZYCISA-N Ile-Tyr-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=C(O)C=C1 WRDTXMBPHMBGIB-STECZYCISA-N 0.000 description 1
- UYODHPPSCXBNCS-XUXIUFHCSA-N Ile-Val-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C UYODHPPSCXBNCS-XUXIUFHCSA-N 0.000 description 1
- RQZFWBLDTBDEOF-RNJOBUHISA-N Ile-Val-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N RQZFWBLDTBDEOF-RNJOBUHISA-N 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- JUZNIMUFDBIJCM-ANEDZVCMSA-N Invanz Chemical compound O=C([C@H]1NC[C@H](C1)SC=1[C@H](C)[C@@H]2[C@H](C(N2C=1C(O)=O)=O)[C@H](O)C)NC1=CC=CC(C(O)=O)=C1 JUZNIMUFDBIJCM-ANEDZVCMSA-N 0.000 description 1
- 241001473007 Ips pini Species 0.000 description 1
- 102100027665 Isopentenyl-diphosphate Delta-isomerase 1 Human genes 0.000 description 1
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 1
- 241000235644 Issatchenkia Species 0.000 description 1
- 241000204082 Kitasatospora griseola Species 0.000 description 1
- 241000588748 Klebsiella Species 0.000 description 1
- 201000008225 Klebsiella pneumonia Diseases 0.000 description 1
- 241000588747 Klebsiella pneumoniae Species 0.000 description 1
- 244000285963 Kluyveromyces fragilis Species 0.000 description 1
- 235000014663 Kluyveromyces fragilis Nutrition 0.000 description 1
- 241000235058 Komagataella pastoris Species 0.000 description 1
- 241001489120 Kondoa Species 0.000 description 1
- 241001304304 Kuraishia Species 0.000 description 1
- 241000222661 Kurtzmanomyces Species 0.000 description 1
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- 101150044775 LYS1 gene Proteins 0.000 description 1
- 241000481961 Lachancea thermotolerans Species 0.000 description 1
- 241001582342 Lactobacillus sakei subsp. sakei Species 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- 241000589902 Leptospira Species 0.000 description 1
- 241000178946 Leptospira interrogans serovar Copenhageni Species 0.000 description 1
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 1
- KWTVLKBOQATPHJ-SRVKXCTJSA-N Leu-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N KWTVLKBOQATPHJ-SRVKXCTJSA-N 0.000 description 1
- HBJZFCIVFIBNSV-DCAQKATOSA-N Leu-Arg-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O HBJZFCIVFIBNSV-DCAQKATOSA-N 0.000 description 1
- QUAAUWNLWMLERT-IHRRRGAJSA-N Leu-Arg-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O QUAAUWNLWMLERT-IHRRRGAJSA-N 0.000 description 1
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 1
- XYUBOFCTGPZFSA-WDSOQIARSA-N Leu-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 XYUBOFCTGPZFSA-WDSOQIARSA-N 0.000 description 1
- CUXRXAIAVYLVFD-ULQDDVLXSA-N Leu-Arg-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CUXRXAIAVYLVFD-ULQDDVLXSA-N 0.000 description 1
- OGCQGUIWMSBHRZ-CIUDSAMLSA-N Leu-Asn-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OGCQGUIWMSBHRZ-CIUDSAMLSA-N 0.000 description 1
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 1
- DLFAACQHIRSQGG-CIUDSAMLSA-N Leu-Asp-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DLFAACQHIRSQGG-CIUDSAMLSA-N 0.000 description 1
- FGNQZXKVAZIMCI-CIUDSAMLSA-N Leu-Asp-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N FGNQZXKVAZIMCI-CIUDSAMLSA-N 0.000 description 1
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 1
- LOLUPZNNADDTAA-AVGNSLFASA-N Leu-Gln-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LOLUPZNNADDTAA-AVGNSLFASA-N 0.000 description 1
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 1
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 1
- APFJUBGRZGMQFF-QWRGUYRKSA-N Leu-Gly-Lys Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN APFJUBGRZGMQFF-QWRGUYRKSA-N 0.000 description 1
- KXODZBLFVFSLAI-AVGNSLFASA-N Leu-His-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CN=CN1 KXODZBLFVFSLAI-AVGNSLFASA-N 0.000 description 1
- AUBMZAMQCOYSIC-MNXVOIDGSA-N Leu-Ile-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O AUBMZAMQCOYSIC-MNXVOIDGSA-N 0.000 description 1
- KUIDCYNIEJBZBU-AJNGGQMLSA-N Leu-Ile-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O KUIDCYNIEJBZBU-AJNGGQMLSA-N 0.000 description 1
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 1
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 1
- FOBUGKUBUJOWAD-IHPCNDPISA-N Leu-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 FOBUGKUBUJOWAD-IHPCNDPISA-N 0.000 description 1
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 1
- JLWZLIQRYCTYBD-IHRRRGAJSA-N Leu-Lys-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JLWZLIQRYCTYBD-IHRRRGAJSA-N 0.000 description 1
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 1
- FKQPWMZLIIATBA-AJNGGQMLSA-N Leu-Lys-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FKQPWMZLIIATBA-AJNGGQMLSA-N 0.000 description 1
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 1
- FIICHHJDINDXKG-IHPCNDPISA-N Leu-Lys-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O FIICHHJDINDXKG-IHPCNDPISA-N 0.000 description 1
- CPONGMJGVIAWEH-DCAQKATOSA-N Leu-Met-Ala Chemical compound CSCC[C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](C)C(O)=O CPONGMJGVIAWEH-DCAQKATOSA-N 0.000 description 1
- HDHQQEDVWQGBEE-DCAQKATOSA-N Leu-Met-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O HDHQQEDVWQGBEE-DCAQKATOSA-N 0.000 description 1
- GCXGCIYIHXSKAY-ULQDDVLXSA-N Leu-Phe-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GCXGCIYIHXSKAY-ULQDDVLXSA-N 0.000 description 1
- SYRTUBLKWNDSDK-DKIMLUQUSA-N Leu-Phe-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYRTUBLKWNDSDK-DKIMLUQUSA-N 0.000 description 1
- WXDRGWBQZIMJDE-ULQDDVLXSA-N Leu-Phe-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O WXDRGWBQZIMJDE-ULQDDVLXSA-N 0.000 description 1
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 1
- UCXQIIIFOOGYEM-ULQDDVLXSA-N Leu-Pro-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UCXQIIIFOOGYEM-ULQDDVLXSA-N 0.000 description 1
- JDBQSGMJBMPNFT-AVGNSLFASA-N Leu-Pro-Val Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O JDBQSGMJBMPNFT-AVGNSLFASA-N 0.000 description 1
- KZZCOWMDDXDKSS-CIUDSAMLSA-N Leu-Ser-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KZZCOWMDDXDKSS-CIUDSAMLSA-N 0.000 description 1
- AKVBOOKXVAMKSS-GUBZILKMSA-N Leu-Ser-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O AKVBOOKXVAMKSS-GUBZILKMSA-N 0.000 description 1
- HWMQRQIFVGEAPH-XIRDDKMYSA-N Leu-Ser-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 HWMQRQIFVGEAPH-XIRDDKMYSA-N 0.000 description 1
- SVBJIZVVYJYGLA-DCAQKATOSA-N Leu-Ser-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O SVBJIZVVYJYGLA-DCAQKATOSA-N 0.000 description 1
- ICYRCNICGBJLGM-HJGDQZAQSA-N Leu-Thr-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O ICYRCNICGBJLGM-HJGDQZAQSA-N 0.000 description 1
- LJBVRCDPWOJOEK-PPCPHDFISA-N Leu-Thr-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LJBVRCDPWOJOEK-PPCPHDFISA-N 0.000 description 1
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 1
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 1
- GZRABTMNWJXFMH-UVOCVTCTSA-N Leu-Thr-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZRABTMNWJXFMH-UVOCVTCTSA-N 0.000 description 1
- UCRJTSIIAYHOHE-ULQDDVLXSA-N Leu-Tyr-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UCRJTSIIAYHOHE-ULQDDVLXSA-N 0.000 description 1
- WUHBLPVELFTPQK-KKUMJFAQSA-N Leu-Tyr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O WUHBLPVELFTPQK-KKUMJFAQSA-N 0.000 description 1
- VHTIZYYHIUHMCA-JYJNAYRXSA-N Leu-Tyr-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VHTIZYYHIUHMCA-JYJNAYRXSA-N 0.000 description 1
- AXVIGSRGTMNSJU-YESZJQIVSA-N Leu-Tyr-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N AXVIGSRGTMNSJU-YESZJQIVSA-N 0.000 description 1
- VQHUBNVKFFLWRP-ULQDDVLXSA-N Leu-Tyr-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=C(O)C=C1 VQHUBNVKFFLWRP-ULQDDVLXSA-N 0.000 description 1
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 1
- 241000221479 Leucosporidium Species 0.000 description 1
- WHXSMMKQMYFTQS-UHFFFAOYSA-N Lithium Chemical compound [Li] WHXSMMKQMYFTQS-UHFFFAOYSA-N 0.000 description 1
- 241001508815 Lodderomyces Species 0.000 description 1
- 241000219745 Lupinus Species 0.000 description 1
- 235000010649 Lupinus albus Nutrition 0.000 description 1
- 240000000894 Lupinus albus Species 0.000 description 1
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 1
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 1
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 1
- CLBGMWIYPYAZPR-AVGNSLFASA-N Lys-Arg-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O CLBGMWIYPYAZPR-AVGNSLFASA-N 0.000 description 1
- NTEVEUCLFMWSND-SRVKXCTJSA-N Lys-Arg-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O NTEVEUCLFMWSND-SRVKXCTJSA-N 0.000 description 1
- SJNZALDHDUYDBU-IHRRRGAJSA-N Lys-Arg-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(O)=O SJNZALDHDUYDBU-IHRRRGAJSA-N 0.000 description 1
- NLOZZWJNIKKYSC-WDSOQIARSA-N Lys-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCCCN)C(O)=O)=CNC2=C1 NLOZZWJNIKKYSC-WDSOQIARSA-N 0.000 description 1
- GGAPIOORBXHMNY-ULQDDVLXSA-N Lys-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)O GGAPIOORBXHMNY-ULQDDVLXSA-N 0.000 description 1
- 108010062166 Lys-Asn-Asp Proteins 0.000 description 1
- HGZHSNBZDOLMLH-DCAQKATOSA-N Lys-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N HGZHSNBZDOLMLH-DCAQKATOSA-N 0.000 description 1
- LZWNAOIMTLNMDW-NHCYSSNCSA-N Lys-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N LZWNAOIMTLNMDW-NHCYSSNCSA-N 0.000 description 1
- WGCKDDHUFPQSMZ-ZPFDUUQYSA-N Lys-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCCN WGCKDDHUFPQSMZ-ZPFDUUQYSA-N 0.000 description 1
- YFGWNAROEYWGNL-GUBZILKMSA-N Lys-Gln-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YFGWNAROEYWGNL-GUBZILKMSA-N 0.000 description 1
- YVMQJGWLHRWMDF-MNXVOIDGSA-N Lys-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N YVMQJGWLHRWMDF-MNXVOIDGSA-N 0.000 description 1
- QFGVDCBPDGLVTA-SZMVWBNQSA-N Lys-Gln-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCCN)C(O)=O)=CNC2=C1 QFGVDCBPDGLVTA-SZMVWBNQSA-N 0.000 description 1
- PBIPLDMFHAICIP-DCAQKATOSA-N Lys-Glu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PBIPLDMFHAICIP-DCAQKATOSA-N 0.000 description 1
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 1
- KNKJPYAZQUFLQK-IHRRRGAJSA-N Lys-His-Arg Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCCCN)N KNKJPYAZQUFLQK-IHRRRGAJSA-N 0.000 description 1
- KEPWSUPUFAPBRF-DKIMLUQUSA-N Lys-Ile-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KEPWSUPUFAPBRF-DKIMLUQUSA-N 0.000 description 1
- MUXNCRWTWBMNHX-SRVKXCTJSA-N Lys-Leu-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O MUXNCRWTWBMNHX-SRVKXCTJSA-N 0.000 description 1
- ONPDTSFZAIWMDI-AVGNSLFASA-N Lys-Leu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ONPDTSFZAIWMDI-AVGNSLFASA-N 0.000 description 1
- QKXZCUCBFPEXNK-KKUMJFAQSA-N Lys-Leu-His Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 QKXZCUCBFPEXNK-KKUMJFAQSA-N 0.000 description 1
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 1
- YPLVCBKEPJPBDQ-MELADBBJSA-N Lys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N YPLVCBKEPJPBDQ-MELADBBJSA-N 0.000 description 1
- WRODMZBHNNPRLN-SRVKXCTJSA-N Lys-Leu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O WRODMZBHNNPRLN-SRVKXCTJSA-N 0.000 description 1
- OIQSIMFSVLLWBX-VOAKCMCISA-N Lys-Leu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OIQSIMFSVLLWBX-VOAKCMCISA-N 0.000 description 1
- LJADEBULDNKJNK-IHRRRGAJSA-N Lys-Leu-Val Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LJADEBULDNKJNK-IHRRRGAJSA-N 0.000 description 1
- JQSIGLHQNSZZRL-KKUMJFAQSA-N Lys-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N JQSIGLHQNSZZRL-KKUMJFAQSA-N 0.000 description 1
- ATNKHRAIZCMCCN-BZSNNMDCSA-N Lys-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N ATNKHRAIZCMCCN-BZSNNMDCSA-N 0.000 description 1
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 1
- SQXZLVXQXWILKW-KKUMJFAQSA-N Lys-Ser-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQXZLVXQXWILKW-KKUMJFAQSA-N 0.000 description 1
- ZJSXCIMWLPSTMG-HSCHXYMDSA-N Lys-Trp-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZJSXCIMWLPSTMG-HSCHXYMDSA-N 0.000 description 1
- SUZVLFWOCKHWET-CQDKDKBSSA-N Lys-Tyr-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O SUZVLFWOCKHWET-CQDKDKBSSA-N 0.000 description 1
- RMKJOQSYLQQRFN-KKUMJFAQSA-N Lys-Tyr-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O RMKJOQSYLQQRFN-KKUMJFAQSA-N 0.000 description 1
- SQRLLZAQNOQCEG-KKUMJFAQSA-N Lys-Tyr-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 SQRLLZAQNOQCEG-KKUMJFAQSA-N 0.000 description 1
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 1
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 1
- 101150068888 MET3 gene Proteins 0.000 description 1
- 241000555676 Malassezia Species 0.000 description 1
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 241000219823 Medicago Species 0.000 description 1
- 241001599018 Melanogaster Species 0.000 description 1
- 235000004357 Mentha x piperita Nutrition 0.000 description 1
- 241001479543 Mentha x piperita Species 0.000 description 1
- 241000970829 Mesorhizobium Species 0.000 description 1
- 241000589195 Mesorhizobium loti Species 0.000 description 1
- CWFYZYQMUDWGTI-GUBZILKMSA-N Met-Arg-Asp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O CWFYZYQMUDWGTI-GUBZILKMSA-N 0.000 description 1
- IIPHCNKHEZYSNE-DCAQKATOSA-N Met-Arg-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O IIPHCNKHEZYSNE-DCAQKATOSA-N 0.000 description 1
- SBSIKVMCCJUCBZ-GUBZILKMSA-N Met-Asn-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N SBSIKVMCCJUCBZ-GUBZILKMSA-N 0.000 description 1
- FRWZTWWOORIIBA-FXQIFTODSA-N Met-Asn-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N FRWZTWWOORIIBA-FXQIFTODSA-N 0.000 description 1
- DRXODWRPPUFIAY-DCAQKATOSA-N Met-Asn-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN DRXODWRPPUFIAY-DCAQKATOSA-N 0.000 description 1
- CAODKDAPYGUMLK-FXQIFTODSA-N Met-Asn-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CAODKDAPYGUMLK-FXQIFTODSA-N 0.000 description 1
- UZVWDRPUTHXQAM-FXQIFTODSA-N Met-Asp-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O UZVWDRPUTHXQAM-FXQIFTODSA-N 0.000 description 1
- ZMYHJISLFYTQGK-FXQIFTODSA-N Met-Asp-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZMYHJISLFYTQGK-FXQIFTODSA-N 0.000 description 1
- XMMWDTUFTZMQFD-GMOBBJLQSA-N Met-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCSC XMMWDTUFTZMQFD-GMOBBJLQSA-N 0.000 description 1
- OSOLWRWQADPDIQ-DCAQKATOSA-N Met-Asp-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OSOLWRWQADPDIQ-DCAQKATOSA-N 0.000 description 1
- XOMXAVJBLRROMC-IHRRRGAJSA-N Met-Asp-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XOMXAVJBLRROMC-IHRRRGAJSA-N 0.000 description 1
- MCNGIXXCMJAURZ-VEVYYDQMSA-N Met-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCSC)N)O MCNGIXXCMJAURZ-VEVYYDQMSA-N 0.000 description 1
- FVKRQMQQFGBXHV-QXEWZRGKSA-N Met-Asp-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O FVKRQMQQFGBXHV-QXEWZRGKSA-N 0.000 description 1
- HLQWFLJOJRFXHO-CIUDSAMLSA-N Met-Glu-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O HLQWFLJOJRFXHO-CIUDSAMLSA-N 0.000 description 1
- FTQOFRPGLYXRFM-CYDGBPFRSA-N Met-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCSC)N FTQOFRPGLYXRFM-CYDGBPFRSA-N 0.000 description 1
- SODXFJOPSCXOHE-IHRRRGAJSA-N Met-Leu-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O SODXFJOPSCXOHE-IHRRRGAJSA-N 0.000 description 1
- JCMMNFZUKMMECJ-DCAQKATOSA-N Met-Lys-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O JCMMNFZUKMMECJ-DCAQKATOSA-N 0.000 description 1
- YYEIFXZOBZVDPH-DCAQKATOSA-N Met-Lys-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O YYEIFXZOBZVDPH-DCAQKATOSA-N 0.000 description 1
- HAQLBBVZAGMESV-IHRRRGAJSA-N Met-Lys-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O HAQLBBVZAGMESV-IHRRRGAJSA-N 0.000 description 1
- CGUYGMFQZCYJSG-DCAQKATOSA-N Met-Lys-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O CGUYGMFQZCYJSG-DCAQKATOSA-N 0.000 description 1
- YLDSJJOGQNEQJK-AVGNSLFASA-N Met-Pro-Leu Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O YLDSJJOGQNEQJK-AVGNSLFASA-N 0.000 description 1
- RMLLCGYYVZKKRT-CIUDSAMLSA-N Met-Ser-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O RMLLCGYYVZKKRT-CIUDSAMLSA-N 0.000 description 1
- DSZFTPCSFVWMKP-DCAQKATOSA-N Met-Ser-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN DSZFTPCSFVWMKP-DCAQKATOSA-N 0.000 description 1
- SPSSJSICDYYTQN-HJGDQZAQSA-N Met-Thr-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(N)=O SPSSJSICDYYTQN-HJGDQZAQSA-N 0.000 description 1
- XTSBLBXAUIBMLW-KKUMJFAQSA-N Met-Tyr-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N XTSBLBXAUIBMLW-KKUMJFAQSA-N 0.000 description 1
- LIIXIZKVWNYQHB-STECZYCISA-N Met-Tyr-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LIIXIZKVWNYQHB-STECZYCISA-N 0.000 description 1
- CNFMPVYIVQUJOO-NHCYSSNCSA-N Met-Val-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(N)=O CNFMPVYIVQUJOO-NHCYSSNCSA-N 0.000 description 1
- IIHMNTBFPMRJCN-RCWTZXSCSA-N Met-Val-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IIHMNTBFPMRJCN-RCWTZXSCSA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 241000202974 Methanobacterium Species 0.000 description 1
- 241000203407 Methanocaldococcus jannaschii Species 0.000 description 1
- 241000203353 Methanococcus Species 0.000 description 1
- 241001302042 Methanothermobacter thermautotrophicus Species 0.000 description 1
- 241000589323 Methylobacterium Species 0.000 description 1
- 241001123674 Metschnikowia Species 0.000 description 1
- 241000235048 Meyerozyma guilliermondii Species 0.000 description 1
- 241001467578 Microbacterium Species 0.000 description 1
- 241000192041 Micrococcus Species 0.000 description 1
- 241000191938 Micrococcus luteus Species 0.000 description 1
- 241000606344 Mitrella <gastropod> Species 0.000 description 1
- 241001149967 Mrakia Species 0.000 description 1
- 241001149947 Mucor circinelloides f. lusitanicus Species 0.000 description 1
- 241000699660 Mus musculus Species 0.000 description 1
- 101100278853 Mus musculus Dhfr gene Proteins 0.000 description 1
- 101100533725 Mus musculus Smr3a gene Proteins 0.000 description 1
- 241000187492 Mycobacterium marinum Species 0.000 description 1
- 241000187917 Mycobacterium ulcerans Species 0.000 description 1
- 241000529863 Myxozyma Species 0.000 description 1
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 1
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 1
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 1
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 1
- 241000193596 Nadsonia Species 0.000 description 1
- 241001099335 Nakazawaea Species 0.000 description 1
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 1
- 241000588653 Neisseria Species 0.000 description 1
- 241000588652 Neisseria gonorrhoeae Species 0.000 description 1
- 241000233892 Neocallimastix Species 0.000 description 1
- 241000221961 Neurospora crassa Species 0.000 description 1
- 101100392389 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) al-3 gene Proteins 0.000 description 1
- 101100022915 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) cys-11 gene Proteins 0.000 description 1
- 101100068676 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) gln-1 gene Proteins 0.000 description 1
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 1
- GRYLNZFGIOXLOG-UHFFFAOYSA-N Nitric acid Chemical compound O[N+]([O-])=O GRYLNZFGIOXLOG-UHFFFAOYSA-N 0.000 description 1
- 241001503696 Nocardia brasiliensis Species 0.000 description 1
- 241000203622 Nocardiopsis Species 0.000 description 1
- 241000203619 Nocardiopsis dassonvillei Species 0.000 description 1
- 108091005461 Nucleic proteins Chemical group 0.000 description 1
- 244000018764 Nyssa sylvatica Species 0.000 description 1
- 235000003339 Nyssa sylvatica Nutrition 0.000 description 1
- 208000008589 Obesity Diseases 0.000 description 1
- 241001112159 Ogataea Species 0.000 description 1
- 241000159576 Oosporidium Species 0.000 description 1
- 241001502335 Orpinomyces Species 0.000 description 1
- BPQQTUXANYXVAA-UHFFFAOYSA-N Orthosilicate Chemical compound [O-][Si]([O-])([O-])[O-] BPQQTUXANYXVAA-UHFFFAOYSA-N 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 241000235652 Pachysolen Species 0.000 description 1
- 241000588912 Pantoea agglomerans Species 0.000 description 1
- 241000588696 Pantoea ananatis Species 0.000 description 1
- 241000589597 Paracoccus denitrificans Species 0.000 description 1
- 241001117114 Paracoccus zeaxanthinifaciens Species 0.000 description 1
- 241001495453 Parthenium argentatum Species 0.000 description 1
- 229930182555 Penicillin Natural products 0.000 description 1
- 239000001888 Peptone Substances 0.000 description 1
- 108010080698 Peptones Proteins 0.000 description 1
- 241001557897 Phaeosphaeria sp. Species 0.000 description 1
- 241001542817 Phaffia Species 0.000 description 1
- MDHZEOMXGNBSIL-DLOVCJGASA-N Phe-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N MDHZEOMXGNBSIL-DLOVCJGASA-N 0.000 description 1
- AJOKKVTWEMXZHC-DRZSPHRISA-N Phe-Ala-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 AJOKKVTWEMXZHC-DRZSPHRISA-N 0.000 description 1
- YRKFKTQRVBJYLT-CQDKDKBSSA-N Phe-Ala-His Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=CC=C1 YRKFKTQRVBJYLT-CQDKDKBSSA-N 0.000 description 1
- LZDIENNKWVXJMX-JYJNAYRXSA-N Phe-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC1=CC=CC=C1 LZDIENNKWVXJMX-JYJNAYRXSA-N 0.000 description 1
- AGYXCMYVTBYGCT-ULQDDVLXSA-N Phe-Arg-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O AGYXCMYVTBYGCT-ULQDDVLXSA-N 0.000 description 1
- YYRCPTVAPLQRNC-ULQDDVLXSA-N Phe-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CC1=CC=CC=C1 YYRCPTVAPLQRNC-ULQDDVLXSA-N 0.000 description 1
- CDNPIRSCAFMMBE-SRVKXCTJSA-N Phe-Asn-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CDNPIRSCAFMMBE-SRVKXCTJSA-N 0.000 description 1
- CSYVXYQDIVCQNU-QWRGUYRKSA-N Phe-Asp-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O CSYVXYQDIVCQNU-QWRGUYRKSA-N 0.000 description 1
- OPEVYHFJXLCCRT-AVGNSLFASA-N Phe-Gln-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O OPEVYHFJXLCCRT-AVGNSLFASA-N 0.000 description 1
- MFQXSDWKUXTOPZ-DZKIICNBSA-N Phe-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N MFQXSDWKUXTOPZ-DZKIICNBSA-N 0.000 description 1
- PSKRILMFHNIUAO-JYJNAYRXSA-N Phe-Glu-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N PSKRILMFHNIUAO-JYJNAYRXSA-N 0.000 description 1
- OYQBFWWQSVIHBN-FHWLQOOXSA-N Phe-Glu-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O OYQBFWWQSVIHBN-FHWLQOOXSA-N 0.000 description 1
- APJPXSFJBMMOLW-KBPBESRZSA-N Phe-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 APJPXSFJBMMOLW-KBPBESRZSA-N 0.000 description 1
- YZJKNDCEPDDIDA-BZSNNMDCSA-N Phe-His-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CN=CN1 YZJKNDCEPDDIDA-BZSNNMDCSA-N 0.000 description 1
- BWTKUQPNOMMKMA-FIRPJDEBSA-N Phe-Ile-Phe Chemical compound C([C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 BWTKUQPNOMMKMA-FIRPJDEBSA-N 0.000 description 1
- ONORAGIFHNAADN-LLLHUVSDSA-N Phe-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N ONORAGIFHNAADN-LLLHUVSDSA-N 0.000 description 1
- YKUGPVXSDOOANW-KKUMJFAQSA-N Phe-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YKUGPVXSDOOANW-KKUMJFAQSA-N 0.000 description 1
- LRBSWBVUCLLRLU-BZSNNMDCSA-N Phe-Leu-Lys Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)Cc1ccccc1)C(=O)N[C@@H](CCCCN)C(O)=O LRBSWBVUCLLRLU-BZSNNMDCSA-N 0.000 description 1
- YCCUXNNKXDGMAM-KKUMJFAQSA-N Phe-Leu-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YCCUXNNKXDGMAM-KKUMJFAQSA-N 0.000 description 1
- FENSZYFJQOFSQR-FIRPJDEBSA-N Phe-Phe-Ile Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FENSZYFJQOFSQR-FIRPJDEBSA-N 0.000 description 1
- RBRNEFJTEHPDSL-ACRUOGEOSA-N Phe-Phe-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 RBRNEFJTEHPDSL-ACRUOGEOSA-N 0.000 description 1
- WKLMCMXFMQEKCX-SLFFLAALSA-N Phe-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O WKLMCMXFMQEKCX-SLFFLAALSA-N 0.000 description 1
- GRVMHFCZUIYNKQ-UFYCRDLUSA-N Phe-Phe-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O GRVMHFCZUIYNKQ-UFYCRDLUSA-N 0.000 description 1
- WWPAHTZOWURIMR-ULQDDVLXSA-N Phe-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 WWPAHTZOWURIMR-ULQDDVLXSA-N 0.000 description 1
- JXQVYPWVGUOIDV-MXAVVETBSA-N Phe-Ser-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JXQVYPWVGUOIDV-MXAVVETBSA-N 0.000 description 1
- APECKGGXAXNFLL-RNXOBYDBSA-N Phe-Trp-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 APECKGGXAXNFLL-RNXOBYDBSA-N 0.000 description 1
- XALFIVXGQUEGKV-JSGCOSHPSA-N Phe-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 XALFIVXGQUEGKV-JSGCOSHPSA-N 0.000 description 1
- RGMLUHANLDVMPB-ULQDDVLXSA-N Phe-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N RGMLUHANLDVMPB-ULQDDVLXSA-N 0.000 description 1
- XBCOOBCTVMMQSC-BVSLBCMMSA-N Phe-Val-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 XBCOOBCTVMMQSC-BVSLBCMMSA-N 0.000 description 1
- 241000192608 Phormidium Species 0.000 description 1
- 241000195887 Physcomitrella patens Species 0.000 description 1
- 240000000020 Picea glauca Species 0.000 description 1
- 235000008127 Picea glauca Nutrition 0.000 description 1
- 241001470703 Picrorhiza kurrooa Species 0.000 description 1
- 241000235379 Piromyces Species 0.000 description 1
- 241000908471 Pirum Species 0.000 description 1
- 240000005428 Pistacia lentiscus Species 0.000 description 1
- 241000694540 Pluvialis Species 0.000 description 1
- 206010035717 Pneumonia klebsiella Diseases 0.000 description 1
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 1
- KIZQGKLMXKGDIV-BQBZGAKWSA-N Pro-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 KIZQGKLMXKGDIV-BQBZGAKWSA-N 0.000 description 1
- LNLNHXIQPGKRJQ-SRVKXCTJSA-N Pro-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H]1CCCN1 LNLNHXIQPGKRJQ-SRVKXCTJSA-N 0.000 description 1
- OCSACVPBMIYNJE-GUBZILKMSA-N Pro-Arg-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O OCSACVPBMIYNJE-GUBZILKMSA-N 0.000 description 1
- MTHRMUXESFIAMS-DCAQKATOSA-N Pro-Asn-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O MTHRMUXESFIAMS-DCAQKATOSA-N 0.000 description 1
- YFNOUBWUIIJQHF-LPEHRKFASA-N Pro-Asp-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O YFNOUBWUIIJQHF-LPEHRKFASA-N 0.000 description 1
- PULPZRAHVFBVTO-DCAQKATOSA-N Pro-Glu-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PULPZRAHVFBVTO-DCAQKATOSA-N 0.000 description 1
- LNOWDSPAYBWJOR-PEDHHIEDSA-N Pro-Ile-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LNOWDSPAYBWJOR-PEDHHIEDSA-N 0.000 description 1
- RYJRPPUATSKNAY-STECZYCISA-N Pro-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@@H]2CCCN2 RYJRPPUATSKNAY-STECZYCISA-N 0.000 description 1
- FMLRRBDLBJLJIK-DCAQKATOSA-N Pro-Leu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FMLRRBDLBJLJIK-DCAQKATOSA-N 0.000 description 1
- YXHYJEPDKSYPSQ-AVGNSLFASA-N Pro-Leu-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 YXHYJEPDKSYPSQ-AVGNSLFASA-N 0.000 description 1
- GURGCNUWVSDYTP-SRVKXCTJSA-N Pro-Leu-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GURGCNUWVSDYTP-SRVKXCTJSA-N 0.000 description 1
- FXGIMYRVJJEIIM-UWVGGRQHSA-N Pro-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FXGIMYRVJJEIIM-UWVGGRQHSA-N 0.000 description 1
- FYPGHGXAOZTOBO-IHRRRGAJSA-N Pro-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2 FYPGHGXAOZTOBO-IHRRRGAJSA-N 0.000 description 1
- MCWHYUWXVNRXFV-RWMBFGLXSA-N Pro-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 MCWHYUWXVNRXFV-RWMBFGLXSA-N 0.000 description 1
- SUENWIFTSTWUKD-AVGNSLFASA-N Pro-Leu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SUENWIFTSTWUKD-AVGNSLFASA-N 0.000 description 1
- RMODQFBNDDENCP-IHRRRGAJSA-N Pro-Lys-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O RMODQFBNDDENCP-IHRRRGAJSA-N 0.000 description 1
- BGWKULMLUIUPKY-BQBZGAKWSA-N Pro-Ser-Gly Chemical compound OC(=O)CNC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BGWKULMLUIUPKY-BQBZGAKWSA-N 0.000 description 1
- UGDMQJSXSSZUKL-IHRRRGAJSA-N Pro-Ser-Tyr Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O UGDMQJSXSSZUKL-IHRRRGAJSA-N 0.000 description 1
- PRKWBYCXBBSLSK-GUBZILKMSA-N Pro-Ser-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O PRKWBYCXBBSLSK-GUBZILKMSA-N 0.000 description 1
- IURWWZYKYPEANQ-HJGDQZAQSA-N Pro-Thr-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O IURWWZYKYPEANQ-HJGDQZAQSA-N 0.000 description 1
- AIOWVDNPESPXRB-YTWAJWBKSA-N Pro-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2)O AIOWVDNPESPXRB-YTWAJWBKSA-N 0.000 description 1
- VDHGTOHMHHQSKG-JYJNAYRXSA-N Pro-Val-Phe Chemical compound CC(C)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O VDHGTOHMHHQSKG-JYJNAYRXSA-N 0.000 description 1
- FIODMZKLZFLYQP-GUBZILKMSA-N Pro-Val-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FIODMZKLZFLYQP-GUBZILKMSA-N 0.000 description 1
- WQUURFHRUAZQHU-VGWMRTNUSA-N Pro-Val-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 WQUURFHRUAZQHU-VGWMRTNUSA-N 0.000 description 1
- 101710150389 Probable farnesyl diphosphate synthase Proteins 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 241000589517 Pseudomonas aeruginosa Species 0.000 description 1
- 241001453299 Pseudomonas mevalonii Species 0.000 description 1
- 101100132333 Pseudomonas mevalonii mvaA gene Proteins 0.000 description 1
- 241000432378 Pseudomonas pudica Species 0.000 description 1
- 241000205160 Pyrococcus Species 0.000 description 1
- 241001148023 Pyrococcus abyssi Species 0.000 description 1
- 241000522615 Pyrococcus horikoshii Species 0.000 description 1
- 235000014443 Pyrus communis Nutrition 0.000 description 1
- 241000589771 Ralstonia solanacearum Species 0.000 description 1
- 244000097202 Rathbunia alamosensis Species 0.000 description 1
- 235000009776 Rathbunia alamosensis Nutrition 0.000 description 1
- 241000700157 Rattus norvegicus Species 0.000 description 1
- 101100149716 Rattus norvegicus Vcsa1 gene Proteins 0.000 description 1
- HELXLJCILKEWJH-SEAGSNCFSA-N Rebaudioside A Natural products O=C(O[C@H]1[C@@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1)[C@@]1(C)[C@@H]2[C@](C)([C@H]3[C@@]4(CC(=C)[C@@](O[C@H]5[C@H](O[C@H]6[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O6)[C@@H](O[C@H]6[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O6)[C@H](O)[C@@H](CO)O5)(C4)CC3)CC2)CCC1 HELXLJCILKEWJH-SEAGSNCFSA-N 0.000 description 1
- RLLCWNUIHGPAJY-RYBZXKSASA-N Rebaudioside E Natural products O=C(O[C@H]1[C@H](O[C@H]2[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O2)[C@@H](O)[C@@H](O)[C@H](CO)O1)[C@]1(C)[C@@H]2[C@@](C)([C@@H]3[C@@]4(CC(=C)[C@@](O[C@@H]5[C@@H](O[C@@H]6[C@@H](O)[C@H](O)[C@@H](O)[C@H](CO)O6)[C@H](O)[C@@H](O)[C@H](CO)O5)(C4)CC3)CC2)CCC1 RLLCWNUIHGPAJY-RYBZXKSASA-N 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 108091007187 Reductases Proteins 0.000 description 1
- 241000191023 Rhodobacter capsulatus Species 0.000 description 1
- 241000191043 Rhodobacter sphaeroides Species 0.000 description 1
- 241000190932 Rhodopseudomonas Species 0.000 description 1
- 101100394989 Rhodopseudomonas palustris (strain ATCC BAA-98 / CGA009) hisI gene Proteins 0.000 description 1
- 241000190967 Rhodospirillum Species 0.000 description 1
- 241000190984 Rhodospirillum rubrum Species 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 101100286750 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) ILV2 gene Proteins 0.000 description 1
- 101100386089 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) MET17 gene Proteins 0.000 description 1
- 241000582914 Saccharomyces uvarum Species 0.000 description 1
- 241001489223 Saccharomycodes Species 0.000 description 1
- 241000222838 Saitoella Species 0.000 description 1
- 241001514651 Sakaguchia Species 0.000 description 1
- 241001138501 Salmonella enterica Species 0.000 description 1
- 241000293871 Salmonella enterica subsp. enterica serovar Typhi Species 0.000 description 1
- 241001149673 Saturnispora Species 0.000 description 1
- 241000159586 Schizoblastosporion Species 0.000 description 1
- 241000235346 Schizosaccharomyces Species 0.000 description 1
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 1
- 101100022918 Schizosaccharomyces pombe (strain 972 / ATCC 24843) sua1 gene Proteins 0.000 description 1
- 241000311088 Schwanniomyces Species 0.000 description 1
- BUGBHKTXTAQXES-UHFFFAOYSA-N Selenium Chemical compound [Se] BUGBHKTXTAQXES-UHFFFAOYSA-N 0.000 description 1
- DWUIECHTAMYEFL-XVYDVKMFSA-N Ser-Ala-His Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 DWUIECHTAMYEFL-XVYDVKMFSA-N 0.000 description 1
- HBZBPFLJNDXRAY-FXQIFTODSA-N Ser-Ala-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O HBZBPFLJNDXRAY-FXQIFTODSA-N 0.000 description 1
- YUSRGTQIPCJNHQ-CIUDSAMLSA-N Ser-Arg-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O YUSRGTQIPCJNHQ-CIUDSAMLSA-N 0.000 description 1
- QFBNNYNWKYKVJO-DCAQKATOSA-N Ser-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N QFBNNYNWKYKVJO-DCAQKATOSA-N 0.000 description 1
- COAHUSQNSVFYBW-FXQIFTODSA-N Ser-Asn-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O COAHUSQNSVFYBW-FXQIFTODSA-N 0.000 description 1
- RDFQNDHEHVSONI-ZLUOBGJFSA-N Ser-Asn-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDFQNDHEHVSONI-ZLUOBGJFSA-N 0.000 description 1
- MESDJCNHLZBMEP-ZLUOBGJFSA-N Ser-Asp-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MESDJCNHLZBMEP-ZLUOBGJFSA-N 0.000 description 1
- QPFJSHSJFIYDJZ-GHCJXIJMSA-N Ser-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO QPFJSHSJFIYDJZ-GHCJXIJMSA-N 0.000 description 1
- MMAPOBOTRUVNKJ-ZLUOBGJFSA-N Ser-Asp-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CO)N)C(=O)O MMAPOBOTRUVNKJ-ZLUOBGJFSA-N 0.000 description 1
- BTPAWKABYQMKKN-LKXGYXEUSA-N Ser-Asp-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BTPAWKABYQMKKN-LKXGYXEUSA-N 0.000 description 1
- IXUGADGDCQDLSA-FXQIFTODSA-N Ser-Gln-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N IXUGADGDCQDLSA-FXQIFTODSA-N 0.000 description 1
- XWCYBVBLJRWOFR-WDSKDSINSA-N Ser-Gln-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O XWCYBVBLJRWOFR-WDSKDSINSA-N 0.000 description 1
- OJPHFSOMBZKQKQ-GUBZILKMSA-N Ser-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CO OJPHFSOMBZKQKQ-GUBZILKMSA-N 0.000 description 1
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 1
- QKQDTEYDEIJPNK-GUBZILKMSA-N Ser-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CO QKQDTEYDEIJPNK-GUBZILKMSA-N 0.000 description 1
- GZBKRJVCRMZAST-XKBZYTNZSA-N Ser-Glu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZBKRJVCRMZAST-XKBZYTNZSA-N 0.000 description 1
- OHKFXGKHSJKKAL-NRPADANISA-N Ser-Glu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OHKFXGKHSJKKAL-NRPADANISA-N 0.000 description 1
- CXBFHZLODKPIJY-AAEUAGOBSA-N Ser-Gly-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N CXBFHZLODKPIJY-AAEUAGOBSA-N 0.000 description 1
- FYUIFUJFNCLUIX-XVYDVKMFSA-N Ser-His-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O FYUIFUJFNCLUIX-XVYDVKMFSA-N 0.000 description 1
- BEAFYHFQTOTVFS-VGDYDELISA-N Ser-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N BEAFYHFQTOTVFS-VGDYDELISA-N 0.000 description 1
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 1
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 1
- XXNYYSXNXCJYKX-DCAQKATOSA-N Ser-Leu-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O XXNYYSXNXCJYKX-DCAQKATOSA-N 0.000 description 1
- JWOBLHJRDADHLN-KKUMJFAQSA-N Ser-Leu-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JWOBLHJRDADHLN-KKUMJFAQSA-N 0.000 description 1
- IXZHZUGGKLRHJD-DCAQKATOSA-N Ser-Leu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IXZHZUGGKLRHJD-DCAQKATOSA-N 0.000 description 1
- GZSZPKSBVAOGIE-CIUDSAMLSA-N Ser-Lys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O GZSZPKSBVAOGIE-CIUDSAMLSA-N 0.000 description 1
- WGDYNRCOQRERLZ-KKUMJFAQSA-N Ser-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N WGDYNRCOQRERLZ-KKUMJFAQSA-N 0.000 description 1
- ZGFRMNZZTOVBOU-CIUDSAMLSA-N Ser-Met-Gln Chemical compound N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)O ZGFRMNZZTOVBOU-CIUDSAMLSA-N 0.000 description 1
- RXSWQCATLWVDLI-XGEHTFHBSA-N Ser-Met-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RXSWQCATLWVDLI-XGEHTFHBSA-N 0.000 description 1
- KZPRPBLHYMZIMH-MXAVVETBSA-N Ser-Phe-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KZPRPBLHYMZIMH-MXAVVETBSA-N 0.000 description 1
- MQUZANJDFOQOBX-SRVKXCTJSA-N Ser-Phe-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O MQUZANJDFOQOBX-SRVKXCTJSA-N 0.000 description 1
- ADJDNJCSPNFFPI-FXQIFTODSA-N Ser-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO ADJDNJCSPNFFPI-FXQIFTODSA-N 0.000 description 1
- CKDXFSPMIDSMGV-GUBZILKMSA-N Ser-Pro-Val Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O CKDXFSPMIDSMGV-GUBZILKMSA-N 0.000 description 1
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 1
- PPCZVWHJWJFTFN-ZLUOBGJFSA-N Ser-Ser-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPCZVWHJWJFTFN-ZLUOBGJFSA-N 0.000 description 1
- JCLAFVNDBJMLBC-JBDRJPRFSA-N Ser-Ser-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JCLAFVNDBJMLBC-JBDRJPRFSA-N 0.000 description 1
- OZPDGESCTGGNAD-CIUDSAMLSA-N Ser-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CO OZPDGESCTGGNAD-CIUDSAMLSA-N 0.000 description 1
- CUXJENOFJXOSOZ-BIIVOSGPSA-N Ser-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CO)N)C(=O)O CUXJENOFJXOSOZ-BIIVOSGPSA-N 0.000 description 1
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 1
- JURQXQBJKUHGJS-UHFFFAOYSA-N Ser-Ser-Ser-Ser Chemical compound OCC(N)C(=O)NC(CO)C(=O)NC(CO)C(=O)NC(CO)C(O)=O JURQXQBJKUHGJS-UHFFFAOYSA-N 0.000 description 1
- XJDMUQCLVSCRSJ-VZFHVOOUSA-N Ser-Thr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O XJDMUQCLVSCRSJ-VZFHVOOUSA-N 0.000 description 1
- RXUOAOOZIWABBW-XGEHTFHBSA-N Ser-Thr-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RXUOAOOZIWABBW-XGEHTFHBSA-N 0.000 description 1
- KKKVOZNCLALMPV-XKBZYTNZSA-N Ser-Thr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O KKKVOZNCLALMPV-XKBZYTNZSA-N 0.000 description 1
- QNBVFKZSSRYNFX-CUJWVEQBSA-N Ser-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N)O QNBVFKZSSRYNFX-CUJWVEQBSA-N 0.000 description 1
- NADLKBTYNKUJEP-KATARQTJSA-N Ser-Thr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NADLKBTYNKUJEP-KATARQTJSA-N 0.000 description 1
- SGZVZUCRAVSPKQ-FXQIFTODSA-N Ser-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N SGZVZUCRAVSPKQ-FXQIFTODSA-N 0.000 description 1
- LLSLRQOEAFCZLW-NRPADANISA-N Ser-Val-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LLSLRQOEAFCZLW-NRPADANISA-N 0.000 description 1
- YEDSOSIKVUMIJE-DCAQKATOSA-N Ser-Val-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O YEDSOSIKVUMIJE-DCAQKATOSA-N 0.000 description 1
- 241000607720 Serratia Species 0.000 description 1
- 241000607715 Serratia marcescens Species 0.000 description 1
- 241000607764 Shigella dysenteriae Species 0.000 description 1
- 241000607762 Shigella flexneri Species 0.000 description 1
- 241000607760 Shigella sonnei Species 0.000 description 1
- 235000002560 Solanum lycopersicum Nutrition 0.000 description 1
- 235000002597 Solanum melongena Nutrition 0.000 description 1
- 244000061458 Solanum melongena Species 0.000 description 1
- 235000002595 Solanum tuberosum Nutrition 0.000 description 1
- 244000061456 Solanum tuberosum Species 0.000 description 1
- 241001529928 Sphoeroides Species 0.000 description 1
- 241000228389 Sporidiobolus Species 0.000 description 1
- 241000222068 Sporobolomyces <Sporidiobolaceae> Species 0.000 description 1
- 241000193640 Sporopachydermia Species 0.000 description 1
- 102100037997 Squalene synthase Human genes 0.000 description 1
- 241000191940 Staphylococcus Species 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 241000222665 Sterigmatomyces Species 0.000 description 1
- 241000040567 Sterigmatosporidium Species 0.000 description 1
- 101100101356 Stevia rebaudiana UGT91D2 gene Proteins 0.000 description 1
- 241000203615 Streptoalloteichus Species 0.000 description 1
- 241000193998 Streptococcus pneumoniae Species 0.000 description 1
- 241000193996 Streptococcus pyogenes Species 0.000 description 1
- 241000186986 Streptomyces anulatus Species 0.000 description 1
- 241000187433 Streptomyces clavuligerus Species 0.000 description 1
- 241000958215 Streptomyces filamentosus Species 0.000 description 1
- 241000187310 Streptomyces noursei Species 0.000 description 1
- 241000813219 Streptomyces sp. KO-3988 Species 0.000 description 1
- 241000187191 Streptomyces viridochromogenes Species 0.000 description 1
- 241000205101 Sulfolobus Species 0.000 description 1
- 241000205098 Sulfolobus acidocaldarius Species 0.000 description 1
- 241000122237 Symbiotaphrina Species 0.000 description 1
- 241000159597 Sympodiomyces Species 0.000 description 1
- 241001523623 Sympodiomycopsis Species 0.000 description 1
- 241000192560 Synechococcus sp. Species 0.000 description 1
- 241001303801 Syntrophus aciditrophicus Species 0.000 description 1
- SEQDDYPDSLOBDC-UHFFFAOYSA-N Temazepam Chemical compound N=1C(O)C(=O)N(C)C2=CC=C(Cl)C=C2C=1C1=CC=CC=C1 SEQDDYPDSLOBDC-UHFFFAOYSA-N 0.000 description 1
- 241001491687 Thalassiosira pseudonana Species 0.000 description 1
- 244000269722 Thea sinensis Species 0.000 description 1
- 241000204673 Thermoplasma acidophilum Species 0.000 description 1
- 241000489996 Thermoplasma volcanium Species 0.000 description 1
- MQCPGOZXFSYJPS-KZVJFYERSA-N Thr-Ala-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MQCPGOZXFSYJPS-KZVJFYERSA-N 0.000 description 1
- GFDUZZACIWNMPE-KZVJFYERSA-N Thr-Ala-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O GFDUZZACIWNMPE-KZVJFYERSA-N 0.000 description 1
- JMZKMSTYXHFYAK-VEVYYDQMSA-N Thr-Arg-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O JMZKMSTYXHFYAK-VEVYYDQMSA-N 0.000 description 1
- MQBTXMPQNCGSSZ-OSUNSFLBSA-N Thr-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N MQBTXMPQNCGSSZ-OSUNSFLBSA-N 0.000 description 1
- UTSWGQNAQRIHAI-UNQGMJICSA-N Thr-Arg-Phe Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 UTSWGQNAQRIHAI-UNQGMJICSA-N 0.000 description 1
- OHAJHDJOCKKJLV-LKXGYXEUSA-N Thr-Asp-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OHAJHDJOCKKJLV-LKXGYXEUSA-N 0.000 description 1
- RKDFEMGVMMYYNG-WDCWCFNPSA-N Thr-Gln-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O RKDFEMGVMMYYNG-WDCWCFNPSA-N 0.000 description 1
- VULNJDORNLBPNG-SWRJLBSHSA-N Thr-Glu-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O VULNJDORNLBPNG-SWRJLBSHSA-N 0.000 description 1
- PAXANSWUSVPFNK-IUKAMOBKSA-N Thr-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N PAXANSWUSVPFNK-IUKAMOBKSA-N 0.000 description 1
- URPSJRMWHQTARR-MBLNEYKQSA-N Thr-Ile-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O URPSJRMWHQTARR-MBLNEYKQSA-N 0.000 description 1
- GMXIJHCBTZDAPD-QPHKQPEJSA-N Thr-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N GMXIJHCBTZDAPD-QPHKQPEJSA-N 0.000 description 1
- ADPHPKGWVDHWML-PPCPHDFISA-N Thr-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N ADPHPKGWVDHWML-PPCPHDFISA-N 0.000 description 1
- YJCVECXVYHZOBK-KNZXXDILSA-N Thr-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H]([C@@H](C)O)N YJCVECXVYHZOBK-KNZXXDILSA-N 0.000 description 1
- AMXMBCAXAZUCFA-RHYQMDGZSA-N Thr-Leu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMXMBCAXAZUCFA-RHYQMDGZSA-N 0.000 description 1
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 1
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 1
- JLNMFGCJODTXDH-WEDXCCLWSA-N Thr-Lys-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O JLNMFGCJODTXDH-WEDXCCLWSA-N 0.000 description 1
- DCRHJDRLCFMEBI-RHYQMDGZSA-N Thr-Lys-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O DCRHJDRLCFMEBI-RHYQMDGZSA-N 0.000 description 1
- QHUWWSQZTFLXPQ-FJXKBIBVSA-N Thr-Met-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O QHUWWSQZTFLXPQ-FJXKBIBVSA-N 0.000 description 1
- KPNSNVTUVKSBFL-ZJDVBMNYSA-N Thr-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KPNSNVTUVKSBFL-ZJDVBMNYSA-N 0.000 description 1
- IVDFVBVIVLJJHR-LKXGYXEUSA-N Thr-Ser-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IVDFVBVIVLJJHR-LKXGYXEUSA-N 0.000 description 1
- DOBIBIXIHJKVJF-XKBZYTNZSA-N Thr-Ser-Gln Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O DOBIBIXIHJKVJF-XKBZYTNZSA-N 0.000 description 1
- BCYUHPXBHCUYBA-CUJWVEQBSA-N Thr-Ser-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O BCYUHPXBHCUYBA-CUJWVEQBSA-N 0.000 description 1
- VBMOVTMNHWPZJR-SUSMZKCASA-N Thr-Thr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VBMOVTMNHWPZJR-SUSMZKCASA-N 0.000 description 1
- VGNLMPBYWWNQFS-ZEILLAHLSA-N Thr-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O VGNLMPBYWWNQFS-ZEILLAHLSA-N 0.000 description 1
- PJCYRZVSACOYSN-ZJDVBMNYSA-N Thr-Thr-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O PJCYRZVSACOYSN-ZJDVBMNYSA-N 0.000 description 1
- NLWDSYKZUPRMBJ-IEGACIPQSA-N Thr-Trp-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(C)C)C(=O)O)N)O NLWDSYKZUPRMBJ-IEGACIPQSA-N 0.000 description 1
- MYNYCUXMIIWUNW-IEGACIPQSA-N Thr-Trp-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MYNYCUXMIIWUNW-IEGACIPQSA-N 0.000 description 1
- UMFLBPIPAJMNIM-LYARXQMPSA-N Thr-Trp-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CC=CC=C3)C(=O)O)N)O UMFLBPIPAJMNIM-LYARXQMPSA-N 0.000 description 1
- OMRWDMWXRWTQIU-YJRXYDGGSA-N Thr-Tyr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CS)C(=O)O)N)O OMRWDMWXRWTQIU-YJRXYDGGSA-N 0.000 description 1
- BKIOKSLLAAZYTC-KKHAAJSZSA-N Thr-Val-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O BKIOKSLLAAZYTC-KKHAAJSZSA-N 0.000 description 1
- PWONLXBUSVIZPH-RHYQMDGZSA-N Thr-Val-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O PWONLXBUSVIZPH-RHYQMDGZSA-N 0.000 description 1
- 108020004566 Transfer RNA Proteins 0.000 description 1
- HDTRYLNUVZCQOY-WSWWMNSNSA-N Trehalose Natural products O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-WSWWMNSNSA-N 0.000 description 1
- 241000400381 Trichosporiella Species 0.000 description 1
- 241000223230 Trichosporon Species 0.000 description 1
- 241001480014 Trigonopsis Species 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- BRBCKMMXKONBAA-KWBADKCTSA-N Trp-Ala-Ala Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 BRBCKMMXKONBAA-KWBADKCTSA-N 0.000 description 1
- MJBBMTOGSOSAKJ-HJXMPXNTSA-N Trp-Ala-Ile Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MJBBMTOGSOSAKJ-HJXMPXNTSA-N 0.000 description 1
- TZNNEYFZZAHLBL-BPUTZDHNSA-N Trp-Arg-Asp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O TZNNEYFZZAHLBL-BPUTZDHNSA-N 0.000 description 1
- OENGVSDBQHHGBU-QEJZJMRPSA-N Trp-Glu-Asn Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OENGVSDBQHHGBU-QEJZJMRPSA-N 0.000 description 1
- YXONONCLMLHWJX-SZMVWBNQSA-N Trp-Glu-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 YXONONCLMLHWJX-SZMVWBNQSA-N 0.000 description 1
- SNJAPSVIPKUMCK-NWLDYVSISA-N Trp-Glu-Thr Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SNJAPSVIPKUMCK-NWLDYVSISA-N 0.000 description 1
- VDUJEEQMRQCLHB-YTQUADARSA-N Trp-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)O VDUJEEQMRQCLHB-YTQUADARSA-N 0.000 description 1
- IVBJBFSWJDNQFW-XIRDDKMYSA-N Trp-Pro-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O IVBJBFSWJDNQFW-XIRDDKMYSA-N 0.000 description 1
- UIRPULWLRODAEQ-QEJZJMRPSA-N Trp-Ser-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 UIRPULWLRODAEQ-QEJZJMRPSA-N 0.000 description 1
- 241000222671 Tsuchiyaea Species 0.000 description 1
- VCXWRWYFJLXITF-AUTRQRHGSA-N Tyr-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 VCXWRWYFJLXITF-AUTRQRHGSA-N 0.000 description 1
- BURPTJBFWIOHEY-UWJYBYFXSA-N Tyr-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 BURPTJBFWIOHEY-UWJYBYFXSA-N 0.000 description 1
- LGEYOIQBBIPHQN-UWJYBYFXSA-N Tyr-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 LGEYOIQBBIPHQN-UWJYBYFXSA-N 0.000 description 1
- OEVJGIHPQOXYFE-SRVKXCTJSA-N Tyr-Asn-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O OEVJGIHPQOXYFE-SRVKXCTJSA-N 0.000 description 1
- AYPAIRCDLARHLM-KKUMJFAQSA-N Tyr-Asn-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O AYPAIRCDLARHLM-KKUMJFAQSA-N 0.000 description 1
- RCLOWEZASFJFEX-KKUMJFAQSA-N Tyr-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 RCLOWEZASFJFEX-KKUMJFAQSA-N 0.000 description 1
- KOVXHANYYYMBRF-IRIUXVKKSA-N Tyr-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O KOVXHANYYYMBRF-IRIUXVKKSA-N 0.000 description 1
- LTSIAOZUVISRAQ-QWRGUYRKSA-N Tyr-Gly-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N)O LTSIAOZUVISRAQ-QWRGUYRKSA-N 0.000 description 1
- KCPFDGNYAMKZQP-KBPBESRZSA-N Tyr-Gly-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O KCPFDGNYAMKZQP-KBPBESRZSA-N 0.000 description 1
- JKUZFODWJGEQAP-KBPBESRZSA-N Tyr-Gly-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O JKUZFODWJGEQAP-KBPBESRZSA-N 0.000 description 1
- AZGZDDNKFFUDEH-QWRGUYRKSA-N Tyr-Gly-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AZGZDDNKFFUDEH-QWRGUYRKSA-N 0.000 description 1
- YYZPVPJCOGGQPC-JYJNAYRXSA-N Tyr-His-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYZPVPJCOGGQPC-JYJNAYRXSA-N 0.000 description 1
- WVGKPKDWYQXWLU-BZSNNMDCSA-N Tyr-His-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CCCCN)C(=O)O)N)O WVGKPKDWYQXWLU-BZSNNMDCSA-N 0.000 description 1
- HVPPEXXUDXAPOM-MGHWNKPDSA-N Tyr-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HVPPEXXUDXAPOM-MGHWNKPDSA-N 0.000 description 1
- BXPOOVDVGWEXDU-WZLNRYEVSA-N Tyr-Ile-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BXPOOVDVGWEXDU-WZLNRYEVSA-N 0.000 description 1
- MVFQLSPDMMFCMW-KKUMJFAQSA-N Tyr-Leu-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O MVFQLSPDMMFCMW-KKUMJFAQSA-N 0.000 description 1
- PRONOHBTMLNXCZ-BZSNNMDCSA-N Tyr-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PRONOHBTMLNXCZ-BZSNNMDCSA-N 0.000 description 1
- CDKZJGMPZHPAJC-ULQDDVLXSA-N Tyr-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CDKZJGMPZHPAJC-ULQDDVLXSA-N 0.000 description 1
- AVFGBGGRZOKSFS-KJEVXHAQSA-N Tyr-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O AVFGBGGRZOKSFS-KJEVXHAQSA-N 0.000 description 1
- QPOUERMDWKKZEG-HJPIBITLSA-N Tyr-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 QPOUERMDWKKZEG-HJPIBITLSA-N 0.000 description 1
- NHOVZGFNTGMYMI-KKUMJFAQSA-N Tyr-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NHOVZGFNTGMYMI-KKUMJFAQSA-N 0.000 description 1
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 1
- OJCISMMNNUNNJA-BZSNNMDCSA-N Tyr-Tyr-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=C(O)C=C1 OJCISMMNNUNNJA-BZSNNMDCSA-N 0.000 description 1
- SQUMHUZLJDUROQ-YDHLFZDLSA-N Tyr-Val-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O SQUMHUZLJDUROQ-YDHLFZDLSA-N 0.000 description 1
- PQPWEALFTLKSEB-DZKIICNBSA-N Tyr-Val-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PQPWEALFTLKSEB-DZKIICNBSA-N 0.000 description 1
- 101710177825 UDP-glycosyltransferase 74G1 Proteins 0.000 description 1
- 101710172549 UDP-glycosyltransferase 85C2 Proteins 0.000 description 1
- 241000145580 Udeniomyces Species 0.000 description 1
- 241000221566 Ustilago Species 0.000 description 1
- 108010064997 VPY tripeptide Proteins 0.000 description 1
- XQVRMLRMTAGSFJ-QXEWZRGKSA-N Val-Asp-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XQVRMLRMTAGSFJ-QXEWZRGKSA-N 0.000 description 1
- HHSILIQTHXABKM-YDHLFZDLSA-N Val-Asp-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](Cc1ccccc1)C(O)=O HHSILIQTHXABKM-YDHLFZDLSA-N 0.000 description 1
- DDNIHOWRDOXXPF-NGZCFLSTSA-N Val-Asp-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N DDNIHOWRDOXXPF-NGZCFLSTSA-N 0.000 description 1
- XKVXSCHXGJOQND-ZOBUZTSGSA-N Val-Asp-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N XKVXSCHXGJOQND-ZOBUZTSGSA-N 0.000 description 1
- GBESYURLQOYWLU-LAEOZQHASA-N Val-Glu-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GBESYURLQOYWLU-LAEOZQHASA-N 0.000 description 1
- OQWNEUXPKHIEJO-NRPADANISA-N Val-Glu-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N OQWNEUXPKHIEJO-NRPADANISA-N 0.000 description 1
- BVWPHWLFGRCECJ-JSGCOSHPSA-N Val-Gly-Tyr Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N BVWPHWLFGRCECJ-JSGCOSHPSA-N 0.000 description 1
- WJVLTYSHNXRCLT-NHCYSSNCSA-N Val-His-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WJVLTYSHNXRCLT-NHCYSSNCSA-N 0.000 description 1
- LKUDRJSNRWVGMS-QSFUFRPTSA-N Val-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LKUDRJSNRWVGMS-QSFUFRPTSA-N 0.000 description 1
- UKEVLVBHRKWECS-LSJOCFKGSA-N Val-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](C(C)C)N UKEVLVBHRKWECS-LSJOCFKGSA-N 0.000 description 1
- SDUBQHUJJWQTEU-XUXIUFHCSA-N Val-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C(C)C)N SDUBQHUJJWQTEU-XUXIUFHCSA-N 0.000 description 1
- OVBMCNDKCWAXMZ-NAKRPEOUSA-N Val-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N OVBMCNDKCWAXMZ-NAKRPEOUSA-N 0.000 description 1
- DJQIUOKSNRBTSV-CYDGBPFRSA-N Val-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](C(C)C)N DJQIUOKSNRBTSV-CYDGBPFRSA-N 0.000 description 1
- FEXILLGKGGTLRI-NHCYSSNCSA-N Val-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N FEXILLGKGGTLRI-NHCYSSNCSA-N 0.000 description 1
- KTEZUXISLQTDDQ-NHCYSSNCSA-N Val-Lys-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KTEZUXISLQTDDQ-NHCYSSNCSA-N 0.000 description 1
- IJGPOONOTBNTFS-GVXVVHGQSA-N Val-Lys-Glu Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O IJGPOONOTBNTFS-GVXVVHGQSA-N 0.000 description 1
- ZRSZTKTVPNSUNA-IHRRRGAJSA-N Val-Lys-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C(C)C)C(O)=O ZRSZTKTVPNSUNA-IHRRRGAJSA-N 0.000 description 1
- JAKHAONCJJZVHT-DCAQKATOSA-N Val-Lys-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N JAKHAONCJJZVHT-DCAQKATOSA-N 0.000 description 1
- XPKCFQZDQGVJCX-RHYQMDGZSA-N Val-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N)O XPKCFQZDQGVJCX-RHYQMDGZSA-N 0.000 description 1
- SVFRYKBZHUGKLP-QXEWZRGKSA-N Val-Met-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SVFRYKBZHUGKLP-QXEWZRGKSA-N 0.000 description 1
- LGXUZJIQCGXKGZ-QXEWZRGKSA-N Val-Pro-Asn Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)N)C(=O)O)N LGXUZJIQCGXKGZ-QXEWZRGKSA-N 0.000 description 1
- USLVEJAHTBLSIL-CYDGBPFRSA-N Val-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C USLVEJAHTBLSIL-CYDGBPFRSA-N 0.000 description 1
- UGFMVXRXULGLNO-XPUUQOCRSA-N Val-Ser-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O UGFMVXRXULGLNO-XPUUQOCRSA-N 0.000 description 1
- MNSSBIHFEUUXNW-RCWTZXSCSA-N Val-Thr-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N MNSSBIHFEUUXNW-RCWTZXSCSA-N 0.000 description 1
- DLRZGNXCXUGIDG-KKHAAJSZSA-N Val-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O DLRZGNXCXUGIDG-KKHAAJSZSA-N 0.000 description 1
- UVHFONIHVHLDDQ-IFFSRLJSSA-N Val-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O UVHFONIHVHLDDQ-IFFSRLJSSA-N 0.000 description 1
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 1
- JAIZPWVHPQRYOU-ZJDVBMNYSA-N Val-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O JAIZPWVHPQRYOU-ZJDVBMNYSA-N 0.000 description 1
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 1
- JVGDAEKKZKKZFO-RCWTZXSCSA-N Val-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N)O JVGDAEKKZKKZFO-RCWTZXSCSA-N 0.000 description 1
- SECKRCOLJRRGGV-UHFFFAOYSA-N Vardenafil Chemical compound CCCC1=NC(C)=C(C(N=2)=O)N1NC=2C(C(=CC=1)OCC)=CC=1S(=O)(=O)N1CCN(CC)CC1 SECKRCOLJRRGGV-UHFFFAOYSA-N 0.000 description 1
- DORPKYRPJIIARM-GYAWPQPFSA-N Verbasoside Chemical compound O[C@@H]1[C@H](O)[C@@H](O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](O)[C@H](OCCC=2C=C(O)C(O)=CC=2)O[C@H](CO)[C@H]1O DORPKYRPJIIARM-GYAWPQPFSA-N 0.000 description 1
- 241000607598 Vibrio Species 0.000 description 1
- 241000235152 Williopsis Species 0.000 description 1
- 241001075308 Xylella fastidiosa Temecula1 Species 0.000 description 1
- 241000235013 Yarrowia Species 0.000 description 1
- 241000235015 Yarrowia lipolytica Species 0.000 description 1
- 241000209149 Zea Species 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 235000007244 Zea mays Nutrition 0.000 description 1
- 241000222676 Zygoascus Species 0.000 description 1
- 241000235017 Zygosaccharomyces Species 0.000 description 1
- 241000685534 Zygowilliopsis Species 0.000 description 1
- 241000193645 Zygozyma Species 0.000 description 1
- 241000588901 Zymomonas Species 0.000 description 1
- HINSNOJRHFIMKB-DJDMUFINSA-N [(2S,3R,4S,5S,6R)-4,5-dihydroxy-6-(hydroxymethyl)-3-[(2S,3R,4R,5R,6S)-3,4,5-trihydroxy-6-methyloxan-2-yl]oxyoxan-2-yl] (1R,4S,5R,9S,10R,13S)-13-[(2S,3R,4S,5R,6R)-5-hydroxy-6-(hydroxymethyl)-3,4-bis[[(2S,3R,4S,5S,6R)-3,4,5-trihydroxy-6-(hydroxymethyl)oxan-2-yl]oxy]oxan-2-yl]oxy-5,9-dimethyl-14-methylidenetetracyclo[11.2.1.01,10.04,9]hexadecane-5-carboxylate Chemical compound [H][C@@]1(O[C@@H]2[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]2OC(=O)[C@]2(C)CCC[C@@]3(C)[C@]4([H])CC[C@@]5(C[C@]4(CC5=C)CC[C@]23[H])O[C@]2([H])O[C@H](CO)[C@@H](O)[C@H](O[C@]3([H])O[C@H](CO)[C@@H](O)[C@H](O)[C@H]3O)[C@H]2O[C@]2([H])O[C@H](CO)[C@@H](O)[C@H](O)[C@H]2O)O[C@@H](C)[C@H](O)[C@@H](O)[C@H]1O HINSNOJRHFIMKB-DJDMUFINSA-N 0.000 description 1
- NRAUADCLPJTGSF-ZPGVOIKOSA-N [(2r,3s,4r,5r,6r)-6-[[(3as,7r,7as)-7-hydroxy-4-oxo-1,3a,5,6,7,7a-hexahydroimidazo[4,5-c]pyridin-2-yl]amino]-5-[[(3s)-3,6-diaminohexanoyl]amino]-4-hydroxy-2-(hydroxymethyl)oxan-3-yl] carbamate Chemical compound NCCC[C@H](N)CC(=O)N[C@@H]1[C@@H](O)[C@H](OC(N)=O)[C@@H](CO)O[C@H]1\N=C/1N[C@H](C(=O)NC[C@H]2O)[C@@H]2N\1 NRAUADCLPJTGSF-ZPGVOIKOSA-N 0.000 description 1
- 241000606834 [Haemophilus] ducreyi Species 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- IKHGUXGNUITLKF-XPULMUKRSA-N acetaldehyde Chemical compound [14CH]([14CH3])=O IKHGUXGNUITLKF-XPULMUKRSA-N 0.000 description 1
- 125000002339 acetoacetyl group Chemical group O=C([*])C([H])([H])C(=O)C([H])([H])[H] 0.000 description 1
- 229940100228 acetyl coenzyme a Drugs 0.000 description 1
- LIPOUNRJVLNBCD-UHFFFAOYSA-N acetyl dihydrogen phosphate Chemical compound CC(=O)OP(O)(O)=O LIPOUNRJVLNBCD-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000010933 acylation Effects 0.000 description 1
- 238000005917 acylation reaction Methods 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 1
- 108010005233 alanylglutamic acid Proteins 0.000 description 1
- 108010087924 alanylproline Proteins 0.000 description 1
- HDTRYLNUVZCQOY-LIZSDCNHSA-N alpha,alpha-trehalose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-LIZSDCNHSA-N 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- WQZGKKKJIJFFOK-PHYPRBDBSA-N alpha-D-galactose Chemical compound OC[C@H]1O[C@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-PHYPRBDBSA-N 0.000 description 1
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 1
- ZRIUUUJAJJNDSS-UHFFFAOYSA-N ammonium phosphates Chemical class [NH4+].[NH4+].[NH4+].[O-]P([O-])([O-])=O ZRIUUUJAJJNDSS-UHFFFAOYSA-N 0.000 description 1
- 235000019289 ammonium phosphates Nutrition 0.000 description 1
- 150000003863 ammonium salts Chemical class 0.000 description 1
- 229940044197 ammonium sulfate Drugs 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000001195 anabolic effect Effects 0.000 description 1
- 239000000538 analytical sample Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 239000002518 antifoaming agent Substances 0.000 description 1
- 239000012736 aqueous medium Substances 0.000 description 1
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 108010007483 arginyl-leucyl-tyrosyl-glutamic acid Proteins 0.000 description 1
- 108010068380 arginylarginine Proteins 0.000 description 1
- 125000000613 asparagine group Chemical group N[C@@H](CC(N)=O)C(=O)* 0.000 description 1
- 108010038633 aspartylglutamate Proteins 0.000 description 1
- 230000001651 autotrophic effect Effects 0.000 description 1
- 239000003782 beta lactam antibiotic agent Substances 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- GUBGYTABKSRVRQ-QUYVBRFLSA-N beta-maltose Chemical compound OC[C@H]1O[C@H](O[C@H]2[C@H](O)[C@@H](O)[C@H](O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@@H]1O GUBGYTABKSRVRQ-QUYVBRFLSA-N 0.000 description 1
- 238000010364 biochemical engineering Methods 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 101150049515 bla gene Proteins 0.000 description 1
- 229910000085 borane Inorganic materials 0.000 description 1
- 150000005693 branched-chain amino acids Chemical class 0.000 description 1
- GVEZIHKRYBHEFX-UHFFFAOYSA-N caerulein A Natural products CC=CCC=CCCC(=O)C1OC1C(N)=O GVEZIHKRYBHEFX-UHFFFAOYSA-N 0.000 description 1
- 229960005069 calcium Drugs 0.000 description 1
- 229940041514 candida albicans extract Drugs 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 235000013877 carbamide Nutrition 0.000 description 1
- YZBQHRLRFGPBSL-RXMQYKEDSA-N carbapenem Chemical compound C1C=CN2C(=O)C[C@H]21 YZBQHRLRFGPBSL-RXMQYKEDSA-N 0.000 description 1
- 239000012159 carrier gas Substances 0.000 description 1
- 101150055766 cat gene Proteins 0.000 description 1
- 230000001925 catabolic effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- OLVCFLKTBJRLHI-AXAPSJFSSA-N cefamandole Chemical compound CN1N=NN=C1SCC1=C(C(O)=O)N2C(=O)[C@@H](NC(=O)[C@H](O)C=3C=CC=CC=3)[C@H]2SC1 OLVCFLKTBJRLHI-AXAPSJFSSA-N 0.000 description 1
- 229960003012 cefamandole Drugs 0.000 description 1
- GCFBRXLSHGKWDP-XCGNWRKASA-N cefoperazone Chemical compound O=C1C(=O)N(CC)CCN1C(=O)N[C@H](C=1C=CC(O)=CC=1)C(=O)N[C@@H]1C(=O)N2C(C(O)=O)=C(CSC=3N(N=NN=3)C)CS[C@@H]21 GCFBRXLSHGKWDP-XCGNWRKASA-N 0.000 description 1
- 229960004682 cefoperazone Drugs 0.000 description 1
- 239000006143 cell culture medium Substances 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 229940124587 cephalosporin Drugs 0.000 description 1
- 150000001780 cephalosporins Chemical class 0.000 description 1
- UCKZMPLVLCKKMO-LHLIQPBNSA-N cephamycin Chemical compound S1CC(C)=C(C(O)=O)N2C(=O)[C@@H](C)[C@]21OC UCKZMPLVLCKKMO-LHLIQPBNSA-N 0.000 description 1
- GVEZIHKRYBHEFX-NQQPLRFYSA-N cerulenin Chemical compound C\C=C\C\C=C\CCC(=O)[C@H]1O[C@H]1C(N)=O GVEZIHKRYBHEFX-NQQPLRFYSA-N 0.000 description 1
- 229950005984 cerulenin Drugs 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 229920003211 cis-1,4-polyisoprene Polymers 0.000 description 1
- 235000020971 citrus fruits Nutrition 0.000 description 1
- 239000000701 coagulant Substances 0.000 description 1
- 239000011436 cob Substances 0.000 description 1
- 239000000571 coke Substances 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000002425 crystallisation Methods 0.000 description 1
- 230000008025 crystallization Effects 0.000 description 1
- 238000012136 culture method Methods 0.000 description 1
- 239000012228 culture supernatant Substances 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 108010060199 cysteinylproline Proteins 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000003413 degradative effect Effects 0.000 description 1
- 238000001212 derivatisation Methods 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- RAABOESOVLLHRU-UHFFFAOYSA-N diazene Chemical compound N=N RAABOESOVLLHRU-UHFFFAOYSA-N 0.000 description 1
- 229910000071 diazene Inorganic materials 0.000 description 1
- 238000007865 diluting Methods 0.000 description 1
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 1
- 238000011143 downstream manufacturing Methods 0.000 description 1
- QYDYPVFESGNLHU-UHFFFAOYSA-N elaidic acid methyl ester Natural products CCCCCCCCC=CCCCCCCCC(=O)OC QYDYPVFESGNLHU-UHFFFAOYSA-N 0.000 description 1
- 238000000909 electrodialysis Methods 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 239000003995 emulsifying agent Substances 0.000 description 1
- JCAVDWHQNFTFBW-GNVSMLMZSA-N ent-kaur-16-en-19-al Chemical compound C1C[C@@H](C2)C(=C)C[C@@]32CC[C@@H]2[C@](C)(C=O)CCC[C@@]2(C)[C@@H]31 JCAVDWHQNFTFBW-GNVSMLMZSA-N 0.000 description 1
- NIKHGUQULKYIGE-SHAPNJEPSA-N ent-kaur-16-en-19-oic acid Chemical compound C([C@H]1C[C@]2(CC1=C)CC1)C[C@H]2[C@@]2(C)[C@H]1[C@](C)(C(O)=O)CCC2 NIKHGUQULKYIGE-SHAPNJEPSA-N 0.000 description 1
- KWVKUAKMOIEELN-UHFFFAOYSA-N ent-kaur-16-en-19-oic acid Natural products CC1(C)CCCC2(C)C1CCC34CC(=C(C3)C(=O)O)CCC24 KWVKUAKMOIEELN-UHFFFAOYSA-N 0.000 description 1
- TUJQVRFWMWRMIO-GNVSMLMZSA-N ent-kaur-16-en-19-ol Chemical compound C1C[C@@H](C2)C(=C)C[C@@]32CC[C@@H]2[C@](C)(CO)CCC[C@@]2(C)[C@@H]31 TUJQVRFWMWRMIO-GNVSMLMZSA-N 0.000 description 1
- 108010026539 ent-kaurenoic acid 13-hydroxylase Proteins 0.000 description 1
- HELXLJCILKEWJH-UHFFFAOYSA-N entered according to Sigma 01432 Natural products C1CC2C3(C)CCCC(C)(C(=O)OC4C(C(O)C(O)C(CO)O4)O)C3CCC2(C2)CC(=C)C21OC(C1OC2C(C(O)C(O)C(CO)O2)O)OC(CO)C(O)C1OC1OC(CO)C(O)C(O)C1O HELXLJCILKEWJH-UHFFFAOYSA-N 0.000 description 1
- 238000001952 enzyme assay Methods 0.000 description 1
- 101150116391 erg9 gene Proteins 0.000 description 1
- 229960002770 ertapenem Drugs 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 238000001704 evaporation Methods 0.000 description 1
- 230000008020 evaporation Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 125000004030 farnesyl group Chemical group [H]C([*])([H])C([H])=C(C([H])([H])[H])C([H])([H])C([H])([H])C([H])=C(C([H])([H])[H])C([H])([H])C([H])([H])C([H])=C(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 230000009123 feedback regulation Effects 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 239000008394 flocculating agent Substances 0.000 description 1
- 239000011888 foil Substances 0.000 description 1
- 235000003599 food sweetener Nutrition 0.000 description 1
- 239000004459 forage Substances 0.000 description 1
- 239000012737 fresh medium Substances 0.000 description 1
- 238000010230 functional analysis Methods 0.000 description 1
- 229930182830 galactose Natural products 0.000 description 1
- 125000002519 galactosyl group Chemical group C1([C@H](O)[C@@H](O)[C@@H](O)[C@H](O1)CO)* 0.000 description 1
- 238000004817 gas chromatography Methods 0.000 description 1
- 238000001423 gas--liquid extraction Methods 0.000 description 1
- 125000002686 geranylgeranyl group Chemical group [H]C([*])([H])/C([H])=C(C([H])([H])[H])/C([H])([H])C([H])([H])/C([H])=C(C([H])([H])[H])/C([H])([H])C([H])([H])/C([H])=C(C([H])([H])[H])/C([H])([H])C([H])([H])C([H])=C(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 229940116332 glucose oxidase Drugs 0.000 description 1
- 235000019420 glucose oxidase Nutrition 0.000 description 1
- 229930182478 glucoside Natural products 0.000 description 1
- 150000008131 glucosides Chemical class 0.000 description 1
- 125000000291 glutamic acid group Chemical group N[C@@H](CCC(O)=O)C(=O)* 0.000 description 1
- 150000002308 glutamine derivatives Chemical group 0.000 description 1
- 108010078144 glutaminyl-glycine Proteins 0.000 description 1
- 108010085059 glutamyl-arginyl-proline Proteins 0.000 description 1
- 108010049041 glutamylalanine Proteins 0.000 description 1
- 229940096919 glycogen Drugs 0.000 description 1
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 1
- 108010010096 glycyl-glycyl-tyrosine Proteins 0.000 description 1
- 108010045126 glycyl-tyrosyl-glycine Proteins 0.000 description 1
- 108010077515 glycylproline Proteins 0.000 description 1
- 108010037850 glycylvaline Proteins 0.000 description 1
- 239000007952 growth promoter Substances 0.000 description 1
- 125000001475 halogen functional group Chemical group 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 108010040030 histidinoalanine Proteins 0.000 description 1
- 108010045383 histidyl-glycyl-glutamic acid Proteins 0.000 description 1
- 108010092114 histidylphenylalanine Proteins 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- GRRNUXAQVGOGFE-NZSRVPFOSA-N hygromycin B Chemical compound O[C@@H]1[C@@H](NC)C[C@@H](N)[C@H](O)[C@H]1O[C@H]1[C@H]2O[C@@]3([C@@H]([C@@H](O)[C@@H](O)[C@@H](C(N)CO)O3)O)O[C@H]2[C@@H](O)[C@@H](CO)O1 GRRNUXAQVGOGFE-NZSRVPFOSA-N 0.000 description 1
- 229940097277 hygromycin b Drugs 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 239000002054 inoculum Substances 0.000 description 1
- CDAISMWEOUEBRE-GPIVLXJGSA-N inositol Chemical compound O[C@H]1[C@H](O)[C@@H](O)[C@H](O)[C@H](O)[C@@H]1O CDAISMWEOUEBRE-GPIVLXJGSA-N 0.000 description 1
- 229960000367 inositol Drugs 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- JEIPFZHSYJVQDO-UHFFFAOYSA-N iron(III) oxide Inorganic materials O=[Fe]O[Fe]=O JEIPFZHSYJVQDO-UHFFFAOYSA-N 0.000 description 1
- 108010078274 isoleucylvaline Proteins 0.000 description 1
- 125000001449 isopropyl group Chemical group [H]C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 125000001909 leucine group Chemical group [H]N(*)C(C(*)=O)C([H])([H])C(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 108010077158 leucinyl-arginyl-tryptophan Proteins 0.000 description 1
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 1
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 1
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 1
- 229940097443 levitra Drugs 0.000 description 1
- 238000004811 liquid chromatography Methods 0.000 description 1
- 238000000622 liquid--liquid extraction Methods 0.000 description 1
- 229910052744 lithium Inorganic materials 0.000 description 1
- XIXADJRWDQXREU-UHFFFAOYSA-M lithium acetate Chemical compound [Li+].CC([O-])=O XIXADJRWDQXREU-UHFFFAOYSA-M 0.000 description 1
- OAIJSZIZWZSQBC-GYZMGTAESA-N lycopene Chemical compound CC(C)=CCC\C(C)=C\C=C\C(\C)=C\C=C\C(\C)=C\C=C\C=C(/C)\C=C\C=C(/C)\C=C\C=C(/C)CCC=C(C)C OAIJSZIZWZSQBC-GYZMGTAESA-N 0.000 description 1
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 230000002934 lysing effect Effects 0.000 description 1
- 108010038320 lysylphenylalanine Proteins 0.000 description 1
- WRUGWIBCXHJTDG-UHFFFAOYSA-L magnesium sulfate heptahydrate Chemical compound O.O.O.O.O.O.O.[Mg+2].[O-]S([O-])(=O)=O WRUGWIBCXHJTDG-UHFFFAOYSA-L 0.000 description 1
- 229940061634 magnesium sulfate heptahydrate Drugs 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 239000013028 medium composition Substances 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 230000007102 metabolic function Effects 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 108010056582 methionylglutamic acid Proteins 0.000 description 1
- 108010005942 methionylglycine Proteins 0.000 description 1
- 229960000485 methotrexate Drugs 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- QYDYPVFESGNLHU-KHPPLWFESA-N methyl oleate Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OC QYDYPVFESGNLHU-KHPPLWFESA-N 0.000 description 1
- 229940073769 methyl oleate Drugs 0.000 description 1
- 239000013586 microbial product Substances 0.000 description 1
- 238000009629 microbiological culture Methods 0.000 description 1
- VYQNWZOUAUKGHI-UHFFFAOYSA-N monobenzone Chemical compound C1=CC(O)=CC=C1OCC1=CC=CC=C1 VYQNWZOUAUKGHI-UHFFFAOYSA-N 0.000 description 1
- 238000002552 multiple reaction monitoring Methods 0.000 description 1
- 101150016209 mvaA gene Proteins 0.000 description 1
- 229930014626 natural product Natural products 0.000 description 1
- RJMUSRYZPJIFPJ-UHFFFAOYSA-N niclosamide Chemical compound OC1=CC=C(Cl)C=C1C(=O)NC1=CC=C([N+]([O-])=O)C=C1Cl RJMUSRYZPJIFPJ-UHFFFAOYSA-N 0.000 description 1
- 229910017604 nitric acid Inorganic materials 0.000 description 1
- 231100001160 nonlethal Toxicity 0.000 description 1
- 238000010899 nucleation Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 235000006286 nutrient intake Nutrition 0.000 description 1
- 235000020824 obesity Nutrition 0.000 description 1
- 239000005332 obsidian Substances 0.000 description 1
- QIQXTHQIDYTFRH-UHFFFAOYSA-N octadecanoic acid Chemical compound CCCCCCCCCCCCCCCCCC(O)=O QIQXTHQIDYTFRH-UHFFFAOYSA-N 0.000 description 1
- 125000001477 organic nitrogen group Chemical group 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- 230000008723 osmotic stress Effects 0.000 description 1
- AZQWKYJCGOJGHM-UHFFFAOYSA-N para-benzoquinone Natural products O=C1C=CC(=O)C=C1 AZQWKYJCGOJGHM-UHFFFAOYSA-N 0.000 description 1
- 101150113864 pat gene Proteins 0.000 description 1
- 150000002960 penicillins Chemical class 0.000 description 1
- 235000019319 peptone Nutrition 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 108010082795 phenylalanyl-arginyl-arginine Proteins 0.000 description 1
- 108010065135 phenylalanyl-phenylalanyl-phenylalanine Proteins 0.000 description 1
- 108010018625 phenylalanylarginine Proteins 0.000 description 1
- 108010051242 phenylalanylserine Proteins 0.000 description 1
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 1
- 230000000865 phosphorylative effect Effects 0.000 description 1
- 108010025488 pinealon Proteins 0.000 description 1
- 235000020077 pisco Nutrition 0.000 description 1
- 229920002523 polyethylene Glycol 1000 Polymers 0.000 description 1
- 239000011591 potassium Substances 0.000 description 1
- 229910052700 potassium Inorganic materials 0.000 description 1
- 235000011009 potassium phosphates Nutrition 0.000 description 1
- 239000013587 production medium Substances 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 108010014614 prolyl-glycyl-proline Proteins 0.000 description 1
- 108010077112 prolyl-proline Proteins 0.000 description 1
- 108010031719 prolyl-serine Proteins 0.000 description 1
- 108010090894 prolylleucine Proteins 0.000 description 1
- 239000003531 protein hydrolysate Substances 0.000 description 1
- WQGWDDDVZFFDIG-UHFFFAOYSA-N pyrogallol Chemical compound OC1=CC=CC(O)=C1O WQGWDDDVZFFDIG-UHFFFAOYSA-N 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 235000019203 rebaudioside A Nutrition 0.000 description 1
- RLLCWNUIHGPAJY-SFUUMPFESA-N rebaudioside E Chemical compound O([C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(=O)O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O RLLCWNUIHGPAJY-SFUUMPFESA-N 0.000 description 1
- QRGRAFPOLJOGRV-UHFFFAOYSA-N rebaudioside F Natural products CC12CCCC(C)(C1CCC34CC(=C)C(CCC23)(C4)OC5OC(CO)C(O)C(OC6OCC(O)C(O)C6O)C5OC7OC(CO)C(O)C(O)C7O)C(=O)OC8OC(CO)C(O)C(O)C8O QRGRAFPOLJOGRV-UHFFFAOYSA-N 0.000 description 1
- HYLAUKAHEAUVFE-AVBZULRRSA-N rebaudioside f Chemical compound O([C@H]1[C@H](O)[C@@H](CO)O[C@H]([C@@H]1O[C@H]1[C@@H]([C@@H](O)[C@H](O)CO1)O)O[C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(=O)O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O HYLAUKAHEAUVFE-AVBZULRRSA-N 0.000 description 1
- 102000037983 regulatory factors Human genes 0.000 description 1
- 108091008025 regulatory factors Proteins 0.000 description 1
- 230000004202 respiratory function Effects 0.000 description 1
- 238000001223 reverse osmosis Methods 0.000 description 1
- 229930194154 rubusside Natural products 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- CDAISMWEOUEBRE-UHFFFAOYSA-N scyllo-inosotol Natural products OC1C(O)C(O)C(O)C(O)C1O CDAISMWEOUEBRE-UHFFFAOYSA-N 0.000 description 1
- 229910052711 selenium Inorganic materials 0.000 description 1
- 239000011669 selenium Substances 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 150000003355 serines Chemical group 0.000 description 1
- 108010048818 seryl-histidine Proteins 0.000 description 1
- 108010026333 seryl-proline Proteins 0.000 description 1
- 235000020046 sherry Nutrition 0.000 description 1
- 229940007046 shigella dysenteriae Drugs 0.000 description 1
- 229940115939 shigella sonnei Drugs 0.000 description 1
- 230000037432 silent mutation Effects 0.000 description 1
- 235000021309 simple sugar Nutrition 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- 239000001488 sodium phosphate Substances 0.000 description 1
- 235000011008 sodium phosphates Nutrition 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 229940031000 streptococcus pneumoniae Drugs 0.000 description 1
- 230000035882 stress Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- LSNNMFCWUKXFEE-UHFFFAOYSA-L sulfite Chemical compound [O-]S([O-])=O LSNNMFCWUKXFEE-UHFFFAOYSA-L 0.000 description 1
- ZDXMLEQEMNLCQG-UHFFFAOYSA-N sulfometuron methyl Chemical group COC(=O)C1=CC=CC=C1S(=O)(=O)NC(=O)NC1=NC(C)=CC(C)=N1 ZDXMLEQEMNLCQG-UHFFFAOYSA-N 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 239000003765 sweetening agent Substances 0.000 description 1
- BVCKFLJARNKCSS-DWPRYXJFSA-N temocillin Chemical compound N([C@]1(OC)C(N2[C@H](C(C)(C)S[C@@H]21)C(O)=O)=O)C(=O)C(C(O)=O)C=1C=CSC=1 BVCKFLJARNKCSS-DWPRYXJFSA-N 0.000 description 1
- 229960001114 temocillin Drugs 0.000 description 1
- 150000003573 thiols Chemical class 0.000 description 1
- 125000000341 threoninyl group Chemical group [H]OC([H])(C([H])([H])[H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- HRXKRNGNAMMEHJ-UHFFFAOYSA-K trisodium citrate Chemical compound [Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O HRXKRNGNAMMEHJ-UHFFFAOYSA-K 0.000 description 1
- 229940038773 trisodium citrate Drugs 0.000 description 1
- 108010045269 tryptophyltryptophan Proteins 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- DRSKVOAJKLUMCL-MMUIXFKXSA-N u2n4xkx7hp Chemical compound O([C@H]1[C@H](O)[C@@H](CO)O[C@H]([C@@H]1O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)O[C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(O)=O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O DRSKVOAJKLUMCL-MMUIXFKXSA-N 0.000 description 1
- 238000000108 ultra-filtration Methods 0.000 description 1
- 210000000689 upper leg Anatomy 0.000 description 1
- 229940045136 urea Drugs 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
- 230000035899 viability Effects 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
- 239000012138 yeast extract Substances 0.000 description 1
- 239000002132 β-lactam antibiotic Substances 0.000 description 1
- 229940124586 β-lactam antibiotics Drugs 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/44—Preparation of O-glycosides, e.g. glucosides
- C12P19/56—Preparation of O-glycosides, e.g. glucosides having an oxygen atom of the saccharide radical directly bound to a condensed ring system having three or more carbocyclic rings, e.g. daunomycin, adriamycin
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
-
- A—HUMAN NECESSITIES
- A23—FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
- A23L—FOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
- A23L2/00—Non-alcoholic beverages; Dry compositions or concentrates therefor; Their preparation
- A23L2/52—Adding ingredients
- A23L2/60—Sweeteners
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0071—Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0071—Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
- C12N9/0073—Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14) with NADH or NADPH as one donor, and incorporation of one atom of oxygen 1.14.13
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/40—Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y114/00—Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
- C12Y114/13—Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with NADH or NADPH as one donor, and incorporation of one atom of oxygen (1.14.13)
- C12Y114/13078—Ent-kaurene oxidase (1.14.13.78)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y114/00—Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
- C12Y114/14—Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with reduced flavin or flavoprotein as one donor, and incorporation of one atom of oxygen (1.14.14)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/14—Fungi; Culture media therefor
- C12N1/16—Yeasts; Culture media therefor
- C12N1/18—Baker's yeast; Brewer's yeast
- C12N1/185—Saccharomyces isolates
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/645—Fungi ; Processes using fungi
- C12R2001/85—Saccharomyces
- C12R2001/865—Saccharomyces cerevisiae
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Biomedical Technology (AREA)
- Microbiology (AREA)
- Mycology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Nutrition Science (AREA)
- Medicinal Chemistry (AREA)
- Polymers & Plastics (AREA)
- Food Science & Technology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
숙주 세포에서 스테비올 글리코시드의 개선된 생산에 대한 조성물 및 방법이 본원에서 제시된다. 몇몇 양태에서, 상기 숙주 세포는 피숨 사티붐 ( Pisum sativum ) 카우렌 산화효소 또는 이의 변이 카우렌 산화효소를 인코딩하는 이종 뉴클레오티드 서열을 포함하도록 유전적으로 변형된다. 몇몇 양태에서, 상기 숙주 세포는, 상기 숙주 세포에서 스테비올 글리코시드를 생산할 수 있는 경로의 추가의 효소들을 인코딩하는 하나 이상의 이종 뉴클레오티드 서열을 더 포함한다. 본원에 기재된 조성물 및 방법은, 레바우디오사이드 D(rebaudioside D) 및 레바우디오사이드 M(rebaudioside M)을 포함하나, 이에 한정되는 것은 아닌 스테비올 글리코시드의 이종 생산을 위한 효율적인 경로를 제시한다.
Description
관련출원의 상호참조
본 출원은 2017년 8월 11일자 미국 가출원 제62/544,718호 및 2017년 8월 11일자 국제출원 PCT/US2017/046637호를 우선권으로 주장하고, 이들의 내용은 이들의 전체 기재내용이 본원에 참고로 포함된다.
기술분야
본 개시내용은 특정 카우렌 산화효소 (kaurene oxidase, KO), 이를 포함하는 조성물, 이를 포함하는 숙주 세포, 및 레바우디오사이드 D 및 레바우디오사이드 M을 포함하는 레바우디오사이드의 생산에 이들을 이용하는 방법에 관한 것이다.
천연 원료로부터 유래된 제로-칼로리 감미료는 높은 당 소비량의 부작용(예, 당뇨 및 비만)을 제한하는 데 바람직하다. 레바우디오사이드 M (Rebaudioside M, RebM)은 스테비아 식물(stevia plant) [S. 레바우디아나 베르토니(S. rebaudiana Bertoni)]에 의해 생산되는 많은 단맛이 나는 화합물들 중 하나이다. 모든 레바우디오사이드 중에서, RebM은 가장 높은 효능(potency)을 가지며 (수크로스보다 ~200-300x 더 달다), 가장 산뜻한 맛이 난다. 그러나, RebM은 스테비아 식물에 의해 소량으로만 생산되고, 전체 스테비올 글리코시드 함량의 적은 부분이다 (<1.0%). Ohta 외, 2010, J. Appl . Glycosci., 57, 199-209 (2010). 이와 같이, 대량 생산과 높은 순도를 허용하는 생명공학 기술 경로를 이용하여 RebM을 생산하는 것이 바람직하다.
생명공학 기술을 이용하여 제품을 경제적으로 생산하기 위해, 공급원료(feedstock)로부터 생성물로의 생물 전환(bioconversion)에서 각 단계는 높은 전환 효율(conversion efficiency) (이상적으로, >90%)을 가져야 할 필요가 있다. 효모를 RebM을 생성하도록 하는 우리의 조작(engineering)에서, 엔트-카우렌을 카우레노산으로 만드는 RebM에 대한 경로(도 1a 및 도 1b)의 생합성 단계(biosynthetic step) 초기에서 분명한 한계점이 확인되었다.
KO 효소는 모든 식물에서 발견되고, 보통, 식물 호르몬인 지베렐린(gibberellin)의 생성에 작용한다. 식물 세포에서 지베렐린의 레벨은 산업용 생산을 위한 효모에서 생산되는 RebM의 레벨보다 크기 정도들(orders of magnitude)이 낮으므로, 대부분의 KO 효소는 상업적 제조를 위한 RebM의 생산에 필요한 높은 플럭스(high flux)를 지닐 것으로 예상되지 않는다. 통상적으로, 스테비아 레바우디아나 (Stevia rebaudiana )로부터 수득된 KO 효소(Sr.KO)는 RebM을 생산하도록 조작된 효모에서 엔트 -카우렌을 카우레노산으로 전환하는 데 이용되어왔다. 통상적인 믿음은 이 식물이 높은 레벨의 스테비올 글리코시드를 생산하므로, 대부분의 다른 KO 효소보다 Sr.KO 효소가 더 높은 전환율(conversion rate)를 갖거나, 또는 더 높은 플럭스를 다루도록 진화되었어야 했다는 것이었다.
RebM로의 높은 탄소 플럭스(carbon flux)를 갖는 효모 균주에서, Sr.KO는 카우레노산으로의 낮은 전환 효율 비율(conversion efficiency rate) (25.6%)을 갖는 것으로 발견되었고, 매우 높은 레벨의 상류 중간 대사체(upstream intermediate metabolite) (엔트 -카우렌, 카우레놀 및 카우레날)가 형성 되었다 (도 1c).
RebM을 효율적이고, 높은 순도로 생산하기 위해, 카우레노산을 고효율로 생산할 수 있는 개선된 효소가 필요하다. 본원에서 제시된 조성물 및 방법은 이러한 필요성을 다루고, 또한 관련된 이점을 제시한다.
카우레노산으로의 카우렌의 개선된 전환에 대한 조성물 및 방법이 본원에서 제시된다. 이들 조성물 및 방법은 현저히 높은 효율로, 카우렌을 카우레노산으로 전환할 수 있는 특정 카우렌 산화효소(kaurene oxidase, KO)의 놀라운 발견에 부분적으로 기초한다. RebM에 대한 시장 수요가 연간 50억 톤이라고 가정하면, 새로운 KO를 이용한 균주 성능(strain performance)의 보통의 개선 (예, 10%) 조차, 향후 생산 비용에서 잠재적으로 천만 달러 넘게 절약할 수 있다.
또한, 본원에 기재된 특정 KO는 잔여 카우레놀 또는 카우레날이 거의 없거나 또는 없이, 카우레노산을 생산할 수 있다. 이와 같이, 특정 양태에서, 본원에 기재된 조성물 및 방법은 하류 공정(downstream processing)의 비용을 감소시켜, RebM과 같은 스테비올 글리코시드를 고수율로 갖는 조성물을 획득할 수 있다.
한 측면에서, 유전적으로 변형된 숙주 세포 및 산업상 유용한 화합물의 생산을 위한 이들의 이용방법이 본원에서 제시된다. 한 측면에서, 피숨 사티붐 카우렌 산화효소를 인코딩하는 이종 핵산을 포함하는 유전적으로 변형된 숙주 세포가 본원에서 제시된다. 몇몇 양태에서, 상기 유전적으로 변형된 숙주 세포는 스테비올 및/또는 스테비올 글리코시드를 생산할 수 있는 하나 이상의 효소적 경로(enzymatic pathway)를 더 포함한다.
특정 양태에서, 피숨 사티붐 카우렌 산화효소의 서열 (예, 서열번호 1)에 대해서 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도를 갖는 아미노산 서열을 포함하는 카우렌 산화효소를 인코딩하는 이종 핵산을 포함하는 유전적으로 변형된 숙주 세포가 본원에서 제시된다. 특정 양태에서, 상기 유전적으로 변형된 숙주 세포는 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 또는 98%를 초과하는 효율로, 카우렌을 카우레노산으로 전환할 수 있다. 특정 양태에서, 상기 유전적으로 변형된 숙주 세포는 효모 세포이다. 특정 양태에서, 상기 유전적으로 변형된 숙주 세포는 사카로마이세스 세레비시아 ( Saccharomyces cerevisiae) 세포이다.
다른 측면에서, 이종 스테비올 글리코시드를 생산하는 방법이 본원에서 제시되고, 상기 방법은 하기 단계를 포함한다: 탄소 공급원을 지닌 배지에서, 본원에 기재된 스테비올 글리코시드의 생성에 적합한 조건하에, 상기 스테비올 글리코시드 화합물을 생산할 수 있는, 본원에서 제시된 유전적으로 변형된 숙주 세포의 집단을 배양하는 단계; 및 상기 배지로부터 상기 스테비올 글리코시드를 회수하는 단계(recovering). 몇몇 양태에서, 이종 스테비올 글리코시드는 RebD 및 RebM으로 이루어진 군으로부터 선택된다.
다른 측면에서, RebD를 생산하는 방법이 본원에서 제시되고, 상기 방법은 하기 단계를 포함한다: 탄소 공급원을 지닌 배지에서, 본원에 기재된 RebD의 생성에 적합한 조건하에, 상기 RebD를 생산할 수 있는 본원에 제시된 유전적으로 변형된 숙주 세포의 집단을 배양하는 단계; 및 상기 배지로부터 상기 RebD를 회수하는 단계.
다른 측면에서, RebM을 생산하는 방법이 본원에 제시되고, 상기 방법은 하기 단계를 포함한다: 탄소 공급원을 지닌 배지에서, 본원에 기재된 RebM의 생성에 적합한 조건하에, 상기 RebM을 생산할 수 있는 본원에 제시된 유전적으로 변형된 숙주 세포의 집단을 배양하는 단계; 및 상기 배지로부터 상기 RebM을 회수하는 단계.
다른 측면에서, 카우레노산을 생산하는 방법이 본원에 제시되고, 상기 방법은 하기 단계를 포함한다: 카우레노산 형성에 적합한 조건하에서, 카우렌을 카우레노산으로 전환할 수 있는, 본원에 기재된 카우렌 산화효소를 카우렌과 접촉시키는 단계.
몇몇 양태에서, 상기 숙주 세포는 효모 세포이다. 몇몇 양태에서, 효모는 사 카로마이세스 세레비시아(Saccharomyces cerevisiae)이다. 몇몇 양태에서, 상기 숙주 세포는 RebD 또는 RebM을 고효율로 생산한다. 몇몇 양태에서, 상기 숙주 세포는 피숨 사티붐 카우렌 산화효소를 포함하지 않는 효모 세포에 비해서, 증가된 양의 RebD 또는 RebM을 생산한다.
도 1a는 파르네실 피로포스페이트(farnesyl pyrophosphate)가 스테비올로 전환되는 것의 개략도를 제시한다.
도 1b는 제라닐제라닐 피로포스페이트 (geranylgeranyl pyrophosphate, GGPP)가 RebM으로 전환되는 것의 개략도를 제시한다.
도 1c는 엔트 -카우렌(ent-kaurene)이 카우레놀(kaurenol)으로, 카우레날(kaurenal)으로, 카우레노산(kaurenoic acid)으로 전환되는 것의 개략도를 제시한다.
도 1d는 메발로네이트(mevalonate) 경로의 개략적 다이어그램을 제시한다.
도 2는 스테비올이 RebM으로 되는 예시적 경로를 제시한다.
도 3a는 효모에서 카우레노산 생산을 스크리닝하기 위한 개별적인 KO 효소들을 삽입하는데 이용된 "랜딩 패드(landing pad)" 설계의 개략도를 제시한다.
도 3b는 효모에서 카우레노산 생산 전환(production conversion)을 스크리닝하기 위한 KO 유전자 제작물의 개략도를 제시한다.
도 4는 상이한 카우렌 산화효소로, 생체 내 생산된 카우레노산의 상대적인 증가를 도시하는 차트를 제시한다.
도 5는 RebM으로의 높은 플럭스를 갖는 효모 균주에서 생체 내 생산된 카우레노산의 총량에 대해서 정규화된 엔트 -카우렌, 카우레놀 및 카우레날의 상대적인 레벨을 도시하는 막대 차트(bar chart)를 제시한다.
도 6은 Sr.KO 또는 Ps.KO 중 하나를 함유하는 높은 플럭스 균주(high flux strain)에서 RebM 역가의 상대적인 레벨을 도시하는 차트를 제시한다.
도 1b는 제라닐제라닐 피로포스페이트 (geranylgeranyl pyrophosphate, GGPP)가 RebM으로 전환되는 것의 개략도를 제시한다.
도 1c는 엔트 -카우렌(ent-kaurene)이 카우레놀(kaurenol)으로, 카우레날(kaurenal)으로, 카우레노산(kaurenoic acid)으로 전환되는 것의 개략도를 제시한다.
도 1d는 메발로네이트(mevalonate) 경로의 개략적 다이어그램을 제시한다.
도 2는 스테비올이 RebM으로 되는 예시적 경로를 제시한다.
도 3a는 효모에서 카우레노산 생산을 스크리닝하기 위한 개별적인 KO 효소들을 삽입하는데 이용된 "랜딩 패드(landing pad)" 설계의 개략도를 제시한다.
도 3b는 효모에서 카우레노산 생산 전환(production conversion)을 스크리닝하기 위한 KO 유전자 제작물의 개략도를 제시한다.
도 4는 상이한 카우렌 산화효소로, 생체 내 생산된 카우레노산의 상대적인 증가를 도시하는 차트를 제시한다.
도 5는 RebM으로의 높은 플럭스를 갖는 효모 균주에서 생체 내 생산된 카우레노산의 총량에 대해서 정규화된 엔트 -카우렌, 카우레놀 및 카우레날의 상대적인 레벨을 도시하는 막대 차트(bar chart)를 제시한다.
도 6은 Sr.KO 또는 Ps.KO 중 하나를 함유하는 높은 플럭스 균주(high flux strain)에서 RebM 역가의 상대적인 레벨을 도시하는 차트를 제시한다.
1. 용어
본원에서 이용된, 용어 "이종- (heterologous)"은 자연에서 보통 발견되지 않는 것을 의미한다. 용어 "이종 뉴클레오티드 서열(heterologous nucleotide sequence)"은 자연에 주어진 세포에서 보통 발견되지 않는 뉴클레오티드 서열을 의미한다. 이와 같이, 이종 뉴클레오티드 서열은 (a) 이의 숙주 세포에 이질적(foreign)일 수 있고 (즉, 세포에 "외인성"임); (b) 숙주 세포에서 자연적으로 발견될 수 있으나 (즉, "내인성"), 세포에 비정상적인 양으로 존재하고 (즉, 숙주 세포에서 자연적으로 발견되는 양보다 크거나 또는 작은 양); 또는 (c) 숙주 세포에서 자연적으로 발견될 수 있으나, 이의 자연적인 유전자 좌위 밖에 위치할 수 있다. 용어 "이종 효소(heterologous enzyme)"는 자연에 주어진 세포에서 보통 발견되지 않는 효소를 의미한다. 상기 용어는 (a) 주어진 세포에 외인성인 효소 (즉, 숙주 세포에 정상적으로 존재하지 않거나, 또는 숙주 세포에 주어진 맥락에서 자연적으로 존재하지 않는 뉴클레오티드 서열에 의해 인코딩됨); 및 (b) 숙주 세포에서 자연적으로 발견되나(예, 효소가 세포에 내인성인 뉴클레오티드 서열에 의해 인코딩됨), 숙주 세포에서 비정상적인 양 (예, 자연적으로 발견되는 양보다 크거나 또는 작음)으로 생산된 효소;를 포함한다.
반면에, 분자 및 특히, 효소 및 핵산에 대해서 본원에서 이용된 용어 "천연- (native)" 또는 "내인성- (endogenous)"은 천연 미생물(native microorganism)에서의 분자의 발현 레벨보다 더 낮거나, 동일하거나, 또는 더 높을 수 있는 발현 레벨과 무관하게 유기체에서 발현되는 분자들 - 자연에서, 상기 분자들은 상기 유기체에서 유래되거나 또는 발견됨 - 을 나타낸다. 천연 효소 또는 폴리뉴클레오티드의 발현은 재조합 미생물에서 변형될 수 있다는 것이 이해될 것이다.
본원에서 이용된, 용어 "모세포(parent cell)"는 변형된 숙주 세포 내로 조작된, 하나 이상의 특정한 유전적 변형, 예를 들어, 다음으로 이루어진 군으로부터 선택된 하나 이상의 변형을 포함하지 않는다는 것 외에, 본원에 개시된 유전적으로 변형된 숙주 세포와 동일한 유전적 백그라운드(genetic background)를 갖는 세포를 의미한다: 스테비올 경로의 효소의 이종 발현; 스테비올 글리코시드 경로의 효소의 이종 발현; 제라닐제라닐 디포스페이트 합성효소의 이종 발현; 코팔릴 디포스페이트 합성효소의 이종 발현; 카우렌 합성효소의 이종 발현; 카우렌 산화효소 (예, 피숨 사티붐 카우렌 산화효소)의 이종 발현; 스테비올 합성효소 (카우레노산 수산화효소); 사이토크롬 P450 환원효소의 이종 발현; UGT74G1의 이종 발현; UGT76G1의 이종 발현; UGT85C2의 이종 발현; 91D의 이종 발현; 및 이종 UGT40087 또는 이의 변이체의 이종 발현.
본원에서 이용된, 용어 "자연적으로 존재하는- (naturally occurring)"은 자연에서 발견되는 것을 의미한다. 예를 들어, 자연에서 공급원으로부터 분리될 수 있는 유기체에 존재하고, 실험실에서 인간에 의해 의도적으로 변형되지 않은 카우렌 산화효소는 자연적으로 존재하는 카우렌 산화효소이다. 역으로, 본원에서 이용된 용어 "자연적으로 존재하지 않는- (non-naturally occurring)"은 자연에서 발견되지 않지만, 인간의 개입(human intervention)에 의해 생성되는 것을 의미한다.
용어 "배지"는 배양 배지 및/또는 발효 배지를 의미한다.
용어 "발효 조성물"은 유전적으로 변형된 숙주 세포 및 유전적으로 변형된 숙주 세포에 의해 생산된 생성물 또는 대사체를 포함하는 조성물을 의미한다. 발효 조성물의 예시는 유전적으로 변형된 숙주 세포로부터 생산된 세포, 수성상(aqueous phase) 및 화합물을 포함하는 용기 (예, 플라스크, 플레이트, 또는 발효기)의 전체 내용물일 수 있는 전세포 배양액(whole cell broth)이다.
본원에서 이용된, 용어 "생산량(production)"은 일반적으로, 본원에서 제시된 유전적으로 변형된 숙주 세포에 의해 생산된 스테비올 또는 스테비올 글리코시드의 양을 의미한다. 몇몇 양태에서, 생산량은 숙주 세포에 의한 스테비올 또는 스테비올 글리코시드의 수율로 표현된다. 다른 양태에서, 생산량은 스테비올 또는 스테비올 글리코시드의 생산에 있어, 숙주 세포의 생산성(productivity)으로 표현된다.
본원에서 이용된, 용어 "생산성(productivity)"은 시간에 따른 (시간 당) 숙주 세포가 배양된 발효액의 양 (부피 기준) 당 생산된 스테비올 또는 스테비올 글리코시드의 양 (중량 기준)으로 표현된, 숙주 세포에 의한 스테비올 또는 스테비올 글리코시드의 생산량을 의미한다.
본원에서 이용된, 용어 "수율(yield)"은 중량 기준의, 숙주 세포에 의해 소비된 탄소 공급원(carbon source)의 양 당 생산된 스테비올 또는 스테비올 글리코시드의 양으로 표현된, 숙주 세포에 의한 스테비올 또는 스테비올 글리코시드의 생산량을 의미한다.
본원에서 이용된, 용어 화합물 (예, RebM2, 스테비올 글리코시드, 또는 기타 화합물)의 "검출 불가능한 레벨(undetectable level)"은 화합물을 측정하는 표준 기법에 의해 측정 및/또는 분석되기에 너무 낮은 화합물의 레벨을 의미한다. 예를 들어, 상기 용어는 실시예 6에 기재된 분석적 방법에 의해 검출 가능하지 않은 화합물의 레벨을 포함한다.
용어 "카우렌(kaurene)"은 화합물 카우렌을 의미하며, 카우렌의 임의의 입체 이성질체를 포함한다. 특정 양태에서, 상기 용어는 당해분야에서 엔트 -카우렌(ent-kaurene)으로 공지된 거울상 이성질체를 의미한다. 특정 양태에서, 상기 용어는 하기 화학식 1의 구조에 따른 화합물을 의미한다:
화학식 1
용어 "카우레놀(kaurenol)"은 화합물 카우레놀을 의미하며, 카우레놀의 임의의 입체 이성질체를 포함한다. 특정 양태에서, 상기 용어는 당해분야에서 엔트 -카우레놀(ent-kaurenol)로 공지된 거울상 이성질체를 의미한다. 특정 양태에서, 상기 용어는 하기 화학식 2의 구조에 따른 화합물을 의미한다:
화학식 2
용어 "카우레날(kaurenal)"은 화합물 카우레날을 의미하며, 카우레날의 임의의 입체 이성질체를 포함한다. 특정 양태에서, 상기 용어는 당해분야에서 엔트 -카우레날(ent-kaurenal)로 공지된 거울상 이성질체를 의미한다. 특정 양태에서, 상기 용어는 하기 화학식 3의 구조에 따른 화합물을 의미한다:
화학식 3
용어 "카우레노산(kaurenoic acid)"은 화합물 카우레노산을 의미하며, 카우레노산의 임의의 입체 이성질체를 포함한다. 특정 양태에서, 상기 용어는 당해분야에서 엔트 -카우레노산(ent-kaurenoic acid)으로 공지된 거울상 이성질체를 의미한다. 특정 양태에서, 상기 용어는 하기 화학식 4의 구조에 따른 화합물을 의미한다:
화학식 4
본원에서 이용된, 용어 "스테비올 글리코시드(들)"은 자연적으로 존재하는 스테비올 글리코시드, 예를 들어, 스테비올모노사이드(steviolmonoside), 스테비올바이오사이드(steviolbioside), 루부소사이드(rubusoside), 둘코사이드 B(dulcoside B), 둘코사이드 A, 레바우디오사이드 B(rebaudioside B), 레바우디오사이드 G, 스테비오사이드(stevioside), 레바우디오사이드 C, 레바우디오사이드 F, 레바우디오사이드 A, 레바우디오사이드 I, 레바우디오사이드 E, 레바우디오사이드 H, 레바우디오사이드 L, 레바우디오사이드 K, 레바우디오사이드 J, 레바우디오사이드 M, 레바우디오사이드 D, 레바우디오사이드 N, 레바우디오사이드 O; 합성 스테비올 글리코시드, 예를 들어, 효소적으로 글리코실화된 스테비올 글리코시드; 및 이들의 혼합물;을 포함하나, 이에 한정되는 것은 아닌 스테비올의 글리코시드를 의미한다.
본원에서 이용된, 용어 "변이(체)"는 구체적으로 인용된 "참조" 폴리펩티드와 아미노산 삽입, 결실, 돌연변이 및/또는 치환에 의해 상이한 폴리펩티드를 의미하나 (예, 야생형 서열), 참조 폴리펩티드와 실질적으로 유사한 활성을 유지한다. 몇몇 양태에서, 상기 변이체는 돌연변이 유발(mutagenesis)과 같은 재조합 DNA 기법에 의해 생성된다. 몇몇 양태에서, 변이 폴리펩티드는 이의 참조 폴리펩티드와 하나의 염기성 잔기가 다른 염기성 잔기로 치환되는 것 (즉, Arg이 Lys으로 치환); 하나의 소수성 잔기가 다른 소수성 잔기로 치환되는 것 (즉, Leu이 Ile으로 치환); 또는 하나의 방향족 잔기가 다른 방향족 잔기로 치환되는 것 (즉, Phe이 Ile으로 치환) 등에 의해 상이하다. 몇몇 양태에서, 변이체는 참조 서열의 실질적인 구조적 유사성(structural analogy)을 야기하는 보존적 치환(conservative substitution)이 획득된 유사체(analog)를 포함한다. 이러한 보존적 치환의 예시는, 글루탐산이 아스파르트산으로 치환되는 것 및 이의 역으로 치환되는 것; 글루타민이 아스파라긴으로 치환되는 것 및 이의 역으로 치환되는 것; 세린이 트레오닌으로 치환되는 것 및 이의 역으로 치환되는 것; 리신이 아르기닌으로 치환되는 것 및 이의 역으로 치환되는 것; 또는 이소류신, 발린 또는 류신 중 임의의 것이 서로 치환되는 것;을 포함하나, 이에 한정되는 것은 아니다.
본원에서 이용된, 용어 "서열 일치도(sequence identity)" 또는 "백분율 일치도(percent identity)"는 두 개 이상의 핵산 또는 단백질 서열의 맥락에서 동일하거나, 또는 동일한 아미노산 잔기 또는 뉴클레오티드의 소정의 백분율을 갖는 두 개 이상의 서열 또는 부분서열(subsquecne)을 의미한다. 예를 들어, 비교창(comparison window)을 통해서 최대 유사성(maximum correspondence)을 위해 비교 및 정렬되거나, 또는 매뉴얼 정렬(manual alignment) 및 비쥬얼 인스펙션(visual inspection)에 의해서 또는 서열 비교 알고리즘을 이용하여 측정된 영역으로 지정되는 경우에, 서열은 참조 서열에 대한 소정의 영역에 대해서 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 그 이상의 일치도의 백분율 일치도를 가질 수 있다. 예를 들어, 일치도의 백분율은 "서열 내 동일한 뉴클레오티드 (또는 아미노산 잔기)의 수 ÷ (전체 뉴클레오티드 (또는 아미노산 잔기)의 길이 - 임의의 갭의 길이)"의 비율을 계산함으로써 결정된다.
편의를 위해, 두 서열 사이 일치도의 정도는 당해분야에 공지된 컴퓨터 프로그램 및 수학적 알고리즘을 이용하여 확인될 수 있다. 백분율 서열 일치도를 계산하는 이러한 알고리즘은 일반적으로, 비교 영역에 대해서, 서열 갭과 미스매치(mismatch)를 고려한다. Clustal W (Thompson 외, (1994) Nucleic Acids Res., 22: 4673-4680), ALIGN (Myers 외, (1988) CABIOS, 4: 11-17), FASTA (Pearson 외, (1988) PNAS, 85:2444-2448; Pearson (1990), Methods Enzymol., 183: 63-98) 및 gapped BLAST (Altschul 외, (1997) Nucleic Acids Res., 25: 3389-3402)와 같은 서열을 비교 및 정렬하는 프로그램들은 상기 목적에 유용하다. BLAST 또는 BLAST 2.0 (Altschul 외, J. Mol . Biol . 215:403-10, 1990)은 서열분석 프로그램인 BLASTP, BLASTN, BLASTX, TBLASTN, 및 TBLASTX와 관련해 사용하기 위해, 국립 생명공학 정보 센터(National Center for Biological Information, NCBI)를 포함하는 몇몇 소스(source)로부터, 인터넷상에서 입수 가능하다. 추가 정보는 NCBI 웹사이트에서 찾을 수 있다.
특정 양태에서, 서열 정렬 및 백분율 일치도 계산은 BLAST 프로그램 - 이의 표준, 기본 파라미터(default parameter)를 이용하는 - 을 이용하여 결정될 수 있다. 뉴클레오티드 서열 정렬 및 서열 일치도 계산의 경우, BLASTN 프로그램이 이의 기본 파라미터 [갭 개시 패널티(Gap opening penalty)=5, 갭 연장 패널티(Gap extension penalty)=2, 핵산 매치(Nucleic match)=2, 핵산 미스매치(Nucleic mismatch)=-3, 기댓값(Expectation value) = 10.0, 워드 크기(Word size) = 11, 퀘리 범위 내 최대 매치(Max matches in a query range) = 0]로 이용된다. 폴리펩티드 서열 정렬 및 서열 일치도 계산의 경우, BLASTP 프로그램이 이의 기본 파라미터 [정렬 행렬(Alignment matrix) = BLOSUM62; 갭 비용(Gap costs): 존재(Existence)=11, 연장(Extension)=1; 조성 조정(Compositional adjustments)=조건적 조성 점수(Conditional compositional score), 행렬 조정(matrix adjustment); 기댓값 = 10.0; 워드 사이즈=6; 퀘리 범위 내 최대 매치 = 0]로 이용된다. 대안적으로는, 다음의 프로그램과 파라미터가 이용된다: Align Plus software of Clone Manager Suite, 버전 5 (Sci-Ed 소프트웨어); DNA 비교: 글로벌 비교(Global comparison), 표준 선형 점수계산 행렬(Standard Linear Scoring matrix), 미스매치 패널티=2, 개시 갭 패널티(Open gap penalty)=4, 연장 갭 패널티(Extend gap penalty)=1; 아미노산 비교: 글로벌 비교(Global comparison), BLOSUM 62 점수계산 행렬. 본원에 기재된 양태에서, 서열 일치도는 BLASTN 또는 BLASTP 프로그램 - 이들의 기본 파라미터를 이용하는 - 을 이용하여 계산된다. 본원에 기재된 양태에서, 둘 이상의 서열의 서열 정렬은 제안된 기본 파라미터 [정렬해제 인풋 서열(Dealign input sequences): 없음; Mbed-유사 클러스터링 가이드-트리(Mbed-like clustering guide-tree): 있음; Mbed-유사 클러스터링 반복(Mbed-like clustering iteration): 있음; 컴바인드 반복의 수(number of combined iterations): 기본값(0); 최대 가이드 트리 반복(Max guide tree iterations): 기본값; 최대 HMM 반복(Max HMM iterations): 기본값; 순서(Order): 인풋)]를 이용하는 Clustal W를 이용하여 수행된다.
2. 숙주 세포
카우렌으로부터 카우레노산 (kaurenoic acid, KA)을 고효율로 생산할 수 있는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 숙주 세포는 시작 물질로서 카우렌으로부터 카우레노산을 생산할 수 있다. 특정 양태에서, 숙주 세포는 배양 배지 중 탄소 공급원으로부터 카우레노산을 생산할 수 있다. 특정 양태에서, 숙주 세포는 배양 배지 중 탄소 공급원으로부터 카우레노산을 생산할 수 있고, 상기 카우레노산으로부터 RebA 또는 RebD를 더 생산할 수 있다. 특정 양태에서, 숙주 세포는 상기 RebD로부터 레바우디오사이드 M (rebaudioside M, RebM)을 더 생산할 수 있다.
특정 양태에서, 숙주 세포는 피숨 사티붐 카우렌 산화효소의 효소 활성을 포함한다. 피숨 사티붐 카우렌 산화효소는 고효율로, 카우렌을 카우레노산으로 전환할 수 있다. 특정 양태에서, 피숨 사티붐 카우렌 산화효소는 30%를 초과하는 효율로, 카우렌을 카우레노산으로 전환할 수 있다. 특정 양태에서, 피숨 사티붐 카우렌 산화효소는 35%를 초과하는 효율로, 카우렌을 카우레노산으로 전환할 수 있다. 특정 양태에서, 피숨 사티붐 카우렌 산화효소는 40%를 초과하는 효율로, 카우렌을 카우레노산으로 전환할 수 있다. 특정 양태에서, 피숨 사티붐 카우렌 산화효소는 95%는 초과하는 효율로, 카우렌을 카우레노산으로 전환할 수 있다. 특정 양태에서, 피숨 사 티붐 카우렌 산화효소는 50%를 초과하는 효율로, 카우렌을 카우레노산으로 전환할 수 있다. 특정 양태에서, 피숨 사티붐 카우렌 산화효소는 55%를 초과하는 효율로, 카우렌을 카우레노산으로 전환할 수 있다. 특정 양태에서, 피숨 사티붐 카우렌 산화효소는 약 58%의 효율로 카우렌을 카우레노산으로 전환할 수 있다. 특정 양태에서, 피 숨 사티붐 카우렌 산화효소는 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95%를 초과하는 효율로, 카우렌을 카우레노산으로 전환할 수 있다.
특정 양태에서, 숙주 세포는 30%를 초과하는 효율로, 카우렌을 카우레노산으로 전환할 수 있다. 특정 양태에서, 숙주 세포는 35%를 초과하는 효율로, 카우렌을 카우레노산으로 전환할 수 있다. 특정 양태에서, 숙주 세포는 40%를 초과하는 효율로, 카우렌을 카우레노산으로 전환할 수 있다. 특정 양태에서, 숙주 세포는 45%를 초과하는 효율로, 카우렌을 카우레노산으로 전환할 수 있다. 특정 양태에서, 숙주 세포는 50%를 초과하는 효율로, 카우렌을 카우레노산으로 전환할 수 있다. 특정 양태에서, 숙주 세포는 55%를 초과하는 효율로 카우렌을 카우레노산으로 전환할 수 있다. 특정 양태에서, 숙주 세포는 약 58%의 효율로, 카우렌을 카우레노산으로 전환할 수 있다. 특정 양태에서, 숙주 세포는 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95%를 초과하는 효율로, 카우렌을 카우레노산으로 전환할 수 있다.
전환의 효율은 통상의 기술자에게 분명한 임의의 기법에 의해 측정될 수 있다. 특정 양태에서, 전환의 효율은 카우레노산의 형성에 적합한 조건하에서, 카우렌을 효소 또는 숙주 세포와 접촉시킴으로써 측정될 수 있다. 효율은 생성되는 조성물 중 카우렌과 카우레노산의 총량에 비해, 생산된 카우레노산의 몰량(molar amount)을 비교함으로써 측정될 수 있다. 또한, 효율은 생성되는 조성물 중 카우레노산 및 카우레노산의 하류 생성물(downstream product)의 총량을 카우렌, 카우레놀, 카우레날, 카우레노산, 및 카우레노산의 하류 생성물의 총량에 비교함으로써 측정될 수 있다. 예를 들어, 도 5에 제시된 Ps.KO를 포함하는 균주의 전환 효율은 생성되는 조성물 중 카우레노산과 도 2에 제시된 모든 하류 화합물(downstream compound)의 총량을 카우렌, 카우레놀, 카우레날, 카우레노산 및 도 2에 제시된 모든 하류 화합물 (즉, 스테비올, 1개의 글루코스 + 스테비올, 2개의 글루코스 + 스테비올, 3개의 글루코스 +스테비올, 4개의 글루코스 + 스테비올, 5개의 글루코스 +스테비올, 및 6개의 글루코스 + 스테비올)의 총량에 비교함으로써 측정되었다.
특정 양태에서, 서열번호 1의 아미노산 서열을 포함하는 카우렌 산화효소를 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 실질적으로 동일한 아미노산 서열을 포함하는 카우렌 산화효소를 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 적어도 60% 동일한 아미노산 서열을 포함하는 카우렌 산화효소를 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 적어도 65% 동일한 아미노산 서열을 포함하는 카우렌 산화효소를 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 적어도 70% 동일한 아미노산 서열을 포함하는 카우렌 산화효소를 포함하는 숙주 세포가 본원에 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 적어도 75% 동일한 아미노산 서열을 포함하는 카우렌 산화효소를 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 적어도 80% 동일한 아미노산 서열을 포함하는 카우렌 산화효소를 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 적어도 85% 동일한 아미노산 서열을 포함하는 카우렌 산화효소를 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 적어도 90% 동일한 아미노산 서열을 포함하는 카우렌 산화효소를 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 적어도 95% 동일한 아미노산 서열을 포함하는 카우렌 산화효소를 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 적어도 96% 동일한 아미노산 서열을 포함하는 카우렌 산화효소를 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 적어도 97% 동일한 아미노산 서열을 포함하는 카우렌 산화효소를 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 적어도 98% 동일한 아미노산 서열을 포함하는 카우렌 산화효소를 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 적어도 99% 동일한 아미노산 서열을 포함하는 카우렌 산화효소를 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 적어도 60%, 적어도 99%, 또는 적어도 60% 내지 99% 사이의 임의의 백분율이 동일한 아미노산 서열을 포함하는 카우렌 산화효소를 포함하는 숙주 세포가 본원에서 제시된다.
특정 양태에서, 본원에 기재된 아미노산 서열을 포함하는 카우렌 산화효소를 포함하는 숙주 세포가 본원에서 제시되고, 카우렌을 카우렌으로 전환할 수 있다. 특정 양태에서, 본원에서 기재된 아미노산 서열을 포함하는 카우렌 산화효소를 포함하는 숙주 세포가 본원에서 제시되고, 카우렌, 카우레놀, 및 카우레날 각각의 19번 위치를 산화시킬 수 있다. 특정 양태에서, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 또는 97%를 초과하는 효율로, 카우렌을 카우레노산으로 전환시킬 수 있는, 카우렌 산화효소를 포함하는 숙주 세포가 본원에서 제시되고, 상기 카우렌 산화효소는 서열번호 1의 아미노산 서열에 대해서 적어도 95%의 서열 일치도를 갖는 아미노산 서열을 포함한다.
특정 양태에서, 서열번호 1의 아미노산 서열을 포함하는 피숨 사티붐 카우렌 산화효소를 인코딩하는 핵산을 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 실질적으로 동일한 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 적어도 60% 동일한 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 적어도 65% 동일한 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 적어도 70% 동일한 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 적어도 75% 동일한 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 적어도 80% 동일한 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 적어도 85% 동일한 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 적어도 90% 동일한 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 적어도 95% 동일한 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 적어도 96% 동일한 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 적어도 97% 동일한 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 적어도 98% 동일한 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 1의 아미노산 서열과 적어도 99% 동일한 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 적어도 60%, 적어도 99%, 또는 60% 내지 99% 사이의 임의의 백분율인 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함하는 숙주 세포가 본원에서 제시된다.
특정 양태에서, 서열번호 1의 서열을 갖는 피숨 사티붐 카우렌 산화효소를 인코딩하는 서열번호 14의 뉴클레오티드 서열을 포함하는 이종 핵산을 포함하는 숙주 세포가 본원에서 제시된다. 특정 양태에서, 서열번호 14의 뉴클레오티드 서열과 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 동일한 뉴클레오티드 서열을 포함하는 이종 핵산을 포함하는 숙주 세포가 본원에서 제시된다.
특정 양태에서, 숙주 세포는 상기 기재된 피숨 사티붐 카우렌 산화효소 폴리펩티드의 변이체를 포함한다. 특정 양태에서, 변이체는 피숨 사티붐 카우렌 산화효소 폴리펩티드에 비해서, 최대 15, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개의 아미노산 치환을 포함할 수 있다. 특정 양태에서, 변이체는 피숨 사티붐 카우렌 산화효소 폴리펩티드에 비해서, 최대 15, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개의 보존적 아미노산 치환을 포함할 수 있다. 특정 양태에서, 본원에 기재된 핵산들 중 임의의 핵산은 숙주 세포에 대해서, 예를 들어, 코돈 최적화(codon optimization)에 의해 최적화될 수 있다.
본원에 기재된 양태들에서, 임의의 적합한 방법은 두 개의 폴리펩티드의 대응하는 아미노산 자리(amino acid position) 또는 대응하는 루프 위치(loop location)를 결정하는 데 이용될 수 있다. 특정 양태에서, 카우렌 산화효소의 서열 및 참조 서열인 서열번호 1은 Clustal(W) - 이의 기본 파라미터를 이용하는 - 을 이용하여 정렬될 수 있다. 다른 양태에서, 카우렌 산화효소의 서열과 참조 서열인 서열번호 1은 ExPASy 웹 서버를 통해서, 또는 프로그램인 DeepView (Swiss Pdb-Viewer)로부터 접속 가능한, 단백질 구조 상동성-모델링 서버(protein structure homology-modelling server)인 SWISS-MODEL과 같은 구조적 정렬(structural alignment)을 이용하여 정렬될 수 있다.
특정 양태에서, 카우렌은 도 1c에 제시된 것이다. 특정 양태에서, 피숨 사티붐 카우렌 산화효소 또는 변이 피숨 사티붐 카우렌 산화효소는 C-19에서 카우렌의 산화를 촉매하여, 카우레놀을 형성할 수 있다. 특정 양태에서, 피숨 사티붐 카우렌 산화효소 또는 변이 피숨 사티붐 카우렌 산화효소는 C-19에서 카우레놀의 산화를 촉매하여, 카우레날을 형성할 수 있다. 특정 양태에서, 피숨 사티붐 카우렌 산화효소는 C-19에서 카우레날의 산화를 촉매하여, 카우레노산을 형성할 수 있다. 특정 양태에서, 피숨 사티붐 카우렌 산화효소 또는 변이 피숨 사티붐 카우렌 산화효소는 C-19에서 카우렌의 산화를 촉매하여, 카우레놀을 형성할 수 있고; C-19에서 카우레놀의 산화를 촉매하여, 카우레날을 형성할 수 있으며; C-19에서 카우레날의 산화를 촉매하여, 카우레노산을 형성할 수 있다.
특정 양태에서, RebD는 도 2에 제시된 것이다. 특정 양태에서, 숙주 세포는 카우레노산을 스테비올로 전환할 수 있는 하나 이상의 효소를 더 포함한다. 특정 양태에서, 숙주 세포는 스테비올을 하나 이상의 스테비올 글리코시드로 전환할 수 있는 하나 이상의 효소를 더 포함한다. 특정 양태에서, 숙주 세포는 RebA를 RebD로 전환할 수 있는 하나 이상의 효소를 더 포함한다. 특정 양태에서, 숙주 세포는 RebD를 RebM으로 전환할 수 있는 하나 이상의 효소를 더 포함한다.
숙주 세포의 피숨 사티붐 카우렌 산화효소 또는 임의의 변이 피숨 사티붐 카우렌 산화효소는 카우렌을 기질로 수용하고(accepting), 카우렌의 공급원은 통상의 기술자에게 적합한 것으로 간주되는 임의의 공급원일 수 있다. 특정 양태에서, 피숨 사티붐 카우렌 산화효소 또는 임의의 변이 피숨 사티붐 카우렌 산화효소는 카우렌과 접촉될 수 있다. 특정 양태에서, 숙주 세포는 카우렌과 접촉될 수 있다. 특정 양태에서, 피숨 사티붐 카우렌 산화효소 또는 피숨 사티붐 카우렌 산화효소의 임의의 변이체는 카우렌, 카우레놀, 및 카우레날 중 하나 이상을 포함하는 조성물과 접촉될 수 있다. 특정 양태에서, 조성물은 카우렌을 포함한다. 특정 양태에서, 조성물은 카우레놀을 포함한다. 특정 양태에서, 조성물은 카우레날을 포함한다. 특정 양태에서, 조성물은 스테비아 레바우디아나 잎(leaf)으로부터 분리된 천연 생성물로부터 유래된다. 특정 양태에서, 조성물은 미생물학적으로(microbially) 유래된다. 특정 양태에서, 숙주 세포는 하나 이상의 탄소 공급원을 포함하는 조성물과 접촉될 수 있다.
특정 양태에서, 목적하는 반응을 촉매하는 데 적합한 임의의 변이 피숨 사티 붐 카우렌 산화효소는 당해분야에 공지된 임의의 적합한 방법에 대해서 스크리닝 될 수 있다. 예를 들어, 변이 피숨 사티붐 카우렌 산화효소를 인코딩하는 이종 핵산을 발현시키고, 기질의 목적하는 위치 (예, 카우렌, 카우레놀, 및/또는 카우레날의 C-19 위치)에서 산화를 촉매할 수 있는 기능성 변이 피숨 사티붐 카우렌 산화효소를 생산하는 세포를 스크리닝함으로써, 적합한 변이 피숨 사티붐 카우렌 산화효소가 생체 내에서 분석될 수 있다. 예시적인 스크리닝 방법이 아래의 실시예에서 기재된다. 다른 예시에서, 적합한 변이 피숨 사티붐 카우렌 산화효소는 변이 피숨 사티붐 카우렌 산화효소를 카우렌, 카우레놀, 및/또는 카우레날과 같은 기질과 접촉시킴으로써 시험관 내에서 스크리닝될 수 있다. 이 예시에서, 카우레노산, 스테비올, 또는 RebD와 같은 스테비올 글리코시드의 존재를 검정하는 것은 변이 피숨 사티붐 카우렌 산화효소가 적합한 효소인지 여부를 결정하는 테스트로 이용될 수 있다. 반응은 LC-MS 또는 당해분야 내 기타 공지된 방법에 의해 분석될 수 있다. 예를 들어, 국제 특허공보 WO 제2013/022989호를 참고한다.
특정 양태에서, 변이 피숨 사티붐 카우렌 산화효소가 생체 내에서 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 96%, 또는 97%를 초과하는 효율로, 카우렌을 카우레노산으로 전환할 수 있는 경우에, 이는 카우렌을 카우레노산으로 전환시키는 데 적합한 것으로 고려된다.
특정 양태에서, 변이 피숨 사티붐 카우렌 산화효소가 생체 내에서 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 96%, 또는 97%를 초과하는 효율로, 카우렌을 카우레노산으로 전환할 수 있는 경우에, 이는 카우렌을 카우레놀로 전환시키는 데 적합한 것으로 고려된다.
특정 양태에서, 변이 피숨 사티붐 카우렌 산화효소가 생체 내에서 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 96%, 또는 97%를 초과하는 효율로, 카우레놀을 카우레날로 전환할 수 있는 경우에, 이는 카우레놀을 카우레날로 전환시키는 데 적합한 것으로 고려된다.
특정 양태에서, 변이 피숨 사티붐 카우렌 산화효소가 생체 내에서 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 96%, 또는 97%를 초과하는 효율로, 카우레날을 카우레노산으로 전환할 수 있는 경우에, 이는 카우레날을 카우레노산을 전환하는 데 적합한 것으로 고려된다.
특정 양태에서, 전환 효율이 생체 내에서 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 96%, 또는 97%를 초과하는 경우에, 변이 피숨 사티붐 카우렌 산화효소는 카우렌을 카우레노산으로 전환하는 데 적합한 것으로 고려되고, 상기 전환 효율은 생성되는 조성물 중 카우렌, 카우레놀, 카우레날, 카우레노산, 및 도 2에 제시된 모든 하류 화합물의 총량으로 나뉜, 카우레노산 및 도 2에 제시된 모든 하류 화합물의 총량 (× 100 퍼센트)에 의해 계산된다.
유리한 양태에서, 숙주 세포는 카우렌을 생성할 수 있는 하나 이상의 효소적 경로를 포함할 수 있고, 상기 경로는 개별적으로 또는 함께 이용될 수 있다. 특정 양태에서, 숙주 세포는 제라닐제라닐 디포스페이트를 카우렌으로 전환할 수 있는 하나 이상의 효소를 포함한다. 유용한 효소 및 효소를 인코딩하는 핵산은 통상의 기술자에게 공지되어 있다. 특정 양태에서, 숙주 세포는 제라닐제라닐 디포스페이트를 카우렌으로 전환할 수 있는 하나 이상의 효소를 포함한다. 추가의 유리한 양태에서, 숙주 세포는 카우레노산을 스테비올 및/또는 스테비올 글리코시드로 전환할 수 있는 하나 이상의 효소적 경로를 포함할 수 있고, 상기 경로는 개별적으로 또는 함께 이용될 수 있다. 유용한 효소 및 효소를 인코딩하는 핵산은 통상의 기술자에게 공지되어 있다. 특히 유용한 효소 및 핵산은 아래의 섹션에서 기재되고, 예를 들어, US 제2014/0329281 A1호, US 제2014/0357588 A1호, US 제2015/0159188호, WO 제2016/038095 A2호, 및 US 제2016/0198748 A1호에 추가로 기재되어 있다.
추가의 양태에서, 숙주 세포는 탄소 공급원으로부터 제라닐제라닐 디포스페이트를 생성할 수 있는 하나 이상의 효소를 더 포함한다. 이들은 DXP 경로의 효소 및 MEV경로의 효소를 포함한다. 유용한 효소 및 효소를 인코딩하는 핵산은 통상의 기술자에게 공지되어 있다. 각 경로의 예시적인 효소는 아래에서 기재되고, 예를 들어, US 제2016/0177341 A1호에 추가로 기재되어 있다. 또한, MEV 경로는 도 1d에서 제시된다.
특정 양태에서, 추가의 효소는 천연이다. 유리한 양태에서, 추가의 효소는 이종이다. 특정 양태에서, 두 효소는 하나의 폴리펩티드로 결합될 수 있다.
3. 자연적으로
존재하지 않는
카우렌
산화효소 폴리펩티드 및 핵산
다른 측면에서, 참조 서열 (예, 서열번호 1)에 비해서, 아미노산 잔기의 변형(들)을 포함하고, 카우렌을 카우레노산으로, 카우렌을 카우레놀로, 카우레놀을 카우레날로, 및/또는 카우레날을 카우레노산으로 전환하는 카우렌 산화효소로서 활성을 여전히 유지하는, 자연적으로 존재하지 않는 변이 카우렌 산화효소가 본원에서 제시된다. 특정 양태에서, 자연적으로 존재하지 않는 변이 카우렌 산화효소는 참조 서열 (예, 서열번호 1)에 비해서, 특정 아미노산 자리(position) 또는 위치(location)에 최대 20, 15, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개의 아미노산 치환, 결실, 첨가, 및/또는 삽입을 포함할 수 있다. 특정 양태에서, 자연적으로 존재하지 않는 변이 카우렌 산화효소는 본원에 기재된 변이 카우렌 산화효소 중 임의의 효소를 포함한다.
다른 측면에서, 참조 서열 (예, 서열번호 15)에 비해서, 핵산 잔기의 변형(들)을 포함하고, 단백질로 번역되는 경우에, 단백질이 카우렌을 카우레노산으로, 카우렌을 카우레놀로, 카우레놀을 카우레날로, 및/또는 카우레날을 카우레노산으로 변형하는 카우렌 산화효소로서 활성을 여전히 유지하는, 자연적으로 존재하지 않는 변이 카우렌 산화효소가 본원에서 제시된다. 특정 양태에서, 자연적으로 존재하지 않는 변이 카우렌 산화효소는 본원에 기재된 변이 카우렌 산화효소 중 임의의 효소를 인코딩할 수 있다.
4. 세포주
본원에 제시된 조성물 및 방법에 유용한 숙주 세포는 고세균(archae), 원핵세포, 또는 진핵세포를 포함한다.
적합한 원핵 숙주는 다양한 그람-양성, 그람-음성, 또는 그람-가변성(gram-variable) 박테리아 중 임의의 박테리아를 포함할 수 있으나, 이에 한정되는 것은 아니다. 예시는 다음의 속들(genera)에 속하는 세포를 포함하나, 이에 한정되는 것은 아니다: 아그로박테리움( Agrobacterium ), 알리사이클로바실러 스(Alicyclobacillus), 아나베나 ( Anabaena ), 아나시스티스 ( Anacystis ), 아르트로박터(Arthrobacter), 아조박터 ( Azobacter ), 바실러스 (Bacillus), 브레비박테리 움(Brevibacterium), 크로마티움 ( Chromatium ), 클로스트리듐(Clostridium), 코리네 박테리움(Corynebacterium), 엔테로박터( Enterobacter ), 에르위니아 ( Erwinia ), 에 세리키아(Escherichia), 락토바실러스 (Lactobacillus), 락토코커스(Lactococcus) , 메소리조비움(Mesorhizobium), 메틸로박테리움 ( Methylobacterium ), 마이크로박테리 움(Microbacterium), 포르미디움 ( Phormidium ), 슈도모나스( Pseudomonas ), 로도박 터(Rhodobacter), 로도슈도모나스 ( Rhodopseudomonas ), 로도스피릴 륨(Rhodospirillum), 로도코커스 ( Rhodococcus ), 살모넬라(Salmonella), 세네데스 문(Scenedesmun), 세라티아( Serratia ), 시겔라 ( Shigella ), 스타필로코커 스(Staphlococcus), 스트렙토마이세스 ( Strepromyces ), 사이네코커스 ( Synnecoccus ), 및 자이모모나스(Zymomonas). 원핵 균주의 예시는 다음을 포함하나, 이에 한정되는 것은 아니다: 바실러스 서브틸리스 (Bacillus subtilis ), 바실러스 아밀로리퀴파시엔스 (Bacillus amyloliquefacines ), 브레비박테리움 암모 니아게네스(Brevibacterium ammoniagenes ), 브레비박테리움 임마리오필 룸(Brevibacterium immariophilum ), 클로스트리듐 베이게링키 (Clostridium beigerinckii), 엔테로박터 사카자키 ( Enterobacter sakazakii ), 에세리키아 콜라 이(Escherichia coli ), 락토코커스 락티스 ( Lactococcus lactis ), 메소리조비움 로 티(Mesorhizobium loti ), 슈도모나스 에루지노사 ( Pseudomonas aeruginosa ), 슈도모나스 메발로니 ( Pseudomonas mevalonii ), 슈도모나스 푸디카 ( Pseudomonas pudica ), 로도박터 캡슐라투스 ( Rhodobacter capsulatus ), 로도박터 스페로이데 스(Rhodobacter sphaeroides ), 로도스피릴륨 루브룸 ( Rhodospirillum rubrum ), 살모넬라 엔테리카 (Salmonella enterica ), 살모넬라 티피 (Salmonella typhi ), 살모넬라 티피뮤리움(Salmonella typhimurium ), 시겔라 디센테리아 ( Shigella dysenteriae ), 시겔라 플렉스네리 ( Shigella flexneri ), 시겔라 소네이 ( Shigella sonnei ), 및 스타필로코커스 아우레우스 (Staphylococcus aureus). 특정 양태에서, 숙주 세포는 에세리키아 콜라이 세포이다.
적합한 고세균 숙주는 다음의 속들에 속하는 세포를 포함하나, 이에 한정되는 것은 아니다: 에로피룸 ( Aeropyrum ), 아르케오글로부스 ( Archaeglobus ), 할로박테 리움(Halobacterium), 메타노코커스 ( Methanococcus ), 메타노박테리움 (Methanobacterium), 파이로코커스 ( Pyrococcus ), 술포로부스( Sulfolobus ), 및 써 모플라즈마(Thermoplasma). 고세균 균주의 예시는 다음을 포함하나, 이에 한정되는 것은 아니다: 아르케오글로부스 풀지두스 ( Archaeoglobus fulgidus ), 할로박테리 움 sp .( Halobacterium sp .), 메타노코커스 잔나스키 ( Methanococcus jannaschii ), 메타노박테리움 써모오토트로피쿰 ( Methanobacterium thermoautotrophicum ), 써모플라즈마 아시도필룸 ( Thermoplasma acidophilum ), 써모플라즈마 볼카니 움(Thermoplasma volcanium ), 파이로코커스 호리코시이 ( Pyrococcus horikoshii ), 파이로코커스 어비시 ( Pyrococcus abyssi ), 및 에로피룸 페르닉스 ( Aeropyrum pernix).
적합한 진핵 숙주는 진균 세포, 조류 세포, 곤충 세포, 및 식물 세포를 포함하나, 이에 한정되는 것은 아니다. 몇몇 양태에서, 본 발명의 방법에 유용한 효모는 미생물 기탁처 (예, IFO, ATCC 등)에 기탁되었고, 그 중에서도 다음의 속들에 속하는 효모를 포함한다: 아시쿨로코니듐 ( Aciculoconidium ), 암브로시오지 마(Ambrosiozyma), 아르트로아스쿠스 ( Arthroascus ), 아르씨오지마 ( Arxiozyma ), 아 쉬비아(Ashbya), 바브제비아 ( Babjevia ), 벤싱토니아 ( Bensingtonia ), 보트리오아스 쿠스(Botryoascus), 보트리오지마(Botryozyma),브레타노마이세스 ( Brettanomyces ), 불레라(Bullera), 불레로마이세스 ( Bulleromyces ), 칸디다( Candida ), 시테로마이세 스(Citeromyces), 클라비스포라 ( Clavispora ), 크립토코커스 ( Cryptococcus ), 시스토필로바시디움 (Cystofilobasidium), 데바리오마이세스 ( Debaryomyces ), 덱카라 (Dekkara), 디포다스콥시스 ( Dipodascopsis ), 디포다스커스 ( Dipodascus ), 에니엘라 (Eeniella), 엔도마이콥셀라 ( Endomycopsella ), 에레마스커스 ( Eremascus ), 에레모테시움 ( Eremothecium ), 에리 트로바시디움(Erythrobasidium), 펠로마이세스 ( Fellomyces ), 필로바시디 움(Filobasidium), 갈락토마이세스 ( Galactomyces ), 지오트리쿰 ( Geotrichum ), 귈리 에르몬델라(Guilliermondella), 한세니아스포라 ( Hanseniaspora ), 한세눌라 ( Hansenula ), 하세가와에(Hasegawaea), 홀터만니아 ( Holtermannia ), 호르모아스커스 ( Hormoascus ), 하이포피키아(Hyphopichia), 이사첸키아 ( Issatchenkia ), 클로엑케라 ( Kloeckera ), 클로엑케라스포라(Kloeckeraspora), 클루이베로마이세스 ( Kluyveromyces ), 콘도 아 (Kondoa), 쿠라이시아 ( Kuraishia ), 쿠르츠마노마이세스 ( Kurtzmanomyces ), 류코스포리디움 ( Leucosporidium ), 리포마이세스 ( Lipomyces ), 로데로마이세스(Lodderomyces), 말라세지아 ( Malassezia ), 멧츠쉬니코위 아(Metschnikowia), 므라키아 ( Mrakia ), 마이소지마 ( Myxozyma ), 나드소니 아(Nadsonia), 나카자와에 ( Nakazawaea ), 네마토스포 라(Nematospora), 오가타에 ( Ogataea ), 오스포리디움 ( Oosporidium ), 파키솔렌 (Pachysolen), 파키티코스포라 ( Phachytichospora ), 파피아 ( Phaffia ), 피키아 ( Pichia ), 로도스포리 듐(Rhodosporidium), 로도토룰라 ( Rhodotorula ), 사카로마이세스 ( Saccharomyces ), 사카로마이코데스(Saccharomycodes), 사카로마이콥시스 ( Saccharomycopsis ), 사이토엘라(Saitoella), 사카구치아 ( Sakaguchia ), 사투르노스포라 ( Saturnospora ), 스키조 블라스토스포리온(Schizoblastosporion), 스키조사카로마이세 스(Schizosaccharomyces), 슈완니오마이세스 ( Schwanniomyces ), 스포리디오볼루 스(Sporidiobolus), 스포로볼로마이세스 ( Sporobolomyces ), 스포로파키데르미 아(Sporopachydermia), 스테파노아스커스 ( Stephanoascus ), 스테리그마토마이세 스(Sterigmatomyces), 스테리그마토스포리듐 ( Sterigmatosporidium ), 심바이오타프 리나(Symbiotaphrina), 심포디오마이세스 ( Sympodiomyces ), 심포디오마이콥시 스(Sympodiomycopsis), 토룰라스포라 ( Torulaspora ), 트리코스포리엘 라(Trichosporiella), 트리코스포론 ( Trichosporon ), 트리고놉시스 ( Trigonopsis ), 츠키야에(Tsuchiyaea), 우데니오마이세스 ( Udeniomyces ), 왈토마이세 스(Waltomyces), 위커하미아 ( Wickerhamia ), 위커하미엘라 ( Wickerhamiella ), 윌리옵 시스(Williopsis), 아마다지마 ( Yamadazyma ), 야로위아 ( Yarrowia ), 자이고아스커스 (Zygoascus), 자이고사카로마이세스 ( Zygosaccharomyces ), 자이고윌리옵시 스(Zygowilliopsis), 및 자이고지마(Zygozyma).
몇몇 양태에서, 숙주 미생물은 사카로마이세스 세레비시아 , 피키아 파스토리 스(Pichia pastoris ), 스키조사카로마이세스 폼베 ( Schizosaccharomyces pombe ), 덱 케라 브룩셀렌시스 ( Dekkera bruxellensis ), 클루이베로마이세스 락티 스(Kluyveromyces lactis ) [이전에, 사카로마이세스 락티스(Saccharomyces lactis)라고 칭함], 클루베로마이세스 마르시아누스 ( Kluveromyces marxianus ), 아르술라 아데니니보란스(Arxula adeninivorans ), 또는 한세눌라 폴리모르파 ( Hansenula polymorpha ) [현재, 피키아 앵구스타 (Pichia angusta )로 알려짐]이다. 몇몇 양태에서, 숙주 미생물은 칸디다 리폴리티카(Candida lipolytica ), 칸디다 귈리에르몬디이 ( Candida guilliermondii), 칸디다 크루세이 ( Candida krusei ), 칸디다 슈도트로피칼리 스(Candida pseudotropicalis ), 또는 칸디다 유틸리스(Candida utilis)와 같은 칸디다 속의 균주이다.
특정 양태에서, 숙주 미생물은 사카로마이세스 세레비시아이다. 몇몇 양태에서, 숙주는 빵 효모(Baker's yeast), CBS 7959, CBS 7960, CBS 7961, CBS 7962, CBS 7963, CBS 7964, IZ-1904, TA, BG-1, CR-1, SA-1, M-26, Y-904, PE-2, PE-5, VR-1, BR-1, BR-2, ME-2, VR-2, MA-3, MA-4, CAT-1, CB-1, NR-1, BT-1, 및 AL-1로 이루어진 군으로부터 선택된 사카로마이세스 세레비시아의 균주이다. 몇몇 양태에서, 숙주 미생물은 PE-2, CAT-1, VR-1, BG-1, CR-1, 및 SA-1로 이루어진 군으로부터 선택된 사카로마이세스 세레비시아의 균주이다. 특정 양태에서, 사카로마이 세스 세레비시아의 균주는 PE-2이다. 다른 특정 양태에서, 사카로마이세스 세레비 시아의 균주는 CAT-1이다. 다른 특정 양태에서, 사카로마이세스 세레비시아의 균주는 BG-1이다.
몇몇 양태에서, 숙주 미생물은 산업용 발효에 적합한 미생물이다. 특정 양태에서, 미생물은 산업용 발효 환경의 인식된 스트레스 조건인 높은 용매 농도, 고온, 확장된 기질 활용(substrate utilization), 영양 제한(nutrient limitation), 당과 염으로 인한 삼투 스트레스(osmotic stress), 산성, 설파이트(sulfite) 및 박테리아 오염(bacterial contamination), 또는 이들의 조합하에서 존속되도록 길들어졌다(conditioned).
5. 스테비올
및 스테비올 글리코시드 생합성 경로
몇몇 양태에서, 스테비올 생합성 경로 및/또는 스테비올 글리코시드 생합성 경로는, 이 경로의 하나 이상의 효소를 인코딩하는 폴리뉴클레오티드 및/또는 폴리펩티드를 발현하도록 세포를 조작함으로써, 본원에서 제시된 유전적으로 변형된 숙주 세포에서 활성화된다. 도 1b는 예시적인 스테비올 생합성 경로를 도시한다. 도 2는 제라닐제라닐 피로포스페이트로부터 시작하여, 다양한 스테비올 글리코시드를 생성하는 예시적 스테비올 글리코시드 생합성 경로를 도시한다.
따라서, 몇몇 양태에서, 본원에서 제시된 유전적으로 변형된 숙주 세포는 제라닐제라닐 디포스페이트 합성효소 (geranylgeranyl diphosphate synthase, GGPPS) 활성을 갖는 폴리펩티드를 인코딩하는 이종 폴리뉴클레오티드를 포함한다. 몇몇 양태에서, 본원에서 제시된 유전적으로 변형된 숙주 세포는 코팔릴 디포스페이트 합성효소 또는 엔트 -코팔릴 피로포스페이트 합성효소 (copalyl diphosphate synthase, CDPS; 또한, 엔트-코팔릴 피로포스페이트 합성효소 또는 CPS라고 함) 활성을 갖는, 폴리펩티드를 인코딩하는 이종 폴리뉴클레오티드를 포함한다. 몇몇 양태에서, 본원에서 제시된 유전적으로 변형된 숙주 세포는 카우렌 합성효소 (kaurene synthase, KS; 또한, 엔트-카우렌 합성효소라고 함) 활성을 갖는, 폴리펩티드를 인코딩하는 이종 폴리뉴클레오티드를 포함한다. 특정 양태에서, 본원에서 제시된 유전적으로 변형된 숙주 세포는 본원에 기재된 카우렌 산화효소(kaurene oxidase, KO; 또한, 엔트 -카우렌 19-산화효소라고 함) 활성을 갖는, 폴리펩티드를 인코딩하는 이종 폴리뉴클레오티드를 포함한다. 몇몇 양태에서, 본원에 제시된 유전적으로 변형된 숙주 세포는 스테비올 합성효소 (또한, 엔트-카우레노산 13-수산화효소 또는 KAH라고 함) 활성을 갖는, 폴리펩티드를 인코딩하는 이종 폴리뉴클레오티드를 포함한다. 몇몇 양태에서, 본원에 제시된 유전적으로 변형된 숙주 세포는 사이토크롬 P450 환원효소 (cytochrome P450 reductase, CPR) 활성을 갖는, 폴리펩티드를 인코딩하는 이종 폴리뉴클레오티드를 포함한다.
몇몇 양태에서, 본원에 제시된 유전적으로 변형된 숙주 세포는 UGT74G1 활성을 갖는, 폴리펩티드를 인코딩하는 이종 폴리뉴클레오티드를 포함한다. 몇몇 양태에서, 본원에 제시된 유전적으로 변형된 숙주 세포는 UGT76G1 활성을 갖는, 폴리펩티드를 인코딩하는 이종 폴리뉴클레오티드를 포함한다. 몇몇 양태에서, 본원에 제시된 유전적으로 변형된 숙주 세포는 UGT85C2 활성을 갖는, 폴리펩티드를 인코딩하는 이종 폴리뉴클레오티드를 포함한다. 몇몇 양태에서, 본원에 제시된 유전적으로 변형된 숙주 세포는 UGT91D 활성을 갖는, 폴리펩티드를 인코딩하는 이종 폴리뉴클레오티드를 포함한다. 몇몇 양태에서, 본원에 제시된 유전적으로 변형된 숙주 세포는 UDP 글리코실 전이효소 활성을 갖는, 폴리펩티드를 인코딩하는 이종 폴리뉴클레오티드를 포함한다.
특정 양태에서, 숙주 세포는 변이체를 포함한다. 특정 양태에서, 변이체는 관련 폴리펩티드에 비해서, 최대 15, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개의 아미노산 치환을 포함할 수 있다. 특정 양태에서, 변이체는 참조 폴리펩티드에 비해서, 최대 15, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개의 보존적 아미노산 치환을 포함할 수 있다. 특정 양태에서, 본원에 기재된 핵산 중 임의의 핵산은 숙주 세포에 대해서 최적화, 예를 들어, 코돈 최적화될 수 있다.
스테비올 생합성 경로 및/또는 스테비올 글리코시드 생합성 경로의 예시적 핵산 및 효소가 아래에 기재된다.
5.1. 제라닐제라닐
디포스페이트
합성효소 (
Geranylgeranyl
diphosphate
synthase,
GGPPS
)
제라닐제라닐 디포스페이트 합성효소 (EC 2.5.1.29)는 파르네실 피로포스페이트를 제라닐제라닐 디포스페이트로 전환하는 것을 촉매한다. 효소의 설명적인 예시는 다음을 포함한다: 스테비아 레바우디아나의 효소 (수탁번호 ABD92926), 지베렐라 푸지쿠로이 ( Gibberella fujikuroi )의 효소 (수탁번호 CAA75568), 무스 무스 쿨루스(Mus musculus )의 효소 (수탁번호 AAH69913), 탈라시오시라 슈도나나 (Thalassiosira pseudonana )의 효소 (수탁번호 XP_002288339), 스트렙토마이세스 클라불리저러스(Streptomyces clavuligerus )의 효소 (수탁번호 ZP_05004570), 술풀 로부스 아시도칼다리우스 ( Sulfulobus acidocaldarius )의 효소 (수탁번호 BAA43200), 시네코코커스 sp .( Synechococcus sp .)의 효소 (수탁번호 ABC98596), 아라비돕시스 탈리아나(Arabidopsis thaliana)의 효소 (수탁번호 NP_195399), 브라케 스리아 트리스포라(Blakeslea trispora)의 효소 (수탁번호 AFC92798.1) 및 US 제2014/0329281 A1호의 효소. 이들 효소를 인코딩하는 핵산은 본원에 제시된 세포 및 방법에 유용하다. 특정 양태에서, 이들 GGPPS 핵산들 중 적어도 하나에 대해서, 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도를 갖는, 핵산을 이용하는 세포 및 방법이 본원에서 제시된다. 특정 양태에서, 이들 GGPPS 효소들 중 적어도 하나에 대해서, 적어도 80%, 85%, 90%, 95%의 서열 일치도를 갖는, 폴리펩티드를 인코딩하는 핵산을 이용하는 세포 및 방법이 본원에서 제시된다.
5.2 코팔릴
디포스페이트
합성효소 (
Copalyl
diphosphate
synthase
, CDPS)
코팔릴 디포스페이트 합성효소 (EC 5.5.1.13)는 파르네실 피로포스페이트를 제라닐제라닐 디포스페이트로 전환하는 것을 촉매한다. 효소의 설명적 예시는 스테비아 레바우디아나의 효소 (수탁번호 AAB87091), 스트렙토마이세스 클라불리저러 스의 효소 (수탁번호 EDY51667), 브래디리조비움 자포니쿰 ( Bradyrhizobium japonicum)의 효소 (수탁번호 AAC28895.1), 제아 마이스(Zea mays)의 효소 (수탁번호 AY562490), 아라비돕시스 탈리아나의 효소 (수탁번호 NM_116512), 오리자 사티 바(Oryza sativa)의 효소 (수탁번호 Q5MQ85.1) 및 US 제2014/0329281 A1호의 효소를 포함한다. 이들 효소를 인코딩하는 핵산은 본원에서 제시된 세포 및 방법에 유용하다. 특정 양태에서, 이들 CDPS 핵산들 중 적어도 하나에 대해서, 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도를 갖는, 핵산을 이용하는 세포 및 방법이 본원에서 제시된다. 특정 양태에서, 이들 CDPS 효소들 중 적어도 하나에 대해서, 적어도 80%, 95%, 90%, 또는 95%의 서열 일치도를 갖는, 폴리펩티드를 인코딩하는 핵산을 이용하는 세포 및 방법이 본원에서 제시된다.
5.3 카우렌
합성효소 (
Kaurene
Synthase
, KS)
카우렌 합성효소 (EC 4.2.3.19)는 코팔릴 디포스페이트를 카우렌 및 디포스페이트로 전환하는 것을 촉매한다. 효소의 설명적 예시는 다음을 포함한다: 브래디리조비움 자포니쿰의 효소 (수탁번호 AAC28895.1), 파에오스파에리아 sp.(Phaeosphaeria sp .)의 효소 (수탁번호 O13284), 아라비돕시스 탈리아나의 효소 (수탁번호 Q9SAK2), 피세아 글라우카(Picea glauca)의 효소 (수탁번호 ADB55711.1) 및 US 제2014/0329281 A1호의 효소. 이들 효소를 인코딩하는 핵산은 본원에 제시된 세포 및 방법에 유용하다. 특정 양태에서, 이들 KS 핵산들 중 적어도 하나에 대해서, 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도를 갖는, 핵산을 이용하는 세포 및 방법이 본원에서 제시된다. 특정 양태에서, 이들 KS 효소들 중 적어도 하나에 대해서, 적어도 80%, 85%, 85%, 90%, 또는 95%의 서열 일치도를 갖는, 폴리펩티드를 인코딩하는 핵산을 이용하는 세포 및 방법이 본원에서 제시된다.
5.4 이중
기능성(
bifunctional
)
코팔릴
디포스페이트
합성효소 (
CDPS
) 및 카우렌 합성효소 (KS)
CDPS-KS 이중 기능성 효소 (EC 5.5.1.13 및 EC 4.2.3.19)가 또한 이용될 수 있다. 효소의 설명적 예시는 다음을 포함한다: 포몹시스 아미그달리(Phomopsis amygdali)의 효소 (수탁번호 BAG30962), 피스코미트렐라 파텐스(Physcomitrella patens)의 효소 (수탁번호 BAF61135), 지베렐라 푸지쿠로이의 효소 (수탁번호 Q9UVY5.1) 및 US 제2014/0329281 A1호의 효소, US 제2014/0357588 A1호의 효소, US 제2015/0159188호의 효소, 및 WO 제2016/038095 A2호의 효소. 이들 효소를 인코딩하는 핵산은 본원에 제시된 세포 및 방법에 유용하다. 특정 양태에서, 이들 CDPS-KS 핵산들 중 적어도 하나에 대해서, 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도를 갖는, 핵산을 이용하는 세포 및 방법이 본원에서 제시된다. 특정 양태에서, 이들 CDPS-KS 효소들 중 적어도 하나에 대해서, 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도를 갖는, 폴리펩티드를 인코딩하는 핵산을 이용하는 세포 및 방법이 본원에서 제시된다.
5.5
엔트
-
카우렌
산화효소 (KO)
엔트-카우렌 산화효소 (EC 1.14.13.78; 또한, 카우렌 산화효소라고 함)가 본원에서 기재된다. 이들 효소를 인코딩하는 핵산은 본원에 제시된 세포 및 방법에 유용하다. 특정 양태에서, 이들 카우렌 산화효소 핵산들 중 적어도 하나에 대해서, 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도를 갖는, 핵산을 이용하는 세포 및 방법이 본원에서 제시된다. 특정 양태에서, 이들 카우렌 산화효소들 중 적어도 하나에 대해서, 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도를 갖는, 폴리펩티드를 인코딩하는 핵산을 이용하는 세포 및 방법이 본원에서 제시된다.
5.6. 스테비올
합성효소 (
KAH
)
스테비올 합성효소, 또는 카우레노산 수산화효소 (KAH), (EC 1.14.13)는 카우레노산이 스테비올로 전환되는 것을 촉매한다. 효소의 설명적 예시는 다음을 포함한다: 스테비아 레바우디아나의 효소 (수탁번호 ACD93722), 스테비아 레바우디아 나의 효소 (서열번호 10), 아라비돕시스 탈리아나의 효소 (수탁번호 NP_197872), 비티스 비니페라(Vitis vinifera)의 효소 (수탁번호 XP_002282091), 메디카고 트룬 쿨라타(Medicago trunculata )의 효소(수탁번호 ABC59076), 및 US 제2014/0329281 A1호의 효소, US 제2014/0357588 A1호의 효소, US 제2015/0159188호의 효소, 및 WO 제2016/038095 A2호의 효소. 이들 효소를 인코딩하는 핵산은 본원에 제시된 세포 및 방법에 유용하다. 특정 양태에서, 이들 KAH 핵산들 중 적어도 하나에 대해서, 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도를 갖는, 핵산을 이용하는 세포 및 방법이 본원에서 제시된다. 특정 양태에서, 이들 KAH 효소들 중 적어도 하나에 대해서, 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도를 갖는, 폴리펩티드를 인코딩하는 핵산을 이용하는 세포 및 방법이 본원에서 제시된다.
5.7 사이토크롬
P450 환원효소 (CPR)
사이토크롬 P450 환원효소 (EC 1.6.2.4)는 상기 기재된 KO 및/또는 KAH의 활성을 보조하거나 또는 용이하게 할 수 있다. 효소의 설명적 예시는 다음을 포함한다: 스테비아 레바우디아나의 효소 (수탁번호 ABB88839), 아라비돕시스 탈리아나의 효소 (수탁번호 NP_194183), 지베렐라 푸지쿠로이의 효소 (수탁번호 CAE09055), 아 르테미시아 아누아(Artemisia annua)의 효소 (수탁번호 ABC47946.1) 및 US 제2014/0329281 A1호의 효소, US 제2014/0357588 A1호의 효소, US 제2015/0159188호의 효소, 및 WO 제2016/038095 A2호의 효소. 이들 효소를 인코딩하는 핵산은 본원에서 제시된 세포 및 방법에 유용하다. 특정 양태에서, 이들 CPR 핵산들 중 적어도 하나에 대해서, 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도를 갖는, 핵산을 이용하는 세포 및 방법이 본원에서 제시된다. 특정 양태에서, 이들 CPR 효소들 중 적어도 하나에 대해서, 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도를 갖는, 폴리펩티드를 인코딩하는 핵산을 이용하는 세포 및 방법이 본원에서 제시된다.
5.8. UDP
글리코실
전이효소 74G1 (
UGT74G1
)
UGT74G1은 우리딘 5'-디포스포 글리코실: 스테비올 19-COOH 전이효소 및 우리딘 5'-디포스포 글루코실: 스테비올-13-O-글루코시드 19-COOH 전이효소로서 작용할 수 있다. 도 2에서 제시된 대로, UGT74G1은 스테비올을 19-글리코시드로 전환할 수 있다. 또한, UGT74G1은 스테비올모노사이드를 루부소사이드로 전환할 수 있다. 또한, UGT74G1은 스테비올바이오사이드를 스테비오사이드로 전환할 수 있다. 효소의 설명적 예시는 스테비아 레바우디아나의 효소 (예, Richman 외, 2005, Plant J. 41: 56-67 및 US 제2014/0329281호 및 WO 제2016/038095 A2호 및 수탁번호 AAR06920.1의 효소)를 포함한다. 이들 효소를 인코딩하는 핵산은 본원에 제시된 세포 및 방법에 유용하다. 특정 양태에서, 이들 UGT74G1 핵산들 중 적어도 하나에 대해서, 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도를 갖는, 핵산을 이용하는 세포 및 방법이 본원에서 제시된다. 특정 양태에서, 이들 UGT74G1 효소들 중 적어도 하나에 대해서, 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도를 갖는, 폴리펩티드를 인코딩하는 핵산을 이용하는 세포 및 방법이 본원에서 제시된다.
5.9. UDP
글리코실
전이효소 76G1 (
UGT76G1
)
UGT76G1은 글루코스 모이어티(glucose moiety)를 수용 분자(acceptor molecule)인 스테비올 1,2 글리코시드의 C-13-O-글루코스의 C-3'으로 전이시킬 수 있다. 따라서, UGT76G1은 우리딘 5'-디포스포 글루코실: 스테비올 13-O-1,2 글루코시드 C-3' 글루코실 전이효소 및 우리딘 5'-디포스포 글루코실: 스테비올-19-O-글루코스, 13-O-1,2 바이오사이드 C-3' 글루코실 전이효소로 작용할 수 있다. 도 2에서 제시된 대로, UGT76G1은 스테비올바이오사이드를 RebB로 전환할 수 있다. 또한, UGT76G1은 스테비오사이드를 RebA로 전환할 수 있다. 또한, UGT76G1은 RebD를 RebM으로 전환할 수 있다. 효소의 설명적 예시는 스테비아 레바우디아나의 효소 (예, Richman 외, 2005, Plant J. 41: 56-67 및 US 제2014/0329281 A1호 및 WO 제2016/038095 A2호 및 수탁번호 AAR06912.1의 효소)를 포함한다. 이들 효소를 인코딩하는 핵산은 본원에 제시된 세포 및 방법에 유용하다. 특정 양태에서, 이들 UGT76G1 핵산들 중 적어도 하나에 대해서, 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도를 갖는, 핵산을 이용하는 세포 및 방법이 본원에서 제시된다. 특정 양태에서, 이들 UGT76G1 효소들 중 적어도 하나에 대해서, 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도를 갖는, 폴리펩티드를 인코딩하는 핵산을 이용하는 세포 및 방법이 본원에서 제시된다.
5.10. UDP
글리코실
전이효소
85C2
(
UGT85C2
)
UGT85C2는 우리딘 5'-디포스포글루코실:스테비올 13-OH 전이효소, 및 우리딘 5'-디포스포글루코실:스테비올-19-O-글루코시드 13-OH 전이효소로 작용할 수 있다. 따라서, 도 2에 제시된 대로, UGT85C2는 스테비올을 스테비올모노사이드로 전환할 수 있고, 또한, 19-글리코시드를 루부소사이드로 전환할 수 있다. 효소의 설명적 예시는 스테비아 레바우디아나 효소 (예, Richman 외, 2005, Plant J. 41: 56-67 및 US 제2014/0329281 A1호 및 WO 제2016/038095 A2호 및 수탁번호 AAR06916.1의 효소)를 포함한다. 이들 효소를 인코딩하는 핵산은 본원에서 제시된 세포 및 방법에 유용하다. 특정 양태에서, 이들 UGT85C2 핵산들 중 적어도 하나에 대해서, 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도를 갖는, 핵산을 이용하는 세포 및 방법이 본원에서 제시된다. 특정 양태에서, 이들 UGT85C2 효소들 중 적어도 하나에 대해서, 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도를 갖는, 폴리펩티드를 인코딩하는 핵산을 이용하는 세포 및 방법에 본원에서 제시된다.
5.11. UDP
-
글리코실
전이효소 91D (
UGT91D
)
UGT91D는 우리딘 5'-디포스포글루코실:스테비올-13-O-글루코시드 전이효소로 작용하고, 글루코스 모이어티를 수용 분자인 스테비올-13-O-글루코시드 (스테비올모노사이드)의 13-O-글루코스의 C-2'로 전이하여, 스테비오바이오사이드(steviobioside)를 생산할 수 있다. 또한, UGT91D는 도 2에 제시된 대로, 우리딘 5'-디포스포글루코실:루부소사이드 전이효소로 작용하고, 글루코스 모이어티를 수용 분자인 루부소사이드의 13-O-글루코스의 C-2'에 전이하여, 스테비오사이드를 생산할 수 있다. 또한, UGT91D는 UGT91D2, UGT91D2e, 또는 UGT91D-like3이라고 한다. UGT91D 효소의 설명적 예시는 스테비아 레바우디아나의 효소(예, 수탁번호 ACE87855.1을 갖는 UGT 서열, US 제2014/0329281 A1호, WO 제2016/038095 A2호, 및 서열번호 7의 효소)를 포함한다. 이들 효소를 인코딩하는 핵산은 본원에 제시된 세포 및 방법에 유용하다. 특정 양태에서, 이들 UGT91D 핵산들 중 적어도 하나에 대해서, 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도를 갖는, 핵산을 이용하는 세포 및 방법이 본원에서 제시된다. 특정 양태에서, 이들 UGT91D 효소들 중 적어도 하나에 대해서, 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도를 갖는, 폴리펩티드를 인코딩하는 핵산을 이용하는 세포 및 방법이 본원에서 제시된다.
5.12. RebA를
RebD로
전환할 수 있는
우리딘
디포스페이트
의존성
글리코
실 전이효소 (UGT
AD
)
우리딘 디포스페이트-의존성 글리코실 전이효소 (UGTAD)는 도 2에 제시된 대로, RebA의 19-O-글루코스의 C-2' 위치에 글루코스 모이어티를 전이하여, RebD를 생산할 수 있다. 또한, UGTAD는 스테비오사이드의 19-O-글루코스의 C-2' 위치에 글루코스 모이어티를 전이하여, RebE를 생산할 수 있다. UGT의 유용한 예시는 오리자 사티바로부터 수득된 Os_UGT_91C1 (또한, Houghton-Larsen 외, WO 제2013/022989 A2호에서 EUGT11; XP_015629141.1이라고 함) 및 솔라눔 리코페르시 쿰(Solanum lycopersicum )으로부터 수득된 Sl_UGT_101249881 (또한, Markosyan 외, WO 제2014/193888 A1호에서 UGTSL2; XP_004250485.1이라고 함)을 포함한다. 추가의 유용한 UGT는 UGT40087 (XP_004982059.1), sr.UGT_9252778 (서열번호 16), Bd_UGT10840 (XP_003560669.1), Hv_UGT_V1 (BAJ94055.1), Bd_UGT10850 (XP_010230871.1), 및 Ob_UGT91B1_like (XP_006650455.1)를 포함한다. 임의의 UGT 또는 UGT 변이체는 본원에 기재된 조성물 및 방법에 이용될 수 있다. 이들 효소를 인코딩하는 핵산은 본원에서 제시된 세포 및 방법에 유용하다. 특정 양태에서, UGT들 중 적어도 하나에 대해서, 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도를 갖는, 핵산을 이용하는 세포 및 방법이 본원에서 제시된다. 특정 양태에서, 이들 UGT들 중 적어도 하나에 대해서, 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도를 갖는, 폴리펩티드를 인코딩하는 핵산을 이용하는 세포 및 방법이 본원에서 제시된다. 특정 양태에서, 본원에 기재된 UGT 변이체를 인코딩하는 핵산이 본원에서 제시된다.
특정 양태에서, 유전적으로 변형된 숙주 세포는 UGT40087의 서열(예, 서열번호 17 또는 서열번호 18)에 대해서 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도를 갖는, 아미노산 서열을 포함하는 UDP-글리코실 전이효소를 인코딩하는 이종 핵산을 포함한다. 특정 양태에서, 유전적으로 변형된 숙주 세포는 90%, 95%, 96%, 또는 97%를 초과하는 효율로, RebA를 RebD로 전환할 수 있다. 특정 양태에서, 유전적으로 변형된 숙주 세포는 당 수용 도메인(sugar acceptor domain)을 포함하는 UDP-글리코실 전이효소를 포함하고, 상기 당 수용 도메인의 아미노산 서열은 서열번호 17 또는 서열번호 18의 당 수용 도메인의 아미노산 서열에 대해서, 적어도 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 일치도를 가진다. 특정 양태에서, 유전적으로 변형된 숙주 세포는 loop1 아미노산 서열, 변이 loop1 아미노산 서열, loop2 아미노산 서열, 변이 loop2 아미노산 서열, loop3_1 아미노산 서열, 변이 loop3_1 아미노산 서열, loop3_2 아미노산 서열, 변이 loop3_2 아미노산 서열, loop4_1 아미노산 서열, 변이 loop4_1 아미노산 서열, loop4_2 아미노산 서열, 또는 이들의 임의의 조합을 포함하는 UDP-글리코실 전이효소를 포함한다. 특정 양태에서, 유전적으로 변형된 숙주 세포는 서열번호 17 또는 서열번호 18의 당 수용 도메인에 대해서, 적어도 61%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95%의 서열 일치도를 갖는, 아미노산 서열을 포함하는 UDP-글리코실 전이효소를 포함하고, 서열번호 17 또는 서열번호 18의 loop4_1 아미노산 서열을 더 포함한다.
본원에서 이용된, 용어 "변이 loop1" 아미노산 서열은 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 또는 10개의 아미노산 삽입, 결실, 돌연변이 및/또는 치환에 의해 서열번호 17 또는 18의 참조 loop1 아미노산 서열과 상이하지만 (또는 서열번호 28의 서열을 갖는 UGT40087의 변형된 loop1 서열), 각각 서열번호 17 또는 18의 loop1 아미노산 서열 위치에 대응하는 위치에 삽입된 변이 loop1 아미노산 서열을 포함하는 UDP-글리코실 전이효소가 RebA를 RebD로 전환하는 것 및/또는 스테비오사이드를 RebE로 전환하는 것의 촉매를 허용하는 아미노산 서열을 의미한다.
본원에서 이용된, 용어 "변이 loop2" 아미노산 서열은 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 또는 10개의 아미노산 삽입, 결실, 돌연변이, 및/또는 치환에 의해 서열번호 17 또는 18의 참조 loop2 아미노산 서열과 상이하지만, 각각 서열번호 17 또는 18의 loop2 아미노산 서열 위치에 대응하는 위치에 삽입된 변이 loop2 아미노산 서열을 포함하는 UDP-글리코실 전이효소가 RebA를 RebD로 전환하는 것 및/또는 스테비오사이드를 RebE로 전환하는 것의 촉매를 허용한다.
본원에서 이용된, "변이 loop3_1" 아미노산 서열은 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 또는 10개의 아미노산 삽입, 결실, 돌연변이, 및/또는 치환에 의해 서열번호 17 또는 18의 참조 loop3_1 아미노산 서열과 상이하지만, 서열번호 17 또는 18의 loop3_1 아미노산 서열 위치에 대응하는 위치에 삽입된 변이 loop3_1 아미노산 서열을 포함하는 UDP-글리코실 전이효소가 RebA를 RebD로 전환하는 것 및/또는 스테비오사이드를 RebE로 전환하는 것의 촉매를 허용하는 아미노산 서열을 의미한다. 본원에서 이용된, 용어 "변이 loop3_2" 아미노산 서열은 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 또는 10개의 아미노산 삽입, 결실, 돌연변이, 및/또는 치환에 의해 서열번호 17 또는 18의 참조 loop3_2 아미노산 서열과 상이하지만, 각각 서열번호 17 또는 18의 loop3_2 아미노산 서열 위치에 대응하는 위치에 삽입된 변이 loop3_2 아미노산 서열을 포함하는 UDP-글리코실 전이효소가 RebA를 RebD로 전환하는 것 및/또는 스테비오사이드를 RebE로 전환하는 것의 촉매를 허용하는 아미노산 서열을 의미한다. 특정 양태에서, 변이 loop3_2 아미노산 서열은 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 또는 최대 30개의 아미노산 삽입, 결실, 돌연변이, 및/또는 치환에 의해, 참조 loop3_2 아미노산 서열과 상이하다.
본원에서 이용된, 용어 "변이 loop4_1" 아미노산 서열은 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 또는 최대 30개의 아미노산 삽입, 결실, 돌연변이, 및/또는 치환에 의해, 서열번호 17 또는 18의 참조 loop4_1 아미노산 서열과 상이하지만, 서열번호 17 또는 18의 loop4_1 아미노산 위치에 대응하는 위치에 삽입된 변이 loop4_1 서열을 포함하는 UDP-글리코실 전이효소가 RebA가 RebD로 전환되는 것 및/또는 스테비오사이드를 RebE로 전환하는 것의 촉매를 허용하는 아미노산 서열을 의미한다.
특정 양태에서, 숙주 세포는 UGT40087의 기능성 도메인을 포함하고, 상기 UGT40087은 서열번호 17 또는 서열번호 18의 아미노산 서열을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 아미노산 서열을 포함하는 UGT40087의 N-말단 당 수용 도메인(N-terminal sugar acceptor domain)을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 아미노산 서열을 포함하는 UGT40087의 C-말단 당 공여 도메인(C-terminal sugar donor domain)을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, UGT40087의 당 수용 도메인은 서열번호 18의 아미노산 자리 1 내지 214 (서열번호 17의 아미노산 자리 1 내지 215에 대응함) 부근을 포함한다. 특정 양태에서, UGT40087의 당 공여 도메인은 서열번호 18의 아미노산 자리 215 내지 435 (서열번호 17의 아미노산 자리 216 내지 436에 대응함) 부근을 포함한다. 특정 양태에서, UGT40087의 당 수용 도메인은 서열번호 17의 아미노산 자리 1 내지 215 부근을 포함한다. 특정 양태에서, 당 공여 도메인은 서열번호 17의 아미노산 자리 216 내지 436 부근을 포함한다. 특정 양태에서, UGT40087의 당 수용 도메인 및 당 공여 도메인은 서열번호 18에 관하여, 각각 1 내지 214 또는 215 내지 435보다 더 좁은 아미노산 잔기의 범위를 포함한다. 특정 양태에서, UGT40087의 당 수용 도메인 및 당 공여 도메인은 서열번호 17에 관하여, 각각 1 내지 215 또는 216 내지 436보다 더 좁은 아미노산 잔기의 범위를 포함한다.
특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 실질적으로 동일한 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 60% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 65% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 70% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 75% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 80% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 85% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 90% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 95% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 96% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 97% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 98% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 99% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 60%, 적어도 99%, 또는 60% 내지 90% 사이의 임의의 백분율이 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 숙주 세포가 본원에서 제시된다.
특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열을 포함하는 UGT40087을 인코딩하는 핵산을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열과 실질적으로 동일한 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 60% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 65% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 70% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 75% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 80% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 85% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 90% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 95% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 96% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 97% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 98% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 99% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함한다.
특정 양태에서, UGT40087 및 다른 UDP-글리코실 전이효소의 3차원 모델링된 구조가 비교 및 분석되는 경우에, 이들은 N-말단 당 수용 도메인에서 유의한 구조적 차이점을 지닌 4개의 루프 (즉, loop1, loop2, loop3, 및 loop4)를 드러냈다. 2개의 UGT 사이에서 대응하는 루프 서열의 교환으로부터 획득된 실험 결과는 UGT40087의 loop1, loop2, loop3_1, loop3_2, 및 loop4_1이, RebA를 RebD로 전환시킬 수 있는 다른 UDP-글리코실 전이효소로부터 비롯된 이들의 각각 대응하는 루프 서열로 치환될 수 있다는 것을 나타냈다. 이들 양태에서, 두 버전의 loop3 (즉, loop3_1 및 loop3_2) 및 loop_4 (즉, loop4_1 및 loop4_2)가 2개의 가능한 루프 길이를 고려하여 설계되었다.
따라서, 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 일치하는 아미노산 서열을 포함하는 UDP-글리코실 전이효소를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 일치하는 아미노산 서열을 포함하는 UDP-글리코실 전이효소를 인코딩하는 이종 핵산을 포함한다. 특정 양태에서, UDP-글리코실 전이효소는 UGT40087 (즉, 서열번호 17 또는 18)의 loop1 아미노산 서열을, 각각 서열번호 17 또는 18의 loop1 위치에 대응하는 UDP-글리코실 전이효소의 위치에서 더 포함한다. 특정 양태에서, 서열번호 17 또는 18의 loop1 아미노산 서열은 서열번호 30의 아미노산 서열을 가진다. 특정 양태에서, loop1 아미노산 서열은 서열번호 28의 서열을 가진다. 특정 양태에서, UDP-글리코실 전이효소는 변이 loop1 아미노산 서열을, 각각 서열번호 17 또는 18의 loop1 위치에 대응하는 UDP-글리코실 전이효소의 위치에서 더 포함한다. 변이 loop1 아미노산 서열은 서열번호 17 또는 18의 참조 loop1 아미노산 서열 또는 서열번호 28을 갖는 loop1 아미노산 서열과 상이하지만, 변이 loop1 아미노산을 포함하는 UDP-글리코실 전이효소가, RebA를 RebD로 전환하고/하거나 스테비오사이드를 RebE로 전환하는 이의 활성을 유지하도록 허용하는 아미노산 서열을 의미한다.
특정 양태에서, UDP-글리코실 전이효소는 UGT40087 (즉, 서열번호 17 또는 18)의 loop2 아미노산 서열을, 각각 서열번호 17 또는 18의 loop2 위치에 대응하는 UDP-글리코실 전이효소의 위치에서 더 포함한다. 특정 양태에서, 서열번호 17 또는 18의 loop2 아미노산 서열은 서열번호 24의 아미노산 서열을 가진다. 특정 양태에서, UDP-글리코실 전이효소는 변이 loop2 아미노산 서열을, 각각 서열번호 17 또는 18의 loop2 위치에 대응하는 UDP-글리코실 전이효소의 위치에서 더 포함한다. 변이 loop2 아미노산 서열은 서열번호 17 또는 18의 참조 loop2 아미노산 서열과 상아하지만, 변이 loop2 아미노산을 포함하는 UDP-글리코실 전이효소가 RebA를 RebD로 전환하고/하거나 스테비오사이드를 RebE로 전환하는 이의 활성을 유지하도록 허용하는 아미노산 서열을 의미한다.
특정 양태에서, UDP-글리코실 전이효소는 UGT40087 (즉, 서열번호 17 또는 18)의 loop3_1 아미노산 서열을, 각각 서열번호 17 또는 18의 loop3_1 위치에 대응하는 UDP-글리코실 전이효소의 위치에서 더 포함한다. 특정 양태에서, 서열번호 17 또는 18의 loop3_1 아미노산 서열은 서열번호 25의 아미노산 서열을 가진다. 특정 양태에서, UDP-글리코실 전이효소는 변이 loop3_1 아미노산 서열을, 각각 서열번호 17 또는 18의 loop3_1 위치에 대응하는 UDP-글리코실 전이효소의 위치에서 더 포함한다. 변이 loop3_1 아미노산 서열은 서열번호 17 또는 18의 참조 loop3_1 아미노산 서열과 상이하지만, 변이 loop3_1 아미노산을 포함하는 UDP-글리코실 전이효소가 RebA를 RebD로 전환하고/하거나 스테비오사이드를 RebE로 전환하는 이의 활성을 유지하도록 허용하는 아미노산 서열을 의미한다.
특정 양태에서, UDP-글리코실 전이효소는 UGT40087 (즉, 서열번호 17 또는 18)의 loop3_2 아미노산 서열을, 각각 서열번호 17 또는 18의 loop3_2 위치에 대응하는 UDP-글리코실 전이효소의 위치에서 더 포함한다. 특정 양태에서, 서열번호 17 또는 18의 loop3_2 아미노산 서열은 서열번호 26의 아미노산 서열을 가진다. 특정 양태에서, UDP-글리코실 전이효소는 변이 loop3_2 아미노산 서열을, 각각 서열번호 17 또는 18의 loop3_2 위치에 대응하는 UDP-글리코실 전이효소의 위치에서 더 포함한다. 변이 loop3_2 아미노산 서열은 서열번호 17 또는 18의 참조 loop3_2 아미노산 서열과 상이하지만, 변이 loop3_2 아미노산을 포함하는 UDP-글리코실 전이효소가 RebA를 RebD로 전환하고/하거나 스테비오사이드를 RebE로 전환하는 이의 활성을 유지하도록 허용하는 아미노산 서열을 의미한다.
특정 양태에서, UDP-글리코실 전이효소는 UGT40087 (즉, 서열번호 17 또는 18)의 loop4_1 아미노산 서열을, 각각 서열번호 17 또는 18의 loop4_1 위치에 대응하는 UDP-글리코실 전이효소의 위치에서 더 포함한다. 특정 양태에서, 서열번호 17 또는 18의 loop4_1 아미노산 서열은 서열번호 27의 아미노산 서열을 가진다. 특정 양태에서, UDP-글리코실 전이효소는 변이 loop4_1 아미노산 서열을, 각각 서열번호 17 또는 18의 loop4_1 위치에 대응하는 UDP-글리코실 전이효소의 위치에서 더 포함한다. 변이 loop4_1 아미노산 서열은 서열번호 17 또는 18의 참조 loop4_1 아미노산 서열과 상이하지만, 변이 loop4_1 아미노산을 포함하는 UDP-글리코실 전이효소가 RebA를 RebD로 전환하고/하거나 스테비오사이드를 RebE로 전환하는 이의 활성을 유지하도록 허용하는 아미노산 서열을 의미한다.
특정 양태에서, UDP-글리코실 전이효소는 UGT40087 (즉, 서열번호 17 또는 18)의 loop4_2 아미노산 서열을, 각각 서열번호 17 또는 18의 loop4_2 위치에 대응하는 UDP-글리코실 전이효소의 위치에서 더 포함한다. 서열번호 17 또는 18의 loop4_2 아미노산 서열은 서열번호 28의 아미노산 서열을 가진다.
특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 일치하는 아미노산 서열을 포함하는 UDP-글리코실 전이효소, 또는 이의 UDP-글리코실 전이효소를 인코딩하는 이종 핵산을 포함하고, 다음 중 임의의 조합을 더 포함한다:
(a) 서열번호 17 또는 18의 loop1 아미노산 서열, 서열번호 30의 아미노산 서열, 또는 변이 loop1 아미노산 서열을, 각각 서열번호 17 또는 18의 loop1 위치에 대응하는 UDP-글리코실 전이효소의 위치에서;
(b) 서열번호 17 또는 18의 loop2 아미노산 서열, 또는 변이 loop2 아미노산 서열을, 각각 서열번호 17 또는 18의 loop2 위치에 대응하는 UDP-글리코실 전이효소의 위치에서;
(c) 서열번호 17 또는 18의 loop3_1 아미노산 서열, 또는 변이 loop3_1 아미노산 서열을, 각각 서열번호 17 또는 18의 loop 3_1 위치에 대응하는 UDP-글리코실 전이효소의 위치에서;
(d) 서열번호 17 또는 18의 loop3_2 아미노산 서열, 또는 변이 loop3_2 아미노산 서열을, 각각 서열번호 17 또는 18의 loop3_2 위치에 대응하는 UDP-글리코실 전이효소의 위치에서;
(e) 서열번호 17 또는 18의 loop4_1 아미노산 서열, 또는 변이 loop4_1 아미노산 서열을, 각각 서열번호 17 또는 18의 loop4_1 위치에 대응하는 UDP-글리코실 전이효소의 위치에서; 및
(f) 서열번호 17 또는 18의 loop4_2 아미노산 서열을, 각각 서열번호 17 또는 18의 loop4_2 위치에 대응하는 UDP-글리코실 전이효소의 위치에서.
특정 양태에서, RebA를 RebD로 전환할 수 있는 UDP-글리코실 전이효소의 3차원 모델링된 구조가 비교 및 분석될 때, UGT40087의 loop4_1이 다른 UDP-글리코실 전이효소의 대응하는 loop4_1 위치로 포함되는 (이의 천연 loop4_1 아미노산 서열을 대체하는) 경우에, 상기 loop4_1이 RebA를 RebD로 전환하는 이의 능력의 관점에서, 변이 UDP-글리코실 전이효소의 우수한 활성을 초래한다는 것이 발견되었다. 실시예 12를 참고한다. 이들 결과는 임의의 적합한 UDP-글리코실 전이효소의 loop4_1 아미노산 서열이 서열번호 17 또는 18의 loop4_1 아미노산 서열과 치환되어, RebA를 RebD로 전환할 수 있다는 것을 나타낸다.
그러므로, 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열과 적어도 61%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 일치하는 아미노산 서열을 포함하는 UDP-글리코실 전이효소를 포함하고, UGT40087 (즉, 서열번호 17 또는 18)의 loop4_1 아미노산 서열 (즉, 서열번호 27)을 더 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열과 적어도 61%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 일치하는 아미노산 서열을 포함하는 UDP-글리코실 전이효소를 인코딩하는 이종 핵산을 포함하고, 서열번호 17 또는 18의 loop4_1 아미노산 서열 (즉, 서열번호 27)을 더 포함한다. 특정 양태에서, 서열번호 17 또는 18에 대해서 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95%인 아미노산 서열을 포함하는 임의의 적합한 UDP-글리코실 전이효소는 서열번호 17 또는 18로부터의 loop4_1 아미노산 서열을 이의 대응하는 loop4_1 위치에 통합하는 데 (이의 천연 loop4_1 아미노산 서열을 대체하는) 이용될 수 있다. 예를 들어, Ob_UGT91B_like, Hv_UGT_V1, Sl_UGT_101249881, Sr.UGT_g252778, Os_UGT_91C1, Bd_UGT10840, Bd_UGT10850, 또는 Si91Dlike는 서열번호 17 또는 18로부터의 loop4_1 아미노산 서열을 이의 대응하는 loop4_1 위치에 통합하는 데 기본으로 이용될 수 있다. 특정 양태에서, UDP-글리코실 전이효소는 서열번호 33의 아미노산 서열을 포함한다.
특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열과 실질적으로 동일한 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열에 대해서 적어도 60% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열에 대해서 적어도 65% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열에 대해서 적어도 70% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열에 대해서 적어도 75% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열에 대해서 적어도 80% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열에 대해서 적어도 85% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열에 대해서 적어도 90% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열에 대해서 적어도 95% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열에 대해서 적어도 96% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열에 대해서 적어도 97% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열에 대해서 적어도 98% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열에 대해서 적어도 99% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 포함한다.
특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열을 포함하는 UGT40087을 인코딩하는 핵산을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열과 실질적으로 일치하는 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열에 대해서 적어도 60% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열에 대해서 적어도 65% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열에 대해서 적어도 70% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열에 대해서 적어도 75% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열에 대해서 적어도 80% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열에 대해서 적어도 85% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열에 대해서 적어도 90% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열에 대해서 적어도 95% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열에 대해서 적어도 96% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열에 대해서 적어도 97% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열에 대해서 적어도 98% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열에 대해서 적어도 99% 일치하는 아미노산 서열을 포함하는 폴리펩티드를 인코딩하는 핵산을 포함한다.
따라서, 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열에 대해서 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 일치하는 아미노산 서열을 포함하는 UDP-글리코실 전이효소를 포함한다. 특정 양태에서, 숙주 세포는 서열번호 17 또는 18의 C-말단 당 공여 도메인의 아미노산 서열에 대해서 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 일치하는 아미노산 서열을 포함하는 UDP-글리코실 전이효소를 인코딩하는 이종 핵산을 포함한다. 특정 양태에서, UDP-글리코실 전이효소는 다른 UDP-글리코실 전이효소로부터 비롯된 C-말단 당 공여 도메인을 더 포함한다. 적합한 C-말단 당 공여 도메인을 갖는 다른 UDP-글리코실 전이효소의 예시는 Ob_UGT91B_like, Hv_UGT_V1, SI_UGT_101249881, Sr.UGT_g252778, Os_UGT_91C1, Bd_UGT10840, Bd_UGT10850, 또는 Si91Dlike를 포함한다.
특정 양태에서, N-말단 당 수용 도메인 내에 있는 특정 아미노산 잔기가 비-기능성인, 추정상의(putative) UDP-글리코실 전이효소를 활성 UDP-글리코실 전이효소로 만드는 촉매 활성을 회복시킬 수 있다는 것이 발견되었다. 그러므로, 숙주 세포는 서열번호 17 또는 18의 N-말단 당 수용 도메인의 아미노산 서열에 대해서 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 일치하는 아미노산 서열을 포함하는 UDP-글리코실 전이효소를 포함하고, 아래의 아미노산 잔기들 중 하나 이상을 추가로 포함하는데;
(a) 서열번호 18의 아미노산 자리 11에 대응하는 UDP-글리코실 전이효소의 아미노산 자리에서, 발린;
(b) 서열번호 18의 아미노산 자리 12에 대응하는 UDP-글리코실 전이효소의 아미노산 자리에서, 이소류신;
(c) 서열번호 18의 아미노산 자리 55에 대응하는 UDP-글리코실 전이효소의 아미노산 자리에서, 프롤린;
(d) 서열번호 18의 아미노산 자리 90에 대응하는 UDP-글리코실 전이효소의 아미노산 자리에서, 글루탐산;
(e) 서열번호 18의 아미노산 자리 203에 대응하는 UDP-글리코실 전이효소의 아미노산 자리에서, 세린;
(f) 서열번호 18의 아미노산 자리 223에 대응하는 UDP-글리코실 전이효소의 아미노산 자리에서, 글루탐산; 또는
(g) 서열번호 18의 아미노산 자리 413에 대응하는 UDP-글리코실 전이효소의 아미노산 자리에서, 발린,
서열번호 18의 아미노산 자리에 대응하는 UDP-글리코실 전이효소의 아미노산 자리는 서열 정렬에 의해 결정된다.
특정 양태에서, 숙주 세포는 서열번호 32의 아미노산 서열을 포함하는 UDP-글리코실 전이효소를 포함한다.
특정 양태에서, 숙주 세포는 상기 기재된 UGT40087 폴리펩티드의 변이체를 포함한다. 특정 양태에서, 변이체는 UGT40087 폴리펩티드에 비해서, 최대 15, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개의 아미노산 치환을 포함할 수 있다. 특정 양태에서, 변이체는 UGT40087 폴리펩티드에 비해서, 최대 15, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개의 보존적 아미노산 치환을 포함할 수 있다. 특정 양태에서, 본원에 기재된 핵산들 중 임의의 핵산은 숙주 세포에 대해서 최적화될 수 있으며, 예를 들어, 코돈 최적화될 수 있다. 유용한 핵산은 서열번호 35 및 36을 포함한다.
6. MEV
경로
FPP
및/또는
GGPP
생산
몇몇 양태에서, 본원에서 제시된 유전적으로 변형된 숙주 세포는 FPP 및/또는 GGPP의 형성에 유용한 MEV 경로의 하나 이상의 이종 효소를 포함한다. 도 1d를 참고한다. 몇몇 양태에서, MEV 경로의 하나 이상의 효소는 아세틸-CoA를 말로닐-CoA(malonyl-CoA)와 축합하여(condensing), 아세토아세틸-CoA를 형성하는 효소를 포함한다. 몇몇 양태에서, MEV 경로의 하나 이상의 효소는 두 분자의 아세틸-CoA를 축합하여, 아세토아세틸-CoA를 형성하는 효소를 포함한다. 몇몇 양태에서, MEV 경로의 하나 이상의 효소는 아세토아세틸-CoA와 아세틸-CoA를 축합하여, HMG-CoA를 형성하는 효소를 포함한다. 몇몇 양태에서, MEV 경로의 하나 이상의 효소는 HMG-CoA를 메발로네이트로 전환하는 효소를 포함한다. 몇몇 양태에서, MEV 경로의 하나 이상의 효소는 메발로네이트를 메발로네이트 5-포스페이트로 인산화시키는(phosphorylating) 효소를 포함한다. 몇몇 양태에서, MEV 경로의 하나 이상의 효소는 메발로네이트 5-포스페이트를 메발로네이트 5-피로포스페이트로 전환하는 효소를 포함한다. 몇몇 양태에서, MEV 경로의 하나 이상의 효소는 메발로네이트 5-피로포스페이트를 이소펜테닐 피로포스페이트로 전환하는 효소를 포함한다.
몇몇 양태에서, MEV 경로의 하나 이상의 효소는 아세틸-CoA 티올라제(acetyl-CoA thiolase), 아세토아세틸-CoA 합성효소, HMG-CoA 합성효소, HMG-CoA 환원효소, 메발로네이트 인산화효소, 포스포메발로네이트 인산화효소 및 메발로네이트 피로포스페이트 탈탄산효소(mevalonate pyrophosphate decarboxylase)로 이루어진 군으로부터 선택된다. 몇몇 양태에서, 아세토아세틸-CoA의 형성을 촉매할 수 있는 MEV 경로의 효소에 대해서, 유전적으로 변형된 숙주 세포는 두 분자의 아세틸-CoA를 축합시켜, 아세토아세틸-CoA를 형성하는 효소, 예를 들어, 아세틸-CoA 티올라제; 또는 아세틸-CoA를 말로닐-CoA와 축합시켜, 아세토아세틸-CoA를 형성하는 효소, 예를 들어, 아세토아세틸-CoA 합성효소; 중 하나를 포함한다. 몇몇 양태에서, 유전적으로 변형된 숙주 세포는 두 분자의 아세틸-CoA를 축합시켜, 아세토아세틸-CoA를 형성하는 효소, 예를 들어, 아세틸-CoA 티올라제; 및 아세틸-CoA를 말로닐-CoA와 축합시켜, 아세토아세틸-CoA를 형성하는 효소, 예를 들어, 아세토아세틸-CoA 합성효소; 모두를 포함한다.
몇몇 양태에서, 숙주 세포는 MEV 경로의 1개보다 많은 효소를 인코딩하는 하나 이상의 이종 뉴클레오티드 서열을 포함한다. 몇몇 양태에서, 숙주 세포는 MEV 경로의 2개의 효소를 인코딩하는 하나 이상의 이종 뉴클레오티드 서열을 포함한다. 몇몇 양태에서, 숙주 세포는 HMG-CoA를 메발로네이트로 전환할 수 있는 효소 및 메발로네이트를 메발로네이트 5-포스페이트로 전환할 수 있는 효소를 인코딩하는 하나 이상의 이종 뉴클레오티드 서열을 포함한다. 몇몇 양태에서, 숙주 세포는 MEV 경로의 3개의 효소를 인코딩하는 하나 이상의 이종 뉴클레오티드 서열을 포함한다. 몇몇 양태에서, 숙주 세포는 MEV 경로의 4개의 효소를 인코딩하는 하나 이상의 이종 뉴클레오티드 서열을 포함한다. 몇몇 양태에서, 숙주 세포는 MEV 경로의 5개의 효소를 인코딩하는 하나 이상의 이종 뉴클레오티드 서열을 포함한다. 몇몇 양태에서, 숙주 세포는 MEV 경로의 6개의 효소를 인코딩하는 하나 이상의 이종 뉴클레오티드 서열을 포함한다. 몇몇 양태에서, 숙주 세포는 MEV 경로의 7개의 효소를 인코딩하는 하나 이상의 이종 뉴클레오티드 서열을 포함한다. 몇몇 양태에서, 숙주 세포는 MEV 경로의 모든 효소를 인코딩하는 복수의 이종 뉴클레오티드 서열을 포함한다.
몇몇 양태에서, 유전적으로 변형된 숙주 세포는 이소펜테닐 피로포스페이트 (isopentenyl pyrophosphate, IPP)를 디메틸알릴 피로포스페이트 (dimethylallyl pyrophosphate, DMAPP)로 전환할 수 있는 효소를 인코딩하는 이종 핵산을 더 포함한다. 몇몇 양태에서, 유전적으로 변형된 숙주 세포는 IPP 및/또는 DMAPP 분자를 축합하여, 폴리프레닐 화합물(polyprenyl compound)을 형성할 수 있는 효소를 인코딩하는 이종 핵산을 더 포함한다. 몇몇 양태에서, 유전적으로 변형된 숙주 세포는 IPP 또는 폴리프레닐을 변형하여, FPP와 같은 이소프레노이드 화합물(isoprenoid compound)을 형성할 수 있는 효소를 인코딩하는 이종 핵산을 더 포함한다.
6.1. 아세토아세틸
-
CoA로의
아세틸-
CoA의
전환
몇몇 양태에서, 유전적으로 변형된 숙주 세포는 두 분자의 아세틸-조효소 A를 축합하여, 아세토아세틸-CoA를 형성하는 효소, 예를 들어, 아세틸-CoA 티올라제를 인코딩하는 이종 뉴클레오티드 서열을 포함한다. 이러한 효소를 인코딩하는 뉴클레오티드 서열의 설명적 예시는 다음을 포함하나, 이에 한정되는 것은 아니다: (NC_000913 REGION: 2324131.2325315; 에세리키아 콜라이), (D49362; 파라코커스데 니트리피칸스(Paracoccus denitrificans)),및 (L20428; 사카로마이세스 세레비시아).
아세틸-CoA 티올라제는 두 분자의 아세틸-CoA의 가역적 축합반응을 촉매하여, 아세토아세틸-CoA를 수득하지만, 이 반응은 열역학적으로 불리하고(thermodynamically unfavorable), 아세토아세틸-CoA 티올 첨가분해(acetoacetyl-CoA thiolysis)가 아세토아세틸-CoA 합성보다 선호된다. 아세토아세틸-CoA 합성효소 (Acetoacetyl-CoA synthase, AACS) (대안적으로는, 아세틸-CoA:말로닐-CoA 아실전이효소(malonyl-CoA acyltransferase); EC 2.3.1.194라고 함)는 아세틸-CoA를 말로닐-CoA와 축합시켜, 아세토아세틸-CoA를 형성한다. 아세틸-CoA 티올라제와 대조적으로, AACS에 의해 촉매된 아세토아세틸-CoA 합성은, 말로닐-CoA의 관련 탈탄산 반응으로 인하여, 본질적으로 에너지 관점에서 유리한 반응(energy-favored reaction)이다. 또한, AACS는 아세토아세틸-CoA에 대한 티올 첨가분해 활성(thiolysis activity)을 보이지 않으므로, 반응은 비가역적이다.
아세틸-CoA 티올라제 및 이종 ADA 및/또는 포스포트랜스아세틸라제 (phosphotransacetylase, PTA)를 포함하는 숙주 세포에서, 아세토아세틸-CoA 티올 첨가분해를 선호하는 아세틸-CoA 티올라제에 의해 촉매된 가역적 반응은 큰 아세틸-CoA 풀(pool)을 야기할 수 있다. ADA의 가역적인 활성을 고려하면, 상기 아세틸-CoA 풀은 결국, ADA가 아세틸-CoA를 아세트알데히드로 전환시키는 가역적인 반응으로 향하도록 유도할 수 있으므로, 아세틸-CoA 생산을 향하는 ADA에 의해 제공되는 이점을 약화시킨다. 마찬가지로, PTA의 활성은 가역적이므로, 큰 아세틸-CoA 풀은 PTA가 아세틸-CoA를 아세틸 포스페이트로 전환시키는 가역적인 반응을 향하도록 유도할 수 있다. 그러므로, 몇몇 양태에서, ADA 및 PTA의 정반응을 유도하도록 아세틸-CoA에 대한 강력한 우위(pull)를 제공하기 위해, 본원에서 제시된 유전적으로 변형된 숙주 세포의 MEV 경로는 아세토아세틸-CoA 합성효소를 활용하여, 아세틸-CoA와 말로닐-CoA로부터 아세토아세틸-CoA를 형성한다.
몇몇 양태에서, AACS는 스트렙토마이세스 sp. 균주 CL190로부터 수득된다 (Okamura 외, Proc Natl Acad Sci USA 107(25):11265-70 (2010). 스트렙토마이세스 sp. 균주 CL190의 대표적인 AACS 뉴클레오티드 서열은 수탁번호 AB540131.1을 포함한다. 스트렙토마이세스 sp. 균주 CL190의 대표적인 AACS 단백질 서열은 수탁번호 D7URV0, BAJ10048를 포함한다. 본원에 제시된 조성물 및 방법에 유용한 다른 아세토아세틸-CoA 합성효소는 다음을 포함하나, 이에 한정되는 것은 아니다: 스트렙토마이세스 sp. (AB183750; KO-3988 BAD86806); S. 아눌라투스(S. anulatus ) 균주 9663 (FN178498; CAX48662); 스트렙토마이세스 sp. KO-3988 (AB212624; BAE78983); 악티노플라네스 sp.(Actinoplanes sp .) A40644 (AB113568; BAD07381); 스트렙토마이세스 sp. C (NZ_ACEW010000640; ZP_05511702); 노카디옵시스 다손빌레이 (Nocardiopsis dassonvillei ) DSM 43111 (NZ_ABUI01000023; ZP_04335288); 마이 코박테리움 울세란스 (Mycobacterium ulcerans ) Agy99 (NC_008611; YP_907152); 마이코박테리움 마리눔 (Mycobacterium marinum ) M (NC_010612; YP_001851502); 스트 렙토마이세스 sp. Mg1 (NZ_DS570501; ZP_05002626); 스트렙토마이세스 sp. AA4 (NZ_ACEV01000037; ZP_05478992); S. 로세오스포루스(S. roseosporus ) NRRL 15998 (NZ_ABYB01000295; ZP_04696763); 스트렙토마이세스 sp. ACTE (NZ_ADFD01000030; ZP_06275834); S. 비리도크로모게네스(S. viridochromogenes ) DSM 40736 (NZ_ACEZ01000031; ZP_05529691); 프랑키아 sp.(Frankia sp .) CcI3 (NC_007777; YP_480101); 노카디아 브라실리엔시스 ( Nocardia brasiliensis ) (NC_018681; YP_006812440.1); 및 오스트윅키아 첼로네(Austwickia chelonae) (NZ_BAGZ01000005; ZP_10950493.1). 추가의 적합한 아세토아세틸-CoA 합성효소는 미국 특허출원 공보 제2010/0285549호 및 제2011/0281315호에 기재된 효소들을 포함하며, 이들 공보는 이의 전체 기재내용이 본원에 참고로 포함된다.
본원에서 제시된 조성물 및 방법에 또한 유용한 아세토아세틸-CoA 합성효소는 본원에 기재된 아세토아세틸-CoA 합성효소들 중 임의의 효소의 "유도체"라고 하는 분자를 포함한다. 이러한 "유도체"는 다음의 특징을 가진다: (1) 본원에 기재된 아세토아세틸-CoA 합성효소들 중 임의의 효소와 실질적 상동성(substantial homology)을 공유함; 및 (2) 아세틸-CoA와 말로닐-CoA의 비가역적인 축합반응을 촉매하여, 아세토아세틸-CoA를 형성할 수 있음. 아세토아세틸-CoA 합성효소의 유도체는, 유도체의 아미노산 서열이 아세토아세틸-CoA 합성효소의 아미노산 서열과 적어도 80%, 더욱 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95% 동일한 경우에, 아세토아세틸-CoA 합성효소와 "실질적 상동성"을 공유한다고 일컬어진다.
6.2. HMG
-
CoA로의
아세토아세틸
-
CoA의
전환
몇몇 양태에서, 숙주 세포는 아세토아세틸-CoA와 다른 분자의 아세틸-CoA를 축합시켜, 3-히드록시-3-메틸글루타릴-CoA(3-hydroxy-3-methylglutaryl-CoA, HMG-CoA)를 형성할 수 있는 효소, 예를 들어, HMG-CoA 합성효소를 인코딩하는 이종 뉴클레오티드 서열을 포함한다. 이러한 효소를 인코딩하는 뉴클레오티드 서열의 설명적 예시는 다음을 포함하나, 이에 한정되는 것은 아니다: (NC_001145. complement 19061.20536; 사카로마이세스 세레비시아), (X96617; 사카로마이세스 세레비시아), (X83882; 아라비돕시스 탈리아나), (AB037907; 키타사토스포라 그리세올라(Kitasatospora griseola )), (BT007302; 호모 사피엔스), 및 (NC_002758, Locus tag SAV2546, GeneID 1122571; 스타필로코커스 아우레우스).
6.3. 메발로네이트로의
HMG
-
CoA의
전환
몇몇 양태에서, 숙주 세포는 HMG-CoA를 메발로네이트로 전환할 수 있는 효소, 예를 들어, HMG-CoA 환원효소를 인코딩하는 이종 뉴클레오티드 서열을 포함한다. 몇몇 양태에서, HMG-CoA 환원효소는 NADH-이용 히드록시메틸글루타릴-CoA 환원효소-CoA 환원효소(NADH-using hydroxymethylglutaryl-CoA reductase-CoA reductase)이다. HMG-CoA 환원효소는 (EC 1.1.1.34; EC 1.1.1.88) (S)-HMG-CoA가 (R)-메발로네이트로되는 환원적 탈아실화 반응(reductive deacylation)을 촉매하고, 두 클래스인 클래스 I 및 클래스 II HMGr로 분류될 수 있다. 클래스 I은 진핵생물, 대부분 고세균으로부터 비롯된 효소를 포함하고, 클래스 II는 특정 원핵생물 및 고세균의 HMG-CoA 환원효소를 포함한다. 서열의 분화(divergence)에 더하여, 두 클래스의 효소는 또한 이들의 보조인자 특이도(cofactor specificity)에 대해서 상이하다. NADPH를 배타적으로 활용하는 클래스 I 효소와 달리, 클래스 II HMG-CoA 환원효소는 NADPH와 NADH를 식별하는 능력이 다양하다. 예를 들어, Hedl 외, Journal of Bacteriology 186 (7): 1927-1932 (2004)를 참고한다. 클래스 II HMG-CoA 환원효소의 선택을 위한 보조인자 특이도는 아래에서 제시된다.
[표: 클래스 II
HMG
-
CoA
환원효소의 선택을 위한
보조인자
특이도]
본원에 제시된 조성물 및 방법에 대해서 유용한 HMG-CoA 환원효소는 보조인자로서 NADH를 활용할 수 있는 HMG-CoA 환원효소, 예를 들어, P. 메발로니 , A. 폴 지두스 또는 S. 아우레우스로부터 수득된 HMG-CoA 환원효소를 포함한다. 특정 양태에서, HMG-CoA 환원효소는 보조인자로서 NADH만 활용할 수 있고, 예를 들어, P. 메발로니, S. 포메로이 (S. pomeroyi ) 또는 D. 아시도보란스(D. acidovorans)로부터 수득된 HMG-CoA 환원효소이다.
몇몇 양태에서, NADH-이용 HMG-CoA 환원효소는 슈도모나스 메발로니로부터 수득된다. HMG-CoA 환원효소 (EC 1.1.1.88)를 인코딩하는 슈도모나스 메발로니로니의 야생형 mvaA 유전자의 서열은 이전에 기재되었다. Beach 및 Rodwell, J. Bacteriol. 171:2994-3001 (1989)를 참고한다. 슈도모나스 메발로니로니의 대표적인 mvaA 뉴클레오티드 서열은 수탁번호 M24015를 포함한다. 슈도모나스 메발로니로니의 대표적인 HMG-CoA 환원효소 단백질 서열은 수탁번호 AAA25837, P13702, MVAA_PSEMV를 포함한다.
몇몇 양태에서, NADH-이용 HMG-CoA 환원효소(NADH-using HMG-CoA reductase)는 실리시박터 포메로이 ( Silicibacter pomeroyi )로부터 수득된다. 실리시박터 포메로이의 대표적인 HMG-CoA 환원효소 뉴클레오티드 서열은 수탁번호 NC_006569.1을 포함한다. 실리시박터 포메로이의 대표적인 HMG-CoA 환원효소 단백질 서열은 수탁번호 YP_164994를 포함한다.
몇몇 양태에서, NADH-이용 HMG-CoA 환원효소는 델프티아 아시도보란 스(Delftia acidovorans )로부터 수득된다. 델프티아 아시도보란스의 대표적인 HMG-CoA 환원효소 뉴클레오티드 서열은 NC_010002 REGION: complement (319980..321269)를 포함한다. 델프티아 아시도보란스의 대표적인 HMG-CoA 환원효소 단백질 서열은 수탁번호 YP_001561318을 포함한다.
몇몇 양태에서, NADH-이용 HMG-CoA 환원효소는 솔라눔 투베로숨(Solanum tuberosum)으로부터 수득된다 (Crane 외, J. Plant Physiol . 159:1301-1307 (2002)).
또한, 본원에 제시된 조성물 및 방법에 유용한 NADH-이용 HMG-CoA 환원효소는 예를 들어, P. 메발로니 , S. 포메로이 및 D. 아시도보란스로부터 수득된 본원에 기재된 NADH-이용 HMG-CoA 환원효소들 중 임의의 효소의 "유도체"라고 하는 분자들을 포함한다. 이러한 "유도체"는 다음의 특징을 갖는다: (1) 본원에 기재된 NADH-이용 HMG-CoA 환원효소들 중 임의의 효소와 실질적 상동성을 공유함; 및 (2) NADH를 보조인자로 우선적으로 이용하며, (S)-HMG-CoA를 (R)-메발로네이트로 만드는 환원적 탈아실화 반응을 촉매할 수 있음. NADH-이용 HMG-CoA 환원효소의 유도체는, 유도체의 아미노산 서열이 NADH-이용 HMG-CoA 환원효소의 아미노산 서열과 적어도 80%, 더욱 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95% 동일한 경우에, NADH-이용 HMG-CoA 환원효소와 "실질적 상동성"을 공유한다고 일컬어진다.
본원에서 이용된, 구절 "NADH-이용 (NADH-using)"은 NADH-이용 HMG-CoA 환원효소가, 예를 들어, NADPH보다 NADH에 대한 더 높은 특이 활성을 입증함으로써, 보조인자로서 NADPH보다 NADH에 선택적이라는 것을 의미한다. 몇몇 양태에서, 보조인자로서 NADH에 대한 선택성(selectivity)은 k cat ( NADH )/ k cat ( NADPH ) 비율로 표현된다. 몇몇 양태에서, NADH-이용 HMG-CoA 환원효소는 적어도 5, 10, 15, 20, 25 또는 25를 초과하는 k cat ( NADH )/ k cat ( NADPH ) 비율을 가진다. 몇몇 양태에서, NADH-이용 HMG-CoA 환원효소는 NADH를 배타적으로 이용한다. 예를 들어, NADH를 배타적으로 이용하는 NADH-이용 HMG-CoA 환원효소는 시험관 내에서 단독 보조인자(sole cofactor)로 공급된 NADH와 약간의 활성을 보이고, NADPH가 단독 보조인자로 공급되는 경우에, 검출가능한 활성을 보이지 않는다. 당해분야에 공지된 보조인자 특이도를 측정하는 임의의 방법이 활용되어, 보조인자로서 NADH에 대한 선호를 갖는 HMG-CoA 환원효소를 확인할 수 있고, 이들 효소는 Kim 외, Protein Science 9:1226-1234 (2000); 및 Wilding 외, J. Bacteriol . 182(18):5147-52 (2000)에 의해 기재된 효소들을 포함하며, 이들 문헌의 내용은 이의 기재내용이 본원에 참고로 포함된다.
몇몇 양태에서, NADH-이용 HMG-CoA 환원효소는 NADPH 보다 NADH에 대해서 선택적이도록, 예를 들어, 보조인자-결합 포켓(cofactor-biding pocket)의 부위-지정 돌연변이 유발(site-directed mutagenesis)을 통해서 조작된다. NADH-선택성을 조작하는 방법은 Watanabe 외, Microbiology 153:3044-3054 (2007)에 기재되어 있고, HMG-CoA 환원효소의 보조인자 특이도를 측정하는 방법은 Kim 외, Protein Sci . 9:1226-1234 (2000)에 기재되어 있으며, 이들 문헌의 내용은 이의 전체 기재내용이 본원에 참고로 포함된다.
몇몇 양태에서, NADH-이용 HMG-CoA 환원효소는 메발로네이트 분해 경로(degradative pathway)를 선천적으로 포함하는 숙주 종, 예를 들어, 이의 단독 탄소 공급원으로서 메발로네이트를 촉매하는 숙주 종으로부터 유래된다. 이들 양태 내에서, 이의 천연 숙주 세포 내에 내재화된(internalized) (R)-메발로네이트를 (S)-HMG-CoA로 만드는 산화적 아실화 반응(oxidative acylation)을 정상적으로 촉매하는 NADH-이용 HMG-CoA 환원효소가 활용되어, 역반응, 즉, 메발로네이트 생합성 경로를 포함하는 유전적으로 변형된 숙주 세포에서 (S)-HMG-CoA를 (R)-메발로네이트로 만드는 환원적 탈아실화를 촉매한다. 메발로네이트를 단독 탄소 공급원으로 하는, 메발로네이트에서 성장할 수 있는 원핵생물은 다음의 문헌에 의해 기재되고: Anderson 외, J. Bacteriol , 171(12):6468-6472 (1989); Beach 외, J. Bacteriol . 171:2994-3001 (1989); Bensch 외, J. Biol . Chem . 245:3755-3762; Fimongnari 외, Biochemistry 4:2086-2090 (1965); Siddiqi 외, Biochem . Biophys . Res. Commun . 8:110-113 (1962); Siddiqi 외, J. Bacteriol . 93:207-214 (1967); 및 Takatsuji 외, Biochem . Biophys . Res. Commun .110:187-193 (1983), 이들 문헌의 내용은 이의 전체 기재내용이 본원에 참고로 포함된다.
본원에 제시된 조성물 및 방법의 몇몇 양태에서, 숙주 세포는 NADH-이용 HMGr과 NADPH-이용 HMG-CoA 환원효소 모두를 포함한다. NADPH-이용 HMG-CoA 환원효소를 인코딩하는 뉴클레오티드 서열의 설명적 예시는 다음을 포함하나, 이에 한정되는 것은 아니다: (NM_206548; 드로소필라 멜라노가스터 ( Drosophila melanogaster )), (NC_002758, Locus tag SAV2545, GeneID 1122570; 스타필로코커스 아우레우스), (AB015627; 스트렙토마이세스 sp . KO 3988), (절단된(truncated) HMG-CoA 환원효소를 인코딩하는 서열을 제공하는 AX128213; 사카로 마이세스 세레비시아), 및 (NC_001145: complement (115734.118898; 사카로마이세스 세레비시아).
6.4. 메발로네이트
-5-
포스페이트로의
메발로네이트의
전환
몇몇 양태에서, 숙주 세포는 메발로네이트를 메발로네이트 5-포스페이트로 전환할 수 있는 효소, 예를 들어, 메발로네이트 인산화효소를 인코딩하는 이종 뉴클레오티드 서열을 포함한다. 이러한 효소를 인코딩하는 뉴클레오티드 서열의 설명적 예시는 다음을 포함하나, 이에 한정되는 것은 아니다: (L77688; 아라비돕시 스 탈리아나), 및 (X55875; 사카로마이세스 세레비시아).
6.5. 메발로네이트
-5-
피로포스페이트로의
메발로네이트
-5-
포스페이트의
전환
몇몇 양태에서, 숙주 세포는 메발로네이트 5-포스페이트를 메발로네이트 5-피로포스페이트로 전환할 수 있는 효소, 예를 들어, 포스포메발로네이트 인산화효소를 인코딩하는 이종 뉴클레오티드 서열을 포함한다. 이러한 효소를 인코딩하는 뉴클레오티드 서열의 설명적 예시는 다음을 포함하나, 이에 한정되는 것은 아니다: (AF429385; 헤베아 브라실리엔시스 ( Hevea brasiliensis )), (NM_006556; 호모 사피엔스), 및 (NC_001145. complement 712315.713670; 사카로마이세스 세레비시아).
6.6. IPP로의
메발로네이트
-5-
피로포스페이트의
전환
몇몇 양태에서, 숙주 세포는 메발로네이트 5-피로포스페이트를 이소펜테닐 디포스페이트 (IPP)로 전환할 수 있는 효소, 예를 들어, 메발로네이트 피로포스페이트 탈탄산효소를 인코딩하는 이종 뉴클레오티드 서열을 포함한다. 이러한 효소를 인코딩하는 뉴클레오티드 서열의 설명적 예시는 다음을 포함하나, 이에 한정되는 것은 아니다: (X97557; 사카로마이세스 세레비시아), (AF290095; 엔테로코커스 패시움(Enterococcus faecium)), 및 (U49260; 호모 사피엔스).
6.7. DMAPP로의
IPP의
전환
몇몇 양태에서, 숙주 세포는 MEV 경로를 통해 생성된 IPP를 디메틸알릴 피로포스페이트(dimethylallyl pyrophosphate, DMAPP)로 전환할 수 있는 효소, 예를 들어, IPP 이성질화 효소(IPP isomerase)를 인코딩하는 이종 뉴클레오티드 서열을 더 포함한다. 이러한 효소를 인코딩하는 뉴클레오티드 서열의 설명적 예시는 다음을 포함하나, 이에 한정되는 것은 아니다: (NC_000913, 3031087.3031635; 에세리키아 콜라이), 및 (AF082326; 헤마토코쿠스 플루비알리스(Haematococcus pluvialis)).
6.8. 폴리프레닐
합성효소
몇몇 양태에서, 숙주 세포는 IPP 및/또는 DMAPP 분자를 축합하여, 5개를 초과하는 탄소를 함유하는 폴리프레닐 화합물을 형성할 수 있는 폴리프레닐 합성효소를 인코딩하는 이종 뉴클레오티드 서열을 더 포함한다.
몇몇 양태에서, 숙주 세포는 한 분자의 IPP와 한 분자의 DMAPP를 축합하여, 한 분자의 제라닐 피로포스페이트(geranyl pyrophosphate, "GPP")를 형성할 수 있는 효소, 예를 들어, GPP 합성효소를 인코딩하는 이종 뉴클레오티드 서열을 포함한다. 이러한 효소를 인코딩하는 뉴클레오티드 서열의 설명적 예시는 다음을 포함하나, 이에 한정되는 것은 아니다: (AF513111; 아비에스 그란디스 ( Abies grandis )), (AF513112; 아비에스 그 란디스), (AF513113; 아비에스 그란디스), (AY534686; 안티르히눔 마주 스(Antirrhinum majus )), (AY534687; 안티르히눔 마주스), (Y17376; 아라비돕시스 탈리아나), (AE016877, Locus AP11092; 바실러스 세레우스(Bacillus cereus ); ATCC 14579), (AJ243739; 시트루스 시넨시스 (Citrus sinensis )), (AY534745; 클라키아 브루에리(Clarkia breweri )), (AY953508; 입스 피니( Ips pini)), (DQ286930; 리코페르시콘 에스쿨렌툼 ( Lycopersicon esculentum )), (AF182828; 멘타 x 피페리타 ( Mentha x piperita )), (AF182827; 멘타 x 피페리타), (MPI249453; 멘타 x 피페리타), (PZE431697, Locus CAD24425; 파라코커스 제아잔티니파시엔스 (Paracoccus zeaxanthinifaciens )), (AY866498; 피크로리자 쿠로 아(Picrorhiza kurrooa )), (AY351862; 비티스 비니페라 ( Vitis vinifera )), 및 (AF203881, Locus AAF12843; 자이모모나스 모빌리스( Zymomonas mobilis )).
몇몇 양태에서, 숙주 세포는 두 분자의 IPP와 한 분자의 DMAPP를 축합, 또는 한 분자의 IPP를 한 분자의 GPP에 추가하여, 한 분자의 파르네실 피로포스페이트("FPP")를 형성할 수 있는 효소, 예를 들어, FPP 합성효소를 인코딩하는 이종 뉴클레오티드 서열을 포함한다. 이러한 효소를 인코딩하는 뉴클레오티드 서열의 설명적 예시는 다음을 포함하나, 이에 한정되는 것은 아니다: (ATU80605; 아라비돕시 스 탈리아나), (ATHFPS2R; 아라비돕시스 탈리아나), (AAU36376; 아르테미시아 아누 아(Artemisia annua )), (AF461050; 보스 토러스 ( Bos taurus)), (D00694; 에세리키아 콜라이 K-12), (AE009951, Locus AAL95523; 푸소박테리움 뉴클레아툼 subsp . 뉴 클레아툼(Fusobacterium nucleatum subsp . nucleatum ) ATCC 25586), (GFFPPSGEN; 지베렐라 푸지쿠로이), (CP000009, Locus AAW60034; 글루코노박터 옥시단 스(Gluconobacter oxydans 621H)), (AF019892; 헬리안투스 안누우스 ( Helianthus annuus)), (HUMFAPS; 호모 사피엔스), (KLPFPSQCR; 클루이베로마이세스 락티 스(Kluyveromyces lactis )), (LAU15777; 루피누스 알부스 ( Lupinus albus )), (LAU20771; 루피누스 알부스), (AF309508; 무스 무스쿨루스), (NCFPPSGEN; 뉴로스포라 크라사 ( Neurospora crassa)), (PAFPS1; 파르테니움 아르겐타툼 ( Parthenium argentatum )), (PAFPS2; 파르테니움 아르겐타툼), (RATFAPS; 라투스 노르베기쿠스 ( Rattus norvegicus )), (YSCFPP; 사카로마이세스 세레비시아), (D89104; 스키조사카로마이세스 폼베), (CP000003, Locus AAT87386; 스트렙토코커스 피오게네스 (Streptococcus pyogenes)), (CP000017, Locus AAZ51849; 스트렙토코커스 피오게네스), (NC_008022, Locus YP_598856; 스트렙토코커스 피오게네스 MGAS10270), (NC_008023, Locus YP_600845; 스트렙토코커스 피오게네스 MGAS2096), (NC_008024, Locus YP_602832; 스트렙토코커스 피오게네스 MGAS10750), (MZEFPS; 제아 마이스 ), (AE000657, Locus AAC06913; 아퀴펙스 아에올리쿠스 ( Aquifex aeolicus ) VF5), (NM_202836; 아라비돕시스 탈리아나), (D84432, Locus BAA12575; 바실러스 서브틸 리스), (U12678, Locus AAC28894; 브래디리조비움 자포니쿰 USDA 110), (BACFDPS; 지오바실러스 스테아로써모필러스 ( Geobacillus stearothermophilus )), (NC_002940, Locus NP_873754; 헤모필루스 듀크레이 ( Haemophilus ducreyi ) 35000HP), (L42023, Locus AAC23087; 헤모필루스 인플루엔자( Haemophilus influenzae ) Rd KW20), (J05262; 호모 사피엔스), (YP_395294; 락토바실러스 사케이 subsp . 사케이 (Lactobacillus sakei subsp . sakei ) 23K), (NC_005823, Locus YP_000273; 렙토스피라 인터로간스 세로바 코펜하게니 str . 피오크루즈(Leptospira interrogans serovar Copenhageni str . Fiocruz ) L1-130), (AB003187; 마이크로코커스 루테우 스(Micrococcus luteus )), (NC_002946, Locus YP_208768; 나이세리아 고노레 아(Neisseria gonorrhoeae ) FA 1090), (U00090, Locus AAB91752; 리조비움 sp. NGR234), (J05091; 사카로마이세스 세레비시아 ( Saccharomyces cerevisae )), (CP000031, Locus AAV93568; 실리시박터 포메로이 DSS-3), (AE008481, Locus AAK99890; 스트렙토코커스 뉴모니에 (Streptococcus pneumoniae ) R6), 및 (NC_004556, Locus NP 779706; 자일렐라 파스티디오사 테메큘라 1(Xylella fastidiosa Temecula 1)).
몇몇 양태에서, 숙주 세포는 IPP와 DMAPP, 또는 IPP와 FPP를 결합시켜, 제라닐제라닐 피로포스페이트 ("GGPP")를 형성할 수 있는 효소를 인코딩하는 이종 뉴클레오티드 서열을 더 포함한다. 이러한 효소를 인코딩하는 뉴클레오티드 서열의 설명적 예시는 다음을 포함하나, 이에 한정되는 것은 아니다: (ATHGERPYRS; 아라비돕 시스 탈리아나), (BT005328; 아라비돕시스 탈리아나 ), (NM_119845; 아라비돕시스 탈리아나), (NZ_AAJM01000380, Locus ZP_00743052; 바실러스 투린지엔시스 세로바 이스라엘렌시스(Bacillus thuringiensis serovar israelensis ), ATCC 35646 sq1563), (CRGGPPS; 카타란투스 로세우스(Catharanthus roseus)), (NZ_AABF02000074, Locus ZP_00144509; 푸소박테리움 뉴클레아툼 subsp . 빈센티 ( Fusobacterium nucleatum subsp. vincentii ), ATCC 49256), (GFGGPPSGN; 지베렐라 푸지쿠로이), (AY371321; 징코 빌로바 (Ginkgo biloba )), (AB055496; 헤베아 브라실리엔시스), (AB017971; 호모 사피엔스), (MCI276129; 무코르 시르시넬로이 데스 f. 루시타니쿠스 ( Mucor circinelloides f. lusitanicus )), (AB016044; 무스 무스쿨루스), (AABX01000298, Locus NCU01427; 뉴로스포라 크라사), (NCU20940; 뉴로스포라 크라사), (NZ_AAKL01000008, Locus ZP_00943566; 랄스토니아 솔라나세 아룸(Ralstonia solanacearum ) UW551), (AB118238; 라투스 노르베기쿠스), (SCU31632; 사카로마이세스 세레비시아), (AB016095; 시네코코커스 일롱게이 츠(Synechococcus elongates)), (SAGGPS; 시나피스 알바 ( Sinapis alba )), (SSOGDS; 술폴로부스 아시도칼다리우스 ( Sulfolobus acidocaldarius )), (NC_007759, Locus YP_461832; 신트로푸스 아시디트로피쿠스 ( Syntrophus aciditrophicus ) SB), (NC_006840, Locus YP_204095; 비브리오 피셰리 ( Vibrio fischeri) ES114), (NM_112315; 아라비돕시스 탈리아나), (ERWCRTE; 판토에아 아 글로메란스(Pantoea agglomerans )), (D90087, Locus BAA14124; 판토에아 아나나티 스(Pantoea ananatis )), (X52291, Locus CAA36538; 로도박터 캡슐라투스), (AF195122, Locus AAF24294; 로도박터 스페로이데스), 및 (NC_004350, Locus NP_721015; 스트렙토코커스 뮤탄스 (Streptococcus mutans) UA159).
메발로네이트 경로의 효소의 예시가 상기에 기재되어 있으나, 특정 양태에서, DXP 경로의 효소가 대안적인 또는 추가의 경로로서 이용되어, 본원에 기재된 숙주 세포, 조성물 및 방법에서 DMAPP 및 IPP를 생산할 수 있다. DXP 경로의 효소를 인코딩하는 효소 및 핵산은 당해분야에서 주지되어 있고, 특성화되어있다. WO 제2012/135591 A2호.
7. 스테비올
글리코시드의 생산방법
다른 측면에서, 스테비올 글리코시드를 생산하는 방법이 본원에서 제시되며, 상기 방법은 다음의 단계를 포함한다: (a) 탄소 공급원을 지닌 배지에서, 스테비올 글리코시드 화합물의 생성에 적합한 조건하에, 스테비올 글리코시드를 생산할 수 있는 본원에 기재된 유전적으로 변형된 숙주 세포들 중 임의의 세포의 집단을 배양하는 단계; 및 (b) 상기 배지로부터 상기 스테비올 글리코시드 화합물을 회수하는 단계.
몇몇 양태에서, 유전적으로 변형된 숙주 세포는 하나 이상의 변형을 포함하지 않는 모세포, 또는 유전적으로 변형된 숙주 세포의 하나 이상의 변형의 하위 집합만 포함하는 모세포에 비해서 증가된 양의 스테비올 글리코시드 화합물을 생산하나, 이 외에는 유전적으로 동일하다. 몇몇 양태에서, 증가된 양은 적어도 1%, 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 100% 또는 100%를 초과하며, 이는 예를 들어, 세포 배양물의 리터 당 그램(grams per liter of cell culture), 건조 세포 중량의 그램 당 밀리그램(milligrams per gram of dry cell weight), 세포 배양물 기준의 단위 부피 당(per unit volume of cell culture basis), 단위 건조 세포 중량 기준 당(per unit dry cell weight basis), 단위 시간 기준 당 세포 배양물의 단위 부피 당(per unit volume of cell culture per unit time basis), 또는 단위 시간 기준 당 단위 건조 세포 중량 당(per unit dry cell weight per unit time basis) 수율, 생산량, 생산성으로 측정된다.
몇몇 양태에서, 숙주 세포는 발효 배지의 리터 당 약 10g보다 큰, 상승된 레벨의 스테비올 글리코시드를 생산한다. 몇몇 이러한 양태에서, 스테비올 글리코시드는 세포 배양물의 리터 당 약 10 내지 약 50 그램의 양, 약 15 그램을 초과하는 양, 약 20 그램을 초과하는 양, 약 25 그램을 초과하는 양, 또는 약 30 그램을 초과하는 양으로 생산된다.
몇몇 양태에서, 숙주 세포는 건조 세포 중량의 그램 당 약 50밀리그램을 초과하는 상승된 레벨의 스테비올 글리코시드를 생산한다. 몇몇 이러한 양태에서, 스테비올 글리코시드는 건조 세포 중량의 그램 당 약 50 내지 약 1500 밀리그램의 양, 약 100 밀리그램을 초과하는 양, 약 150 밀리그램을 초과하는 양, 약 200 밀리그램을 초과하는 양, 약 250 밀리그램을 초과하는 양, 약 500 밀리그램을 초과하는 양, 약 750 밀리그램을 초과하는 양, 또는 약 1000 밀리그램을 초과하는 양으로 생산된다.
몇몇 양태에서, 숙주 세포는 세포 배양물 기준의 단위 부피 당, 모세포에 의해 생산된 스테비올 글리코시드의 레벨보다, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 5배, 적어도 약 10배, 적어도 약 20배, 적어도 약 30배, 적어도 약 40배, 적어도 약 50배, 적어도 약 75배, 적어도 약 100배, 적어도 약 200배, 적어도 약 300배, 적어도 약 400배, 적어도 약 500배, 또는 적어도 약 1,000배, 또는 그 이상 높은, 상승된 레벨의 스테비올 글리코시드를 생산한다.
몇몇 양태에서, 숙주 세포는 단위 건조 세포 중량 기준 당, 모세포에 의해 생산된 스테비올 글리코시드의 레벨보다, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 5배, 적어도 약 10배, 적어도 약 20배, 적어도 약 30배, 적어도 약 40배, 적어도 약 50배, 적어도 약 75배, 적어도 약 100배, 적어도 약 200배, 적어도 약 300배, 적어도 약 400배, 적어도 약 500배, 또는 적어도 약 1,000배, 또는 그 이상 높은, 상승된 레벨의 스테비올 글리코시드를 생산한다.
몇몇 양태에서, 숙주 세포는 단위 시간 기준 당 세포 배양물의 단위 부피 당, 모세포에 의해 생산된 스테비올 글리코시드의 레벨보다, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 5배, 적어도 약 10배, 적어도 약 20배, 적어도 약 30배, 적어도 약 40배, 적어도 약 50배, 적어도 약 75배, 적어도 약 100배, 적어도 약 200배, 적어도 약 300배, 적어도 약 400배, 적어도 약 500배, 또는 적어도 약 1,000배, 또는 그 이상 높은, 상승된 레벨의 스테비올 글리코시드를 생산한다.
몇몇 양태에서, 숙주 세포는 단위 시간 기준 당 단위 건조 세포 중량 당, 모세포에 의해 생산된 스테비올 글리코시드의 레벨보다, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 5배, 적어도 약 10배, 적어도 약 20배, 적어도 약 30배, 적어도 약 40배, 적어도 약 50배, 적어도 약 75배, 적어도 약 100배, 적어도 약 200배, 적어도 약 300배, 적어도 약 400배, 적어도 약 500배, 또는 적어도 약 1,000배, 또는 그 이상 높은, 상승된 레벨의 스테비올 글리코시드를 생산한다.
대부분의 양태에서, 숙주 세포에 의한 상승된 레벨의 스테비올 글리코시드의 생산은 유도 화합물(inducing compound)에 의해 유도 가능하다. 이러한 숙주 세포는 유도 화합물 없이 용이하게 조작될 수 있다. 유도 화합물은 추가되어, 숙주 세포에 의한 상승된 레벨의 스테비올 글리코시드의 생산을 유도한다. 다른 양태에서, 숙주 세포에 의한 스테비올 글리코시드의 상승된 레벨의 생산은, 예를 들어, 성장 온도, 배지 구성 등과 같은 배양 조건을 변화시킴으로써 유도 가능하다.
8. 배양
배지 및 조건
미생물 배양물을 유지 및 성장시키는 재료 및 방법은 미생물학 또는 발효 과학 분야의 통상의 기술자에게 주지되어 있다 (예를 들어, Bailey 외, Biochemical Engineering Fundamentals, second edition, McGraw Hill, New York, 1986을 참고). 숙주 세포, 발효 및 공정의 특정한 요건에 따라서, 적합한 배양 배지, pH, 온도 및 호기성, 미세 호기성(microaerobic), 또는 혐기성 조건에 대한 요건을 고려해야 한다.
본원에 제시된 스테비올 글리코시드를 생산하는 방법은 세포 배양 플레이트, 플라스크 또는 발효기를 포함하나, 이에 한정되는 것은 아닌 적절한 용기 내에서, 적절한 배양 배지 [예, 판토테네이트(pantothenate) 보충이 있거나 또는 없는]에서 수행될 수 있다. 또한, 상기 방법은 미생물 생성물의 산업용 생산을 지원하는 당해분야에 공지된 발효의 임의의 규모로 수행될 수 있다. 임의의 적합한 발효기가 이용될 수 있으며, 교반탱크 발효기(stirred tank fermentator), 에어리프트 발효기(airlift fermentor), 기포 발효기(bubble fermentor), 또는 이들의 임의의 조합을 포함한다. 사카로마이세스 세레비시아를 숙주 세포로 활용하는 특정 양태에서, 균주는 Kosaric 외, in Ullmann's Encyclopedia of Industrial Chemistry, 제6판, 12권, 398-473 페이지, 독일, 바인하임 소재, Wiley-VCH Verlag GmbH & Co. KDaA에 의해 상세히 기재된 대로, 발효기에서 성장될 수 있다.
몇몇 양태에서, 배양 배지는 스테비올 글리코시드를 생산할 수 있는 유전적으로 변형된 미생물이 존속할 수 있는, 즉, 성장 및 생존도를 유지할 수 있는 임의의 배양 배지이다. 몇몇 양태에서, 배양 배지는 동화 가능한(assimilable) 탄소 공급원, 질소 공급원 및 포스페이트 공급원(phosphate source)을 포함하는 수성 배지이다. 또한, 이러한 배지는 적합한 염, 미네랄, 금속 및 다른 영양소를 포함할 수 있다. 몇몇 양태에서, 탄소 공급원 및 각각의 필수 세포 영양소는 발효 배지에 증분적으로(incrementally) 또는 지속적으로 추가되고, 각 필수 영양소(required nutrient)는, 예를 들어, 탄소 공급원을 바이오매스(biomass)로 전환하는 세포의 대사 또는 호흡 기능에 기초한 예정된 세포 성장 곡선에 따른, 성장하는 세포에 의한 효율적인 동화에 필요한 최소 레벨에 기본적으로 유지된다.
미생물의 배양에 적합한 조건 및 적합한 배지는 당해분야에 주지되어 있다. 몇몇 양태에서, 적합한 배지는, 예를 들어, 유도자(inducer) [예, 유전자 산물을 인코딩하는 하나 이상의 뉴클레오티드 서열이 유도성 프로모터(inducible promoter)의 제어하에 있는 경우]; 억제자(repressor) [예, 유전자 산물을 인코딩하는 하나 이상의 뉴클레오티드 서열이 억제성 프로모터(repressible promoter)의 제어하에 있는 경우]; 또는 선별 제제(selection agent) [예, 유전적 변형을 포함하는 미생물을 선별하기 위한 항생제];와 같은 하나 이상의 추가의 제제로 보충된다.
몇몇 양태에서, 탄소 공급원은 단당류 (단순당), 이당류, 다당류, 비-발효성 탄소 공급원(non-fermentable carbon source), 또는 이들의 하나 이상의 혼합물이다. 적합한 단당류의 비-제한적인 예시는 글루코스, 갈락토스, 만노스, 프럭토스, 자일로스, 리보스, 및 이들의 혼합물을 포함한다. 적합한 이당류의 비-제한적 예시는 수크로스, 락토스, 말토스, 트레할로스(trehalose), 셀로비오스(cellobiose), 및 이들의 혼합물을 포함한다. 적합한 다당류의 비-제한적 예시는 전분, 글리코겐, 셀룰로오스, 키틴, 및 이들의 혼합물을 포함한다. 적합한 비-발효성 탄소 공급원(non-fermentable carbon source)의 비-제한적 예시는 아세테이트 및 글리세롤을 포함한다.
배양 배지 중 글루코스와 같은 탄소 공급원의 농도는 세포 성장을 촉진시켜야 하지만, 이용되는 미생물의 성장을 억제할 만큼 높아서는 안된다. 통상적으로, 배양은 목적하는 레벨의 성장 및 바이오매스를 달성하기 위한 레벨이지만, 검출 불가능한 레벨 (약 0.1g/l 미만인 검출 한계를 가짐)로 추가되는 글루코스와 같은 탄소 공급원과 함께 수행된다. 다른 양태에서, 배양 배지 중 글루코스와 같은 탄소 공급원의 농도는 약 1 g/L를 초과하고, 바람직하게는 약 2 g/L를 초과하며, 더욱 바람직하게는 약 5 g/L를 초과한다. 또한, 배양 배지 중 글루코스와 같은 탄소 공급원의 농도는 통상적으로, 약 100 g/L 미만이고, 바람직하게는 약 50 g/L 미만이며, 더욱 바람직하게는 약 20 g/L 미만이다. 배양 성분 농도에 대한 언급은 초기 및/또는 진행중인(ongoing) 성분 농도 모두를 의미할 수 있다는 것을 주의해야 한다. 몇몇 경우에서, 배양하는 동안에 배양 배지가 탄소 공급원을 고갈하도록 하는 것이 바람직할 수 있다.
적합한 배양 배지에서 이용될 수 있는 동화성 질소 공급원은 단순 질소 공급원(simple nitrogen source), 유기 질소 공급원(organic nitrogen sources) 및 복합 질소 공급원(complex nitrogen source)을 포함하나, 이에 한정되는 것은 아니다. 이러한 질소 공급원은 무수 암모니아(anhydrous ammonia), 암모늄 염 및 동물, 식물 및/또는 미생물 기원의 물질을 포함한다. 적합한 질소 공급원은 단백질 가수분해물(protein hydrolysate), 미생물 바이오매스 가수분해물(microbial biomass hydrolysate), 펩톤(peptone), 효모 추출물, 암모늄 설페이트, 요소, 및 아미노산을 포함하나, 이에 한정되는 것은 아니다. 통상적으로, 배양 배지 중 질소 공급원의 농도는 약 0.1 g/L를 초과하고, 바람직하게는 약 0.25 g/L를 초과하며, 더욱 바람직하게는 약 1.0 g/L를 초과한다. 그러나, 특정 농도를 넘어서서, 질소 공급원을 배양 배지에 추가하는 것은 미생물의 성장에 이롭지 않다. 결과적으로, 배양 배지 중 질소 공급원의 농도는 약 20 g/L 미만이고, 바람직하게는 약 10 g/L 미만이며, 더욱 바람직하게는 약 5 g/L 미만이다. 또한, 몇몇 경우에서, 배양하는 동안에 배양 배지가 질소 공급원을 고갈하도록 하는 것이 바람직할 수 있다.
효과적인 배양 배지는 무기염, 비타민, 미량 금속(trace metal), 또는 성장 촉진제(growth promoter)와 같은 다른 화합물을 함유할 수 있다. 또한, 이러한 다른 화합물은 효과적인 배지 중 탄소 공급원, 질소 공급원 또는 미네랄 공급원(mineral source)에 존재할 수 있거나, 또는 배지에 구체적으로 추가될 수 있다.
또한, 배양 배지는 적합한 포스페이트 공급원을 함유할 수 있다. 이러한 포스페이트 공급원은 무기 및 유기 포스페이트 공급원 모두를 포함한다. 바람직한 포스페이트 공급원은 일염기(monobasic) 또는 이염기(dibasic) 소듐 및 포타슘 포스페이트, 암모늄 포스페이트 및 이들의 혼합물과 같은 포스페이트 염을 포함하나, 이에 한정되는 것은 아니다. 통상적으로, 배양 배지 중 포스페이트의 농도는 약 1.0 g/L를 초과하고, 바람직하게는 약 2.0 g/L를 초과하며, 더욱 바람직하게는 약 5.0 g/L를 초과한다. 그러나, 특정 농도를 넘어서서, 배양 배지에 포스페이트를 추가하는 것은 미생물의 성장에 이롭지 않다. 따라서, 배양 배지 중 포스페이트의 농도는 통상적으로 약 20 g/L 미만이고, 바람직하게는 약 15 g/L 미만이며, 더욱 바람직하게는 약 10 g/L 미만이다.
또한, 적합한 배양 배지는 마그네슘원(source of magnesium), 바람직하게는 마그네슘 설페이트 헵타하이드레이트(magnesium sulfate heptahydrate)와 같은 생리학적으로 허용가능한 염의 형태인 마그네슘원을 포함하나, 유사한 양의 마그네슘에 기여하는 농도의 다른 마그네슘원이 이용될 수 있다. 통상적으로, 배양 배지 중 마그네슘의 농도는 약 0.5 g/L를 초과하고, 바람직하게는 약 1.0 g/L를 초과하며, 더욱 바람직하게는 약 2.0 g/L를 초과한다. 그러나, 특정 농도를 넘어서서, 배양 배지에 마그네슘을 첨가하는 것은 미생물의 성장에 이롭지 않다. 따라서, 배양 배지 중 마그네슘의 농도는 통상적으로 약 10 g/L 미만이고, 바람직하게는 약 5 g/L 미만이며, 더욱 바람직하게는 약 3 g/L 미만이다. 또한, 몇몇 경우에서, 배양하는 동안에 배양 배지가 마그네슘원을 고갈하도록 하는 것이 바람직할 수 있다.
몇몇 양태에서, 배양 배지는 또한 생물학적으로 허용가능한 킬레이트제, 예를 들어, 트리소듐 시트레이트(trisodium citrate)의 다이하이드레이트(dihydrate)를 포함할 수 있다. 이러한 경우에, 배양 배지 중 킬레이트제의 농도는 약 0.2 g/L를 초과하고, 바람직하게는 약 0.5 g/L를 초과하며, 더욱 바람직하게는 약 1 g/L를 초과한다. 그러나, 특정 농도를 넘어서서, 킬레이트제를 배양 배지에 추가하는 것은 미생물의 성장에 이롭지 않다. 따라서, 배양 배지 중 킬레이트제의 농도는 통상적으로 약 10 g/L 미만이고, 바람직하게는 약 5 g/L 미만이며, 더욱 바람직하게는 약 2 g/L 미만이다.
또한, 배양 배지는 초기에 생물학적으로 허용가능한 산 또는 염기를 포함하여, 배양 배지의 목적하는 pH를 유지할 수 있다. 생물학적으로 허용가능한 산은 염산, 황산, 질산, 인산 및 이들의 혼합물을 포함하나, 이에 한정되는 것은 아니다. 생물학적으로 허용가능한 염기는 암모늄 하이드록사이드(ammonium hydroxide), 소듐 하이드록사이드, 포타슘 하이드록사이드 및 이들의 혼합물을 포함하나, 이에 한정되는 것은 아니다. 몇몇 양태에서, 이용된 염기는 암모늄 하이드록사이드이다.
또한, 배양 배지는 생물학적으로 허용가능한 칼슘원을 포함하고, 칼슘 클로라이드를 포함하나, 이에 한정되는 것은 아니다. 통상적으로, 배양 배지 중 칼슘 클로라이드, 다이하이드레이트(dihydrate)와 같은 칼슘원의 농도는 약 5 mg/L 내지 약 2000 mg/L의 범위에 속하고, 바람직하게는 약 20 mg/L 내지 약 1000 mg/L의 범위에 속하며, 더욱 바람직하게는 약 50 mg/L 내지 약 500 mg/L의 범위에 속한다.
또한, 배양 배지는 소듐 클로라이드를 포함할 수 있다. 통상적으로, 배양 배지 중 소듐 클로라이드의 농도는 약 0.1 g/L 내지 약 5 g/L의 범위에 속하고, 바람직하게는 약 1 g/L 내지 약 4 g/L의 범위에 속하며, 더욱 바람직하게는 약 2 g/L 내지 약 4 g/L의 범위에 속한다.
몇몇 양태에서, 배양 배지는 또한 미량 금속(trace metal)을 포함할 수 있다. 이러한 미량 금속은, 편의를 위해 배양 배지의 나머지와 별도로 제조될 수 있는 저장 용액(stock solution)으로서, 배양 배지에 추가될 수 있다. 통상적으로, 배양 배지에 추가된 이러한 미량 금속 용액의 양은 약 1 mL/L를 초과하고, 바람직하게는 약 5 mL/L를 초과하며, 더욱 바람직하게는 약 10 mL/L를 초과한다. 그러나, 특정 농도를 넘어서서, 미량 금속을 배양 배지에 추가하는 것은 미생물의 성장에 이롭지 않다. 따라서, 배양 배지에 추가된 이러한 미량 금속 용액의 양은 통상적으로 약 100 mL/L 미만이고, 바람직하게는 약 50 mL/L 미만이며, 더욱 바람직하게는 약 30 mL/L 미만이다. 저장 용액에 미량 금속을 추가하는 것에 더하여, 개별적인 성분이, 미량 금속 용액의 상기 기재된 범위에 의해 영향을 받는 성분의 양에 독립적으로 대응하는 범위 내에서 별도로, 각각 추가될 수 있다는 것에 주의해야 한다.
배양 배지는 판토테네이트, 비오틴, 칼슘, 판토테네이트, 이노시톨, 피리독신-HCl(pyridoxine-HCl), 및 티아민-HCl(thiamine-HCl)과 같은 기타 비타민을 포함할 수 있다. 이러한 비타민은 편의를 위해, 배양 배지의 나머지와 별도로 제조될 수 있는 저장 용액으로서 배양 배지에 추가될 수 있다. 그러나, 특정 농도를 넘어서서, 비타민을 배양 배지에 추가하는 것은 미생물의 성장에 이롭지 않다.
본원에 기재된 발효 방법은, 배치(batch), 페드-배치(fed-batch), 세포 재순환(cell recycle), 연속식(continuous) 및 반-연속식(semi-continuous)을 포함하나, 이에 한정되는 것은 아닌 통상적인 배양 방식에서 수행될 수 있다. 몇몇 양태에서, 발효는 페드-배치 방식으로 수행된다. 이러한 경우에, 배양의 생산 단계(production stage) 동안에 판토테네이트를 포함하는 배지의 성분들 중 일부는 배양 동안에 고갈된다. 몇몇 양태에서, 첨가물이 필요하기 전의 기간 동안에, 성장 및/또는 스테비올 글리코시드 생산이 지원되도록, 배양은 예를 들어, 생산 단계의 처음에서, 상대적으로 높은 농도의 이러한 성분으로 보충될 수 있다. 이들 성분의 레벨이 배양에 의해 고갈됨에 따라, 이들의 바람직한 범위는 이들을 추가함으로써 배양 동안에 유지된다. 배양 배지 중 성분의 레벨은 예를 들어, 배양 배지를 주기적으로 샘플링하여, 농도에 대해서 검정함으로써 모니터링될 수 있다. 대안적으로는, 표준 배양 절차가 전개되면, 특정한 시간의 공지된 레벨에 대응하는 시간을 맞춘 간격(timed interval)에서, 배양 동안에 추가를 수행할 수 있다. 통상의 기술자에 의해 인식되는 바와 같이, 배지의 세포 밀도가 증가함에 따라, 영양소의 소비 속도는 배양하는 동안에 증가한다. 더욱이, 배양 배지로 외부 미생물의 도입을 피하기 위해, 당해분야에 공지되어 있는 무균 추가 방법(aseptic addition method)을 이용하여 추가가 수행된다. 또한, 소량의 소포제(anti-foaming agent)가 배양하는 동안 추가될 수 있다.
배양 배지의 온도는 유전적으로 변형된 세포의 성장 및/또는 스테비올 글리코시드의 생산에 적합한 임의의 온도일 수 있다. 예를 들어, 접종물과 함께 배양 배지를 접종하기 전에, 배양 배지는 약 20°C 내지 약 45°C 범위 내 온도, 바람직하게는 약 25°C 내지 약 40°C 범위 내 온도, 및 더욱 바람직하게는 약 28°C 내지 약 32°C 범위 내 온도로 초래되고 유지될 수 있다.
배양 배지의 pH는 산 또는 염기를 배양 배지에 추가함으로써 제어될 수 있다. 이러한 경우에서, 암모니아가 pH의 제어에 이용되면, 이는 또한 편리하게 배양 배지에서 질소 공급원으로 작용한다. 바람직하게는, pH는 약 3.0 내지 약 8.0으로 유지되고, 더욱 바람직하게는 약 3.5 내지 약 7.0으로 유지되며, 가장 바람직하게는 약 4.0 내지 약 6.5로 유지된다.
몇몇 양태에서, 배양 배지의 글루코스 농도와 같은 탄소 공급원 농도가 배양하는 동안에 모니터링된다. 배양 배지의 글루코스 농도는 예를 들어, 상청액, 예를 들어, 배양 배지의 무세포 성분(cell-free component) 중 글루코스 농도를 모니터링하는 데 이용될 수 있는 글루코스 산화효소 검사(glucose oxidase test) 또는 고압 액체 크로마토그래피의 이용과 같은 공지된 기법을 이용하여 모니터링될 수 있다. 이전에 명시된 대로, 탄소 공급원 농도는 세포 성장 억제가 발생하는 레벨 미만으로 유지되어야 한다. 이러한 농도가 유기체마다 다를 수 있으나, 글루코스가 탄소 공급원인 경우에, 약 60 g/L를 초과하는 글루코스 농도에서 세포 성장 억제가 발생하고, 실험에 의해 용이하게 측정될 수 있다. 따라서, 클루코스가 탄소 공급원으로 이용되는 경우에, 글루코스는 바람직하게는, 발효기에 투입되고(feeding), 검출 한계 미만으로 유지된다. 대안적으로는, 배양 배지 중 글루코스 농도는 약 1 g/L 내지 약 100 g/L의 범위 내에서 유지되고, 더욱 바람직하게는 약 2 g/L 내지 약 50 g/L의 범위 내에서 유지되며, 더 더욱 바람직하게는 약 5 g/L 내지 약 20 g/L의 범위 내에서 유지된다. 탄소 공급원 농도는, 예를 들어, 실질적으로 순수한 글루코스 용액의 추가에 의해 목적하는 레벨 내에서 유지될 수 있으나, 본래의 배양 배지의 분획의 추가에 의해 배양 배지의 탄소 공급원 농도를 유지하는 것이 허용가능하고, 바람직할 수 있다. 배지 중 기타 영양소 (예를 들어, 질소 공급원 및 포스페이트 공급원)의 농도가 동시에 유지될 수 있기 때문에, 본래의 배양 배지의 분획의 이용은 바람직할 수 있다. 마찬가지로, 미량 금속 농도가, 미량 금속 용액의 분획의 추가에 의해 배양 배지에서 유지될 수 있다.
기타 적합한 발효 배지 및 방법은 예를 들어, WO 제2016/196321호에 기재되어 있다.
9. 발효
조성물
다른 측면에서, 본원에 기재된 유전적으로 변형된 숙주 세포 및 유전적으로 변형된 숙주 세포로부터 생산된 스테비올 글리코시드를 포함하는 발효 조성물이 본원에서 제시된다. 발효 조성물은 배지를 더 포함할 수 있다. 특정 양태에서, 발효 조성물은 유전적으로 변형된 숙주 세포를 포함하고, RebA, RebD, 및 RebM을 더 포함한다. 특정 양태에서, 본원에 제시된 발효 조성물은 RebM을 유전적으로 변형된 숙주 세포로부터 생산된 스테비올 글리코시드의 주성분으로서 포함한다. 특정 양태에서, 발효 조성물은 RebA, RebD, 및 RebM을 적어도 1:7:50의 비율로 포함한다. 특정 양태에서, 발효 조성물은 RebA, RebD, 및 RebM을 적어도 1:7:50 내지 1:100:1000의 비율로 포함한다. 특정 양태에서, 발효 조성물은 적어도 1:7:50 내지 1:200:2000의 비율을 포함한다. 특정 양태에서, RebA, RebD, 및 RebM의 비율은 배지 및 유전적으로 변형된 숙주 세포와 관련된 스테비올 글리코시드의 전체 함량에 기초한다. 특정 양태에서, RebA, RebD, 및 RebM의 비율은 배지 중 스테비올 글리코시드의 전체 함량에 기초한다. 특정 양태에서, RebA, RebD, 및 RebM의 비율은 유전적으로 변형된 숙주 세포와 관련된 스테비올 글리코시드의 전체 함량에 기초한다.
특정 양태에서, 본원에서 제시된 발효 조성물은 RebM2를 검출 불가능한 레벨로 함유한다. 특정 양태에서, 본원에서 제시된 발효 조성물은 자연적으로 존재하지 않는 스테비올 글리코시드를 검출 불가능한 레벨로 함유한다. 특정 양태에서, 본원에 제시된 발효 조성물에 대해서 GC-크로마토그래피를 수행하는 경우에, RebA 피크와 RebB 사이에서 검출 가능한 레벨의 "스테비올 + 2 글루코스" 피크를 생성하지 않는다.
10. 스테비올
글리코시드의 회수
스테비올 글리코시드가 숙주 세포에 의해 생산되면, 스테비올 글리코시드는 당해분야에 공지된 임의의 적합한 분리 및 정제를 이용하여, 후속적인 이용을 위해 회수 및 분리될 수 있다. 몇몇 양태에서, 스테비올 글리코시드를 포함하는 유기상은 원심분리에 의해 발효물로부터 분리된다. 다른 양태에서, 스테비올 글리코시드를 포함하는 유기상은 발효물로부터 자발적으로 분리된다. 다른 양태에서, 스테비올 글리코시드를 포함하는 유기상은 항유화제(demulsifier) 및/또는 핵제(nucleating agent)를 발효 반응에 첨가함으로써 발효물로부터 분리된다. 항유화제의 설명적 예시는 응집제(flocculant) 및 응고제(coagulant)를 포함한다. 핵제의 설명적 예시는 도데칸(dodecane), 이소프로필 미리스트레이트(isopropyl myristrate), 및 메틸 올레에이트(methyl oleate)와 같은 유기 용매와 스테비올 글리코시드 자체의 액적들을 포함한다.
이들 세포에서 생산된 스테비올 글리코시드는 배양 상청액에 존재할 수 있고/할 수 있거나, 숙주 세포와 관련될 수 있다. 스테비올 글리코시드가 숙주 세포와 관련된 양태에서, 스테비올 글리코시드의 회수는 세포를 투과(permeabilizing) 또는 용해시키는 방법을 포함할 수 있다. 대안적으로 또는 동시에, 배양 배지 중 스테비올 글리코시드는 크로마토그래피, 추출, 용매 추출, 막 분리(membrane separation), 전기투석 (electrodialysis), 역삼투(reverse osmosis), 증류, 화학적 유도체화(derivatization) 및 결정화를 포함하나, 이에 한정되는 것은 아닌 회수 공정을 이용하여 회수될 수 있다.
몇몇 양태에서, 스테비올 글리코시드는 유기상에 존재할 수 있는 다른 생성물로부터 분리된다. 몇몇 양태에서, 분리는 흡수(adsorption), 증류, 기체-액체 추출(gas-liquid extraction) [스트리핑(stripping)], 액체-액체 추출 (liquid-liquid extraction) (용매 추출), 진공 추출, 증발, 한외여과, 및 표준 크로마토그래피 기법을 이용하여 달성된다. 다른 적합한 발효 배지 및 방법이 예를 들어, US 제2016/0185813호에 기재되어 있다.
11. 유전적으로
변형된 세포를 생성하는 방법
상기 기재된 변형들 중 하나 이상, 예를 들어, 피숨 사티붐 카우렌 산화효소, 및/또는 예를 들어, 스테비올 글리코시드 화합물에 대한 생합성 경로 효소를 인코딩하는 하나 이상의 핵 이종 핵산을 포함하도록 유전적으로 조작된 숙주 세포를 생산하는 방법이 본원에서 또한 제시된다. 숙주 세포에서 발현을 허용하는 조절 인자(regulatory element)의 제어하에 있는, 효소를 인코딩하는 뉴클레오티드 서열을 포함하는 핵산을 숙주 세포로 도입시킴으로써, 숙주 세포에서 이종 효소의 발현이 달성될 수 있다. 몇몇 양태에서, 핵산은 염색체 외 플라스미드(extrachromosomal plasmid)이다. 다른 양태에서, 핵산은 뉴클레오티드 서열을 숙주 세포의 염색체로 통합시킬 수 있는 염색체 통합 벡터(chromosomal integration vector)이다.
이들 단백질을 인코딩하는 핵산은 제한 없이, 통상의 기술자에게 공지된 임의의 방법에 의해 숙주 세포로 통합될 수 있다 (예를 들어, Hinnen 외. (1978) Proc . Natl. Acad . Sci . USA 75:1292-3; Cregg 외. (1985) Mol . Cell. Biol . 5:3376-3385; Goeddel 외. eds, 1990, Methods in Enzymology, vol. 185, Academic Press, Inc., CA; Krieger, 1990, Gene Transfer and Expression -- A Laboratory Manual, Stockton Press, NY; Sambrook 외, 1989, Molecular Cloning -- A Laboratory Manual, Cold Spring Harbor Laboratory, NY; 및 Ausubel 외, eds., Current Edition, Current Protocols in Molecular Biology, Greene Publishing Associates and Wiley Interscience, NY를 참고한다). 예시적인 기법은 스페로플라스팅(spheroplasting), 전기천공(electroporation), PEG 1000 매개 형질전환, 및 리튬 아세테이트 또는 리튬 클로라이드 매개 형질전환을 포함하나, 이들에 한정되는 것은 아니다.
숙주 세포에서 효소의 카피 수는 효소를 인코딩하는 유전자의 전사를 변형시킴으로써 변경될 수 있다. 이는, 예를 들어, 효소를 인코딩하는 뉴클레오티드 서열의 카피 수를 변형시킴으로써 (예를 들어, 뉴클레오티드 서열을 포함하는 더 높은 카피 수 또는 더 낮은 카피 수의 발현 벡터를 이용함으로써, 또는 뉴클레오티드 서열의 추가의 카피를 숙주 세포의 게놈으로 도입시킴으로써, 또는 숙주 세포의 게놈에서 뉴클레오티드 서열을 결실 또는 파괴시킴으로써); 오페론의 폴리시스트론 mRNA(polycistronic mRNA) 상에서 서열을 코딩하는 순서를 변화시키거나 또는 오페론을 개별적인 유전자 - 각각은 이의 자체 제어 인자(control element)를 지님 - 로 분해시킴으로써; 또는 뉴클레오티드 서열이 작동가능하게 연결된, 프로모터 또는 오퍼레이터의 세기를 증가시킴으로써; 달성될 수 있다. 대안적으로 또는 이에 더하여, 숙주 세포에서 효소의 카피 수는, 효소를 인코딩하는 mRNA의 번역의 레벨을 변형시킴으로써 변경될 수 있다. 이는, 예를 들어, mRNA의 안정성을 변형시킴으로써; 리보솜 결합 부위의 서열을 변형시킴으로써; 리보솜 결합 부위와 효소 코딩 서열의 개시 코돈 사이의 거리 또는 서열을 변형시킴으로써; 효소 코딩 영역의 개시 코돈의 5' 측의 "상류"에 위치하거나 또는 이에 인접한 전체 시스트론 간 영역 (intercistronic region)을 변형시킴으로써; 헤어핀 및 전문화된 서열(specialized sequence)을 이용하여 mRNA 전사물의 3'-말단을 안정화시킴으로써; 효소의 코돈 사용을 변형시킴으로써; 효소의 생합성에서 이용되는 드문 코돈 tRNA(rare codon tRNA)의 발현을 변경함으로써; 및/또는 효소의 안정성을, 예를 들어, 이의 코딩 서열의 돌연변이를 통해 증가시킴으로써; 달성될 수 있다.
숙주 세포에서 효소의 활성은 다음을 포함하나, 이들에 한정되는 것은 아닌 다수의 방법으로 변경될 수 있다: 숙주 세포에서 증가 또는 감소된 용해도를 보이는 효소의 변형된 형태의 발현; 도메인 - 이를 통해 효소의 활성이 억제됨 - 이 결여된 효소의 변형된 형태의 발현; 기질에 대한 더 높거나 더 낮은 Kcat, 또는 더 낮거나 더 높은 Km을 갖는 효소의 변형된 형태의 발현; 또는 경로 내 다른 분자에 의한 피드-백 조절(feed-back regulation) 또는 피드-포워드 조절(feed-forward regulation)에 의해 영향을 더 받거나 또는 덜 받는 효소의 변경된 형태의 발현.
몇몇 양태에서, 숙주 세포를 유전적으로 변형하는 데 이용된 핵산은 형질전환된 숙주 세포의 선별 및 외부 DNA를 유지하기 위해 숙주 세포에 선택압(selective pressure)을 가하는 데 유용한 하나 이상의 선별가능한 마커(selectable marker)를 포함한다.
몇몇 양태에서, 선별가능한 마커는 항생제 저항성 마커이다. 항생제 저항성 마커의 설명적 예시는 BLA , NAT1 , PAT, AUR1 -C, PDR4 , SMR1 , CAT, 마우스 dhfr, HPH, DSDA , KAN R , 및 SH BLE 유전자 산물을 포함하나, 이에 한정되는 것은 아니다. E. 콜라이로부터 수득된 BLA 유전자 산물은 베타-락탐 항생제[예, 좁은 범위(narrow-spectrum) 세팔로스포린(cephalosporin), 세파마이신(cephamycin), 및 카바페넴(carbapenem) (에르타페넴(ertapenem)), 세파만돌(cefamandole), 및 세포페라존(cefoperazone)] 및 테모실린(temocillin)을 제외한 모든 항-그람-음성 박테리아 페니실린에 대한 저항성을 부여하고; S. 노우르세이(S. noursei)로부터 수득된 NAT1 유전자 산물은 노우르세오트리신(nourseothricin)에 대한 저항성을 부여하며; S. 비리도크로모게 네스 Tu94로부터 수득된 PAT 유전자 산물은 비알로포스(bialophos)에 대한 저항성을 부여하고; 사카로마이세스 세레비시아로부터 수득된 AUR1 -C 유전자 산물은 아우에로바시딘 A (Auerobasidin A, AbA)에 대한 저항성을 부여하며; PDR4 유전자 산물은 세룰레닌(cerulenin)에 대한 저항성을 부여하고; SMR1 유전자 산물은 설포메투론 메틸(sulfometuron methyl)에 대한 저항성을 부여하며; Tn9 트랜스포존(transposon)으로부터 수득된 CAT 유전자 산물은 클로람페니콜(chloramphenicol)에 대한 저항성을 부여하고; 마우스 dhfr 유전자 산물은 메토트렉세이트에 대한 저항성을 부여하며; 클레브시엘라 뉴모니에(Klebsiella pneumonia)의 HPH 유전자 산물은 하이그로마이신 B(Hygromycin B)에 대한 저항성을 부여하고; E. 콜라이의 DSDA 유전자 산물은 세포가 D-세린을 단독 질소 공급원으로 함유한 플레이트 상에서 성장하도록하며; Tn903 트랜스포존의 KAN R 유전는 G418에 대한 저항성을 부여하고; 스트 렙토알로테이쿠스 힌두스타누스 ( Streptoalloteichus hindustanus )로부터 수득된 SH BLE 유전자 산물은 제오신(블레오마이신)[Zeocin (bleomycin)]에 대한 저항성을 부여한다. 몇몇 양태에서, 항생제 저항성 마커는 본원에 개시된 유전적으로 변형된 숙주 세포가 분리된 후에 결실된다.
몇몇 양태에서, 선별가능한 마커는 유전적으로 변형된 미생물에서 영양요구성(auxotrophy) [예, 영양소 영양요구성(nutritional auxotrophy)]을 회복시킨다(rescuing). 이러한 양태에서, 모 미생물은(parent microorganism)은 아미노산 또는 뉴클레오티드 생합성 경로에서 작용하고, 비-기능성인 경우에 모세포가 하나 이상의 영양소로 보충되지 않은 배지에서 성장할 수 없는 상태로 만드는 하나 이상의 유전자 산물에서의 기능상의 파괴(functional disruption)를 포함한다. 이러한 유전자 산물은 효모에서의 HIS3 , LEU2 , LYS1 , LYS2 , MET15, TRP1 , ADE2 , 및 URA3 유전자 산물을 포함하나, 이에 한정되는 것은 아니다. 이어서, 파괴된 유전자 산물의 기능성 카피(functional copy)를 인코딩하는 발현 벡터 또는 염색체 통합 제작물(chromosomal integration construct)로 모세포를 형질전환시킴으로써, 영양요구성 표현형(auxotrophic phenotype)이 회복될 수 있고, 생성된 유전적으로 변형된 숙주 세포는 모세포의 영양요구성 표현형의 상실에 기초하여 선별될 수 있다. 선별가능한 마커로서 URA3 , TRP1, 및 LYS2 유전자의 활용은, 양성 및 음성 선별 모두가 가능하기 때문에, 현저한 이점을 가진다. 양성 선별은 URA3 , TRP1, 및 LYS2 돌연변이의 영양요구성 보완(auxotrophic complementation)에 의해 수행되는 반면에, 음성 선별은 특정한 억제자, 즉, 각각 5-플루오로-오르트산 (fluoro-orotic acid, FOA), 5-플루오로안트라닐산(5-fluoroanthranilic acid), 및 아미노아디프산(aminoadipic acid, aAA) - 자가영양 균주(prototrophic strain)의 성장을 예방하나, 각각 URA3 , TRP1, 및 LYS2 돌연변이의 성장을 허용함 - 에 기초한다. 다른 양태에서, 선별가능한 마커는 공지된 선별 방법에 의해 확인될 수 있는 다른 비-치명적인(non-lethal) 결핍 또는 표현형을 회복시킨다.
본 개시내용의 방법, 조성물 및 유기체에 유용한 특정한 유전자 및 단백질이 본원에 기재되었지만, 이러한 유전자에 대한 절대적인 동일함(absolute identity)이 필수적이지 않다는 것이 인식될 것이다. 예를 들어, 폴리펩티드 또는 효소를 인코딩하는 서열을 포함하는 특정한 유전자 또는 폴리뉴클레오티드의 변화가 수행될 수 있고, 활성에 대해서 스크리닝될 수 있다. 통상적으로, 이러한 변화는 보존적 돌연변이 및 침묵 돌연변이를 포함한다. 이러한 변형된 또는 돌연변이된 폴리뉴클레오티드 및 폴리펩티드는 당해분야에 공지된 방법을 이용하여, 기능성 효소의 발현에 대해서 스크리닝될 수 있다.
유전 암호(genetic code)의 내재하는 축퇴(inherent degeneracy)로 인해, 동일하거나 또는 기능적으로 등가인 폴리펩티드를 실질적으로 인코딩하는 다른 폴리뉴클레오티드가 이러한 효소를 인코딩하는 폴리뉴클레오티드의 클로닝 및 발현에 또한 이용될 수 있다.
코딩 서열을 변형하여, 특정한 숙주에서 이의 발현을 강화시키는 것이 이로울 수 있는데, 이는 통상의 기술자에게 이해될 것이다. 유전 암호는 64개의 가능한 코돈으로 중복되지만(redundant), 대부분의 유기체는 통상적으로 이들 코돈의 하위 집합을 이용한다. 종(species)에서 가장 흔히 사용되는 코돈을 최적 코돈(optimal codon)이라고 하며, 매우 흔히 사용되지 않는 코돈은 드문 (rare) 또는 저-사용 코돈(low-usage codon)으로 분류된다. 때때로, "코돈 최적화" 또는 "종 코돈 편향에 대한 제어(controlling for species codon bias)"라고 하는 과정에서, 코돈이 치환되어 숙주의 바람직한 코돈 사용을 반영할 수 있다. 다른 숙주 세포에 대한 코돈 최적화는 코돈 사용표를 이용하여 용이하게 결정될 수 있거나, 또는 Integrated DNA Technologies의 CodonOp (www.idtdna.com/CodonOptfrom)와 같은 시판중인 소프트웨어를 이용하여 수행될 수 있다.
특정한 원핵 또는 진핵 숙주에 의해 선호되는 코돈을 함유하는 최적화된 코딩 서열 (Murray 외, 1989, Nucl Acids Res. 17: 477-508)이 제조되어, 예를 들어, 번역의 속도를 증가시키거나, 또는 비-최적화된 서열로부터 생산된 전사물에 비해서 더 긴 반감기와 같은, 목적하는 특성을 갖는 재조합 RNA 전사물을 생산할 수 있다. 또한, 번역 종결 코돈이 변형되어, 숙주 선호도를 반영할 수 있다. 예를 들어, S. 세레비시아 및 포유동물에 대한 통상적인 종결 코돈은 각각 UAA 및 UGA이다. 단자엽 식물(monocotyledonous plant)에 대한 통상적인 종결 코돈은 UGA인 반면에, 곤충 및 E. 콜라이는 통상적으로 UAA를 종결 코돈으로 이용한다 (Dalphin 외, 1996, Nucl Acids Res. 24: 216-8).
통상의 기술자는, 유전 암호의 축퇴 성질(degenerate nature)로 인해, 다양한 DNA 분자 - 이들의 뉴클레오티드 서열이 상이한 - 가 본 개시내용의 제공된 효소를 인코딩하는 데 이용될 수 있다는 것을 인식할 것이다. 상기 기재된 생합성 효소를 인코딩하는 천연 DNA 서열이 단지 본 개시내용의 양태를 설명하기 위해 본원에서 언급되고, 본 개시내용은 본 개시내용의 방법에서 활용되는 효소의 폴리펩티드 및 단백질의 아미노산 서열을 인코딩하는 임의의 서열의 DNA 분자를 포함한다. 유사한 방식으로, 폴리펩티드는 목적하는 활성의 상실 또는 유의한 상실 없이, 이의 아미노산 서열에 하나 이상의 아미노산 치환, 결실, 및 삽입을 통상적으로 용인할 수 있다. 본 개시내용은 변형된 또는 변이된 폴리펩티드가 참조 폴리펩티드의 효소 동화 활성(anabolic activity) 또는 이화 활성(catabolic activity)을 갖는 한, 본원에 기재된 특정한 단백질과 상이한 아미노산 서열을 갖는 이러한 폴리펩티드를 포함한다. 또한, 본원에 나타낸 DNA 서열에 의해 인코딩된 아미노산 서열은 단지, 본 개시내용의 양태를 설명한다.
또한, 본원에 제시된 조성물 및 방법에 유용한 효소의 상동체가 본 개시내용에 의해 포함된다. 몇몇 양태에서, 2개의 단백질 (또는 단백질의 영역)은 아미노산 서열이 적어도 약 30%, 40%, 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 일치도를 갖는 경우에, 실질적으로 상동성이다. 2개의 아미노산 서열, 또는 핵산 서열의 백분율 일치도를 측정하기 위해, 서열들은 최적의 비교 목적을 위해 정렬된다 (예를 들어, 최적의 정렬을 위해, 갭이 제1 및 제2 아미노산 또는 핵산 서열 중 하나 또는 모두에 도입될 수 있고, 비-상동 서열이 비교 목적을 위해 무시될 수 있다). 하나의 양태에서, 비교 목적을 위해 정렬된 참조 서열의 길이는 참조 서열 길이의 적어도 30%, 통상적으로는 적어도 40%, 더욱 통상적으로는 적어도 50%, 더 더욱 통상적으로는 적어도 60%, 및 더 더욱 통상적으로는 적어도 70%, 80%, 90%, 100% 이다. 대응하는 아미노산 자리 또는 뉴클레오티드 자리에서 아미노산 잔기 또는 뉴클레오티드가 비교된다. 제1 서열에 존재하는 자리에, 제2 서열에 존재하는 대응하는 자리와 동일한 아미노산 잔기 또는 뉴클레오티드가 위치하는 경우에, 분자는 상기 자리에서 일치한다 (본원에서 이용된, 아미노산 또는 핵산 "일치도"는 아미노산 또는 핵산 "상동성"과 등가임). 두 서열 사이의 백분율 일치도는 서열에 의해 공유되는 동일한 자리의 수의 함수이고, 두 서열의 최적의 정렬을 위해 도입될 필요가 있는 갭의 수와 각 갭의 길이를 고려한다.
"상동성-"이 단백질 또는 펩티드에 대해서 이용되는 경우에, 일치하지 않는 잔기 자리는 보존적 아미노산 치환에 의해 대개 상이하지 않다는 것이 인지된다. "보존적 아미노산 치환"은 아미노산 잔기가 유사한 화학적 특성 (예, 전하 또는 소수성)을 지닌 측쇄 (R 기)를 갖는 다른 아미노산 잔기에 의해 치환된 것이다. 대체로, 보존적 아미노산 치환은 단백질의 기능적 특성을 실질적으로 변화시키지 않을 것이다. 2개 이상의 아미노산 서열이 보존적 치환에 의해 서로 상이한 경우에, 백분율 서열 일치도 또는 상동성의 정도(degree of homology)는 상향 조정되어, 치환의 보존적 성질에 대해서 보정할 수 있다. 이러한 조정을 수행하는 수단은 통상의 기술자에게 주지되어 있다 (예를 들어, Pearson W. R., 1994, Methods in Mol Biol 25: 365-89를 참고).
다음의 6개의 그룹은 각각, 서로에 대한 보존적 치환인 아미노산을 함유한다: 1) 세린(Serine, S), 트레오닌(Threonine, T); 2) 아스파라긴산(Aspartic Acid, D), 글루탐산(Glutamic Acid, E); 3) 아스파라긴(Asparagine, N), 글루타민(Glutamine, Q); 4) 아르기닌(Arginine, R), 리신(Lysine, K); 5) 이소류신(Isoleucine, I), 류신(Leucine, L), 알라닌(Alanine, A), 발린(Valine, V), 및 6) 페닐알라닌(Phenylalanine, F), 티로신(Tyrosine, Y), 트립토판(Tryptophan, W).
백분율 서열 일치도로 또한 지칭되는, 폴리펩티드에 대한 서열 상동성은 통상적으로 서열 분석 소프트웨어를 이용하여 측정된다. 상이한 유기체로부터 비롯된 많은 수의 서열을 함유하는 데이터베이스에 분자 서열을 비교하는데 이용되는 통상적인 알고리즘은 컴퓨터 프로그램인 BLAST이다. 많은 수의 상이한 유기체로부터 비롯된 서열을 함유하는 데이터베이스를 검색하는 경우에, 아미노산 서열을 비교하는 것이 통상적이다.
또한, 상기 기재된 효소들을 인코딩하는 유전자들 중 임의의 유전자 (또는 본원에서 언급된 임의의 다른 유전자들 (또는 이들의 발현을 제어 또는 조절하는 조절 인자들 중 임의의 인자))는 통상의 기술자에게 공지된, 유도 진화(directed evolution) 또는 합리적 돌연변이 유발(rational mutagenesis)과 같은 유전자/단백질 조작 기법에 의해 최적화될 수 있다. 이러한 작용은 통상의 기술자가 효모에서의 발현 및 활성에 대해 효소를 최적화하는 것을 허용한다.
또한, 이들 효소를 인코딩하는 유전자가 다른 진균 또는 박테리아 종으로부터 확인될 수 있고, 이 경로의 조절을 위해 발현될 수 있다. 다양한 유기체는 이들 유전자를 위한 공급원으로 작용할 수 있으며, 다음을 포함하나, 이에 한정되는 것은 아니다: S. 세레비시아 및 S. 우바룸(S. uvarum)을 포함하는 사카로마이세 스 spp.; K. 써모톨러란스 (K. thermotolerans ), K. 락티스, 및 K. 마르시아누스를 포함하는 클루이베로마이세스 spp.; 피키아 spp.; H. 폴리모르파를 포함하는 한세눌라 spp.; 칸디다 spp.; 트리코스포론 spp.; Y. spp. 스티피티스(Y. spp. stipitis )를 포함하는 야마다지마 spp . ( Yamadazyma spp .); 토룰라스포라 프레토리 엔시스(Torulaspora pretoriensis ); 이사첸키아 오리엔탈리스(Issatchenkia orientalis); S. 폼베를 포함하는 스키조사카로마이세스 spp.; 크립토코커스 spp .; 아스페르길루스 spp .( Aspergillus spp .); 뉴로스포라 spp.; 또는 우스틸라고 spp.(Ustilago spp.). 혐기성 진균으로부터 수득된 유전자들의 공급원들은 피로마이세스 spp .( Piromyces spp .), 오르피노마이세스 spp .( Orpinomyces spp .), 또는 네 오칼리 마스틱스 spp .( Neocallimastix spp .)를 포함하나, 이에 한정되는 것은 아니다. 유용한 원핵생물 효소의 공급원들은 다음을 포함하나, 이들에 한정되는 것은 아니다: 에세리키아 콜라이, 자이모모나스 모빌리스, 스타필로코커스 아우레우스, 바실 러스 spp., 클로스트리듐 spp., 코리네박테리움 spp .( Corynebacterium spp .), 슈도모나스 spp., 락토코커스 spp., 엔테로박터 spp., 및 살모넬라 spp..
통상의 기술자에게 공지된 기법은 추가의 상동 유전자 및 상동 효소를 확인하는 데 적합할 수 있다. 일반적으로, 유사 유전자(analogous gene) 및/또는 유사 효소(analogous enzyme)는 기능 분석에 의해 확인될 수 있고, 기능적 유사성을 가질 것이다. 통상의 기술자에게 공지된 기법은 유사 유전자 및 유사 효소를 확인하는 데 적합할 수 있다. 예를 들어, 상동 또는 유사 UDP 글리코실 전이효소, PTA, 또는 임의의 생합성 경로 유전자, 단백질, 또는 효소를 확인하기 위해, 기법은 관심 있는 유전자/효소의 공개된 서열에 기초한 프라이머를 이용한 PCR; 또는 관심 있는 유전자들 중 보존된 영역을 증폭하도록 설계된 축퇴 프라이머(degenerate primer)를 이용한 축퇴 PCR(degenerate PCR);에 의한 유전자의 클로닝을 포함하나, 이에 한정되는 것은 아니다. 또한, 통상의 기술자는 기법을 이용하여, 기능적 상동성 또는 유사성을 갖는 상동 또는 유사 유전자, 단백질, 또는 효소를 확인할 수 있다. 기법은 다음을 포함한다: 세포 또는 세포 배양물을 효소의 촉매 활성에 대한 시험관 내 효소 검정을 통해서, 상기 활성에 대해서 검사(예를 들어, 본원 또는 Kiritani, K., Branched-Chain Amino Acids Methods Enzymology, 1970에 기재됨)한 후에, 상기 활성을 갖는 효소를 정제를 통해 분리하는 것, 에드만 분해(Edman degradation)와 같은 기법을 통해 효소의 단백질 서열을 결정하는 것, 유망한 핵산 서열에 대한 PCR 프라이머의 설계, PCR을 통한 상기 DNA 서열의 증폭, 및 상기 핵산 서열의 클로닝. 상동 또는 유사한 유전자 및/또는 상동 또는 유사한 효소, 유사 유전자 및/또는 유사 효소 또는 단백질을 확인하기 위해, 기법은 또한 후보 유전자 또는 효소에 관련된 데이터를 BRENDA, KEGG, 또는 MetaCYC와 같은 데이터베이스와 비교하는 것을 포함한다. 본원의 교시에 따라, 후보 유전자 또는 효소가 상기 언급된 데이터베이스 내에서 확인될 수 있다.
[
실시예
]
[
실시예
1:
파르네실
피로포스페이트
(
FPP
) 및
이소프레노이드
파르네
센(isoprenoid
farnesene
)에 대해서 높은 플럭스(high flux)를 할 수 있는 기본 효모 균주(base yeast strain)의 생성]
GAL1 또는 GAL10 프로모터의 제어하에서, 메발로네이트 경로 (도 1d)의 유전자를 발현시킴으로써, 파르네센 생산 균주를 야생형 사카로마이세스 세레비시아 균주 (CEN.PK2)로부터 제작했다. 상기 균주는 다음의 염색체 통합된 S. 세레비시아로부터 수득된 메발로네이트 경로 유전자를 포함했다: 아세틸-CoA 티올라제, HMG-CoA 합성효소, HMG-CoA 환원효소, 메발로네이트 인산화효소, 포스포메발로네이트 인산화효소, 메발로네이트 피로포스페이트 탈탄산효소, 및 IPP:DMAPP 이성질화 효소. 공개적으로 입수가능하거나 또는 다른 적합한 알고리즘을 이용하여, 본원에 기재된 모든 유전자를 코돈 최적화시켰다. 이에 더하여, 균주는 아르테미시닌 아누아(Artemisinin annua)로부터 수득되었고, 또한 GAL1 또는 GAL10 프로모터 중 하나의 제어하에 있는, 파르네센 합성효소의 6 카피를 함유했다. 또한, 균주는 GAL80 유전자의 결실과 GAL4oc 프로모터 하에 있는 GAL4의 추가의 카피를 함유했고, 사카 로마이세스 세레비시아의 GAL4 유전자의 코딩 서열은 이의 천연 프로모터의 "작동 구성요소(operative constitutive)" 버전의 조절 제어(regulatory control)하에 있다 (PGAL4oc; 예를 들어, Griggs & Johnston (1991) PNAS 88(19):8597-8601을 참고). 끝으로, 천연 프로모터를 효모 유전자 MET3의 프로모터로 대체함으로써, 스쿠알렌 합성효소(squalene synthase)를 인코딩하는 ERG9 유전자를 하향조절한다 (Westfall 외, PNAS 2012).
[
실시예
2:
레바우디오사이드
A (
RebA
)에 높은 플럭스를 할 수 있는 기본 효소 균주의 생성]
도 1b는 FPP로부터 스테비올로 만드는 예시적 생합성 경로를 나타낸다. 도 2는 스테비올로부터 글리코시드 RebM으로 만드는 예시적 생합성 경로를 나타낸다. 상기 기재된 파르네센 기본 균주(base strain)를 C-20 이소프레노이드 카우렌에 대한 높은 플럭스를 갖도록 전환하기 위해, 6 카피의 제라닐제라닐 피로포스페이트 합성효소(GGPP)를 게놈으로 통합시킨 후에, 각각 4 카피의 코팔릴디포스페이트 합성효소 및 카우렌 합성효소를 게놈으로 통합시켰다. 표 1은 FPP를 RebA로 전환하는 데 이용된 모든 유전자와 프로모터를 열거한다. 이 시점에서, 6 카피의 파르네센 합성효소를 균주로부터 제거했다. 새로운 균주가 엔트 -카우렌을 만드는 것으로 확인되면, 엔트 -카우렌을 RebA로 전환시키는 나머지 유전자를 게놈으로 삽입했다. 2 카피를 갖는 Sr.KAH 효소를 제외하고, 각 유전자를 단일 카피로 통합시켰다 (표 1). 표 1에 기재된 모든 유전자를 함유하는 균주는 RebA를 주로 생산했다. 효소 UGT91D_like3은 RebA를 레바우디오사이드 D (RebD)로 전환하는 약간 낮은 활성을 가진다. 단일 카피의 91D_like3이 RebA의 약 (3%)를 균주에서 RebD로, 상기 기재된 효모 균주의 (도 3 및 표 2) 생체 내에서 전환시킬 수 있다는 것을 측정했다. 이어서, UGT76G1은 RebD를 최종 생성물인 레바우디오사이드 M (RebM)으로 전환할 수 있다.
[
실시예
3: 고효율로,
카우렌을
카우레노산
으로
전환시키는
카우렌
산화효소 (KO)의 스크리닝]
RebM에 대한 높은 플럭스를 갖는 균주를 생성하기 위해, 실시예 2에 기재된 균주를 GAL1 프로모터 하에 있는, 단일 카피의 유전자 UGT40087로 형질전환시켰다 (실시예 8과 표들 및 본원에 부록(appendix)으로 첨부된 PCT 출원 AM-7400 PCT의 도면에 기재됨). 이 균주는 RebM을 주로 생산한다. 생체 내에서 카우렌을 카우레노산으로 전환하기 위한, 상이한 KO 대립 유전자를 스크리닝하기 위해, 이 RebM 균주에서 스테비아 레바우디아나 KO 유전자를 제거했고, GAL1 프로모터와 터미네이터(terminator) - 프로모터와 터미네이터 사이에 F-CphI 제한 서열(restriction sequence)을 갖는 - 만 함유하는 랜딩 패드로 대체했다 (도 3). 이제, 이 스크리닝 균주는 임의의 KO 효소가 결여되었고, 엔트-카우렌만 생성한다.
문헌으로부터 획득된 13개의 KO 효소 (표 1)를 S. 세레비시아에서 최적의 발현을 위해 코돈 최적화했고, 도 3a에 기재된 랜딩 패드에서 F-CphI 서열을 플랭킹하는(flanking) 효모 터미네이터 및 PGAL1에 대해서 상동인 60 bp의 서열로 합성했다. 각각의 합성된 KO 유전자를, 단일 카피로, 상기 기재된 효모 균주에서, 엔트 -카우렌을 카우레노산으로 생체 내에서 전환하는 능력에 대해서 개별적으로 테스트했다. 효모를 KO 공여 DNA 및 랜딩 패드 내에 DNA를 절단하기 위한 엔도뉴클레아제 F-CphI을 함유하는 플라스미드로 형질전환시켰다. 각 형질전환에서 특정한 KO 유전자에 인터널(internal)인 역방향 프라이머와 GAL1 프로모터의 말단에 있는 유니버셜 정방향 프라이머(universal forward primer)를 이용한 콜로니 PCR에 의해 정확한 통합을 확인했다. 도 3b는 정확한 F-CphI 절단 및 KO DNA를 이용한 상동 재조합(homologous recombination) 후, 최종 유전자 제작물을 나타낸다.
[표 1:
카우레노산으로의
카우렌의
더 높은 전환에 대해서, 효모에서
테스트된
카우렌
산화효소]
도 4는 KO 스크리닝의 결과를 나타낸다. 이 균주 백그라운드(strain background)에서, 스테비아 레바우디아나 (Sr.KO)로부터 수득된 KO 효소에 비해서, 식물 피숨 사티붐 (완두)으로부터 수득된 하나의 KO 효소 (Ps.KO)는 엔트 -카우렌을 카우레노산으로 전환하는 증가된 능력 (약 3.5x 개선됨)을 갖는 것으로 밝혀졌다. 효모 세포에서의 발현에 이용된 피숨 사티붐 KO 효소의 코돈 최적화된 핵산 서열은 서열번호 15로 제시된다.
[
실시예
4:
카우레노산으로의
엔트
-
카우렌의
개선된
전환을 갖는
높은 플럭스
RebM
균주의 생성]
Ps.KO의 활성을 RebM에 대한 매우 높은 플럭스를 지닌 균주에서 Sr.KO에 대해서 테스트했다. KO 효소는 보통, 대부분의 식물에서 작용하여, 식물 호르몬인 지베렐린(gibberellin)을 생산한다. 식물 세포에서 지베렐린의 레벨은 산업용 생산을 위해 효소에서 생산된 RebM의 레벨보다 크기 정도들(orders of magnitude)이 낮으므로, KO 효소는 상업용 제조를 위한 RebM의 생산에 필요한 높은 플럭스를 지닐 것으로 예상되지 않는다. 표 3은 초기에 KO 효소를 스크리닝하는 데 이용된 균주 (즉, KO "기본 균주")보다 더 높은 RebM 플럭스를 지닌 균주에 함유된 모든 유전자 및 프로모터를 열거한다. 표 3의 모든 유전자들을 효모 게놈으로 삽입했다. KO 유전자는 엔트 -카우렌을 3차례 후속적으로 산화시켜, 카우레노산을 생산한다. 반응의 순서 및 중간체는 다음과 같다: 첫 번째 산화는 엔트 -카우렌을 카우레놀로 만들고 (K-OL), 두 번째 산화는 카우레놀을 카우레날로 만들며 (K-AL), 세 번째 산화는 카우레날을 카우레노산 (-acid)으로 만든다 (도 1c). 엔트 -카우렌으로부터 RebM으로 최대 플럭스를 달성하기 위해, KO 효소는 엔트 -카우렌을 K-acid로 완전히 산화시켜야 한다. 불완전한 전환은 탄소를 소모할 것이고, RebM 역가를 전반적으로 감소시킬 것이며, 독성 중간체 화합물을 잠재적으로 생산할 것이다. 도 5의 데이터는 RebM에 대한 높은 탄소 플럭스를 지닌 균주에서, Sr.KO 대립 유전자가 상류 중간체인 엔트 -카우렌, 카우레놀 (K-OL), 카우레날 (K-AL)의 유의한 양을 축적한다고 나타낸 반면에, Ps.KO 효소는 이들 중간체의 유의하게 감소된 축적을 나타낸다.
도 6은 Sr.KO에 비해서 Ps.KO으로 생산된 카우레노산의 더 높은 양으로 인해, Ps.KO가 세포에서 만들어진 RebM의 양을 증가시킨다는 것을 나타낸다. 높은 플럭스 RebM 균주에서, Sr.KO를 지닌 동일한 균주에 비해서 Ps.KO를 지닌 균주에서 RebM 역가가 16% 증가한다. 이러한 더 높은 RebM 역가는 Ps.KO 균주에서 생산되는 더 많은 카우레노산으로 인한 것이다.
[
실시예
5: 효모 배양 조건]
예상되는 카우렌 산화효소 유전자를 함유하는 것으로 확인된 효모 콜로니를 찍어서(picking), 20 g/L의 수크로스 및 37.5 g/L의 암모늄 설페이트와 함께 버드 시드 배지(Bird Seed Media, BSM; 본래, van Hoek 외, Biotechnology and Bioengineering 68(5), 2000, pp. 517-523에 의해 기재됨)를 함유하는 96-웰 마이크로타이터 플레이트(96-well microtiter plate)로 넣었다. 세포를 30℃에서, 고용량 마이크로타이터 플레이트 배양기(high capacity microtiter plate incubator)에서, 1000 RPM으로 80%의 습도에서 3일 동안 진탕시키며, 배양물이 탄소 소진(carbon exhaustion)에 도달할 때까지 배양시켰다. 성장-포화 배양물(growth-saturated culture)로부터 14.4 μL를 취해, 360 μL의 새로운 배지 중으로 희석시킴으로써, 포화 배양물을 40 g/L의 수크로스 및 150 g/L의 암모늄 설페이트와 함께 BSM를 함유하는 새로운 플레이트 내로 계대 배양시켰다(subculturing). 생산 배지 중 세포를 30℃에서, 고용량 마이크로타이터 플레이트 진탕기(high capacity microtiter plate shaker)에서, 1000 RPM으로, 80%의 습도에서 추출 및 분석하기 전 추가로 3일 동안 배양시켰다. 완료되면, 전세포 배양액을 100% 에탄올 360 μL로 희석시키고, 호일 씰(foil seal)로 실링하여, 1250 rpm에서, 30분 동안 진탕시켜, 레바우디오사이드를 추출한다. 50:50의 에탄올:물 490 μL를 새로운 1.1-mL 검정 플레이트에 추가하고, 10uL의 배양물/에탄올 혼합물을 상기 검정 플레이트에 추가한다. 상기 혼합물을 원심분리시켜 임의의 고체를 펠렛으로 만들었고(peletting), 400 μL의 용액을 새로운 1.1-mL 플레이트로 옮겨, LC-MS에 의해 검정했다.
[
실시예
6: 분석 방법]
스테비올 및 스테비올 글리코시드의 질량 분석기 검출:
샘플을 LC-MS 질량 분석기(AB QTrap 4000)에 의해 다음의 기울기와 함께, Sigma Ascentis Express Peptide ES-C18 (5 cm, 2.1 mm, 2.7 ㎛; part #53301-U)를 이용하여 분석한다:
질량 분석기를 음이온 다중 반응 모니터링 모드(negative ion multiple reaction monitoring mode)에서 작동시켰다. 인증 표준(authentic standard)으로부터 결정된 머무름 시간(retention time) 및 MRM 전이(MRM transition)에 의해 각각의 레바우디오사이드 이성질체를 확인했다:
카우렌
정량:
배양액 중 엔트 -카우렌의 역가를 제한된 열 질량 오븐(limited thermal mass oven)과 불꽃 이온화 검출기(flame ionization detector)가 장착된 기체 크로마토그래피를 이용하여 측정한다. 동일한 비율의 배양액 및 메탄올을 이용하여 배양액 샘플을 추출하고, 실링된 용기에서 30분 동안 진탕시켜, 세포로부터 엔트-카우렌을 회수한다. 이어서, 배양액:메탄올 용액의 240 uL의 분획(aliquot)을 1 mL의 에틸 아세테이트와 희석시키고, 실링하여, 추가의 30분 동안 진탕시켜, 엔트-카우렌을 유기상 중으로 추출한다. 상기 유기상을 적절히 희석하여, 검정의 선형 범위(linear range) 내에 속하도록 하고, 샘플 바이알로 분취했다(aliquoting). 샘플을 적절한 분할비(split ratio)로 주입하여, 선형 범위 내에 속하도록 했다. 정압모드(constant pressure mode)에서, 운반 기체(carrier gas)로서 수소와 함께, 애질런트(Agilent) DB-1MS LTM II 컬럼 상에서 다음의 온도 기울기(temperature gradient)를 이용하여 샘플 분리를 수행했다: (1) 0분 동안 초기온도 150oC, (2) 25 oC/분의 온도를 230 oC의 온도로 증가시킴, (3) 1800 oC/분의 온도를 320 oC의 온도로 증가시키고, 1분 동안 유지. 인증된 엔트 -카우렌 표준을 이용한 외부 교정(external calibration)을 이용하여 엔트-카우렌의 양을 측정한다.
카우레노산
,
카우레놀
, 및
카우레날
정량
:
배양액 중 카우레노산, 카우레놀, 및 카우레날의 역가를 가변파장 검출기(variable wavelength detector)가 장착된 고압 액체 크로마토그래프(high pressure liquid chromatograph)를 이용하여 측정한다. 배양액 샘플(100 μL)을 300 μL의 에탄올 중에 희석시켜, 실링된 용기에서 30분 동안 진탕시켰다. 200 μL의 물을 배양액:에탄올 혼합물에 추가하여, 혼합시켰고, 원심분리시켰다. 생성되는 용액의 분획을 (세포 펠렛을 피하며) 샘플 바이알로 옮겼고, HPLC를 이용하여 분석했다. 애질런트 Eclipse Plus C18 USP L1 (4.6 mm x 50 mm x 1.8 μm) 상에서 다음의 용매를:
다음의 용매 기울기와 함께 이용하여, 샘플 분리를 수행한다:
피분석물(analyte)을 200 nm에서의 UV 흡수를 이용하여 검출하고, 스테비올 표준에 대한 상대 반응 계수(relative response factor)와 함께 외부 교정으로 정량한다.
도 6에 제시된 데이터에 이용된
레바우디오사이드
M 정량법:
배양액 중 레바우디오사이드 M의 역가를 삼중 사중극자 질량 분석기(triple quadrupole mass spectrometer)가 장착된 고압 액체 크로마토그래프를 이용하여 측정한다. 배양액 샘플을 에펜도르프 튜브(Eppendorf tube) 내로 분취하여, 50:50의 에탄올:물 중에 200배 내지 800배로 희석시켜, 20분 동안 혼합시켰고, 원심분리시켜 세포와 잔해물을 펠렛으로 만들었으며, 상청액의 분획을 분석용 샘플 바이알로 옮겼다. 피분석물이 MRM 전이의 신호 강도에 기초하여 정량되는 유동 주입 모드(flow injetion mode)에서 샘플을 검사한다. 이동상 40%의 물 + 0.1%의 포름산 및 60%의 아세토니트릴 + 0.1%의 포름산과 1.1 mL/분의 유속. 레바우디오사이드 M 농도를 내부 표준 (레바우디오사이드 N)의 반응에 대해서 정규화된 이의 반응에 의해 측정한다.
[표 2:
FPP를
RebA로
전환하는 데 이용된 효소의 유전자, 프로모터, 및 아미노산 서열]
[표 3:
RebM을
생산하는 균주에서 효소의 유전자, 프로모터, 카피 수, 및 아미노산 서열]
본 명세서에서 인용된 모든 간행물, 특허, 및 특허 출원은 참고로 본원에 포함되며, 각각의 개별적인 간행물 또는 특허 출원은 참고로 포함되었음이 구체적이고 개별적으로 명시되었다고 간주된다. 명료한 이해를 위해, 상기 기재된 발명이 도시 및 예시로서 일부 상세히 기재되었으나, 본 발명의 교시를 고려하면, 첨부된 청구범위의 사상 및 범위로부터 벗어나지 않고, 본 발명에 특정한 변화 및 변형이 행해질 수 있다는 것은 통상의 기술자에게 용이하게 명백할 것이다.
[서열목록]
>Seq_ID_1
MDTLTLSLGFLSLFLFLFLLKRSTHKHSKLSHVPVVPGLPVIGNLLQLKEKKPHKTFTKMAQKYGPIFSIKAGSSKIIVLNTAHLAKEAMVTRYSSISKRKLSTALTILTSDKCMVAMSDYNDFHKMVKKHILASVLGANAQKRLRFHREVMMENMSSKFNEHVKTLSDSAVDFRKIFVSELFGLALKQALGSDIESIYVEGLTATLSREDLYNTLVVDFMEGAIEVDWRDFFPYLKWIPNKSFEKKIRRVDRQRKIIMKALINEQKKRLTSGKELDCYYDYLVSEAKEVTEEQMIMLLWEPIIETSDTTLVTTEWAMYELAKDKNRQDRLYEELLNVCGHEKVTDEELSKLPYLGAVFHETLRKHSPVPIVPLRYVDEDTELGGYHIPAGSEIAINIYGCNMDSNLWENPDQWIPERFLDEKYAQADLYKTMAFGGGKRVCAGSLQAMLIACTAIGRLVQEFEWELGHGEEENVDTMGLTTHRLHPLQVKLKPRNRIY
>Seq_ID_2
MDAVTGLLTVPATAITIGGTAVALAVALIFWYLKSYTSARRSQSNHLPRVPEVPGVPLLGNLLQLKEKKPYMTFTRWAATYGPIYSIKTGATSMVVVSSNEIAKEALVTRFQSISTRNLSKALKVLTADKTMVAMSDYDDYHKTVKRHILTAVLGPNAQKKHRIHRDIMMDNISTQLHEFVKNNPEQEEVDLRKIFQSELFGLAMRQALGKDVESLYVEDLKITMNRDEIFQVLVVDPMMGAIDVDWRDFFPYLKWVPNKKFENTIQQMYIRREAVMKSLIKENKKRIASGEKLNSYIDYLLSEAQTLTDQQLLMSLWEPIIESSDTTMVTTEWAMYELAKNPKLQDRLYRDIKSVCGSEKITEEHLSQLPYITAIFHETLRRHSPVPIIPLRHVHEDTVLGGYHVPAGTELAVNIYGCNMDKNVWENPEEWNPERFMKENETIDFQKTMAFGGGKRVCAGSLQALLTASIGIGRMVQEFEWKLKDMTQEEVNTIGLTTQMLRPLRAIIKPRI
>Seq_ID_3
MAFFSMISILLGFVISSFIFIFFFKKLLSFSRKNMSEVSTLPSVPVVPGFPVIGNLLQLKEKKPHKTFTRWSEIYGPIYSIKMGSSSLIVLNSTETAKEAMVTRFSSISTRKLSNALTVLTCDKSMVATSDYDDFHKLVKRCLLNGLLGANAQKRKRHYRDALIENVSSKLHAHARDHPQEPVNFRAIFEHELFGVALKQAFGKDVESIYVKELGVTLSKDEIFKVLVHDMMEGAIDVDWRDFFPYLKWIPNKSFEARIQQKHKRRLAVMNALIQDRLKQNGSESDDDCYLNFLMSEAKTLTKEQIAILVWETIIETADTTLVTTEWAIYELAKHPSVQDRLCKEIQNVCGGEKFKEEQLSQVPYLNGVFHETLRKYSPAPLVPIRYAHEDTQIGGYHVPAGSEIAINIYGCNMDKKRWERPEDWWPERFLDDGKYETSDLHKTMAFGAGKRVCAGALQASLMAGIAIGRLVQEFEWKLRDGEEENVDTYGLTSQKLYPLMAIINPRRS
>Seq_ID_4
MAVATDPLGCMQKLVQMLQAPPYVAAAVQSSALLLTFFIGDWRKRRRSPLPLLPAIPGIPVLGNLLQLKEKKPHKTFAQWSETYGPIYSIKAGASTVIVLNSSDLAKEAMVTRYSSISSRKLSKALTILTADKCMVAMSDYNDFHKLVKRYILANVLGANAQKRLRQRRDTMIDNISRELFACVKDSSSESVNFRKIFESELFGLALKETFGRDMESLYVDGLGTTLLREDLFRTLVIDPMEGAIEVDWRDFFPYLRWIPNKGVEDRIRKMDFRRRVTMKSLMEEKKKQIAAGEDLNCYSEFLLSEAKSLTEEQISMLLWEIIIETSDTTLVVTEWAMYELAQNPKRQERLYQHIQSVCGSAKITEENLSQLPYLTAVFHETLRKYSPVSIVPLRYAHEDTQLGGYFIPAGSEVAVNIYACNMDKKQWESPEEWKPERFLDESYDPMDLYKTMAFGGGKRVCAGAPKAMLIACTTLGRLVQGFTWKLREGEEDKVDTLGLTARKLQPLHIVAKPRIN
>Seq_ID_5
MAVVTDPLASMQLLANTIPAPPYAAAAVLGGVSLVLSVFFVADCRKKRRNFLPPVPAVPGVPVLGNLLQLKEKKPHKTFARWAETYGAVYSIRTGASTVIVLNTTEVAKEAMVTRYGSISSRKLSKALTILTADKCMVAMSDYNEFHKMVKRYILANVLGANAQKKHRQRRDAMIENISRELFAHVKEFPLDTVNFRKIFEAELFRLALKETLGKDIESIYVDGLGTTLPREDLFRILVIDPMEGAIEVDWRDFFPYLRWIPNKRVENKIRNMDFRRRMTMKKLMEEPKKRIAAGEETYCYADFLLSEAKTLTEDQISMLLWETIIETSDTTLVVTEWAMYELSKDPRRQDYLYQQIQSVCGSATLTEENLSQLPYLTAIFHETLRKHSPVPVVPLRYAHEDTQLGGYFVPAGSEIAVNIYACNMDKDHWESPEEWKPERFLDDKYDPMDLHKTMAFGGGKRVCAGALKAMLIACTTIGRMVQEFEWKLREGEEEKVDTLGLTARKLQPLHVVIKPRNN
>Seq_ID_6
MSKSNSMNSTSHETLFQQLVLGLDRMPLMDVHWLIYVAFGAWLCSYVIHVLSSSSTVKVPVVGYRSVFEPTWLLRLRFVWEGGSIIGQGYNKFKDSIFQVRKLGTDIVIIPPNYIDEVRKLSQDKTRSVEPFINDFAGQYTRGMVFLQSDLQNRVIQQRLTPKLVSLTKVMKEELDYALTKEMPDMKNDEWVEVDISSIMVRLISRISARVFLGPEHCRNQEWLTTTAEYSESLFITGFILRVVPHILRPFIAPLLPSYRTLLRNVSSGRRVIGDIIRSQQGDGNEDILSWMRDAATGEEKQIDNIAQRMLILSLASIHTTAMTMTHAMYDLCACPEYIEPLRDEVKSVVGASGWDKTALNRFHKLDSFLKESQRFNPVFLLTFNRIYHQSMTLSDGTNIPSGTRIAVPSHAMLQDSAHVPGPTPPTEFDGFRYSKIRSDSNYAQKYLFSMTDSSNMAFGYGKYACPGRFYASNEMKLTLAILLLQFEFKLPDGKGRPRNITIDSDMIPDPRARLCVRKRSLRDE
>Seq_ID_7
MNKFNSMNNTINETLLRQLVSGLDEIPLMDIHWLIYVAFGAWLCSYVIHLLSSPSTVNVPFVGYRSVFEPTWFLRLRFVWEGGSIISQGYSKFKDSIFQVRKLGTDIVIIPPNYIDEVRKLSQDKTRSVEPFINDFAGDYTRGMVFLQSDLQNRVIQQRLTPKLVSLTKVMKEELDYALTKGMPDMKDDEWVEADIASIMVRLISRISARVFLGPEHCRNQEWLTTTAEYSESLFMTGFILRVVPHILRPFVAPLLPSYRTLLRSVSSGRKVIGDIIRSQQGSENEDILSWMVEAATGEEKQVDNIAQRMLILSLASIHTTAMTMTHAMYDLCARPEYTKPLREEVKGVVGASGWDKTALNRLHKLDSFLKESQRFNPVFLLTFNRIYHQPMTLSDGTNLPSGTRIAVPSHAMLQDSAHVPGPAPPTDFDGFRYSKIRSDSNYAQKYLFSMTDSSNMAFGYGKYACPGRFYASNEMKLTLAILLLQFEFKLPDGKGRPRNITIDSDMVPDPRARLCVRKRSLREE
>Seq_ID_8
MDLQTMAPMGSAAIAIGGPAVAVAGGISLLFLKSFLSQQPGNPNHLPSVPAVPGVPLLGNLLELKEKKPYKTFTKWAETYGPIYSIKTGATSMVVVNSNQLAKEAMVTRFDSISTRKLSKALQILTADKTMVAMSDYDDYHKTVKRNLLTSILGPAAQKRHRAHRDAMGDNLSRQLHALALNSPQEAINFRQIFQSELFTLAFKQTFGRDIESIFVGDLGTTMTREEMFQILVVDPMMGAIDVDWRDFFPYLKWIPNAKLEEKIEQMYIRRKAVMKAVIQEHRKRIDSGENLDSYIDFLLAEAQPLTEKQLLMSLWEPIIETSDTTMVTTEWAMYELSKHPNKQQRLYNEIRNICGSEKITEEKLCKMPYLSAVFHETLRVHSPVSIIPLRYVHENTELGGYHVPAGTELAVNIYGCNMEREIWENPEEWSPERFLAENEPVNLQKTMAFGAGKRVCAGAMQAMLLACVGIGRMVQEFEWRLKDDVEEDVNTLGLTTQRLNPMLAVIKPRN
>Seq_ID_9
MDGVIDMQTIPLRTAIAIGGTAVALVVALYFWFLRSYASPSHHSNHLPPVPEVPGVPVLGNLLQLKEKKPYMTFTKWAEMYGPIYSIRTGATSMVVVSSNEIAKEVVVTRFPSISTRKLSYALKVLTEDKSMVAMSDYHDYHKTVKRHILTAVLGPNAQKKFRAHRDTMMENVSNELHAFFEKNPNQEVNLRKIFQSQLFGLAMKQALGKDVESIYVKDLETTMKREEIFEVLVVDPMMGAIEVDWRDFFPYLKWVPNKSFENIIHRMYTRREAVMKALIQEHKKRIASGENLNSYIDYLLSEAQTLTDKQLLMSLWEPIIESSDTTMVTTEWAMYELAKNPNMQDRLYEEIQSVCGSEKITEENLSQLPYLYAVFQETLRKHCPVPIMPLRYVHENTVLGGYHVPAGTEVAINIYGCNMDKKVWENPEEWNPERFLSEKESMDLYKTMAFGGGKRVCAGSLQAMVISCIGIGRLVQDFEWKLKDDAEEDVNTLGLTTQKLHPLLALINPRKS
>Seq_ID_10
MEAFVPGGAGAAAAAVGGFVAAAALAERAGVIAPRKRPNAPPAVPGLPIIGNLHQLKEKKPHQTFAKWAEIYGPIYTIRTGASSVVVLNSTEVAKEAMVAKFSSISTRKLSKALTVLTRDKSMVATSDYCDFHKMVKRYVMSSMLGTSAQKQFRDIRDMMIHNMLSTFHKLVKDDPHAPLIFRDVFKDELFRLSMIQSLGEDVSSVYVDEFGRDISKEEIYNATVTDMMMCAIEVDWRDFFPYLSWVPNKSFETRVFTTETRRTAVMRALIKQQKERIVRGEAKTCYLDFLLAENTLTDEQLMMLVWEALIEAADTTLVTTEWAMYELAKNPDKQERLYQEIREVCGDETVTEEHLPRLPYLNAVFHETLRRHSPVPLIPPRFVHEDTKLAGYDVPAGTEMVINLYGCNMNRKEWESPEEWVPERFAGGRLEVADMYKTMAFGAGRRACAGSLQATHIACAAVARFVQEFGWRLREGDEEKVDTVQLTAYKLHPLHVHLTRRGRM
>Seq_ID_11
MLETKVIAHHVSHSPCAAIPGGLPVLGNLLQLTEKKPHRTFTAWSKEHGPIFTIKVGSVPQAVVNNSEIAKEVLVTKFASISKRQMPMALRVLTRDKTMVAMSDYGEEHRMLKKLVMTNLLGPTTQNKNRSLRDDALIGMIEGVLAELKASPTSPKVVNVRDYVQRSLFPFALQQVFGYIPDQVEVLELGTCVSTWDMFDALVVAPLSAVINVDWRDFFPALRWIPNRSVEDLVRTVDFKRNSIMKALIRAQRMRLANLKEPPRCYADIALTEATHLTEKQLEMSLWEPIIESADTTLVTSEWAMYEIAKNPDCQDRLYREIVSVAGTERMVTEDDLPNMPYLGAIIKETLRKYTPVPLIPSRFVEEDITLGGYDIPKGYQILVNLFAIANDPAVWSNPEKWDPERMLANKKVDMGFRDFSLMPFGAGKRMCAGITQAMFIIPMNVAALVQHCEWRLSPQEISNINNKIEDVVYLTTHKLSPLSCEATPRISHRLP
>Seq_ID_12
MMDDTTSPYSTYHSVRSIRNQSAWALAPIAVFICYVVLRHNRKSVPAASAGSHSILEPLWLARLRFIRDSRFIIGQGYSKFKDTIFKVTKVGADIIVVAPKYVEEIRRLSRDTGRSVEPFIHDFAGELLGGLNFLESDLQTRVVQQKLTPNLKTIVPVMEDEMHYALVSELDSCLDGSEHWTRVDMIHMLSRIVSRISARIFLGPKYCRNDLWLKTTAEYTENLFLTGTLLRFVPRMLQKWIAPLLPSFRQLQENRQAARKIISEILTDHQPEKHDETSDNGDPYPDILTLMFQAARGKEKDIEDIAQHTLLLSLSSIHTTALTMTQALYDLCAYPQYLDPVKHEIADTLQSEGSWSKAMLDKLHMMDSLLRESQRLSPVFLLTFNRILHTPLTLSNGIHLPKGTRIAAPSDAILNDPSLVPGPQPADTFDPFRYINHSTGDAKKTKTNFQTTSLQNMAFGYGKYACPGRFYVANEIKLVLGHLLMHYEFKFPPGMGRPVNSTVDTDMYPDLGARLLVRKRKMEE
>Seq_ID_13
MESLVAALPAGGAAAAAAFGGLVAAAALAGKVGLVGSKKHLNAPPAVSGLPLIGNLHQLKEKKPHQTFTKWAEIYGPIYTIRTGSSTVVVLNSAQVAKEAMIAKFSSISTRKLSKALSALTRDKTMVATSDYGDFHKMIKRYIMTFMLGTSGQKQFRDTRNMMVDNMLNTFHTLLMDDPNSPLNFREVFKNELFRLSLVQALGEDVSSIYVEEYGKVISKEEIYKATVVDMMMCAIEVDWRDFFPYLSWIPNRTFETRVLTTEARRTTVMQALIKQQKERIARGETRISYLDFLLAENTLTDEQLLMLVWEAVIEAADTTLVTTEWAMYEIAKHPEKQEYLYQEIQKVCGNKTVTEDHLPELPYLNAVFHETMRRHSPVPLVPPRLVHENTNLAGYEVPAGTEIIINLYGCNMNKNDWAEPEEWKPERFLDGRFEAVDMHKTMAFGAGRRACAGSMQAMNISCTAIGRFVQEFAWRLEEGDEDKVDTIQLTTNRLYPLHVYLAPRGRK
>SEQ ID NO:14 AY245442.1 ent-kaurene oxidase mRNA [Pisum sativum]
GTGGTGAAGCAACTAGCAGTGGCAGCCATGGATACTCTCACACTTTCTTTGGGTTTTTTA
TCTCTCTTTTTGTTCCTCTTCTTACTAAAGAGATCTACTCACAAACATTCCAAGCTTTCC
CATGTACCAGTGGTTCCAGGTTTGCCAGTGATTGGGAATCTGCTGCAATTGAAAGAGAAG
AAACCTCACAAGACATTCACAAAGATGGCTCAGAAATATGGACCCATTTTTTCCATCAAA
GCTGGTTCTTCCAAAATCATTGTTCTCAACACTGCTCATCTTGCTAAAGAGGCAATGGTG
ACTAGATATTCATCAATTTCAAAAAGGAAGCTATCAACTGCACTGACGATTCTAACTTCG
GATAAATGCATGGTTGCTATGAGCGACTACAATGATTTTCACAAAATGGTTAAAAAACAT
ATTCTTGCAAGTGTTCTTGGAGCCAATGCACAGAAGCGACTCCGTTTTCACAGAGAGGTT
ATGATGGAAAATATGTCTAGTAAGTTTAATGAACATGTGAAGACCCTCTCAGATTCTGCT
GTTGATTTTAGGAAAATATTTGTGTCTGAACTTTTCGGATTAGCACTAAAGCAAGCTCTG
GGAAGTGATATTGAATCCATTTATGTGGAGGGTTTGACGGCTACATTATCAAGAGAGGAC
TTATATAACACTCTAGTGGTTGATTTTATGGAGGGTGCAATTGAGGTGGATTGGAGAGAT
TTCTTCCCGTACCTGAAATGGATTCCAAATAAGAGCTTCGAGAAGAAAATCCGTAGAGTC
GATCGCCAAAGAAAAATTATCATGAAGGCACTAATTAATGAGCAAAAGAAGCGGTTGACA
TCAGGAAAAGAATTAGATTGTTATTATGATTACCTAGTATCAGAAGCTAAAGAAGTGACT
GAAGAACAAATGATCATGCTGCTCTGGGAGCCAATTATTGAGACATCCGATACTACCTTA
GTCACGACAGAATGGGCTATGTATGAACTTGCCAAAGACA
>Seq_ID_15
ATGGATACCTTAACTTTGTCTTTAGGTTTCTTATCTTTGTTCTTATTTTTATTCTTGTTAAAGAGATCTACTCACAAGCACTCCAAGTTATCCCACGTTCCAGTTGTTCCAGGTTTGCCTGTCATTGGTAACTTATTGCAATTGAAAGAAAAGAAGCCACACAAGACTTTCACCAAGATGGCTCAAAAGTACGGTCCAATTTTCTCCATCAAAGCCGGTTCTTCTAAAATCATTGTTTTAAACACTGCCCACTTGGCTAAAGAAGCTATGGTTACTAGATATTCTTCCATCTCCAAGAGAAAGTTGTCTACTGCTTTGACCATCTTGACTTCTGATAAGTGCATGGTTGCTATGTCCGATTATAACGACTTCCACAAGATGGTTAAGAAGCACATCTTGGCTTCTGTTTTGGGTGCCAACGCCCAAAAGAGATTGCGTTTCCACAGAGAAGTCATGATGGAAAACATGTCTTCCAAATTCAATGAACATGTCAAGACTTTGTCTGATTCTGCTGTTGACTTCAGAAAGATTTTCGTTTCTGAATTATTTGGTTTGGCTTTGAAGCAAGCTTTGGGTTCCGATATCGAATCTATCTACGTTGAAGGTTTGACTGCTACTTTATCTAGAGAAGATTTGTATAACACCTTGGTCGTCGACTTCATGGAAGGTGCTATCGAAGTTGATTGGAGAGACTTTTTCCCTTATTTGAAGTGGATTCCAAACAAATCCTTCGAAAAGAAGATCAGAAGAGTTGATAGACAAAGAAAAATTATCATGAAAGCTTTGATCAACGAACAAAAGAAAAGATTGACCTCTGGTAAGGAATTGGACTGTTACTACGATTACTTAGTTTCTGAAGCTAAGGAAGTCACCGAAGAACAAATGATCATGTTGTTGTGGGAACCAATTATTGAGACTTCTGATACTACTTTAGTTACCACCGAATGGGCTATGTATGAGTTGGCTAAGGACAAGAACCGTCAAGACAGATTGTACGAAGAATTGTTGAACGTTTGTGGTCACGAAAAGGTTACTGATGAAGAATTGTCCAAGTTGCCATACTTAGGTGCTGTCTTTCACGAAACCTTGCGTAAACACTCTCCAGTTCCAATCGTCCCATTGAGATACGTTGATGAAGATACCGAATTGGGTGGTTATCATATTCCTGCCGGTTCCGAAATCGCTATCAACATTTACGGTTGTAATATGGATTCCAACTTGTGGGAGAACCCAGATCAATGGATCCCTGAAAGATTTTTAGATGAAAAATACGCCCAAGCTGATTTGTATAAGACTATGGCTTTCGGTGGTGGTAAAAGAGTCTGTGCTGGTTCCTTACAAGCTATGTTGATTGCCTGTACTGCTATTGGTAGATTGGTTCAAGAATTTGAATGGGAATTGGGTCACGGTGAAGAAGAAAACGTTGACACCATGGGTTTAACTACCCATAGATTACACCCATTGCAAGTCAAATTAAAGCCAAGAAACAGAATTTACTAA
>SEQ ID NO:16 (sr.UGT_g252778)
MATNDDDRKQLHVAMFPWLAFGHILPFLELSKLIAQNGHKVSFLSTTRNIQRLPSHLTPLINLVKLTLPRVQELPEDAEATTDIKHDDQDHLLNASDGLQPEVTRFLEEESPDWIIFDYSYYWLPPVAAELGISRAFFMTFPTWTMALTRLPSDQLTAEDLMTLSKISFKKHEIVNLMYGTSTQGDLYRLTMACNGSDCILIRCCYEFEPQWLTLLEKLLPVPVVPVGLLPPEIHGDEKDDDTWVSVKEWLDGQHKGHVVYVALGSEAMVSKDELGELALGLELSGLPFFWALRKPPGSTESDSVELPDGFMERTRNRGVVWTSWAPQLRILSHESVCGFLTHCGVSSIVEGLMFGHPLIMLPIFGDQIMNAQVLADKQVGIEIPRNEEDGWFTKESVAKSLRSVVVDDEGEIYKANARELSKIFSDTDLGKKYISHFIDFLMMEIVKT*
SEQ ID NO:17 (UGT40087 version 1)
MDASDSSPLHIVIFPWLAFGHMLASLELAERLAARGHRVSFVSTPRNISRLRPVPPALAPLIDFVALPLP
RVDGLPDGAEATSDIPPGKTELHLKALDGLAAPFAAFLDAACADGSTNKVDWLFLDNFQYWAAAAAADHK
IPCALNLTFAASTSAEYGVPRVEPPVDGSTASILQRFVLTLEKCQFVIQRACFELEPEPLPLLSDIFGKP
VIPYGLVPPCPPAEGHKREHGNAALSWLDKQQPESVLFIALGSEPPVTVEQLHEIALGLELAGTTFLWAL
KKPNGLLLEADGDILPPGFEERTRDRGLVAMGWVPQPIILAHSSVGAFLTHGGWASTIEGVMSGHPMLFL
TFLDEQRINAQLIERKKAGLRVPRREKDGSYDRQGIAGAIRAVMCEEESKSVFAANAKKMQEIVSDRNCQ
EKYIDELIQRLGSFEK
SEQ ID NO: 18 (UGT40087 version 2)
MDASSSPLHIVIFPWLAFGHMLASLELAERLAARGHRVSFVSTPRNISRLRPVPPALAPLIDFVALPLP
RVDGLPDGAEATSDIPPGKTELHLKALDGLAAPFAAFLDAACADGSTNKVDWLFLDNFQYWAAAAAADHK
IPCALNLTFAASTSAEYGVPRVEPPVDGSTASILQRFVLTLEKCQFVIQRACFELEPEPLPLLSDIFGKP
VIPYGLVPPCPPAEGHKREHGNAALSWLDKQQPESVLFIALGSEPPVTVEQLHEIALGLELAGTTFLWAL
KKPNGLLLEADGDILPPGFEERTRDRGLVAMGWVPQPIILAHSSVGAFLTHGGWASTIEGVMSGHPMLFL
TFLDEQRINAQLIERKKAGLRVPRREKDGSYDRQGIAGAIRAVMCEEESKSVFAANAKKMQEIVSDRNCQ
EKYIDELIQRLGSFEK
SEQ ID NO: 19 (loop2 from Os_UGT_91C1)
EGLPDGAESTNDVPHDRPDMV
SEQ ID NO: 20 (loop3_1 from Os_UGT_91C1)
SEFLGTACAD
SEQ ID NO: 21 (loop3_2 from Os_UGT_91C1)
SEFLGTACADWVIVDVFHH
SEQ ID NO: 22 (loop4_1 from Os_UGT_91C1)
ADRRLERAETESPAAAGQGRPAAAPTFEVARMKLIRTKGSSGM
SEQ ID NO: 23 (loop4_2 from Os_UGT_91C1)
MMLLGSAHMIASIADRRLERAETESPAAAGQGRPAAAPTFEVARMKLIRTKGSSGM
SEQ ID NO: 24 (loop2 from UGT40087)
DGLPDGAEATSDIPPGKT
SEQ ID NO: 25 (loop3_1 from UGT40087)
AAFLDAACADGSTNKVD
SEQ ID NO: 26 (loop3_2 from UGT40087)
AAFLDAACADGSTNKVDWLFLDNFQY
SEQ ID NO: 27 (loop4_1 from UGT40087)
GVPRVEPPVDGSTA
SEQ ID NO: 28 (loop4_2 from UGT40087)
LNLTFAASTSAEYGVPRVEPPVDGSTA
SEQ ID NO: 29 (modified loop1 from Os_UGT_91C1 present in UGT40087_loop1)
TPRNISRLPPVPPALAP
SEQ ID NO: 30 (modified loop1 from UGT40087 present in Os_UGT_91C1_loop1)
TPRNISRLRPVRPALAP
SEQ ID NO: 31 (loop1 from Os_UGT_91C1 having SEQ ID NO:8)
TPRNISRLPPVRPALAP
SEQ ID NO: 32 (loop1 from UGT40087 having SEQ ID NO:11)
TPRNISRLRPVPPALAP
SEQ ID NO: 33 (UGT40087/Si91Dlike chimera)
MDASSSPLHIVIFPWLAFGHMLASLELAERLAARGHRVSFVSTPRNISRLRPVPPALAPLIDFVALPLPRVDGLPDGAEATSDIPPGKTELHLKALDGLAAPFAAFLDAACADGSTNKVDWLFLDNFQYWAAAAAADHKIPCALNLTFAASTSAEYGVPRVEPPVDGSTASILQRFVLTLEKCQFVIQRACFELEPEPLPLLSDIFGKPVIPYGLVPPCPPAQGHIEHDNAALSWLDKQQPESVLFIALGSEPPVTVEQLHEIALGLELAGTTFLWALKKPNGLLLEADGDILPPGFEERTRDRGLVAMGWVPQLSILAHSSVGAFLTHGGWSSTIEGAMSGHPMVFLTFLDEQRINAQLIERKKAGLRVPRCEKDGSYDRQGIAGAIRAVMCEEESKSVFAANAKKMQEIINDRKCQERYIDELIQRLRSFEK
SEQ ID NO: 34 (Os_UGT_91C1_loop4_1)
MDSGYSSSYAAAAGMHVVICPWLAFGHLLPCLDLAQRLASRGHRVSFVSTPRNISRLPPVRPALAPLVAFVALPLPRVEGLPDGAESTNDVPHDRPDMVELHRRAFDGLAAPFSEFLGTACADWVIVDVFHHWAAAAALEHKVPCAMMLLGSAHMIASIGVPRVEPPVDGSTASLAERFSLTLSRSSLVVGRSCVEFEPETVPLLSTLRGKPITFLGLMPPLHEGRREDGEDATVRWLDAQPAKSVVYVALGSEVPLGVEKVHELALGLELAGTRFLWALRKPTGVSDADLLPAGFEERTRGRGVVATRWVPQMSILAHAAVGAFLTHCGWNSTIEGLMFGHPLIMLPIFGDQGPNARLIEAKNAGLQVARNDGDGSFDREGVAAAIRAVAVEEESSKVFQAKAKKLQEIVADMACHERYIDGFIQQLRSYKD
SEQ ID NO:35 (unoptimized nucleic acid sequence of UGT40087 having SEQ ID NO:17)
tcgtgacgca acagagcaac tctcgccggc accggtcgcc ccttccgcag gcaggcagca
ggctcgcgcg catggacgcc tccgactcct ccccgctgca catcgtcatc ttcccgtggc
tcgcgttcgg ccacatgctc gccagcctgg agctcgccga gcgcctggcc gcgcgaggcc
accgcgtgtc cttcgtctcc accccgcgca acatcagccg cctccgcccg gtcccgcccg
cgctggcgcc gctcatcgac ttcgtggcgc tgccgctgcc gcgcgtcgac ggcctccccg
acggcgcgga ggccaccagc gacatcccgc ccggcaagac cgagctccac ctcaaggccc
tagacggcct cgccgcgccc ttcgcagctt tcctcgacgc cgcctgcgcc gacgggagca
ccaacaaggt ggactggctc ttcctcgaca acttccaata ctgggccgcc gccgccgctg
ccgaccataa gataccctgc gcgctgaacc tgacattcgc agcgtcgacg tcagcggagt
acggtgtgcc acgcgttgag ccgccggtgg atggctcaac agcctcaata ctccagcgat
ttgtgctaac cttggagaaa tgccagtttg tcatccaacg cgcctgcttc gagctggagc
cggagcccct gcctctcctg tcagacatct tcggcaagcc ggtgatcccg tacggcctag
tcccgccgtg tccccccgca gaaggtcaca aaagagagca cggcaacgca gctctgtcat
ggctcgacaa gcagcagccc gagtctgtcc tgttcattgc tctgggaagc gagcctccgg
tgaccgtcga acagctgcac gagatcgcgc ttgggctgga gctcgccggg acgacattcc
tctgggctct gaagaagcct aacggcctcc tcctcgaggc ggacggcgac atcctgcccc
caggtttcga ggagcggacg cgtgaccgtg ggctcgtggc catgggctgg gttcctcagc
ccatcatact ggctcacagc tccgtgggcg cgttcctgac gcacggcgga tgggcctcca
ccattgaagg ggttatgtcc gggcatccca tgctcttcct gacgttctta gatgaacaga
ggataaacgc gcaactgatc gagaggaaga aggccgggtt gcgagtgcca aggcgtgaga
aggacggctc gtacgatcgc caaggcatcg ccggagcgat ccgggctgtc atgtgcgagg
aagaaagtaa gagcgtcttc gcggctaatg ccaagaagat gcaggagatt gtgagcgaca
ggaattgcca ggagaagtac atcgacgagc ttatccagcg tctgggatcc ttcgagaagt
gaaataaggt gaaatatcct acaataaccg cctgttgatg gcttgatgca acgatgtagg
tggccattcg cgcctctgat ctccatgttc cggcaataaa tccaccatat gttatggctc
tgacttactg aatttcctaa tatgtatgcc caaacacatg cataggttgc tagttgcccc
tcgcgccggc attagcgata atgtcaccgc agtcgccagc acaggtgtag caatttgaca
t
SEQ ID NO: 36 (UGT40087-1 codon optimized nucleic acid sequence)
ATGGATGCTTCCAGTAGTCCTTTACACATCGTTATCTTTCCATGGTTAGCTTTCGGTCATATGTTGGCTTCCTTGGAATTGGCTGAGAGATTGGCTGCTCGTGGTCACAGAGTCTCCTTCGTTTCCACCCCTAGAAACATCTCTAGATTACGTCCAGTTCCACCAGCTTTAGCTCCATTGATTGATTTTGTCGCTTTGCCATTGCCTAGAGTCGATGGTTTACCAGATGGTGCCGAAGCTACCTCTGACATTCCACCAGGTAAGACCGAATTACACTTGAAGGCTTTGGACGGTTTGGCTGCTCCATTCGCCGCTTTTTTGGACGCTGCCTGTGCTGATGGTTCCACCAACAAGGTTGATTGGTTGTTTTTGGACAACTTCCAATACTGGGCTGCCGCTGCCGCTGCTGATCACAAAATTCCTTGCGCCTTAAACTTGACTTTTGCCGCTTCCACCTCCGCTGAATACGGTGTTCCACGTGTTGAACCACCAGTTGACGGTTCCACTGCCTCCATCTTACAAAGATTTGTCTTAACCTTAGAAAAATGTCAATTCGTTATCCAAAGAGCTTGTTTCGAATTGGAACCTGAACCATTGCCATTGTTGTCCGACATTTTCGGTAAGCCAGTCATCCCATACGGTTTAGTTCCTCCATGTCCACCAGCTGAAGGTCACAAAAGAGAACACGGTAACGCTGCTTTGTCCTGGTTGGATAAGCAACAACCAGAATCTGTTTTGTTCATCGCTTTGGGTTCTGAACCACCTGTTACCGTCGAACAATTGCACGAAATCGCTTTGGGTTTAGAATTGGCCGGTACCACCTTCTTGTGGGCCTTGAAAAAGCCAAACGGTTTGTTGTTAGAAGCCGATGGTGATATTTTGCCACCAGGTTTCGAAGAAAGAACTAGAGATAGAGGTTTAGTCGCTATGGGTTGGGTTCCACAACCAATTATCTTGGCCCATTCCTCTGTTGGTGCCTTTTTGACTCACGGTGGTTGGGCCTCCACTATTGAAGGTGTCATGTCCGGTCACCCTATGTTGTTCTTAACCTTCTTGGACGAACAACGTATCAACGCCCAATTGATCGAAAGAAAAAAGGCTGGTTTAAGAGTCCCAAGAAGAGAAAAGGATGGTTCCTACGACAGACAAGGTATTGCTGGTGCTATTAGAGCCGTCATGTGTGAAGAAGAATCTAAGTCTGTCTTCGCTGCTAACGCTAAGAAAATGCAAGAGATCGTTTCTGACAGAAACTGTCAAGAAAAGTACATCGACGAATTGATTCAAAGATTGGGTTCTTTCGAAAAGTAA
SEQUENCE LISTING
<110> AMYRIS, INC.
<120> PISUM SATIVUM KAURENE OXIDASE FOR HIGH EFFICIENCY PRODUCTION OF
REBAUDIOSIDES
<130> 107345.00694
<140> PCT/US2018/046359
<141> 2018-08-10
<150> US 62/544,718
<151> 2017-08-11
<150> PCT/US2017/046637
<151> 2017-08-11
<160> 36
<170> PatentIn version 3.5
<210> 1
<211> 499
<212> PRT
<213> Pisum Sativum
<220>
<221> misc_feature
<222> (1)..(499)
<223> Kaurene oxidase enzyme
<400> 1
Met Asp Thr Leu Thr Leu Ser Leu Gly Phe Leu Ser Leu Phe Leu Phe
1 5 10 15
Leu Phe Leu Leu Lys Arg Ser Thr His Lys His Ser Lys Leu Ser His
20 25 30
Val Pro Val Val Pro Gly Leu Pro Val Ile Gly Asn Leu Leu Gln Leu
35 40 45
Lys Glu Lys Lys Pro His Lys Thr Phe Thr Lys Met Ala Gln Lys Tyr
50 55 60
Gly Pro Ile Phe Ser Ile Lys Ala Gly Ser Ser Lys Ile Ile Val Leu
65 70 75 80
Asn Thr Ala His Leu Ala Lys Glu Ala Met Val Thr Arg Tyr Ser Ser
85 90 95
Ile Ser Lys Arg Lys Leu Ser Thr Ala Leu Thr Ile Leu Thr Ser Asp
100 105 110
Lys Cys Met Val Ala Met Ser Asp Tyr Asn Asp Phe His Lys Met Val
115 120 125
Lys Lys His Ile Leu Ala Ser Val Leu Gly Ala Asn Ala Gln Lys Arg
130 135 140
Leu Arg Phe His Arg Glu Val Met Met Glu Asn Met Ser Ser Lys Phe
145 150 155 160
Asn Glu His Val Lys Thr Leu Ser Asp Ser Ala Val Asp Phe Arg Lys
165 170 175
Ile Phe Val Ser Glu Leu Phe Gly Leu Ala Leu Lys Gln Ala Leu Gly
180 185 190
Ser Asp Ile Glu Ser Ile Tyr Val Glu Gly Leu Thr Ala Thr Leu Ser
195 200 205
Arg Glu Asp Leu Tyr Asn Thr Leu Val Val Asp Phe Met Glu Gly Ala
210 215 220
Ile Glu Val Asp Trp Arg Asp Phe Phe Pro Tyr Leu Lys Trp Ile Pro
225 230 235 240
Asn Lys Ser Phe Glu Lys Lys Ile Arg Arg Val Asp Arg Gln Arg Lys
245 250 255
Ile Ile Met Lys Ala Leu Ile Asn Glu Gln Lys Lys Arg Leu Thr Ser
260 265 270
Gly Lys Glu Leu Asp Cys Tyr Tyr Asp Tyr Leu Val Ser Glu Ala Lys
275 280 285
Glu Val Thr Glu Glu Gln Met Ile Met Leu Leu Trp Glu Pro Ile Ile
290 295 300
Glu Thr Ser Asp Thr Thr Leu Val Thr Thr Glu Trp Ala Met Tyr Glu
305 310 315 320
Leu Ala Lys Asp Lys Asn Arg Gln Asp Arg Leu Tyr Glu Glu Leu Leu
325 330 335
Asn Val Cys Gly His Glu Lys Val Thr Asp Glu Glu Leu Ser Lys Leu
340 345 350
Pro Tyr Leu Gly Ala Val Phe His Glu Thr Leu Arg Lys His Ser Pro
355 360 365
Val Pro Ile Val Pro Leu Arg Tyr Val Asp Glu Asp Thr Glu Leu Gly
370 375 380
Gly Tyr His Ile Pro Ala Gly Ser Glu Ile Ala Ile Asn Ile Tyr Gly
385 390 395 400
Cys Asn Met Asp Ser Asn Leu Trp Glu Asn Pro Asp Gln Trp Ile Pro
405 410 415
Glu Arg Phe Leu Asp Glu Lys Tyr Ala Gln Ala Asp Leu Tyr Lys Thr
420 425 430
Met Ala Phe Gly Gly Gly Lys Arg Val Cys Ala Gly Ser Leu Gln Ala
435 440 445
Met Leu Ile Ala Cys Thr Ala Ile Gly Arg Leu Val Gln Glu Phe Glu
450 455 460
Trp Glu Leu Gly His Gly Glu Glu Glu Asn Val Asp Thr Met Gly Leu
465 470 475 480
Thr Thr His Arg Leu His Pro Leu Gln Val Lys Leu Lys Pro Arg Asn
485 490 495
Arg Ile Tyr
<210> 2
<211> 513
<212> PRT
<213> Stevia rebaudiana
<220>
<221> misc_feature
<222> (1)..(513)
<223> Kaurene oxidase enzyme
<400> 2
Met Asp Ala Val Thr Gly Leu Leu Thr Val Pro Ala Thr Ala Ile Thr
1 5 10 15
Ile Gly Gly Thr Ala Val Ala Leu Ala Val Ala Leu Ile Phe Trp Tyr
20 25 30
Leu Lys Ser Tyr Thr Ser Ala Arg Arg Ser Gln Ser Asn His Leu Pro
35 40 45
Arg Val Pro Glu Val Pro Gly Val Pro Leu Leu Gly Asn Leu Leu Gln
50 55 60
Leu Lys Glu Lys Lys Pro Tyr Met Thr Phe Thr Arg Trp Ala Ala Thr
65 70 75 80
Tyr Gly Pro Ile Tyr Ser Ile Lys Thr Gly Ala Thr Ser Met Val Val
85 90 95
Val Ser Ser Asn Glu Ile Ala Lys Glu Ala Leu Val Thr Arg Phe Gln
100 105 110
Ser Ile Ser Thr Arg Asn Leu Ser Lys Ala Leu Lys Val Leu Thr Ala
115 120 125
Asp Lys Thr Met Val Ala Met Ser Asp Tyr Asp Asp Tyr His Lys Thr
130 135 140
Val Lys Arg His Ile Leu Thr Ala Val Leu Gly Pro Asn Ala Gln Lys
145 150 155 160
Lys His Arg Ile His Arg Asp Ile Met Met Asp Asn Ile Ser Thr Gln
165 170 175
Leu His Glu Phe Val Lys Asn Asn Pro Glu Gln Glu Glu Val Asp Leu
180 185 190
Arg Lys Ile Phe Gln Ser Glu Leu Phe Gly Leu Ala Met Arg Gln Ala
195 200 205
Leu Gly Lys Asp Val Glu Ser Leu Tyr Val Glu Asp Leu Lys Ile Thr
210 215 220
Met Asn Arg Asp Glu Ile Phe Gln Val Leu Val Val Asp Pro Met Met
225 230 235 240
Gly Ala Ile Asp Val Asp Trp Arg Asp Phe Phe Pro Tyr Leu Lys Trp
245 250 255
Val Pro Asn Lys Lys Phe Glu Asn Thr Ile Gln Gln Met Tyr Ile Arg
260 265 270
Arg Glu Ala Val Met Lys Ser Leu Ile Lys Glu Asn Lys Lys Arg Ile
275 280 285
Ala Ser Gly Glu Lys Leu Asn Ser Tyr Ile Asp Tyr Leu Leu Ser Glu
290 295 300
Ala Gln Thr Leu Thr Asp Gln Gln Leu Leu Met Ser Leu Trp Glu Pro
305 310 315 320
Ile Ile Glu Ser Ser Asp Thr Thr Met Val Thr Thr Glu Trp Ala Met
325 330 335
Tyr Glu Leu Ala Lys Asn Pro Lys Leu Gln Asp Arg Leu Tyr Arg Asp
340 345 350
Ile Lys Ser Val Cys Gly Ser Glu Lys Ile Thr Glu Glu His Leu Ser
355 360 365
Gln Leu Pro Tyr Ile Thr Ala Ile Phe His Glu Thr Leu Arg Arg His
370 375 380
Ser Pro Val Pro Ile Ile Pro Leu Arg His Val His Glu Asp Thr Val
385 390 395 400
Leu Gly Gly Tyr His Val Pro Ala Gly Thr Glu Leu Ala Val Asn Ile
405 410 415
Tyr Gly Cys Asn Met Asp Lys Asn Val Trp Glu Asn Pro Glu Glu Trp
420 425 430
Asn Pro Glu Arg Phe Met Lys Glu Asn Glu Thr Ile Asp Phe Gln Lys
435 440 445
Thr Met Ala Phe Gly Gly Gly Lys Arg Val Cys Ala Gly Ser Leu Gln
450 455 460
Ala Leu Leu Thr Ala Ser Ile Gly Ile Gly Arg Met Val Gln Glu Phe
465 470 475 480
Glu Trp Lys Leu Lys Asp Met Thr Gln Glu Glu Val Asn Thr Ile Gly
485 490 495
Leu Thr Thr Gln Met Leu Arg Pro Leu Arg Ala Ile Ile Lys Pro Arg
500 505 510
Ile
<210> 3
<211> 509
<212> PRT
<213> Arabidopsis thaliana
<220>
<221> misc_feature
<222> (1)..(509)
<223> Kaurene oxidase enzyme
<400> 3
Met Ala Phe Phe Ser Met Ile Ser Ile Leu Leu Gly Phe Val Ile Ser
1 5 10 15
Ser Phe Ile Phe Ile Phe Phe Phe Lys Lys Leu Leu Ser Phe Ser Arg
20 25 30
Lys Asn Met Ser Glu Val Ser Thr Leu Pro Ser Val Pro Val Val Pro
35 40 45
Gly Phe Pro Val Ile Gly Asn Leu Leu Gln Leu Lys Glu Lys Lys Pro
50 55 60
His Lys Thr Phe Thr Arg Trp Ser Glu Ile Tyr Gly Pro Ile Tyr Ser
65 70 75 80
Ile Lys Met Gly Ser Ser Ser Leu Ile Val Leu Asn Ser Thr Glu Thr
85 90 95
Ala Lys Glu Ala Met Val Thr Arg Phe Ser Ser Ile Ser Thr Arg Lys
100 105 110
Leu Ser Asn Ala Leu Thr Val Leu Thr Cys Asp Lys Ser Met Val Ala
115 120 125
Thr Ser Asp Tyr Asp Asp Phe His Lys Leu Val Lys Arg Cys Leu Leu
130 135 140
Asn Gly Leu Leu Gly Ala Asn Ala Gln Lys Arg Lys Arg His Tyr Arg
145 150 155 160
Asp Ala Leu Ile Glu Asn Val Ser Ser Lys Leu His Ala His Ala Arg
165 170 175
Asp His Pro Gln Glu Pro Val Asn Phe Arg Ala Ile Phe Glu His Glu
180 185 190
Leu Phe Gly Val Ala Leu Lys Gln Ala Phe Gly Lys Asp Val Glu Ser
195 200 205
Ile Tyr Val Lys Glu Leu Gly Val Thr Leu Ser Lys Asp Glu Ile Phe
210 215 220
Lys Val Leu Val His Asp Met Met Glu Gly Ala Ile Asp Val Asp Trp
225 230 235 240
Arg Asp Phe Phe Pro Tyr Leu Lys Trp Ile Pro Asn Lys Ser Phe Glu
245 250 255
Ala Arg Ile Gln Gln Lys His Lys Arg Arg Leu Ala Val Met Asn Ala
260 265 270
Leu Ile Gln Asp Arg Leu Lys Gln Asn Gly Ser Glu Ser Asp Asp Asp
275 280 285
Cys Tyr Leu Asn Phe Leu Met Ser Glu Ala Lys Thr Leu Thr Lys Glu
290 295 300
Gln Ile Ala Ile Leu Val Trp Glu Thr Ile Ile Glu Thr Ala Asp Thr
305 310 315 320
Thr Leu Val Thr Thr Glu Trp Ala Ile Tyr Glu Leu Ala Lys His Pro
325 330 335
Ser Val Gln Asp Arg Leu Cys Lys Glu Ile Gln Asn Val Cys Gly Gly
340 345 350
Glu Lys Phe Lys Glu Glu Gln Leu Ser Gln Val Pro Tyr Leu Asn Gly
355 360 365
Val Phe His Glu Thr Leu Arg Lys Tyr Ser Pro Ala Pro Leu Val Pro
370 375 380
Ile Arg Tyr Ala His Glu Asp Thr Gln Ile Gly Gly Tyr His Val Pro
385 390 395 400
Ala Gly Ser Glu Ile Ala Ile Asn Ile Tyr Gly Cys Asn Met Asp Lys
405 410 415
Lys Arg Trp Glu Arg Pro Glu Asp Trp Trp Pro Glu Arg Phe Leu Asp
420 425 430
Asp Gly Lys Tyr Glu Thr Ser Asp Leu His Lys Thr Met Ala Phe Gly
435 440 445
Ala Gly Lys Arg Val Cys Ala Gly Ala Leu Gln Ala Ser Leu Met Ala
450 455 460
Gly Ile Ala Ile Gly Arg Leu Val Gln Glu Phe Glu Trp Lys Leu Arg
465 470 475 480
Asp Gly Glu Glu Glu Asn Val Asp Thr Tyr Gly Leu Thr Ser Gln Lys
485 490 495
Leu Tyr Pro Leu Met Ala Ile Ile Asn Pro Arg Arg Ser
500 505
<210> 4
<211> 517
<212> PRT
<213> Cucurbita maxima
<220>
<221> misc_feature
<222> (1)..(517)
<223> Kaurene oxidase enzyme
<400> 4
Met Ala Val Ala Thr Asp Pro Leu Gly Cys Met Gln Lys Leu Val Gln
1 5 10 15
Met Leu Gln Ala Pro Pro Tyr Val Ala Ala Ala Val Gln Ser Ser Ala
20 25 30
Leu Leu Leu Thr Phe Phe Ile Gly Asp Trp Arg Lys Arg Arg Arg Ser
35 40 45
Pro Leu Pro Leu Leu Pro Ala Ile Pro Gly Ile Pro Val Leu Gly Asn
50 55 60
Leu Leu Gln Leu Lys Glu Lys Lys Pro His Lys Thr Phe Ala Gln Trp
65 70 75 80
Ser Glu Thr Tyr Gly Pro Ile Tyr Ser Ile Lys Ala Gly Ala Ser Thr
85 90 95
Val Ile Val Leu Asn Ser Ser Asp Leu Ala Lys Glu Ala Met Val Thr
100 105 110
Arg Tyr Ser Ser Ile Ser Ser Arg Lys Leu Ser Lys Ala Leu Thr Ile
115 120 125
Leu Thr Ala Asp Lys Cys Met Val Ala Met Ser Asp Tyr Asn Asp Phe
130 135 140
His Lys Leu Val Lys Arg Tyr Ile Leu Ala Asn Val Leu Gly Ala Asn
145 150 155 160
Ala Gln Lys Arg Leu Arg Gln Arg Arg Asp Thr Met Ile Asp Asn Ile
165 170 175
Ser Arg Glu Leu Phe Ala Cys Val Lys Asp Ser Ser Ser Glu Ser Val
180 185 190
Asn Phe Arg Lys Ile Phe Glu Ser Glu Leu Phe Gly Leu Ala Leu Lys
195 200 205
Glu Thr Phe Gly Arg Asp Met Glu Ser Leu Tyr Val Asp Gly Leu Gly
210 215 220
Thr Thr Leu Leu Arg Glu Asp Leu Phe Arg Thr Leu Val Ile Asp Pro
225 230 235 240
Met Glu Gly Ala Ile Glu Val Asp Trp Arg Asp Phe Phe Pro Tyr Leu
245 250 255
Arg Trp Ile Pro Asn Lys Gly Val Glu Asp Arg Ile Arg Lys Met Asp
260 265 270
Phe Arg Arg Arg Val Thr Met Lys Ser Leu Met Glu Glu Lys Lys Lys
275 280 285
Gln Ile Ala Ala Gly Glu Asp Leu Asn Cys Tyr Ser Glu Phe Leu Leu
290 295 300
Ser Glu Ala Lys Ser Leu Thr Glu Glu Gln Ile Ser Met Leu Leu Trp
305 310 315 320
Glu Ile Ile Ile Glu Thr Ser Asp Thr Thr Leu Val Val Thr Glu Trp
325 330 335
Ala Met Tyr Glu Leu Ala Gln Asn Pro Lys Arg Gln Glu Arg Leu Tyr
340 345 350
Gln His Ile Gln Ser Val Cys Gly Ser Ala Lys Ile Thr Glu Glu Asn
355 360 365
Leu Ser Gln Leu Pro Tyr Leu Thr Ala Val Phe His Glu Thr Leu Arg
370 375 380
Lys Tyr Ser Pro Val Ser Ile Val Pro Leu Arg Tyr Ala His Glu Asp
385 390 395 400
Thr Gln Leu Gly Gly Tyr Phe Ile Pro Ala Gly Ser Glu Val Ala Val
405 410 415
Asn Ile Tyr Ala Cys Asn Met Asp Lys Lys Gln Trp Glu Ser Pro Glu
420 425 430
Glu Trp Lys Pro Glu Arg Phe Leu Asp Glu Ser Tyr Asp Pro Met Asp
435 440 445
Leu Tyr Lys Thr Met Ala Phe Gly Gly Gly Lys Arg Val Cys Ala Gly
450 455 460
Ala Pro Lys Ala Met Leu Ile Ala Cys Thr Thr Leu Gly Arg Leu Val
465 470 475 480
Gln Gly Phe Thr Trp Lys Leu Arg Glu Gly Glu Glu Asp Lys Val Asp
485 490 495
Thr Leu Gly Leu Thr Ala Arg Lys Leu Gln Pro Leu His Ile Val Ala
500 505 510
Lys Pro Arg Ile Asn
515
<210> 5
<211> 519
<212> PRT
<213> Cucumis sativus
<220>
<221> misc_feature
<222> (1)..(519)
<223> Kaurene oxidase enzyme
<400> 5
Met Ala Val Val Thr Asp Pro Leu Ala Ser Met Gln Leu Leu Ala Asn
1 5 10 15
Thr Ile Pro Ala Pro Pro Tyr Ala Ala Ala Ala Val Leu Gly Gly Val
20 25 30
Ser Leu Val Leu Ser Val Phe Phe Val Ala Asp Cys Arg Lys Lys Arg
35 40 45
Arg Asn Phe Leu Pro Pro Val Pro Ala Val Pro Gly Val Pro Val Leu
50 55 60
Gly Asn Leu Leu Gln Leu Lys Glu Lys Lys Pro His Lys Thr Phe Ala
65 70 75 80
Arg Trp Ala Glu Thr Tyr Gly Ala Val Tyr Ser Ile Arg Thr Gly Ala
85 90 95
Ser Thr Val Ile Val Leu Asn Thr Thr Glu Val Ala Lys Glu Ala Met
100 105 110
Val Thr Arg Tyr Gly Ser Ile Ser Ser Arg Lys Leu Ser Lys Ala Leu
115 120 125
Thr Ile Leu Thr Ala Asp Lys Cys Met Val Ala Met Ser Asp Tyr Asn
130 135 140
Glu Phe His Lys Met Val Lys Arg Tyr Ile Leu Ala Asn Val Leu Gly
145 150 155 160
Ala Asn Ala Gln Lys Lys His Arg Gln Arg Arg Asp Ala Met Ile Glu
165 170 175
Asn Ile Ser Arg Glu Leu Phe Ala His Val Lys Glu Phe Pro Leu Asp
180 185 190
Thr Val Asn Phe Arg Lys Ile Phe Glu Ala Glu Leu Phe Arg Leu Ala
195 200 205
Leu Lys Glu Thr Leu Gly Lys Asp Ile Glu Ser Ile Tyr Val Asp Gly
210 215 220
Leu Gly Thr Thr Leu Pro Arg Glu Asp Leu Phe Arg Ile Leu Val Ile
225 230 235 240
Asp Pro Met Glu Gly Ala Ile Glu Val Asp Trp Arg Asp Phe Phe Pro
245 250 255
Tyr Leu Arg Trp Ile Pro Asn Lys Arg Val Glu Asn Lys Ile Arg Asn
260 265 270
Met Asp Phe Arg Arg Arg Met Thr Met Lys Lys Leu Met Glu Glu Pro
275 280 285
Lys Lys Arg Ile Ala Ala Gly Glu Glu Thr Tyr Cys Tyr Ala Asp Phe
290 295 300
Leu Leu Ser Glu Ala Lys Thr Leu Thr Glu Asp Gln Ile Ser Met Leu
305 310 315 320
Leu Trp Glu Thr Ile Ile Glu Thr Ser Asp Thr Thr Leu Val Val Thr
325 330 335
Glu Trp Ala Met Tyr Glu Leu Ser Lys Asp Pro Arg Arg Gln Asp Tyr
340 345 350
Leu Tyr Gln Gln Ile Gln Ser Val Cys Gly Ser Ala Thr Leu Thr Glu
355 360 365
Glu Asn Leu Ser Gln Leu Pro Tyr Leu Thr Ala Ile Phe His Glu Thr
370 375 380
Leu Arg Lys His Ser Pro Val Pro Val Val Pro Leu Arg Tyr Ala His
385 390 395 400
Glu Asp Thr Gln Leu Gly Gly Tyr Phe Val Pro Ala Gly Ser Glu Ile
405 410 415
Ala Val Asn Ile Tyr Ala Cys Asn Met Asp Lys Asp His Trp Glu Ser
420 425 430
Pro Glu Glu Trp Lys Pro Glu Arg Phe Leu Asp Asp Lys Tyr Asp Pro
435 440 445
Met Asp Leu His Lys Thr Met Ala Phe Gly Gly Gly Lys Arg Val Cys
450 455 460
Ala Gly Ala Leu Lys Ala Met Leu Ile Ala Cys Thr Thr Ile Gly Arg
465 470 475 480
Met Val Gln Glu Phe Glu Trp Lys Leu Arg Glu Gly Glu Glu Glu Lys
485 490 495
Val Asp Thr Leu Gly Leu Thr Ala Arg Lys Leu Gln Pro Leu His Val
500 505 510
Val Ile Lys Pro Arg Asn Asn
515
<210> 6
<211> 525
<212> PRT
<213> Gibberella fujikuroi
<220>
<221> misc_feature
<222> (1)..(525)
<223> Kaurene oxidase enzyme
<400> 6
Met Ser Lys Ser Asn Ser Met Asn Ser Thr Ser His Glu Thr Leu Phe
1 5 10 15
Gln Gln Leu Val Leu Gly Leu Asp Arg Met Pro Leu Met Asp Val His
20 25 30
Trp Leu Ile Tyr Val Ala Phe Gly Ala Trp Leu Cys Ser Tyr Val Ile
35 40 45
His Val Leu Ser Ser Ser Ser Thr Val Lys Val Pro Val Val Gly Tyr
50 55 60
Arg Ser Val Phe Glu Pro Thr Trp Leu Leu Arg Leu Arg Phe Val Trp
65 70 75 80
Glu Gly Gly Ser Ile Ile Gly Gln Gly Tyr Asn Lys Phe Lys Asp Ser
85 90 95
Ile Phe Gln Val Arg Lys Leu Gly Thr Asp Ile Val Ile Ile Pro Pro
100 105 110
Asn Tyr Ile Asp Glu Val Arg Lys Leu Ser Gln Asp Lys Thr Arg Ser
115 120 125
Val Glu Pro Phe Ile Asn Asp Phe Ala Gly Gln Tyr Thr Arg Gly Met
130 135 140
Val Phe Leu Gln Ser Asp Leu Gln Asn Arg Val Ile Gln Gln Arg Leu
145 150 155 160
Thr Pro Lys Leu Val Ser Leu Thr Lys Val Met Lys Glu Glu Leu Asp
165 170 175
Tyr Ala Leu Thr Lys Glu Met Pro Asp Met Lys Asn Asp Glu Trp Val
180 185 190
Glu Val Asp Ile Ser Ser Ile Met Val Arg Leu Ile Ser Arg Ile Ser
195 200 205
Ala Arg Val Phe Leu Gly Pro Glu His Cys Arg Asn Gln Glu Trp Leu
210 215 220
Thr Thr Thr Ala Glu Tyr Ser Glu Ser Leu Phe Ile Thr Gly Phe Ile
225 230 235 240
Leu Arg Val Val Pro His Ile Leu Arg Pro Phe Ile Ala Pro Leu Leu
245 250 255
Pro Ser Tyr Arg Thr Leu Leu Arg Asn Val Ser Ser Gly Arg Arg Val
260 265 270
Ile Gly Asp Ile Ile Arg Ser Gln Gln Gly Asp Gly Asn Glu Asp Ile
275 280 285
Leu Ser Trp Met Arg Asp Ala Ala Thr Gly Glu Glu Lys Gln Ile Asp
290 295 300
Asn Ile Ala Gln Arg Met Leu Ile Leu Ser Leu Ala Ser Ile His Thr
305 310 315 320
Thr Ala Met Thr Met Thr His Ala Met Tyr Asp Leu Cys Ala Cys Pro
325 330 335
Glu Tyr Ile Glu Pro Leu Arg Asp Glu Val Lys Ser Val Val Gly Ala
340 345 350
Ser Gly Trp Asp Lys Thr Ala Leu Asn Arg Phe His Lys Leu Asp Ser
355 360 365
Phe Leu Lys Glu Ser Gln Arg Phe Asn Pro Val Phe Leu Leu Thr Phe
370 375 380
Asn Arg Ile Tyr His Gln Ser Met Thr Leu Ser Asp Gly Thr Asn Ile
385 390 395 400
Pro Ser Gly Thr Arg Ile Ala Val Pro Ser His Ala Met Leu Gln Asp
405 410 415
Ser Ala His Val Pro Gly Pro Thr Pro Pro Thr Glu Phe Asp Gly Phe
420 425 430
Arg Tyr Ser Lys Ile Arg Ser Asp Ser Asn Tyr Ala Gln Lys Tyr Leu
435 440 445
Phe Ser Met Thr Asp Ser Ser Asn Met Ala Phe Gly Tyr Gly Lys Tyr
450 455 460
Ala Cys Pro Gly Arg Phe Tyr Ala Ser Asn Glu Met Lys Leu Thr Leu
465 470 475 480
Ala Ile Leu Leu Leu Gln Phe Glu Phe Lys Leu Pro Asp Gly Lys Gly
485 490 495
Arg Pro Arg Asn Ile Thr Ile Asp Ser Asp Met Ile Pro Asp Pro Arg
500 505 510
Ala Arg Leu Cys Val Arg Lys Arg Ser Leu Arg Asp Glu
515 520 525
<210> 7
<211> 525
<212> PRT
<213> Gibberella moniliformis
<220>
<221> misc_feature
<222> (1)..(525)
<223> Kaurene oxidase enzyme
<400> 7
Met Asn Lys Phe Asn Ser Met Asn Asn Thr Ile Asn Glu Thr Leu Leu
1 5 10 15
Arg Gln Leu Val Ser Gly Leu Asp Glu Ile Pro Leu Met Asp Ile His
20 25 30
Trp Leu Ile Tyr Val Ala Phe Gly Ala Trp Leu Cys Ser Tyr Val Ile
35 40 45
His Leu Leu Ser Ser Pro Ser Thr Val Asn Val Pro Phe Val Gly Tyr
50 55 60
Arg Ser Val Phe Glu Pro Thr Trp Phe Leu Arg Leu Arg Phe Val Trp
65 70 75 80
Glu Gly Gly Ser Ile Ile Ser Gln Gly Tyr Ser Lys Phe Lys Asp Ser
85 90 95
Ile Phe Gln Val Arg Lys Leu Gly Thr Asp Ile Val Ile Ile Pro Pro
100 105 110
Asn Tyr Ile Asp Glu Val Arg Lys Leu Ser Gln Asp Lys Thr Arg Ser
115 120 125
Val Glu Pro Phe Ile Asn Asp Phe Ala Gly Asp Tyr Thr Arg Gly Met
130 135 140
Val Phe Leu Gln Ser Asp Leu Gln Asn Arg Val Ile Gln Gln Arg Leu
145 150 155 160
Thr Pro Lys Leu Val Ser Leu Thr Lys Val Met Lys Glu Glu Leu Asp
165 170 175
Tyr Ala Leu Thr Lys Gly Met Pro Asp Met Lys Asp Asp Glu Trp Val
180 185 190
Glu Ala Asp Ile Ala Ser Ile Met Val Arg Leu Ile Ser Arg Ile Ser
195 200 205
Ala Arg Val Phe Leu Gly Pro Glu His Cys Arg Asn Gln Glu Trp Leu
210 215 220
Thr Thr Thr Ala Glu Tyr Ser Glu Ser Leu Phe Met Thr Gly Phe Ile
225 230 235 240
Leu Arg Val Val Pro His Ile Leu Arg Pro Phe Val Ala Pro Leu Leu
245 250 255
Pro Ser Tyr Arg Thr Leu Leu Arg Ser Val Ser Ser Gly Arg Lys Val
260 265 270
Ile Gly Asp Ile Ile Arg Ser Gln Gln Gly Ser Glu Asn Glu Asp Ile
275 280 285
Leu Ser Trp Met Val Glu Ala Ala Thr Gly Glu Glu Lys Gln Val Asp
290 295 300
Asn Ile Ala Gln Arg Met Leu Ile Leu Ser Leu Ala Ser Ile His Thr
305 310 315 320
Thr Ala Met Thr Met Thr His Ala Met Tyr Asp Leu Cys Ala Arg Pro
325 330 335
Glu Tyr Thr Lys Pro Leu Arg Glu Glu Val Lys Gly Val Val Gly Ala
340 345 350
Ser Gly Trp Asp Lys Thr Ala Leu Asn Arg Leu His Lys Leu Asp Ser
355 360 365
Phe Leu Lys Glu Ser Gln Arg Phe Asn Pro Val Phe Leu Leu Thr Phe
370 375 380
Asn Arg Ile Tyr His Gln Pro Met Thr Leu Ser Asp Gly Thr Asn Leu
385 390 395 400
Pro Ser Gly Thr Arg Ile Ala Val Pro Ser His Ala Met Leu Gln Asp
405 410 415
Ser Ala His Val Pro Gly Pro Ala Pro Pro Thr Asp Phe Asp Gly Phe
420 425 430
Arg Tyr Ser Lys Ile Arg Ser Asp Ser Asn Tyr Ala Gln Lys Tyr Leu
435 440 445
Phe Ser Met Thr Asp Ser Ser Asn Met Ala Phe Gly Tyr Gly Lys Tyr
450 455 460
Ala Cys Pro Gly Arg Phe Tyr Ala Ser Asn Glu Met Lys Leu Thr Leu
465 470 475 480
Ala Ile Leu Leu Leu Gln Phe Glu Phe Lys Leu Pro Asp Gly Lys Gly
485 490 495
Arg Pro Arg Asn Ile Thr Ile Asp Ser Asp Met Val Pro Asp Pro Arg
500 505 510
Ala Arg Leu Cys Val Arg Lys Arg Ser Leu Arg Glu Glu
515 520 525
<210> 8
<211> 511
<212> PRT
<213> Lactuca sativa
<220>
<221> misc_feature
<222> (1)..(511)
<223> Kaurene oxidase enzyme
<400> 8
Met Asp Leu Gln Thr Met Ala Pro Met Gly Ser Ala Ala Ile Ala Ile
1 5 10 15
Gly Gly Pro Ala Val Ala Val Ala Gly Gly Ile Ser Leu Leu Phe Leu
20 25 30
Lys Ser Phe Leu Ser Gln Gln Pro Gly Asn Pro Asn His Leu Pro Ser
35 40 45
Val Pro Ala Val Pro Gly Val Pro Leu Leu Gly Asn Leu Leu Glu Leu
50 55 60
Lys Glu Lys Lys Pro Tyr Lys Thr Phe Thr Lys Trp Ala Glu Thr Tyr
65 70 75 80
Gly Pro Ile Tyr Ser Ile Lys Thr Gly Ala Thr Ser Met Val Val Val
85 90 95
Asn Ser Asn Gln Leu Ala Lys Glu Ala Met Val Thr Arg Phe Asp Ser
100 105 110
Ile Ser Thr Arg Lys Leu Ser Lys Ala Leu Gln Ile Leu Thr Ala Asp
115 120 125
Lys Thr Met Val Ala Met Ser Asp Tyr Asp Asp Tyr His Lys Thr Val
130 135 140
Lys Arg Asn Leu Leu Thr Ser Ile Leu Gly Pro Ala Ala Gln Lys Arg
145 150 155 160
His Arg Ala His Arg Asp Ala Met Gly Asp Asn Leu Ser Arg Gln Leu
165 170 175
His Ala Leu Ala Leu Asn Ser Pro Gln Glu Ala Ile Asn Phe Arg Gln
180 185 190
Ile Phe Gln Ser Glu Leu Phe Thr Leu Ala Phe Lys Gln Thr Phe Gly
195 200 205
Arg Asp Ile Glu Ser Ile Phe Val Gly Asp Leu Gly Thr Thr Met Thr
210 215 220
Arg Glu Glu Met Phe Gln Ile Leu Val Val Asp Pro Met Met Gly Ala
225 230 235 240
Ile Asp Val Asp Trp Arg Asp Phe Phe Pro Tyr Leu Lys Trp Ile Pro
245 250 255
Asn Ala Lys Leu Glu Glu Lys Ile Glu Gln Met Tyr Ile Arg Arg Lys
260 265 270
Ala Val Met Lys Ala Val Ile Gln Glu His Arg Lys Arg Ile Asp Ser
275 280 285
Gly Glu Asn Leu Asp Ser Tyr Ile Asp Phe Leu Leu Ala Glu Ala Gln
290 295 300
Pro Leu Thr Glu Lys Gln Leu Leu Met Ser Leu Trp Glu Pro Ile Ile
305 310 315 320
Glu Thr Ser Asp Thr Thr Met Val Thr Thr Glu Trp Ala Met Tyr Glu
325 330 335
Leu Ser Lys His Pro Asn Lys Gln Gln Arg Leu Tyr Asn Glu Ile Arg
340 345 350
Asn Ile Cys Gly Ser Glu Lys Ile Thr Glu Glu Lys Leu Cys Lys Met
355 360 365
Pro Tyr Leu Ser Ala Val Phe His Glu Thr Leu Arg Val His Ser Pro
370 375 380
Val Ser Ile Ile Pro Leu Arg Tyr Val His Glu Asn Thr Glu Leu Gly
385 390 395 400
Gly Tyr His Val Pro Ala Gly Thr Glu Leu Ala Val Asn Ile Tyr Gly
405 410 415
Cys Asn Met Glu Arg Glu Ile Trp Glu Asn Pro Glu Glu Trp Ser Pro
420 425 430
Glu Arg Phe Leu Ala Glu Asn Glu Pro Val Asn Leu Gln Lys Thr Met
435 440 445
Ala Phe Gly Ala Gly Lys Arg Val Cys Ala Gly Ala Met Gln Ala Met
450 455 460
Leu Leu Ala Cys Val Gly Ile Gly Arg Met Val Gln Glu Phe Glu Trp
465 470 475 480
Arg Leu Lys Asp Asp Val Glu Glu Asp Val Asn Thr Leu Gly Leu Thr
485 490 495
Thr Gln Arg Leu Asn Pro Met Leu Ala Val Ile Lys Pro Arg Asn
500 505 510
<210> 9
<211> 513
<212> PRT
<213> Lactuca sativa
<220>
<221> misc_feature
<222> (1)..(513)
<223> Kaurene oxidase enzyme
<400> 9
Met Asp Gly Val Ile Asp Met Gln Thr Ile Pro Leu Arg Thr Ala Ile
1 5 10 15
Ala Ile Gly Gly Thr Ala Val Ala Leu Val Val Ala Leu Tyr Phe Trp
20 25 30
Phe Leu Arg Ser Tyr Ala Ser Pro Ser His His Ser Asn His Leu Pro
35 40 45
Pro Val Pro Glu Val Pro Gly Val Pro Val Leu Gly Asn Leu Leu Gln
50 55 60
Leu Lys Glu Lys Lys Pro Tyr Met Thr Phe Thr Lys Trp Ala Glu Met
65 70 75 80
Tyr Gly Pro Ile Tyr Ser Ile Arg Thr Gly Ala Thr Ser Met Val Val
85 90 95
Val Ser Ser Asn Glu Ile Ala Lys Glu Val Val Val Thr Arg Phe Pro
100 105 110
Ser Ile Ser Thr Arg Lys Leu Ser Tyr Ala Leu Lys Val Leu Thr Glu
115 120 125
Asp Lys Ser Met Val Ala Met Ser Asp Tyr His Asp Tyr His Lys Thr
130 135 140
Val Lys Arg His Ile Leu Thr Ala Val Leu Gly Pro Asn Ala Gln Lys
145 150 155 160
Lys Phe Arg Ala His Arg Asp Thr Met Met Glu Asn Val Ser Asn Glu
165 170 175
Leu His Ala Phe Phe Glu Lys Asn Pro Asn Gln Glu Val Asn Leu Arg
180 185 190
Lys Ile Phe Gln Ser Gln Leu Phe Gly Leu Ala Met Lys Gln Ala Leu
195 200 205
Gly Lys Asp Val Glu Ser Ile Tyr Val Lys Asp Leu Glu Thr Thr Met
210 215 220
Lys Arg Glu Glu Ile Phe Glu Val Leu Val Val Asp Pro Met Met Gly
225 230 235 240
Ala Ile Glu Val Asp Trp Arg Asp Phe Phe Pro Tyr Leu Lys Trp Val
245 250 255
Pro Asn Lys Ser Phe Glu Asn Ile Ile His Arg Met Tyr Thr Arg Arg
260 265 270
Glu Ala Val Met Lys Ala Leu Ile Gln Glu His Lys Lys Arg Ile Ala
275 280 285
Ser Gly Glu Asn Leu Asn Ser Tyr Ile Asp Tyr Leu Leu Ser Glu Ala
290 295 300
Gln Thr Leu Thr Asp Lys Gln Leu Leu Met Ser Leu Trp Glu Pro Ile
305 310 315 320
Ile Glu Ser Ser Asp Thr Thr Met Val Thr Thr Glu Trp Ala Met Tyr
325 330 335
Glu Leu Ala Lys Asn Pro Asn Met Gln Asp Arg Leu Tyr Glu Glu Ile
340 345 350
Gln Ser Val Cys Gly Ser Glu Lys Ile Thr Glu Glu Asn Leu Ser Gln
355 360 365
Leu Pro Tyr Leu Tyr Ala Val Phe Gln Glu Thr Leu Arg Lys His Cys
370 375 380
Pro Val Pro Ile Met Pro Leu Arg Tyr Val His Glu Asn Thr Val Leu
385 390 395 400
Gly Gly Tyr His Val Pro Ala Gly Thr Glu Val Ala Ile Asn Ile Tyr
405 410 415
Gly Cys Asn Met Asp Lys Lys Val Trp Glu Asn Pro Glu Glu Trp Asn
420 425 430
Pro Glu Arg Phe Leu Ser Glu Lys Glu Ser Met Asp Leu Tyr Lys Thr
435 440 445
Met Ala Phe Gly Gly Gly Lys Arg Val Cys Ala Gly Ser Leu Gln Ala
450 455 460
Met Val Ile Ser Cys Ile Gly Ile Gly Arg Leu Val Gln Asp Phe Glu
465 470 475 480
Trp Lys Leu Lys Asp Asp Ala Glu Glu Asp Val Asn Thr Leu Gly Leu
485 490 495
Thr Thr Gln Lys Leu His Pro Leu Leu Ala Leu Ile Asn Pro Arg Lys
500 505 510
Ser
<210> 10
<211> 505
<212> PRT
<213> Oryza sativa subsp. japonica
<220>
<221> misc_feature
<222> (1)..(505)
<223> Kaurene oxidase enzyme
<400> 10
Met Glu Ala Phe Val Pro Gly Gly Ala Gly Ala Ala Ala Ala Ala Val
1 5 10 15
Gly Gly Phe Val Ala Ala Ala Ala Leu Ala Glu Arg Ala Gly Val Ile
20 25 30
Ala Pro Arg Lys Arg Pro Asn Ala Pro Pro Ala Val Pro Gly Leu Pro
35 40 45
Ile Ile Gly Asn Leu His Gln Leu Lys Glu Lys Lys Pro His Gln Thr
50 55 60
Phe Ala Lys Trp Ala Glu Ile Tyr Gly Pro Ile Tyr Thr Ile Arg Thr
65 70 75 80
Gly Ala Ser Ser Val Val Val Leu Asn Ser Thr Glu Val Ala Lys Glu
85 90 95
Ala Met Val Ala Lys Phe Ser Ser Ile Ser Thr Arg Lys Leu Ser Lys
100 105 110
Ala Leu Thr Val Leu Thr Arg Asp Lys Ser Met Val Ala Thr Ser Asp
115 120 125
Tyr Cys Asp Phe His Lys Met Val Lys Arg Tyr Val Met Ser Ser Met
130 135 140
Leu Gly Thr Ser Ala Gln Lys Gln Phe Arg Asp Ile Arg Asp Met Met
145 150 155 160
Ile His Asn Met Leu Ser Thr Phe His Lys Leu Val Lys Asp Asp Pro
165 170 175
His Ala Pro Leu Ile Phe Arg Asp Val Phe Lys Asp Glu Leu Phe Arg
180 185 190
Leu Ser Met Ile Gln Ser Leu Gly Glu Asp Val Ser Ser Val Tyr Val
195 200 205
Asp Glu Phe Gly Arg Asp Ile Ser Lys Glu Glu Ile Tyr Asn Ala Thr
210 215 220
Val Thr Asp Met Met Met Cys Ala Ile Glu Val Asp Trp Arg Asp Phe
225 230 235 240
Phe Pro Tyr Leu Ser Trp Val Pro Asn Lys Ser Phe Glu Thr Arg Val
245 250 255
Phe Thr Thr Glu Thr Arg Arg Thr Ala Val Met Arg Ala Leu Ile Lys
260 265 270
Gln Gln Lys Glu Arg Ile Val Arg Gly Glu Ala Lys Thr Cys Tyr Leu
275 280 285
Asp Phe Leu Leu Ala Glu Asn Thr Leu Thr Asp Glu Gln Leu Met Met
290 295 300
Leu Val Trp Glu Ala Leu Ile Glu Ala Ala Asp Thr Thr Leu Val Thr
305 310 315 320
Thr Glu Trp Ala Met Tyr Glu Leu Ala Lys Asn Pro Asp Lys Gln Glu
325 330 335
Arg Leu Tyr Gln Glu Ile Arg Glu Val Cys Gly Asp Glu Thr Val Thr
340 345 350
Glu Glu His Leu Pro Arg Leu Pro Tyr Leu Asn Ala Val Phe His Glu
355 360 365
Thr Leu Arg Arg His Ser Pro Val Pro Leu Ile Pro Pro Arg Phe Val
370 375 380
His Glu Asp Thr Lys Leu Ala Gly Tyr Asp Val Pro Ala Gly Thr Glu
385 390 395 400
Met Val Ile Asn Leu Tyr Gly Cys Asn Met Asn Arg Lys Glu Trp Glu
405 410 415
Ser Pro Glu Glu Trp Val Pro Glu Arg Phe Ala Gly Gly Arg Leu Glu
420 425 430
Val Ala Asp Met Tyr Lys Thr Met Ala Phe Gly Ala Gly Arg Arg Ala
435 440 445
Cys Ala Gly Ser Leu Gln Ala Thr His Ile Ala Cys Ala Ala Val Ala
450 455 460
Arg Phe Val Gln Glu Phe Gly Trp Arg Leu Arg Glu Gly Asp Glu Glu
465 470 475 480
Lys Val Asp Thr Val Gln Leu Thr Ala Tyr Lys Leu His Pro Leu His
485 490 495
Val His Leu Thr Arg Arg Gly Arg Met
500 505
<210> 11
<211> 496
<212> PRT
<213> Physcomitrella patens subsp. patens
<220>
<221> misc_feature
<222> (1)..(496)
<223> Kaurene oxidase enzyme
<400> 11
Met Leu Glu Thr Lys Val Ile Ala His His Val Ser His Ser Pro Cys
1 5 10 15
Ala Ala Ile Pro Gly Gly Leu Pro Val Leu Gly Asn Leu Leu Gln Leu
20 25 30
Thr Glu Lys Lys Pro His Arg Thr Phe Thr Ala Trp Ser Lys Glu His
35 40 45
Gly Pro Ile Phe Thr Ile Lys Val Gly Ser Val Pro Gln Ala Val Val
50 55 60
Asn Asn Ser Glu Ile Ala Lys Glu Val Leu Val Thr Lys Phe Ala Ser
65 70 75 80
Ile Ser Lys Arg Gln Met Pro Met Ala Leu Arg Val Leu Thr Arg Asp
85 90 95
Lys Thr Met Val Ala Met Ser Asp Tyr Gly Glu Glu His Arg Met Leu
100 105 110
Lys Lys Leu Val Met Thr Asn Leu Leu Gly Pro Thr Thr Gln Asn Lys
115 120 125
Asn Arg Ser Leu Arg Asp Asp Ala Leu Ile Gly Met Ile Glu Gly Val
130 135 140
Leu Ala Glu Leu Lys Ala Ser Pro Thr Ser Pro Lys Val Val Asn Val
145 150 155 160
Arg Asp Tyr Val Gln Arg Ser Leu Phe Pro Phe Ala Leu Gln Gln Val
165 170 175
Phe Gly Tyr Ile Pro Asp Gln Val Glu Val Leu Glu Leu Gly Thr Cys
180 185 190
Val Ser Thr Trp Asp Met Phe Asp Ala Leu Val Val Ala Pro Leu Ser
195 200 205
Ala Val Ile Asn Val Asp Trp Arg Asp Phe Phe Pro Ala Leu Arg Trp
210 215 220
Ile Pro Asn Arg Ser Val Glu Asp Leu Val Arg Thr Val Asp Phe Lys
225 230 235 240
Arg Asn Ser Ile Met Lys Ala Leu Ile Arg Ala Gln Arg Met Arg Leu
245 250 255
Ala Asn Leu Lys Glu Pro Pro Arg Cys Tyr Ala Asp Ile Ala Leu Thr
260 265 270
Glu Ala Thr His Leu Thr Glu Lys Gln Leu Glu Met Ser Leu Trp Glu
275 280 285
Pro Ile Ile Glu Ser Ala Asp Thr Thr Leu Val Thr Ser Glu Trp Ala
290 295 300
Met Tyr Glu Ile Ala Lys Asn Pro Asp Cys Gln Asp Arg Leu Tyr Arg
305 310 315 320
Glu Ile Val Ser Val Ala Gly Thr Glu Arg Met Val Thr Glu Asp Asp
325 330 335
Leu Pro Asn Met Pro Tyr Leu Gly Ala Ile Ile Lys Glu Thr Leu Arg
340 345 350
Lys Tyr Thr Pro Val Pro Leu Ile Pro Ser Arg Phe Val Glu Glu Asp
355 360 365
Ile Thr Leu Gly Gly Tyr Asp Ile Pro Lys Gly Tyr Gln Ile Leu Val
370 375 380
Asn Leu Phe Ala Ile Ala Asn Asp Pro Ala Val Trp Ser Asn Pro Glu
385 390 395 400
Lys Trp Asp Pro Glu Arg Met Leu Ala Asn Lys Lys Val Asp Met Gly
405 410 415
Phe Arg Asp Phe Ser Leu Met Pro Phe Gly Ala Gly Lys Arg Met Cys
420 425 430
Ala Gly Ile Thr Gln Ala Met Phe Ile Ile Pro Met Asn Val Ala Ala
435 440 445
Leu Val Gln His Cys Glu Trp Arg Leu Ser Pro Gln Glu Ile Ser Asn
450 455 460
Ile Asn Asn Lys Ile Glu Asp Val Val Tyr Leu Thr Thr His Lys Leu
465 470 475 480
Ser Pro Leu Ser Cys Glu Ala Thr Pro Arg Ile Ser His Arg Leu Pro
485 490 495
<210> 12
<211> 525
<212> PRT
<213> Sphaceloma manihoticola
<220>
<221> misc_feature
<222> (1)..(525)
<223> Kaurene oxidase enzyme
<400> 12
Met Met Asp Asp Thr Thr Ser Pro Tyr Ser Thr Tyr His Ser Val Arg
1 5 10 15
Ser Ile Arg Asn Gln Ser Ala Trp Ala Leu Ala Pro Ile Ala Val Phe
20 25 30
Ile Cys Tyr Val Val Leu Arg His Asn Arg Lys Ser Val Pro Ala Ala
35 40 45
Ser Ala Gly Ser His Ser Ile Leu Glu Pro Leu Trp Leu Ala Arg Leu
50 55 60
Arg Phe Ile Arg Asp Ser Arg Phe Ile Ile Gly Gln Gly Tyr Ser Lys
65 70 75 80
Phe Lys Asp Thr Ile Phe Lys Val Thr Lys Val Gly Ala Asp Ile Ile
85 90 95
Val Val Ala Pro Lys Tyr Val Glu Glu Ile Arg Arg Leu Ser Arg Asp
100 105 110
Thr Gly Arg Ser Val Glu Pro Phe Ile His Asp Phe Ala Gly Glu Leu
115 120 125
Leu Gly Gly Leu Asn Phe Leu Glu Ser Asp Leu Gln Thr Arg Val Val
130 135 140
Gln Gln Lys Leu Thr Pro Asn Leu Lys Thr Ile Val Pro Val Met Glu
145 150 155 160
Asp Glu Met His Tyr Ala Leu Val Ser Glu Leu Asp Ser Cys Leu Asp
165 170 175
Gly Ser Glu His Trp Thr Arg Val Asp Met Ile His Met Leu Ser Arg
180 185 190
Ile Val Ser Arg Ile Ser Ala Arg Ile Phe Leu Gly Pro Lys Tyr Cys
195 200 205
Arg Asn Asp Leu Trp Leu Lys Thr Thr Ala Glu Tyr Thr Glu Asn Leu
210 215 220
Phe Leu Thr Gly Thr Leu Leu Arg Phe Val Pro Arg Met Leu Gln Lys
225 230 235 240
Trp Ile Ala Pro Leu Leu Pro Ser Phe Arg Gln Leu Gln Glu Asn Arg
245 250 255
Gln Ala Ala Arg Lys Ile Ile Ser Glu Ile Leu Thr Asp His Gln Pro
260 265 270
Glu Lys His Asp Glu Thr Ser Asp Asn Gly Asp Pro Tyr Pro Asp Ile
275 280 285
Leu Thr Leu Met Phe Gln Ala Ala Arg Gly Lys Glu Lys Asp Ile Glu
290 295 300
Asp Ile Ala Gln His Thr Leu Leu Leu Ser Leu Ser Ser Ile His Thr
305 310 315 320
Thr Ala Leu Thr Met Thr Gln Ala Leu Tyr Asp Leu Cys Ala Tyr Pro
325 330 335
Gln Tyr Leu Asp Pro Val Lys His Glu Ile Ala Asp Thr Leu Gln Ser
340 345 350
Glu Gly Ser Trp Ser Lys Ala Met Leu Asp Lys Leu His Met Met Asp
355 360 365
Ser Leu Leu Arg Glu Ser Gln Arg Leu Ser Pro Val Phe Leu Leu Thr
370 375 380
Phe Asn Arg Ile Leu His Thr Pro Leu Thr Leu Ser Asn Gly Ile His
385 390 395 400
Leu Pro Lys Gly Thr Arg Ile Ala Ala Pro Ser Asp Ala Ile Leu Asn
405 410 415
Asp Pro Ser Leu Val Pro Gly Pro Gln Pro Ala Asp Thr Phe Asp Pro
420 425 430
Phe Arg Tyr Ile Asn His Ser Thr Gly Asp Ala Lys Lys Thr Lys Thr
435 440 445
Asn Phe Gln Thr Thr Ser Leu Gln Asn Met Ala Phe Gly Tyr Gly Lys
450 455 460
Tyr Ala Cys Pro Gly Arg Phe Tyr Val Ala Asn Glu Ile Lys Leu Val
465 470 475 480
Leu Gly His Leu Leu Met His Tyr Glu Phe Lys Phe Pro Pro Gly Met
485 490 495
Gly Arg Pro Val Asn Ser Thr Val Asp Thr Asp Met Tyr Pro Asp Leu
500 505 510
Gly Ala Arg Leu Leu Val Arg Lys Arg Lys Met Glu Glu
515 520 525
<210> 13
<211> 508
<212> PRT
<213> Zea mays
<220>
<221> misc_feature
<222> (1)..(508)
<223> Kaurene oxidase enzyme
<400> 13
Met Glu Ser Leu Val Ala Ala Leu Pro Ala Gly Gly Ala Ala Ala Ala
1 5 10 15
Ala Ala Phe Gly Gly Leu Val Ala Ala Ala Ala Leu Ala Gly Lys Val
20 25 30
Gly Leu Val Gly Ser Lys Lys His Leu Asn Ala Pro Pro Ala Val Ser
35 40 45
Gly Leu Pro Leu Ile Gly Asn Leu His Gln Leu Lys Glu Lys Lys Pro
50 55 60
His Gln Thr Phe Thr Lys Trp Ala Glu Ile Tyr Gly Pro Ile Tyr Thr
65 70 75 80
Ile Arg Thr Gly Ser Ser Thr Val Val Val Leu Asn Ser Ala Gln Val
85 90 95
Ala Lys Glu Ala Met Ile Ala Lys Phe Ser Ser Ile Ser Thr Arg Lys
100 105 110
Leu Ser Lys Ala Leu Ser Ala Leu Thr Arg Asp Lys Thr Met Val Ala
115 120 125
Thr Ser Asp Tyr Gly Asp Phe His Lys Met Ile Lys Arg Tyr Ile Met
130 135 140
Thr Phe Met Leu Gly Thr Ser Gly Gln Lys Gln Phe Arg Asp Thr Arg
145 150 155 160
Asn Met Met Val Asp Asn Met Leu Asn Thr Phe His Thr Leu Leu Met
165 170 175
Asp Asp Pro Asn Ser Pro Leu Asn Phe Arg Glu Val Phe Lys Asn Glu
180 185 190
Leu Phe Arg Leu Ser Leu Val Gln Ala Leu Gly Glu Asp Val Ser Ser
195 200 205
Ile Tyr Val Glu Glu Tyr Gly Lys Val Ile Ser Lys Glu Glu Ile Tyr
210 215 220
Lys Ala Thr Val Val Asp Met Met Met Cys Ala Ile Glu Val Asp Trp
225 230 235 240
Arg Asp Phe Phe Pro Tyr Leu Ser Trp Ile Pro Asn Arg Thr Phe Glu
245 250 255
Thr Arg Val Leu Thr Thr Glu Ala Arg Arg Thr Thr Val Met Gln Ala
260 265 270
Leu Ile Lys Gln Gln Lys Glu Arg Ile Ala Arg Gly Glu Thr Arg Ile
275 280 285
Ser Tyr Leu Asp Phe Leu Leu Ala Glu Asn Thr Leu Thr Asp Glu Gln
290 295 300
Leu Leu Met Leu Val Trp Glu Ala Val Ile Glu Ala Ala Asp Thr Thr
305 310 315 320
Leu Val Thr Thr Glu Trp Ala Met Tyr Glu Ile Ala Lys His Pro Glu
325 330 335
Lys Gln Glu Tyr Leu Tyr Gln Glu Ile Gln Lys Val Cys Gly Asn Lys
340 345 350
Thr Val Thr Glu Asp His Leu Pro Glu Leu Pro Tyr Leu Asn Ala Val
355 360 365
Phe His Glu Thr Met Arg Arg His Ser Pro Val Pro Leu Val Pro Pro
370 375 380
Arg Leu Val His Glu Asn Thr Asn Leu Ala Gly Tyr Glu Val Pro Ala
385 390 395 400
Gly Thr Glu Ile Ile Ile Asn Leu Tyr Gly Cys Asn Met Asn Lys Asn
405 410 415
Asp Trp Ala Glu Pro Glu Glu Trp Lys Pro Glu Arg Phe Leu Asp Gly
420 425 430
Arg Phe Glu Ala Val Asp Met His Lys Thr Met Ala Phe Gly Ala Gly
435 440 445
Arg Arg Ala Cys Ala Gly Ser Met Gln Ala Met Asn Ile Ser Cys Thr
450 455 460
Ala Ile Gly Arg Phe Val Gln Glu Phe Ala Trp Arg Leu Glu Glu Gly
465 470 475 480
Asp Glu Asp Lys Val Asp Thr Ile Gln Leu Thr Thr Asn Arg Leu Tyr
485 490 495
Pro Leu His Val Tyr Leu Ala Pro Arg Gly Arg Lys
500 505
<210> 14
<211> 1000
<212> DNA
<213> Pisum sativum
<220>
<221> misc_feature
<222> (1)..(1000)
<223> AY245442.1 ent-kaurene oxidase mRNA
<400> 14
gtggtgaagc aactagcagt ggcagccatg gatactctca cactttcttt gggtttttta 60
tctctctttt tgttcctctt cttactaaag agatctactc acaaacattc caagctttcc 120
catgtaccag tggttccagg tttgccagtg attgggaatc tgctgcaatt gaaagagaag 180
aaacctcaca agacattcac aaagatggct cagaaatatg gacccatttt ttccatcaaa 240
gctggttctt ccaaaatcat tgttctcaac actgctcatc ttgctaaaga ggcaatggtg 300
actagatatt catcaatttc aaaaaggaag ctatcaactg cactgacgat tctaacttcg 360
gataaatgca tggttgctat gagcgactac aatgattttc acaaaatggt taaaaaacat 420
attcttgcaa gtgttcttgg agccaatgca cagaagcgac tccgttttca cagagaggtt 480
atgatggaaa atatgtctag taagtttaat gaacatgtga agaccctctc agattctgct 540
gttgatttta ggaaaatatt tgtgtctgaa cttttcggat tagcactaaa gcaagctctg 600
ggaagtgata ttgaatccat ttatgtggag ggtttgacgg ctacattatc aagagaggac 660
ttatataaca ctctagtggt tgattttatg gagggtgcaa ttgaggtgga ttggagagat 720
ttcttcccgt acctgaaatg gattccaaat aagagcttcg agaagaaaat ccgtagagtc 780
gatcgccaaa gaaaaattat catgaaggca ctaattaatg agcaaaagaa gcggttgaca 840
tcaggaaaag aattagattg ttattatgat tacctagtat cagaagctaa agaagtgact 900
gaagaacaaa tgatcatgct gctctgggag ccaattattg agacatccga tactacctta 960
gtcacgacag aatgggctat gtatgaactt gccaaagaca 1000
<210> 15
<211> 1500
<212> DNA
<213> Pisum sativum
<220>
<221> misc_feature
<222> (1)..(1500)
<223> nucleic acid sequence of Pisum sativum KO enzyme
<400> 15
atggatacct taactttgtc tttaggtttc ttatctttgt tcttattttt attcttgtta 60
aagagatcta ctcacaagca ctccaagtta tcccacgttc cagttgttcc aggtttgcct 120
gtcattggta acttattgca attgaaagaa aagaagccac acaagacttt caccaagatg 180
gctcaaaagt acggtccaat tttctccatc aaagccggtt cttctaaaat cattgtttta 240
aacactgccc acttggctaa agaagctatg gttactagat attcttccat ctccaagaga 300
aagttgtcta ctgctttgac catcttgact tctgataagt gcatggttgc tatgtccgat 360
tataacgact tccacaagat ggttaagaag cacatcttgg cttctgtttt gggtgccaac 420
gcccaaaaga gattgcgttt ccacagagaa gtcatgatgg aaaacatgtc ttccaaattc 480
aatgaacatg tcaagacttt gtctgattct gctgttgact tcagaaagat tttcgtttct 540
gaattatttg gtttggcttt gaagcaagct ttgggttccg atatcgaatc tatctacgtt 600
gaaggtttga ctgctacttt atctagagaa gatttgtata acaccttggt cgtcgacttc 660
atggaaggtg ctatcgaagt tgattggaga gactttttcc cttatttgaa gtggattcca 720
aacaaatcct tcgaaaagaa gatcagaaga gttgatagac aaagaaaaat tatcatgaaa 780
gctttgatca acgaacaaaa gaaaagattg acctctggta aggaattgga ctgttactac 840
gattacttag tttctgaagc taaggaagtc accgaagaac aaatgatcat gttgttgtgg 900
gaaccaatta ttgagacttc tgatactact ttagttacca ccgaatgggc tatgtatgag 960
ttggctaagg acaagaaccg tcaagacaga ttgtacgaag aattgttgaa cgtttgtggt 1020
cacgaaaagg ttactgatga agaattgtcc aagttgccat acttaggtgc tgtctttcac 1080
gaaaccttgc gtaaacactc tccagttcca atcgtcccat tgagatacgt tgatgaagat 1140
accgaattgg gtggttatca tattcctgcc ggttccgaaa tcgctatcaa catttacggt 1200
tgtaatatgg attccaactt gtgggagaac ccagatcaat ggatccctga aagattttta 1260
gatgaaaaat acgcccaagc tgatttgtat aagactatgg ctttcggtgg tggtaaaaga 1320
gtctgtgctg gttccttaca agctatgttg attgcctgta ctgctattgg tagattggtt 1380
caagaatttg aatgggaatt gggtcacggt gaagaagaaa acgttgacac catgggttta 1440
actacccata gattacaccc attgcaagtc aaattaaagc caagaaacag aatttactaa 1500
<210> 16
<211> 449
<212> PRT
<213> Stevia rebaudiana
<220>
<221> misc_feature
<222> (1)..(449)
<223> sr.UGT_g252778
<400> 16
Met Ala Thr Asn Asp Asp Asp Arg Lys Gln Leu His Val Ala Met Phe
1 5 10 15
Pro Trp Leu Ala Phe Gly His Ile Leu Pro Phe Leu Glu Leu Ser Lys
20 25 30
Leu Ile Ala Gln Asn Gly His Lys Val Ser Phe Leu Ser Thr Thr Arg
35 40 45
Asn Ile Gln Arg Leu Pro Ser His Leu Thr Pro Leu Ile Asn Leu Val
50 55 60
Lys Leu Thr Leu Pro Arg Val Gln Glu Leu Pro Glu Asp Ala Glu Ala
65 70 75 80
Thr Thr Asp Ile Lys His Asp Asp Gln Asp His Leu Leu Asn Ala Ser
85 90 95
Asp Gly Leu Gln Pro Glu Val Thr Arg Phe Leu Glu Glu Glu Ser Pro
100 105 110
Asp Trp Ile Ile Phe Asp Tyr Ser Tyr Tyr Trp Leu Pro Pro Val Ala
115 120 125
Ala Glu Leu Gly Ile Ser Arg Ala Phe Phe Met Thr Phe Pro Thr Trp
130 135 140
Thr Met Ala Leu Thr Arg Leu Pro Ser Asp Gln Leu Thr Ala Glu Asp
145 150 155 160
Leu Met Thr Leu Ser Lys Ile Ser Phe Lys Lys His Glu Ile Val Asn
165 170 175
Leu Met Tyr Gly Thr Ser Thr Gln Gly Asp Leu Tyr Arg Leu Thr Met
180 185 190
Ala Cys Asn Gly Ser Asp Cys Ile Leu Ile Arg Cys Cys Tyr Glu Phe
195 200 205
Glu Pro Gln Trp Leu Thr Leu Leu Glu Lys Leu Leu Pro Val Pro Val
210 215 220
Val Pro Val Gly Leu Leu Pro Pro Glu Ile His Gly Asp Glu Lys Asp
225 230 235 240
Asp Asp Thr Trp Val Ser Val Lys Glu Trp Leu Asp Gly Gln His Lys
245 250 255
Gly His Val Val Tyr Val Ala Leu Gly Ser Glu Ala Met Val Ser Lys
260 265 270
Asp Glu Leu Gly Glu Leu Ala Leu Gly Leu Glu Leu Ser Gly Leu Pro
275 280 285
Phe Phe Trp Ala Leu Arg Lys Pro Pro Gly Ser Thr Glu Ser Asp Ser
290 295 300
Val Glu Leu Pro Asp Gly Phe Met Glu Arg Thr Arg Asn Arg Gly Val
305 310 315 320
Val Trp Thr Ser Trp Ala Pro Gln Leu Arg Ile Leu Ser His Glu Ser
325 330 335
Val Cys Gly Phe Leu Thr His Cys Gly Val Ser Ser Ile Val Glu Gly
340 345 350
Leu Met Phe Gly His Pro Leu Ile Met Leu Pro Ile Phe Gly Asp Gln
355 360 365
Ile Met Asn Ala Gln Val Leu Ala Asp Lys Gln Val Gly Ile Glu Ile
370 375 380
Pro Arg Asn Glu Glu Asp Gly Trp Phe Thr Lys Glu Ser Val Ala Lys
385 390 395 400
Ser Leu Arg Ser Val Val Val Asp Asp Glu Gly Glu Ile Tyr Lys Ala
405 410 415
Asn Ala Arg Glu Leu Ser Lys Ile Phe Ser Asp Thr Asp Leu Gly Lys
420 425 430
Lys Tyr Ile Ser His Phe Ile Asp Phe Leu Met Met Glu Ile Val Lys
435 440 445
Thr
<210> 17
<211> 436
<212> PRT
<213> Setaria italica
<220>
<221> misc_feature
<222> (1)..(436)
<223> UGT40087 version 1
<400> 17
Met Asp Ala Ser Asp Ser Ser Pro Leu His Ile Val Ile Phe Pro Trp
1 5 10 15
Leu Ala Phe Gly His Met Leu Ala Ser Leu Glu Leu Ala Glu Arg Leu
20 25 30
Ala Ala Arg Gly His Arg Val Ser Phe Val Ser Thr Pro Arg Asn Ile
35 40 45
Ser Arg Leu Arg Pro Val Pro Pro Ala Leu Ala Pro Leu Ile Asp Phe
50 55 60
Val Ala Leu Pro Leu Pro Arg Val Asp Gly Leu Pro Asp Gly Ala Glu
65 70 75 80
Ala Thr Ser Asp Ile Pro Pro Gly Lys Thr Glu Leu His Leu Lys Ala
85 90 95
Leu Asp Gly Leu Ala Ala Pro Phe Ala Ala Phe Leu Asp Ala Ala Cys
100 105 110
Ala Asp Gly Ser Thr Asn Lys Val Asp Trp Leu Phe Leu Asp Asn Phe
115 120 125
Gln Tyr Trp Ala Ala Ala Ala Ala Ala Asp His Lys Ile Pro Cys Ala
130 135 140
Leu Asn Leu Thr Phe Ala Ala Ser Thr Ser Ala Glu Tyr Gly Val Pro
145 150 155 160
Arg Val Glu Pro Pro Val Asp Gly Ser Thr Ala Ser Ile Leu Gln Arg
165 170 175
Phe Val Leu Thr Leu Glu Lys Cys Gln Phe Val Ile Gln Arg Ala Cys
180 185 190
Phe Glu Leu Glu Pro Glu Pro Leu Pro Leu Leu Ser Asp Ile Phe Gly
195 200 205
Lys Pro Val Ile Pro Tyr Gly Leu Val Pro Pro Cys Pro Pro Ala Glu
210 215 220
Gly His Lys Arg Glu His Gly Asn Ala Ala Leu Ser Trp Leu Asp Lys
225 230 235 240
Gln Gln Pro Glu Ser Val Leu Phe Ile Ala Leu Gly Ser Glu Pro Pro
245 250 255
Val Thr Val Glu Gln Leu His Glu Ile Ala Leu Gly Leu Glu Leu Ala
260 265 270
Gly Thr Thr Phe Leu Trp Ala Leu Lys Lys Pro Asn Gly Leu Leu Leu
275 280 285
Glu Ala Asp Gly Asp Ile Leu Pro Pro Gly Phe Glu Glu Arg Thr Arg
290 295 300
Asp Arg Gly Leu Val Ala Met Gly Trp Val Pro Gln Pro Ile Ile Leu
305 310 315 320
Ala His Ser Ser Val Gly Ala Phe Leu Thr His Gly Gly Trp Ala Ser
325 330 335
Thr Ile Glu Gly Val Met Ser Gly His Pro Met Leu Phe Leu Thr Phe
340 345 350
Leu Asp Glu Gln Arg Ile Asn Ala Gln Leu Ile Glu Arg Lys Lys Ala
355 360 365
Gly Leu Arg Val Pro Arg Arg Glu Lys Asp Gly Ser Tyr Asp Arg Gln
370 375 380
Gly Ile Ala Gly Ala Ile Arg Ala Val Met Cys Glu Glu Glu Ser Lys
385 390 395 400
Ser Val Phe Ala Ala Asn Ala Lys Lys Met Gln Glu Ile Val Ser Asp
405 410 415
Arg Asn Cys Gln Glu Lys Tyr Ile Asp Glu Leu Ile Gln Arg Leu Gly
420 425 430
Ser Phe Glu Lys
435
<210> 18
<211> 435
<212> PRT
<213> Setaria italica
<220>
<221> misc_feature
<222> (1)..(435)
<223> UGT40087 version 2
<400> 18
Met Asp Ala Ser Ser Ser Pro Leu His Ile Val Ile Phe Pro Trp Leu
1 5 10 15
Ala Phe Gly His Met Leu Ala Ser Leu Glu Leu Ala Glu Arg Leu Ala
20 25 30
Ala Arg Gly His Arg Val Ser Phe Val Ser Thr Pro Arg Asn Ile Ser
35 40 45
Arg Leu Arg Pro Val Pro Pro Ala Leu Ala Pro Leu Ile Asp Phe Val
50 55 60
Ala Leu Pro Leu Pro Arg Val Asp Gly Leu Pro Asp Gly Ala Glu Ala
65 70 75 80
Thr Ser Asp Ile Pro Pro Gly Lys Thr Glu Leu His Leu Lys Ala Leu
85 90 95
Asp Gly Leu Ala Ala Pro Phe Ala Ala Phe Leu Asp Ala Ala Cys Ala
100 105 110
Asp Gly Ser Thr Asn Lys Val Asp Trp Leu Phe Leu Asp Asn Phe Gln
115 120 125
Tyr Trp Ala Ala Ala Ala Ala Ala Asp His Lys Ile Pro Cys Ala Leu
130 135 140
Asn Leu Thr Phe Ala Ala Ser Thr Ser Ala Glu Tyr Gly Val Pro Arg
145 150 155 160
Val Glu Pro Pro Val Asp Gly Ser Thr Ala Ser Ile Leu Gln Arg Phe
165 170 175
Val Leu Thr Leu Glu Lys Cys Gln Phe Val Ile Gln Arg Ala Cys Phe
180 185 190
Glu Leu Glu Pro Glu Pro Leu Pro Leu Leu Ser Asp Ile Phe Gly Lys
195 200 205
Pro Val Ile Pro Tyr Gly Leu Val Pro Pro Cys Pro Pro Ala Glu Gly
210 215 220
His Lys Arg Glu His Gly Asn Ala Ala Leu Ser Trp Leu Asp Lys Gln
225 230 235 240
Gln Pro Glu Ser Val Leu Phe Ile Ala Leu Gly Ser Glu Pro Pro Val
245 250 255
Thr Val Glu Gln Leu His Glu Ile Ala Leu Gly Leu Glu Leu Ala Gly
260 265 270
Thr Thr Phe Leu Trp Ala Leu Lys Lys Pro Asn Gly Leu Leu Leu Glu
275 280 285
Ala Asp Gly Asp Ile Leu Pro Pro Gly Phe Glu Glu Arg Thr Arg Asp
290 295 300
Arg Gly Leu Val Ala Met Gly Trp Val Pro Gln Pro Ile Ile Leu Ala
305 310 315 320
His Ser Ser Val Gly Ala Phe Leu Thr His Gly Gly Trp Ala Ser Thr
325 330 335
Ile Glu Gly Val Met Ser Gly His Pro Met Leu Phe Leu Thr Phe Leu
340 345 350
Asp Glu Gln Arg Ile Asn Ala Gln Leu Ile Glu Arg Lys Lys Ala Gly
355 360 365
Leu Arg Val Pro Arg Arg Glu Lys Asp Gly Ser Tyr Asp Arg Gln Gly
370 375 380
Ile Ala Gly Ala Ile Arg Ala Val Met Cys Glu Glu Glu Ser Lys Ser
385 390 395 400
Val Phe Ala Ala Asn Ala Lys Lys Met Gln Glu Ile Val Ser Asp Arg
405 410 415
Asn Cys Gln Glu Lys Tyr Ile Asp Glu Leu Ile Gln Arg Leu Gly Ser
420 425 430
Phe Glu Lys
435
<210> 19
<211> 21
<212> PRT
<213> Oryza sativa
<220>
<221> misc_feature
<222> (1)..(21)
<223> loop2 from Os_UGT_91C1
<400> 19
Glu Gly Leu Pro Asp Gly Ala Glu Ser Thr Asn Asp Val Pro His Asp
1 5 10 15
Arg Pro Asp Met Val
20
<210> 20
<211> 10
<212> PRT
<213> Oryza sativa
<220>
<221> misc_feature
<222> (1)..(10)
<223> loop3_1 from Os_UGT_91C1
<400> 20
Ser Glu Phe Leu Gly Thr Ala Cys Ala Asp
1 5 10
<210> 21
<211> 19
<212> PRT
<213> Oryza sativa
<220>
<221> misc_feature
<222> (1)..(19)
<223> loop3_2 from Os_UGT_91C1
<400> 21
Ser Glu Phe Leu Gly Thr Ala Cys Ala Asp Trp Val Ile Val Asp Val
1 5 10 15
Phe His His
<210> 22
<211> 43
<212> PRT
<213> Oryza sativa
<220>
<221> misc_feature
<222> (1)..(43)
<223> loop4_1 from Os_UGT_91C1
<400> 22
Ala Asp Arg Arg Leu Glu Arg Ala Glu Thr Glu Ser Pro Ala Ala Ala
1 5 10 15
Gly Gln Gly Arg Pro Ala Ala Ala Pro Thr Phe Glu Val Ala Arg Met
20 25 30
Lys Leu Ile Arg Thr Lys Gly Ser Ser Gly Met
35 40
<210> 23
<211> 56
<212> PRT
<213> Oryza sativa
<220>
<221> misc_feature
<222> (1)..(56)
<223> loop4_2 from Os_UGT_91C1
<400> 23
Met Met Leu Leu Gly Ser Ala His Met Ile Ala Ser Ile Ala Asp Arg
1 5 10 15
Arg Leu Glu Arg Ala Glu Thr Glu Ser Pro Ala Ala Ala Gly Gln Gly
20 25 30
Arg Pro Ala Ala Ala Pro Thr Phe Glu Val Ala Arg Met Lys Leu Ile
35 40 45
Arg Thr Lys Gly Ser Ser Gly Met
50 55
<210> 24
<211> 18
<212> PRT
<213> Oryza sativa
<220>
<221> misc_feature
<222> (1)..(18)
<223> loop2 from UGT40087
<400> 24
Asp Gly Leu Pro Asp Gly Ala Glu Ala Thr Ser Asp Ile Pro Pro Gly
1 5 10 15
Lys Thr
<210> 25
<211> 17
<212> PRT
<213> Setaria italica
<220>
<221> misc_feature
<222> (1)..(17)
<223> loop3_1 from UGT40087
<400> 25
Ala Ala Phe Leu Asp Ala Ala Cys Ala Asp Gly Ser Thr Asn Lys Val
1 5 10 15
Asp
<210> 26
<211> 26
<212> PRT
<213> Setaria italica
<220>
<221> misc_feature
<222> (1)..(26)
<223> loop3_2 from UGT40087
<400> 26
Ala Ala Phe Leu Asp Ala Ala Cys Ala Asp Gly Ser Thr Asn Lys Val
1 5 10 15
Asp Trp Leu Phe Leu Asp Asn Phe Gln Tyr
20 25
<210> 27
<211> 14
<212> PRT
<213> Setaria italica
<220>
<221> misc_feature
<222> (1)..(14)
<223> loop4_1 from UGT40087
<400> 27
Gly Val Pro Arg Val Glu Pro Pro Val Asp Gly Ser Thr Ala
1 5 10
<210> 28
<211> 27
<212> PRT
<213> Setaria italica
<220>
<221> misc_feature
<222> (1)..(27)
<223> loop4_2 from UGT40087
<400> 28
Leu Asn Leu Thr Phe Ala Ala Ser Thr Ser Ala Glu Tyr Gly Val Pro
1 5 10 15
Arg Val Glu Pro Pro Val Asp Gly Ser Thr Ala
20 25
<210> 29
<211> 17
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic: modified loop1 from Os_UGT_91C1 present in
UGT40087_loop1
<400> 29
Thr Pro Arg Asn Ile Ser Arg Leu Pro Pro Val Pro Pro Ala Leu Ala
1 5 10 15
Pro
<210> 30
<211> 17
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic: modified loop1 from UGT40087 present in
Os_UGT_91C1_loop1
<400> 30
Thr Pro Arg Asn Ile Ser Arg Leu Arg Pro Val Arg Pro Ala Leu Ala
1 5 10 15
Pro
<210> 31
<211> 17
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic: loop1 from Os_UGT_91C1 having SEQ ID NO:8
<400> 31
Thr Pro Arg Asn Ile Ser Arg Leu Pro Pro Val Arg Pro Ala Leu Ala
1 5 10 15
Pro
<210> 32
<211> 17
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic: loop1 from UGT40087 having SEQ ID NO:11
<400> 32
Thr Pro Arg Asn Ile Ser Arg Leu Arg Pro Val Pro Pro Ala Leu Ala
1 5 10 15
Pro
<210> 33
<211> 434
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic: UGT40087/Si91Dlike chimera
<400> 33
Met Asp Ala Ser Ser Ser Pro Leu His Ile Val Ile Phe Pro Trp Leu
1 5 10 15
Ala Phe Gly His Met Leu Ala Ser Leu Glu Leu Ala Glu Arg Leu Ala
20 25 30
Ala Arg Gly His Arg Val Ser Phe Val Ser Thr Pro Arg Asn Ile Ser
35 40 45
Arg Leu Arg Pro Val Pro Pro Ala Leu Ala Pro Leu Ile Asp Phe Val
50 55 60
Ala Leu Pro Leu Pro Arg Val Asp Gly Leu Pro Asp Gly Ala Glu Ala
65 70 75 80
Thr Ser Asp Ile Pro Pro Gly Lys Thr Glu Leu His Leu Lys Ala Leu
85 90 95
Asp Gly Leu Ala Ala Pro Phe Ala Ala Phe Leu Asp Ala Ala Cys Ala
100 105 110
Asp Gly Ser Thr Asn Lys Val Asp Trp Leu Phe Leu Asp Asn Phe Gln
115 120 125
Tyr Trp Ala Ala Ala Ala Ala Ala Asp His Lys Ile Pro Cys Ala Leu
130 135 140
Asn Leu Thr Phe Ala Ala Ser Thr Ser Ala Glu Tyr Gly Val Pro Arg
145 150 155 160
Val Glu Pro Pro Val Asp Gly Ser Thr Ala Ser Ile Leu Gln Arg Phe
165 170 175
Val Leu Thr Leu Glu Lys Cys Gln Phe Val Ile Gln Arg Ala Cys Phe
180 185 190
Glu Leu Glu Pro Glu Pro Leu Pro Leu Leu Ser Asp Ile Phe Gly Lys
195 200 205
Pro Val Ile Pro Tyr Gly Leu Val Pro Pro Cys Pro Pro Ala Gln Gly
210 215 220
His Ile Glu His Asp Asn Ala Ala Leu Ser Trp Leu Asp Lys Gln Gln
225 230 235 240
Pro Glu Ser Val Leu Phe Ile Ala Leu Gly Ser Glu Pro Pro Val Thr
245 250 255
Val Glu Gln Leu His Glu Ile Ala Leu Gly Leu Glu Leu Ala Gly Thr
260 265 270
Thr Phe Leu Trp Ala Leu Lys Lys Pro Asn Gly Leu Leu Leu Glu Ala
275 280 285
Asp Gly Asp Ile Leu Pro Pro Gly Phe Glu Glu Arg Thr Arg Asp Arg
290 295 300
Gly Leu Val Ala Met Gly Trp Val Pro Gln Leu Ser Ile Leu Ala His
305 310 315 320
Ser Ser Val Gly Ala Phe Leu Thr His Gly Gly Trp Ser Ser Thr Ile
325 330 335
Glu Gly Ala Met Ser Gly His Pro Met Val Phe Leu Thr Phe Leu Asp
340 345 350
Glu Gln Arg Ile Asn Ala Gln Leu Ile Glu Arg Lys Lys Ala Gly Leu
355 360 365
Arg Val Pro Arg Cys Glu Lys Asp Gly Ser Tyr Asp Arg Gln Gly Ile
370 375 380
Ala Gly Ala Ile Arg Ala Val Met Cys Glu Glu Glu Ser Lys Ser Val
385 390 395 400
Phe Ala Ala Asn Ala Lys Lys Met Gln Glu Ile Ile Asn Asp Arg Lys
405 410 415
Cys Gln Glu Arg Tyr Ile Asp Glu Leu Ile Gln Arg Leu Arg Ser Phe
420 425 430
Glu Lys
<210> 34
<211> 433
<212> PRT
<213> Oryza sativa
<220>
<221> misc_feature
<222> (1)..(433)
<223> Os_UGT_91C1_loop4_1
<400> 34
Met Asp Ser Gly Tyr Ser Ser Ser Tyr Ala Ala Ala Ala Gly Met His
1 5 10 15
Val Val Ile Cys Pro Trp Leu Ala Phe Gly His Leu Leu Pro Cys Leu
20 25 30
Asp Leu Ala Gln Arg Leu Ala Ser Arg Gly His Arg Val Ser Phe Val
35 40 45
Ser Thr Pro Arg Asn Ile Ser Arg Leu Pro Pro Val Arg Pro Ala Leu
50 55 60
Ala Pro Leu Val Ala Phe Val Ala Leu Pro Leu Pro Arg Val Glu Gly
65 70 75 80
Leu Pro Asp Gly Ala Glu Ser Thr Asn Asp Val Pro His Asp Arg Pro
85 90 95
Asp Met Val Glu Leu His Arg Arg Ala Phe Asp Gly Leu Ala Ala Pro
100 105 110
Phe Ser Glu Phe Leu Gly Thr Ala Cys Ala Asp Trp Val Ile Val Asp
115 120 125
Val Phe His His Trp Ala Ala Ala Ala Ala Leu Glu His Lys Val Pro
130 135 140
Cys Ala Met Met Leu Leu Gly Ser Ala His Met Ile Ala Ser Ile Gly
145 150 155 160
Val Pro Arg Val Glu Pro Pro Val Asp Gly Ser Thr Ala Ser Leu Ala
165 170 175
Glu Arg Phe Ser Leu Thr Leu Ser Arg Ser Ser Leu Val Val Gly Arg
180 185 190
Ser Cys Val Glu Phe Glu Pro Glu Thr Val Pro Leu Leu Ser Thr Leu
195 200 205
Arg Gly Lys Pro Ile Thr Phe Leu Gly Leu Met Pro Pro Leu His Glu
210 215 220
Gly Arg Arg Glu Asp Gly Glu Asp Ala Thr Val Arg Trp Leu Asp Ala
225 230 235 240
Gln Pro Ala Lys Ser Val Val Tyr Val Ala Leu Gly Ser Glu Val Pro
245 250 255
Leu Gly Val Glu Lys Val His Glu Leu Ala Leu Gly Leu Glu Leu Ala
260 265 270
Gly Thr Arg Phe Leu Trp Ala Leu Arg Lys Pro Thr Gly Val Ser Asp
275 280 285
Ala Asp Leu Leu Pro Ala Gly Phe Glu Glu Arg Thr Arg Gly Arg Gly
290 295 300
Val Val Ala Thr Arg Trp Val Pro Gln Met Ser Ile Leu Ala His Ala
305 310 315 320
Ala Val Gly Ala Phe Leu Thr His Cys Gly Trp Asn Ser Thr Ile Glu
325 330 335
Gly Leu Met Phe Gly His Pro Leu Ile Met Leu Pro Ile Phe Gly Asp
340 345 350
Gln Gly Pro Asn Ala Arg Leu Ile Glu Ala Lys Asn Ala Gly Leu Gln
355 360 365
Val Ala Arg Asn Asp Gly Asp Gly Ser Phe Asp Arg Glu Gly Val Ala
370 375 380
Ala Ala Ile Arg Ala Val Ala Val Glu Glu Glu Ser Ser Lys Val Phe
385 390 395 400
Gln Ala Lys Ala Lys Lys Leu Gln Glu Ile Val Ala Asp Met Ala Cys
405 410 415
His Glu Arg Tyr Ile Asp Gly Phe Ile Gln Gln Leu Arg Ser Tyr Lys
420 425 430
Asp
<210> 35
<211> 1621
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: unoptimized nucleic acid sequence of UGT40087 having
SEQ ID NO:17
<400> 35
tcgtgacgca acagagcaac tctcgccggc accggtcgcc ccttccgcag gcaggcagca 60
ggctcgcgcg catggacgcc tccgactcct ccccgctgca catcgtcatc ttcccgtggc 120
tcgcgttcgg ccacatgctc gccagcctgg agctcgccga gcgcctggcc gcgcgaggcc 180
accgcgtgtc cttcgtctcc accccgcgca acatcagccg cctccgcccg gtcccgcccg 240
cgctggcgcc gctcatcgac ttcgtggcgc tgccgctgcc gcgcgtcgac ggcctccccg 300
acggcgcgga ggccaccagc gacatcccgc ccggcaagac cgagctccac ctcaaggccc 360
tagacggcct cgccgcgccc ttcgcagctt tcctcgacgc cgcctgcgcc gacgggagca 420
ccaacaaggt ggactggctc ttcctcgaca acttccaata ctgggccgcc gccgccgctg 480
ccgaccataa gataccctgc gcgctgaacc tgacattcgc agcgtcgacg tcagcggagt 540
acggtgtgcc acgcgttgag ccgccggtgg atggctcaac agcctcaata ctccagcgat 600
ttgtgctaac cttggagaaa tgccagtttg tcatccaacg cgcctgcttc gagctggagc 660
cggagcccct gcctctcctg tcagacatct tcggcaagcc ggtgatcccg tacggcctag 720
tcccgccgtg tccccccgca gaaggtcaca aaagagagca cggcaacgca gctctgtcat 780
ggctcgacaa gcagcagccc gagtctgtcc tgttcattgc tctgggaagc gagcctccgg 840
tgaccgtcga acagctgcac gagatcgcgc ttgggctgga gctcgccggg acgacattcc 900
tctgggctct gaagaagcct aacggcctcc tcctcgaggc ggacggcgac atcctgcccc 960
caggtttcga ggagcggacg cgtgaccgtg ggctcgtggc catgggctgg gttcctcagc 1020
ccatcatact ggctcacagc tccgtgggcg cgttcctgac gcacggcgga tgggcctcca 1080
ccattgaagg ggttatgtcc gggcatccca tgctcttcct gacgttctta gatgaacaga 1140
ggataaacgc gcaactgatc gagaggaaga aggccgggtt gcgagtgcca aggcgtgaga 1200
aggacggctc gtacgatcgc caaggcatcg ccggagcgat ccgggctgtc atgtgcgagg 1260
aagaaagtaa gagcgtcttc gcggctaatg ccaagaagat gcaggagatt gtgagcgaca 1320
ggaattgcca ggagaagtac atcgacgagc ttatccagcg tctgggatcc ttcgagaagt 1380
gaaataaggt gaaatatcct acaataaccg cctgttgatg gcttgatgca acgatgtagg 1440
tggccattcg cgcctctgat ctccatgttc cggcaataaa tccaccatat gttatggctc 1500
tgacttactg aatttcctaa tatgtatgcc caaacacatg cataggttgc tagttgcccc 1560
tcgcgccggc attagcgata atgtcaccgc agtcgccagc acaggtgtag caatttgaca 1620
t 1621
<210> 36
<211> 1308
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic: UGT40087-1 codon optimized nucleic acid sequence
<400> 36
atggatgctt ccagtagtcc tttacacatc gttatctttc catggttagc tttcggtcat 60
atgttggctt ccttggaatt ggctgagaga ttggctgctc gtggtcacag agtctccttc 120
gtttccaccc ctagaaacat ctctagatta cgtccagttc caccagcttt agctccattg 180
attgattttg tcgctttgcc attgcctaga gtcgatggtt taccagatgg tgccgaagct 240
acctctgaca ttccaccagg taagaccgaa ttacacttga aggctttgga cggtttggct 300
gctccattcg ccgctttttt ggacgctgcc tgtgctgatg gttccaccaa caaggttgat 360
tggttgtttt tggacaactt ccaatactgg gctgccgctg ccgctgctga tcacaaaatt 420
ccttgcgcct taaacttgac ttttgccgct tccacctccg ctgaatacgg tgttccacgt 480
gttgaaccac cagttgacgg ttccactgcc tccatcttac aaagatttgt cttaacctta 540
gaaaaatgtc aattcgttat ccaaagagct tgtttcgaat tggaacctga accattgcca 600
ttgttgtccg acattttcgg taagccagtc atcccatacg gtttagttcc tccatgtcca 660
ccagctgaag gtcacaaaag agaacacggt aacgctgctt tgtcctggtt ggataagcaa 720
caaccagaat ctgttttgtt catcgctttg ggttctgaac cacctgttac cgtcgaacaa 780
ttgcacgaaa tcgctttggg tttagaattg gccggtacca ccttcttgtg ggccttgaaa 840
aagccaaacg gtttgttgtt agaagccgat ggtgatattt tgccaccagg tttcgaagaa 900
agaactagag atagaggttt agtcgctatg ggttgggttc cacaaccaat tatcttggcc 960
cattcctctg ttggtgcctt tttgactcac ggtggttggg cctccactat tgaaggtgtc 1020
atgtccggtc accctatgtt gttcttaacc ttcttggacg aacaacgtat caacgcccaa 1080
ttgatcgaaa gaaaaaaggc tggtttaaga gtcccaagaa gagaaaagga tggttcctac 1140
gacagacaag gtattgctgg tgctattaga gccgtcatgt gtgaagaaga atctaagtct 1200
gtcttcgctg ctaacgctaa gaaaatgcaa gagatcgttt ctgacagaaa ctgtcaagaa 1260
aagtacatcg acgaattgat tcaaagattg ggttctttcg aaaagtaa 1308
Claims (47)
- 하나 이상의 스테비올 글리코시드(steviol glycoside)를 생산할 수 있는 유전적으로 변형된 사카로마이세스 세레비시아 ( Saccharomyces cerevisiae ) 숙주 세포로서, 상기 숙주 세포는, 서열번호 1에 대해서 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도(sequence identity)를 갖는 아미노산 서열을 포함하는 카우렌 산화효소(kaurene oxidase)를 인코딩하는 이종 핵산(heterologous nucleic acid)을 포함하는 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
- 제1항에 있어서,
30%, 35%, 40%, 45%, 50%, 또는 55%를 초과하는 효율로, 카우렌(kaurene)을 카우레노산(kaurenoic acid)으로 전환할 수 있는 것인, 유전적으로 변형된 사카로 마이세스 세레비시아 숙주 세포.
- 제1항 또는 제2항에 있어서,
상기 카우렌 산화효소는 서열번호 1의 서열을 갖는 아미노산 서열을 포함하는 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
- 제1항 내지 제3항 중 어느 한 항에 있어서,
상기 카우렌 산화효소는 카우렌, 카우레놀(kaurenol), 및/또는 카우레날(kaurenal)의 C19 위치를 산화시킬 수 있는 것인, 유전적으로 변형된 사카로마이 세스 세레비시아 숙주 세포.
- 제1항 내지 제4항 중 어느 한 항에 있어서,
상기 카우렌 산화효소는 이종(heterologous) 핵산에 의해 인코딩되고, 상기 이종 핵산은 서열번호 15에 대해서 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도를 갖는 뉴클레오티드 서열을 포함하는 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
- 제1항 내지 제5항 중 어느 한 항에 있어서,
상기 카우렌 산화효소는 서열번호 15의 서열을 갖는 이종 핵산에 의해 인코딩되는 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
- 제1항 내지 제6항 중 어느 한 항에 있어서,
30%, 35%, 40%, 45%, 50%, 또는 55%를 초과하는 효율로, 카우렌을 카우레노산으로 전환할 수 있고, 상기 카우렌 산화효소는 서열번호 1에 대해서 적어도 95% 서열 일치도를 갖는 아미노산 서열을 포함하는 것인, 유전적으로 변형된 사카로마 이세스 세레비시아 숙주 세포.
- 제1항 내지 제7항 중 어느 한 항에 있어서,
상기 카우렌 산화효소는 서열번호 1의 기능성 도메인(functional domain)에 대해서 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도를 지닌 기능성 도메인을 갖는 폴리펩티드인 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
- 제26항에 있어서,
55%를 초과하는 효율로, 카우렌을 카우레노산으로 전환할 수 있는 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
- 제1항 내지 제9항 중 어느 한 항에 있어서,
카우레노산을 생산할 수 있는 것인, 유전적으로 변형된 사카로마이세스 세레 비시아 숙주 세포.
- 제1항 내지 제10항 중 어느 한 항에 있어서,
스테비올을 생산할 수 있는 것인, 유전적으로 변형된 사카로마이세스 세레비 시아 숙주 세포.
- 제1항 내지 제11항 중 어느 한 항에 있어서,
RebD를 생산할 수 있는 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
- 제1항 내지 제12항 중 어느 한 항에 있어서,
RebM을 생산할 수 있는 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
- 제1항 내지 제13항 중 어느 한 항에 있어서,
RebM과 RebM2를 적어도 10:1, 100:1, 또는 1000:1의 비율로 생산할 수 있는 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
- 제1항 내지 제14항 중 어느 한 항에 있어서,
상기 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포는 검출 불가능한 레벨의 RebM2를 생산하는 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
- 제1항 내지 제15항 중 어느 한 항에 있어서,
상기 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포는, 스테비올을 생성하는 경로의 하나 이상의 효소를 인코딩하는 하나 이상의 이종 핵산을 더 포함하는 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
- 제1항 내지 제16항 중 어느 한 항에 있어서,
상기 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포는, 스테비올 글리코시드를 생성하는 경로의 하나 이상의 효소를 인코딩하는 하나 이상의 이종 핵산을 더 포함하는 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
- 제1항 내지 제17항 중 어느 한 항에 있어서,
상기 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포는, RebA를 생성하는 경로의 하나 이상의 효소를 인코딩하는 하나 이상의 이종 핵산을 더 포함하는 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
- 제1항 내지 제18항 중 어느 한 항에 있어서,
상기 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포는, RebM을 생성하는 경로의 하나 이상의 효소를 인코딩하는 하나 이상의 이종 핵산을 더 포함하는 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
- 제1항 내지 제19항 중 어느 한 항에 있어서,
상기 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포는, RebE를 생성하는 경로의 하나 이상의 효소를 인코딩하는 하나 이상의 이종 핵산을 더 포함하는 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
- 제1항 내지 제20항 중 어느 한 항에 있어서,
상기 경로의 하나 이상의 효소는 제라닐제라닐 디포스페이트 합성효소(geranylgeranyl diphosphate synthase)를 포함하는 것인, 유전적으로 변형된 사 카로마이세스 세레비시아 숙주 세포.
- 제1항 내지 제21항 중 어느 한 항에 있어서,
상기 경로의 하나 이상의 효소는 코팔릴 디포스페이트 합성효소(copalyl diphosphate synthase)를 포함하는 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
- 제1항 내지 제22항 중 어느 한 항에 있어서,
상기 경로의 하나 이상의 효소는 엔트-카우렌 합성효소(ent-kaurene synthase)를 포함하는 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
- 제1항 내지 제23항 중 어느 한 항에 있어서,
상기 경로의 하나 이상의 효소는 카우레노산 수산화효소(kaurenoic acid hydroxylase)를 포함하는 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
- 제1항 내지 제24항 중 어느 한 항에 있어서,
상기 경로의 하나 이상의 효소는 사이토크롬 P450 환원효소(cytochrome P450 reductase)를 포함하는 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
- 제1항 내지 제25항 중 어느 한 항에 있어서,
상기 경로의 하나 이상의 효소는 하나 이상의 우리딘 5'-디포스페이트-의존성 글리코실 전이효소(uridine 5'-diphosphate-dependent glycosyltransferase)를 포함하는 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
- 제1항 내지 제26항 중 어느 한 항에 있어서,
상기 경로의 하나 이상의 효소는 Os_UGT_91C1, Sl_UGT_101249881, UGT40087, sr.UGT_9252778, Bd_UGT10840, Hv_UGT_V1, Bd_UGT10850, 또는 Ob_UGT91B1_like를 포함하는 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
- 제1항 내지 제27항 중 어느 한 항에 있어서,
상기 경로의 하나 이상의 효소는 UGT74G1, UGT76G1, UGT85C2, UGT91D, 또는 UGT40087 또는 이의 변이체를 포함하는 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
- 제1항 내지 제28항 중 어느 한 항에 있어서,
상기 경로의 하나 이상의 효소는 제라닐제라닐 디포스페이트 합성효소, 코팔릴 디포스페이트 합성효소, 엔트-카우렌 합성효소, 카우렌 산화효소, 카우레노산 수산화효소, 사이토크롬 P450 환원효소, UGTAD, UGT74G1, UGT76G1, UGT85C2, 및 UGT91D를 포함하는 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
- 제1항 내지 제29항 중 어느 한 항에 있어서,
상기 경로의 하나 이상의 효소는 제라닐제라닐 디포스페이트 합성효소, 코팔릴 디포스페이트 합성효소, 엔트-카우렌 합성효소, 카우렌 산화효소, 카우레노산 수산화효소, 사이토크롬 P450 환원효소, UGT40087 또는 이의 변이체, UGT74G1, UGT76G1, UGT85C2, 및 UGT91D를 포함하는 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
- 제1항 내지 제30항 중 어느 한 항에 있어서,
상기 UGT40087은 서열번호 17, 18, 또는 33에 따른 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
- 제1항 내지 제31항 중 어느 한 항에 있어서,
상기 경로의 하나 이상의 효소는 이중 기능성 (bifunctional) 코팔릴 디포스페이트 합성효소 및 카우렌 합성효소를 포함하는 것인, 유전적으로 변형된 사카로 마이세스 세레비시아 숙주 세포.
- 제1항 내지 제32항 중 어느 한 항에 있어서,
상기 경로의 하나 이상의 효소를 인코딩하는 하나 이상의 이종 핵산은 단일 전사 조절인자(transcriptional regulator)의 제어하에 있는 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
- 제1항 내지 제33항 중 어느 한 항에 있어서,
상기 경로의 하나 이상의 효소를 인코딩하는 하나 이상의 이종 핵산은 복수의 이종 전사 조절인자의 제어하에 있는 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
- 제1항 내지 제34항 중 어느 한 항에 있어서,
상기 세포는 박테리아 세포, 진균 세포, 조류 세포(algal cell), 곤충 세포, 및 식물 세포로 이루어진 군으로부터 선택되는 것인, 유전적으로 변형된 사카로마 이세스 세레비시아 숙주 세포.
- 제1항 내지 제35항 중 어느 한 항에 있어서,
상기 세포는 효모 세포인 것인, 유전적으로 변형된 사카로마이세스 세레비시아 숙주 세포.
- 제1항 내지 제36항 중 어느 한 항에 있어서,
효모는 사카로마이세스 세레비시아인 것인, 유전적으로 변형된 사카로마이세 스 세레비시아 숙주 세포.
- 하기 단계를 포함하는, 카우레노산을 생산하는 방법:
(a) 탄소 공급원을 지닌 배지에서, RebD의 생성에 적합한 조건하에, 제1항 내지 제37항 중 어느 한 항에 기재된 유전적으로 변형된 사카로마이세스 세레비시 아 숙주 세포의 집단을 배양하는 단계; 및
(b) 상기 배지로부터 상기 카우레노산 화합물을 회수하는 단계(recovering).
- 하기 단계를 포함하는, RebD를 생산하는 방법:
(a) 탄소 공급원을 지닌 배지에서, RebD의 생성에 적합한 조건하에, 제1항 내지 제37항 중 어느 한 항에 기재된 유전적으로 변형된 숙주 세포의 집단을 배양하는 단계; 및
(b) 상기 배지로부터 상기 RebD 화합물을 회수하는 단계;
- 하기 단계를 포함하는, RebM을 생산하는 방법:
(a) 탄소 공급원을 지닌 배지에서, RebM의 생성에 적합한 조건하에, 제1항 내지 제37항 중 어느 한 항에 기재된 유전적으로 변형된 숙주 세포의 집단을 배양하는 단계; 및
(b) 상기 배지로부터 상기 RebM 화합물을 회수하는 단계.
- 하기 단계를 포함하는, 카우레노산을 생산하는 방법:
(a) 카우레노산의 형성에 적합한 조건하에서, 카우렌을 카우레노산으로 전환할 수 있는 제1항 내지 제40항 중 어느 한 항에 기재된 카우렌 산화효소를 카우렌과 접촉시키는 단계; 및
(b) 배지로부터 상기 카우레노산 화합물을 회수하는 단계.
- (a) 하기를 포함하는, 유전적으로 변형된 숙주 세포:
i. 카우렌을 카우레노산으로 전환할 수 있는, 제1항 내지 제41항 중 어느 한 항에 기재된 카우렌 산화효소를 인코딩하는 이종 핵산; 및
(b) 상기 유전적으로 변형된 숙주 세포로부터 생산된 스테비올 글리코시드;를 포함하는 발효 조성물.
- 제42항에 있어서,
상기 스테비올 글리코시드는 RebA, RebD 및 ReM을 적어도 1:7:50의 RebA:RebD:RebM의 비율로 포함하는 것인, 발효 조성물.
- 서열번호 1에 대해서 적어도 80%, 85%, 90%, 또는 95%의 서열 일치도를 갖는, 자연적으로 존재하지 않는 카우렌 산화효소.
- 생체 내에서 30%, 35%, 40%, 45%, 50%, 또는 55%를 초과하는 효율로, 카우렌을 카우레노산으로 전환할 수 있는, 자연적으로 존재하지 않는 카우렌 산화효소.
- 제44항 또는 제45항에 기재된 자연적으로 존재하지 않는 카우렌 산화효소를 인코딩하는, 자연적으로 존재하지 않는 핵산.
- 하기 단계를 포함하는, 스테비올 글리코시드를 생산하는 방법:
(a) 탄소 공급원을 지닌 배지에서, 스테비올 글리코시드의 생성에 적합한 조건하에, 제1항 내지 제37항 중 어느 한 항에 기재된 유전적으로 변형된 숙주 세포의 집단을 배양하는 단계.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762544718P | 2017-08-11 | 2017-08-11 | |
PCT/US2017/046637 WO2018031955A2 (en) | 2016-08-12 | 2017-08-11 | Udp-dependent glycosyltransferase for high efficiency production of rebaudiosides |
US62/544,718 | 2017-08-11 | ||
USPCT/US2017/046637 | 2017-08-11 | ||
PCT/US2018/046359 WO2019033064A1 (en) | 2017-08-11 | 2018-08-10 | KAURENE OXIDASE FROM PISUM SATIVUM FOR HIGH-PERFORMANCE PRODUCTION OF REBAUDIOSIDES |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20200035981A true KR20200035981A (ko) | 2020-04-06 |
Family
ID=65271337
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020207005218A KR20200035981A (ko) | 2017-08-11 | 2018-08-10 | 레바우디오사이드의 고효율 생산을 위한 피숨 사티붐 카우렌 산화효소 |
Country Status (12)
Country | Link |
---|---|
US (1) | US20200165651A1 (ko) |
EP (1) | EP3665287A1 (ko) |
JP (1) | JP7487099B2 (ko) |
KR (1) | KR20200035981A (ko) |
CN (1) | CN111263815A (ko) |
AU (1) | AU2018314249A1 (ko) |
BR (1) | BR112020002708A2 (ko) |
CA (1) | CA3071029A1 (ko) |
MA (1) | MA49836A (ko) |
MX (1) | MX2020001537A (ko) |
SG (1) | SG11202001058TA (ko) |
WO (1) | WO2019033064A1 (ko) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA3031162A1 (en) * | 2016-08-12 | 2018-02-15 | Amyris, Inc. | Udp-dependent glycosyltransferase for high efficiency production of rebaudiosides |
AU2021367159A1 (en) * | 2020-10-22 | 2023-05-04 | Cargill, Incorporated | Microorganisms for diterpene production |
CN112852653A (zh) * | 2021-01-26 | 2021-05-28 | 江南大学 | 从头合成莱鲍迪苷m的酿酒酵母工程菌及其应用 |
CN113881649B (zh) * | 2021-11-15 | 2022-08-02 | 四川大学 | 糖基转移酶OsUGT91C1突变体及其用途 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4760951B2 (ja) | 2009-05-08 | 2011-08-31 | トヨタ自動車株式会社 | ブタノール生産能を有する組換え微生物及びブタノールの製造方法 |
US20100297722A1 (en) * | 2009-05-20 | 2010-11-25 | Board Of Trustees Of Southern Illinois University | Transgenic moss producing terpenoids |
JP5056897B2 (ja) | 2010-05-14 | 2012-10-24 | トヨタ自動車株式会社 | 2−ブタノールの製造方法及び2−ブタノール生産能を有する組換え微生物 |
BR122021005287B1 (pt) * | 2010-06-02 | 2022-02-22 | Evolva, Inc | Hospedeiro recombinante que compreende um gene recombinante para produção de esteviol ou glicosídeo de esteviol |
WO2012135591A2 (en) | 2011-03-30 | 2012-10-04 | Amyris, Inc. | Microbial isoprenoid production using a heterologous dxp pathway |
WO2013022989A2 (en) | 2011-08-08 | 2013-02-14 | Evolva Sa | Recombinant production of steviol glycosides |
US10000783B2 (en) | 2012-03-16 | 2018-06-19 | Suntory Holdings Limited | Steviol glucosyltransferases and genes encoding the same |
US9752174B2 (en) | 2013-05-28 | 2017-09-05 | Purecircle Sdn Bhd | High-purity steviol glycosides |
CA2917699C (en) | 2013-07-31 | 2021-12-07 | Dsm Ip Assets B.V. | Recovery of steviol glycosides |
BR112016002526B1 (pt) | 2013-08-07 | 2021-11-23 | Total Marketing Services | Método para produção de um composto heterólogo não catabólico, e, composição de fermentação |
WO2016023844A1 (en) * | 2014-08-11 | 2016-02-18 | Evolva Sa | Production of steviol glycosides in recombinant hosts |
SG10201901957SA (en) | 2014-09-09 | 2019-04-29 | Evolva Sa | Production of steviol glycosides in recombinant hosts |
CN104726523B (zh) * | 2015-03-28 | 2018-08-10 | 南京工业大学 | 一种酶法制备莱鲍迪苷m的方法 |
CN104745543A (zh) * | 2015-04-07 | 2015-07-01 | 江苏科技大学 | 桑树贝壳杉烯氧化酶MmKO及其应用 |
US10815513B2 (en) | 2015-05-29 | 2020-10-27 | Cargill, Incorporated | Fermentation methods for producing steviol glycosides using high pH and compositions obtained therefrom |
-
2018
- 2018-08-10 JP JP2020502289A patent/JP7487099B2/ja active Active
- 2018-08-10 WO PCT/US2018/046359 patent/WO2019033064A1/en unknown
- 2018-08-10 KR KR1020207005218A patent/KR20200035981A/ko not_active Application Discontinuation
- 2018-08-10 US US16/637,188 patent/US20200165651A1/en active Pending
- 2018-08-10 SG SG11202001058TA patent/SG11202001058TA/en unknown
- 2018-08-10 MA MA049836A patent/MA49836A/fr unknown
- 2018-08-10 CN CN201880051961.1A patent/CN111263815A/zh active Pending
- 2018-08-10 CA CA3071029A patent/CA3071029A1/en active Pending
- 2018-08-10 BR BR112020002708-1A patent/BR112020002708A2/pt unknown
- 2018-08-10 EP EP18756533.8A patent/EP3665287A1/en active Pending
- 2018-08-10 AU AU2018314249A patent/AU2018314249A1/en active Pending
- 2018-08-10 MX MX2020001537A patent/MX2020001537A/es unknown
Also Published As
Publication number | Publication date |
---|---|
SG11202001058TA (en) | 2020-03-30 |
JP7487099B2 (ja) | 2024-05-20 |
WO2019033064A1 (en) | 2019-02-14 |
JP2020533954A (ja) | 2020-11-26 |
BR112020002708A2 (pt) | 2020-08-25 |
US20200165651A1 (en) | 2020-05-28 |
MX2020001537A (es) | 2020-07-13 |
CA3071029A1 (en) | 2019-02-14 |
EP3665287A1 (en) | 2020-06-17 |
RU2020109765A3 (ko) | 2022-04-08 |
CN111263815A (zh) | 2020-06-09 |
AU2018314249A2 (en) | 2020-03-19 |
AU2018314249A1 (en) | 2020-03-05 |
RU2020109765A (ru) | 2021-09-13 |
MA49836A (fr) | 2020-06-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11866738B2 (en) | UDP-dependent glycosyltransferase for high efficiency production of rebaudiosides | |
KR20200035981A (ko) | 레바우디오사이드의 고효율 생산을 위한 피숨 사티붐 카우렌 산화효소 | |
US20210371892A1 (en) | Stevia rebaudiana kaurenoic acid hydroxylase variants for high efficiency production of rebaudiosides | |
US20220282228A1 (en) | Kaurenoic acid 13-hydroxylase (kah) variants and uses thereof | |
RU2795855C2 (ru) | Аbc-транспортеры для высокоэффективного производства ребаудиозидов | |
RU2795550C2 (ru) | Применение кауреноксидазы pisum sativum для высокоэффективного производства ребаудиозидов | |
US20220106619A1 (en) | Abc transporters for the high efficiency production of rebaudiosides | |
RU2777901C2 (ru) | Udp-зависимая гликозилтрансфераза для высокоэффективного продуцирования ребаудиозидов | |
WO2023225604A1 (en) | Compositions and methods for improved production of steviol glycosides |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application | ||
E902 | Notification of reason for refusal |