CN111263815A - 用于高效生成瑞鲍迪苷的豌豆贝壳杉烯氧化酶 - Google Patents
用于高效生成瑞鲍迪苷的豌豆贝壳杉烯氧化酶 Download PDFInfo
- Publication number
- CN111263815A CN111263815A CN201880051961.1A CN201880051961A CN111263815A CN 111263815 A CN111263815 A CN 111263815A CN 201880051961 A CN201880051961 A CN 201880051961A CN 111263815 A CN111263815 A CN 111263815A
- Authority
- CN
- China
- Prior art keywords
- host cell
- seq
- genetically modified
- kaurene
- amino acid
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108010067758 ent-kaurene oxidase Proteins 0.000 title claims abstract description 148
- 229930188195 rebaudioside Natural products 0.000 title description 14
- 102000004190 Enzymes Human genes 0.000 claims abstract description 194
- 108090000790 Enzymes Proteins 0.000 claims abstract description 194
- 238000000034 method Methods 0.000 claims abstract description 116
- RPYRMTHVSUWHSV-CUZJHZIBSA-N rebaudioside D Chemical compound O([C@H]1[C@H](O)[C@@H](CO)O[C@H]([C@@H]1O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)O[C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(=O)O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O RPYRMTHVSUWHSV-CUZJHZIBSA-N 0.000 claims abstract description 102
- 235000019202 steviosides Nutrition 0.000 claims abstract description 85
- 230000037361 pathway Effects 0.000 claims abstract description 62
- 239000002773 nucleotide Substances 0.000 claims abstract description 61
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 61
- 239000004383 Steviol glycoside Substances 0.000 claims abstract description 59
- 235000019411 steviol glycoside Nutrition 0.000 claims abstract description 59
- 229930182488 steviol glycoside Natural products 0.000 claims abstract description 59
- 239000000203 mixture Substances 0.000 claims abstract description 56
- 150000008144 steviol glycosides Chemical class 0.000 claims abstract description 54
- -1 stevioside compound Chemical class 0.000 claims abstract description 38
- UEDUENGHJMELGK-HYDKPPNVSA-N Stevioside Chemical class O([C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(=O)O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O UEDUENGHJMELGK-HYDKPPNVSA-N 0.000 claims abstract description 36
- 238000004519 manufacturing process Methods 0.000 claims abstract description 34
- 210000004027 cell Anatomy 0.000 claims description 410
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 304
- 150000007523 nucleic acids Chemical class 0.000 claims description 152
- 102000039446 nucleic acids Human genes 0.000 claims description 142
- 108020004707 nucleic acids Proteins 0.000 claims description 142
- ONVABDHFQKWOSV-UHFFFAOYSA-N 16-Phyllocladene Natural products C1CC(C2)C(=C)CC32CCC2C(C)(C)CCCC2(C)C31 ONVABDHFQKWOSV-UHFFFAOYSA-N 0.000 claims description 134
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 129
- 229920001184 polypeptide Polymers 0.000 claims description 127
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 127
- ONVABDHFQKWOSV-HPUSYDDDSA-N ent-kaur-16-ene Chemical compound C1C[C@H](C2)C(=C)C[C@@]32CC[C@@H]2C(C)(C)CCC[C@@]2(C)[C@@H]31 ONVABDHFQKWOSV-HPUSYDDDSA-N 0.000 claims description 117
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims description 101
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 claims description 99
- 239000002253 acid Substances 0.000 claims description 87
- 239000002609 medium Substances 0.000 claims description 76
- QFVOYBUQQBFCRH-UHFFFAOYSA-N Steviol Natural products C1CC2(C3)CC(=C)C3(O)CCC2C2(C)C1C(C)(C(O)=O)CCC2 QFVOYBUQQBFCRH-UHFFFAOYSA-N 0.000 claims description 46
- QFVOYBUQQBFCRH-VQSWZGCSSA-N steviol Chemical compound C([C@@]1(O)C(=C)C[C@@]2(C1)CC1)C[C@H]2[C@@]2(C)[C@H]1[C@](C)(C(O)=O)CCC2 QFVOYBUQQBFCRH-VQSWZGCSSA-N 0.000 claims description 46
- 229940032084 steviol Drugs 0.000 claims description 46
- 241000954177 Bangana ariza Species 0.000 claims description 41
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 claims description 37
- 229910052799 carbon Inorganic materials 0.000 claims description 37
- 150000001875 compounds Chemical class 0.000 claims description 30
- 238000000855 fermentation Methods 0.000 claims description 29
- 230000004151 fermentation Effects 0.000 claims description 29
- ONVABDHFQKWOSV-YQXATGRUSA-N ent-Kaur-16-ene Natural products C1C[C@@H](C2)C(=C)C[C@@]32CC[C@@H]2C(C)(C)CCC[C@@]2(C)[C@@H]31 ONVABDHFQKWOSV-YQXATGRUSA-N 0.000 claims description 23
- UIXMIBNGPQGJJJ-UHFFFAOYSA-N ent-kaurene Natural products CC1CC23CCC4C(CCCC4(C)C)C2CCC1C3 UIXMIBNGPQGJJJ-UHFFFAOYSA-N 0.000 claims description 23
- TUJQVRFWMWRMIO-XRNRSJMDSA-N Kaur-16-en-18-ol Chemical compound C1C[C@H](C2)C(=C)C[C@@]32CC[C@@H]2[C@](C)(CO)CCC[C@@]2(C)[C@@H]31 TUJQVRFWMWRMIO-XRNRSJMDSA-N 0.000 claims description 21
- JCAVDWHQNFTFBW-UHFFFAOYSA-N ent-kaurenal Natural products C1CC(C2)C(=C)CC32CCC2C(C)(C=O)CCCC2(C)C31 JCAVDWHQNFTFBW-UHFFFAOYSA-N 0.000 claims description 21
- TUJQVRFWMWRMIO-UHFFFAOYSA-N kaurenol Natural products C1CC(C2)C(=C)CC32CCC2C(C)(CO)CCCC2(C)C31 TUJQVRFWMWRMIO-UHFFFAOYSA-N 0.000 claims description 21
- JCAVDWHQNFTFBW-XRNRSJMDSA-N Kaur-16-en-18-al Chemical compound C1C[C@H](C2)C(=C)C[C@@]32CC[C@@H]2[C@](C)(C=O)CCC[C@@]2(C)[C@@H]31 JCAVDWHQNFTFBW-XRNRSJMDSA-N 0.000 claims description 20
- 239000001963 growth medium Substances 0.000 claims description 18
- DQUHDYWUEKWRLN-UHFFFAOYSA-N Isophyllocladen Natural products C1CC2C3(C)CCCC(C)(C)C3CCC22C=C(C)C1C2 DQUHDYWUEKWRLN-UHFFFAOYSA-N 0.000 claims description 17
- DQUHDYWUEKWRLN-HPUSYDDDSA-N ent-isokaurene Chemical compound C([C@@]1(C)[C@@H]2CC3)CCC(C)(C)[C@H]1CC[C@]21C=C(C)[C@H]3C1 DQUHDYWUEKWRLN-HPUSYDDDSA-N 0.000 claims description 17
- 101100262416 Stevia rebaudiana UGT76G1 gene Proteins 0.000 claims description 15
- 108010066605 Geranylgeranyl-Diphosphate Geranylgeranyltransferase Proteins 0.000 claims description 13
- 240000006365 Vitis vinifera Species 0.000 claims description 13
- 102100039291 Geranylgeranyl pyrophosphate synthase Human genes 0.000 claims description 12
- 101100427140 Stevia rebaudiana UGT74G1 gene Proteins 0.000 claims description 12
- 238000001727 in vivo Methods 0.000 claims description 12
- 108010045510 NADPH-Ferrihemoprotein Reductase Proteins 0.000 claims description 11
- 101100048059 Stevia rebaudiana UGT85C2 gene Proteins 0.000 claims description 11
- JCAIWDXKLCEQEO-PGHZQYBFSA-N 5beta,9alpha,10alpha-labda-8(20),13-dien-15-yl diphosphate Chemical compound CC1(C)CCC[C@@]2(C)[C@H](CCC(/C)=C/COP(O)(=O)OP(O)(O)=O)C(=C)CC[C@@H]21 JCAIWDXKLCEQEO-PGHZQYBFSA-N 0.000 claims description 10
- 238000012258 culturing Methods 0.000 claims description 10
- 241000196324 Embryophyta Species 0.000 claims description 8
- 108700023372 Glycosyltransferases Proteins 0.000 claims description 7
- 230000015572 biosynthetic process Effects 0.000 claims description 7
- XCCTYIAWTASOJW-UHFFFAOYSA-N UDP-Glc Natural products OC1C(O)C(COP(O)(=O)OP(O)(O)=O)OC1N1C(=O)NC(=O)C=C1 XCCTYIAWTASOJW-UHFFFAOYSA-N 0.000 claims description 6
- 108010075920 UDP-galactose translocator Proteins 0.000 claims description 6
- 108010074633 Mixed Function Oxygenases Proteins 0.000 claims description 5
- 102000008109 Mixed Function Oxygenases Human genes 0.000 claims description 5
- XCCTYIAWTASOJW-XVFCMESISA-N Uridine-5'-Diphosphate Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(=O)OP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1 XCCTYIAWTASOJW-XVFCMESISA-N 0.000 claims description 5
- 210000005253 yeast cell Anatomy 0.000 claims description 5
- 230000001580 bacterial effect Effects 0.000 claims description 4
- 241000238631 Hexapoda Species 0.000 claims description 3
- 102000004316 Oxidoreductases Human genes 0.000 claims description 3
- 108090000854 Oxidoreductases Proteins 0.000 claims description 3
- 230000001588 bifunctional effect Effects 0.000 claims description 3
- 230000001419 dependent effect Effects 0.000 claims description 3
- 108010064739 ent-kaurene synthetase B Proteins 0.000 claims description 3
- 230000002538 fungal effect Effects 0.000 claims description 3
- NIKHGUQULKYIGE-UHFFFAOYSA-N kaurenoic acid Natural products C1CC2(CC3=C)CC3CCC2C2(C)C1C(C)(C(O)=O)CCC2 NIKHGUQULKYIGE-UHFFFAOYSA-N 0.000 claims description 3
- 230000001590 oxidative effect Effects 0.000 claims description 3
- NIKHGUQULKYIGE-OTCXFQBHSA-N ent-kaur-16-en-19-oic acid Chemical compound C([C@@H]1C[C@]2(CC1=C)CC1)C[C@H]2[C@@]2(C)[C@H]1[C@](C)(C(O)=O)CCC2 NIKHGUQULKYIGE-OTCXFQBHSA-N 0.000 claims description 2
- 108700014210 glycosyltransferase activity proteins Proteins 0.000 claims description 2
- 102000045442 glycosyltransferase activity proteins Human genes 0.000 claims 1
- 230000002103 transcriptional effect Effects 0.000 claims 1
- 108091008023 transcriptional regulators Proteins 0.000 claims 1
- 235000010582 Pisum sativum Nutrition 0.000 abstract description 75
- 240000004713 Pisum sativum Species 0.000 abstract description 74
- 108091028043 Nucleic acid sequence Proteins 0.000 abstract description 31
- OHHNJQXIOPOJSC-UHFFFAOYSA-N stevioside Natural products CC1(CCCC2(C)C3(C)CCC4(CC3(CCC12C)CC4=C)OC5OC(CO)C(O)C(O)C5OC6OC(CO)C(O)C(O)C6O)C(=O)OC7OC(CO)C(O)C(O)C7O OHHNJQXIOPOJSC-UHFFFAOYSA-N 0.000 abstract description 26
- 229940013618 stevioside Drugs 0.000 abstract description 26
- GSGVXNMGMKBGQU-PHESRWQRSA-N rebaudioside M Chemical compound C[C@@]12CCC[C@](C)([C@H]1CC[C@@]13CC(=C)[C@@](C1)(CC[C@@H]23)O[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O[C@@H]2O[C@H](CO)[C@@H](O)[C@H](O)[C@H]2O)[C@H]1O[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O)C(=O)O[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O[C@@H]2O[C@H](CO)[C@@H](O)[C@H](O)[C@H]2O)[C@H]1O[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O GSGVXNMGMKBGQU-PHESRWQRSA-N 0.000 abstract description 9
- 241000219843 Pisum Species 0.000 abstract 1
- 229940088598 enzyme Drugs 0.000 description 175
- 235000000346 sugar Nutrition 0.000 description 73
- 235000001014 amino acid Nutrition 0.000 description 65
- 108090000623 proteins and genes Proteins 0.000 description 64
- ZSLZBFCDCINBPY-ZSJPKINUSA-N acetyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 ZSLZBFCDCINBPY-ZSJPKINUSA-N 0.000 description 60
- 238000006243 chemical reaction Methods 0.000 description 50
- 102000004286 Hydroxymethylglutaryl CoA Reductases Human genes 0.000 description 45
- 108090000895 Hydroxymethylglutaryl CoA Reductases Proteins 0.000 description 45
- 230000000694 effects Effects 0.000 description 37
- 229940024606 amino acid Drugs 0.000 description 35
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 34
- 210000004899 c-terminal region Anatomy 0.000 description 30
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 28
- 244000228451 Stevia rebaudiana Species 0.000 description 28
- 239000008103 glucose Substances 0.000 description 27
- 235000006092 Stevia rebaudiana Nutrition 0.000 description 26
- 238000006467 substitution reaction Methods 0.000 description 25
- KJTLQQUUPVSXIM-ZCFIWIBFSA-N (R)-mevalonic acid Chemical compound OCC[C@](O)(C)CC(O)=O KJTLQQUUPVSXIM-ZCFIWIBFSA-N 0.000 description 24
- 239000000047 product Substances 0.000 description 24
- OJFDKHTZOUZBOS-CITAKDKDSA-N acetoacetyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)CC(=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 OJFDKHTZOUZBOS-CITAKDKDSA-N 0.000 description 23
- 150000001413 amino acids Chemical class 0.000 description 23
- 108020004705 Codon Proteins 0.000 description 22
- 244000005700 microbiome Species 0.000 description 22
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 21
- KJTLQQUUPVSXIM-UHFFFAOYSA-N DL-mevalonic acid Natural products OCCC(O)(C)CC(O)=O KJTLQQUUPVSXIM-UHFFFAOYSA-N 0.000 description 20
- 108030002854 Acetoacetyl-CoA synthases Proteins 0.000 description 19
- 241000235070 Saccharomyces Species 0.000 description 18
- 235000018102 proteins Nutrition 0.000 description 18
- 102000004169 proteins and genes Human genes 0.000 description 18
- NUHSROFQTUXZQQ-UHFFFAOYSA-N isopentenyl diphosphate Chemical compound CC(=C)CCO[P@](O)(=O)OP(O)(O)=O NUHSROFQTUXZQQ-UHFFFAOYSA-N 0.000 description 17
- 108091033319 polynucleotide Proteins 0.000 description 17
- 102000040430 polynucleotide Human genes 0.000 description 17
- 239000002157 polynucleotide Substances 0.000 description 17
- 241000219195 Arabidopsis thaliana Species 0.000 description 16
- 241000589516 Pseudomonas Species 0.000 description 16
- RMUAUSHZJJJLAG-UHFFFAOYSA-N iso-kaurenoic acid Natural products C1CC2C3(C)CCCC(C)(C(O)=O)C3CCC22C=C(C)C1C2 RMUAUSHZJJJLAG-UHFFFAOYSA-N 0.000 description 16
- 238000004113 cell culture Methods 0.000 description 15
- 238000003780 insertion Methods 0.000 description 15
- 230000037431 insertion Effects 0.000 description 15
- 241000187747 Streptomyces Species 0.000 description 14
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 14
- 230000012010 growth Effects 0.000 description 14
- 229910052757 nitrogen Inorganic materials 0.000 description 14
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical group NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 description 13
- VWFJDQUYCIWHTN-YFVJMOTDSA-N 2-trans,6-trans-farnesyl diphosphate Chemical compound CC(C)=CCC\C(C)=C\CC\C(C)=C\CO[P@](O)(=O)OP(O)(O)=O VWFJDQUYCIWHTN-YFVJMOTDSA-N 0.000 description 13
- VWFJDQUYCIWHTN-UHFFFAOYSA-N Farnesyl pyrophosphate Natural products CC(C)=CCCC(C)=CCCC(C)=CCOP(O)(=O)OP(O)(O)=O VWFJDQUYCIWHTN-UHFFFAOYSA-N 0.000 description 13
- 238000007792 addition Methods 0.000 description 13
- OINNEUNVOZHBOX-QIRCYJPOSA-K 2-trans,6-trans,10-trans-geranylgeranyl diphosphate(3-) Chemical compound CC(C)=CCC\C(C)=C\CC\C(C)=C\CC\C(C)=C\COP([O-])(=O)OP([O-])([O-])=O OINNEUNVOZHBOX-QIRCYJPOSA-K 0.000 description 12
- 241000588724 Escherichia coli Species 0.000 description 12
- OINNEUNVOZHBOX-XBQSVVNOSA-N Geranylgeranyl diphosphate Natural products [P@](=O)(OP(=O)(O)O)(OC/C=C(\CC/C=C(\CC/C=C(\CC/C=C(\C)/C)/C)/C)/C)O OINNEUNVOZHBOX-XBQSVVNOSA-N 0.000 description 12
- 125000000539 amino acid group Chemical group 0.000 description 12
- 240000008474 Pimenta dioica Species 0.000 description 11
- 235000006990 Pimenta dioica Nutrition 0.000 description 11
- 238000012217 deletion Methods 0.000 description 11
- 230000037430 deletion Effects 0.000 description 11
- 230000003647 oxidation Effects 0.000 description 11
- 238000007254 oxidation reaction Methods 0.000 description 11
- CBIDRCWHNCKSTO-UHFFFAOYSA-N prenyl diphosphate Chemical compound CC(C)=CCO[P@](O)(=O)OP(O)(O)=O CBIDRCWHNCKSTO-UHFFFAOYSA-N 0.000 description 11
- JSNRRGGBADWTMC-UHFFFAOYSA-N (6E)-7,11-dimethyl-3-methylene-1,6,10-dodecatriene Chemical compound CC(C)=CCCC(C)=CCCC(=C)C=C JSNRRGGBADWTMC-UHFFFAOYSA-N 0.000 description 10
- 101100351811 Caenorhabditis elegans pgal-1 gene Proteins 0.000 description 10
- 229910019142 PO4 Inorganic materials 0.000 description 10
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 10
- 230000035772 mutation Effects 0.000 description 10
- 235000021317 phosphate Nutrition 0.000 description 10
- 241000193830 Bacillus <bacterium> Species 0.000 description 9
- 241000235649 Kluyveromyces Species 0.000 description 9
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 9
- 239000010452 phosphate Substances 0.000 description 9
- CABVTRNMFUVUDM-VRHQGPGLSA-N (3S)-3-hydroxy-3-methylglutaryl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)C[C@@](O)(CC(O)=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 CABVTRNMFUVUDM-VRHQGPGLSA-N 0.000 description 8
- 241000282414 Homo sapiens Species 0.000 description 8
- LTYOQGRJFJAKNA-KKIMTKSISA-N Malonyl CoA Natural products S(C(=O)CC(=O)O)CCNC(=O)CCNC(=O)[C@@H](O)C(CO[P@](=O)(O[P@](=O)(OC[C@H]1[C@@H](OP(=O)(O)O)[C@@H](O)[C@@H](n2c3ncnc(N)c3nc2)O1)O)O)(C)C LTYOQGRJFJAKNA-KKIMTKSISA-N 0.000 description 8
- 241000191967 Staphylococcus aureus Species 0.000 description 8
- 230000002068 genetic effect Effects 0.000 description 8
- 230000001965 increasing effect Effects 0.000 description 8
- LTYOQGRJFJAKNA-DVVLENMVSA-N malonyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)CC(O)=O)O[C@H]1N1C2=NC=NC(N)=C2N=C1 LTYOQGRJFJAKNA-DVVLENMVSA-N 0.000 description 8
- 230000002441 reversible effect Effects 0.000 description 8
- 239000000243 solution Substances 0.000 description 8
- QSIDJGUAAUSPMG-CULFPKEHSA-N steviolmonoside Chemical compound O([C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(O)=O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O QSIDJGUAAUSPMG-CULFPKEHSA-N 0.000 description 8
- 108020004414 DNA Proteins 0.000 description 7
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 7
- 102000002932 Thiolase Human genes 0.000 description 7
- 108060008225 Thiolase Proteins 0.000 description 7
- XJLXINKUBYWONI-DQQFMEOOSA-N [[(2r,3r,4r,5r)-5-(6-aminopurin-9-yl)-3-hydroxy-4-phosphonooxyoxolan-2-yl]methoxy-hydroxyphosphoryl] [(2s,3r,4s,5s)-5-(3-carbamoylpyridin-1-ium-1-yl)-3,4-dihydroxyoxolan-2-yl]methyl phosphate Chemical compound NC(=O)C1=CC=C[N+]([C@@H]2[C@H]([C@@H](O)[C@H](COP([O-])(=O)OP(O)(=O)OC[C@@H]3[C@H]([C@@H](OP(O)(O)=O)[C@@H](O3)N3C4=NC=NC(N)=C4N=C3)O)O2)O)=C1 XJLXINKUBYWONI-DQQFMEOOSA-N 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 239000011777 magnesium Substances 0.000 description 7
- 229910052749 magnesium Inorganic materials 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 7
- 229930027945 nicotinamide-adenine dinucleotide Natural products 0.000 description 7
- 235000015097 nutrients Nutrition 0.000 description 7
- GHOKWGTUZJEAQD-ZETCQYMHSA-N (D)-(+)-Pantothenic acid Chemical compound OCC(C)(C)[C@@H](O)C(=O)NCCC(O)=O GHOKWGTUZJEAQD-ZETCQYMHSA-N 0.000 description 6
- OKZYCXHTTZZYSK-ZCFIWIBFSA-N (R)-5-phosphomevalonic acid Chemical compound OC(=O)C[C@@](O)(C)CCOP(O)(O)=O OKZYCXHTTZZYSK-ZCFIWIBFSA-N 0.000 description 6
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 6
- 241001600125 Delftia acidovorans Species 0.000 description 6
- BDAGIHXWWSANSR-UHFFFAOYSA-N Formic acid Chemical compound OC=O BDAGIHXWWSANSR-UHFFFAOYSA-N 0.000 description 6
- 102000051366 Glycosyltransferases Human genes 0.000 description 6
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 6
- 108700023175 Phosphate acetyltransferases Proteins 0.000 description 6
- 241001453299 Pseudomonas mevalonii Species 0.000 description 6
- 241000316848 Rhodococcus <scale insect> Species 0.000 description 6
- 102000004357 Transferases Human genes 0.000 description 6
- 108090000992 Transferases Proteins 0.000 description 6
- 238000003556 assay Methods 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 6
- 230000001627 detrimental effect Effects 0.000 description 6
- 230000004907 flux Effects 0.000 description 6
- 229910052751 metal Inorganic materials 0.000 description 6
- 239000002184 metal Substances 0.000 description 6
- 150000002739 metals Chemical class 0.000 description 6
- 239000012074 organic phase Substances 0.000 description 6
- 150000003839 salts Chemical class 0.000 description 6
- 238000002864 sequence alignment Methods 0.000 description 6
- CXENHBSYCFFKJS-UHFFFAOYSA-N (3E,6E)-3,7,11-Trimethyl-1,3,6,10-dodecatetraene Natural products CC(C)=CCCC(C)=CCC=C(C)C=C CXENHBSYCFFKJS-UHFFFAOYSA-N 0.000 description 5
- 241000219194 Arabidopsis Species 0.000 description 5
- 235000001405 Artemisia annua Nutrition 0.000 description 5
- 240000000011 Artemisia annua Species 0.000 description 5
- 244000063299 Bacillus subtilis Species 0.000 description 5
- 235000014469 Bacillus subtilis Nutrition 0.000 description 5
- 241000894006 Bacteria Species 0.000 description 5
- 102100029398 Calpain small subunit 1 Human genes 0.000 description 5
- 101710131373 Calpain small subunit 1 Proteins 0.000 description 5
- 241000193403 Clostridium Species 0.000 description 5
- 241000186216 Corynebacterium Species 0.000 description 5
- 101710120485 Cyclo(L-leucyl-L-leucyl) synthase Proteins 0.000 description 5
- 101710116120 Cyclo(L-tyrosyl-L-tyrosyl) synthase Proteins 0.000 description 5
- 101150094690 GAL1 gene Proteins 0.000 description 5
- 102100028501 Galanin peptides Human genes 0.000 description 5
- 101100121078 Homo sapiens GAL gene Proteins 0.000 description 5
- 244000285963 Kluyveromyces fragilis Species 0.000 description 5
- 241000320412 Ogataea angusta Species 0.000 description 5
- 241000235648 Pichia Species 0.000 description 5
- 241000039796 Pythia Species 0.000 description 5
- 241000191043 Rhodobacter sphaeroides Species 0.000 description 5
- 241000223252 Rhodotorula Species 0.000 description 5
- YWPVROCHNBYFTP-UHFFFAOYSA-N Rubusoside Natural products C1CC2C3(C)CCCC(C)(C(=O)OC4C(C(O)C(O)C(CO)O4)O)C3CCC2(C2)CC(=C)C21OC1OC(CO)C(O)C(O)C1O YWPVROCHNBYFTP-UHFFFAOYSA-N 0.000 description 5
- 241000607142 Salmonella Species 0.000 description 5
- 241000607768 Shigella Species 0.000 description 5
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 5
- 229930009668 farnesene Natural products 0.000 description 5
- 125000002791 glucosyl group Chemical group C1([C@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 5
- 239000003550 marker Substances 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 5
- 108020004999 messenger RNA Proteins 0.000 description 5
- 239000012071 phase Substances 0.000 description 5
- 230000001105 regulatory effect Effects 0.000 description 5
- 238000012216 screening Methods 0.000 description 5
- 241000894007 species Species 0.000 description 5
- 239000000758 substrate Substances 0.000 description 5
- 229910021654 trace metal Inorganic materials 0.000 description 5
- 230000009466 transformation Effects 0.000 description 5
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 5
- 229940045145 uridine Drugs 0.000 description 5
- 244000178606 Abies grandis Species 0.000 description 4
- 235000017894 Abies grandis Nutrition 0.000 description 4
- 241000203069 Archaea Species 0.000 description 4
- 241000589174 Bradyrhizobium japonicum Species 0.000 description 4
- 108091026890 Coding region Proteins 0.000 description 4
- 108700010070 Codon Usage Proteins 0.000 description 4
- 241000221778 Fusarium fujikuroi Species 0.000 description 4
- 229930191978 Gibberellin Natural products 0.000 description 4
- 101000773364 Homo sapiens Beta-alanine-activating enzyme Proteins 0.000 description 4
- 235000014663 Kluyveromyces fragilis Nutrition 0.000 description 4
- 241001138401 Kluyveromyces lactis Species 0.000 description 4
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 4
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical group CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 4
- 241001671311 Laurus Species 0.000 description 4
- 241000221960 Neurospora Species 0.000 description 4
- 240000007594 Oryza sativa Species 0.000 description 4
- 235000007164 Oryza sativa Nutrition 0.000 description 4
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 4
- 241000379619 Ruegeria Species 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- OMHUCGDTACNQEX-OSHKXICASA-N Steviolbioside Natural products O([C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(O)=O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O OMHUCGDTACNQEX-OSHKXICASA-N 0.000 description 4
- 241000187433 Streptomyces clavuligerus Species 0.000 description 4
- 229930006000 Sucrose Natural products 0.000 description 4
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 4
- 101150050575 URA3 gene Proteins 0.000 description 4
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Chemical group CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 4
- 240000008042 Zea mays Species 0.000 description 4
- 241000235017 Zygosaccharomyces Species 0.000 description 4
- 230000003115 biocidal effect Effects 0.000 description 4
- 239000002738 chelating agent Substances 0.000 description 4
- JLPRGBMUVNVSKP-AHUXISJXSA-M chembl2368336 Chemical compound [Na+].O([C@H]1[C@@H](O)[C@H](O)[C@H](CO)O[C@H]1O[C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C([O-])=O)[C@@H]1O[C@@H](CO)[C@@H](O)[C@H](O)[C@@H]1O JLPRGBMUVNVSKP-AHUXISJXSA-M 0.000 description 4
- 238000004587 chromatography analysis Methods 0.000 description 4
- IXORZMNAPKEEDV-UHFFFAOYSA-N gibberellic acid GA3 Natural products OC(=O)C1C2(C3)CC(=C)C3(O)CCC2C2(C=CC3O)C1C3(C)C(=O)O2 IXORZMNAPKEEDV-UHFFFAOYSA-N 0.000 description 4
- 239000003448 gibberellin Substances 0.000 description 4
- 230000001939 inductive effect Effects 0.000 description 4
- 239000000543 intermediate Substances 0.000 description 4
- 238000002955 isolation Methods 0.000 description 4
- 235000019161 pantothenic acid Nutrition 0.000 description 4
- 239000011713 pantothenic acid Substances 0.000 description 4
- YWPVROCHNBYFTP-OSHKXICASA-N rubusoside Chemical compound O([C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(=O)O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O YWPVROCHNBYFTP-OSHKXICASA-N 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- 239000005720 sucrose Substances 0.000 description 4
- 239000004474 valine Chemical group 0.000 description 4
- 229940088594 vitamin Drugs 0.000 description 4
- 235000013343 vitamin Nutrition 0.000 description 4
- 239000011782 vitamin Substances 0.000 description 4
- 229930003231 vitamin Natural products 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- GGKNTGJPGZQNID-UHFFFAOYSA-N (1-$l^{1}-oxidanyl-2,2,6,6-tetramethylpiperidin-4-yl)-trimethylazanium Chemical compound CC1(C)CC([N+](C)(C)C)CC(C)(C)N1[O] GGKNTGJPGZQNID-UHFFFAOYSA-N 0.000 description 3
- 101710163881 5,6-dihydroxyindole-2-carboxylic acid oxidase Proteins 0.000 description 3
- 102100039601 ARF GTPase-activating protein GIT1 Human genes 0.000 description 3
- 101710194905 ARF GTPase-activating protein GIT1 Proteins 0.000 description 3
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 3
- 241000607620 Aliivibrio fischeri Species 0.000 description 3
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 3
- 102100030981 Beta-alanine-activating enzyme Human genes 0.000 description 3
- 239000002028 Biomass Substances 0.000 description 3
- 241000186146 Brevibacterium Species 0.000 description 3
- 241000235172 Bullera Species 0.000 description 3
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 3
- 241001527609 Cryptococcus Species 0.000 description 3
- 102000057412 Diphosphomevalonate decarboxylases Human genes 0.000 description 3
- 241000588914 Enterobacter Species 0.000 description 3
- 241001465321 Eremothecium Species 0.000 description 3
- XEKOWRVHYACXOJ-UHFFFAOYSA-N Ethyl acetate Chemical compound CCOC(C)=O XEKOWRVHYACXOJ-UHFFFAOYSA-N 0.000 description 3
- 241000223218 Fusarium Species 0.000 description 3
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 101100246753 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) pyrF gene Proteins 0.000 description 3
- 244000043261 Hevea brasiliensis Species 0.000 description 3
- 101710081758 High affinity cationic amino acid transporter 1 Proteins 0.000 description 3
- 102000002284 Hydroxymethylglutaryl-CoA Synthase Human genes 0.000 description 3
- 108010000775 Hydroxymethylglutaryl-CoA synthase Proteins 0.000 description 3
- 101150094051 KO gene Proteins 0.000 description 3
- 241000235058 Komagataella pastoris Species 0.000 description 3
- 241001149698 Lipomyces Species 0.000 description 3
- 241000227653 Lycopersicon Species 0.000 description 3
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 3
- 108700040132 Mevalonate kinases Proteins 0.000 description 3
- 101000958834 Neosartorya fumigata (strain ATCC MYA-4609 / Af293 / CBS 101355 / FGSC A1100) Diphosphomevalonate decarboxylase mvd1 Proteins 0.000 description 3
- 101000958925 Panax ginseng Diphosphomevalonate decarboxylase 1 Proteins 0.000 description 3
- 102100024279 Phosphomevalonate kinase Human genes 0.000 description 3
- 241000235645 Pichia kudriavzevii Species 0.000 description 3
- KWYUFKZDYYNOTN-UHFFFAOYSA-M Potassium hydroxide Chemical compound [OH-].[K+] KWYUFKZDYYNOTN-UHFFFAOYSA-M 0.000 description 3
- 241000589776 Pseudomonas putida Species 0.000 description 3
- 235000018368 Saccharomyces fragilis Nutrition 0.000 description 3
- 241000293871 Salmonella enterica subsp. enterica serovar Typhi Species 0.000 description 3
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 3
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- 241000194017 Streptococcus Species 0.000 description 3
- 241000194019 Streptococcus mutans Species 0.000 description 3
- 241000193996 Streptococcus pyogenes Species 0.000 description 3
- 241000204667 Thermoplasma Species 0.000 description 3
- 241000235006 Torulaspora Species 0.000 description 3
- 241000223259 Trichoderma Species 0.000 description 3
- 241000223230 Trichosporon Species 0.000 description 3
- 150000007513 acids Chemical class 0.000 description 3
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 3
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 3
- 235000011130 ammonium sulphate Nutrition 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 229960005069 calcium Drugs 0.000 description 3
- 239000011575 calcium Substances 0.000 description 3
- 229910052791 calcium Inorganic materials 0.000 description 3
- 235000001465 calcium Nutrition 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 230000010261 cell growth Effects 0.000 description 3
- 230000020176 deacylation Effects 0.000 description 3
- 238000005947 deacylation reaction Methods 0.000 description 3
- 235000011180 diphosphates Nutrition 0.000 description 3
- 230000009483 enzymatic pathway Effects 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- GVVPGTZRZFNKDS-JXMROGBWSA-N geranyl diphosphate Chemical compound CC(C)=CCC\C(C)=C\CO[P@](O)(=O)OP(O)(O)=O GVVPGTZRZFNKDS-JXMROGBWSA-N 0.000 description 3
- 235000013922 glutamic acid Nutrition 0.000 description 3
- 239000004220 glutamic acid Substances 0.000 description 3
- 238000000338 in vitro Methods 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 229960000310 isoleucine Drugs 0.000 description 3
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 3
- 229940031154 kluyveromyces marxianus Drugs 0.000 description 3
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 3
- 102000002678 mevalonate kinase Human genes 0.000 description 3
- 230000000813 microbial effect Effects 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 108091000116 phosphomevalonate kinase Proteins 0.000 description 3
- 229920001195 polyisoprene Polymers 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000011002 quantification Methods 0.000 description 3
- 238000011084 recovery Methods 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 239000002904 solvent Substances 0.000 description 3
- 238000000638 solvent extraction Methods 0.000 description 3
- 239000011550 stock solution Substances 0.000 description 3
- 238000006177 thiolation reaction Methods 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- RLMLFADXHJLPSQ-NPPFTVEMSA-N (3s,6s,9s,12s,15s,18s,21s,24r,27s)-3,6-dibenzyl-12,24-bis[(2r)-butan-2-yl]-15-(2-hydroxypropan-2-yl)-4,10,16,22-tetramethyl-18-(2-methylpropyl)-9,21-di(propan-2-yl)-13-oxa-1,4,7,10,16,19,22,25-octazabicyclo[25.3.0]triacontane-2,5,8,11,14,17,20,23,26-nonon Chemical compound C([C@H]1C(=O)N2CCC[C@H]2C(=O)N[C@@H](C(N(C)[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N(C)[C@H](C(=O)O[C@H](C(=O)N(C)[C@@H](C(C)C)C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N1C)[C@H](C)CC)C(C)(C)O)=O)[C@H](C)CC)C1=CC=CC=C1 RLMLFADXHJLPSQ-NPPFTVEMSA-N 0.000 description 2
- OYIFNHCXNCRBQI-UHFFFAOYSA-N 2-aminoadipic acid Chemical compound OC(=O)C(N)CCCC(O)=O OYIFNHCXNCRBQI-UHFFFAOYSA-N 0.000 description 2
- OSWFIVFLDKOXQC-UHFFFAOYSA-N 4-(3-methoxyphenyl)aniline Chemical compound COC1=CC=CC(C=2C=CC(N)=CC=2)=C1 OSWFIVFLDKOXQC-UHFFFAOYSA-N 0.000 description 2
- ZHBXLZQQVCDGPA-UHFFFAOYSA-N 5-[(1,3-dioxo-2-benzofuran-5-yl)sulfonyl]-2-benzofuran-1,3-dione Chemical compound C1=C2C(=O)OC(=O)C2=CC(S(=O)(=O)C=2C=C3C(=O)OC(C3=CC=2)=O)=C1 ZHBXLZQQVCDGPA-UHFFFAOYSA-N 0.000 description 2
- SEHFUALWMUWDKS-UHFFFAOYSA-N 5-fluoroorotic acid Chemical compound OC(=O)C=1NC(=O)NC(=O)C=1F SEHFUALWMUWDKS-UHFFFAOYSA-N 0.000 description 2
- 241000567147 Aeropyrum Species 0.000 description 2
- 241000567139 Aeropyrum pernix Species 0.000 description 2
- 108700028369 Alleles Proteins 0.000 description 2
- VHUUQVKOLVNVRT-UHFFFAOYSA-N Ammonium hydroxide Chemical compound [NH4+].[OH-] VHUUQVKOLVNVRT-UHFFFAOYSA-N 0.000 description 2
- 240000001436 Antirrhinum majus Species 0.000 description 2
- 101100433757 Arabidopsis thaliana ABCG32 gene Proteins 0.000 description 2
- 241000205042 Archaeoglobus fulgidus Species 0.000 description 2
- 239000004475 Arginine Substances 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- 241000228212 Aspergillus Species 0.000 description 2
- 241000193744 Bacillus amyloliquefaciens Species 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 2
- 241000722885 Brettanomyces Species 0.000 description 2
- 240000001829 Catharanthus roseus Species 0.000 description 2
- GHOKWGTUZJEAQD-UHFFFAOYSA-N Chick antidermatitis factor Natural products OCC(C)(C)C(O)C(=O)NCCC(O)=O GHOKWGTUZJEAQD-UHFFFAOYSA-N 0.000 description 2
- 241000186145 Corynebacterium ammoniagenes Species 0.000 description 2
- 241000235646 Cyberlindnera jadinii Species 0.000 description 2
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 2
- SRBFZHDQGSBBOR-IOVATXLUSA-N D-xylopyranose Chemical compound O[C@@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-IOVATXLUSA-N 0.000 description 2
- 241000235035 Debaryomyces Species 0.000 description 2
- 241000255601 Drosophila melanogaster Species 0.000 description 2
- 239000001512 FEMA 4601 Substances 0.000 description 2
- 241000605986 Fusobacterium nucleatum Species 0.000 description 2
- 101150038242 GAL10 gene Proteins 0.000 description 2
- 102100024637 Galectin-10 Human genes 0.000 description 2
- 241000589232 Gluconobacter oxydans Species 0.000 description 2
- 102000000340 Glucosyltransferases Human genes 0.000 description 2
- 108010055629 Glucosyltransferases Proteins 0.000 description 2
- 241000205062 Halobacterium Species 0.000 description 2
- 241001149669 Hanseniaspora Species 0.000 description 2
- 244000020551 Helianthus annuus Species 0.000 description 2
- 235000003222 Helianthus annuus Nutrition 0.000 description 2
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 2
- 108010065958 Isopentenyl-diphosphate Delta-isomerase Proteins 0.000 description 2
- 241000588747 Klebsiella pneumoniae Species 0.000 description 2
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 2
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- 241000186660 Lactobacillus Species 0.000 description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Chemical group CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 2
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 2
- 239000004472 Lysine Substances 0.000 description 2
- 241000555676 Malassezia Species 0.000 description 2
- 241000589195 Mesorhizobium loti Species 0.000 description 2
- 241000202974 Methanobacterium Species 0.000 description 2
- 241000203407 Methanocaldococcus jannaschii Species 0.000 description 2
- 241000203353 Methanococcus Species 0.000 description 2
- 241001302042 Methanothermobacter thermautotrophicus Species 0.000 description 2
- 241000235048 Meyerozyma guilliermondii Species 0.000 description 2
- 241000191938 Micrococcus luteus Species 0.000 description 2
- 101100278853 Mus musculus Dhfr gene Proteins 0.000 description 2
- 241000588652 Neisseria gonorrhoeae Species 0.000 description 2
- 241000233892 Neocallimastix Species 0.000 description 2
- 101100054296 Oryza sativa subsp. japonica ABCG37 gene Proteins 0.000 description 2
- 101100107593 Oryza sativa subsp. japonica ABCG40 gene Proteins 0.000 description 2
- 241000588912 Pantoea agglomerans Species 0.000 description 2
- 241000588696 Pantoea ananatis Species 0.000 description 2
- 241001057811 Paracoccus <mealybug> Species 0.000 description 2
- 108010009736 Protein Hydrolysates Proteins 0.000 description 2
- 241000589517 Pseudomonas aeruginosa Species 0.000 description 2
- 241000205160 Pyrococcus Species 0.000 description 2
- HELXLJCILKEWJH-SEAGSNCFSA-N Rebaudioside A Natural products O=C(O[C@H]1[C@@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1)[C@@]1(C)[C@@H]2[C@](C)([C@H]3[C@@]4(CC(=C)[C@@](O[C@H]5[C@H](O[C@H]6[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O6)[C@@H](O[C@H]6[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O6)[C@H](O)[C@@H](CO)O5)(C4)CC3)CC2)CCC1 HELXLJCILKEWJH-SEAGSNCFSA-N 0.000 description 2
- 241000589180 Rhizobium Species 0.000 description 2
- 241000191023 Rhodobacter capsulatus Species 0.000 description 2
- 101150037481 SMR1 gene Proteins 0.000 description 2
- 101100491255 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) YAP1 gene Proteins 0.000 description 2
- 241000582914 Saccharomyces uvarum Species 0.000 description 2
- 241000293869 Salmonella enterica subsp. enterica serovar Typhimurium Species 0.000 description 2
- 241000235346 Schizosaccharomyces Species 0.000 description 2
- 241000311088 Schwanniomyces Species 0.000 description 2
- 240000003705 Senecio vulgaris Species 0.000 description 2
- 235000002595 Solanum tuberosum Nutrition 0.000 description 2
- 244000061456 Solanum tuberosum Species 0.000 description 2
- 241000228389 Sporidiobolus Species 0.000 description 2
- 241000222068 Sporobolomyces <Sporidiobolaceae> Species 0.000 description 2
- 241000191940 Staphylococcus Species 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- 241000958215 Streptomyces filamentosus Species 0.000 description 2
- 241000187310 Streptomyces noursei Species 0.000 description 2
- 241000205101 Sulfolobus Species 0.000 description 2
- 241000205098 Sulfolobus acidocaldarius Species 0.000 description 2
- QAOWNCQODCNURD-UHFFFAOYSA-N Sulfuric acid Chemical compound OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 2
- 241001453296 Synechococcus elongatus Species 0.000 description 2
- 241000204673 Thermoplasma acidophilum Species 0.000 description 2
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 2
- 239000004473 Threonine Substances 0.000 description 2
- 241001480014 Trigonopsis Species 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- 241000221566 Ustilago Species 0.000 description 2
- 235000007212 Verbena X moechina Moldenke Nutrition 0.000 description 2
- 240000001519 Verbena officinalis Species 0.000 description 2
- 235000001594 Verbena polystachya Kunth Nutrition 0.000 description 2
- 235000007200 Verbena x perriana Moldenke Nutrition 0.000 description 2
- 235000002270 Verbena x stuprosa Moldenke Nutrition 0.000 description 2
- 241000235015 Yarrowia lipolytica Species 0.000 description 2
- 235000007244 Zea mays Nutrition 0.000 description 2
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 2
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 2
- 241000588901 Zymomonas Species 0.000 description 2
- 241000588902 Zymomonas mobilis Species 0.000 description 2
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 2
- 239000000908 ammonium hydroxide Substances 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 235000003704 aspartic acid Nutrition 0.000 description 2
- 108010008887 aureobasidin A Proteins 0.000 description 2
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 2
- 230000003197 catalytic effect Effects 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000006482 condensation reaction Methods 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- XPPKVPWEQAFLFU-UHFFFAOYSA-N diphosphoric acid Chemical compound OP(O)(=O)OP(O)(O)=O XPPKVPWEQAFLFU-UHFFFAOYSA-N 0.000 description 2
- 150000002016 disaccharides Chemical class 0.000 description 2
- 238000004821 distillation Methods 0.000 description 2
- SNRUBQQJIBEYMU-UHFFFAOYSA-N dodecane Chemical compound CCCCCCCCCCCC SNRUBQQJIBEYMU-UHFFFAOYSA-N 0.000 description 2
- HELXLJCILKEWJH-UHFFFAOYSA-N entered according to Sigma 01432 Natural products C1CC2C3(C)CCCC(C)(C(=O)OC4C(C(O)C(O)C(CO)O4)O)C3CCC2(C2)CC(=C)C21OC(C1OC2C(C(O)C(O)C(CO)O2)O)OC(CO)C(O)C1OC1OC(CO)C(O)C(O)C1O HELXLJCILKEWJH-UHFFFAOYSA-N 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- 235000019253 formic acid Nutrition 0.000 description 2
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 2
- 150000004676 glycans Chemical class 0.000 description 2
- 229930182470 glycoside Natural products 0.000 description 2
- 150000002338 glycosides Chemical class 0.000 description 2
- 238000004128 high performance liquid chromatography Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000009655 industrial fermentation Methods 0.000 description 2
- 229910052500 inorganic mineral Inorganic materials 0.000 description 2
- 230000002427 irreversible effect Effects 0.000 description 2
- JVTAAEKCZFNVCJ-UHFFFAOYSA-N lactic acid Chemical compound CC(O)C(O)=O JVTAAEKCZFNVCJ-UHFFFAOYSA-N 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- KWGKDLIKAYFUFQ-UHFFFAOYSA-M lithium chloride Chemical compound [Li+].[Cl-] KWGKDLIKAYFUFQ-UHFFFAOYSA-M 0.000 description 2
- 235000009973 maize Nutrition 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 239000002207 metabolite Substances 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 2
- 235000010755 mineral Nutrition 0.000 description 2
- 239000011707 mineral Substances 0.000 description 2
- 150000002772 monosaccharides Chemical class 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- 239000002667 nucleating agent Substances 0.000 description 2
- 229940014662 pantothenate Drugs 0.000 description 2
- 229940055726 pantothenic acid Drugs 0.000 description 2
- 239000003375 plant hormone Substances 0.000 description 2
- 239000013612 plasmid Substances 0.000 description 2
- 229920001550 polyprenyl Polymers 0.000 description 2
- 125000001185 polyprenyl group Polymers 0.000 description 2
- 229920001282 polysaccharide Polymers 0.000 description 2
- 239000005017 polysaccharide Substances 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- HELXLJCILKEWJH-NCGAPWICSA-N rebaudioside A Chemical compound O([C@H]1[C@H](O)[C@@H](CO)O[C@H]([C@@H]1O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)O[C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(=O)O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O HELXLJCILKEWJH-NCGAPWICSA-N 0.000 description 2
- 235000019203 rebaudioside A Nutrition 0.000 description 2
- QSRAJVGDWKFOGU-WBXIDTKBSA-N rebaudioside c Chemical compound O[C@@H]1[C@H](O)[C@@H](O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](O[C@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O2)O)[C@H](O)[C@@H](CO)O[C@H]1O[C@]1(CC[C@H]2[C@@]3(C)[C@@H]([C@](CCC3)(C)C(=O)O[C@H]3[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O3)O)CC3)C(=C)C[C@]23C1 QSRAJVGDWKFOGU-WBXIDTKBSA-N 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 235000009566 rice Nutrition 0.000 description 2
- 229920006395 saturated elastomer Polymers 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 230000009469 supplementation Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- BVCKFLJARNKCSS-DWPRYXJFSA-N temocillin Chemical compound N([C@]1(OC)C(N2[C@H](C(C)(C)S[C@@H]21)C(O)=O)=O)C(=O)C(C(O)=O)C=1C=CSC=1 BVCKFLJARNKCSS-DWPRYXJFSA-N 0.000 description 2
- 229960001114 temocillin Drugs 0.000 description 2
- 150000003505 terpenes Chemical class 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- HDTRYLNUVZCQOY-UHFFFAOYSA-N α-D-glucopyranosyl-α-D-glucopyranoside Natural products OC1C(O)C(O)C(CO)OC1OC1C(O)C(O)C(O)C(CO)O1 HDTRYLNUVZCQOY-UHFFFAOYSA-N 0.000 description 1
- 101710165761 (2E,6E)-farnesyl diphosphate synthase Proteins 0.000 description 1
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 1
- GVEZIHKRYBHEFX-MNOVXSKESA-N 13C-Cerulenin Natural products CC=CCC=CCCC(=O)[C@H]1O[C@@H]1C(N)=O GVEZIHKRYBHEFX-MNOVXSKESA-N 0.000 description 1
- OKZYCXHTTZZYSK-UHFFFAOYSA-N 3-hydroxy-3-methyl-5-phosphonooxypentanoic acid Chemical compound OC(=O)CC(O)(C)CCOP(O)(O)=O OKZYCXHTTZZYSK-UHFFFAOYSA-N 0.000 description 1
- 102100029077 3-hydroxy-3-methylglutaryl-coenzyme A reductase Human genes 0.000 description 1
- ZUQOBHTUMCEQBG-UHFFFAOYSA-N 4-amino-5-hydroxynaphthalene-1,7-disulfonic acid Chemical compound OS(=O)(=O)C1=CC(O)=C2C(N)=CC=C(S(O)(=O)=O)C2=C1 ZUQOBHTUMCEQBG-UHFFFAOYSA-N 0.000 description 1
- HIQIXEFWDLTDED-UHFFFAOYSA-N 4-hydroxy-1-piperidin-4-ylpyrrolidin-2-one Chemical compound O=C1CC(O)CN1C1CCNCC1 HIQIXEFWDLTDED-UHFFFAOYSA-N 0.000 description 1
- UHPMCKVQTMMPCG-UHFFFAOYSA-N 5,8-dihydroxy-2-methoxy-6-methyl-7-(2-oxopropyl)naphthalene-1,4-dione Chemical compound CC1=C(CC(C)=O)C(O)=C2C(=O)C(OC)=CC(=O)C2=C1O UHPMCKVQTMMPCG-UHFFFAOYSA-N 0.000 description 1
- FPQMGQZTBWIHDN-UHFFFAOYSA-N 5-fluoroanthranilic acid Chemical compound NC1=CC=C(F)C=C1C(O)=O FPQMGQZTBWIHDN-UHFFFAOYSA-N 0.000 description 1
- 101150096273 ADE2 gene Proteins 0.000 description 1
- 101150069942 ATR2 gene Proteins 0.000 description 1
- 241000218642 Abies Species 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 1
- 108010006229 Acetyl-CoA C-acetyltransferase Proteins 0.000 description 1
- 102000005345 Acetyl-CoA C-acetyltransferase Human genes 0.000 description 1
- 241000186361 Actinobacteria <class> Species 0.000 description 1
- 241000187844 Actinoplanes Species 0.000 description 1
- 241000187712 Actinoplanes sp. Species 0.000 description 1
- 102000057234 Acyl transferases Human genes 0.000 description 1
- 108700016155 Acyl transferases Proteins 0.000 description 1
- 241000589158 Agrobacterium Species 0.000 description 1
- 241001147780 Alicyclobacillus Species 0.000 description 1
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 1
- 241001508809 Ambrosiozyma Species 0.000 description 1
- 239000004254 Ammonium phosphate Substances 0.000 description 1
- 241000192542 Anabaena Species 0.000 description 1
- 241000207875 Antirrhinum Species 0.000 description 1
- 241000893512 Aquifex aeolicus Species 0.000 description 1
- 101100459266 Arabidopsis thaliana MYC3 gene Proteins 0.000 description 1
- 101001094837 Arabidopsis thaliana Pectinesterase 5 Proteins 0.000 description 1
- 241000205046 Archaeoglobus Species 0.000 description 1
- 241001638540 Arthroascus Species 0.000 description 1
- 241001508785 Arxiozyma Species 0.000 description 1
- 101710177204 Atrochrysone carboxyl ACP thioesterase Proteins 0.000 description 1
- 241000589151 Azotobacter Species 0.000 description 1
- 241000193755 Bacillus cereus Species 0.000 description 1
- 241000193388 Bacillus thuringiensis Species 0.000 description 1
- 241000193365 Bacillus thuringiensis serovar israelensis Species 0.000 description 1
- 241000235553 Blakeslea trispora Species 0.000 description 1
- 241000680806 Blastobotrys adeninivorans Species 0.000 description 1
- 108010006654 Bleomycin Proteins 0.000 description 1
- 241000178289 Botryozyma Species 0.000 description 1
- 241000589173 Bradyrhizobium Species 0.000 description 1
- 235000006463 Brassica alba Nutrition 0.000 description 1
- 244000140786 Brassica hirta Species 0.000 description 1
- 241000995051 Brenda Species 0.000 description 1
- 244000027711 Brettanomyces bruxellensis Species 0.000 description 1
- 235000000287 Brettanomyces bruxellensis Nutrition 0.000 description 1
- 241000033328 Bulleromyces Species 0.000 description 1
- 241000345998 Calamus manan Species 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 235000002566 Capsicum Nutrition 0.000 description 1
- 229930186147 Cephalosporin Natural products 0.000 description 1
- 229920002101 Chitin Polymers 0.000 description 1
- 241000588881 Chromobacterium Species 0.000 description 1
- 241001508787 Citeromyces Species 0.000 description 1
- 235000005976 Citrus sinensis Nutrition 0.000 description 1
- 240000002319 Citrus sinensis Species 0.000 description 1
- 241000219930 Clarkia Species 0.000 description 1
- 241001508811 Clavispora Species 0.000 description 1
- 241000193454 Clostridium beijerinckii Species 0.000 description 1
- 240000004792 Corchorus capsularis Species 0.000 description 1
- 241001135265 Cronobacter sakazakii Species 0.000 description 1
- GUBGYTABKSRVRQ-CUHNMECISA-N D-Cellobiose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-CUHNMECISA-N 0.000 description 1
- MTCFGRXMJLQNBG-UWTATZPHSA-N D-Serine Chemical compound OC[C@@H](N)C(O)=O MTCFGRXMJLQNBG-UWTATZPHSA-N 0.000 description 1
- 229930195711 D-Serine Natural products 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 241001306278 Diaporthe amygdali Species 0.000 description 1
- 229930186291 Dulcoside Natural products 0.000 description 1
- 102100031780 Endonuclease Human genes 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 241000194031 Enterococcus faecium Species 0.000 description 1
- 241000588698 Erwinia Species 0.000 description 1
- 241000588722 Escherichia Species 0.000 description 1
- 241001646716 Escherichia coli K-12 Species 0.000 description 1
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 108091029865 Exogenous DNA Proteins 0.000 description 1
- 239000001776 FEMA 4720 Substances 0.000 description 1
- 101710156207 Farnesyl diphosphate synthase Proteins 0.000 description 1
- 102100035111 Farnesyl pyrophosphate synthase Human genes 0.000 description 1
- 101710125754 Farnesyl pyrophosphate synthase Proteins 0.000 description 1
- 101710089428 Farnesyl pyrophosphate synthase erg20 Proteins 0.000 description 1
- 108010022535 Farnesyl-Diphosphate Farnesyltransferase Proteins 0.000 description 1
- 241000187809 Frankia Species 0.000 description 1
- 229930091371 Fructose Natural products 0.000 description 1
- 239000005715 Fructose Substances 0.000 description 1
- RFSUNEUAIZKAJO-ARQDHWQXSA-N Fructose Chemical compound OC[C@H]1O[C@](O)(CO)[C@@H](O)[C@@H]1O RFSUNEUAIZKAJO-ARQDHWQXSA-N 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 241000223195 Fusarium graminearum Species 0.000 description 1
- 241001288226 Fusibacter Species 0.000 description 1
- 241000605909 Fusobacterium Species 0.000 description 1
- 101150077230 GAL4 gene Proteins 0.000 description 1
- 101150103317 GAL80 gene Proteins 0.000 description 1
- 102100039556 Galectin-4 Human genes 0.000 description 1
- GVVPGTZRZFNKDS-YFHOEESVSA-N Geranyl diphosphate Natural products CC(C)=CCC\C(C)=C/COP(O)(=O)OP(O)(O)=O GVVPGTZRZFNKDS-YFHOEESVSA-N 0.000 description 1
- 235000008100 Ginkgo biloba Nutrition 0.000 description 1
- 244000194101 Ginkgo biloba Species 0.000 description 1
- 239000004366 Glucose oxidase Substances 0.000 description 1
- 108010015776 Glucose oxidase Proteins 0.000 description 1
- 229920002527 Glycogen Polymers 0.000 description 1
- 101150009006 HIS3 gene Proteins 0.000 description 1
- 241000168517 Haematococcus lacustris Species 0.000 description 1
- 241000204942 Halobacterium sp. Species 0.000 description 1
- SQUHHTBVTRBESD-UHFFFAOYSA-N Hexa-Ac-myo-Inositol Natural products CC(=O)OC1C(OC(C)=O)C(OC(C)=O)C(OC(C)=O)C(OC(C)=O)C1OC(C)=O SQUHHTBVTRBESD-UHFFFAOYSA-N 0.000 description 1
- 101000884385 Homo sapiens Arylamine N-acetyltransferase 1 Proteins 0.000 description 1
- 101001034811 Homo sapiens Eukaryotic translation initiation factor 4 gamma 2 Proteins 0.000 description 1
- 101000608765 Homo sapiens Galectin-4 Proteins 0.000 description 1
- 101000639975 Homo sapiens Sodium-dependent noradrenaline transporter Proteins 0.000 description 1
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- GRRNUXAQVGOGFE-UHFFFAOYSA-N Hygromycin-B Natural products OC1C(NC)CC(N)C(O)C1OC1C2OC3(C(C(O)C(O)C(C(N)CO)O3)O)OC2C(O)C(CO)O1 GRRNUXAQVGOGFE-UHFFFAOYSA-N 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- JUZNIMUFDBIJCM-ANEDZVCMSA-N Invanz Chemical compound O=C([C@H]1NC[C@H](C1)SC=1[C@H](C)[C@@H]2[C@H](C(N2C=1C(O)=O)=O)[C@H](O)C)NC1=CC=CC(C(O)=O)=C1 JUZNIMUFDBIJCM-ANEDZVCMSA-N 0.000 description 1
- 241001473007 Ips pini Species 0.000 description 1
- 241001183967 Isodon Species 0.000 description 1
- 102100027665 Isopentenyl-diphosphate Delta-isomerase 1 Human genes 0.000 description 1
- 241001489120 Kondoa Species 0.000 description 1
- 241000222661 Kurtzmanomyces Species 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- 101150044775 LYS1 gene Proteins 0.000 description 1
- 241000481961 Lachancea thermotolerans Species 0.000 description 1
- 241001582342 Lactobacillus sakei subsp. sakei Species 0.000 description 1
- 241000194036 Lactococcus Species 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- 241001469654 Lawsonia <weevil> Species 0.000 description 1
- 241000589902 Leptospira Species 0.000 description 1
- 241000178946 Leptospira interrogans serovar Copenhageni Species 0.000 description 1
- 241000113239 Leucospora Species 0.000 description 1
- 241000209510 Liliopsida Species 0.000 description 1
- 241001508815 Lodderomyces Species 0.000 description 1
- 235000002262 Lycopersicon Nutrition 0.000 description 1
- 101150068888 MET3 gene Proteins 0.000 description 1
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 241000219823 Medicago Species 0.000 description 1
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 description 1
- 241000219828 Medicago truncatula Species 0.000 description 1
- 244000246386 Mentha pulegium Species 0.000 description 1
- 235000016257 Mentha pulegium Nutrition 0.000 description 1
- 235000004357 Mentha x piperita Nutrition 0.000 description 1
- 241000970829 Mesorhizobium Species 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- CERQOIWHTDAKMF-UHFFFAOYSA-N Methacrylic acid Chemical compound CC(=C)C(O)=O CERQOIWHTDAKMF-UHFFFAOYSA-N 0.000 description 1
- 241000589323 Methylobacterium Species 0.000 description 1
- 241001123674 Metschnikowia Species 0.000 description 1
- 241000091577 Mexicana Species 0.000 description 1
- 241001467578 Microbacterium Species 0.000 description 1
- 241001149967 Mrakia Species 0.000 description 1
- 241000699660 Mus musculus Species 0.000 description 1
- 101100194350 Mus musculus Rere gene Proteins 0.000 description 1
- 101100533725 Mus musculus Smr3a gene Proteins 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 241000186359 Mycobacterium Species 0.000 description 1
- 241000187492 Mycobacterium marinum Species 0.000 description 1
- 101000997933 Mycobacterium tuberculosis (strain ATCC 25618 / H37Rv) (2E,6E)-farnesyl diphosphate synthase Proteins 0.000 description 1
- 101001015102 Mycobacterium tuberculosis (strain ATCC 25618 / H37Rv) Dimethylallyltranstransferase Proteins 0.000 description 1
- 241000187917 Mycobacterium ulcerans Species 0.000 description 1
- 241000529863 Myxozyma Species 0.000 description 1
- 101150082943 NAT1 gene Proteins 0.000 description 1
- 101100022915 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) cys-11 gene Proteins 0.000 description 1
- 241000088436 Neurospora sp. Species 0.000 description 1
- GRYLNZFGIOXLOG-UHFFFAOYSA-N Nitric acid Chemical compound O[N+]([O-])=O GRYLNZFGIOXLOG-UHFFFAOYSA-N 0.000 description 1
- 241000187654 Nocardia Species 0.000 description 1
- 241000203622 Nocardiopsis Species 0.000 description 1
- 108091005461 Nucleic proteins Chemical group 0.000 description 1
- 208000008589 Obesity Diseases 0.000 description 1
- 241001112159 Ogataea Species 0.000 description 1
- 241000603382 Oomyces Species 0.000 description 1
- 241000159576 Oosporidium Species 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 241001502335 Orpinomyces Species 0.000 description 1
- 241000589597 Paracoccus denitrificans Species 0.000 description 1
- 229930182555 Penicillin Natural products 0.000 description 1
- 239000006002 Pepper Substances 0.000 description 1
- 239000001888 Peptone Substances 0.000 description 1
- 108010080698 Peptones Proteins 0.000 description 1
- 241000496307 Phaeomyces Species 0.000 description 1
- 241000195887 Physcomitrella patens Species 0.000 description 1
- 244000060014 Picea glauca var. densata Species 0.000 description 1
- 241000255972 Pieris <butterfly> Species 0.000 description 1
- 235000016761 Piper aduncum Nutrition 0.000 description 1
- 240000003889 Piper guineense Species 0.000 description 1
- 235000017804 Piper guineense Nutrition 0.000 description 1
- 235000008184 Piper nigrum Nutrition 0.000 description 1
- 241000235379 Piromyces Species 0.000 description 1
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 1
- 241001088162 Primula auricula Species 0.000 description 1
- 235000006894 Primula auricula Nutrition 0.000 description 1
- 101710150389 Probable farnesyl diphosphate synthase Proteins 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 241001123666 Protomyces Species 0.000 description 1
- 101100132333 Pseudomonas mevalonii mvaA gene Proteins 0.000 description 1
- 241001148023 Pyrococcus abyssi Species 0.000 description 1
- 241000522615 Pyrococcus horikoshii Species 0.000 description 1
- 244000184734 Pyrus japonica Species 0.000 description 1
- 101100149716 Rattus norvegicus Vcsa1 gene Proteins 0.000 description 1
- RLLCWNUIHGPAJY-RYBZXKSASA-N Rebaudioside E Natural products O=C(O[C@H]1[C@H](O[C@H]2[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O2)[C@@H](O)[C@@H](O)[C@H](CO)O1)[C@]1(C)[C@@H]2[C@@](C)([C@@H]3[C@@]4(CC(=C)[C@@](O[C@@H]5[C@@H](O[C@@H]6[C@@H](O)[C@H](O)[C@@H](O)[C@H](CO)O6)[C@H](O)[C@@H](O)[C@H](CO)O5)(C4)CC3)CC2)CCC1 RLLCWNUIHGPAJY-RYBZXKSASA-N 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 241000589187 Rhizobium sp. Species 0.000 description 1
- 241000191025 Rhodobacter Species 0.000 description 1
- 101100394989 Rhodopseudomonas palustris (strain ATCC BAA-98 / CGA009) hisI gene Proteins 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 101100286750 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) ILV2 gene Proteins 0.000 description 1
- 101100386089 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) MET17 gene Proteins 0.000 description 1
- 241000222480 Schizophyllum Species 0.000 description 1
- 101100022918 Schizosaccharomyces pombe (strain 972 / ATCC 24843) sua1 gene Proteins 0.000 description 1
- 241000545593 Scolytinae Species 0.000 description 1
- 102100033929 Sodium-dependent noradrenaline transporter Human genes 0.000 description 1
- 240000003768 Solanum lycopersicum Species 0.000 description 1
- 235000002560 Solanum lycopersicum Nutrition 0.000 description 1
- 241001085826 Sporotrichum Species 0.000 description 1
- 102100037997 Squalene synthase Human genes 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 241000222665 Sterigmatomyces Species 0.000 description 1
- 101100101356 Stevia rebaudiana UGT91D2 gene Proteins 0.000 description 1
- 244000057717 Streptococcus lactis Species 0.000 description 1
- 235000014897 Streptococcus lactis Nutrition 0.000 description 1
- 241000193998 Streptococcus pneumoniae Species 0.000 description 1
- 241000103155 Streptococcus pyogenes MGAS10270 Species 0.000 description 1
- 241000103160 Streptococcus pyogenes MGAS10750 Species 0.000 description 1
- 241000103154 Streptococcus pyogenes MGAS2096 Species 0.000 description 1
- 241000187180 Streptomyces sp. Species 0.000 description 1
- 241000187191 Streptomyces viridochromogenes Species 0.000 description 1
- 241000267323 Streptomyces viridochromogenes DSM 40736 Species 0.000 description 1
- LSNNMFCWUKXFEE-UHFFFAOYSA-N Sulfurous acid Chemical compound OS(O)=O LSNNMFCWUKXFEE-UHFFFAOYSA-N 0.000 description 1
- 241000192707 Synechococcus Species 0.000 description 1
- 241000192560 Synechococcus sp. Species 0.000 description 1
- 101150006914 TRP1 gene Proteins 0.000 description 1
- 241001491687 Thalassiosira pseudonana Species 0.000 description 1
- 241000489996 Thermoplasma volcanium Species 0.000 description 1
- 241001495125 Torulaspora pretoriensis Species 0.000 description 1
- HDTRYLNUVZCQOY-WSWWMNSNSA-N Trehalose Natural products O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-WSWWMNSNSA-N 0.000 description 1
- 241000121219 Tricholoma Species 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 241001467018 Typhis Species 0.000 description 1
- 235000009754 Vitis X bourquina Nutrition 0.000 description 1
- 235000012333 Vitis X labruscana Nutrition 0.000 description 1
- 235000014787 Vitis vinifera Nutrition 0.000 description 1
- 241000193620 Wickerhamia Species 0.000 description 1
- 241001523965 Xylaria Species 0.000 description 1
- 241000311098 Yamadazyma Species 0.000 description 1
- 241000209149 Zea Species 0.000 description 1
- 108010084455 Zeocin Proteins 0.000 description 1
- HINSNOJRHFIMKB-DJDMUFINSA-N [(2S,3R,4S,5S,6R)-4,5-dihydroxy-6-(hydroxymethyl)-3-[(2S,3R,4R,5R,6S)-3,4,5-trihydroxy-6-methyloxan-2-yl]oxyoxan-2-yl] (1R,4S,5R,9S,10R,13S)-13-[(2S,3R,4S,5R,6R)-5-hydroxy-6-(hydroxymethyl)-3,4-bis[[(2S,3R,4S,5S,6R)-3,4,5-trihydroxy-6-(hydroxymethyl)oxan-2-yl]oxy]oxan-2-yl]oxy-5,9-dimethyl-14-methylidenetetracyclo[11.2.1.01,10.04,9]hexadecane-5-carboxylate Chemical compound [H][C@@]1(O[C@@H]2[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]2OC(=O)[C@]2(C)CCC[C@@]3(C)[C@]4([H])CC[C@@]5(C[C@]4(CC5=C)CC[C@]23[H])O[C@]2([H])O[C@H](CO)[C@@H](O)[C@H](O[C@]3([H])O[C@H](CO)[C@@H](O)[C@H](O)[C@H]3O)[C@H]2O[C@]2([H])O[C@H](CO)[C@@H](O)[C@H](O)[C@H]2O)O[C@@H](C)[C@H](O)[C@@H](O)[C@H]1O HINSNOJRHFIMKB-DJDMUFINSA-N 0.000 description 1
- NRAUADCLPJTGSF-ZPGVOIKOSA-N [(2r,3s,4r,5r,6r)-6-[[(3as,7r,7as)-7-hydroxy-4-oxo-1,3a,5,6,7,7a-hexahydroimidazo[4,5-c]pyridin-2-yl]amino]-5-[[(3s)-3,6-diaminohexanoyl]amino]-4-hydroxy-2-(hydroxymethyl)oxan-3-yl] carbamate Chemical compound NCCC[C@H](N)CC(=O)N[C@@H]1[C@@H](O)[C@H](OC(N)=O)[C@@H](CO)O[C@H]1\N=C/1N[C@H](C(=O)NC[C@H]2O)[C@@H]2N\1 NRAUADCLPJTGSF-ZPGVOIKOSA-N 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- IKHGUXGNUITLKF-XPULMUKRSA-N acetaldehyde Chemical compound [14CH]([14CH3])=O IKHGUXGNUITLKF-XPULMUKRSA-N 0.000 description 1
- LIPOUNRJVLNBCD-UHFFFAOYSA-N acetyl dihydrogen phosphate Chemical compound CC(=O)OP(O)(O)=O LIPOUNRJVLNBCD-UHFFFAOYSA-N 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 230000010933 acylation Effects 0.000 description 1
- 238000005917 acylation reaction Methods 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- HDTRYLNUVZCQOY-LIZSDCNHSA-N alpha,alpha-trehalose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-LIZSDCNHSA-N 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- WQZGKKKJIJFFOK-PHYPRBDBSA-N alpha-D-galactose Chemical compound OC[C@H]1O[C@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-PHYPRBDBSA-N 0.000 description 1
- 229910021529 ammonia Inorganic materials 0.000 description 1
- ZRIUUUJAJJNDSS-UHFFFAOYSA-N ammonium phosphates Chemical class [NH4+].[NH4+].[NH4+].[O-]P([O-])([O-])=O ZRIUUUJAJJNDSS-UHFFFAOYSA-N 0.000 description 1
- 235000019289 ammonium phosphates Nutrition 0.000 description 1
- 150000003863 ammonium salts Chemical class 0.000 description 1
- 229940044197 ammonium sulfate Drugs 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000001195 anabolic effect Effects 0.000 description 1
- 239000012491 analyte Substances 0.000 description 1
- 239000002518 antifoaming agent Substances 0.000 description 1
- 239000012736 aqueous medium Substances 0.000 description 1
- 239000008346 aqueous phase Substances 0.000 description 1
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 1
- 229930101531 artemisinin Natural products 0.000 description 1
- BLUAFEHZUWYNDE-NNWCWBAJSA-N artemisinin Chemical compound C([C@](OO1)(C)O2)C[C@H]3[C@H](C)CC[C@@H]4[C@@]31[C@@H]2OC(=O)[C@@H]4C BLUAFEHZUWYNDE-NNWCWBAJSA-N 0.000 description 1
- 229960004191 artemisinin Drugs 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 150000001510 aspartic acids Chemical class 0.000 description 1
- 229940097012 bacillus thuringiensis Drugs 0.000 description 1
- 239000003782 beta lactam antibiotic agent Substances 0.000 description 1
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- GUBGYTABKSRVRQ-QUYVBRFLSA-N beta-maltose Chemical compound OC[C@H]1O[C@H](O[C@H]2[C@H](O)[C@@H](O)[C@H](O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@@H]1O GUBGYTABKSRVRQ-QUYVBRFLSA-N 0.000 description 1
- GINJFDRNADDBIN-FXQIFTODSA-N bilanafos Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCP(C)(O)=O GINJFDRNADDBIN-FXQIFTODSA-N 0.000 description 1
- 238000010364 biochemical engineering Methods 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000001851 biosynthetic effect Effects 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 229960001561 bleomycin Drugs 0.000 description 1
- OYVAGSVQBOHSSS-UAPAGMARSA-O bleomycin A2 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC=C(N=1)C=1SC=C(N=1)C(=O)NCCC[S+](C)C)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C OYVAGSVQBOHSSS-UAPAGMARSA-O 0.000 description 1
- 150000005693 branched-chain amino acids Chemical class 0.000 description 1
- GVEZIHKRYBHEFX-UHFFFAOYSA-N caerulein A Natural products CC=CCC=CCCC(=O)C1OC1C(N)=O GVEZIHKRYBHEFX-UHFFFAOYSA-N 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229960002713 calcium chloride Drugs 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- LLSDKQJKOVVTOJ-UHFFFAOYSA-L calcium chloride dihydrate Chemical compound O.O.[Cl-].[Cl-].[Ca+2] LLSDKQJKOVVTOJ-UHFFFAOYSA-L 0.000 description 1
- 229940052299 calcium chloride dihydrate Drugs 0.000 description 1
- 229940041514 candida albicans extract Drugs 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 235000013877 carbamide Nutrition 0.000 description 1
- 229940041011 carbapenems Drugs 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 239000012159 carrier gas Substances 0.000 description 1
- 101150055766 cat gene Proteins 0.000 description 1
- 230000001925 catabolic effect Effects 0.000 description 1
- 230000006652 catabolic pathway Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- OLVCFLKTBJRLHI-AXAPSJFSSA-N cefamandole Chemical compound CN1N=NN=C1SCC1=C(C(O)=O)N2C(=O)[C@@H](NC(=O)[C@H](O)C=3C=CC=CC=3)[C@H]2SC1 OLVCFLKTBJRLHI-AXAPSJFSSA-N 0.000 description 1
- 229960003012 cefamandole Drugs 0.000 description 1
- GCFBRXLSHGKWDP-XCGNWRKASA-N cefoperazone Chemical compound O=C1C(=O)N(CC)CCN1C(=O)N[C@H](C=1C=CC(O)=CC=1)C(=O)N[C@@H]1C(=O)N2C(C(O)=O)=C(CSC=3N(N=NN=3)C)CS[C@@H]21 GCFBRXLSHGKWDP-XCGNWRKASA-N 0.000 description 1
- 229960004682 cefoperazone Drugs 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 229940124587 cephalosporin Drugs 0.000 description 1
- 150000001780 cephalosporins Chemical class 0.000 description 1
- GVEZIHKRYBHEFX-NQQPLRFYSA-N cerulenin Chemical compound C\C=C\C\C=C\CCC(=O)[C@H]1O[C@H]1C(N)=O GVEZIHKRYBHEFX-NQQPLRFYSA-N 0.000 description 1
- 229950005984 cerulenin Drugs 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 239000000701 coagulant Substances 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 235000009508 confectionery Nutrition 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 238000002425 crystallisation Methods 0.000 description 1
- 230000008025 crystallization Effects 0.000 description 1
- 239000012228 culture supernatant Substances 0.000 description 1
- 238000006114 decarboxylation reaction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000001212 derivatisation Methods 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 238000007865 diluting Methods 0.000 description 1
- AIUDWMLXCFRVDR-UHFFFAOYSA-N dimethyl 2-(3-ethyl-3-methylpentyl)propanedioate Chemical class CCC(C)(CC)CCC(C(=O)OC)C(=O)OC AIUDWMLXCFRVDR-UHFFFAOYSA-N 0.000 description 1
- 239000001177 diphosphate Substances 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000011143 downstream manufacturing Methods 0.000 description 1
- CANAPGLEBDTCAF-UHFFFAOYSA-N dulcoside a Chemical compound OC1C(O)C(O)C(C)OC1OC1C(OC23C(CC4(C2)C(C2(C)C(C(CCC2)(C)C(=O)OC2C(C(O)C(O)C(CO)O2)O)CC4)CC3)=C)OC(CO)C(O)C1O CANAPGLEBDTCAF-UHFFFAOYSA-N 0.000 description 1
- QYDYPVFESGNLHU-UHFFFAOYSA-N elaidic acid methyl ester Natural products CCCCCCCCC=CCCCCCCCC(=O)OC QYDYPVFESGNLHU-UHFFFAOYSA-N 0.000 description 1
- 238000000909 electrodialysis Methods 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- JCAVDWHQNFTFBW-GNVSMLMZSA-N ent-kaur-16-en-19-al Chemical compound C1C[C@@H](C2)C(=C)C[C@@]32CC[C@@H]2[C@](C)(C=O)CCC[C@@]2(C)[C@@H]31 JCAVDWHQNFTFBW-GNVSMLMZSA-N 0.000 description 1
- NIKHGUQULKYIGE-SHAPNJEPSA-N ent-kaur-16-en-19-oic acid Chemical compound C([C@H]1C[C@]2(CC1=C)CC1)C[C@H]2[C@@]2(C)[C@H]1[C@](C)(C(O)=O)CCC2 NIKHGUQULKYIGE-SHAPNJEPSA-N 0.000 description 1
- KWVKUAKMOIEELN-UHFFFAOYSA-N ent-kaur-16-en-19-oic acid Natural products CC1(C)CCCC2(C)C1CCC34CC(=C(C3)C(=O)O)CCC24 KWVKUAKMOIEELN-UHFFFAOYSA-N 0.000 description 1
- TUJQVRFWMWRMIO-GNVSMLMZSA-N ent-kaur-16-en-19-ol Chemical compound C1C[C@@H](C2)C(=C)C[C@@]32CC[C@@H]2[C@](C)(CO)CCC[C@@]2(C)[C@@H]31 TUJQVRFWMWRMIO-GNVSMLMZSA-N 0.000 description 1
- 238000001952 enzyme assay Methods 0.000 description 1
- 101150116391 erg9 gene Proteins 0.000 description 1
- 229960002770 ertapenem Drugs 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 238000001704 evaporation Methods 0.000 description 1
- 230000008020 evaporation Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 239000008394 flocculating agent Substances 0.000 description 1
- 238000004401 flow injection analysis Methods 0.000 description 1
- 239000011888 foil Substances 0.000 description 1
- 235000003599 food sweetener Nutrition 0.000 description 1
- 239000012737 fresh medium Substances 0.000 description 1
- 238000010230 functional analysis Methods 0.000 description 1
- 229930182830 galactose Natural products 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 238000001423 gas--liquid extraction Methods 0.000 description 1
- 238000012239 gene modification Methods 0.000 description 1
- 230000005017 genetic modification Effects 0.000 description 1
- 235000013617 genetically modified food Nutrition 0.000 description 1
- 229940116332 glucose oxidase Drugs 0.000 description 1
- 235000019420 glucose oxidase Nutrition 0.000 description 1
- 229930182478 glucoside Natural products 0.000 description 1
- 150000008131 glucosides Chemical class 0.000 description 1
- 229940096919 glycogen Drugs 0.000 description 1
- 239000007952 growth promoter Substances 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 235000001050 hortel pimenta Nutrition 0.000 description 1
- 101150029559 hph gene Proteins 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 125000001165 hydrophobic group Chemical group 0.000 description 1
- GRRNUXAQVGOGFE-NZSRVPFOSA-N hygromycin B Chemical compound O[C@@H]1[C@@H](NC)C[C@@H](N)[C@H](O)[C@H]1O[C@H]1[C@H]2O[C@@]3([C@@H]([C@@H](O)[C@@H](O)[C@@H](C(N)CO)O3)O)O[C@H]2[C@@H](O)[C@@H](CO)O1 GRRNUXAQVGOGFE-NZSRVPFOSA-N 0.000 description 1
- 229940097277 hygromycin b Drugs 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 239000002054 inoculum Substances 0.000 description 1
- 229910052816 inorganic phosphate Inorganic materials 0.000 description 1
- CDAISMWEOUEBRE-GPIVLXJGSA-N inositol Chemical compound O[C@H]1[C@H](O)[C@@H](O)[C@H](O)[C@H](O)[C@@H]1O CDAISMWEOUEBRE-GPIVLXJGSA-N 0.000 description 1
- 229960000367 inositol Drugs 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 239000004310 lactic acid Substances 0.000 description 1
- 235000014655 lactic acid Nutrition 0.000 description 1
- 229940039696 lactobacillus Drugs 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 125000001909 leucine group Chemical group [H]N(*)C(C(*)=O)C([H])([H])C(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 238000000622 liquid--liquid extraction Methods 0.000 description 1
- XIXADJRWDQXREU-UHFFFAOYSA-M lithium acetate Chemical compound [Li+].CC([O-])=O XIXADJRWDQXREU-UHFFFAOYSA-M 0.000 description 1
- OAIJSZIZWZSQBC-GYZMGTAESA-N lycopene Chemical compound CC(C)=CCC\C(C)=C\C=C\C(\C)=C\C=C\C(\C)=C\C=C\C=C(/C)\C=C\C=C(/C)\C=C\C=C(/C)CCC=C(C)C OAIJSZIZWZSQBC-GYZMGTAESA-N 0.000 description 1
- 230000002934 lysing effect Effects 0.000 description 1
- WRUGWIBCXHJTDG-UHFFFAOYSA-L magnesium sulfate heptahydrate Chemical compound O.O.O.O.O.O.O.[Mg+2].[O-]S([O-])(=O)=O WRUGWIBCXHJTDG-UHFFFAOYSA-L 0.000 description 1
- 229940061634 magnesium sulfate heptahydrate Drugs 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 239000013028 medium composition Substances 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 230000007102 metabolic function Effects 0.000 description 1
- 229960000485 methotrexate Drugs 0.000 description 1
- QYDYPVFESGNLHU-KHPPLWFESA-N methyl oleate Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OC QYDYPVFESGNLHU-KHPPLWFESA-N 0.000 description 1
- 229940073769 methyl oleate Drugs 0.000 description 1
- 239000013586 microbial product Substances 0.000 description 1
- 238000009629 microbiological culture Methods 0.000 description 1
- VYQNWZOUAUKGHI-UHFFFAOYSA-N monobenzone Chemical compound C1=CC(O)=CC=C1OCC1=CC=CC=C1 VYQNWZOUAUKGHI-UHFFFAOYSA-N 0.000 description 1
- 238000002552 multiple reaction monitoring Methods 0.000 description 1
- 101150016209 mvaA gene Proteins 0.000 description 1
- 229930014626 natural product Natural products 0.000 description 1
- 230000017095 negative regulation of cell growth Effects 0.000 description 1
- 229910017604 nitric acid Inorganic materials 0.000 description 1
- 231100001160 nonlethal Toxicity 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 235000020824 obesity Nutrition 0.000 description 1
- 125000001477 organic nitrogen group Chemical group 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- 230000008723 osmotic stress Effects 0.000 description 1
- FIKAKWIAUPDISJ-UHFFFAOYSA-L paraquat dichloride Chemical compound [Cl-].[Cl-].C1=C[N+](C)=CC=C1C1=CC=[N+](C)C=C1 FIKAKWIAUPDISJ-UHFFFAOYSA-L 0.000 description 1
- 101150113864 pat gene Proteins 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 150000002960 penicillins Chemical class 0.000 description 1
- 235000019319 peptone Nutrition 0.000 description 1
- 229940066779 peptones Drugs 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- CWCMIVBLVUHDHK-ZSNHEYEWSA-N phleomycin D1 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC[C@@H](N=1)C=1SC=C(N=1)C(=O)NCCCCNC(N)=N)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C CWCMIVBLVUHDHK-ZSNHEYEWSA-N 0.000 description 1
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 1
- 229920002523 polyethylene Glycol 1000 Polymers 0.000 description 1
- 239000011591 potassium Substances 0.000 description 1
- 229910052700 potassium Inorganic materials 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 239000013587 production medium Substances 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 239000003531 protein hydrolysate Substances 0.000 description 1
- ZUFQODAHGAHPFQ-UHFFFAOYSA-N pyridoxine hydrochloride Chemical compound Cl.CC1=NC=C(CO)C(CO)=C1O ZUFQODAHGAHPFQ-UHFFFAOYSA-N 0.000 description 1
- 235000019171 pyridoxine hydrochloride Nutrition 0.000 description 1
- 239000011764 pyridoxine hydrochloride Substances 0.000 description 1
- 235000012950 rattan cane Nutrition 0.000 description 1
- RLLCWNUIHGPAJY-SFUUMPFESA-N rebaudioside E Chemical compound O([C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(=O)O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O RLLCWNUIHGPAJY-SFUUMPFESA-N 0.000 description 1
- QRGRAFPOLJOGRV-UHFFFAOYSA-N rebaudioside F Natural products CC12CCCC(C)(C1CCC34CC(=C)C(CCC23)(C4)OC5OC(CO)C(O)C(OC6OCC(O)C(O)C6O)C5OC7OC(CO)C(O)C(O)C7O)C(=O)OC8OC(CO)C(O)C(O)C8O QRGRAFPOLJOGRV-UHFFFAOYSA-N 0.000 description 1
- HYLAUKAHEAUVFE-AVBZULRRSA-N rebaudioside f Chemical compound O([C@H]1[C@H](O)[C@@H](CO)O[C@H]([C@@H]1O[C@H]1[C@@H]([C@@H](O)[C@H](O)CO1)O)O[C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(=O)O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O HYLAUKAHEAUVFE-AVBZULRRSA-N 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000004202 respiratory function Effects 0.000 description 1
- 238000001223 reverse osmosis Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- CDAISMWEOUEBRE-UHFFFAOYSA-N scyllo-inosotol Natural products OC1C(O)C(O)C(O)C(O)C1O CDAISMWEOUEBRE-UHFFFAOYSA-N 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 230000037432 silent mutation Effects 0.000 description 1
- 235000021309 simple sugar Nutrition 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 229940031000 streptococcus pneumoniae Drugs 0.000 description 1
- 230000035882 stress Effects 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- ZDXMLEQEMNLCQG-UHFFFAOYSA-N sulfometuron methyl Chemical group COC(=O)C1=CC=CC=C1S(=O)(=O)NC(=O)NC1=NC(C)=CC(C)=N1 ZDXMLEQEMNLCQG-UHFFFAOYSA-N 0.000 description 1
- 239000003765 sweetening agent Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 229960003495 thiamine Drugs 0.000 description 1
- DPJRMOMPQZCRJU-UHFFFAOYSA-M thiamine hydrochloride Chemical compound Cl.[Cl-].CC1=C(CCO)SC=[N+]1CC1=CN=C(C)N=C1N DPJRMOMPQZCRJU-UHFFFAOYSA-M 0.000 description 1
- 235000019190 thiamine hydrochloride Nutrition 0.000 description 1
- 239000011747 thiamine hydrochloride Substances 0.000 description 1
- OQPOFZJZPYRNFF-CULFPKEHSA-N tkd5uc898q Chemical compound O=C([C@]1(C)CCC[C@@]2([C@@H]1CC[C@]13C[C@](O)(C(=C)C1)CC[C@@H]23)C)O[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O OQPOFZJZPYRNFF-CULFPKEHSA-N 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- DRSKVOAJKLUMCL-MMUIXFKXSA-N u2n4xkx7hp Chemical compound O([C@H]1[C@H](O)[C@@H](CO)O[C@H]([C@@H]1O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)O[C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(O)=O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O DRSKVOAJKLUMCL-MMUIXFKXSA-N 0.000 description 1
- 238000000108 ultra-filtration Methods 0.000 description 1
- 229940045136 urea Drugs 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
- 229940011671 vitamin b6 Drugs 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
- 239000012138 yeast extract Substances 0.000 description 1
- 239000002132 β-lactam antibiotic Substances 0.000 description 1
- 229940124586 β-lactam antibiotics Drugs 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/44—Preparation of O-glycosides, e.g. glucosides
- C12P19/56—Preparation of O-glycosides, e.g. glucosides having an oxygen atom of the saccharide radical directly bound to a condensed ring system having three or more carbocyclic rings, e.g. daunomycin, adriamycin
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
-
- A—HUMAN NECESSITIES
- A23—FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
- A23L—FOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
- A23L2/00—Non-alcoholic beverages; Dry compositions or concentrates therefor; Their preparation
- A23L2/52—Adding ingredients
- A23L2/60—Sweeteners
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0071—Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0071—Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
- C12N9/0073—Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14) with NADH or NADPH as one donor, and incorporation of one atom of oxygen 1.14.13
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/40—Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y114/00—Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
- C12Y114/13—Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with NADH or NADPH as one donor, and incorporation of one atom of oxygen (1.14.13)
- C12Y114/13078—Ent-kaurene oxidase (1.14.13.78)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y114/00—Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
- C12Y114/14—Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with reduced flavin or flavoprotein as one donor, and incorporation of one atom of oxygen (1.14.14)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/14—Fungi; Culture media therefor
- C12N1/16—Yeasts; Culture media therefor
- C12N1/18—Baker's yeast; Brewer's yeast
- C12N1/185—Saccharomyces isolates
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/645—Fungi ; Processes using fungi
- C12R2001/85—Saccharomyces
- C12R2001/865—Saccharomyces cerevisiae
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Biomedical Technology (AREA)
- Microbiology (AREA)
- Mycology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Nutrition Science (AREA)
- Food Science & Technology (AREA)
- Polymers & Plastics (AREA)
- Medicinal Chemistry (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
本发明提供了在宿主细胞中改进生成甜菊糖苷类化合物的组合物和方法。在一些实施方案,所述宿主细胞进行遗传修饰以包含编码豌豆(Pisum sativum)贝壳杉烯氧化酶或其变体贝壳杉烯氧化酶的异源核苷酸序列。在一些实施方案,所述宿主细胞还包含一种或多种异源核苷酸序列,其编码能够在所述宿主细胞中生成甜菊糖苷类化合物的途径的其他酶。本发明所述的组合物和方法提供了异源生成甜菊糖苷类化合物(包括但不限于瑞鲍迪苷D和瑞鲍迪苷M)的有效途径。
Description
1.相关申请的交叉引用
本申请要求并享有于2017年8月11日提交的美国临时申请号62/544,718以及于2017年8月11日提交的国际申请号PCT/US2017/046637的优先权,其内容均通过引用其整体并入本申请。
2.发明领域
本发明涉及某些贝壳杉烯氧化酶(KO),包含所述贝壳杉烯氧化酶的组合物,包含所述贝壳杉烯氧化酶的宿主细胞,及其用于生成瑞鲍迪苷(包括瑞鲍迪苷D和瑞鲍迪苷M)的方法。
3.发明背景
需要源自天然来源的零热量甜味剂来限制高糖消耗(例如,糖尿病类和肥胖症)的不良影响。瑞鲍迪苷M(RebM)是由甜叶菊植物(Stevia rebaudiana Bertoni)生成的许多甜味化合物之一。在所有的瑞鲍迪苷中,RebM具有最高的效力(比蔗糖甜约200-300倍),口感最纯净。然而,RebM仅由甜叶菊植物少量生成,并且仅占甜菊糖苷(steviol glycoside)总含量的一小部分(<1.0%),Ohta et al.,2010,J.Appl.Glycosci.,57,199-209(2010)。因此,希望使用生物技术途径来生成RebM,从而使其能够大量且高纯度地生成。
为了使用生物技术经济地生成产品,从原料到产品的生物转化中的每个步骤需有利地具有高转化效率(理想地>90%)。在我们生成RebM的酵母工程中,我们在RebM的途径中发现了明显的局限性,所述途径可将内根-贝壳杉烯(ent-kaurene)转化为异贝壳杉烯酸(kaurenoic acid)(图1A和图1B)。
KO酶存在于各种植物中,并且通常用于生成植物激素赤霉素。植物细胞中赤霉素的含量比工业生产酵母中生成的RebM的含量低几个数量级,因此,大多KO酶不能承载商业生产RebM所需的高通量。通常,来自甜叶菊(Stevia rebaudiana(Sr.KO))的KO酶(Sr.KO)已被用于在经工程化以生成RebM的酵母中将内根-贝壳杉烯转化为异贝壳杉烯酸。传统的看法是此植物生成高水平的甜菊糖苷,因此所述Sr.KO酶应该已进化为比大多数其他KO酶具有更高的转化率或处理更高的通量。
在具有高碳通量以生成RebM的酵母菌株中,发现所述Sr.KO对异贝壳杉烯酸的转化效率低(25.6%),并且形成了很高水平的上游中间代谢物(内根-贝壳杉烯、贝壳杉烯醇、和贝壳杉烯醛)(图1C)。
为了高效且高纯度地生成RebM,需要能够高效生成异贝壳杉烯酸的改进酶。本发明提供的组合物和方法满足了此种需求,并且还提供了相关优点。
4.发明摘要
本发明提供了改进的将贝壳杉烯转化为异贝壳杉烯酸的组合物和方法。所述这些组合物和方法部分基于令人惊奇的发现,即某些贝壳杉烯氧化酶(KO)能够以非常高的效率将贝壳杉烯转化为异贝壳杉烯酸。假设市场对RebM的需求为每年50亿吨,即使使用新的KO进行应变性能方面的适度改进(例如,改进了10%),则也可能在未来节省超过一千万美元的生产成本。
本发明所述的某些KO还能够生成含有很少或不含残留贝壳杉烯醇或贝壳杉烯醛的异贝壳杉烯酸。如此,在某些实施方案,本发明所述的组合物和方法可降低下游加工成本以得到具有高产量甜菊糖苷类化合物(例如RebM)的组合物。
一方面,本发明提供了经遗传修饰的宿主细胞及其用于生成工业上有用的化合物的方法。一方面,本发明提供了经遗传修饰的宿主细胞,其包含:编码豌豆(Pisum sativum)贝壳杉烯氧化酶的异源核酸。在一些实施方案,所述经遗传修饰的宿主细胞还包含能够生成甜菊醇和/或甜菊糖苷类化合物的一种或多种酶途径。
在某些实施方案,本发明提供了经遗传修饰的宿主细胞,其包含编码贝壳杉烯氧化酶的异源核酸,所述贝壳杉烯氧化酶包含与豌豆(Pisum sativum)贝壳杉烯氧化酶的序列(例如,SEQ ID NO:1)具有至少80%、85%、90%、或95%序列同一性的氨基酸序列。在某些实施方案,所述经遗传修饰的宿主细胞能够以大于30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、或98%的效率将贝壳杉烯转化为异贝壳杉烯酸。在某些实施方案,所述经遗传修饰的宿主细胞是酵母细胞。在某些实施方案,所述经遗传修饰的宿主细胞是酿酒酵母(Saccharomyces cerevisiae)细胞。
另一方面,本发明提供了生成异源甜菊糖苷的方法,所述方法包含:在适于制备所述甜菊糖苷化合物的条件下,在含有碳源的培养基中培养本发明提供的能够生成本发明所述甜菊糖苷的经遗传修饰的宿主细胞群;和从所述培养基中回收所述甜菊糖苷。在一些实施方案,异源甜菊糖苷是选自由RebD和RebM组成的组。
另一方面,本发明提供了生成RebD的方法,所述方法包含:在适于制备所述RebD的条件下,在含有碳源的培养基中培养本发明提供的能够生成本发明所述RebD的经遗传修饰的宿主细胞群;和从所述培养基中回收所述RebD。
另一方面,本发明提供了生成RebM的方法,所述方法包含:在适于制备所述RebM的条件下,在含有碳源的培养基中培养本发明提供的能够生成本发明所述RebM的经遗传修饰的宿主细胞群;和从所述培养基中回收所述RebM。
另一方面,本发明提供了生成异贝壳杉烯酸的方法,所述方法包含:在适于形成异贝壳杉烯酸的条件下,使贝壳杉烯与本发明所述的贝壳杉烯氧化酶接触,所述贝壳杉烯氧化酶能够将贝壳杉烯转化为异贝壳杉烯酸。
在一些实施方案,所述宿主细胞是酵母细胞。在一些实施方案,所述酵母是酿酒酵母(Saccharomyces cerevisiae)。在一些实施方案,所述宿主细胞以高效率生成RebD或RebM。在一些实施方案,与不含所述豌豆(Pisum sativum)贝壳杉烯氧化酶的酵母细胞相比,所述宿主细胞生成增加量的RebD或RebM。
5.附图简要说明
图1A提供了法呢基焦磷酸转化为甜菊醇的示意图。
图1B提供了香叶基香叶基焦磷酸(GGPP)转化为RebM的示意图。
图1C提供了将内根-贝壳杉烯转化为贝壳杉烯醇,再将贝壳杉烯醇转化为贝壳杉烯醛,然后将贝壳杉烯醛转化为异贝壳杉烯酸的示意图。
图1D提供了甲羟戊酸途径的示意图。
图2提供了甜菊醇转化为RebM的示例性途径。
图3A提供了“着陆垫(landingpad)”设计的示意图,所述设计用于插入单独的KO酶以筛选酵母中异贝壳杉烯酸的生成。
图3B提供了用于筛选酵母中异贝壳杉烯酸生成转化的KO遗传构建体的示意图。
图4提供了图解说明在体内用不同的贝壳杉烯氧化酶生成的异贝壳杉烯酸的相对增加量的图表。
图5提供了条形图,其图解说明了将内根-贝壳杉烯、贝壳杉烯醇和贝壳杉烯醛的相对水平归一化为在高通量生成RebM的酵母菌株中体内生成的异贝壳杉烯酸的总量。
图6提供了图解说明含有Sr.KO或Ps.KO的高通量菌株中RebM滴度的相对水平的图表。
6.具体实施方式
6.1术语定义
本发明使用的术语“异源的/异源性/异源”是指通常在自然界中不存在的物质。术语“异源核苷酸序列”是指自然界中在给定细胞中通常不存在的核苷酸序列。因此,异源核苷酸序列可以是:(a)相对于其宿主细胞是外源的(即,对所述细胞而言是“外源的”);(b)天然存在于所述宿主细胞中(即“内源性/內源的/內源”),但在所述细胞中以非天然量存在(即,比所述宿主细胞中天然存在的量更多或更少);或(c)天然存在于所述宿主细胞中,但位于其天然基因座之外。术语“异源酶”是指自然界中通常在给定细胞中不存在的酶。所述术语包括以下酶:(a)对给定细胞而言是外源的(即,由非天然存在于所述宿主细胞中或不在所述宿主细胞的给定环境中天然存在的核苷酸序列编码);和(b)天然存在于所述宿主细胞中(例如,所述酶由细胞内源的核苷酸序列编码),但在所述宿主细胞中以非天然量(例如,大于或小于所述天然存在的量)生成。
另一方面,本发明使用的术语“天然的”或“内源的/内源性/內源”涉及分子,特别是酶和核酸,表示在它们起源或在自然界中发现的生物体中表达的分子,与表达水平无关,所述表达水平可低于、等于或高于天然微生物体中分子的表达水平。应理解,天然酶或天然多核苷酸的表达可在重组微生物中进行修饰。
本发明使用的术语“亲本细胞”是指与本发明公开的经遗传修饰的宿主细胞具有相同遗传背景的细胞,除了其不包含工程化到所述经修饰的宿主细胞中的一种或多种特定遗传修饰,譬如,选自由以下组成的组的一种或多种修饰:甜菊醇途径的酶的异源表达,甜菊糖苷途径的酶的异源表达,香叶基香叶基焦磷酸合酶的异源表达,柯巴基焦磷酸合酶的异源表达,贝壳杉烯合酶的异源表达,贝壳杉烯氧化酶(例如,豌豆(Pisum sativum)贝壳杉烯氧化酶)的异源表达,甜菊醇合酶(异贝壳杉烯酸羟化酶)的异源表达,细胞色素P450还原酶的异源表达,UGT74G1的异源表达,UGT76G1的异源表达,UGT85C2的异源表达,91D的异源表达,和UGT40087或其变体的异源表达。
本发明使用的术语“天然存在的”是指天然存在的那些物质。譬如,存在于生物体中的贝壳杉烯氧化酶是天然存在的贝壳杉烯氧化酶,其可从自然界中的来源分离得到并且在实验室中未被人有意修饰。相反,本发明使用的术语“非天然存在的”是指在自然界中未发现但通过人为干预生成的那些物质。
术语“培养基”是指培养基和/或发酵培养基。
术语“发酵组合物”是指组合物,所述组合物包含经遗传修饰的宿主细胞和由所述经遗传修饰的宿主细胞生成的产物或代谢物。发酵组合物的实例是全细胞培养液,其可以是容器(例如,烧瓶、平板或发酵罐)的全部内容物,包括细胞、水相和由所述经遗传修饰的宿主细胞生成的化合物。
本发明使用的术语“生成量”通常是指由本发明提供的经遗传修饰的宿主细胞生成的甜菊醇或甜菊糖苷的量。在一些实施方案,生成量表示为由所述宿主细胞生成的甜菊醇或甜菊糖苷的产量。在其他实施方案,生成量表示为生成所述甜菊醇或甜菊糖苷时所述宿主细胞的生产率。
本发明使用的术语“生产率/生产力”是指由宿主细胞生成甜菊醇或甜菊糖苷的量,表示为每单位量的发酵液中生成的甜菊醇或甜菊糖苷的量(按重量计),其中所述宿主细胞根据时间(每小时)进行培养(按体积计)。
本发明使用的术语“产量/产率”是指由宿主细胞生成的甜菊醇或甜菊糖苷的量,表示为宿主细胞消耗的每单位量的碳源生成的甜菊醇或甜菊糖苷的量,按重量计。
本发明使用的术语化合物(例如,RebM2、甜菊糖苷类化合物或其他化合物)的“不可检测水平”是指化合物的水平/含量太低而不能通过标准技术来测定和/或分析所述化合物。譬如,所述术语包括由实施例6中所述的分析方法无法检测的化合物的水平。
术语“贝壳杉烯(kaurene)”是指化合物贝壳杉烯,包括贝壳杉烯的任何立体异构体。在特定实施方案,所述术语是指在本领域中称为内根-贝壳杉烯的对映异构体。在特定实施方案,所述术语是指具有以下结构的化合物:
术语“贝壳杉烯醇(kaurenol)”是指化合物贝壳杉烯醇,包括贝壳杉烯醇的任何立体异构体。在特定实施方案,所述术语是指在本领域中称为内根-贝壳杉烯醇的对映异构体。在特定实施方案,所述术语是指具有以下结构的化合物:
术语“贝壳杉烯醛(kaurenal)”是指化合物贝壳杉烯醛,包括贝壳杉烯醛的任何立体异构体。在特定实施方案,所述术语是指在本领域中称为内根-贝壳杉烯醛的对映异构体。在特定实施方案,所述术语是指具有以下结构的化合物:
术语“异贝壳杉烯酸(kaurenoic acid)”是指化合物异贝壳杉烯酸,包括异贝壳杉烯酸的任何立体异构体。在特定实施方案,所述术语是指在本领域中称为内根-异贝壳杉烯酸的对映异构体。在特定实施方案,所述术语是指具有以下结构的化合物:
本发明使用的术语“甜菊糖苷/甜菊糖苷类化合物”是指甜菊醇的糖苷,包括但不限于,天然存在的甜菊糖苷类化合物,例如天然存在的甜菊单糖苷、甜菊双糖苷、甜茶苷、杜克苷B、杜克苷A、瑞鲍迪苷B、瑞鲍迪苷G、甜菊苷(stevioside)、瑞鲍迪苷C、瑞鲍迪苷F、瑞鲍迪苷A、瑞鲍迪苷I、瑞鲍迪苷E、瑞鲍迪苷H、瑞鲍迪苷L、瑞鲍迪苷K、瑞鲍迪苷J、瑞鲍迪苷M、瑞鲍迪苷D、瑞鲍迪苷N、瑞鲍迪苷O,合成甜菊糖苷类化合物例如酶促糖基化的甜菊糖苷类化合物及其组合。
本发明使用的术语“变体”是指通过氨基酸插入、缺失、突变和/或置换而不同于具体列举的“参考”多肽(例如,野生型序列)的多肽,但保留与所述参考多肽基本相似的活性。在一些实施方案,所述变体通过重组DNA技术(例如诱变)而产生。在一些实施方案,变体多肽与其参考多肽的不同之处在于一个碱基残基置换另一个碱基残基(即,Arg置换Lys),一个疏水残基置换另一个疏水残基(即,Leu置换Ile),或一个芳香族残基置换另一个芳香族残基(即,Phe置换Tyr)等。在一些实施方案,变体包括类似物,其中实现保守置换导致所述参考序列的基本结构类似。此类保守置换的实例包括但不限于,谷氨酸置换天冬氨酸,反之亦然;谷氨酰胺置换天冬酰胺,反之亦然;丝氨酸置换苏氨酸,反之亦然;赖氨酸置换精氨酸,反之亦然;或者任何异亮氨酸、缬氨酸或亮氨酸之间的彼此置换。
在上下文中或两个或更多个核酸或蛋白质序列中,本发明使用的术语“序列同一性”或“同一性百分比”是指两个或更多个序列或子序列是相同,或所述序列或子序列具有特定百分比的相同的氨基酸残基或核苷酸。譬如,当进行比较和比对以在比较窗口上进行最大对应,或者使用序列比较算法或通过手动比对和目视检查进行测定的指定区域时,所述序列可在所述指定区域与参考序列具有至少60%,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或更高的同一性。譬如,通过计算所述序列中相同核苷酸(或氨基酸残基)的数量除以总核苷酸(或氨基酸残基)的长度减去任何空位(gap)的长度的比值来确定同一性百分比。
为方便起见,可使用本领域已知的计算机程序和数学算法来确定两个序列之间的同一性程度。计算序列同一性百分比的此类算法通常考虑所述比较区域上的序列空位和错配。比较和比对序列的程序,如Clustal W(序列比对W)(Thompson et al.,(1994)NucleicAcids Res.,22:4673-4680),Clustal Omega(序列比对ω)(Sievers et al.,(2011)Molecular Systems Biology.,7:539),ALIGN(Myers et al.,(1988)CABIOS,4:11-17),FASTA(Pearson et al.,(1988)PNAS,85:2444-2448;Pearson(1990),Methods Enzymol.,183:63-98),以及空位的BLAST(Altschul et al.,(1997)Nucleic Acids Res.,25:3389-3402),均可用于此目的。所述BLAST或BLAST 2.0(Altschul et al.,J.Mol.Biol.215:403-10,1990)可从若干来源得到,包括国家生物信息中心(NCBI)和因特网,用于与序列分析程序BLASTP、BLASTN、BLASTX、TBLASTN和TBLASTX结合使用。更多信息可从NCBI网站上获悉。
在一些实施方案,序列比对和同一性百分比计算可使用BLAST程序采用其标准默认参数来确定。对于核苷酸序列比对和序列同一性计算,BLASTN程序可以其默认参数(空位开放罚分(Gap opening penalty)=5,空位延伸罚分(Gap extension penalty)=2,核匹配(Nucleic match)=1,核不匹配(Nucleic mismatch)=-3,期望值(Expectation value)=10.0,字大小(Word size)=11,查询范围中的最大匹配数=0)进行使用。对于多肽序列比对和序列同一性计算,BLASTP程序可以其默认参数(比对矩阵(Alignment matrix)=BLOSUM62;空位损失(Gap costs):存在(Existence)=11,扩展(Extension)=1;组成调整(Compositional adjustments)=条件组成得分(Conditional compositional score),矩阵调整;期望值=10.0;字大小(Word size)=6;查询范围中的最大匹配数=0)进行使用。或者,使用以下程序和参数:克隆管理组件(Clone Manager Suite)的比对加强版(AlignPlus)软件,版本5(Sci-Ed软件);DNA比较:总体比较(Global comparison),标准线性评分矩阵(Standard Linear Scoring matrix),不匹配罚分=2,开放空位罚分=4,延伸空位罚分=1。在本发明所述的实施方案中,使用BLASTN或BLASTP程序使用其默认参数来计算序列同一性。氨基酸比较:总体比较,BLOSUM 62评分矩阵。在本发明所述的实施方案中,使用Clustal W使用建议的默认参数进行两个或更多个序列的序列比对(Dealign输入序列:无;Mbed样聚类引导树(Mbed-like clustering guide-tree):是;Mbed样聚类迭代(Mbed-likeclustering iteration):是;组合迭代次数:默认(0);最大引导树迭代(Max guide treeiterations):默认;最大HMM迭代:默认;指令(Order):输入)。
6.2宿主细胞
本发明提供了能够以高效率从贝壳杉烯生成异贝壳杉烯酸的宿主细胞。在某些实施方案,所述宿主细胞可从作为起始物料的贝壳杉烯生成异贝壳杉烯酸。在特定实施方案,所述宿主细胞可从培养基中的碳源生成异贝壳杉烯酸。在特定实施方案,所述宿主细胞可从培养基中的碳源生成异贝壳杉烯酸,并可进一步由所述异贝壳杉烯酸生成RebA或RebD。在特定实施方案,所述宿主细胞可进一步由所述RebD生成瑞鲍迪苷M(RebM)。
在特定实施方案,所述宿主细胞包含豌豆(Pisum sativum)贝壳杉烯氧化酶的酶活性。豌豆贝壳杉烯氧化酶能够高效地将贝壳杉烯转化为异贝壳杉烯酸。在某些实施方案,豌豆贝壳杉烯氧化酶能够以大于30%的效率将贝壳杉烯转化为异贝壳杉烯酸。在某些实施方案,豌豆贝壳杉烯氧化酶能够以大于35%的效率将贝壳杉烯转化为异贝壳杉烯酸。在某些实施方案,豌豆贝壳杉烯氧化酶能够以大于40%的效率将贝壳杉烯转化为异贝壳杉烯酸。在某些实施方案,豌豆贝壳杉烯氧化酶能够以大于95%的效率将贝壳杉烯转化为异贝壳杉烯酸。在某些实施方案,豌豆贝壳杉烯氧化酶能够以大于50%的效率将贝壳杉烯转化为异贝壳杉烯酸。在某些实施方案,豌豆贝壳杉烯氧化酶能够以大于55%的效率将贝壳杉烯转化为异贝壳杉烯酸。在某些实施方案,豌豆贝壳杉烯氧化酶能够以约58%的效率将贝壳杉烯转化为异贝壳杉烯酸。在某些实施方案,豌豆贝壳杉烯氧化酶能够以大于30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、或95%的效率将贝壳杉烯转化为异贝壳杉烯酸。
在某些实施方案,所述宿主细胞能够以大于30%的效率将贝壳杉烯转化为异贝壳杉烯酸。在某些实施方案,所述宿主细胞能够以大于35%的效率将贝壳杉烯转化为异贝壳杉烯酸。在某些实施方案,所述宿主细胞能够以大于40%的效率将贝壳杉烯转化为异贝壳杉烯酸。在某些实施方案,所述宿主细胞能够以大于45%的效率将贝壳杉烯转化为异贝壳杉烯酸。在某些实施方案,所述宿主细胞能够以大于50%的效率将贝壳杉烯转化为异贝壳杉烯酸。在某些实施方案,所述宿主细胞能够以大于55%的效率将贝壳杉烯转化为异贝壳杉烯酸。在某些实施方案,所述宿主细胞能够以约58%的效率将贝壳杉烯转化为异贝壳杉烯酸。在某些实施方案,所述宿主细胞能够以大于30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、或95%的效率将贝壳杉烯转化为异贝壳杉烯酸。
转化效率可通过本领域技术人员显而易见的任何技术进行测定。在某些实施方案,转化效率可通过在适于形成异贝壳杉烯酸的条件下,使贝壳杉烯与酶或宿主细胞接触来测定。效率可通过将所生成的异贝壳杉烯酸的摩尔量与所得组合物中的贝壳杉烯和异贝壳杉烯酸的总量进行比较来测定。效率还可通过将所得组合物中的异贝壳杉烯酸和异贝壳杉烯酸的下游产物的总量与贝壳杉烯、贝壳杉烯醇、贝壳杉烯醛、异贝壳杉烯酸和异贝壳杉烯酸的下游产物的总量进行比较来测定。譬如,包含图5中所示Ps.KO的菌株的转化效率是通过将所得组合物(即,甜菊醇,1葡萄糖+甜菊醇,2葡萄糖+甜菊醇,3葡萄糖+甜菊醇,4葡萄糖+甜菊醇,5葡萄糖+甜菊醇,和6葡萄糖+甜菊醇)中图2中所示的异贝壳杉烯酸和所有下游化合物的总量与图2中所示的贝壳杉烯、贝壳杉烯醇、贝壳杉烯醛、异贝壳杉烯酸和异贝壳杉烯酸的所有下游产物的总量进行比较来测定。
在某些实施方案,本发明提供了包含贝壳杉烯氧化酶的宿主细胞,所述贝壳杉烯氧化酶包含SEQ ID NO:1的氨基酸序列。在某些实施方案,本发明提供了包含贝壳杉烯氧化酶的宿主细胞,所述贝壳杉烯氧化酶包含与SEQ ID NO:1的氨基酸序列基本相同的氨基酸序列。在某些实施方案,本发明提供了包含贝壳杉烯氧化酶的宿主细胞,所述贝壳杉烯氧化酶包含与SEQ ID NO:1的氨基酸序列具有至少60%同一性的氨基酸序列。在某些实施方案,本发明提供了包含贝壳杉烯氧化酶的宿主细胞,所述贝壳杉烯氧化酶包含与SEQ ID NO:1的氨基酸序列具有至少65%同一性的氨基酸序列。在某些实施方案,本发明提供了包含贝壳杉烯氧化酶的宿主细胞,所述贝壳杉烯氧化酶包含与SEQ ID NO:1的氨基酸序列具有至少70%同一性的氨基酸序列。在某些实施方案,本发明提供了包含贝壳杉烯氧化酶的宿主细胞,所述贝壳杉烯氧化酶包含与SEQ ID NO:1的氨基酸序列具有至少75%同一性的氨基酸序列。在某些实施方案,本发明提供了包含贝壳杉烯氧化酶的宿主细胞,所述贝壳杉烯氧化酶包含与SEQ ID NO:1的氨基酸序列具有至少80%同一性的氨基酸序列。在某些实施方案,本发明提供了包含贝壳杉烯氧化酶的宿主细胞,所述贝壳杉烯氧化酶包含与SEQ IDNO:1的氨基酸序列具有至少85%同一性的氨基酸序列。在某些实施方案,本发明提供了包含贝壳杉烯氧化酶的宿主细胞,所述贝壳杉烯氧化酶包含与SEQ ID NO:1的氨基酸序列具有至少90%同一性的氨基酸序列。在某些实施方案,本发明提供了包含贝壳杉烯氧化酶的宿主细胞,所述贝壳杉烯氧化酶包含与SEQ ID NO:1的氨基酸序列具有至少95%同一性的氨基酸序列。在某些实施方案,本发明提供了包含贝壳杉烯氧化酶的宿主细胞,所述贝壳杉烯氧化酶包含与SEQ ID NO:1的氨基酸序列具有至少96%同一性的氨基酸序列。在某些实施方案,本发明提供了包含贝壳杉烯氧化酶的宿主细胞,所述贝壳杉烯氧化酶包含与SEQID NO:1的氨基酸序列具有至少97%同一性的氨基酸序列。在某些实施方案,本发明提供了包含贝壳杉烯氧化酶的宿主细胞,所述贝壳杉烯氧化酶包含与SEQ ID NO:1的氨基酸序列具有至少98%同一性的氨基酸序列。在某些实施方案,本发明提供了包含贝壳杉烯氧化酶的宿主细胞,所述贝壳杉烯氧化酶包含与SEQ ID NO:1的氨基酸序列具有至少99%同一性的氨基酸序列。在某些实施方案,本发明提供了包含贝壳杉烯氧化酶的宿主细胞,所述贝壳杉烯氧化酶包含与SEQ ID NO:1的氨基酸序列具有至少60%、至少99%、或至少60%和99%之间任一百分比同一性的氨基酸序列。
在某些实施方案,本发明提供了包含贝壳杉烯氧化酶的宿主细胞,所述贝壳杉烯氧化酶包含本发明所述的氨基酸序列,并能够将贝壳杉烯转化为异贝壳杉烯酸。在某些实施方案,本发明提供了包含贝壳杉烯氧化酶的宿主细胞,所述贝壳杉烯氧化酶包含本发明所述的氨基酸序列,并能够氧化各个贝壳杉烯、贝壳杉烯醇、和贝壳杉烯醛的19位。在某些实施方案,本发明提供了包含贝壳杉烯氧化酶的宿主细胞,所述贝壳杉烯氧化酶能够以大于30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、或97%的效率将贝壳杉烯转化为异贝壳杉烯酸,和其中所述贝壳杉烯氧化酶包含与SEQ IDNO:1的氨基酸序列具有至少95%序列同一性的氨基酸序列。
在某些实施方案,本发明提供了包含核酸的宿主细胞,所述核酸编码包含SEQ IDNO:1的氨基酸序列的豌豆(Pisum sativum)贝壳杉烯氧化酶。在某些实施方案,本发明提供了包含核酸的宿主细胞,所述核酸编码包含与SEQ ID NO:1的氨基酸序列基本相同的氨基酸序列的多肽。在某些实施方案,本发明提供了包含核酸的宿主细胞,所述核酸编码包含与SEQ ID NO:1的氨基酸序列具有至少60%同一性的氨基酸序列的多肽。在某些实施方案,本发明提供了包含核酸的宿主细胞,所述核酸编码包含与SEQ ID NO:1的氨基酸序列具有至少65%同一性的氨基酸序列的多肽。在某些实施方案,本发明提供了包含核酸的宿主细胞,所述核酸编码包含与SEQ ID NO:1的氨基酸序列具有至少70%同一性的氨基酸序列的多肽。在某些实施方案,本发明提供了包含核酸的宿主细胞,所述核酸编码包含与SEQ ID NO:1的氨基酸序列具有至少75%同一性的氨基酸序列的多肽。在某些实施方案,本发明提供了包含核酸的宿主细胞,所述核酸编码包含与SEQ ID NO:1的氨基酸序列具有至少80%同一性的氨基酸序列的多肽。在某些实施方案,本发明提供了包含核酸的宿主细胞,所述核酸编码包含与SEQ ID NO:1的氨基酸序列具有至少85%同一性的氨基酸序列的多肽。在某些实施方案,本发明提供了包含核酸的宿主细胞,所述核酸编码包含与SEQ ID NO:1的氨基酸序列具有至少90%同一性的氨基酸序列的多肽。在某些实施方案,本发明提供了包含核酸的宿主细胞,所述核酸编码包含与SEQ ID NO:1的氨基酸序列具有至少95%同一性的氨基酸序列的多肽。在某些实施方案,本发明提供了包含核酸的宿主细胞,所述核酸编码包含与SEQ ID NO:1的氨基酸序列具有至少96%同一性的氨基酸序列的多肽。在某些实施方案,本发明提供了包含核酸的宿主细胞,所述核酸编码包含与SEQ ID NO:1的氨基酸序列具有至少97%同一性的氨基酸序列的多肽。在某些实施方案,本发明提供了包含核酸的宿主细胞,所述核酸编码包含与SEQ ID NO:1的氨基酸序列具有至少98%同一性的氨基酸序列的多肽。在某些实施方案,本发明提供了包含核酸的宿主细胞,所述核酸编码包含与SEQ ID NO:1的氨基酸序列具有至少99%同一性的氨基酸序列的多肽。在某些实施方案,本发明提供了包含核酸的宿主细胞,所述核酸编码包含与SEQ ID NO:1的氨基酸序列具有至少60%、至少99%、或60%和99%之间任一百分比同一性的氨基酸序列的多肽。
在某些实施方案,本发明提供了包含异源核酸的宿主细胞,所述异源核酸包含SEQID NO:14的核苷酸序列,所述异源核酸编码具有SEQ ID NO:1的序列的豌豆(Pisumsativum)贝壳杉烯氧化酶。在某些实施方案,本发明提供了包含异源核酸的宿主细胞,所述异源核酸包含与SEQ ID NO:14的核苷酸序列具有至少60%,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,至少96%,至少97%,至少98%,或至少99%同一性的核苷酸序列。
在某些实施方案,所述宿主细胞包含上述豌豆(Pisum sativum)贝壳杉烯氧化酶多肽的变体。在某些实施方案,相对于豌豆(Pisum sativum)贝壳杉烯氧化酶多肽,所述变体可包含多达15、10、9、8、7、6、5、4、3、2、或1个氨基酸置换。在某些实施方案,相对于豌豆(Pisum sativum)贝壳杉烯氧化酶多肽,所述变体可包含多达15、10、9、8、7、6、5、4、3、2、或1个保守氨基酸置换。在某些实施方案,本发明所述的任何核酸可以例如通过密码子优化对所述宿主细胞进行优化。
在本发明所述的实施方案中,任何合适的方法可用于确定两种多肽的相应氨基酸位置或相应环路(loop)位置。在某些实施方案,贝壳杉烯氧化酶和参考序列SEQ ID NO:1的所述序列均可采用Clustal(W)使用其默认参数进行比对。在其他实施方案,贝壳杉烯氧化酶和参考序列SEQ ID NO:1的所述序列均可采用结构比对()进行比对,例如SWISS-MODEL,其是蛋白质结构同源性建模服务器,可通过ExPASy网络服务器或DeepView(Swiss Pdb-Viewer)程序访问。
在某些实施方案,贝壳杉烯如图1C所示。在某些实施方案,豌豆(Pisum sativum)贝壳杉烯氧化酶或变体豌豆(Pisum sativum)贝壳杉烯氧化酶能够催化氧化贝壳杉烯的C-19位以形成贝壳杉烯醇。在某些实施方案,豌豆贝壳杉烯氧化酶或变体豌豆贝壳杉烯氧化酶能够催化氧化贝壳杉烯醇的C-19位以形成贝壳杉烯醛。在某些实施方案,豌豆贝壳杉烯氧化酶或变体豌豆贝壳杉烯氧化酶能够催化氧化贝壳杉烯醛的C-19位以形成异贝壳杉烯酸。在某些实施方案,豌豆贝壳杉烯氧化酶或变体豌豆贝壳杉烯氧化酶能够催化氧化贝壳杉烯的C-19位以形成贝壳杉烯醇,氧化贝壳杉烯醇的C-19位以形成贝壳杉烯醛,以及催化氧化贝壳杉烯醛的C-19位以形成异贝壳杉烯酸。
在某些实施方案,RebD如图2所示。在某些实施方案,所述宿主细胞还包含能够将异贝壳杉烯酸转化为甜菊醇的一种或多种酶。在某些实施方案,所述宿主细胞还包含能够将甜菊醇转化为一种或多种甜菊糖苷类化合物的一种或多种酶。在某些实施方案,所述宿主细胞还包含能够将RebA转化为RebD的一种或多种酶。在某些实施方案,所述宿主细胞还包含能够将RebD转化为RebM的一种或多种酶。
尽管所述宿主细胞的豌豆(Pisum sativum)贝壳杉烯氧化酶或任何变体豌豆(Pisum sativum)贝壳杉烯氧化酶接受以贝壳杉烯为底物,但贝壳杉烯的来源可以是本领域技术人员认为合适的任何来源。在某些实施方案,豌豆贝壳杉烯氧化酶或任何变体豌豆贝壳杉烯氧化酶可与贝壳杉烯接触。在某些实施方案,所述宿主细胞可与贝壳杉烯接触。在某些实施方案,豌豆贝壳杉烯氧化酶或任何变体豌豆贝壳杉烯氧化酶可与包含贝壳杉烯、贝壳杉烯醇、和贝壳杉烯醛中的一种或多种的组合物接触。在某些实施方案,所述组合物包含贝壳杉烯。在某些实施方案,所述组合物包含贝壳杉烯醇。在某些实施方案,所述组合物包含贝壳杉烯醛。在某些实施方案,所述组合物衍生自从甜叶菊(Stevia rebaudiana)叶中分离的天然产物。在某些实施方案,所述组合物是微生物衍生的。在某些实施方案,可使所述宿主细胞与包含一种或多种碳源的组合物接触。
在某些实施方案,可采用本领域已知的任何合适的方法筛选适于催化所需反应的任何变体豌豆(Pisum sativum)贝壳杉烯氧化酶。例如,可通过表达编码变体豌豆贝壳杉烯氧化酶的异源核酸并筛选生成能够在底物的所需位置(例如,贝壳杉烯、贝壳杉烯醇、和/或贝壳杉烯醛的C-19位)催化氧化的功能性变体豌豆贝壳杉烯氧化酶的细胞,在体内检测合适的变体豌豆贝壳杉烯氧化酶。示例性筛选方法记载于以下实施例中。在另一实施例,可通过使变体豌豆贝壳杉烯氧化酶与底物(例如,贝壳杉烯、贝壳杉烯醇、和/或贝壳杉烯醛)接触来体外筛选合适的变体豌豆贝壳杉烯氧化酶。在此实施例中,可通过测定异贝壳杉烯酸、甜菊醇或甜菊糖苷(例如RebD)的存在来进行检测,以确定变体豌豆贝壳杉烯氧化酶是否是合适的酶。可通过LC-MS或本领域其他已知方法来分析反应,参见例如WO 2013/022989。
在某些实施方案,如果变体豌豆(Pisum sativum)贝壳杉烯氧化酶在体内能够以大于30%、40%、50%、60%、70%、80%、90%、95%、96%、或97%的效率将贝壳杉烯转化为异贝壳杉烯酸,则所述变体豌豆贝壳杉烯氧化酶被认为适合于将贝壳杉烯转化为异贝壳杉烯酸。
在某些实施方案,如果变体豌豆(Pisum sativum)贝壳杉烯氧化酶在体内能够以大于30%、40%、50%、60%、70%、80%、90%、95%、96%、或97%的效率将贝壳杉烯转化为贝壳杉烯醇,则所述变体豌豆贝壳杉烯氧化酶被认为适合于将贝壳杉烯转化为贝壳杉烯醇。
在某些实施方案,如果变体豌豆(Pisum sativum)贝壳杉烯氧化酶在体内能够以大于30%、40%、50%、60%、70%、80%、90%、95%、96%、或97%的效率将贝壳杉烯醇转化为贝壳杉烯醛,则所述变体豌豆贝壳杉烯氧化酶被认为适合于将贝壳杉烯醇转化为贝壳杉烯醛。
在某些实施方案,如果变体豌豆(Pisum sativum)贝壳杉烯氧化酶在体内能够以大于30%、40%、50%、60%、70%、80%、90%、95%、96%、或97%的效率将贝壳杉烯醛转化为异贝壳杉烯酸,则所述变体豌豆贝壳杉烯氧化酶被认为适合于将贝壳杉烯醛转化为异贝壳杉烯酸。
在某些实施方案,如果体内转化效率大于30%、40%、50%、60%、70%、80%、90%、95%、96%、或97%,则变体豌豆(Pisum sativum)贝壳杉烯氧化酶被认为适合于将贝壳杉烯转化为异贝壳杉烯酸,其中所述转化效率是通过在所得组合物中图2中所示的异贝壳杉烯酸和所有下游化合物的总量除以图2中所示的贝壳杉烯、贝壳杉烯醇、贝壳杉烯醛、异贝壳杉烯酸、和所有下游化合物的总量(乘以100%)来计算得到。
在有利的实施方案中,所述宿主细胞可包含能够制备贝壳杉烯的一种或多种酶途径,所述途径可单独或一起采用。在某些实施方案,所述宿主细胞包含能够将香叶基香叶基焦磷酸转化为贝壳杉烯的一种或多种酶。有用的酶和编码所述酶的核酸均是本领域技术人员已知的。在某些实施方案,所述宿主细胞包含能够将香叶基香叶基焦磷酸转化为贝壳杉烯的一种或多种酶。在进一步有利的实施方案中,所述宿主细胞包含能够将异贝壳杉烯酸转化为甜菊醇和/或甜菊糖苷类化合物的一种或多种酶途径,所述途径可单独或一起采用。有用的酶和编码所述酶的核酸均是本领域技术人员已知的。特别有用的酶和核酸均描述于以下章节中,并进一步描述于例如US 2014/0329281A1、US 2014/0357588A1、US 2015/0159188、WO 2016/038095A2和US 2016/0198748A1中。
在进一步的实施方案中,所述宿主细胞还包含能够从碳源制备香叶基香叶基焦磷酸的一种或多种酶。所述这些包括DXP途径的酶类和MEV途径的酶类。有用的酶和编码所述酶的核酸均是本领域技术人员已知的。每种途径的示例性酶类描述如下,并进一步描述于例如US 2016/0177341A1中。所述MEV途径也如图1D所示。
在某些实施方案,所述另外的酶是天然的。在有利的实施方案中,所述另外的酶是异源的。在某些实施方案,两种酶可在一种多肽中进行组合。
6.3非天然存在的贝壳杉烯氧化酶多肽和核酸
另一方面,本发明提供了非天然存在的变体贝壳杉烯氧化酶,所述变体贝壳杉烯氧化酶包括与参考序列(例如,SEQ ID NO:1)相比的氨基酸残基的修饰,但仍保留贝壳杉烯氧化酶将贝壳杉烯转化为异贝壳杉烯酸,将贝壳杉烯转化为贝壳杉烯醇、将贝壳杉烯醇转化为贝壳杉烯醛、和/或将贝壳杉烯醛转化为异贝壳杉烯酸的活性。在某些实施方案,与参考序列(例如,SEQ ID NO:1)相比,非天然存在的变体贝壳杉烯氧化酶可在某些氨基酸位置或位点包括多达20、15、10、9、8、7、6、5、4、3、2或1个氨基酸置换、缺失、添加和/或插入。在某些实施方案,非天然存在的变体贝壳杉烯氧化酶包含本发明所述的任何变体贝壳杉烯氧化酶。
另一方面,本发明提供了非天然存在的变体贝壳杉烯氧化酶,所述贝壳杉烯氧化酶包括与参考序列(例如,SEQ ID NO:15)相比的核酸残基的修饰,然而,当翻译成蛋白质时,所述蛋白质保持贝壳杉烯氧化酶将贝壳杉烯转化为异贝壳杉烯酸,将贝壳杉烯转化为贝壳杉烯醇、将贝壳杉烯醇转化为贝壳杉烯醛、和/或将贝壳杉烯醛转化为异贝壳杉烯酸的活性。在某些实施方案,非天然存在的变体贝壳杉烯氧化酶可编码本发明所述的任何变体贝壳杉烯氧化酶。
6.4细胞株
本发明提供的宿主细胞有用的组合物和方法包括古细菌细胞、原核细胞或真核细胞。
合适的原核宿主包括但不限于,多种革兰氏阳性、革兰氏阴性或革兰氏变种细菌中的任一种。实例包括但不限于,属于以下属的细胞:土壤杆菌属(Agrobacterium),脂环酸芽孢杆菌属(Alicyclobacillus),鱼腥藻属(Anabaena),蓝细菌属(Anacystis),节细菌属(Arthrobacter),固氮菌属(Azobacter),芽孢杆菌属(Bacillus),短杆菌属(Brevibacterium),着色菌属(Chromatium),梭菌属(Clostridium),棒状杆菌属(Corynebacterium),肠杆菌属(Enterobacter),欧文氏菌属(Erwinia),埃希氏杆菌属(Escherichia),乳酸杆菌属(Lactobacillus),乳球菌属(Lactococcus),中慢生根瘤菌属(Mesorhizobium),甲基杆菌属(Methylobacterium),细杆菌属(Microbacterium),席藻属(Phormidium),假单胞菌属(Pseudomonas),红细菌属(Rhodobacter),红假单胞菌属(Rhodopseudomonas),红螺菌属(Rhodospirillum),红球菌属(Rhodococcus),沙门氏菌属(Salmonella),栅藻属(Scenedesmun),沙雷氏菌属(Serratia),志贺氏菌属(Shigella),葡萄球菌属(Staphlococcus),链霉菌属(Strepromyces),Synnecoccus和发酵单胞菌属(Zymomonas)。原核菌株的实例包括但不限于:枯草芽孢杆菌(Bacillus subtilis),解淀粉芽孢杆菌(Bacillus amyloliquefacines),产氨短杆菌(Brevibacterium ammoniagenes),嗜氨短杆菌(Brevibacterium immariophilum),拜氏梭菌(Clostridium beigerinckii),阪崎肠杆菌(Enterobactersakazakii),大肠杆菌(Escherichia coli),乳酸乳球菌(Lactococcus lactis),百脉根根瘤菌(Mesorhizobium loti),绿脓假单胞菌(Pseudomonas aeruginosa),迈氏假单胞菌(Pseudomonas mevalonii),普迪卡假单胞菌(Pseudomonas pudica),荚膜红细菌(Rhodobactercapsulatus),类球红细菌(Rhodobactersphaeroides),深红红螺菌(Rhodospirillum rubrum),肠道沙门氏菌(Salmonella enterica),伤寒沙门氏菌(Salmonella typhi),鼠伤寒沙门氏菌(Salmonella typhimurium),痢疾志贺氏杆菌(Shigella dysenteriae),福氏志贺菌(Shigella flexneri),宋内志贺菌(Shigella sonne)和金黄色葡萄球菌(Staphylococcusaureus)。在特定实施方案中,所述宿主细胞是大肠杆菌(Escherichia coli)细胞。
合适的古细菌宿主包括但不限于属于以下属的细胞:气火菌属(Aeropyrum),古菌状菌属(Archaeglobus),盐杆菌属(Halobacterium),产甲烷球菌属(Methanococcus),甲烷细菌属(Methanobacterium),火球菌属(Pyrococcus),硫化叶菌属(Sulfolobus),和热原体属(Thermoplasma)。古细菌菌株的实例包括但不限于:闪烁古生球菌(Archaeoglobusfulgidus),盐杆菌属(Halobacterium sp.),詹氏甲烷球菌(Methanococcus jannaschii),嗜热自养甲烷杆菌(Methanobacterium thermoautotrophicum),嗜酸热原体(Thermoplasma acidophilum),火山热原体(Thermoplasma volcanium),嗜热古菌(Pyrococcus horikoshii),Pyrococcus abyssi,和敏捷气热菌(Aeropyrumpernix)。
合适的真核宿主包括但不限于真菌细胞、藻类细胞、昆虫细胞和植物细胞。在一些实施方案,可用于本发明方法的酵母包括已经与微生物保藏中心(例如,IFO、ATCC等)一起保藏并属于以下属的酵母:芽孢酵母属(Aciculoconidium),神食酵母属(Ambrosiozyma),节束酵母属(Arthroascus),Arxiozyma,阿舒囊霉属(Ashbya),Babjevia,本森顿酵母属(Bensingtonia),Botryoascus,Botryozyma,酒香酵母属(Brettanomyces),布勒掷孢酵母属(Bullera),布勒担孢酵母属(Bulleromyces),念珠菌属(Candida),固囊酵母属(Citeromyces),棒孢酵母属(Clavispora),隐球菌属(Cryptococcus),Cystofilobasidium,德巴利氏酵母属(Debaryomyces),Dekkara,Dipodascopsis,双足囊菌属(Dipodascus),Eeniella,Endomycopsella,Eremascus,假囊酵母属(Eremothecium),担孢酵母属(Erythrobasidium),Fellomyces,线黑粉酵母属(Filobasidium),耐碱酵母属(Galactomyces),地丝菌属(Geotrichum),季氏酵母属(Guilliermondella),孢汉逊酵母属(Hanseniaspora),汉逊酵母属(Hansenula),Hasegawaea,胶珊瑚属(Holtermannia),Hormoascus属,生丝毕赤酵母属(Hyphopichia),伊萨酵母属(Issatchenkia),克勒克酵母属(Kloeckera),孢克勒克酵母属(Kloeckeraspora),克鲁维酵母属(Kluyveromyces),Kondoa属,Kuraishia属,克氏担孢酵母属(Kurtzmanomyces),白冬孢酵母属(Leucosporidium),油脂酵母属(Lipomyces),娄德酵母属(Lodderomyces),马拉色氏霉菌属(Malassezia),梅奇酵母属(Metschnikowia),木拉克酵母属(Mrakia),油脂酵母属无性属(Myxozyma),拿逊酵母属(Nadsonia),Nakazawaea,针孢酵母属(Nematospora),甲醇诱导型酵母属(Ogataea),卵孢酵母属(Oosporidium),管囊酵母属(Pachysolen),厚壁孢酵母(Phachytichospora),巴西仙草(Phaffia),毕赤酵母属(Pichia),红冬孢酵母属(Rhodosporidium),红酵母属(Rhodotorula),酵母属(Saccharomyces),类酵母属(Saccharomycodes),覆膜孢酵母属(Saccharomycopsis),Saitoella,Sakaguchia,Saturnospora,裂芽酵母孢子菌属(Schizoblastosporion),裂殖酵母属(Schizosaccharomyces),许旺酵母属(Schwanniomyces),锁掷酵母属(Sporidiobolus),掷孢酵母属(Sporobolomyces),原孢酵母属(Sporopachydermia),冠孢酵母属(Stephanoascus),梗孢酵母属(Sterigmatomyces),拟梗孢酵母属(Sterigmatosporidium),Symbiotaphrina,合轴酵母属(Sympodiomyces),Sympodiomycopsis,有孢圆酵母属(Torulaspora),Trichosporiella,毛孢子菌属(Trichosporon),三角酵母属(Trigonopsis),Tsuchiyaea,Udeniomyces,Waltomyces,威克酵母属(Wickerhamia),拟威克酵母属(Wickerhamiella),拟威尔酵母属(Williopsis),Yamadazyma,耶氏酵母属(Yarrowia),接合囊酵母属(Zygoascus),接合酵母属(Zygosaccharomyces),接合拟威尔酵母属(Zygowilliopsis),和Zygozyma等等。
在一些实施方案,所述宿主微生物是酿酒酵母(Saccharomyces cerevisiae),巴斯德毕赤酵母(Pichia pastoris),粟酒裂殖酵母(Schizosaccharomyces pombe),布鲁赛尔德克酵母(Dekkera bruxellensis),乳酸克鲁维酵母(Kruyveromyces lactis,先前称为乳酸酵母(Saccharomyces lactis)),马克斯克鲁维酵母(Kluveromyces marxianus),Arxula adeninivorans或多形汉逊酵母(Hansenula polymorpha)(现称为毕赤酵母(Pichia angusta))。在一些实施方案,所述宿主微生物是念珠菌属的菌株,例如解脂假丝酵母(Candida lipolytica),吉利蒙假丝酵母(Candida guilliermondii),克鲁斯假丝酵母(Candida krusei),假热带假丝酵母(Candida pseudotropicalis)或产朊假丝酵母(Candida utilis)的菌株。
在特定实施方案,所述宿主微生物是酿酒酵母(Saccharomyces cerevisiae)。在一些实施方案,所述宿主是酿酒酵母(Saccharomyces cerevisiae)的菌株,所述酿酒酵母的菌株是选自由贝克氏(Baker’s)酵母、CBS 7959、CBS 7960、CBS 7961、CBS 7962、CBS7963、CBS 7964、IZ-1904、TA、BG-1、CR-1、SA-1、M-26、Y-904、PE-2、PE-5、VR-1、BR-1、BR-2、ME-2、VR-2、MA-3、MA-4、CAT-1、CB-1、NR-1、BT-1、和AL-1组成的组。在一些实施方案,所述宿主微生物是酿酒酵母(Saccharomyces cerevisiae)的菌株,所述酿酒酵母的菌株是选自由PE-2、CAT-1、VR-1、BG-1、CR-1、和SA-1组成的组。在特定实施方案,酿酒酵母(Saccharomyces cerevisiae)的菌株是PE-2。在另一特定实施方案,酿酒酵母(Saccharomyces cerevisiae)的菌株是CAT-1。在另一特定实施方案,酿酒酵母(Saccharomyces cerevisiae)的菌株是BG-1。
在一些实施方案,所述宿主微生物是适于工业发酵的微生物。在特定实施方案,所述微生物被调节为在高溶剂浓度、高温、扩大的底物利用、营养限制、由糖和盐引起的渗透应力、酸度、亚硫酸盐和细菌污染、或其组合下存活,所述这些是公认的工业发酵环境的应力条件。
6.5甜菊醇和甜菊糖苷生物合成途径
在一些实施方案,通过工程化所述细胞以表达编码所述途径的一种或多种酶的多核苷酸和/或多肽,在本发明提供的经遗传修饰的宿主细胞中激活甜菊醇生物合成途径和/或甜菊糖苷生物合成途径。图1B示出了示例性甜菊醇生物合成途径。图2示出了由香叶基香叶基焦磷酸转化得到各种甜菊糖苷类化合物的示例性甜菊糖苷生物合成途径。
因此,在一些实施方案,本发明提供的经遗传修饰的宿主细胞包含编码多肽的异源多核苷酸,所述多肽具有香叶基香叶基焦磷酸合酶(GGPPS)活性。在一些实施方案,本发明提供的经遗传修饰的宿主细胞包含编码多肽的异源多核苷酸,所述多肽具有柯巴基焦磷酸合酶或内根-柯巴基焦磷酸合酶(CDPS;也称为内根-柯巴基二磷酸合酶或CPS)活性。在一些实施方案,本发明提供的经遗传修饰的宿主细胞包含编码多肽的异源多核苷酸,所述多肽具有贝壳杉烯合酶(KS;也称为内根-贝壳杉烯合酶)活性。在特定实施方案,本发明提供的经遗传修饰的宿主细胞包含编码多肽的异源多核苷酸,所述多肽具有本发明所述的贝壳杉烯氧化酶(KO;也称为内根-贝壳杉烯19-氧化酶)活性。在一些实施方案,本发明提供的经遗传修饰的宿主细胞包含编码多肽的异源多核苷酸,所述多肽具有甜菊醇合酶(也称为内根-异贝壳杉烯酸13-羟化酶或KAH)活性。在一些实施方案,本发明提供的经遗传修饰的宿主细胞包含编码多肽的异源多核苷酸,所述多肽具有细胞色素P450还原酶(CPR)活性。
在一些实施方案,本发明提供的经遗传修饰的宿主细胞包含编码具有UGT74G1活性的多肽的异源多核苷酸。在一些实施方案,本发明提供的经遗传修饰的宿主细胞包含编码具有UGT76G1活性的多肽的异源多核苷酸。在一些实施方案,本发明提供的经遗传修饰的宿主细胞包含编码具有UGT85C2活性的多肽的异源多核苷酸。在一些实施方案,本发明提供的经遗传修饰的宿主细胞包含编码具有UGT91D活性的多肽的异源多核苷酸。在一些实施方案,本发明提供的经遗传修饰的宿主细胞包含编码具有UDP-糖基转移酶活性的多肽的异源多核苷酸。
在某些实施方案,所述宿主细胞包含变体。在某些实施方案,相对于相关多肽,所述变体可包含多达15、10、9、8、7、6、5、4、3、2或1个氨基酸置换。在某些实施方案,相对于参考多肽,所述变体可包含多达15、10、9、8、7、6、5、4、3、2或1个保守氨基酸置换。在某些实施方案,可针对所述宿主细胞优化本发明所述的任何核酸,例如进行密码子优化。
以下描述了甜菊醇生物合成途径和/或甜菊糖苷生物合成途径的示例性核酸和酶。
6.5.1香叶基香叶基焦磷酸合酶(GGPPS)
香叶基香叶基焦磷酸合酶(EC 2.5.1.29)催化法呢基焦磷酸转化为香叶基香叶基焦磷酸。酶的示例性实例包括甜叶菊(Stevia rebaudiana,登录号ABD92926),藤仓赤霉(Gibberella fujikuroi,登录号CAA75568),小家鼠(Mus musculus,登录号AAH69913),假微型海链藻(Thalassiosira pseudonana,登录号XP_002288339),棒状链霉菌(Streptomyces clavuligerus,登录号ZP_05004570),嗜酸热硫化叶菌(Sulfulobusacidocaldarius,登录号BAA43200),聚球藻属(Synechococcus sp.,登录号ABC98596),拟南芥(Arabidopsis thaliana,登录号NP_195399),和三孢布拉霉(Blakeslea trispora,登录号AFC92798.1)的那些酶,以及US2014/0329281A1中示出的那些酶。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸与这些GGPPS核酸中的至少一种具有至少80%、85%、90%、或95%序列同一性。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸编码与这些GGPPS酶中的至少一种具有至少80%、85%、90%、或95%序列同一性的多肽。
6.5.2柯巴基焦磷酸合酶(CDPS)
柯巴基焦磷酸合酶(EC 5.5.1.13)催化香叶基香叶基焦磷酸转化为柯巴基焦磷酸。酶的示例性实例包括甜叶菊(Stevia rebaudiana,登录号AAB87091),棒状链霉菌(Streptomyces clavuligerus,登录号EDY51667),慢生型大豆根瘤菌(Bradyrhizobiumjaponicum,登录号AAC28895.1),玉米(Zea mays,登录号AY562490),拟南芥(Arabidopsisthaliana,登录号NM_116512),和稻(Oryza sativa,登录号Q5MQ85.1)的那些酶,以及US2014/0329281A1中示出的那些酶。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸与这些CDPS核酸中的至少一种具有至少80%、85%、90%、或95%序列同一性。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸编码与这些CDPS酶中的至少一种具有至少80%、85%、90%、或95%序列同一性的多肽。
6.5.3贝壳杉烯合酶(KS)
贝壳杉烯合酶(EC 4.2.3.19)催化柯巴基焦磷酸转化为贝壳杉烯和二磷酸。酶的示例性实例包括慢生型大豆根瘤菌(Bradyrhizobium japonicum,登录号AAC28895.1),暗球腔菌属(Phaeosphaeria sp.,登录号O13284),拟南芥(Arabidopsis thaliana,登录号Q9SAK2),和白云杉(Piceaglauca,登录号ADB55711.1)的那些酶,以及US2014/0329281A1中示出的那些酶。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸与这些KS核酸中的至少一种具有至少80%、85%、90%、或95%序列同一性。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸编码与这些KS酶中的至少一种具有至少80%、85%、90%、或95%序列同一性的多肽。
6.5.4双功能柯巴基焦磷酸合酶(CDPS)和贝壳杉烯合酶(KS)
还可使用CDPS-KS双功能酶(EC 5.5.1.13和EC 4.2.3.19)。酶的示例性实例包括桃拟茎点霉(Phomopsis amygdali,登录号BAG30962),小立碗藓(Physcomitrellapatens,登录号BAF61135),和藤仓赤霉(Gibberella fujikuroi,登录号Q9UVY5.1)的那些酶,以及US 2014/0329281A1、US 2014/0357588A1、US 2015/0159188和WO 2016/038095A2中示出的那些酶。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸与这些CDPS-KS核酸中的至少一种具有至少80%、85%、90%、或95%序列同一性。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸编码与这些CDPS-KS酶中的至少一种具有至少80%、85%、90%、或95%序列同一性的多肽。
6.5.5内根-贝壳杉烯氧化酶(KO)
内根-贝壳杉烯氧化酶(EC 1.14.13.78;也称为贝壳杉烯氧化酶)如本发明所述。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸与这些贝壳杉烯氧化酶核酸中的至少一种具有至少80%、85%、90%、或95%序列同一性。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸编码与这些贝壳杉烯氧化酶中的至少一种具有至少80%、85%、90%、或95%序列同一性的多肽。
6.5.6甜菊醇合酶(KAH)
甜菊醇合酶或异贝壳杉烯酸羟化酶(KAH,EC 1.14.13)催化异贝壳杉烯酸转化为甜菊醇。酶的示例性实例包括甜叶菊(Stevia rebaudiana,登录号ACD93722),甜叶菊(Stevia rebaudiana,SEQ ID NO:10),拟南芥(Arabidopsis thaliana,登录号NP_197872),葡萄(Vitis vinifera,登录号XP_002282091),和紫花苜蓿(Medicagotrunculata,登录号ABC59076)的那些酶,以及US 2014/0329281A1、US 2014/0357588A1、US2015/0159188和WO 2016/038095A2中示出的那些酶。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸与这些KAH核酸中的至少一种具有至少80%、85%、90%、或95%序列同一性。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸编码与这些KAH酶中的至少一种具有至少80%、85%、90%、或95%序列同一性的多肽。
6.5.7细胞色素P450还原酶(CPR)
细胞色素P450还原酶(EC 1.6.2.4)能够帮助或促进上述KO和/或KAH的活性。酶的示例性实例包括甜叶菊(Stevia rebaudiana,登录号ABB88839),拟南芥(Arabidopsisthaliana,登录号NP_194183),藤仓赤霉(Gibberellafujikuroi,登录号CAE09055),青蒿(Artemisia annua,登录号ABC47946.1)的那些酶,以及US 2014/0329281A1、US 2014/0357588A1、US 2015/0159188和WO 2016/038095A2中示出的那些酶。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸与这些CPR核酸中的至少一种具有至少80%、85%、90%、或95%序列同一性。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸编码与这些CPR酶中的至少一种具有至少80%、85%、90%、或95%序列同一性的多肽。
6.5.8UDP糖基转移酶74G1(UGT74G1)
UGT74G1能够作为尿苷5'-二磷酸葡糖基:甜菊醇19-COOH转移酶起作用和作为尿苷5'-二磷酸葡糖基:甜菊醇-13-O-葡糖苷19-COOH转移酶起作用。如图2所示,UGT74G1能够将甜菊醇转化为19-糖苷。UGT74G1还能够将甜菊单糖苷转化为甜茶苷。UGT74G1还可将甜菊双糖苷转化为甜菊苷。酶的示例性实例包括甜叶菊(Stevia rebaudiana)的那些酶(例如,Richman etal.,2005,PlantJ.41:56-67和US 2014/0329281和WO 2016/038095A2以及登录号AAR06920.1描述的那些)。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸与这些UGT74G1核酸中的至少一种具有至少80%、85%、90%、或95%序列同一性。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸编码与这些UGT74G1酶中的至少一种具有至少80%、85%、90%、或95%序列同一性的多肽。
6.5.9UDP糖基转移酶76G1(UGT76G1)
UGT76G1能够将葡萄糖基团部分转移至受体分子(即甜菊醇1,2-糖苷)的C-13-O-葡萄糖的C-3'处。因此,UGT76G1能够作为尿苷5'-二磷酸葡萄糖基:甜菊醇13-O-1,2葡萄糖苷C-3'葡萄糖基转移酶起作用和作为尿苷5'-二磷酸葡萄糖基:甜菊醇-19-O-葡萄糖、13-O-1,2双糖苷C-3'葡萄糖基转移酶起作用。如图2所示,UGT76G1能够将甜菊双糖苷转化为RebB。UGT76G1还能够将甜菊苷转化为RebA。UGT76G1还能够将RebD转换为RebM。酶的示例性实例包括甜叶菊(Stevia rebaudiana)的那些酶(例如,Richman etal.,2005,PlantJ.41:56-67和US 2014/0329281A1和WO 2016/038095A2以及登录号AAR06912.1描述的那些)。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸与这些UGT76G1核酸中的至少一种具有至少80%、85%、90%、或95%序列同一性。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸编码与这些UGT76G1酶中的至少一种具有至少80%、85%、90%、或95%序列同一性的多肽。
6.5.10UDP糖基转移酶85C2(UGT85C2)
UGT85C2能够作为尿苷5'-二磷酸葡糖基:甜菊醇13-OH转移酶起作用和作为尿苷5'-二磷酸葡糖基:甜菊醇-19-O-葡糖苷13-OH转移酶起作用。因此,如图2所示,UGT85C2能够将甜菊醇转化为甜菊单糖苷,并还能够将19-糖苷转化为甜茶苷。酶的示例性实例包括甜叶菊(Stevia rebaudiana)的那些酶(例如Richman etal.,2005,PlantJ.41:56-67和US2014/0329281A1、WO 2016/038095A2以及登录号AAR06916.1描述的那些)。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸与这些UGT85C2核酸中的至少一种具有至少80%、85%、90%、或95%序列同一性。在一些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸编码与这些UGT85C2酶中的至少一种具有至少80%、85%、90%、或95%序列同一性的多肽。
6.5.11UDP-糖基转移酶91D(UGT91D)
UGT91D能够作为尿苷5'-二磷酸葡糖基:甜菊醇-13-O-葡糖苷转移酶起作用,将葡萄糖基团部分转移至受体分子(甜菊醇-13-O-葡萄糖苷(甜菊单糖苷))的13-O-葡萄糖的C-2'处,以生成甜菊双糖苷。UGT91D还能够作为尿苷5'-二磷酸葡糖基:甜茶苷转移酶起作用,将葡萄糖基团部分转移至受体分子(甜茶苷)的13-O-葡萄糖的C-2'处,以提供甜菊苷,如图2所示。UGT91D也称为UGT91D2、UGT91D2e或UGT91D-like3。UGT91D酶的示例性实例包括甜叶菊(Stevia rebaudiana)的那些酶(例如,UGT序列的登录号为ACE87855.1,以及US2014/0329281A1,WO2016/038095A2和SEQ ID NO:7描述的那些)。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸与这些UGT91D核酸中的至少一种具有至少80%、85%、90%、或95%序列同一性。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸编码与这些UGT91D酶中的至少一种具有至少80%、85%、90%、或95%序列同一性的多肽。
6.5.12能够将RebA转化为RebD的尿苷二磷酸依赖性糖基转移酶(UGTAD)
尿苷二磷酸依赖性糖基转移酶(UGTAD)能够将葡萄糖基团部分转移至RebA的19-O-葡萄糖的C-2’位置以生成RebD,如图2所示。UGTAD还能够将葡萄糖基团部分转移至甜菊苷(stevioside)的19-O-葡萄糖的C-2’位置以生成RebE。UGT有用的实例包括来自稻(Oryzasativa)的Os_UGT_91C1(在Houghton-Larsen等人的专利申请WO 2013/022989A2中也称为EUGT11;XP_015629141.1),以及来自番茄(Solanum lycopersicum)的Sl_UGT_101249881(在Markosyan等人的专利申请WO2014/193888A1中也称为UGTSL2;XP_004250485.1)。有用的UGT还包括UGT40087(XP_004982059.1),sr.UGT_9252778(SEQ ID NO:16),Bd_UGT10840(XP_003560669.1),Hv_UGT_V1(BAJ94055.1),Bd_UGT10850(XP_010230871.1),和Ob_UGT91B1_like(XP_006650455.1)。任何UGT或UGT变体均可用于本发明所述的组合物和方法。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸与UGT中的至少一种具有至少80%、85%、90%、或95%序列同一性。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸编码与所述这些UGT中的至少一种具有至少80%、85%、90%、或95%序列同一性的多肽。在某些实施方案,本发明提供了编码本发明所述的UGT变体的核酸。
在某些实施方案,所述经遗传修饰的宿主细胞包含编码UDP-糖基转移酶的异源核酸,所述UDP-糖基转移酶包含与UGT40087的序列(例如,SEQ ID NO:17或SEQ ID NO:18)具有至少80%、85%、90%、或95%序列同一性的氨基酸序列。在某些实施方案,所述经遗传修饰的宿主细胞能够以大于90%、95%、96%、或97%的效率将RebA转化为RebD。在某些实施方案,所述经遗传修饰的宿主细胞包含UDP-糖基转移酶,所述UDP-糖基转移酶包含糖受体结构域,其中所述糖受体结构域的所述氨基酸序列与SEQ ID NO:17或SEQ ID NO:18的所述糖受体结构域的所述氨基酸序列具有至少84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%序列同一性。在某些实施方案,所述经遗传修饰的宿主细胞包含UDP-糖基转移酶,所述UDP-糖基转移酶包含loop1氨基酸序列,变体loop1氨基酸序列,loop2氨基酸序列,变体loop2氨基酸序列,loop3_1氨基酸序列,变体loop3_1氨基酸序列,loop3_2氨基酸序列,变体loop3_2氨基酸序列,loop4_1氨基酸序列,变体loop4_1氨基酸序列,loop4_2氨基酸序列,或其任何组合。在某些实施方案,所述经遗传修饰的宿主细胞包含UDP-糖基转移酶,所述UDP-糖基转移酶包含与SEQ ID NO:17或SEQID NO:18的糖受体结构域具有至少61%、65%、70%、75%、80%、85%、90%、或95%序列同一性的氨基酸序列,并进一步包含SEQ ID NO:17或SEQ ID NO:18的loop4_1氨基酸序列。
本发明使用的术语“变体loop1”氨基酸序列是指与SEQ ID NO:17或SEQ ID NO:18的参考loop1氨基酸序列(或具有SEQ ID NO:28的所述序列的UGT40087的经修饰的loop1序列)相差1、2、3、4、5、6、7、8、9或10个氨基酸插入、缺失、突变和/或置换的氨基酸序列,但允许包含变体loop1氨基酸序列的UDP-糖基转移酶,插入分别对应于SEQ ID NO:17或SEQ IDNO:18的loop1氨基酸序列位置的位置处,以催化RebA向RebD转化、和/或甜菊苷向RebE转化。
本发明使用的术语“变体loop2”氨基酸序列是指与SEQ ID NO:17或SEQ ID NO:18的参考loop2氨基酸序列相差1、2、3、4、5、6、7、8、9或10个氨基酸插入、缺失、突变和/或置换的氨基酸序列,但允许包含变体loop2氨基酸序列的UDP-糖基转移酶,插入分别对应于SEQID NO:17或SEQ ID NO:18的loop2氨基酸序列位置的位置处,以催化RebA向RebD转化、和/或甜菊苷向RebE转化。
本发明使用的术语“变体loop3_1”氨基酸序列是指与SEQ ID NO:17或SEQ ID NO:18的参考loop3_1氨基酸序列相差1、2、3、4、5、6、7、8、9或10个氨基酸插入、缺失、突变和/或置换的氨基酸序列,但允许包含变体loop3_1氨基酸序列的UDP-糖基转移酶,插入分别对应于SEQ ID NO:17或SEQ ID NO:18的loop3_1氨基酸序列位置的位置处,以催化RebA向RebD转化、和/或甜菊苷向RebE转化。本发明使用的术语“变体loop3_2”氨基酸序列是指与SEQID NO:17或SEQ ID NO:18的参考loop3_2氨基酸序列相差1、2、3、4、5、6、7、8、9或10个氨基酸插入、缺失、突变和/或置换的氨基酸序列,但允许包含变体loop3_2氨基酸序列的UDP-糖基转移酶,插入分别对应于SEQ ID NO:17或SEQ ID NO:18的loop3_2氨基酸序列位置的位置处,以催化RebA向RebD转化、和/或甜菊苷向RebE转化。在某些实施方案,变体loop3_2氨基酸序列与所述参考loop3_2氨基酸序列相差1、2、3、4、5、6、7、8、9、10个、或多达30个氨基酸插入、缺失、突变和/或置换。
本发明使用的术语“变体loop4_1”氨基酸序列是指与SEQ ID NO:17或SEQ ID NO:18的参考loop4_1氨基酸序列相差1、2、3、4、5、6、7、8、9、10个、或多达30个氨基酸插入、缺失、突变和/或置换的氨基酸序列,但允许包含变体loop4_1氨基酸序列的UDP-糖基转移酶,插入对应于SEQ ID NO:17或SEQ ID NO:18的loop4_1氨基酸序列位置的位置处,以催化RebA向RebD转化、和/或甜菊苷向RebE转化。
在某些实施方案,所述宿主细胞包含UGT40087的功能结构域,其中所述UGT40087包含SEQ ID NO:17或SEQ ID NO:18的氨基酸序列。在某些实施方案,所述宿主细胞包含多肽,所述多肽包含UGT40087的N-末端糖受体结构域,所述UGT40087包含SEQ ID NO:17或SEQID NO:18的氨基酸序列。在某些实施方案,所述宿主细胞包含多肽,所述多肽包含UGT40087的C-末端糖受体结构域,所述UGT40087包含SEQ ID NO:17或SEQ ID NO:18的氨基酸序列。在某些实施方案,UGT40087的所述糖受体结构域包含SEQ ID NO:18的约1至214位氨基酸位置(其对应于SEQ ID NO:17的氨基酸位置1至215)。在某些实施方案,UGT40087的所述糖供体结构域包含SEQ ID NO:18的约215至435位氨基酸位置(其对应于SEQ ID NO:17的氨基酸位置216至436)。在某些实施方案,UGT40087的所述糖受体结构域包含SEQ ID NO:17的约1至215位氨基酸位置。在某些实施方案,UGT40087的所述糖供体结构域包含SEQ ID NO:17的约216至436位氨基酸位置。在某些实施方案,相对于SEQ ID NO:18,UGT40087的所述糖受体结构域和所述糖供体结构域分别包含比1至214或215至435更窄的氨基酸残基范围。在某些实施方案,相对于SEQ ID NO:17,UGT40087的所述糖受体结构域和所述糖供体结构域分别包含比1至215或216至436更窄的氨基酸残基范围。
在某些实施方案,所述宿主细胞包含多肽,所述多肽包含与SEQ ID NO:17或SEQID NO:18的N-末端糖受体结构域的氨基酸序列基本上相同的氨基酸序列。在某些实施方案,所述宿主细胞包含多肽,所述多肽包含与SEQ ID NO:17或SEQ ID NO:18的N-末端糖受体结构域的氨基酸序列具有至少60%同一性的氨基酸序列。在某些实施方案,所述宿主细胞包含多肽,所述多肽包含与SEQ ID NO:17或SEQ ID NO:18的N-末端糖受体结构域的氨基酸序列具有至少65%同一性的氨基酸序列。在某些实施方案,所述宿主细胞包含多肽,所述多肽包含与SEQ ID NO:17或SEQ ID NO:18的N-末端糖受体结构域的氨基酸序列具有至少70%同一性的氨基酸序列。在某些实施方案,所述宿主细胞包含多肽,所述多肽包含与SEQID NO:17或SEQ ID NO:18的N-末端糖受体结构域的氨基酸序列具有至少75%同一性的氨基酸序列。在某些实施方案,所述宿主细胞包含多肽,所述多肽包含与SEQ ID NO:17或SEQID NO:18的N-末端糖受体结构域的氨基酸序列具有至少80%同一性的氨基酸序列。在某些实施方案,所述宿主细胞包含多肽,所述多肽包含与SEQ ID NO:17或SEQ ID NO:18的N-末端糖受体结构域的氨基酸序列具有至少85%同一性的氨基酸序列。在某些实施方案,所述宿主细胞包含多肽,所述多肽包含与SEQ ID NO:17或SEQ ID NO:18的N-末端糖受体结构域的氨基酸序列具有至少90%同一性的氨基酸序列。在某些实施方案,所述宿主细胞包含多肽,所述多肽包含与SEQ ID NO:17或SEQ ID NO:18的N-末端糖受体结构域的氨基酸序列具有至少95%同一性的氨基酸序列。在某些实施方案,所述宿主细胞包含多肽,所述多肽包含与SEQ ID NO:17或SEQ ID NO:18的N-末端糖受体结构域的氨基酸序列具有至少96%同一性的氨基酸序列。在某些实施方案,所述宿主细胞包含多肽,所述多肽包含与SEQ ID NO:17或SEQ ID NO:18的N-末端糖受体结构域的氨基酸序列具有至少97%同一性的氨基酸序列。在某些实施方案,所述宿主细胞包含多肽,所述多肽包含与SEQ ID NO:17或SEQ ID NO:18的N-末端糖受体结构域的氨基酸序列具有至少98%同一性的氨基酸序列。在某些实施方案,所述宿主细胞包含多肽,所述多肽包含与SEQ ID NO:17或SEQ ID NO:18的N-末端糖受体结构域的氨基酸序列具有至少99%同一性的氨基酸序列。在某些实施方案,本发明提供了包含多肽的宿主细胞,所述多肽包含与SEQ ID NO:17或SEQ ID NO:18的N-末端糖受体结构域的氨基酸序列具有至少60%,至少99%,或60%和99%之间的任何百分比同一性的氨基酸序列。
在某些实施方案,所述宿主细胞包含编码UGT40087的核酸,所述UGT40087包含SEQID NO:17或SEQ ID NO:18的N-末端糖受体结构域的氨基酸序列。在某些实施方案,所述宿主细胞包含编码多肽的核酸,所述多肽包含与SEQ ID NO:17或SEQ ID NO:18的N-末端糖受体结构域的氨基酸序列基本上相同的氨基酸序列。在某些实施方案,所述宿主细胞包含编码多肽的核酸,所述多肽包含与SEQ ID NO:17或SEQ ID NO:18的N-末端糖受体结构域的氨基酸序列具有至少60%同一性的氨基酸序列。在某些实施方案,所述宿主细胞包含编码多肽的核酸,所述多肽包含与SEQ ID NO:17或SEQ ID NO:18的N-末端糖受体结构域的氨基酸序列具有至少65%同一性的氨基酸序列。在某些实施方案,所述宿主细胞包含编码多肽的核酸,所述多肽包含与SEQ ID NO:17或SEQ ID NO:18的N-末端糖受体结构域的氨基酸序列具有至少70%同一性的氨基酸序列。在某些实施方案,所述宿主细胞包含编码多肽的核酸,所述多肽包含与SEQ ID NO:17或SEQ ID NO:18的N-末端糖受体结构域的氨基酸序列具有至少75%同一性的氨基酸序列。在某些实施方案,所述宿主细胞包含编码多肽的核酸,所述多肽包含与SEQ ID NO:17或SEQ ID NO:18的N-末端糖受体结构域的氨基酸序列具有至少80%同一性的氨基酸序列。在某些实施方案,所述宿主细胞包含编码多肽的核酸,所述多肽包含与SEQ ID NO:17或SEQ ID NO:18的N-末端糖受体结构域的氨基酸序列具有至少85%同一性的氨基酸序列。在某些实施方案,所述宿主细胞包含编码多肽的核酸,所述多肽包含与SEQ ID NO:17或SEQ ID NO:18的N-末端糖受体结构域的氨基酸序列具有至少90%同一性的氨基酸序列。在某些实施方案,所述宿主细胞包含编码多肽的核酸,所述多肽包含与SEQ ID NO:17或SEQ ID NO:18的N-末端糖受体结构域的氨基酸序列具有至少95%同一性的氨基酸序列。在某些实施方案,所述宿主细胞包含编码多肽的核酸,所述多肽包含与SEQID NO:17或SEQ ID NO:18的N-末端糖受体结构域的氨基酸序列具有至少96%同一性的氨基酸序列。在某些实施方案,所述宿主细胞包含编码多肽的核酸,所述多肽包含与SEQ IDNO:17或SEQ ID NO:18的N-末端糖受体结构域的氨基酸序列具有至少97%同一性的氨基酸序列。在某些实施方案,所述宿主细胞包含编码多肽的核酸,所述多肽包含与SEQ ID NO:17或SEQ ID NO:18的N-末端糖受体结构域的氨基酸序列具有至少98%同一性的氨基酸序列。在某些实施方案,所述宿主细胞包含编码多肽的核酸,所述多肽包含与SEQ ID NO:17或SEQID NO:18的N-末端糖受体结构域的氨基酸序列具有至少99%同一性的氨基酸序列。
在某些实施方案,当比较和分析UGT40087和另一UDP-糖基转移酶的三维模型结构时,它们揭示了在N-末端糖受体结构域具有显著构象差异的四个环路(loop)(即,loop1、loop2、loop3和loop4)。来自所述两个UGT之间相应环路(loop)序列交换的实验结果表明UGT40087的loop1、loop2、loop3_1、loop3_2和loop4_1可以与其各自、来自其他UDP-糖基转移酶的相应环路(loop)序列进行置换,所述其他UDP-糖基转移酶能够将RebA转化为RebD。在所述这些实施方案中,设计了两个版本的loop3(即,loop3_1和loop3_2)和loop4(即,loop4_1和loop4_2)来考虑两个可能的环路(loop)长度。
因此,在某些实施方案,所述宿主细胞包含UDP-糖基转移酶,所述UDP-糖基转移酶包含与SEQ ID NO:17或SEQ ID NO:18的N-末端糖受体结构域的氨基酸序列具有至少84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列。在某些实施方案,所述宿主细胞包含编码UDP-糖基转移酶的异源核酸,所述UDP-糖基转移酶包含与SEQ ID NO:17或SEQ ID NO:18的N-末端糖受体结构域的氨基酸序列具有至少84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列。在某些实施方案,所述UDP-糖基转移酶在分别对应于SEQ ID NO:17或SEQ ID NO:18的所述loop1位置的所述UDP-糖基转移酶的位置处还包含UGT40087(即,SEQ ID NO:17或SEQ ID NO:18)的loop1氨基酸序列。在某些实施方案,SEQ ID NO:17或SEQ ID NO:18的所述loop1氨基酸序列具有SEQ ID NO:30的氨基酸序列。在某些实施方案,所述loop1氨基酸序列具有SEQ ID NO:28的序列。在某些实施方案,所述UDP-糖基转移酶在分别对应于SEQ ID NO:17或SEQ ID NO:18的所述loop1位置的所述UDP-糖基转移酶的位置处还包含变体loop1氨基酸序列。所述变体loop1氨基酸序列是指与SEQ ID NO:17或SEQ ID NO:18的所述参考loop1氨基酸序列或具有SEQ ID NO:28的所述loop1氨基酸序列不同的氨基酸序列,但允许包含所述变体loop1氨基酸的所述UDP-糖基转移酶保留其将RebA转化为RebD和/或将甜菊苷转化为RebE的活性。
在某些实施方案,所述UDP-糖基转移酶在分别对应于SEQ ID NO:17或SEQ ID NO:18的所述loop2位置的所述UDP-糖基转移酶的位置处还包含UGT40087(即,SEQ ID NO:17或SEQ ID NO:18)的loop2氨基酸序列。在某些实施方案,SEQ ID NO:17或SEQ ID NO:18的所述loop2氨基酸序列具有SEQ ID NO:24的氨基酸序列。在某些实施方案,所述UDP-糖基转移酶在分别对应于SEQ ID NO:17或SEQ ID NO:18的所述loop2位置的所述UDP-糖基转移酶的位置处还包含变体loop2氨基酸序列。所述变体loop2氨基酸序列是指与SEQ ID NO:17或SEQ ID NO:18的所述参考loop2氨基酸序列不同的氨基酸序列,但允许包含所述变体loop2氨基酸的所述UDP-糖基转移酶保留其将RebA转化为RebD和/或将甜菊苷转化为RebE的活性。
在某些实施方案,所述UDP-糖基转移酶在分别对应于SEQ ID NO:17或SEQ ID NO:18的所述loop3_1位置的所述UDP-糖基转移酶的位置处还包含UGT40087(即,SEQ ID NO:17或SEQ ID NO:18)的loop3_1氨基酸序列。在某些实施方案,SEQ ID NO:17或SEQ ID NO:18的所述loop3_1氨基酸序列具有SEQ ID NO:25的氨基酸序列。在某些实施方案,所述UDP-糖基转移酶在分别对应于SEQ ID NO:17或SEQ ID NO:18的所述loop3_1位置的所述UDP-糖基转移酶的位置处还包含变体loop3_1氨基酸序列。所述变体loop3_1氨基酸序列是指与SEQID NO:17或SEQ ID NO:18的所述参考loop3_1氨基酸序列不同的氨基酸序列,但允许包含所述变体loop3_1氨基酸的所述UDP-糖基转移酶保留其将RebA转化为RebD和/或将甜菊苷转化为RebE的活性。
在某些实施方案,所述UDP-糖基转移酶在分别对应于SEQ ID NO:17或SEQ ID NO:18的所述loop3_2位置的所述UDP-糖基转移酶的位置处还包含UGT40087(即,SEQ ID NO:17或SEQ ID NO:18)的loop3_2氨基酸序列。在某些实施方案,SEQ ID NO:17或SEQ ID NO:18的所述loop3_2氨基酸序列具有SEQ ID NO:26的氨基酸序列。在某些实施方案,所述UDP-糖基转移酶在分别对应于SEQ ID NO:17或SEQ ID NO:18的所述loop3_2位置的所述UDP-糖基转移酶的位置处还包含变体loop3_2氨基酸序列。所述变体loop3_2氨基酸序列是指与SEQID NO:17或SEQ ID NO:18的所述参考loop3_2氨基酸序列不同的氨基酸序列,但允许包含所述变体loop3_2氨基酸的所述UDP-糖基转移酶保留其将RebA转化为RebD和/或将甜菊苷转化为RebE的活性。
在某些实施方案,所述UDP-糖基转移酶在分别对应于SEQ ID NO:17或SEQ ID NO:18的所述loop4_1位置的所述UDP-糖基转移酶的位置处还包含UGT40087(即,SEQ ID NO:17或SEQ ID NO:18)的loop4_1氨基酸序列。在某些实施方案,SEQ ID NO:17或SEQ ID NO:18的所述loop4_1氨基酸序列具有SEQ ID NO:27的氨基酸序列。在某些实施方案,所述UDP-糖基转移酶在分别对应于SEQ ID NO:17或SEQ ID NO:18的所述loop4_1位置的所述UDP-糖基转移酶的位置处还包含变体loop4_1氨基酸序列。所述变体loop4_1氨基酸序列是指与SEQID NO:17或SEQ ID NO:18的所述参考loop4_1氨基酸序列不同的氨基酸序列,但允许包含所述变体loop4_1氨基酸的所述UDP-糖基转移酶保留其将RebA转化为RebD和/或将甜菊苷转化为RebE的活性。
在某些实施方案,所述UDP-糖基转移酶在分别对应于SEQ ID NO:17或SEQ ID NO:18的所述loop4_2位置的所述UDP-糖基转移酶的位置处还包含UGT40087(即,SEQ ID NO:17或SEQ ID NO:18)的loop4_2氨基酸序列。SEQ ID NO:17或SEQ ID NO:18的所述loop4_2氨基酸序列具有SEQ ID NO:28的氨基酸序列。
在某些实施方案,所述宿主细胞包含UDP-糖基转移酶,所述UDP-糖基转移酶包含与SEQ ID NO:17或SEQ ID NO:18的N-末端糖受体结构域的氨基酸序列具有至少84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列,或包含编码其UDP-糖基转移酶的异源核酸,和进一步包含以下的任何组合:
(a)位于分别对应于SEQ ID NO:17或SEQ ID NO:18的所述loop1位置的所述UDP-糖基转移酶的位置处的SEQ ID NO:17或SEQ ID NO:18的所述loop1氨基酸序列、SEQ ID NO:30的序列、或变体loop1氨基酸序列;
(b)位于分别对应于SEQ ID NO:17或SEQ ID NO:18的所述loop2位置的所述UDP-糖基转移酶的位置处的SEQ ID NO:17或SEQ ID NO:18的所述loop2氨基酸序列、或变体loop2氨基酸序列;
(c)位于分别对应于SEQ ID NO:17或SEQ ID NO:18的所述loop 3_1位置的所述UDP-糖基转移酶的位置处的SEQ ID NO:17或SEQ ID NO:18的所述loop3_1氨基酸序列、或变体loop3_1氨基酸序列;
(d)位于分别对应于SEQ ID NO:17或SEQ ID NO:18的所述loop3_2位置的所述UDP-糖基转移酶的位置处的SEQ ID NO:17或SEQ ID NO:18的所述loop3_2氨基酸序列、或变体loop3_2氨基酸序列;
(e)位于分别对应于SEQ ID NO:17或SEQ ID NO:18的所述loop4_1位置的所述UDP-糖基转移酶的位置处的SEQ ID NO:17或SEQ ID NO:18的所述loop4_1氨基酸序列、或变体loop4_1氨基酸序列;和
(f)位于分别对应于SEQ ID NO:17或SEQ ID NO:18的所述loop4_2位置的所述UDP-糖基转移酶的位置处的SEQ ID NO:17或SEQ ID NO:18的所述loop4_2氨基酸序列。
在某些实施方案,当比较和分析能够将RebA转化为RebD的UDP-糖基转移酶的三维模型结构时,发现UGT40087的loop4_1,当掺入另一UDP-糖基转移酶的相应loop4_1位置(和置换其天然loop4_1氨基酸序列)时,导致变体UDP-糖基转移酶在其将RebA转化为RebD的能力方面具有优异活性。参见实施例12。所述这些结果表明,任何合适的UDP-糖基转移酶的所述loop4_1氨基酸序列可用SEQ ID NO:17或SEQ ID NO:18的所述loop4_1氨基酸序列置换,从而将RebA转化为RebD。
因此,在某些实施方案,所述宿主细胞包含UDP-糖基转移酶,所述UDP-糖基转移酶包含与SEQ ID NO:17或SEQ ID NO:18的所述N-末端糖受体结构域的所述氨基酸序列具有至少61%、65%、70%、75%、80%、85%、90%、或95%同一性的氨基酸序列,和进一步包含UGT40087(即,SEQ ID NO:17或SEQ ID NO:18)的所述loop4_1氨基酸序列(即,SEQ ID NO:27)。在某些实施方案,所述宿主细胞包含编码UDP-糖基转移酶的异源核酸,所述UDP-糖基转移酶包含与SEQ ID NO:17或SEQ ID NO:18的所述N-末端糖受体结构域的所述氨基酸序列具有至少61%、65%、70%、75%、80%、85%、90%、或95%同一性的氨基酸序列,和进一步包含SEQ ID NO:17或SEQ ID NO:18的所述loop4_1氨基酸序列(即,SEQ ID NO:27)。在某些实施方案中,包含与SEQ ID NO:17或SEQ ID NO:18具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、或95%同一性的氨基酸序列的任何合适的UDP-糖基转移酶可用于将来自SEQ ID NO:17或SEQ ID NO:18的所述loop4_1氨基酸序列整合到其相应的loop4_1位置(置换其天然loop4_1氨基酸序列)。譬如,Ob_UGT91B_like、Hv_UGT_V1、Sl_UGT_101249881、Sr.UGT_g252778、Os_UGT_91C1、Bd_UGT10840、Bd_UGT10850、或Si91Dlike可用作碱基以将来自SEQ ID NO:17或SEQ ID NO:18的所述loop4_1氨基酸序列整合在其相应的loop4_1位置。在某些实施方案,所述UDP-糖基转移酶包含SEQ ID NO:33的氨基酸序列。
在某些实施方案,所述宿主细胞包含多肽,所述多肽包含与SEQ ID NO:17或SEQID NO:18的C-末端糖供体结构域的氨基酸序列基本上相同的氨基酸序列。在某些实施方案,所述宿主细胞包含多肽,所述多肽包含与SEQ ID NO:17或SEQ ID NO:18的所述C-末端糖供体结构域的所述氨基酸序列具有至少60%同一性的氨基酸序列。在某些实施方案,所述宿主细胞包含多肽,所述多肽包含与SEQ ID NO:17或SEQ ID NO:18的所述C-末端糖供体结构域的所述氨基酸序列具有至少65%同一性的氨基酸序列。在某些实施方案,所述宿主细胞包含多肽,所述多肽包含与SEQ ID NO:17或SEQ ID NO:18的所述C-末端糖供体结构域的所述氨基酸序列具有至少70%同一性的氨基酸序列。在某些实施方案,所述宿主细胞包含多肽,所述多肽包含与SEQ ID NO:17或SEQ ID NO:18的所述C-末端糖供体结构域的所述氨基酸序列具有至少75%同一性的氨基酸序列。在某些实施方案,所述宿主细胞包含多肽,所述多肽包含与SEQ ID NO:17或SEQ ID NO:18的所述C-末端糖供体结构域的所述氨基酸序列具有至少80%同一性的氨基酸序列。在某些实施方案,所述宿主细胞包含多肽,所述多肽包含与SEQ ID NO:17或SEQ ID NO:18的所述C-末端糖供体结构域的所述氨基酸序列具有至少85%同一性的氨基酸序列。在某些实施方案,所述宿主细胞包含多肽,所述多肽包含与SEQ ID NO:17或SEQ ID NO:18的所述C-末端糖供体结构域的所述氨基酸序列具有至少90%同一性的氨基酸序列。在某些实施方案,所述宿主细胞包含多肽,所述多肽包含与SEQID NO:17或SEQ ID NO:18的所述C-末端糖供体结构域的所述氨基酸序列具有至少95%同一性的氨基酸序列。在某些实施方案,所述宿主细胞包含多肽,所述多肽包含与SEQ ID NO:17或SEQ ID NO:18的所述C-末端糖供体结构域的所述氨基酸序列具有至少96%同一性的氨基酸序列。在某些实施方案,所述宿主细胞包含多肽,所述多肽包含与SEQ ID NO:17或SEQ ID NO:18的所述C-末端糖供体结构域的所述氨基酸序列具有至少97%同一性的氨基酸序列。在某些实施方案,所述宿主细胞包含多肽,所述多肽包含与SEQ ID NO:17或SEQ IDNO:18的所述C-末端糖供体结构域的所述氨基酸序列具有至少98%同一性的氨基酸序列。在某些实施方案,所述宿主细胞包含多肽,所述多肽包含与SEQ ID NO:17或SEQ ID NO:18的所述C-末端糖供体结构域的所述氨基酸序列具有至少99%同一性的氨基酸序列。
在某些实施方案,所述宿主细胞包含编码UGT40087的核酸,所述UGT40087包含SEQID NO:17或SEQ ID NO:18的所述C-末端糖供体结构域的所述氨基酸序列。在某些实施方案,所述宿主细胞包含编码多肽的核酸,所述多肽包含与SEQ ID NO:17或SEQ ID NO:18的所述C-末端糖供体结构域的所述氨基酸序列基本上相同的氨基酸序列。在某些实施方案,所述宿主细胞包含编码多肽的核酸,所述多肽包含与SEQ ID NO:17或SEQ ID NO:18的所述C-末端糖供体结构域的氨基酸序列具有至少60%同一性的氨基酸序列。在某些实施方案,所述宿主细胞包含编码多肽的核酸,所述多肽包含与SEQ ID NO:17或SEQ ID NO:18的所述C-末端糖供体结构域的氨基酸序列具有至少65%同一性的氨基酸序列。在某些实施方案,所述宿主细胞包含编码多肽的核酸,所述多肽包含与SEQ ID NO:17或SEQ ID NO:18的所述C-末端糖供体结构域的氨基酸序列具有至少70%同一性的氨基酸序列。在某些实施方案,所述宿主细胞包含编码多肽的核酸,所述多肽包含与SEQ ID NO:17或SEQ ID NO:18的所述C-末端糖供体结构域的氨基酸序列具有至少75%同一性的氨基酸序列。在某些实施方案,所述宿主细胞包含编码多肽的核酸,所述多肽包含与SEQ ID NO:17或SEQ ID NO:18的所述C-末端糖供体结构域的氨基酸序列具有至少80%同一性的氨基酸序列。在某些实施方案,所述宿主细胞包含编码多肽的核酸,所述多肽包含与SEQ ID NO:17或SEQ ID NO:18的所述C-末端糖供体结构域的氨基酸序列具有至少85%同一性的氨基酸序列。在某些实施方案,所述宿主细胞包含编码多肽的核酸,所述多肽包含与SEQ ID NO:17或SEQ ID NO:18的所述C-末端糖供体结构域的氨基酸序列具有至少90%同一性的氨基酸序列。在某些实施方案,所述宿主细胞包含编码多肽的核酸,所述多肽包含与SEQ ID NO:17或SEQ ID NO:18的所述C-末端糖供体结构域的氨基酸序列具有至少95%同一性的氨基酸序列。在某些实施方案,所述宿主细胞包含编码多肽的核酸,所述多肽包含与SEQ ID NO:17或SEQ ID NO:18的所述C-末端糖供体结构域的氨基酸序列具有至少96%同一性的氨基酸序列。在某些实施方案,所述宿主细胞包含编码多肽的核酸,所述多肽包含与SEQ ID NO:17或SEQ ID NO:18的所述C-末端糖供体结构域的氨基酸序列具有至少97%同一性的氨基酸序列。在某些实施方案,所述宿主细胞包含编码多肽的核酸,所述多肽包含与SEQ ID NO:17或SEQ ID NO:18的所述C-末端糖供体结构域的氨基酸序列具有至少98%同一性的氨基酸序列。在某些实施方案,所述宿主细胞包含编码多肽的核酸,所述多肽包含与SEQ ID NO:17或SEQ ID NO:18的所述C-末端糖供体结构域的氨基酸序列具有至少99%同一性的氨基酸序列。
因此,在某些实施方案,所述宿主细胞包含UDP-糖基转移酶,所述UDP-糖基转移酶包含与SEQ ID NO:17或SEQ ID NO:18的所述C-末端糖供体结构域的所述氨基酸序列具有至少60%、65%、70%、75%、80%、85%、90%、或95%同一性的氨基酸序列。在某些实施方案,所述宿主细胞包含编码UDP-糖基转移酶的异源核酸,所述UDP-糖基转移酶包含与SEQID NO:17或SEQ ID NO:18的所述C-末端糖供体结构域的所述氨基酸序列具有至少60%、65%、70%、75%、80%、85%、90%、或95%同一性的氨基酸序列。在某些实施方案,所述UDP-糖基转移酶还包含来自其他UDP-糖基转移酶的C-末端糖供体结构域。具有合适的C-末端糖供体结构域的其他UDP-糖基转移酶的实例包括Ob_UGT91B_like、Hv_UGT_V1、SI_UGT_101249881、Sr.UGT_g252778、Os_UGT_91C1、Bd_UGT10840、Bd_UGT10850、或Si91Dlike。
在某些实施方案,发现所述N-末端糖受体结构域中的某些氨基酸残基可将非功能性、推定的UDP-糖基转移酶的催化活性恢复为活性UDP-糖基转移酶。因此,所述宿主细胞包含UDP-糖基转移酶,所述UDP-糖基转移酶包含与SEQ ID NO:17或SEQ ID NO:18的所述N-末端糖受体结构域的所述氨基酸序列具有至少60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列,和进一步包含一个或多个以下氨基酸残基:
(a)缬氨酸,所述缬氨酸位于对应于SEQ ID NO:18的氨基酸位置11的所述UDP-糖基转移酶的氨基酸位置处;
(b)异亮氨酸,所述异亮氨酸位于对应于SEQ ID NO:18的氨基酸位置12的所述UDP-糖基转移酶的氨基酸位置处;
(c)脯氨酸,所述脯氨酸位于对应于SEQ ID NO:18的氨基酸位置55的所述UDP-糖基转移酶的氨基酸位置处;
(d)谷氨酸,所述谷氨酸位于对应于SEQ ID NO:18的氨基酸位置90的所述UDP-糖基转移酶的氨基酸位置处;
(e)丝氨酸,所述丝氨酸位于对应于SEQ ID NO:18的氨基酸位置203的所述UDP-糖基转移酶的氨基酸位置处;
(f)谷氨酸,所述谷氨酸位于对应于SEQ ID NO:18的氨基酸位置223的所述UDP-糖基转移酶的氨基酸位置处;或
(g)缬氨酸,所述缬氨酸位于对应于SEQ ID NO:18的氨基酸位置413的所述UDP-糖基转移酶的氨基酸位置处,
其中,对应于SEQ ID NO:18的所述氨基酸位置的所述UDP-糖基转移酶的所述氨基酸位置均通过序列比对进行确定。
在某些实施方案,所述宿主细胞包含UDP-糖基转移酶,所述UDP-糖基转移酶包含SEQ ID NO:32的氨基酸序列。
在某些实施方案,所述宿主细胞包含上述UGT40087多肽的变体。在某些实施方案,相对于所述UGT40087多肽,所述变体可包含多达15、10、9、8、7、6、5、4、3、2、或1个氨基酸置换。在某些实施方案,相对于所述UGT40087多肽,所述变体可包含多达15、10、9、8、7、6、5、4、3、2、或1个保守氨基酸置换。在某些实施方案,可针对所述宿主细胞优化本发明所述的任何核酸,例如进行密码子优化。有用的核酸包括SEQ ID NO:35和SEQ ID NO:36。
6.6MEV途径生成FPP和/或GGPP
在一些实施方案中,本发明提供的经遗传修饰的宿主细胞包含MEV途径的一种或多种异源酶,其可用于形成FPP和/或GGPP。参见图1D。在一些实施方案,所述MEV途径的一种或多种酶包含使乙酰-CoA与丙二酰-CoA缩合以形成乙酰乙酰-CoA的酶。在一些实施方案,所述MEV途径的一种或多种酶包含使两分子乙酰-CoA缩合以形成乙酰乙酰-CoA的酶。在一些实施方案,所述MEV途径的一种或多种酶包含使乙酰乙酰-CoA与乙酰-CoA缩合以形成HMG-CoA的酶。在一些实施方案,所述MEV途径的一种或多种酶包含使HMG-CoA转化为甲羟戊酸的酶。在一些实施方案,所述MEV途径的一种或多种酶包含使甲羟戊酸磷酸化为甲羟戊酸5-磷酸的酶。在一些实施方案,所述MEV途径的一种或多种酶包含使甲羟戊酸5-磷酸转化为甲羟戊酸5-焦磷酸的酶。在一些实施方案,所述MEV途径的一种或多种酶包含使甲羟戊酸5-焦磷酸转化为异戊烯焦磷酸的酶。
在一些实施方案,所述MEV途径的一种或多种酶选自由乙酰-CoA硫解酶,乙酰乙酰-CoA合酶,HMG-CoA合酶,HMG-CoA还原酶,甲羟戊酸激酶,磷酸甲羟戊酸激酶和甲羟戊酸焦磷酸脱羧酶组成的组。在一些实施方案,关于能够催化形成乙酰乙酰-CoA的所述MEV途径的酶,所述经遗传修饰的宿主细胞包含使两分子乙酰-CoA缩合以形成乙酰乙酰-CoA的酶,例如乙酰-CoA硫解酶;或者使乙酰-CoA与丙二酰-CoA缩合以形成乙酰乙酰-CoA的酶,例如乙酰乙酰-CoA合酶。在一些实施方案,所述经遗传修饰的宿主细胞包含使两分子乙酰-CoA缩合以形成乙酰乙酰-CoA的酶,例如乙酰-CoA硫解酶;和使乙酰-CoA与丙二酰-CoA缩合以形成乙酰乙酰-CoA的酶,例如乙酰乙酰-CoA合酶。
在一些实施方案,所述宿主细胞包含编码所述MEV途径的一种以上酶的一种或多种异源核苷酸序列。在一些实施方案,所述宿主细胞包含编码所述MEV途径的两种酶的一种或多种异源核苷酸序列。在一些实施方案,所述宿主细胞包含一种或多种异源核苷酸序列,所述异源核苷酸序列编码可将HMG-CoA转化为甲羟戊酸的酶和可将甲羟戊酸转化为甲羟戊酸5-磷酸的酶。在一些实施方案,所述宿主细胞包含编码所述MEV途径的三种酶的一种或多种异源核苷酸序列。在一些实施方案,所述宿主细胞包含编码所述MEV途径的四种酶的一种或多种异源核苷酸序列。在一些实施方案,所述宿主细胞包含编码所述MEV途径的五种酶的一种或多种异源核苷酸序列。在一些实施方案,所述宿主细胞包含编码所述MEV途径的六种酶的一种或多种异源核苷酸序列。在一些实施方案,所述宿主细胞包含编码所述MEV途径的七种酶的一种或多种异源核苷酸序列。在一些实施方案,所述宿主细胞包含编码所述MEV途径的所有酶的多种异源核酸。
在一些实施方案,所述经遗传修饰的宿主细胞还包含编码酶的异源核酸,所述酶可将异戊烯焦磷酸(IPP)转化为二甲基烯丙基焦磷酸(DMAPP)。在一些实施方案,所述经遗传修饰的宿主细胞还包含编码酶的异源核酸,所述酶可使IPP和/或DMAPP分子缩合以形成聚异戊二烯基化合物。在一些实施方案,所述经遗传修饰的宿主细胞还包含编码酶的异源核酸,所述酶可修饰IPP或聚异戊二烯基以形成类异戊二烯化合物,例如FPP。
6.6.1乙酰-CoA转化为乙酰乙酰-CoA
在一些实施方案,所述经遗传修饰的宿主细胞包含编码酶的异源核苷酸序列,所述酶可使两分子的乙酰辅酶A缩合以形成乙酰乙酰-CoA,例如乙酰-CoA硫解酶。编码此种酶的核苷酸序列的示例性实例包括但不限于:(NC_000913REGION:2324131.2325315;大肠杆菌(Escherichia coli)),(D49362;脱氮副球菌(Paracoccus denitrificans))和(L20428;酿酒酵母(Saccharomyces cerevisiae))。
乙酰-CoA硫解酶催化两分子乙酰-CoA的可逆缩合反应以生成乙酰乙酰-CoA,但此反应在热力学上是不利的;乙酰乙酰-CoA硫解作用优于乙酰乙酰-CoA合成。乙酰乙酰-CoA合酶(AACS)(或者称为乙酰-CoA:丙二酰-CoA酰基转移酶;EC 2.3.1.194)使乙酰-CoA与丙二酰-CoA缩合以形成乙酰乙酰-CoA。与乙酰-CoA硫解酶相反,由于丙二酰-CoA的相关脱羧反应,AACS催化的乙酰乙酰-CoA合成基本上是能量有利的反应。此外,AACS对乙酰乙酰-CoA未显示出硫解活性,因此所述反应是不可逆的。
在包含乙酰-CoA硫解酶和异源性ADA和/或磷酸转乙酰酶(PTA)的宿主细胞中,有利于乙酰乙酰-CoA硫解的乙酰-CoA硫解酶催化的可逆反应可导致大的乙酰-CoA库。鉴于ADA的可逆活性,此乙酰-CoA库可反过来驱动ADA朝向将乙酰-CoA转化为乙醛的逆向反应,从而减少了ADA对乙酰-CoA生成提供的益处。类似地,PTA的活性是可逆的,因此,大的乙酰-CoA库可驱使PTA朝向将乙酰-CoA转化为乙酰磷酸的逆向反应。因此,在一些实施方案,为了提供对乙酰-CoA的强拉力以驱动ADA和PTA的正向反应,本发明提供的经遗传修饰的宿主细胞的所述MEV途径利用乙酰乙酰-CoA合酶使乙酰-CoA和丙二酰-CoA形成乙酰乙酰-CoA。
在一些实施方案中,AACS是来自链霉菌属(Streptomyces sp.)菌株CL190(Okamura etal.,Proc NatlAcadSci USA 107(25):11265-70(2010))。链霉菌属(Streptomyces sp.)菌株CL190的代表性AACS核苷酸序列包括登录号AB540131.1。链霉菌属(Streptomyces sp.)菌株CL190的代表性AACS蛋白质序列包括登录号D7URV0、BAJ10048。可用于本发明提供的组合物和方法的其他乙酰乙酰-CoA合酶包括但不限于,链霉菌属(Streptomyces sp.)(AB183750;KO-3988BAD86806);S.anulatus菌株9663(FN178498;CAX48662);链霉菌属KO-3988(AB212624;BAE78983);游动放线菌属(Actinoplanes sp.)A40644(AB113568;BAD07381);链霉菌属C(NZ_ACEW010000640;ZP_05511702);达松维尔拟诺卡氏菌(Nocardiopsis dassonvillei)DSM 43111(NZ_ABUI01000023;ZP_04335288);溃疡分枝杆菌(Mycobacterium ulcerans)Agy99(NC_008611;YP_907152);海鱼分枝杆菌(Mycobacterium marinum)M(NC_010612;YP_001851502);链霉菌属Mg1(NZ_DS570501;ZP_05002626);链霉菌属AA4(NZ_ACEV01000037;ZP_05478992);玫瑰孢链霉菌(S.roseosporus)NRRL 15998(NZ_ABYB01000295;ZP_04696763);链霉菌属ACTE(NZ_ADFD01000030;ZP_06275834);产绿色链霉菌(S.viridochromogenes)DSM 40736(NZ_ACEZ01000031;ZP_05529691);弗兰克氏菌属(Frankia sp.)CcI3(NC_007777;YP_480101);巴西诺卡菌(Nocardia brasiliensis)(NC_018681;YP_006812440.1);和chelonae放线菌(Austwickia chelonae)(NZ_BAGZ01000005;ZP_10950493.1)。其他合适的乙酰乙酰-CoA合酶包括美国专利申请公开号2010/0285549和2011/0281315中描述的那些,其内容通过引用其整体并入本发明。
也可用于本发明提供的组合物和方法的乙酰乙酰-CoA合酶包括那些被称为本发明所述的任何乙酰乙酰-CoA合酶的“衍生物”的分子。此种“衍生物”具有以下特征:(1)它与本发明所述的任何乙酰乙酰-CoA合酶具有基本同源性;和(2)能够催化乙酰-CoA与丙二酰-CoA的不可逆缩合反应以生成乙酰乙酰-CoA。如果衍生物的氨基酸序列与乙酰乙酰-CoA合酶的氨基酸序列为至少80%、更优选至少90%、最优选至少95%相同,则称乙酰乙酰-CoA合酶的衍生物与乙酰乙酰-CoA合酶具有“基本同源性”。
6.6.2乙酰乙酰-CoA转化为HMG-CoA
在一些实施方案,所述宿主细胞包含编码酶的异源核苷酸序列,所述酶可使乙酰乙酰-CoA与另一分子的乙酰-CoA缩合以形成3-羟基-3-甲基戊二酰-CoA(HMG-CoA),例如HMG-CoA合酶。编码此种酶的核苷酸序列的示例性实例包括但不限于:(NC_001145.互补19061.20536;酿酒酵母),(X96617;酿酒酵母),(X83882;拟南芥),(AB037907;griseola北里孢菌(Kitasatospora griseola)),(BT007302;智人(Homo sapiens)),和(NC_002758,基因座标签为SAV2546,GeneID(基因ID)为1122571;金黄色葡萄球菌(Staphylococcusaureus))。
6.6.3HMG-CoA转化为甲羟戊酸
在一些实施方案,所述宿主细胞包含编码酶的异源核苷酸序列,所述酶可使HMG-CoA转化为甲羟戊酸,例如HMG-CoA还原酶。在一些实施方案,HMG-CoA还原酶是使用NADH的羟甲基戊二酰-CoA还原酶-CoA还原酶。HMG-CoA还原酶(EC 1.1.1.34;EC 1.1.1.88)催化(S)-HMG-CoA还原脱酰为(R)-甲羟戊酸,并可以分为两类,I类和II类HMGr(HMG-CoA还原酶)。I类包括来自真核生物和大多数古细菌的酶,II类包括某些原核生物和古细菌的HMG-CoA还原酶。除了序列的差异外,两类酶在其辅因子特异性方面也不同。与仅使用NADPH的I类酶不同,II类HMG-CoA还原酶在区分NADPH和NADH的能力方面不同。参见,例如Hedl etal.,Journal of Bacteriology 186(7):1927-1932(2004)。选择的II类HMG-CoA还原酶的辅因子特异性提供如下。
选择的II类HMG-CoA还原酶的辅因子特异性
用于本发明提供的组合物和方法的有用的HMG-CoA还原酶包括能够利用NADH作为辅因子的HMG-CoA还原酶,例如来自迈氏假单胞菌(P.mevalonii),闪烁古生球菌(A.fulgidus)或金黄色葡萄球菌(S.aureus)的HMG-CoA还原酶。在特定实施方案,所述HMG-CoA还原酶仅能够利用NADH作为辅因子,例如来自迈氏假单胞菌(P.mevalonii),波美罗伊硅杆菌(S.pomeroyi)或食酸代尔夫特菌(D.acidovorans)的HMG-CoA还原酶。
在一些实施方案,使用NADH的HMG-CoA还原酶来自迈氏假单胞菌(Pseudomonasmevalonii)。先前已描述了编码HMG-CoA还原酶(EC 1.1.1.88)的迈氏假单胞菌(Pseudomonas mevalonii)的野生型mvaA基因的序列。参见Beach and Rodwell,J.Bacteriol.171:2994-3001(1989)。代表性的迈氏假单胞菌(Pseudomonas mevalonii)的mvaA核苷酸序列包括登录号M24015。迈氏假单胞菌(Pseudomonas mevalonii)的代表性HMG-CoA还原酶蛋白质序列包括登录号AAA25837、P13702、MVAA_PSEMV。
在一些实施方案,使用NADH的HMG-CoA还原酶来自波美罗伊硅杆菌(Silicibacterpomeroyi)。代表性的波美罗伊硅杆菌(Silicibacter pomeroyi)的HMG-CoA还原酶核苷酸序列包括登录号NC_006569.1。波美罗伊硅杆菌(Silicibacter pomeroyi)的代表性HMG-CoA还原酶蛋白质序列包括登录号YP_164994。
在一些实施方案,所述使用NADH的HMG-CoA还原酶来自食酸代尔夫特菌(Delftiaacidovorans)。食酸代尔夫特菌(Delftia acidovorans)的代表性HMG-CoA还原酶核苷酸序列包括NC_010002REGION:互补(319980..321269)。食酸代尔夫特菌(Delftiaacidovorans)的代表性HMG-CoA还原酶蛋白质序列包括登录号YP_001561318。
在一些实施方案,所述使用NADH的HMG-CoA还原酶来自马铃薯(Solanumtuberosum)(Crane et al.,J.Plant Physiol.159:1301-1307(2002))。
在本发明提供的组合物和方法中还可采用的使用NADH的HMG-CoA还原酶包括那些被称为任何本发明所述的使用NADH的HMG-CoA还原酶的“衍生物”的分子,例如来自迈氏假单胞菌(P.mevalonii),波美罗伊硅杆菌(S.pomeroyi)和食酸代尔夫特菌(D.acidovorans)的使用NADH的HMG-CoA还原酶的“衍生物”的分子。此种“衍生物”具有以下特征:(1)它与任何本发明所述的使用NADH的HMG-CoA还原酶具有基本同源性;和(2)能够催化(S)-HMG-CoA还原脱酰为(R)-甲羟戊酸,同时优先使用NADH作为辅因子。如果所述衍生物的氨基酸序列与使用NADH的HMG-CoA还原酶的氨基酸序列为至少80%,更优选至少90%,最优选至少95%相同,则使用NADH的HMG-CoA还原酶的衍生物与使用NADH的HMG-CoA还原酶具有“基本同源性”。
本发明使用的短语“使用NADH/NADH-使用的”是指所述使用NADH的HMG-CoA还原酶对NADH作为辅因子相对NADPH作为辅因子具有选择性,譬如,通过证明对NADH的比活性高于对NADPH的比活性。在一些实施方案,对作为辅因子的NADH的选择性表示为kcat (NADH)/kcat (NADPH)比值。在一些实施方案,所述使用NADH的HMG-CoA还原酶具有至少5、10、15、20、25或大于25的kcat (NADH)/kcat (NADPH)比值。在一些实施方案,所述使用NADH的HMG-CoA还原酶仅使用NADH。譬如,仅使用NADH的使用NADH的HMG-CoA还原酶显示出一定活性,其中NADH作为体外唯一的辅助因子提供,并且当NADPH作为唯一辅因子提供时不显示可检测的活性。可利用本领域已知的任何确定辅因子特异性的方法来鉴定优先选择NADH作为辅因子的HMG-CoA还原酶,包括Kim et al.,Protein Science 9:1226-1234(2000);和Wilding et al.,J.Bacteriol.182(18):5147-52(2000)中描述的那些,其内容均通过引用其整体并入本发明。
在一些实施方案,所述使用NADH的HMG-CoA还原酶被设计为对NADH相较NAPDH具有选择性,例如,通过辅因子结合口袋的定点诱变来设计。工程化设计NADH选择性的方法记载在Watanabe et al.,Microbiology 153:3044-3054(2007)中,用于确定HMG-CoA还原酶的辅因子特异性的方法记载在Kim et al.,Protein Sci.9:1226-1234(2000)中,其内容均通过引用其整体并入本发明。
在一些实施方案,所述使用NADH的HMG-CoA还原酶衍生自天然包含甲羟戊酸降解途径的宿主物种,例如,使作为其唯一碳源的甲羟戊酸分解代谢的宿主物种。在所述这些实施方案中,所述使用NADH的HMG-CoA还原酶,其通常催化在其天然宿主细胞内的内化的(R)-甲羟戊酸氧化酰化为(S)-HMG-CoA,用于催化所述逆向反应,即,在包含甲羟戊酸生物合成途径的经遗传修饰的宿主细胞中,使(S)-HMG-CoA还原脱酰为(R)-甲羟戊酸。能够在甲羟戊酸作为其唯一碳源上生长的原核生物已记载在:Anderson et al.,J.Bacteriol,171(12):6468-6472(1989);Beach et al.,J.Bacteriol.171:2994-3001(1989);Bensch et al.,J.Biol.Chem.245:3755-3762;Fimongnari et al.,Biochemistry 4:2086-2090(1965);Siddiqi etal.,Biochem.Biophys.Res.Commun.8:110-113(1962);Siddiqi et al.,J.Bacteriol.93:207-214(1967);和Takatsuji et al.,Biochem.Biophys.Res.Commun.110:187-193(1983)中,其内容均通过引用其整体并入本发明。
在本发明提供的组合物和方法的一些实施方案中,所述宿主细胞包含使用NADH的HMGr(HMG-CoA还原酶)和使用NADPH的HMG-CoA还原酶。编码使用NADPH的HMG-CoA还原酶的核苷酸序列的示例性实例包括但不限于:(NM_206548;黑腹果蝇(Drosophilamelanogaster)),(NC_002758,基因座标签为SAV2545,基因ID(GeneID)为1122570;金黄色葡萄球菌(Staphylococcus aureus)),(AB015627;链霉菌属(Streptomyces sp.)KO3988),(AX128213,提供编码截短的HMG-CoA还原酶的序列;酿酒酵母(Saccharomycescerevisiae)),和(NC_001145:互补(115734.118898;酿酒酵母(Saccharomycescerevisiae))。
6.6.4甲羟戊酸转化为甲羟戊酸-5-磷酸
在一些实施方案,所述宿主细胞包含编码酶的异源核苷酸序列,所述酶可将甲羟戊酸转化为甲羟戊酸5-磷酸,例如甲羟戊酸激酶。编码此种酶的核苷酸序列的示例性实例包括但不限于:(L77688;拟南芥(Arabidopsis thaliana)),和(X55875;酿酒酵母(Saccharomyces cerevisiae))。
6.6.5甲羟戊酸-5-磷酸转化为甲羟戊酸-5-焦磷酸
在一些实施方案,所述宿主细胞包含编码酶的异源核苷酸序列,所述酶可将甲羟戊酸5-磷酸转化为甲羟戊酸5-焦磷酸,例如磷酸甲羟戊酸激酶。编码此种酶的核苷酸序列的示例性实例包括但不限于:(AF429385;巴西橡胶树(Hevea brasiliensis)),(NM_006556;智人(Homo sapiens)),和(NC_001145.互补712315.713670;酿酒酵母(Saccharomyces cerevisiae))。
6.6.6甲羟戊酸-5-焦磷酸转化为IPP
在一些实施方案,所述宿主细胞包含编码酶的异源核苷酸序列,所述酶可将甲羟戊酸5-焦磷酸转化为异戊烯焦磷酸(IPP),例如甲羟戊酸焦磷酸脱羧酶。编码此种酶的核苷酸序列的示例性实例包括但不限于:(X97557;酿酒酵母(Saccharomyces cerevisiae)),(AF290095;屎肠球菌(Enterococcus faecium)),和(U49260;智人(Homo sapiens))。
6.6.7IPP转化为DMAPP
在一些实施方案,所述宿主细胞还包含编码酶的异源核苷酸序列,所述酶可将通过MEV途径生成的IPP转化为二甲基烯丙基焦磷酸(DMAPP),例如IPP异构酶。编码此种酶的核苷酸序列的示例性实例包括但不限于:(NC_000913,3031087.3031635;大肠杆菌(Escherichia coli)),和(AF082326;雨生红球藻(Haematococcus pluvialis))。
6.6.8聚异戊二烯合酶
在一些实施方案,所述宿主细胞还包含编码聚异戊二烯合酶的异源性核苷酸序列,所述聚异戊二烯合酶可使IPP和/或DMAPP分子缩合以形成含有多于5个碳的聚异戊二烯基化合物。
在一些实施方案,所述宿主细胞包含编码酶的异源核苷酸序列,所述酶可将一分子IPP与一分子DMAPP缩合以形成一分子香叶基焦磷酸(“GPP”),例如GPP合酶。编码此种酶的核苷酸序列的示例性实例包括但不限于:(AF513111;巨冷杉(Abies grandis)),(AF513112;巨冷杉),(AF513113;巨冷杉),(AY534686;金鱼草(Antirrhinum majus)),(AY534687;金鱼草),(Y17376;拟南芥(Arabidopsis thaliana)),(AE016877,基因座AP11092;蜡样芽胞杆菌(Bacillus cereus);ATCC 14579),(AJ243739;甜橙(Citrussinensis)),(AY534745;仙女扇(Clarkia breweri)),(AY953508;齿小蠹(Ips pini)),(DQ286930;番茄(Lycopersicon esculentum)),(AF182828;胡椒薄荷(Mentha xpiperita)),(AF182827;胡椒薄荷),(MPI249453;胡椒薄荷),(PZE431697,基因座CAD24425;玉米黄质副球菌(Paracoccuszeaxanthinifaciens)),(AY866498;胡黄连(Picrorhiza kurrooa)),(AY351862;葡萄(Vitis vinifera)),和(AF203881,基因座AAF12843;运动发酵单胞菌(Zymomonas mobilis))。
在一些实施方案,所述宿主细胞包含编码酶的异源核苷酸序列,所述酶可将两分子IPP与一分子DMAPP缩合,或者将IPP分子添加至GPP分子中,以形成法呢基焦磷酸(“FPP”)分子,例如FPP合酶。编码此种酶的核苷酸序列的示例性实例包括但不限于:(ATU80605;拟南芥),(ATHFPS2R;拟南芥),(AAU36376;青蒿(Artemisia annua)),(AF461050;欧洲普通牛(Bos taurus)),(D00694;大肠杆菌K-12),(AE009951,基因座AAL95523;具核梭杆菌具核亚种(Fusobacterium nucleatum subsp.nucleatum)ATCC25586),(GFFPPSGEN;藤仓赤霉(Gibberella fujikuroi)),(CP000009,基因座AAW60034;氧化葡萄糖杆菌(Gluconobacteroxydans)621H),(AF019892;向日葵(Helianthus annuus)),(HUMFAPS;智人(Homosapiens)),(KLPFPSQCR;乳酸克鲁维酵母(Kluyveromyces lactis)),(LAU15777;白羽扇豆(Lupinus albus)),(LAU20771;白羽扇豆),(AF309508;小鼠(Mus musculus)),(NCFPPSGEN;粗糙脉孢菌(Neurospora crassa)),(PAFPS1;灰白银胶菊(Partheniumargentatum)),(PAFPS2;灰白银胶菊),(RATFAPS;褐家鼠(Rattus norvegicus)),(YSCFPP;酿酒酵母),(D89104;粟酒裂殖酵母(Schizosaccharomyces pombe)),(CP000003,基因座AAT87386;酿脓链球菌(Streptococcus pyogenes)),(CP000017,基因座AAZ51849;酿脓链球菌),(NC_008022,基因座YP_598856;酿脓链球菌MGAS10270),(NC_008023,基因座YP_600845;酿脓链球菌MGAS2096),(NC_008024,基因座YP_602832;酿脓链球菌MGAS10750),(MZEFPS;玉米(Zea mays)),(AE000657,基因座AAC06913;风产液菌(Aquifex aeolicus)VF5),(NM_202836;拟南芥),(D84432,基因座BAA12575;枯草芽孢杆菌(Bacillussubtilis)),(U12678,基因座AAC28894;慢生型大豆根瘤菌(Bradyrhizobiumjaponicum)USDA 110),(BACFDPS;嗜热脂肪土芽孢杆菌(Geobacillus stearothermophilus)),(NC_002940,基因座NP_873754;杜克雷嗜血杆菌(Haemophilus ducreyi)35000HP),(L42023,基因座AAC23087;流感嗜血杆菌(Haemophilus influenzae)RdKW20),(J05262;智人(Homosapiens)),(YP_395294;沙克乳酸杆菌沙克亚种(Lactobacillus sakei subsp.sakei)23K),(NC_005823,基因座YP_000273;Copenhageni str.Fiocruz钩端螺旋体血清变型(Leptospira interrogans serovar Copenhageni str.Fiocruz)L1-130),(AB003187;藤黄微球菌(Micrococcus luteus)),(NC_002946,基因座YP_208768;淋病奈瑟氏菌(Neisseria gonorrhoeae)FA 1090),(U00090,基因座AAB91752;根瘤菌属(Rhizobiumsp.)NGR234),(J05091;酿酒酵母),(CP000031,基因座AAV93568;Silicibacter pomeroyiDSS-3),(AE008481,基因座AAK99890;肺炎链球菌(Streptococcus pneumoniae)R6),和(NC_004556,基因座NP 779706;木质部难养菌特曼库拉1(Xylella fastidiosaTemecula1)。
在一些实施方案,所述宿主细胞还包含编码酶的异源核苷酸序列,所述酶将IPP和DMAPP或IPP和FPP进行结合以形成香叶基香叶基焦磷酸(“GGPP”)。编码此种酶的核苷酸序列的示例性实例包括但不限于:(ATHGERPYRS;拟南芥),(BT005328;拟南芥),(NM_119845;拟南芥),(NZ_AAJM01000380,基因座ZP_00743052;苏云金芽孢杆菌血清变型(Bacillusthuringiensis serovar israelensis),ATCC 35646sq1563),(CRGGPPS;长春花(Catharanthus roseus)),(NZ_AABF02000074,基因座ZP_00144509;具核梭杆菌文森特亚种(Fusobacterium nucleatum subsp.vincentii),ATCC 49256),(GFGGPPSGN;藤仓赤霉(Gibberella fujikuroi)),(AY371321;银杏(Ginkgo biloba)),(AB055496;巴西橡胶树(Hevea brasiliensis)),(AB017971;智人(Homo sapiens)),(MCI276129;卢西坦毛霉(Mucor circinelloides f.lusitanicus)),(AB016044;小鼠(Mus musculus)),(AABX01000298,基因座NCU01427;粗糙脉孢菌(Neurospora crassa)),(NCU20940;粗糙脉孢菌),(NZ_AAKL01000008,基因座ZP_00943566;青枯雷尔氏菌(Ralstonia solanacearum)UW551),(AB118238;褐家鼠(Rattus norvegicus)),(SCU31632;酿酒酵母),(AB016095;细长聚球藻(Synechococcus elongates)),(SAGGPS;白芥子(Sinapis alba)),(SSOGDS;嗜酸热硫化叶菌(Sulfolobus acidocaldarius)),(NC_007759,基因座YP_461832;aciditrophicus互养菌(Syntrophus aciditrophicus)SB),(NC_006840,基因座YP_204095;费氏弧菌(Vibrio fischeri)ES114),(NM_112315;拟南芥),(ERWCRTE;成团泛菌(Pantoea agglomerans)),(D90087,基因座BAA14124;菠萝泛菌(Pantoea ananatis)),(X52291,基因座CAA36538;荚膜红细菌(Rhodobacter capsulatus)),(AF195122,基因座AAF24294;类球红细菌(Rhodobacter sphaeroides)),和(NC_004350,基因座NP_721015;变异链球菌(Streptococcus mutans)UA159)。
虽然上文描述了甲羟戊酸途径的酶的实例,但在某些实施方案,所述DXP途径的酶在本发明所述的宿主细胞、组合物和方法中可用作生成DMAPP和IPP的替代途径或另外的途径。酶以及编码所述DXP途径的酶的核酸是本领域公知的以及在现有技术WO2012/135591A2表征的那些。
6.7生成甜菊糖苷类化合物的方法
另一方面,本发明提供了生成甜菊糖苷的方法,所述方法包含以下步骤:(a)在适于制备甜菊糖苷化合物的条件下,在含有碳源的培养基中培养能够生成所述甜菊糖苷的任何本发明所述的经遗传修饰的宿主细胞群;和(b)从所述培养基中回收所述甜菊糖苷化合物。
在一些实施方案,与不包含一种或多种修饰的亲本细胞相比,或者与仅包含所述经遗传修饰的宿主细胞的一种或多种修饰的子集,但在遗传上是相同的亲本细胞相比,所述经遗传修饰的宿主细胞生成增加量的甜菊糖苷。在一些实施方案,所述增加的量为至少1%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、100%、或大于100%,例如,以产量、生成量、生产率计,或以克/升细胞培养物,毫克/克干细胞重量计,或者基于每单位体积的细胞培养物,基于每单位干细胞重量,基于每单位时间的每单位体积的细胞培养物,或基于每单位时间的每单位干细胞重量计。
在一些实施方案,所述宿主细胞生成升高水平的甜菊糖苷,其大于约10克/升发酵培养基。在一些此类实施方案中,所述甜菊糖苷以从约10至约50克/升细胞培养物,超过约15克/升细胞培养物,超过约20克/升细胞培养物,超过约25克/升细胞培养物,超过约30克/升细胞培养物的量生成。
在一些实施方案,所述宿主细胞生成升高水平的甜菊糖苷,其大于约50毫克每克干细胞重量。在一些此类实施方案中,所述甜菊糖苷以从约50至约1500毫克,超过约100毫克,超过约150毫克,超过约200毫克,超过约250毫克,超过约500毫克,超过约750毫克,或超过约1000毫克每克干细胞重量的量生成。
在一些实施方案,所述宿主细胞生成升高水平的甜菊糖苷,其比由亲本细胞生成的甜菊糖苷水平高至少约10%,至少约15%,至少约20%,至少约25%,至少约30%,至少约35%,至少约40%,至少约45%,至少约50%,至少约60%,至少约70%,至少约80%,至少约90%,至少约2倍,至少约2.5倍,至少约5倍,至少约10倍,至少约20倍,至少约30倍,至少约40倍,至少约50倍,至少约75倍,至少约100倍,至少约200倍,至少约300倍,至少约400倍,至少约500倍,或至少约1000倍或更多,基于每单位体积细胞培养物。
在一些实施方案,所述宿主细胞生成升高水平的甜菊糖苷,其比由亲本细胞生成的甜菊糖苷水平高至少约10%,至少约15%,至少约20%,至少约25%,至少约30%,至少约35%,至少约40%,至少约45%,至少约50%,至少约60%,至少约70%,至少约80%,至少约90%,至少约2倍,至少约2.5倍,至少约5倍,至少约10倍,至少约20倍,至少约30倍,至少约40倍,至少约50倍,至少约75倍,至少约100倍,至少约200倍,至少约300倍,至少约400倍,至少约500倍,或至少约1000倍或更多,基于每单位干细胞重量。
在一些实施方案,所述宿主细胞生成升高水平的甜菊糖苷,其比由亲本细胞生成的甜菊糖苷水平高至少约10%,至少约15%,至少约20%,至少约25%,至少约30%,至少约35%,至少约40%,至少约45%,至少约50%,至少约60%,至少约70%,至少约80%,至少约90%,至少约2倍,至少约2.5倍,至少约5倍,至少约10倍,至少约20倍,至少约30倍,至少约40倍,至少约50倍,至少约75倍,至少约100倍,至少约200倍,至少约300倍,至少约400倍,至少约500倍,或至少约1000倍或更多,基于每单位时间的每单位体积细胞培养物。
在一些实施方案,所述宿主细胞生成升高水平的甜菊糖苷,其比由亲本细胞生成的甜菊糖苷水平高至少约10%,至少约15%,至少约20%,至少约25%,至少约30%,至少约35%,至少约40%,至少约45%,至少约50%,至少约60%,至少约70%,至少约80%,至少约90%,至少约2倍,至少约2.5倍,至少约5倍,至少约10倍,至少约20倍,至少约30倍,至少约40倍,至少约50倍,至少约75倍,至少约100倍,至少约200倍,至少约300倍,至少约400倍,至少约500倍,或至少约1000倍或更多,基于每单位时间的每单位干细胞重量。
在大多实施方案中,所述宿主细胞生成的升高水平的甜菊糖苷是由诱导化合物进行诱导。在不存在所述诱导化合物情况下,可容易地操作此种宿主细胞。然后加入所述诱导化合物以诱导所述宿主细胞生成升高水平的甜菊糖苷。在其他实施方案,通过改变培养条件,例如改变生长温度、培养基成分等,可诱导所述宿主细胞生成升高水平的甜菊糖苷。
6.8培养基和培养条件
用于微生物培养物的维持和生长的物料和方法是微生物学或发酵科学领域的技术人员所熟知的(参见,例如Bailey et al.,Biochemical Engineering Fundamentals,second edition,McGraw Hill,New York,1986)。根据宿主细胞、发酵和过程/方法的特定要求,必须考虑适当的培养基,pH值,温度,以及需氧、微需氧或厌氧条件的要求。
本发明提供的生成甜菊糖苷类化合物的方法可在合适的容器(包括但不限于细胞培养板、烧瓶或发酵罐)中在合适的培养基(例如,含或不含泛酸补充)中进行。此外,所述方法可以本领域已知的任何发酵规模进行,以支持微生物产物的工业生产。可使用任何合适的发酵罐,包括搅拌槽发酵罐,气升式发酵罐,气泡发酵罐或其任何组合。在利用酿酒酵母(Saccharomyces cerevisiae)作为宿主细胞的特定实施方案中,菌株可在发酵罐中生长,详细记载如Kosaric,et al,Ullmann's Encyclopedia of Industrial Chemistry,SixthEdition,Volume 12,pages 398-473,Wiley-VCH Verlag GmbH&Co.KDaA,Weinheim,Germany中所述。
在一些实施方案,所述培养基是其中能够生成甜菊糖苷的经遗传修饰的微生物可以存活,即保持生长和活力的任何培养基。在一些实施方案,所述培养基是包含可同化的碳源、氮源和磷酸盐源的水性介质。此种培养基还可包括适当的盐类、矿物质类、金属类和其他营养物类。在一些实施方案,将所述碳源和每种必需细胞营养物增量地或连续地添加到发酵培养基中,并将每种所需营养物通过使细胞生长,譬如,根据基于将碳源转化成生物量的细胞的代谢或呼吸功能的预定细胞生长曲线,保持在基本有效同化所需的最低水平。
用于培养微生物的合适条件和合适的培养基是本领域熟知的。在一些实施方案,所述合适的培养基补充有一种或多种另外的试剂,例如诱导物(例如,当编码基因产物的一个或多个核苷酸序列受诱导型启动子的控制时),阻抑物(例如,当编码基因产物的一个或多个核苷酸序列受阻抑型启动子的控制时),或选择剂(例如,选择包含所述经遗传修饰的微生物的抗生素)。
在一些实施方案,所述碳源是单糖(简单糖)、二糖、多糖、不可发酵的碳源、或其一种或多种组合。合适的单糖的非限制性实例包括葡萄糖、半乳糖、甘露糖、果糖、木糖、核糖、和其组合。合适的二糖的非限制性实例包括蔗糖、乳糖、麦芽糖、海藻糖、纤维二糖、和其组合。合适的多糖的非限制性实例包括淀粉、糖原、纤维素、几丁质、和其组合。合适的不可发酵碳源的非限制性实例包括乙酸盐和甘油。
所述培养基中碳源(例如葡萄糖)的浓度应促进细胞生长,但不能高到抑制所用微生物的生长。通常,培养物采用碳源(例如葡萄糖)进行,所述碳源以达到所需生长水平和生物量的水平、但以不可检测水平(检测限为约<0.1g/L)进行添加。在其他实施方案,所述培养基中碳源(例如葡萄糖)的浓度大于约1g/L,优选大于约2g/L,更优选大于约5g/L。此外,所述培养基中碳源(例如葡萄糖)的浓度通常小于约100g/L,优选小于约50g/L,更优选小于约20g/L。应当注意,对培养组分浓度的提及可以指初始和/或正在进行的组分浓度。在一些情况下,可能需要在培养期间使所述培养基耗尽碳源。
可用于合适培养基的可同化氮的来源包括但不限于简单氮源、有机氮源和复合氮源。此类氮源包括无水氨,铵盐类,以及动物、植物和/或微生物来源的物质。合适的氮源包括但不限于,蛋白质水解产物类,微生物生物量水解产物类,蛋白胨,酵母提取物,硫酸铵,尿素和氨基酸类。通常,所述培养基中所述氮源的浓度大于约0.1g/L,优选大于约0.25g/L,更优选大于约1.0g/L。然而,超过一定浓度,向所述培养基中添加氮源对于微生物的生长是不利的。因此,所述培养基中所述氮源的浓度小于约20g/L,优选小于约10g/L,更优选小于约5g/L。此外,在某些情况下,可能需要在培养期间使所述培养基耗尽所述氮源。
有效的培养基可含有其他化合物,例如无机盐类、维生素类、痕量金属类、或生长促进剂类。此类其他化合物也可存在于有效培养基中的碳源、氮源或矿物源中,或者可特异性地添加至所述培养基中。
所述培养基还可含有合适的磷酸盐源。此类磷酸盐源包括无机磷酸盐源和有机磷酸盐源。优选的磷酸盐源包括但不限于磷酸的盐类,例如单或二元磷酸钠和磷酸钾、磷酸铵、和其混合物。通常,所述培养基中磷酸盐的浓度大于约1.0g/L,优选大于约2.0g/L,更优选大于约5.0g/L。然而,超过一定浓度,向所述培养基中添加磷酸盐对于微生物的生长是不利的。因此,所述培养基中所述磷酸盐的浓度通常小于约20g/L,优选小于约15g/L,更优选小于约10g/L。
合适的培养基还可包括镁源,优选地以生理学上可接受的盐的形式,例如七水合硫酸镁,尽管可使用浓度为贡献相似量的镁的其他镁源。通常,所述培养基中镁的浓度大于约0.5g/L,优选大于约1.0g/L,更优选大于约2.0g/L。然而,超过一定浓度,向所述培养基中添加镁对于微生物的生长是不利的。因此,所述培养基中镁的浓度通常小于约10g/L,优选小于约5g/L,更优选小于约3g/L。此外,在某些情况下,可能需要在培养期间使所述培养基耗尽镁源。
在一些实施方案,所述培养基还可包含生物学上可接受的螯合剂,例如二水合柠檬酸三钠。在此种情况下,所述培养基中螯合剂的浓度大于约0.2g/L,优选大于约0.5g/L,更优选大于约1g/L。然而,超过一定浓度,向所述培养基中添加螯合剂对于微生物的生长是不利的。因此,所述培养基中螯合剂的浓度通常小于约10g/L,优选小于约5g/L,更优选小于约2g/L。
所述培养基最初还可包括生物学上可接受的酸或碱以维持所述培养基的所需pH值。生物学上可接受的酸包括但不限于,盐酸、硫酸、硝酸、磷酸、和其混合物。生物学上可接受的碱包括但不限于,氢氧化铵、氢氧化钠、氢氧化钾、和其混合物。在一些实施方案,使用的碱是氢氧化铵。
所述培养基还可包括生物学上可接受的钙源,包括但不限于氯化钙。通常,所述培养基中所述钙源(例如氯化钙二水合物)的浓度在约5mg/L至约2000mg/L的范围内,优选在约20mg/L至约1000mg/L的范围内,更优选在约50mg/L至约500mg/L的范围内。
所述培养基还可包括氯化钠。通常,所述培养基中氯化钠的浓度在约0.1g/L至约5g/L的范围内,优选在约1g/L至约4g/L的范围内,更优选在约2g/L至约4g/L的范围内。
在一些实施方案,所述培养基还可包含痕量金属。此类痕量金属可作为储备溶液添加至所述培养基中,为方便起见,可与其余培养基分开制备。通常,添加至所述培养基中的此痕量金属溶液的量大于约1mL/L,优选大于约5mL/L,更优选大于约10mL/L。然而,超过一定浓度,向所述培养基中添加痕量金属对于微生物的生长是不利的。因此,添加至所述培养基中的此痕量金属溶液的量通常小于约100mL/L,优选小于约50mL/L,更优选小于约30mL/L。应注意的是,除了在储备溶液中添加痕量金属之外,各个组分可单独进行添加,各自在与上述痕量金属溶液范围所规定的组分的量相对应的范围内。
所述培养基可包括其他维生素类,例如泛酸、生物素、钙、泛酸盐、肌醇、吡哆醇-HCl和硫胺素-HCl。此类维生素可作为储备溶液添加至所述培养基中,为方便起见,可与其余培养基分开制备。然而,超过一定浓度,向所述培养基中添加维生素类不利于微生物的生长。
本发明所述的发酵方法可以常规培养模式进行,所述培养模式包括但不限于分批、补料分批、细胞再循环、连续和半连续。在一些实施方案,所述发酵以补料分批模式进行。在此种情况下,所述培养基中的一些组分在培养期间被耗尽,所述组分包括在发酵的生成阶段期间的泛酸。在一些实施方案,所述培养物可在开始时(例如,生成阶段)补充相对高浓度的此类组分,使得在需要添加之前支持生长和/或甜菊糖苷生成一段时间。所述这些组分的优选范围在整个培养过程中通过添加来维持,所述添加以培养物耗尽的水平进行添加。可通过例如定期对培养基取样并测定浓度来监测所述培养基中组分的水平。或者,一旦开发出标准培养程序,所述添加可在整个培养期间的特定时间对应于已知水平以定时间隔进行。如本领域技术人员将认识到的,随着所述培养基的细胞密度增加,培养期间营养物的消耗速率亦将增加。此外,为了避免将外来微生物引入培养基中,可使用本领域已知的无菌添加方法进行添加。此外,在培养期间可加入少量消泡剂。
所述培养基的温度可以是适于经遗传修饰的细胞生长和/或甜菊糖苷生成的任何温度。譬如,在用接种物接种培养基之前,所述培养基可保持在约20℃至约45℃的温度范围内,优选保持在约25℃至约40℃的温度范围内,更优选保持在约28℃至约32℃的温度范围内。
可通过向所述培养基中添加酸或碱来控制所述培养基的pH值。在此种情况下,当氨用于控制pH时,其也方便地用作所述培养基中的氮源。优选地,所述pH值保持在约3.0至约8.0,更优选保持在约3.5至约7.0,最优选保持在约4.0至约6.5。
在一些实施方案,在培养期间监测所述培养基的碳源浓度,例如葡萄糖浓度。可使用已知技术监测所述培养基的葡萄糖浓度,例如,采用葡萄糖氧化酶试验或高压液相色谱,其可用于监测上清液(例如,所述培养基的无细胞组分)中的葡萄糖浓度。如前所述,所述碳源浓度应保持低于发生细胞生长抑制的水平。虽然此浓度可能因生物体而异,但对于葡萄糖作为碳源,细胞生长抑制发生在葡萄糖浓度大于约60g/L时,并可通过试验容易地确定。因此,当葡萄糖用作碳源时,优选将葡萄糖加入发酵罐中并保持在检测限以下。或者,所述培养基中的葡萄糖浓度维持在约1g/L至约100g/L的范围内,更优选地维持在约2g/L至约50g/L的范围内,更优选地维持在约5g/L至约20g/L的范围内。尽管通过添加例如基本上纯的葡萄糖溶液,可将所述碳源浓度维持在所需水平,但通过添加初始培养基的等分试样来维持的所述培养基的所述碳源浓度是可接受的,并且可能是优选的。使用初始培养基的等分试样是可取的,因为可同时维持所述培养基中的其他营养物(例如,氮源和磷酸盐源)的浓度。同样,通过添加痕量金属溶液的等份试样,亦可在所述培养基中维持所述痕量金属浓度。
其他合适的发酵培养基和方法记载在例如WO 2016/196321中。
6.9发酵组合物
另一方面,本发明提供了发酵组合物,其包含本发明所述的经遗传修饰的宿主细胞和由所述经遗传修饰的宿主细胞生成的甜菊糖苷类化合物。所述发酵组合物可进一步包含培养基。在某些实施方案,所述发酵组合物包含经遗传修饰的宿主细胞,和进一步包含RebA、RebD和RebM。在某些实施方案,本发明提供的发酵组合物包含RebM,作为由所述经遗传修饰的宿主细胞生成的甜菊糖苷类化合物的主要组分。在某些实施方案,所述发酵组合物包含RebA:RebD:RebM比例为至少1:7:50的RebA、RebD和RebM。在某些实施方案,所述发酵组合物包含RebA:RebD:RebM比例为至少1:7:50至1:100:1000的RebA、RebD和RebM。在某些实施方案,所述发酵组合物包含RebA:RebD:RebM比例为至少1:7:50至1:200:2000的RebA、RebD和RebM。在某些实施方案,所述RebA、RebD和RebM的比例是基于与所述经遗传修饰的宿主细胞和所述培养基相关的甜菊糖苷类化合物的总含量。在某些实施方案,所述RebA、RebD和RebM的比例是基于所述培养基中甜菊糖苷类化合物的总含量。在某些实施方案,所述RebA、RebD和RebM的比例是基于与所述经遗传修饰的宿主细胞相关的甜菊糖苷类化合物的总含量。
在某些实施方案,本发明提供的发酵组合物包含不可检测水平的RebM2。在某些实施方案,本发明提供的发酵组合物包含不可检测水平的非天然存在的甜菊糖苷类化合物。在某些实施方案,当本发明提供的发酵组合物进行GC色谱分析时,在可检测水平上,在RebA峰和RebB峰之间不产生“甜菊醇+2葡萄糖”峰。
6.10甜菊糖苷类化合物的回收
一旦甜菊糖苷由所述宿主细胞生成,便可使用本领域已知的任何合适的分离和纯化方法将其回收或分离用于后续应用。在一些实施方案,通过离心将包含甜菊糖苷的有机相从发酵物分离得到。在其他实施方案,包含甜菊糖苷的有机相自发地从发酵物中分离得到。在其他实施方案,通过将破乳剂和/或成核剂添加至发酵反应中,将包含甜菊糖苷的有机相从发酵物分离得到。破乳剂的示例性实例包括絮凝剂类和凝结剂类。成核剂的示例性实例包括甜菊糖苷本身的液滴和有机溶剂类,例如十二烷、肉豆蔻酸异丙酯和油酸甲酯。
在所述这些细胞中生成的甜菊糖苷可存在于培养物上清液中和/或与所述宿主细胞结合。在甜菊糖苷与宿主细胞结合的实施方案中,所述甜菊糖苷的回收可包括透化或裂解所述细胞的方法。或者或同时,可使用回收方法来回收所述培养基中的甜菊糖苷,所述回收方法包括但不限于,色谱法、萃取法、溶剂萃取法、膜分离法、电渗析法、反渗透法、蒸馏法、化学衍生化方法和结晶法。
在一些实施方案,将甜菊糖苷与可存在于有机相中的其他产物进行分离。在一些实施方案,使用吸附法、蒸馏法、气液萃取(汽提)法、液-液萃取(溶剂萃取)法、真空萃取法、蒸发、超滤法、和标准色谱技术来实现分离。其他合适的发酵培养基和方法记载在例如美国专利申请公开号2016/0185813中。
6.11制备经遗传修饰的细胞的方法
本发明还提供了用于生成宿主细胞的方法,所述宿主细胞经遗传工程改造以包含一种或多种上述修饰,例如编码豌豆(Pisum sativum)贝壳杉烯氧化酶的一种或多种异源核酸,和/或生物合成途径酶,例如用于甜菊糖苷化合物的生物合成途径酶。异源酶在宿主细胞中的表达可通过在所述宿主细胞中引入包含编码所述酶的核苷酸序列的核酸来实现,编码所述酶的所述核苷酸序列受允许在所述宿主细胞中表达的调节元件的控制。在一些实施方案,所述核酸是染色体外质粒。在其他实施方案,所述核酸是染色体整合载体,其可将所述核苷酸序列整合到所述宿主细胞的染色体中。
可通过本领域技术人员已知的任何方法,且不限于这些方法,将编码这些蛋白质的核酸引入所述宿主细胞中(参见,例如Hinnen et al.(1978)Proc.Natl.Acad.Sci.USA75:1292-3;Cregg et al.(1985)Mol.Cell.Biol.5:3376-3385;Goeddel et al.eds,1990,Methods in Enzymology,vol.185,Academic Press,Inc.,CA;Krieger,1990,GeneTransfer and Expression--A Laboratory Manual,Stockton Press,NY;Sambrook etal.,1989,Molecular Cloning--A Laboratory Manual,Cold Spring HarborLaboratory,NY;和Ausubel et al.,eds.,Current Edition,Current Protocols inMolecular Biology,Greene Publishing Associates andWiley Interscience,NY)。示例性技术包括但不限于原生质球法、电穿孔法、PEG1000介导的转化、和乙酸锂或氯化锂介导的转化。
可通过修饰编码所述酶的基因的转录来改变宿主细胞中酶的拷贝数。其可通过例如修饰编码所述酶的所述核苷酸序列的拷贝数(例如,通过使用包含所述核苷酸序列的更高或更低拷贝数的表达载体,或通过将所述核苷酸序列另外的拷贝引入所述宿主细胞的基因组中,或通过删除或破坏所述宿主细胞基因组中的所述核苷酸序列),通过改变操纵子的多顺反子mRNA上的编码序列的顺序或将操纵子分解成各自具有其自身控制元件的单个基因,或通过增加核苷酸序列可操作连接的启动子或操纵子的强度来实现。或者或另外,可通过改变编码酶的mRNA的翻译水平来改变宿主细胞中酶的拷贝数。其可通过譬如改变mRNA的稳定性,改变核糖体结合位点的序列,改变核糖体结合位点和酶编码序列的起始密码子之间的距离或序列,改变位于酶编码区起始密码子“上游”或邻接5'侧的整个跨顺反子区域,使用发夹和特化序列稳定mRNA转录物的3'末端,修改酶的密码子使用,改变用于酶的生物合成的稀有密码子tRNA的表达,和/或增加酶的稳定性,例如通过其编码序列的突变来实现。
宿主细胞中酶的活性可以多种方式改变,包括但不限于,表达在宿主细胞中表现出增加或降低的溶解度的酶的修饰形式;表达酶的改变形式,所述酶缺乏抑制所述酶活性的结构域;表达酶的修饰形式,所述酶具有更高或更低的Kcat或更低或更高的Km的底物;或表达酶的改变形式,所述酶或多或少受到所述途径中另一分子的反馈或前馈调节的影响。
在一些实施方案,用于经遗传修饰的宿主细胞的核酸包含一种或多种选择标记,所述选择标记可用于选择转化的宿主细胞和对所述宿主细胞施加选择性压力以维持外源DNA。
在一些实施方案,所述选择标记是抗生素抗性标记。抗生素抗性标记的示例性实例包括但不限于,BLA、NAT1、PAT、AUR1-C、PDR4、SMR1、CAT、小鼠dhfr、HPH、DSDA、KANR、和SHBLE基因产物。来自大肠杆菌的BLA基因产物对β-内酰胺抗生素(例如,窄谱头孢菌素类、头孢霉素类、和碳青霉烯类(厄他培南)、头孢孟多和头孢哌酮)具有抗性,以及对除了替莫西林(temocillin)之外的所有抗革兰氏阴性细菌青霉素类具有抗性;来自诺尔斯链霉菌(S.noursei)的NAT1基因产物对诺尔丝菌素具有抗性;来自产绿色链霉菌(S.viridochromogenes)Tu94的PAT基因产物对双丙氨膦(bialophos)具有抗性;来自酿酒酵母的AUR1-C基因产物对Auerobasidin A(AbA)具有抗性;PDR4基因产物对浅蓝菌素具有抗性;SMR1基因产物对甲嘧磺隆具有抗性;来自Tn9转座子的CAT基因产物对氯霉素具有抗性;小鼠dhfr基因产物对甲氨蝶呤具有抗性;肺炎克雷伯氏菌(Klebsiella pneumonia)的HPH基因产物对潮霉素B具有抗性;大肠杆菌的DSDA基因产物使细胞在D-丝氨酸作为唯一氮源的平板上生长;Tn903转座子的KANR基因对G418具有抗性;和来自印度斯坦异壁链霉菌(Streptoalloteichus hindustanus)的SHBLE基因产物对Zeocin(博来霉素)具有抗性。在一些实施方案,在分离本发明公开的经遗传修饰的宿主细胞后,删除所述抗生素抗性标记。
在一些实施方案,所述选择标记拯救所述经遗传修饰的微生物中的营养缺陷型(例如,营养性营养缺陷型)。在此类实施方案中,亲本微生物包含一种或多种基因产物中的功能性破坏,所述一种或多种基因产物在氨基酸或核苷酸生物合成途径中起作用,并且当非功能性使得亲本细胞不能在培养基中生长而不补充一种或多种营养素时。此类基因产物包括但不限于酵母中的HIS3、LEU2、LYS1、LYS2、MET15、TRP1、ADE2、和URA3基因产物。然后可通过用编码所述破坏的基因产物的功能性拷贝的表达载体或染色体整合构建体来转化亲本细胞,从而拯救营养缺陷型表型,并可基于所述亲本细胞的所述营养缺陷型表型的缺失来选择生成的经遗传修饰的宿主细胞。利用URA3、TRP1和LYS2基因作为选择标记具有显著的优势,因为正选择和负选择均是可能的。通过URA3、TRP1和LYS2突变的营养缺陷型互补进行正选择,而负选择则基于特异性抑制剂,即5-氟-乳清酸(FOA)、5-氟邻氨基苯甲酸、和氨基己二酸(aAA),其分别阻止原养型菌株生长但分别使URA3、TRP1和LYS2突变体生长。在其他实施方案,所述选择标记拯救可通过已知选择方法鉴定的其他非致死缺陷或表型。
本发明描述了可用于本发明公开的方法、组合物和生物体的特定基因和蛋白;然而,人们将认识到这些基因的绝对同一性是不必要的。譬如,可对包含编码多肽或酶的序列的特定基因或多核苷酸进行变化并筛选活性。通常,此类变化包括保守突变和沉默突变。可使用本领域已知的方法筛选此类经修饰或经突变的多核苷酸和多肽以表达功能性酶。
由于遗传密码的固有简并性,编码基本上相同或功能等同的多肽的其他多核苷酸也可用于克隆和表达编码此类酶的多核苷酸。
如本领域技术人员将理解的,修饰编码序列以增强其在特定宿主中的表达可能是有利的。所述遗传密码是冗余的,具有64个可能的密码子,但大多数生物体通常使用这些密码子的子集。在物种中最常使用的密码子称为最佳密码子,而那些未经常使用的密码子被分类为稀有密码子或低使用密码子。在有时被称为“密码子优化”或“控制物种密码子偏倚”的过程中,密码子可被置换以反映所述宿主的优选密码子使用。可使用密码子使用表容易地确定其他宿主细胞的密码子优化,或者可使用商业上可获得的软件,例如来自Integrated DNA Technologies的CodonOp(www.idtdna.com/CodonOptfrom)进行密码子优化。
可制备含有特定原核或真核宿主(Murray et al.,1989,Nucl Acids Res.17:477-508)优选的密码子的优化编码序列,例如,与由非优化序列生成的转录物相比,以提高翻译速率或以生成具有所需特性(例如更长的半衰期)的重组RNA转录物。还可修改翻译终止密码子以反映宿主偏好。譬如,酿酒酵母和哺乳动物的典型终止密码子分别是UAA和UGA。单子叶植物类的典型终止密码子是UGA,而昆虫和大肠杆菌通常使用UAA作为终止密码子(Dalphin et al.,1996,Nucl Acids Res.24:216-8)。
本领域技术人员将认识到,由于遗传密码的简并性质,可使用与其核苷酸序列不同的多种DNA分子来编码本发明给定的酶。引用编码上述生物合成酶的天然DNA序列在本发明中仅用于说明本发明的实施方案,并且本发明包括任何序列的DNA分子,所述序列编码本发明方法中所用酶的多肽和蛋白质的氨基酸序列。以类似的方式,多肽通常可在其氨基酸序列中耐受一个或多个氨基酸置换、缺失和插入,而不会损失或显著损失所需活性。本发明包括具有与本发明所述特定蛋白质不同的氨基酸序列的此类多肽,只要所述经修饰的多肽或变体多肽具有所述参照多肽的酶促合成代谢活性或分解代谢活性即可。此外,由本发明所示的DNA序列编码的氨基酸序列仅阐明了本发明的实施方案。
此外,可用于本发明提供的组合物和方法的酶的同源物包含在本发明公开内容中。在一些实施方案,当氨基酸序列具有至少约30%、40%、50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性时,两种蛋白质(或所述蛋白质的区域)基本上是同源的。为了确定两个氨基酸序列或两个核酸序列的同一性百分比,比对所述序列以达到最佳比较目的(例如,可在第一和第二氨基酸或核酸序列中的一个或两个中引入空位用于最佳比对,并且可忽略非同源序列用于比较目的)。在一个实施方案,为比较目的而比对的参考序列的长度为所述参考序列长度的至少30%,通常至少40%,更通常至少50%,甚至更通常至少60%,甚至更通常至少70%、80%、90%、100%。然后比较相应氨基酸位置或核苷酸位置处的氨基酸残基或核苷酸。当所述第一序列中的位置被与所述第二序列中的相应位置的相同氨基酸残基或核苷酸占据时,那么所述分子在此位置具有同一性(本发明使用的氨基酸或核酸“同一性”等同于氨基酸或核酸“同源性”)。两个序列之间的同一性百分比是所述序列共有的相同位置的数量的函数,考虑到空位的数量和每个空位的长度,需引入这些空位以实现所述两个序列的最佳比对。
当“同源/同源性”用于提及蛋白质或肽时,将认识到不相同的残基位置通常因保守氨基酸置换而不同。“保守氨基酸置换”是其中氨基酸残基被具有相似化学性质(例如,电荷或疏水性)的侧链(R基团)的另一氨基酸残基置换的氨基酸置换。通常,保守氨基酸置换不会显著改变蛋白质的功能特性。在通过保守置换使两个或两个以上氨基酸序列彼此不同的情况下,可以向上调节序列同一性百分比或同源性程度以校正所述置换的保守性质。进行此种调节的方法是本领域技术人员所熟知的(参见,例如Pearson W.R.,1994,Methodsin Mol Biol 25:365-89)。
以下六组各自含有彼此保守置换的氨基酸:1)丝氨酸(S),苏氨酸(T);2)天冬氨酸(D),谷氨酸(E);3)天冬酰胺(N),谷氨酰胺(Q);4)精氨酸(R),赖氨酸(K);5)异亮氨酸(I),亮氨酸(L),丙氨酸(A),缬氨酸(V);和6)苯丙氨酸(F),酪氨酸(Y),色氨酸(W)。
通常使用序列分析软件来测定多肽的序列同源性,其也称为序列同一性百分比。用于将分子序列与含有来自不同生物体的大量序列的数据库进行比较的典型算法是计算机程序BLAST。当搜索含有来自大量不同生物体的序列的数据库时,通常比较氨基酸序列。
此外,编码前述酶(或本发明提及的任何其他酶类(或控制或调节其表达的任何调节元件))的任何基因可通过遗传/蛋白质工程技术进行优化,例如本领域普通技术人员已知的定向进化或合理诱变。此种作用使本领域普通技术人员能够优化所述酶在酵母中的表达和活性。
此外,编码所述这些酶的基因可从其他真菌和细菌物种中鉴定得到,并且可表达调节此途径。多种生物体可作为所述这些酶的来源,包括但不限于,酵母属(Saccharomycesspp.),包括酿酒酵母(S.cerevisiae)和葡萄汁酵母(S.uvarum);克鲁维酵母菌属(Kluyveromyces spp.),包括耐热克鲁维酵母(K.thermotolerans),乳酸克鲁维酵母(K.lactis),和马修斯克鲁维酵母(K.marxianus);毕赤酵母属(Pichia spp.);汉逊酵母属(Hansenula spp.),包括多型汉逊酵母(H.polymorpha);假丝酵母属(Candida spp.);丝孢酵母属(Trichosporon spp.);Yamadazyma酵母属,包括Y.spp.Stipitis,球有孢圆酵母(Torulaspora pretoriensis),东方伊萨酵母(Issatchenkia orientalis);裂殖酵母属(Schizosaccharomyces spp.),包括粟酒裂殖酵母(S.pombe);隐球菌属(Cryptococcusspp.);曲霉属(Aspergillus spp.);脉孢菌属(Neurospora spp.);或黑粉菌属(Ustilagospp.)。来自厌氧真菌的基因来源包括但不限于,梨囊鞭菌属(Piromyces spp.),根囊鞭菌属(Orpinomyces spp.),或新美鞭菌属(Neocallimastixspp.)。可用的原核酶的来源包括但不限于,大肠杆菌(Escherichia coli),运动发酵单胞菌(Zymomonas mobilis),金黄色葡萄球菌(Staphylococcus aureus),芽孢杆菌属(Bacillus spp.),梭菌属(Clostridiumspp.),棒状杆菌属(Corynebacterium spp.),假单胞菌属(Pseudomonas spp.),乳球菌属(Lactococcus spp.),肠杆菌属(Enterobacterspp.)和沙门氏菌属(Salmonella spp.)。
本领域技术人员已知的技术可适于鉴定其他同源基因和同源酶。通常,类似基因和/或类似酶可通过功能分析进行鉴定,并具有功能相似性。本领域技术人员已知的技术可适用于鉴定类似基因和类似酶。譬如,为了鉴定同源或类似的UDP糖基转移酶,PTA,或任何生物合成途径基因、蛋白质、或酶,技术可包括但不限于使用基于目的基因/酶的公开序列的引物通过PCR来克隆基因的技术,或通过使用设计用于扩增目的基因中的保守区域的简并引物的简并PCR技术。此外,本领域技术人员可使用技术来鉴定具有功能同源性或相似性的同源或类似的基因、蛋白质、或酶。技术包括通过用于所述活性的体外酶测定法来检测细胞或细胞培养物的酶的催化活性(例如,如本发明所述或如Kiritani,K.,Branched-ChainAmino Acids Methods Enzymology,1970中所述),然后通过纯化技术来分离具有所述活性的酶,通过诸如埃德曼(Edman)降解、设计可能的核酸序列的PCR引物、通过PCR来扩增所述DNA序列以及克隆所述核酸序列等技术来确定所述酶的所述蛋白质序列。为了鉴定同源或类似基因和/或同源或类似酶、类似基因和/或类似酶或蛋白质,技术还包括将关于候选基因或酶的数据同诸如BRENDA、KEGG或MetaCYC的数据库进行比较。可根据本发明的教导,在上述数据库中鉴定候选基因或酶。
7.实施例
实施例1:能够高通量生成法呢基焦磷酸(FPP)和类异戊二烯法呢烯的基础酵母菌株(base yeast strain)的生成
通过在GAL1或GAL10启动子的控制下表达甲羟戊酸途径的基因(图1D),从野生型酿酒酵母(Saccharomyces cerevisiae)菌株(CEN.PK2)产生法呢烯生成菌株。所述菌株包含来自酿酒酵母的以下染色体整合的甲羟戊酸途径基因:乙酰辅酶A硫解酶,HMG-CoA合酶,HMG-CoA还原酶,甲羟戊酸激酶,磷酸甲羟戊酸激酶,甲羟戊酸焦磷酸脱羧酶,和IPP:DMAPP异构酶。本发明所述的所有基因使用公众可获得的算法或其他合适算法进行密码子优化。此外,所述菌株包含来自青蒿(Artemisinin annua)的法呢烯合酶的六个拷贝,也受GAL1或GAL10启动子的控制。所述菌株还含有GAL80基因的缺失和受GAL4oc启动子控制的GAL4的另外拷贝,其中酿酒酵母的GAL4基因的编码序列受其天然启动子(PGAL4oc;参见例如Griggs&Johnston(1991)PNAS 88(19):8597-8601)的“有效组成型”形式的调节控制。最后,编码鲨烯合酶的ERG9基因通过用酵母基因MET3的启动子置换所述天然启动子而进行下调(Westfall et al PNAS 2012)。
实施例2.能够高通量生成瑞鲍迪苷A(RebA)的基础酵母菌株的生成
图1B示出了从FPP至甜菊醇的示例性生物合成途径。图2示出了从甜菊醇至糖苷RebM的示例性生物合成途径。为了将上述法呢烯基础菌株高通量转化为C-20类异戊二烯的贝壳杉烯,将香叶基香叶基焦磷酸合酶(GGPPS)的六个拷贝整合到基因组中,然后将柯巴基焦磷酸合酶和贝壳杉烯合酶各自的四个拷贝整合到基因组中。表1列出了用于将FPP转化为RebA的所有基因和启动子。此时,从所述菌株中除去法呢烯合酶的六个拷贝。一旦证实新菌株生成了内根-贝壳杉烯,则将用于将内根-贝壳杉烯转化为RebA的剩余基因插入所述基因组中。除了具有两个拷贝的Sr.KAH酶(表1)之外,将每个基因与单拷贝整合。包含表1中所述的所有基因的菌株主要生成RebA。酶UGT91D_like3具有某些将RebA转化为瑞鲍迪苷D(RebD)的低活性。我们测定了UGT91D_like3的单拷贝能够在上述酵母菌株中在体内将菌株中大约(3%)的RebA转化为RebD(图3和表2)。然后,UGT76G1可将RebD转化为最终产品瑞鲍迪苷M(RebM)。
实施例3.筛选将贝壳杉烯更高效转化为异贝壳杉烯酸的贝壳杉烯氧化酶(KO)
为了生成对RebM具有高通量的菌株,在GAL1启动子下,用基因UGT40087的单拷贝转化实施例2中所述的菌株(如实施例8和PCT申请AM-7400PCT中的表和图所述,其在本发明中作为附件)。所述菌株主要生成RebM。为了在体内筛选不同的KO等位基因以将贝壳杉烯转化为异贝壳杉烯酸,将此RebM菌株中的甜叶菊(Stevia rebaudiana)KO基因除去,并替换为仅包含GAL1启动子和终止子的着陆垫,其在启动子和终止子之间具有F-CphI限制性序列(图3)。现在,此种筛选菌株不含任何KO酶,仅产生内根-贝壳杉烯。
对由文献中所述得到的13种KO酶(表1)进行密码子优化,以在酿酒酵母中最佳表达,并合成了与图3A中所述的着陆垫中PGAL1和F-CphI序列侧翼的酵母终止子同源的60bp序列。对每个合成的KO基因进行单独测试(具有单拷贝),以检测上述酵母菌株中在体内将内根-贝壳杉烯转化为异贝壳杉烯酸的能力。用KO供体DNA和含有核酸内切酶F-CphI的质粒转化酵母,以切割着陆垫中的DNA。使用每个转化中特定KO基因内部的反向引物和GAL1启动子末端的通用正向引物,通过菌落PCR来验证正确的整合。图3B示出了正确的F-CphI切割和与KO DNA同源重组后的最终遗传构建体。
表1.在酵母中测试了将贝壳杉烯更高效转化为异贝壳杉烯酸的贝壳杉烯氧化酶
图4示出了KO筛选的结果。与来自甜叶菊(Srvia rebaudiana)的KO酶(Sr.KO)相比,发现一种来自豌豆(Pisum sativum)(豌豆(gardenpea))的KO酶(Ps.KO)具有将内根-贝壳杉烯转化为异贝壳杉烯酸的增强的能力(提高了约3.5倍)。用于在酵母细胞中表达的豌豆(Pisum sativum)KO酶的密码子优化的核酸序列示出为SEQ ID NO:15。
实施例4.具有改进的将内根-贝壳杉烯转化为异贝壳杉烯酸的高通量RebM菌株的生成
然后在对RebM具有非常高通量的菌株中测试了Ps.KO对Sr.KO的活性。KO酶通常在大多数植物中起作用以生成植物激素赤霉素。植物细胞中赤霉素的含量比工业生产酵母中生成的RebM的含量低几个数量级,因此,预计KO酶不会携带商业化生产生成RebM所需的高通量。表3列出了与用于最初筛选KO酶的菌株(即KO“基础菌株”)相比,具有更高RebM通量的菌株中包含的所有基因和启动子。将表3中所有基因插入酵母基因组中。KO酶通过三轮随后的氧化反应,使内根-贝壳杉烯生成异贝壳杉烯酸。反应和中间体的顺序为:第一次氧化将内根-贝壳杉烯转化为贝壳杉烯醇(K-OL),第二次氧化将贝壳杉烯醇转化为贝壳杉烯醛(K-AL),第三次氧化将贝壳杉烯醛转化为异贝壳杉烯酸(-酸)(图1C)。为了最大通量将内根-贝壳杉烯转化为RebM,KO酶应将内根-贝壳杉烯完全氧化为K-酸。不完全的转化将浪费碳,降低总体RebM滴度,并产生潜在有毒的中间体化合物。图5中的数据表明,在对RebM具有高碳通量的菌株中,Sr.KO等位基因积累了大量上游中间产物,即内根-贝壳杉烯、贝壳杉烯醇(K-OL)、和贝壳杉烯醛(K-AL),而Ps.KO酶显示这些中间产物的积累明显减少。
图6显示,由于与Sr.KO相比,由Ps.KO生成更高量的异贝壳杉烯酸,因此Ps.KO增加了在细胞中生成RebM的量。在高通量RebM菌株中,与具有Sr.KO的相同菌株相比,具有Ps.KO的菌株中RebM滴度增加了16%。更高的RebM滴度是由于在Ps.KO菌株中生成了更多的异贝壳杉烯酸。
实施例5.酵母培养条件
将经验证含有预期的贝壳杉烯氧化酶基因的酵母菌落挑选到含有鸟种培养基(Bird Seed Media,BSM,最初由van Hoek et al.,Biotechnology and Bioengineering68(5),2000,pp.517-523记载)的96孔微量滴定板中,所述鸟种培养基(Bird Seed Media)含有20g/L蔗糖和37.5g/L硫酸铵。将细胞在30℃下在高容量微量滴定板孵化器中进行培养,在1000RPM和80%湿度下振荡3天,直至所述培养物耗尽碳。通过从饱和培养物中取14.4μL并稀释至360μL新鲜培养基中,将生长饱和的培养物传代培养至含有BSM的新鲜平板中,所述BMS含有40g/L蔗糖和150g/L硫酸铵。在提取和分析之前,将所述生成培养基中的细胞在30℃下在高容量微量滴定板振荡器中,在1000RPM和80%湿度下再培养3天。培养完成后,将全细胞培养液用360μL 100%乙醇稀释,用箔纸进行密封,并以1250rpm振荡30分钟以提取瑞鲍迪苷类化合物。将490μL 50:50的乙醇:水加入到新的1.1mL测定板中,并将10μL培养物/乙醇混合物加入所述测定板中。将所述混合物离心以使任何固体沉淀,将400μL溶液转移至新的1.1mL板中并通过LC-MS进行测定。
实施例6.分析方法
甜菊醇和甜菊糖苷类化合物的质谱分析:
通过LC-MS质谱仪(AB QTrap 4000),使用Sigma Ascentis Express Peptide ES-C18(5cm,2.1mm,2.7μm;part#53301-U),采用以下梯度来分析样品:
质谱仪在负离子多反应监测模式下进行操作。根据真实标准品以及MRM跃迁来测定,通过保留时间来确定每种瑞鲍迪苷异构体:
贝壳杉烯的定量:
使用配备有有限热质量炉和火焰离子化检测器的气相色谱仪来测定培养液中内根-贝壳杉烯的滴度。用等份的培养液和甲醇来提取培养液样品,并在密封的容器中振摇30分钟,以从细胞中回收内根-贝壳杉烯。然后将所述培养液:甲醇溶液的240μL等分试样用1mL乙酸乙酯稀释,密封,并再振摇30分钟,以将内根-贝壳杉烯萃取到有机相中。适当地稀释有机相以使其落入所述测定试验的线性范围内,并等分到样品瓶中。样品以适当的分流比进样以落入所述线性范围内。样品分离在AgilentDB-1MS LTM II色谱柱上进行,使用氢气作为恒压模式下的载气,使用温度梯度:(1)起始温度为150℃持续0min,(2)将温度以25℃/min升高至230℃,(3)将温度以1800℃/min升高至320℃,并保持1分钟。使用真实可信的内根-贝壳杉烯标准品进行外部校准来确定内根-贝壳杉烯的量。
异贝壳杉烯酸、贝壳杉烯醇和贝壳杉烯醛的定量:
使用配备有可变波长检测器的高压液相色谱仪来测定培养液中的异贝壳杉烯酸、贝壳杉烯醇和贝壳杉烯醛的滴度。将培养液样品(100μL)稀释到300μL乙醇中,并在密封容器中振摇30分钟。将200μL水加至培养液:乙醇混合物中,混合并离心。将所得溶液的等分试样(避免细胞沉淀)转移至样品瓶中,并采用HPLC进行分析。采用以下溶剂在AglientEclipse Plus C18 USP L1(4.6mmx 50mmx 1.8μm)上进行样品分离:
·流动相A:0.1%甲酸的水溶液(v/v)
·流动相B:0.1%甲酸的乙腈溶液(v/v)
溶剂梯度:
时间(min) | 通道A(%) | 通道B(%) |
0.00 | 50 | 50 |
2.50 | 50 | 50 |
5.75 | 0 | 100 |
8.00 | 0 | 100 |
8.10 | 50 | 50 |
9.0 | 50 | 50 |
使用UV吸光度在200nm处来检测分析物,并通过外部校准(相对于甜菊醇标准品的相对响应因子)进行定量。
用于图6所示数据的瑞鲍迪苷M定量方法:
培养液中瑞鲍迪苷M的滴度使用配备有三重四极杆质谱仪的高压液相色谱仪进行测定。将培养液样品等分到在50:50/乙醇:水中稀释200至800倍的微量离心管(Eppendorf)中,混合20分钟,离心成沉淀细胞和碎片,将等分的上清液转移至样品瓶中进行分析。样品以流动注入模式运行,其中基于MRM跃迁的信号强度对分析物进行定量。流动相为40%水+0.1%甲酸和60%乙腈+0.1%甲酸,流速为1.1mL/min。瑞鲍迪苷M的浓度由其响应归一化为内标物(瑞鲍迪苷N)的响应来确定。
表2.用于将FPP转换为RebA的酶的基因、启动子和氨基酸序列
1去除前65个氨基酸,并用蛋氨酸代替
表3.生成RebM的菌株中酶的基因、启动子、拷贝数和氨基酸序列
酶名称 | 基因拷贝数 | 登录号或序列ID | 启动子 |
三孢布拉氏霉菌(Btrispora).GGPPS | 6 | AFC92798.1 | PGAL1 |
内根-CDPS_Os | 4 | Q5MQ85.1<sup>1</sup> | PGAL1 |
KS_Pg | 4 | ADB55711.1 | PGAL1 |
Sr.KO | 1 | AAQ63464.1 | PGAL1 |
Sr.KAH | 3 | SEQ ID :10 | PGAL1 |
ATR2 | 1 | NP_194750.1 | PGAL3 |
UGT85C2 | 2 | AAR06916.1 | PGAL1或PGAL10 |
UGT74G1 | 2 | AAR06920.1 | PGAL1或PGAL10 |
UGT91D_like3 | 2 | SEQ ID NO:7 | PGAL1或PGAL10 |
UGT76G1 | 4 | AAR06912.1 | PGAL1或PGAL10 |
1去除前65个氨基酸,并用蛋氨酸代替
本说明书中引用的所有出版物、专利和专利申请均通过引用并入本发明,如同每个单独的出版物或专利申请被具体和单独地指出通过引用并入。尽管为了清楚理解的目的,已通过举例说明和实施例详细地描述了前述发明,但根据本发明的教导,对本领域普通技术人员显而易见的是,在不脱离所附权利要求的精神或范围的情况下,可对其进行某些改变/变化和修改/修饰。
序列表
>序列_ID_1
MDTLTLSLGFLSLFLFLFLLKRSTHKHSKLSHVPVVPGLPVIGNLLQLKEKKPHKTFTKMAQKYGPIFSIKAGSSKIIVLNTAHLAKEAMVTRYSSISKRKLSTALTILTSDKCMVAMSDYNDFHKMVKKHILASVLGANAQKRLRFHREVMMENMSSKFNEHVKTLSDSAVDFRKIFVSELFGLALKQALGSDIESIYVEGLTATLSREDLYNTLVVDFMEGAIEVDWRDFFPYLKWIPNKSFEKKIRRVDRQRKIIMKALINEQKKRLTSGKELDCYYDYLVSEAKEVTEEQMIMLLWEPIIETSDTTLVTTEWAMYELAKDKNRQDRLYEELLNVCGHEKVTDEELSKLPYLGAVFHETLRKHSPVPIVPLRYVDEDTELGGYHIPAGSEIAINIYGCNMDSNLWENPDQWIPERFLDEKYAQADLYKTMAFGGGKRVCAGSLQAMLIACTAIGRLVQEFEWELGHGEEENVDTMGLTTHRLHPLQVKLKPRNRIY
>序列_ID_2
MDAVTGLLTVPATAITIGGTAVALAVALIFWYLKSYTSARRSQSNHLPRVPEVPGVPLLGNLLQLKEKKPYMTFTRWAATYGPIYSIKTGATSMVVVSSNEIAKEALVTRFQSISTRNLSKALKVLTADKTMVAMSDYDDYHKTVKRHILTAVLGPNAQKKHRIHRDIMMDNISTQLHEFVKNNPEQEEVDLRKIFQSELFGLAMRQALGKDVESLYVEDLKITMNRDEIFQVLVVDPMMGAIDVDWRDFFPYLKWVPNKKFENTIQQMYIRREAVMKSLIKENKKRIASGEKLNSYIDYLLSEAQTLTDQQLLMSLWEPIIESSDTTMVTTEWAMYELAKNPKLQDRLYRDIKSVCGSEKITEEHLSQLPYITAIFHETLRRHSPVPIIPLRHVHEDTVLGGYHVPAGTELAVNIYGCNMDKNVWENPEEWNPERFMKENETIDFQKTMAFGGGKRVCAGSLQALLTASIGIGRMVQEFEWKLKDMTQEEVNTIGLTTQMLRPLRAIIKPRI
>序列_ID_3
MAFFSMISILLGFVISSFIFIFFFKKLLSFSRKNMSEVSTLPSVPVVPGFPVIGNLLQLKEKKPHKTFTRWSEIYGPIYSIKMGSSSLIVLNSTETAKEAMVTRFSSISTRKLSNALTVLTCDKSMVATSDYDDFHKLVKRCLLNGLLGANAQKRKRHYRDALIENVSSKLHAHARDHPQEPVNFRAIFEHELFGVALKQAFGKDVESIYVKELGVTLSKDEIFKVLVHDMMEGAIDVDWRDFFPYLKWIPNKSFEARIQQKHKRRLAVMNALIQDRLKQNGSESDDDCYLNFLMSEAKTLTKEQIAILVWETIIETADTTLVTTEWAIYELAKHPSVQDRLCKEIQNVCGGEKFKEEQLSQVPYLNGVFHETLRKYSPAPLVPIRYAHEDTQIGGYHVPAGSEIAINIYGCNMDKKRWERPEDWWPERFLDDGKYETSDLHKTMAFGAGKRVCAGALQASLMAGIAIGRLVQEFEWKLRDGEEENVDTYGLTSQKLYPLMAIINPRRS
>序列_ID_4
MAVATDPLGCMQKLVQMLQAPPYVAAAVQSSALLLTFFIGDWRKRRRSPLPLLPAIPGIPVLGNLLQLKEKKPHKTFAQWSETYGPIYSIKAGASTVIVLNSSDLAKEAMVTRYSSISSRKLSKALTILTADKCMVAMSDYNDFHKLVKRYILANVLGANAQKRLRQRRDTMIDNISRELFACVKDSSSESVNFRKIFESELFGLALKETFGRDMESLYVDGLGTTLLREDLFRTLVIDPMEGAIEVDWRDFFPYLRWIPNKGVEDRIRKMDFRRRVTMKSLMEEKKKQIAAGEDLNCYSEFLLSEAKSLTEEQISMLLWEIIIETSDTTLVVTEWAMYELAQNPKRQERLYQHIQSVCGSAKITEENLSQLPYLTAVFHETLRKYSPVSIVPLRYAHEDTQLGGYFIPAGSEVAVNIYACNMDKKQWESPEEWKPERFLDESYDPMDLYKTMAFGGGKRVCAGAPKAMLIACTTLGRLVQGFTWKLREGEEDKVDTLGLTARKLQPLHIVAKPRIN
>序列_ID_5
MAVVTDPLASMQLLANTIPAPPYAAAAVLGGVSLVLSVFFVADCRKKRRNFLPPVPAVPGVPVLGNLLQLKEKKPHKTFARWAETYGAVYSIRTGASTVIVLNTTEVAKEAMVTRYGSISSRKLSKALTILTADKCMVAMSDYNEFHKMVKRYILANVLGANAQKKHRQRRDAMIENISRELFAHVKEFPLDTVNFRKIFEAELFRLALKETLGKDIESIYVDGLGTTLPREDLFRILVIDPMEGAIEVDWRDFFPYLRWIPNKRVENKIRNMDFRRRMTMKKLMEEPKKRIAAGEETYCYADFLLSEAKTLTEDQISMLLWETIIETSDTTLVVTEWAMYELSKDPRRQDYLYQQIQSVCGSATLTEENLSQLPYLTAIFHETLRKHSPVPVVPLRYAHEDTQLGGYFVPAGSEIAVNIYACNMDKDHWESPEEWKPERFLDDKYDPMDLHKTMAFGGGKRVCAGALKAMLIACTTIGRMVQEFEWKLREGEEEKVDTLGLTARKLQPLHVVIKPRNN
>序列_ID_6
MSKSNSMNSTSHETLFQQLVLGLDRMPLMDVHWLIYVAFGAWLCSYVIHVLSSSSTVKVPVVGYRSVFEPTWLLRLRFVWEGGSIIGQGYNKFKDSIFQVRKLGTDIVIIPPNYIDEVRKLSQDKTRSVEPFINDFAGQYTRGMVFLQSDLQNRVIQQRLTPKLVSLTKVMKEELDYALTKEMPDMKNDEWVEVDISSIMVRLISRISARVFLGPEHCRNQEWLTTTAEYSESLFITGFILRVVPHILRPFIAPLLPSYRTLLRNVSSGRRVIGDIIRSQQGDGNEDILSWMRDAATGEEKQIDNIAQRMLILSLASIHTTAMTMTHAMYDLCACPEYIEPLRDEVKSVVGASGWDKTALNRFHKLDSFLKESQRFNPVFLLTFNRIYHQSMTLSDGTNIPSGTRIAVPSHAMLQDSAHVPGPTPPTEFDGFRYSKIRSDSNYAQKYLFSMTDSSNMAFGYGKYACPGRFYASNEMKLTLAILLLQFEFKLPDGKGRPRNITIDSDMIPDPRARLCVRKRSLRDE
>序列_ID_7
MNKFNSMNNTINETLLRQLVSGLDEIPLMDIHWLIYVAFGAWLCSYVIHLLSSPSTVNVPFVGYRSVFEPTWFLRLRFVWEGGSIISQGYSKFKDSIFQVRKLGTDIVIIPPNYIDEVRKLSQDKTRSVEPFINDFAGDYTRGMVFLQSDLQNRVIQQRLTPKLVSLTKVMKEELDYALTKGMPDMKDDEWVEADIASIMVRLISRISARVFLGPEHCRNQEWLTTTAEYSESLFMTGFILRVVPHILRPFVAPLLPSYRTLLRSVSSGRKVIGDIIRSQQGSENEDILSWMVEAATGEEKQVDNIAQRMLILSLASIHTTAMTMTHAMYDLCARPEYTKPLREEVKGVVGASGWDKTALNRLHKLDSFLKESQRFNPVFLLTFNRIYHQPMTLSDGTNLPSGTRIAVPSHAMLQDSAHVPGPAPPTDFDGFRYSKIRSDSNYAQKYLFSMTDSSNMAFGYGKYACPGRFYASNEMKLTLAILLLQFEFKLPDGKGRPRNITIDSDMVPDPRARLCVRKRSLREE
>序列_ID_8
MDLQTMAPMGSAAIAIGGPAVAVAGGISLLFLKSFLSQQPGNPNHLPSVPAVPGVPLLGNLLELKEKKPYKTFTKWAETYGPIYSIKTGATSMVVVNSNQLAKEAMVTRFDSISTRKLSKALQILTADKTMVAMSDYDDYHKTVKRNLLTSILGPAAQKRHRAHRDAMGDNLSRQLHALALNSPQEAINFRQIFQSELFTLAFKQTFGRDIESIFVGDLGTTMTREEMFQILVVDPMMGAIDVDWRDFFPYLKWIPNAKLEEKIEQMYIRRKAVMKAVIQEHRKRIDSGENLDSYIDFLLAEAQPLTEKQLLMSLWEPIIETSDTTMVTTEWAMYELSKHPNKQQRLYNEIRNICGSEKITEEKLCKMPYLSAVFHETLRVHSPVSIIPLRYVHENTELGGYHVPAGTELAVNIYGCNMEREIWENPEEWSPERFLAENEPVNLQKTMAFGAGKRVCAGAMQAMLLACVGIGRMVQEFEWRLKDDVEEDVNTLGLTTQRLNPMLAVIKPRN
>序列_ID_9
MDGVIDMQTIPLRTAIAIGGTAVALVVALYFWFLRSYASPSHHSNHLPPVPEVPGVPVLGNLLQLKEKKPYMTFTKWAEMYGPIYSIRTGATSMVVVSSNEIAKEVVVTRFPSISTRKLSYALKVLTEDKSMVAMSDYHDYHKTVKRHILTAVLGPNAQKKFRAHRDTMMENVSNELHAFFEKNPNQEVNLRKIFQSQLFGLAMKQALGKDVESIYVKDLETTMKREEIFEVLVVDPMMGAIEVDWRDFFPYLKWVPNKSFENIIHRMYTRREAVMKALIQEHKKRIASGENLNSYIDYLLSEAQTLTDKQLLMSLWEPIIESSDTTMVTTEWAMYELAKNPNMQDRLYEEIQSVCGSEKITEENLSQLPYLYAVFQETLRKHCPVPIMPLRYVHENTVLGGYHVPAGTEVAINIYGCNMDKKVWENPEEWNPERFLSEKESMDLYKTMAFGGGKRVCAGSLQAMVISCIGIGRLVQDFEWKLKDDAEEDVNTLGLTTQKLHPLLALINPRKS
>序列_ID_10
MEAFVPGGAGAAAAAVGGFVAAAALAERAGVIAPRKRPNAPPAVPGLPIIGNLHQLKEKKPHQTFAKWAEIYGPIYTIRTGASSVVVLNSTEVAKEAMVAKFSSISTRKLSKALTVLTRDKSMVATSDYCDFHKMVKRYVMSSMLGTSAQKQFRDIRDMMIHNMLSTFHKLVKDDPHAPLIFRDVFKDELFRLSMIQSLGEDVSSVYVDEFGRDISKEEIYNATVTDMMMCAIEVDWRDFFPYLSWVPNKSFETRVFTTETRRTAVMRALIKQQKERIVRGEAKTCYLDFLLAENTLTDEQLMMLVWEALIEAADTTLVTTEWAMYELAKNPDKQERLYQEIREVCGDETVTEEHLPRLPYLNAVFHETLRRHSPVPLIPPRFVHEDTKLAGYDVPAGTEMVINLYGCNMNRKEWESPEEWVPERFAGGRLEVADMYKTMAFGAGRRACAGSLQATHIACAAVARFVQEFGWRLREGDEEKVDTVQLTAYKLHPLHVHLTRRGRM
>序列_ID_11
MLETKVIAHHVSHSPCAAIPGGLPVLGNLLQLTEKKPHRTFTAWSKEHGPIFTIKVGSVPQAVVNNSEIAKEVLVTKFASISKRQMPMALRVLTRDKTMVAMSDYGEEHRMLKKLVMTNLLGPTTQNKNRSLRDDALIGMIEGVLAELKASPTSPKVVNVRDYVQRSLFPFALQQVFGYIPDQVEVLELGTCVSTWDMFDALVVAPLSAVINVDWRDFFPALRWIPNRSVEDLVRTVDFKRNSIMKALIRAQRMRLANLKEPPRCYADIALTEATHLTEKQLEMSLWEPIIESADTTLVTSEWAMYEIAKNPDCQDRLYREIVSVAGTERMVTEDDLPNMPYLGAIIKETLRKYTPVPLIPSRFVEEDITLGGYDIPKGYQILVNLFAIANDPAVWSNPEKWDPERMLANKKVDMGFRDFSLMPFGAGKRMCAGITQAMFIIPMNVAALVQHCEWRLSPQEISNINNKIEDVVYLTTHKLSPLSCEATPRISHRLP
>序列_ID_12
MMDDTTSPYSTYHSVRSIRNQSAWALAPIAVFICYVVLRHNRKSVPAASAGSHSILEPLWLARLRFIRDSRFIIGQGYSKFKDTIFKVTKVGADIIVVAPKYVEEIRRLSRDTGRSVEPFIHDFAGELLGGLNFLESDLQTRVVQQKLTPNLKTIVPVMEDEMHYALVSELDSCLDGSEHWTRVDMIHMLSRIVSRISARIFLGPKYCRNDLWLKTTAEYTENLFLTGTLLRFVPRMLQKWIAPLLPSFRQLQENRQAARKIISEILTDHQPEKHDETSDNGDPYPDILTLMFQAARGKEKDIEDIAQHTLLLSLSSIHTTALTMTQALYDLCAYPQYLDPVKHEIADTLQSEGSWSKAMLDKLHMMDSLLRESQRLSPVFLLTFNRILHTPLTLSNGIHLPKGTRIAAPSDAILNDPSLVPGPQPADTFDPFRYINHSTGDAKKTKTNFQTTSLQNMAFGYGKYACPGRFYVANEIKLVLGHLLMHYEFKFPPGMGRPVNSTVDTDMYPDLGARLLVRKRKMEE
>序列_ID_13
MESLVAALPAGGAAAAAAFGGLVAAAALAGKVGLVGSKKHLNAPPAVSGLPLIGNLHQLKEKKPHQTFTKWAEIYGPIYTIRTGSSTVVVLNSAQVAKEAMIAKFSSISTRKLSKALSALTRDKTMVATSDYGDFHKMIKRYIMTFMLGTSGQKQFRDTRNMMVDNMLNTFHTLLMDDPNSPLNFREVFKNELFRLSLVQALGEDVSSIYVEEYGKVISKEEIYKATVVDMMMCAIEVDWRDFFPYLSWIPNRTFETRVLTTEARRTTVMQALIKQQKERIARGETRISYLDFLLAENTLTDEQLLMLVWEAVIEAADTTLVTTEWAMYEIAKHPEKQEYLYQEIQKVCGNKTVTEDHLPELPYLNAVFHETMRRHSPVPLVPPRLVHENTNLAGYEVPAGTEIIINLYGCNMNKNDWAEPEEWKPERFLDGRFEAVDMHKTMAFGAGRRACAGSMQAMNISCTAIGRFVQEFAWRLEEGDEDKVDTIQLTTNRLYPLHVYLAPRGRK
>SEQ ID NO:14AY245442.1内根-贝壳杉烯氧化酶mRNA[豌豆(Pisum sativum)]
GTGGTGAAGCAACTAGCAGTGGCAGCCATGGATACTCTCACACTTTCTTTGGGTTTTTTATCTCTCTTTTTGTTCCTCTTCTTACTAAAGAGATCTACTCACAAACATTCCAAGCTTTCCCATGTACCAGTGGTTCCAGGTTTGCCAGTGATTGGGAATCTGCTGCAATTGAAAGAGAAGAAACCTCACAAGACATTCACAAAGATGGCTCAGAAATATGGACCCATTTTTTCCATCAAAGCTGGTTCTTCCAAAATCATTGTTCTCAACACTGCTCATCTTGCTAAAGAGGCAATGGTGACTAGATATTCATCAATTTCAAAAAGGAAGCTATCAACTGCACTGACGATTCTAACTTCGGATAAATGCATGGTTGCTATGAGCGACTACAATGATTTTCACAAAATGGTTAAAAAACATATTCTTGCAAGTGTTCTTGGAGCCAATGCACAGAAGCGACTCCGTTTTCACAGAGAGGTTATGATGGAAAATATGTCTAGTAAGTTTAATGAACATGTGAAGACCCTCTCAGATTCTGCTGTTGATTTTAGGAAAATATTTGTGTCTGAACTTTTCGGATTAGCACTAAAGCAAGCTCTGGGAAGTGATATTGAATCCATTTATGTGGAGGGTTTGACGGCTACATTATCAAGAGAGGACTTATATAACACTCTAGTGGTTGATTTTATGGAGGGTGCAATTGAGGTGGATTGGAGAGATTTCTTCCCGTACCTGAAATGGATTCCAAATAAGAGCTTCGAGAAGAAAATCCGTAGAGTCGATCGCCAAAGAAAAATTATCATGAAGGCACTAATTAATGAGCAAAAGAAGCGGTTGACATCAGGAAAAGAATTAGATTGTTATTATGATTACCTAGTATCAGAAGCTAAAGAAGTGACTGAAGAACAAATGATCATGCTGCTCTGGGAGCCAATTATTGAGACATCCGATACTACCTTAGTCACGACAGAATGGGCTATGTATGAACTTGCCAAAGACA
>序列_ID_15
ATGGATACCTTAACTTTGTCTTTAGGTTTCTTATCTTTGTTCTTATTTTTATTCTTGTTAAAGAGATCTACTCACAAGCACTCCAAGTTATCCCACGTTCCAGTTGTTCCAGGTTTGCCTGTCATTGGTAACTTATTGCAATTGAAAGAAAAGAAGCCACACAAGACTTTCACCAAGATGGCTCAAAAGTACGGTCCAATTTTCTCCATCAAAGCCGGTTCTTCTAAAATCATTGTTTTAAACACTGCCCACTTGGCTAAAGAAGCTATGGTTACTAGATATTCTTCCATCTCCAAGAGAAAGTTGTCTACTGCTTTGACCATCTTGACTTCTGATAAGTGCATGGTTGCTATGTCCGATTATAACGACTTCCACAAGATGGTTAAGAAGCACATCTTGGCTTCTGTTTTGGGTGCCAACGCCCAAAAGAGATTGCGTTTCCACAGAGAAGTCATGATGGAAAACATGTCTTCCAAATTCAATGAACATGTCAAGACTTTGTCTGATTCTGCTGTTGACTTCAGAAAGATTTTCGTTTCTGAATTATTTGGTTTGGCTTTGAAGCAAGCTTTGGGTTCCGATATCGAATCTATCTACGTTGAAGGTTTGACTGCTACTTTATCTAGAGAAGATTTGTATAACACCTTGGTCGTCGACTTCATGGAAGGTGCTATCGAAGTTGATTGGAGAGACTTTTTCCCTTATTTGAAGTGGATTCCAAACAAATCCTTCGAAAAGAAGATCAGAAGAGTTGATAGACAAAGAAAAATTATCATGAAAGCTTTGATCAACGAACAAAAGAAAAGATTGACCTCTGGTAAGGAATTGGACTGTTACTACGATTACTTAGTTTCTGAAGCTAAGGAAGTCACCGAAGAACAAATGATCATGTTGTTGTGGGAACCAATTATTGAGACTTCTGATACTACTTTAGTTACCACCGAATGGGCTATGTATGAGTTGGCTAAGGACAAGAACCGTCAAGACAGATTGTACGAAGAATTGTTGAACGTTTGTGGTCACGAAAAGGTTACTGATGAAGAATTGTCCAAGTTGCCATACTTAGGTGCTGTCTTTCACGAAACCTTGCGTAAACACTCTCCAGTTCCAATCGTCCCATTGAGATACGTTGATGAAGATACCGAATTGGGTGGTTATCATATTCCTGCCGGTTCCGAAATCGCTATCAACATTTACGGTTGTAATATGGATTCCAACTTGTGGGAGAACCCAGATCAATGGATCCCTGAAAGATTTTTAGATGAAAAATACGCCCAAGCTGATTTGTATAAGACTATGGCTTTCGGTGGTGGTAAAAGAGTCTGTGCTGGTTCCTTACAAGCTATGTTGATTGCCTGTACTGCTATTGGTAGATTGGTTCAAGAATTTGAATGGGAATTGGGTCACGGTGAAGAAGAAAACGTTGACACCATGGGTTTAACTACCCATAGATTACACCCATTGCAAGTCAAATTAAAGCCAAGAAACAGAATTTACTAA
>SEQ ID NO:16(sr.UGT_g252778)
MATNDDDRKQLHVAMFPWLAFGHILPFLELSKLIAQNGHKVSFLSTTRNIQRLPSHLTPLINLVKLTLPRVQELPEDAEATTDIKHDDQDHLLNASDGLQPEVTRFLEEESPDWIIFDYSYYWLPPVAAELGISRAFFMTFPTWTMALTRLPSDQLTAEDLMTLSKISFKKHEIVNLMYGTSTQGDLYRLTMACNGSDCILIRCCYEFEPQWLTLLEKLLPVPVVPVGLLPPEIHGDEKDDDTWVSVKEWLDGQHKGHVVYVALGSEAMVSKDELGELALGLELSGLPFFWALRKPPGSTESDSVELPDGFMERTRNRGVVWTSWAPQLRILSHESVCGFLTHCGVSSIVEGLMFGHPLIMLPIFGDQIMNAQVLADKQVGIEIPRNEEDGWFTKESVAKSLRSVVVDDEGEIYKANARELSKIFSDTDLGKKYISHFIDFLMMEIVKT*
SEQ ID NO:17(UGT40087版本1)
MDASDSSPLHIVIFPWLAFGHMLASLELAERLAARGHRVSFVSTPRNISRLRPVPPALAPLIDFVALPLPRVDGLPDGAEATSDIPPGKTELHLKALDGLAAPFAAFLDAACADGSTNKVDWLFLDNFQYWAAAAAADHKIPCALNLTFAASTSAEYGVPRVEPPVDGSTASILQRFVLTLEKCQFVIQRACFELEPEPLPLLSDIFGKPVIPYGLVPPCPPAEGHKREHGNAALSWLDKQQPESVLFIALGSEPPVTVEQLHEIALGLELAGTTFLWALKKPNGLLLEADGDILPPGFEERTRDRGLVAMGWVPQPIILAHSSVGAFLTHGGWASTIEGVMSGHPMLFLTFLDEQRINAQLIERKKAGLRVPRREKDGSYDRQGIAGAIRAVMCEEESKSVFAANAKKMQEIVSDRNCQEKYIDELIQRLGSFEK
SEQ ID NO:18(UGT40087版本2)
MDASSSPLHIVIFPWLAFGHMLASLELAERLAARGHRVSFVSTPRNISRLRPVPPALAPLIDFVALPLPRVDGLPDGAEATSDIPPGKTELHLKALDGLAAPFAAFLDAACADGSTNKVDWLFLDNFQYWAAAAAADHKIPCALNLTFAASTSAEYGVPRVEPPVDGSTASILQRFVLTLEKCQFVIQRACFELEPEPLPLLSDIFGKPVIPYGLVPPCPPAEGHKREHGNAALSWLDKQQPESVLFIALGSEPPVTVEQLHEIALGLELAGTTFLWALKKPNGLLLEADGDILPPGFEERTRDRGLVAMGWVPQPIILAHSSVGAFLTHGGWASTIEGVMSGHPMLFLTFLDEQRINAQLIERKKAGLRVPRREKDGSYDRQGIAGAIRAVMCEEESKSVFAANAKKMQEIVSDRNCQEKYIDELIQRLGSFEK
SEQ ID NO:19(来自Os_UGT_91C1的loop2)
EGLPDGAESTNDVPHDRPDMV
SEQ ID NO:20(来自Os_UGT_91C1的loop3_1)
SEFLGTACAD
SEQ ID NO:21(来自Os_UGT_91C1的loop3_2)
SEFLGTACADWVIVDVFHH
SEQ ID NO:22(来自Os_UGT_91C1的loop4_1)
ADRRLERAETESPAAAGQGRPAAAPTFEVARMKLIRTKGSSGM
SEQ ID NO:23(来自Os_UGT_91C1的loop4_2)
MMLLGSAHMIASIADRRLERAETESPAAAGQGRPAAAPTFEVARMKLIRTKGSSGM
SEQ ID NO:24(来自UGT40087的loop2)
DGLPDGAEATSDIPPGKT
SEQ ID NO:25(来自UGT40087的loop3_1)
AAFLDAACADGSTNKVD
SEQ ID NO:26(来自UGT40087的loop3_2)
AAFLDAACADGSTNKVDWLFLDNFQY
SEQ ID NO:27(来自UGT40087的loop4_1)
GVPRVEPPVDGSTA
SEQ ID NO:28(来自UGT40087的loop4_2)
LNLTFAASTSAEYGVPRVEPPVDGSTA
SEQ ID NO:29(来自存在于UGT40087_loop1中的Os_UGT_91C1的经修饰的loop1)
TPRNISRLPPVPPALAP
SEQ ID NO:30(来自存在于Os_UGT_91C1_loop1中的UGT40087的经修饰的loop1)
TPRNISRLRPVRPALAP
SEQ ID NO:31(来自具有SEQ ID NO:8的Os_UGT_91C1的loop1)
TPRNISRLPPVRPALAP
SEQ ID NO:32(来自具有SEQ ID NO:11的UGT40087的loop1)
TPRNISRLRPVPPALAP
SEQ ID NO:33(UGT40087/Si91Dlike嵌合体)
MDASSSPLHIVIFPWLAFGHMLASLELAERLAARGHRVSFVSTPRNISRLRPVPPALAPLIDFVALPLPRVDGLPDGAEATSDIPPGKTELHLKALDGLAAPFAAFLDAACADGSTNKVDWLFLDNFQYWAAAAAADHKIPCALNLTFAASTSAEYGVPRVEPPVDGSTASILQRFVLTLEKCQFVIQRACFELEPEPLPLLSDIFGKPVIPYGLVPPCPPAQGHIEHDNAALSWLDKQQPESVLFIALGSEPPVTVEQLHEIALGLELAGTTFLWALKKPNGLLLEADGDILPPGFEERTRDRGLVAMGWVPQLSILAHSSVGAFLTHGGWSSTIEGAMSGHPMVFLTFLDEQRINAQLIERKKAGLRVPRCEKDGSYDRQGIAGAIRAVMCEEESKSVFAANAKKMQEIINDRKCQERYIDELIQRLRSFEK
SEQ ID NO:34(Os_UGT_91C1_loop4_1)
MDSGYSSSYAAAAGMHVVICPWLAFGHLLPCLDLAQRLASRGHRVSFVSTPRNISRLPPVRPALAPLVAFVALPLPRVEGLPDGAESTNDVPHDRPDMVELHRRAFDGLAAPFSEFLGTACADWVIVDVFHHWAAAAALEHKVPCAMMLLGSAHMIASIGVPRVEPPVDGSTASLAERFSLTLSRSSLVVGRSCVEFEPETVPLLSTLRGKPITFLGLMPPLHEGRREDGEDATVRWLDAQPAKSVVYVALGSEVPLGVEKVHELALGLELAGTRFLWALRKPTGVSDADLLPAGFEERTRGRGVVATRWVPQMSILAHAAVGAFLTHCGWNSTIEGLMFGHPLIMLPIFGDQGPNARLIEAKNAGLQVARNDGDGSFDREGVAAAIRAVAVEEESSKVFQAKAKKLQEIVADMACHERYIDGFIQQLRSYKD
SEQ ID NO:35(具有SEQ ID NO:17的UGT40087的未经优化的核酸序列)
SEQ ID NO:36(UGT40087-1密码子优化的核酸序列)
ATGGATGCTTCCAGTAGTCCTTTACACATCGTTATCTTTCCATGGTTAGCTTTCGGTCATATGTTGGCTTCCTTGGAATTGGCTGAGAGATTGGCTGCTCGTGGTCACAGAGTCTCCTTCGTTTCCACCCCTAGAAACATCTCTAGATTACGTCCAGTTCCACCAGCTTTAGCTCCATTGATTGATTTTGTCGCTTTGCCATTGCCTAGAGTCGATGGTTTACCAGATGGTGCCGAAGCTACCTCTGACATTCCACCAGGTAAGACCGAATTACACTTGAAGGCTTTGGACGGTTTGGCTGCTCCATTCGCCGCTTTTTTGGACGCTGCCTGTGCTGATGGTTCCACCAACAAGGTTGATTGGTTGTTTTTGGACAACTTCCAATACTGGGCTGCCGCTGCCGCTGCTGATCACAAAATTCCTTGCGCCTTAAACTTGACTTTTGCCGCTTCCACCTCCGCTGAATACGGTGTTCCACGTGTTGAACCACCAGTTGACGGTTCCACTGCCTCCATCTTACAAAGATTTGTCTTAACCTTAGAAAAATGTCAATTCGTTATCCAAAGAGCTTGTTTCGAATTGGAACCTGAACCATTGCCATTGTTGTCCGACATTTTCGGTAAGCCAGTCATCCCATACGGTTTAGTTCCTCCATGTCCACCAGCTGAAGGTCACAAAAGAGAACACGGTAACGCTGCTTTGTCCTGGTTGGATAAGCAACAACCAGAATCTGTTTTGTTCATCGCTTTGGGTTCTGAACCACCTGTTACCGTCGAACAATTGCACGAAATCGCTTTGGGTTTAGAATTGGCCGGTACCACCTTCTTGTGGGCCTTGAAAAAGCCAAACGGTTTGTTGTTAGAAGCCGATGGTGATATTTTGCCACCAGGTTTCGAAGAAAGAACTAGAGATAGAGGTTTAGTCGCTATGGGTTGGGTTCCACAACCAATTATCTTGGCCCATTCCTCTGTTGGTGCCTTTTTGACTCACGGTGGTTGGGCCTCCACTATTGAAGGTGTCATGTCCGGTCACCCTATGTTGTTCTTAACCTTCTTGGACGAACAACGTATCAACGCCCAATTGATCGAAAGAAAAAAGGCTGGTTTAAGAGTCCCAAGAAGAGAAAAGGATGGTTCCTACGACAGACAAGGTATTGCTGGTGCTATTAGAGCCGTCATGTGTGAAGAAGAATCTAAGTCTGTCTTCGCTGCTAACGCTAAGAAAATGCAAGAGATCGTTTCTGACAGAAACTGTCAAGAAAAGTACATCGACGAATTGATTCAAAGATTGGGTTCTTTCGAAAAGTAA
Claims (47)
1.能够生成一种或多种甜菊糖苷的经遗传修饰的酿酒酵母(Saccharomycescerevisiae)宿主细胞,其包含编码贝壳杉烯(kaurene)氧化酶的异源核酸,所述贝壳杉烯氧化酶包含与SEQ ID NO:1具有至少80%、85%、90%、或95%序列同一性的氨基酸序列。
2.根据权利要求1所述的经遗传修饰的酿酒酵母宿主细胞,其能够以大于30%、35%、40%、45%、50%、或55%的效率将贝壳杉烯转化为异贝壳杉烯酸(kaurenoic acid)。
3.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞,其中,所述贝壳杉烯氧化酶包含具有SEQ ID NO:1的所述序列的氨基酸序列。
4.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞,其中,所述贝壳杉烯氧化酶能够氧化贝壳杉烯、贝壳杉烯醇(kaurenol)和/或贝壳杉烯醛(kaurenal)的C19位。
5.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞,其中,所述贝壳杉烯氧化酶由异源核酸编码,其中所述异源核酸包含与SEQ ID NO:15具有至少80%、85%、90%、或95%序列同一性的核苷酸序列。
6.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞,其中,所述贝壳杉烯氧化酶由具有SEQ ID NO:15的所述序列的异源核酸编码。
7.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞,其能够以大于30%、35%、40%、45%、50%、或55%的效率将贝壳杉烯转化为异贝壳杉烯酸,和其中所述贝壳杉烯氧化酶包含与SEQ ID NO:1具有至少95%序列同一性的氨基酸序列。
8.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞,其中,所述贝壳杉烯氧化酶是多肽,所述多肽具有与SEQ ID NO:1的功能结构域具有至少80%、85%、90%、或95%序列同一性的功能结构域。
9.根据前述权利要求26所述的经遗传修饰的酿酒酵母宿主细胞,其能够以大于55%的效率将贝壳杉烯转化为异贝壳杉烯酸。
10.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞,其能够生成异贝壳杉烯酸。
11.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞,其能够生成甜菊醇(steviol)。
12.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞,其能够生成RebD。
13.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞,其能够生成RebM。
14.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞,其能够以至少10:1、100:1、或1000:1的比例生成RebM和RebM2。
15.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞,其中,所述经遗传修饰的宿主细胞生成不可检测水平的RebM2。
16.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞,其中,所述经遗传修饰的宿主细胞还包含一种或多种异源核酸,所述一种或多种异源核酸编码制备甜菊醇的途径的一种或多种酶。
17.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞,其中,所述经遗传修饰的宿主细胞还包含一种或多种异源核酸,所述一种或多种异源核酸编码制备甜菊糖苷的途径的一种或多种酶。
18.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞,其中,所述经遗传修饰的宿主细胞还包含一种或多种异源核酸,所述一种或多种异源核酸编码制备RebA的途径的一种或多种酶。
19.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞,其中,所述经遗传修饰的宿主细胞还包含一种或多种异源核酸,所述一种或多种异源核酸编码制备RebM的途径的一种或多种酶。
20.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞,其中,所述经遗传修饰的宿主细胞还包含一种或多种异源核酸,所述一种或多种异源核酸编码制备RebE的途径的一种或多种酶。
21.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞,其中,所述途径的所述一种或多种酶包含香叶基香叶基焦磷酸合酶。
22.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞,其中,所述途径的所述一种或多种酶包含柯巴基焦磷酸合酶。
23.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞,其中,所述途径的所述一种或多种酶包含内根-贝壳杉烯(ent-kaurene)合酶。
24.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞,其中,所述途径的所述一种或多种酶包含异贝壳杉烯酸羟化酶。
25.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞,其中,所述途径的所述一种或多种酶包含细胞色素P450还原酶。
26.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞,其中,所述途径的所述一种或多种酶包含一种或多种尿苷5'-二磷酸依赖性糖基转移酶。
27.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞,其中,所述途径的所述一种或多种酶包含Os_UGT_91C1,Sl_UGT_101249881,UGT40087,sr.UGT_9252778,Bd_UGT10840,Hv_UGT_V1,Bd_UGT10850,或Ob_UGT91B1_like。
28.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞,其中,所述途径的所述一种或多种酶包含UGT74G1,UGT76G1,UGT85C2,UGT91D,或UGT40087或其变体。
29.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞,其中,所述途径的所述一种或多种酶包含香叶基香叶基焦磷酸合酶,柯巴基焦磷酸合酶,内根-贝壳杉烯合酶,贝壳杉烯氧化酶,异贝壳杉烯酸羟化酶,细胞色素P450还原酶,UGTAD,UGT74G1,UGT76G1,UGT85C2,和UGT91D。
30.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞,其中,所述途径的所述一种或多种酶包含香叶基香叶基焦磷酸合酶,柯巴基焦磷酸合酶,内根-贝壳杉烯合酶,贝壳杉烯氧化酶,异贝壳杉烯酸羟化酶,细胞色素P450还原酶,UGT40087或其变体,UGT74G1,UGT76G1,UGT85C2,和UGT91D。
31.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞,其中,所述UGT40087是根据SEQ ID NO:17、SEQ ID NO:18或SEQ ID NO:33的序列。
32.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞,其中,所述途径的所述一种或多种酶包含双功能的柯巴基焦磷酸合酶和贝壳杉烯合酶。
33.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞,其中,编码所述途径的一种或多种酶的所述一种或多种异源核酸受单一转录调节因子的控制。
34.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞,其中,编码所述途径的一种或多种酶的所述一种或多种异源核酸受多种异源转录调节因子的控制。
35.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞,其中,所述细胞是选自由细菌细胞、真菌细胞、藻类细胞、昆虫细胞、和植物细胞组成的组。
36.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞,其中,所述细胞是酵母细胞。
37.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞,其中,所述酵母是酿酒酵母(Saccharomyces cerevisiae)。
38.生成异贝壳杉烯酸的方法:
(a)在适于制备RebD的条件下,在含有碳源的培养基中培养前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞群;和
(b)从所述培养基中回收所述异贝壳杉烯酸化合物。
39.生成RebD的方法:
(a)在适于制备RebD的条件下,在含有碳源的培养基中培养前述权利要求任一项所述的经遗传修饰的宿主细胞群;和
(b)从所述培养基中回收所述RebD化合物。
40.生成RebM的方法:
(a)在适于制备RebM的条件下,在含有碳源的培养基中培养前述权利要求任一项所述的经遗传修饰的宿主细胞群;和
(b)从所述培养基中回收所述RebM化合物。
41.生成异贝壳杉烯酸的方法:
(a)在适于形成异贝壳杉烯酸的条件下,使贝壳杉烯与前述权利要求任一项所述的贝壳杉烯氧化酶接触,所述贝壳杉烯氧化酶能够将贝壳杉烯转化为异贝壳杉烯酸;和
(b)从所述培养基中回收所述异贝壳杉烯酸化合物。
42.发酵组合物,其包含:
(a)经遗传修饰的宿主细胞,其包含:
(i)异源核酸,所述异源核酸编码前述权利要求任一项所述的贝壳杉烯氧化酶,所述贝壳杉烯氧化酶能够将贝壳杉烯转化为异贝壳杉烯酸;和
(b)由所述经遗传修饰的宿主细胞生成的甜菊糖苷类化合物。
43.根据权利要求42所述的发酵组合物,其中所述甜菊糖苷类化合物包含RebA、RebD和RebM,其RebA:RebD:RebM之比为至少1:7:50。
44.非天然存在的贝壳杉烯氧化酶,其与SEQ ID NO:1具有至少80%、85%、90%、或95%序列同一性。
45.非天然存在的贝壳杉烯氧化酶,其能够在体内以大于30%、35%、40%、45%、50%、或55%的效率将贝壳杉烯转化为异贝壳杉烯酸。
46.非天然存在的核酸,其编码权利要求44或45所述的非天然存在的贝壳杉烯氧化酶。
47.生成甜菊糖苷的方法:
(a)在适于制备甜菊糖苷的条件下,在含有碳源的培养基中培养前述权利要求任一项所述的经遗传修饰的宿主细胞群。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762544718P | 2017-08-11 | 2017-08-11 | |
US62/544718 | 2017-08-11 | ||
USPCT/US2017/046637 | 2017-08-11 | ||
PCT/US2017/046637 WO2018031955A2 (en) | 2016-08-12 | 2017-08-11 | Udp-dependent glycosyltransferase for high efficiency production of rebaudiosides |
PCT/US2018/046359 WO2019033064A1 (en) | 2017-08-11 | 2018-08-10 | KAURENE OXIDASE FROM PISUM SATIVUM FOR HIGH-PERFORMANCE PRODUCTION OF REBAUDIOSIDES |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111263815A true CN111263815A (zh) | 2020-06-09 |
Family
ID=65271337
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880051961.1A Pending CN111263815A (zh) | 2017-08-11 | 2018-08-10 | 用于高效生成瑞鲍迪苷的豌豆贝壳杉烯氧化酶 |
Country Status (12)
Country | Link |
---|---|
US (1) | US20200165651A1 (zh) |
EP (1) | EP3665287A1 (zh) |
JP (1) | JP7487099B2 (zh) |
KR (1) | KR20200035981A (zh) |
CN (1) | CN111263815A (zh) |
AU (1) | AU2018314249A1 (zh) |
BR (1) | BR112020002708A2 (zh) |
CA (1) | CA3071029A1 (zh) |
MA (1) | MA49836A (zh) |
MX (1) | MX2020001537A (zh) |
SG (1) | SG11202001058TA (zh) |
WO (1) | WO2019033064A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112852653A (zh) * | 2021-01-26 | 2021-05-28 | 江南大学 | 从头合成莱鲍迪苷m的酿酒酵母工程菌及其应用 |
CN113881649A (zh) * | 2021-11-15 | 2022-01-04 | 四川大学 | 糖基转移酶OsUGT91C1突变体及其用途 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
PT3497222T (pt) * | 2016-08-12 | 2022-02-09 | Amyris Inc | Glicosiltransferase dependente de udp para produção de eficácia elevada de rebaudiosídeos |
EP4232568A1 (en) * | 2020-10-22 | 2023-08-30 | DSM IP Assets B.V. | Microorganisms for diterpene production |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100297722A1 (en) * | 2009-05-20 | 2010-11-25 | Board Of Trustees Of Southern Illinois University | Transgenic moss producing terpenoids |
CN103179850A (zh) * | 2010-06-02 | 2013-06-26 | 伊沃瓦营养学股份有限公司 | 甜菊糖苷的重组生产 |
WO2016023844A1 (en) * | 2014-08-11 | 2016-02-18 | Evolva Sa | Production of steviol glycosides in recombinant hosts |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4760951B2 (ja) | 2009-05-08 | 2011-08-31 | トヨタ自動車株式会社 | ブタノール生産能を有する組換え微生物及びブタノールの製造方法 |
JP5056897B2 (ja) | 2010-05-14 | 2012-10-24 | トヨタ自動車株式会社 | 2−ブタノールの製造方法及び2−ブタノール生産能を有する組換え微生物 |
WO2012135591A2 (en) | 2011-03-30 | 2012-10-04 | Amyris, Inc. | Microbial isoprenoid production using a heterologous dxp pathway |
EP3792350A1 (en) | 2011-08-08 | 2021-03-17 | Evolva SA | Recombinant production of steviol glycosides |
WO2013137487A1 (ja) | 2012-03-16 | 2013-09-19 | サントリーホールディングス株式会社 | ステビオール配糖体化酵素およびそれをコードする遺伝子 |
US9752174B2 (en) | 2013-05-28 | 2017-09-05 | Purecircle Sdn Bhd | High-purity steviol glycosides |
MX369591B (es) | 2013-07-31 | 2019-11-13 | Dsm Ip Assets Bv | Recuperacion de glicosidos de esteviol. |
BR112016002526B1 (pt) | 2013-08-07 | 2021-11-23 | Total Marketing Services | Método para produção de um composto heterólogo não catabólico, e, composição de fermentação |
EP3190905A2 (en) | 2014-09-09 | 2017-07-19 | Evolva SA | Production of steviol glycosides in recombinant hosts |
CN104726523B (zh) * | 2015-03-28 | 2018-08-10 | 南京工业大学 | 一种酶法制备莱鲍迪苷m的方法 |
CN104745543A (zh) * | 2015-04-07 | 2015-07-01 | 江苏科技大学 | 桑树贝壳杉烯氧化酶MmKO及其应用 |
EP3303553B1 (en) | 2015-05-29 | 2022-07-27 | Cargill, Incorporated | Fermentation methods for producing steviol glycosides using high ph |
-
2018
- 2018-08-10 MX MX2020001537A patent/MX2020001537A/es unknown
- 2018-08-10 US US16/637,188 patent/US20200165651A1/en active Pending
- 2018-08-10 SG SG11202001058TA patent/SG11202001058TA/en unknown
- 2018-08-10 EP EP18756533.8A patent/EP3665287A1/en active Pending
- 2018-08-10 CN CN201880051961.1A patent/CN111263815A/zh active Pending
- 2018-08-10 WO PCT/US2018/046359 patent/WO2019033064A1/en unknown
- 2018-08-10 MA MA049836A patent/MA49836A/fr unknown
- 2018-08-10 CA CA3071029A patent/CA3071029A1/en active Pending
- 2018-08-10 BR BR112020002708-1A patent/BR112020002708A2/pt unknown
- 2018-08-10 AU AU2018314249A patent/AU2018314249A1/en active Pending
- 2018-08-10 JP JP2020502289A patent/JP7487099B2/ja active Active
- 2018-08-10 KR KR1020207005218A patent/KR20200035981A/ko not_active Application Discontinuation
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100297722A1 (en) * | 2009-05-20 | 2010-11-25 | Board Of Trustees Of Southern Illinois University | Transgenic moss producing terpenoids |
CN103179850A (zh) * | 2010-06-02 | 2013-06-26 | 伊沃瓦营养学股份有限公司 | 甜菊糖苷的重组生产 |
WO2016023844A1 (en) * | 2014-08-11 | 2016-02-18 | Evolva Sa | Production of steviol glycosides in recombinant hosts |
Non-Patent Citations (1)
Title |
---|
SANDRA E. DAVIDSON等: "The Pea Gene LH Encodes ent-Kaurene Oxidase", PLANT PHYSIOL, vol. 134, no. 3, pages 1123 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112852653A (zh) * | 2021-01-26 | 2021-05-28 | 江南大学 | 从头合成莱鲍迪苷m的酿酒酵母工程菌及其应用 |
CN113881649A (zh) * | 2021-11-15 | 2022-01-04 | 四川大学 | 糖基转移酶OsUGT91C1突变体及其用途 |
Also Published As
Publication number | Publication date |
---|---|
RU2020109765A (ru) | 2021-09-13 |
EP3665287A1 (en) | 2020-06-17 |
RU2020109765A3 (zh) | 2022-04-08 |
CA3071029A1 (en) | 2019-02-14 |
SG11202001058TA (en) | 2020-03-30 |
AU2018314249A2 (en) | 2020-03-19 |
JP7487099B2 (ja) | 2024-05-20 |
AU2018314249A1 (en) | 2020-03-05 |
US20200165651A1 (en) | 2020-05-28 |
MX2020001537A (es) | 2020-07-13 |
MA49836A (fr) | 2020-06-17 |
BR112020002708A2 (pt) | 2020-08-25 |
JP2020533954A (ja) | 2020-11-26 |
KR20200035981A (ko) | 2020-04-06 |
WO2019033064A1 (en) | 2019-02-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11866738B2 (en) | UDP-dependent glycosyltransferase for high efficiency production of rebaudiosides | |
JP7487099B2 (ja) | レバウジオシドの高効率生成のためのエンドウ(pisum sativum)カウレンオキシダーゼ | |
JP7518838B2 (ja) | レバウジオシドの高効率な生成のためのabcトランスポーター | |
CN113260699A (zh) | 用于高效生成瑞鲍迪苷的甜叶菊异贝壳杉烯酸羟化酶变体 | |
RU2795550C2 (ru) | Применение кауреноксидазы pisum sativum для высокоэффективного производства ребаудиозидов | |
US12065685B1 (en) | UDP-glycosyltransferase variants and uses thereof | |
US20220282228A1 (en) | Kaurenoic acid 13-hydroxylase (kah) variants and uses thereof | |
RU2777901C2 (ru) | Udp-зависимая гликозилтрансфераза для высокоэффективного продуцирования ребаудиозидов | |
RU2795855C2 (ru) | Аbc-транспортеры для высокоэффективного производства ребаудиозидов |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |