CN113631698A - 用于高效生成瑞鲍迪苷的abc转运蛋白 - Google Patents
用于高效生成瑞鲍迪苷的abc转运蛋白 Download PDFInfo
- Publication number
- CN113631698A CN113631698A CN202080023632.3A CN202080023632A CN113631698A CN 113631698 A CN113631698 A CN 113631698A CN 202080023632 A CN202080023632 A CN 202080023632A CN 113631698 A CN113631698 A CN 113631698A
- Authority
- CN
- China
- Prior art keywords
- seq
- host cell
- genetically modified
- sequence
- modified host
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108010006533 ATP-Binding Cassette Transporters Proteins 0.000 title claims abstract description 87
- 102000005416 ATP-Binding Cassette Transporters Human genes 0.000 title claims abstract description 86
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 32
- 229930188195 rebaudioside Natural products 0.000 title description 11
- 210000004027 cell Anatomy 0.000 claims abstract description 334
- 235000019202 steviosides Nutrition 0.000 claims abstract description 142
- 239000004383 Steviol glycoside Substances 0.000 claims abstract description 117
- 235000019411 steviol glycoside Nutrition 0.000 claims abstract description 117
- 229930182488 steviol glycoside Natural products 0.000 claims abstract description 117
- 150000008144 steviol glycosides Chemical class 0.000 claims abstract description 114
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 107
- 238000000034 method Methods 0.000 claims abstract description 102
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 93
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 93
- -1 but not limited to Chemical class 0.000 claims abstract description 36
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims description 99
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 claims description 96
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 95
- 230000002538 fungal effect Effects 0.000 claims description 83
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 68
- 229920001184 polypeptide Polymers 0.000 claims description 67
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 67
- 239000002773 nucleotide Substances 0.000 claims description 50
- 125000003729 nucleotide group Chemical group 0.000 claims description 50
- QFVOYBUQQBFCRH-UHFFFAOYSA-N Steviol Natural products C1CC2(C3)CC(=C)C3(O)CCC2C2(C)C1C(C)(C(O)=O)CCC2 QFVOYBUQQBFCRH-UHFFFAOYSA-N 0.000 claims description 45
- QFVOYBUQQBFCRH-VQSWZGCSSA-N steviol Chemical compound C([C@@]1(O)C(=C)C[C@@]2(C1)CC1)C[C@H]2[C@@]2(C)[C@H]1[C@](C)(C(O)=O)CCC2 QFVOYBUQQBFCRH-VQSWZGCSSA-N 0.000 claims description 45
- 229940032084 steviol Drugs 0.000 claims description 45
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 claims description 37
- 101710204244 Processive diacylglycerol beta-glucosyltransferase Proteins 0.000 claims description 37
- 229910052799 carbon Inorganic materials 0.000 claims description 37
- 150000001875 compounds Chemical class 0.000 claims description 32
- 108010066605 Geranylgeranyl-Diphosphate Geranylgeranyltransferase Proteins 0.000 claims description 23
- 102100039291 Geranylgeranyl pyrophosphate synthase Human genes 0.000 claims description 22
- ONVABDHFQKWOSV-UHFFFAOYSA-N 16-Phyllocladene Natural products C1CC(C2)C(=C)CC32CCC2C(C)(C)CCCC2(C)C31 ONVABDHFQKWOSV-UHFFFAOYSA-N 0.000 claims description 21
- 108010045510 NADPH-Ferrihemoprotein Reductase Proteins 0.000 claims description 21
- ONVABDHFQKWOSV-HPUSYDDDSA-N ent-kaur-16-ene Chemical compound C1C[C@H](C2)C(=C)C[C@@]32CC[C@@H]2C(C)(C)CCC[C@@]2(C)[C@@H]31 ONVABDHFQKWOSV-HPUSYDDDSA-N 0.000 claims description 21
- 239000002253 acid Substances 0.000 claims description 20
- 108091033319 polynucleotide Proteins 0.000 claims description 19
- 102000040430 polynucleotide Human genes 0.000 claims description 19
- 239000002157 polynucleotide Substances 0.000 claims description 19
- 238000006467 substitution reaction Methods 0.000 claims description 19
- 101100262416 Stevia rebaudiana UGT76G1 gene Proteins 0.000 claims description 14
- 101100427140 Stevia rebaudiana UGT74G1 gene Proteins 0.000 claims description 12
- 238000012258 culturing Methods 0.000 claims description 12
- 108091026890 Coding region Proteins 0.000 claims description 11
- 150000001413 amino acids Chemical class 0.000 claims description 11
- 101100048059 Stevia rebaudiana UGT85C2 gene Proteins 0.000 claims description 10
- ONVABDHFQKWOSV-YQXATGRUSA-N ent-Kaur-16-ene Natural products C1C[C@@H](C2)C(=C)C[C@@]32CC[C@@H]2C(C)(C)CCC[C@@]2(C)[C@@H]31 ONVABDHFQKWOSV-YQXATGRUSA-N 0.000 claims description 8
- UIXMIBNGPQGJJJ-UHFFFAOYSA-N ent-kaurene Natural products CC1CC23CCC4C(CCCC4(C)C)C2CCC1C3 UIXMIBNGPQGJJJ-UHFFFAOYSA-N 0.000 claims description 8
- 150000003839 salts Chemical class 0.000 claims description 8
- HELXLJCILKEWJH-NCGAPWICSA-N rebaudioside A Chemical compound O([C@H]1[C@H](O)[C@@H](CO)O[C@H]([C@@H]1O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)O[C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(=O)O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O HELXLJCILKEWJH-NCGAPWICSA-N 0.000 claims description 7
- 241000238631 Hexapoda Species 0.000 claims description 5
- 230000001580 bacterial effect Effects 0.000 claims description 5
- 108010064739 ent-kaurene synthetase B Proteins 0.000 claims description 5
- NIKHGUQULKYIGE-UHFFFAOYSA-N kaurenoic acid Natural products C1CC2(CC3=C)CC3CCC2C2(C)C1C(C)(C(O)=O)CCC2 NIKHGUQULKYIGE-UHFFFAOYSA-N 0.000 claims description 5
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 4
- 210000003463 organelle Anatomy 0.000 claims description 4
- 102000004316 Oxidoreductases Human genes 0.000 claims description 3
- 108090000854 Oxidoreductases Proteins 0.000 claims description 3
- HELXLJCILKEWJH-UHFFFAOYSA-N entered according to Sigma 01432 Natural products C1CC2C3(C)CCCC(C)(C(=O)OC4C(C(O)C(O)C(CO)O4)O)C3CCC2(C2)CC(=C)C21OC(C1OC2C(C(O)C(O)C(CO)O2)O)OC(CO)C(O)C1OC1OC(CO)C(O)C(O)C1O HELXLJCILKEWJH-UHFFFAOYSA-N 0.000 claims description 3
- 235000019203 rebaudioside A Nutrition 0.000 claims description 3
- KWVKUAKMOIEELN-UHFFFAOYSA-N ent-kaur-16-en-19-oic acid Natural products CC1(C)CCCC2(C)C1CCC34CC(=C(C3)C(=O)O)CCC24 KWVKUAKMOIEELN-UHFFFAOYSA-N 0.000 claims description 2
- NIKHGUQULKYIGE-SHAPNJEPSA-N ent-kaur-16-en-19-oic acid Chemical compound C([C@H]1C[C@]2(CC1=C)CC1)C[C@H]2[C@@]2(C)[C@H]1[C@](C)(C(O)=O)CCC2 NIKHGUQULKYIGE-SHAPNJEPSA-N 0.000 claims description 2
- PLQMEXSCSAIXGB-SAXRGWBVSA-N (+)-artemisinic acid Chemical compound C1=C(C)CC[C@H]2[C@H](C)CC[C@@H](C(=C)C(O)=O)[C@H]21 PLQMEXSCSAIXGB-SAXRGWBVSA-N 0.000 claims 8
- LZMOBPWDHUQTKL-RWMBFGLXSA-N artemisinic acid Natural products CC1=C[C@@H]2[C@@H](CCC[C@H]2C(=C)C(=O)O)CC1 LZMOBPWDHUQTKL-RWMBFGLXSA-N 0.000 claims 4
- PLQMEXSCSAIXGB-UHFFFAOYSA-N artemisininic acid Natural products C1=C(C)CCC2C(C)CCC(C(=C)C(O)=O)C21 PLQMEXSCSAIXGB-UHFFFAOYSA-N 0.000 claims 4
- 229960004191 artemisinin Drugs 0.000 claims 2
- 108010022380 Amorpha-4,11-diene synthase Proteins 0.000 claims 1
- HMTAHNDPLDKYJT-UHFFFAOYSA-N amorphadiene Natural products C1=C(C)CCC2C(C)CCC(C(C)=C)C21 HMTAHNDPLDKYJT-UHFFFAOYSA-N 0.000 claims 1
- BLUAFEHZUWYNDE-NNWCWBAJSA-N artemisinin Chemical compound C([C@](OO1)(C)O2)C[C@H]3[C@H](C)CC[C@@H]4[C@@]31[C@@H]2OC(=O)[C@@H]4C BLUAFEHZUWYNDE-NNWCWBAJSA-N 0.000 claims 1
- 102000004190 Enzymes Human genes 0.000 abstract description 186
- 108090000790 Enzymes Proteins 0.000 abstract description 186
- 108091028043 Nucleic acid sequence Proteins 0.000 abstract description 41
- 230000037361 pathway Effects 0.000 abstract description 40
- 230000014509 gene expression Effects 0.000 abstract description 39
- 239000000203 mixture Substances 0.000 abstract description 38
- RPYRMTHVSUWHSV-CUZJHZIBSA-N rebaudioside D Chemical compound O([C@H]1[C@H](O)[C@@H](CO)O[C@H]([C@@H]1O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)O[C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(=O)O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O RPYRMTHVSUWHSV-CUZJHZIBSA-N 0.000 abstract description 14
- GSGVXNMGMKBGQU-PHESRWQRSA-N rebaudioside M Chemical compound C[C@@]12CCC[C@](C)([C@H]1CC[C@@]13CC(=C)[C@@](C1)(CC[C@@H]23)O[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O[C@@H]2O[C@H](CO)[C@@H](O)[C@H](O)[C@H]2O)[C@H]1O[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O)C(=O)O[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O[C@@H]2O[C@H](CO)[C@@H](O)[C@H](O)[C@H]2O)[C@H]1O[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O GSGVXNMGMKBGQU-PHESRWQRSA-N 0.000 abstract description 5
- 210000001723 extracellular space Anatomy 0.000 abstract description 3
- 210000005061 intracellular organelle Anatomy 0.000 abstract 1
- 229940088598 enzyme Drugs 0.000 description 185
- 108090000623 proteins and genes Proteins 0.000 description 79
- 239000002609 medium Substances 0.000 description 76
- 108010078791 Carrier Proteins Proteins 0.000 description 69
- ZSLZBFCDCINBPY-ZSJPKINUSA-N acetyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 ZSLZBFCDCINBPY-ZSJPKINUSA-N 0.000 description 64
- 102000004286 Hydroxymethylglutaryl CoA Reductases Human genes 0.000 description 46
- 108090000895 Hydroxymethylglutaryl CoA Reductases Proteins 0.000 description 46
- 238000004113 cell culture Methods 0.000 description 37
- 230000000694 effects Effects 0.000 description 33
- 239000000047 product Substances 0.000 description 32
- 235000018102 proteins Nutrition 0.000 description 31
- 102000004169 proteins and genes Human genes 0.000 description 31
- 239000006228 supernatant Substances 0.000 description 31
- 244000228451 Stevia rebaudiana Species 0.000 description 29
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 28
- NUHSROFQTUXZQQ-UHFFFAOYSA-N isopentenyl diphosphate Chemical compound CC(=C)CCO[P@](O)(=O)OP(O)(O)=O NUHSROFQTUXZQQ-UHFFFAOYSA-N 0.000 description 28
- KJTLQQUUPVSXIM-ZCFIWIBFSA-N (R)-mevalonic acid Chemical compound OCC[C@](O)(C)CC(O)=O KJTLQQUUPVSXIM-ZCFIWIBFSA-N 0.000 description 27
- UEDUENGHJMELGK-HYDKPPNVSA-N Stevioside Chemical compound O([C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(=O)O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O UEDUENGHJMELGK-HYDKPPNVSA-N 0.000 description 27
- 238000000855 fermentation Methods 0.000 description 27
- 230000004151 fermentation Effects 0.000 description 27
- OJFDKHTZOUZBOS-CITAKDKDSA-N acetoacetyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)CC(=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 OJFDKHTZOUZBOS-CITAKDKDSA-N 0.000 description 25
- 229940013618 stevioside Drugs 0.000 description 25
- OHHNJQXIOPOJSC-UHFFFAOYSA-N stevioside Natural products CC1(CCCC2(C)C3(C)CCC4(CC3(CCC12C)CC4=C)OC5OC(CO)C(O)C(O)C5OC6OC(CO)C(O)C(O)C6O)C(=O)OC7OC(CO)C(O)C(O)C7O OHHNJQXIOPOJSC-UHFFFAOYSA-N 0.000 description 25
- 238000006243 chemical reaction Methods 0.000 description 24
- KJTLQQUUPVSXIM-UHFFFAOYSA-N DL-mevalonic acid Natural products OCCC(O)(C)CC(O)=O KJTLQQUUPVSXIM-UHFFFAOYSA-N 0.000 description 23
- 235000006092 Stevia rebaudiana Nutrition 0.000 description 23
- 244000005700 microbiome Species 0.000 description 23
- 241000235070 Saccharomyces Species 0.000 description 21
- 239000008103 glucose Substances 0.000 description 21
- 230000001965 increasing effect Effects 0.000 description 20
- CBIDRCWHNCKSTO-UHFFFAOYSA-N prenyl diphosphate Chemical compound CC(C)=CCO[P@](O)(=O)OP(O)(O)=O CBIDRCWHNCKSTO-UHFFFAOYSA-N 0.000 description 20
- 108030002854 Acetoacetyl-CoA synthases Proteins 0.000 description 19
- VWFJDQUYCIWHTN-YFVJMOTDSA-N 2-trans,6-trans-farnesyl diphosphate Chemical compound CC(C)=CCC\C(C)=C\CC\C(C)=C\CO[P@](O)(=O)OP(O)(O)=O VWFJDQUYCIWHTN-YFVJMOTDSA-N 0.000 description 18
- 108020004414 DNA Proteins 0.000 description 18
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 18
- VWFJDQUYCIWHTN-UHFFFAOYSA-N Farnesyl pyrophosphate Natural products CC(C)=CCCC(C)=CCCC(C)=CCOP(O)(=O)OP(O)(O)=O VWFJDQUYCIWHTN-UHFFFAOYSA-N 0.000 description 18
- 235000001014 amino acid Nutrition 0.000 description 18
- 241000219195 Arabidopsis thaliana Species 0.000 description 17
- 108020004705 Codon Proteins 0.000 description 17
- 241000589516 Pseudomonas Species 0.000 description 17
- 230000012010 growth Effects 0.000 description 16
- 239000001963 growth medium Substances 0.000 description 16
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 15
- 241000187747 Streptomyces Species 0.000 description 15
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 14
- 229910052757 nitrogen Inorganic materials 0.000 description 14
- 241000588724 Escherichia coli Species 0.000 description 13
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 13
- OINNEUNVOZHBOX-QIRCYJPOSA-K 2-trans,6-trans,10-trans-geranylgeranyl diphosphate(3-) Chemical compound CC(C)=CCC\C(C)=C\CC\C(C)=C\CC\C(C)=C\COP([O-])(=O)OP([O-])([O-])=O OINNEUNVOZHBOX-QIRCYJPOSA-K 0.000 description 12
- OINNEUNVOZHBOX-XBQSVVNOSA-N Geranylgeranyl diphosphate Natural products [P@](=O)(OP(=O)(O)O)(OC/C=C(\CC/C=C(\CC/C=C(\CC/C=C(\C)/C)/C)/C)/C)O OINNEUNVOZHBOX-XBQSVVNOSA-N 0.000 description 12
- CABVTRNMFUVUDM-VRHQGPGLSA-N (3S)-3-hydroxy-3-methylglutaryl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)C[C@@](O)(CC(O)=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 CABVTRNMFUVUDM-VRHQGPGLSA-N 0.000 description 11
- 101100351811 Caenorhabditis elegans pgal-1 gene Proteins 0.000 description 11
- 241000282414 Homo sapiens Species 0.000 description 11
- JSNRRGGBADWTMC-UHFFFAOYSA-N (6E)-7,11-dimethyl-3-methylene-1,6,10-dodecatriene Chemical compound CC(C)=CCCC(C)=CCCC(=C)C=C JSNRRGGBADWTMC-UHFFFAOYSA-N 0.000 description 10
- 244000285963 Kluyveromyces fragilis Species 0.000 description 10
- 238000004422 calculation algorithm Methods 0.000 description 10
- 230000035772 mutation Effects 0.000 description 10
- 241000193830 Bacillus <bacterium> Species 0.000 description 9
- 101100023519 Candida albicans (strain SC5314 / ATCC MYA-2876) MLT1 gene Proteins 0.000 description 9
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 9
- 235000014663 Kluyveromyces fragilis Nutrition 0.000 description 9
- 241000221960 Neurospora Species 0.000 description 9
- 101100437839 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) BPT1 gene Proteins 0.000 description 9
- 229940024606 amino acid Drugs 0.000 description 9
- 230000005764 inhibitory process Effects 0.000 description 9
- OKZYCXHTTZZYSK-ZCFIWIBFSA-N (R)-5-phosphomevalonic acid Chemical compound OC(=O)C[C@@](O)(C)CCOP(O)(O)=O OKZYCXHTTZZYSK-ZCFIWIBFSA-N 0.000 description 8
- JCAIWDXKLCEQEO-PGHZQYBFSA-N 5beta,9alpha,10alpha-labda-8(20),13-dien-15-yl diphosphate Chemical compound CC1(C)CCC[C@@]2(C)[C@H](CCC(/C)=C/COP(O)(=O)OP(O)(O)=O)C(=C)CC[C@@H]21 JCAIWDXKLCEQEO-PGHZQYBFSA-N 0.000 description 8
- 244000063299 Bacillus subtilis Species 0.000 description 8
- 235000014469 Bacillus subtilis Nutrition 0.000 description 8
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 8
- LTYOQGRJFJAKNA-KKIMTKSISA-N Malonyl CoA Natural products S(C(=O)CC(=O)O)CCNC(=O)CCNC(=O)[C@@H](O)C(CO[P@](=O)(O[P@](=O)(OC[C@H]1[C@@H](OP(=O)(O)O)[C@@H](O)[C@@H](n2c3ncnc(N)c3nc2)O1)O)O)(C)C LTYOQGRJFJAKNA-KKIMTKSISA-N 0.000 description 8
- 241000320412 Ogataea angusta Species 0.000 description 8
- 241000191967 Staphylococcus aureus Species 0.000 description 8
- 102000002932 Thiolase Human genes 0.000 description 8
- 108060008225 Thiolase Proteins 0.000 description 8
- 230000003115 biocidal effect Effects 0.000 description 8
- LTYOQGRJFJAKNA-DVVLENMVSA-N malonyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)CC(O)=O)O[C@H]1N1C2=NC=NC(N)=C2N=C1 LTYOQGRJFJAKNA-DVVLENMVSA-N 0.000 description 8
- 241000894007 species Species 0.000 description 8
- QSIDJGUAAUSPMG-CULFPKEHSA-N steviolmonoside Chemical compound O([C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(O)=O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O QSIDJGUAAUSPMG-CULFPKEHSA-N 0.000 description 8
- GGKNTGJPGZQNID-UHFFFAOYSA-N (1-$l^{1}-oxidanyl-2,2,6,6-tetramethylpiperidin-4-yl)-trimethylazanium Chemical compound CC1(C)CC([N+](C)(C)C)CC(C)(C)N1[O] GGKNTGJPGZQNID-UHFFFAOYSA-N 0.000 description 7
- GHOKWGTUZJEAQD-ZETCQYMHSA-N (D)-(+)-Pantothenic acid Chemical compound OCC(C)(C)[C@@H](O)C(=O)NCCC(O)=O GHOKWGTUZJEAQD-ZETCQYMHSA-N 0.000 description 7
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 7
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 7
- 241001453299 Pseudomonas mevalonii Species 0.000 description 7
- 241000316848 Rhodococcus <scale insect> Species 0.000 description 7
- 241000223252 Rhodotorula Species 0.000 description 7
- 235000018368 Saccharomyces fragilis Nutrition 0.000 description 7
- 241000293871 Salmonella enterica subsp. enterica serovar Typhi Species 0.000 description 7
- XJLXINKUBYWONI-DQQFMEOOSA-N [[(2r,3r,4r,5r)-5-(6-aminopurin-9-yl)-3-hydroxy-4-phosphonooxyoxolan-2-yl]methoxy-hydroxyphosphoryl] [(2s,3r,4s,5s)-5-(3-carbamoylpyridin-1-ium-1-yl)-3,4-dihydroxyoxolan-2-yl]methyl phosphate Chemical compound NC(=O)C1=CC=C[N+]([C@@H]2[C@H]([C@@H](O)[C@H](COP([O-])(=O)OP(O)(=O)OC[C@@H]3[C@H]([C@@H](OP(O)(O)=O)[C@@H](O3)N3C4=NC=NC(N)=C4N=C3)O)O2)O)=C1 XJLXINKUBYWONI-DQQFMEOOSA-N 0.000 description 7
- 125000000539 amino acid group Chemical group 0.000 description 7
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 7
- 229940031154 kluyveromyces marxianus Drugs 0.000 description 7
- 239000011777 magnesium Substances 0.000 description 7
- 229910052749 magnesium Inorganic materials 0.000 description 7
- 229930027945 nicotinamide-adenine dinucleotide Natural products 0.000 description 7
- 235000015097 nutrients Nutrition 0.000 description 7
- 239000011574 phosphorus Substances 0.000 description 7
- 229910052698 phosphorus Inorganic materials 0.000 description 7
- 230000002441 reversible effect Effects 0.000 description 7
- 230000009466 transformation Effects 0.000 description 7
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 7
- 229940045145 uridine Drugs 0.000 description 7
- 102100039601 ARF GTPase-activating protein GIT1 Human genes 0.000 description 6
- 101710194905 ARF GTPase-activating protein GIT1 Proteins 0.000 description 6
- 241000219194 Arabidopsis Species 0.000 description 6
- 102100029398 Calpain small subunit 1 Human genes 0.000 description 6
- 101710131373 Calpain small subunit 1 Proteins 0.000 description 6
- 241000186216 Corynebacterium Species 0.000 description 6
- 101710120485 Cyclo(L-leucyl-L-leucyl) synthase Proteins 0.000 description 6
- 101710116120 Cyclo(L-tyrosyl-L-tyrosyl) synthase Proteins 0.000 description 6
- 241001600125 Delftia acidovorans Species 0.000 description 6
- 241000196324 Embryophyta Species 0.000 description 6
- 241000221778 Fusarium fujikuroi Species 0.000 description 6
- 101150094690 GAL1 gene Proteins 0.000 description 6
- 102100028501 Galanin peptides Human genes 0.000 description 6
- GVVPGTZRZFNKDS-YFHOEESVSA-N Geranyl diphosphate Natural products CC(C)=CCC\C(C)=C/COP(O)(=O)OP(O)(O)=O GVVPGTZRZFNKDS-YFHOEESVSA-N 0.000 description 6
- 101710081758 High affinity cationic amino acid transporter 1 Proteins 0.000 description 6
- 101100121078 Homo sapiens GAL gene Proteins 0.000 description 6
- 241000235649 Kluyveromyces Species 0.000 description 6
- 241001671311 Laurus Species 0.000 description 6
- 240000007594 Oryza sativa Species 0.000 description 6
- 235000007164 Oryza sativa Nutrition 0.000 description 6
- 229910019142 PO4 Inorganic materials 0.000 description 6
- 241000191043 Rhodobacter sphaeroides Species 0.000 description 6
- 102000004357 Transferases Human genes 0.000 description 6
- 108090000992 Transferases Proteins 0.000 description 6
- 241000235015 Yarrowia lipolytica Species 0.000 description 6
- 238000003556 assay Methods 0.000 description 6
- 230000001627 detrimental effect Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000002068 genetic effect Effects 0.000 description 6
- GVVPGTZRZFNKDS-JXMROGBWSA-N geranyl diphosphate Chemical compound CC(C)=CCC\C(C)=C\CO[P@](O)(=O)OP(O)(O)=O GVVPGTZRZFNKDS-JXMROGBWSA-N 0.000 description 6
- 125000002791 glucosyl group Chemical group C1([C@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 6
- 238000001727 in vivo Methods 0.000 description 6
- 239000003550 marker Substances 0.000 description 6
- 229910052751 metal Inorganic materials 0.000 description 6
- 239000002184 metal Substances 0.000 description 6
- 150000002739 metals Chemical class 0.000 description 6
- 235000021317 phosphate Nutrition 0.000 description 6
- 230000001105 regulatory effect Effects 0.000 description 6
- 239000000243 solution Substances 0.000 description 6
- 239000000758 substrate Substances 0.000 description 6
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 6
- CXENHBSYCFFKJS-UHFFFAOYSA-N (3E,6E)-3,7,11-Trimethyl-1,3,6,10-dodecatetraene Natural products CC(C)=CCCC(C)=CCC=C(C)C=C CXENHBSYCFFKJS-UHFFFAOYSA-N 0.000 description 5
- 235000001405 Artemisia annua Nutrition 0.000 description 5
- 240000000011 Artemisia annua Species 0.000 description 5
- 239000002028 Biomass Substances 0.000 description 5
- 241000193403 Clostridium Species 0.000 description 5
- 241000235646 Cyberlindnera jadinii Species 0.000 description 5
- 241001138401 Kluyveromyces lactis Species 0.000 description 5
- 108010074633 Mixed Function Oxygenases Proteins 0.000 description 5
- 102000008109 Mixed Function Oxygenases Human genes 0.000 description 5
- 108700023175 Phosphate acetyltransferases Proteins 0.000 description 5
- 241000235648 Pichia Species 0.000 description 5
- YWPVROCHNBYFTP-UHFFFAOYSA-N Rubusoside Natural products C1CC2C3(C)CCCC(C)(C(=O)OC4C(C(O)C(O)C(CO)O4)O)C3CCC2(C2)CC(=C)C21OC1OC(CO)C(O)C(O)C1O YWPVROCHNBYFTP-UHFFFAOYSA-N 0.000 description 5
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 5
- 241000223230 Trichosporon Species 0.000 description 5
- 241000235017 Zygosaccharomyces Species 0.000 description 5
- 239000008186 active pharmaceutical agent Substances 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 5
- 108010067758 ent-kaurene oxidase Proteins 0.000 description 5
- 229930009668 farnesene Natural products 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 5
- 239000012528 membrane Substances 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000002018 overexpression Effects 0.000 description 5
- 229920001195 polyisoprene Polymers 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 229910021654 trace metal Inorganic materials 0.000 description 5
- 230000032258 transport Effects 0.000 description 5
- 244000178606 Abies grandis Species 0.000 description 4
- 235000017894 Abies grandis Nutrition 0.000 description 4
- 241000894006 Bacteria Species 0.000 description 4
- 241000722885 Brettanomyces Species 0.000 description 4
- 108700010070 Codon Usage Proteins 0.000 description 4
- 102000057412 Diphosphomevalonate decarboxylases Human genes 0.000 description 4
- 102000051366 Glycosyltransferases Human genes 0.000 description 4
- 108700023372 Glycosyltransferases Proteins 0.000 description 4
- 101000773364 Homo sapiens Beta-alanine-activating enzyme Proteins 0.000 description 4
- 102000002284 Hydroxymethylglutaryl-CoA Synthase Human genes 0.000 description 4
- 108010000775 Hydroxymethylglutaryl-CoA synthase Proteins 0.000 description 4
- 108010065958 Isopentenyl-diphosphate Delta-isomerase Proteins 0.000 description 4
- 241001149698 Lipomyces Species 0.000 description 4
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 4
- 108700040132 Mevalonate kinases Proteins 0.000 description 4
- 101000958834 Neosartorya fumigata (strain ATCC MYA-4609 / Af293 / CBS 101355 / FGSC A1100) Diphosphomevalonate decarboxylase mvd1 Proteins 0.000 description 4
- 101000958925 Panax ginseng Diphosphomevalonate decarboxylase 1 Proteins 0.000 description 4
- 102100024279 Phosphomevalonate kinase Human genes 0.000 description 4
- 240000008474 Pimenta dioica Species 0.000 description 4
- 235000006990 Pimenta dioica Nutrition 0.000 description 4
- 240000004713 Pisum sativum Species 0.000 description 4
- 235000010582 Pisum sativum Nutrition 0.000 description 4
- 241000205160 Pyrococcus Species 0.000 description 4
- 241000607142 Salmonella Species 0.000 description 4
- 241000293869 Salmonella enterica subsp. enterica serovar Typhimurium Species 0.000 description 4
- 241000235346 Schizosaccharomyces Species 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- OMHUCGDTACNQEX-OSHKXICASA-N Steviolbioside Natural products O([C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(O)=O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O OMHUCGDTACNQEX-OSHKXICASA-N 0.000 description 4
- 241000187433 Streptomyces clavuligerus Species 0.000 description 4
- 229930006000 Sucrose Natural products 0.000 description 4
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 4
- 101150050575 URA3 gene Proteins 0.000 description 4
- XCCTYIAWTASOJW-XVFCMESISA-N Uridine-5'-Diphosphate Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(=O)OP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1 XCCTYIAWTASOJW-XVFCMESISA-N 0.000 description 4
- 240000008042 Zea mays Species 0.000 description 4
- 239000002738 chelating agent Substances 0.000 description 4
- JLPRGBMUVNVSKP-AHUXISJXSA-M chembl2368336 Chemical compound [Na+].O([C@H]1[C@@H](O)[C@H](O)[C@H](CO)O[C@H]1O[C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C([O-])=O)[C@@H]1O[C@@H](CO)[C@@H](O)[C@H](O)[C@@H]1O JLPRGBMUVNVSKP-AHUXISJXSA-M 0.000 description 4
- 230000000295 complement effect Effects 0.000 description 4
- 210000000805 cytoplasm Anatomy 0.000 description 4
- 238000012217 deletion Methods 0.000 description 4
- 230000037430 deletion Effects 0.000 description 4
- JCAVDWHQNFTFBW-UHFFFAOYSA-N ent-kaurenal Natural products C1CC(C2)C(=C)CC32CCC2C(C)(C=O)CCCC2(C)C31 JCAVDWHQNFTFBW-UHFFFAOYSA-N 0.000 description 4
- 239000011888 foil Substances 0.000 description 4
- 108020001507 fusion proteins Proteins 0.000 description 4
- 102000037865 fusion proteins Human genes 0.000 description 4
- 238000002744 homologous recombination Methods 0.000 description 4
- 230000006801 homologous recombination Effects 0.000 description 4
- 230000001939 inductive effect Effects 0.000 description 4
- 230000010354 integration Effects 0.000 description 4
- XIXADJRWDQXREU-UHFFFAOYSA-M lithium acetate Chemical compound [Li+].CC([O-])=O XIXADJRWDQXREU-UHFFFAOYSA-M 0.000 description 4
- 108020004999 messenger RNA Proteins 0.000 description 4
- 102000002678 mevalonate kinase Human genes 0.000 description 4
- 235000019161 pantothenic acid Nutrition 0.000 description 4
- 239000011713 pantothenic acid Substances 0.000 description 4
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 4
- 239000010452 phosphate Substances 0.000 description 4
- 108091000116 phosphomevalonate kinase Proteins 0.000 description 4
- 239000013612 plasmid Substances 0.000 description 4
- 239000013587 production medium Substances 0.000 description 4
- 238000011084 recovery Methods 0.000 description 4
- YWPVROCHNBYFTP-OSHKXICASA-N rubusoside Chemical compound O([C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(=O)O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O YWPVROCHNBYFTP-OSHKXICASA-N 0.000 description 4
- 238000002864 sequence alignment Methods 0.000 description 4
- 239000005720 sucrose Substances 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 210000003934 vacuole Anatomy 0.000 description 4
- 229940088594 vitamin Drugs 0.000 description 4
- 235000013343 vitamin Nutrition 0.000 description 4
- 239000011782 vitamin Substances 0.000 description 4
- 229930003231 vitamin Natural products 0.000 description 4
- 101710165761 (2E,6E)-farnesyl diphosphate synthase Proteins 0.000 description 3
- 101710163881 5,6-dihydroxyindole-2-carboxylic acid oxidase Proteins 0.000 description 3
- 241000607620 Aliivibrio fischeri Species 0.000 description 3
- 108700028369 Alleles Proteins 0.000 description 3
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 3
- 241000205042 Archaeoglobus fulgidus Species 0.000 description 3
- 241000954177 Bangana ariza Species 0.000 description 3
- 102100030981 Beta-alanine-activating enzyme Human genes 0.000 description 3
- 241000186146 Brevibacterium Species 0.000 description 3
- 241000235172 Bullera Species 0.000 description 3
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 3
- GHOKWGTUZJEAQD-UHFFFAOYSA-N Chick antidermatitis factor Natural products OCC(C)(C)C(O)C(=O)NCCC(O)=O GHOKWGTUZJEAQD-UHFFFAOYSA-N 0.000 description 3
- 241001527609 Cryptococcus Species 0.000 description 3
- 108010042407 Endonucleases Proteins 0.000 description 3
- 241000588914 Enterobacter Species 0.000 description 3
- 241000194032 Enterococcus faecalis Species 0.000 description 3
- 101710156207 Farnesyl diphosphate synthase Proteins 0.000 description 3
- 102100035111 Farnesyl pyrophosphate synthase Human genes 0.000 description 3
- 101710125754 Farnesyl pyrophosphate synthase Proteins 0.000 description 3
- 101710089428 Farnesyl pyrophosphate synthase erg20 Proteins 0.000 description 3
- 241000233866 Fungi Species 0.000 description 3
- 241000223218 Fusarium Species 0.000 description 3
- 101100246753 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) pyrF gene Proteins 0.000 description 3
- 244000043261 Hevea brasiliensis Species 0.000 description 3
- 102100027665 Isopentenyl-diphosphate Delta-isomerase 1 Human genes 0.000 description 3
- JCAVDWHQNFTFBW-XRNRSJMDSA-N Kaur-16-en-18-al Chemical compound C1C[C@H](C2)C(=C)C[C@@]32CC[C@@H]2[C@](C)(C=O)CCC[C@@]2(C)[C@@H]31 JCAVDWHQNFTFBW-XRNRSJMDSA-N 0.000 description 3
- TUJQVRFWMWRMIO-XRNRSJMDSA-N Kaur-16-en-18-ol Chemical compound C1C[C@H](C2)C(=C)C[C@@]32CC[C@@H]2[C@](C)(CO)CCC[C@@]2(C)[C@@H]31 TUJQVRFWMWRMIO-XRNRSJMDSA-N 0.000 description 3
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 3
- 241000227653 Lycopersicon Species 0.000 description 3
- 239000004472 Lysine Substances 0.000 description 3
- 241000235645 Pichia kudriavzevii Species 0.000 description 3
- KWYUFKZDYYNOTN-UHFFFAOYSA-M Potassium hydroxide Chemical compound [OH-].[K+] KWYUFKZDYYNOTN-UHFFFAOYSA-M 0.000 description 3
- 101710150389 Probable farnesyl diphosphate synthase Proteins 0.000 description 3
- 241000039796 Pythia Species 0.000 description 3
- 241000379619 Ruegeria Species 0.000 description 3
- 241000311088 Schwanniomyces Species 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- 241000194019 Streptococcus mutans Species 0.000 description 3
- 241000193996 Streptococcus pyogenes Species 0.000 description 3
- 241000204667 Thermoplasma Species 0.000 description 3
- 238000009825 accumulation Methods 0.000 description 3
- 150000007513 acids Chemical class 0.000 description 3
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 3
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 3
- 235000011130 ammonium sulphate Nutrition 0.000 description 3
- 239000003242 anti bacterial agent Substances 0.000 description 3
- 239000008346 aqueous phase Substances 0.000 description 3
- 229960005069 calcium Drugs 0.000 description 3
- 239000011575 calcium Substances 0.000 description 3
- 229910052791 calcium Inorganic materials 0.000 description 3
- 235000001465 calcium Nutrition 0.000 description 3
- 230000010261 cell growth Effects 0.000 description 3
- 238000005119 centrifugation Methods 0.000 description 3
- 210000000172 cytosol Anatomy 0.000 description 3
- 230000020176 deacylation Effects 0.000 description 3
- 238000005947 deacylation reaction Methods 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 235000011180 diphosphates Nutrition 0.000 description 3
- NIKHGUQULKYIGE-OTCXFQBHSA-N ent-kaur-16-en-19-oic acid Chemical compound C([C@@H]1C[C@]2(CC1=C)CC1)C[C@H]2[C@@]2(C)[C@H]1[C@](C)(C(O)=O)CCC2 NIKHGUQULKYIGE-OTCXFQBHSA-N 0.000 description 3
- 230000009483 enzymatic pathway Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 229930182470 glycoside Natural products 0.000 description 3
- 150000002338 glycosides Chemical class 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 238000002955 isolation Methods 0.000 description 3
- TUJQVRFWMWRMIO-UHFFFAOYSA-N kaurenol Natural products C1CC(C2)C(=C)CC32CCC2C(C)(CO)CCCC2(C)C31 TUJQVRFWMWRMIO-UHFFFAOYSA-N 0.000 description 3
- 230000037353 metabolic pathway Effects 0.000 description 3
- 238000002703 mutagenesis Methods 0.000 description 3
- 231100000350 mutagenesis Toxicity 0.000 description 3
- 229940055726 pantothenic acid Drugs 0.000 description 3
- 239000008188 pellet Substances 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 235000009566 rice Nutrition 0.000 description 3
- 239000000523 sample Substances 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 239000011550 stock solution Substances 0.000 description 3
- 239000012134 supernatant fraction Substances 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- RLMLFADXHJLPSQ-NPPFTVEMSA-N (3s,6s,9s,12s,15s,18s,21s,24r,27s)-3,6-dibenzyl-12,24-bis[(2r)-butan-2-yl]-15-(2-hydroxypropan-2-yl)-4,10,16,22-tetramethyl-18-(2-methylpropyl)-9,21-di(propan-2-yl)-13-oxa-1,4,7,10,16,19,22,25-octazabicyclo[25.3.0]triacontane-2,5,8,11,14,17,20,23,26-nonon Chemical compound C([C@H]1C(=O)N2CCC[C@H]2C(=O)N[C@@H](C(N(C)[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N(C)[C@H](C(=O)O[C@H](C(=O)N(C)[C@@H](C(C)C)C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N1C)[C@H](C)CC)C(C)(C)O)=O)[C@H](C)CC)C1=CC=CC=C1 RLMLFADXHJLPSQ-NPPFTVEMSA-N 0.000 description 2
- OYIFNHCXNCRBQI-UHFFFAOYSA-N 2-aminoadipic acid Chemical compound OC(=O)C(N)CCCC(O)=O OYIFNHCXNCRBQI-UHFFFAOYSA-N 0.000 description 2
- ZHBXLZQQVCDGPA-UHFFFAOYSA-N 5-[(1,3-dioxo-2-benzofuran-5-yl)sulfonyl]-2-benzofuran-1,3-dione Chemical compound C1=C2C(=O)OC(=O)C2=CC(S(=O)(=O)C=2C=C3C(=O)OC(C3=CC=2)=O)=C1 ZHBXLZQQVCDGPA-UHFFFAOYSA-N 0.000 description 2
- SEHFUALWMUWDKS-UHFFFAOYSA-N 5-fluoroorotic acid Chemical compound OC(=O)C=1NC(=O)NC(=O)C=1F SEHFUALWMUWDKS-UHFFFAOYSA-N 0.000 description 2
- ZKHQWZAMYRWXGA-KQYNXXCUSA-J ATP(4-) Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)[C@H]1O ZKHQWZAMYRWXGA-KQYNXXCUSA-J 0.000 description 2
- ZKHQWZAMYRWXGA-UHFFFAOYSA-N Adenosine triphosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)C(O)C1O ZKHQWZAMYRWXGA-UHFFFAOYSA-N 0.000 description 2
- 241000567147 Aeropyrum Species 0.000 description 2
- 241000567139 Aeropyrum pernix Species 0.000 description 2
- VHUUQVKOLVNVRT-UHFFFAOYSA-N Ammonium hydroxide Chemical compound [NH4+].[OH-] VHUUQVKOLVNVRT-UHFFFAOYSA-N 0.000 description 2
- 240000001436 Antirrhinum majus Species 0.000 description 2
- 241000893512 Aquifex aeolicus Species 0.000 description 2
- 101100433757 Arabidopsis thaliana ABCG32 gene Proteins 0.000 description 2
- 241000203069 Archaea Species 0.000 description 2
- 239000004475 Arginine Substances 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- 241000228212 Aspergillus Species 0.000 description 2
- 241000193744 Bacillus amyloliquefaciens Species 0.000 description 2
- 241000193388 Bacillus thuringiensis Species 0.000 description 2
- 241000680806 Blastobotrys adeninivorans Species 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 2
- 241000589174 Bradyrhizobium japonicum Species 0.000 description 2
- 240000001829 Catharanthus roseus Species 0.000 description 2
- 240000002319 Citrus sinensis Species 0.000 description 2
- 235000005976 Citrus sinensis Nutrition 0.000 description 2
- 241000186145 Corynebacterium ammoniagenes Species 0.000 description 2
- 241001135265 Cronobacter sakazakii Species 0.000 description 2
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 2
- SRBFZHDQGSBBOR-IOVATXLUSA-N D-xylopyranose Chemical compound O[C@@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-IOVATXLUSA-N 0.000 description 2
- 241000235035 Debaryomyces Species 0.000 description 2
- 241000255601 Drosophila melanogaster Species 0.000 description 2
- 102100031780 Endonuclease Human genes 0.000 description 2
- 241001465321 Eremothecium Species 0.000 description 2
- 241000206602 Eukaryota Species 0.000 description 2
- 239000001512 FEMA 4601 Substances 0.000 description 2
- 101150038242 GAL10 gene Proteins 0.000 description 2
- 102100024637 Galectin-10 Human genes 0.000 description 2
- 241000589232 Gluconobacter oxydans Species 0.000 description 2
- 102000000340 Glucosyltransferases Human genes 0.000 description 2
- 108010055629 Glucosyltransferases Proteins 0.000 description 2
- 241000205062 Halobacterium Species 0.000 description 2
- 241001149669 Hanseniaspora Species 0.000 description 2
- 244000020551 Helianthus annuus Species 0.000 description 2
- 235000003222 Helianthus annuus Nutrition 0.000 description 2
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 2
- 241000235644 Issatchenkia Species 0.000 description 2
- 241000588747 Klebsiella pneumoniae Species 0.000 description 2
- 241001532504 Kluyveromyces marxianus DMKU3-1042 Species 0.000 description 2
- 241000235058 Komagataella pastoris Species 0.000 description 2
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 2
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical group CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 2
- 241000186660 Lactobacillus Species 0.000 description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Chemical group CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 2
- 241000192132 Leuconostoc Species 0.000 description 2
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 2
- 241000555676 Malassezia Species 0.000 description 2
- 241000589195 Mesorhizobium loti Species 0.000 description 2
- 241000202974 Methanobacterium Species 0.000 description 2
- 241000203407 Methanocaldococcus jannaschii Species 0.000 description 2
- 241000203353 Methanococcus Species 0.000 description 2
- 241001302042 Methanothermobacter thermautotrophicus Species 0.000 description 2
- 241000235048 Meyerozyma guilliermondii Species 0.000 description 2
- 241000191938 Micrococcus luteus Species 0.000 description 2
- 101100278853 Mus musculus Dhfr gene Proteins 0.000 description 2
- 101000997933 Mycobacterium tuberculosis (strain ATCC 25618 / H37Rv) (2E,6E)-farnesyl diphosphate synthase Proteins 0.000 description 2
- 101001015102 Mycobacterium tuberculosis (strain ATCC 25618 / H37Rv) Dimethylallyltranstransferase Proteins 0.000 description 2
- 241000088436 Neurospora sp. Species 0.000 description 2
- 108700026244 Open Reading Frames Proteins 0.000 description 2
- 101100054296 Oryza sativa subsp. japonica ABCG37 gene Proteins 0.000 description 2
- 101100107593 Oryza sativa subsp. japonica ABCG40 gene Proteins 0.000 description 2
- 241000588912 Pantoea agglomerans Species 0.000 description 2
- 241000588696 Pantoea ananatis Species 0.000 description 2
- 239000001888 Peptone Substances 0.000 description 2
- 108010080698 Peptones Proteins 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 2
- 240000004064 Poterium sanguisorba Species 0.000 description 2
- 108010009736 Protein Hydrolysates Proteins 0.000 description 2
- 108010026552 Proteome Proteins 0.000 description 2
- 241000589517 Pseudomonas aeruginosa Species 0.000 description 2
- HELXLJCILKEWJH-SEAGSNCFSA-N Rebaudioside A Natural products O=C(O[C@H]1[C@@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1)[C@@]1(C)[C@@H]2[C@](C)([C@H]3[C@@]4(CC(=C)[C@@](O[C@H]5[C@H](O[C@H]6[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O6)[C@@H](O[C@H]6[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O6)[C@H](O)[C@@H](CO)O5)(C4)CC3)CC2)CCC1 HELXLJCILKEWJH-SEAGSNCFSA-N 0.000 description 2
- RLLCWNUIHGPAJY-RYBZXKSASA-N Rebaudioside E Natural products O=C(O[C@H]1[C@H](O[C@H]2[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O2)[C@@H](O)[C@@H](O)[C@H](CO)O1)[C@]1(C)[C@@H]2[C@@](C)([C@@H]3[C@@]4(CC(=C)[C@@](O[C@@H]5[C@@H](O[C@@H]6[C@@H](O)[C@H](O)[C@@H](O)[C@H](CO)O6)[C@H](O)[C@@H](O)[C@H](CO)O5)(C4)CC3)CC2)CCC1 RLLCWNUIHGPAJY-RYBZXKSASA-N 0.000 description 2
- 241000191025 Rhodobacter Species 0.000 description 2
- 101150037481 SMR1 gene Proteins 0.000 description 2
- 101100491255 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) YAP1 gene Proteins 0.000 description 2
- 240000003705 Senecio vulgaris Species 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- 244000061456 Solanum tuberosum Species 0.000 description 2
- 235000002595 Solanum tuberosum Nutrition 0.000 description 2
- 241000191940 Staphylococcus Species 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- 241000193998 Streptococcus pneumoniae Species 0.000 description 2
- 241000958215 Streptomyces filamentosus Species 0.000 description 2
- 241000187310 Streptomyces noursei Species 0.000 description 2
- 241000205101 Sulfolobus Species 0.000 description 2
- 241000205098 Sulfolobus acidocaldarius Species 0.000 description 2
- QAOWNCQODCNURD-UHFFFAOYSA-N Sulfuric acid Chemical compound OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 2
- 241001453296 Synechococcus elongatus Species 0.000 description 2
- 241000204673 Thermoplasma acidophilum Species 0.000 description 2
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 2
- 239000004473 Threonine Substances 0.000 description 2
- 241000006364 Torula Species 0.000 description 2
- 241000235006 Torulaspora Species 0.000 description 2
- XCCTYIAWTASOJW-UHFFFAOYSA-N UDP-Glc Natural products OC1C(O)C(COP(O)(=O)OP(O)(O)=O)OC1N1C(=O)NC(=O)C=C1 XCCTYIAWTASOJW-UHFFFAOYSA-N 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Chemical group CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- 235000007212 Verbena X moechina Moldenke Nutrition 0.000 description 2
- 240000001519 Verbena officinalis Species 0.000 description 2
- 235000001594 Verbena polystachya Kunth Nutrition 0.000 description 2
- 235000007200 Verbena x perriana Moldenke Nutrition 0.000 description 2
- 235000002270 Verbena x stuprosa Moldenke Nutrition 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 240000006365 Vitis vinifera Species 0.000 description 2
- 235000014787 Vitis vinifera Nutrition 0.000 description 2
- 235000007244 Zea mays Nutrition 0.000 description 2
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 2
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 2
- 241000588901 Zymomonas Species 0.000 description 2
- 241000588902 Zymomonas mobilis Species 0.000 description 2
- 239000000908 ammonium hydroxide Substances 0.000 description 2
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 235000003704 aspartic acid Nutrition 0.000 description 2
- 108010008887 aureobasidin A Proteins 0.000 description 2
- 229940097012 bacillus thuringiensis Drugs 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000001588 bifunctional effect Effects 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 230000001851 biosynthetic effect Effects 0.000 description 2
- 101150038738 ble gene Proteins 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 229940041514 candida albicans extract Drugs 0.000 description 2
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 2
- 210000000170 cell membrane Anatomy 0.000 description 2
- 230000030570 cellular localization Effects 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000006482 condensation reaction Methods 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- 239000012228 culture supernatant Substances 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- XPPKVPWEQAFLFU-UHFFFAOYSA-N diphosphoric acid Chemical compound OP(O)(=O)OP(O)(O)=O XPPKVPWEQAFLFU-UHFFFAOYSA-N 0.000 description 2
- 150000002016 disaccharides Chemical class 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000004907 flux Effects 0.000 description 2
- 239000007789 gas Substances 0.000 description 2
- 238000012239 gene modification Methods 0.000 description 2
- 230000005017 genetic modification Effects 0.000 description 2
- 235000013617 genetically modified food Nutrition 0.000 description 2
- 238000012268 genome sequencing Methods 0.000 description 2
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 2
- 150000004676 glycans Chemical class 0.000 description 2
- 230000001976 improved effect Effects 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 238000009655 industrial fermentation Methods 0.000 description 2
- 229910052500 inorganic mineral Inorganic materials 0.000 description 2
- 150000002500 ions Chemical class 0.000 description 2
- 230000002427 irreversible effect Effects 0.000 description 2
- 229960000310 isoleucine Drugs 0.000 description 2
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 2
- JVTAAEKCZFNVCJ-UHFFFAOYSA-N lactic acid Chemical compound CC(O)C(O)=O JVTAAEKCZFNVCJ-UHFFFAOYSA-N 0.000 description 2
- KWGKDLIKAYFUFQ-UHFFFAOYSA-M lithium chloride Chemical compound [Li+].[Cl-] KWGKDLIKAYFUFQ-UHFFFAOYSA-M 0.000 description 2
- 235000009973 maize Nutrition 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 239000002207 metabolite Substances 0.000 description 2
- 230000000813 microbial effect Effects 0.000 description 2
- 235000010755 mineral Nutrition 0.000 description 2
- 239000011707 mineral Substances 0.000 description 2
- 230000000116 mitigating effect Effects 0.000 description 2
- 150000002772 monosaccharides Chemical class 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 235000019319 peptone Nutrition 0.000 description 2
- 239000012071 phase Substances 0.000 description 2
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 2
- 238000013081 phylogenetic analysis Methods 0.000 description 2
- 238000007747 plating Methods 0.000 description 2
- 229920001550 polyprenyl Polymers 0.000 description 2
- 125000001185 polyprenyl group Polymers 0.000 description 2
- 229920001282 polysaccharide Polymers 0.000 description 2
- 239000005017 polysaccharide Substances 0.000 description 2
- 230000026447 protein localization Effects 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- RLLCWNUIHGPAJY-SFUUMPFESA-N rebaudioside E Chemical compound O([C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(=O)O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O RLLCWNUIHGPAJY-SFUUMPFESA-N 0.000 description 2
- QSRAJVGDWKFOGU-WBXIDTKBSA-N rebaudioside c Chemical compound O[C@@H]1[C@H](O)[C@@H](O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](O[C@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O2)O)[C@H](O)[C@@H](CO)O[C@H]1O[C@]1(CC[C@H]2[C@@]3(C)[C@@H]([C@](CCC3)(C)C(=O)O[C@H]3[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O3)O)CC3)C(=C)C[C@]23C1 QSRAJVGDWKFOGU-WBXIDTKBSA-N 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 229920006395 saturated elastomer Polymers 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 229940031000 streptococcus pneumoniae Drugs 0.000 description 2
- 235000000346 sugar Nutrition 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- BVCKFLJARNKCSS-DWPRYXJFSA-N temocillin Chemical compound N([C@]1(OC)C(N2[C@H](C(C)(C)S[C@@H]21)C(O)=O)=O)C(=O)C(C(O)=O)C=1C=CSC=1 BVCKFLJARNKCSS-DWPRYXJFSA-N 0.000 description 2
- 229960001114 temocillin Drugs 0.000 description 2
- 150000003505 terpenes Chemical class 0.000 description 2
- 238000006177 thiolation reaction Methods 0.000 description 2
- DRSKVOAJKLUMCL-MMUIXFKXSA-N u2n4xkx7hp Chemical compound O([C@H]1[C@H](O)[C@@H](CO)O[C@H]([C@@H]1O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)O[C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(O)=O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O DRSKVOAJKLUMCL-MMUIXFKXSA-N 0.000 description 2
- 239000004474 valine Chemical group 0.000 description 2
- 238000012800 visualization Methods 0.000 description 2
- 239000012138 yeast extract Substances 0.000 description 2
- 239000007222 ypd medium Substances 0.000 description 2
- HDTRYLNUVZCQOY-UHFFFAOYSA-N α-D-glucopyranosyl-α-D-glucopyranoside Natural products OC1C(O)C(O)C(CO)OC1OC1C(O)C(O)C(O)C(CO)O1 HDTRYLNUVZCQOY-UHFFFAOYSA-N 0.000 description 1
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 1
- GVEZIHKRYBHEFX-MNOVXSKESA-N 13C-Cerulenin Natural products CC=CCC=CCCC(=O)[C@H]1O[C@@H]1C(N)=O GVEZIHKRYBHEFX-MNOVXSKESA-N 0.000 description 1
- RVCKCEDKBVEEHL-UHFFFAOYSA-N 2,3,4,5,6-pentachlorobenzyl alcohol Chemical compound OCC1=C(Cl)C(Cl)=C(Cl)C(Cl)=C1Cl RVCKCEDKBVEEHL-UHFFFAOYSA-N 0.000 description 1
- OKZYCXHTTZZYSK-UHFFFAOYSA-N 3-hydroxy-3-methyl-5-phosphonooxypentanoic acid Chemical compound OC(=O)CC(O)(C)CCOP(O)(O)=O OKZYCXHTTZZYSK-UHFFFAOYSA-N 0.000 description 1
- 102100029077 3-hydroxy-3-methylglutaryl-coenzyme A reductase Human genes 0.000 description 1
- FPQMGQZTBWIHDN-UHFFFAOYSA-N 5-fluoroanthranilic acid Chemical compound NC1=CC=C(F)C=C1C(O)=O FPQMGQZTBWIHDN-UHFFFAOYSA-N 0.000 description 1
- 101150096273 ADE2 gene Proteins 0.000 description 1
- 241000218642 Abies Species 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 1
- 108010006229 Acetyl-CoA C-acetyltransferase Proteins 0.000 description 1
- 102000005345 Acetyl-CoA C-acetyltransferase Human genes 0.000 description 1
- 241000186361 Actinobacteria <class> Species 0.000 description 1
- 241000187844 Actinoplanes Species 0.000 description 1
- 241000187712 Actinoplanes sp. Species 0.000 description 1
- 102000057234 Acyl transferases Human genes 0.000 description 1
- 108700016155 Acyl transferases Proteins 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- 241000589158 Agrobacterium Species 0.000 description 1
- 241001147780 Alicyclobacillus Species 0.000 description 1
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 1
- 241001508809 Ambrosiozyma Species 0.000 description 1
- 239000004254 Ammonium phosphate Substances 0.000 description 1
- 241000192542 Anabaena Species 0.000 description 1
- 241000207875 Antirrhinum Species 0.000 description 1
- 101001094837 Arabidopsis thaliana Pectinesterase 5 Proteins 0.000 description 1
- 241000205046 Archaeoglobus Species 0.000 description 1
- 241001638540 Arthroascus Species 0.000 description 1
- 241001508785 Arxiozyma Species 0.000 description 1
- 241001523626 Arxula Species 0.000 description 1
- 235000005340 Asparagus officinalis Nutrition 0.000 description 1
- 241000228245 Aspergillus niger Species 0.000 description 1
- 240000006439 Aspergillus oryzae Species 0.000 description 1
- 235000002247 Aspergillus oryzae Nutrition 0.000 description 1
- 101710177204 Atrochrysone carboxyl ACP thioesterase Proteins 0.000 description 1
- 241000972773 Aulopiformes Species 0.000 description 1
- 241000589151 Azotobacter Species 0.000 description 1
- 241000193755 Bacillus cereus Species 0.000 description 1
- 241000235553 Blakeslea trispora Species 0.000 description 1
- 108010006654 Bleomycin Proteins 0.000 description 1
- 241000178289 Botryozyma Species 0.000 description 1
- 241000589173 Bradyrhizobium Species 0.000 description 1
- 235000006463 Brassica alba Nutrition 0.000 description 1
- 244000140786 Brassica hirta Species 0.000 description 1
- 241000995051 Brenda Species 0.000 description 1
- 244000027711 Brettanomyces bruxellensis Species 0.000 description 1
- 235000000287 Brettanomyces bruxellensis Nutrition 0.000 description 1
- 241000033328 Bulleromyces Species 0.000 description 1
- 241000345998 Calamus manan Species 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 229930186147 Cephalosporin Natural products 0.000 description 1
- 241000282985 Cervus Species 0.000 description 1
- 229920002101 Chitin Polymers 0.000 description 1
- 241000588881 Chromobacterium Species 0.000 description 1
- 241001508787 Citeromyces Species 0.000 description 1
- 241000219930 Clarkia Species 0.000 description 1
- 241001508811 Clavispora Species 0.000 description 1
- 241000193454 Clostridium beijerinckii Species 0.000 description 1
- 240000004792 Corchorus capsularis Species 0.000 description 1
- GUBGYTABKSRVRQ-CUHNMECISA-N D-Cellobiose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-CUHNMECISA-N 0.000 description 1
- MTCFGRXMJLQNBG-UWTATZPHSA-N D-Serine Chemical compound OC[C@@H](N)C(O)=O MTCFGRXMJLQNBG-UWTATZPHSA-N 0.000 description 1
- 229930195711 D-Serine Natural products 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 241001306278 Diaporthe amygdali Species 0.000 description 1
- 229930186291 Dulcoside Natural products 0.000 description 1
- 241000194031 Enterococcus faecium Species 0.000 description 1
- 241000588698 Erwinia Species 0.000 description 1
- 241000588722 Escherichia Species 0.000 description 1
- 241001646716 Escherichia coli K-12 Species 0.000 description 1
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 1
- 108091029865 Exogenous DNA Proteins 0.000 description 1
- 239000001776 FEMA 4720 Substances 0.000 description 1
- 108010022535 Farnesyl-Diphosphate Farnesyltransferase Proteins 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 241000187809 Frankia Species 0.000 description 1
- 229930091371 Fructose Natural products 0.000 description 1
- 239000005715 Fructose Substances 0.000 description 1
- RFSUNEUAIZKAJO-ARQDHWQXSA-N Fructose Chemical compound OC[C@H]1O[C@](O)(CO)[C@@H](O)[C@@H]1O RFSUNEUAIZKAJO-ARQDHWQXSA-N 0.000 description 1
- 241001288226 Fusibacter Species 0.000 description 1
- 241000605909 Fusobacterium Species 0.000 description 1
- 241000605986 Fusobacterium nucleatum Species 0.000 description 1
- 101150103804 GAL3 gene Proteins 0.000 description 1
- 101150103317 GAL80 gene Proteins 0.000 description 1
- 102100039558 Galectin-3 Human genes 0.000 description 1
- 244000194101 Ginkgo biloba Species 0.000 description 1
- 235000008100 Ginkgo biloba Nutrition 0.000 description 1
- 108010015776 Glucose oxidase Proteins 0.000 description 1
- 239000004366 Glucose oxidase Substances 0.000 description 1
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 1
- 229920002527 Glycogen Polymers 0.000 description 1
- 101150009006 HIS3 gene Proteins 0.000 description 1
- 241000168517 Haematococcus lacustris Species 0.000 description 1
- 241000204942 Halobacterium sp. Species 0.000 description 1
- SQUHHTBVTRBESD-UHFFFAOYSA-N Hexa-Ac-myo-Inositol Natural products CC(=O)OC1C(OC(C)=O)C(OC(C)=O)C(OC(C)=O)C(OC(C)=O)C1OC(C)=O SQUHHTBVTRBESD-UHFFFAOYSA-N 0.000 description 1
- 101000884385 Homo sapiens Arylamine N-acetyltransferase 1 Proteins 0.000 description 1
- 101001034811 Homo sapiens Eukaryotic translation initiation factor 4 gamma 2 Proteins 0.000 description 1
- 101000801640 Homo sapiens Phospholipid-transporting ATPase ABCA3 Proteins 0.000 description 1
- 101000639975 Homo sapiens Sodium-dependent noradrenaline transporter Proteins 0.000 description 1
- GRRNUXAQVGOGFE-UHFFFAOYSA-N Hygromycin-B Natural products OC1C(NC)CC(N)C(O)C1OC1C2OC3(C(C(O)C(O)C(C(N)CO)O3)O)OC2C(O)C(CO)O1 GRRNUXAQVGOGFE-UHFFFAOYSA-N 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- JUZNIMUFDBIJCM-ANEDZVCMSA-N Invanz Chemical compound O=C([C@H]1NC[C@H](C1)SC=1[C@H](C)[C@@H]2[C@H](C(N2C=1C(O)=O)=O)[C@H](O)C)NC1=CC=CC(C(O)=O)=C1 JUZNIMUFDBIJCM-ANEDZVCMSA-N 0.000 description 1
- 241001473007 Ips pini Species 0.000 description 1
- 108090000769 Isomerases Proteins 0.000 description 1
- 102000004195 Isomerases Human genes 0.000 description 1
- 241001099156 Komagataella phaffii Species 0.000 description 1
- 241001489120 Kondoa Species 0.000 description 1
- 241000222661 Kurtzmanomyces Species 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- 101150044775 LYS1 gene Proteins 0.000 description 1
- 241000481961 Lachancea thermotolerans Species 0.000 description 1
- 241001582342 Lactobacillus sakei subsp. sakei Species 0.000 description 1
- 241000194036 Lactococcus Species 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- 241000589902 Leptospira Species 0.000 description 1
- 241000589929 Leptospira interrogans Species 0.000 description 1
- 241000113239 Leucospora Species 0.000 description 1
- 241000209510 Liliopsida Species 0.000 description 1
- 241001149691 Lipomyces starkeyi Species 0.000 description 1
- 235000002262 Lycopersicon Nutrition 0.000 description 1
- 241000193386 Lysinibacillus sphaericus Species 0.000 description 1
- 101150068888 MET3 gene Proteins 0.000 description 1
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 241000219823 Medicago Species 0.000 description 1
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 description 1
- 241000219828 Medicago truncatula Species 0.000 description 1
- 102000003939 Membrane transport proteins Human genes 0.000 description 1
- 108090000301 Membrane transport proteins Proteins 0.000 description 1
- 244000246386 Mentha pulegium Species 0.000 description 1
- 235000016257 Mentha pulegium Nutrition 0.000 description 1
- 235000004357 Mentha x piperita Nutrition 0.000 description 1
- 241000970829 Mesorhizobium Species 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 241000589323 Methylobacterium Species 0.000 description 1
- 241001123674 Metschnikowia Species 0.000 description 1
- 241000091577 Mexicana Species 0.000 description 1
- 241001467578 Microbacterium Species 0.000 description 1
- 241000588621 Moraxella Species 0.000 description 1
- 241001149967 Mrakia Species 0.000 description 1
- 241000699660 Mus musculus Species 0.000 description 1
- 101100533725 Mus musculus Smr3a gene Proteins 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 241000186359 Mycobacterium Species 0.000 description 1
- 241000187492 Mycobacterium marinum Species 0.000 description 1
- 241000187917 Mycobacterium ulcerans Species 0.000 description 1
- 101150082943 NAT1 gene Proteins 0.000 description 1
- 241000193596 Nadsonia Species 0.000 description 1
- 241000588652 Neisseria gonorrhoeae Species 0.000 description 1
- 241000233892 Neocallimastix Species 0.000 description 1
- 241001147660 Neospora Species 0.000 description 1
- 101100022915 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) cys-11 gene Proteins 0.000 description 1
- GRYLNZFGIOXLOG-UHFFFAOYSA-N Nitric acid Chemical compound O[N+]([O-])=O GRYLNZFGIOXLOG-UHFFFAOYSA-N 0.000 description 1
- 241000187654 Nocardia Species 0.000 description 1
- 241000203622 Nocardiopsis Species 0.000 description 1
- 108091005461 Nucleic proteins Chemical group 0.000 description 1
- 241001502335 Orpinomyces Species 0.000 description 1
- 241001057811 Paracoccus <mealybug> Species 0.000 description 1
- 241000589597 Paracoccus denitrificans Species 0.000 description 1
- 229930182555 Penicillin Natural products 0.000 description 1
- 102100033623 Phospholipid-transporting ATPase ABCA3 Human genes 0.000 description 1
- 241000195888 Physcomitrella Species 0.000 description 1
- 241000195887 Physcomitrella patens Species 0.000 description 1
- 240000000020 Picea glauca Species 0.000 description 1
- 235000008127 Picea glauca Nutrition 0.000 description 1
- 241000235379 Piromyces Species 0.000 description 1
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 1
- 101100132333 Pseudomonas mevalonii mvaA gene Proteins 0.000 description 1
- 241000589776 Pseudomonas putida Species 0.000 description 1
- 241001148023 Pyrococcus abyssi Species 0.000 description 1
- 241000522615 Pyrococcus horikoshii Species 0.000 description 1
- 101100149716 Rattus norvegicus Vcsa1 gene Proteins 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 241000589180 Rhizobium Species 0.000 description 1
- 241000589187 Rhizobium sp. Species 0.000 description 1
- 241000191023 Rhodobacter capsulatus Species 0.000 description 1
- 241001501882 Rhodomonas Species 0.000 description 1
- 101100394989 Rhodopseudomonas palustris (strain ATCC BAA-98 / CGA009) hisI gene Proteins 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 101150048520 SFM1 gene Proteins 0.000 description 1
- 101100286750 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) ILV2 gene Proteins 0.000 description 1
- 101100386089 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) MET17 gene Proteins 0.000 description 1
- 101100533323 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) SFM1 gene Proteins 0.000 description 1
- 241000582914 Saccharomyces uvarum Species 0.000 description 1
- 241000222838 Saitoella Species 0.000 description 1
- 241001514651 Sakaguchia Species 0.000 description 1
- 241001138501 Salmonella enterica Species 0.000 description 1
- 241001149673 Saturnispora Species 0.000 description 1
- 241000235060 Scheffersomyces stipitis Species 0.000 description 1
- 241000222480 Schizophyllum Species 0.000 description 1
- 101100022918 Schizosaccharomyces pombe (strain 972 / ATCC 24843) sua1 gene Proteins 0.000 description 1
- 241000545593 Scolytinae Species 0.000 description 1
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 1
- 102100033929 Sodium-dependent noradrenaline transporter Human genes 0.000 description 1
- 240000003768 Solanum lycopersicum Species 0.000 description 1
- 235000002560 Solanum lycopersicum Nutrition 0.000 description 1
- 241000228389 Sporidiobolus Species 0.000 description 1
- 241000222068 Sporobolomyces <Sporidiobolaceae> Species 0.000 description 1
- 241001085826 Sporotrichum Species 0.000 description 1
- 102100037997 Squalene synthase Human genes 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 241000222665 Sterigmatomyces Species 0.000 description 1
- 101100101356 Stevia rebaudiana UGT91D2 gene Proteins 0.000 description 1
- 244000057717 Streptococcus lactis Species 0.000 description 1
- 235000014897 Streptococcus lactis Nutrition 0.000 description 1
- 241000103155 Streptococcus pyogenes MGAS10270 Species 0.000 description 1
- 241000103160 Streptococcus pyogenes MGAS10750 Species 0.000 description 1
- 241000103154 Streptococcus pyogenes MGAS2096 Species 0.000 description 1
- 241000186986 Streptomyces anulatus Species 0.000 description 1
- 241000187180 Streptomyces sp. Species 0.000 description 1
- 241000187191 Streptomyces viridochromogenes Species 0.000 description 1
- 241000267323 Streptomyces viridochromogenes DSM 40736 Species 0.000 description 1
- LSNNMFCWUKXFEE-UHFFFAOYSA-N Sulfurous acid Chemical compound OS(O)=O LSNNMFCWUKXFEE-UHFFFAOYSA-N 0.000 description 1
- 241001511915 Symphora Species 0.000 description 1
- 241000192707 Synechococcus Species 0.000 description 1
- 241000192560 Synechococcus sp. Species 0.000 description 1
- 101150006914 TRP1 gene Proteins 0.000 description 1
- 241000489996 Thermoplasma volcanium Species 0.000 description 1
- 206010043866 Tinea capitis Diseases 0.000 description 1
- HDTRYLNUVZCQOY-WSWWMNSNSA-N Trehalose Natural products O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-WSWWMNSNSA-N 0.000 description 1
- 241000223259 Trichoderma Species 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 241001467018 Typhis Species 0.000 description 1
- 101710177825 UDP-glycosyltransferase 74G1 Proteins 0.000 description 1
- 101710171974 UDP-glycosyltransferase 76G1 Proteins 0.000 description 1
- 101710172549 UDP-glycosyltransferase 85C2 Proteins 0.000 description 1
- 241000221566 Ustilago Species 0.000 description 1
- 235000009754 Vitis X bourquina Nutrition 0.000 description 1
- 235000012333 Vitis X labruscana Nutrition 0.000 description 1
- 241000311098 Yamadazyma Species 0.000 description 1
- 108010084455 Zeocin Proteins 0.000 description 1
- 241000234314 Zingiber Species 0.000 description 1
- HINSNOJRHFIMKB-DJDMUFINSA-N [(2S,3R,4S,5S,6R)-4,5-dihydroxy-6-(hydroxymethyl)-3-[(2S,3R,4R,5R,6S)-3,4,5-trihydroxy-6-methyloxan-2-yl]oxyoxan-2-yl] (1R,4S,5R,9S,10R,13S)-13-[(2S,3R,4S,5R,6R)-5-hydroxy-6-(hydroxymethyl)-3,4-bis[[(2S,3R,4S,5S,6R)-3,4,5-trihydroxy-6-(hydroxymethyl)oxan-2-yl]oxy]oxan-2-yl]oxy-5,9-dimethyl-14-methylidenetetracyclo[11.2.1.01,10.04,9]hexadecane-5-carboxylate Chemical compound [H][C@@]1(O[C@@H]2[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]2OC(=O)[C@]2(C)CCC[C@@]3(C)[C@]4([H])CC[C@@]5(C[C@]4(CC5=C)CC[C@]23[H])O[C@]2([H])O[C@H](CO)[C@@H](O)[C@H](O[C@]3([H])O[C@H](CO)[C@@H](O)[C@H](O)[C@H]3O)[C@H]2O[C@]2([H])O[C@H](CO)[C@@H](O)[C@H](O)[C@H]2O)O[C@@H](C)[C@H](O)[C@@H](O)[C@H]1O HINSNOJRHFIMKB-DJDMUFINSA-N 0.000 description 1
- NRAUADCLPJTGSF-ZPGVOIKOSA-N [(2r,3s,4r,5r,6r)-6-[[(3as,7r,7as)-7-hydroxy-4-oxo-1,3a,5,6,7,7a-hexahydroimidazo[4,5-c]pyridin-2-yl]amino]-5-[[(3s)-3,6-diaminohexanoyl]amino]-4-hydroxy-2-(hydroxymethyl)oxan-3-yl] carbamate Chemical compound NCCC[C@H](N)CC(=O)N[C@@H]1[C@@H](O)[C@H](OC(N)=O)[C@@H](CO)O[C@H]1\N=C/1N[C@H](C(=O)NC[C@H]2O)[C@@H]2N\1 NRAUADCLPJTGSF-ZPGVOIKOSA-N 0.000 description 1
- IKHGUXGNUITLKF-XPULMUKRSA-N acetaldehyde Chemical compound [14CH]([14CH3])=O IKHGUXGNUITLKF-XPULMUKRSA-N 0.000 description 1
- LIPOUNRJVLNBCD-UHFFFAOYSA-N acetyl dihydrogen phosphate Chemical compound CC(=O)OP(O)(O)=O LIPOUNRJVLNBCD-UHFFFAOYSA-N 0.000 description 1
- 125000002015 acyclic group Chemical group 0.000 description 1
- 230000010933 acylation Effects 0.000 description 1
- 238000005917 acylation reaction Methods 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 244000193174 agave Species 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- HDTRYLNUVZCQOY-LIZSDCNHSA-N alpha,alpha-trehalose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-LIZSDCNHSA-N 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- WQZGKKKJIJFFOK-PHYPRBDBSA-N alpha-D-galactose Chemical compound OC[C@H]1O[C@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-PHYPRBDBSA-N 0.000 description 1
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 1
- 229910021529 ammonia Inorganic materials 0.000 description 1
- ZRIUUUJAJJNDSS-UHFFFAOYSA-N ammonium phosphates Chemical class [NH4+].[NH4+].[NH4+].[O-]P([O-])([O-])=O ZRIUUUJAJJNDSS-UHFFFAOYSA-N 0.000 description 1
- 235000019289 ammonium phosphates Nutrition 0.000 description 1
- 150000003863 ammonium salts Chemical class 0.000 description 1
- 229940044197 ammonium sulfate Drugs 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000001195 anabolic effect Effects 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 239000002518 antifoaming agent Substances 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 239000012736 aqueous medium Substances 0.000 description 1
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 150000001510 aspartic acids Chemical class 0.000 description 1
- 239000003782 beta lactam antibiotic agent Substances 0.000 description 1
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- GUBGYTABKSRVRQ-QUYVBRFLSA-N beta-maltose Chemical compound OC[C@H]1O[C@H](O[C@H]2[C@H](O)[C@@H](O)[C@H](O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@@H]1O GUBGYTABKSRVRQ-QUYVBRFLSA-N 0.000 description 1
- GINJFDRNADDBIN-FXQIFTODSA-N bilanafos Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCP(C)(O)=O GINJFDRNADDBIN-FXQIFTODSA-N 0.000 description 1
- 238000010364 biochemical engineering Methods 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 101150049515 bla gene Proteins 0.000 description 1
- 229960001561 bleomycin Drugs 0.000 description 1
- OYVAGSVQBOHSSS-UAPAGMARSA-O bleomycin A2 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC=C(N=1)C=1SC=C(N=1)C(=O)NCCC[S+](C)C)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C OYVAGSVQBOHSSS-UAPAGMARSA-O 0.000 description 1
- 150000005693 branched-chain amino acids Chemical class 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- GVEZIHKRYBHEFX-UHFFFAOYSA-N caerulein A Natural products CC=CCC=CCCC(=O)C1OC1C(N)=O GVEZIHKRYBHEFX-UHFFFAOYSA-N 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229960002713 calcium chloride Drugs 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- LLSDKQJKOVVTOJ-UHFFFAOYSA-L calcium chloride dihydrate Chemical compound O.O.[Cl-].[Cl-].[Ca+2] LLSDKQJKOVVTOJ-UHFFFAOYSA-L 0.000 description 1
- 229940052299 calcium chloride dihydrate Drugs 0.000 description 1
- 238000011088 calibration curve Methods 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 235000013877 carbamide Nutrition 0.000 description 1
- 229940041011 carbapenems Drugs 0.000 description 1
- 125000004432 carbon atom Chemical group C* 0.000 description 1
- 101150055766 cat gene Proteins 0.000 description 1
- 230000001925 catabolic effect Effects 0.000 description 1
- 230000006652 catabolic pathway Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- OLVCFLKTBJRLHI-AXAPSJFSSA-N cefamandole Chemical compound CN1N=NN=C1SCC1=C(C(O)=O)N2C(=O)[C@@H](NC(=O)[C@H](O)C=3C=CC=CC=3)[C@H]2SC1 OLVCFLKTBJRLHI-AXAPSJFSSA-N 0.000 description 1
- 229960003012 cefamandole Drugs 0.000 description 1
- GCFBRXLSHGKWDP-XCGNWRKASA-N cefoperazone Chemical compound O=C1C(=O)N(CC)CCN1C(=O)N[C@H](C=1C=CC(O)=CC=1)C(=O)N[C@@H]1C(=O)N2C(C(O)=O)=C(CSC=3N(N=NN=3)C)CS[C@@H]21 GCFBRXLSHGKWDP-XCGNWRKASA-N 0.000 description 1
- 229960004682 cefoperazone Drugs 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 229940124587 cephalosporin Drugs 0.000 description 1
- 150000001780 cephalosporins Chemical class 0.000 description 1
- GVEZIHKRYBHEFX-NQQPLRFYSA-N cerulenin Chemical compound C\C=C\C\C=C\CCC(=O)[C@H]1O[C@H]1C(N)=O GVEZIHKRYBHEFX-NQQPLRFYSA-N 0.000 description 1
- 229950005984 cerulenin Drugs 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 238000005352 clarification Methods 0.000 description 1
- 239000000701 coagulant Substances 0.000 description 1
- 235000009508 confectionery Nutrition 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 239000013256 coordination polymer Substances 0.000 description 1
- 238000002425 crystallisation Methods 0.000 description 1
- 230000008025 crystallization Effects 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 238000006114 decarboxylation reaction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000001212 derivatisation Methods 0.000 description 1
- 239000008121 dextrose Substances 0.000 description 1
- 238000007865 diluting Methods 0.000 description 1
- AIUDWMLXCFRVDR-UHFFFAOYSA-N dimethyl 2-(3-ethyl-3-methylpentyl)propanedioate Chemical class CCC(C)(CC)CCC(C(=O)OC)C(=O)OC AIUDWMLXCFRVDR-UHFFFAOYSA-N 0.000 description 1
- 239000001177 diphosphate Substances 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 1
- 125000000567 diterpene group Chemical group 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- CANAPGLEBDTCAF-UHFFFAOYSA-N dulcoside a Chemical compound OC1C(O)C(O)C(C)OC1OC1C(OC23C(CC4(C2)C(C2(C)C(C(CCC2)(C)C(=O)OC2C(C(O)C(O)C(CO)O2)O)CC4)CC3)=C)OC(CO)C(O)C1O CANAPGLEBDTCAF-UHFFFAOYSA-N 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- JCAVDWHQNFTFBW-GNVSMLMZSA-N ent-kaur-16-en-19-al Chemical compound C1C[C@@H](C2)C(=C)C[C@@]32CC[C@@H]2[C@](C)(C=O)CCC[C@@]2(C)[C@@H]31 JCAVDWHQNFTFBW-GNVSMLMZSA-N 0.000 description 1
- TUJQVRFWMWRMIO-GNVSMLMZSA-N ent-kaur-16-en-19-ol Chemical compound C1C[C@@H](C2)C(=C)C[C@@]32CC[C@@H]2[C@](C)(CO)CCC[C@@]2(C)[C@@H]31 TUJQVRFWMWRMIO-GNVSMLMZSA-N 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 238000001952 enzyme assay Methods 0.000 description 1
- 101150116391 erg9 gene Proteins 0.000 description 1
- 229960002770 ertapenem Drugs 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 238000001704 evaporation Methods 0.000 description 1
- 230000008020 evaporation Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000010435 extracellular transport Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 239000000796 flavoring agent Substances 0.000 description 1
- 235000019634 flavors Nutrition 0.000 description 1
- 239000008394 flocculating agent Substances 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 239000012737 fresh medium Substances 0.000 description 1
- 238000010230 functional analysis Methods 0.000 description 1
- 229930182830 galactose Natural products 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 229940116332 glucose oxidase Drugs 0.000 description 1
- 235000019420 glucose oxidase Nutrition 0.000 description 1
- 229930182478 glucoside Natural products 0.000 description 1
- 150000008131 glucosides Chemical class 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- 229940096919 glycogen Drugs 0.000 description 1
- 108700014210 glycosyltransferase activity proteins Proteins 0.000 description 1
- 235000002532 grape seed extract Nutrition 0.000 description 1
- 239000007952 growth promoter Substances 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 235000001050 hortel pimenta Nutrition 0.000 description 1
- 101150029559 hph gene Proteins 0.000 description 1
- 235000003642 hunger Nutrition 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 125000001165 hydrophobic group Chemical group 0.000 description 1
- GRRNUXAQVGOGFE-NZSRVPFOSA-N hygromycin B Chemical compound O[C@@H]1[C@@H](NC)C[C@@H](N)[C@H](O)[C@H]1O[C@H]1[C@H]2O[C@@]3([C@@H]([C@@H](O)[C@@H](O)[C@@H](C(N)CO)O3)O)O[C@H]2[C@@H](O)[C@@H](CO)O1 GRRNUXAQVGOGFE-NZSRVPFOSA-N 0.000 description 1
- 229940097277 hygromycin b Drugs 0.000 description 1
- 238000007654 immersion Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 239000002054 inoculum Substances 0.000 description 1
- CDAISMWEOUEBRE-GPIVLXJGSA-N inositol Chemical compound O[C@H]1[C@H](O)[C@@H](O)[C@H](O)[C@H](O)[C@@H]1O CDAISMWEOUEBRE-GPIVLXJGSA-N 0.000 description 1
- 229960000367 inositol Drugs 0.000 description 1
- 230000010189 intracellular transport Effects 0.000 description 1
- IPFXNYPSBSIFOB-UHFFFAOYSA-N isopentyl pyrophosphate Chemical compound CC(C)CCO[P@](O)(=O)OP(O)(O)=O IPFXNYPSBSIFOB-UHFFFAOYSA-N 0.000 description 1
- 239000004310 lactic acid Substances 0.000 description 1
- 235000014655 lactic acid Nutrition 0.000 description 1
- 229940039696 lactobacillus Drugs 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 125000001909 leucine group Chemical group [H]N(*)C(C(*)=O)C([H])([H])C(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- OAIJSZIZWZSQBC-GYZMGTAESA-N lycopene Chemical compound CC(C)=CCC\C(C)=C\C=C\C(\C)=C\C=C\C(\C)=C\C=C\C=C(/C)\C=C\C=C(/C)\C=C\C=C(/C)CCC=C(C)C OAIJSZIZWZSQBC-GYZMGTAESA-N 0.000 description 1
- WRUGWIBCXHJTDG-UHFFFAOYSA-L magnesium sulfate heptahydrate Chemical compound O.O.O.O.O.O.O.[Mg+2].[O-]S([O-])(=O)=O WRUGWIBCXHJTDG-UHFFFAOYSA-L 0.000 description 1
- 229940061634 magnesium sulfate heptahydrate Drugs 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000013028 medium composition Substances 0.000 description 1
- 230000007102 metabolic function Effects 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 1
- 229960000485 methotrexate Drugs 0.000 description 1
- 239000013586 microbial product Substances 0.000 description 1
- 238000009629 microbiological culture Methods 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- VYQNWZOUAUKGHI-UHFFFAOYSA-N monobenzone Chemical compound C1=CC(O)=CC=C1OCC1=CC=CC=C1 VYQNWZOUAUKGHI-UHFFFAOYSA-N 0.000 description 1
- 101150016209 mvaA gene Proteins 0.000 description 1
- 230000017095 negative regulation of cell growth Effects 0.000 description 1
- 229910017604 nitric acid Inorganic materials 0.000 description 1
- 235000013615 non-nutritive sweetener Nutrition 0.000 description 1
- 231100001160 nonlethal Toxicity 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 239000003921 oil Substances 0.000 description 1
- 125000001477 organic nitrogen group Chemical group 0.000 description 1
- 230000008723 osmotic stress Effects 0.000 description 1
- 230000001590 oxidative effect Effects 0.000 description 1
- 229940014662 pantothenate Drugs 0.000 description 1
- 101150113864 pat gene Proteins 0.000 description 1
- 150000002960 penicillins Chemical class 0.000 description 1
- 229940066779 peptones Drugs 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- CWCMIVBLVUHDHK-ZSNHEYEWSA-N phleomycin D1 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC[C@@H](N=1)C=1SC=C(N=1)C(=O)NCCCCNC(N)=N)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C CWCMIVBLVUHDHK-ZSNHEYEWSA-N 0.000 description 1
- 229920002523 polyethylene Glycol 1000 Polymers 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 239000011591 potassium Substances 0.000 description 1
- 229910052700 potassium Inorganic materials 0.000 description 1
- 230000003389 potentiating effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 239000003531 protein hydrolysate Substances 0.000 description 1
- ZUFQODAHGAHPFQ-UHFFFAOYSA-N pyridoxine hydrochloride Chemical compound Cl.CC1=NC=C(CO)C(CO)=C1O ZUFQODAHGAHPFQ-UHFFFAOYSA-N 0.000 description 1
- 235000019171 pyridoxine hydrochloride Nutrition 0.000 description 1
- 239000011764 pyridoxine hydrochloride Substances 0.000 description 1
- 238000002708 random mutagenesis Methods 0.000 description 1
- 235000012950 rattan cane Nutrition 0.000 description 1
- QRGRAFPOLJOGRV-UHFFFAOYSA-N rebaudioside F Natural products CC12CCCC(C)(C1CCC34CC(=C)C(CCC23)(C4)OC5OC(CO)C(O)C(OC6OCC(O)C(O)C6O)C5OC7OC(CO)C(O)C(O)C7O)C(=O)OC8OC(CO)C(O)C(O)C8O QRGRAFPOLJOGRV-UHFFFAOYSA-N 0.000 description 1
- HYLAUKAHEAUVFE-AVBZULRRSA-N rebaudioside f Chemical compound O([C@H]1[C@H](O)[C@@H](CO)O[C@H]([C@@H]1O[C@H]1[C@@H]([C@@H](O)[C@H](O)CO1)O)O[C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(=O)O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O HYLAUKAHEAUVFE-AVBZULRRSA-N 0.000 description 1
- 230000004202 respiratory function Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 235000019515 salmon Nutrition 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- CDAISMWEOUEBRE-UHFFFAOYSA-N scyllo-inosotol Natural products OC1C(O)C(O)C(O)C(O)C1O CDAISMWEOUEBRE-UHFFFAOYSA-N 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000009919 sequestration Effects 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 230000037432 silent mutation Effects 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 235000021309 simple sugar Nutrition 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 239000007921 spray Substances 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 230000037351 starvation Effects 0.000 description 1
- 239000008223 sterile water Substances 0.000 description 1
- 230000035882 stress Effects 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- ZDXMLEQEMNLCQG-UHFFFAOYSA-N sulfometuron methyl Chemical group COC(=O)C1=CC=CC=C1S(=O)(=O)NC(=O)NC1=NC(C)=CC(C)=N1 ZDXMLEQEMNLCQG-UHFFFAOYSA-N 0.000 description 1
- 239000013595 supernatant sample Substances 0.000 description 1
- 239000004094 surface-active agent Substances 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 229960003495 thiamine Drugs 0.000 description 1
- DPJRMOMPQZCRJU-UHFFFAOYSA-M thiamine hydrochloride Chemical compound Cl.[Cl-].CC1=C(CCO)SC=[N+]1CC1=CN=C(C)N=C1N DPJRMOMPQZCRJU-UHFFFAOYSA-M 0.000 description 1
- 235000019190 thiamine hydrochloride Nutrition 0.000 description 1
- 239000011747 thiamine hydrochloride Substances 0.000 description 1
- 208000009189 tinea favosa Diseases 0.000 description 1
- OQPOFZJZPYRNFF-CULFPKEHSA-N tkd5uc898q Chemical compound O=C([C@]1(C)CCC[C@@]2([C@@H]1CC[C@]13C[C@](O)(C(=C)C1)CC[C@@H]23)C)O[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O OQPOFZJZPYRNFF-CULFPKEHSA-N 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 238000010977 unit operation Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 229940045136 urea Drugs 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
- 229940011671 vitamin b6 Drugs 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 239000002132 β-lactam antibiotic Substances 0.000 description 1
- 229940124586 β-lactam antibiotics Drugs 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/44—Preparation of O-glycosides, e.g. glucosides
- C12P19/56—Preparation of O-glycosides, e.g. glucosides having an oxygen atom of the saccharide radical directly bound to a condensed ring system having three or more carbocyclic rings, e.g. daunomycin, adriamycin
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/705—Receptors; Cell surface antigens; Cell surface determinants
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/415—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0012—Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7)
- C12N9/0036—Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on NADH or NADPH (1.6)
- C12N9/0038—Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on NADH or NADPH (1.6) with a heme protein as acceptor (1.6.2)
- C12N9/0042—NADPH-cytochrome P450 reductase (1.6.2.4)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0071—Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0071—Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
- C12N9/0073—Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14) with NADH or NADPH as one donor, and incorporation of one atom of oxygen 1.14.13
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1048—Glycosyltransferases (2.4)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1048—Glycosyltransferases (2.4)
- C12N9/1051—Hexosyltransferases (2.4.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1048—Glycosyltransferases (2.4)
- C12N9/1051—Hexosyltransferases (2.4.1)
- C12N9/1062—Sucrose synthase (2.4.1.13)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1085—Transferases (2.) transferring alkyl or aryl groups other than methyl groups (2.5)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/88—Lyases (4.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/90—Isomerases (5.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P15/00—Preparation of compounds containing at least three condensed carbocyclic rings
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/44—Preparation of O-glycosides, e.g. glucosides
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P5/00—Preparation of hydrocarbons or halogenated hydrocarbons
- C12P5/007—Preparation of hydrocarbons or halogenated hydrocarbons containing one or more isoprene units, i.e. terpenes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/24—Preparation of oxygen-containing organic compounds containing a carbonyl group
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/40—Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y106/00—Oxidoreductases acting on NADH or NADPH (1.6)
- C12Y106/02—Oxidoreductases acting on NADH or NADPH (1.6) with a heme protein as acceptor (1.6.2)
- C12Y106/02004—NADPH-hemoprotein reductase (1.6.2.4), i.e. NADP-cytochrome P450-reductase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y114/00—Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
- C12Y114/13—Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with NADH or NADPH as one donor, and incorporation of one atom of oxygen (1.14.13)
- C12Y114/13078—Ent-kaurene oxidase (1.14.13.78)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y114/00—Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
- C12Y114/13—Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with NADH or NADPH as one donor, and incorporation of one atom of oxygen (1.14.13)
- C12Y114/13079—Ent-kaurenoic acid oxidase (1.14.13.79)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y114/00—Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
- C12Y114/13—Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with NADH or NADPH as one donor, and incorporation of one atom of oxygen (1.14.13)
- C12Y114/13158—Amorpha-4,11-diene 12-monooxygenase (1.14.13.158)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y204/00—Glycosyltransferases (2.4)
- C12Y204/01—Hexosyltransferases (2.4.1)
- C12Y204/01017—Glucuronosyltransferase (2.4.1.17)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y205/00—Transferases transferring alkyl or aryl groups, other than methyl groups (2.5)
- C12Y205/01—Transferases transferring alkyl or aryl groups, other than methyl groups (2.5) transferring alkyl or aryl groups, other than methyl groups (2.5.1)
- C12Y205/01001—Dimethylallyltranstransferase (2.5.1.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y205/00—Transferases transferring alkyl or aryl groups, other than methyl groups (2.5)
- C12Y205/01—Transferases transferring alkyl or aryl groups, other than methyl groups (2.5) transferring alkyl or aryl groups, other than methyl groups (2.5.1)
- C12Y205/01081—Geranylfarnesyl diphosphate synthase (2.5.1.81)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y402/00—Carbon-oxygen lyases (4.2)
- C12Y402/03—Carbon-oxygen lyases (4.2) acting on phosphates (4.2.3)
- C12Y402/03019—Ent-kaurene synthase (4.2.3.19)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y402/00—Carbon-oxygen lyases (4.2)
- C12Y402/03—Carbon-oxygen lyases (4.2) acting on phosphates (4.2.3)
- C12Y402/03024—Amorpha-4,11-diene synthase (4.2.3.24)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y505/00—Intramolecular lyases (5.5)
- C12Y505/01—Intramolecular lyases (5.5.1)
- C12Y505/01003—Tetrahydroxypteridine cycloisomerase (5.5.1.3)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y505/00—Intramolecular lyases (5.5)
- C12Y505/01—Intramolecular lyases (5.5.1)
- C12Y505/01013—Ent-copalyl diphosphate synthase (5.5.1.13)
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Medicinal Chemistry (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Biophysics (AREA)
- Mycology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Gastroenterology & Hepatology (AREA)
- Botany (AREA)
- Cell Biology (AREA)
- Immunology (AREA)
- Toxicology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Enzymes And Modification Thereof (AREA)
- Peptides Or Proteins (AREA)
Abstract
本发明提供了用于改进甜菊糖苷生成量的经遗传修饰的宿主细胞、组合物和方法。在一些实施方案,所述宿主细胞经遗传修饰以包含异源核酸表达盒,所述异源核酸表达盒表达能够将甜菊糖苷转运至细胞外空间或转运至细胞内细胞器的腔空间的ABC转运蛋白。在一些实施方案,所述宿主细胞进一步包含一种或多种异源核苷酸序列,所述一种或多种异源核苷酸序列编码能够在所述宿主细胞中生成一种或多种甜菊糖苷的途径的其他酶。本发明所述的宿主细胞、组合物和方法提供了异源生成甜菊糖苷(包括但不限于,瑞鲍迪苷D和瑞鲍迪苷M)的有效途径。
Description
1.相关申请的交叉引用
本申请要求并享有于2019年1月24日提交的、发明名称为“ABC TRANSPORTERS FORTHE HIGH EFFICIENCY PRODUCTION OF REBAUDIOSIDES”的美国临时专利申请序列号62/796,228的优先权,此临时申请的内容在此通过引用完全并入本申请。
2.发明领域
本发明涉及特定的ABC转运蛋白(ABC-transporter)、包含所述ABC转运蛋白的宿主细胞,以及其用于生成甜菊醇和/或瑞鲍迪苷(包括瑞鲍迪苷D和瑞鲍迪苷M)的方法。
3.发明背景
需要源自天然来源的低热量甜味剂来限制高糖消耗对健康的影响。甜叶菊植物(Stevia rebaudiana Bertoni)产生多种甜味的糖基化二萜,称为甜菊糖苷(steviolglycoside)。在所有已知的甜菊糖苷中,Reb M的效力最高(比蔗糖甜约200-300倍),并具有最吸引人的风味特征。然而,Reb M仅由甜叶菊植物少量生成,并且仅占甜菊糖苷总含量的一小部分(<1.0%),因此从甜菊叶中分离Reb M是不切实际的。需要其他获得Reb M的方法。其中一种方法是应用合成生物学来设计微生物(例如,酵母),其可从可持续原料来源生成大量Reb M。
为了使用合成生物技术经济地生成产品,从原料到产品的生物转化中的每个步骤均需具有高转化效率(理想情况下>90%)。在我们对酵母进行工程改造以生成RebM时,我们注意到Reb M的细胞溶质积聚抑制了工程化到酵母中的甜菊糖苷代谢途径,从而限制了发酵运行的总产量。此种抑制可能是由于参与甜菊糖苷生物合成的一种或多种酶的产物抑制或终产物抑制所致。因此,需要减轻产物抑制的新机制,以提高生物合成Reb M生成量的转化效率。
4.发明摘要
本发明提供了用于改进Reb M的生成量的经遗传修饰的宿主细胞、组合物和方法。所述这些组合物和方法部分基于某些异源ABC转运蛋白在宿主细胞中的表达,所述宿主细胞经遗传修饰以生成甜菊糖苷类化合物,例如Reb M。所述这些ABC转运蛋白能够将某些甜菊糖苷,优选Reb M和/或相关的高分子量甜菊糖苷瑞鲍迪苷D(Reb D),从胞质溶胶转运至细胞外空间或转运至亚细胞器的腔内,例如酵母液泡。某些甜菊糖苷(如Reb D和Reb M)的螯合可通过减轻由甜菊糖苷积聚引起的产物抑制来提高甜菊糖苷代谢途径的效率。
在本发明的一个方面,本发明提供了经遗传修饰的宿主细胞及其用于生成工业上有用的化合物的方法。一方面,本发明提供了能够生成一种或多种甜菊糖苷(steviolglycoside)的经遗传修饰的宿主细胞,其中所述宿主细胞包含编码ABC转运蛋白的异源核酸,所述ABC转运蛋白具有与选自由下列组成的组的氨基酸序列具有至少80%序列同一性的氨基酸序列:SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:28、SEQ ID NO:29、和SEQ ID NO:30。
在本发明的一个实施方案中,所述ABC转运蛋白具有氨基酸序列,所述氨基酸序列具有选自由下列组成的组的序列:SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:28、SEQ ID NO:29、和SEQ ID NO:30。在另一实施方案,本发明的所述经遗传修饰的宿主细胞包含核酸,所述核酸编码香叶基香叶基焦磷酸合酶(GGPPS)、内根-柯巴基焦磷酸合酶(ent-copalylpyrophosphate synthase,CPS)、内根-贝壳杉烯合酶(ent-kaurene synthase,KS)、内根-贝壳杉烯19-氧化酶(ent-kaurene 19-oxidase,KO)、内根-异贝壳杉烯酸13-羟化酶(ent-kaurenoic acid 13-hydroxylase,KAH)、细胞色素p450还原酶(CPR)、以及一种或多种UDP-葡萄糖基转移酶(UGT)。在进一步的实施方案,所述一种或多种UDP-葡萄糖基转移酶(UGT)选自EUGT11、UGT85C2、UGT74G1、UGT91D_like3、UGT76G1、和UGT40087。在本发明的另一实施方案中,所述香叶基香叶基焦磷酸合酶(GGPPS)具有与SEQ ID NO:9具有至少80%序列同一性的氨基酸序列,所述内根-柯巴基焦磷酸合酶(CPS)具有与SEQ ID NO:10具有至少80%序列同一性的氨基酸序列,所述内根-贝壳杉烯合酶(KS)具有与SEQ ID NO:11具有至少80%序列同一性的氨基酸序列,所述内根-贝壳杉烯19-氧化酶(KO)具有与SEQ ID NO:12具有至少80%序列同一性的氨基酸序列,所述内根-异贝壳杉烯酸13-羟化酶(KAH)具有与SEQ IDNO:13具有至少80%序列同一性的氨基酸序列,所述细胞色素p450还原酶(CPR)具有与SEQID NO:14具有至少80%序列同一性的氨基酸序列,和所述一种或多种UDP-葡萄糖基转移酶(UGT)具有与选自由下列组成的组的氨基酸序列具有至少80%序列同一性的氨基酸序列:SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:27。
在本发明的特定实施方案中,所述香叶基香叶基焦磷酸合酶(GGPPS)具有SEQ IDNO:9的氨基酸序列,所述内根-柯巴基焦磷酸合酶(CPS)具有SEQ ID NO:10的氨基酸序列,所述内根-贝壳杉烯合酶(KS)具有SEQ ID NO:11的氨基酸序列,所述内根-贝壳杉烯19-氧化酶(KO)包含SEQ ID NO:12的氨基酸序列,所述内根-异贝壳杉烯酸13-羟化酶(KAH)包含SEQ ID NO:13的氨基酸序列,所述细胞色素p450还原酶(CPR)包含SEQ ID NO:14的氨基酸序列,和所述一种或多种UDP-葡萄糖基转移酶(UGT)包含选自由下列组成的组的氨基酸序列:SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ IDNO:27。
在实施方案中,所述宿主细胞选自细菌细胞、真菌细胞、藻类细胞、昆虫细胞和植物细胞。在另一实施方案,所述宿主细胞是酿酒酵母(Saccharomyces cerevisiae)细胞。
在本发明的实施方案中,所述ABC转运蛋白具有氨基酸序列,所述氨基酸序列具有SEQ ID NO:1的所述序列。
在另一实施方案,所述ABC转运蛋白具有氨基酸序列,所述氨基酸序列具有SEQ IDNO:2的所述序列。
在进一步的实施方案,所述ABC转运蛋白具有氨基酸序列,所述氨基酸序列具有SEQ ID NO:3的所述序列。
又在另一实施方案,所述ABC转运蛋白具有氨基酸序列,所述氨基酸序列具有SEQID NO:4的所述序列。
在附加实施方案,所述ABC转运蛋白具有氨基酸序列,所述氨基酸序列具有SEQ IDNO:5的所述序列。
在实施方案中,所述ABC转运蛋白具有氨基酸序列,所述氨基酸序列具有SEQ IDNO:6的所述序列。
在另一实施方案,所述ABC转运蛋白具有氨基酸序列,所述氨基酸序列具有SEQ IDNO:7的所述序列。
又在另一实施方案,所述ABC转运蛋白具有氨基酸序列,所述氨基酸序列具有SEQID NO:8的所述序列。
又在另一实施方案,所述ABC转运蛋白具有氨基酸序列,所述氨基酸序列具有SEQID NO:28的所述序列。
又在另一实施方案,所述ABC转运蛋白具有氨基酸序列,所述氨基酸序列具有SEQID NO:29的所述序列。
又在另一实施方案,所述ABC转运蛋白具有氨基酸序列,所述氨基酸序列具有SEQID NO:30的所述序列。
在本发明的实施方案中,所述一种或多种甜菊糖苷选自瑞鲍迪苷A(Reb A)、瑞鲍迪苷B(Reb B)、Reb D、瑞鲍迪苷E(Reb E)、或Reb M。在另一实施方案,所述一种或多种甜菊糖苷包含Reb M。
在一个实施方案,大部分所述一种或多种甜菊糖苷积聚在细胞器的腔内。在另一实施方案,大部分所述一种或多种甜菊糖苷积聚在细胞外。
另一方面,本发明提供了表达ABC转运蛋白的异源核酸表达盒的核酸序列。在实施方案中,所述异源核酸表达盒的所述核苷酸序列具有SEQ ID NO:20、SEQ ID NO:21、SEQ IDNO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、或SEQ ID NO:27的编码序列,其中所述编码序列可操作地连接至异源启动子。
另一方面,本发明提供了生成甜菊醇或一种或多种甜菊糖苷的方法,其包含:在适于制备甜菊醇或一种或多种甜菊糖苷的条件下,在含有碳源的培养基中培养本发明所述的宿主细胞的种群以生成培养液(culture broth);和从所述培养液回收所述甜菊醇或一种或多种甜菊糖苷。
另一方面,本发明提供了生成Reb D的方法,其包含:在适于制备Reb D的条件下,在含有碳源的培养基中培养本发明所述的宿主细胞的种群以生成培养液;和从所述培养液回收所述Reb D化合物。
另一方面,本发明提供了生成Reb M的方法,其包含:在适于制备Reb M的条件下,在含有碳源的培养基中培养本发明所述的宿主细胞的种群以生成培养液;和从所述培养液回收所述Reb M化合物。
5.附图简要说明
图1是示出从天然酵母代谢物法呢基焦磷酸(FPP)到甜菊醇的酶促途径的示意图。
图2是示出从甜菊醇到瑞鲍迪苷M的酶促途径的示意图。
图3是用于将转运蛋白插入Reb M菌株的着陆垫(landing pad)DNA构建体的示意图。构建体的每一端均包含来自酵母SFM1基因下游的500bp DNA序列,以促进此基因座处的同源重组。在此基因座处插入着陆垫不会删除任何基因。着陆垫包含全长GAL1启动子,然后是F-CphI核酸内切酶的识别位点及来自原生酵母基因HEM13的终止子。
图4是上清液中存在的Reb D+Reb M的百分比图表。具有不同过表达转运蛋白的酵母菌株均在微量滴定板中生长。此图报告了去除细胞后在上清液中检测到的Reb D+Reb M(以微摩尔为单位)的百分比。亲本菌株不包含过表达的转运蛋白。将上清液中测得的Reb D+Reb M的量除以全细胞培养液中测得的Reb D+Reb M的量,得到上清液中Reb D+Reb M的百分比。
图5是全细胞培养液中总甜菊糖苷相对于亲本的图表。具有不同过表达转运蛋白的酵母菌株均在微量滴定板中生长。此图报告了相对于亲本菌株,在全细胞培养液(细胞和上清液)中检测到的所有甜菊糖苷(以微摩尔为单位)的总和。亲本菌株不包含过表达的转运蛋白。
图6是全细胞培养液中Reb D+Reb M的量相对于亲本的图表。具有不同过表达转运蛋白的酵母菌株均在微量滴定板中生长。此图报告了相对于亲本菌株,在全细胞培养液(细胞和上清液)中检测到的Reb D+Reb M(以微摩尔为单位)的总和。亲本菌株不包含过表达的转运蛋白。
图7是上清液中总甜菊糖苷相对于亲本的图表。具有不同过表达转运蛋白的酵母菌株均在微量滴定板中生长。此图报告了相对于亲本菌株,在去除细胞后在上清液中检测到的所有甜菊糖苷(以微摩尔为单位)的总和。亲本菌株不包含过表达的转运蛋白。
图8示出了所生成的所有甜菊糖苷位于上清液中的百分比。具有不同过表达转运蛋白的酵母菌株均在微量滴定板中生长。此图报告了在上清液中检测到的由细胞生成的所有甜菊糖苷的百分比(以微摩尔为单位)。将上清液中测得的总甜菊糖苷的量除以全细胞培养液中测得的总甜菊糖苷的量,得到上清液中总甜菊糖苷的百分比。
图9是全细胞培养液中Reb D+Reb M的量相对于亲本的图表。表达GFP标记及未标记版本的BPT1和T4_Fungal_5转运蛋白的酵母菌株均在微量滴定板中生长。比较了GFP标记及未标记版本的转运蛋白的相对活性。数据表明,转运蛋白的GFP标记版本与未标记版本的行为相似。
图10是一组表达GFP标记的BPT1的酵母的明场(A)和荧光(B)图像的显微照片。
图11是一组表达GFP标记的T4_Fungal_5转运蛋白的酵母的明场(A)和荧光(B)图像的显微照片。
图12是全细胞培养液中Reb M的量相对于具有野生型T4_Fungal_5的亲本的图表。经由易错PCR及选择得到的表达转运蛋白T4_Fungal_5及其变体(分离株_1-8(Isolate_1–8))的酵母菌株均在微量滴定板中生长。此图报告了相对于未诱变的T4_Fungal_5,在表达经诱变的T4_Fungal_5转运蛋白变体(分离株_1-8)的酵母菌株的全细胞培养液(细胞和上清液)中检测到的Reb M滴度(以微摩尔为单位)。数据表明,与T4_Fungal_5相比,分离株_1-8的表达使得酵母菌株的Reb M生成量提高。
图13是全细胞培养液中总甜菊糖苷的Reb M比例相对于具有野生型T4_Fungal_5的亲本的图表。经由易错PCR及选择得到的表达转运蛋白T4_Fungal_5及其变体(分离株_1-8(Isolate_1–8))的酵母菌株均在微量滴定板中生长。此图报告了相对于未诱变的T4_Fungal_5,在表达经诱变的T4_Fungal_5转运蛋白变体(分离株_1-8)的酵母菌株的全细胞培养液(细胞和上清液)中检测到的Reb M与所有甜菊糖苷总和的比率(以微摩尔为单位)。数据表明,与T4_Fungal_5转运蛋白相比,分离株_1-8的表达使得所有甜菊糖苷中Reb M的占比增加。换言之,分离株_1-8显示出对Reb M的底物偏好增加。
图14是由表达T4_Fungal_5或Fungal_5_muA转运蛋白的菌株生成的全细胞培养液和上清液级分中Reb M的量的图表。在PGAL3(强度低于PGAL1)的控制下表达T4_Fungal_5或Fungal_5_muA的酵母菌株均在微量滴定板中生长。此图报告了在酵母菌株的全细胞培养液(细胞和上清液)及上清液级分中检测到的Reb M滴度(以微摩尔为单位)。数据证实,当在酵母菌株中表达时,Fungal_5_muA确实赋予了改进的性能:当两种转运蛋白均在较低的启动子强度下表达时,具有Fungal_5_muA的菌株比具有野生型T4_Fungal_5的菌株在全细胞培养液中生成多30%的Reb M以及多40%的细胞外Reb M。
图15是全细胞培养液中Reb M的量相对于具有Fungal_5_muA的亲本的图表。表达转运蛋白Fungal_5_muA及其8个变体的酵母菌株均在微量滴定板中生长,其中1、2或3个突变回复为野生型T4_Fungal_5序列。此图报告了在表达相对于Fungal_5_muA的8个Fungal_5_muA变体的酵母菌株的全细胞培养液(细胞和上清液)中检测到的Reb M滴度(以微摩尔为单位)。数据证明了不同突变对Reb M生成量的影响,尤其有趣的是E1320V回复的有益作用。
图16是全细胞培养液中总甜菊糖苷相对于具有Fungal_5_muA的亲本的图表。表达转运蛋白Fungal_5_muA及其8个变体的酵母菌株均在微量滴定板中生长,其中1、2或3个突变回复为野生型T4_Fungal_5序列。此图报告了在表达相对于Fungal_5_muA的8个Fungal_5_muA变体的酵母菌株的全细胞培养液(细胞和上清液)中检测到的所有甜菊糖苷的总和(以微摩尔为单位)。数据证明了不同突变对TSG生成量的影响。结合图15,其不仅说明了活性差异,还说明了底物偏好。
6.具体实施方式
6.1术语定义
本发明使用的术语“异源的/异源性/异源”是指通常在自然界中不存在的物质。术语“异源核苷酸序列”是指自然界中在给定细胞中通常不存在的核苷酸序列。因此,异源核苷酸序列可以是:(a)相对于其宿主细胞是外源的(即,对所述细胞而言是“外源的”);(b)天然存在于所述宿主细胞中(即“内源性/內源的/內源”),但在所述细胞中以非天然量存在(即,比所述宿主细胞中天然存在的量更多或更少);或(c)天然存在于所述宿主细胞中,但位于其天然基因座之外。
另一方面,本发明使用的术语“原生的/天然的(native)”或“内源的/内源性/內源”涉及分子,特别是酶和核酸,表示在它们起源或在自然界中发现的生物体中表达的分子。应理解,原生酶或原生多核苷酸的表达可在重组微生物中进行修饰。
本发明使用的术语“异源核酸表达盒(cassette)”是指包含编码序列的核酸序列,所述编码序列可操作地连接至足以在宿主细胞中表达所述编码序列的一个或多个调节元件。在实施方案中,“ABC转运蛋白表达盒”是指异源核酸表达盒,其中所述异源核酸包含ABC转运蛋白多肽的所述编码序列。调节元件的非限制性实例包括启动子、增强子、沉默子、终止子和多聚腺苷酸加尾(poly-A)信号。
本发明使用的术语“ABC转运蛋白”和“ATP结合盒转运蛋白”是指膜相关多肽的超家族,其将三磷酸腺苷(ATP)水解与各种底物跨生物膜的易位偶联。
本发明使用的术语“CEN.PK.BPT1”是指ABC转运蛋白,其具有以下氨基酸序列(SEQID NO:1):
MSSLEVVDGCPYGYRPYPDSGTNALNPCFISVISAWQAVFFLLIGSYQLWKLYKNNKVPPRFKNFPTLPSKINSRHLTHLTNVCFQSTLIICELALVSQSSDRVYPFILKKALYLNLLFNLGISLPTQYLAYFKSTFSMGNQLFYYMFQILLQLFLILQRYYHGSSNERLTVISGQTAMILEVLLLFNSVAIFIYDLCIFEPINELSEYYKKNGWYPPVHVLSYITFIWMNKLIVETYRNKKIKDPNQLPLPPVDLNIKSISKEFKANWELEKWLNRNSLWRAIWKSFGRTISVAMLYETTSDLLSVVQPQFLRIFIDGLNPETSSKYPPLNGVFIALTLFVISVVSVFLTNQFYIGIFEAGLGIRGSLASLVYQKSLRLTLAERNEKSTGDILNLMSVDVLRIQRFFENAQTIIGAPIQIIVVLTSLYWLLGKAVIGGLVTMAIMMPINAFLSRKVKKLSKTQMKYKDMRIKTITELLNAIKSIKLYAWEEPMMARLNHVRNDMELKNFRKIGIVSNLIYFAWNCVPLMVTCSTFGLFSLFSDSPLSPAIVFPSLSLFNILNSAIYSVPSMINTIIETSVSMERLKSFLLSDEIDDSFIERIDPSADERALPAIEMNNITFLWKSKEVLTSSQSGDNLRTDEESIIGSSQIALKNIDHFEAKRGDLVCVVGRVGAGKSTFLKAILGQLPCMSGSRDSIPPKLIIRSSSVAYCSQESWIMNASVRENILFGHKFDQDYYDLTIKACQLLPDLKILPDGDETLVGEKGISLSGGQKARLSLARAVYSRADIYLLDDILSAVDAEVSKNIIEYVLIGKTALLKNKTIILTTNTVSILKHSQMIYALENGEIVEQGNYEDVMNRKNNTSKLKKLLEEFDSPIDNGNESDVQTEHRSESEVDEPLQLKVTESETEDEVVTESELELIKANSRRASLATLRPRPFVGAQLDSVKKTAQKAEKTEVGRVKTKIYLAYIKACGVLGVVLFFLFMILTRVFDLAENFWLKYWSESNEKNGSNERVWMFVGVYSLIGVASAAFNNLRSIMMLLYCSIRGSKKLHESMAKSVIRSPMTFFETTPVGRIINRFSSDMDAVDSNLQYIFSFFFKSILTYLVTVILVGYNMPWFLVFNMFLVVIYIYYQTFYIVLSRELKRLISISYSPIMSLMSESLNGYSIIDAYDHFERFIYLNYEKIQYNVDFVFNFRSTNRWLSVRLQTIGATIVLATAILALATMNTKRQLSSGMVGLLMSYSLEVTGSLTWIVRTTVTIETNIVSVERIVEYCELPPEAQSINPEKRPDENWPSKGGIEFKNYSTKYRENLDPVLNNINVKIEPCEKVGIVGRTGAGKSTLSLALFRILEPTEGKIIIDGIDISDIGLFDLRSHLAIIPQDAQAFEGTVKTNLDPFNRYSEDELKRAVEQAHLKPHLEKMLHSKPRGDDSNEEDGNVNDILDVKINENGSNLSVGQRQLLCLARALLNRSKILVLDEATASVDMETDKIIQDTIRREFKDRTILTIAHRIDTVLDSDKIIVLDQGSVREFDSPSKLLSDKTSIFYSLCEKGGYLK*;并由以下核酸序列(SEQ ID NO:20)编码:
ATGTCTTCACTAGAAGTGGTAGATGGGTGCCCCTATGGATACCGACCATATCCAGATAGTGGCACAAATGCATTAAATCCATGTTTTATATCAGTAATATCCGCCTGGCAAGCCGTCTTTTTCCTATTGATTGGTAGCTATCAATTGTGGAAACTTTATAAGAACAATAAAGTACCACCCAGATTTAAGAACTTTCCTACATTACCAAGTAAAATCAACAGTCGACATCTAACGCATTTGACCAATGTTTGCTTTCAGTCCACGCTTATAATTTGTGAACTGGCCTTGGTATCCCAATCTAGCGATAGGGTTTATCCATTTATACTAAAGAAGGCTCTGTACTTGAATCTCCTTTTCAATTTGGGTATTTCTCTCCCTACTCAATACTTAGCTTATTTTAAAAGTACATTTTCAATGGGCAACCAGCTTTTCTATTACATGTTTCAAATTCTTCTACAGCTCTTCTTGATATTGCAGAGGTACTATCATGGTTCTAGTAACGAAAGGCTTACTGTTATTAGCGGACAAACTGCTATGATTTTAGAAGTGCTCCTTCTTTTCAATTCTGTGGCAATTTTTATTTATGATCTATGCATTTTTGAGCCAATTAACGAATTATCTGAATACTACAAGAAAAATGGGTGGTATCCCCCCGTTCATGTACTATCCTATATTACATTTATCTGGATGAACAAACTGATTGTGGAAACTTACCGTAACAAGAAAATCAAAGATCCTAACCAGTTACCATTGCCGCCAGTAGATCTGAATATTAAGTCGATAAGTAAGGAATTTAAGGCTAACTGGGAATTGGAAAAATGGTTGAATAGAAATTCTCTTTGGAGGGCCATTTGGAAGTCATTTGGTAGGACTATTTCTGTGGCTATGCTGTATGAAACGACATCTGATTTACTTTCTGTAGTACAGCCCCAGTTTCTACGGATATTCATAGATGGTTTGAACCCGGAAACATCTTCTAAATATCCTCCTTTAAATGGTGTATTTATTGCTCTAACCCTTTTCGTAATCAGCGTGGTTTCTGTGTTCCTCACCAATCAATTTTATATTGGAATTTTTGAGGCTGGTTTGGGGATAAGAGGCTCTTTAGCTTCTTTAGTGTATCAGAAGTCCTTAAGATTGACGCTAGCAGAGCGTAACGAAAAATCTACTGGTGACATCTTAAATTTGATGTCTGTGGATGTGTTAAGGATCCAGCGGTTTTTCGAAAATGCCCAAACCATTATTGGCGCTCCTATTCAGATTATTGTTGTATTAACTTCCCTGTACTGGTTGCTAGGAAAGGCTGTTATTGGAGGGTTGGTTACTATGGCTATTATGATGCCTATCAATGCCTTCTTATCTAGAAAGGTAAAAAAGCTATCAAAAACTCAAATGAAGTATAAGGACATGAGAATCAAGACTATTACAGAGCTTTTGAATGCTATAAAATCTATTAAATTATACGCCTGGGAGGAACCTATGATGGCAAGATTGAATCATGTTCGTAATGATATGGAGTTGAAAAATTTTCGGAAAATTGGTATAGTGAGCAATCTGATATATTTTGCGTGGAATTGTGTACCTTTAATGGTGACATGTTCCACATTTGGCTTATTTTCTTTATTTAGTGATTCTCCGTTATCTCCTGCCATTGTCTTCCCTTCATTATCTTTATTTAATATTTTGAACAGTGCCATCTATTCCGTTCCATCCATGATAAATACCATTATAGAGACAAGCGTTTCTATGGAAAGATTAAAGTCATTCCTACTTAGTGACGAAATTGATGATTCGTTCATCGAACGTATTGATCCTTCAGCGGATGAAAGAGCGTTACCTGCTATAGAGATGAATAATATTACATTTTTATGGAAATCAAAAGAAGTATTAACATCTAGCCAATCTGGAGATAATTTGAGGACAGATGAAGAGTCTATTATCGGATCTTCTCAAATTGCGTTGAAGAATATCGATCATTTTGAAGCAAAAAGGGGTGATTTAGTTTGTGTTGTTGGTCGGGTAGGAGCTGGTAAATCAACATTTTTGAAGGCAATTCTTGGTCAACTTCCTTGCATGAGTGGTTCTAGGGACTCGATACCACCTAAACTGATCATTAGATCATCGTCTGTAGCCTACTGTTCACAAGAATCCTGGATAATGAACGCATCTGTAAGAGAAAACATTCTATTTGGTCACAAGTTCGACCAAGATTATTATGACCTCACTATTAAAGCATGTCAATTGCTACCCGATTTGAAAATACTACCAGATGGTGATGAAACTTTGGTAGGTGAAAAGGGCATTTCCCTATCAGGCGGTCAGAAGGCCCGTCTTTCATTAGCCAGAGCGGTGTACTCGAGAGCAGATATTTATTTGTTGGATGACATTTTATCTGCTGTTGATGCAGAAGTTAGTAAAAATATTATTGAATATGTTTTGATCGGAAAGACGGCTTTATTAAAAAATAAAACAATTATTTTAACTACCAATACTGTATCAATTTTAAAACATTCGCAGATGATATATGCGCTAGAAAACGGTGAAATTGTTGAACAAGGGAATTATGAGGATGTAATGAACCGTAAGAACAATACTTCAAAACTGAAAAAATTACTAGAGGAATTTGATTCTCCGATTGATAATGGAAATGAAAGCGATGTCCAAACTGAACACCGATCCGAAAGTGAAGTGGATGAACCTCTGCAGCTTAAAGTAACTGAATCAGAAACTGAGGATGAGGTTGTTACTGAGAGTGAATTAGAACTAATCAAAGCCAATTCTAGAAGAGCTTCTCTAGCTACGCTAAGACCTAGACCCTTTGTGGGAGCACAATTGGATTCCGTGAAGAAAACGGCGCAAAAGGCCGAGAAGACAGAGGTGGGAAGAGTCAAAACAAAGATTTATCTTGCGTATATTAAGGCTTGTGGAGTTTTAGGTGTTGTTTTATTTTTCTTGTTTATGATATTAACAAGGGTTTTCGACTTAGCAGAGAATTTTTGGTTAAAGTACTGGTCAGAATCTAATGAAAAAAATGGTTCAAATGAAAGGGTTTGGATGTTTGTTGGTGTGTATTCCTTAATCGGAGTAGCATCGGCCGCATTCAATAATTTACGGAGTATTATGATGCTACTGTATTGTTCTATTAGGGGTTCTAAGAAACTGCATGAAAGCATGGCCAAATCTGTAATTAGAAGTCCTATGACTTTCTTTGAGACTACACCAGTTGGAAGGATCATAAACAGGTTCTCATCTGATATGGATGCAGTGGACAGTAATCTACAGTACATTTTCTCCTTTTTTTTCAAATCAATACTAACCTATTTGGTTACTGTTATATTAGTCGGGTACAATATGCCATGGTTTTTAGTGTTCAATATGTTTTTGGTGGTTATCTATATTTACTATCAAACATTTTACATTGTGCTATCTAGGGAGCTAAAAAGATTGATCAGTATATCTTACTCTCCGATTATGTCCTTAATGAGTGAGAGCTTGAACGGTTATTCTATTATTGATGCATACGATCATTTTGAGAGATTCATCTATCTAAATTATGAAAAAATCCAATACAACGTTGATTTTGTCTTCAACTTTAGATCAACGAATAGATGGTTATCCGTGAGATTGCAAACTATTGGTGCTACAATTGTTTTGGCTACTGCAATCTTAGCACTAGCAACAATGAATACTAAAAGGCAACTAAGTTCGGGTATGGTTGGTCTACTAATGAGCTATTCATTAGAGGTTACAGGTTCATTGACTTGGATTGTAAGGACAACTGTGACGATTGAAACCAACATTGTATCAGTGGAGAGAATTGTTGAGTACTGCGAATTACCACCTGAAGCACAGTCCATTAACCCTGAAAAGAGGCCAGATGAAAATTGGCCATCAAAGGGTGGTATTGAATTCAAAAACTATTCCACAAAATACAGAGAAAATTTGGATCCAGTGCTGAATAATATTAACGTGAAGATTGAGCCATGTGAAAAGGTTGGGATTGTTGGCAGAACAGGTGCAGGGAAGTCTACACTGAGCCTGGCATTATTTAGAATACTAGAACCTACCGAAGGTAAAATTATTATTGACGGCATTGATATATCCGACATAGGTCTGTTCGATTTAAGAAGCCATTTGGCAATTATTCCTCAGGATGCACAAGCTTTTGAAGGTACAGTAAAGACCAATTTGGACCCTTTCAATCGTTATTCAGAAGATGAACTTAAAAGGGCTGTTGAGCAGGCACATTTAAAGCCTCATCTGGAAAAAATGCTGCACAGTAAACCAAGAGGTGATGATTCTAATGAAGAGGATGGCAATGTTAATGATATTCTGGATGTCAAGATTAATGAGAACGGTAGTAACTTGTCAGTGGGGCAAAGACAACTACTATGTTTGGCAAGAGCGCTGCTAAACCGTTCCAAAATATTGGTCCTTGATGAAGCAACGGCTTCTGTGGATATGGAAACCGATAAAATTATCCAAGACACTATAAGAAGAGAATTTAAGGACCGTACCATCTTAACAATTGCACATCGTATCGACACTGTATTGGACAGTGATAAGATAATTGTTCTTGACCAGGGTAGTGTGAGGGAATTCGATTCACCCTCGAAATTGTTATCCGATAAAACGTCTATTTTTTACAGTCTTTGTGAGAAAGGTGGGTATTTGAAATAA。
本发明使用的术语“T4_Fungal_1”是指ABC转运蛋白,其具有以下氨基酸序列(SEQID NO:2):MSLELSNSTLCDSYWAVDDFTACGRQLVESWVSVPLVLSALVVAFNLLRNSLASEKTDPYSKLDAEQQPLLQNGHALYTSSIESDNTDIFQRHFDIALLKPVKDDGKPIGVVRIVYRDTAEKLKVALEEILLISQTVLAFLALSRLEDISESRFLLVKYINFSLWLYLTVITSARLLNVTKGFSANRVDLWYHCAILYNLQWFNSVMLFRSALLHHVSGTYGYWFYVTQFVINTLLCLTNGLEKLSDKPAIVYEEEGVIPSPETTSSLIDIMTYGYLDKMVFSSYWKPITMEEVWGLRYDDYSHDVLIRFHKLKSSIRFTLRLFLQFKKELALQTLCTCIEALLIFVPPLCLKKILEYIESPHTKSRSMAWFYVLIMFGSGVIACSFSGRGLFLGRRICTRMRSILIGEIYSKALRRRLGSTDKEKTTEEEDDKSAKSKKEDEPSNKELGGIINLMAVDAFKVSEIGGYLHYFPNSFVMAAVAIYMLYKLLGWSSLIGTATLIAILPINYMLVEKLSKYQKQMLLVTDKRIQKTNEAFQNIRIIKYFAWEDKFADTIMKIREEELGYLVGRCVVWALLIFLWLVVPTIVTLITFYAYTVIQGNPLTSPIAFTALSLFTLLRGPLDALADMLSMVMQCKVSLDRVEDFLNEPETTKYQQLSAPRGPNSPLIGFENATFYWSKNSKAEFALKDLNIDFKVGKLNVVIGPTGSGKSSLLLALLGEMDLDKGNVFLPGAIPRDDLTPNPVTGLMESVAYCSQTAWLLNATVKDNIIFASPFNQERYDAVIHACGLTRDLSILEAGDETEIGEKGITLSGGQKQRVSLARALYSSASYLLLDDCLSAVDSHTAVHIYDYCINGELMKGRTCILVSHNVSLTVKEADFVVMMDNGRIKAQGSVDELMQEGLLNEEVVKSVMQSRSASTANLAALDDNSPISSEAIAEGLAKKTQKPEQSKKSKLIEDETKSDGSVKPEIYYAYFRYFGNPALWIMIAFLFIGSQSVNVYQSYWLRRWSAIEDKRDLSAFSNSNDMTLFLFPTFHSINWHRPLVNYALQPFGLAVEERSTMYYITIYTLIGLAFATLGSSRVILTFIGGLNVSRKIFKDLLDKLLHAKLRFFDQTPIGRIMNRFSKDIEAIDQELALYAEEFVTYLISCLSTLVVVCAVTPAFLVAGVLILLVYYGVGVLYLELSRDLKRFESITKSPIHQHFSETLVGMTTIRAYGDERRFLKQNFEKIDVNNRPFWYVWVNNRWLAYRSDMIGAFIIFFAAAFAVAYSDKIDAGLAGISLSFSVSFRYTAVWVVRMYAYVEMSMNSVERVQEYIEQTPQEPPKYLPQDPVNSWPSNGVIDVQNICIRYSPELPRVIDNVSFHVNAGEKIGVVGRTGAGKSTIITSFFRFVDLESGSIKIDGLDISKIGLKPLRKGLTIIPQDPTLFSGTIRSNLDIFGEYGDLQMFEALRRVNLISVDDYQRIVDGNGAAVADETAQARGDNVNKFLDLDSTVSEGGGNLSQGERQLLCLARSILKMPKILMLDEATASIDYESDAKIQATIREEFSSSTVLTIAHRLKTIIDYDKILLLDHGKVKEYDHPYKLITNKKSDFRKMCQDTGEFDDLVNLAKQAYRK*;并由以下核酸序列(SEQ ID NO:21)编码:
ATGTCTTCACTAGAAGTGGTAGATGGGTGCCCCTATGGATACCGACCATATCCAGATAGTGGCACAAATGCATTAAATCCATGTTTTATATCAGTAATATCCGCCTGGCAAGCCGTCTTTTTCCTATTGATTGGTAGCTATCAATTGTGGAAACTTTATAAGAACAATAAAGTACCACCCAGATTTAAGAACTTTCCTACATTACCAAGTAAAATCAACAGTCGACATCTAACGCATTTGACCAATGTTTGCTTTCAGTCCACGCTTATAATTTGTGAACTGGCCTTGGTATCCCAATCTAGCGATAGGGTTTATCCATTTATACTAAAGAAGGCTCTGTACTTGAATCTCCTTTTCAATTTGGGTATTTCTCTCCCTACTCAATACTTAGCTTATTTTAAAAGTACATTTTCAATGGGCAACCAGCTTTTCTATTACATGTTTCAAATTCTTCTACAGCTCTTCTTGATATTGCAGAGGTACTATCATGGTTCTAGTAACGAAAGGCTTACTGTTATTAGCGGACAAACTGCTATGATTTTAGAAGTGCTCCTTCTTTTCAATTCTGTGGCAATTTTTATTTATGATCTATGCATTTTTGAGCCAATTAACGAATTATCTGAATACTACAAGAAAAATGGGTGGTATCCCCCCGTTCATGTACTATCCTATATTACATTTATCTGGATGAACAAACTGATTGTGGAAACTTACCGTAACAAGAAAATCAAAGATCCTAACCAGTTACCATTGCCGCCAGTAGATCTGAATATTAAGTCGATAAGTAAGGAATTTAAGGCTAACTGGGAATTGGAAAAATGGTTGAATAGAAATTCTCTTTGGAGGGCCATTTGGAAGTCATTTGGTAGGACTATTTCTGTGGCTATGCTGTATGAAACGACATCTGATTTACTTTCTGTAGTACAGCCCCAGTTTCTACGGATATTCATAGATGGTTTGAACCCGGAAACATCTTCTAAATATCCTCCTTTAAATGGTGTATTTATTGCTCTAACCCTTTTCGTAATCAGCGTGGTTTCTGTGTTCCTCACCAATCAATTTTATATTGGAATTTTTGAGGCTGGTTTGGGGATAAGAGGCTCTTTAGCTTCTTTAGTGTATCAGAAGTCCTTAAGATTGACGCTAGCAGAGCGTAACGAAAAATCTACTGGTGACATCTTAAATTTGATGTCTGTGGATGTGTTAAGGATCCAGCGGTTTTTCGAAAATGCCCAAACCATTATTGGCGCTCCTATTCAGATTATTGTTGTATTAACTTCCCTGTACTGGTTGCTAGGAAAGGCTGTTATTGGAGGGTTGGTTACTATGGCTATTATGATGCCTATCAATGCCTTCTTATCTAGAAAGGTAAAAAAGCTATCAAAAACTCAAATGAAGTATAAGGACATGAGAATCAAGACTATTACAGAGCTTTTGAATGCTATAAAATCTATTAAATTATACGCCTGGGAGGAACCTATGATGGCAAGATTGAATCATGTTCGTAATGATATGGAGTTGAAAAATTTTCGGAAAATTGGTATAGTGAGCAATCTGATATATTTTGCGTGGAATTGTGTACCTTTAATGGTGACATGTTCCACATTTGGCTTATTTTCTTTATTTAGTGATTCTCCGTTATCTCCTGCCATTGTCTTCCCTTCATTATCTTTATTTAATATTTTGAACAGTGCCATCTATTCCGTTCCATCCATGATAAATACCATTATAGAGACAAGCGTTTCTATGGAAAGATTAAAGTCATTCCTACTTAGTGACGAAATTGATGATTCGTTCATCGAACGTATTGATCCTTCAGCGGATGAAAGAGCGTTACCTGCTATAGAGATGAATAATATTACATTTTTATGGAAATCAAAAGAAGTATTAACATCTAGCCAATCTGGAGATAATTTGAGGACAGATGAAGAGTCTATTATCGGATCTTCTCAAATTGCGTTGAAGAATATCGATCATTTTGAAGCAAAAAGGGGTGATTTAGTTTGTGTTGTTGGTCGGGTAGGAGCTGGTAAATCAACATTTTTGAAGGCAATTCTTGGTCAACTTCCTTGCATGAGTGGTTCTAGGGACTCGATACCACCTAAACTGATCATTAGATCATCGTCTGTAGCCTACTGTTCACAAGAATCCTGGATAATGAACGCATCTGTAAGAGAAAACATTCTATTTGGTCACAAGTTCGACCAAGATTATTATGACCTCACTATTAAAGCATGTCAATTGCTACCCGATTTGAAAATACTACCAGATGGTGATGAAACTTTGGTAGGTGAAAAGGGCATTTCCCTATCAGGCGGTCAGAAGGCCCGTCTTTCATTAGCCAGAGCGGTGTACTCGAGAGCAGATATTTATTTGTTGGATGACATTTTATCTGCTGTTGATGCAGAAGTTAGTAAAAATATTATTGAATATGTTTTGATCGGAAAGACGGCTTTATTAAAAAATAAAACAATTATTTTAACTACCAATACTGTATCAATTTTAAAACATTCGCAGATGATATATGCGCTAGAAAACGGTGAAATTGTTGAACAAGGGAATTATGAGGATGTAATGAACCGTAAGAACAATACTTCAAAACTGAAAAAATTACTAGAGGAATTTGATTCTCCGATTGATAATGGAAATGAAAGCGATGTCCAAACTGAACACCGATCCGAAAGTGAAGTGGATGAACCTCTGCAGCTTAAAGTAACTGAATCAGAAACTGAGGATGAGGTTGTTACTGAGAGTGAATTAGAACTAATCAAAGCCAATTCTAGAAGAGCTTCTCTAGCTACGCTAAGACCTAGACCCTTTGTGGGAGCACAATTGGATTCCGTGAAGAAAACGGCGCAAAAGGCCGAGAAGACAGAGGTGGGAAGAGTCAAAACAAAGATTTATCTTGCGTATATTAAGGCTTGTGGAGTTTTAGGTGTTGTTTTATTTTTCTTGTTTATGATATTAACAAGGGTTTTCGACTTAGCAGAGAATTTTTGGTTAAAGTACTGGTCAGAATCTAATGAAAAAAATGGTTCAAATGAAAGGGTTTGGATGTTTGTTGGTGTGTATTCCTTAATCGGAGTAGCATCGGCCGCATTCAATAATTTACGGAGTATTATGATGCTACTGTATTGTTCTATTAGGGGTTCTAAGAAACTGCATGAAAGCATGGCCAAATCTGTAATTAGAAGTCCTATGACTTTCTTTGAGACTACACCAGTTGGAAGGATCATAAACAGGTTCTCATCTGATATGGATGCAGTGGACAGTAATCTACAGTACATTTTCTCCTTTTTTTTCAAATCAATACTAACCTATTTGGTTACTGTTATATTAGTCGGGTACAATATGCCATGGTTTTTAGTGTTCAATATGTTTTTGGTGGTTATCTATATTTACTATCAAACATTTTACATTGTGCTATCTAGGGAGCTAAAAAGATTGATCAGTATATCTTACTCTCCGATTATGTCCTTAATGAGTGAGAGCTTGAACGGTTATTCTATTATTGATGCATACGATCATTTTGAGAGATTCATCTATCTAAATTATGAAAAAATCCAATACAACGTTGATTTTGTCTTCAACTTTAGATCAACGAATAGATGGTTATCCGTGAGATTGCAAACTATTGGTGCTACAATTGTTTTGGCTACTGCAATCTTAGCACTAGCAACAATGAATACTAAAAGGCAACTAAGTTCGGGTATGGTTGGTCTACTAATGAGCTATTCATTAGAGGTTACAGGTTCATTGACTTGGATTGTAAGGACAACTGTGACGATTGAAACCAACATTGTATCAGTGGAGAGAATTGTTGAGTACTGCGAATTACCACCTGAAGCACAGTCCATTAACCCTGAAAAGAGGCCAGATGAAAATTGGCCATCAAAGGGTGGTATTGAATTCAAAAACTATTCCACAAAATACAGAGAAAATTTGGATCCAGTGCTGAATAATATTAACGTGAAGATTGAGCCATGTGAAAAGGTTGGGATTGTTGGCAGAACAGGTGCAGGGAAGTCTACACTGAGCCTGGCATTATTTAGAATACTAGAACCTACCGAAGGTAAAATTATTATTGACGGCATTGATATATCCGACATAGGTCTGTTCGATTTAAGAAGCCATTTGGCAATTATTCCTCAGGATGCACAAGCTTTTGAAGGTACAGTAAAGACCAATTTGGACCCTTTCAATCGTTATTCAGAAGATGAACTTAAAAGGGCTGTTGAGCAGGCACATTTAAAGCCTCATCTGGAAAAAATGCTGCACAGTAAACCAAGAGGTGATGATTCTAATGAAGAGGATGGCAATGTTAATGATATTCTGGATGTCAAGATTAATGAGAACGGTAGTAACTTGTCAGTGGGGCAAAGACAACTACTATGTTTGGCAAGAGCGCTGCTAAACCGTTCCAAAATATTGGTCCTTGATGAAGCAACGGCTTCTGTGGATATGGAAACCGATAAAATTATCCAAGACACTATAAGAAGAGAATTTAAGGACCGTACCATCTTAACAATTGCACATCGTATCGACACTGTATTGGACAGTGATAAGATAATTGTTCTTGACCAGGGTAGTGTGAGGGAATTCGATTCACCCTCGAAATTGTTATCCGATAAAACGTCTATTTTTTACAGTCTTTGTGAGAAAGGTGGGTATTTGAAATAA。
本发明使用的术语“T4_Fungal_10”是指ABC转运蛋白,其具有以下氨基酸序列(SEQ ID NO:3):
MGQSERAALIAFASRNTTECWLCRDKEGFGPISYYGDFTVCFIDGVLLNFAALFMLIFGTYQVVKLSKKEHPGIKYRRDWLLFSRITLVGCFLLFTSMAAYYSSEKHESIALTSQYTLTLMSIFVALMLHWVEYHRSRISNGIVLFYWLFETLFQGSKWVNFSIRHAYNLNHEWPVSYSVYILTIFQTISAFMILILEAGFEKPLPSYQRVIESYSKQKRNPVDNSHIFQRLSFSWMTELMKTGYKKYLTEQDLYKLPKSFGAKEISHKFSERWQYQLKHKANPSLAWALLSTFGGKILLGGIFKVAYDILQFTQPQLLRILIKFVSDYTSTPEPQLPLVRGVMLSIAMFVVSVVQTSILHQYFLNAFDTGMHIKSGMTSVIYQKALVLSSEASASSSTGDIVNLMSVDVQRLQDLTQWGQIIWSGPFQIILCLVSLYKLLGPCMWVGVIIMIIMIPINSVIVRIQKKLQKIQMKNKDERTRVTSEILNNIKSLKVYGWEIPYKAKLDHVRNDKELKNLKKMGCTLALASFQFNIVPFLVSCSTFAVFVFTEDRPLSTDLVFPALTLFNLLSFPLAVVPNAISSFIEASVSVNRLYAFLTNEELQTDAVHREPKVNNIGDEGVKVSDATFLWQRKPEYKVALKNINFSAKKGELTCIVGKVGSGKSALIQSLLGDLIRVKGYAAVHGSVAYVSQVAWIMNGTVKDNIIFGHKYDPEFYELTIKACALAIDLSMLPDGDQTLVGEKGISLSGGQKARLSLARAVYARADTYLLDDPLAAVDEHVAKHLIEHVLGPHGLLHSKTKVLATNKISVLSIADSITLMENGEIIQQGTYEETNNTTDSPLSKLISEFGKKGKATPSQSTTSLTKLATSDLGSSSDSKVSDVSIDVSQLDTENLTEAEELKSLRRASMATLGSIGFDDDENIARREHREQGKVKWDIYMEYARACNPRSVCVFLFFIVLSMLLSVLGNFWLKHWSEVNTGEGYNPHAARYLLIYFALGVGSALATLIQTIVLWVFCTIHGSRYLHDAMATSVLKAPMSFFETTPIGRILNRFSNDIYKVDEVLGRTFSQFFANVVKVSFTIIVICMATWQFIFIILPLSVLYIYYQQYYLRTSRELRRLDSVTRSPIYAHFQETLGGLTTIRGYSQQTRFVHINQTRVDNNMSAFYPSVNANRWLAFRLEFIGSIIILGSSMLAVIRLGNGTLTAGMIGLSLSFALQITQSLNWIVRMTVEVETNIVSVERIKEYAELKSEAPYIIEDHRPPASWPEKGDVKFVNYSTRYRPELELILKDINLHILPKEKIGIVGRTGAGKSSLTLALFRIIEAASGHIIIDGIPIDSIGLADLRHRLSIIPQDSQIFEGTIRENIDPSKQYTDEQIWDALELSHLKNHVKNMGPDGLETMLSEGGGNLSVGQRQLMCLARALLISSKILVLDEATAAVDVETDQLIQKTIREAFKERTILTIAHRINTIMDSDRIIVLDKGRVTEFDTPANLLNKKDSIFYSLCVEAGLAE*;并由以下核酸序列(SEQ ID NO:22)编码:
ATGTCTTCACTAGAAGTGGTAGATGGGTGCCCCTATGGATACCGACCATATCCAGATAGTGGCACAAATGCATTAAATCCATGTTTTATATCAGTAATATCCGCCTGGCAAGCCGTCTTTTTCCTATTGATTGGTAGCTATCAATTGTGGAAACTTTATAAGAACAATAAAGTACCACCCAGATTTAAGAACTTTCCTACATTACCAAGTAAAATCAACAGTCGACATCTAACGCATTTGACCAATGTTTGCTTTCAGTCCACGCTTATAATTTGTGAACTGGCCTTGGTATCCCAATCTAGCGATAGGGTTTATCCATTTATACTAAAGAAGGCTCTGTACTTGAATCTCCTTTTCAATTTGGGTATTTCTCTCCCTACTCAATACTTAGCTTATTTTAAAAGTACATTTTCAATGGGCAACCAGCTTTTCTATTACATGTTTCAAATTCTTCTACAGCTCTTCTTGATATTGCAGAGGTACTATCATGGTTCTAGTAACGAAAGGCTTACTGTTATTAGCGGACAAACTGCTATGATTTTAGAAGTGCTCCTTCTTTTCAATTCTGTGGCAATTTTTATTTATGATCTATGCATTTTTGAGCCAATTAACGAATTATCTGAATACTACAAGAAAAATGGGTGGTATCCCCCCGTTCATGTACTATCCTATATTACATTTATCTGGATGAACAAACTGATTGTGGAAACTTACCGTAACAAGAAAATCAAAGATCCTAACCAGTTACCATTGCCGCCAGTAGATCTGAATATTAAGTCGATAAGTAAGGAATTTAAGGCTAACTGGGAATTGGAAAAATGGTTGAATAGAAATTCTCTTTGGAGGGCCATTTGGAAGTCATTTGGTAGGACTATTTCTGTGGCTATGCTGTATGAAACGACATCTGATTTACTTTCTGTAGTACAGCCCCAGTTTCTACGGATATTCATAGATGGTTTGAACCCGGAAACATCTTCTAAATATCCTCCTTTAAATGGTGTATTTATTGCTCTAACCCTTTTCGTAATCAGCGTGGTTTCTGTGTTCCTCACCAATCAATTTTATATTGGAATTTTTGAGGCTGGTTTGGGGATAAGAGGCTCTTTAGCTTCTTTAGTGTATCAGAAGTCCTTAAGATTGACGCTAGCAGAGCGTAACGAAAAATCTACTGGTGACATCTTAAATTTGATGTCTGTGGATGTGTTAAGGATCCAGCGGTTTTTCGAAAATGCCCAAACCATTATTGGCGCTCCTATTCAGATTATTGTTGTATTAACTTCCCTGTACTGGTTGCTAGGAAAGGCTGTTATTGGAGGGTTGGTTACTATGGCTATTATGATGCCTATCAATGCCTTCTTATCTAGAAAGGTAAAAAAGCTATCAAAAACTCAAATGAAGTATAAGGACATGAGAATCAAGACTATTACAGAGCTTTTGAATGCTATAAAATCTATTAAATTATACGCCTGGGAGGAACCTATGATGGCAAGATTGAATCATGTTCGTAATGATATGGAGTTGAAAAATTTTCGGAAAATTGGTATAGTGAGCAATCTGATATATTTTGCGTGGAATTGTGTACCTTTAATGGTGACATGTTCCACATTTGGCTTATTTTCTTTATTTAGTGATTCTCCGTTATCTCCTGCCATTGTCTTCCCTTCATTATCTTTATTTAATATTTTGAACAGTGCCATCTATTCCGTTCCATCCATGATAAATACCATTATAGAGACAAGCGTTTCTATGGAAAGATTAAAGTCATTCCTACTTAGTGACGAAATTGATGATTCGTTCATCGAACGTATTGATCCTTCAGCGGATGAAAGAGCGTTACCTGCTATAGAGATGAATAATATTACATTTTTATGGAAATCAAAAGAAGTATTAACATCTAGCCAATCTGGAGATAATTTGAGGACAGATGAAGAGTCTATTATCGGATCTTCTCAAATTGCGTTGAAGAATATCGATCATTTTGAAGCAAAAAGGGGTGATTTAGTTTGTGTTGTTGGTCGGGTAGGAGCTGGTAAATCAACATTTTTGAAGGCAATTCTTGGTCAACTTCCTTGCATGAGTGGTTCTAGGGACTCGATACCACCTAAACTGATCATTAGATCATCGTCTGTAGCCTACTGTTCACAAGAATCCTGGATAATGAACGCATCTGTAAGAGAAAACATTCTATTTGGTCACAAGTTCGACCAAGATTATTATGACCTCACTATTAAAGCATGTCAATTGCTACCCGATTTGAAAATACTACCAGATGGTGATGAAACTTTGGTAGGTGAAAAGGGCATTTCCCTATCAGGCGGTCAGAAGGCCCGTCTTTCATTAGCCAGAGCGGTGTACTCGAGAGCAGATATTTATTTGTTGGATGACATTTTATCTGCTGTTGATGCAGAAGTTAGTAAAAATATTATTGAATATGTTTTGATCGGAAAGACGGCTTTATTAAAAAATAAAACAATTATTTTAACTACCAATACTGTATCAATTTTAAAACATTCGCAGATGATATATGCGCTAGAAAACGGTGAAATTGTTGAACAAGGGAATTATGAGGATGTAATGAACCGTAAGAACAATACTTCAAAACTGAAAAAATTACTAGAGGAATTTGATTCTCCGATTGATAATGGAAATGAAAGCGATGTCCAAACTGAACACCGATCCGAAAGTGAAGTGGATGAACCTCTGCAGCTTAAAGTAACTGAATCAGAAACTGAGGATGAGGTTGTTACTGAGAGTGAATTAGAACTAATCAAAGCCAATTCTAGAAGAGCTTCTCTAGCTACGCTAAGACCTAGACCCTTTGTGGGAGCACAATTGGATTCCGTGAAGAAAACGGCGCAAAAGGCCGAGAAGACAGAGGTGGGAAGAGTCAAAACAAAGATTTATCTTGCGTATATTAAGGCTTGTGGAGTTTTAGGTGTTGTTTTATTTTTCTTGTTTATGATATTAACAAGGGTTTTCGACTTAGCAGAGAATTTTTGGTTAAAGTACTGGTCAGAATCTAATGAAAAAAATGGTTCAAATGAAAGGGTTTGGATGTTTGTTGGTGTGTATTCCTTAATCGGAGTAGCATCGGCCGCATTCAATAATTTACGGAGTATTATGATGCTACTGTATTGTTCTATTAGGGGTTCTAAGAAACTGCATGAAAGCATGGCCAAATCTGTAATTAGAAGTCCTATGACTTTCTTTGAGACTACACCAGTTGGAAGGATCATAAACAGGTTCTCATCTGATATGGATGCAGTGGACAGTAATCTACAGTACATTTTCTCCTTTTTTTTCAAATCAATACTAACCTATTTGGTTACTGTTATATTAGTCGGGTACAATATGCCATGGTTTTTAGTGTTCAATATGTTTTTGGTGGTTATCTATATTTACTATCAAACATTTTACATTGTGCTATCTAGGGAGCTAAAAAGATTGATCAGTATATCTTACTCTCCGATTATGTCCTTAATGAGTGAGAGCTTGAACGGTTATTCTATTATTGATGCATACGATCATTTTGAGAGATTCATCTATCTAAATTATGAAAAAATCCAATACAACGTTGATTTTGTCTTCAACTTTAGATCAACGAATAGATGGTTATCCGTGAGATTGCAAACTATTGGTGCTACAATTGTTTTGGCTACTGCAATCTTAGCACTAGCAACAATGAATACTAAAAGGCAACTAAGTTCGGGTATGGTTGGTCTACTAATGAGCTATTCATTAGAGGTTACAGGTTCATTGACTTGGATTGTAAGGACAACTGTGACGATTGAAACCAACATTGTATCAGTGGAGAGAATTGTTGAGTACTGCGAATTACCACCTGAAGCACAGTCCATTAACCCTGAAAAGAGGCCAGATGAAAATTGGCCATCAAAGGGTGGTATTGAATTCAAAAACTATTCCACAAAATACAGAGAAAATTTGGATCCAGTGCTGAATAATATTAACGTGAAGATTGAGCCATGTGAAAAGGTTGGGATTGTTGGCAGAACAGGTGCAGGGAAGTCTACACTGAGCCTGGCATTATTTAGAATACTAGAACCTACCGAAGGTAAAATTATTATTGACGGCATTGATATATCCGACATAGGTCTGTTCGATTTAAGAAGCCATTTGGCAATTATTCCTCAGGATGCACAAGCTTTTGAAGGTACAGTAAAGACCAATTTGGACCCTTTCAATCGTTATTCAGAAGATGAACTTAAAAGGGCTGTTGAGCAGGCACATTTAAAGCCTCATCTGGAAAAAATGCTGCACAGTAAACCAAGAGGTGATGATTCTAATGAAGAGGATGGCAATGTTAATGATATTCTGGATGTCAAGATTAATGAGAACGGTAGTAACTTGTCAGTGGGGCAAAGACAACTACTATGTTTGGCAAGAGCGCTGCTAAACCGTTCCAAAATATTGGTCCTTGATGAAGCAACGGCTTCTGTGGATATGGAAACCGATAAAATTATCCAAGACACTATAAGAAGAGAATTTAAGGACCGTACCATCTTAACAATTGCACATCGTATCGACACTGTATTGGACAGTGATAAGATAATTGTTCTTGACCAGGGTAGTGTGAGGGAATTCGATTCACCCTCGAAATTGTTATCCGATAAAACGTCTATTTTTTACAGTCTTTGTGAGAAAGGTGGGTATTTGAAATAA。
本发明使用的术语“T4_Fungal_2”是指ABC转运蛋白,其具有以下氨基酸序列(SEQID NO:4):MSSLEVVDGCPYGYRPYPDSGTNALNPCFISVISAWQAVFFLLIGSYQLWKLYKNNKVPPRFKNFPTLPSKINSRHLTHLTNVCFQSTLIICELALVSQSSDRVYPFILKKALYLNLLFNLGISLPTQYLAYFKSTFSMGNQLFYYMFQILLQLFLILQRYYHGSSNERLTVISGQTAMILEVLLLFNSVAIFIYDLCIFEPINELSEYYKKNGWYPPVHVLSYITFIWMNKLIVETYRNKKIKDPNQLPLPPVDLNIKSISKEFKANWELEKWLNRNSLWRAIWKSFGRTISVAMLYETTSDLLSVVQPQFLRIFIDGFNPETSSKYPPLNGVFIALTLFVISVVSVFLTNQFYIGIFEAGLGIRGSLASLVYQKSLRLTLAERNEKSTGDILNLMSVDVLRIQRFFENAQTIIGAPIQIIVVLTSLYWLLGKAVVGGLVTMAIMMPINAFLSRKVKKLSKTQMKYKDMRIKTITELLNAIKSIKLYAWEEPMMARLNHVRNDMELKNFRKIGIVSNLIYFAWNCVPLMVTCSTFGLFSLFSDSPLSPAIVFPSLSLFNILNSAIYSVPSMINTIIETSVSMERLKSFLLSDEIDDSFIERIDPSADERALPAIEMNNITFLWKSKEVLASSQSGDNLRTDEESIIGSSQIALKNIDHFEAKRGDLVCVVGRVGAGKSTFLKAILGQLPCMSGSRDSIPPKLIIRSSSVAYCSQESWIMNASVRENILFGHKFDQNYYDLTIKACQLLPDLKILPDGDETLVGEKGISLSGGQKARLSLARAVYSRADIYLLDDILSAVDAEVSKNIIEYVLIGKTALLKNKTIILTTNTVSILKHSQMIYALENGEIVEQGNYEDVMNRKNNTSKLKKLLEEFDSPIDNGNESDVQTEHRSESEVDEPLQLKVTESETEDEVVTESELELIKANSRRASLATLRPRPFVGAQLDSVKKTAQEAEKTEVGRVKTKVYLAYIKACGVLGVVLFFLFMILTRVFDLAENFWLKYWSESNEKNGSNERVWMFVGVYSLIGVASAAFNNLRSIMMLLYCSIRGSKKLHESMAKSVIRSPMTFFETTPVGRIINRFSSDMDAVDSNLQYIFSFFFKSILTYLVTVILVGYNMPWFLVFNMFLVVIYIYYQTFYIVLSRELKRLISISYSPIMSLMSESLNGYSIIDAYDHFERFIYLNYEKIQYNVDFVFNFRSTNRWLSVRLQTIGATIVLATAILALATMNTKRQLSSGMVGLLMSYSLEVTGSLTWIVRTTVMIETNIVSVERIVEYCELPPEAQSINPEKRPDENWPSKGGIEFKNYSTKYRENLDPVLNNINVKIEPCEKVGIVGRTGAGKSTLSLALFRILEPTEGKIIIDGIGISDIGLFDLRSHLAIIPQDAQAFEGTVKTNLDPFNRYSEDELKRAVEQAHLKPHLEKMLHSKPRGDDSNEEDGNVNDILDVKINENGSNLSVGQRQLLCLARALLNRSKILVLDEATASVDMETDKIIQDTIRREFKDRTILTIAHRIDTVLDSDKIIVLDQGSVREFDSPSKLLSDKTSIFYSLCEKGGYLK*;并由以下核酸序列(SEQ ID NO:23)编码:
ATGTCTTCACTAGAAGTGGTAGATGGGTGCCCCTATGGATACCGACCATATCCAGATAGTGGCACAAATGCATTAAATCCATGTTTTATATCAGTAATATCCGCCTGGCAAGCCGTCTTTTTCCTATTGATTGGTAGCTATCAATTGTGGAAACTTTATAAGAACAATAAAGTACCACCCAGATTTAAGAACTTTCCTACATTACCAAGTAAAATCAACAGTCGACATCTAACGCATTTGACCAATGTTTGCTTTCAGTCCACGCTTATAATTTGTGAACTGGCCTTGGTATCCCAATCTAGCGATAGGGTTTATCCATTTATACTAAAGAAGGCTCTGTACTTGAATCTCCTTTTCAATTTGGGTATTTCTCTCCCTACTCAATACTTAGCTTATTTTAAAAGTACATTTTCAATGGGCAACCAGCTTTTCTATTACATGTTTCAAATTCTTCTACAGCTCTTCTTGATATTGCAGAGGTACTATCATGGTTCTAGTAACGAAAGGCTTACTGTTATTAGCGGACAAACTGCTATGATTTTAGAAGTGCTCCTTCTTTTCAATTCTGTGGCAATTTTTATTTATGATCTATGCATTTTTGAGCCAATTAACGAATTATCTGAATACTACAAGAAAAATGGGTGGTATCCCCCCGTTCATGTACTATCCTATATTACATTTATCTGGATGAACAAACTGATTGTGGAAACTTACCGTAACAAGAAAATCAAAGATCCTAACCAGTTACCATTGCCGCCAGTAGATCTGAATATTAAGTCGATAAGTAAGGAATTTAAGGCTAACTGGGAATTGGAAAAATGGTTGAATAGAAATTCTCTTTGGAGGGCCATTTGGAAGTCATTTGGTAGGACTATTTCTGTGGCTATGCTGTATGAAACGACATCTGATTTACTTTCTGTAGTACAGCCCCAGTTTCTACGGATATTCATAGATGGTTTGAACCCGGAAACATCTTCTAAATATCCTCCTTTAAATGGTGTATTTATTGCTCTAACCCTTTTCGTAATCAGCGTGGTTTCTGTGTTCCTCACCAATCAATTTTATATTGGAATTTTTGAGGCTGGTTTGGGGATAAGAGGCTCTTTAGCTTCTTTAGTGTATCAGAAGTCCTTAAGATTGACGCTAGCAGAGCGTAACGAAAAATCTACTGGTGACATCTTAAATTTGATGTCTGTGGATGTGTTAAGGATCCAGCGGTTTTTCGAAAATGCCCAAACCATTATTGGCGCTCCTATTCAGATTATTGTTGTATTAACTTCCCTGTACTGGTTGCTAGGAAAGGCTGTTATTGGAGGGTTGGTTACTATGGCTATTATGATGCCTATCAATGCCTTCTTATCTAGAAAGGTAAAAAAGCTATCAAAAACTCAAATGAAGTATAAGGACATGAGAATCAAGACTATTACAGAGCTTTTGAATGCTATAAAATCTATTAAATTATACGCCTGGGAGGAACCTATGATGGCAAGATTGAATCATGTTCGTAATGATATGGAGTTGAAAAATTTTCGGAAAATTGGTATAGTGAGCAATCTGATATATTTTGCGTGGAATTGTGTACCTTTAATGGTGACATGTTCCACATTTGGCTTATTTTCTTTATTTAGTGATTCTCCGTTATCTCCTGCCATTGTCTTCCCTTCATTATCTTTATTTAATATTTTGAACAGTGCCATCTATTCCGTTCCATCCATGATAAATACCATTATAGAGACAAGCGTTTCTATGGAAAGATTAAAGTCATTCCTACTTAGTGACGAAATTGATGATTCGTTCATCGAACGTATTGATCCTTCAGCGGATGAAAGAGCGTTACCTGCTATAGAGATGAATAATATTACATTTTTATGGAAATCAAAAGAAGTATTAACATCTAGCCAATCTGGAGATAATTTGAGGACAGATGAAGAGTCTATTATCGGATCTTCTCAAATTGCGTTGAAGAATATCGATCATTTTGAAGCAAAAAGGGGTGATTTAGTTTGTGTTGTTGGTCGGGTAGGAGCTGGTAAATCAACATTTTTGAAGGCAATTCTTGGTCAACTTCCTTGCATGAGTGGTTCTAGGGACTCGATACCACCTAAACTGATCATTAGATCATCGTCTGTAGCCTACTGTTCACAAGAATCCTGGATAATGAACGCATCTGTAAGAGAAAACATTCTATTTGGTCACAAGTTCGACCAAGATTATTATGACCTCACTATTAAAGCATGTCAATTGCTACCCGATTTGAAAATACTACCAGATGGTGATGAAACTTTGGTAGGTGAAAAGGGCATTTCCCTATCAGGCGGTCAGAAGGCCCGTCTTTCATTAGCCAGAGCGGTGTACTCGAGAGCAGATATTTATTTGTTGGATGACATTTTATCTGCTGTTGATGCAGAAGTTAGTAAAAATATTATTGAATATGTTTTGATCGGAAAGACGGCTTTATTAAAAAATAAAACAATTATTTTAACTACCAATACTGTATCAATTTTAAAACATTCGCAGATGATATATGCGCTAGAAAACGGTGAAATTGTTGAACAAGGGAATTATGAGGATGTAATGAACCGTAAGAACAATACTTCAAAACTGAAAAAATTACTAGAGGAATTTGATTCTCCGATTGATAATGGAAATGAAAGCGATGTCCAAACTGAACACCGATCCGAAAGTGAAGTGGATGAACCTCTGCAGCTTAAAGTAACTGAATCAGAAACTGAGGATGAGGTTGTTACTGAGAGTGAATTAGAACTAATCAAAGCCAATTCTAGAAGAGCTTCTCTAGCTACGCTAAGACCTAGACCCTTTGTGGGAGCACAATTGGATTCCGTGAAGAAAACGGCGCAAAAGGCCGAGAAGACAGAGGTGGGAAGAGTCAAAACAAAGATTTATCTTGCGTATATTAAGGCTTGTGGAGTTTTAGGTGTTGTTTTATTTTTCTTGTTTATGATATTAACAAGGGTTTTCGACTTAGCAGAGAATTTTTGGTTAAAGTACTGGTCAGAATCTAATGAAAAAAATGGTTCAAATGAAAGGGTTTGGATGTTTGTTGGTGTGTATTCCTTAATCGGAGTAGCATCGGCCGCATTCAATAATTTACGGAGTATTATGATGCTACTGTATTGTTCTATTAGGGGTTCTAAGAAACTGCATGAAAGCATGGCCAAATCTGTAATTAGAAGTCCTATGACTTTCTTTGAGACTACACCAGTTGGAAGGATCATAAACAGGTTCTCATCTGATATGGATGCAGTGGACAGTAATCTACAGTACATTTTCTCCTTTTTTTTCAAATCAATACTAACCTATTTGGTTACTGTTATATTAGTCGGGTACAATATGCCATGGTTTTTAGTGTTCAATATGTTTTTGGTGGTTATCTATATTTACTATCAAACATTTTACATTGTGCTATCTAGGGAGCTAAAAAGATTGATCAGTATATCTTACTCTCCGATTATGTCCTTAATGAGTGAGAGCTTGAACGGTTATTCTATTATTGATGCATACGATCATTTTGAGAGATTCATCTATCTAAATTATGAAAAAATCCAATACAACGTTGATTTTGTCTTCAACTTTAGATCAACGAATAGATGGTTATCCGTGAGATTGCAAACTATTGGTGCTACAATTGTTTTGGCTACTGCAATCTTAGCACTAGCAACAATGAATACTAAAAGGCAACTAAGTTCGGGTATGGTTGGTCTACTAATGAGCTATTCATTAGAGGTTACAGGTTCATTGACTTGGATTGTAAGGACAACTGTGACGATTGAAACCAACATTGTATCAGTGGAGAGAATTGTTGAGTACTGCGAATTACCACCTGAAGCACAGTCCATTAACCCTGAAAAGAGGCCAGATGAAAATTGGCCATCAAAGGGTGGTATTGAATTCAAAAACTATTCCACAAAATACAGAGAAAATTTGGATCCAGTGCTGAATAATATTAACGTGAAGATTGAGCCATGTGAAAAGGTTGGGATTGTTGGCAGAACAGGTGCAGGGAAGTCTACACTGAGCCTGGCATTATTTAGAATACTAGAACCTACCGAAGGTAAAATTATTATTGACGGCATTGATATATCCGACATAGGTCTGTTCGATTTAAGAAGCCATTTGGCAATTATTCCTCAGGATGCACAAGCTTTTGAAGGTACAGTAAAGACCAATTTGGACCCTTTCAATCGTTATTCAGAAGATGAACTTAAAAGGGCTGTTGAGCAGGCACATTTAAAGCCTCATCTGGAAAAAATGCTGCACAGTAAACCAAGAGGTGATGATTCTAATGAAGAGGATGGCAATGTTAATGATATTCTGGATGTCAAGATTAATGAGAACGGTAGTAACTTGTCAGTGGGGCAAAGACAACTACTATGTTTGGCAAGAGCGCTGCTAAACCGTTCCAAAATATTGGTCCTTGATGAAGCAACGGCTTCTGTGGATATGGAAACCGATAAAATTATCCAAGACACTATAAGAAGAGAATTTAAGGACCGTACCATCTTAACAATTGCACATCGTATCGACACTGTATTGGACAGTGATAAGATAATTGTTCTTGACCAGGGTAGTGTGAGGGAATTCGATTCACCCTCGAAATTGTTATCCGATAAAACGTCTATTTTTTACAGTCTTTGTGAGAAAGGTGGGTATTTGAAATAA。
本发明使用的术语“T4_Fungal_3”是指ABC转运蛋白,其具有以下氨基酸序列(SEQID NO:5):MNSYNESAPTGCSFWDNDDISPCIRKSLLDSYLPAAIVVGSLLYLLLIGAQQIKTHRKLYAKDETQPLLEPANGSPTDYSNTYGTIDYEEEQSTAELTTSQKHFDISRLEPLKDDGTPLGLVKYVQRDGWEKVKLILEFVILIFQLVIAVVALFVPSLNQEWEGYKLTPIVRVFVWIFLFALGSIRALNKSGPFPLANISLLYYIVNIVPSALSFRSVLIHPQNSQLVNYYYSFQFINNTLLFLLLGSARVFDHPSVLFDTDDGVKPSPENNSNFFEIVTYSWIDPLIFKAYKTPLQFNDIWGLRIDDYAYFLLRRFKDLGFTRTFTYKIFYFSKGDLAAQALWASIDSMLIFGPSLLLKRILEYVDNPGMTSRNMAWLYVLTMFFIQISDSLVSGRSLYLGRRVCIRMKALIIGEVYAKALRRRMTSPEELIEEVDPKDGKAPIADQTSKEESKSTELGGIINLMAVDASKVSELCSYLHFFVNSFFMIIVAVTLLYRLLGWSALAGSSSILILLPLNYKLASKIGEFQKEMLGITDNRIQKLNEAFQSIRIIKFFAWEENFAKEIMKVRNEEIRYLRYRVIVWTCSAFVWFITPTLVTLISFYFYVVFQGKILTTPVAFTALSLFNLLRSPLDQLSDMLSFMVQSKVSLDRVQKFLEEQESDKYEQLTHTRGANSPEVGFENATLSWNKGSKNDFQLKDIDIAFKVGKLNVIIGPTGSGKTSLLLGLLGEMQLTNGKIFLPGSTPRDELIPNPETGMTEAVAYCSQIAWLLNDTVKNNIVFAAPFNQQRYDAVIDACGLTRDLKVLDAGDATEIGEKGITLSGGQKQRVSLARALYSNARHVLLDDCLSAVDSHTAAWIYENCITGPLMKDRTCILVSHNVALTVRDAAWIVAMDNGRVLEQGTCEDLLSSGSLGHDDLVSTVISSRSQSSVNLKQLNVSDTSEIHQKLKKIAESDKADQLDEERLSPRGKLIEDETKSSGAVSWEVYKFYGRAFGGVFIWFVFVAAFAASQGSNIMQSVWLKIWAAANDKLVSPAFTMSIDRSLNALKEGFRASVASVEWSRPLGGEMFRVYGEESSHSSGYYITIYALIGLSYALISAFRVYVVFMGGIVASNKIFEDMLTKIFNAKLRFFDSTPIGRIMNRFSKDTESIDQELAPYAEGFIVSVLQCGATILLICIITPGFIVFAAFIVIIYYYIGALYLASSRELKRYDSITVSPIHQHFSETLVGVTTIRAYGDERRFMRQNLEKIDNNNRSFFYLWVANRWLALRVDFVGALVSLLSAAFVMLSIGHIDAGMAGLSLSYAIAFTQSALWVVRLYSVVEMNMNSVERLEEYLNIDQEPDREIPDNKPPSSWPETGEIEVDDVSLRYAPSLPKVIKNVSFKVEPRSKIGIVGRTGAGKSTIITAFFRFVDPESGSIKIDGIDITSIGLKDLRNAVTIIPQDPTLFTGTIRSNLDPFNQYSDAEIFESLKRVNLVSTDEPTSGSSSDNIEDSNENVNKFLNLNNTVSEGGSNLSQGQRQLTCLARSLLKSPKIILLDEATASIDYNTDSKIQTTIREEFSDSTILTIAHRLRSIIDYDKILVMDAGRVVEYDDPYKLISDQNSLFYSMCSNSGELDTLVKLAKEAFIAKRNKK*;并由以下核酸序列(SEQ IDNO:24)编码:
ATGTCTTCACTAGAAGTGGTAGATGGGTGCCCCTATGGATACCGACCATATCCAGATAGTGGCACAAATGCATTAAATCCATGTTTTATATCAGTAATATCCGCCTGGCAAGCCGTCTTTTTCCTATTGATTGGTAGCTATCAATTGTGGAAACTTTATAAGAACAATAAAGTACCACCCAGATTTAAGAACTTTCCTACATTACCAAGTAAAATCAACAGTCGACATCTAACGCATTTGACCAATGTTTGCTTTCAGTCCACGCTTATAATTTGTGAACTGGCCTTGGTATCCCAATCTAGCGATAGGGTTTATCCATTTATACTAAAGAAGGCTCTGTACTTGAATCTCCTTTTCAATTTGGGTATTTCTCTCCCTACTCAATACTTAGCTTATTTTAAAAGTACATTTTCAATGGGCAACCAGCTTTTCTATTACATGTTTCAAATTCTTCTACAGCTCTTCTTGATATTGCAGAGGTACTATCATGGTTCTAGTAACGAAAGGCTTACTGTTATTAGCGGACAAACTGCTATGATTTTAGAAGTGCTCCTTCTTTTCAATTCTGTGGCAATTTTTATTTATGATCTATGCATTTTTGAGCCAATTAACGAATTATCTGAATACTACAAGAAAAATGGGTGGTATCCCCCCGTTCATGTACTATCCTATATTACATTTATCTGGATGAACAAACTGATTGTGGAAACTTACCGTAACAAGAAAATCAAAGATCCTAACCAGTTACCATTGCCGCCAGTAGATCTGAATATTAAGTCGATAAGTAAGGAATTTAAGGCTAACTGGGAATTGGAAAAATGGTTGAATAGAAATTCTCTTTGGAGGGCCATTTGGAAGTCATTTGGTAGGACTATTTCTGTGGCTATGCTGTATGAAACGACATCTGATTTACTTTCTGTAGTACAGCCCCAGTTTCTACGGATATTCATAGATGGTTTGAACCCGGAAACATCTTCTAAATATCCTCCTTTAAATGGTGTATTTATTGCTCTAACCCTTTTCGTAATCAGCGTGGTTTCTGTGTTCCTCACCAATCAATTTTATATTGGAATTTTTGAGGCTGGTTTGGGGATAAGAGGCTCTTTAGCTTCTTTAGTGTATCAGAAGTCCTTAAGATTGACGCTAGCAGAGCGTAACGAAAAATCTACTGGTGACATCTTAAATTTGATGTCTGTGGATGTGTTAAGGATCCAGCGGTTTTTCGAAAATGCCCAAACCATTATTGGCGCTCCTATTCAGATTATTGTTGTATTAACTTCCCTGTACTGGTTGCTAGGAAAGGCTGTTATTGGAGGGTTGGTTACTATGGCTATTATGATGCCTATCAATGCCTTCTTATCTAGAAAGGTAAAAAAGCTATCAAAAACTCAAATGAAGTATAAGGACATGAGAATCAAGACTATTACAGAGCTTTTGAATGCTATAAAATCTATTAAATTATACGCCTGGGAGGAACCTATGATGGCAAGATTGAATCATGTTCGTAATGATATGGAGTTGAAAAATTTTCGGAAAATTGGTATAGTGAGCAATCTGATATATTTTGCGTGGAATTGTGTACCTTTAATGGTGACATGTTCCACATTTGGCTTATTTTCTTTATTTAGTGATTCTCCGTTATCTCCTGCCATTGTCTTCCCTTCATTATCTTTATTTAATATTTTGAACAGTGCCATCTATTCCGTTCCATCCATGATAAATACCATTATAGAGACAAGCGTTTCTATGGAAAGATTAAAGTCATTCCTACTTAGTGACGAAATTGATGATTCGTTCATCGAACGTATTGATCCTTCAGCGGATGAAAGAGCGTTACCTGCTATAGAGATGAATAATATTACATTTTTATGGAAATCAAAAGAAGTATTAACATCTAGCCAATCTGGAGATAATTTGAGGACAGATGAAGAGTCTATTATCGGATCTTCTCAAATTGCGTTGAAGAATATCGATCATTTTGAAGCAAAAAGGGGTGATTTAGTTTGTGTTGTTGGTCGGGTAGGAGCTGGTAAATCAACATTTTTGAAGGCAATTCTTGGTCAACTTCCTTGCATGAGTGGTTCTAGGGACTCGATACCACCTAAACTGATCATTAGATCATCGTCTGTAGCCTACTGTTCACAAGAATCCTGGATAATGAACGCATCTGTAAGAGAAAACATTCTATTTGGTCACAAGTTCGACCAAGATTATTATGACCTCACTATTAAAGCATGTCAATTGCTACCCGATTTGAAAATACTACCAGATGGTGATGAAACTTTGGTAGGTGAAAAGGGCATTTCCCTATCAGGCGGTCAGAAGGCCCGTCTTTCATTAGCCAGAGCGGTGTACTCGAGAGCAGATATTTATTTGTTGGATGACATTTTATCTGCTGTTGATGCAGAAGTTAGTAAAAATATTATTGAATATGTTTTGATCGGAAAGACGGCTTTATTAAAAAATAAAACAATTATTTTAACTACCAATACTGTATCAATTTTAAAACATTCGCAGATGATATATGCGCTAGAAAACGGTGAAATTGTTGAACAAGGGAATTATGAGGATGTAATGAACCGTAAGAACAATACTTCAAAACTGAAAAAATTACTAGAGGAATTTGATTCTCCGATTGATAATGGAAATGAAAGCGATGTCCAAACTGAACACCGATCCGAAAGTGAAGTGGATGAACCTCTGCAGCTTAAAGTAACTGAATCAGAAACTGAGGATGAGGTTGTTACTGAGAGTGAATTAGAACTAATCAAAGCCAATTCTAGAAGAGCTTCTCTAGCTACGCTAAGACCTAGACCCTTTGTGGGAGCACAATTGGATTCCGTGAAGAAAACGGCGCAAAAGGCCGAGAAGACAGAGGTGGGAAGAGTCAAAACAAAGATTTATCTTGCGTATATTAAGGCTTGTGGAGTTTTAGGTGTTGTTTTATTTTTCTTGTTTATGATATTAACAAGGGTTTTCGACTTAGCAGAGAATTTTTGGTTAAAGTACTGGTCAGAATCTAATGAAAAAAATGGTTCAAATGAAAGGGTTTGGATGTTTGTTGGTGTGTATTCCTTAATCGGAGTAGCATCGGCCGCATTCAATAATTTACGGAGTATTATGATGCTACTGTATTGTTCTATTAGGGGTTCTAAGAAACTGCATGAAAGCATGGCCAAATCTGTAATTAGAAGTCCTATGACTTTCTTTGAGACTACACCAGTTGGAAGGATCATAAACAGGTTCTCATCTGATATGGATGCAGTGGACAGTAATCTACAGTACATTTTCTCCTTTTTTTTCAAATCAATACTAACCTATTTGGTTACTGTTATATTAGTCGGGTACAATATGCCATGGTTTTTAGTGTTCAATATGTTTTTGGTGGTTATCTATATTTACTATCAAACATTTTACATTGTGCTATCTAGGGAGCTAAAAAGATTGATCAGTATATCTTACTCTCCGATTATGTCCTTAATGAGTGAGAGCTTGAACGGTTATTCTATTATTGATGCATACGATCATTTTGAGAGATTCATCTATCTAAATTATGAAAAAATCCAATACAACGTTGATTTTGTCTTCAACTTTAGATCAACGAATAGATGGTTATCCGTGAGATTGCAAACTATTGGTGCTACAATTGTTTTGGCTACTGCAATCTTAGCACTAGCAACAATGAATACTAAAAGGCAACTAAGTTCGGGTATGGTTGGTCTACTAATGAGCTATTCATTAGAGGTTACAGGTTCATTGACTTGGATTGTAAGGACAACTGTGACGATTGAAACCAACATTGTATCAGTGGAGAGAATTGTTGAGTACTGCGAATTACCACCTGAAGCACAGTCCATTAACCCTGAAAAGAGGCCAGATGAAAATTGGCCATCAAAGGGTGGTATTGAATTCAAAAACTATTCCACAAAATACAGAGAAAATTTGGATCCAGTGCTGAATAATATTAACGTGAAGATTGAGCCATGTGAAAAGGTTGGGATTGTTGGCAGAACAGGTGCAGGGAAGTCTACACTGAGCCTGGCATTATTTAGAATACTAGAACCTACCGAAGGTAAAATTATTATTGACGGCATTGATATATCCGACATAGGTCTGTTCGATTTAAGAAGCCATTTGGCAATTATTCCTCAGGATGCACAAGCTTTTGAAGGTACAGTAAAGACCAATTTGGACCCTTTCAATCGTTATTCAGAAGATGAACTTAAAAGGGCTGTTGAGCAGGCACATTTAAAGCCTCATCTGGAAAAAATGCTGCACAGTAAACCAAGAGGTGATGATTCTAATGAAGAGGATGGCAATGTTAATGATATTCTGGATGTCAAGATTAATGAGAACGGTAGTAACTTGTCAGTGGGGCAAAGACAACTACTATGTTTGGCAAGAGCGCTGCTAAACCGTTCCAAAATATTGGTCCTTGATGAAGCAACGGCTTCTGTGGATATGGAAACCGATAAAATTATCCAAGACACTATAAGAAGAGAATTTAAGGACCGTACCATCTTAACAATTGCACATCGTATCGACACTGTATTGGACAGTGATAAGATAATTGTTCTTGACCAGGGTAGTGTGAGGGAATTCGATTCACCCTCGAAATTGTTATCCGATAAAACGTCTATTTTTTACAGTCTTTGTGAGAAAGGTGGGTATTTGAAATAA。
本发明使用的术语“T4_Fungal_4”是指ABC转运蛋白,其具有以下氨基酸序列(SEQID NO:6):MSSLEVVDGCPYGYRPYPDSGTNALNPCFISVISAWQAVFFLLIGSYQLWKLYKNNKVPPRFKNFPTLPSKINSRHLTHLTNVCFQSTLIICELALVSQSSDRVYPFILKKALYLNLLFNLGISLPTQYLAYFKSTFSMGNQLFYYMFQILLQLFLILQRYYHGSSNERLTVISGQTAMILEVLLLFNSVAIFIYDLCIFEPINELSEYYKKNGWYPPVHVLSYITFIWMNKLIVETYRNKKIKDPNQLPLPPVDLNIKSISKEFKANWELEKWLNRNSLWRAIWKSFGRTISVAMLYETTSDLLSVVQPQFLRIFIDGFNPETSSKYPPLNGVFIALTLFVISVVSVFLTNQFYIGIFEAGLGIRGSLASLVYQKSLRLTLAERNEKSTGDILNLMSVDVLRIQRFFENAQTIIGAPIQIIVVLTSLYWLLGKAVIGGLVTMAIMMPINAFLSRKVKKLSKTQMKYKDMRIKTITELLNAIKSIKLYAWEEPMMARLNHVRNDMELKNFRKIGIVSNLIYFAWNCVPLMVTCSTFGLFSLFSDSPLSPAIVFPSLSLFNILNSAIYSVPSMINTIIETSVSMERLKSFLLSDEIDDSFIERIDPSADERALPAIEMNNITFLWKSKEVLASSQSRDNLRTDEESIIGSSQIALKNIDHFEAKRGDLVCVVGRVGAGKSTFLKAILGQLPCMSGSRDSIPPKLIIRSSSVAYCSQESWIMNASVRENILFGHKFDQNYYDLTIKACQLLPDLKILPDGDETLVGEKGISLSGGQKARLSLARAVYSRADIYLLDDILSAVDAEVSKNIIEYVLIGKTALLKNKTIILTTNTVSILKHSQMIYALENGEIVEQGNYEDVMNRKNNTSKLKKLLEEFDSPIDNGNESDVQTEHRSESEVDEPLQLKVTESETEDEVVTESELELIKANSRRASLATLRPRPFVGAQLDSVKKTAQEAEKTEVGRVKTKVYLAYIKACGVLGVVLFFLFMILTRVFDLAENFWLKYWSESNEKNGSNERVWMFVGVYSLIGVASAAFNNLRSIMMLLYCSIRGSKKLHESMAKSVIRSPMTFFETTPVGRIINRFSSDMDAVDSNLQYIFSFFFKSILTYLVTVILVGYNMPWFLVFNMFLVVIYIYYQTFYIVLSRELKRLISISYSPIMSLMSESLNGYSIIDAYDHFERFIYLNYEKIQYNVDFVFNFRSTNRWLSVRLQTIGATIVLATAILALATMNTKRQLSSGMVGLLMSYSLEVTGSLTWIVRTTVMIETNIVSVERIVEYCELPPEAQSINPEKRPDENWPSKGGIEFKNYSTKYRENLDPVLNNINVKIEPCEKVGIVGRTGAGKSTLSLALFRILEPTEGKIIIDGIDISDIGLFDLRSHLAIIPQDAQAFEGTVKTNLDPFNRYSEDELKRAVEQAHLKPHLEKMLHSKPRGDDSNEEDGNVNDILDVKINENGSNLSVGQRQLLCLARALLNRSKILVLDEATASVDMETDKIIQDTIRREFKDRTILTIAHRIDTVLDSDKIIVLDQGSVREFDSPSKLLSDKTSIFYSLCEKGGYLK*;并由以下核酸序列(SEQ ID NO:25)编码:
ATGTCTTCACTAGAAGTGGTAGATGGGTGCCCCTATGGATACCGACCATATCCAGATAGTGGCACAAATGCATTAAATCCATGTTTTATATCAGTAATATCCGCCTGGCAAGCCGTCTTTTTCCTATTGATTGGTAGCTATCAATTGTGGAAACTTTATAAGAACAATAAAGTACCACCCAGATTTAAGAACTTTCCTACATTACCAAGTAAAATCAACAGTCGACATCTAACGCATTTGACCAATGTTTGCTTTCAGTCCACGCTTATAATTTGTGAACTGGCCTTGGTATCCCAATCTAGCGATAGGGTTTATCCATTTATACTAAAGAAGGCTCTGTACTTGAATCTCCTTTTCAATTTGGGTATTTCTCTCCCTACTCAATACTTAGCTTATTTTAAAAGTACATTTTCAATGGGCAACCAGCTTTTCTATTACATGTTTCAAATTCTTCTACAGCTCTTCTTGATATTGCAGAGGTACTATCATGGTTCTAGTAACGAAAGGCTTACTGTTATTAGCGGACAAACTGCTATGATTTTAGAAGTGCTCCTTCTTTTCAATTCTGTGGCAATTTTTATTTATGATCTATGCATTTTTGAGCCAATTAACGAATTATCTGAATACTACAAGAAAAATGGGTGGTATCCCCCCGTTCATGTACTATCCTATATTACATTTATCTGGATGAACAAACTGATTGTGGAAACTTACCGTAACAAGAAAATCAAAGATCCTAACCAGTTACCATTGCCGCCAGTAGATCTGAATATTAAGTCGATAAGTAAGGAATTTAAGGCTAACTGGGAATTGGAAAAATGGTTGAATAGAAATTCTCTTTGGAGGGCCATTTGGAAGTCATTTGGTAGGACTATTTCTGTGGCTATGCTGTATGAAACGACATCTGATTTACTTTCTGTAGTACAGCCCCAGTTTCTACGGATATTCATAGATGGTTTGAACCCGGAAACATCTTCTAAATATCCTCCTTTAAATGGTGTATTTATTGCTCTAACCCTTTTCGTAATCAGCGTGGTTTCTGTGTTCCTCACCAATCAATTTTATATTGGAATTTTTGAGGCTGGTTTGGGGATAAGAGGCTCTTTAGCTTCTTTAGTGTATCAGAAGTCCTTAAGATTGACGCTAGCAGAGCGTAACGAAAAATCTACTGGTGACATCTTAAATTTGATGTCTGTGGATGTGTTAAGGATCCAGCGGTTTTTCGAAAATGCCCAAACCATTATTGGCGCTCCTATTCAGATTATTGTTGTATTAACTTCCCTGTACTGGTTGCTAGGAAAGGCTGTTATTGGAGGGTTGGTTACTATGGCTATTATGATGCCTATCAATGCCTTCTTATCTAGAAAGGTAAAAAAGCTATCAAAAACTCAAATGAAGTATAAGGACATGAGAATCAAGACTATTACAGAGCTTTTGAATGCTATAAAATCTATTAAATTATACGCCTGGGAGGAACCTATGATGGCAAGATTGAATCATGTTCGTAATGATATGGAGTTGAAAAATTTTCGGAAAATTGGTATAGTGAGCAATCTGATATATTTTGCGTGGAATTGTGTACCTTTAATGGTGACATGTTCCACATTTGGCTTATTTTCTTTATTTAGTGATTCTCCGTTATCTCCTGCCATTGTCTTCCCTTCATTATCTTTATTTAATATTTTGAACAGTGCCATCTATTCCGTTCCATCCATGATAAATACCATTATAGAGACAAGCGTTTCTATGGAAAGATTAAAGTCATTCCTACTTAGTGACGAAATTGATGATTCGTTCATCGAACGTATTGATCCTTCAGCGGATGAAAGAGCGTTACCTGCTATAGAGATGAATAATATTACATTTTTATGGAAATCAAAAGAAGTATTAACATCTAGCCAATCTGGAGATAATTTGAGGACAGATGAAGAGTCTATTATCGGATCTTCTCAAATTGCGTTGAAGAATATCGATCATTTTGAAGCAAAAAGGGGTGATTTAGTTTGTGTTGTTGGTCGGGTAGGAGCTGGTAAATCAACATTTTTGAAGGCAATTCTTGGTCAACTTCCTTGCATGAGTGGTTCTAGGGACTCGATACCACCTAAACTGATCATTAGATCATCGTCTGTAGCCTACTGTTCACAAGAATCCTGGATAATGAACGCATCTGTAAGAGAAAACATTCTATTTGGTCACAAGTTCGACCAAGATTATTATGACCTCACTATTAAAGCATGTCAATTGCTACCCGATTTGAAAATACTACCAGATGGTGATGAAACTTTGGTAGGTGAAAAGGGCATTTCCCTATCAGGCGGTCAGAAGGCCCGTCTTTCATTAGCCAGAGCGGTGTACTCGAGAGCAGATATTTATTTGTTGGATGACATTTTATCTGCTGTTGATGCAGAAGTTAGTAAAAATATTATTGAATATGTTTTGATCGGAAAGACGGCTTTATTAAAAAATAAAACAATTATTTTAACTACCAATACTGTATCAATTTTAAAACATTCGCAGATGATATATGCGCTAGAAAACGGTGAAATTGTTGAACAAGGGAATTATGAGGATGTAATGAACCGTAAGAACAATACTTCAAAACTGAAAAAATTACTAGAGGAATTTGATTCTCCGATTGATAATGGAAATGAAAGCGATGTCCAAACTGAACACCGATCCGAAAGTGAAGTGGATGAACCTCTGCAGCTTAAAGTAACTGAATCAGAAACTGAGGATGAGGTTGTTACTGAGAGTGAATTAGAACTAATCAAAGCCAATTCTAGAAGAGCTTCTCTAGCTACGCTAAGACCTAGACCCTTTGTGGGAGCACAATTGGATTCCGTGAAGAAAACGGCGCAAAAGGCCGAGAAGACAGAGGTGGGAAGAGTCAAAACAAAGATTTATCTTGCGTATATTAAGGCTTGTGGAGTTTTAGGTGTTGTTTTATTTTTCTTGTTTATGATATTAACAAGGGTTTTCGACTTAGCAGAGAATTTTTGGTTAAAGTACTGGTCAGAATCTAATGAAAAAAATGGTTCAAATGAAAGGGTTTGGATGTTTGTTGGTGTGTATTCCTTAATCGGAGTAGCATCGGCCGCATTCAATAATTTACGGAGTATTATGATGCTACTGTATTGTTCTATTAGGGGTTCTAAGAAACTGCATGAAAGCATGGCCAAATCTGTAATTAGAAGTCCTATGACTTTCTTTGAGACTACACCAGTTGGAAGGATCATAAACAGGTTCTCATCTGATATGGATGCAGTGGACAGTAATCTACAGTACATTTTCTCCTTTTTTTTCAAATCAATACTAACCTATTTGGTTACTGTTATATTAGTCGGGTACAATATGCCATGGTTTTTAGTGTTCAATATGTTTTTGGTGGTTATCTATATTTACTATCAAACATTTTACATTGTGCTATCTAGGGAGCTAAAAAGATTGATCAGTATATCTTACTCTCCGATTATGTCCTTAATGAGTGAGAGCTTGAACGGTTATTCTATTATTGATGCATACGATCATTTTGAGAGATTCATCTATCTAAATTATGAAAAAATCCAATACAACGTTGATTTTGTCTTCAACTTTAGATCAACGAATAGATGGTTATCCGTGAGATTGCAAACTATTGGTGCTACAATTGTTTTGGCTACTGCAATCTTAGCACTAGCAACAATGAATACTAAAAGGCAACTAAGTTCGGGTATGGTTGGTCTACTAATGAGCTATTCATTAGAGGTTACAGGTTCATTGACTTGGATTGTAAGGACAACTGTGACGATTGAAACCAACATTGTATCAGTGGAGAGAATTGTTGAGTACTGCGAATTACCACCTGAAGCACAGTCCATTAACCCTGAAAAGAGGCCAGATGAAAATTGGCCATCAAAGGGTGGTATTGAATTCAAAAACTATTCCACAAAATACAGAGAAAATTTGGATCCAGTGCTGAATAATATTAACGTGAAGATTGAGCCATGTGAAAAGGTTGGGATTGTTGGCAGAACAGGTGCAGGGAAGTCTACACTGAGCCTGGCATTATTTAGAATACTAGAACCTACCGAAGGTAAAATTATTATTGACGGCATTGATATATCCGACATAGGTCTGTTCGATTTAAGAAGCCATTTGGCAATTATTCCTCAGGATGCACAAGCTTTTGAAGGTACAGTAAAGACCAATTTGGACCCTTTCAATCGTTATTCAGAAGATGAACTTAAAAGGGCTGTTGAGCAGGCACATTTAAAGCCTCATCTGGAAAAAATGCTGCACAGTAAACCAAGAGGTGATGATTCTAATGAAGAGGATGGCAATGTTAATGATATTCTGGATGTCAAGATTAATGAGAACGGTAGTAACTTGTCAGTGGGGCAAAGACAACTACTATGTTTGGCAAGAGCGCTGCTAAACCGTTCCAAAATATTGGTCCTTGATGAAGCAACGGCTTCTGTGGATATGGAAACCGATAAAATTATCCAAGACACTATAAGAAGAGAATTTAAGGACCGTACCATCTTAACAATTGCACATCGTATCGACACTGTATTGGACAGTGATAAGATAATTGTTCTTGACCAGGGTAGTGTGAGGGAATTCGATTCACCCTCGAAATTGTTATCCGATAAAACGTCTATTTTTTACAGTCTTTGTGAGAAAGGTGGGTATTTGAAATAA。
本发明使用的术语“T4_Fungal_5”是指ABC转运蛋白,其具有以下氨基酸序列(SEQID NO:7):MTSPGSEKCTPRSDEDLERSEPQLQRRLLTPFLLSKKVPPIPKEDERKPYPYLKTNPLSQILFWWLNPLLRVGYKRTLDPNDFYYLEHSQDIETTYSNYEMHLARILEKDRAKARAKDPTLTDEDLKNREYPKNAVIKALFLTFKWKYLWSIFLKLLSDIVLVLNPLLSKALINFVDEKMYNPDMSVGRGVGYAIGVTFMLGTSGILINHFLYLSLTVGAHCKAVLTTAIMNKSFRASAKSKHEYPSGRVTSLMSTDLARIDLAIGFQPFAITVPVPIGVAIALLIVNIGVSALAGIAVFLVCIVVISASSKSLLKMRKGANQYTDARISYMREILQNMRIIKFYSWEDAYEKSVVTERNSEMSIILKMQSIRNFLLALSLSLPAIISMVAFLVLYGVSNDKNPGNIFSSISLFSVLAQQTMMLPMALATGADAKIGLERLRQYLQSGDIEKEYEDHEKPGDRDVVLPDNVAVELNNASFIWEKFDDADDNDGNSEKTKEVVVTSKSSLTDSSHIDKSTDSADGEYIKSVFEGFNNINLTIKKGEFVIITGPIGSGKSSLLVALAGFMKKTSGTLGVNGTMLLCGQPWVQNCTVRDNILFGLEYDEARYDRVVEVCALGDDLKMFTAGDQTEIGERGITLSGGQKARINLARAVYANKDIILLDDVLSAVDARVGKLIVDDCLTSFLGDKTRILATHQLSLIEAADRVIYLNGDGTIHIGTVQELLESNEGFLKLMEFSRKSESEDEEDVEAANEKDVSLQKAVSVVQEQDAHAGVLIGQEERAVNGIEWDIYKEYLHEGRGKLGIFAIPTIIMLLVLDVFTSIFVNVWLSFWISHKFKARSDGFYIGLYVMFVILSVIWITAEFVVMGYFSSTAARRLNLKAMKRVLHTPMHFLDVTPMGRILNRFTKDTDVLDNEIGEQARMFLHPAAYVIGVLILCIIYIPWFAIAIPPLAILFTFITNFYIASSREVKRIEAIQRSLVYNNFNEVLNGLQTLKAYNATSRFMEKNKRLLNRMNEAYLLVIANQRWISVNLDLVSCCFVFLISMLSVFRVFDINASSVGLVVTSVLQIGGLMSLIMRAYTTVENEMNSVERLCHYANKLEQEAPYIMNETKPRPTWPEHGAIEFKHASMRYREGLPLVLKDLTISVKGGEKIGICGRTGAGKSTIMNALYRLTELAEGSITIDGVEISQLGLYDLRSKLAIIPQDPVLFRGTIRKNLDPFGQNDDETLWDALRRSGLVEGSILNTIKSQSKDDPNFHKFHLDQTVEDEGANFSLGERQLIALARALVRNSKILILDEATSSVDYETDSKIQKTISTEFSHCTILCIAHRLKTILTYDRILVLEKGEVEEFDTPRVLYSKNGVFRQMCERSEITSADFV*;并由以下核酸序列(SEQ ID NO:26)编码:
ATGTCTTCACTAGAAGTGGTAGATGGGTGCCCCTATGGATACCGACCATATCCAGATAGTGGCACAAATGCATTAAATCCATGTTTTATATCAGTAATATCCGCCTGGCAAGCCGTCTTTTTCCTATTGATTGGTAGCTATCAATTGTGGAAACTTTATAAGAACAATAAAGTACCACCCAGATTTAAGAACTTTCCTACATTACCAAGTAAAATCAACAGTCGACATCTAACGCATTTGACCAATGTTTGCTTTCAGTCCACGCTTATAATTTGTGAACTGGCCTTGGTATCCCAATCTAGCGATAGGGTTTATCCATTTATACTAAAGAAGGCTCTGTACTTGAATCTCCTTTTCAATTTGGGTATTTCTCTCCCTACTCAATACTTAGCTTATTTTAAAAGTACATTTTCAATGGGCAACCAGCTTTTCTATTACATGTTTCAAATTCTTCTACAGCTCTTCTTGATATTGCAGAGGTACTATCATGGTTCTAGTAACGAAAGGCTTACTGTTATTAGCGGACAAACTGCTATGATTTTAGAAGTGCTCCTTCTTTTCAATTCTGTGGCAATTTTTATTTATGATCTATGCATTTTTGAGCCAATTAACGAATTATCTGAATACTACAAGAAAAATGGGTGGTATCCCCCCGTTCATGTACTATCCTATATTACATTTATCTGGATGAACAAACTGATTGTGGAAACTTACCGTAACAAGAAAATCAAAGATCCTAACCAGTTACCATTGCCGCCAGTAGATCTGAATATTAAGTCGATAAGTAAGGAATTTAAGGCTAACTGGGAATTGGAAAAATGGTTGAATAGAAATTCTCTTTGGAGGGCCATTTGGAAGTCATTTGGTAGGACTATTTCTGTGGCTATGCTGTATGAAACGACATCTGATTTACTTTCTGTAGTACAGCCCCAGTTTCTACGGATATTCATAGATGGTTTGAACCCGGAAACATCTTCTAAATATCCTCCTTTAAATGGTGTATTTATTGCTCTAACCCTTTTCGTAATCAGCGTGGTTTCTGTGTTCCTCACCAATCAATTTTATATTGGAATTTTTGAGGCTGGTTTGGGGATAAGAGGCTCTTTAGCTTCTTTAGTGTATCAGAAGTCCTTAAGATTGACGCTAGCAGAGCGTAACGAAAAATCTACTGGTGACATCTTAAATTTGATGTCTGTGGATGTGTTAAGGATCCAGCGGTTTTTCGAAAATGCCCAAACCATTATTGGCGCTCCTATTCAGATTATTGTTGTATTAACTTCCCTGTACTGGTTGCTAGGAAAGGCTGTTATTGGAGGGTTGGTTACTATGGCTATTATGATGCCTATCAATGCCTTCTTATCTAGAAAGGTAAAAAAGCTATCAAAAACTCAAATGAAGTATAAGGACATGAGAATCAAGACTATTACAGAGCTTTTGAATGCTATAAAATCTATTAAATTATACGCCTGGGAGGAACCTATGATGGCAAGATTGAATCATGTTCGTAATGATATGGAGTTGAAAAATTTTCGGAAAATTGGTATAGTGAGCAATCTGATATATTTTGCGTGGAATTGTGTACCTTTAATGGTGACATGTTCCACATTTGGCTTATTTTCTTTATTTAGTGATTCTCCGTTATCTCCTGCCATTGTCTTCCCTTCATTATCTTTATTTAATATTTTGAACAGTGCCATCTATTCCGTTCCATCCATGATAAATACCATTATAGAGACAAGCGTTTCTATGGAAAGATTAAAGTCATTCCTACTTAGTGACGAAATTGATGATTCGTTCATCGAACGTATTGATCCTTCAGCGGATGAAAGAGCGTTACCTGCTATAGAGATGAATAATATTACATTTTTATGGAAATCAAAAGAAGTATTAACATCTAGCCAATCTGGAGATAATTTGAGGACAGATGAAGAGTCTATTATCGGATCTTCTCAAATTGCGTTGAAGAATATCGATCATTTTGAAGCAAAAAGGGGTGATTTAGTTTGTGTTGTTGGTCGGGTAGGAGCTGGTAAATCAACATTTTTGAAGGCAATTCTTGGTCAACTTCCTTGCATGAGTGGTTCTAGGGACTCGATACCACCTAAACTGATCATTAGATCATCGTCTGTAGCCTACTGTTCACAAGAATCCTGGATAATGAACGCATCTGTAAGAGAAAACATTCTATTTGGTCACAAGTTCGACCAAGATTATTATGACCTCACTATTAAAGCATGTCAATTGCTACCCGATTTGAAAATACTACCAGATGGTGATGAAACTTTGGTAGGTGAAAAGGGCATTTCCCTATCAGGCGGTCAGAAGGCCCGTCTTTCATTAGCCAGAGCGGTGTACTCGAGAGCAGATATTTATTTGTTGGATGACATTTTATCTGCTGTTGATGCAGAAGTTAGTAAAAATATTATTGAATATGTTTTGATCGGAAAGACGGCTTTATTAAAAAATAAAACAATTATTTTAACTACCAATACTGTATCAATTTTAAAACATTCGCAGATGATATATGCGCTAGAAAACGGTGAAATTGTTGAACAAGGGAATTATGAGGATGTAATGAACCGTAAGAACAATACTTCAAAACTGAAAAAATTACTAGAGGAATTTGATTCTCCGATTGATAATGGAAATGAAAGCGATGTCCAAACTGAACACCGATCCGAAAGTGAAGTGGATGAACCTCTGCAGCTTAAAGTAACTGAATCAGAAACTGAGGATGAGGTTGTTACTGAGAGTGAATTAGAACTAATCAAAGCCAATTCTAGAAGAGCTTCTCTAGCTACGCTAAGACCTAGACCCTTTGTGGGAGCACAATTGGATTCCGTGAAGAAAACGGCGCAAAAGGCCGAGAAGACAGAGGTGGGAAGAGTCAAAACAAAGATTTATCTTGCGTATATTAAGGCTTGTGGAGTTTTAGGTGTTGTTTTATTTTTCTTGTTTATGATATTAACAAGGGTTTTCGACTTAGCAGAGAATTTTTGGTTAAAGTACTGGTCAGAATCTAATGAAAAAAATGGTTCAAATGAAAGGGTTTGGATGTTTGTTGGTGTGTATTCCTTAATCGGAGTAGCATCGGCCGCATTCAATAATTTACGGAGTATTATGATGCTACTGTATTGTTCTATTAGGGGTTCTAAGAAACTGCATGAAAGCATGGCCAAATCTGTAATTAGAAGTCCTATGACTTTCTTTGAGACTACACCAGTTGGAAGGATCATAAACAGGTTCTCATCTGATATGGATGCAGTGGACAGTAATCTACAGTACATTTTCTCCTTTTTTTTCAAATCAATACTAACCTATTTGGTTACTGTTATATTAGTCGGGTACAATATGCCATGGTTTTTAGTGTTCAATATGTTTTTGGTGGTTATCTATATTTACTATCAAACATTTTACATTGTGCTATCTAGGGAGCTAAAAAGATTGATCAGTATATCTTACTCTCCGATTATGTCCTTAATGAGTGAGAGCTTGAACGGTTATTCTATTATTGATGCATACGATCATTTTGAGAGATTCATCTATCTAAATTATGAAAAAATCCAATACAACGTTGATTTTGTCTTCAACTTTAGATCAACGAATAGATGGTTATCCGTGAGATTGCAAACTATTGGTGCTACAATTGTTTTGGCTACTGCAATCTTAGCACTAGCAACAATGAATACTAAAAGGCAACTAAGTTCGGGTATGGTTGGTCTACTAATGAGCTATTCATTAGAGGTTACAGGTTCATTGACTTGGATTGTAAGGACAACTGTGACGATTGAAACCAACATTGTATCAGTGGAGAGAATTGTTGAGTACTGCGAATTACCACCTGAAGCACAGTCCATTAACCCTGAAAAGAGGCCAGATGAAAATTGGCCATCAAAGGGTGGTATTGAATTCAAAAACTATTCCACAAAATACAGAGAAAATTTGGATCCAGTGCTGAATAATATTAACGTGAAGATTGAGCCATGTGAAAAGGTTGGGATTGTTGGCAGAACAGGTGCAGGGAAGTCTACACTGAGCCTGGCATTATTTAGAATACTAGAACCTACCGAAGGTAAAATTATTATTGACGGCATTGATATATCCGACATAGGTCTGTTCGATTTAAGAAGCCATTTGGCAATTATTCCTCAGGATGCACAAGCTTTTGAAGGTACAGTAAAGACCAATTTGGACCCTTTCAATCGTTATTCAGAAGATGAACTTAAAAGGGCTGTTGAGCAGGCACATTTAAAGCCTCATCTGGAAAAAATGCTGCACAGTAAACCAAGAGGTGATGATTCTAATGAAGAGGATGGCAATGTTAATGATATTCTGGATGTCAAGATTAATGAGAACGGTAGTAACTTGTCAGTGGGGCAAAGACAACTACTATGTTTGGCAAGAGCGCTGCTAAACCGTTCCAAAATATTGGTCCTTGATGAAGCAACGGCTTCTGTGGATATGGAAACCGATAAAATTATCCAAGACACTATAAGAAGAGAATTTAAGGACCGTACCATCTTAACAATTGCACATCGTATCGACACTGTATTGGACAGTGATAAGATAATTGTTCTTGACCAGGGTAGTGTGAGGGAATTCGATTCACCCTCGAAATTGTTATCCGATAAAACGTCTATTTTTTACAGTCTTTGTGAGAAAGGTGGGTATTTGAAATAA。
本发明使用的术语“T4_Fungal_8”是指ABC转运蛋白,其具有以下氨基酸序列(SEQID NO:8):MSGSNSNSNLDAISDSCPFWRYDDITECGRVQYINYYLPITLVGVSLLYLFKNAIQHYYRKPQEIKPSVASELLGSNLTDLPNENKPLLSESTQALYTNPDSNKTGFSLKEEHFSINKVTLTEIHSNKHDAVKIVRRNWLEKLRVFLEWVLCALQLCIYISVWSKYTNTQEDFPMHASISGLMLWSLLLLVVSLRLANINQNISWINSGPGNLWALSFACYLSLFCGSVLPLRSIYIGHITDEIASTFYKLQFYLSLTLFLLLFTSQAGNRFAIIYKSTPDITPSPEPIVSIASYITWAWVDKFLWKAHQNYIEMKDVWGLMVEDYSILVIKRFNHFVQNKTKSRTFSFNLIHFFMKFIAIQGAWATISSVISFVPTMLLRRILEYVEDQSTAPLNLAWMYIFLMFLARILTAICAAQALFLGRRVCIRMKAIIISEIYSKALRRKISPNSTKEPTDVVDPQELNDKQHVDGDEESATTANLGAIINLMAVDAFKVSEICAYLHSFIEAIIMTIVALFLLYRLIGWSALVGSAMIICFLPLNFKLASLLGTLQKKSLAITDKRIQKLNEAFQAIRIIKFFSWEENFEKDIQNTRDEELNMLLKRSIVWALSSLVWFITPSIVTSASFAVYIYVQGQTLTTPVAFTALSLFALLRNPLDMLSDMLSFVIQSKVSLDRVQEFLNEEETKKYEQLTVSRNKLGLQNATFTWDKNNQDFKLKNLTIDFKIGKLNVIVGPTGSGKTSLLMGLLGEMELLNGKVFVPSLNPREELVVEADGMTNSIAYCSQAAWLLNDTVRNNILFNAPYNENRYNAVISACGLKRDFEILSAGDQTEIGEKGITLSGGQKQRVSLARSLYSSSRHLLLDDCLSAVDSHTALWIYENCITGPLMEGRTCVLVSHNVALTLKNADWVIIMENGRVKEQGEPVELLQKGSLGDDSMVKSSILSRTASSVNISETNSKISSGPKAPAESDNANEESTTCGDRSKSSGKLIAEETKSNGVVSLDVYKWYAVFFGGWKMISFLCFIFLFAQMISISQAWWLRAWASNNTLKVFSNLGLQTMRPFALSLQGKEASPVTLSAVFPNGSLTTATEPNHSNAYYLSIYLGIGVFQALCSSSKAIINFVAGIRASRKIFNLLLKNVLYAKLRFFDSTPIGRIMNRFSKDIESIDQELTPYMEGAFGSLIQCVSTIIVIAYITPQFLIVAAIVMLLFYFVAYFYMSGARELKRLESMSRSPIHQHFSETLVGITTIRAFSDERRFLVDNMKKIDDNNRPFFYLWVCNRWLSYRIELIGALIVLAAGSFILLNIKSIDSGLAGISLGFAIQFTDGALWVVRLYSNVEMNMNSVERLKEYTTIEQEPSNVGALVPPCEWPQNGKIEVKDLSLRYAAGLPKVIKNVTFTVDSKCKVGIVGRTGAGKSTIITALFRFLDPETGYIKIDDVDITTIGLKRLRQSITIIPQDPTLFTGTLKTNLDPYNEYSEAEIFEALKRVNLVSSEELGNPSTSDSTSVHSANMNKFLDLENEVSEGGSNLSQGQRQLICLARSLLRCPKVILLDEATASIDYNSDSKIQATIREEFSNSTILTIAHRLRSIIDYDKILVMDAGEVKEYDHPYSLLLNRDSIFYHMCEDSGELEVLIQLAKESFVKKLNAN;并由以下核酸序列(SEQ ID NO:27)编码:
ATGTCAGGTTCAAATTCGAATTCAAATCTAGATGCAATAAGTGATTCATGCCCATTTTGGCGCTATGATGATATTACAGAGTGTGGAAGAGTGCAGTATATCAATTACTACCTTCCAATAACATTGGTAGGCGTTTCTCTCTTGTATTTATTCAAAAACGCGATCCAACATTATTACAGAAAGCCTCAAGAAATTAAGCCTAGTGTTGCTTCCGAATTATTGGGCTCAAATCTCACAGACCTTCCGAATGAAAACAAGCCTTTACTATCGGAGAGTACACAAGCATTATACACTAATCCGGATTCGAATAAGACAGGATTCTCTCTAAAAGAGGAGCATTTCTCTATAAATAAAGTTACACTTACGGAAATTCATTCCAATAAGCATGACGCTGTGAAGATCGTAAGGAGAAACTGGCTTGAAAAATTAAGAGTGTTCTTAGAATGGGTTCTATGCGCCTTACAACTTTGCATCTACATTTCAGTCTGGTCGAAATACACTAATACCCAAGAGGATTTCCCAATGCACGCATCTATCTCAGGTCTAATGTTATGGTCTCTACTCTTGTTAGTAGTGTCATTGAGGTTGGCAAACATCAACCAGAATATAAGCTGGATCAATTCAGGACCGGGAAACTTATGGGCCCTTTCATTTGCATGTTATCTATCACTATTCTGCGGATCCGTTTTGCCATTGAGATCTATCTATATCGGTCATATCACAGATGAAATTGCATCAACATTTTATAAGTTGCAATTTTACCTAAGTTTGACACTATTCTTGTTACTTTTCACCTCTCAAGCGGGAAATCGGTTTGCCATTATCTATAAAAGTACACCAGATATAACACCGTCTCCTGAACCTATTGTGTCGATTGCAAGTTATATCACTTGGGCATGGGTAGATAAATTTCTTTGGAAAGCGCATCAAAATTATATCGAAATGAAAGATGTTTGGGGTCTAATGGTGGAAGACTATTCCATTCTCGTAATAAAGAGATTCAATCATTTTGTTCAGAATAAAACCAAGTCTAGGACATTTTCATTTAACTTAATCCACTTTTTCATGAAATTTATCGCCATTCAAGGTGCCTGGGCAACAATTTCGTCAGTTATTAGTTTTGTTCCAACAATGTTGCTCAGACGTATTTTGGAGTATGTTGAAGATCAATCAACTGCTCCATTAAATTTGGCTTGGATGTATATTTTTCTTATGTTCCTTGCCAGAATTTTAACTGCCATATGTGCTGCTCAGGCGCTATTTTTAGGGAGAAGGGTTTGTATCAGAATGAAGGCTATCATAATTTCTGAAATCTACTCCAAGGCTTTGAGAAGAAAAATTTCTCCAAATTCCACTAAGGAGCCAACTGATGTCGTTGATCCACAGGAATTAAATGACAAACAACACGTTGATGGAGATGAAGAATCAGCAACCACTGCAAATCTTGGTGCTATCATTAATTTGATGGCGGTGGATGCTTTCAAAGTATCCGAAATATGTGCGTATTTGCACTCCTTTATAGAGGCGATCATCATGACCATTGTTGCATTATTCCTTTTATATCGGTTAATAGGCTGGTCTGCTTTAGTTGGTAGTGCAATGATTATTTGCTTCTTACCATTGAACTTCAAACTTGCCAGCTTGTTAGGGACACTCCAAAAGAAATCCTTGGCAATCACAGATAAAAGAATTCAGAAACTAAACGAAGCTTTCCAGGCCATTCGTATTATCAAATTCTTCTCTTGGGAAGAGAATTTTGAAAAGGACATACAAAACACAAGGGATGAAGAATTAAATATGCTTTTAAAAAGGTCTATCGTTTGGGCTCTTTCTTCTCTTGTTTGGTTCATTACCCCCTCTATTGTCACATCCGCTTCTTTTGCAGTCTATATTTATGTGCAAGGCCAAACTTTAACTACTCCGGTAGCATTTACTGCACTATCTCTATTTGCTCTACTAAGAAATCCGTTAGACATGCTTTCTGATATGTTGTCTTTTGTTATTCAATCCAAGGTCTCTTTGGATAGAGTCCAAGAATTTTTAAATGAAGAGGAGACGAAAAAGTATGAGCAATTAACCGTATCAAGAAATAAACTTGGGTTGCAAAACGCTACTTTTACATGGGATAAAAATAATCAAGATTTCAAGTTAAAAAACCTAACTATTGATTTCAAAATTGGGAAATTAAACGTTATTGTAGGTCCAACTGGATCTGGTAAAACATCATTGTTAATGGGATTATTGGGTGAAATGGAGCTATTGAACGGAAAAGTTTTCGTCCCTTCGCTCAATCCTAGGGAAGAGTTGGTTGTAGAGGCCGATGGAATGACTAATTCAATCGCGTACTGCTCCCAAGCTGCCTGGTTGCTAAATGATACTGTCAGGAACAATATTCTATTCAATGCGCCTTATAATGAGAATAGATATAATGCCGTCATCTCTGCGTGTGGTTTGAAACGCGACTTCGAGATCTTAAGCGCTGGTGATCAGACAGAGATTGGCGAAAAGGGTATAACACTTTCTGGTGGTCAAAAACAAAGAGTCTCGTTGGCCAGATCATTGTATTCTTCATCAAGACATTTGCTGTTAGATGATTGTTTGAGTGCCGTAGACTCGCACACGGCCTTATGGATCTACGAAAATTGTATAACAGGCCCATTAATGGAAGGAAGAACATGTGTATTGGTTTCTCACAATGTTGCATTAACTTTAAAAAATGCAGATTGGGTTATCATTATGGAAAATGGTAGAGTAAAAGAACAAGGCGAACCAGTAGAATTGCTACAGAAGGGGTCCCTTGGGGATGACTCCATGGTGAAATCATCAATTTTGTCCCGTACGGCGTCCTCAGTTAATATTTCAGAAACTAACAGTAAGATTTCTAGTGGTCCGAAGGCTCCAGCGGAATCGGATAATGCCAATGAGGAGTCCACCACCTGTGGAGATCGTTCAAAGTCAAGCGGCAAGCTAATCGCTGAAGAAACAAAATCAAACGGTGTTGTTTCCCTGGACGTCTATAAGTGGTATGCCGTGTTTTTCGGTGGATGGAAGATGATATCATTTTTGTGTTTCATTTTCTTGTTTGCCCAAATGATCAGTATTTCACAGGCCTGGTGGTTGCGTGCTTGGGCCTCCAACAACACTCTAAAAGTTTTCTCCAACCTTGGATTGCAAACAATGAGGCCATTCGCTTTGTCCTTACAAGGAAAAGAAGCTTCTCCTGTGACTCTTAGTGCTGTTTTCCCAAATGGCAGTCTAACAACAGCCACGGAACCAAATCACTCGAACGCGTATTATCTATCAATATATTTGGGTATTGGTGTATTCCAGGCTTTATGTTCATCTTCGAAAGCAATTATAAACTTTGTGGCCGGTATTAGAGCTTCCAGGAAAATATTCAATTTATTGTTGAAAAATGTGTTATACGCCAAGCTGAGATTTTTTGATTCTACTCCAATAGGAAGAATAATGAACAGATTTTCTAAAGACATCGAATCAATAGATCAAGAATTGACTCCTTATATGGAAGGTGCATTTGGTTCCTTAATACAATGTGTTTCCACAATTATCGTCATTGCATACATTACTCCCCAATTTTTGATTGTCGCGGCGATTGTCATGTTATTGTTTTATTTTGTTGCCTACTTTTACATGTCAGGAGCAAGAGAATTAAAGCGTCTTGAATCGATGTCACGCTCTCCTATTCATCAGCACTTCTCTGAGACTCTTGTGGGTATCACGACTATTCGAGCATTTTCTGACGAGCGGCGTTTTCTGGTTGATAATATGAAGAAAATTGATGATAATAATAGGCCTTTCTTTTACTTATGGGTCTGTAATAGATGGCTATCTTACAGAATCGAGCTGATAGGCGCCCTTATTGTTTTGGCTGCAGGTAGTTTCATCTTATTGAACATAAAATCGATCGATTCTGGTTTGGCCGGTATTTCATTGGGTTTCGCTATACAATTTACCGATGGTGCCCTTTGGGTTGTTAGGTTATATTCCAACGTTGAAATGAATATGAATTCCGTCGAAAGGTTAAAAGAGTACACCACCATCGAGCAAGAACCTTCTAACGTTGGTGCCTTGGTACCTCCTTGCGAATGGCCACAAAATGGTAAAATCGAAGTCAAGGATTTATCTTTACGCTATGCAGCTGGTCTACCAAAGGTTATAAAAAATGTCACATTCACCGTCGATTCAAAGTGTAAAGTAGGTATTGTTGGCAGGACTGGTGCTGGTAAATCTACTATTATCACAGCCCTTTTCAGATTCTTAGACCCTGAAACTGGTTATATCAAAATCGATGACGTTGATATAACAACCATTGGTTTAAAACGTTTGCGCCAATCTATCACTATTATTCCACAGGACCCAACCCTTTTCACCGGTACTTTGAAAACCAATCTCGATCCATACAACGAATATTCGGAAGCTGAAATTTTCGAAGCTCTAAAACGTGTCAACCTTGTTTCCTCAGAAGAACTTGGTAATCCTTCTACTTCGGATTCAACCTCGGTACATTCAGCAAATATGAATAAGTTTTTGGATTTGGAAAATGAAGTCAGTGAAGGTGGTTCCAACCTCTCACAAGGACAACGTCAATTGATATGTTTGGCCCGTTCATTATTGCGGTGTCCAAAGGTAATTCTACTTGATGAAGCCACAGCTTCAATCGATTATAACTCAGACTCTAAAATCCAGGCTACTATAAGGGAAGAATTCAGTAATAGTACCATTCTCACGATTGCTCATCGTTTACGATCAATTATTGATTATGATAAAATACTTGTTATGGATGCTGGGGAGGTTAAAGAATATGATCATCCTTACTCCTTATTGTTGAATCGTGATAGTATATTCTATCATATGTGTGAAGATAGTGGAGAATTAGAAGTCTTGATACAATTAGCCAAAGAATCATTTGTCAAAAAGCTCAATGCAAATTGA。
本发明使用的术语“亲本细胞”是指与本发明公开的经遗传修饰的宿主细胞具有相同遗传背景的细胞,除了其不包含工程化到所述经修饰的宿主细胞中的一种或多种特定遗传修饰,譬如,选自由以下组成的组的一种或多种修饰:甜菊醇途径的酶的异源表达,甜菊糖苷途径的酶的异源表达,香叶基香叶基焦磷酸合酶的异源表达,柯巴基焦磷酸合酶的异源表达,贝壳杉烯合酶的异源表达,贝壳杉烯氧化酶(例如,豌豆(Pisum sativum)贝壳杉烯氧化酶)的异源表达,甜菊醇合酶(异贝壳杉烯酸羟化酶)的异源表达,细胞色素P450还原酶的异源表达,EUGT11的异源表达,UGT74G1的异源表达,UGT76G1的异源表达,UGT85C2的异源表达,UGT91D的异源表达,和UGT40087或其变体的异源表达。
本发明使用的术语“天然存在的”是指天然存在的那些物质。譬如,存在于生物体中的ABC转运蛋白可从自然界中的来源分离得到并且在实验室中未被人有意修饰,其就是天然存在的ABC转运蛋白。相反,本发明使用的术语“非天然存在的”是指在自然界中未发现但通过人为干预生成的那些物质。
术语“培养基”是指培养基和/或发酵培养基。
术语“发酵组合物”是指组合物,所述组合物包含经遗传修饰的宿主细胞和由所述经遗传修饰的宿主细胞生成的产物或代谢物。发酵组合物的实例是全细胞培养液,其可以是容器(例如,烧瓶、平板或发酵罐)的全部内容物,包括细胞、水相和由所述经遗传修饰的宿主细胞生成的化合物。
本发明使用的术语“生成量”通常是指由本发明提供的经遗传修饰的宿主细胞生成的甜菊醇或甜菊糖苷的量。在一些实施方案,生成量表示为由所述宿主细胞生成的甜菊醇或甜菊糖苷的产量。在其他实施方案,生成量表示为生成所述甜菊醇或甜菊糖苷时所述宿主细胞的生产率。
本发明使用的术语“生产率/生产力”是指由宿主细胞生成甜菊醇或甜菊糖苷的量,表示为每单位量的发酵液中生成的甜菊醇或甜菊糖苷的量(按重量计),其中所述宿主细胞根据时间(每小时)进行培养(按体积计)。
本发明使用的术语“产量/产率”是指由宿主细胞生成的甜菊醇或甜菊糖苷的量,表示为宿主细胞消耗的每单位量的碳源生成的甜菊醇或甜菊糖苷的量,按重量计。
本发明使用的术语化合物(例如,RebM、甜菊糖苷类化合物或其他化合物)的“不可检测水平”是指化合物的水平/含量太低而不能通过标准技术进行测定和/或分析以检测所述化合物。譬如,所述术语包括由本领域已知分析方法无法检测到的化合物的水平。
术语“贝壳杉烯(kaurene)”是指化合物贝壳杉烯,包括贝壳杉烯的任何立体异构体。在特定实施方案,所述术语是指在本领域中称为内根-贝壳杉烯的对映异构体。在特定实施方案,所述术语是指具有以下结构的化合物:
术语“贝壳杉烯醇(kaurenol)”是指化合物贝壳杉烯醇,包括贝壳杉烯醇的任何立体异构体。
在特定实施方案,所述术语是指在本领域中称为内根-贝壳杉烯醇的对映异构体。在特定实施方案,所述术语是指具有以下结构的化合物:
术语“贝壳杉烯醛(kaurenal)”是指化合物贝壳杉烯醛,包括贝壳杉烯醛的任何立体异构体。
在特定实施方案,所述术语是指在本领域中称为内根-贝壳杉烯醛的对映异构体。在特定实施方案,所述术语是指具有以下结构的化合物:
术语“贝壳杉烯酸/异贝壳杉烯酸(kaurenoic acid)”是指化合物异贝壳杉烯酸,包括异贝壳杉烯酸的任何立体异构体。在特定实施方案,所述术语是指在本领域中称为内根-异贝壳杉烯酸的对映异构体。在特定实施方案,所述术语是指具有以下结构的化合物:
术语“甜菊醇(steviol)”是指化合物甜菊醇,包括甜菊醇的任何立体异构体。在特定实施方案,所述术语是指具有以下结构的化合物:
本发明使用的术语“甜菊糖苷/甜菊醇糖苷/甜菊糖苷类化合物(steviolglycoside(s))”是指甜菊醇的糖苷,包括但不限于,天然存在的甜菊糖苷类化合物,例如天然存在的甜菊单糖苷、甜菊双糖苷、甜茶苷、杜克苷B、杜克苷A、瑞鲍迪苷B、瑞鲍迪苷G、甜菊苷(stevioside)、瑞鲍迪苷C、瑞鲍迪苷F、瑞鲍迪苷A、瑞鲍迪苷I、瑞鲍迪苷E、瑞鲍迪苷H、瑞鲍迪苷L、瑞鲍迪苷K、瑞鲍迪苷J、瑞鲍迪苷M、瑞鲍迪苷D、瑞鲍迪苷N、瑞鲍迪苷O,合成甜菊糖苷类化合物例如酶促糖基化的甜菊糖苷类化合物,及其组合。
本发明使用的术语“瑞鲍迪苷M”是指具有以下结构的化合物:
本发明使用的术语“变体”是指通过氨基酸插入、缺失、突变和/或置换而不同于具体列举的“参考”多肽(例如,野生型序列)的多肽,但保留与所述参考多肽基本相似的活性。在一些实施方案,所述变体通过重组DNA技术或通过诱变而产生。在一些实施方案,变体多肽与其参考多肽的不同之处在于一个碱基残基置换另一个碱基残基(即,Arg置换Lys),一个疏水残基置换另一个疏水残基(即,Leu置换Ile),或一个芳香族残基置换另一个芳香族残基(即,Phe置换Tyr)等。在一些实施方案,变体包括类似物,其中实现保守置换导致所述参考序列的基本结构类似。此类保守置换的实例包括但不限于,谷氨酸置换天冬氨酸,反之亦然;谷氨酰胺置换天冬酰胺,反之亦然;丝氨酸置换苏氨酸,反之亦然;赖氨酸置换精氨酸,反之亦然;或者任何异亮氨酸、缬氨酸或亮氨酸之间的彼此置换。
在上下文中或两个或更多个核酸或蛋白质序列中,本发明使用的术语“序列同一性”或“同一性百分比”是指两个或更多个序列或子序列是相同,或所述序列或子序列具有特定百分比的相同氨基酸残基或核苷酸。譬如,当进行比较和比对以在比较窗口上进行最大对应,或者使用序列比较算法或通过手动比对和目视检查进行测定的指定区域时,所述序列可在所述指定区域与参考序列具有至少60%,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或更高的同一性。譬如,通过计算所述序列中相同核苷酸(或氨基酸残基)的数量除以总核苷酸(或氨基酸残基)的长度减去任何空位(gap)的长度的比值来确定同一性百分比。
为方便起见,可使用本领域已知的计算机程序和数学算法来确定两个序列之间的同一性程度。计算序列同一性百分比的此类算法通常考虑所述比较区域上的序列空位和错配。用于比较和比对序列的程序,如Clustal W(序列比对W)(Thompson et al.,(1994)Nucleic Acids Res.,22:4673-4680),ALIGN(Myers et al.,(1988)CABIOS,4:11-17),FASTA(Pearson et al.,(1988)PNAS,85:2444-2448;Pearson(1990),Methods Enzymol.,183:63-98),以及空位的BLAST(Altschul et al.,(1997)Nucleic Acids Res.,25:3389-3402),均可用于此目的。所述BLAST或BLAST 2.0(Altschul et al.,J.Mol.Biol.215:403-10,1990)可从若干来源得到,包括国家生物信息中心(NCBI)和因特网,用于与序列分析程序BLASTP、BLASTN、BLASTX、TBLASTN和TBLASTX结合使用。更多信息可从NCBI网站上获悉。
在某些实施方案,序列比对和同一性百分比计算可使用BLAST程序采用其标准默认参数来确定。对于核苷酸序列比对和序列同一性计算,BLASTN程序可以其默认参数(空位开放罚分(Gap opening penalty)=5,空位延伸罚分(Gap extension penalty)=2,核匹配(Nucleic match)=2,核不匹配(Nucleic mismatch)=-3,期望值(Expectation value)=10.0,字长(Word size)=11,查询范围中的最大匹配数=0)进行使用。对于多肽序列比对和序列同一性计算,BLASTP程序可以其默认参数(比对矩阵(Alignment matrix)=BLOSUM62;空位罚分(Gap costs):存在(Existence)=11,延伸(Extension)=1;组成调整(Compositional adjustments)=条件组成得分(Conditional compositional score),矩阵调整;期望值=10.0;字长(Word size)=6;查询范围中的最大匹配数=0)进行使用。或者,使用以下程序和参数:克隆管理组件(Clone Manager Suite)的比对加强版(AlignPlus)软件,版本5(Sci-Ed软件);DNA比较:总体比较/整体联配(Global comparison),标准线性打分矩阵(Standard Linear Scoring matrix),不匹配罚分=2,开放空位罚分=4,延伸空位罚分=1。氨基酸比较:总体比较,BLOSUM 62打分矩阵。在本发明所述的实施方案中,使用BLASTN或BLASTP程序使用其默认参数来计算序列同一性。在本发明所述的实施方案中,使用Clustal W使用建议的默认参数进行两个或更多个序列的序列比对(Dealign输入序列:否;Mbed样聚类引导树(Mbed-like clustering guide-tree):是;Mbed样聚类迭代(Mbed-like clustering iteration):是;组合迭代次数:默认(0);最大引导树迭代次数(Max guide tree iterations):默认;最大HMM迭代次数:默认;指令(Order):输入(input))。
6.2ABC转运蛋白、核酸、表达盒和宿主细胞
一方面,本发明提供了表达ABC转运蛋白的重组核酸。本发明的ABC转运蛋白可通过针对已知ABC转运蛋白序列的基于序列的搜索来识别。已知ABC转运蛋白的示例性序列数据库由(Kovalchuk and Driessen,Phylogenetic Analysis of Fungal ABCTransporters,BMC Genomics,2010,11:177)提供。ABC转运蛋白BLAST数据库也可由其他生物体生成。在优选实施方案,真菌序列数据库来自(1)多形汉逊酵母(Hansenulapolymorpha)DL-1(NRRL-Y-7560)、(2)解脂耶氏酵母(Yarrowia lipolytica)ATCC 18945、(3)食腺嘌呤芽生葡萄孢酵母(Arxula adeninivorans)ATCC 76597、(4)酿酒酵母(S.cerevisiae)CAT-1、(5)斯达氏油脂酵母(Lipomyces starkeyi)ATCC 58690、(6)马克斯克鲁维酵母(Kluyveromyces marxianus)、(7)马克斯克鲁维酵母DMKU3-1042、(8)法夫驹形氏酵母(Komagataella phaffii)NRRL Y-11430、(9)酿酒酵母MBG3370、(10)酿酒酵母MBG3373、(11)乳酸克鲁维酵母(K.lactis)ATCC 8585、(12)产朊假丝酵母(Candidautilis)ATCC 22023、(13)毕赤酵母(Pichia pastoris)ATCC 28485、和(14)米曲霉(Aspergillus oryzae)NRRL5590,作为本发明ABC转运蛋白的来源。
使用Biopython或任何其他合适的序列分析软件,通过tblastn算法来分析由各种生物体的从头基因组测序、组装和注释生成的核苷酸ORF序列。tblastn算法使用BLAST将已知ABC转运蛋白的蛋白质序列与每个生物体的核苷酸ORF序列的经翻译DNA在所有6个可能的阅读框中进行比对。示例性BLAST参数均是标准的,E值(evalue)=1e-25(表4和表5)。随后可过滤命中(hit)以确保至少2000个核苷酸的整体联配。
在本发明的其他实施方案中,可使用Uniprot API从Uniprot中提取生物体的整个蛋白质组,以创建用于BLAST搜索的数据库。blastp算法可应用于Uniprot派生数据库。在一个实施方案,BLAST参数可以是标准的,E值(evalue)=0.001。在特定实施方案,可基于≥40%的同一性截断百分比和≥60%的对齐长度截断百分比来执行过滤。在优选实施方案,命中(hit)必须匹配来自所述参考的610个种子序列中的至少一个。
一旦确定了核苷酸序列,便可设计引物来扩增经由PCR扩增的每个完整ORF。理想情况下,每个PCR引物均应与启动子和终止子的所述启动子和终止子DNA序列具有侧翼同源性,所述启动子和终止子用于异源核苷酸表达盒并添加至两端,以促进经扩增的基因同源重组到着陆垫靶位点,以产生特定的ABC转运蛋白表达盒。每个ABC转运蛋白基因可作为单拷贝单独转化到本发明所述的亲本Reb M酵母菌株中,并筛选在体内过表达时增加产物滴度的能力。
在某些实施方案,所述重组核酸编码具有SEQ ID NO:1至SEQ ID NO:8中任一个提供的氨基酸序列的多肽。在某些实施方案,所述重组核酸包含SEQ ID NO:20至SEQ ID NO:27中任一个提供的核苷酸序列。
本发明还提供了宿主细胞,所述宿主细胞包含一种或多种本发明提供的能够生成甜菊糖苷类化合物的ABC转运蛋白多肽或核酸。在某些实施方案,所述宿主细胞可由培养基中的碳源生成甜菊糖苷类化合物。在特定实施方案,所述宿主细胞可由培养基中的碳源生成甜菊醇,并且可进一步由甜菊醇生成Reb A或Reb D。在特定实施方案,所述宿主细胞可进一步由Reb D生成Reb M。在特定实施方案,Reb D和/或Reb M被转运至一种或多种细胞器的腔内。在特定实施方案,Reb D和/或Reb M被转运至细胞外空间(即,上清液)。
在某些实施方案,与缺乏ABC转运蛋白表达盒的亲本宿主细胞相比,根据上述实施方案表达ABC转运蛋白的宿主细胞生成高出至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、或至少100%的总甜菊糖苷(TSG)。
在某些实施方案,与缺乏ABC转运蛋白表达盒的亲本宿主细胞相比,根据上述实施方案表达ABC转运蛋白的宿主细胞在上清液中生成高出至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、或至少75%的TSG。在特定实施方案,与缺乏ABC转运蛋白表达盒的亲本宿主细胞相比,根据上述实施方案表达ABC转运蛋白的宿主细胞在上清液中生成高出至少2倍、至少3倍、至少4倍、或至少5倍的TSG。
在有利的实施方案中,所述宿主细胞可包含能够制备异贝壳杉烯酸的一种或多种酶促途径,所述途径可单独使用或一同使用。如本发明所述,所述宿主细胞包含本发明提供的甜叶菊(Stevia rebaudiana)异贝壳杉烯酸羟化酶,其能够将异贝壳杉烯酸转化为甜菊醇。在某些实施方案,所述宿主细胞还包含能够将法呢基焦磷酸转化为香叶基香叶基焦磷酸的一种或多种酶。在某些实施方案,所述宿主细胞还包含能够将香叶基香叶基焦磷酸转化为柯巴基焦磷酸的一种或多种酶。在某些实施方案,所述宿主细胞还包含能够将柯巴基焦磷酸转化为贝壳杉烯的一种或多种酶。在某些实施方案,所述宿主细胞还包含能够将贝壳杉烯转化为异贝壳杉烯酸的一种或多种酶。在某些实施方案,所述宿主细胞还包含能够将甜菊醇转化为一种或多种甜菊糖苷的一种或多种酶。在某些实施方案,所述宿主细胞还包含能够一同将甜菊醇转化为Reb A的1、2、3、4或更多种酶。在某些实施方案,宿主细胞还包含能够将Reb A转化为Reb D的一种或多种酶。在某些实施方案,所述宿主细胞还包含能够将Reb D转化为Reb M的一种或多种酶。有用的酶和编码所述酶的核酸均是本领域技术人员已知的。特别有用的酶和核酸均描述于以下章节中,并进一步描述于例如US 2014/0329281A1、US 2014/0357588A1、US 2015/0159188、WO 2016/038095A2和US 2016/0198748A1中。
在进一步的实施方案,所述宿主细胞还包含能够由碳源制备香叶基香叶基焦磷酸的一种或多种酶。所述这些包括DXP途径的酶类和MEV途径的酶类。有用的酶和编码所述酶的核酸均是本领域技术人员已知的。每种途径的示例性酶类如下所述,并进一步描述于例如US 2016/0177341A1中,其通过引用其全文并入本发明。
在某些实施方案,所述宿主细胞包含选自由以下组成的组的一种或多种或所有类异戊二烯途径酶:(a)使两分子乙酰辅酶A缩合形成乙酰乙酰辅酶A的酶(例如,乙酰辅酶A硫解酶);(b)使乙酰乙酰辅酶A与另一分子乙酰辅酶A缩合形成3-羟基-3-甲基戊二酰-辅酶A(HMG-CoA)的酶(例如,HMG-CoA合酶);(c)使HMG-CoA转化为甲羟戊酸的酶(例如,HMG-CoA还原酶);(d)使甲羟戊酸转化为甲羟戊酸5-磷酸的酶(例如,甲羟戊酸激酶);(e)使甲羟戊酸5-磷酸转化为甲羟戊酸5-焦磷酸的酶(例如,磷酸甲羟戊酸激酶);(f)使甲羟戊酸5-焦磷酸转化为异戊烯二磷酸(IPP)的酶(例如,甲羟戊酸焦磷酸脱羧酶);(g)使IPP转化为二甲基烯丙基焦磷酸(DMAPP)的酶(例如,IPP异构酶);(h)可缩合IPP和/或DMAPP分子以形成含有五个以上碳原子的聚异戊二烯基化合物的聚异戊二烯合酶;(i)使IPP与DMAPP缩合形成香叶基焦磷酸(GPP)的酶(例如,GPP合酶);(j)使两分子IPP与一分子DMAPP缩合的酶(例如,FPP合酶);(k)使IPP与GPP缩合形成法呢基焦磷酸(FPP)的酶(例如,FPP合酶);(l)使IPP与DMAPP缩合形成香叶基香叶基焦磷酸(GGPP)的酶;和(m)使IPP与FPP缩合形成GGPP的酶。
在某些实施方案,所述另外的酶是原生或天然的。在有利的实施方案中,所述另外的酶是异源的。在某些实施方案,两种或两种以上的酶可在一种多肽中进行组合。
6.3细胞菌株
可用于本发明提供的组合物和方法的宿主细胞包括古细菌细胞、原核细胞或真核细胞。
合适的原核宿主包括但不限于,多种革兰氏阳性、革兰氏阴性或革兰氏变种细菌中的任一种。实例包括但不限于,属于以下属的细胞:土壤杆菌属(Agrobacterium),脂环酸芽孢杆菌属(Alicyclobacillus),鱼腥藻属(Anabaena),蓝细菌属(Anacystis),节细菌属(Arthrobacter),固氮菌属(Azobacter),芽孢杆菌属(Bacillus),短杆菌属(Brevibacterium),着色菌属(Chromatium),梭菌属(Clostridium),棒状杆菌属(Corynebacterium),肠杆菌属(Enterobacter),欧文氏菌属(Erwinia),埃希氏杆菌属(Escherichia),乳酸杆菌属(Lactobacillus),乳球菌属(Lactococcus),中慢生根瘤菌属(Mesorhizobium),甲基杆菌属(Methylobacterium),细杆菌属(Microbacterium),席藻属(Phormidium),假单胞菌属(Pseudomonas),红细菌属(Rhodobacter),红假单胞菌属(Rhodopseudomonas),红螺菌属(Rhodospirillum),红球菌属(Rhodococcus),沙门氏菌属(Salmonella),栅藻属(Scenedesmun),沙雷氏菌属(Serratia),志贺氏菌属(Shigella),葡萄球菌属(Staphlococcus),链霉菌属(Strepromyces),聚球蓝细菌属(Synnecoccus)和发酵单胞菌属(Zymomonas)。原核菌株的实例包括但不限于:枯草芽孢杆菌(Bacillussubtilis),解淀粉芽孢杆菌(Bacillus amyloliquefacines),产氨短杆菌(Brevibacterium ammoniagenes),嗜氨短杆菌(Brevibacterium immariophilum),拜氏梭菌(Clostridium beigerinckii),阪崎肠杆菌(Enterobacter sakazakii),大肠杆菌(Escherichia coli),乳酸乳球菌(Lactococcus lactis),百脉根中生根瘤菌(Mesorhizobium loti),绿脓假单胞菌(Pseudomonas aeruginosa),迈氏假单胞菌(Pseudomonas mevalonii),普迪卡假单胞菌(Pseudomonas pudica),荚膜红细菌(Rhodobacter capsulatus),类球红细菌(Rhodobacter sphaeroides),深红红螺菌(Rhodospirillum rubrum),肠道沙门氏菌(Salmonella enterica),伤寒沙门氏菌(Salmonella typhi),鼠伤寒沙门氏菌(Salmonella typhimurium),痢疾志贺氏菌(Shigella dysenteriae),福氏志贺菌(Shigella flexneri),宋内志贺菌(Shigellasonne)和金黄色葡萄球菌(Staphylococcus aureus)。在特定实施方案,所述宿主细胞是大肠杆菌(Escherichia coli)细胞。
合适的古细菌宿主包括但不限于属于以下属的细胞:气火菌属(Aeropyrum),古球菌属(Archaeglobus),盐杆菌属(Halobacterium),产甲烷球菌属(Methanococcus),甲烷杆菌属(Methanobacterium),火球菌属(Pyrococcus),硫化叶菌属(Sulfolobus),和热原体属(Thermoplasma)。古细菌菌株的实例包括但不限于:闪烁古生球菌(Archaeoglobusfulgidus),盐杆菌属(Halobacterium sp.),詹氏甲烷球菌(Methanococcus jannaschii),嗜热自养甲烷杆菌(Methanobacterium thermoautotrophicum),嗜酸热原体(Thermoplasma acidophilum),火山热原体(Thermoplasma volcanium),掘越氏热球菌(Pyrococcus horikoshii),深海火球菌(Pyrococcus abyssi),和敏捷气热菌(Aeropyrumpernix)。
合适的真核宿主包括但不限于真菌细胞、藻类细胞、昆虫细胞和植物细胞。在一些实施方案,可用于本发明方法的酵母包括已被微生物保藏中心(例如,IFO、ATCC等)保藏并属于以下属的酵母:芽孢酵母属(Aciculoconidium),神食酵母属(Ambrosiozyma),节束酵母属(Arthroascus),Arxiozyma,阿舒囊霉属(Ashbya),Babjevia,本森顿酵母属(Bensingtonia),Botryoascus,Botryozyma,酒香酵母属(Brettanomyces),布勒掷孢酵母属(Bullera),布勒担孢酵母属(Bulleromyces),假丝酵母属(Candida),固囊酵母属(Citeromyces),棒孢酵母属(Clavispora),隐球菌属(Cryptococcus),产黑色素酵母属(Cystofilobasidium),德巴利氏酵母属(Debaryomyces),德克酵母属(Dekkara),拟双足囊菌属(Dipodascopsis),双足囊菌属(Dipodascus),Eeniella,Endomycopsella,Eremascus,假囊酵母属(Eremothecium),担孢酵母属(Erythrobasidium),Fellomyces,线黑粉酵母属(Filobasidium),耐碱酵母属(Galactomyces),地丝菌属(Geotrichum),季氏酵母属(Guilliermondella),有孢汉逊酵母属(Hanseniaspora),汉逊酵母属(Hansenula),Hasegawaea,胶珊瑚属(Holtermannia),Hormoascus,生丝毕赤酵母属(Hyphopichia),伊萨酵母属(Issatchenkia),克勒克酵母属(Kloeckera),孢克勒克酵母属(Kloeckeraspora),克鲁维酵母属(Kluyveromyces),Kondoa,Kuraishia,克氏担孢酵母属(Kurtzmanomyces),白冬孢酵母属(Leucosporidium),油脂酵母属(Lipomyces),路德酵母属(Lodderomyces),马拉色氏霉菌属(Malassezia),梅奇酵母属(Metschnikowia),木拉克酵母属(Mrakia),油脂酵母属无性属(Myxozyma),拿逊酵母属(Nadsonia),Nakazawaea,针孢酵母属(Nematospora),甲醇诱导型酵母属(Ogataea),卵孢酵母属(Oosporidium),管囊酵母属(Pachysolen),厚壁孢酵母(Phachytichospora),法夫酵母属(Phaffia),毕赤酵母属(Pichia),红冬孢酵母属(Rhodosporidium),红酵母属(Rhodotorula),酵母属(Saccharomyces),类酵母属(Saccharomycodes),覆膜孢酵母属(Saccharomycopsis),齐藤酵母属(Saitoella),Sakaguchia,Saturnospora,裂芽酵母孢子菌属(Schizoblastosporion),裂殖酵母属(Schizosaccharomyces),许旺酵母属(Schwanniomyces),锁掷酵母属(Sporidiobolus),掷孢酵母属(Sporobolomyces),原孢酵母属(Sporopachydermia),冠孢酵母属(Stephanoascus),梗孢酵母属(Sterigmatomyces),拟梗孢酵母属(Sterigmatosporidium),Symbiotaphrina,合轴酵母属(Sympodiomyces),Sympodiomycopsis,有孢圆酵母属(Torulaspora),Trichosporiella,毛孢子菌属(Trichosporon),三角酵母属(Trigonopsis),Tsuchiyaea,Udeniomyces,Waltomyces,威克酵母属(Wickerhamia),拟威克酵母属(Wickerhamiella),拟威尔酵母属(Williopsis),Yamadazyma,耶氏酵母属(Yarrowia),接合囊酵母属(Zygoascus),接合酵母属(Zygosaccharomyces),接合拟威尔酵母属(Zygowilliopsis),和Zygozyma等等。
在一些实施方案,所述宿主微生物是酿酒酵母(Saccharomyces cerevisiae),巴斯德毕赤酵母(Pichia pastoris),粟酒裂殖酵母(Schizosaccharomyces pombe),布鲁赛尔德克酵母(Dekkera bruxellensis),乳酸克鲁维酵母(Kruyveromyces lactis,此前称为乳酸酵母(Saccharomyces lactis)),马克斯克鲁维酵母(Kluveromyces marxianus),食腺嘌呤芽生葡萄孢酵母(Arxula adeninivorans),或多形汉逊酵母(Hansenula polymorpha)(现称为安格斯毕赤酵母(Pichia angusta))。在一些实施方案,所述宿主微生物是假丝酵母属(Candida)的菌株,例如解脂假丝酵母(Candida lipolytica),吉利蒙假丝酵母(Candida guilliermondii),克鲁斯假丝酵母(Candida krusei),假热带假丝酵母(Candida pseudotropicalis)或产朊假丝酵母(Candida utilis)的菌株。
在特定实施方案,所述宿主微生物是酿酒酵母(Saccharomyces cerevisiae)。在一些实施方案,所述宿主是酿酒酵母(Saccharomyces cerevisiae)的菌株,所述酿酒酵母的菌株是选自由贝克氏(Baker’s)酵母、CBS 7959、CBS 7960、CBS 7961、CBS 7962、CBS7963、CBS 7964、IZ-1904、TA、BG-1、CR-1、SA-1、M-26、Y-904、PE-2、PE-5、VR-1、BR-1、BR-2、ME-2、VR-2、MA-3、MA-4、CAT-1、CB-1、NR-1、BT-1、和AL-1组成的组。在一些实施方案,所述宿主微生物是酿酒酵母(Saccharomyces cerevisiae)的菌株,所述酿酒酵母的菌株是选自由PE-2、CAT-1、VR-1、BG-1、CR-1、和SA-1组成的组。在特定实施方案,酿酒酵母(Saccharomyces cerevisiae)的菌株是PE-2。在另一特定实施方案,酿酒酵母(Saccharomyces cerevisiae)的菌株是CAT-1。在另一特定实施方案,酿酒酵母(Saccharomyces cerevisiae)的菌株是BG-1。
在一些实施方案,所述宿主微生物是适于工业发酵的微生物。在特定实施方案,所述微生物适应于在高溶剂浓度、高温、扩大的底物利用率、营养限制、由糖和盐引起的渗透应力、酸度、亚硫酸盐和细菌污染、或其组合下存活,所述这些是公认的工业发酵环境的应激条件。
6.4甜菊醇和甜菊糖苷生物合成途径
在一些实施方案,通过工程化所述细胞以表达编码所述途径的一种或多种酶的多核苷酸和/或多肽,在本发明提供的经遗传修饰的宿主细胞中激活甜菊醇生物合成途径和/或甜菊糖苷生物合成途径。图1示出了示例性甜菊醇生物合成途径。
因此,在一些实施方案,本发明提供的经遗传修饰的宿主细胞包含编码多肽的异源多核苷酸,所述多肽具有香叶基香叶基焦磷酸合酶(GGPPS)活性。在一些实施方案,本发明提供的经遗传修饰的宿主细胞包含编码多肽的异源多核苷酸,所述多肽具有柯巴基焦磷酸合酶或内根-柯巴基二磷酸合酶(CDPS;也称为内根-柯巴基焦磷酸合酶或CPS)活性。在一些实施方案,本发明提供的经遗传修饰的宿主细胞包含编码多肽的异源多核苷酸,所述多肽具有贝壳杉烯合酶(KS;也称为内根-贝壳杉烯合酶)活性。在特定实施方案,本发明提供的经遗传修饰的宿主细胞包含编码多肽的异源多核苷酸,所述多肽具有本发明所述的贝壳杉烯氧化酶(KO;也称为内根-贝壳杉烯19-氧化酶)活性。在特定实施方案,本发明提供的经遗传修饰的宿主细胞包含编码多肽的异源多核苷酸,根据本发明提供的实施方案,所述多肽具有异贝壳杉烯酸羟化酶多肽(KAH;也称为甜菊醇合酶)活性。在一些实施方案,本发明提供的经遗传修饰的宿主细胞包含编码多肽的异源多核苷酸,所述多肽具有细胞色素P450还原酶(CPR)活性。
在一些实施方案,本发明提供的经遗传修饰的宿主细胞包含编码具有UGT74G1活性的多肽的异源多核苷酸。在一些实施方案,本发明提供的经遗传修饰的宿主细胞包含编码具有UGT76G1活性的多肽的异源多核苷酸。在一些实施方案,本发明提供的经遗传修饰的宿主细胞包含编码具有UGT85C2活性的多肽的异源多核苷酸。在一些实施方案,本发明提供的经遗传修饰的宿主细胞包含编码具有UGT91D活性的多肽的异源多核苷酸。在一些实施方案,本发明提供的经遗传修饰的宿主细胞包含编码具有UGTAD活性的多肽的异源多核苷酸。如下所述,UGTAD是指尿苷二磷酸依赖性糖基转移酶,其能够将葡萄糖基团部分转移至RebA的19-O-葡萄糖的C-2'位置以生成RebD。
在某些实施方案,所述宿主细胞包含变体酶。在某些实施方案,相对于相关多肽,所述变体可包含多达15、10、9、8、7、6、5、4、3、2或1个氨基酸置换。在某些实施方案,相对于参考多肽,所述变体可包含多达15、10、9、8、7、6、5、4、3、2或1个保守氨基酸置换。在某些实施方案,可针对所述宿主细胞优化本发明所述的任何核酸,例如进行密码子优化。
以下描述了甜菊醇生物合成途径和/或甜菊糖苷生物合成途径的示例性核酸和酶。
6.4.1香叶基香叶基焦磷酸合酶(GGPPS)
香叶基香叶基焦磷酸合酶(EC 2.5.1.29)催化法呢基焦磷酸转化为香叶基香叶基焦磷酸。酶的示例性实例包括甜叶菊(Stevia rebaudiana,登录号ABD92926),藤仓赤霉(Gibberella fujikuroi,登录号CAA75568),小家鼠(Mus musculus,登录号AAH69913),假微型海链藻(Thalassiosira pseudonana,登录号XP_002288339),棒状链霉菌(Streptomyces clavuligerus,登录号ZP_05004570),嗜酸热硫化叶菌(Sulfulobusacidocaldarius,登录号BAA43200),聚球藻属(Synechococcus sp.,登录号ABC98596),拟南芥(Arabidopsis thaliana,登录号NP_195399),和三孢布拉霉(Blakeslea trispora,登录号AFC92798.1)的那些酶,以及US2014/0329281A1中示出的那些酶。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸与这些GGPPS核酸中的至少一种具有至少80%、85%、90%、或95%序列同一性。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸编码与这些GGPPS酶中的至少一种具有至少80%、85%、90%、或95%序列同一性的多肽。
6.4.2柯巴基焦磷酸合酶(CDPS)
柯巴基焦磷酸合酶(EC 5.5.1.13)催化香叶基香叶基焦磷酸转化为柯巴基焦磷酸。酶的示例性实例包括甜叶菊(Stevia rebaudiana,登录号AAB87091),棒状链霉菌(Streptomyces clavuligerus,登录号EDY51667),慢生型大豆根瘤菌(Bradyrhizobiumjaponicum,登录号AAC28895.1),玉米(Zea mays,登录号AY562490),拟南芥(Arabidopsisthaliana,登录号NM_116512),和稻(Oryza sativa,登录号Q5MQ85.1)的那些酶,以及US2014/0329281A1中示出的那些酶。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸与这些CDPS核酸中的至少一种具有至少80%、85%、90%、或95%序列同一性。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸编码与这些CDPS酶中的至少一种具有至少80%、95%、90%、或95%序列同一性的多肽。
6.4.3贝壳杉烯合酶(KS)
贝壳杉烯合酶(EC 4.2.3.19)催化柯巴基焦磷酸转化为贝壳杉烯和二磷酸。酶的示例性实例包括慢生型大豆根瘤菌(Bradyrhizobium japonicum,登录号AAC28895.1),暗球腔菌属(Phaeosphaeria sp.,登录号O13284),拟南芥(Arabidopsis thaliana,登录号Q9SAK2),和白云杉(Picea glauca,登录号ADB55711.1)的那些酶,以及US2014/0329281A1中示出的那些酶。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸与这些KS核酸中的至少一种具有至少80%、85%、90%、或95%序列同一性。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸编码与这些KS酶中的至少一种具有至少80%、85%、85%、90%、或95%序列同一性的多肽。
6.4.4双功能柯巴基焦磷酸合酶(CDPS)和贝壳杉烯合酶(KS)
还可使用CDPS-KS双功能酶(EC 5.5.1.13和EC 4.2.3.19)。酶的示例性实例包括桃拟茎点霉(Phomopsis amygdali,登录号BAG30962),小立碗藓(Physcomitrella patens,登录号BAF61135),和藤仓赤霉(Gibberella fujikuroi,登录号Q9UVY5.1)的那些酶,以及US 2014/0329281A1、US 2014/0357588A1、US 2015/0159188和WO 2016/038095A2中示出的那些酶。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸与这些CDPS-KS核酸中的至少一种具有至少80%、85%、90%、或95%序列同一性。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸编码与这些CDPS-KS酶中的至少一种具有至少80%、85%、90%、或95%序列同一性的多肽。
6.4.5内根-贝壳杉烯氧化酶(KO)
内根-贝壳杉烯氧化酶(EC 1.14.13.78;本发明也称为贝壳杉烯氧化酶)催化将贝壳杉烯转化为异贝壳杉烯酸。酶的示例性实例包括稻(Oryza sativa,登录号Q5Z5R4),藤仓赤霉(Gibberella fujikuroi,登录号O94142),拟南芥(Arabidopsis thaliana,登录号Q93ZB2),甜叶菊(Stevia rebaudiana,登录号AAQ63464.1),和豌豆(Pisum sativum,Uniprot号Q6XAF4)的那些酶,以及US 2014/0329281A1、US2014/0357588A1、US 2015/0159188和WO 2016/038095A2中示出的那些酶。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸与这些KO核酸中的至少一种具有至少80%、85%、90%、或95%序列同一性。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸编码与这些KO酶中的至少一种具有至少80%、85%、90%、或95%序列同一性的多肽。
6.4.6甜菊醇合酶(KAH)
甜菊醇合酶或异贝壳杉烯酸羟化酶(KAH,EC 1.14.13)催化异贝壳杉烯酸转化为甜菊醇。酶的示例性实例包括甜叶菊(Stevia rebaudiana,登录号ACD93722),甜叶菊(Stevia rebaudiana,SEQ ID NO:10),拟南芥(Arabidopsis thaliana,登录号NP_197872),葡萄(Vitis vinifera,登录号XP_002282091),和紫花苜蓿(Medicagotrunculata,登录号ABC59076)的那些酶,以及US 2014/0329281A1、US 2014/0357588A1、US2015/0159188和WO 2016/038095A2中示出的那些酶。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸与这些KAH核酸中的至少一种具有至少80%、85%、90%、或95%序列同一性。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸编码与这些KAH酶中的至少一种具有至少80%、85%、90%、或95%序列同一性的多肽。
6.4.7细胞色素P450还原酶(CPR)
细胞色素P450还原酶(EC 1.6.2.4)对于上述KO和/或KAH的活性是必需的。酶的示例性实例包括甜叶菊(Stevia rebaudiana,登录号ABB88839),拟南芥(Arabidopsisthaliana,登录号NP_194183),藤仓赤霉(Gibberella fujikuroi,登录号CAE09055),和青蒿(Artemisia annua,登录号ABC47946.1)的那些酶,以及US 2014/0329281A1、US 2014/0357588A1、US 2015/0159188和WO 2016/038095A2中示出的那些酶。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸与这些CPR核酸中的至少一种具有至少80%、85%、90%、或95%序列同一性。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸编码与这些CPR酶中的至少一种具有至少80%、85%、90%、或95%序列同一性的多肽。
6.4.8 UDP糖基转移酶74G1(UGT74G1)
UGT74G1能够作为尿苷5'-二磷酸葡糖基:甜菊醇19-COOH转移酶起作用和作为尿苷5'-二磷酸葡糖基:甜菊醇-13-O-葡糖苷19-COOH转移酶起作用。如图1所示,UGT74G1能够将甜菊醇转化为19-糖苷。UGT74G1还能够将甜菊单糖苷转化为甜茶苷。UGT74G1还可将甜菊双糖苷转化为甜菊苷。酶的示例性实例包括甜叶菊(Stevia rebaudiana)的那些酶(例如,Richman et al.,2005,Plant J.41:56-67和US 2014/0329281和WO 2016/038095A2以及登录号AAR06920.1描述的那些)。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸与这些UGT74G1核酸中的至少一种具有至少80%、85%、90%、或95%序列同一性。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸编码与这些UGT74G1酶中的至少一种具有至少80%、85%、90%、或95%序列同一性的多肽。
6.4.9 UDP糖基转移酶76G1(UGT76G1)
UGT76G1能够将葡萄糖基团部分转移至受体分子(即甜菊醇1,2-糖苷)的C-13-O-葡萄糖的C-3'处。因此,UGT76G1能够作为尿苷5'-二磷酸葡糖基:甜菊醇13-O-1,2葡糖苷C-3'葡萄糖基转移酶起作用和作为尿苷5'-二磷酸葡糖基:甜菊醇-19-O-葡萄糖、13-O-1,2双糖苷C-3'葡萄糖基转移酶起作用。UGT76G1能够将甜菊双糖苷转化为Reb B。UGT76G1还能够将甜菊苷转化为Reb A。UGT76G1还能够将Reb D转化为Reb M。酶的示例性实例包括甜叶菊(Stevia rebaudiana)的那些酶(例如,Richman et al.,2005,Plant J.41:56-67和US2014/0329281A1和WO 2016/038095A2以及登录号AAR06912.1描述的那些)。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸与这些UGT76G1核酸中的至少一种具有至少80%、85%、90%、或95%序列同一性。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸编码与这些UGT76G1酶中的至少一种具有至少80%、85%、90%、或95%序列同一性的多肽。
6.4.10 UDP糖基转移酶85C2(UGT85C2)
UGT85C2能够作为尿苷5'-二磷酸葡糖基:甜菊醇13-OH转移酶起作用和作为尿苷5'-二磷酸葡糖基:甜菊醇-19-O-葡糖苷13-OH转移酶起作用。UGT85C2能够将甜菊醇转化为甜菊单糖苷,并还能够将19-糖苷转化为甜茶苷。酶的示例性实例包括甜叶菊(Steviarebaudiana)的那些酶(例如Richman et al.,2005,Plant J.41:56-67和US 2014/0329281A1、WO 2016/038095A2以及登录号AAR06916.1描述的那些)。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸与这些UGT85C2核酸中的至少一种具有至少80%、85%、90%、或95%序列同一性。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸编码与这些UGT85C2酶中的至少一种具有至少80%、85%、90%、或95%序列同一性的多肽。
6.4.11 UDP-糖基转移酶91D(UGT91D)
UGT91D能够作为尿苷5'-二磷酸葡糖基:甜菊醇-13-O-葡糖苷转移酶起作用,将葡萄糖基团部分转移至受体分子(甜菊醇-13-O-葡萄糖苷(甜菊单糖苷))的13-O-葡萄糖的C-2'处,以生成甜菊双糖苷。UGT91D还能够作为尿苷5'-二磷酸葡糖基:甜茶苷转移酶起作用,将葡萄糖基团部分转移至受体分子(甜茶苷)的13-O-葡萄糖的C-2'处,以提供甜菊苷。UGT91D也称为UGT91D2、UGT91D2e或UGT91D-like3。UGT91D酶的示例性实例包括甜叶菊(Stevia rebaudiana)的那些酶(例如,登录号为ACE87855.1的UGT序列,以及US2014/0329281A1,WO2016/038095A2和SEQ ID NO:7描述的那些)。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸与这些UGT91D核酸中的至少一种具有至少80%、85%、90%、或95%序列同一性。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸编码与这些UGT91D酶中的至少一种具有至少80%、85%、90%、或95%序列同一性的多肽。
6.4.12能够将Reb A转化为Reb D的尿苷二磷酸依赖性糖基转移酶(UGTAD)
尿苷二磷酸依赖性糖基转移酶(UGTAD)能够将葡萄糖基团部分转移至Reb A的19-O-葡萄糖的C-2’位置以生成Reb D。UGTAD还能够将葡萄糖基团部分转移至甜菊苷(stevioside)的19-O-葡萄糖的C-2’位置以生成Reb E。UGT有用的实例包括来自稻(Oryzasativa)的Os_UGT_91C1(在Houghton-Larsen等人的专利申请WO 2013/022989A2中也称为EUGT11;XP_015629141.1),以及来自番茄(Solanum lycopersicum)的Sl_UGT_101249881(在Markosyan等人的专利申请WO2014/193888A1中也称为UGTSL2;XP_004250485.1)。有用的UGT还包括UGT40087(XP_004982059.1;如WO 2018/031955中所述),sr.UGT_9252778,Bd_UGT10840(XP_003560669.1),Hv_UGT_V1(BAJ94055.1),Bd_UGT10850(XP_010230871.1),和Ob_UGT91B1_like(XP_006650455.1)。任何UGT或UGT变体均可用于本发明所述的组合物和方法。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸与UGT中的至少一种具有至少80%、85%、90%、或95%序列同一性。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸编码与所述这些UGT中的至少一种具有至少80%、85%、90%、或95%序列同一性的多肽。在某些实施方案,本发明提供了编码本发明所述的UGT变体的核酸。
6.5 MEV途径生成FPP和/或GGPP
在一些实施方案,本发明提供的经遗传修饰的宿主细胞包含MEV途径的一种或多种异源酶,其可用于形成FPP和/或GGPP。在一些实施方案,所述MEV途径的一种或多种酶包含使乙酰-CoA与丙二酰-CoA缩合以形成乙酰乙酰-CoA的酶。在一些实施方案,所述MEV途径的一种或多种酶包含使两分子乙酰-CoA缩合以形成乙酰乙酰-CoA的酶。在一些实施方案,所述MEV途径的一种或多种酶包含使乙酰乙酰-CoA与乙酰-CoA缩合以形成HMG-CoA的酶。在一些实施方案,所述MEV途径的一种或多种酶包含使HMG-CoA转化为甲羟戊酸的酶。在一些实施方案,所述MEV途径的一种或多种酶包含使甲羟戊酸磷酸化为甲羟戊酸5-磷酸的酶。在一些实施方案,所述MEV途径的一种或多种酶包含使甲羟戊酸5-磷酸转化为甲羟戊酸5-焦磷酸的酶。在一些实施方案,所述MEV途径的一种或多种酶包含使甲羟戊酸5-焦磷酸转化为异戊烯焦磷酸的酶。在一些实施方案,所述MEV途径的一种或多种酶包含使异戊烯焦磷酸转化为二甲基烯丙基二磷酸的酶。
在一些实施方案,所述MEV途径的一种或多种酶选自由乙酰-CoA硫解酶,乙酰乙酰-CoA合酶,HMG-CoA合酶,HMG-CoA还原酶,甲羟戊酸激酶,磷酸甲羟戊酸激酶,甲羟戊酸焦磷酸脱羧酶,和异戊基二磷酸:二甲基烯丙基二磷酸异构酶(IDI或IPP异构酶)组成的组。在一些实施方案,关于能够催化形成乙酰乙酰-CoA的所述MEV途径的酶,所述经遗传修饰的宿主细胞包含使两分子乙酰-CoA缩合以形成乙酰乙酰-CoA的酶,例如乙酰-CoA硫解酶;或者使乙酰-CoA与丙二酰-CoA缩合以形成乙酰乙酰-CoA的酶,例如乙酰乙酰-CoA合酶。在一些实施方案,所述经遗传修饰的宿主细胞包含使两分子乙酰-CoA缩合以形成乙酰乙酰-CoA的酶,例如乙酰-CoA硫解酶;和使乙酰-CoA与丙二酰-CoA缩合以形成乙酰乙酰-CoA的酶,例如乙酰乙酰-CoA合酶。
在一些实施方案,所述宿主细胞包含编码所述MEV途径的一种以上酶的一种或多种异源核苷酸序列。在一些实施方案,所述宿主细胞包含编码所述MEV途径的两种酶的一种或多种异源核苷酸序列。在一些实施方案,所述宿主细胞包含一种或多种异源核苷酸序列,所述一种或多种异源核苷酸序列编码可将HMG-CoA转化为甲羟戊酸的酶和可将甲羟戊酸转化为甲羟戊酸5-磷酸的酶。在一些实施方案,所述宿主细胞包含编码所述MEV途径的三种酶的一种或多种异源核苷酸序列。在一些实施方案,所述宿主细胞包含编码所述MEV途径的四种酶的一种或多种异源核苷酸序列。在一些实施方案,所述宿主细胞包含编码所述MEV途径的五种酶的一种或多种异源核苷酸序列。在一些实施方案,所述宿主细胞包含编码所述MEV途径的六种酶的一种或多种异源核苷酸序列。在一些实施方案,所述宿主细胞包含编码所述MEV途径的七种酶的一种或多种异源核苷酸序列。在一些实施方案,所述宿主细胞包含编码所述MEV途径的所有酶的多种异源核酸。
在一些实施方案,所述经遗传修饰的宿主细胞还包含编码酶的异源核酸,所述酶可将异戊烯焦磷酸(IPP)转化为二甲基烯丙基焦磷酸(DMAPP)。在一些实施方案,所述经遗传修饰的宿主细胞还包含编码酶的异源核酸,所述酶可使IPP和/或DMAPP分子缩合以形成聚异戊二烯基化合物。在一些实施方案,所述经遗传修饰的宿主细胞还包含编码酶的异源核酸,所述酶可修饰IPP或聚异戊二烯基以形成类异戊二烯化合物,例如FPP。
6.5.1乙酰-CoA转化为乙酰乙酰-CoA
在一些实施方案,所述经遗传修饰的宿主细胞包含编码酶的异源核苷酸序列,所述酶可使两分子的乙酰辅酶A缩合以形成乙酰乙酰-CoA,例如乙酰-CoA硫解酶。编码此种酶的核苷酸序列的示例性实例包括但不限于:(NC_000913REGION(区域):2324131.2325315;大肠杆菌(Escherichia coli)),(D49362;脱氮副球菌(Paracoccus denitrificans))和(L20428;酿酒酵母(Saccharomyces cerevisiae))。
乙酰-CoA硫解酶催化两分子乙酰-CoA的可逆缩合反应以生成乙酰乙酰-CoA,但此反应在热力学上是不利的;乙酰乙酰-CoA硫解作用优于乙酰乙酰-CoA合成作用。乙酰乙酰-CoA合酶(AACS)(或者称为乙酰-CoA:丙二酰-CoA酰基转移酶;EC 2.3.1.194)使乙酰-CoA与丙二酰-CoA缩合以形成乙酰乙酰-CoA。与乙酰-CoA硫解酶相反,由于丙二酰-CoA的相关脱羧反应,AACS催化的乙酰乙酰-CoA合成基本上是能量有利的反应。此外,AACS对乙酰乙酰-CoA未表现出硫解活性,因此所述反应是不可逆的。
在包含乙酰-CoA硫解酶和异源性ADA和/或磷酸转乙酰酶(PTA)的宿主细胞中,有利于乙酰乙酰-CoA硫解的乙酰-CoA硫解酶催化的可逆反应可导致大的乙酰-CoA库。鉴于ADA的可逆活性,此乙酰-CoA库可反过来驱动ADA朝向将乙酰-CoA转化为乙醛的逆向反应,从而减少了ADA对乙酰-CoA生成提供的益处。类似地,PTA的活性是可逆的,因此,大的乙酰-CoA库可驱使PTA朝向将乙酰-CoA转化为乙酰磷酸的逆向反应。因此,在一些实施方案,为了提供对乙酰-CoA的强拉力以驱动ADA和PTA的正向反应,本发明提供的经遗传修饰的宿主细胞的所述MEV途径利用乙酰乙酰-CoA合酶使乙酰-CoA和丙二酰-CoA形成乙酰乙酰-CoA。
在一些实施方案,AACS是来自链霉菌属(Streptomyces sp.)菌株CL190(Okamuraet al.,Proc Natl Acad Sci USA 107(25):11265-70(2010))。链霉菌属(Streptomycessp.)菌株CL190的代表性AACS核苷酸序列包括登录号AB540131.1。链霉菌属(Streptomycessp.)菌株CL190的代表性AACS蛋白质序列包括登录号D7URV0、BAJ10048。可用于本发明提供的组合物和方法的其他乙酰乙酰-CoA合酶包括但不限于,链霉菌属(Streptomyces sp.)(AB183750;KO-3988BAD86806);无环链霉菌(S.anulatus)菌株9663(FN178498;CAX48662);链霉菌属KO-3988(AB212624;BAE78983);游动放线菌属(Actinoplanes sp.)A40644(AB113568;BAD07381);链霉菌属C(NZ_ACEW010000640;ZP_05511702);达松维尔拟诺卡氏菌(Nocardiopsis dassonvillei)DSM 43111(NZ_ABUI01000023;ZP_04335288);溃疡分枝杆菌(Mycobacterium ulcerans)Agy99(NC_008611;YP_907152);海鱼分枝杆菌(Mycobacterium marinum)M(NC_010612;YP_001851502);链霉菌属Mg1(NZ_DS570501;ZP_05002626);链霉菌属AA4(NZ_ACEV01000037;ZP_05478992);玫瑰孢链霉菌(S.roseosporus)NRRL 15998(NZ_ABYB01000295;ZP_04696763);链霉菌属ACTE(NZ_ADFD01000030;ZP_06275834);产绿色链霉菌(S.viridochromogenes)DSM 40736(NZ_ACEZ01000031;ZP_05529691);弗兰克氏菌属(Frankia sp.)CcI3(NC_007777;YP_480101);巴西诺卡菌(Nocardia brasiliensis)(NC_018681;YP_006812440.1);和Austwickiachelonae放线菌(Austwickia chelonae)(NZ_BAGZ01000005;ZP_10950493.1)。其他合适的乙酰乙酰-CoA合酶包括美国专利申请公开号2010/0285549和2011/0281315中描述的那些,其内容均通过引用其整体并入本发明。
亦可用于本发明提供的组合物和方法的乙酰乙酰-CoA合酶包括那些被称为本发明所述的任何乙酰乙酰-CoA合酶的“衍生物”的分子。此种“衍生物”具有以下特征:(1)它与本发明所述的任何乙酰乙酰-CoA合酶具有基本同源性;和(2)能够催化乙酰-CoA与丙二酰-CoA的不可逆缩合反应以形成乙酰乙酰-CoA。如果衍生物的氨基酸序列与乙酰乙酰-CoA合酶的氨基酸序列为至少80%、更优选至少90%、最优选至少95%相同,则称乙酰乙酰-CoA合酶的衍生物与乙酰乙酰-CoA合酶具有“基本同源性”。
6.5.2乙酰乙酰-CoA转化为HMG-CoA
在一些实施方案,所述宿主细胞包含编码酶的异源核苷酸序列,所述酶可使乙酰乙酰-CoA与另一分子的乙酰-CoA缩合以形成3-羟基-3-甲基戊二酰-CoA(HMG-CoA),例如HMG-CoA合酶。编码此种酶的核苷酸序列的示例性实例包括但不限于:(NC_001145.补体19061.20536;酿酒酵母),(X96617;酿酒酵母),(X83882;拟南芥),(AB037907;griseola北里孢菌(Kitasatospora griseola)),(BT007302;智人(Homo sapiens)),和(NC_002758,基因座标签为SAV2546,GeneID(基因ID)为1122571;金黄色葡萄球菌(Staphylococcusaureus))。
6.5.3 HMG-CoA转化为甲羟戊酸
在一些实施方案,所述宿主细胞包含编码酶的异源核苷酸序列,所述酶可使HMG-CoA转化为甲羟戊酸,例如HMG-CoA还原酶。在一些实施方案,HMG-CoA还原酶是使用NADH的羟甲基戊二酰-CoA还原酶-CoA还原酶。HMG-CoA还原酶(EC 1.1.1.34;EC 1.1.1.88)催化(S)-HMG-CoA还原脱酰为(R)-甲羟戊酸,并可以分为两类,I类和II类HMGr(HMG-CoA还原酶)。I类包括来自真核生物和大多数古细菌的酶,II类包括某些原核生物和古细菌的HMG-CoA还原酶。除了序列的差异外,两类酶在其辅因子特异性方面也不同。与仅使用NADPH的I类酶不同,II类HMG-CoA还原酶在区分NADPH和NADH的能力方面不同。参见,例如Hedl etal.,Journal of Bacteriology 186(7):1927-1932(2004)。选择的II类HMG-CoA还原酶的辅因子特异性提供如下。
选择的II类HMG-CoA还原酶的辅因子特异性
用于本发明提供的组合物和方法的有用的HMG-CoA还原酶包括能够利用NADH作为辅因子的HMG-CoA还原酶,例如来自迈氏假单胞菌(P.mevalonii),闪烁古生球菌(A.fulgidus)或金黄色葡萄球菌(S.aureus)的HMG-CoA还原酶。在特定实施方案,所述HMG-CoA还原酶仅能够利用NADH作为辅因子,例如来自迈氏假单胞菌(P.mevalonii),波美罗伊硅杆菌(S.pomeroyi)或食酸代尔夫特菌(D.acidovorans)的HMG-CoA还原酶。
在一些实施方案,所述使用NADH的HMG-CoA还原酶来自迈氏假单胞菌(Pseudomonas mevalonii)。先前已描述了编码HMG-CoA还原酶(EC 1.1.1.88)的迈氏假单胞菌(Pseudomonas mevalonii)的野生型mvaA基因的序列。参见Beach and Rodwell,J.Bacteriol.171:2994-3001(1989)。迈氏假单胞菌(Pseudomonas mevalonii)的代表性mvaA核苷酸序列包括登录号M24015。迈氏假单胞菌(Pseudomonas mevalonii)的代表性HMG-CoA还原酶蛋白质序列包括登录号AAA25837、P13702、MVAA_PSEMV。
在一些实施方案,所述使用NADH的HMG-CoA还原酶来自波美罗伊硅杆菌(Silicibacter pomeroyi)。波美罗伊硅杆菌(Silicibacter pomeroyi)的代表性HMG-CoA还原酶核苷酸序列包括登录号NC_006569.1。波美罗伊硅杆菌(Silicibacter pomeroyi)的代表性HMG-CoA还原酶蛋白质序列包括登录号YP_164994。
在一些实施方案,所述使用NADH的HMG-CoA还原酶来自食酸代尔夫特菌(Delftiaacidovorans)。食酸代尔夫特菌(Delftia acidovorans)的代表性HMG-CoA还原酶核苷酸序列包括NC_010002REGION:补体(319980..321269)。食酸代尔夫特菌(Delftiaacidovorans)的代表性HMG-CoA还原酶蛋白质序列包括登录号YP_001561318。
在一些实施方案,所述使用NADH的HMG-CoA还原酶来自马铃薯(Solanumtuberosum)(Crane et al.,J.Plant Physiol.159:1301-1307(2002))。
在本发明提供的组合物和方法中还可采用的使用NADH的HMG-CoA还原酶包括那些被称为任何本发明所述的使用NADH的HMG-CoA还原酶的“衍生物”的分子,例如来自迈氏假单胞菌(P.mevalonii),波美罗伊硅杆菌(S.pomeroyi)和食酸代尔夫特菌(D.acidovorans)的使用NADH的HMG-CoA还原酶的“衍生物”的分子。此种“衍生物”具有以下特征:(1)它与任何本发明所述的使用NADH的HMG-CoA还原酶具有基本同源性;和(2)能够催化(S)-HMG-CoA还原脱酰为(R)-甲羟戊酸,同时优先使用NADH作为辅因子。如果所述衍生物的氨基酸序列与使用NADH的HMG-CoA还原酶的氨基酸序列为至少80%,更优选至少90%,最优选至少95%相同,则称使用NADH的HMG-CoA还原酶的衍生物与使用NADH的HMG-CoA还原酶具有“基本同源性”。
本发明使用的短语“使用NADH/NADH-使用的”是指所述使用NADH的HMG-CoA还原酶对NADH作为辅因子相对NADPH作为辅因子具有选择性,譬如,通过证明对NADH的比活性高于对NADPH的比活性。在一些实施方案,对作为辅因子的NADH的选择性表示为kcat (NADH)/kcat (NADPH)比值。在一些实施方案,所述使用NADH的HMG-CoA还原酶具有至少5、10、15、20、25或大于25的kcat (NADH)/kcat (NADPH)比值。在一些实施方案,所述使用NADH的HMG-CoA还原酶仅使用NADH。譬如,仅使用NADH的使用NADH的HMG-CoA还原酶显示出一定活性,其中NADH作为体外唯一的辅因子提供,并且当NADPH作为唯一辅因子提供时显示出不可检测的活性。可利用本领域已知的任何确定辅因子特异性的方法来鉴定优先选择NADH作为辅因子的HMG-CoA还原酶,包括Kim et al.,Protein Science 9:1226-1234(2000);和Wilding et al.,J.Bacteriol.182(18):5147-52(2000)中描述的那些,其内容均通过引用其整体并入本发明。
在一些实施方案,所述使用NADH的HMG-CoA还原酶被设计为对NADH相较NAPDH具有选择性,例如,通过辅因子结合口袋的定点诱变来设计。工程化设计NADH选择性的方法记载在Watanabe et al.,Microbiology 153:3044-3054(2007)中,用于确定HMG-CoA还原酶的辅因子特异性的方法记载在Kim et al.,Protein Sci.9:1226-1234(2000)中,其内容均通过引用其整体并入本发明。
在一些实施方案,所述使用NADH的HMG-CoA还原酶衍生自天然包含甲羟戊酸降解途径的宿主物种,例如,使作为其唯一碳源的甲羟戊酸分解代谢的宿主物种。在所述这些实施方案中,所述使用NADH的HMG-CoA还原酶,其通常催化在其原生宿主细胞内的内化的(R)-甲羟戊酸氧化酰化为(S)-HMG-CoA,用于催化所述逆向反应,即,在包含甲羟戊酸生物合成途径的经遗传修饰的宿主细胞中,使(S)-HMG-CoA还原脱酰为(R)-甲羟戊酸。能够在作为其唯一碳源的甲羟戊酸上生长的原核生物已记载在:Anderson et al.,J.Bacteriol,171(12):6468-6472(1989);Beach et al.,J.Bacteriol.171:2994-3001(1989);Bensch etal.,J.Biol.Chem.245:3755-3762;Fimongnari et al.,Biochemistry 4:2086-2090(1965);Siddiqi et al.,Biochem.Biophys.Res.Commun.8:110-113(1962);Siddiqi etal.,J.Bacteriol.93:207-214(1967);和Takatsuji et al.,Biochem.Biophys.Res.Commun.110:187-193(1983)中,其内容均通过引用其整体并入本发明。
在本发明提供的组合物和方法的一些实施方案中,所述宿主细胞包含使用NADH的HMGr(HMG-CoA还原酶)和使用NADPH的HMG-CoA还原酶。编码使用NADPH的HMG-CoA还原酶的核苷酸序列的示例性实例包括但不限于:(NM_206548;黑腹果蝇(Drosophilamelanogaster)),(NC_002758,基因座标签为SAV2545,基因ID(GeneID)为1122570;金黄色葡萄球菌(Staphylococcus aureus)),(AB015627;链霉菌属(Streptomyces sp.)KO3988),(AX128213,提供编码截短的HMG-CoA还原酶的序列;酿酒酵母(Saccharomycescerevisiae)),和(NC_001145:补体(115734.118898;酿酒酵母(Saccharomycescerevisiae))。
6.5.4甲羟戊酸转化为甲羟戊酸-5-磷酸
在一些实施方案,所述宿主细胞包含编码酶的异源核苷酸序列,所述酶可将甲羟戊酸转化为甲羟戊酸5-磷酸,例如甲羟戊酸激酶。编码此种酶的核苷酸序列的示例性实例包括但不限于:(L77688;拟南芥(Arabidopsis thaliana)),和(X55875;酿酒酵母(Saccharomyces cerevisiae))。
6.5.5甲羟戊酸-5-磷酸转化为甲羟戊酸-5-焦磷酸
在一些实施方案,所述宿主细胞包含编码酶的异源核苷酸序列,所述酶可将甲羟戊酸5-磷酸转化为甲羟戊酸5-焦磷酸,例如磷酸甲羟戊酸激酶。编码此种酶的核苷酸序列的示例性实例包括但不限于:(AF429385;巴西橡胶树(Hevea brasiliensis)),(NM_006556;智人(Homo sapiens)),和(NC_001145.补体712315.713670;酿酒酵母(Saccharomyces cerevisiae))。
6.5.6甲羟戊酸-5-焦磷酸转化为IPP
在一些实施方案,所述宿主细胞包含编码酶的异源核苷酸序列,所述酶可将甲羟戊酸5-焦磷酸转化为异戊烯焦磷酸(IPP),例如甲羟戊酸焦磷酸脱羧酶。编码此种酶的核苷酸序列的示例性实例包括但不限于:(X97557;酿酒酵母(Saccharomyces cerevisiae)),(AF290095;屎肠球菌(Enterococcus faecium)),和(U49260;智人(Homo sapiens))。
6.5.7 IPP转化为DMAPP
在一些实施方案,所述宿主细胞还包含编码酶的异源核苷酸序列,所述酶可将通过MEV途径生成的IPP转化为二甲基烯丙基焦磷酸(DMAPP),例如IPP异构酶。编码此种酶的核苷酸序列的示例性实例包括但不限于:(NC_000913,3031087.3031635;大肠杆菌(Escherichia coli)),和(AF082326;雨生红球藻(Haematococcus pluvialis))。
6.5.8聚异戊二烯合酶
在一些实施方案,所述宿主细胞还包含编码聚异戊二烯合酶的异源核苷酸序列,所述聚异戊二烯合酶可使IPP和/或DMAPP分子缩合以形成含有多于5个碳的聚异戊二烯基化合物。
在一些实施方案,所述宿主细胞包含编码酶的异源核苷酸序列,所述酶可将一分子IPP与一分子DMAPP缩合以形成一分子香叶基焦磷酸(“GPP”),例如GPP合酶。编码此种酶的核苷酸序列的示例性实例包括但不限于:(AF513111;巨冷杉(Abies grandis)),(AF513112;巨冷杉),(AF513113;巨冷杉),(AY534686;金鱼草(Antirrhinum majus)),(AY534687;金鱼草),(Y17376;拟南芥(Arabidopsis thaliana)),(AE016877,基因座AP11092;蜡样芽胞杆菌(Bacillus cereus);ATCC 14579),(AJ243739;甜橙(Citrussinensis)),(AY534745;仙女扇(Clarkia breweri)),(AY953508;齿小蠹(Ips pini)),(DQ286930;番茄(Lycopersicon esculentum)),(AF182828;胡椒薄荷(Mentha xpiperita)),(AF182827;胡椒薄荷),(MPI249453;胡椒薄荷),(PZE431697,基因座CAD24425;玉米黄质副球菌(Paracoccus zeaxanthinifaciens)),(AY866498;胡黄连(Picrorhiza kurrooa)),(AY351862;葡萄(Vitis vinifera)),和(AF203881,基因座AAF12843;运动发酵单胞菌(Zymomonas mobilis))。
在一些实施方案,所述宿主细胞包含编码酶的异源核苷酸序列,所述酶可将两分子IPP与一分子DMAPP缩合,或者将IPP分子添加至GPP分子中,以形成法呢基焦磷酸(“FPP”)分子,例如FPP合酶。编码此种酶的核苷酸序列的示例性实例包括但不限于:(ATU80605;拟南芥),(ATHFPS2R;拟南芥),(AAU36376;青蒿(Artemisia annua)),(AF461050;普通牛(Bostaurus)),(D00694;大肠杆菌K-12),(AE009951,基因座AAL95523;具核梭杆菌具核亚种(Fusobacterium nucleatum subsp.nucleatum)ATCC25586),(GFFPPSGEN;藤仓赤霉(Gibberella fujikuroi)),(CP000009,基因座AAW60034;氧化葡萄糖杆菌(Gluconobacteroxydans)621H),(AF019892;向日葵(Helianthus annuus)),(HUMFAPS;智人(Homosapiens)),(KLPFPSQCR;乳酸克鲁维酵母(Kluyveromyces lactis)),(LAU15777;白羽扇豆(Lupinus albus)),(LAU20771;白羽扇豆),(AF309508;小家鼠(Mus musculus)),(NCFPPSGEN;粗糙脉孢菌(Neurospora crassa)),(PAFPS1;灰白银胶菊(Partheniumargentatum)),(PAFPS2;灰白银胶菊),(RATFAPS;褐家鼠(Rattus norvegicus)),(YSCFPP;酿酒酵母),(D89104;粟酒裂殖酵母(Schizosaccharomyces pombe)),(CP000003,基因座AAT87386;酿脓链球菌(Streptococcus pyogenes)),(CP000017,基因座AAZ51849;酿脓链球菌),(NC_008022,基因座YP_598856;酿脓链球菌MGAS10270),(NC_008023,基因座YP_600845;酿脓链球菌MGAS2096),(NC_008024,基因座YP_602832;酿脓链球菌MGAS10750),(MZEFPS;玉米(Zea mays)),(AE000657,基因座AAC06913;风产液菌(Aquifex aeolicus)VF5),(NM_202836;拟南芥),(D84432,基因座BAA12575;枯草芽孢杆菌(Bacillussubtilis)),(U12678,基因座AAC28894;慢生型大豆根瘤菌(Bradyrhizobium japonicum)USDA 110),(BACFDPS;嗜热脂肪土芽孢杆菌(Geobacillus stearothermophilus)),(NC_002940,基因座NP_873754;杜克雷嗜血杆菌(Haemophilus ducreyi)35000HP),(L42023,基因座AAC23087;流感嗜血杆菌(Haemophilus influenzae)Rd KW20),(J05262;智人(Homosapiens)),(YP_395294;沙克乳酸杆菌沙克亚种(Lactobacillus sakei subsp.sakei)23K),(NC_005823,基因座YP_000273;Copenhageni str.Fiocruz钩端螺旋体血清变型(Leptospira interrogans serovar Copenhageni str.Fiocruz)L1-130),(AB003187;藤黄微球菌(Micrococcus luteus)),(NC_002946,基因座YP_208768;淋病奈瑟氏菌(Neisseria gonorrhoeae)FA 1090),(U00090,基因座AAB91752;根瘤菌属(Rhizobiumsp.)NGR234),(J05091;酿酒酵母),(CP000031,基因座AAV93568;波美罗伊硅杆菌(Silicibacter pomeroyi)DSS-3),(AE008481,基因座AAK99890;肺炎链球菌(Streptococcus pneumoniae)R6),和(NC_004556,基因座NP 779706;木质部难养菌特曼库拉1(Xylella fastidiosa Temecula1)。
在一些实施方案,所述宿主细胞还包含编码酶的异源核苷酸序列,所述酶可将IPP和DMAPP或IPP和FPP进行结合以形成香叶基香叶基焦磷酸(“GGPP”)。编码此种酶的核苷酸序列的示例性实例包括但不限于:(ATHGERPYRS;拟南芥),(BT005328;拟南芥),(NM_119845;拟南芥),(NZ_AAJM01000380,基因座ZP_00743052;苏云金芽孢杆菌血清变型(Bacillus thuringiensis serovar israelensis),ATCC 35646sq1563),(CRGGPPS;长春花(Catharanthus roseus)),(NZ_AABF02000074,基因座ZP_00144509;具核梭杆菌文森特亚种(Fusobacterium nucleatum subsp.vincentii),ATCC 49256),(GFGGPPSGN;藤仓赤霉(Gibberella fujikuroi)),(AY371321;银杏(Ginkgo biloba)),(AB055496;巴西橡胶树(Hevea brasiliensis)),(AB017971;智人(Homo sapiens)),(MCI276129;卢西坦毛霉(Mucor circinelloides f.lusitanicus)),(AB016044;小家鼠(Mus musculus)),(AABX01000298,基因座NCU01427;粗糙脉孢菌(Neurospora crassa)),(NCU20940;粗糙脉孢菌),(NZ_AAKL01000008,基因座ZP_00943566;青枯雷尔氏菌(Ralstonia solanacearum)UW551),(AB118238;褐家鼠(Rattus norvegicus)),(SCU31632;酿酒酵母),(AB016095;细长聚球藻(Synechococcus elongates)),(SAGGPS;白芥子(Sinapis alba)),(SSOGDS;嗜酸热硫化叶菌(Sulfolobus acidocaldarius)),(NC_007759,基因座YP_461832;aciditrophicus互养菌(Syntrophus aciditrophicus)SB),(NC_006840,基因座YP_204095;费氏弧菌(Vibrio fischeri)ES114),(NM_112315;拟南芥),(ERWCRTE;成团泛菌(Pantoea agglomerans)),(D90087,基因座BAA14124;菠萝泛菌(Pantoea ananatis)),(X52291,基因座CAA36538;荚膜红细菌(Rhodobacter capsulatus)),(AF195122,基因座AAF24294;类球红细菌(Rhodobacter sphaeroides)),和(NC_004350,基因座NP_721015;变异链球菌(Streptococcus mutans)UA159)。
虽然上文描述了甲羟戊酸途径的酶的实例,但在某些实施方案,所述DXP途径的酶在本发明所述的宿主细胞、组合物和方法中可用作生成DMAPP和IPP的替代途径或另外的途径。所述DXP途径的酶以及编码所述酶的核酸是本领域公知的并已在现有技术例如WO2012/135591A2中进行表征。
6.6生成甜菊糖苷类化合物的方法
另一方面,本发明提供了生成甜菊糖苷的方法,所述方法包含以下步骤:(a)在适于制备甜菊糖苷化合物的条件下,在含有碳源的培养基中培养能够生成所述甜菊糖苷的任何本发明所述的经遗传修饰的宿主细胞的种群;和(b)从所述培养基回收所述甜菊糖苷化合物。
在一些实施方案,与不包含一种或多种修饰的亲本细胞相比,或者与仅包含所述经遗传修饰的宿主细胞的一种或多种修饰的子集,但在遗传上是相同的亲本细胞相比,所述经遗传修饰的宿主细胞生成增加量的甜菊糖苷。在一些实施方案,所述增加的量为至少1%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、100%、或大于100%,例如,以产量、生成量、生产率计,或以克/升细胞培养物,毫克/克干细胞重量计,或者基于每单位体积的细胞培养物,基于每单位干细胞重量,基于每单位时间的每单位体积的细胞培养物,或基于每单位时间的每单位干细胞重量计,进行测定。
在一些实施方案,所述宿主细胞生成升高水平的甜菊糖苷,其大于约1克/升发酵培养基。在一些实施方案,所述宿主细胞生成升高水平的甜菊糖苷,其大于约5克/升发酵培养基。在一些实施方案,所述宿主细胞生成升高水平的甜菊糖苷,其大于约10克/升发酵培养基。在一些实施方案,所述甜菊糖苷以从约10至约50克/升细胞培养物,从约10至约15克/升细胞培养物,超过约15克/升细胞培养物,超过约20克/升细胞培养物,超过约25克/升细胞培养物,超过约30克/升细胞培养物的量生成。
在一些实施方案,所述宿主细胞生成升高水平的甜菊糖苷,其大于约50毫克每克干细胞重量。在一些此类实施方案中,所述甜菊糖苷以从约50至约1500毫克,超过约100毫克,超过约150毫克,超过约200毫克,超过约250毫克,超过约500毫克,超过约750毫克,或超过约1000毫克每克干细胞重量的量生成。
在一些实施方案,所述宿主细胞生成升高水平的甜菊糖苷,其比由亲本细胞生成的甜菊糖苷水平高至少约10%,至少约15%,至少约20%,至少约25%,至少约30%,至少约35%,至少约40%,至少约45%,至少约50%,至少约60%,至少约70%,至少约80%,至少约90%,至少约2倍,至少约2.5倍,至少约5倍,至少约10倍,至少约20倍,至少约30倍,至少约40倍,至少约50倍,至少约75倍,至少约100倍,至少约200倍,至少约300倍,至少约400倍,至少约500倍,或至少约1000倍或更多,基于每单位体积细胞培养物。
在一些实施方案,所述宿主细胞生成升高水平的甜菊糖苷,其比由亲本细胞生成的甜菊糖苷水平高至少约10%,至少约15%,至少约20%,至少约25%,至少约30%,至少约35%,至少约40%,至少约45%,至少约50%,至少约60%,至少约70%,至少约80%,至少约90%,至少约2倍,至少约2.5倍,至少约5倍,至少约10倍,至少约20倍,至少约30倍,至少约40倍,至少约50倍,至少约75倍,至少约100倍,至少约200倍,至少约300倍,至少约400倍,至少约500倍,或至少约1000倍或更多,基于每单位干细胞重量。
在一些实施方案,所述宿主细胞生成升高水平的甜菊糖苷,其比由亲本细胞生成的甜菊糖苷水平高至少约10%,至少约15%,至少约20%,至少约25%,至少约30%,至少约35%,至少约40%,至少约45%,至少约50%,至少约60%,至少约70%,至少约80%,至少约90%,至少约2倍,至少约2.5倍,至少约5倍,至少约10倍,至少约20倍,至少约30倍,至少约40倍,至少约50倍,至少约75倍,至少约100倍,至少约200倍,至少约300倍,至少约400倍,至少约500倍,或至少约1000倍或更多,基于每单位时间的每单位体积细胞培养物。
在一些实施方案,所述宿主细胞生成升高水平的甜菊糖苷,其比由亲本细胞生成的甜菊糖苷水平高至少约10%,至少约15%,至少约20%,至少约25%,至少约30%,至少约35%,至少约40%,至少约45%,至少约50%,至少约60%,至少约70%,至少约80%,至少约90%,至少约2倍,至少约2.5倍,至少约5倍,至少约10倍,至少约20倍,至少约30倍,至少约40倍,至少约50倍,至少约75倍,至少约100倍,至少约200倍,至少约300倍,至少约400倍,至少约500倍,或至少约1000倍或更多,基于每单位时间的每单位干细胞重量。
在大多实施方案中,所述宿主细胞生成的升高水平的甜菊糖苷是在诱导化合物存在下进行诱导。在不存在所述诱导化合物情况下,可容易地操作此种宿主细胞。然后加入所述诱导化合物以诱导所述宿主细胞生成升高水平的甜菊糖苷。在其他实施方案,通过改变培养条件,例如改变生长温度、培养基成分等,可诱导所述宿主细胞生成升高水平的甜菊糖苷。
6.7培养基和培养条件
用于微生物培养物的维持和生长的物料和方法是微生物学或发酵科学领域的技术人员所熟知的(参见,例如Bailey et al.,Biochemical Engineering Fundamentals,second edition,McGraw Hill,New York,1986)。根据宿主细胞、发酵和过程/方法的特定要求,必须考虑适当的培养基,pH值,温度,以及需氧、微需氧或厌氧条件的要求。
本发明提供的生成甜菊糖苷类化合物的方法可在合适的容器(包括但不限于细胞培养板、微量滴定板、烧瓶或发酵罐)中于合适的培养基(例如,含或不含泛酸补充)中进行。此外,所述方法可以本领域已知的任何发酵规模进行,以支持微生物产物的工业生产。可使用任何合适的发酵罐,包括搅拌槽式发酵罐,气升式发酵罐,气泡式发酵罐,或其任何组合。在利用酿酒酵母(Saccharomyces cerevisiae)作为宿主细胞的特定实施方案中,菌株可在发酵罐中生长,详细记载如Kosaric,et al,Ullmann's Encyclopedia of IndustrialChemistry,Sixth Edition,Volume 12,pages 398-473,Wiley-VCH Verlag GmbH&Co.KDaA,Weinheim,Germany中所述。
在一些实施方案,所述培养基是其中能够生成甜菊糖苷的经遗传修饰的微生物可以存活,即保持生长和活力的任何培养基。在一些实施方案,所述培养基是包含可同化的碳源、氮源和磷源(phosphate source)的水性培养基。此种培养基还可包括适当的盐类、矿物质类、金属类和其他营养物类。在一些实施方案,将所述碳源和每种必需细胞营养物增量地或连续地添加到发酵培养基中,并将每种所需营养物通过使细胞生长,譬如,根据基于将碳源转化成生物量的细胞的代谢或呼吸功能的预定细胞生长曲线,保持在基本有效同化所需的最低水平。
用于培养微生物的合适条件和合适的培养基是本领域熟知的。在一些实施方案,所述合适的培养基补充有一种或多种另外的试剂,例如诱导物(例如,当编码基因产物的一个或多个核苷酸序列受诱导型启动子的控制时),阻抑物(例如,当编码基因产物的一个或多个核苷酸序列受阻抑型启动子的控制时),或选择剂(例如,选择包含所述遗传修饰的微生物的抗生素)。
在一些实施方案,所述碳源是单糖(简单糖)、二糖、多糖、不可发酵的碳源、或其一种或多种组合。合适的单糖的非限制性实例包括葡萄糖、半乳糖、甘露糖、果糖、木糖、核糖、和其组合。合适的二糖的非限制性实例包括蔗糖、乳糖、麦芽糖、海藻糖、纤维二糖、和其组合。合适的多糖的非限制性实例包括淀粉、糖原、纤维素、几丁质、和其组合。合适的不可发酵碳源的非限制性实例包括乙酸盐和甘油。
所述培养基中碳源(例如葡萄糖)的浓度足以促进细胞生长,但不能高到抑制所用微生物的生长。通常,培养物采用碳源(例如葡萄糖)进行,所述碳源以达到所需生长水平和所需生物量的水平进行添加。在其他实施方案,所述培养基中碳源(例如葡萄糖)的浓度大于约1g/L,优选大于约2g/L,更优选大于约5g/L。此外,所述培养基中碳源(例如葡萄糖)的浓度通常小于约100g/L,优选小于约50g/L,更优选小于约20g/L。应当注意,对培养组分浓度的提及可以指初始和/或正在进行的组分浓度。在一些案例中,可能需要在培养期间使所述培养基耗尽碳源。
可用于合适培养基的可同化氮的来源包括但不限于简单氮源、有机氮源和复合氮源。此类氮源包括无水氨,铵盐类,以及动物、植物和/或微生物来源的物质。合适的氮源包括但不限于,蛋白质水解产物类,微生物生物质水解产物类,蛋白胨,酵母提取物,硫酸铵,尿素和氨基酸类。通常,所述培养基中所述氮源的浓度大于约0.1g/L,优选大于约0.25g/L,更优选大于约1.0g/L。然而,超过一定浓度,向所述培养基中添加氮源对于微生物的生长是不利的。因此,所述培养基中所述氮源的浓度小于约20g/L,优选小于约10g/L,更优选小于约5g/L。此外,在一些实施例中,可能需要在培养期间使所述培养基耗尽所述氮源。
有效的培养基可含有其他化合物,例如无机盐类、维生素类、痕量金属类、或生长促进剂类。此类其他化合物也可存在于有效培养基中的碳源、氮源或矿物源中,或者可特异性地添加至所述培养基中。
所述培养基还可含有合适的磷源。此类磷源包括无机磷源和有机磷源。优选的磷源包括但不限于磷酸盐类,例如单或二元磷酸钠及单或二元磷酸钾、磷酸铵、和其混合物。通常,所述培养基中磷酸盐的浓度大于约1.0g/L,优选大于约2.0g/L,更优选大于约5.0g/L。然而,超过一定浓度,向所述培养基中添加磷酸盐对于微生物的生长是不利的。因此,所述培养基中所述磷酸盐的浓度通常小于约20g/L,优选小于约15g/L,更优选小于约10g/L。
合适的培养基还可包括镁源,优选地以生理学上可接受的盐的形式,例如七水合硫酸镁,尽管可使用浓度为贡献相似量的镁的其他镁源。通常,所述培养基中镁的浓度大于约0.5g/L,优选大于约1.0g/L,更优选大于约2.0g/L。然而,超过一定浓度,向所述培养基中添加镁对于微生物的生长是不利的。因此,所述培养基中镁的浓度通常小于约10g/L,优选小于约5g/L,更优选小于约3g/L。此外,在一些实施例中,可能需要在培养期间使所述培养基耗尽镁源。
在一些实施方案,所述培养基还可包含生物学上可接受的螯合剂,例如二水合柠檬酸三钠。在此类实施例中,所述培养基中螯合剂的浓度大于约0.2g/L,优选大于约0.5g/L,更优选大于约1g/L。然而,超过一定浓度,向所述培养基中添加螯合剂对于微生物的生长是不利的。因此,所述培养基中螯合剂的浓度通常小于约10g/L,优选小于约5g/L,更优选小于约2g/L。
所述培养基最初还可包括生物学上可接受的酸或碱以维持所述培养基的所需pH值。生物学上可接受的酸包括但不限于,盐酸、硫酸、硝酸、磷酸、和其混合物。生物学上可接受的碱包括但不限于,氢氧化铵、氢氧化钠、氢氧化钾、和其混合物。在一些实施方案,使用的碱是氢氧化铵。
所述培养基还可包括生物学上可接受的钙源,包括但不限于氯化钙。通常,所述培养基中所述钙源(例如氯化钙二水合物)的浓度在约5mg/L至约2000mg/L的范围内,优选在约20mg/L至约1000mg/L的范围内,更优选在约50mg/L至约500mg/L的范围内。
所述培养基还可包括氯化钠。通常,所述培养基中氯化钠的浓度在约0.1g/L至约5g/L的范围内,优选在约1g/L至约4g/L的范围内,更优选在约2g/L至约4g/L的范围内。
在一些实施方案,所述培养基还可包含痕量金属。此类痕量金属可作为储备溶液添加至所述培养基中,为方便起见,可与培养基的其余部分分开制备。通常,添加至所述培养基中的此痕量金属溶液的量大于约1mL/L,优选大于约5mL/L,更优选大于约10mL/L。然而,超过一定浓度,向所述培养基中添加痕量金属对于微生物的生长是不利的。因此,添加至所述培养基中的此痕量金属溶液的量通常小于约100mL/L,优选小于约50mL/L,更优选小于约30mL/L。应注意的是,除了在储备溶液中添加痕量金属之外,各个组分可单独进行添加,各自在与上述痕量金属溶液范围所规定的组分的量相对应的范围内。
在一些实施方案,所述培养基可包括其他维生素类,例如泛酸、生物素、钙、泛酸盐、肌醇、吡哆醇-HCl和硫胺素-HCl。此类维生素可作为储备溶液添加至所述培养基中,为方便起见,可与培养基的其余部分分开制备。然而,超过一定浓度,向所述培养基中添加维生素类不利于微生物的生长。
本发明所述的发酵方法可以常规培养模式进行,所述培养模式包括但不限于分批、补料分批、细胞再循环、连续和半连续。在一些实施方案,所述发酵以补料分批模式进行。在此类案例中,所述培养基中的一些组分在培养期间被耗尽,所述组分包括在发酵的生成阶段期间的泛酸。在一些实施方案,所述培养物可在开始时(例如,生成阶段)补充相对高浓度的此类组分,使得在需要添加之前支持生长和/或甜菊糖苷生成一段时间。所述这些组分的优选范围在整个培养过程中通过添加来维持,所述添加以培养物耗尽的水平进行添加。可通过例如定期对培养基取样并测定浓度来监测所述培养基中组分的水平。或者,一旦开发出标准培养程序,所述添加可在整个培养期间的特定时间对应于已知水平以一定时间间隔进行。如本领域技术人员将认识到的,随着所述培养基的细胞密度增加,培养期间营养物的消耗速率亦将增加。此外,为了避免将外来微生物引入培养基中,可使用本领域已知的无菌添加方法进行添加。此外,在培养期间可加入少量消泡剂。
所述培养基的温度可以是适于经遗传修饰的细胞生长和/或甜菊糖苷生成的任何温度。譬如,在用接种物接种培养基之前,所述培养基可置于并保持在约20℃至约45℃的温度范围,优选保持在约25℃至约40℃的温度范围,更优选保持在约28℃至约32℃的温度范围。
可通过向所述培养基中添加酸或碱来控制所述培养基的pH值。在此类案例中,当氨用于控制pH时,其也方便地用作所述培养基中的氮源。优选地,所述pH值保持在约3.0至约8.0,更优选保持在约3.5至约7.0,最优选保持在约4.0至约6.5。
在一些实施方案,在培养期间监测所述培养基的碳源浓度,例如葡萄糖浓度。可使用已知技术监测所述培养基的葡萄糖浓度,例如,采用葡萄糖氧化酶试验或高压液相色谱,其可用于监测上清液(例如,所述培养基的无细胞组分)中的葡萄糖浓度。所述碳源浓度通常保持低于发生细胞生长抑制的水平。虽然此浓度可能因生物体而异,但对于葡萄糖作为碳源,细胞生长抑制发生在葡萄糖浓度大于约60g/L时,并可通过试验容易地确定。因此,当葡萄糖用作碳源时,优选将葡萄糖加入发酵罐中并保持在检测限以下。或者,所述培养基中的葡萄糖浓度维持在约1g/L至约100g/L的范围内,更优选地维持在约2g/L至约50g/L的范围内,更优选地维持在约5g/L至约20g/L的范围内。尽管通过添加例如基本上纯的葡萄糖溶液,可将所述碳源浓度维持在所需水平,但通过添加初始培养基的等分试样来维持所述培养基的所述碳源浓度是可接受的,并且可能是优选的。使用初始培养基的等分试样是可取的,因为可同时维持所述培养基中其他营养物(例如,氮源和磷源)的浓度。同样,通过添加痕量金属溶液的等份试样,亦可在所述培养基中维持所述痕量金属浓度。
其他合适的发酵培养基和方法记载在例如WO 2016/196321中。
6.8发酵组合物
另一方面,本发明提供了发酵组合物,其包含本发明所述的经遗传修饰的宿主细胞和由所述经遗传修饰的宿主细胞生成的甜菊糖苷类化合物。所述发酵组合物可进一步包含培养基。在某些实施方案,所述发酵组合物包含经遗传修饰的宿主细胞,和进一步包含Reb A、Reb D和Reb M。在某些实施方案,本发明提供的发酵组合物包含Reb M,作为由所述经遗传修饰的宿主细胞生成的甜菊糖苷类化合物的主要组分。在某些实施方案,所述发酵组合物包含Reb A:Reb D:Reb M之比为至少1:7:50的RebA、RebD和RebM。在某些实施方案,所述发酵组合物包含Reb A:Reb D:Reb M之比为至少1:7:50至1:100:1000的RebA、RebD和RebM。在某些实施方案,所述发酵组合物包含Reb A:Reb D:Reb M之比为至少1:7:50至1:200:2000。在某些实施方案,所述Reb A、Reb D和Reb M的比例是基于与所述经遗传修饰的宿主细胞和所述培养基相关的甜菊糖苷类化合物的总含量。在某些实施方案,所述Reb A、Reb D和Reb M的比例是基于所述培养基中甜菊糖苷类化合物的总含量。在某些实施方案,所述Reb A、Reb D和Reb M的比例是基于与所述经遗传修饰的宿主细胞相关的甜菊糖苷类化合物的总含量。
在某些实施方案,本发明提供的发酵组合物包含不可检测水平的Reb M2。在某些实施方案,本发明提供的发酵组合物包含不可检测水平的非天然存在的甜菊糖苷类化合物。
6.9甜菊糖苷类化合物的回收
一旦甜菊糖苷由所述宿主细胞生成,便可使用本领域已知的任何合适的分离和纯化方法将其回收或分离用于后续应用。在一些实施方案,通过离心将包含甜菊糖苷的澄清水相从发酵物分离得到。在其他实施方案,通过将破乳剂添加至发酵反应中,将包含甜菊糖苷的澄清水相从发酵物分离得到。破乳剂的示例性实例包括絮凝剂类和凝结剂类。
在所述这些细胞中生成的甜菊糖苷可存在于培养物上清液中和/或与所述宿主细胞结合。在甜菊糖苷与宿主细胞结合的实施方案中,所述甜菊糖苷的回收可包括改善甜菊糖苷从细胞中释放的方法。在一些实施方案,这可采取用热水或缓冲液处理,有或没有表面活性剂,有或没有添加缓冲剂或盐的方式来清洗细胞的形式。在一些实施方案,所述温度是认为适合释放甜菊糖苷类化合物的任何温度。在一些实施方案,所述温度是从40℃至95℃;或从60℃至90℃;或从75℃到85℃的范围。在一些实施方案,所述温度是40℃、45℃、50℃、55℃、65℃、70℃、75℃、80℃、85℃、90℃、或95℃。在一些实施方案,物理或化学细胞破坏可用于增强甜菊糖苷类化合物从宿主细胞释放。或者和/或随后,可使用分离单元操作来回收所述培养基中的甜菊糖苷,所述分离单元操作包括但不限于,溶剂萃取法、膜澄清法、膜浓缩法、吸附法、色谱法、蒸发法、化学衍生化法、结晶法和干燥法。
6.10制备经遗传修饰的细胞的方法
本发明还提供了用于生成宿主细胞的方法,所述宿主细胞经遗传工程改造以包含一种或多种上述修饰,例如,编码甜叶菊(Stevia rebaudiana)异贝壳杉烯酸羟化酶和/或生物合成途径酶(例如用于甜菊糖苷化合物的生物合成途径酶)的一种或多种异源核酸。异源酶在宿主细胞中的表达可通过在所述宿主细胞中引入包含编码所述酶的核苷酸序列的核酸来实现,所述核酸受允许在所述宿主细胞中表达的调节元件的控制。在一些实施方案,所述核酸是染色体外质粒。在其他实施方案,所述核酸是染色体整合载体,其可将所述核苷酸序列整合到所述宿主细胞的染色体中。在其他实施方案,所述核酸是线性双链DNA片段,其可通过同源性将核苷酸序列整合到宿主细胞的染色体中。
可通过本领域技术人员已知的任何方法,且不限于这些方法,将编码这些蛋白质的核酸引入所述宿主细胞中(参见,例如Hinnen et al.(1978)Proc.Natl.Acad.Sci.USA75:1292-3;Cregg et al.(1985)Mol.Cell.Biol.5:3376-3385;Goeddel et al.eds,1990,Methods in Enzymology,vol.185,Academic Press,Inc.,CA;Krieger,1990,GeneTransfer and Expression--A Laboratory Manual,Stockton Press,NY;Sambrook etal.,1989,Molecular Cloning--A Laboratory Manual,Cold Spring HarborLaboratory,NY;和Ausubel et al.,eds.,Current Edition,Current Protocols inMolecular Biology,Greene Publishing Associates and Wiley Interscience,NY)。示例性技术包括但不限于原生质球法、电穿孔法、PEG1000介导的转化、和乙酸锂或氯化锂介导的转化。
可通过修饰编码所述酶的基因的转录来改变宿主细胞中酶的量。其可通过例如以下方式来实现:通过修饰编码所述酶的所述核苷酸序列的拷贝数(例如,通过使用包含所述核苷酸序列的更高或更低拷贝数的表达载体,或通过将所述核苷酸序列另外的拷贝引入所述宿主细胞的基因组中,或通过删除或破坏所述宿主细胞基因组中的所述核苷酸序列),通过改变操纵子的多顺反子mRNA上的编码序列的顺序或将操纵子分解成各自具有其自身控制元件的单个基因,或通过增加核苷酸序列可操作连接的启动子或操纵子的强度。或者,此外,可通过修饰编码所述酶的mRNA的翻译水平来改变宿主细胞中酶的拷贝数。其可通过譬如以下方式来实现:通过修饰mRNA的稳定性,修饰核糖体结合位点的序列,修饰核糖体结合位点与酶编码序列的起始密码子之间的距离或序列,修饰位于酶编码区起始密码子“上游”或邻接5'侧的整个顺反子间区,使用发夹和特化序列稳定mRNA转录物的3'端,修饰酶的密码子用法,改变用于酶的生物合成的稀有密码子tRNA的表达,和/或通过例如突变其编码序列来提高酶的稳定性。
宿主细胞中酶的活性可以多种方式改变,包括但不限于,表达所述酶的经修饰形式(其在宿主细胞中表现出增加或降低的溶解度);表达所述酶的经改变形式(其缺乏通过其抑制所述酶的活性的结构域);表达所述酶的经修饰形式(其具有较高或较低Kcat或较低或较高Km的底物);或表达所述酶的经改变形式(其或多或少受到所述途径中另一分子的反馈或前馈调节的影响)。
在一些实施方案,用于遗传修饰宿主细胞的核酸包含一种或多种选择标记,所述选择标记可用于选择转化的宿主细胞和对所述宿主细胞施加选择性压力以维持外源DNA。
在一些实施方案,所述选择标记是抗生素抗性标记。抗生素抗性标记的示例性实例包括但不限于,BLA、NAT1、PAT、AUR1-C、PDR4、SMR1、CAT、小鼠dhfr、HPH、DSDA、KANR、和SHBLE基因产物。来自大肠杆菌(E.coli)的BLA基因产物赋予对β-内酰胺抗生素(例如,窄谱头孢菌素类、头孢霉素类、和碳青霉烯类(厄他培南)、头孢孟多和头孢哌酮)的抗性,以及赋予对除了替莫西林(temocillin)之外的所有抗革兰氏阴性细菌青霉素类的抗性;来自诺尔斯链霉菌(S.noursei)的NAT1基因产物赋予对诺尔丝菌素的抗性;来自产绿色链霉菌(S.viridochromogenes)Tu94的PAT基因产物赋予对双丙氨膦(bialophos)的抗性;来自酿酒酵母的AUR1-C基因产物赋予对Auerobasidin A(AbA)的抗性;PDR4基因产物赋予对浅蓝菌素的抗性;SMR1基因产物赋予对甲嘧磺隆的抗性;来自Tn9转座子的CAT基因产物赋予对氯霉素的抗性;小鼠dhfr基因产物赋予对甲氨蝶呤的抗性;肺炎克雷伯氏菌(Klebsiellapneumonia)的HPH基因产物赋予对潮霉素B的抗性;大肠杆菌的DSDA基因产物使细胞在D-丝氨酸作为唯一氮源的平板上生长;Tn903转座子的KANR基因赋予对G418的抗性;和来自印度斯坦异壁链霉菌(Streptoalloteichus hindustanus)的SH BLE基因产物赋予对Zeocin(博来霉素)的抗性。在一些实施方案,在分离本发明公开的经遗传修饰的宿主细胞后,删除所述抗生素抗性标记。
在一些实施方案,所述选择标记拯救所述经遗传修饰的微生物中的营养缺陷型(例如,营养性营养缺陷型)。在此类实施方案中,亲本微生物包含一种或多种基因产物中的功能性破坏,所述一种或多种基因产物在氨基酸或核苷酸生物合成途径中起作用,并且当无功能性时使得亲本细胞无法在不补充一种或多种营养物的培养基中生长。此类基因产物包括但不限于酵母中的HIS3、LEU2、LYS1、LYS2、MET15、TRP1、ADE2、和URA3基因产物。然后可通过用编码所述经破坏的基因产物的功能性拷贝的表达载体或染色体整合构建体来转化亲本细胞,从而拯救营养缺陷型表型,并可基于所述亲本细胞的所述营养缺陷型表型的缺失来选择生成的经遗传修饰的宿主细胞。利用URA3、TRP1和LYS2基因作为选择标记具有显著的优势,因为正选择和负选择均是可能的。通过URA3、TRP1和LYS2突变的营养缺陷型互补进行正选择,而负选择则是基于特异性抑制剂,即5-氟-乳清酸(FOA)、5-氟邻氨基苯甲酸、和氨基己二酸(aAA),其分别阻止原养型菌株生长但分别使URA3、TRP1和LYS2突变体生长。在其他实施方案,所述选择标记拯救可通过已知选择方法鉴定的其他非致死性缺陷或表型。
本发明描述了可用于本发明公开的方法、组合物和生物体的特定基因和蛋白质;然而,人们将认识到这些基因的绝对同一性是不必要的。譬如,可对包含编码多肽或酶的序列的特定基因或多核苷酸进行变化并筛选活性。通常,此类变化包括保守突变和沉默突变。可使用本领域已知的方法筛选此类经修饰或经突变的多核苷酸和多肽以表达功能性酶。
由于遗传密码的固有简并性,编码基本上相同或功能等同的多肽的其他多核苷酸也可用于克隆和表达编码此类酶的多核苷酸。
如本领域技术人员将理解的,修饰编码序列以增强其在特定宿主中的表达可能是有利的。所述遗传密码是冗余的,具有64个可能的密码子,但大多数生物体通常使用这些密码子的子集。在物种中最常使用的密码子称为最佳密码子,而那些未经常使用的密码子被分类为稀有密码子或低使用率密码子。在有时被称为“密码子优化”或“控制物种密码子偏性”的过程中,密码子可被置换以反映所述宿主的优选密码子用法。可使用密码子用法表容易地确定其他宿主细胞的密码子优化,或者可使用商业上可获得的软件,例如来自Integrated DNA Technologies的CodonOp(www.idtdna.com/CodonOptfrom)进行密码子优化。
可制备含有由特定原核或真核宿主优选的密码子的优化编码序列(Murray etal.,1989,Nucl Acids Res.17:477-508),例如,与由非优化序列生成的转录物相比,以提高翻译速率或以生成具有期望性质(例如更长的半衰期)的重组RNA转录物。还可修饰翻译终止密码子以反映宿主偏好。譬如,酿酒酵母和哺乳动物的典型终止密码子分别是UAA和UGA。单子叶植物类的典型终止密码子是UGA,而昆虫和大肠杆菌通常使用UAA作为终止密码子(Dalphin et al.,1996,Nucl Acids Res.24:216-8)。
本领域技术人员将认识到,由于遗传密码的简并性质,可使用与其核苷酸序列不同的多种DNA分子来编码本发明给定的酶。引用编码上述生物合成酶的原生DNA序列在本发明中仅用于说明本发明的实施方案,并且本发明包括任何序列的DNA分子,所述序列编码本发明方法中所用酶的多肽和蛋白质的氨基酸序列。以类似的方式,多肽通常可在其氨基酸序列中耐受一个或多个氨基酸置换、缺失和插入,而不会损失或显著损失所需活性。本发明包括具有与本发明所述特定蛋白质不同的氨基酸序列的此类多肽,只要所述经修饰的多肽或变体多肽具有所述参考多肽的酶促合成代谢活性或分解代谢活性即可。此外,由本发明所示的DNA序列编码的氨基酸序列仅阐明了本发明的实施方案。
此外,可用于本发明提供的组合物和方法的酶的同源物均包含在本发明公开内容中。在一些实施方案,当氨基酸序列具有至少约30%、40%、50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性时,两种蛋白质(或所述蛋白质的区域)基本上是同源的。为了确定两个氨基酸序列或两个核酸序列的同一性百分比,比对所述序列以达到最佳比较目的(例如,为了最佳比对,可在第一和第二氨基酸或核酸序列中的一个或两个中引入空位,并且出于比较目的,可忽略非同源序列)。在一个实施方案,出于比较目的而比对的参考序列的长度为所述参考序列长度的至少30%,通常至少40%,更通常至少50%,甚至更通常至少60%,甚至更通常至少70%、80%、90%、100%。然后比较相应氨基酸位置或核苷酸位置处的氨基酸残基或核苷酸。当所述第一序列中的位置被与所述第二序列中的相应位置的相同氨基酸残基或核苷酸占据时,那么所述分子在此位置均是相同的(本发明使用的氨基酸或核酸“同一性”等同于氨基酸或核酸“同源性”)。两个序列之间的同一性百分比是所述序列共有的相同位置的数量的函数,考虑到空位的数量和每个空位的长度,需引入这些空位以实现所述两个序列的最佳比对。
当“同源/同源性”用于提及蛋白质或肽时,将认识到不相同的残基位置通常因保守氨基酸置换而不同。“保守氨基酸置换”是其中氨基酸残基被具有相似化学性质(例如,电荷或疏水性)的侧链(R基团)的另一氨基酸残基置换的氨基酸置换。通常,保守氨基酸置换不会显著改变蛋白质的功能特性。在通过保守置换使两个或两个以上氨基酸序列彼此不同的情况下,可以向上调节序列同一性百分比或同源性程度以校正所述置换的保守性质。进行此种调节的方法是本领域技术人员所熟知的(参见,例如Pearson W.R.,1994,Methodsin Mol Biol 25:365-89)。
以下六组各自含有彼此保守置换的氨基酸:1)丝氨酸(S),苏氨酸(T);2)天冬氨酸(D),谷氨酸(E);3)天冬酰胺(N),谷氨酰胺(Q);4)精氨酸(R),赖氨酸(K);5)异亮氨酸(I),亮氨酸(L),丙氨酸(A),缬氨酸(V);和6)苯丙氨酸(F),酪氨酸(Y),色氨酸(W)。
通常使用序列分析软件来测定多肽的序列同源性,其亦称为序列同一性百分比。用于将分子序列与含有来自不同生物体的大量序列的数据库进行比较的典型算法是计算机程序BLAST。当搜索含有来自大量不同生物体的序列的数据库时,通常对氨基酸序列进行比较。
此外,编码前述酶(或本发明提及的任何其他酶类(或控制或调节其表达的任何调节元件))的任何基因可通过遗传/蛋白质工程技术进行优化,例如本领域普通技术人员已知的定向进化或合理诱变。此种作用使本领域普通技术人员能够优化所述酶在酵母中的表达和活性。
此外,编码所述这些酶的基因可从其他真菌和细菌物种中鉴定得到,并且可表达对此途径的调节。多种生物体可作为所述这些酶的来源,包括但不限于,酵母属(Saccharomyces spp.),包括酿酒酵母(S.cerevisiae)和葡萄汁酵母(S.uvarum);克鲁维酵母菌属(Kluyveromyces spp.),包括耐热克鲁维酵母(K.thermotolerans),乳酸克鲁维酵母(K.lactis),和马克斯克鲁维酵母(K.marxianus);毕赤酵母属(Pichia spp.);汉逊酵母属(Hansenula spp.),包括多形汉逊酵母(H.polymorpha);假丝酵母属(Candida spp.);丝孢酵母属(Trichosporon spp.);接合糖酵母属(Yamadazyma spp.),包括树干接合糖酵母(Y.spp.Stipitis),比勒陀利亚有孢圆酵母(Torulaspora pretoriensis),东方伊萨酵母(Issatchenkia orientalis);裂殖酵母属(Schizosaccharomyces spp.),包括粟酒裂殖酵母(S.pombe);隐球酵母属(Cryptococcus spp.);曲霉属(Aspergillus spp.);脉孢菌属(Neurospora spp.);或黑粉菌属(Ustilago spp.)。来自厌氧真菌的基因来源包括但不限于,梨囊鞭菌属(Piromyces spp.),根囊鞭菌属(Orpinomyces spp.),或新美鞭菌属(Neocallimastix spp.)。可用的原核酶的来源包括但不限于,大肠杆菌(Escherichiacoli),运动发酵单胞菌(Zymomonas mobilis),金黄色葡萄球菌(Staphylococcusaureus),芽孢杆菌属(Bacillus spp.),梭菌属(Clostridium spp.),棒状杆菌属(Corynebacterium spp.),假单胞菌属(Pseudomonas spp.),乳球菌属(Lactococcusspp.),肠杆菌属(Enterobacter spp.)和沙门氏菌属(Salmonella spp.)。
本领域技术人员已知的技术可适于鉴定其他同源基因和同源酶。通常,类似基因和/或类似酶可通过功能分析进行鉴定,并具有功能相似性。本领域技术人员已知的技术可适用于鉴定类似基因和类似酶。譬如,为了鉴定同源或类似的UDP糖基转移酶,KAH,或任何生物合成途径基因、蛋白质、或酶,技术可包括但不限于使用基于目的基因/酶的公开序列的引物进行PCR,或通过使用设计用于扩增目的基因中的保守区域的简并引物进行简并PCR,来克隆基因。此外,本领域技术人员可使用技术来鉴定具有功能同源性或相似性的同源或类似的基因、蛋白质、或酶。技术包括通过针对所述活性的体外酶测定法来检测细胞或细胞培养物中酶的催化活性(例如,如本发明所述或如Kiritani,K.,Branched-ChainAmino Acids Methods Enzymology,1970中所述),然后通过纯化技术来分离具有所述活性的酶,通过诸如埃德曼(Edman)降解等技术确定所述酶的所述蛋白质序列,设计可能的核酸序列的PCR引物,通过PCR来扩增所述DNA序列,以及克隆所述核酸序列。为了鉴定同源或类似基因和/或同源或类似酶、类似基因和/或类似酶或蛋白质,技术还包括将关于候选基因或酶的数据同诸如BRENDA、KEGG或MetaCYC的数据库进行比较。可根据本发明的教导,在上述数据库中识别候选基因或酶。
7.实施例
实施例1.酵母转化方法
在优化的乙酸锂转化中,使用标准分子生物学技术将各DNA构建体整合到酿酒酵母(Saccharomyces cerevisiae)(CEN.PK2)中。简言之,细胞在30℃、振摇(200rpm)的酵母提取物蛋白胨右旋糖(YPD)培养基中生长过夜,在100mL YPD中稀释至OD600为0.1,然后生长至OD600为0.6–0.8。对于每次转化,通过离心收获5mL培养物,在5mL无菌水中清洗,再次离心,重悬于1mL 100mM乙酸锂中,并转移至微量离心管中。将细胞离心(13,000x g)30s,移除上清液,并将细胞重悬于由240μL 50%PEG、36μL 1M乙酸锂、10μL煮鲑鱼精DNA和74μL供体DNA组成的转化混合物中。供体DNA包括携带F-CphI内切酶基因的质粒,所述F-CphI内切酶基因在酵母TDH3启动子下表达(参见实施例4)。在42℃下热激40分钟后,将细胞在含有适当抗生素的YPD培养基中回收过夜,以选择已吸收F-CphI质粒的细胞。回收过夜后,细胞通过离心法进行短暂离心并铺板在含有适当抗生素的YPD培养基上,以选择已吸收F-CphI质粒的细胞。DNA整合通过菌落PCR确证,其中使用了对所述整合具有特异性的引物。
实施例2:能够高通量生成法呢基焦磷酸(FPP)和类异戊二烯法呢烯的基础酵母菌株(base yeast strain)的生成
通过在GAL1或GAL10启动子的控制下表达甲羟戊酸途径的基因,从野生型酿酒酵母菌株(CEN.PK2)生成法呢烯生成菌株。此菌株包含来自酿酒酵母的以下染色体整合的甲羟戊酸途径基因:乙酰-CoA硫解酶,HMG-CoA合酶,HMG-CoA还原酶,甲羟戊酸激酶,磷酸甲羟戊酸激酶,甲羟戊酸焦磷酸脱羧酶,和IPP:DMAPP异构酶。此外,所述菌株还包含来自青蒿(Artemisia annua)的法呢烯合酶的多个拷贝,亦受GAL1或GAL10启动子的控制。使用公开可获得的算法或其他合适的算法对本发明所述的所有异源基因进行密码子优化。所述菌株还包含GAL80基因的缺失,编码鲨烯合酶的ERG9基因通过用酵母基因MET3的启动子替换所述原生启动子而进行下调(Westfall et al.,Proc.Natl.Acad.Sci.USA109(3),2012,pp.E111-E118)。在美国专利号8,415,136和美国专利号8,236,512中记载了生成酿酒酵母菌株的方法的实例,所述菌株可高通量生成类异戊二烯类化合物,其全部内容均并入本发明。
实施例3.能够高通量生成Reb M的基础酵母菌株的生成
图1示出了由FPP到甜菊醇的示例性生物合成途径。图2示出了由甜菊醇到糖苷RebM的示例性生物合成途径。为了将上述法呢烯基础菌株高通量转化为C20类异戊二烯类贝壳杉烯,将香叶基香叶基焦磷酸合酶(GGPPS)的四个拷贝整合到基因组中,然后将柯巴基焦磷酸合酶的两个拷贝以及贝壳杉烯合酶的单个拷贝整合到基因组中。此时,法呢烯合酶的所有拷贝均从菌株中除去。一旦新菌株被确证可产生内根-贝壳杉烯,则将剩余的可将内根-贝壳杉烯转化为Reb M的基因插入到基因组中。表1列出了用于将FPP转化为Reb M的所有基因和启动子。除了整合了两个基因拷贝的Sr.KAH酶外,贝壳杉烯合酶后的每个基因均被整合为单个拷贝。包含表1中所述的所有基因的菌株主要生成Reb M。
表1.用于将FPP转化为Reb M的酶的基因、启动子和氨基酸序列
酶名称 | SEQ ID | 启动子 |
Bt.GGPPS | SEQ ID NO:9 | PGAL1 |
内根(Ent)-Os,CDPS | SEQ ID NO:10<sup>1</sup> | PGAL1 |
内根(Ent)-Pg.Ks | SEQ ID NO:11 | PGAL1 |
Ps.KO | SEQ ID NO:12 | PGAL1 |
Sr.KAH | SEQ ID NO:13 | PGAL1 |
At.CPR | SEQ ID NO:14 | PGAL3 |
UGT85C2 | SEQ ID NO:15 | PGAL10 |
UGT74G1 | SEQ ID NO:16 | PGAL1 |
UGT91D_like3 | SEQ ID NO:17 | PGAL1 |
UGT76G1 | SEQ ID NO:18 | PGAL10 |
UGT40087 | SEQ ID NO:19 | PGAL1 |
1前65个氨基酸被移除并被替换为蛋氨酸
实施例4.用于筛选甜菊糖苷转运蛋白的菌株的生成
为了在生成Reb M的菌株中在体内快速筛选甜菊糖苷转运蛋白,将着陆垫(landing pad)插入到上述菌株中。着陆垫由位于SFM1开放阅读框下游基因组区域的构建体两端的500bp基因座靶向DNA序列组成(参见图3)。在内部,着陆垫包含GAL1启动子和酵母终止子,其分别位于核酸内切酶识别位点(F-CphI)的两侧。
实施例5:酵母培养条件
将过表达转运蛋白蛋白质的酵母菌落挑选到含有鸟种培养基(Bird Seed Media,BSM,最初由van Hoek et al.,Biotechnology and Bioengineering 68(5),2000,pp.517-523记载)的96孔微量滴定板中,所述鸟种培养基(Bird Seed Media)含有20g/L蔗糖、3.75g/L硫酸铵、以及1g/L赖氨酸。将细胞于28℃下在高容量微量滴定板孵化器中,于1000rpm和80%湿度下振摇培养3天,直至所述培养物耗尽碳。通过从饱和培养物中取14.4μL并稀释至360μL新鲜培养基中,将生长饱和的培养物传代培养至含有BSM的新鲜平板中,所述BSM含有40g/L蔗糖和3.75g/L硫酸铵。在提取和分析之前,将所述生成培养基中的细胞于30℃下在高容量微量滴定板振荡器中,于1000rpm和80%湿度下再培养3天。
实施例6:用于分析甜菊糖苷类化合物的全细胞培养液样品制备条件
为了分析培养物中生成的所有甜菊糖苷类化合物的量,在培养完成后,将全细胞培养液(whole cell broth)用628μL 100%乙醇稀释,用箔密封件进行密封,并在1250rpm下振摇30s以提取甜菊糖苷类化合物。将314μL水直接添加至每个孔中以稀释所述提取液。将板短暂离心以使固体沉淀。将208μL的含有0.48mg/L瑞鲍迪苷N的50:50乙醇:水混合物(内标)转移至新的250μL测定板,并将2μL培养物/乙醇混合物添加至测定板中。将板用箔密封件进行密封以进行分析。
实施例7:用于分析甜菊糖苷类化合物的培养物上清液样品制备条件
为了分析生成并排泄至培养基中的所有甜菊糖苷类化合物的量,在培养完成后,将全细胞培养液以2000x g离心5分钟以使细胞沉淀。将所得上清液的240μL等分试样转移至空的96孔微量滴定板中。上清液样品用480μL 100%乙醇稀释,用箔密封件进行密封,并以1250rpm的速度振摇30秒以提取甜菊糖苷类化合物。将240μL水添加至每个孔中以稀释所述提取液。将板短暂离心以使任何固体沉淀。将208μL的含有0.48mg/L瑞鲍迪苷N的50:50乙醇:水混合物(内标)转移至新的250μL测定板,并将2μL培养物/乙醇混合物添加至测定板中。将板用箔密封件进行密封以进行分析。
实施例8:分析方法
针对甜菊糖苷类化合物检测的样品通过具有RapidFire 365系统自动进样器和C8柱的质谱仪(Agilent 6470-QQQ),采用表2和表3所示的配置进行分析。
表2.RapidFire 365系统配置
表3. 6470-QQQ MS方法配置
离子源 | AJS ESI |
时间滤波峰宽 | 0.02min |
停止时间 | 无限制/作为泵 |
扫描方式 | MRM |
分流阀 | 进MS |
台达(Delta)EMV | (+)0/(-)300 |
离子模式(极性) | 负 |
气温度 | 250℃ |
气流量 | 11L/min |
喷雾器 | 30psi |
鞘气温度 | 350℃ |
鞘气流量 | 11L/min |
负模式毛细管V | 2500V |
来自质谱仪的色谱图的峰面积用于生成校准曲线。相关化合物的摩尔比是通过采用真实标准品通过外部校准对每种化合物的摩尔量进行定量,然后取适当的比例来确定。
实施例9.筛选能够在体内增加甜菊糖苷类化合物滴度的转运蛋白
在没有表达额外转运蛋白的所述Reb M生成菌株中,发现大约80%的较高分子量甜菊糖苷Reb D和Reb M均与生物量相关(参见图4)。此种生物量相关可能归因于Reb D和Reb M均未被有效转运出细胞并保留在细胞质中所致。Reb D和Reb M的积聚可能导致产物抑制,此举会降低经由甜菊糖苷代谢途径的碳通量。因此,将甜菊糖苷类化合物(尤其是RebD和Reb M)转运出细胞质并进入培养基(上清液)的一种或多种转运蛋白的表达有望减轻产物抑制,从而增加经由所述途径的碳通量,进而产生更高的甜菊糖苷滴度。为了鉴定能够将较高分子量的甜菊糖苷输出到细胞外从而缓解产物抑制的转运蛋白,我们筛选了从多种真菌中鉴定出的多种转运蛋白,以提高总甜菊糖苷滴度,尤其是较高分子量糖苷(即Reb D和Reb M)的滴度。
使用CEN.PK2作为基因组DNA来源,所有被注释为来自酿酒酵母(S.cerevisiae)基因组的转运蛋白的蛋白质均经由PCR进行扩增。每个PCR引物均与着陆垫中的PGAL1和酵母终止子DNA序列具有40bp的侧翼同源性(参见图3),所述PGAL1和酵母终止子DNA序列被添加至两端以促进经扩增基因同源重组到着陆垫中。除了筛选在CEN.PK2中发现的所有内源性酿酒酵母(S.cerevisiae)转运蛋白之外,亦对来自少量真菌和其他酿酒酵母菌株的ABC转运蛋白进行了扩展生物信息学搜索。
为了制作真菌ABC转运蛋白文库,我们首先从Kovalchuk和Driessen的出版物“真菌ABC转运蛋白的系统发育分析(Phylogenetic Analysis of Fungal ABCTransporters)”(Kovalchuk and Driessen,BMC Genomics,11,2010,pp.177-197)获得氨基酸序列,其中对27种真菌物种进行了ABC转运蛋白的系统发育分析。从此文献来源中,总共挑选了610个氨基酸序列,其中包括指定为属于ABC-C、ABC-D和ABC-G亚家族的所有转运蛋白。接下来,我们为以下真菌开发了内部BLAST数据库:(1)多形汉逊酵母(Hansenulapolymorpha)DL-1(NRRL-Y-7560)、(2)解脂耶氏酵母(Yarrowia lipolytica)ATCC 18945、(3)食腺嘌呤芽生葡萄孢酵母(Arxula adeninivorans)ATCC 76597、(4)酿酒酵母(S.cerevisiae)CAT-1、(5)斯达氏油脂酵母(Lipomyces starkeyi)ATCC 58690、(6)马克斯克鲁维酵母(Kluyveromyces marxianus)、(7)马克斯克鲁维酵母DMKU3-1042、(8)法夫驹形氏酵母(Komagataella phaffii)NRRL Y-11430、(9)酿酒酵母MBG3370、(10)酿酒酵母MBG3373、(11)乳酸克鲁维酵母(K.lactis)ATCC 8585、(12)产朊假丝酵母(Candidautilis)ATCC 22023、(13)毕赤酵母(Pichia pastoris)ATCC 28485、和(14)米曲霉(Aspergillus oryzae)NRRL5590。
对于我们已通过从头基因组测序、组装和注释工作获得内部核苷酸ORF序列的生物体,我们使用Biopython应用了tBLASTn。tBLASTn算法允许使用BLAST在六个可能的阅读框中,将蛋白质序列(在此案例中,来自Kovalchuk和Driessen的610个种子序列(BMCGenomics,11,2010,pp.177-197))与每个生物体的核苷酸ORF序列的经翻译DNA进行快速比对。tBLASTn参数均是标准的,E值(evalue)=1e-25(参见表4)。所有计算均通过biopythonAPI(从PyPI下载的v 1.70)使用Python 2.7.12和Ubuntu16.04.5LTS(GNU/Linux 4.4.0-138-generic x86_64)执行。随后过滤命中(hit)以确保至少2000个核苷酸的整体联配。所有符合这些标准的匹配均被带至工作流程的下一步。
表4.tBLASTn默认参数
对于其余无内部基因组序列的生物体,使用Uniprot API从Uniprot获得生物体的整个蛋白质组,以创建用于BLASTp搜索的数据库。在大多数情况下,Uniprot对我们拥有内部基因组DNA的物种具有准确的条目,但在其他情况下,与内部真菌菌株接近但不完全匹配。在后一种情况下,我们依赖于基因序列足够相似的高概率,以至于针对Uniprot参考设计的引物仍然可扩增内部基因组DNA。然后我们使用Biopython将BLASTp应用于Uniprot派生数据库。BLAST参数均是标准的,E值(evalue)=0.001(参见表5)。可基于≥40%的同一性截断百分比和≥60%的对齐长度截断百分比来执行后续过滤。所有计算均通过biopythonAPI(从PyPI下载的v 1.70)使用Python 2.7.12和Ubuntu 16.04.5LTS(GNU/Linux 4.4.0-138-generic x86_64)执行。命中(hit)必须匹配来自所述参考的610个种子序列中的至少一个。然后使用Uniprot ID映射服务到EMBL标识符,将命中转换为核苷酸序列。欧洲分子生物学实验室允许从Uniprot条目提取核苷酸序列。我们将符合这些标准的任何命中或匹配结果用于工作流程的下一步。
表5.BLASTp默认参数
一旦识别出所有核苷酸序列,便设计引物以经由PCR扩增每个完整的ORF。每个PCR引物均与着陆垫中的PGAL1和酵母终止子DNA序列具有40bp的侧翼同源性(图3),所述PGAL1和酵母终止子DNA序列被添加至两端以促进经扩增基因同源重组到着陆垫中。将每个转运蛋白基因作为单拷贝单独转化到上述Reb M生成酵母菌株中,并筛选在体内过表达时增加产物滴度的能力。
实施例11:使得体内甜菊糖苷生成量增加的转运蛋白的过表达
体内酿酒酵母(S.cerevisiae)转运蛋白筛选发现,与不含过表达转运蛋白的亲本Reb M菌株相比,当过表达时,8种转运蛋白在统计学上增加了总甜菊糖苷(TSG)生成量(参见图5)。TSG计算为由细胞生成的所有甜菊糖苷的微摩尔总和(由全细胞培养液提取物测定)。所有已识别的转运蛋白均属于称为ABC转运蛋白的转运蛋白类别。所述这些转运蛋白的过表达使TSG相对于亲本从20%增至两倍。转运蛋白过表达引起的TSG增加可能是由于所有甜菊糖苷或只是一部分甜菊糖苷的转运增加所致。因此,亦分析了数据以确定转运蛋白过表达仅对较高分子量的甜菊糖苷Reb D和Reb M的影响。在增加TSG的8种转运蛋白中,其中7种还增加了Reb D和Reb M的总生成量,如图6所示。随着转运蛋白的过表达,Reb D和RebM的增加范围从30%增至两倍增加不等。
实施例12:甜菊糖苷类化合物的细胞外和细胞内转运
8个Reb M菌株中的7个携带过表达的转运蛋白,使得全细胞培养液中的总甜菊糖苷增加,同时亦增加了上清液中的总甜菊糖苷含量(图7)。虽然四种转运蛋白使全细胞培养液中的总甜菊糖苷增加了近两倍(图5),但上清液中TSG的典型增加较少,范围为35%至70%(图7)。然而,转运蛋白T4_Fungal_5使上清液中的TSG增加了大约五倍(图7)。图5和图7示出的数据表明,具有某些过表达转运蛋白的菌株生成更多的TSG,但TSG的增加并不总是表现为上清液中TSG的线性增加。
明确观察位于上清液中生成的总甜菊糖苷的比例(图8)表明,大多数转运蛋白(八分之六)上清液中的TSG比例低于亲本。这表明转运蛋白正在从胞质溶胶移除甜菊糖苷,从而减轻产物抑制并使得更多的产物形成,但它们并未将甜菊糖苷转运至培养基中。相反,这些转运蛋白最有可能将甜菊糖苷类化合物转运至液泡或其他一些细胞区室中。相比之下,转运蛋白T4_Fungal_5使得所生成的TSG几乎100%位于上清液中(图8)。这表明T4_Fungal_5可能是质膜转运蛋白,其能够从细胞的细胞质中移除甜菊糖苷并将其转运出细胞,进入培养基。此外,图4所示数据表明,转运蛋白T4_Fungal_5将较高分子量的甜菊糖苷Reb D和RebM输出至细胞外并进入培养基;事实上,几乎100%的Reb D和Reb M均位于上清液级分中。
转运蛋白筛选的命中结果之一是内源性酿酒酵母(S.cerevisiae)ABC转运蛋白BPT1。此蛋白质在酵母基因组数据库(Saccharomyces Genome Database)中被注释为定位于液泡。转运蛋白T4_Fungal_2和T4_Fungal_4均具有与CEN.PK2 BPT1具有99%同一性的蛋白质序列,分别源自酿酒酵母菌株CAT-1和MBG3373;它们均是BPT1的等位基因。所有其他转运蛋白在蛋白质序列方面与BPT1具有30-43%同一性,并代表可跨膜转运甜菊糖苷的新型ABC转运蛋白(参见表6)。在输出甜菊糖苷类化合物的其余非BPT1转运蛋白中,无任何蛋白质序列与任何其他蛋白质的同一性高于53%,这表明其余5种蛋白质均是独特的序列。
表6.增加甜菊糖苷滴度的所有转运蛋白的同一性百分比
实施例13:BPT1和T4_Fungal_5细胞定位
为了确定所述Reb M生成菌株中过表达的BPT1和T4_Fungal_5蛋白的细胞定位,我们创建了GFP-转运蛋白融合蛋白。每个转运蛋白(BPT1或T4_Fungal_5)蛋白质均有GFP蛋白质融合至转运蛋白的C端;GFP-转运蛋白融合蛋白质经由GAL1启动子表达并含有酵母终止子。如实施例4中所述构建菌株,唯一区别是使用转运蛋白-GFP融合蛋白质代替仅转运蛋白的蛋白质。具有正确整合的转运蛋白-GFP构建体的细胞经由菌落PCR进行确证,如实施例5中所述进行培养,并确证其活性等同于含有转运蛋白(其不含C端GFP标记)的菌株(图9)。
为了经由GFP可视化蛋白质定位,如实施例5中所述进行细胞繁殖,但在生成培养基中2天后进行收获,用于观察。细胞用等体积的PBS清洗两次,然后在PBS中重悬至OD600为1.0。使用安装在载玻片上的1%琼脂糖垫固定细胞,并使用标准荧光显微镜在488nm激发下或在明场下在油浸中以100倍放大倍数进行可视化观察。表达BPT1 C末端标记有GFP的细胞显示出与定位于液泡的融合蛋白一致的荧光模式(图10)。这是预期的结果,因为据报道BPT1通常定位于酵母中的液泡(Sharma et al.,Eukaryot.Cell1(3),2002,pp.391-400)。C末端标记的T4_Fungal_5蛋白显示出不同的GFP定位,与定位于质膜的蛋白质一致(图11)。
实施例14:使用易错PCR和生长选择定向进化T4_Fungal_5蛋白
转运蛋白T4_Fungal_5从细胞质主动移除Reb D和Reb M(参见图4)。Reb D是Reb M的直接底物(图2),因此从胞质溶胶移除Reb D会减少酵母生成的Reb M总量。因此,T4_Fungal_5经历了酶进化,以增加其整体活性及其对Reb M的特异性。T4_Fungal_5的DNA编码序列(CDS)使用GeneMorph II随机诱变试剂盒(安捷伦科技公司)经由易错PCR进行诱变,并将所得DNA文库转化到与实施例11中提及的转运蛋白筛选中使用的酵母菌株相似的Reb M酵母菌株中,但具有两个额外的UGT76G1的拷贝,其均在GAL1启动子下表达。使用野生型T4_Fungal_5转运蛋白进行额外的转化作为对照。如实施例1中所述进行转化。过夜回收后,将培养物转移至补充有选择性抗生素的生成培养基中以继续生长。监测培养物的OD600并使用新鲜含抗生素的生成培养基对培养物进行连续稀释以避免碳饥饿。每天对培养物取样以获得此两种甘油储备液档案,并在含抗生素的YPD琼脂平板上铺板以形成单个菌落。使用实施例6、7和8中所述方法来评估和比较来自每个每日样品的88个菌落的所述TSG及Reb M滴度。根据此数据,确定了生成具有等于或大于对照菌株(表达野生型T4_Fungal_5)的TSG滴度的菌落的最高百分比的时间点。从此时间点开始,从甘油储备液中接种其他菌落,挑选并筛选900个菌落。筛选确定了8个分离株,它们将Reb M滴度提高了26%至47%,并将Reb M/TSG比值提高了10%(图12和图13)。图12和图13所示数据表明,在T4_Fungal_5转运蛋白中鉴定的突变提高了对甜菊糖苷的总体活性及对Reb M的特异性。
T4_Fungal_5基因的Sanger测序显示所有8个分离株均具有相同的核酸置换,产生4个氨基酸置换:V666A、Y942N、L956P和E1320V。此突变等位基因命名为“Fungal_5_muA”。为了验证Fungal_5_muA与提高滴度和特异性的因果关系,突变等位基因从分离株之一进行扩增并重新引入亲本菌株中。所得菌株重现了表型并证明Fungal_5_muA在提高甜菊糖苷生成量和特异性方面的应用。当T4_Fungal_5和Fungal_5_muA在较弱的GAL3启动子下表达时,与具有野生型T4_Fungal_5的菌株相比,具有Fungal_5_muA的菌株在全细胞培养液中生成的Reb M高出30%,并且在细胞外生成的Reb M高出40%(图14),这与早期数据一致。
实施例15:Fungal_5_muA的进一步改进
为了通过去除潜在的有害突变来进一步改进Fungal_5_muA,我们创建了额外的T4_Fungal_5突变变体,其具有在Fungal_5_muA中识别的1、2或3个氨基酸置换,并将它们引入到实施例14中用于筛选T4_Fungal_5诱变文库的酵母菌株中。尽管Fungal_5_muA中V666A的单次回复对TSG或Reb M产生的影响可忽略不计,但E1320V的回复是有益的,并且V666AY942N L956P三重突变体生成的TSG比Fungal_5_muA菌株高出14%,而生成的Reb M高出12%(图15和图16)。然而,与V666A Y942N L956P三重突变体相比,L956P在所述三重突变体(V666A Y942N)中的进一步回复导致Reb M减少10%以及TSG减少19%。与Fungal_5_muA菌株相比,单个Y942N突变菌株生成的TSG高出21%,但生成的Reb M的量则少10%。所述这些数据表明,Y942N突变有利于T4_Fungal_5在输出甜菊糖苷方面的总体活性,但在其对Reb M的特异性方面有负面影响。
本说明书中引用的所有出版物、专利和专利申请均通过引用并入本发明,如同每个单独的出版物或专利申请被具体和单独地指出通过引用并入。尽管出于清楚理解的目的,已通过举例说明和示例的方式对上述发明进行了一些详细描述,但根据本发明教导,对于本领域普通技术人员而言将显而易见的是,在不脱离所附权利要求书的精神或范围的情况下,可对其进行某些改变/变化以及修改/修饰。
Claims (48)
1.能够生成一种或多种甜菊糖苷(steviol glycoside)的经遗传修饰的宿主细胞,所述经遗传修饰的宿主细胞包含编码ABC转运蛋白的异源核酸,所述ABC转运蛋白包含与选自由下列组成的组的氨基酸序列具有至少80%序列同一性的氨基酸序列:SEQ ID NO:1、SEQID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ IDNO:8、SEQ ID NO:28、SEQ ID NO:29、和SEQ ID NO:30。
2.根据权利要求1所述的经遗传修饰的宿主细胞,其中所述ABC转运蛋白包含氨基酸序列,所述氨基酸序列具有选自由下列组成的组的序列:SEQ ID NO:1、SEQ ID NO:2、SEQ IDNO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、和SEQ ID NO:8。
3.根据前述权利要求任一项所述的经遗传修饰的宿主细胞,其进一步包含核酸,所述核酸编码香叶基香叶基焦磷酸合酶(GGPPS)、内根-柯巴基焦磷酸合酶(ent-copalylpyrophosphate synthase,CPS)、内根-贝壳杉烯合酶(ent-kaurene synthase,KS)、内根-贝壳杉烯19-氧化酶(ent-kaurene 19-oxidase,KO)、内根-异贝壳杉烯酸13-羟化酶(ent-kaurenoic acid 13-hydroxylase,KAH)、细胞色素p450还原酶(CPR)、以及一种或多种UDP-葡萄糖基转移酶(UGT)。
4.根据权利要求3所述的经遗传修饰的宿主细胞,其中所述一种或多种UDP-葡萄糖基转移酶(UGT)选自由下列组成的组:UGT85C2、UGT74G1、UGT91D_like3、UGT76G1、EUGT11、和UGT40087。
5.根据权利要求4所述的经遗传修饰的宿主细胞,其中所述香叶基香叶基焦磷酸合酶(GGPPS)包含与SEQ ID NO:9具有至少80%序列同一性的氨基酸序列,所述内根-柯巴基焦磷酸合酶(CPS)包含与SEQ ID NO:10具有至少80%序列同一性的氨基酸序列,所述内根-贝壳杉烯合酶(KS)包含与SEQ ID NO:11具有至少80%序列同一性的氨基酸序列,所述内根-贝壳杉烯19-氧化酶(KO)包含与SEQ ID NO:12具有至少80%序列同一性的氨基酸序列,所述内根-异贝壳杉烯酸13-羟化酶(KAH)包含与SEQ ID NO:13具有至少80%序列同一性的氨基酸序列,所述细胞色素p450还原酶(CPR)包含与SEQ ID NO:14具有至少80%序列同一性的氨基酸序列,和所述一种或多种UDP-葡萄糖基转移酶(UGT)包含与选自由下列组成的组的氨基酸序列具有至少80%序列同一性的氨基酸序列:SEQ ID NO:15、SEQ ID NO:16、SEQID NO:17、SEQ ID NO:18、SEQ ID NO:19。
6.根据权利要求5所述的经遗传修饰的宿主细胞,其中所述香叶基香叶基焦磷酸合酶(GGPPS)包含SEQ ID NO:9的氨基酸序列,所述内根-柯巴基焦磷酸合酶(CPS)包含SEQ IDNO:10的氨基酸序列,所述内根-贝壳杉烯合酶(KS)包含SEQ ID NO:11的氨基酸序列,所述内根-贝壳杉烯19-氧化酶(KO)包含SEQ ID NO:12的氨基酸序列,所述内根-异贝壳杉烯酸13-羟化酶(KAH)包含SEQ ID NO:13的氨基酸序列,所述细胞色素p450还原酶(CPR)包含SEQID NO:14的氨基酸序列,和所述一种或多种UDP-葡萄糖基转移酶(UGT)包含选自由下列组成的组的氨基酸序列:SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ IDNO:19。
7.根据前述权利要求任一项所述的经遗传修饰的宿主细胞,其中所述宿主细胞选自细菌细胞、真菌细胞、藻类细胞、昆虫细胞和植物细胞。
8.根据权利要求7所述的经遗传修饰的宿主细胞,其中所述宿主细胞是酿酒酵母(Saccharomyces cerevisiae)细胞。
9.根据前述权利要求任一项所述的经遗传修饰的宿主细胞,其中所述ABC转运蛋白包含具有SEQ ID NO:1的所述序列的氨基酸序列。
10.根据前述权利要求任一项所述的经遗传修饰的宿主细胞,其中所述ABC转运蛋白包含具有SEQ ID NO:2的所述序列的氨基酸序列。
11.根据前述权利要求任一项所述的经遗传修饰的宿主细胞,其中所述ABC转运蛋白包含具有SEQ ID NO:3的所述序列的氨基酸序列。
12.根据前述权利要求任一项所述的经遗传修饰的宿主细胞,其中所述ABC转运蛋白包含具有SEQ ID NO:4的所述序列的氨基酸序列。
13.根据前述权利要求任一项所述的经遗传修饰的宿主细胞,其中所述ABC转运蛋白包含具有SEQ ID NO:5的所述序列的氨基酸序列。
14.根据前述权利要求任一项所述的经遗传修饰的宿主细胞,其中所述ABC转运蛋白包含具有SEQ ID NO:6的所述序列的氨基酸序列。
15.根据前述权利要求任一项所述的经遗传修饰的宿主细胞,其中所述ABC转运蛋白包含具有SEQ ID NO:7的所述序列的氨基酸序列。
16.根据权利要求15所述的经遗传修饰的宿主细胞,其中所述ABC转运蛋白包含相对于SEQ ID NO:7的所述氨基酸序列的一个或多个氨基酸置换。
17.根据权利要求16所述的经遗传修饰的宿主细胞,其中所述一个或多个氨基酸置换选自V666A、Y942N、L956P、和E1320V。
18.根据前述权利要求任一项所述的经遗传修饰的宿主细胞,其中所述ABC转运蛋白包含具有SEQ ID NO:8的所述序列的氨基酸序列。
19.根据前述权利要求任一项所述的经遗传修饰的宿主细胞,其中所述ABC转运蛋白包含具有SEQ ID NO:28的所述序列的氨基酸序列。
20.根据前述权利要求任一项所述的经遗传修饰的宿主细胞,其中所述ABC转运蛋白包含具有SEQ ID NO:29的所述序列的氨基酸序列。
21.根据前述权利要求任一项所述的经遗传修饰的宿主细胞,其中所述ABC转运蛋白包含具有SEQ ID NO:30的所述序列的氨基酸序列。
22.根据前述权利要求任一项所述的经遗传修饰的宿主细胞,其中所述一种或多种甜菊糖苷选自由下列组成的组:Reb A、Reb B、Reb D、Reb E、和Reb M。
23.根据权利要求22所述的经遗传修饰的宿主细胞,其中所述一种或多种甜菊糖苷包含Reb M。
24.多核苷酸,其包含前述权利要求任一项所述的异源核酸的核苷酸序列。
25.根据权利要求24所述的多核苷酸,其中所述异源核酸的所述核苷酸序列包含选自由下列组成的组的编码序列:SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、和SEQ ID NO:27,其中所述编码序列可操作地连接至异源启动子。
26.生成甜菊醇或一种或多种甜菊糖苷的方法,其包含下列步骤:
(a)在适于制备甜菊醇或一种或多种甜菊糖苷的条件下,在含有碳源的培养基中培养权利要求1-23任一项所述的宿主细胞的种群以生成培养液(culture broth);和
(b)从所述培养液回收所述甜菊醇或一种或多种甜菊糖苷。
27.生成Reb D的方法,其包含下列步骤:
(a)在适于制备Reb D的条件下,在含有碳源的培养基中培养权利要求1-23任一项所述的宿主细胞的种群以生成培养液;和
(b)从所述培养液回收所述Reb D化合物。
28.生成Reb M的方法,其包含下列步骤:
(a)在适于制备Reb M的条件下,在含有碳源的培养基中培养权利要求1-23任一项所述的宿主细胞的种群以生成培养液;和
(b)从所述培养液回收所述Reb M化合物。
29.根据权利要求1或2所述的经遗传修饰的宿主细胞,其中至少50%的所述一种或多种甜菊糖苷积聚在细胞器的腔内。
30.根据权利要求1或2所述的经遗传修饰的宿主细胞,其中至少50%的所述一种或多种甜菊糖苷积聚在细胞外。
31.根据权利要求1-23任一项所述的经遗传修饰的宿主细胞,其进一步包含UDP-葡萄糖基转移酶(UGT),所述UDP-葡萄糖基转移酶(UGT)具有与SEQ ID NO:18的所述氨基酸序列具有至少80%序列同一性的氨基酸序列。
32.根据权利要求1-23任一项所述的经遗传修饰的宿主细胞,其进一步包含UDP-葡萄糖基转移酶(UGT),所述UDP-葡萄糖基转移酶(UGT)具有SEQ ID NO:18的氨基酸序列。
33.能够生成类异戊二烯化合物的经遗传修饰的宿主细胞,所述经遗传修饰的宿主细胞包含编码ABC转运蛋白的异源核酸,所述ABC转运蛋白包含与选自由下列组成的组的氨基酸序列具有至少80%序列同一性的氨基酸序列:SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:28、SEQID NO:29、SEQ ID NO:30。
34.根据权利要求33所述的经遗传修饰的宿主细胞,其中所述ABC转运蛋白包含氨基酸序列,所述氨基酸序列具有选自由下列组成的组的序列:SEQ ID NO:1、SEQ ID NO:2、SEQID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ IDNO:。
35.根据权利要求33或34所述的经遗传修饰的宿主细胞,其进一步包含编码紫穗槐-4,11-二烯合酶的核酸及编码紫穗槐-4,11-二烯氧化酶的核酸。
36.根据权利要求35所述的经遗传修饰的宿主细胞,其中所述类异戊二烯化合物选自青蒿醇、青蒿醛、和青蒿酸。
37.根据权利要求36任一项所述的经遗传修饰的宿主细胞,其中所述宿主细胞选自细菌细胞、真菌细胞、藻类细胞、昆虫细胞和植物细胞。
38.根据权利要求37所述的经遗传修饰的宿主细胞,其中所述宿主细胞是酿酒酵母(Saccharomyces cerevisiae)细胞。
39.根据权利要求33-38任一项所述的经遗传修饰的宿主细胞,其中所述ABC转运蛋白包含具有SEQ ID NO:1的所述序列的氨基酸序列。
40.根据权利要求33-38任一项所述的经遗传修饰的宿主细胞,其中所述ABC转运蛋白包含具有SEQ ID NO:2的所述序列的氨基酸序列。
41.根据权利要求33-38任一项所述的经遗传修饰的宿主细胞,其中所述ABC转运蛋白包含具有SEQ ID NO:3的所述序列的氨基酸序列。
42.根据权利要求33-38任一项所述的经遗传修饰的宿主细胞,其中所述ABC转运蛋白包含具有SEQ ID NO:4的所述序列的氨基酸序列。
43.根据权利要求33-38任一项所述的经遗传修饰的宿主细胞,其中所述ABC转运蛋白包含具有SEQ ID NO:5的所述序列的氨基酸序列。
44.根据权利要求33-38任一项所述的经遗传修饰的宿主细胞,其中所述ABC转运蛋白包含具有SEQ ID NO:6的所述序列的氨基酸序列。
45.根据权利要求33-38任一项所述的经遗传修饰的宿主细胞,其中所述ABC转运蛋白包含具有SEQ ID NO:7的所述序列的氨基酸序列。
46.根据权利要求33-38任一项所述的经遗传修饰的宿主细胞,其中所述ABC转运蛋白包含具有SEQ ID NO:8的所述序列的氨基酸序列。
47.生成青蒿酸的方法,其包含下列步骤:
(a)在适于制备青蒿酸的条件下,在含有碳源的培养基中培养权利要求33-46任一项所述的宿主细胞的种群以生成培养液;和
(b)从所述培养液回收所述青蒿酸。
48.生成类异戊二烯化合物的方法,其包含下列步骤:
(a)在适于制备所述类异戊二烯化合物的条件下,在含有碳源的培养基中培养权利要求33所述的宿主细胞的种群以生成培养液;和
(b)从所述培养液回收所述类异戊二烯化合物。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962796228P | 2019-01-24 | 2019-01-24 | |
US62/796228 | 2019-01-24 | ||
PCT/US2020/014859 WO2020154549A2 (en) | 2019-01-24 | 2020-01-23 | Abc transporters for the high efficiency production of rebaudiosides |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113631698A true CN113631698A (zh) | 2021-11-09 |
Family
ID=69771038
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080023632.3A Pending CN113631698A (zh) | 2019-01-24 | 2020-01-23 | 用于高效生成瑞鲍迪苷的abc转运蛋白 |
Country Status (11)
Country | Link |
---|---|
US (1) | US20220106619A1 (zh) |
EP (1) | EP3914700A2 (zh) |
JP (1) | JP7518838B2 (zh) |
KR (1) | KR20210120027A (zh) |
CN (1) | CN113631698A (zh) |
AU (1) | AU2020211408A1 (zh) |
BR (1) | BR112021014143A2 (zh) |
CA (1) | CA3127249A1 (zh) |
MX (1) | MX2021008747A (zh) |
SG (1) | SG11202107656TA (zh) |
WO (1) | WO2020154549A2 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118374427A (zh) * | 2024-05-07 | 2024-07-23 | 山东三元生物科技股份有限公司 | 一株催化甜菊糖粗糖生成莱鲍迪甙d的重组菌及其应用 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014122328A1 (en) * | 2013-02-11 | 2014-08-14 | Evolva Sa | Efficient production of steviol glycosides in recombinant hosts |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2644273A1 (en) * | 2006-04-05 | 2008-03-27 | Metanomics Gmbh | Process for the production of a fine chemical |
JP4760951B2 (ja) | 2009-05-08 | 2011-08-31 | トヨタ自動車株式会社 | ブタノール生産能を有する組換え微生物及びブタノールの製造方法 |
JP5056897B2 (ja) | 2010-05-14 | 2012-10-24 | トヨタ自動車株式会社 | 2−ブタノールの製造方法及び2−ブタノール生産能を有する組換え微生物 |
JP5580488B2 (ja) | 2011-02-02 | 2014-08-27 | アミリス, インコーポレイテッド | テルペンシンターゼ変異体を発生させる方法 |
WO2012135591A2 (en) | 2011-03-30 | 2012-10-04 | Amyris, Inc. | Microbial isoprenoid production using a heterologous dxp pathway |
EP3792350A1 (en) | 2011-08-08 | 2021-03-17 | Evolva SA | Recombinant production of steviol glycosides |
IN2014CN03791A (zh) | 2011-11-09 | 2015-10-16 | Amyris Inc | |
WO2013137487A1 (ja) | 2012-03-16 | 2013-09-19 | サントリーホールディングス株式会社 | ステビオール配糖体化酵素およびそれをコードする遺伝子 |
US9752174B2 (en) | 2013-05-28 | 2017-09-05 | Purecircle Sdn Bhd | High-purity steviol glycosides |
BR112016002526B1 (pt) | 2013-08-07 | 2021-11-23 | Total Marketing Services | Método para produção de um composto heterólogo não catabólico, e, composição de fermentação |
BR112017002783A2 (pt) | 2014-08-11 | 2017-12-19 | Evolva Sa | produção de glicosídeos de esteviol em hospedeiros recombinantes |
EP3190905A2 (en) | 2014-09-09 | 2017-07-19 | Evolva SA | Production of steviol glycosides in recombinant hosts |
EP3303553B1 (en) | 2015-05-29 | 2022-07-27 | Cargill, Incorporated | Fermentation methods for producing steviol glycosides using high ph |
EP3332018B1 (en) | 2015-08-07 | 2022-07-27 | Evolva SA | Production of steviol glycosides in recombinant hosts |
WO2017025649A1 (en) * | 2015-08-13 | 2017-02-16 | Dsm Ip Assets B.V. | Steviol glycoside transport |
US11297862B2 (en) | 2015-08-13 | 2022-04-12 | Dsm Ip Assets B.V. | Steviol glycoside transport |
PT3497222T (pt) | 2016-08-12 | 2022-02-09 | Amyris Inc | Glicosiltransferase dependente de udp para produção de eficácia elevada de rebaudiosídeos |
WO2018211032A1 (en) * | 2017-05-17 | 2018-11-22 | Evolva Sa | Production of steviol glycosides in recombinant hosts |
-
2020
- 2020-01-23 JP JP2021542445A patent/JP7518838B2/ja active Active
- 2020-01-23 AU AU2020211408A patent/AU2020211408A1/en active Pending
- 2020-01-23 KR KR1020217026611A patent/KR20210120027A/ko unknown
- 2020-01-23 EP EP20709795.7A patent/EP3914700A2/en active Pending
- 2020-01-23 SG SG11202107656TA patent/SG11202107656TA/en unknown
- 2020-01-23 CN CN202080023632.3A patent/CN113631698A/zh active Pending
- 2020-01-23 WO PCT/US2020/014859 patent/WO2020154549A2/en unknown
- 2020-01-23 CA CA3127249A patent/CA3127249A1/en active Pending
- 2020-01-23 US US17/425,634 patent/US20220106619A1/en active Pending
- 2020-01-23 BR BR112021014143-0A patent/BR112021014143A2/pt unknown
- 2020-01-23 MX MX2021008747A patent/MX2021008747A/es unknown
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014122328A1 (en) * | 2013-02-11 | 2014-08-14 | Evolva Sa | Efficient production of steviol glycosides in recombinant hosts |
Also Published As
Publication number | Publication date |
---|---|
BR112021014143A2 (pt) | 2021-10-19 |
KR20210120027A (ko) | 2021-10-06 |
MX2021008747A (es) | 2021-09-08 |
WO2020154549A3 (en) | 2020-10-08 |
CA3127249A1 (en) | 2020-07-30 |
AU2020211408A1 (en) | 2021-08-12 |
EP3914700A2 (en) | 2021-12-01 |
WO2020154549A2 (en) | 2020-07-30 |
JP7518838B2 (ja) | 2024-07-18 |
US20220106619A1 (en) | 2022-04-07 |
JP2022523665A (ja) | 2022-04-26 |
SG11202107656TA (en) | 2021-08-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11866738B2 (en) | UDP-dependent glycosyltransferase for high efficiency production of rebaudiosides | |
JP7487099B2 (ja) | レバウジオシドの高効率生成のためのエンドウ(pisum sativum)カウレンオキシダーゼ | |
JP7518838B2 (ja) | レバウジオシドの高効率な生成のためのabcトランスポーター | |
CN113260699A (zh) | 用于高效生成瑞鲍迪苷的甜叶菊异贝壳杉烯酸羟化酶变体 | |
US12065685B1 (en) | UDP-glycosyltransferase variants and uses thereof | |
RU2795855C2 (ru) | Аbc-транспортеры для высокоэффективного производства ребаудиозидов | |
RU2795550C2 (ru) | Применение кауреноксидазы pisum sativum для высокоэффективного производства ребаудиозидов | |
US20220282228A1 (en) | Kaurenoic acid 13-hydroxylase (kah) variants and uses thereof | |
RU2777901C2 (ru) | Udp-зависимая гликозилтрансфераза для высокоэффективного продуцирования ребаудиозидов |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |