CN115678952A - 鼠李糖高度专一的糖基转移酶及其应用 - Google Patents
鼠李糖高度专一的糖基转移酶及其应用 Download PDFInfo
- Publication number
- CN115678952A CN115678952A CN202110871374.0A CN202110871374A CN115678952A CN 115678952 A CN115678952 A CN 115678952A CN 202110871374 A CN202110871374 A CN 202110871374A CN 115678952 A CN115678952 A CN 115678952A
- Authority
- CN
- China
- Prior art keywords
- rhamnose
- glycosyl
- polypeptide
- compound
- ginsenoside
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108700023372 Glycosyltransferases Proteins 0.000 title claims abstract description 108
- 102000051366 Glycosyltransferases Human genes 0.000 title claims abstract description 107
- SHZGCJCMOBCMKK-JFNONXLTSA-N L-rhamnopyranose Chemical compound C[C@@H]1OC(O)[C@H](O)[C@H](O)[C@H]1O SHZGCJCMOBCMKK-JFNONXLTSA-N 0.000 title claims abstract description 40
- SHZGCJCMOBCMKK-UHFFFAOYSA-N D-mannomethylose Natural products CC1OC(O)C(O)C(O)C1O SHZGCJCMOBCMKK-UHFFFAOYSA-N 0.000 title claims abstract description 26
- PNNNRSAQSRJVSB-UHFFFAOYSA-N L-rhamnose Natural products CC(O)C(O)C(O)C(O)C=O PNNNRSAQSRJVSB-UHFFFAOYSA-N 0.000 title claims abstract description 26
- -1 triterpene compound Chemical class 0.000 claims abstract description 53
- 125000003147 glycosyl group Chemical group 0.000 claims abstract description 38
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 113
- 229920001184 polypeptide Polymers 0.000 claims description 112
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 112
- 210000004027 cell Anatomy 0.000 claims description 78
- 150000001875 compounds Chemical class 0.000 claims description 46
- 239000000348 glycosyl donor Substances 0.000 claims description 42
- AGBCLJAHARWNLA-DQUQINEDSA-N Ginsenoside RG2 Chemical compound O[C@@H]1[C@H](O)[C@@H](O)[C@H](C)O[C@H]1O[C@H]1[C@H](O[C@@H]2[C@H]3C(C)(C)[C@@H](O)CC[C@]3(C)[C@@H]3[C@@]([C@@]4(CC[C@@H]([C@H]4[C@H](O)C3)[C@@](C)(O)CCC=C(C)C)C)(C)C2)O[C@H](CO)[C@@H](O)[C@@H]1O AGBCLJAHARWNLA-DQUQINEDSA-N 0.000 claims description 40
- YURJSTAIMNSZAE-UHFFFAOYSA-N UNPD89172 Natural products C1CC(C2(CC(C3C(C)(C)C(O)CCC3(C)C2CC2O)OC3C(C(O)C(O)C(CO)O3)O)C)(C)C2C1C(C)(CCC=C(C)C)OC1OC(CO)C(O)C(O)C1O YURJSTAIMNSZAE-UHFFFAOYSA-N 0.000 claims description 40
- 238000000034 method Methods 0.000 claims description 38
- 108091033319 polynucleotide Proteins 0.000 claims description 33
- 102000040430 polynucleotide Human genes 0.000 claims description 33
- 239000002157 polynucleotide Substances 0.000 claims description 33
- YURJSTAIMNSZAE-HHNZYBFYSA-N ginsenoside Rg1 Chemical compound O([C@@](C)(CCC=C(C)C)[C@@H]1[C@@H]2[C@@]([C@@]3(C[C@@H]([C@H]4C(C)(C)[C@@H](O)CC[C@]4(C)[C@H]3C[C@H]2O)O[C@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O2)O)C)(C)CC1)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O YURJSTAIMNSZAE-HHNZYBFYSA-N 0.000 claims description 31
- 238000006243 chemical reaction Methods 0.000 claims description 29
- 239000013598 vector Substances 0.000 claims description 28
- RAQNTCRNSXYLAH-RFCGZQMISA-N (20S)-ginsenoside Rh1 Chemical compound O([C@@H]1[C@H]2C(C)(C)[C@@H](O)CC[C@]2(C)[C@H]2C[C@@H](O)[C@H]3[C@@]([C@@]2(C1)C)(C)CC[C@@H]3[C@@](C)(O)CCC=C(C)C)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O RAQNTCRNSXYLAH-RFCGZQMISA-N 0.000 claims description 22
- RAQNTCRNSXYLAH-UHFFFAOYSA-N Ginsenoside Rh1 Natural products CC(C)=CCCC(C)(O)C1CCC(C2(C3)C)(C)C1C(O)CC2C1(C)CCC(O)C(C)(C)C1C3OC1OC(CO)C(O)C(O)C1O RAQNTCRNSXYLAH-UHFFFAOYSA-N 0.000 claims description 22
- 150000007523 nucleic acids Chemical class 0.000 claims description 21
- 235000000346 sugar Nutrition 0.000 claims description 21
- AGBCLJAHARWNLA-UHFFFAOYSA-N (20R)-ginsenoside Rg2 Natural products OC1C(O)C(O)C(C)OC1OC1C(OC2C3C(C)(C)C(O)CCC3(C)C3C(C4(CCC(C4C(O)C3)C(C)(O)CCC=C(C)C)C)(C)C2)OC(CO)C(O)C1O AGBCLJAHARWNLA-UHFFFAOYSA-N 0.000 claims description 20
- YPUHYSBFIMWSEC-OEHDJSDTSA-N (2r,3r,4s,5s,6r)-2-[[(2r,3s,4s,5r,6s)-6-[(2s)-2-[(3s,5r,6s,8r,9r,10r,12r,13r,14r,17s)-3,12-dihydroxy-4,4,8,10,14-pentamethyl-6-[(2r,3r,4s,5s,6r)-3,4,5-trihydroxy-6-(hydroxymethyl)oxan-2-yl]oxy-2,3,5,6,7,9,11,12,13,15,16,17-dodecahydro-1h-cyclopenta[a]phen Chemical compound C([C@H]1O[C@H]([C@@H]([C@@H](O)[C@@H]1O)O)O[C@@](C)(CCC=C(C)C)[C@@H]1[C@@H]2[C@@]([C@@]3(C[C@@H]([C@H]4C(C)(C)[C@@H](O)CC[C@]4(C)[C@H]3C[C@H]2O)O[C@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O2)O)C)(C)CC1)O[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O YPUHYSBFIMWSEC-OEHDJSDTSA-N 0.000 claims description 20
- PWAOOJDMFUQOKB-WCZZMFLVSA-N ginsenoside Re Chemical compound O[C@@H]1[C@H](O)[C@@H](O)[C@H](C)O[C@H]1O[C@H]1[C@H](O[C@@H]2[C@H]3C(C)(C)[C@@H](O)CC[C@]3(C)[C@@H]3[C@@]([C@@]4(CC[C@@H]([C@H]4[C@H](O)C3)[C@](C)(CCC=C(C)C)O[C@H]3[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O3)O)C)(C)C2)O[C@H](CO)[C@@H](O)[C@@H]1O PWAOOJDMFUQOKB-WCZZMFLVSA-N 0.000 claims description 20
- CBEHEBUBNAGGKC-UHFFFAOYSA-N ginsenoside Rg1 Natural products CC(=CCCC(C)(OC1OC(CO)C(O)C(O)C1O)C2CCC3(C)C2C(O)CC4C5(C)CCC(O)C(C)(C)C5CC(OC6OC(CO)C(O)C(O)C6O)C34C)C CBEHEBUBNAGGKC-UHFFFAOYSA-N 0.000 claims description 20
- AOGZLQUEBLOQCI-UHFFFAOYSA-N ginsenoside-Re Natural products CC1OC(OCC2OC(OC3CC4(C)C(CC(O)C5C(CCC45C)C(C)(CCC=C(C)C)OC6OC(CO)C(O)C(O)C6O)C7(C)CCC(O)C(C)(C)C37)C(O)C(O)C2O)C(O)C(O)C1O AOGZLQUEBLOQCI-UHFFFAOYSA-N 0.000 claims description 20
- JURZHOVRCOWZFN-UHFFFAOYSA-N notoginsenoside R1 Natural products CC(=CCCC(C)(OC1OC(CO)C(O)C(O)C1O)C2CCC3(C)C2C(O)CC4C5(C)CCC(O)C(C)(C)C5C(CC34C)OC6OC(COC7OCC(O)C(O)C7O)C(O)C(O)C6O)C JURZHOVRCOWZFN-UHFFFAOYSA-N 0.000 claims description 20
- 102000039446 nucleic acids Human genes 0.000 claims description 19
- 108020004707 nucleic acids Proteins 0.000 claims description 19
- 230000015572 biosynthetic process Effects 0.000 claims description 17
- 125000002791 glucosyl group Chemical group C1([C@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 claims description 17
- 230000014509 gene expression Effects 0.000 claims description 15
- BKQLBIWHYYCPJF-UHFFFAOYSA-N Yesanchinoside E Natural products OC1C(O)C(O)C(C)OC1OC1C(OC2C3C(C)(C)C(O)CCC3(C)C3C(C4(CCC(C4C(O)C3)C(C)(CCC=C(C)C)OC3C(C(O)C(O)C(COC4C(C(O)C(O)C(CO)O4)O)O3)O)C)(C)C2)OC(CO)C(O)C1O BKQLBIWHYYCPJF-UHFFFAOYSA-N 0.000 claims description 13
- 239000002243 precursor Substances 0.000 claims description 12
- 239000013604 expression vector Substances 0.000 claims description 11
- 125000000539 amino acid group Chemical group 0.000 claims description 10
- YPUHYSBFIMWSEC-UHFFFAOYSA-N notoginsenoside-R3 Natural products C1CC(C2(CC(C3C(C)(C)C(O)CCC3(C)C2CC2O)OC3C(C(O)C(O)C(CO)O3)O)C)(C)C2C1C(C)(CCC=C(C)C)OC(C(C(O)C1O)O)OC1COC1OC(CO)C(O)C(O)C1O YPUHYSBFIMWSEC-UHFFFAOYSA-N 0.000 claims description 10
- XTWYTFMLZFPYCI-KQYNXXCUSA-N 5'-adenylphosphoric acid Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O XTWYTFMLZFPYCI-KQYNXXCUSA-N 0.000 claims description 9
- XTWYTFMLZFPYCI-UHFFFAOYSA-N Adenosine diphosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(=O)OP(O)(O)=O)C(O)C1O XTWYTFMLZFPYCI-UHFFFAOYSA-N 0.000 claims description 9
- ZWIADYZPOWUWEW-XVFCMESISA-N CDP Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(O)=O)O1 ZWIADYZPOWUWEW-XVFCMESISA-N 0.000 claims description 9
- QGWNDRXFNXRZMB-UUOKFMHZSA-N GDP Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O QGWNDRXFNXRZMB-UUOKFMHZSA-N 0.000 claims description 9
- XCCTYIAWTASOJW-XVFCMESISA-N Uridine-5'-Diphosphate Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(=O)OP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1 XCCTYIAWTASOJW-XVFCMESISA-N 0.000 claims description 9
- UJLXYODCHAELLY-XLPZGREQSA-N dTDP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 UJLXYODCHAELLY-XLPZGREQSA-N 0.000 claims description 9
- QGWNDRXFNXRZMB-UHFFFAOYSA-N guanidine diphosphate Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(COP(O)(=O)OP(O)(O)=O)C(O)C1O QGWNDRXFNXRZMB-UHFFFAOYSA-N 0.000 claims description 9
- 238000012546 transfer Methods 0.000 claims description 6
- 238000002744 homologous recombination Methods 0.000 claims description 5
- 230000006801 homologous recombination Effects 0.000 claims description 5
- 108010076504 Protein Sorting Signals Proteins 0.000 claims description 4
- 125000000089 arabinosyl group Chemical group C1([C@@H](O)[C@H](O)[C@H](O)CO1)* 0.000 claims description 4
- 210000004899 c-terminal region Anatomy 0.000 claims description 4
- 150000002772 monosaccharides Chemical class 0.000 claims description 4
- 238000012258 culturing Methods 0.000 claims description 3
- 125000000969 xylosyl group Chemical group C1([C@H](O)[C@@H](O)[C@H](O)CO1)* 0.000 claims description 3
- 230000003834 intracellular effect Effects 0.000 claims description 2
- WOSQVRAUHHPIKD-DEZHIRTDSA-N OP(O)(=O)OP(O)(O)=O.C[C@H](O)[C@H](O)[C@@H](O)[C@@H](O)C=O Chemical compound OP(O)(=O)OP(O)(O)=O.C[C@H](O)[C@H](O)[C@@H](O)[C@@H](O)C=O WOSQVRAUHHPIKD-DEZHIRTDSA-N 0.000 claims 6
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 claims 6
- 125000003275 alpha amino acid group Chemical group 0.000 claims 6
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 claims 3
- 239000002126 C01EB10 - Adenosine Substances 0.000 claims 3
- WUKAYDLASGHIDN-VQFINVRFSA-N C[C@H](O)[C@H](O)[C@@H](O)[C@@H](O)C=O.C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O Chemical compound C[C@H](O)[C@H](O)[C@@H](O)[C@@H](O)C=O.C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O WUKAYDLASGHIDN-VQFINVRFSA-N 0.000 claims 3
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 claims 3
- 229960005305 adenosine Drugs 0.000 claims 3
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 claims 3
- ZOSQFDVXNQFKBY-CGAXJHMRSA-N dTDP-beta-L-rhamnose Chemical compound O[C@@H]1[C@H](O)[C@@H](O)[C@H](C)O[C@@H]1OP(O)(=O)OP(O)(=O)OC[C@@H]1[C@@H](O)C[C@H](N2C(NC(=O)C(C)=C2)=O)O1 ZOSQFDVXNQFKBY-CGAXJHMRSA-N 0.000 claims 3
- 229930182494 ginsenoside Natural products 0.000 abstract description 24
- 239000000758 substrate Substances 0.000 abstract description 19
- 229940089161 ginsenoside Drugs 0.000 abstract description 14
- 230000003197 catalytic effect Effects 0.000 abstract description 11
- 230000013595 glycosylation Effects 0.000 abstract description 9
- 238000006206 glycosylation reaction Methods 0.000 abstract description 9
- 238000010276 construction Methods 0.000 abstract description 4
- 230000006172 rhamnosylation Effects 0.000 abstract description 2
- 102000004190 Enzymes Human genes 0.000 description 31
- 108090000790 Enzymes Proteins 0.000 description 31
- 108090000623 proteins and genes Proteins 0.000 description 29
- 241000196324 Embryophyta Species 0.000 description 27
- 108020004414 DNA Proteins 0.000 description 26
- 244000131316 Panax pseudoginseng Species 0.000 description 26
- 108700014210 glycosyltransferase activity proteins Proteins 0.000 description 26
- 241000588724 Escherichia coli Species 0.000 description 25
- 239000000047 product Substances 0.000 description 25
- 229930182490 saponin Natural products 0.000 description 25
- 235000017709 saponins Nutrition 0.000 description 25
- 235000003140 Panax quinquefolius Nutrition 0.000 description 23
- 150000001413 amino acids Chemical group 0.000 description 23
- 230000000694 effects Effects 0.000 description 23
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 22
- 235000008434 ginseng Nutrition 0.000 description 22
- 150000007949 saponins Chemical class 0.000 description 21
- BBEUDPAEKGPXDG-UHFFFAOYSA-N protopanaxatriol Natural products CC(CCC=C(C)C)C1CCC2(C)C1C(O)CC3C4(C)CCC(O)C(C)(C)C4C(O)CC23C BBEUDPAEKGPXDG-UHFFFAOYSA-N 0.000 description 20
- 102000004169 proteins and genes Human genes 0.000 description 17
- SHCBCKBYTHZQGZ-DLHMIPLTSA-N protopanaxatriol Chemical compound C1C[C@H](O)C(C)(C)[C@@H]2[C@@H](O)C[C@@]3(C)[C@]4(C)CC[C@H]([C@](C)(O)CCC=C(C)C)[C@H]4[C@H](O)C[C@@H]3[C@]21C SHCBCKBYTHZQGZ-DLHMIPLTSA-N 0.000 description 17
- 239000006228 supernatant Substances 0.000 description 17
- 235000018102 proteins Nutrition 0.000 description 16
- 239000001397 quillaja saponaria molina bark Substances 0.000 description 16
- 238000004809 thin layer chromatography Methods 0.000 description 14
- 239000012634 fragment Substances 0.000 description 13
- 239000006166 lysate Substances 0.000 description 13
- 239000000937 glycosyl acceptor Substances 0.000 description 12
- 238000004128 high performance liquid chromatography Methods 0.000 description 11
- 238000005918 transglycosylation reaction Methods 0.000 description 11
- 229940024606 amino acid Drugs 0.000 description 10
- HSCJRCZFDFQWRP-JZMIEXBBSA-N UDP-alpha-D-glucose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1OP(O)(=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C(NC(=O)C=C2)=O)O1 HSCJRCZFDFQWRP-JZMIEXBBSA-N 0.000 description 9
- HSCJRCZFDFQWRP-UHFFFAOYSA-N Uridindiphosphoglukose Natural products OC1C(O)C(O)C(CO)OC1OP(O)(=O)OP(O)(=O)OCC1C(O)C(O)C(N2C(NC(=O)C=C2)=O)O1 HSCJRCZFDFQWRP-UHFFFAOYSA-N 0.000 description 9
- 235000001014 amino acid Nutrition 0.000 description 9
- 239000013612 plasmid Substances 0.000 description 9
- 150000003648 triterpenes Chemical class 0.000 description 9
- 108091033409 CRISPR Proteins 0.000 description 8
- 241000180649 Panax notoginseng Species 0.000 description 8
- 235000003143 Panax notoginseng Nutrition 0.000 description 8
- 210000003527 eukaryotic cell Anatomy 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 238000006467 substitution reaction Methods 0.000 description 8
- 238000003786 synthesis reaction Methods 0.000 description 8
- XCCTYIAWTASOJW-UHFFFAOYSA-N UDP-Glc Natural products OC1C(O)C(COP(O)(=O)OP(O)(O)=O)OC1N1C(=O)NC(=O)C=C1 XCCTYIAWTASOJW-UHFFFAOYSA-N 0.000 description 7
- 230000004071 biological effect Effects 0.000 description 7
- 239000013592 cell lysate Substances 0.000 description 7
- 238000000338 in vitro Methods 0.000 description 7
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 6
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 6
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 6
- 238000004519 manufacturing process Methods 0.000 description 6
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 5
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 5
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 5
- 235000002791 Panax Nutrition 0.000 description 5
- 241000208343 Panax Species 0.000 description 5
- 239000000654 additive Substances 0.000 description 5
- PYXFVCFISTUSOO-UHFFFAOYSA-N betulafolienetriol Natural products C1CC(O)C(C)(C)C2CCC3(C)C4(C)CCC(C(C)(O)CCC=C(C)C)C4C(O)CC3C21C PYXFVCFISTUSOO-UHFFFAOYSA-N 0.000 description 5
- 239000003623 enhancer Substances 0.000 description 5
- 238000003780 insertion Methods 0.000 description 5
- 230000037431 insertion Effects 0.000 description 5
- 238000002360 preparation method Methods 0.000 description 5
- 210000001236 prokaryotic cell Anatomy 0.000 description 5
- SWQINCWATANGKN-UHFFFAOYSA-N protopanaxadiol Natural products CC(CCC=C(C)C)C1CCC2(C)C1C(O)CC1C3(C)CCC(O)C(C)(C)C3CCC21C SWQINCWATANGKN-UHFFFAOYSA-N 0.000 description 5
- 230000009261 transgenic effect Effects 0.000 description 5
- INLFWQCRAJUDCR-IQVMEADQSA-N (1R,2S,4S,5'S,6R,7S,8R,9S,12S,13S)-5',7,9,13-tetramethylspiro[5-oxapentacyclo[10.8.0.02,9.04,8.013,18]icosane-6,2'-oxane] Chemical compound O([C@@H]1[C@@H]([C@]2(CC[C@@H]3[C@@]4(C)CCCCC4CC[C@H]3[C@@H]2C1)C)[C@@H]1C)[C@]11CC[C@H](C)CO1 INLFWQCRAJUDCR-IQVMEADQSA-N 0.000 description 4
- PYXFVCFISTUSOO-HKUCOEKDSA-N (20S)-protopanaxadiol Chemical compound C1C[C@H](O)C(C)(C)[C@@H]2CC[C@@]3(C)[C@]4(C)CC[C@H]([C@@](C)(O)CCC=C(C)C)[C@H]4[C@H](O)C[C@@H]3[C@]21C PYXFVCFISTUSOO-HKUCOEKDSA-N 0.000 description 4
- BTJVOUQWFXABOI-IHRRRGAJSA-N Arg-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCNC(N)=N BTJVOUQWFXABOI-IHRRRGAJSA-N 0.000 description 4
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 4
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 4
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 4
- 108091028043 Nucleic acid sequence Proteins 0.000 description 4
- 108090000854 Oxidoreductases Proteins 0.000 description 4
- 101000932810 Panax ginseng Dammarenediol 12-hydroxylase Proteins 0.000 description 4
- 101000644012 Panax ginseng UDP-glycosyltransferase 100 Proteins 0.000 description 4
- KAGCQPSEVAETCA-JYJNAYRXSA-N Phe-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N KAGCQPSEVAETCA-JYJNAYRXSA-N 0.000 description 4
- SVXXJYJCRNKDDE-AVGNSLFASA-N Pro-Pro-His Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CN=CN1 SVXXJYJCRNKDDE-AVGNSLFASA-N 0.000 description 4
- 108020004511 Recombinant DNA Proteins 0.000 description 4
- DRDCJEIZVLVWNC-SLBWPEPYSA-N UDP-beta-L-rhamnose Chemical compound O[C@@H]1[C@H](O)[C@@H](O)[C@H](C)O[C@@H]1OP(O)(=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C(NC(=O)C=C2)=O)O1 DRDCJEIZVLVWNC-SLBWPEPYSA-N 0.000 description 4
- 230000000996 additive effect Effects 0.000 description 4
- 108010038633 aspartylglutamate Proteins 0.000 description 4
- 230000001580 bacterial effect Effects 0.000 description 4
- 238000010367 cloning Methods 0.000 description 4
- 238000012217 deletion Methods 0.000 description 4
- 230000037430 deletion Effects 0.000 description 4
- 239000000386 donor Substances 0.000 description 4
- 239000000499 gel Substances 0.000 description 4
- 239000008103 glucose Substances 0.000 description 4
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 4
- 238000013508 migration Methods 0.000 description 4
- 230000005012 migration Effects 0.000 description 4
- 239000002773 nucleotide Substances 0.000 description 4
- 125000003729 nucleotide group Chemical group 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000012216 screening Methods 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- 238000010354 CRISPR gene editing Methods 0.000 description 3
- NLHQJXWYMZLQJY-UHFFFAOYSA-N Dammarendiol Natural products C1CC(O)C(C)(C)C2CCC3(C)C4(C)CCC(C(C)(O)CCC=C(C)C)C4CCC3C21C NLHQJXWYMZLQJY-UHFFFAOYSA-N 0.000 description 3
- 108090000364 Ligases Proteins 0.000 description 3
- 235000003181 Panax pseudoginseng Nutrition 0.000 description 3
- 239000011543 agarose gel Substances 0.000 description 3
- 238000000246 agarose gel electrophoresis Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 230000008827 biological function Effects 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 3
- 239000002299 complementary DNA Substances 0.000 description 3
- NLHQJXWYMZLQJY-TXNIMPHESA-N dammarenediol-II Chemical compound C1C[C@H](O)C(C)(C)[C@@H]2CC[C@@]3(C)[C@]4(C)CC[C@H]([C@@](C)(O)CCC=C(C)C)[C@H]4CC[C@@H]3[C@]21C NLHQJXWYMZLQJY-TXNIMPHESA-N 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000013613 expression plasmid Substances 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000000855 fermentation Methods 0.000 description 3
- 230000004151 fermentation Effects 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 239000013641 positive control Substances 0.000 description 3
- 238000010188 recombinant method Methods 0.000 description 3
- 230000001172 regenerating effect Effects 0.000 description 3
- 230000003248 secreting effect Effects 0.000 description 3
- 230000028327 secretion Effects 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 230000001131 transforming effect Effects 0.000 description 3
- 230000006098 transglycosylation Effects 0.000 description 3
- 238000001262 western blot Methods 0.000 description 3
- PLQMEXSCSAIXGB-SAXRGWBVSA-N (+)-artemisinic acid Chemical compound C1=C(C)CC[C@H]2[C@H](C)CC[C@@H](C(=C)C(O)=O)[C@H]21 PLQMEXSCSAIXGB-SAXRGWBVSA-N 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 2
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 2
- SVBXIUDNTRTKHE-CIUDSAMLSA-N Ala-Arg-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O SVBXIUDNTRTKHE-CIUDSAMLSA-N 0.000 description 2
- OKEWAFFWMHBGPT-XPUUQOCRSA-N Ala-His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CN=CN1 OKEWAFFWMHBGPT-XPUUQOCRSA-N 0.000 description 2
- GSHKMNKPMLXSQW-KBIXCLLPSA-N Ala-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C)N GSHKMNKPMLXSQW-KBIXCLLPSA-N 0.000 description 2
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 2
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 2
- DGLQWAFPIXDKRL-UBHSHLNASA-N Ala-Met-Phe Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N DGLQWAFPIXDKRL-UBHSHLNASA-N 0.000 description 2
- PGNNQOJOEGFAOR-KWQFWETISA-N Ala-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 PGNNQOJOEGFAOR-KWQFWETISA-N 0.000 description 2
- BVLPIIBTWIYOML-ZKWXMUAHSA-N Ala-Val-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BVLPIIBTWIYOML-ZKWXMUAHSA-N 0.000 description 2
- NKBQZKVMKJJDLX-SRVKXCTJSA-N Arg-Glu-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NKBQZKVMKJJDLX-SRVKXCTJSA-N 0.000 description 2
- AUFHLLPVPSMEOG-YUMQZZPRSA-N Arg-Gly-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AUFHLLPVPSMEOG-YUMQZZPRSA-N 0.000 description 2
- OLGCWMNDJTWQAG-GUBZILKMSA-N Asn-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(N)=O OLGCWMNDJTWQAG-GUBZILKMSA-N 0.000 description 2
- OLISTMZJGQUOGS-GMOBBJLQSA-N Asn-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N OLISTMZJGQUOGS-GMOBBJLQSA-N 0.000 description 2
- RBOBTTLFPRSXKZ-BZSNNMDCSA-N Asn-Phe-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RBOBTTLFPRSXKZ-BZSNNMDCSA-N 0.000 description 2
- YRTOMUMWSTUQAX-FXQIFTODSA-N Asn-Pro-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O YRTOMUMWSTUQAX-FXQIFTODSA-N 0.000 description 2
- MJIJBEYEHBKTIM-BYULHYEWSA-N Asn-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N MJIJBEYEHBKTIM-BYULHYEWSA-N 0.000 description 2
- BFOYULZBKYOKAN-OLHMAJIHSA-N Asp-Asp-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BFOYULZBKYOKAN-OLHMAJIHSA-N 0.000 description 2
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 2
- CRNKLABLTICXDV-GUBZILKMSA-N Asp-His-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N CRNKLABLTICXDV-GUBZILKMSA-N 0.000 description 2
- RQHLMGCXCZUOGT-ZPFDUUQYSA-N Asp-Leu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RQHLMGCXCZUOGT-ZPFDUUQYSA-N 0.000 description 2
- 108091033380 Coding strand Proteins 0.000 description 2
- JDHMXPSXWMPYQZ-AAEUAGOBSA-N Cys-Gly-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CS)N JDHMXPSXWMPYQZ-AAEUAGOBSA-N 0.000 description 2
- KGIHMGPYGXBYJJ-SRVKXCTJSA-N Cys-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CS KGIHMGPYGXBYJJ-SRVKXCTJSA-N 0.000 description 2
- BCFXQBXXDSEHRS-FXQIFTODSA-N Cys-Ser-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BCFXQBXXDSEHRS-FXQIFTODSA-N 0.000 description 2
- DQGIAOGALAQBGK-BWBBJGPYSA-N Cys-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N)O DQGIAOGALAQBGK-BWBBJGPYSA-N 0.000 description 2
- BLOXULLYFRGYKZ-GUBZILKMSA-N Gln-Glu-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BLOXULLYFRGYKZ-GUBZILKMSA-N 0.000 description 2
- XSBGUANSZDGULP-IUCAKERBSA-N Gln-Gly-Lys Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CCCCN)C(O)=O XSBGUANSZDGULP-IUCAKERBSA-N 0.000 description 2
- ICRKQMRFXYDYMK-LAEOZQHASA-N Gln-Val-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ICRKQMRFXYDYMK-LAEOZQHASA-N 0.000 description 2
- SOEXCCGNHQBFPV-DLOVCJGASA-N Gln-Val-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SOEXCCGNHQBFPV-DLOVCJGASA-N 0.000 description 2
- YYOBUPFZLKQUAX-FXQIFTODSA-N Glu-Asn-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YYOBUPFZLKQUAX-FXQIFTODSA-N 0.000 description 2
- RDDSZZJOKDVPAE-ACZMJKKPSA-N Glu-Asn-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDDSZZJOKDVPAE-ACZMJKKPSA-N 0.000 description 2
- WATXSTJXNBOHKD-LAEOZQHASA-N Glu-Asp-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O WATXSTJXNBOHKD-LAEOZQHASA-N 0.000 description 2
- KIMXNQXJJWWVIN-AVGNSLFASA-N Glu-Cys-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)N)O KIMXNQXJJWWVIN-AVGNSLFASA-N 0.000 description 2
- FKGNJUCQKXQNRA-NRPADANISA-N Glu-Cys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CCC(O)=O FKGNJUCQKXQNRA-NRPADANISA-N 0.000 description 2
- HILMIYALTUQTRC-XVKPBYJWSA-N Glu-Gly-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HILMIYALTUQTRC-XVKPBYJWSA-N 0.000 description 2
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 2
- FBEJIDRSQCGFJI-GUBZILKMSA-N Glu-Leu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FBEJIDRSQCGFJI-GUBZILKMSA-N 0.000 description 2
- SWRVAQHFBRZVNX-GUBZILKMSA-N Glu-Lys-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O SWRVAQHFBRZVNX-GUBZILKMSA-N 0.000 description 2
- LHIPZASLKPYDPI-AVGNSLFASA-N Glu-Phe-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LHIPZASLKPYDPI-AVGNSLFASA-N 0.000 description 2
- RFTVTKBHDXCEEX-WDSKDSINSA-N Glu-Ser-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RFTVTKBHDXCEEX-WDSKDSINSA-N 0.000 description 2
- KAJAOGBVWCYGHZ-JTQLQIEISA-N Gly-Gly-Phe Chemical compound [NH3+]CC(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KAJAOGBVWCYGHZ-JTQLQIEISA-N 0.000 description 2
- UESJMAMHDLEHGM-NHCYSSNCSA-N Gly-Ile-Leu Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O UESJMAMHDLEHGM-NHCYSSNCSA-N 0.000 description 2
- ZLCLYFGMKFCDCN-XPUUQOCRSA-N Gly-Ser-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CO)NC(=O)CN)C(O)=O ZLCLYFGMKFCDCN-XPUUQOCRSA-N 0.000 description 2
- FFJQHWKSGAWSTJ-BFHQHQDPSA-N Gly-Thr-Ala Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O FFJQHWKSGAWSTJ-BFHQHQDPSA-N 0.000 description 2
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 2
- YGHSQRJSHKYUJY-SCZZXKLOSA-N Gly-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN YGHSQRJSHKYUJY-SCZZXKLOSA-N 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 2
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 2
- 241000238631 Hexapoda Species 0.000 description 2
- FDQYIRHBVVUTJF-ZETCQYMHSA-N His-Gly-Gly Chemical compound [O-]C(=O)CNC(=O)CNC(=O)[C@@H]([NH3+])CC1=CN=CN1 FDQYIRHBVVUTJF-ZETCQYMHSA-N 0.000 description 2
- ORERHHPZDDEMSC-VGDYDELISA-N His-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N ORERHHPZDDEMSC-VGDYDELISA-N 0.000 description 2
- NBWATNYAUVSAEQ-ZEILLAHLSA-N His-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O NBWATNYAUVSAEQ-ZEILLAHLSA-N 0.000 description 2
- 101000595467 Homo sapiens T-complex protein 1 subunit gamma Proteins 0.000 description 2
- WUEIUSDAECDLQO-NAKRPEOUSA-N Ile-Ala-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)O)N WUEIUSDAECDLQO-NAKRPEOUSA-N 0.000 description 2
- YPQDTQJBOFOTJQ-SXTJYALSSA-N Ile-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N YPQDTQJBOFOTJQ-SXTJYALSSA-N 0.000 description 2
- YBJWJQQBWRARLT-KBIXCLLPSA-N Ile-Gln-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O YBJWJQQBWRARLT-KBIXCLLPSA-N 0.000 description 2
- JXMSHKFPDIUYGS-SIUGBPQLSA-N Ile-Glu-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N JXMSHKFPDIUYGS-SIUGBPQLSA-N 0.000 description 2
- FZWVCYCYWCLQDH-NHCYSSNCSA-N Ile-Leu-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N FZWVCYCYWCLQDH-NHCYSSNCSA-N 0.000 description 2
- GAZGFPOZOLEYAJ-YTFOTSKYSA-N Ile-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N GAZGFPOZOLEYAJ-YTFOTSKYSA-N 0.000 description 2
- GVNNAHIRSDRIII-AJNGGQMLSA-N Ile-Lys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N GVNNAHIRSDRIII-AJNGGQMLSA-N 0.000 description 2
- RCMNUBZKIIJCOI-ZPFDUUQYSA-N Ile-Met-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RCMNUBZKIIJCOI-ZPFDUUQYSA-N 0.000 description 2
- XLXPYSDGMXTTNQ-UHFFFAOYSA-N Ile-Phe-Leu Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 XLXPYSDGMXTTNQ-UHFFFAOYSA-N 0.000 description 2
- XLXPYSDGMXTTNQ-DKIMLUQUSA-N Ile-Phe-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CC(C)C)C(O)=O XLXPYSDGMXTTNQ-DKIMLUQUSA-N 0.000 description 2
- IITVUURPOYGCTD-NAKRPEOUSA-N Ile-Pro-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IITVUURPOYGCTD-NAKRPEOUSA-N 0.000 description 2
- DZMWFIRHFFVBHS-ZEWNOJEFSA-N Ile-Tyr-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N DZMWFIRHFFVBHS-ZEWNOJEFSA-N 0.000 description 2
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 2
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 2
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 2
- FIJMQLGQLBLBOL-HJGDQZAQSA-N Leu-Asn-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FIJMQLGQLBLBOL-HJGDQZAQSA-N 0.000 description 2
- HGFGEMSVBMCFKK-MNXVOIDGSA-N Leu-Ile-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HGFGEMSVBMCFKK-MNXVOIDGSA-N 0.000 description 2
- SEMUSFOBZGKBGW-YTFOTSKYSA-N Leu-Ile-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SEMUSFOBZGKBGW-YTFOTSKYSA-N 0.000 description 2
- OMHLATXVNQSALM-FQUUOJAGSA-N Leu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(C)C)N OMHLATXVNQSALM-FQUUOJAGSA-N 0.000 description 2
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 2
- VULJUQZPSOASBZ-SRVKXCTJSA-N Leu-Pro-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O VULJUQZPSOASBZ-SRVKXCTJSA-N 0.000 description 2
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 2
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 2
- ODRREERHVHMIPT-OEAJRASXSA-N Leu-Thr-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ODRREERHVHMIPT-OEAJRASXSA-N 0.000 description 2
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 2
- QUYCUALODHJQLK-CIUDSAMLSA-N Lys-Asp-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUYCUALODHJQLK-CIUDSAMLSA-N 0.000 description 2
- PBIPLDMFHAICIP-DCAQKATOSA-N Lys-Glu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PBIPLDMFHAICIP-DCAQKATOSA-N 0.000 description 2
- GQFDWEDHOQRNLC-QWRGUYRKSA-N Lys-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN GQFDWEDHOQRNLC-QWRGUYRKSA-N 0.000 description 2
- WAIHHELKYSFIQN-XUXIUFHCSA-N Lys-Ile-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O WAIHHELKYSFIQN-XUXIUFHCSA-N 0.000 description 2
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 2
- IKXQOBUBZSOWDY-AVGNSLFASA-N Lys-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N IKXQOBUBZSOWDY-AVGNSLFASA-N 0.000 description 2
- WGBMNLCRYKSWAR-DCAQKATOSA-N Met-Asp-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN WGBMNLCRYKSWAR-DCAQKATOSA-N 0.000 description 2
- MCNGIXXCMJAURZ-VEVYYDQMSA-N Met-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCSC)N)O MCNGIXXCMJAURZ-VEVYYDQMSA-N 0.000 description 2
- SDTSLIMYROCDNS-FXQIFTODSA-N Met-Cys-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O SDTSLIMYROCDNS-FXQIFTODSA-N 0.000 description 2
- JACAKCWAOHKQBV-UWVGGRQHSA-N Met-Gly-Lys Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN JACAKCWAOHKQBV-UWVGGRQHSA-N 0.000 description 2
- AWGBEIYZPAXXSX-RWMBFGLXSA-N Met-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N AWGBEIYZPAXXSX-RWMBFGLXSA-N 0.000 description 2
- LXCSZPUQKMTXNW-BQBZGAKWSA-N Met-Ser-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O LXCSZPUQKMTXNW-BQBZGAKWSA-N 0.000 description 2
- SOAYQFDWEIWPPR-IHRRRGAJSA-N Met-Ser-Tyr Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O SOAYQFDWEIWPPR-IHRRRGAJSA-N 0.000 description 2
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 2
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 2
- FNIRVWPHRMMRQI-PGOMJGFXSA-N Notoginsenoside R2 Chemical compound O([C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@H]2C(C)(C)[C@@H](O)CC[C@]2(C)[C@H]2C[C@@H](O)[C@H]3[C@@]([C@@]2(C1)C)(C)CC[C@@H]3[C@@](C)(O)CCC=C(C)C)[C@@H]1OC[C@@H](O)[C@H](O)[C@H]1O FNIRVWPHRMMRQI-PGOMJGFXSA-N 0.000 description 2
- 101710163270 Nuclease Proteins 0.000 description 2
- 101100272974 Panax ginseng CYP716A47 gene Proteins 0.000 description 2
- 101000722816 Panax ginseng Dammarenediol II synthase Proteins 0.000 description 2
- 101000644025 Panax ginseng UDP-glycosyltransferase 1 Proteins 0.000 description 2
- BJEYSVHMGIJORT-NHCYSSNCSA-N Phe-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 BJEYSVHMGIJORT-NHCYSSNCSA-N 0.000 description 2
- NRKNYPRRWXVELC-NQCBNZPSSA-N Phe-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC3=CC=CC=C3)N NRKNYPRRWXVELC-NQCBNZPSSA-N 0.000 description 2
- QARPMYDMYVLFMW-KKUMJFAQSA-N Phe-Pro-Glu Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=CC=C1 QARPMYDMYVLFMW-KKUMJFAQSA-N 0.000 description 2
- 239000002202 Polyethylene glycol Substances 0.000 description 2
- AJLVKXCNXIJHDV-CIUDSAMLSA-N Pro-Ala-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O AJLVKXCNXIJHDV-CIUDSAMLSA-N 0.000 description 2
- GRIRJQGZZJVANI-CYDGBPFRSA-N Pro-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H]1CCCN1 GRIRJQGZZJVANI-CYDGBPFRSA-N 0.000 description 2
- AHXPYZRZRMQOAU-QXEWZRGKSA-N Pro-Asn-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1)C(O)=O AHXPYZRZRMQOAU-QXEWZRGKSA-N 0.000 description 2
- FYPGHGXAOZTOBO-IHRRRGAJSA-N Pro-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2 FYPGHGXAOZTOBO-IHRRRGAJSA-N 0.000 description 2
- SUENWIFTSTWUKD-AVGNSLFASA-N Pro-Leu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SUENWIFTSTWUKD-AVGNSLFASA-N 0.000 description 2
- DCHQYSOGURGJST-FJXKBIBVSA-N Pro-Thr-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O DCHQYSOGURGJST-FJXKBIBVSA-N 0.000 description 2
- YHUBAXGAAYULJY-ULQDDVLXSA-N Pro-Tyr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O YHUBAXGAAYULJY-ULQDDVLXSA-N 0.000 description 2
- ZMLRZBWCXPQADC-TUAOUCFPSA-N Pro-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 ZMLRZBWCXPQADC-TUAOUCFPSA-N 0.000 description 2
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 2
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 2
- 108020005091 Replication Origin Proteins 0.000 description 2
- QPFJSHSJFIYDJZ-GHCJXIJMSA-N Ser-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO QPFJSHSJFIYDJZ-GHCJXIJMSA-N 0.000 description 2
- LQESNKGTTNHZPZ-GHCJXIJMSA-N Ser-Ile-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O LQESNKGTTNHZPZ-GHCJXIJMSA-N 0.000 description 2
- GJFYFGOEWLDQGW-GUBZILKMSA-N Ser-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GJFYFGOEWLDQGW-GUBZILKMSA-N 0.000 description 2
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 2
- XKFJENWJGHMDLI-QWRGUYRKSA-N Ser-Phe-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O XKFJENWJGHMDLI-QWRGUYRKSA-N 0.000 description 2
- PJIQEIFXZPCWOJ-FXQIFTODSA-N Ser-Pro-Asp Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O PJIQEIFXZPCWOJ-FXQIFTODSA-N 0.000 description 2
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 2
- KQNDIKOYWZTZIX-FXQIFTODSA-N Ser-Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQNDIKOYWZTZIX-FXQIFTODSA-N 0.000 description 2
- JCLAFVNDBJMLBC-JBDRJPRFSA-N Ser-Ser-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JCLAFVNDBJMLBC-JBDRJPRFSA-N 0.000 description 2
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 2
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 2
- 241000187747 Streptomyces Species 0.000 description 2
- 102100036049 T-complex protein 1 subunit gamma Human genes 0.000 description 2
- MQBTXMPQNCGSSZ-OSUNSFLBSA-N Thr-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N MQBTXMPQNCGSSZ-OSUNSFLBSA-N 0.000 description 2
- ZLNWJMRLHLGKFX-SVSWQMSJSA-N Thr-Cys-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZLNWJMRLHLGKFX-SVSWQMSJSA-N 0.000 description 2
- LHEZGZQRLDBSRR-WDCWCFNPSA-N Thr-Glu-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LHEZGZQRLDBSRR-WDCWCFNPSA-N 0.000 description 2
- SPVHQURZJCUDQC-VOAKCMCISA-N Thr-Lys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O SPVHQURZJCUDQC-VOAKCMCISA-N 0.000 description 2
- DOBIBIXIHJKVJF-XKBZYTNZSA-N Thr-Ser-Gln Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O DOBIBIXIHJKVJF-XKBZYTNZSA-N 0.000 description 2
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 2
- 239000004473 Threonine Substances 0.000 description 2
- PALLCTDPFINNMM-JQHSSLGASA-N Trp-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N PALLCTDPFINNMM-JQHSSLGASA-N 0.000 description 2
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 2
- VFJIWSJKZJTQII-SRVKXCTJSA-N Tyr-Asp-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O VFJIWSJKZJTQII-SRVKXCTJSA-N 0.000 description 2
- UABYBEBXFFNCIR-YDHLFZDLSA-N Tyr-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UABYBEBXFFNCIR-YDHLFZDLSA-N 0.000 description 2
- WZQZUVWEPMGIMM-JYJNAYRXSA-N Tyr-Gln-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O WZQZUVWEPMGIMM-JYJNAYRXSA-N 0.000 description 2
- WAPFQMXRSDEGOE-IHRRRGAJSA-N Tyr-Glu-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O WAPFQMXRSDEGOE-IHRRRGAJSA-N 0.000 description 2
- MQGGXGKQSVEQHR-KKUMJFAQSA-N Tyr-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MQGGXGKQSVEQHR-KKUMJFAQSA-N 0.000 description 2
- DQQDLYVHOTZLOR-UHFFFAOYSA-N UDP-alpha-D-xylose Natural products O1C(N2C(NC(=O)C=C2)=O)C(O)C(O)C1COP(O)(=O)OP(O)(=O)OC1OCC(O)C(O)C1O DQQDLYVHOTZLOR-UHFFFAOYSA-N 0.000 description 2
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 2
- VVZDBPBZHLQPPB-XVKPBYJWSA-N Val-Glu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VVZDBPBZHLQPPB-XVKPBYJWSA-N 0.000 description 2
- UEHRGZCNLSWGHK-DLOVCJGASA-N Val-Glu-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UEHRGZCNLSWGHK-DLOVCJGASA-N 0.000 description 2
- ZTKGDWOUYRRAOQ-ULQDDVLXSA-N Val-His-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N ZTKGDWOUYRRAOQ-ULQDDVLXSA-N 0.000 description 2
- ZIGZPYJXIWLQFC-QTKMDUPCSA-N Val-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](C(C)C)N)O ZIGZPYJXIWLQFC-QTKMDUPCSA-N 0.000 description 2
- OVBMCNDKCWAXMZ-NAKRPEOUSA-N Val-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N OVBMCNDKCWAXMZ-NAKRPEOUSA-N 0.000 description 2
- KRAHMIJVUPUOTQ-DCAQKATOSA-N Val-Ser-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KRAHMIJVUPUOTQ-DCAQKATOSA-N 0.000 description 2
- ZNGPROMGGGFOAA-JYJNAYRXSA-N Val-Tyr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=C(O)C=C1 ZNGPROMGGGFOAA-JYJNAYRXSA-N 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 108010005233 alanylglutamic acid Proteins 0.000 description 2
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 2
- 229960000723 ampicillin Drugs 0.000 description 2
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 239000000427 antigen Substances 0.000 description 2
- 102000036639 antigens Human genes 0.000 description 2
- 108091007433 antigens Proteins 0.000 description 2
- 108010013835 arginine glutamate Proteins 0.000 description 2
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 2
- 108010062796 arginyllysine Proteins 0.000 description 2
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 2
- 108010068265 aspartyltyrosine Proteins 0.000 description 2
- 230000000975 bioactive effect Effects 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 238000006555 catalytic reaction Methods 0.000 description 2
- 239000013599 cloning vector Substances 0.000 description 2
- 206010012601 diabetes mellitus Diseases 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 238000003028 enzyme activity measurement method Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 102000037865 fusion proteins Human genes 0.000 description 2
- 108020001507 fusion proteins Proteins 0.000 description 2
- 108010049041 glutamylalanine Proteins 0.000 description 2
- 108010079547 glutamylmethionine Proteins 0.000 description 2
- 108010054666 glycyl-leucyl-glycyl-glycine Proteins 0.000 description 2
- 108010020688 glycylhistidine Proteins 0.000 description 2
- 108010050848 glycylleucine Proteins 0.000 description 2
- 108010077515 glycylproline Proteins 0.000 description 2
- 108010037850 glycylvaline Proteins 0.000 description 2
- 239000005090 green fluorescent protein Substances 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- 108010040030 histidinoalanine Proteins 0.000 description 2
- 108010028295 histidylhistidine Proteins 0.000 description 2
- 108010025306 histidylleucine Proteins 0.000 description 2
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 2
- 108010054155 lysyllysine Proteins 0.000 description 2
- 108010017391 lysylvaline Proteins 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 230000037353 metabolic pathway Effects 0.000 description 2
- 238000009335 monocropping Methods 0.000 description 2
- 239000000178 monomer Substances 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 229930014626 natural product Natural products 0.000 description 2
- FNIRVWPHRMMRQI-UHFFFAOYSA-N notoginsenoside-R2 Natural products CC(C)=CCCC(C)(O)C1CCC(C2(C3)C)(C)C1C(O)CC2C1(C)CCC(O)C(C)(C)C1C3OC1OC(CO)C(O)C(O)C1OC1OCC(O)C(O)C1O FNIRVWPHRMMRQI-UHFFFAOYSA-N 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 239000000575 pesticide Substances 0.000 description 2
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 2
- 229920001223 polyethylene glycol Polymers 0.000 description 2
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 2
- 108010015796 prolylisoleucine Proteins 0.000 description 2
- 239000002994 raw material Substances 0.000 description 2
- 238000003259 recombinant expression Methods 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 108010026333 seryl-proline Proteins 0.000 description 2
- 125000001424 substituent group Chemical group 0.000 description 2
- 238000006276 transfer reaction Methods 0.000 description 2
- 108010038745 tryptophylglycine Proteins 0.000 description 2
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 2
- 108010003137 tyrosyltyrosine Proteins 0.000 description 2
- 239000004474 valine Substances 0.000 description 2
- 210000005253 yeast cell Anatomy 0.000 description 2
- 101710135150 (+)-T-muurolol synthase ((2E,6E)-farnesyl diphosphate cyclizing) Proteins 0.000 description 1
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- DLGAUVSRZXNATA-DHYYHALDSA-N (2s,3s)-2-amino-3-methylpentanoic acid;(2s)-pyrrolidine-2-carboxylic acid Chemical compound OC(=O)[C@@H]1CCCN1.CC[C@H](C)[C@H](N)C(O)=O DLGAUVSRZXNATA-DHYYHALDSA-N 0.000 description 1
- QYIMSPSDBYKPPY-RSKUXYSASA-N (S)-2,3-epoxysqualene Chemical compound CC(C)=CCC\C(C)=C\CC\C(C)=C\CC\C=C(/C)CC\C=C(/C)CC[C@@H]1OC1(C)C QYIMSPSDBYKPPY-RSKUXYSASA-N 0.000 description 1
- FBFMBWCLBGQEBU-GYMUUCMZSA-N 20-gluco-ginsenoside-Rf Natural products O([C@](CC/C=C(\C)/C)(C)[C@@H]1[C@H]2[C@H](O)C[C@H]3[C@](C)([C@]2(C)CC1)C[C@H](O[C@@H]1[C@H](O[C@H]2[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O2)[C@@H](O)[C@H](O)[C@@H](CO)O1)[C@H]1C(C)(C)[C@@H](O)CC[C@]31C)[C@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 FBFMBWCLBGQEBU-GYMUUCMZSA-N 0.000 description 1
- MIJYXULNPSFWEK-GTOFXWBISA-N 3beta-hydroxyolean-12-en-28-oic acid Chemical compound C1C[C@H](O)C(C)(C)[C@@H]2CC[C@@]3(C)[C@]4(C)CC[C@@]5(C(O)=O)CCC(C)(C)C[C@H]5C4=CC[C@@H]3[C@]21C MIJYXULNPSFWEK-GTOFXWBISA-N 0.000 description 1
- 208000024827 Alzheimer disease Diseases 0.000 description 1
- YWENWUYXQUWRHQ-LPEHRKFASA-N Arg-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O YWENWUYXQUWRHQ-LPEHRKFASA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 108091062157 Cis-regulatory element Proteins 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 235000019750 Crude protein Nutrition 0.000 description 1
- 102000002004 Cytochrome P-450 Enzyme System Human genes 0.000 description 1
- 108010015742 Cytochrome P-450 Enzyme System Proteins 0.000 description 1
- 150000008574 D-amino acids Chemical class 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 1
- JKLISIRFYWXLQG-UHFFFAOYSA-N Epioleonolsaeure Natural products C1CC(O)C(C)(C)C2CCC3(C)C4(C)CCC5(C(O)=O)CCC(C)(C)CC5C4CCC3C21C JKLISIRFYWXLQG-UHFFFAOYSA-N 0.000 description 1
- 241000701959 Escherichia virus Lambda Species 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 101710119400 Geranylfarnesyl diphosphate synthase Proteins 0.000 description 1
- 101710107752 Geranylgeranyl diphosphate synthase Proteins 0.000 description 1
- UZIOUZHBUYLDHW-MSJHMJQNSA-N Ginsenoside Rf Natural products O([C@H]1[C@@H](O)[C@H](O)[C@H](CO)O[C@@H]1O[C@@H]1[C@H]2C(C)(C)[C@@H](O)CC[C@]2(C)[C@@H]2[C@](C)([C@@]3(C)[C@H]([C@@H](O)C2)[C@@H]([C@@](O)(CC/C=C(\C)/C)C)CC3)C1)[C@H]1[C@@H](O)[C@@H](O)[C@H](O)[C@H](CO)O1 UZIOUZHBUYLDHW-MSJHMJQNSA-N 0.000 description 1
- OWVURWCRZZMAOZ-XHNCKOQMSA-N Glu-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)N)C(=O)O OWVURWCRZZMAOZ-XHNCKOQMSA-N 0.000 description 1
- 102400000322 Glucagon-like peptide 1 Human genes 0.000 description 1
- DTHNMHAUYICORS-KTKZVXAJSA-N Glucagon-like peptide 1 Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC=1N=CNC=1)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=CC=C1 DTHNMHAUYICORS-KTKZVXAJSA-N 0.000 description 1
- 101800000224 Glucagon-like peptide 1 Proteins 0.000 description 1
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 108020005004 Guide RNA Proteins 0.000 description 1
- 240000006509 Gynostemma pentaphyllum Species 0.000 description 1
- 235000002956 Gynostemma pentaphyllum Nutrition 0.000 description 1
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- 150000008575 L-amino acids Chemical class 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 101100476480 Mus musculus S100a8 gene Proteins 0.000 description 1
- 101710135898 Myc proto-oncogene protein Proteins 0.000 description 1
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 1
- 101710118186 Neomycin resistance protein Proteins 0.000 description 1
- 229930189092 Notoginsenoside Natural products 0.000 description 1
- YBRJHZPWOMJYKQ-UHFFFAOYSA-N Oleanolic acid Natural products CC1(C)CC2C3=CCC4C5(C)CCC(O)C(C)(C)C5CCC4(C)C3(C)CCC2(C1)C(=O)O YBRJHZPWOMJYKQ-UHFFFAOYSA-N 0.000 description 1
- MIJYXULNPSFWEK-UHFFFAOYSA-N Oleanolinsaeure Natural products C1CC(O)C(C)(C)C2CCC3(C)C4(C)CCC5(C(O)=O)CCC(C)(C)CC5C4=CCC3C21C MIJYXULNPSFWEK-UHFFFAOYSA-N 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 240000005373 Panax quinquefolius Species 0.000 description 1
- 240000000220 Panda oleosa Species 0.000 description 1
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 102000018120 Recombinases Human genes 0.000 description 1
- 108010091086 Recombinases Proteins 0.000 description 1
- 241000293869 Salmonella enterica subsp. enterica serovar Typhimurium Species 0.000 description 1
- 206010039966 Senile dementia Diseases 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- 241001052560 Thallis Species 0.000 description 1
- 108010022394 Threonine synthase Proteins 0.000 description 1
- 102000006601 Thymidine Kinase Human genes 0.000 description 1
- 108020004440 Thymidine kinase Proteins 0.000 description 1
- 101710150448 Transcriptional regulator Myc Proteins 0.000 description 1
- DQQDLYVHOTZLOR-OCIMBMBZSA-N UDP-alpha-D-xylose Chemical compound C([C@@H]1[C@H]([C@H]([C@@H](O1)N1C(NC(=O)C=C1)=O)O)O)OP(O)(=O)OP(O)(=O)O[C@H]1OC[C@@H](O)[C@H](O)[C@H]1O DQQDLYVHOTZLOR-OCIMBMBZSA-N 0.000 description 1
- 241000607479 Yersinia pestis Species 0.000 description 1
- JCPSMIOSLWKUPV-XQQPQPTDSA-N [[(3r,4r,5s)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-[(2s,3s,4r,5r)-5-(2,4-dioxopyrimidin-1-yl)-3,4-dihydroxyoxolan-2-yl]methyl] phosphono hydrogen phosphate Chemical compound O[C@@H]1[C@@H](O)[C@H](CO)OC1C(OP(O)(=O)OP(O)(O)=O)[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C(NC(=O)C=C2)=O)O1 JCPSMIOSLWKUPV-XQQPQPTDSA-N 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 238000005377 adsorption chromatography Methods 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 229930101531 artemisinin Natural products 0.000 description 1
- BLUAFEHZUWYNDE-NNWCWBAJSA-N artemisinin Chemical compound C([C@](OO1)(C)O2)C[C@H]3[C@H](C)CC[C@@H]4[C@@]31[C@@H]2OC(=O)[C@@H]4C BLUAFEHZUWYNDE-NNWCWBAJSA-N 0.000 description 1
- 229960004191 artemisinin Drugs 0.000 description 1
- PLQMEXSCSAIXGB-UHFFFAOYSA-N artemisininic acid Natural products C1=C(C)CCC2C(C)CCC(C(=C)C(O)=O)C21 PLQMEXSCSAIXGB-UHFFFAOYSA-N 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 230000001851 biosynthetic effect Effects 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 239000003054 catalyst Substances 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- ZYZJWAJOTPNVPI-ZVBSCDOUSA-N cucurbitane Chemical compound C([C@H]1[C@]2(C)CC[C@@H]([C@]2(CC[C@]11C)C)[C@H](C)CCCC(C)C)CC2[C@H]1CCCC2(C)C ZYZJWAJOTPNVPI-ZVBSCDOUSA-N 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- OORMXZNMRWBSTK-LGFJJATJSA-N dammarane Chemical compound C1CCC(C)(C)[C@@H]2CC[C@@]3(C)[C@]4(C)CC[C@H]([C@H](C)CCCC(C)C)[C@H]4CC[C@@H]3[C@]21C OORMXZNMRWBSTK-LGFJJATJSA-N 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- JYGAZEJXUVDYHI-DGTMBMJNSA-N dihydroartemisinic acid Chemical compound C1CC(C)=C[C@@H]2[C@H]([C@@H](C)C(O)=O)CC[C@@H](C)[C@@H]21 JYGAZEJXUVDYHI-DGTMBMJNSA-N 0.000 description 1
- JYGAZEJXUVDYHI-UHFFFAOYSA-N dihydroartemisininic acid Natural products C1CC(C)=CC2C(C(C)C(O)=O)CCC(C)C21 JYGAZEJXUVDYHI-UHFFFAOYSA-N 0.000 description 1
- 102000004419 dihydrofolate reductase Human genes 0.000 description 1
- WQLVFSAGQJTQCK-UHFFFAOYSA-N diosgenin Natural products CC1C(C2(CCC3C4(C)CCC(O)CC4=CCC3C2C2)C)C2OC11CCC(C)CO1 WQLVFSAGQJTQCK-UHFFFAOYSA-N 0.000 description 1
- 239000001177 diphosphate Substances 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000001976 enzyme digestion Methods 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 210000001035 gastrointestinal tract Anatomy 0.000 description 1
- 238000002523 gelfiltration Methods 0.000 description 1
- 238000003198 gene knock in Methods 0.000 description 1
- 238000012239 gene modification Methods 0.000 description 1
- VAXXNBLRJUUBPR-UHFFFAOYSA-N ginsenoside F3 Natural products CC(=CCCC(C)(O)C1CCC2(C)C1C(O)CC3C4(C)CCC(O)C(C)(C)C4C(CC23C)OC5OC(COC6OCC(O)C(O)C6O)C(O)C(O)C5O)C VAXXNBLRJUUBPR-UHFFFAOYSA-N 0.000 description 1
- UZIOUZHBUYLDHW-XUBRWZAZSA-N ginsenoside Rf Chemical compound O([C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@H]2C(C)(C)[C@@H](O)CC[C@]2(C)[C@H]2C[C@@H](O)[C@H]3[C@@]([C@@]2(C1)C)(C)CC[C@@H]3[C@@](C)(O)CCC=C(C)C)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O UZIOUZHBUYLDHW-XUBRWZAZSA-N 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 230000001279 glycosylating effect Effects 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 229930187479 gypenoside Natural products 0.000 description 1
- ZRBFCAALKKNCJG-UHFFFAOYSA-N gypenoside-XVII Natural products C1CC(C2(CCC3C(C)(C)C(OC4C(C(O)C(O)C(CO)O4)O)CCC3(C)C2CC2O)C)(C)C2C1C(C)(CCC=C(C)C)OC(C(C(O)C1O)O)OC1COC1OC(CO)C(O)C(O)C1O ZRBFCAALKKNCJG-UHFFFAOYSA-N 0.000 description 1
- 230000004217 heart function Effects 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 230000001678 irradiating effect Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 238000004811 liquid chromatography Methods 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000002609 medium Substances 0.000 description 1
- 201000001441 melanoma Diseases 0.000 description 1
- 230000007087 memory ability Effects 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 239000002808 molecular sieve Substances 0.000 description 1
- 239000003471 mutagenic agent Substances 0.000 description 1
- 231100000707 mutagenic chemical Toxicity 0.000 description 1
- 230000004770 neurodegeneration Effects 0.000 description 1
- 208000015122 neurodegenerative disease Diseases 0.000 description 1
- 239000002777 nucleoside Substances 0.000 description 1
- 229940100243 oleanolic acid Drugs 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- HZLWUYJLOIAQFC-UHFFFAOYSA-N prosapogenin PS-A Natural products C12CC(C)(C)CCC2(C(O)=O)CCC(C2(CCC3C4(C)C)C)(C)C1=CCC2C3(C)CCC4OC1OCC(O)C(O)C1O HZLWUYJLOIAQFC-UHFFFAOYSA-N 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 239000012264 purified product Substances 0.000 description 1
- 238000002708 random mutagenesis Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000004153 renaturation Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- NWMIYTWHUDFRPL-UHFFFAOYSA-N sapogenin Natural products COC(=O)C1(CO)C(O)CCC2(C)C1CCC3(C)C2CC=C4C5C(C)(O)C(C)CCC5(CCC34C)C(=O)O NWMIYTWHUDFRPL-UHFFFAOYSA-N 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- URGAHOPLAPQHLN-UHFFFAOYSA-N sodium aluminosilicate Chemical compound [Na+].[Al+3].[O-][Si]([O-])=O.[O-][Si]([O-])=O URGAHOPLAPQHLN-UHFFFAOYSA-N 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 230000004960 subcellular localization Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 230000002463 transducing effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 238000005199 ultracentrifugation Methods 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1048—Glycosyltransferases (2.4)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/10—Cells modified by introduction of foreign genetic material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P33/00—Preparation of steroids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P33/00—Preparation of steroids
- C12P33/20—Preparation of steroids containing heterocyclic rings
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Biomedical Technology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Medicinal Chemistry (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Cell Biology (AREA)
- Enzymes And Modification Thereof (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
本发明提供了一种鼠李糖高度专一的糖基转移酶及其应用。本发明首次揭示一种专一性糖基转移酶,其可催化底物特定位置发生鼠李糖基化,以及提高催化活性。具体地,本发明的专一性糖基转移酶能特异和高效地催化四环三萜化合物底物的C‑6位在第一个糖基上发生糖基化,以延伸鼠李糖基团。本发明的专一性糖基转移酶具有良好的特异性和高效性,可应用于构建人工合成人参皂苷及多种新人参皂苷及其衍生物,在药学等领域具有良好的应用价值。
Description
技术领域
本发明涉及生物技术和植物生物学领域,具体地,本发明涉及一种鼠李糖高 度专一的糖基转移酶及其应用。
背景技术
人参皂苷是从人参属植物(如人参、三七和西洋参等)和绞股蓝中分离到的皂苷的总称,是一类三萜化合物。人参皂苷亦可以根据其分离的来源称为人参皂苷,三 七皂苷和绞股蓝皂苷。人参皂苷是这些药用植物中的主要生物活性成份。目前,已 经分离出了约150种皂苷。从结构上来看,人参皂苷主要是皂苷元经过糖基化后形 成的生物活性小分子。人参皂苷的皂苷元只有有限的几种,主要是达玛烷型四环三 萜的原人参二醇和原人参三醇,以及齐墩果烷酸。皂苷元通过糖基化后,可以提高 水溶性,改变其亚细胞定位,并产生出不同的生物活性。绝大部分原人参二醇型皂 苷是在C3和/或C20位羟基进行糖基化修饰,而原人参三醇型皂苷是在C6和/或 C20的羟基上进行糖基化修饰。不同类型的糖基以及不同程度的糖基化修饰产生了 分子结构繁多的人参皂苷。
鼠李糖基化修饰的人参皂苷具有丰富的生物活性。例如Rg2是在Rh1的 C6-O-Glc延伸一分子鼠李糖,Rg2在治疗抑郁、改善心功能、提高学习记忆能力、 抗老年痴呆等方面具有很好功效;人参皂苷Re是在Rg1的C6-O-Glc延伸一分子 鼠李糖,可能通过促进肠道组织中胰高血糖素样肽-1的分泌来发挥降血糖、治疗 糖尿病的作用。
人参皂苷以人参或者三七的总皂苷或者丰富皂苷为原料,依赖化学、酶和微 生物发酵的水解方法进行制备。由于野生的人参资源已基本耗竭,人参皂苷资源目 前来源于人参或三七的人工栽培,而其人工栽培的生长周期长(一般需要5-7年以 上),并且受到地域的限制,还经常受到病虫害而需要施用大量的农药,所以,人 参或三七的人工栽培有严重的连作障碍(人参或三七种植地需要休耕5-15年以上才 能克服连作障碍),所以人参皂苷的产量、品质及安全性都面临挑战。
合成生物学的发展为植物来源的天然产物的异源合成提供了新的机遇。以酵 母为底盘,通过代谢途径的组装和优化,已经实现了用廉价的单糖来发酵合成青蒿 酸或者双氢青蒿酸,继而再通过一步化学转化的方法生产青蒿素,这表明合成生物 学在天然产物的药物合成方面具有的巨大潜力。利用酵母底盘细胞通过合成生物学 方法异源合成人参皂苷单体,原料为廉价的单糖,制备过程为安全性可调控的发酵 过程,避免了任何外来污染(例如,原料植物人工种植时使用的农药),因此,通过 合成生物学技术制备人参皂苷单体,不仅具有成本优势,而且,可以保证成品的品 质与安全性。利用合成生物学技术制备足够量的各种高纯度的天然与非天然的人参 皂苷单体,用于活性测定及临床实验,促进稀有人参皂苷的创新药物研发。
近年来通过对人参、三七和西洋参的转录组和功能基因组研究,人参皂苷皂 苷元合成途径的解析已经有了非常大的进展。2006年,日本和韩国科学家分别鉴 定了将环氧角鲨烯转化为达玛烯二醇的萜环化酶元件达(玛烯二醇合成酶, PgDDS)。2011年到2012年,韩国科学家又鉴定了把达玛烯二醇氧化为原人参二 醇以及把原人参二醇进一步氧化为原人参三醇的细胞色素P450元件CYP716A4和 CYP716A53v2。
利用合成生物学方法来人工合成这些具有药用活性的人参皂苷,不仅需要构 建合成皂苷元的代谢途径,还需要鉴定催化人参皂苷的糖基化的UDP-糖基转移酶。 UDP-糖基转移酶的功能是将糖基供体(核苷二磷酸糖,例如UDP-葡萄糖、UDP-鼠 李糖、UDP-木糖和UDP-阿拉伯糖)上的糖基转移到不同的糖基受体上。从目前已 测序的植物基因组分析,植物基因组往往编码了上百种以上不同的糖基转移酶。 2015年中国学者鉴定了能在原人参三醇C6位转入一个葡萄糖基的UDP-糖基转移 酶元件(UGTPg100)。中国学者在专利(PCT/CN2015/081111)公开了可以在原人参三 醇型皂苷的C6位进行糖链延伸的糖基转移酶(gGT29-7等),如,gGT29-7可以利 用UDP-Xyl催化Rh1的C6位延伸一分子木糖基生成三七皂苷R2,可以利用 UDP-Glc催化Rh1的C6位延伸一分子葡萄糖糖基生成Rf,但基本无法利用UDP-Rha;专利(PCT/CN2015/081111)公开的gGT29-7的突变体 gGT29-7(N343G,A359P)具利用UDP-Rha催化Rh1的C6位延伸一分子鼠李糖基生成 Rg2,但活性非常低,仅大约9%转化率。并且gGT29-7(N343G,A359P)除了以 UDP-Rha为供体进行转糖基反应之外,仍然还可以以UDP-glc为供体进行转糖基 反应且催化效率高于以UDP-Rha为糖基供体的催化反应。所以 gGT29-7(N343G,A359P)催化UDP-Rha的活性低且不专一,导致大量副产物的合 成,不能满足应用的需求。
发明内容
在以上背景下,本发明人从人参中筛选获得能在C6位延伸UPD-鼠李糖的糖基转移酶URT94-1和URT94-2,可以专一性得以UDP-Rha为糖基供体,高效催化人参皂苷Rh1、 人参皂苷Rg1或三七R3的C-6位第一个糖基上延伸一分子鼠李糖从而分别获得人参皂苷 Rg2、人参皂苷Re或者Yesanchinoside E。但是,URT94-1和URT94-2不能利用UDP- 葡萄糖为糖基供体催化上述皂苷底物。因此这些糖基转移酶为人参皂苷Rg2、人参皂苷 Re和Yesanchinoside E等皂苷的高效制备提供了高度专一性的糖基转移酶。
在本发明的第一方面,提供一种在四环三萜(类)化合物的C-6位的第一个糖基 上连接鼠李糖基的方法,包括:以专一性糖基转移酶进行转移,所述专一性糖基转 移酶是具有SEQ ID NO:2或SEQ ID NO:4所示氨基酸序列的多肽,或其保守性变 异多肽。
在本发明的另一方面,提供专一性糖基转移酶的用途,用于在四环三萜(类)化 合物的C-6位的第一个糖基上连接鼠李糖基(包括用于作为该反应的催化剂),所述 专一性糖基转移酶是具有SEQ ID NO:2或SEQ ID NO:4所示氨基酸序列的多肽, 或其保守性变异多肽。
在一个或多个实施方案中,所述的鼠李糖基由糖基供体提供;较佳地,所述糖 基供体是携带鼠李糖基团的糖基供体;更佳地,所述的糖基供体包括(但不限于): 尿苷二磷酸(UDP)-鼠李糖,鸟苷二磷酸(GDP)-鼠李糖,腺苷二磷酸(ADP)-鼠李糖, 胞苷二磷酸(CDP)-鼠李糖,胸苷二磷酸(TDP)-鼠李糖。
在一个或多个实施方案中,所述的四环三萜化合物为式(I)化合物,在C-6位的 糖基上连接糖基的化合物为式(II)化合物;
其中,R1和R2为H或者糖基,R3为单糖糖基,R4为鼠李糖基;较佳地, 所述的糖基或单糖糖基(R3)选自:葡萄糖基、木糖基、阿拉伯糖基或鼠李糖基;
较佳地,当R1为H、R2和R3为葡萄糖基时,所述式(I)化合物为人参皂苷 Rg1,所述式(II)化合物为人参皂苷Re;当R1和R2为H、R3为葡萄糖基时,所 述式(I)化合物为人参皂苷Rh1,所述的式(II)化合物为人参皂苷Rg2。
在一个或多个实施方案中,所述的四环三萜化合物为式(III)化合物,在C-6位 的糖基上连接糖基的化合物为式(IV)化合物;
其中,R1为H或糖基,R2、R3、R4为单糖糖基,R5为鼠李糖基;较佳地, 所述的糖基(R1)或单糖糖基(R2、R3、R4)选自:葡萄糖基、木糖基、阿拉伯糖基或 鼠李糖基;
较佳地,当R1为H、R2、R3和R4为葡萄糖基、R5为鼠李糖基时,所述式 (III)化合物为三七皂苷R3,式(IV)化合物为Yesanchinoside E。
在一个或多个实施方案中,基团种类、底物或产物如下表所示:
底物 | R1 | R2 | R3 | R4 | 产物 |
人参皂苷Rg1 | H | Glc | Glc | Rha | 人参皂苷Re |
人参皂苷Rh1 | H | H | Glc | Rha | 人参皂苷Rg2 |
在一个或多个实施方案中,基团种类、底物或产物如下表所示:
底物 | R1 | R2 | R3 | R4 | R5 | 产物 |
三七皂苷R3 | H | Glc | Glc | Glc | Rha | Yesanchinoside E |
在一个或多个实施方案中,所述反应式中(I)、(III)化合物包括但不限于:S构 型或R构型的达玛烷型四环三萜化合物、羊毛脂烷型四环三萜化合物、去水甘遂 烷(apotirucallane)型四环三萜、甘遂烷型四环三萜化合物、环阿屯烷(环阿尔廷烷) 型四环三萜化合物、葫芦烷四环三萜化合物、或楝烷型四环三萜化合物。
在一个或多个实施方案中,所述反应式中(II)或(IV)化合物包括人参皂苷Rg2、人参皂苷Re、Yesanchinoside E。
在本发明的另一方面,提供一种胞内在四环三萜(类)化合物的C-6位的第一个 糖基上连接鼠李糖基的方法,包括:
(a)在宿主细胞内引入四环三萜化合物反应前体或表达/形成其的构建体,以及引入专一性糖基转移酶或表达其的构建体,获得重组的宿主细胞;所述专一性糖基 转移酶是具有SEQ ID NO:2或SEQ ID NO:4所示氨基酸序列的多肽,或其保守性 变异多肽;所述宿主细胞内存在携带鼠李糖基团的糖基供体或引入有携带鼠李糖基 团的糖基供体(包括能形成该糖基供体的构建体/前体);
(b)培养(a)的重组的宿主细胞,获得C-6位的第一个糖基上连接鼠李糖基的四 环三萜化合物产物;
较佳地,所述四环三萜化合物反应前体包括:人参皂苷Rg1,人参皂苷Rh1, 三七皂苷R3;相应的产物包括:人参皂苷Re,人参皂苷Rg2,Yesanchinoside E;
较佳地,所述的糖基供体包括(但不限于):尿苷二磷酸(UDP)-鼠李糖,鸟苷二 磷酸(GDP)-鼠李糖,腺苷二磷酸(ADP)-鼠李糖,胞苷二磷酸(CDP)-鼠李糖,胸苷 二磷酸(TDP)-鼠李糖。
在一个或多个实施方案中,所述方法还包括:向反应体系中提供用于调节酶 活性的添加物。
在一个或多个实施方案中,所述的用于调节酶活性的添加物是:提高酶活性 或抑制酶活性的添加物。
在一个或多个实施方案中,所述的用于调节酶活性的添加物选自下组:Ca2+、 Co2 +、Mn2+、Ba2+、Al3+、Ni2+、Zn2+、或Fe2+。
在一个或多个实施方案中,所述的用于调节酶活性的添加物是:可以生成 Ca2+、Co2+、Mn2+、Ba2+、Al3+、Ni2+、Zn2+、或Fe2+的物质。
在一个或多个实施方案中,反应体系的pH为:pH4.0-10.0,优选pH为5.5-9.0。
在一个或多个实施方案中,反应体系的温度为:10℃-105℃,优选20℃-50℃。
在本发明的另一方面,提供一种专一性糖基转移酶,其是具有SEQ ID NO:2 或SEQID NO:4所示氨基酸序列的多肽,或其保守性变异多肽;较佳地,所述保 守性变异多肽包括:
(1)由SEQ ID NO:2或SEQ ID NO:4所示序列的多肽经过一个或多个(如1-20 个,较佳地1-10个;更佳地1-5个;更佳地1-3个)氨基酸残基的取代、缺失或添 加而形成的,且具有在四环三萜化合物的C-6位的第一个糖基上连接鼠李糖基功能 的多肽;
(2)氨基酸序列与SEQ ID NO:2或SEQ ID NO:4所示序列的多肽有50%以上 (较佳地60%以上;更佳地70%以上;更佳地80%以上;更佳地85%以上;更佳地 90%以上;更佳地95%以上;更佳地98%以上;更佳地99%以上)相同性,且具有 在四环三萜化合物的C-6位的第一个糖基上连接鼠李糖基功能的多肽;或
(3)在SEQ ID NO:2或SEQ ID NO:4所示序列的多肽的N或C末端添加标签 序列,或在其N末端添加信号肽序列后形成的多肽。
在本发明的另一方面,提供分离的多核苷酸,所述多核苷酸编码所述的专一 性糖基转移酶。
在一个或多个实施方案中,编码所述的专一性糖基转移酶的多核苷酸包括选 自下组的多核苷酸:(A)如SEQ ID NO:1或3所示的核苷酸序列;(B)与SEQ ID NO: 1或3所示序列有至少95%相同性的核苷酸序列;(E)在SEQ ID NO:1或3所示序 列的5’端和/或3’端截短或添加1-60个(较佳地1-30,更佳地1-10个)核苷酸所形成 的核苷酸序列;(F)(A)-(E)任一所述的核苷酸序列的互补序列;(G)(A)-(F)所述序 列的长20-50个碱基的片段。
在一个或多个实施方案中,所述多核苷酸序列选自SEQ ID NO:1、3中任一 或其互补序列。
在本发明的另一方面,提供一种核酸构建物(构建体),其包含所述的多核苷酸,或表达所述的专一性糖基转移酶;较佳地,所述核酸构建物是表达载体或同源重组 载体。
在本发明的另一方面,提供一种重组宿主细胞,其表达所述的专一性糖基转 移酶,或含有所述的多核苷酸,或含有所述的核酸构建物;较佳地,该重组宿主细 胞中还含有四环三萜化合物反应前体或表达/形成其的构建体;较佳地,该重组宿 主细胞中还存在携带鼠李糖基团的糖基供体或引入有携带鼠李糖基团的糖基供体 (包括能形成该糖基供体的构建体/前体);
在一个或多个实施方案中,所述四环三萜化合物反应前体包括:人参皂苷Rg1, 人参皂苷Rh1,三七皂苷R3;相应的产物包括:人参皂苷Re,人参皂苷Rg2, Yesanchinoside E。
在一个或多个实施方案中,所述的糖基供体包括(但不限于):尿苷二磷酸 (UDP)-鼠李糖,尿苷二磷酸(UDP)-鼠李糖,鸟苷二磷酸(GDP)-鼠李糖,腺苷二磷 酸(ADP)-鼠李糖,胞苷二磷酸(CDP)-鼠李糖,胸苷二磷酸(TDP)-鼠李糖。
在一个或多个实施方案中,宿主细胞为原核细胞或真核细胞。
在一个或多个实施方案中,宿主细胞为真核细胞,如酵母细胞或植物细胞。 在一个或多个实施方案中,宿主细胞为酿酒酵母细胞。在一个或多个实施方案中, 宿主细胞为人参细胞或三七细胞。
在一个或多个实施方案中,宿主细胞为原核细胞,如大肠杆菌。
在一个或多个实施方案中,宿主细胞不是天然产生本发明所述专一性糖基转 移酶处理后形成的产物的细胞;例如,其不是天然产生式(II)、(IV)化合物的细胞。
在一个或多个实施方案中,所述的宿主细胞不是天然产生以下物质中的一种 或多种的细胞:人参皂苷Rh1、人参皂苷Rg1、三七皂苷R3、人参皂苷Rg2、人 参皂苷Re、Yesanchinoside E。
在一个或多个实施方案中,所述宿主细胞还具有选自下述的特征:
(a)表达达玛烯二醇和/或原人参二醇类皂苷和/或原人参三醇类皂苷合成代谢途径中的关键酶与该酶具有50%序列相同性的突变体;
(b)表达包含(a)所述酶的功能片段或与该片段具有50%序列相同性的突变体的多肽;
(c)含有(a)所述酶或(b)所述多肽的多核苷酸或其互补序列,和/或
(d)含有包含(c)所述编码序列的核酸构建物。
在一个或多个实施方案中,原人参三醇类皂苷包含人参皂苷Rh1、人参皂苷 Rg1、三七皂苷R3、人参皂苷Rg2、人参皂苷Re、Yesanchinoside E。
在一个或多个实施方案中,人参皂苷Rh1合成代谢途径中的关键基因包括(但 不限于):达玛烯二醇合成酶基因、细胞色素P450 CYP716A47基因和P450 CYP716A47的还原酶基因和四环三萜C6的糖基转移酶UGTPg100(Genbank accession number AKQ76388.1),或其组合。
在一个或多个实施方案中,人参皂苷Rg1合成代谢途径中的关键基因包括(但 不限于):达玛烯二醇合成酶基因、细胞色素P450 CYP716A47基因和P450 CYP716A47的还原酶基因和四环三萜C20位和C6的糖基转移酶UGTPg1和 UGTPg100(Genbank accession numberAKQ76388.1),或其组合。
在一个或多个实施方案中,人参皂苷Rg2合成代谢途径中的关键基因包括(但 不限于):达玛烯二醇合成酶基因、细胞色素P450 CYP716A47基因和P450 CYP716A47的还原酶基因和四环三萜C6的糖基转移酶UGTPg100(Genbank accession number AKQ76388.1)以及本发明中催化C6位糖基延伸的糖基转移酶 URT94-1和URT94-2,或其组合。
在一个或多个实施方案中,人参皂苷Re合成代谢途径中的关键基因包括(但 不限于):达玛烯二醇合成酶基因、细胞色素P450 CYP716A47基因和P450 CYP716A47的还原酶基因和四环三萜C20位和C6的糖基转移酶UGTPg1和 UGTPg100(Genbank accession numberAKQ76388.1)以及本文中催化C6位糖基延伸 的糖基转移酶URT94-1和URT94-2,或其组合。
本发明另一方面,还提供本发明所述宿主细胞在制备糖基转移酶、催化试剂、 或式(II)、(IV)化合物中的用途。
本发明另一方面,还提供生产糖基转移酶或式(II)或(IV)化合物的方法,包括 孵育本发明所述的宿主细胞。
本发明另一方面,还提供本发明所述宿主细胞的用途,用于制备酶催化试剂, 或产生糖基转移酶、或作为催化细胞、或产生式(II)、(IV)化合物。
本发明另一方面,还提供一种产生转基因植物的方法,包括步骤:将本发明 所述宿主细胞再生为植物,其中所述宿主细胞为植物细胞。在一个或多个实施方案 中,所述宿主细胞为人参细胞。在一个或多个实施方案中,所述宿主细胞为三七细 胞。
在本发明的另一方面,提供一种用于糖基转移的试剂盒,其中包括:所述的 专一性糖基转移酶,该酶能在四环三萜(类)化合物的C-6位的第一个糖基上连接鼠 李糖基,所述专一性糖基转移酶是具有SEQ ID NO:2或SEQ ID NO:4所示氨基酸 序列的多肽,或其保守性变异多肽。
在本发明的另一方面,提供一种用于糖基转移的试剂盒,其中包括:所述分 离的多核苷酸。
在本发明的另一方面,提供一种用于糖基转移的试剂盒,其中包括:所述的 核酸构建物(构建体)。
在本发明的另一方面,提供一种用于糖基转移的试剂盒,其中包括:所述的 重组宿主细胞。
在一个或多个实施方案中,试剂盒中还包括:携带鼠李糖基团的糖基供体;更 佳地,所述的糖基供体包括(但不限于):尿苷二磷酸(UDP)-鼠李糖,鸟苷二磷酸 (GDP)-鼠李糖,腺苷二磷酸(ADP)-鼠李糖,胞苷二磷酸(CDP)-鼠李糖,胸苷二磷 酸(TDP)-鼠李糖。
在一个或多个实施方案中,试剂盒中还包括:四环三萜化合物反应前体。
应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例) 中具体描述的各技术特征之间都可以互相组合,从而构成新的或优选的技术方案。 限于篇幅,在此不再一一累述。
附图说明
图1、从单株人参单株植物中分别扩增了2条糖基转移酶目标条带,扩增所得 产物的DNA琼脂糖凝胶电泳检测结果。
图2、通过Western Blot显示糖基转移酶URT94-1和URT94-2,在大肠杆菌 中的表达情况。“1”,代表空载体pET28a大肠杆菌重组子的裂解液上清;Marker, 代表蛋白质分子量标准;“2”,代表糖基转移酶BL21-URT94-1大肠杆菌重组子 的裂解液上清;“3”,代表糖基转移酶BL21-URT94-2大肠杆菌重组子的裂解液 上清;“4”,代表糖基转移酶BL21-gGT29-7大肠杆菌重组子的裂解液上清; “5”,代表糖基转移酶BL21-gGT29-7(N343G,A359P)大肠杆菌重组子的裂解液 上清。
图3、a图表示,糖基转移酶URT94-1和URT94-2催化以原人参三醇型人参 皂苷Rh1为糖基受体,UDP-Rha为糖基供体的转糖基反应的TLC图谱。“1”, 代表以pet28a空载体重组子的裂解液上清作为酶液;“2”,“3”,“4”,“5”,, 分别代表BL21-URT94-1,BL21-URT94-2,BL21-gGT29-7(N343G,A359P)和 BL21-gGT29-7的裂解液上清作为酶液。箭头所指为皂苷标准品的迁移位置;b图 表示,糖基转移酶URT94-1和URT94-2催化以原人参三醇型人参皂苷Rh1为糖基 受体,UDP-Rha为糖基供体的转糖基反应的HPLC图谱。
图4、a图表示,糖基转移酶URT94-1和URT94-2催化以原人参三醇型人参 皂苷Rg1为糖基受体,UDP-Rha为糖基供体的转糖基反应的TLC图谱。“1”, 代表以pet28a空载体重组子的裂解液上清作为酶液;“2”,“3”,“4”,“5”, 分别代表BL21-gGT29-7,BL21-gGT29-7(N343G,A359P),BL21-URT94-1和 BL21-URT94-2的裂解液上清作为酶液。箭头所指为皂苷标准品的迁移位置;b图 表示,糖基转移酶URT94-1和URT94-2催化以原人参三醇型人参皂苷Rg1为糖基 受体,UDP-Rha为糖基供体的转糖基反应的HPLC图谱。
图5、糖基转移酶URT94-1和URT94-2催化以原人参三醇型人参皂苷Rh1为 糖基受体,UDP-Glc为糖基供体的转糖基反应的TLC图谱。“1”,代表以pet28a 空载体重组子的裂解液上清作为酶液;“2”,“3”,“4”,“5”,分别代表 BL21-gGT29-7,BL21-gGT29-7(N343G,A359P),BL21-URT94-1和BL21-URT94-2 的裂解液上清作为酶液。箭头所指为皂苷标准品的迁移位置。
图6、糖基转移酶URT94-1和URT94-2催化以原人参三醇型人参皂苷Rg1为 糖基受体,UDP-Glc为糖基供体的转糖基反应的TLC图谱。“1”,代表以pet28a 空载体重组子的裂解液上清作为酶液;“2”,“3”,“4”,“5”,分别代表 BL21-gGT29-7,BL21-gGT29-7(N343G,A359P),BL21-URT94-1和BL21-URT94-2 的裂解液上清作为酶液。箭头所指为皂苷标准品的迁移位置。
具体实施方式
本发明人经过深入的研究筛选,首次提供了一种专一性糖基转移酶,其可催 化底物特定位置发生鼠李糖基化,以及提高催化活性。具体地,本发明的专一性糖 基转移酶能特异和高效地催化四环三萜化合物底物的C-6位在第一个糖基的羟基 糖基化,以延伸鼠李糖基团。
定义
如本文所用,“分离的多肽”或“活性多肽”是指所述多肽基本上不含天然 与其相关的其它蛋白、脂类、糖类或其它物质。本领域的技术人员能用标准的蛋白 质纯化技术纯化所述多肽。基本上纯的多肽在非还原聚丙烯酰胺凝胶上能产生单一 的主带。所述多肽的纯度还可以用氨基酸序列进行进一步分析。
如本文所用,术语“活性多肽”、“本发明的多肽及其衍生多肽”、“本发 明的酶”、“糖基转移酶”可互换使用,均指URT94-1(SEQ ID NO:2),URT94-2(SEQ ID NO:4)多肽或其衍生多肽。
如本文所用,术语“保守性变异多肽”是指基本上保持所述多肽相同的生物 学功能或活性的多肽。所述的“保守性变异多肽”可以是(i)有一个或多个保守或非 保守性氨基酸残基(优选保守性氨基酸残基)被取代的多肽,而这样的取代的氨基酸 残基可以是也可以不是由遗传密码编码的,或(ii)在一个或多个氨基酸残基中具有 取代基团的多肽,或(iii)成熟多肽与另一个化合物(比如延长多肽半衰期的化合物, 例如聚乙二醇)融合所形成的多肽,或(iv)附加的氨基酸序列融合到此多肽序列而形 成的多肽(如前导序列或分泌序列或用来纯化此多肽的序列或蛋白原序列,或与抗 原IgG片段的形成的融合蛋白)。根据本文的教导,这些片段、衍生物和类似物属 于本领域熟练技术人员公知的范围。
如本文所用,术语“变体”或“突变体”是指与参照序列相比,通过一个或 多个氨基酸的插入、缺失或取代使氨基酸序列发生变化但保留至少一种生物活性的 肽或多肽。本文任一实施方案所述的突变体包括与参照序列(如本文所述的SEQ ID NO:2或4)具有至少50%、60%或70%,优选至少80%,优选至少85%,优选至少 90%,优选至少95%,优选至少97%的序列相同性并保留参照序列的生物学活性(如 作为糖基转移酶)的氨基酸序列。可采用例如NCBI的BLASTp计算两条比对的序 列之间的序列相同性。突变体还包括在参照序列的氨基酸序列中具有一个或多个突 变(插入、缺失或取代)、同时仍保留参照序列生物学活性的氨基酸序列。所述多个 突变通常指1-20个以内,例如1-15个、1-10个、1-8个、1-5个或1-3个。取代优 选是保守性取代。例如,在本领域中,用性能相近或相似的氨基酸进行保守性取代 时,通常不会改变蛋白质或多肽的功能。“性能相近或相似的氨基酸”包括例如,具有相似侧链的氨基酸残基的家族,这些家族包括具有碱性侧链的氨基酸(例如赖 氨酸、精氨酸、组氨酸)、具有酸性侧链的氨基酸(例如天冬氨酸、谷氨酸)、具有不 带电荷的极性侧链的氨基酸(例如甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、 酪氨酸、半胱氨酸)、具有非极性侧链的氨基酸(例如丙氨酸、缬氨酸、亮氨酸、异 亮氨酸脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸)、具有β-分支侧链的氨基酸(例如苏 氨酸、缬氨酸、异亮氨酸)和具有芳香侧链的氨基酸(例如酪氨酸、苯丙氨酸、色氨 酸、组氨酸)。因此,在本发明多肽中用来自同一侧链类的另一氨基酸残基替换一 个或几个位点,将不会在实质上影响其活性。
活性多肽、其编码基因、载体及宿主
本发明人通过挖掘基因组以及转录组信息,结合大量的研究和实验工作,揭 示了新型的具有专一性的糖基转移酶,其可以特异性和高效地将四环三萜化合物底 物的C-6的第一个糖基上转入糖基以延伸糖链,其反应产物在药学等领域具有良好 的应用价值。
本发明所述的专一性的糖基转移酶的序列优选为如SEQ ID NO:2或4所示的 多肽。该多肽还包括具有与所示多肽具有相同功能的、SEQ ID NO:2或4序列的 “保守性变异多肽”。本发明还包括所述多肽的片段、衍生物和类似物。如本文所 用,术语“片段”、“衍生物”和“类似物”是指基本上保持所述多肽相同的生物 学功能或活性的多肽。
本发明中,所述的“保守性变异多肽”是指基本上保持所述多肽相同的生物 学功能或活性的多肽。所述的“保守性变异多肽”可以是(i)有一个或多个保守或非 保守性氨基酸残基(优选保守性氨基酸残基)被取代的多肽,而这样的取代的氨基酸 残基可以是也可以不是由遗传密码编码的,或(ii)在一个或多个氨基酸残基中具有 取代基团的多肽,或(iii)成熟多肽与另一个化合物(比如延长多肽半衰期的化合物, 例如聚乙二醇)融合所形成的多肽,或(iv)附加的氨基酸序列融合到此多肽序列而形 成的多肽(如前导序列或分泌序列或用来纯化此多肽的序列或蛋白原序列,或与抗 原IgG片段的形成的融合蛋白)。根据本文的教导,这些片段、衍生物和类似物属 于本领域熟练技术人员公知的范围。
所述的“保守性变异多肽”可以包括(但并不限于):一个或多个(通常为1-50 个,较佳地1-30个,更佳地1-20个,最佳地1-10个)氨基酸的缺失、插入和/或取 代,以及在C末端和/或N末端添加或缺失一个或数个(如50个以内,较20个或 10个以内,更佳地为5个以内)氨基酸。例如,在本领域中,用性能相近或相似的 氨基酸进行取代时,通常不会改变蛋白质的功能。又比如,在C末端和/或N末端 添加一个或数个氨基酸通常也不会改变蛋白质的功能。本发明还提供所述多肽的类 似物。这些类似物与天然多肽的差别可以是氨基酸序列上的差异,也可以是不影响 序列的修饰形式上的差异,或者兼而有之。这些多肽包括天然或诱导的遗传变异体。 诱导变异体可以通过各种技术得到,如通过辐射或暴露于诱变剂而产生随机诱变, 还可通过定点诱变法或其他已知分子生物学的技术。类似物还包括具有不同于天然 L-氨基酸的残基(如D-氨基酸)的类似物,以及具有非天然存在的或合成的氨基酸 (如β、γ-氨基酸)的类似物。应理解,本发明的多肽并不限于上述例举的代表性的 多肽。
本发明的URT94-1(SEQ ID NO:2)和URT94-2(SEQ ID NO:4)或其保守性变异 多肽的氨基端或羧基端还可含有一个或多个多肽片段,作为蛋白标签。任何合适的 标签都可以用于本发明。例如,所述的标签可以是FLAG、HA、HA1、c-Myc、Poly –His、Poly-Arg、Strep-TagII、AU1、EE、T7、4A6、ε、B、gE、以及Ty1。这些 标签可用于对蛋白进行纯化。
当出于生产本发明的专一性的糖基转移酶或其它酶(例如在宿主细胞中用于反应形成本发明的专一性的糖基转移酶的底物的酶,参与本发明的产物合成途径任一 步骤的酶)的目的时,为了使翻译的蛋白分泌表达(如分泌到细胞外),还可在本发明 的多肽的氨基端添加上信号肽序列。信号肽在多肽从细胞内分泌出来的过程中可被 切去。
本发明的活性多肽可以是重组多肽、天然多肽、合成多肽。本发明的多肽可 以是天然纯化的产物,或是化学合成的产物,或使用重组技术从原核或真核宿主(例 如,细菌、酵母、高等植物)中产生。根据重组生产方案所用的宿主,本发明的多 肽可以是糖基化的,或可以是非糖基化的。本发明的多肽还可包括或不包括起始的 甲硫氨酸残基。
编码本发明的专一性的糖基转移酶以及其它酶的多核苷酸可以是DNA形式或 RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是 单链的或是双链的。DNA可以是编码链或非编码链。术语“编码多肽的多核苷酸” 可以是包括编码此多肽的多核苷酸,也可以是还包括附加编码和/或非编码序列的 多核苷酸。
本发明也涉及包含本发明的多核苷酸的载体,以及用本发明的载体或多肽编码序列经基因工程产生的宿主细胞,以及经重组技术产生本发明所述多肽的方法。
本发明涉及核酸构建物,该核酸构建物含有本文所述的多核苷酸,以及与这 些序列操作性连接的一个或多个调控序列或基因组同源重组所需的序列。本发明所 述的多核苷酸可以多种方式被操作以保证所述多肽或蛋白的表达。在将核酸构建物 插入载体之前可根据表达载体的不同或要求而对核酸构建物进行操作。利用重组 DNA方法来改变多核苷酸序列的技术是本领域已知的。
在某些实施方案中,所述核酸构建物是载体。载体可以是克隆载体,也可以 是表达载体,或者是基因敲入载体。本发明的多核苷酸可被克隆入许多类型的载体, 例如,质粒、噬菌粒、噬菌体衍生物、动物病毒和粘粒。克隆载体可用于提供本发 明蛋白或多肽的编码序列。表达载体可以以细菌载体或病毒载体形式提供给细胞。 通常通过可操作地连接本发明的多核苷酸至启动子,并将构建体并入表达载体,实 现本发明多核苷酸的表达。该载体对于复制和整合真核细胞可为合适的。典型的表 达载体包含可用于调节期望核酸序列表达的表达控制序列。
基因敲入载体用于将本文所述多核苷酸序列整合到基因组的感兴趣区域。通 常情况下,基因敲入载体除含有所述多核苷酸序列外,还可含有基因组同源重组所 需的5’同源臂和3’同源臂。在一些实施方案中,本文的核酸构建物含有5’同源臂、 本文所述多核苷酸序列和3’同源臂。在使用基因敲入载体时,可同时利用 CRISPR/Cas9技术将多核苷酸序列同源重组到感兴趣的位置。CRISPR/Cas9技术通 过设计针对目的基因的向导RNA从而引导Cas9核酸酶对插入位置的基因组进行 修饰,造成该基因修饰区域同源重组效率增加,将包含在基因敲入载体中的目的片 段同源重组到目的位点。本领域周知CRISPR/Cas9技术的步骤以及所用的试剂, 例如Cas9核酸酶。
本领域的技术人员熟知的方法能用于构建核酸构建物。这些方法包括体外重 组DNA技术、DNA合成技术、体内重组技术等。所述的DNA序列可有效连接到 表达载体中的适当启动子上,以指导mRNA合成。这些启动子的代表性例子有: 大肠杆菌的lac或trp启动子;λ噬菌体PL启动子;真核启动子包括CMV立即早 期启动子、HSV胸苷激酶启动子、早期和晚期SV40启动子、反转录病毒的LTRs 和其他一些已知的可控制基因在原核或真核细胞或其病毒中表达的启动子。表达载 体还包括翻译起始用的核糖体结合位点和转录终止子。此外,表达载体优选地包含 一个或多个选择性标记基因,以提供用于选择转化的宿主细胞的表型性状,如真核 细胞培养用的二氢叶酸还原酶、新霉素抗性以及绿色荧光蛋白(GFP),或用于大肠 杆菌的四环素或氨苄青霉素抗性。
本发明的多核苷酸在高等真核细胞中表达时,如果在载体中插入增强子序列 时将会使转录得到增强。增强子是DNA的顺式作用因子,通常大约有10到300 个碱基对,作用于启动子以增强基因的转录。可举的例子包括在复制起始点晚期一 侧的100到270个碱基对的SV40增强子、在复制起始点晚期一侧的多瘤增强子以 及腺病毒增强子等。
本发明也提供了用于生物合成目标产物的宿主细胞。所述的宿主细胞可以为原核细胞,例如但不限于为大肠杆菌,酵母,链霉菌;更佳地为大肠杆菌细胞。细胞 宿主是一种生产工具,本领域技术人员可以通过一些技术手段对多种宿主细胞进行 改造,从而也实现如本发明的生物合成,由此构成的宿主细胞以及生产方法也应包 含在本发明中。
通过常规的重组DNA技术,可利用本发明的多聚核苷酸序列表达或生产本文 所述多肽。一般来说有以下步骤:(1)用本发明的编码所述专一性的糖基转移酶的 多核苷酸(或变异体),或用含有该多核苷酸的表达载体转化或转导合适的宿主细 胞;(2)在合适的培养基中培养的宿主细胞;(3)从培养基或细胞中分离、纯化蛋 白质。
包含上述的适当DNA序列以及适当启动子或者控制序列的载体,可以用于转 化适当的宿主细胞,以使其能够表达蛋白质。宿主细胞可以是原核细胞,如细菌细 胞;或是低等真核细胞,如酵母细胞;或是高等真核细胞,如哺乳动物细胞。代表 性例子有:大肠杆菌,链霉菌属;鼠伤寒沙门氏菌的细菌细胞;真菌细胞如酵母; 植物细胞;果蝇S2或Sf9的昆虫细胞;CHO、COS、293细胞、或Bowes黑素瘤 细胞的动物细胞等。本领域一般技术人员都清楚如何选择适当的载体、启动子、增 强子和宿主细胞。
用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。在上面 的方法中的重组多肽可在细胞内、或在细胞膜上表达、或分泌到细胞外。如果需要, 可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化重组的蛋白。这 些方法是本领域技术人员所熟知的。这些方法的例子包括但并不限于:常规的复性 处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛 层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(HPLC)和其它各种液相 层析技术及这些方法的结合。
应用
本发明人致力于糖基转移酶的研究,然而在前期的工作中,尚未获得可以高 效利用鼠李糖基供体、特异性在四环三萜(类)化合物的C-6位的第一个糖基上连接 鼠李糖基的酶。已有的酶中,有的基本无法利用鼠李糖基供体(如UDP-Rha);有的 则活性非常低,不能完全满足应用的需求。
在以上背景下,本发明人从人参中筛选获得的能在C6位延伸鼠李糖的专一性 的糖基转移酶(URT94s),可以高效催化在原人参三醇皂苷(原人参三醇型皂苷/原人 参三醇类皂苷):人参皂苷Rh1、人参皂苷Rg1、三七皂苷R3的C-6位第一个糖基 上延伸1分子鼠李糖;从而获得人参皂苷Rg2、人参皂苷Re或Yesanchinoside E。 该糖基转移酶为人参皂苷Rg2或者人参皂苷Re或者Yesanchinoside E的高效制备 提供的高度专一性的糖基转移酶。优选地,所述原人参三醇类皂苷包含人参皂苷 Rh1、人参皂苷Rg1。
作为本发明的一个具体实施方式,本发明的活性多肽具有糖基转移酶活性, 并且能够催化以下一种或多种反应:
其中,R1和R2为H或者糖基,R3和R4为单糖糖基。
在一个或多个实施方案中,R1-R4经取代后的化合物如下所示:
底物 | R1 | R2 | R3 | R4 | 产物 |
Rg1 | H | Glc | Glc | Rha | 人参皂苷Re |
Rh1 | H | H | Glc | Rha | 人参皂苷Rg2 |
即当R1为H时,R2和R3为葡萄糖基时,所述的式(I)化合物为人参皂苷Rg1, 且R4为鼠李糖基时,所述的式(II)化合物为三七皂苷Re;或当R1和R2为H,R3 为葡萄糖基时,所述的式(I)化合物为人参皂苷Rh1,且R4为鼠李糖基时,所述的 式(II)化合物为三七皂苷Rg2。
作为本发明的另一具体实施方式,
其中,R1为H或者糖基,R2、R3、R4和R5为单糖糖基;所述多肽选自 SEQ ID NO:2或4或其衍生多肽。
在一个或多个实施方案中,R1-R5经取代后的化合物如下所示:
底物 | R1 | R2 | R3 | R4 | R5 | 产物 |
三七皂苷R3 | H | Glc | Glc | Glc | Rha | Yesanchinoside E |
即当R1为H时,R2、R3和R4为葡萄糖基时,所述的式(III)化合物为三七皂 苷R3,且R5为鼠李糖基时,所述的式(IV)化合物为Yesanchinoside E。
本发明还提供构建转基因植物的方法,包括将含有本文所述多肽或多核苷酸 的宿主细胞再生为植物,所述宿主细胞是植物细胞。本领域周知再生植物细胞的方 法和试剂。
本发明的糖基转移酶特别能够分别将人参皂苷Rh1转化为具有其它活性的人 参皂苷Rg2。本发明的糖基转移酶特别能够分别将人参皂苷Rg1转化为具有其它 活性的人参皂苷Re。
本发明涉及的活性多肽或糖基转移酶可用于人工合成已知人参皂苷及新人参 皂苷及其衍生物,能够将Rh1转化为具有活性的人参皂苷Rg2,以及能够将Rg1 转化为具有活性的人参皂苷Re。
本发明还提供构建转基因植物的方法,包括用本文所述多核苷酸或核酸构建 物转化植物,在植物的后代中通过杂交、筛选获得表达本文所述多肽、包含所述多 核苷酸或包含所述核酸构建物的转基因阳性植物。本领域周知用核酸转化植物以及 植物杂交和筛选转基因阳性植物的方法。
本发明也提供了用于生物合成目标产物或其中间体的试剂盒,其中包括:SEQ IDNO:2或4所示的新型的专一性的糖基转移酶或其保守性变异多肽;较佳地其中 还包括糖基供体;较佳地其中还包括宿主细胞。更佳地,所述试剂盒中还包括说明 进行生物合成的方法的使用说明书。
本发明的主要优点在于:
(1)本发明的专一性的糖基转移酶可以特异性和高效地将四环三萜化合物底 物的C-6的第一个糖基上转入糖基以延伸糖链;
(2)Rh1能由本发明的糖基转移酶高效转化为具有活性的人参皂苷Rg2;Rg1 能由本发明的糖基转移酶高效转化为具有活性的人参皂苷Re。Rg2防治神经退行 性疾病的活性;Re具有降血糖治疗糖尿病的活性。因此,本发明的糖基转移酶具 有广泛的应用价值。
(3)催化效率高。与专利PCT/CN2015/081111披露的糖基转移酶相比,URT94-1 和URT94-2以UDP-鼠李糖为糖基供体催化Rh1的C6位延伸糖链的活性至少提高 了5倍。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明 本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通 常按照常规条件如J.萨姆布鲁克等编著,分子克隆实验指南,第三版,科学出版社, 2002中所述的条件,或按照制造厂商所建议的条件。
序列信息
SEQ ID NO:1(URT94-1核酸)
atggataccaatgaaaaaaccagaataaaagttgtaatgttaccatggctggcatatggtcacatatcaccctatctagagctagcaaa aaaactctcaaaacgaaatttttacatatacttttgttccacatctatcaatcttagttccatcaggaaaaaacttgcagttgatgatcacgaggcaa tacagctgatagaattccagttaacttcacaaaccgagctgccgccgcaccatcacacaaccaaaggtctccctccccatctcattcctgatttg atcaaggcccttggtatgtccggccccaacgtcatcaacattctaaatacagtaaaccctgatttaatcatctacgatgtcttccagttatgggtgc ctgcatttgcagcctctcttcaaatcccagctgtccatttccaagtagtcggagccatatcaactgccgccgcctataggtttaaggtggatccta gtataccggttccttgttcaagaatctttctggatgacaccaacataaggaaaagccccgattatgattcatcttcagcagaaaatagtggtattct tgaccttacatttggtacagctatacaatcgtcagatataatcttgatcaagagttctagagagttcgatgaaaagaatatcgaatactattcccttttgatggacaagaagattgtgcctacgggtccacttgtacaagtcaacacatctgtggctgtccataccgaaaatgagaaggacgatataatgg agtggctaagcaagaaagaagaatcctcaacagtttatgtttcttttgggagtgagtgctatttgtcagagcctaggatccgagagctggcccat gggctagagcttagcaatgtaaatttcatatgggttattagttttccagagggagatgaggaaatgtgtaatacttgtattgaagatgtattaccgg aagggtttcttgatagggtgaaagatagaggggtgattgtgagttgggccccacaggaaagaatattagggcatggtggacttgggggatttgtgagtcattgtgggtggggttctgtagtggaaggcatgagctatggagttccaataattgccatgcccgcgcaatatgaacagcctttgcatgct atgtttgtggaggaggtgggcgttggcgtggaggttctaaaagacgagagtggagaatttaggagggatgaaatagcaaaagctataaaaaa ggttgtggtggagaaaaatggagaaggtgtgaggaagaaggcaagagagatgggcaaggcaataaaaaagagaggagaagaagaagtg gaatgtgtagttgaggagttgaccaaactttgcaaaaagtatcagaaagtagcagcaggccaggggaagcgatgcccctaa
SEQ ID NO:2(URT94-1蛋白)
MDTNEKTRIKVVMLPWLAYGHISPYLELAKKLSKRNFYIYFCSTSINLSSIRKKLAVDD HEAIQLIEFQLTSQTELPPHHHTTKGLPPHLIPDLIKALGMSGPNVINILNTVNPDLIIYDVFQL WVPAFAASLQIPAVHFQVVGAISTAAAYRFKVDPSIPVPCSRIFLDDTNIRKSPDYDSSSAENS GILDLTFGTAIQSSDIILIKSSREFDEKNIEYYSLLMDKKIVPTGPLVQVNTSVAVHTENEKDDI MEWLSKKEESSTVYVSFGSECYLSEPRIRELAHGLELSNVNFIWVISFPEGDEEMCNTCIEDVL PEGFLDRVKDRGVIVSWAPQERILGHGGLGGFVSHCGWGSVVEGMSYGVPIIAMPAQYEQPL HAMFVEEVGVGVEVLKDESGEFRRDEIAKAIKKVVVEKNGEGVRKKAREMGKAIKKRGEEEVECVVEELTKLCKKYQKVAAGQGKRCP
SEQ ID NO:3(URT94-2核酸)
atggataccaatgaaaaaaccagaataaaagttgtaatgttaccatggctggcatatggtcacatatcaccctatctagagctagcaaa aaaactctcaaaacgaaatttttacatatacttttgttccacatctatcaatcttagttccatcaggaaaaaacttgcagttgatgatcacgaggcaa tacagctgatagaattccagttaacttcacaaaccgagctgccgccgcaccatcacacaaccaaaggtctccctccccatctcattcctgatttg atcaaggcccttggtatgtccggccccaacgtcatcaacattctaaatacagtaaaccctgatttaatcatctacgatgtcttccagttatgggtgc ctgcatttgcagcctctcttcaaatcccagctgtccatttccaagtagtcggagccatatcaactgccgccgcctataggtttaaggtggatccta gtataccggttccttgttcaagaatctttctggatgacaccaacataaggaaaagccccgattatgattcatcttcagcagaaaatagtggtattct tgaccttacatttggtacagctatacaatcgtcagatataatcttgatcaagagttctagagagttcgatgaaaagaatatcgaatactattcccttttgatggacaagaagattgtgcctacgggtccacttgtacaagtcaacacatctgtggctgtccataccgaaaatgagaaggacgatataatgg agtggctaagcaagaaagaagaatcctcaacagtttatgtttcttttgggagtgagtgctatttgtcagagcctaggatccgagagctggcccat gggctagagcttagcaatgtaaatttcatatgggttattagttttccagagggagatgaggaaatgtgtaatacttgtattgaagatgtattaccgg aagggtttcttgatagggtgaaagatagaggggtgattgtgagttgggccccacaggaaagaatattagggcatggtggacttgggggatttgtgagtcattgtgggtggggttctgtagtggaaggcatgagctatggagttccaataattgccatgcccgcgcaatatgaacagcctttgcatgct atgtttgtggaggaggtgggcgttggcgtggaggttctaaaagacgagagcggagaatttaggagggatgaaatagcaaaagctataaaaaa ggttgtggtggagaaaaatggagaaggtgtgaggaagaaggcaagagagatgggcaaggcaataaaaaagagaggagaagaagaagtg gaatgtgtagttgaggagttgaccaaactttgcaaaaagtatcagaaagtagcagcaggccaggggaaggaatgcccctaa
SEQ ID NO:4(URT94-2蛋白)
MDTNEKTRIKVVMLPWLAYGHISPYLELAKKLSKRNFYIYFCSTSINLSSIRKKLAVDD HEAIQLIEFQLTSQTELPPHHHTTKGLPPHLIPDLIKALGMSGPNVINILNTVNPDLIIYDVFQL WVPAFAASLQIPAVHFQVVGAISTAAAYRFKVDPSIPVPCSRIFLDDTNIRKSPDYDSSSAENS GILDLTFGTAIQSSDIILIKSSREFDEKNIEYYSLLMDKKIVPTGPLVQVNTSVAVHTENEKDDI MEWLSKKEESSTVYVSFGSECYLSEPRIRELAHGLELSNVNFIWVISFPEGDEEMCNTCIEDVL PEGFLDRVKDRGVIVSWAPQERILGHGGLGGFVSHCGWGSVVEGMSYGVPIIAMPAQYEQPL HAMFVEEVGVGVEVLKDESGEFRRDEIAKAIKKVVVEKNGEGVRKKAREMGKAIKKRGEEEVECVVEELTKLCKKYQKVAAGQGKECP
SEQ ID NO:5(引物对1-F)
cgcagtacatctaacagaaaaaga
SEQ ID NO:6(引物对1-R)
caataatttgaaaaaaaatgaatta
SEQ ID NO:7(引物对2-F)
cgtgacattaatggtgtcatttat
SEQ ID NO:8(引物对2-R)
cttttttatagcttttgctatccct
SEQ ID NO:9(URT94-1_Pet28a-F)
ctttaagaaggagatataccatggataccaatgaaaaaacca
SEQ ID NO:10(URT94-1_Pet28a-R)
ctcgagtgcggccgcaagcttggggcatcgcttcccctggcctg
SEQ ID NO:11(URT94-2_Pet28a-F)
ctttaagaaggagatataccatggataccaatgaaaaaaccaga
SEQ ID NO:12(URT94-2_Pet28a-R)
ctcgagtgcggccgcaagcttggggcattccttcccctggcctg
实施例1、人参来源的糖基转移酶URT94s的克隆
本发明人经过深入研究筛选,从单株人参植物中克隆获得两条糖基转移酶, 分别命名为URT94-1和URT94-2(URT94s)。
所述URT94s的克隆:提取人参RNA并进行反转录,获得人参的cDNA。以 该cDNA为模板设计2对引物(SEQ ID NO:5-SEQ ID NO:6扩增URT94-1;SEQ ID NO:7-SEQ ID NO:8扩增URT94-2)进行PCR扩增。DNA聚合酶选用宝生物工程有 限公司的高保真的DNA聚合酶PrimeSTAR。PCR产物经琼脂糖凝胶电泳检测(图 1)。在紫外下照射,切下目标DNA条带。然后采用AxyPrep DNA Gel Extraction Kit(AXYGEN公司)从琼脂糖凝胶中回收DNA即为扩增出的DNA片段。将此DNA 片段用宝生物工程有限公司的rTaq DNA聚合酶在末端加A后与市售的克隆载体 pMD18T质粒连接,获得重组质粒URT94-1-pMD18T和URT94-2-pMD18T。连接 产物转化市售的大肠杆菌Top10感受态细胞,将转化后的大肠杆菌菌液涂布在添 加氨苄青霉素100ug/mL的LB平板上,并进一步通过PCR和酶切验证重组克隆。 分别选取其中一个克隆提取重组质粒后进行测序。验证发现,URT94-1和URT94-2 是糖基转移酶基因,其ORF编码糖基转移酶第1家族保守功能域PSPG盒。
本发明人分别对URT94-1和URT94-2进行表达及转糖基反应分析。其中,2 个核酸序列(分别是SEQ ID NO:1、3)编码的糖基转移酶(分别是SEQ ID NO:2或 4)可以催化Rh1的C6位延伸1个鼠李糖基生成Rg2,催化活性相比于之前专利(PCT/CN2015/081111)公开的gGT29-7的突变体gGT29-7(N343G,A359P),提高至 少5倍,两者均无法催化Rh1的C6位延伸1个葡萄糖基生成Rf。
实验结果表明,人参来源的URT94-1和URT94-2在催化Rh1的C6位延伸一 个鼠李糖基生成Rg2的转化率均达到50%以上,催化Rg1的C6位延伸一个鼠李糖 基生成Re的转化率均达到50%以上,两者均无法催化Rg1的C6位延伸1个葡萄 糖基生成C20-O-Glc-Rf,表明它们是UDP-鼠李糖高度专一性的糖基转移酶。
实施例2、人参糖基转移酶URT94s基因重组表达质粒构建
分别以实施例1构建的含有URT94-1和URT94-2基因的pMD18T质粒,以质 粒URT94-1-pMD18T为例,正向引物包括两部分,5’端-3’端依次含有pET28a同源 臂的序列20bp以及编码URT94-1的起始序列20bp,反向引物包括两部分,5’端-3’ 端依次含有pET28a同源臂的序列20bp以及编码URT94-1的末端序列20bp(SEQ ID NO:9-SEQ ID NO:10,见表1),利用上述引物通过PCR方法扩增得了编码URT94-1 的基因(含pET28a同源臂)。DNA聚合酶选用宝生物工程有限公司的高保真DNA 聚合酶PrimeSTAR,参考其说明书设定PCR程序:94℃2min;94℃15s,57℃30s, 68℃1.5min,共33个循环;68℃10min;16℃保温。PCR产物经琼脂糖凝胶电泳检测,在紫外光下,切下与目标DNA大小一致的条带。然后采用AxyPrep DNA GelExtraction Kit(AXYGEN公司)从琼脂糖凝胶中回收DNA片段。
用Thermo公司的FD限制性内切酶NcoI和SalI双酶切质粒pET28a,37℃ 50min,然后采用AxyPrep DNA Gel Extraction Kit(AXYGEN公司)从琼脂糖凝胶 中回收线性的质粒pET28a。利用上海翊圣生物科技有限公司的重组酶将酶切线性 质粒分别与以上获得的URT94-1等2个UGTs进行同源重组,连接产物转化E.coli BL21(DE3)感受态细胞,并涂布于添加50μg/mL卡那霉素(Kana)的LB平板上。通 过菌落PCR验证阳性转化子,并测序进一步验证重组表达质粒是否构建成功。阳 性转化子称为大肠杆菌BL21-URT94-1和BL21-URT94-2。
表1、构建基因表达质粒所用的引物
实施例3、人参糖基转移酶URT94s在大肠杆菌中表达
分别将测序正确的大肠杆菌BL21-URT94-1和BL21-URT94-2两种菌,接种 到50mLLB培养基中,37℃ 200rpm培养至OD600约0.6-0.8,使菌液降温至4℃, 加入终浓度为200μM的IPTG,18℃ 120rpm诱导表达16h。4℃离心收集菌体, 超声破碎细胞,4℃ 12000g离心10min收集细胞裂解液上清,从而获取蛋白粗酶 液。pET28a上的6×His tag序列使蛋白URT94-1和URT94-2的C末端分别带有 6×His tag标签。由此对两种蛋白粗酶液进行Western blot检测蛋白表达情况。抗 6×His tag Western Blot(图2)表明,在45-55kD之间有明显条带,糖基转移酶 URT94-1和URT94-2在大肠杆菌中均有可溶表达。
实施例4、糖基转移酶URT94s以原人参三醇型皂苷Rh1为底物进行体外转 糖基活性和产物鉴定
以实施例4中重组大肠杆菌BL21-URT94-1和BL21-URT94-2的细胞裂解液上 清为粗酶液来进行转糖基反应,转空载体pET28a重组大肠杆菌的细胞裂解液作为 对照。选取专利PCT/CN2015/081111来源的人参糖基转移酶gGT29-7, gGT29-7(N343G,A359P)作阳性对照。按照表2所呈现的反应体系进行体外转糖基 化测试,35℃反应过夜。
反应结果分别用薄层层析(TLC),高效液相色谱(HPLC)进行检测:
表2、酶活测定反应体系
如图3a-b所示,以原人参三醇型人参皂苷Rh1为糖基受体,UDP-Rha为糖基 供体,BL21-URT94-1和BL21-URT94-2催化其生成Rg2,且它们的催化效率均明 显优于之前公开的糖基转移酶gGT29-7(N343G,A359P)的催化效果。并且,HPLC 的结果与TLC结果一致。
因此,URT94-1、URT94-2和gGT29-7(N343G,A359P)一样,能够催化Rh1 的C6-O-Glc延伸一分子鼠李糖生成人参皂苷Rg2。
实施例5、糖基转移酶URT94s以原人参三醇型皂苷Rg1为底物进行体外转 糖基活性和产物鉴定
以实施例4中重组大肠杆菌BL21-URT94-1和BL21-RT94-2的细胞裂解液上 清为粗酶液来进行转糖基反应,转空载体pET28a重组大肠杆菌的细胞裂解液作为 对照。选取专利PCT/CN2015/081111来源的人参糖基转移酶gGT29-7, gGT29-7(N343G,A359P)作阳性对照。按照表3所呈现的反应体系进行体外转糖基 化测试,35℃,反应过夜。
反应结果分别用薄层层析(TLC),高效液相色谱(HPLC)进行检测:
以原人参三醇型人参皂苷Rg1为糖基受体,UDP-Rha为糖基供体,URT94-1 和URT94-2催化其生成Re,且催化效率均明显优于之前公开的糖基转移酶 gGT29-7(N343G,A359P)(PCT/CN2015/081111)的催化效果。并且,HPLC的结果 与TLC结果一致。如图4a-b所示。
因此,URT94-1、URT94-2和gGT29-7(N343G,A359P)一样,能够催化Rg1 的C6-O-Glc延伸一分子鼠李糖生成人参皂苷Re。
实施例6、糖基转移酶URT94s以原人参三醇型皂苷Rh1/Rg1为底物,以 UDP-Glc为糖供体进行体外转糖基活性和产物鉴定
以实施例4中重组大肠杆菌BL21-URT94-1和BL21-URT94-2的细胞裂解液 上清为粗酶液来进行转糖基反应,转空载体pET28a重组大肠杆菌的细胞裂解液作 为对照。选取专利PCT/CN2015/081111来源的人参糖基转移酶gGT29-7, gGT29-7(N343G,A359P)作阳性对照。按照表3所呈现的反应体系进行体外转糖基 化测试,35℃,反应过夜。反应结果分别用薄层层析(TLC),高效液相色谱(HPLC) 进行检测。
表3、酶活测定反应体系
以原人参三醇型人参皂苷Rh1为糖基受体,UDP-Glc为糖基供体,URT94-1 和URT94-2不能催化其生成Rf,并且HPLC的结果与TLC结果一致。因此,与 gGT29-7和gGT29-7(N343G,A359P)不同,本发明的糖基转移酶URT94-1和 URT94-2,不能够催化Rh1的C6-O-Glc延伸一分子葡萄糖生成人参皂苷Rf,如图 5所示。
以原人参三醇型人参皂苷Rg1为糖基受体,UDP-Glc为糖基供体,URT94-1 和URT94-2不能催化其生成C20-O-Glc-Rf,并且HPLC的结果与TLC结果一致。 因此,与gGT29-7和gGT29-7(N343G,A359P)不同,本发明的糖基转移酶URT94-1 和URT94-2,不能够催化Rg1的C6-O-Glc延伸一分子葡萄糖生成人参皂苷 C20-O-Glc-Rf,如图6所示。表明URT94-1和URT94-2是UDP-鼠李糖高度专一性 的糖基转移酶。
实施例7、催化C6延伸一分子鼠李糖的URT94s的效率比较
来源专利PCT/CN2015/081111的糖基转移酶gGT29-7可在C6延伸一分子葡 萄糖,gGT29-7(N343G,A359P),可在C6延伸一分子葡萄糖也可以在C6延伸一 分子鼠李糖。将糖基转移酶gGT29-7,gGT29-7(N343G,A359P)以及本发明糖基转 移酶URT94-1和URT94-2,按照实施例4的方法对这些糖基转移酶进行表达并制 备粗酶液。按实施例5进行酶催化反应,以UDP-Rha为糖基供体,以Rh1和/或 Rg1为糖基受体,35℃反应为1小时,并用HPLC对产物进行定量测定。按以下公 式进行催化效率的计算:
转化效率(%)=产物量/(底物量+产物量)
如表4显示,与专利PCT/CN2015/081111披露的糖基转移酶gGT29-7, gGT29-7(N343G,A359P)相比,URT94-1和URT94-2,以UDP-鼠李糖为糖基供体 催化Rh1和/或Rg1的C6位延伸糖链的活性均得到提高。
表4、催化C6位延伸Rha的糖基转移酶的催化效率比较
因此,不同于此前的糖基转移酶,本发明的URT94-1和URT94-2可以特异性 和高效地在四环三萜化合物底物的C-6的第一个糖基上进一步加上鼠李糖基以延 伸糖链。
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被 单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领 域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权 利要求书所限定的范围。
序列表
<110> 中国科学院分子植物科学卓越创新中心
<120> 鼠李糖高度专一的糖基转移酶及其应用
<130> 215522
<160> 12
<170> SIPOSequenceListing 1.0
<210> 1
<211> 1404
<212> DNA
<213> 人参(Panax L.)
<400> 1
atggatacca atgaaaaaac cagaataaaa gttgtaatgt taccatggct ggcatatggt 60
cacatatcac cctatctaga gctagcaaaa aaactctcaa aacgaaattt ttacatatac 120
ttttgttcca catctatcaa tcttagttcc atcaggaaaa aacttgcagt tgatgatcac 180
gaggcaatac agctgataga attccagtta acttcacaaa ccgagctgcc gccgcaccat 240
cacacaacca aaggtctccc tccccatctc attcctgatt tgatcaaggc ccttggtatg 300
tccggcccca acgtcatcaa cattctaaat acagtaaacc ctgatttaat catctacgat 360
gtcttccagt tatgggtgcc tgcatttgca gcctctcttc aaatcccagc tgtccatttc 420
caagtagtcg gagccatatc aactgccgcc gcctataggt ttaaggtgga tcctagtata 480
ccggttcctt gttcaagaat ctttctggat gacaccaaca taaggaaaag ccccgattat 540
gattcatctt cagcagaaaa tagtggtatt cttgacctta catttggtac agctatacaa 600
tcgtcagata taatcttgat caagagttct agagagttcg atgaaaagaa tatcgaatac 660
tattcccttt tgatggacaa gaagattgtg cctacgggtc cacttgtaca agtcaacaca 720
tctgtggctg tccataccga aaatgagaag gacgatataa tggagtggct aagcaagaaa 780
gaagaatcct caacagttta tgtttctttt gggagtgagt gctatttgtc agagcctagg 840
atccgagagc tggcccatgg gctagagctt agcaatgtaa atttcatatg ggttattagt 900
tttccagagg gagatgagga aatgtgtaat acttgtattg aagatgtatt accggaaggg 960
tttcttgata gggtgaaaga tagaggggtg attgtgagtt gggccccaca ggaaagaata 1020
ttagggcatg gtggacttgg gggatttgtg agtcattgtg ggtggggttc tgtagtggaa 1080
ggcatgagct atggagttcc aataattgcc atgcccgcgc aatatgaaca gcctttgcat 1140
gctatgtttg tggaggaggt gggcgttggc gtggaggttc taaaagacga gagtggagaa 1200
tttaggaggg atgaaatagc aaaagctata aaaaaggttg tggtggagaa aaatggagaa 1260
ggtgtgagga agaaggcaag agagatgggc aaggcaataa aaaagagagg agaagaagaa 1320
gtggaatgtg tagttgagga gttgaccaaa ctttgcaaaa agtatcagaa agtagcagca 1380
ggccagggga agcgatgccc ctaa 1404
<210> 2
<211> 467
<212> PRT
<213> 人参(Panax L.)
<400> 2
Met Asp Thr Asn Glu Lys Thr Arg Ile Lys Val Val Met Leu Pro Trp
1 5 10 15
Leu Ala Tyr Gly His Ile Ser Pro Tyr Leu Glu Leu Ala Lys Lys Leu
20 25 30
Ser Lys Arg Asn Phe Tyr Ile Tyr Phe Cys Ser Thr Ser Ile Asn Leu
35 40 45
Ser Ser Ile Arg Lys Lys Leu Ala Val Asp Asp His Glu Ala Ile Gln
50 55 60
Leu Ile Glu Phe Gln Leu Thr Ser Gln Thr Glu Leu Pro Pro His His
65 70 75 80
His Thr Thr Lys Gly Leu Pro Pro His Leu Ile Pro Asp Leu Ile Lys
85 90 95
Ala Leu Gly Met Ser Gly Pro Asn Val Ile Asn Ile Leu Asn Thr Val
100 105 110
Asn Pro Asp Leu Ile Ile Tyr Asp Val Phe Gln Leu Trp Val Pro Ala
115 120 125
Phe Ala Ala Ser Leu Gln Ile Pro Ala Val His Phe Gln Val Val Gly
130 135 140
Ala Ile Ser Thr Ala Ala Ala Tyr Arg Phe Lys Val Asp Pro Ser Ile
145 150 155 160
Pro Val Pro Cys Ser Arg Ile Phe Leu Asp Asp Thr Asn Ile Arg Lys
165 170 175
Ser Pro Asp Tyr Asp Ser Ser Ser Ala Glu Asn Ser Gly Ile Leu Asp
180 185 190
Leu Thr Phe Gly Thr Ala Ile Gln Ser Ser Asp Ile Ile Leu Ile Lys
195 200 205
Ser Ser Arg Glu Phe Asp Glu Lys Asn Ile Glu Tyr Tyr Ser Leu Leu
210 215 220
Met Asp Lys Lys Ile Val Pro Thr Gly Pro Leu Val Gln Val Asn Thr
225 230 235 240
Ser Val Ala Val His Thr Glu Asn Glu Lys Asp Asp Ile Met Glu Trp
245 250 255
Leu Ser Lys Lys Glu Glu Ser Ser Thr Val Tyr Val Ser Phe Gly Ser
260 265 270
Glu Cys Tyr Leu Ser Glu Pro Arg Ile Arg Glu Leu Ala His Gly Leu
275 280 285
Glu Leu Ser Asn Val Asn Phe Ile Trp Val Ile Ser Phe Pro Glu Gly
290 295 300
Asp Glu Glu Met Cys Asn Thr Cys Ile Glu Asp Val Leu Pro Glu Gly
305 310 315 320
Phe Leu Asp Arg Val Lys Asp Arg Gly Val Ile Val Ser Trp Ala Pro
325 330 335
Gln Glu Arg Ile Leu Gly His Gly Gly Leu Gly Gly Phe Val Ser His
340 345 350
Cys Gly Trp Gly Ser Val Val Glu Gly Met Ser Tyr Gly Val Pro Ile
355 360 365
Ile Ala Met Pro Ala Gln Tyr Glu Gln Pro Leu His Ala Met Phe Val
370 375 380
Glu Glu Val Gly Val Gly Val Glu Val Leu Lys Asp Glu Ser Gly Glu
385 390 395 400
Phe Arg Arg Asp Glu Ile Ala Lys Ala Ile Lys Lys Val Val Val Glu
405 410 415
Lys Asn Gly Glu Gly Val Arg Lys Lys Ala Arg Glu Met Gly Lys Ala
420 425 430
Ile Lys Lys Arg Gly Glu Glu Glu Val Glu Cys Val Val Glu Glu Leu
435 440 445
Thr Lys Leu Cys Lys Lys Tyr Gln Lys Val Ala Ala Gly Gln Gly Lys
450 455 460
Arg Cys Pro
465
<210> 3
<211> 1404
<212> DNA
<213> 人参(Panax L.)
<400> 3
atggatacca atgaaaaaac cagaataaaa gttgtaatgt taccatggct ggcatatggt 60
cacatatcac cctatctaga gctagcaaaa aaactctcaa aacgaaattt ttacatatac 120
ttttgttcca catctatcaa tcttagttcc atcaggaaaa aacttgcagt tgatgatcac 180
gaggcaatac agctgataga attccagtta acttcacaaa ccgagctgcc gccgcaccat 240
cacacaacca aaggtctccc tccccatctc attcctgatt tgatcaaggc ccttggtatg 300
tccggcccca acgtcatcaa cattctaaat acagtaaacc ctgatttaat catctacgat 360
gtcttccagt tatgggtgcc tgcatttgca gcctctcttc aaatcccagc tgtccatttc 420
caagtagtcg gagccatatc aactgccgcc gcctataggt ttaaggtgga tcctagtata 480
ccggttcctt gttcaagaat ctttctggat gacaccaaca taaggaaaag ccccgattat 540
gattcatctt cagcagaaaa tagtggtatt cttgacctta catttggtac agctatacaa 600
tcgtcagata taatcttgat caagagttct agagagttcg atgaaaagaa tatcgaatac 660
tattcccttt tgatggacaa gaagattgtg cctacgggtc cacttgtaca agtcaacaca 720
tctgtggctg tccataccga aaatgagaag gacgatataa tggagtggct aagcaagaaa 780
gaagaatcct caacagttta tgtttctttt gggagtgagt gctatttgtc agagcctagg 840
atccgagagc tggcccatgg gctagagctt agcaatgtaa atttcatatg ggttattagt 900
tttccagagg gagatgagga aatgtgtaat acttgtattg aagatgtatt accggaaggg 960
tttcttgata gggtgaaaga tagaggggtg attgtgagtt gggccccaca ggaaagaata 1020
ttagggcatg gtggacttgg gggatttgtg agtcattgtg ggtggggttc tgtagtggaa 1080
ggcatgagct atggagttcc aataattgcc atgcccgcgc aatatgaaca gcctttgcat 1140
gctatgtttg tggaggaggt gggcgttggc gtggaggttc taaaagacga gagcggagaa 1200
tttaggaggg atgaaatagc aaaagctata aaaaaggttg tggtggagaa aaatggagaa 1260
ggtgtgagga agaaggcaag agagatgggc aaggcaataa aaaagagagg agaagaagaa 1320
gtggaatgtg tagttgagga gttgaccaaa ctttgcaaaa agtatcagaa agtagcagca 1380
ggccagggga aggaatgccc ctaa 1404
<210> 4
<211> 467
<212> PRT
<213> 人参(Panax L.)
<400> 4
Met Asp Thr Asn Glu Lys Thr Arg Ile Lys Val Val Met Leu Pro Trp
1 5 10 15
Leu Ala Tyr Gly His Ile Ser Pro Tyr Leu Glu Leu Ala Lys Lys Leu
20 25 30
Ser Lys Arg Asn Phe Tyr Ile Tyr Phe Cys Ser Thr Ser Ile Asn Leu
35 40 45
Ser Ser Ile Arg Lys Lys Leu Ala Val Asp Asp His Glu Ala Ile Gln
50 55 60
Leu Ile Glu Phe Gln Leu Thr Ser Gln Thr Glu Leu Pro Pro His His
65 70 75 80
His Thr Thr Lys Gly Leu Pro Pro His Leu Ile Pro Asp Leu Ile Lys
85 90 95
Ala Leu Gly Met Ser Gly Pro Asn Val Ile Asn Ile Leu Asn Thr Val
100 105 110
Asn Pro Asp Leu Ile Ile Tyr Asp Val Phe Gln Leu Trp Val Pro Ala
115 120 125
Phe Ala Ala Ser Leu Gln Ile Pro Ala Val His Phe Gln Val Val Gly
130 135 140
Ala Ile Ser Thr Ala Ala Ala Tyr Arg Phe Lys Val Asp Pro Ser Ile
145 150 155 160
Pro Val Pro Cys Ser Arg Ile Phe Leu Asp Asp Thr Asn Ile Arg Lys
165 170 175
Ser Pro Asp Tyr Asp Ser Ser Ser Ala Glu Asn Ser Gly Ile Leu Asp
180 185 190
Leu Thr Phe Gly Thr Ala Ile Gln Ser Ser Asp Ile Ile Leu Ile Lys
195 200 205
Ser Ser Arg Glu Phe Asp Glu Lys Asn Ile Glu Tyr Tyr Ser Leu Leu
210 215 220
Met Asp Lys Lys Ile Val Pro Thr Gly Pro Leu Val Gln Val Asn Thr
225 230 235 240
Ser Val Ala Val His Thr Glu Asn Glu Lys Asp Asp Ile Met Glu Trp
245 250 255
Leu Ser Lys Lys Glu Glu Ser Ser Thr Val Tyr Val Ser Phe Gly Ser
260 265 270
Glu Cys Tyr Leu Ser Glu Pro Arg Ile Arg Glu Leu Ala His Gly Leu
275 280 285
Glu Leu Ser Asn Val Asn Phe Ile Trp Val Ile Ser Phe Pro Glu Gly
290 295 300
Asp Glu Glu Met Cys Asn Thr Cys Ile Glu Asp Val Leu Pro Glu Gly
305 310 315 320
Phe Leu Asp Arg Val Lys Asp Arg Gly Val Ile Val Ser Trp Ala Pro
325 330 335
Gln Glu Arg Ile Leu Gly His Gly Gly Leu Gly Gly Phe Val Ser His
340 345 350
Cys Gly Trp Gly Ser Val Val Glu Gly Met Ser Tyr Gly Val Pro Ile
355 360 365
Ile Ala Met Pro Ala Gln Tyr Glu Gln Pro Leu His Ala Met Phe Val
370 375 380
Glu Glu Val Gly Val Gly Val Glu Val Leu Lys Asp Glu Ser Gly Glu
385 390 395 400
Phe Arg Arg Asp Glu Ile Ala Lys Ala Ile Lys Lys Val Val Val Glu
405 410 415
Lys Asn Gly Glu Gly Val Arg Lys Lys Ala Arg Glu Met Gly Lys Ala
420 425 430
Ile Lys Lys Arg Gly Glu Glu Glu Val Glu Cys Val Val Glu Glu Leu
435 440 445
Thr Lys Leu Cys Lys Lys Tyr Gln Lys Val Ala Ala Gly Gln Gly Lys
450 455 460
Glu Cys Pro
465
<210> 5
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(24)
<223> 引物
<400> 5
cgcagtacat ctaacagaaa aaga 24
<210> 6
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(25)
<223> 引物
<400> 6
caataatttg aaaaaaaatg aatta 25
<210> 7
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(24)
<223> 引物
<400> 7
cgtgacatta atggtgtcat ttat 24
<210> 8
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(25)
<223> 引物
<400> 8
cttttttata gcttttgcta tccct 25
<210> 9
<211> 42
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(42)
<223> 引物
<400> 9
ctttaagaag gagatatacc atggatacca atgaaaaaac ca 42
<210> 10
<211> 44
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(44)
<223> 引物
<400> 10
ctcgagtgcg gccgcaagct tggggcatcg cttcccctgg cctg 44
<210> 11
<211> 44
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(44)
<223> 引物
<400> 11
ctttaagaag gagatatacc atggatacca atgaaaaaac caga 44
<210> 12
<211> 44
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(44)
<223> 引物
<400> 12
ctcgagtgcg gccgcaagct tggggcattc cttcccctgg cctg 44
Claims (11)
1.一种在四环三萜化合物的C-6位的第一个糖基上连接鼠李糖基的方法,包括:以专一性糖基转移酶进行转移,所述专一性糖基转移酶是具有SEQ ID NO:2或SEQ ID NO:4所示氨基酸序列的多肽,或其保守性变异多肽。
2.专一性糖基转移酶的用途,用于在四环三萜化合物的C-6位的第一个糖基上连接鼠李糖基,所述专一性糖基转移酶是具有SEQ ID NO:2或SEQ ID NO:4所示氨基酸序列的多肽,或其保守性变异多肽。
3.如权利要求1所述的方法或权利要求2所述的用途,其特征在于,所述的鼠李糖基由糖基供体提供;较佳地,所述糖基供体是携带鼠李糖基团的糖基供体;更佳地,所述的糖基供体包括选自:尿苷二磷酸-鼠李糖,鸟苷二磷酸-鼠李糖,腺苷二磷酸-鼠李糖,胞苷二磷酸-鼠李糖,胸苷二磷酸-鼠李糖,或其组合。
6.一种胞内在四环三萜化合物的C-6位的第一个糖基上连接鼠李糖基的方法,包括:
(a)在宿主细胞内引入四环三萜化合物反应前体或表达/形成其的构建体,以及引入专一性糖基转移酶或表达其的构建体,获得重组的宿主细胞;所述专一性糖基转移酶是具有SEQ ID NO:2或SEQ ID NO:4所示氨基酸序列的多肽,或其保守性变异多肽;所述宿主细胞内存在携带鼠李糖基团的糖基供体或引入有携带鼠李糖基团的糖基供体;
(b)培养(a)的重组的宿主细胞,获得C-6位的第一个糖基上连接鼠李糖基的四环三萜化合物产物;
较佳地,所述四环三萜化合物反应前体包括:人参皂苷Rg1,人参皂苷Rh1,三七皂苷R3;相应的产物包括:人参皂苷Re,人参皂苷Rg2,Yesanchinoside E;
较佳地,所述的糖基供体包括选自:尿苷二磷酸-鼠李糖,鸟苷二磷酸-鼠李糖,腺苷二磷酸-鼠李糖,胞苷二磷酸-鼠李糖,胸苷二磷酸-鼠李糖,或其组合。
7.一种专一性糖基转移酶,其是具有SEQ ID NO:2或SEQ ID NO:4所示氨基酸序列的多肽,或其保守性变异多肽;较佳地,所述保守性变异多肽包括:
(1)由SEQ ID NO:2或SEQ ID NO:4所示序列的多肽经过一个或多个氨基酸残基的取代、缺失或添加而形成的,且具有在四环三萜化合物的C-6位的第一个糖基上连接鼠李糖基功能的多肽;
(2)氨基酸序列与SEQ ID NO:2或SEQ ID NO:4所示序列的多肽有50%以上相同性,且具有在四环三萜化合物的C-6位的第一个糖基上连接鼠李糖基功能的多肽;或
(3)在SEQ ID NO:2或SEQ ID NO:4所示序列的多肽的N或C末端添加标签序列,或在其N末端添加信号肽序列后形成的多肽。
8.分离的多核苷酸,所述多核苷酸编码权利要求8所述的专一性糖基转移酶。
9.一种核酸构建物,其包含权利要求8所述的多核苷酸,或表达权利要求7所述的专一性糖基转移酶;较佳地,所述核酸构建物是表达载体或同源重组载体。
10.一种重组宿主细胞,其表达权利要求7所述的专一性糖基转移酶,或含有权利要求8所述的多核苷酸,或含有权利要求9所述的核酸构建物;较佳地,该重组宿主细胞中还含有四环三萜化合物反应前体或表达/形成其的构建体;较佳地,该重组宿主细胞中还存在携带鼠李糖基团的糖基供体或引入有携带鼠李糖基团的糖基供体;
较佳地,所述四环三萜化合物反应前体包括:人参皂苷Rg1,人参皂苷Rh1,三七皂苷R3;相应的产物包括:人参皂苷Re,人参皂苷Rg2,Yesanchinoside E;
较佳地,所述的糖基供体包括选自:尿苷二磷酸-鼠李糖,尿苷二磷酸-鼠李糖,鸟苷二磷酸-鼠李糖,腺苷二磷酸-鼠李糖,胞苷二磷酸鼠李糖,胸苷二磷酸-鼠李糖,或其组合。
11.一种用于糖基转移的试剂盒,其特征在于,其中包括:
权利要求7所述的专一性糖基转移酶,该酶能在四环三萜化合物的C-6位的第一个糖基上连接鼠李糖基,所述专一性糖基转移酶是具有SEQ ID NO:2或SEQ ID NO:4所示氨基酸序列的多肽,或其保守性变异多肽;或
权利要求8所述分离的多核苷酸;或
权利要求9所述的核酸构建物;或
权利要求10所述的重组宿主细胞;
较佳地,其中还包括:携带鼠李糖基团的糖基供体;更佳地,所述的糖基供体包括:尿苷二磷酸-鼠李糖,鸟苷二磷酸-鼠李糖,腺苷二磷酸-鼠李糖,胞苷二磷酸-鼠李糖,胸苷二磷酸-鼠李糖。
较佳地,其中还包括:四环三萜化合物反应前体。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110871374.0A CN115678952A (zh) | 2021-07-30 | 2021-07-30 | 鼠李糖高度专一的糖基转移酶及其应用 |
KR1020247004280A KR20240032944A (ko) | 2021-07-30 | 2022-08-01 | 람노스가 고도로 특이적인 글리코실트랜스퍼라제 및 이의 응용 |
PCT/CN2022/109355 WO2023006109A1 (zh) | 2021-07-30 | 2022-08-01 | 鼠李糖高度专一的糖基转移酶及其应用 |
CN202280053383.1A CN117897480A (zh) | 2021-07-30 | 2022-08-01 | 鼠李糖高度专一的糖基转移酶及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110871374.0A CN115678952A (zh) | 2021-07-30 | 2021-07-30 | 鼠李糖高度专一的糖基转移酶及其应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115678952A true CN115678952A (zh) | 2023-02-03 |
Family
ID=85058549
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110871374.0A Pending CN115678952A (zh) | 2021-07-30 | 2021-07-30 | 鼠李糖高度专一的糖基转移酶及其应用 |
CN202280053383.1A Pending CN117897480A (zh) | 2021-07-30 | 2022-08-01 | 鼠李糖高度专一的糖基转移酶及其应用 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202280053383.1A Pending CN117897480A (zh) | 2021-07-30 | 2022-08-01 | 鼠李糖高度专一的糖基转移酶及其应用 |
Country Status (3)
Country | Link |
---|---|
KR (1) | KR20240032944A (zh) |
CN (2) | CN115678952A (zh) |
WO (1) | WO2023006109A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116286712B (zh) * | 2023-05-11 | 2023-08-25 | 中国中医科学院中药研究所 | 鼠李糖基转移酶突变体、编码基因、制备方法及应用 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
IL128193A (en) * | 1999-01-22 | 2008-03-20 | Yeda Res & Dev | Rhamnosyl-transferase gene and uses thereof |
KR20180005716A (ko) * | 2012-12-06 | 2018-01-16 | 상하이 인스티튜츠 포 바이올로지컬 사이언시스, 차이니즈 아카데미 오브 사이언시스 | 한 그룹의 글리코실전이효소 및 그 응용 |
CN104232723B (zh) * | 2013-06-07 | 2021-03-26 | 中国科学院分子植物科学卓越创新中心 | 一组糖基转移酶及其应用 |
CN115341008A (zh) * | 2014-06-09 | 2022-11-15 | 周志华 | 一组糖基转移酶及其应用 |
CN105985938A (zh) * | 2015-01-30 | 2016-10-05 | 中国科学院上海生命科学研究院 | 糖基转移酶突变蛋白及其应用 |
CN112831481B (zh) * | 2019-11-22 | 2024-01-19 | 生合万物(上海)生物科技有限公司 | 糖基转移酶以及催化糖链延伸的方法 |
-
2021
- 2021-07-30 CN CN202110871374.0A patent/CN115678952A/zh active Pending
-
2022
- 2022-08-01 WO PCT/CN2022/109355 patent/WO2023006109A1/zh active Application Filing
- 2022-08-01 KR KR1020247004280A patent/KR20240032944A/ko unknown
- 2022-08-01 CN CN202280053383.1A patent/CN117897480A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
WO2023006109A1 (zh) | 2023-02-02 |
CN117897480A (zh) | 2024-04-16 |
KR20240032944A (ko) | 2024-03-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7504946B2 (ja) | 一連の糖鎖伸長を触媒するudp-糖転移酵素およびその使用 | |
JP6479084B2 (ja) | 一連の糖転移酵素およびその応用 | |
CN104232723B (zh) | 一组糖基转移酶及其应用 | |
WO2015188742A2 (zh) | 一组糖基转移酶及其应用 | |
CN105087739B (zh) | 一种新的制备稀有人参皂苷的催化体系及其应用 | |
JP7086107B2 (ja) | 糖転移酵素、突然変異体およびその使用 | |
KR20140041261A (ko) | 인삼 유래의 신규한 udp-당전이효소 및 이의 용도 | |
KR20140041259A (ko) | 인삼 유래의 신규한 udp-당전이효소 및 이의 용도 | |
WO2021164673A1 (zh) | 双功能碳苷糖基转移酶及其应用 | |
CN114032223B (zh) | 七叶苷和秦皮苷糖基转移酶蛋白及其编码基因与应用 | |
WO2023006109A1 (zh) | 鼠李糖高度专一的糖基转移酶及其应用 | |
CN112831481B (zh) | 糖基转移酶以及催化糖链延伸的方法 | |
CN114507646B (zh) | 细胞色素p450突变体蛋白及其应用 | |
CN113444703B (zh) | 催化糖链延伸的糖基转移酶突变体及其应用 | |
CN111926000B (zh) | 绞股蓝糖基转移酶及其应用 | |
CN113755464B (zh) | 一种参与桂叶苷B和毛蕊花糖苷生物合成的LrUGT2蛋白及其编码基因与应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
CB02 | Change of applicant information |
Address after: 201318 floor 1-2, building 2, Lane 500, Furonghua Road, Pudong New Area, Shanghai Applicant after: Shenghe Everything (Shanghai) Biotechnology Co.,Ltd. Address before: Room 805, building 6, juke Biological Park, No. 333 Guiping Road, Xuhui District, Shanghai 200233 Applicant before: Shenghe everything (Suzhou) Biotechnology Co.,Ltd. |
|
CB02 | Change of applicant information |