发明内容
本发明的目的在于提供一种利用微生物生产甜菊糖苷类化合物的方法。
本发明在第一方面,提供了一种分离的多肽,其特征在于,所述的多肽是非甜叶菊来源的糖基转移酶,用于催化在甜菊糖苷类化合物的O-葡萄糖残基的C-2’再转移上一个糖。
优选地,其氨基酸序列与甜叶菊来源的具有同一功能的酶的氨基酸序列一致性不大于95%,较佳的,不大于80%;较佳的,不大于70%;较佳的,不大于60%;较佳的,不大于50%;更佳的,不大于40%;更佳的,不大于30%。
在一个优选例中,所述的非甜叶菊来源糖基转移酶来源于斯塔摩酵母(Starmerellabombicola)或甘薯(Ipomoea batatas)。
在另一优选例中,所述的来源于斯塔摩酵母的糖基转移酶,其特征在于,具有如SEQ ID NO:41的氨基酸序列(称为UGTB1)或在SEQ ID NO:41基础上经过一个或多个氨基酸残基的取代、缺失或添加而形成的同功能衍生蛋白。
在另一优选例中,所述的来源于甘薯的糖基转移酶,其特征在于,具有如SEQ IDNO:51所示的氨基酸序列(称为IBGT),或在SEQ ID NO:51基础上经过一个或多个氨基酸残基的取代、缺失或添加而形成的同功能衍生蛋白。
本发明在另一方面,提供了一种分离的核苷酸序列,其特征在于,所述的核苷酸序列编码非甜叶菊来源的糖基转移酶,用于催化在甜菊糖苷类化合物的O-葡萄糖残基的C-2’再转移上一个糖。
在一个优选例中,所述的核苷酸序列具有:(1)如SEQ ID NO:42所示的序列,或与SEQ ID NO:42同源度在70%及以上的序列(较佳的,在80%以上;更佳的在90%以上,更佳的在95%以上)(2)如SEQ ID NO:52所示的序列,或与SEQ ID NO:52同源度在在70%及以上的序列(较佳的,在80%以上;更佳的在90%以上,更佳的在95%以上)。
在另一优选例中,所述的核苷酸序列是(1)如SEQ ID NO:42所示的序列或(2)如SEQ ID NO:52所示的序列。
本发明在另一方面,提供了一种非甜叶菊来源的糖基转移酶的用途,用于在宿主细胞中重组表达以制备甜菊糖苷类化合物,其特征在于,催化在甜菊糖苷类化合物的O-葡萄糖残基的C-2’再转移上一个糖。
在一个优选例中,所述的糖基转移酶的催化底物包括但不限于甜菊醇-13-O-葡萄糖苷(又称甜菊醇单糖苷)、甜茶素(又称甜叶悬钩子苷)、甜菊糖苷、莱鲍迪苷A;优选的,催化甜菊醇单糖苷生成甜菊醇双糖苷。
本发明在另一方面,提供了一种合成甜菊糖苷类化合物的方法,其特征在于,在宿主细胞中重组表达能催化在甜菊糖苷类化合物的O-葡萄糖残基的C-2’再转移上一个糖的非甜叶菊来源的糖基转移酶。。
在一个优选例中,所述的宿主细胞还含有下述中的一个或多个:
(a)牻牛儿基牻牛儿基焦磷酸合成酶,
(b)选自以下(I)或(II)的酶:(I)古巴焦磷酸合成酶和贝壳烯合成酶,(II)双功能贝壳烯合酶,
(c)贝壳烯氧化酶,
(d)细胞色素P450氧化还原蛋白,
(e)贝壳烯酸-13α-羟化酶,
(f)UGT85C2糖基转移酶,
(h)UGT74G1糖基转移酶,
(i)UGT76G1糖基转移酶。
在另一优选例中,所述的的宿主细胞还含有包括以下酶的基因表达盒:1-脱氧木糖-5-磷酸合成酶,2-甲基赤藓糖-4-磷酸胞苷转移酶,2-甲基赤藓糖-2,4-环二磷酸合成酶和异戊烯焦磷酸异构酶。
在另一优选例中,所述的宿主细胞选自:原核微生物细胞或真核微生物细胞。
在另一优选例中,所述的原核微生物是:大肠杆菌,枯草芽孢杆菌,醋酸杆菌、棒状杆菌、短杆菌;更佳地,所述大肠杆菌选自:BL21、BLR、DH10B、HMS、CD43、JM109、DH5α或Noveblue;或所述的真核微生物细胞是:酵母菌、霉菌、担子菌;所述的酵母菌是:毕赤酵母,酿酒酵母,乳酸克鲁维酵母。较佳地,所述的毕赤酵母选自GS115、MC100-3、SMD1163、SMD1165、SMD1168或KM71;较佳地,所述的酿酒酵母选自W303、CEN.PK2、S288c、FY834或S1949;较佳地,所述的乳酸克鲁维酵母选自GG799。
在本发明的另一方面,提供一种合成甜菊糖苷类化合物的方法,包括:在细胞中重组表达(较佳地,为异源表达):
(a)牻牛儿基牻牛儿基焦磷酸合成酶(GGPPS),
(b)选自以下(I)或(II)的酶:(I)古巴焦磷酸合成酶(CDPS)和贝壳烯合成酶(KS),(II)双功能贝壳烯合酶(CPS/KS),
(c)贝壳烯氧化酶(KO),
(d)细胞色素P450氧化还原蛋白(CPR),
(e)贝壳烯酸-13α-羟化酶,
(f)UGT85C2糖基转移酶,和
(g)UGTB1/IBGT糖基转移酶;
培养所述的细胞,从而生成甜菊糖苷类化合物。
在一个优选例中,还包括重组表达:
(h)UGT74G1糖基转移酶,和/或
(i)UGT76G1糖基转移酶。
在另一优选例中,重组表达所述的牻牛儿基牻牛儿基焦磷酸合成酶、古巴焦磷酸合成酶、贝壳烯合成酶、贝壳烯氧化酶、贝壳烯酸-13α-羟化酶、UGT85C2糖基转移酶和UGTB1/IBGT糖基转移酶,从而合成甜菊醇双糖苷。
在另一优选例中,重组表达所述的牻牛儿基牻牛儿基焦磷酸合成酶、古巴焦磷酸合成酶、贝壳烯合成酶、贝壳烯氧化酶、贝壳烯酸-13α-羟化酶、UGT85C2糖基转移酶,UGTB1/IBGT糖基转移酶和UGT74G1糖基转移酶,从而合成甜菊糖苷。
在另一优选例中,重组表达所述的牻牛儿基牻牛儿基焦磷酸合成酶、古巴焦磷酸合成酶、贝壳烯合成酶、贝壳烯氧化酶、贝壳烯酸-13α-羟化酶、UGT85C2糖基转移酶,UGTB1/IBGT糖基转移酶,UGT74G1糖基转移酶和UGT76G1糖基转移酶,从而合成莱鲍迪苷A。
在另一优选例中,(b)项中,采用(II)双功能贝壳烯合酶。
在另一优选例中,所述的方法中,所述的牻牛儿基牻牛儿基焦磷酸合成酶来源于加拿大红豆杉(Taxus canadensis)或甜叶菊(Stevia rebaudiana)(优选地,来源于加拿大红豆杉);
所述的古巴焦磷酸合成酶来源于甜叶菊或慢生大豆根瘤菌(Bradyrhizobiumjaponicum)(优选地,来源于甜叶菊);
所述的贝壳烯合成酶来源于甜叶菊或慢生大豆根瘤菌(优选地,来源于甜叶菊);
所述的双功能贝壳烯合酶来源于小立碗藓(Physcomitrella patens)或藤仓赤霉(Gibberella fujikuroi)(优选地,来源于小立碗藓);
所述的贝壳烯氧化酶来源于甜叶菊、藤仓赤霉、阿拉伯芥(Arabidopsis thaliana)或慢生大豆根瘤菌(优选地,来源于甜叶菊);
所述的贝壳烯酸-13α-羟化酶来源于甜叶菊、阿拉伯芥(优选地,来源于甜叶菊);
所述的UGT85C2糖基转移酶、UGT74G1糖基转移酶、UGT76G1糖基转移酶来源于甜叶菊;
所述的UGTB1糖基转移酶来源于斯塔摩酵母(Starmerella bombicola);所述的IBGT糖基转移酶来源于甘薯(Ipomoea batatas);所述的细胞色素P450氧化还原蛋白来源于黄花蒿(Artemisia annua),暗球腔菌(Phaeosphaeria sp.L487),藤仓赤霉,甜叶菊或阿拉伯芥(优选地,来源于暗球腔菌)。
在另一优选例中,(b)项中,采用(II)双功能贝壳烯合酶;且,所述的牻牛儿基牻牛儿基焦磷酸合成酶来源于加拿大红豆杉,所述的双功能贝壳烯合酶来源于小立碗藓,所述的贝壳烯氧化酶、贝壳烯酸-13α-羟化酶、UGT85C2糖基转移酶、UGT74G1糖基转移酶、UGT76G1糖基转移酶来源于甜叶菊;所述的UGTB1糖基转移酶来源于斯塔摩酵母;所述的细胞色素P450氧化还原蛋白来源于暗球腔菌;所述的IGBT糖基转移酶来源于甘薯(Ipomoea batatas)。
在另一优选例中,所述的来源于加拿大红豆杉的牻牛儿基牻牛儿基焦磷酸合成酶,在野生型的基础上去除了N端的质体转运肽序列;较佳地,去除了N端98个氨基酸;
所述的来源于黄花蒿的细胞色素P450氧化还原蛋白,在野生型基础上去除了N端跨膜区序列;较佳地,去除了N端66个氨基酸。
在另一优选例中,所述的牻牛儿基牻牛儿基焦磷酸合成酶具有SEQ ID NO:1或SEQ ID NO:45所示的氨基酸序列,或在SEQ ID NO:1或SEQ ID NO:45基础上经过一个或多个(如1-30个,较佳地1-20个,更佳地1-10个,更佳地1-5个)氨基酸残基的取代、缺失或添加而形成的同功能衍生蛋白;
所述的古巴焦磷酸合成酶具有SEQ ID NO:3或SEQ ID NO:25所示的氨基酸序列,或在SEQ ID NO:3或SEQ ID NO:25基础上经过一个或多个(如1-30个,较佳地1-20个,更佳地1-10个,更佳地1-5个)氨基酸残基的取代、缺失或添加而形成的同功能衍生蛋白;
所述的贝壳烯合成酶具有SEQ ID NO:5或SEQ ID NO:27所示的氨基酸序列,或在SEQ ID NO:5或SEQ ID NO:27基础上经过一个或多个(如1-30个,较佳地1-20个,更佳地1-10个,更佳地1-5个)氨基酸残基的取代、缺失或添加而形成的同功能衍生蛋白;
所述的双功能贝壳烯合酶具有SEQ ID NO:21或SEQ ID NO:23所示的氨基酸序列,或在SEQ ID NO:21或SEQ ID NO:23基础上经过一个或多个(如1-30个,较佳地1-20个,更佳地1-10个,更佳地1-5个)氨基酸残基的取代、缺失或添加而形成的同功能衍生蛋白;
所述的贝壳烯氧化酶具有SEQ ID NO:7、SEQ ID NO:31、SEQ ID NO:37或SEQID NO:29所示的氨基酸序列,或在SEQ ID NO:7、SEQ ID NO:31、SEQ ID NO:37或SEQ ID NO:29基础上经过一个或多个(如1-30个,较佳地1-20个,更佳地1-10个,更佳地1-5个)氨基酸残基的取代、缺失或添加而形成的同功能衍生蛋白;
所述的贝壳烯酸-13α-羟化酶具有SEQ ID NO:9、SEQ ID NO:43、SEQID NO:47或SEQ ID NO:49所示的氨基酸序列,或在SEQ ID NO:9、SEQ ID NO:43、SEQIDNO:47或SEQ ID NO:49基础上经过一个或多个氨基酸残基的取代、缺失或添加而形成的同功能衍生蛋白;
UGT85C2糖基转移酶具有SEQ ID NO:11所示的氨基酸序列,或在SEQ ID NO:11基础上经过一个或多个(如1-30个,较佳地1-20个,更佳地1-10个,更佳地1-5个)氨基酸残基的取代、缺失或添加而形成的同功能衍生蛋白;
UGT74G1糖基转移酶具有SEQ ID NO:13所示的氨基酸序列,或在SEQ ID NO:13基础上经过一个或多个(如1-30个,较佳地1-20个,更佳地1-10个,更佳地1-5个)氨基酸残基的取代、缺失或添加而形成的同功能衍生蛋白;
UGT76G1糖基转移酶具有SEQ ID NO:15所示的氨基酸序列,或在SEQ ID NO:15基础上经过一个或多个(如1-30个,较佳地1-20个,更佳地1-10个,更佳地1-5个)氨基酸残基的取代、缺失或添加而形成的同功能衍生蛋白;
所述的UGTB1糖基转移酶具有SEQ ID NO:41所示的氨基酸序列,或在SEQ IDNO:41基础上经过一个或多个(如1-30个,较佳地1-20个,更佳地1-10个,更佳地1-5个)氨基酸残基的取代、缺失或添加而形成的同功能衍生蛋白;
所述的IBGT糖基转移酶具有SEQ ID NO:51所示的氨基酸序列,或在SEQ IDNO:51基础上经过一个或多个(如1-30个,较佳地1-20个,更佳地1-10个,更佳地1-5个)氨基酸残基的取代、缺失或添加而形成的同功能衍生蛋白;或
所述的细胞色素P450氧化还原蛋白具有SEQ ID NO:17、SEQ ID NO:19、SEQID NO:33、SEQ ID NO:35或SEQ ID NO:39所示的氨基酸序列,或在SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:33、SEQ ID NO:35或SEQ ID NO:39基础上经过一个或多个(如1-30个,较佳地1-20个,更佳地1-10个,更佳地1-5个)氨基酸残基的取代、缺失或添加而形成同功能衍生蛋白。
在另一优选例中,所述的牻牛儿基牻牛儿基焦磷酸合成酶的编码基因具有SEQID NO:2或SEQ ID NO:46所示的核苷酸序列,或与SEQ ID NO:2或SEQ ID NO:46序列有70%以上(较佳地80%以上;更佳地90%以上;更佳的93%以上;更佳地95%以上;更佳的97%以上)相同性的编码同功能蛋白的核苷酸序列;
所述的古巴焦磷酸合成酶的编码基因具有SEQ ID NO:4或SEQ ID NO:26所示的核苷酸序列,或与SEQ ID NO:4或SEQ ID NO:26序列有70%以上(较佳地80%以上;更佳地90%以上;更佳的93%以上;更佳地95%以上;更佳的97%以上)相同性的编码同功能蛋白的核苷酸序列;
所述的贝壳烯合成酶的编码基因具有SEQ ID NO:6或SEQ ID NO:28所示的核苷酸序列,或与SEQ ID NO:6或SEQ ID NO:28序列有70%以上(较佳地80%以上;更佳地90%以上;更佳的93%以上;更佳地95%以上;更佳的97%以上)相同性的编码同功能蛋白的核苷酸序列;
所述的双功能贝壳烯合酶的编码基因具有SEQ ID NO:22或SEQ ID NO:24所示的核苷酸序列,或与SEQ ID NO:22或SEQ IDNO:24序列有50%以上(较佳地80%以上;更佳地90%以上;更佳的93%以上;更佳地95%以上;更佳的97%以上)相同性的编码同功能蛋白的核苷酸序列;
所述的贝壳烯氧化酶的编码基因具有SEQ ID NO:8、SEQ ID NO:32、SEQ ID NO:38或SEQ ID NO:30所示的核苷酸序列,或与SEQ ID NO:8、SEQ ID NO:32、SEQ IDNO:38或SEQ ID NO:30序列有70%以上(较佳地80%以上;更佳地90%以上;更佳的93%以上;更佳地95%以上;更佳的97%以上)相同性的编码同功能蛋白的核苷酸序列;
所述的贝壳烯酸-13α-羟化酶的编码基因具有SEQ ID NO:10、SEQ ID NO:44、SEQ ID NO:48或SEQ ID NO:50所示的核苷酸序列,或与SEQ ID NO:10、SEQ ID NO:44、SEQ ID NO:48或SEQ ID NO:50序列有70%以上(较佳地80%以上;更佳地90%以上;更佳的93%以上;更佳地95%以上;更佳的97%以上)相同性的编码同功能蛋白的核苷酸序列;
UGT85C2糖基转移酶的编码基因具有SEQ ID NO:12所示的核苷酸序列,或与SEQ ID NO:12序列有70%以上(较佳地80%以上;更佳地90%以上;更佳的93%以上;更佳地95%以上;更佳的97%以上)相同性的编码同功能蛋白的核苷酸序列;
UGT74G1糖基转移酶的编码基因具有SEQ ID NO:14所示的核苷酸序列,或与SEQ ID NO:14序列有70%以上(较佳地80%以上;更佳地90%以上;更佳的93%以上;更佳地95%以上;更佳的97%以上)相同性的编码同功能蛋白的核苷酸序列;
UGT76G1糖基转移酶的编码基因具有SEQ ID NO:16所示的核苷酸序列,或与SEQ ID NO:16序列有70%以上(较佳地80%以上;更佳地90%以上;更佳的93%以上;更佳地95%以上;更佳的97%以上)相同性的编码同功能蛋白的核苷酸序列;
所述的UGTB1糖基转移酶的编码基因具有SEQ ID NO:42所示的核苷酸序列,或与SEQ ID NO:42序列有50%以上(较佳地60%以上;较佳地70%以上;较佳地80%以上;更佳地90%以上;更佳的93%以上;更佳地95%以上;更佳的97%以上)相同性的编码同功能蛋白的核苷酸序列;
所述的IBGT糖基转移酶的编码基因具有SEQ ID NO:52所示的核苷酸序列,或与SEQ ID NO:42序列有50%以上(较佳地60%以上;较佳地70%以上;较佳地80%以上;更佳地90%以上;更佳的93%以上;更佳地95%以上;更佳的97%以上)相同性的编码同功能蛋白的核苷酸序列或
所述的细胞色素P450氧化还原蛋白的编码基因具有SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:34、SEQ ID NO:36或SEQ ID NO:40所示的核苷酸序列;或与SEQID NO:18、SEQ ID NO:20、SEQ ID NO:34、SEQ ID NO:36或SEQ ID NO:40序列有70%以上(较佳地80%以上;更佳地90%以上;更佳的93%以上;更佳地95%以上;更佳的97%以上)相同性的编码同功能蛋白的核苷酸序列。
在另一优选例中,所述的细胞选自(但不限于);原核微生物细胞,真核微生物细胞。
在另一优选例中,所述的原核微生物是(但不限于):大肠杆菌,枯草芽孢杆菌,醋酸杆菌、棒状杆菌、短杆菌;更佳地,所述大肠杆菌选自:BL21、BLR、DH10B、HMS、CD43、JM109、DH5α或Noveblue。
在另一优选例中,所述的真核微生物细胞是(但不限于):酵母菌、霉菌、担子菌;所述的酵母菌是(但不限于):毕赤酵母,酿酒酵母,乳酸克鲁维酵母。较佳地,所述的毕赤酵母选自GS115、MC100-3、SMD1163、SMD1165、SMD1168或KM71;较佳地,所述的酿酒酵母选自W303、CEN.PK2、S288c、FY834或S1949;较佳地,所述的乳酸克鲁维酵母选自GG799。
在另一优选例中,当所述的细胞为革兰氏阴性菌株,采用pET、pBAD和pQE系列表达载体(如pET28a和pET21c)来重组表达各酶;或当所述的细胞为酵母细胞,采用pPIC(如pPIC3.5)或pSY系列表达载体(如pSY01)来重组表达各酶。
在另一优选例中,所述的方法包括:将各(a)-(g)及可选地(h)-(i)各酶的编码基因插入到所述的重组表达载体中,构建基因表达盒,用于重组表达所述的酶。
在本发明的另一方面,提供一种用于合成甜菊糖苷类化合物的表达构建物(如表达载体),其中包括以下酶的基因表达盒:
(a)牻牛儿基牻牛儿基焦磷酸合成酶(GGPPS),
(b)选自以下(I)或(II)的酶:(I)古巴焦磷酸合成酶(CDPS)和贝壳烯合成酶(KS),(II)双功能贝壳烯合酶(CPS/KS),
(c)贝壳烯氧化酶(KO),
(d)细胞色素P450氧化还原蛋白(CPR),
(e)贝壳烯酸-13α-羟化酶,
(f)UGT85C2糖基转移酶,和
(g)UGTB1/IBGT糖基转移酶。
在另一优选例中,所述的用于合成甜菊糖苷类化合物的表达构建物还包括以下酶的基因表达盒:
(h)UGT74G1糖基转移酶,和/或
(i)UGT76G1糖基转移酶。
在本发明的另一方面,提供一种用于甜菊糖苷类化合物前体途径强化的表达构建物,其包括以下酶的基因表达盒:
1-脱氧木糖-5-磷酸合成酶(DXS),2-甲基赤藓糖-4-磷酸胞苷转移酶(CMS),2-甲基赤藓糖-2,4-环二磷酸合成酶(MCS)和异戊烯焦磷酸异构酶(IDI)。
在本发明的另一方面,提供一种用于合成甜菊糖苷类化合物的宿主细胞,其中包含所述的用于合成甜菊糖苷类化合物的表达构建物。
在另一优选例中,所述的用于合成甜菊糖苷类化合物的宿主细胞为非生殖材料及非繁殖材料。
在另一优选例中,所述的用于合成甜菊糖苷类化合物的细胞选自(但不限于);原核微生物细胞,真核微生物细胞。
在另一优选例中,所述的用于合成甜菊糖苷类化合物的宿主细胞中还包括所述的用于甜菊糖苷类化合物前体途径强化的表达构建物。
在本发明的另一方面,提供一种制备贝壳烯的方法,包括:在原核微生物细胞,真核微生物细胞中重组表达(较佳地,为异源表达):
(a)牻牛儿基牻牛儿基焦磷酸合成酶(GGPPS),和
(b)双功能贝壳烯合酶(CPS/KS)。
在另一优选例中,所述的牻牛儿基牻牛儿基焦磷酸合成酶来源于加拿大红豆杉或甜叶菊;或所述的双功能贝壳烯合酶来源于小立碗藓或藤仓赤霉。
在本发明的另一方面,提供一种用于制备贝壳烯的表达构建物,其中包括以下酶的基因表达盒:
(a)牻牛儿基牻牛儿基焦磷酸合成酶和
(b)双功能贝壳烯合酶。
在本发明的另一方面,提供一种用于制备贝壳烯的宿主细胞,其中包含所述的用于制备贝壳烯的表达构建物;和/或所述的用于甜菊糖苷类化合物前体途径强化的表达构建物。
在另一优选例中,所述的制备贝壳烯的宿主细胞是革兰氏阴性DE3溶源化菌株,酵母细胞。
在本发明的另一方面,提供UGTB1/IBGT糖基转移酶的用途,用于将甜菊醇单糖苷转化为甜菊醇双糖苷(较佳地,在甜菊醇单糖苷的C-13葡萄糖的C-2’位点上加上糖基)。
在本发明的另一方面,提供双功能贝壳烯合酶的用途,用于将香叶基香叶基焦磷酸转化为贝壳烯。
在本发明的另一方面,提供一种用于制备甜菊糖苷类化合物的酶的组合,所述组合包括:
(a)牻牛儿基牻牛儿基焦磷酸合成酶(GGPPS),
(b)选自以下(I)或(II)的酶:(I)古巴焦磷酸合成酶(CDPS)和贝壳烯合成酶(KS),(II)双功能贝壳烯合酶(CPS/KS),
(c)贝壳烯氧化酶(KO),
(d)细胞色素P450氧化还原蛋白(CPR),
(e)贝壳烯酸-13α-羟化酶,
(f)UGT85C2糖基转移酶,和
(g)UGTB1/IBGT糖基转移酶。
在另一优选例中,所述的酶的组合还包括:
(h)UGT74G1糖基转移酶,
(i)UGT76G1糖基转移酶。
在本发明的另一方面,提供一种用于制备甜菊糖苷类化合物的试剂盒,所述试剂盒中包括:所述的用于合成甜菊糖苷类化合物的表达构建物;更佳地还包括所述的用于甜菊糖苷类化合物前体途径强化的表达构建物;或
所述试剂盒中包括:所述的用于合成甜菊糖苷类化合物的宿主细胞。
在本发明的另一方面,提供一种用于制备贝壳烯的组合(如含有酶的试剂盒),所述组合包括:(a)牻牛儿基牻牛儿基焦磷酸合成酶(GGPPS),和(b)双功能贝壳烯合酶(CPS/KS)。
在另一优选例中,所述的用于制备贝壳烯的组合还包括:1-脱氧木酮糖-5-磷酸合成酶(DXS,1-deoxy-D-xylulose-5-phosphate synthase),2-甲基赤藓糖-4-磷酸胞苷转移酶(CMS,2-C-methyl-D-erythritol4-phosphate cytidylyltransferase),2-甲基赤藓糖-2,4-环二磷酸合成酶(MCS,2-C-methyl-D-erythritol2,4-cyclodiphosphate synthase)和异戊烯焦磷酸异构酶(IDI,isopentenyl-diphosphate delta-isomerase)。
在本发明的另一方面,提供一种用于制备贝壳烯的试剂盒,所述试剂盒中包括:所述的用于制备贝壳烯的表达构建物;更佳地还包括所述的用于甜菊糖苷类化合物前体途径强化的表达构建物;或所述试剂盒中包括:所述的用于制备贝壳烯的宿主细胞。
本发明的其它方面由于本文的公开内容,对本领域的技术人员而言是显而易见的。
具体实施方式
本发明人经过深入的研究,首次揭示了甜菊糖苷类化合物异源生物合成的关键酶,从而可实现甜菊糖苷类化合物的异源生物合成。
术语
如本文所用,所述的“甜菊糖苷类化合物”是指选自甜菊醇、甜菊醇单糖苷、甜菊醇双糖苷、甜菊糖苷、甜菊糖莱鲍迪苷A或甜菊糖莱鲍迪苷B的化合物。
如本文所用,所述的“基因表达盒”是指包含有表达目的多肽(本发明中为酶)所需的所有必要元件的基因表达系统,通常其包括以下元件:启动子、编码多肽的基因序列,终止子;此外还可选择性包括信号肽编码序列等;这些元件是操作性相连的。
如本文所用,所述的“可操作地连接(相连)”或“操作性连接(相连)”是指两个或多个核酸区域或核酸序列的功能性的空间排列。例如:启动子区被置于相对于目的基因核酸序列的特定位置,使得核酸序列的转录受到该启动子区域的引导,从而,启动子区域被“可操作地连接”到该核酸序列上。
如本文所用,所述的“表达构建物”是指重组DNA分子,它包含预期的核酸编码序列,其可以包含一个或多个基因表达盒。所述的“构建物”通常被包含在表达载体中。
如本文所用,所述的“异源”是指来自不同来源的两条或多条核酸或蛋白质序列之间的关系,获知来自不同来源的蛋白(或核酸)与宿主细胞之间的关系。例如,如果核酸与宿主细胞的组合通常不是天然存在的,则核酸对于该宿主细胞来说是异源的。特定序列对于其所插入的细胞或生物体来说是“异源的”。
合成途径的蛋白及其表达系统
本发明涉及甜菊糖苷类化合物合成过程中的牻牛儿基牻牛儿基焦磷酸合成酶、古巴焦磷酸合成酶、贝壳烯合成酶、双功能贝壳烯合酶(或可选地,古巴焦磷酸合成酶及贝壳烯合成酶)、贝壳烯氧化酶、贝壳烯酸-13α-羟化酶、UGT85C2糖基转移酶、UGT74G1糖基转移酶、UGT76G1糖基转移酶,UGTB1糖基转移酶,和细胞色素P450氧化还原蛋白。上述蛋白在细胞中的共同表达可实现甜菊糖苷类化合物的合成。较佳地,合成途径的上游,还涉及前体途径强化的酶,所述的前体途径强化的酶可以是任何可将中心代谢途径的丙酮酸(PYR)和3-磷酸甘油醛(G3P)前体转化为萜类合成通用前体异戊烯焦磷酸(IPP)和二甲基丙烯基焦磷酸(DMAPP)的酶;优选地,所述的前体途径强化的酶包括:1-脱氧木糖-5-磷酸合成酶(DXS),2-甲基赤藓糖-4-磷酸胞苷转移酶(CMS),2-甲基赤藓糖-2,4-环二磷酸合成酶(MCS)和异戊烯焦磷酸异构酶(IDI)。
本发明人还研究了不同来源的酶应用于合成中间产物贝壳烯及终产物甜菊糖类化合物的效率,获得了一系列具有较好的效果的酶。因此,作为本发明的优选方式,所述的牻牛儿基牻牛儿基焦磷酸合成酶来源于加拿大红豆杉或甜叶菊(更优选地,来源于加拿大红豆杉);所述的古巴焦磷酸合成酶来源于甜叶菊或慢生大豆根瘤菌(更优选地,来源于甜叶菊);所述的贝壳烯合成酶来源于甜叶菊或慢生大豆根瘤菌(优选地,来源于甜叶菊)(更优选地,来源于甜叶菊);所述的双功能贝壳烯合酶来源于小立碗藓或藤仓赤霉(更优选地,来源于小立碗藓);所述的贝壳烯氧化酶来源于甜叶菊、藤仓赤霉、阿拉伯芥或慢生大豆根瘤菌(更优选地,来源于甜叶菊);所述的贝壳烯酸-13α-羟化酶、UGT85C2糖基转移酶、UGT74G1糖基转移酶、UGT76G1糖基转移酶来源于甜叶菊;所述的UGTB1糖基转移酶来源于斯塔摩酵母;所述的IBGT糖基转移酶来源于甘薯;或所述的细胞色素P450氧化还原蛋白来源于黄花蒿,暗球腔菌,藤仓赤霉,甜叶菊或阿拉伯芥(更优选地,来源于暗球腔菌)。作为本发明的更优选方式,采用双功能贝壳烯合酶;且,所述的牻牛儿基牻牛儿基焦磷酸合成酶来源于加拿大红豆杉,所述的双功能贝壳烯合酶来源于小立碗藓,所述的贝壳烯氧化酶、贝壳烯酸-13α-羟化酶、UGT85C2糖基转移酶、UGT74G1糖基转移酶、UGT76G1糖基转移酶来源于甜叶菊;所述的UGTB1糖基转移酶来源于斯塔摩酵母;所述的细胞色素P450氧化还原蛋白来源于暗球腔菌。
作为本发明的更优选方式,所述的来源于加拿大红豆杉的牻牛儿基牻牛儿基焦磷酸合成酶,在野生型的基础上去除了N端的质体转运肽序列;较佳地,去除了N端98个氨基酸。所述的来源于黄花蒿的细胞色素P450氧化还原蛋白,在野生型基础上去除了N端跨膜区序列;较佳地,去除了N端66个氨基酸。
在本发明中,上述的酶或蛋白可以是天然存在的,比如其可被分离或纯化自动植物或微生物。此外,所述的酶或蛋白也可以是人工制备的,比如可以根据常规的基因工程重组技术来生产重组酶或蛋白。优选的,本发明可采用重组的酶或蛋白。
任何适合的酶或蛋白均可用于本发明。所述的酶或蛋白包括全长的酶或蛋白或其生物活性片段(或称为活性片段),在本发明中具有CDPS和KS双功能酶的CPS/KS的活性片段为YDTAWXA、DXDD和DDXXD,或YDTAWXA、DXDD和DEXXE,UGTB1糖基转移酶的活性片段为GHVGP和NGGYGG。经过一个或多个氨基酸残基的取代、缺失或添加而形成的酶或蛋白的氨基酸序列也包括在本发明中。酶或蛋白的生物活性片段的含义是指作为一种多肽,其仍然能保持全长的酶或蛋白的全部或部分功能。通常情况下,所述的生物活性片段至少保持50%的全长酶或蛋白的活性。在更优选的条件下,所述活性片段能够保持全长酶或蛋白的55%、60%、65%、70%、75%、80%、85%、90%、95%、97%、99%、或100%的活性。酶或蛋白或其生物活性片段包括一部分保守氨基酸的替代序列,所述经氨基酸替换的序列并不影响其活性或保留了其部分的活性。适当替换氨基酸是本领域公知的技术,所述技术可以很容易地被实施,并且确保不改变所得分子的生物活性。这些技术使本领域人员认识到,一般来说,在一种多肽的非必要区域改变单个氨基酸基本上不会改变生物活性。见Watson等Molecular Biology of The Gene,第四版,1987,The Benjamin/Cummings Pub.Co.P224。
本发明也可采用经修饰或改良的酶或蛋白,比如,可采用为了促进其半衰期、有效性、代谢和/或蛋白的效力而加以修饰或改良的酶或蛋白。所述经过修饰或改良的酶或蛋白可以是一种共轭物,或其可包含被取代的或人工的氨基酸。所述经过修饰或改良的酶或蛋白可以是与天然存在的酶或蛋白具有较小的共同点,但也能发挥与野生型相同或基本相同的功能,且不会带来其它不良影响。也就是说,任何不影响酶或蛋白的生物活性的变化形式都可应用于本发明中。
本发明还包括了编码所述的酶或蛋白的生物活性片段的分离的核酸,也可以是其互补链。作为本发明的优选方式,可对各酶或蛋白的编码序列进行密码子优化,以提高表达效率。编码酶或蛋白的生物活性片段的DNA序列,可以全序列人工合成,也可用PCR扩增的方法获得。在获得了编码所述的酶或蛋白的生物活性片段的DNA序列之后,将其连入合适的表达构建物(如表达载体)中,再转入合适的宿主细胞。最后通过培养转化后的宿主细胞,得到所要的蛋白。
本发明还包括了包含编码所述酶或蛋白的生物活性片段的核酸分子的表达构建物。所述的表达构建物可包括一个或多个编码所述酶或蛋白的基因表达盒,还可包含与所述核酸分子的序列操作性相连的表达调控序列,以便于蛋白的表达。所述的表达调控序列的设计是本领域公知的。表达调控序列中,根据不同的需要,可以应用诱导型或组成型的启动子,诱导型的启动子可实现更可控的蛋白表达以及化合物生产,有利于工业化应用。
作为本发明的优选方式,提供了一种表达构建物,其包括以下酶的基因表达盒:牻牛儿基牻牛儿基焦磷酸合成酶(GGPPS),选自(I)古巴焦磷酸合成酶(CDPS)和贝壳烯合成酶(KS)或(II)双功能贝壳烯合酶(CPS/KS)的酶,贝壳烯氧化酶(KO),细胞色素P450氧化还原蛋白(CPR),贝壳烯酸-13α-羟化酶,UGT85C2糖基转移酶和UGTB1/IBGT糖基转移酶。更优选的,所述的表达构建物还包括以下酶的基因表达盒:UGT74G1糖基转移酶和/或UGT76G1糖基转移酶。
表达构建物的建立目前已经是本领域技术人员熟悉的技术。因此,在得知了所需选择的酶或蛋白之后,本领域技术人员易于进行表达构建物的建立。编码酶或蛋白的基因序列可以被插入到不同的表达构建物(如表达载体)中,也可以被插入到同一表达构建物中,只要在转入到细胞后酶或蛋白能够被有效地表达即可。
此外,含有编码所述酶或蛋白的生物活性片段核酸序列的重组细胞也包括在本发明中。“宿主细胞”包括原核细胞和真核细胞。常用的原核宿主细胞包括大肠杆菌、枯草杆菌等;常用的真核宿主细胞包括酵母细胞、昆虫细胞和哺乳动物细胞。作为本发明的优选方式,所述的细胞选自(但不限于);革兰氏阴性DE3溶源化菌株,酵母细胞。更优选地,所述的革兰氏阴性菌DE3溶源化菌株是(但不限于):大肠杆菌,枯草芽孢杆菌;更佳地,所述大肠杆菌选自:BL21(DE3)、BLR(DE3)、DH10B(DE3)、HMS(DE3)、CD43(DE3)、JM109(DE3)、DH5α(DE3)或Noveblue(DE3)。更优选地,所述的酵母细胞是(但不限于):毕赤酵母,酿酒酵母,乳酸克鲁维酵母。较佳地,所述的毕赤酵母选自GS115、MC100-3、SMD1163、SMD1165、SMD1168或KM71;较佳地,所述的酿酒酵母选自W303、CEN.PK2、S288c、FY834或S1949;较佳地,所述的乳酸克鲁维酵母选自GG799。
针对细菌细胞或真菌细胞,本领域已知适合的表达载体是哪些,因此人们易于选择到合适的表达载体作为克隆编码基因的骨架载体,例如,当所述的细胞为细菌细胞时,采用pET系列表达载体(如pET28a)来重组表达各酶;当所述的细胞为酵母细胞,采用pPICC(如pPICC3.5)或pSY系列表达载体(如pSY01)。
用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物如大肠杆菌时,能吸收DNA的感受态细胞可在指数生长期后收获,用例如CaCl2或MgCl2等方法处理,所用的步骤在本领域众所周知。如果需要,转化也可用电穿孔的方法进行。当宿主是真核生物,可选用如下的DNA转染方法:磷酸钙共沉淀法,常规机械方法如显微注射、电穿孔、脂质体包装等。
获得的转化子可以用常规方法培养,表达本发明的基因所编码的酶或蛋白。根据所用的宿主细胞,培养中所用的培养基可选自各种常规培养基。在适于宿主细胞生长的条件下进行培养。
合成甜菊糖苷类化合物的方法
本发明公开一种利用微生物异源合成生产甜菊糖苷类化合物的方法。利用合成生物学技术将不同来源的与甜菊糖苷类化合物生物合成相关的酶进行人工组合,在底盘细胞中获得甜菊糖苷类化合物(含莱鲍迪苷A)。
本发明的合成甜菊糖苷类化合物的生物合成过程参见图2。以中心代谢途径的丙酮酸(PYR)和3-磷酸甘油醛(G3P)为前体,获得萜类合成的通用前体异戊烯焦磷酸(IPP)和二甲基丙烯基焦磷酸(DMAPP)开始,依次经过牻牛儿基牻牛儿基焦磷酸(GGPPS,ggpps基因编码),古巴焦磷酸合酶(CDPS,cdps基因编码),贝壳烯合酶(KS,ks基因编码)形成贝壳烯(更佳地,以双功能贝壳烯合酶(CPS/KS,cps/ks基因编码)取代CDPS和KS),随后细胞色素P450氧化蛋白贝壳烯氧化酶(KO,ko基因编码)催化贝壳烯形成贝壳烯酸,并进一步被贝壳烯酸羟化酶(KAH,kah基因编码)氧化形成二萜母核甜菊醇。甜菊醇经UGT85C2糖基转移酶作用,得到甜菊醇单糖苷,又经一步糖基化反应,得到甜菊醇双糖苷。甜菊醇双糖苷在UGT74G1糖基转移酶作用,得到甜菊糖苷,最终经UGT76G1糖基转移酶作用,形成甜菊糖莱鲍迪苷A。
本发明人第一次应用上述的一系列酶成功实现了甜菊糖苷类化合物的异源生物合成,特别是将UGTB1/IBGT一类糖基转移酶用于将甜菊醇单糖苷转化为甜菊醇双糖苷(其能在甜菊醇单糖苷的C-13葡萄糖的C-2’位点上加上糖基),克服了现有技术中无法将甜菊醇单糖苷转化为甜菊糖双糖苷的技术问题。对于甜菊糖苷类化合物的生物合成中从甜菊醇单糖苷经一步糖基化反应得到甜菊醇双糖苷这一步骤所需要的糖基转移酶在现有技术中是未知的;而本发明人经过深入的研究,筛选了大量的糖基转移酶基因,最终发现UGTB1或IBGT糖基转移酶可以实现在底物的C-13葡萄糖的C-2’位点上进一步糖基化。
合适的UGTB1/IBGT类糖基转移酶可以发挥尿苷-5’-二磷酸葡糖基:甜菊醇-13-O-葡萄糖苷转移酶(又被称为甜菊醇-13-单葡萄糖苷1,2-葡糖基化酶)的作用,给受体分子甜菊醇-13-O-葡萄糖苷中13-O-葡萄糖的C-2’转移上葡萄糖部分。
一般来说,合适的UGTB1/IBGT类糖基转移酶还可以发挥尿苷-5’-二磷酸葡糖基:甜茶素转移酶的作用,给受体分子甜茶素(Rubusoside)中13-O-葡萄糖的C-2’转移上葡萄糖部分。
合适的UGTB1/IBGT类糖基转移酶还可以催化利用除了甜菊醇-13-O-葡萄糖苷和甜茶素以外的甜菊糖苷底物的反应,例如可以利用甜菊糖苷(Stevioside)作为底物,将葡萄糖部分转移到19-O-葡萄糖残基的C-2’上从而产生莱鲍迪苷E。还可以利用莱鲍迪苷A作为底物,将葡萄糖部分转移到19-O-葡萄糖残基的C-2’上从而产生莱鲍迪苷D。但是,UGTB1/IBGT类糖基转移酶一般不会给在C-13位置具有1,3-结合的葡萄糖的甜菊醇化合物转移葡萄糖部分,即不会发生葡萄糖部分到甜菊醇1,3-二糖苷和1,3-甜菊苷的转移。
合适的UGTB1/IBGT类糖基转移酶可以转移来自除了尿苷二磷酸葡糖以外的糖部分。例如,合适的UGTB1/IBGT类糖基转移酶可以发挥尿苷5’-二磷酸D-木糖基:甜菊醇-13-O-葡萄糖苷转移酶的作用,将木糖部分转移到受体分子甜菊醇-13-O-葡萄糖苷中13-O-葡萄糖的C-2’。另一个例子,合适的UGTB1/IBGT类糖基转移酶可以发挥尿苷5’-二磷酸L-鼠李糖基:甜菊醇-13-O-葡萄糖苷转移酶的作用,将鼠李糖部分转移到受体分子甜菊醇-13-O-葡萄糖苷中13-O-葡萄糖的C-2’。
获得萜类合成的通用前体IPP和DMAPP,可以采用本领域技术人员已知的技术。作为本发明的优选方式,为了获得IPP和DMAPP,相对于现有技术中还应用dxr、ispE、ispG、ispH等基因的技术方案,本发明人进行了简化,以中心代谢途径的丙酮酸(PYR)和3-磷酸甘油醛(G3P)为前体,萜类合成的通用前体异戊烯焦磷酸(IPP)和二甲基丙烯基焦磷酸(DMAPP)在1-去氧木糖-5-磷酸途径的作用下,依次经过1-脱氧木糖-5-磷酸合成酶(DXS,dxs基因编码),2-甲基赤藓糖-4-磷酸胞苷转移酶(CMS,ispD基因编码),2-甲基赤藓糖-2,4-环二磷酸合成酶(MCS,ispF基因编码)的催化合成。IPP和DMAPP在异戊烯焦磷酸异构酶(编码基因idi)作用下可以相互转化。
合成贝壳烯的方法
甜菊糖苷类化合物是以二萜类化合物贝壳烯为骨架的反应产物。贝壳烯作为一种主要的中间产物,其生成效率的提高将有利于下游甜菊糖苷类化合物的高效合成。
为了提高贝壳烯合成效率的方法,本发明人通过反复实验,最终发现采用双功能贝壳烯合酶(CPS/KS)取代古巴焦磷酸合成酶(CDPS)及贝壳烯合成酶(KS),CPS/KS是具有CDPS和KS的双功能酶,能够显著地提高贝壳烯合成效率。
本发明的有益效果
利用本发明的方法,关键中间产物贝壳烯产量能达到1g/L以上,莱鲍迪苷A达到10mg/L以上。该方法可替代植物提取法获得甜菊糖苷类化合物、特别是具有巨大市场价值的莱鲍迪苷A,具有广阔的应用前景和发展潜力。
本发明的方法克服了传统从植物中提取时繁琐,受环境影响大,破坏自然资源等缺点,具有成本低,占地面积少,产品质量可控等优点。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如J.萨姆布鲁克等编著,分子克隆实验指南,第3版,科学出版社,2002中所述的条件,或按照制造厂商所建议的条件。除非另外说明,否则百分比和份数按重量计算。
实施例1、甜菊糖苷类化合物化合物异源合成途径中所用的蛋白的获得
甜菊糖苷类化合物莱鲍迪苷A异源合成途径中所用的牻牛儿基牻牛儿基焦磷酸合成酶、古巴焦磷酸合成酶、贝壳烯合成酶、双功能贝壳烯合酶、贝壳烯氧化酶、贝壳烯酸-13α-羟化酶、UGT85C2糖基转移酶、UGTB1糖基转移酶、UGT74G1糖基转移酶、UGT76G1糖基转移酶及细胞色素P450氧化还原蛋白的基因来源与合成。
首先从美国国立生物信息学数据库(NCBI)中选取了来源于加拿大红豆杉(Taxuscanadensis)和甜叶菊(Stevia rebaudiana)的牻牛儿基牻牛儿基焦磷酸合成酶(GGPPS),来源于甜叶菊(Stevia rebaudiana)和慢生大豆根瘤菌(Bradyrhizobium japonicum)的古巴焦磷酸合成酶(CDPS),来源于甜叶菊(Stevia rebaudiana)和慢生大豆根瘤菌(Bradyrhizobium japonicum)的贝壳烯合成酶(KS),来源于小立碗藓(Physcomitrellapatens)和藤仓赤霉(Gibberella fujikuroi)的双功能贝壳烯合酶(CPS/KS),来源于甜叶菊(Stevia rebaudiana)、阿拉伯芥(Arabidopsis thaliana)、藤仓赤霉(Gibberella fujikuroi)和慢生大豆根瘤菌(Bradyrhizobium japonicum)的贝壳烯氧化酶(KO),来源于甜叶菊(Stevia rebaudiana)的贝壳烯酸-13-羟化酶(KAH)、UGT85C2糖基转移酶、UGT74G1糖基转移酶、UGT76G1糖基转移酶,来源于斯塔摩酵母(Starmerella bombicola)UGTB1糖基转移酶,来源于甘薯(Ipomoea batatas)IBGT糖基转移酶,以及来源于黄花蒿(Artemisia annua)、暗球腔菌(Phaeosphaeria sp.L487)、甜叶菊(Stevia rebaudiana)、阿拉伯芥(Arabidopsis thaliana)和藤仓赤霉(Gibberella fujikuroi)的细胞色素P450氧化还原蛋白,所选取酶的信息如表2。
表2、异源途径构建中所涉及的基因
通过本领域公知的密码子优化方法,如Optimizer(http://genomes.urv.es/OPTIMIZER/),优化了所选取的酶的编码序列,并进行了合成,具体情况如下:
所用的来源于加拿大红豆杉的牻牛儿基牻牛儿基焦磷酸合成酶的氨基酸序列见SEQID NO:1,去除了野生型GGPP合成酶N端98个氨基酸(质体转运肽),然后加上甲硫氨酸,获得改造后的重组GGPP合成酶,然后进行密码子优化,优化后的DNA序列见SEQID NO:2。
来源于甜叶菊的古巴焦磷酸合成酶(CDPS)的氨基酸序列见SEQ ID NO:3,经密码子优化后的DNA序列见SEQ ID NO:4。
来源于甜叶菊的贝壳烯合成酶(KS)的氨基酸序列见SEQ ID NO:5,经密码子优化后的DNA序列见SEQ ID NO:6。
来源于甜叶菊的贝壳烯氧化酶(KO)的氨基酸序列见SEQ ID NO:7,经密码子优化后的DNA序列见SEQ ID NO:8。
来源于甜叶菊的贝壳烯酸-13α-羟化酶(KAH)的氨基酸序列见SEQ ID NO:9,经密码子优化后的DNA序列,见SEQ ID NO:10。
来源于甜叶菊的UGT85C2糖基转移酶的氨基酸序列见SEQ ID NO:11,经密码子优化后的DNA序列见SEQ ID NO:12。
来源于甜叶菊的UGT74G1糖基转移酶的氨基酸序列见SEQ ID NO:13,经密码子优化后的DNA序列见SEQ ID NO:14。
来源于甜叶菊的UGT76G1糖基转移酶的氨基酸序列见SEQ ID NO:15,经优化后的DNA序列见SEQ ID NO:16。
来源于黄花蒿的细胞色素P450氧化还原蛋白(CPR)的氨基酸序列见SEQ ID NO:17,切除了野生型CPR蛋白N端跨膜序列区的66个氨基酸,然后加上热带假丝酵母(C.tropicalis)的CPR蛋白(AAU10466)N端序列,最终获得本发明中改造的CPR蛋白,经密码子优化后的DNA序列见SEQ ID NO:18。
来源暗球腔菌的细胞色素P450氧化还原蛋白的氨基酸序列见SEQ ID NO:19,经密码子优化后的DNA序列见SEQ ID NO:20。
来源小立碗藓的双功能贝壳烯合酶(CPS/KS)的氨基酸序列见SEQ NO:21,经密码子优化后的DNA序列,见SEQ NO:22。
来源藤仓赤霉的双功能贝壳烯合酶(CPS/KS)的氨基酸序列见SEQ NO:23,经密码子优化后的DNA序列,见SEQ NO:24。
来源慢生大豆根瘤菌的古巴焦磷酸合成酶的氨基酸序列见SEQ ID NO:25,经密码子优化后的DNA序列,见SEQ ID NO:26。
来源慢生大豆根瘤菌的贝壳烯合成酶的氨基酸序列见SEQ ID NO:27,经密码子优化后的DNA序列,见SEQ ID NO:28。
来源慢生大豆根瘤菌的贝壳烯氧化酶的氨基酸序列见SEQ ID NO:29,经密码子优化后的DNA序列见SEQ ID NO:30。
来源藤仓赤霉的贝壳烯氧化酶的氨基酸序列见SEQ ID NO:31,经密码子优化后的DNA序列见SEQ ID NO:32。
来源藤仓赤霉的细胞色素P450氧化还原蛋白的氨基酸序列见SEQ ID NO:33,经密码子优化后的DNA序列见SEQ ID NO:34。
来源甜叶菊的细胞色素P450氧化还原蛋白的氨基酸序列见SEQ ID NO:35,经密码子优化后的DNA序列见SEQ ID NO:36。
来源阿拉伯芥的贝壳烯氧化酶的氨基酸序列见SEQ ID NO:37,经密码子优化后的DNA序列见SEQ ID NO:38。
来源阿拉伯芥的细胞色素P450氧化还原蛋白的氨基酸序列见SEQ ID NO:39,经密码子优化后的DNA序列,见SEQ ID NO:40。
来源于斯塔摩酵母的糖基转移酶UGTB1基因的氨基酸序列见SEQ ID NO:41,经密码子优化后的DNA序列见SEQ ID NO:42。
来源于甜叶菊的贝壳烯酸-13α-羟化酶(KAH)的氨基酸序列见SEQ ID NO:43,经优化的DNA序列见SEQ ID NO:44。
来源于甜叶菊的牻牛儿基牻牛儿基焦磷酸合成酶(GGPP)的氨基酸序列见SEQ IDNO:45,经优化后的DNA序列见SEQ ID NO:46。
来源于阿拉伯芥的贝壳烯酸-13α-羟化酶(Genbank号:AED93376.1)的氨基酸序列见SEQ NO:47,经密码子优化后的DNA序列见SEQ NO:48。
来源于阿拉伯芥的贝壳烯酸-13α-羟化酶(Genbank号:AED93377.1)的氨基酸序列见SEQ NO:49,经密码子优化后的DNA序列见SEQ NO:50。
来源于甘薯的糖基转移酶(Genbank号:ABL74480.1)的氨基酸序列见SEQ NO:51,经密码子优化后的DNA序列见SEQ NO:52。
其他蛋白可由相同方法得到优化的DNA序列。
进一步地,本发明人分析了不同来源的经鉴定发现为同功能蛋白的序列同源性,结果如表3。
表3、不同来源氨基酸序列同源性分析
从表3中可知,不同来源的相同功能蛋白氨基酸序列同源性较低。例如从甜菊来源的CDPS分别与小立碗藓和藤仓赤霉来源的具有CDPS和KS双功能酶的CPS/KS最高同源性仅有50%和58%。从甜菊来源的KS分别与小立碗藓和藤仓赤霉来源的具有CDPS和KS双功能酶的CPS/KS最高同源性仅有36%和64%。另外,从斯塔摩酵母来源的UGTB1糖基转移酶与从甜菊来源的UGT85C2糖基转移酶、UGT74G1糖基转移酶和UGT76G1糖基转移酶的同源性也仅有33%、83%和45%。
几种真菌来源的CPS/KS同源度较高,小立碗藓来源的CPS/KS同源度相对较低,但它们都含有富含天冬氨酸的区域,是具有CPS和KS两个酶活性的片段,其中CPS活性片段为从YDTAWXA开始,具有DXDD的N端序列,KS活性片段为具有DDXXD或DEXXE的C端序列,X为任意氨基酸。UGTB1的活性片段是位于氨基酸序列16位到20位的GHVGP和338位到343位NGGYGG。
实施例2、原核表达载体的构建
将实施例1优化所得的牻牛儿基牻牛儿基焦磷酸合成酶、古巴焦磷酸合成酶、贝壳烯合成酶、双功能贝壳烯合酶、贝壳烯氧化酶、贝壳烯酸-13α-羟化酶、UGT85C2糖基转移酶、UGT74G1糖基转移酶、UGT76G1糖基转移酶及细胞色素P450氧化还原蛋白的相关基因克隆到相应的质粒上,进行细菌莱鲍迪苷A合成途径基因表达载体的构建。
在优化后的ggpps基因的终止密码子TAA后加入SpeI酶切位点,然后将其克隆到质粒pET28a(购自Novagen)的NcoI/HindIII酶切位点上,得到pET28a-ggpps(图3A)。
在优化后的cdps,cps/ks,ks,ko,kah,ugt85c2,ugtb1,ugt74g1,ugt76g1的9个基因的终止密码子TAA后面分别加入SpeI位点,然后将这些基因分别克隆到质粒pET21a(购自Novagen)的NdeI/BamHI位点上,分别得到质粒pET21a-cdps,pET21a-cps/ks,pET21a-ks,pET21a-ko,pET21a-kah,pET21a-ugt85c2,pET21a-ugtb1,pET21a-ugt74g1,pET21a-ugt76g1(图3B),图3b中的Inserted gene为cdps,cps/ks,ks,ko,kah,ugt85c2,ugtb1,ugt74g1,ugt76g1九个基因单独克隆的质粒插入位点(NdeI/HindIII)。
在优化后的cpr基因的终止密码子TAA后加入SpeI位点,然后将其克隆到质粒pET21d(购自Novagen)的NcoI/HindIII位点上,得到质粒pET21d-cpr(图3C)。
作为举例,质粒pZQ110构建如下:采用了类似New England Biolab公司的BioBrick Assembly Kit试剂盒提供的方法,进行异源途径基因的串联组装;即首先用SpeI/HindIII双酶切质粒pET28a-ggpps(加拿大红豆杉来源),用XbaI/HindIII酶切质粒pET21a-cps/ks(小立碗藓),分别用PCR清洁试剂盒直接回收pET28a-ggpps载体和胶回收cps/ksDNA片段;然后用T4DNA连接酶将pET28a-ggpps载体和cps/ksDNA片段进行连接,构建质粒pET28a-ggpps-cps/ks。采用相同的方法用再将ko(甜叶菊来源)、kah(甜叶菊来源)、ugt85c2(甜叶菊来源)、ugtb1(斯塔摩酵母来源)、ugt74g1(甜叶菊来源)、ugt76g1(甜叶菊来源)及cpr(暗球腔菌来源)逐步串联,最终获得细菌莱鲍迪苷A合成基因表达质粒pZQ110载体(图3E)。该表达质粒的酶切(XbaI/HindIII双酶酶切)验证图谱如图3F所示,其中M1为Marker1,分子量为DS15000;1为阴性对照产物;2-4为pZQ110产物;M2为Marker2,分子量为DS5000。从图3F可以看出,质粒pZQ110用XbaI/HindIII双酶切后得到两条大小分别为5300/16500左右的条带,可以得出pZQ110构建正确。
基于与质粒pZQ110类似的方法,本发明人还构建了一些用于表达中间体或产物的重组表达质粒,如表4。
表4、细菌鲍迪苷A合成途径基因表达质粒信息
实施例3、真菌表达载体的构建
将实施例1优化所得的牻牛儿基牻牛儿基焦磷酸合成酶、古巴焦磷酸合成酶、贝壳烯合成酶、双功能贝壳烯合酶、贝壳烯氧化酶、贝壳烯酸-13α-羟化酶、UGT85C2糖基转移酶、UGTB1糖基转移酶、UGT74G1糖基转移酶、UGT76G1糖基转移酶及细胞色素P450氧化还原蛋白的相关基因克隆到相应的质粒上,进行真菌莱鲍迪苷A合成基因表达质粒的构建。
首先将原始的pAO815载体(购自Invitrogen)进行改造,采用定点突变PCR在pAO815的终止子后引入BamHI和XhoI酶切位点,改造后的pAO815命名为pSY01。通过定点突变PCR将pET28a-ggpps基因内的BamHI位点去掉。通过定点突变PCR将pET21a-ks基因内的BglII位点去掉。
以pET28a-ggpps为模板,通过PCR扩增ggpps基因,在两端分别引入EcoRI酶切位点(ATG前面加入4个A碱基),用EcoRI酶切该PCR片段,同时用EcoRI酶切载体pSY01,用清洁试剂盒直接回收pSY01载体和ggpps片段;然后用T4DNA连接酶将pSY01载体和ggpps片段进行连接,构建质粒pSY01-ggpps。
以pET21a-cdps为模板,通过PCR扩增cdps基因(红豆杉来源),在两端分别引入BglII和NotI酶切位点(ATG前面加入4个A碱基),用BglII和NotI酶切该PCR片段,同时用BamHI和NotI双酶切载体pPIC3.5K(购自Invitrogen),用清洁试剂盒直接回收pPIC3.5K载体和cdps片段,然后用T4DNA连接酶将pPIC3.5K载体和cdps片段进行连接,构建质粒pPIC3.5K-cdps。采用相同的方法用分别将cps/ks、ks、ko、kah、ugt85c2、ugt74g1、ugt76g1及cpr构建到pPIC3.5K上(图中Inserted gene位置)。
以pPIC3.5K-cps/ks为模板进行PCR,扩增出5’AOX-cps/ks-TT,两端分别引入BglII和XhoI酶切位点,用BglII和XhoI酶切该PCR片段,同时用BamHI和XhoI双酶切载体pSY01-ggpps,用清洁试剂盒直接回收pSY01-ggpps载体和5’AOX-cps/ks-TT片段,然后用T4DNA连接酶将pSY01-ggpps载体和5’AOX-cps/ks-TT片段进行连接,构建质粒。采用相同的方法用再将cps/ks(小立碗藓来源)、ko(甜叶菊来源)、kah(甜叶菊来源)、ugt85c2(甜叶菊来源)、ugtb1(斯塔摩酵母来源)、ugt74g1(甜叶菊来源)、ugt76g1(甜叶菊来源)及cpr(暗球腔菌来源)逐步串联,最终获得表达质粒pSY210(图3G)。质粒pSY210的PCR验证图谱如图3I所示,其中M1为Marker,分子量为DS2000;1为阳性对照产物;2和3为pSY210产物。从图3I可以看出,质粒pSY210用特异性针对全长UGT74G1糖基转移酶编码基因的引物做PCR验证,得到一条大小约1383bp的条带,可见pSY210构建正确。
基于与构建质粒pZQ210类似的方法,本发明人还构建了一些用于表达中间体或产物的重组表达质粒,如表5。
表5、真菌鲍迪苷A合成途径基因表达质粒信息
实施例4、各基因在大肠杆菌中的表达状况
将实施例2所得的质粒pET21a-cdps,pET21a-ks,pET21a-ko,pET21a-kah,pET21a-ugt85c2,pET21a-ugt74g1,pET21a-ugt76g1分别转化宿主细胞BL21(DE3)。
分别挑取各单克隆到2ml的LB培养基中(100mg/L氨苄青霉素),37℃培养过夜,然后以1%(v/v)的接种量转接到2ml加有相同抗生素的新鲜LB培养基中,37℃培养至OD600为0.3-0.4,加入IPTG至终浓度为0.1mM后,18℃诱导表达6h,然后将各发酵液进行SDS-PAGE分析。
结果如图4A、图4B、图4C、图4D及图4E所示,从图4A中可以看出基因cdps,ugt85C2明显表达,从图4B中可以看出基因ko和ks明显表达,从图4C中可以看出基因kah明显表达,从图4D中可以看出基因ugt74g1有较少表达,从图4E中可以看出基因ugt76g1明显表达。
实施例5、载体的转化及原核表达
将实施例2所得的各用于莱鲍迪苷A或其中间体合成的基因表达质粒和前体途径强化表达质粒pJF47(图3D)共同转化宿主细胞E.coli BL21(DE3),得到转化有莱鲍迪苷A或其中间体合成的基因表达质粒和pJF47的重组大肠杆菌E.coli BL21(DE3)。
首先提取E.coliMG1655的基因组,然后下表引物PCR扩增各基因,分别克隆到质粒pET21d的NcoI/EcoRI位点上。然后用SpeI/EcoRI酶切pET21c-ispF,XbaI/EcoRI酶切pET21d-idi,回收pET21c-ispF载体和idi基因片段,将两者连接,构建质粒pET21d-ispF-idi;接着将SpeI/EcoRI酶切pET21c-ispD,用XbaI/EcoRI酶切pET21d-ispF-idi,回收pET21c-ispD载体和ispF-idi基因片段,连接构建pET21d-ispD-ispF-idi;再将SpeI/EcoRI酶切pET21d-dxs,用XbaI/EcoRI酶切pET21d-ispD-ispF-idi,回收pET21d-dxs载体和ispD-ispF-idi基因片段,连接构建质粒pET21d-dxs-ispD-ispF-idi,命名为pJF47。
然后挑取单克隆至含有氨苄青霉素(100mg/L)和卡那霉素(50mg/L)的LB液体培养基中,37℃培养8h后,离心收集菌体,加入10%(v/v)的甘油制备种子液,-80℃保存。
以5%(v/v)的接种量接入装有10ml M9培养基(购自上海生工)(含100mg/L氨苄青霉素,50mg/L卡那霉素)的100ml摇瓶中,37℃培养至OD约为0.4后,加入0.05mMIPTG诱导培养,然后22℃培养5天后,收集发酵液,-80℃冷冻保存。
实施例6、实施例5制备的部分合成甜菊糖中间产物贝壳烯的重组细胞的贝壳烯产物检测
进行实施例5所得的含有莱鲍迪苷A或其中间体合成基因的表达质粒和前体途径强化表达质粒pJF47的重组大肠杆菌E.coli BL21(DE3)发酵生产,进行贝壳烯的检测。
取1ml实施例5所得的发酵液,加入50ul2M的HCl,然后加入等体积的乙酸乙酯,冰浴超声1min,然后室温下漩涡震荡20min,12000rpm离心1min,使有机相分层,吸取有机相,残留的水相再用等体积乙酸乙酯萃取1次,合并有机相后,获得经萃取的产物(含贝壳烯),用GC-MS直接检测贝壳烯。
贝壳烯的GC-MS检测条件:采用Agilent7890-5975GC MS系统。柱子为HP-5MS,载气为氦气,流速1ml/min。进样量5ul,不分流,进样温度250℃。柱子升温程序为:100℃保持2min,以5℃/min升温至250℃,然后250℃保持15min。溶剂延迟4.50min。扫描方式:选择离子扫描(m/z272)。解离电压为70eV。
检测贝壳烯的质谱图结果见图5A,贝壳烯的出峰时间为11.212min。各载体转化E.coli BL21(DE3)获得的重组菌株的贝壳烯产量见图5B和表6。
表6、实施例6和实施例8所得的部分发酵液中的贝壳烯产量
由表6结果可见,除空载体pET28a外,贝壳烯产量最低的是采用pZQ3(GGPP是加拿大红豆杉来源,CDPS和KS是甜叶菊来源)转化的细胞,其产量只有189mg/L。贝壳烯产量最高的是采用pSY32(GGPP是加拿大红豆杉来源,CDPKS是小立碗藓来源)转化的细胞,其产量达到1105mg/L。
结果表明,在E.coli表达系统中,双功能的CPS/KS模块比CDPS和KS双模块同时表达合成贝壳烯更优,且小立碗藓来源的CPS/KS、加拿大红豆杉来源的GGPPS效果尤佳。
实施例7、实施例5制备的部分合成莱鲍迪苷A的重组细胞的产物检测
取1ml实施例5所得的发酵液,加入等体积的乙酸乙酯,冰浴超声1min,然后室温下漩涡震荡20min,12000rpm离心1min,使有机相分层,吸取有机相,残留的水相再用等体积乙酸乙酯萃取1次,合并有机相后,萃取获得含甜菊糖苷类化合物的萃取产物,包括贝壳烯酸,甜菊醇,甜菊醇单糖苷和莱鲍迪苷A。将获得的有机相真空干燥,然后加入500ul乙腈重溶残留物,用HPLC-MS检测产物。
贝壳烯酸,甜菊糖醇,甜菊糖苷化合物的HPLC-MS检测条件:采用HPLC-MS进行检测(Aglient,LC1200/MS-QTOF6520),C18反相色谱柱(Waters,Xterra,2.1×50mm)。流动相A相为甲醇+0.1%甲酸,B相为水+0.1%甲酸。采用梯度洗脱:0-35min,A由30%增加到100%,B由70%将至0。流速0.2ml/min,进样量8ul。质谱条件:采用负离子扫描,扫描范围(m/z)100-1500。
结果见图6,其中图6B为贝壳烯酸的检测结果,高分辨率质谱的结果显示正离子扫描存在着303.2291离子;其中图6C为甜菊醇的检测结果,高分辨率质谱的结果显示正离子扫描存在着319.2244离子,其中图6D为甜菊醇单糖苷的检测结果,高分辨率质谱的结果显示正离子扫描存在着481.2754离子,其中图6E为莱鲍迪苷A的检测结果,高分辨率质谱的结果显示正离子扫描存在着967.43离子,最终结果表明该重组大肠杆菌成功地合成了贝壳烯酸,甜菊醇、甜菊醇单糖苷和莱鲍迪苷A,其中各载体转化细胞的莱鲍迪苷A产量见图6F和表7。
表7
从莱鲍迪苷A合成途径可知,斯塔摩酵母来源的UGTB1糖基转移酶成功地将甜菊醇单糖苷的C-13葡萄糖的C-2’位点上进一步糖基化生成甜菊醇双糖苷。对莱鲍迪苷A产量比较可见,不同来源的蛋白对其产莱鲍迪苷A有影响。产量最高的表达载体是pZQ110,莱鲍迪苷A产量达到11mg/L,其GGPP来源于加拿大红豆杉,CPS/KS来源于小立碗藓,KO和KAH来源于甜叶菊,CPR来源于暗球腔菌,UGT76G1、UGT74G1和UGT85C2来源于甜叶菊,UGTB1糖基转移酶来源于斯塔摩酵母。
实施例8、真菌载体的转化及酵母表达
将实施例3所得的用于合成莱鲍迪苷A的表达质粒载体用SalI将质粒酶切,使其线性化,电转到宿主细胞毕赤酵母KM71(购自Invitrogen)后得到具有质粒整合到基因组上His位点的重组毕赤酵母KM71;然后挑取单克隆至BMGY液体培养基中,30℃培养24小时后,离心收集菌体,加入10%的甘油制备种子液,-80℃保存。
挑取单克隆到含50ml BMGY的500ml摇瓶中,过夜28℃,250rpm培养至OD600为2-4(约16-20h)。离心收集菌体,去掉上清培养基,将菌体转移到含10mlBMMY的100ml摇瓶中,28℃,250rpm培养,每24小时加入50μl的甲醇,培养5天后,收集发酵液,-80℃冷冻保存。
实施例9、实施例8制备的部分合成甜菊糖中间产物贝壳烯的重组酵母细胞的贝壳烯产物检测
进行实施例8所得的重组毕赤酵母KM71发酵生产的产物贝壳烯进行检测。
取1ml实施例8所得的发酵液,加入50ul2M的HCl,然后加入等体积的乙酸乙酯,冰浴超声1min,然后室温下漩涡震荡20min,12000rpm离心1min,使有机相分层,吸取有机相,残留的水相再用等体积乙酸乙酯萃取1次,合并有机相后,用GC-MS直接检测贝壳烯,成功检测到产物贝壳烯,其产量见图7和表8。
表8
从产量上比较可知,在毕赤酵母表达系统中,双功能的CPS/KS比CDPS/KS的组合具有更优异的合成贝壳烯的效果。选用最优的表达载体pZQ132,贝壳烯产量达到1172mg/L,比选用pSY16表达载体产量高了5.4倍。
实施例10、实施例8制备的部分合成莱鲍迪苷A的重组酵母细胞的产物检测
取1ml实施例8所得的发酵液,加入等体积的乙酸乙酯,冰浴超声1min,然后室温下漩涡震荡20min,12000rpm离心1min,使有机相分层,吸取有机相,残留的水相再用等体积乙酸乙酯萃取1次,合并有机相后,萃取获得甜菊糖苷类化合物,包括贝壳烯酸,甜菊醇,甜菊醇单糖苷和莱鲍迪苷A。将获得的有机相中真空干燥,然后加入500ul乙腈重溶残留物,用HPLC-MS检测产物,高分辨率质谱的结果显示正离子扫描存在着303.2291离子、319.2244离子、481.2754离子和967.43离子,结果表明该重组毕赤酵母成功地合成了贝壳烯酸,甜菊醇、甜菊醇单糖苷和莱鲍迪苷A。各重组酵母细胞的莱鲍迪苷A产量见图8和表9。
表9
从图8和表9可知,莱鲍迪苷A产量最高的表达载体是pZQ210,莱鲍迪苷A产量达到12mg/L,其GGPP来源于加拿大红豆杉,CPS/KS来源于小立碗藓,KO和KAH来源于甜叶菊,CPR来源于暗球腔菌,UGT76G1、UGT74G1和UGT85C2来源于甜叶菊,UGTB1糖基转移酶来源于斯塔摩酵母。
实施例11、UGTB1或IBGT糖基转移酶的功能研究
取1ml实施例5所得的发酵液,加入等体积的乙酸乙酯,冰浴超声1min,然后室温下漩涡震荡20min,12000rpm离心1min,使有机相分层,吸取有机相,残留的水相再用等体积乙酸乙酯萃取1次,合并有机相后,萃取获得甜菊醇单糖苷和甜菊醇双糖苷。将获得的有机相中真空干燥,然后加入500ul乙腈重溶残留物,用HPLC-MS检测产物,结果见图9。从图9C可知,只含UGT85c2糖基转移酶,不含UGTB1糖基转移酶或IBGT糖基转移酶的pZQ104、pZQ105和pZQ106发酵液中只能检测到甜菊醇单糖苷,不能检测到甜菊醇双糖苷。而pZQ107、pZQ108、pZQ109、pSY200、pSY201和pSY202中都含有UGT85c2糖基转移酶和UGTB1糖基转移酶或IBGT糖基转移酶,它们的发酵液中都能成功检测到甜菊醇双糖苷(图9A、9B和9D)。
本发明人还检测了不同表达载体转化的原核细胞的甜菊醇单糖苷和甜菊醇双糖苷产量,结果如图10和表10。
表10
从图10和表10可知,不含UGTB1糖基转移酶或IBGT糖基转移酶的表达载体pZQ104、pZQ105和pZQ106和阴性对照pET28a都只能生产甜菊醇单糖苷,不能生产甜菊醇双糖苷。从生物催化效率上看,UGTB1糖基转移酶或IBGT糖基转移酶对甜菊醇单糖苷的转化效率非常高,转化效率可达99%以上。
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。