一组催化糖链延伸的UDP-糖基转移酶及其应用
技术领域
本发明涉及生物技术和植物生物学领域,具体地,本发明涉及一组糖基转移酶及其应用。
背景技术
人参皂苷是从人参属植物(如人参、三七和西洋参等)和绞股蓝中分离到的皂苷的总称,是一类三萜化合物。人参皂苷亦可以根据其分离的来源称为人参皂苷,三七皂苷和绞股蓝皂苷。人参皂苷是这些药用植物中的主要生物活性成份。目前,已经分离出了约150种皂苷。从结构上来看,人参皂苷主要是皂苷元经过糖基化后形成的生物活性小分子。人参皂苷的皂苷元只有有限的几种,主要是达玛烷型四环三萜的原人参二醇和原人参三醇,以及齐墩果烷酸。皂苷元通过糖基化后,可以提高水溶性,改变其亚细胞定位,并产生出不同的生物活性。绝大部分原人参二醇型皂苷是在C3和/或C20位羟基进行糖基化修饰,而原人参三醇型皂苷是在C6和/或C20的羟基上进行糖基化修饰。不同类型的糖基以及不同程度的糖基化修饰产生了分子结构繁多的人参皂苷。
具有不同糖基化修饰方式的人参皂苷具有不同的生物活性。例如Rb1,Rb2和Rb3分别是在Rd的C20-O-Glc延伸一分子葡萄糖、阿拉伯糖和木糖。实验证实丰富皂苷Rb1具有保护神经细胞和抗炎症抗氧化的功效;Rb2具有抑制肿瘤血管生成与肿瘤转移、降低糖尿病小鼠血糖以及降低血脂的功效;Rb3具有减缓心肌缺血和抗抑郁的功效。
人参皂苷以人参或者三七的总皂苷或者丰富皂苷为原料,依赖化学、酶和微生物发酵的水解方法进行制备。由于野生的人参资源已基本耗竭,人参皂苷资源目前来源于人参或三七的人工栽培,而其人工栽培的生长周期长(一般需要5-7年以上),并且受到地域的限制,还经常受到病虫害而需要施用大量的农药,所以,人参或三七的人工栽培有严重的连作障碍(人参或三七种植地需要休耕5-15年以上才能克服连作障碍),所以人参皂苷的产量、品质及安全性都面临挑战。
合成生物学的发展为植物来源的天然产物的异源合成提供了新的机遇。以酵母为底盘,通过代谢途径的组装和优化,已经实现了用廉价的单糖来发酵合成青蒿酸或者双氢青蒿酸,继而再通过一步化学转化的方法生产青蒿素,这表明合成生物学在天然产物的药物合成方面具有的巨大潜力。利用酵母底盘细胞通过合成生物学方法异源合成人参皂苷单体,原料为廉价的单糖,制备过程为安全性可调控的发酵过程,避免了任何外来污染(例如,原料植物人工种植时使用的农药),因此,通过合成生物学技术制备人参皂苷单体,不仅具有成本优势,而且,可以 保证成品的品质与安全性。利用合成生物学技术制备足够量的各种高纯度的天然与非天然的人参皂苷单体,用于活性测定及临床实验,促进稀有人参皂苷的创新药物研发。
近年来通过对人参、三七和西洋参的转录组和功能基因组研究,人参皂苷皂苷元合成途径的解析已经有了非常大的进展。2006年,日本和韩国科学家分别鉴定了将环氧角鲨烯转化为达玛烯二醇的萜环化酶元件达(玛烯二醇合成酶,PgDDS)。2011年到2012年,韩国科学家又鉴定了把达玛烯二醇氧化为原人参二醇以及把原人参二醇进一步氧化为原人参三醇的细胞色素P450元件CYP716A4和CYP716A53v2。
利用合成生物学方法来人工合成这些具有药用活性的人参皂苷,不仅需要构建合成皂苷元的代谢途径,还需要鉴定催化人参皂苷的糖基化的UDP-糖基转移酶。UDP-糖基转移酶的功能是将糖基供体(核苷二磷酸糖,例如UDP-葡萄糖、UDP-鼠李糖、UDP-木糖和UDP-阿拉伯糖)上的糖基转移到不同的糖基受体上。从目前已测序的植物基因组分析,植物基因组往往编码了上百种以上不同的糖基转移酶。由于UDP-糖基转移酶可能催化的底物(包括糖基供体和糖基受体)非常多样,这个UDP-糖基转移酶的功能鉴定带来了很大的困难。直到2014年,第一个参与人参皂苷糖基化的UDP-糖基转移酶(UGTPg1)才被中国学者鉴定出来,它可以在原人参二醇型人参皂苷的C20羟基转入一个葡萄糖基。随后,随后,韩国科学家又在人参中克隆两个UDP-糖基转移酶元件(PgUGT74AE2和PgUGT94Q2),它们可以在原人参二醇型皂苷的C3位上分别转入一个葡萄糖基和进行一个葡萄糖基的延伸。几乎与此同时,中国学者也独立地从人参中克隆了两个与PgUGT74AE2和PgUGT94Q2具有相同功能的糖基转移酶元件UGTPg45和UGTPg29。2015年中国学者又进一步鉴定了能在原人参三醇C6位转入一个葡萄糖基的UDP-糖基转移酶元件(UGTPg100)。2015年韩国学者在绞股蓝中发现了一个能在原人参二醇型和原人参三醇型皂苷的C20延伸一个葡萄糖基的糖基转移酶GpUGT23。但是到目前为止,除了在C3位延伸一个葡糖糖基的糖基转移酶植物,人参中能催化糖链延伸的其它糖基转移酶还未有报道。
在这种背景下,本发明人对人参中能在原人参二醇型和原人参三醇型皂苷的C20延伸一个葡萄糖基或者木糖糖基的糖基转移酶以及能在原人参三醇型皂苷的C6延伸一个木糖糖基的糖基转移酶进行了克隆和鉴定。该糖基转移酶可用于包括人参皂苷Rb1、人参皂苷Rb3、绞股蓝皂苷LXXV、绞股蓝皂苷XVII、三七皂苷U、三七皂苷R1、三七皂苷R2和三七皂苷R3等人参皂苷的制备。
发明内容
本发明提供了一组新的糖基转移酶以及制备利用其催化四环三萜类化合物糖基化 反应的方法。
本发明第一方面,提供了一种体外糖基化方法,包括步骤:
在糖基转移酶存在下,将糖基供体的糖基转移到四环三萜类化合物的以下位点上:
C20位和/或C3位的第一个糖基上;
从而形成糖基化的四环三萜类化合物;
其中,所述的糖基转移酶选自:
如SEQ ID NO.:4、6、8、8、39、41、43、45、47、49、51、53、55、57、59、98、或100所示的糖基转移酶或其衍生多肽。
在另一优选例中,在C20位进行糖基化的四环三萜类化合物包括人参皂苷Rd、CK、F1和F2。
本发明第二方面,提供了一种体外糖基化方法,包括步骤:
在糖基转移酶存在下,将糖基供体的糖基转移到四环三萜类化合物的以下位点上:
C6位的第一个糖基上;
从而形成糖基化的四环三萜类化合物;
其中,所述的糖基转移酶选自:
如SEQ ID NO.:12、14、16、18、20、22、24、26、28和30所示的糖基转移酶或其衍生多肽。
在另一优选例中,在C6位进行糖基化的四环三萜类化合物包括Rg1或Rh1。
本发明提供了一种体外糖基化的方法,包括步骤:
在糖基转移酶存在下,将糖基供体的糖基转移到四环三萜类化合物的以下位点上:
C3位的第一个糖基上;
从而形成糖基化的四环三萜类化合物;
其中,所述的糖基转移酶选自:
如SEQ ID NO.:39、41、43、45、47、49、51、53、55、57、59、90、92、94、96、98、100、116、118、120、122、或124所示的糖基转移酶或其衍生多肽。
在另一优选例中,在C3位进行糖基化的四环三萜类化合物包括F2、或Rh2。在另一优选例中,所述衍生多肽分别选自下组:
(a)具有SEQ ID NOs.:4、6、8、12、14、16、18、20、22、24、26、28、30、39、41、43、45、47、49、51、53、55、57、59、90、92、94、96、98、100、116、118、 120、122、或124中任一条或多条所示氨基酸序列的多肽;
(b)将SEQ ID NOs:4、6、8、14、16、18、20、22、24、26、28、30、39、41、43、45、47、49、51、53、55、57、59、90、92、94、96、98、100、116、118、120、122、或124添加标签序列、信号序列或分泌信号序列后形成的、并具有糖基转移酶活性的衍生多肽;
(c)氨基酸序列与SEQ ID NOs:4、6、8、14、16、18、20、22、24、26、28、30、39、41、43、45、47、49、51、53、55、57、59、90、92、94、96、98、100、116、118、120、122、或124中任一条或多条中所示氨基酸序列的同源性≥95%,并具有糖基转移酶活性的衍生多肽。
在另一优选例中,(c)中还包括将SEQ ID NOs.:4、6、8、14、16、18、20、22、24、26、28、30、39、41、43、45、47、49、51、53、55、57、59、90、92、94、96、98、100、116、118、120、122、或124中任一条或多条所示氨基酸序列的多肽经过一个或几个氨基酸残基的取代、缺失或添加而形成的、并具有糖基转移酶活性的衍生多肽。
本发明第三方面,提供了一种分离的多肽,所述的分离的多肽为:
SEQ ID NOs.:4、6、8、28、30、39、41、43、45、47、49、51、53、55、57、59、90、92、94、96、98、100、116、118、120、122、或124中任一条或多条所示氨基酸序列的多肽或其衍生多肽;其中,所述衍生多肽选自:
(a)具有SEQ ID NOs.:4、6、8、12、14、16、18、20、22、24、26、28、30、39、41、43、45、47、49、51、53、55、57、59、90、92、94、96、98、100、116、118、120、122、或124中任一条或多条所示氨基酸序列的多肽;
(b)将SEQ ID NOs:4、6、8、28、30、39、41、43、45、47、49、51、53、55、57、59、90、92、94、96、98、100、116、118、120、122、或124添加标签序列、信号序列或分泌信号序列后形成的、并具有糖基转移酶活性的衍生多肽;
(c)氨基酸序列与SEQ ID NOs:4、6、8、28、30、39、41、43、45、47、49、51、53、55、57、59、90、92、94、96、98、100、116、118、120、122、或124中任一条或多条中所示氨基酸序列的同源性≥95%,并具有糖基转移酶活性的衍生多肽。
在另一优选例中,(c)中还包括将SEQ ID NOs.:4、6、8、28、30、39、41、43、45、47、49、51、53、55、57、59、90、92、94、96、98、100、116、118、120、122、 或124中任一条所示氨基酸序列的多肽经过一个或几个氨基酸残基的取代、缺失或添加而形成的、并具有糖基转移酶活性的衍生多肽。
在另一优选例中,所述的分离的多肽用于体外糖基化。
本发明第四方面,提供了一种分离的多核苷酸,所述的多核苷酸选自下组:
(A)编码权利要求4所述多肽的核苷酸序列;
(B)编码如SEQ ID NOs:4、6、8、28、30、39、41、43、45、47、49、51、53、55、57、59、90、92、94、96、98、100、116、118、120、122、或124所示多肽的核苷酸序列;
(C)如SEQ ID NO.:3、5、7、27、29、38、40、42、44、46、48、50、52、54、56、58、89、91、93、95、97、99、115、117、119、121、或123所示的核苷酸序列;
(D)与SEQ ID NO.:3、5、7、27、29、38、40、42、44、46、48、50、52、54、56、58、89、91、93、95、97、99、115、117、119、121、或123所示的核苷酸序列所示序列的同源性≥95%(较佳地≥98%)的核苷酸序列;
(E)与(A)-(D)任一所述的核苷酸序列互补(较佳地完全互补)的核苷酸序列。
在另一优选例中,所述(D)还包括在SEQ ID NO.:3、5、7、27、29、38、40、42、44、46、48、50、52、54、56、58、89、91、93、95、97、99、115、117、119、121、或123所示核苷酸序列的5’端和/或3’端截短或添加1-60个(较佳地1-30,更佳地1-10个)核苷酸所形成的核苷酸序列。
在另一优选例中,序列如SEQ ID NO.:3、5、7、27、29、38、40、42、44、46、48、50、52、54、56、58、89、91、93、95、97、99、115、117、119、121、或123所示的核苷酸序列分别编码SEQ ID NOs:4、6、8、28、30、39、41、43、45、47、49、51、53、55、57、59、90、92、94、96、98、100、116、118、120、122、或124所示的多肽。
本发明第五方面,提供了一种载体,所述的载体含有本发明第四方面所述的多核苷酸,或表达本发明第三方面所述的分离的多肽。
本发明第三方面所述的分离的多肽的用途,被用于催化以下一种或多种反应,或被用于制备催化以下一种或多种反应的催化制剂:
将来自糖基供体的糖基转移到四环三萜类化合物的以下位点以延伸糖链:
(i)C-6位的第一个糖基上;
(ii)C-20位的第一个糖基上;和/或
(iii)C3位的第一个糖基上。
在另一优选例中,所述的糖基转移包括在特定的位点的基团进行的糖基的添加或取代。
在另一优选例中,还提供了一种多肽或其衍生多肽的用途,其特征在于,被用于催化以下反应,或被用于制备催化以下反应的催化制剂:
在糖基转移酶存在下,将糖基供体的糖基转移到四环三萜类化合物的以下位点上:
C-6位的第一个糖基上;或C-20位的第一个糖基上;和/或C-3位的第一个糖基上;
从而形成糖基化的四环三萜类化合物;
其中,所述的糖基转移酶选自:
如SEQ ID NO.:4、6、8、12、14、16、18、20、22、24、26、28、30、39、41、43、45、47、49、51、53、55、57、59、90、92、94、96、98、100、116、118、120、122、或124所示的糖基转移酶或其衍生多肽。
在另一优选例中,还提供了一种多肽或其衍生多肽的用途,被用于催化以下反应,或被用于制备催化以下反应的催化制剂:
在糖基转移酶存在下,将糖基供体的糖基转移到四环三萜类化合物的以下位点上:
C20位和/或C3位的第一个糖基上;
从而形成糖基化的四环三萜类化合物;
其中,所述的糖基转移酶选自:
如SEQ ID NO.:4、6、8、39、41、43、45、47、49、51、53、55、57、59、98、或100所示的糖基转移酶或其衍生多肽。
在另一优选例中,还提供了一种多肽或其衍生多肽的用途,其特征在于,被用于催化以下反应,或被用于制备催化以下反应的催化制剂:
在糖基转移酶存在下,将糖基供体的糖基转移到四环三萜类化合物的以下位点上:
C6位的第一个糖基上;
从而形成糖基化的四环三萜类化合物;
其中,所述的糖基转移酶选自:
如SEQ ID NO.:12、14、16、18、20、22、24、26、28、或30所示的糖基转移酶或其衍生多肽。
在另一优选例中,还提供了一种多肽或其衍生多肽的用途,其特征在于,被用于催化以下反应,或被用于制备催化以下反应的催化制剂:
在糖基转移酶存在下,将糖基供体的糖基转移到四环三萜类化合物的以下位点上:
C-3位的第一个糖基上;
从而形成糖基化的四环三萜类化合物;
其中,所述的糖基转移酶选自:
如SEQ ID NO.:39、41、43、45、47、49、51、53、55、57、59、90、92、94、96、98、100、116、118、120、122、或124所示的糖基转移酶或其衍生多肽。
在另一优选例中,所述衍生多肽分别选自下组:
(a)具有SEQ ID NOs.:4、6、8、12、14、16、18、20、22、24、26、28、30、39、41、43、45、47、49、51、53、55、57、59、90、92、94、96、98、100、116、118、120、122、或124中任一条所示氨基酸序列的多肽;
(b)将SEQ ID NOs:4、6、8、12、14、16、18、20、22、24、26、28、30、39、41、43、45、47、49、51、53、55、57、59、90、92、94、96、98、100、116、118、120、122、或124添加标签序列、信号序列或分泌信号序列后形成的、并具有糖基转移酶活性的衍生多肽;
(c)氨基酸序列与SEQ ID NOs:4、6、8、12、14、16、18、20、22、24、26、28、30、39、41、43、45、47、49、51、53、55、57、59、90、92、94、96、98、100、116、118、120、122、或124中任一条中所示氨基酸序列的同源性≥95%,并具有糖基转移酶活性的衍生多肽。在另一优选例中,所述的糖基供体包括选自下组的核苷二磷酸糖:UDP-葡萄糖,ADP-葡萄糖,TDP-葡萄糖,CDP-葡萄糖,GDP-葡萄糖,UDP-乙酰基葡萄糖,ADP-乙酰基葡萄糖,TDP-乙酰基葡萄糖,CDP-乙酰基葡萄糖,GDP-乙酰基葡萄糖,UDP-木糖,ADP-木糖,TDP-木糖,CDP-木糖,GDP-木糖,UDP-半乳糖醛酸,ADP-半乳糖醛酸,TDP-半乳糖醛酸,CDP-半乳糖醛酸,GDP-半乳糖醛酸,UDP-半乳糖,ADP-半乳糖,TDP-半乳糖,CDP-半乳糖,GDP-半乳糖,UDP-阿拉伯糖,ADP-阿拉伯糖,TDP-阿拉伯糖,CDP-阿拉伯糖,GDP-阿拉伯糖,UDP-鼠李糖,ADP-鼠李糖,TDP-鼠李糖,CDP-鼠李糖,GDP-鼠李糖,UDP-木糖,ADP-木糖,TDP-木糖,CDP-木糖,GDP-木糖,或其他核苷二磷酸己糖或核苷二磷酸戊糖,或其组合。
在另一优选例中,所述的糖基供体包括选自下组的尿苷二磷酸(UDP)糖:UDP-葡 萄糖,UDP-半乳糖醛酸,UDP-半乳糖,UDP-阿拉伯糖,UDP-鼠李糖,UDP-木糖,或其他尿苷二磷酸己糖或尿苷二磷酸戊糖,或其组合。在另一优选例中,所述分离的多肽用于催化下述一种或多种反应或被用于制备催化下述一种或多种反应的催化制剂:
(A)
其中,R1为H、单糖糖基或多糖糖基;R2为H或OH;R3为单糖糖基;R4为单糖糖基所述的多肽选自SEQ ID NO:4、6、8、39、41、43、45、47、49、51、53、55、57、59、98、100、116、118、120、122、或124或其衍生多肽。在另一优选例中,所述的单糖包括葡萄糖(Glc),鼠李糖(Rha),乙酰基葡萄糖(Glc(6)Ac),阿拉伯呋喃糖(Araf),阿拉伯吡喃糖(Arap),或木糖(Xyl)等。
在另一优选例中,所述的多糖包括Glc(2-1)Glc,Glc(6-1)Glc,Glc(6)Ac,Glc(2-1)Rha,Glc(6-1)Arap,Glc(6-1)Xyl,Glc(6-1)Araf,Glc(3-1)Glc(3-1),Glc(2-1)Glu(6)Ac,Glc(6-1)Arap(4-1)Xyl,Glc(6-1)Arap(2-1)Xyl,或Glc(6-1)Arap(3-1)Xyl等2-4个单糖组成的多糖。
在另一优选例中,R1-R4经取代后的化合物如下表所示:
即当所述的R1为H,R2为OH,R3为葡萄糖基时,所述的式(I)化合物为人参皂苷CK(CK);
当所述的R1为H,R2为OH,R3和R4为葡萄糖基时,所述的式(II)化合物为绞股蓝皂苷LXXV;
当所述的R1为H,R2为OH,R3为葡萄糖基,R4为木糖基时,所述的式(II)化合物为绞股蓝皂苷XIII;
当R1和R2都为H,R3为葡萄糖基时,所述的式(I)化合物为人参皂苷DMG;
当R1和R2都为H,R3和R4为葡萄糖基时,所述的式(II)化合物为皂苷DMGG(20-O-β-(D-吡喃葡萄糖基)-β-(D-吡喃葡萄糖基)-达玛烯二醇)(20-O-β-(D-glucopyranosyl)-β-(D-glucopyranosyl)-dammarenediol);
当R1和R2都为H,R3为葡萄糖基,R4为木糖基时,所述的式(II)化合物为皂苷DMGX(20-O-β-(D-吡喃木糖基)-β-(D-吡喃葡萄糖基)-达玛烯二醇)(20-O-β-(D-xylopyranosyl)-β-(D-glucopyranosyl)-dammarenediol);
当R1为葡萄糖基,R2为OH,R3为葡萄糖基时,所述的式(I)化合物为人参皂苷F2(F2);
当R1为葡萄糖基,R2为OH,R3和R4为葡萄糖基时,所述的式(II)化合物为绞股蓝皂苷XVII;
当R1为葡萄糖基,R2为OH,R3为葡萄糖基,R4为木糖基时,所述的式(II)化合物为绞股蓝皂苷IX;
当R1为两个葡萄糖基(Glc(2-1)Glc),R2为OH,R3为葡萄糖基时,所述的式(I)化合物为人参皂苷Rd;
当R1为两个葡萄糖基(Glc(2-1)Glc),R2为OH,R3和R4为葡萄糖基时,所述的式(II)化合物为人参皂苷Rb1;或
当R1为两个葡萄糖基(Glc(2-1)Glc),R2为OH,R3为葡萄糖基,R4为木糖基时,所述的式(II)化合物为人参皂苷Rb3;
当所述的R1为H,R2为OH,R3为葡萄糖基,R4为阿拉伯糖基时,所述的式(II)化合物为人参皂苷F3;
(B)
其中,R1为H,糖基或多糖糖基,R2糖基,R3为糖基,所述的多肽选自SEQ ID NOs.:4或其衍生多肽。
在另一优选例中,R1-R3经取代后的化合物如下表所示:
底物 |
R1 |
R2 |
R3 |
产物 |
F1 |
H |
Glc |
Glc |
三七皂苷U |
Rg1 |
Glc |
Glc |
Glc |
三七皂苷R3 |
即当R1为H时,R2为葡萄糖基时,所述的式(III)化合物为人参皂苷F1(F1);
当R1为H时,R2和R3为葡萄糖基时,所述的式(IV)化合物为三七皂苷U;当R1和R2为葡萄糖基时,所述的式(III)化合物为人参皂苷Rg1(Rg1);或
当R1,R2和R3为葡萄糖基时,所述的式(IV)化合物为三七皂苷R3(R3);
(C)
其中,R1和R2为H或者糖基,R3和R4为糖基;所述的多肽选自SEQ ID NOs.:12、14、16、18、20、22、24、26、28、30或其衍生多肽。
在另一优选例中,R1-R4经取代后的化合物如下表所示:
底物 |
R1 |
R2 |
R3 |
R4 |
产物 |
Rg1 |
H |
Glc |
Glc |
Xyl |
三七皂苷R1 |
Rg1 |
H |
Glc |
Glc |
Glc |
20-O-Glucosylginsenoside Rf |
Rh1 |
H |
H |
Glc |
Xyl |
三七皂苷R2 |
Rh1 |
H |
H |
Glc |
Glc |
人参皂苷Rf |
即当R1为H时,R2和R3为葡萄糖基时,所述的式(V)化合物为人参皂苷Rg1;
当R1为H时,R2和R3为葡萄糖基,R4为木糖基时,所述的式(VI)化合物为三 七皂苷R1;
当R1为H时,R2和R3为葡萄糖基,R4为葡萄糖基时,所述的式(VI)化合物为皂苷20-O-Glucosylginsenoside Rf;
当R1和R2为H,R3为葡萄糖基时,所述的式(V)化合物为人参皂苷Rh1;
当R1和R2为H,R3为葡萄糖基,R4为木糖基时,所述的式(VI)化合物为三七皂苷R2;当R1和R2为H,R3和R4位葡萄糖基时,所述的式(VI)化合物为人参皂苷Rf。
(D)
其中,R1为糖基;R2和R3为OH或者H;R4为糖基或者H;R5为糖基,R5-R1-O为C3第一个糖基衍生的糖基;所述的多肽选自SEQ ID NOs.:39、41、43、45、47、49、51、53、55、57、59、98、100、116、118、120、122、或124或其衍生多肽;
R1-R4经取代后的化合物如下表所示:
即当R1为葡萄糖基;R2为H,R3为OH,R4为H,式(VII)化合物为Rh2;
R1为葡萄糖基;R2为H,R3为OH,R4为葡萄糖基,式(VII)化合物为F2;
R1为葡萄糖基;R2为H,R3为OH,R4为两个葡萄糖基,式(VII)化合物为绞股蓝皂苷Gypenoside XVII;
R1为葡萄糖基;R2为H,R3为OH,R4为一个葡萄糖基延伸一个木糖基,式(VII)化合物为绞股蓝皂苷Gypenoside IX;
当底物(VII)化合物为Rh2,则产物式(VIII)化合物为Rg3;底物(VII)化合物为F2,则产物式(VIII)化合物为Rd;底物(VII)化合物为Gypenoside XVII,则产物(VIII) 化合物为Rb1;底物(VII)化合物为Gypenoside IX,则产物(VIII)化合物为Rb3。
(E)
其中,R1为糖基;R2和R3为OH或者H;R4为糖基或者H;R5为糖基,R6-R1-O为C3第一个糖基衍生的糖基;R6为糖基,R6-R1-O为C3第一个糖基衍生的糖基,所述的多肽选自SEQ ID NOs.:41、45、90、92、94或96或其衍生多肽;
R1为两个葡萄糖基,R2为H,R3为OH,R4为H,式(IX)化合物为Rg3。
R1为两个葡萄糖基,R2为H,R3为OH,R4为葡萄糖基,式(IX)化合物为Rd
在另一优选例中,所述的糖基选自:葡萄糖基、木糖、半乳糖醛酸基、半乳糖基、阿拉伯糖基、鼠李糖基,以及其他己糖基或戊糖基。
在另一优选例中,所述反应式中(I)、(III)、(V)、(VII)、(IX)化合物包括(但不限于):S构型或R构型的达玛烷型四环三萜类化合物、羊毛脂烷型四环三萜类化合物、apotirucallane型四环三萜、甘遂烷型四环三萜类化合物、环阿屯烷(环阿尔廷烷)型四环三萜类化合物、葫芦烷四环三萜类化合物、或楝烷型四环三萜类化合物。
在另一优选例中,所述反应式中(II)、(IV)、(VI)、(VIII)、或(X)化合物包括人参皂苷Rg3、人参皂苷Rd、人参皂苷Rb1、人参皂苷Rb3、皂苷DMGG、皂苷DMGX、绞股蓝皂苷LXXV、绞股蓝皂苷XVII、绞股蓝皂苷XIII、绞股蓝皂苷IX、三七皂苷U和、三七皂苷R1、和三七皂苷R2、三七皂苷R3、3-O-β-(D-xylopyranosyl)-β-(D-glucopyranosyl)-PPD;3-O-β-(D-xylopyranosyl)-β-(D-glucopyranosyl)-CK、20-O-Glucosylginsenoside Rf和Ginsenoside F3。
本发明第六方面,提供了一种进行糖基转移催化反应的方法,包括步骤:在本发明第三方面所述的多肽或其衍生多肽存在的条件下,进行糖基转移催化反应。
在另一优选例中,所述的方法还包括步骤:
在糖基供体以及如本发明第三方面所述多肽及其衍生多肽的存在下,将所述的式(I)化合物转化为所述的式(II)化合物,或式(III)化合物转化为所述的式(IV)化合物,或者式(V)化合物转化为所述的式(VI)化合物;或式所述的式(VII)化合物转化为所述的式(VIII)化合物,或式(IX)化合物转化为所述的式(IX)化合物。
在另一优选例中,所述的方法还包括将所述的多肽及其衍生多肽分别加入催化反应;和/或
将所述的多肽及其衍生多肽同时加入催化反应。
在另一优选例中,所述的方法还包括将编码糖基转移酶的核苷酸序列与达玛稀二醇和/或原人参二醇和/或原人参三醇合成代谢途径中的关键基因在宿主细胞中共表达,从而获得所述的式(II)、(IV)、(VI)、(VIII)、或(X)化合物。
在另一优选例中,所述的宿主细胞为酵母菌或大肠杆菌。
在另一优选例中,所述的多肽为具有SEQ ID NOs.:4、6、8、12、14、16、18、20、22、24、26、28、30、39、41、43、45、47、49、51、53、55、57、59、90、92、94、96、98、100、116、118、120、122、或124所示氨基酸序列的多肽及其衍生多肽。
在另一优选例中,编码所述多肽的核苷酸序列如SEQ ID NOs.:3、5、7、13、15、17、19、21、23、25、27、29、38、40、42、44、46、48、50、52、54、56、58、89、91、93、95、97、99、115、117、119、121、或123所示。
在另一优选例中,所述方法还包括:向反应体系中提供用于调节酶活性的添加物。
在另一优选例中,所述的用于调节酶活性的添加物是:提高酶活性或抑制酶活性的添加物。
在另一优选例中,所述的用于调节酶活性的添加物选自下组:Ca
2+、Co
2+、Mn
2+、Ba
2+、Al3+、Ni
2+、Zn
2+、或Fe
2+。
在另一优选例中,所述的用于调节酶活性的添加物是:可以生成Ca
2+、Co
2+、Mn
2+、Ba
2+、Al3+、Ni
2+、Zn
2+、或Fe
2+的物质。
在另一优选例中,所述的糖基供体是核苷二磷酸糖,选自下组:UDP-葡萄糖,ADP-葡萄糖,TDP-葡萄糖,CDP-葡萄糖,GDP-葡萄糖,UDP-木糖,ADP-木糖,TDP-木糖,CDP-木糖,GDP-木糖,UDP-半乳糖醛酸,UDP-乙酰基葡萄糖,ADP-乙酰基葡萄糖,TDP-乙酰基葡萄糖,CDP-乙酰基葡萄糖,GDP-乙酰基葡萄糖,ADP-半乳糖醛 酸,TDP-半乳糖醛酸,CDP-半乳糖醛酸,GDP-半乳糖醛酸,UDP-半乳糖,ADP-半乳糖,TDP-半乳糖,CDP-半乳糖,GDP-半乳糖,UDP-阿拉伯糖,ADP-阿拉伯糖,TDP-阿拉伯糖,CDP-阿拉伯糖,GDP-阿拉伯糖,UDP-鼠李糖,ADP-鼠李糖,TDP-鼠李糖,CDP-鼠李糖,GDP-鼠李糖,或其他核苷二磷酸己糖或核苷二磷酸戊糖,或其组合。
在另一优选例中,所述的糖基供体是尿苷二磷酸糖,选自下组:UDP-葡萄糖,UDP-木糖,UDP-半乳糖醛酸,UDP-半乳糖,UDP-阿拉伯糖,UDP-鼠李糖,或其他尿苷二磷酸己糖或尿苷二磷酸戊糖,或其组合。
在另一优选例中,反应体系的pH为:pH4.0-10.0,优选pH为5.5-9.0。
在另一优选例中,反应体系的温度为:10℃-105℃,优选20℃-50℃。
在另一优选例中,所述的达玛稀二醇合成代谢途径中的关键基因包括(但不限于):达玛烯二醇合成酶基因。
在另一优选例中,所述的人参皂苷CK合成代谢途径中的关键基因包括(但不限于):达玛烯二醇合成酶基因、细胞色素P450CYP716A47基因和P450CYP716A47的还原酶基因和四环三萜C20位的糖基转移酶UGTPg1(Genbank accession number KF377585.1),或其组合。
在另一优选例中,所述的人参皂苷人参皂苷F1合成代谢途径中的关键基因包括(但不限于):达玛烯二醇合成酶基因、细胞色素P450CYP716A47基因、P450CYP716A47的还原酶基因、及细胞色素P450CYP716A53V2基因及其还原酶基因和四环三萜C20位的糖基转移酶UGTPg1,或其组合。
在另一优选例中,所述的人参皂苷Rg1合成代谢途径中的关键基因包括(但不限于):达玛烯二醇合成酶基因、细胞色素P450CYP716A47基因和P450CYP716A47的还原酶基因和四环三萜C20位和C6的糖基转移酶UGTPg1和UGTPg100(Genbank accession number AKQ76388.1),或其组合。
在另一优选例中,所述糖基催化反应的底物为式(I)、(III)、(V)、(VII)、(IX)化合物,且所述的产物分别为(II)、(IV)、(VI)、(VIII)、(X)化合物;
在另一优选例中,所述的式(I)化合物为人参皂苷CK,并且式(II)化合物为绞股蓝皂苷LXXV(20-O-β-(D-吡喃葡萄糖基)-β-(D-吡喃葡萄糖基)-原人参二醇)(20-O-β-(D-glucopyranosyl)-β-(D-glucopyranosyl)-protopanaxadiol);
或,所述的式(I)化合物为人参皂苷DMG,并且式(II)化合物为一种新的人参皂苷DMGG(20-O-β-(D-吡喃葡萄糖基)-β-(D-吡喃葡萄糖基)-达玛烯二醇)(20-O-β-(D-glucopyranosyl)-β-(D-glucopyranosyl)-dammarenediol);
所述的式(I)化合物为人参皂苷F2,并且式(II)化合物为绞股蓝皂苷XVII(3-O-β-(D-吡喃葡萄糖基)-20-O-β-(D-吡喃葡萄糖基)-β-(D-吡喃葡萄糖基)-原人参二醇)(3-O-β-(D-glucopyranosyl)-20-O-β-(D-glucopyranosyl)-β-(D-glucopyranosyl)-protopanaxadiol);
或,所述的式(I)化合物为人参皂苷Rd,并且式(II)化合物为人参皂苷Rb1(3-O-β-(D-吡喃葡萄糖基)-β-(D-吡喃葡萄糖基)-20-O-β-(D-吡喃葡萄糖基)-β-(D-吡喃葡萄糖基)-原人参二醇)(3-O-β-(D-glucopyranosyl)-β-(D-glucopyranosyl)-20-O-β-(D-glucopyranosyl)-β-(D-glucopyranosyl)-protopanaxadiol);
或,所述的式(I)化合物为人参皂苷Rd,并且式(II)化合物为人参皂苷Rb3(3-O-β-(D-吡喃葡萄糖基)-β-(D-吡喃葡萄糖基)-20-O-β-(D-吡喃木糖基)-β-(D-吡喃葡萄糖基)-原人参二醇)(3-O-β-(D-glucopyranosyl)-β-(D-glucopyranosyl)-20-O-β-(D-xylopyranosyl)-β-(D-glucopyranosyl)-protopanaxadiol)
所述的式(I)化合物为人参皂苷CK,并且式(II)化合物为绞股蓝皂苷XIII;
所述的式(I)化合物为人参皂苷DMG,并且式(II)化合物为人参皂苷DMGX(20-O-β-(D-吡喃木糖基)-β-(D-吡喃葡萄糖基)-达玛烯二醇)(20-O-β-(D-glucopyranosyl)-β-(D-glucopyranosyl)-dammarenediol);
所述的式(I)化合物为人参皂苷F2,并且式(II)化合物为绞股蓝皂苷IX;
所述的式(I)化合物为人参皂苷CK,并且式(II)化合物为人参皂苷F3;在另一优选例中,所述的式(III)化合物为人参皂苷F1,并且式(IV)化合物为三七皂苷U(20-O-β-(D-吡喃葡萄糖基)-β-(D-吡喃葡萄糖基)-原人参三醇)(20-O-β-(D-glucopyranosyl)-β-(D-glucopyranosyl)-protopanaxatriol);
在另一优选例中,所述的式(III)化合物为人参皂苷Rg1,并且式(IV)化合物为三七皂苷R3;
在另一优选例中,所述的式(V)化合物为人参皂苷Rg1,并且式(VI)化合物为三七皂苷R1(6-O-β-(D-吡喃木糖基)-β-(D-吡喃葡萄糖基)-20-O-β-(D-吡喃葡萄糖基)-原人参三醇)(6-O-β-(D-xylopyranosyl)-β-(D-glucopyranosyl)-20-O-β-(D-glucopyranosyl) -protopanaxatriol);
所述的式(V)化合物为人参皂苷Rg1,并且式(VI)化合物为20-O-Glucosylginsenoside Rf;
所述的式(V)化合物为人参皂苷Rh1、并且式(VI)化合物为三七皂苷R2(6-O-β-(D-吡喃木糖基)-β-(D-吡喃葡萄糖基)-原人参三醇)(6-O-β-(D-xylopyranosyl)-β-(D-glucopyranosyl)-protopanaxatriol)。
或、所述的式(V)化合物为人参皂苷Rh1、并且式(VI)化合物为人参皂苷Rf。
在另一优选例中,所述的式(III)化合物为人参皂苷Rg1,并且式(IV)化合物为三七皂苷R3;
在另一优选例中,所述的式(VII)化合物为Rh2,则产物式(VIII)化合物为Rg3;
所述的式(VII)化合物为F2,则产物式(VIII)化合物为Rd;
所述的式(VII)化合物为Gypenoside XVII,则产物(VIII)化合物为Rb1;
所述的式(VII)化合物为Gypenoside IX,则产物(VIII)化合物为Rb3。
在另一优选例中,所述的式(IX)化合物为Rg3,则产物式(X)化合物为3-O-β-(D-xylopyranosyl)-β-(D-glucopyranosyl)-PPD;
所述的式(IX)化合物为Rd,则产物式(X)化合物为3-O-β-(D-xylopyranosyl)-β-(D-glucopyranosyl)-CK。
本发明第七方面,提供了一种遗传工程化的宿主细胞,所述的宿主细胞含有本发明第五方面所述的载体,或其基因中整合本发明第四方面所述的多核苷酸。
在另一优选例中,所述的细胞为原核细胞或真核细胞。
在另一优选例中,所述的宿主细胞为真核细胞,如酵母细胞或植物细胞。
在另一优选例中,所述的宿主细胞为酿酒酵母细胞。
在另一优选例中,所述的宿主细胞原核细胞,如大肠杆菌。
在另一优选例中,所述的宿主细胞为人参细胞。
在另一优选例中,所述的宿主细胞不是天然产生式(II)、(IV)、(VI)、(VII)、(X)化合物的细胞。
在另一优选例中,所述的宿主细胞不是天然产生人参皂苷Rg3、人参皂苷Rd、人参皂苷Rb1、人参皂苷Rb3、皂苷DMGG、皂苷DMGX、绞股蓝皂苷LXXV、绞股蓝皂苷XVII、绞股蓝皂苷XIII、绞股蓝皂苷IX、三七皂苷U和、三七皂苷R1、和 三七皂苷R2、三七皂苷R3、3-O-β-(D-xylopyranosyl)-β-(D-glucopyranosyl)-PPD;3-O-β-(D-xylopyranosyl)-β-(D-glucopyranosyl)-CK、20-O-Glucosylginsenoside Rf和Ginsenoside F3。
在另一优选例中,所述的达玛稀二醇合成代谢途径中的关键基因包括(但不限于):达玛烯二醇合成酶基因。
在另一优选例中,所述的宿主细胞含有人参皂苷CK合成代谢途径中的关键基因包括(但不限于):达玛烯二醇合成酶基因、细胞色素P450CYP716A47基因、P450CYP716A47的还原酶基因和和四环三萜C20位的糖基转移酶UGTPg1,或其组合。
在另一优选例中,所述的宿主细胞含有人参皂苷F1合成代谢途径中的关键基因包括(但不限于):达玛烯二醇合成酶基因、细胞色素P450CYP716A47基因、P450CYP716A47的还原酶基因、细胞色素P450CYP716A53V2基因和四环三萜C20位的糖基转移酶UGTPg1,或其组合。
在另一优选例中,所述的人参皂苷Rg1合成代谢途径中的关键基因包括(但不限于):达玛烯二醇合成酶基因、细胞色素P450CYP716A47基因和P450CYP716A47的还原酶基因和四环三萜C20位和C6的糖基转移酶UGTPg1和UGTPg100(Genbank accession number AKQ76388.1),或其组合。
本发明第八方面,提供了本发明第七方面所述宿主细胞的用途,用于制备酶催化试剂,或产生糖基转移酶、或作为催化细胞、或产生式(II)、(IV)、(VI)、(VIII)或(X)化合物。
本发明第九方面,提供了一种产生转基因植物的方法,包括步骤:将权利要求8中所述遗传工程化的宿主细胞再生为植物,并且所述的遗传工程化的宿主细胞为植物细胞。
在另一优选例中,所述的遗传工程化的宿主细胞为人参细胞。
在另一优选例中,所述的遗传工程化的宿主细胞为三七细胞。
应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合,从而构成新的或优选的技术方案。限于篇幅,在此不再一一累述。
附图说明
图1(A)为SDS-PAGE糖基转移酶基因GT29-32,GT29-33和GT29-34在大肠杆菌中的表达;泳道control,pet28a空载体重组子的裂解液总蛋白或者裂解上 清;泳道GT29-32,重组大肠杆菌BL21-GT29-32的裂解液总蛋白或者裂解上清;泳道GT29-33,重组大肠杆菌BL21-GT29-33的裂解液总蛋白或者裂解上清;泳道GT29-34,重组大肠杆菌BL21-GT29-34的裂解液总蛋白或者裂解上清;(B)为Western Blot检测糖基转移酶基因GT29-32,GT29-33和GT29-34在大肠杆菌中的表达;泳道control,pet28a空载体重组子的裂解液总蛋白或者裂解上清;泳道GT29-32,重组大肠杆菌BL21-GT29-32的裂解液总蛋白或者裂解上清;泳道GT29-33,重组大肠杆菌BL21-GT29-33的裂解液总蛋白或者裂解上清;泳道GT29-34,重组大肠杆菌BL21-GT29-34的裂解液总蛋白或者裂解上清。
图2,显示糖基转移酶GT29-32,GT29-33和GT29-34催化的以人参皂苷CK或者Rd为糖基受体,UDP-葡萄糖或者UDP-木糖为糖基供体的转糖基反应的TLC图谱。Control代表以pet28a空载体重组子的裂解液上清作为酶液;GT29-32,GT29-33和GT29-34分别代表以重组大肠杆菌BL21-GT29-32,BL21-GT29-33和BL21-GT29-34的裂解液上清作为酶液。
图3,显示糖基转移酶GT29-32,GT29-33和GT29-34催化的以人参皂苷CK或者Rd为糖基受体,UDP-葡萄糖为糖基供体的转糖基反应的HPLC图谱。Control代表以pet28a空载体重组子的裂解液上清作为酶液;GT29-32,GT29-33和GT29-34分别代表以重组大肠杆菌BL21-GT29-32,BL21-GT29-33和BL21-GT29-34的裂解液上清作为酶液。
图4,显示糖基转移酶GT29-32,GT29-33和GT29-34催化的以人参皂苷Rd为糖基受体,UDP-木糖为糖基供体的转糖基反应的HPLC图谱。Control代表以pet28a空载体重组子的裂解液上清作为酶液;GT29-32,GT29-33和GT29-34分别代表以重组大肠杆菌BL21-GT29-32,BL21-GT29-33和BL21-GT29-34的裂解液上清作为酶液。
图5,显示糖基转移酶GT29-32,GT29-33和GT29-34催化的以人参皂苷F1为糖基受体,UDP-葡萄糖为糖基供体的转糖基反应的TLC图谱。Control代表以pet28a空载体重组子的裂解液上清作为酶液;GT29-32,GT29-33和GT29-34分别代表以重组大肠杆菌BL21-GT29-32,BL21-GT29-33和BL21-GT29-34的裂解液上清作为酶液。
图6,显示糖基转移酶GT29-32,GT29-33和GT29-34催化的以人参皂苷F1为糖基受体,UDP-葡萄糖为糖基供体的转糖基反应的HPLC图谱。Control代表以pet28a空载体重组子的裂解液上清作为酶液;GT29-32,GT29-33和GT29-34分别代表以重组大肠杆菌BL21-GT29-32,BL21-GT29-33和BL21-GT29-34的裂解液上清作为酶液。
图7,显示糖基转移酶GT29-4,GT29-5,GT29-7,GT29-9,GT29-11,GT29-13,GT29-17,GT29-18,GT29-24和GT29-25催化的以人参皂苷Rg1为糖基受体,UDP-木糖为糖基供体的转糖基反应的TLC图谱。Control代表以pet28a空载体重 组子的裂解液上清作为酶液;GT29-4,GT29-5,GT29-7,GT29-9,GT29-11,GT29-13,GT29-17,GT29-18,GT29-24和GT29-25分别代表以重组大肠杆菌BL21-GT29-4,BL21-GT29-5,BL21-GT29-7,BL21-GT29-9,BL21-GT29-11,BL21-GT29-13,BL21-GT29-17,BL21-GT29-18,BL21-GT29-24和BL21-GT29-25的裂解液上清作为酶液。
图8,显示糖基转移酶GT29-4,GT29-5,GT29-7和GT29-9,催化的以人参皂苷Rg1为糖基受体,UDP-木糖为糖基供体的转糖基反应的HPLC图谱。Control代表以pet28a空载体重组子的裂解液上清作为酶液;GT29-4,GT29-5,GT29-7和GT29-9,分别代表以重组大肠杆菌BL21-GT29-4,BL21-GT29-5,BL21-GT29-7和BL21-GT29-9,的裂解液上清作为酶液。
图9,显示糖基转移酶GT29-11,GT29-13,GT29-17,GT29-18,GT29-24和GT29-25催化的以人参皂苷Rg1为糖基受体,UDP-木糖为糖基供体的转糖基反应的HPLC图谱。Control代表以pet28a空载体重组子的裂解液上清作为酶液;GT29-11,GT29-13,GT29-17,GT29-18,GT29-24和GT29-25分别代表以重组大肠杆菌BL21-GT29-11,BL21-GT29-13,BL21-GT29-17,BL21-GT29-18,BL21-GT29-24和BL21-GT29-25的裂解液上清作为酶液。
图10,显示Western blot检测糖基转移酶PNUGT29-1,PNUGT29-2,PNUGT29-3,PNUGT29-4,PNUGT29-5,PNUGT29-6,PNUGT29-7,PNUGT29-8,PNUGT29-9,PNUGT29-14,PNUGT29-15蛋白表达情况。Control代表以pet28a空载体重组子的裂解液上清作为酶液;PNUGT29-1,PNUGT29-2,PNUGT29-3,PNUGT29-4,PNUGT29-5,PNUGT29-6,PNUGT29-7,PNUGT29-8,PNUGT29-9,PNUGT29-14,PNUGT29-15分别代表以重组大肠杆菌BL21-PNUGT29-1,BL21-PNUGT29-2,BL21-PNUGT29-3,BL21-PNUGT29-4,BL21-PNUGT29-5,BL21-PNUGT29-6,BL21-PNUGT29-7,BL21-PNUGT29-8,BL21-PNUGT29-9,BL21-PNUGT29-14,BL21-PNUGT29-15的裂解液上清作为酶液。
图11,显示糖基转移酶PNUGT29-1,PNUGT29-2,PNUGT29-3,PNUGT29-4,PNUGT29-5,PNUGT29-6,PNUGT29-7,PNUGT29-8,PNUGT29-9,PNUGT29-14,PNUGT29-15催化的以人身皂苷Rd为糖基受体,UDP-葡萄糖为糖基供体的转糖基反应的TLC图谱。Control代表以pet28a空载体重组子的裂解液上清作为酶液;PNUGT29-1,PNUGT29-2,PNUGT29-3,PNUGT29-4,PNUGT29-5,PNUGT29-6,PNUGT29-7,PNUGT29-8,PNUGT29-9,PNUGT29-14,PNUGT29-15分别代表以重组大肠杆菌BL21-PNUGT29-1,BL21-PNUGT29-2,BL21-PNUGT29-3,BL21-PNUGT29-4,BL21-PNUGT29-5,BL21-PNUGT29-6,BL21-PNUGT29-7,BL21-PNUGT29-8,BL21-PNUGT29-9,BL21-PNUGT29-14,BL21-PNUGT29-15的裂解液上清作为酶液。
图12,显示糖基转移酶PNUGT29-1,PNUGT29-2,PNUGT29-3,PNUGT29-4, PNUGT29-5,PNUGT29-6,PNUGT29-7,PNUGT29-8,PNUGT29-9,PNUGT29-14,PNUGT29-15,催化的以人身皂苷CK为糖基受体,UDP-葡萄糖为糖基供体的转糖基反应的TLC图谱。Control代表以pet28a空载体重组子的裂解液上清作为酶液;PNUGT29-1,PNUGT29-2,PNUGT29-3,PNUGT29-4,PNUGT29-5,PNUGT29-6,PNUGT29-7,PNUGT29-8,PNUGT29-9,PNUGT29-14,PNUGT29-15分别代表以重组大肠杆菌BL21-PNUGT29-1,BL21-PNUGT29-2,BL21-PNUGT29-3,BL21-PNUGT29-4,BL21-PNUGT29-5,BL21-PNUGT29-6,BL21-PNUGT29-7,BL21-PNUGT29-8,BL21-PNUGT29-9,BL21-PNUGT29-14,BL21-PNUGT29-15的裂解液上清作为酶液。
图13,显示糖基转移酶PNUGT29-1,PNUGT29-2,PNUGT29-3,PNUGT29-4,PNUGT29-5,PNUGT29-6,PNUGT29-7,PNUGT29-8,PNUGT29-9,PNUGT29-14,PNUGT29-15,催化的以人身皂苷Rh2为糖基受体,UDP-葡萄糖为糖基供体的转糖基反应的TLC图谱。Control代表以pet28a空载体重组子的裂解液上清作为酶液;PNUGT29-1,PNUGT29-2,PNUGT29-3,PNUGT29-4,PNUGT29-5,PNUGT29-6,PNUGT29-7,PNUGT29-8,PNUGT29-9,PNUGT29-14,PNUGT29-15分别代表以重组大肠杆菌BL21-PNUGT29-1,BL21-PNUGT29-2,BL21-PNUGT29-3,BL21-PNUGT29-4,BL21-PNUGT29-5,BL21-PNUGT29-6,BL21-PNUGT29-7,BL21-PNUGT29-8,BL21-PNUGT29-9,BL21-PNUGT29-14,BL21-PNUGT29-15的裂解液上清作为酶液。
图14,显示糖基转移酶GT29-36,GT29-36,GT29-42和GT29-43,催化的以人参皂苷Rd为糖基受体,UDP-木糖为糖基供体的转糖基反应的TLC图谱。GT29-36,GT29-36,GT29-42和GT29-43分别代表以重组大肠杆菌BL21-GT29-36,BL21-GT29-36,BL21-GT29-42和BL21-GT29-43的裂解液上清作为酶液。
图15,显示糖基转移酶GT29-45和GT29-46,催化的以人参皂苷Rh2为糖基受体,UDP-葡萄糖为糖基供体的转糖基反应的TLC图谱。Control代表以pet28a空载体重组子的裂解液上清作为酶液;GT29-45和GT29-46分别代表以重组大肠杆菌BL21-GT29-45和BL21-GT29-46的裂解液上清作为酶液。
图16,显示糖基转移酶GT29-45和GT29-46,催化的以人参皂苷CK为糖基受体,UDP-葡萄糖为糖基供体的转糖基反应的TLC图谱。Control代表以pet28a空载体重组子的裂解液上清作为酶液;GT29-45和GT29-46分别代表以重组大肠杆菌BL21-GT29-45和BL21-GT29-46的裂解液上清作为酶液。图17,显示糖基转移酶GT29-32,催化的以人参皂苷CK为糖基受体,UDP-阿拉伯糖为糖基供体的转糖基反应的TLC图谱。Control代表以pet28a空载体重组子的裂解液上清作为酶液;GT29-32代表以重组大肠杆菌BL21-GT29-32的裂解液上清作为酶液。
具体实施方式
本发明人经过广泛而深入的研究,首次提供了新的糖基转移酶、其相应的糖基转移催化位点。具体地,本发明的糖基转移酶GT29-32(SEQ ID NO.:4),GT29-33(SEQ ID NO.:6)、GT29-34(SEQ ID NO.:8)、GT29-4(SEQ ID NO.:12)、GT29-5(SEQ ID NO.:14)、GT29-7(SEQ ID NO.:16)、GT29-9(SEQ ID NO.:18),GT29-11(SEQ ID NO.:20)、GT29-13(SEQ ID NO.:22)、GT29-17(SEQ ID NO.:24)、GT29-18(SEQ ID NO.:26)、GT29-19(SEQ ID NO.:116)、GT29-20(SEQ ID NO.:118)、GT29-21(SEQ ID NO.:120)、GT29-22(SEQ ID NO.:122)、GT29-23(SEQ ID NO.:124)、GT29-24(SEQ ID NO.:28)、GT29-25(SEQ ID NO.:30)、GT29-36(SEQ ID NO.:90)、GT29-37(SEQ ID NO.:92)、GT29-42(SEQ ID NO.:94)、GT29-43(SEQ ID NO.:96)、GT29-45(SEQ ID NO.:98)、GT29-46(SEQ ID NO.:100)、PNUGT29-1(SEQ ID NO.:39)、PNUGT29-2(SEQ ID NO.:41)、PNUGT29-3(SEQ ID NO.:43)、PNUGT29-4(SEQ ID NO.:45)、PNUGT29-5(SEQ ID NO.:47)、PNUGT29-6(SEQ ID NO.:49)、PNUGT29-7(SEQ ID NO.:51)、PNUGT29-8(SEQ ID NO.:53)、PNUGT29-9(SEQ ID NO.:55)、PNUGT29-14(SEQ ID NO.:57)、PNUGT29-15(SEQ ID NO.:59)能特异和高效地催化四环三萜化合物底物的C-20位、C-6位或C3位第一个糖基的羟基糖基化或将原有的糖基进行糖基置换,以延伸糖链。
本发明的糖基转移酶特别能够分别将人参皂苷CK,DMG,F2,Rd,F1,Rh1和Rg1分别转化为具有其它活性的人参皂苷Rg3、人参皂苷Rd、人参皂苷Rb1、人参皂苷Rb3、皂苷DMGG、皂苷DMGX、绞股蓝皂苷LXXV、绞股蓝皂苷XVII、绞股蓝皂苷XIII、绞股蓝皂苷IX、三七皂苷U和、三七皂苷R1、和三七皂苷R2、三七皂苷R3、3-O-β-(D-xylopyranosyl)-β-(D-glucopyranosyl)-PPD;3-O-β-(D-xylopyranosyl)-β-(D-glucopyranosyl)-CK、20-O-Glucosylginsenoside Rf和Ginsenoside F3。
定义
如本文所用,术语“活性多肽”、“本发明的多肽及其衍生多肽”、“本发明的酶”、“糖基转移酶”可互换使用,均指GT29-32(SEQ ID NO.:4),GT29-33(SEQ ID NO.:6)、GT29-34(SEQ ID NO.:8)、GT29-4(SEQ ID NO.:12)、GT29-5(SEQ ID NO.:14)、GT29-7(SEQ ID NO.:16)、GT29-9(SEQ ID NO.:18),GT29-11(SEQ ID NO.:20)、GT29-13(SEQ ID NO.:22)、GT29-17(SEQ ID NO.:24)、GT29-18(SEQ ID NO.:26)、GT29-19(SEQ ID NO.:116)、GT29-20(SEQ ID NO.:118)、GT29-21(SEQ ID NO.:120)、GT29-22(SEQ ID NO.:122)、GT29-23(SEQ ID NO.:124)、GT29-24(SEQ ID NO.:28)、GT29-25(SEQ ID NO.:30)、GT29-36(SEQ ID NO.:90)、GT29-37(SEQ ID NO.:92)、GT29-42(SEQ ID NO.:94)、GT29-43(SEQ ID NO.:96)、GT29-45(SEQ ID NO.:98)、GT29-46(SEQ ID NO.:100)、PNUGT29-1(SEQ ID NO.:39)、PNUGT29-2(SEQ ID NO.:41)、PNUGT29-3(SEQ ID NO.:43)、PNUGT29-4(SEQ ID NO.:45)、PNUGT29-5(SEQ ID NO.:47)、PNUGT29-6(SEQ ID NO.:49)、PNUGT29-7(SEQ ID NO.:51)、PNUGT29-8(SEQ ID NO.:53)、PNUGT29-9(SEQ ID NO.:55)、PNUGT29-14(SEQ ID NO.:57)、PNUGT29-15(SEQ ID NO.:59)多肽及其衍生多肽。
如本文所用,“分离的多肽”或“活性多肽”是指所述多肽基本上不含天然与其相关的其它蛋白、脂类、糖类或其它物质。本领域的技术人员能用标准的蛋白质纯化技术纯化所述多肽。基本上纯的多肽在非还原聚丙烯酰胺凝胶上能产生单一的主带。所述多肽的纯度还可以用氨基酸序列进行进一步分析。
本发明的活性多肽可以是重组多肽、天然多肽、合成多肽。本发明的多肽可以是天然纯化的产物,或是化学合成的产物,或使用重组技术从原核或真核宿主(例如,细菌、酵母、植物)中产生。根据重组生产方案所用的宿主,本发明的多肽可以是糖基化的,或可以是非糖基化的。本发明的多肽还可包括或不包括起始的甲硫氨酸残基。
本发明还包括所述多肽的片段、衍生物和类似物。如本文所用,术语“片段”、“衍生物”和“类似物”是指基本上保持所述多肽相同的生物学功能或活性的多肽。
本发明的多肽片段、衍生物或类似物可以是(i)有一个或多个保守或非保守性氨基酸残基(优选保守性氨基酸残基)被取代的多肽,而这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的,或(ii)在一个或多个氨基酸残基中具有取代基团的多肽,或(iii)成熟多肽与另一个化合物(比如延长多肽半衰期的化合物,例如聚乙二醇)融合所形成的多肽,或(iv)附加的氨基酸序列融合到此多肽序列而 形成的多肽(如前导序列或分泌序列或用来纯化此多肽的序列或蛋白原序列,或与抗原IgG片段的形成的融合蛋白)。根据本文的教导,这些片段、衍生物和类似物属于本领域熟练技术人员公知的范围。
在本发明的活性多肽具有糖基转移酶活性,并且能够催化以下一种或多种反应:
(A)
其中,R1为H、单糖糖基或多糖糖基;R2为H或OH;R3为单糖糖基;R4为单糖糖基所述的多肽选自SEQ ID NO:4、6、8、39、41、43、45、47、49、51、53、55、57、59、98、100、116、118、120、122、或124或其衍生多肽。
在另一优选例中,所述的单糖包括葡萄糖(Glc),鼠李糖(Rha),乙酰基葡萄糖(Glc(6)Ac),阿拉伯呋喃糖(Araf),阿拉伯吡喃糖(Arap),或木糖(Xyl)等。
在另一优选例中,所述的多糖包括Glc(2-1)Glc,Glc(6-1)Glc,Glc(6)Ac,Glc(2-1)Rha,Glc(6-1)Arap,Glc(6-1)Xyl,Glc(6-1)Araf,Glc(3-1)Glc(3-1),Glc(2-1)Glu(6)Ac,Glc(6-1)Arap(4-1)Xyl,Glc(6-1)Arap(2-1)Xyl,或Glc(6-1)Arap(3-1)Xyl等2-4个单糖组成的多糖。
R1-R4经取代后的化合物如下表所示:
即当所述的R1为H,R2为OH,R3为葡萄糖基时,所述的式(I)化合物为人参皂苷CK(CK);
当R1和R2都为H,R3为葡萄糖基时,所述的式(I)化合物为人参皂苷DMG;
当R1为葡萄糖基,R2为OH,R3为葡萄糖基时,所述的式(I)化合物为人参皂苷F2(F2);或
当R1为两个葡萄糖基(Glc(2-1)Glc),R2为OH,R3为葡萄糖基时,所述的式(I)化合物为人参皂苷Rd;
(B)
其中,R1为H,糖基或多糖糖基,R2糖基,R3为糖基,所述的多肽选自SEQ ID NOs.:4或其衍生多肽;
R1-R3经取代后的化合物如下表所示:
底物 |
R1 |
R2 |
R3 |
产物 |
F1 |
H |
Glc |
Glc |
三七皂苷U |
Rg1 |
Glc |
Glc |
Glc |
三七皂苷R3 |
即当R1为H时,R2为葡萄糖基时,所述的式(III)化合物为人参皂苷F1(F1);或当R1和R2为葡萄糖基时,所述的式(III)化合物为人参皂苷Rg1(Rg1);
(C)
其中,R1和R2为H或者糖基,R3和R4为糖基。所述的多肽选自SEQ ID NOs.:12、14、16、18、20、22、24、26、28、30或其衍生多肽;
R1-R4经取代后的化合物如下表所示:
底物 |
R1 |
R2 |
R3 |
R4 |
产物 |
Rg1 |
H |
Glc |
Glc |
Xyl |
三七皂苷R1 |
Rg1 |
H |
Glc |
Glc |
Glc |
20-O-Glucosylginsenoside Rf |
Rh1 |
H |
H |
Glc |
Xyl |
三七皂苷R2 |
Rh1 |
H |
H |
Glc |
Glc |
人参皂苷Rf |
即当R1为H时,R2和R3为葡萄糖基时,所述的式(V)化合物为人参皂苷Rg1;
当R1和R2为H,R3为葡萄糖基时,所述的式(V)化合物为人参皂苷Rh1。(D)
其中,R1为糖基;R2和R3为OH或者H;R4为糖基或者H;R5为糖基,R5-R1-O为C3第一个糖基衍生的糖基;所述的多肽选自SEQ ID NOs.:26、28、30、39、41、43、45、47、49、51、53、55、57、59、98、100、116、118、120、122、或124或其衍生多肽;
即当R1为葡萄糖基;R2为H,R3为OH,R4为H,式(VII)化合物为Rh2;
R1为葡萄糖基;R2为H,R3为OH,R4为葡萄糖基,式(VII)化合物为F2;
R1为葡萄糖基;R2为H,R3为OH,R4为两个葡萄糖基,式(VII)化合物为绞股蓝皂苷Gypenoside XVII;
R1为葡萄糖基;R2为H,R3为OH,R4为一个葡萄糖基延伸一个木糖基,式(VII)化合物为绞股蓝皂苷Gypenoside IX;
(E)
其中,R1为糖基;R2和R3为OH或者H;R4为糖基或者H;R5为糖基,R5-R1-O为C3第一个糖基衍生的糖基;R6为糖基,R6-R1-O为C3第一个糖基衍生的糖基,所述的多肽选自SEQ ID NOs.:41、45、90、92、94或96或其衍生多肽;
R1为两个葡萄糖基,R2为H,R3为OH,R4为H,式(IX)化合物为Rg3。
R1为两个葡萄糖基,R2为H,R3为OH,R4为葡萄糖基,式(IX)化合物为Rd。
所述的多肽优选序列为如SEQ ID NO.:4、6、8、12、14、16、18、20、22、24、26、28、30、39、41、43、45、47、49、51、53、55、57、59、90、92、94、96、98、100、116、118、120、122、或124所示的多肽,该术语还包括具有与所示多肽具有相同功能的、SEQ ID NO.:4、6、8、12、14、16、18、20、22、24、26、28、30、39、41、43、45、47、49、51、53、55、57、59、90、92、94、96、98、100、116、118、120、122、或124序列的变异形式及衍生多肽。这些变异形式包括(但并不限于):一个或多个(通常为1-50个,较佳地1-30个,更佳地1-20个,最佳地1-10个)氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加一个或数个(通常为20个以内,较佳地为10个以内,更佳地为5个以内)氨基酸。例如,在本领域中,用性能相近或相似的氨基酸进行取代时,通常不会改变蛋白质的功能。又比如,在C末端和/或N末端添加一个或数个氨基酸通常也不会改变蛋白质的功能。该术语还包括人本发明多肽的活性片段和活性衍生物。本发明还提供所述多肽的类似物。这些类似物与天然本发明多肽多肽的差别可以是氨基酸序列上的差异,也可以是不影响序列的修饰形式上的差异,或者兼而有之。这些多肽包括天然或诱导的遗传变异体。诱导变异体可以通过各种技术得到,如通过辐射或暴露于诱变剂而产生随机诱变,还可通过定点诱变法或其他已知分子生物学的技术。类似物还包括具有不同于天然L-氨基酸的残基(如D-氨基酸)的类似物,以及具有非天然存在的或合成的氨基酸(如β、γ-氨基酸)的类似 物。应理解,本发明的多肽并不限于上述例举的代表性的多肽。
修饰(通常不改变一级结构)形式包括:体内或体外的多肽的化学衍生形式如乙酰化或羧基化。修饰还包括糖基化,如那些在多肽的合成和加工中或进一步加工步骤中进行糖基化修饰而产生的多肽。这种修饰可以通过将多肽暴露于进行糖基化的酶(如哺乳动物的糖基化酶或去糖基化酶)而完成。修饰形式还包括具有磷酸化氨基酸残基(如磷酸酪氨酸,磷酸丝氨酸,磷酸苏氨酸)的序列。还包括被修饰从而提高了其抗蛋白水解性能或优化了溶解性能的多肽。
本发明的GT29-32、GT29-33、GT29-34、GT29-4、GT29-5、GT29-7、GT29-9、GT29-11、GT29-13、GT29-17、GT29-18、GT29-19、GT29-20、GT29-21、GT29-22、GT29-23、GT29-24、GT29-25、GT29-32、GT29-33、GT29-34、GT29-36、GT29-37、GT29-42、GT29-43、GT29-45、GT29-46、PNUGT29-1、PNUGT29-2、PNUGT29-3、PNUGT29-4、PNUGT29-5、PNUGT29-6、PNUGT29-7、PNUGT29-8、PNUGT29-9、PNUGT29-14或PNUGT29-15蛋白的氨基端或羧基端还可含有一个或多个多肽片段,作为蛋白标签。任何合适的标签都可以用于本发明。例如,所述的标签可以是FLAG、HA、HA1、c-Myc、Poly–His、Poly-Arg、Strep-TagII、AU1、EE、T7、4A6、ε、B、gE、以及Ty1。这些标签可用于对蛋白进行纯化。表1列出了其中的一些市售标签。
表1
为了使翻译的蛋白分泌表达(如分泌到细胞外),还可在所述GT29-32、GT29-33、GT29-34、GT29-4、GT29-5、GT29-7、GT29-9、GT29-11、GT29-13、GT29-17、GT29-18、GT29-19、GT29-20、GT29-21、GT29-22、GT29-23、GT29-24、GT29-25、GT29-32、GT29-33、GT29-34、GT29-36、GT29-37、GT29-42、GT29-43、GT29-45、GT29-46、PNUGT29-1、PNUGT29-2、PNUGT29-3、PNUGT29-4、PNUGT29-9、PNUGT29-14或PNUGT29-15的氨基酸氨基末端添加上信号肽序列,如pelB信号肽 等。信号肽在多肽从细胞内分泌出来的过程中可被切去。
本发明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。编码成熟多肽的编码区序列可以与SEQ ID NO.:3、5、7、11、13、15、17、19、21、23、25、27、29、38、40、42、44、46、48、50、52、54、56、58、89、91、93、95、97、99、115、117、119、121、或123所示的编码区序列相同或者是简并的变异体。如本文所用,“简并的变异体”在本发明中是指编码具有SEQ ID NO.:4、6、8、12、14、16、18、20、22、24、26、28、30、39、41、43、45、47、49、51、53、55、57、59、90、92、94、96、98、100、116、118、120、122、或124的蛋白质,但与SEQ ID NO.:3、5、7、11、13、15、17、19、21、23、25、27、29、38、40、42、44、46、48、50、52、54、56、58、89、91、93、95、97、99、115、117、119、121、或123分别所示的编码区序列有差别的核酸序列。
编码SEQ ID NO.:4、6、8、12、14、16、18、20、22、24、26、28、30、39、41、43、45、47、49、51、53、55、57、59、90、92、94、96、98、100、116、118、120、122、或124的成熟多肽的多核苷酸包括:只编码成熟多肽的编码序列;成熟多肽的编码序列和各种附加编码序列;成熟多肽的编码序列(和任选的附加编码序列)以及非编码序列。
术语“编码多肽的多核苷酸”可以是包括编码此多肽的多核苷酸,也可以是还包括附加编码和/或非编码序列的多核苷酸。
本发明还涉及上述多核苷酸的变异体,其编码与本发明有相同的氨基酸序列的多肽或多肽的片段、类似物和衍生物。此多核苷酸的变异体可以是天然发生的等位变异体或非天然发生的变异体。这些核苷酸变异体包括取代变异体、缺失变异体和插入变异体。如本领域所知的,等位变异体是一个多核苷酸的替换形式,它可能是一个或多个核苷酸的取代、缺失或插入,但不会从实质上改变其编码的多肽的功能。
本发明还涉及与上述的序列杂交且两个序列之间具有至少50%,较佳地至少70%,更佳地至少80%、85%、90%、95%相同性的多核苷酸。本发明特别涉及在严格条件(或严紧条件)下与本发明所述多核苷酸可杂交的多核苷酸。在本发明中,“严格条件”是指:(1)在较低离子强度和较高温度下的杂交和洗脱,如0.2×SSC,0.1%SDS,60℃;或(2)杂交时加有变性剂,如50%(v/v)甲酰胺,0.1%小牛血清/0.1%Ficoll,42℃等; 或(3)仅在两条序列之间的相同性至少在90%以上,更好是95%以上时才发生杂交。并且,可杂交的多核苷酸编码的多肽与SEQ ID NO.:4、6、8、12、14、16、18、20、22、24、26、28、30、39、41、43、45、47、49、51、53、55、57、59、90、92、94、96、98、100、116、118、120、122、或124所示的成熟多肽有相同的生物学功能和活性。
本发明还涉及与上述的序列杂交的核酸片段。如本文所用,“核酸片段”的长度至少含15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100个核苷酸以上。核酸片段可用于核酸的扩增技术(如PCR)以确定和/或分离编码GT29-32、GT29-33、GT29-34、GT29-4、GT29-5、GT29-7、GT29-9、GT29-11、GT29-13、GT29-17、GT29-18、GT29-19、GT29-20、GT29-21、GT29-22、GT29-23、GT29-24、GT29-25、GT29-32、GT29-33、GT29-34、GT29-36、GT29-37、GT29-42、GT29-43、GT29-45、GT29-46、PNUGT29-1、PNUGT29-2、PNUGT29-3、PNUGT29-4、PNUGT29-5、PNUGT29-6、PNUGT29-7、PNUGT29-8、PNUGT29-9、PNUGT29-14或PNUGT29-15蛋白的多聚核苷酸。
本发明中的多肽和多核苷酸优选以分离的形式提供,更佳地被纯化至均质。
本发明的GT29-32、GT29-33、GT29-34、GT29-4、GT29-5、GT29-7、GT29-9、GT29-11、GT29-13、GT29-17、GT29-18、GT29-19、GT29-20、GT29-21、GT29-22、GT29-23、GT29-24、GT29-25、GT29-32、GT29-33、GT29-34、GT29-36、GT29-37、GT29-42、GT29-43、GT29-45、GT29-46、PNUGT29-1、PNUGT29-2、PNUGT29-3、PNUGT29-4、PNUGT29-5、PNUGT29-6、PNUGT29-7、PNUGT29-8、PNUGT29-9、PNUGT29-14或PNUGT29-15核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
此外,还可用人工合成的方法来合成有关序列,尤其是片段长度较短时。通常,通过先合成多个小片段,然后再进行连接可获得序列很长的片段。
目前,已经可以完全通过化学合成来得到编码本发明蛋白(或其片段,或其衍生物)的DNA序列。然后可将该DNA序列引入本领域中已知的各种现有的DNA分子(或如载体)和细胞中。此外,还可通过化学合成将突变引入本发明蛋白序列中。
应用PCR技术扩增DNA/RNA的方法被优选用于获得本发明的基因。特别是很难从文库中得到全长的cDNA时,可优选使用RACE法(RACE-cDNA末端快速扩增法),用于PCR的引物可根据本文所公开的本发明的序列信息适当地选择,并可用常规方法合成。可用常规方法如通过凝胶电泳分离和纯化扩增的DNA/RNA片段。
本发明也涉及包含本发明的多核苷酸的载体,以及用本发明的载体或GT29-32、GT29-33、GT29-34、GT29-4、GT29-5、GT29-7、GT29-9、GT29-11、GT29-13、GT29-17、GT29-18、GT29-19、GT29-20、GT29-21、GT29-22、GT29-23、GT29-24、GT29-25、GT29-32、GT29-33、GT29-34、GT29-36、GT29-37、GT29-42、GT29-43、GT29-45、GT29-46、PNUGT29-1、PNUGT29-2、PNUGT29-3、PNUGT29-4、PNUGT29-5、PNUGT29-6、PNUGT29-7、PNUGT29-8、PNUGT29-9、PNUGT29-14或PNUGT29-15蛋白编码序列经基因工程产生的宿主细胞,以及经重组技术产生本发明所述多肽的方法。
通过常规的重组DNA技术,可利用本发明的多聚核苷酸序列可用来表达或生产重组的GT29-32、GT29-33、GT29-34、GT29-4、GT29-5、GT29-7、GT29-9、GT29-11、GT29-13、GT29-17、GT29-18、GT29-19、GT29-20、GT29-21、GT29-22、GT29-23、GT29-24、GT29-25、GT29-32、GT29-33、GT29-34、GT29-36、GT29-37、GT29-42、GT29-43、GT29-45、GT29-46、PNUGT29-1、PNUGT29-2、PNUGT29-3、PNUGT29-4、PNUGT29-5、PNUGT29-6、PNUGT29-7、PNUGT29-8、PNUGT29-9、PNUGT29-14或PNUGT29-15多肽。一般来说有以下步骤:
(1).用本发明的编码GT29-32、GT29-33、GT29-34、GT29-4、GT29-5、GT29-7、GT29-9、GT29-11、GT29-13、GT29-17、GT29-18、GT29-19、GT29-20、GT29-21、GT29-22、GT29-23、GT29-24、GT29-25、GT29-32、GT29-33、GT29-34、GT29-36、GT29-37、GT29-42、GT29-43、GT29-45、GT29-46、PNUGT29-1、PNUGT29-2、PNUGT29-3、PNUGT29-4、PNUGT29-5、PNUGT29-6、PNUGT29-7、PNUGT29-8、 PNUGT29-9、PNUGT29-14或PNUGT29-15多肽的多核苷酸(或变异体),或用含有该多核苷酸的重组表达载体转化或转导合适的宿主细胞;
(2).在合适的培养基中培养的宿主细胞;
(3).从培养基或细胞中分离、纯化蛋白质。
本发明中,GT29-32、GT29-33、GT29-34、GT29-4、GT29-5、GT29-7、GT29-9、GT29-11、GT29-13、GT29-17、GT29-18、GT29-19、GT29-20、GT29-21、GT29-22、GT29-23、GT29-24、GT29-25、GT29-32、GT29-33、GT29-34、GT29-36、GT29-37、GT29-42、GT29-43、GT29-45、GT29-46、PNUGT29-1、PNUGT29-2、PNUGT29-3、PNUGT29-4、PNUGT29-9、PNUGT29-14或PNUGT29-15多核苷酸序列可插入到重组表达载体中。术语“重组表达载体”指本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒如腺病毒、逆转录病毒或其他载体。只要能在宿主体内复制和稳定,任何质粒和载体都可以用。表达载体的一个重要特征是通常含有复制起点、启动子、标记基因和翻译控制元件。
本领域的技术人员熟知的方法能用于构建含GT29-32、GT29-33、GT29-34、GT29-4、GT29-5、GT29-7、GT29-9、GT29-11、GT29-13、GT29-17、GT29-18、GT29-19、GT29-20、GT29-21、GT29-22、GT29-23、GT29-24、GT29-25、GT29-32、GT29-33、GT29-34、GT29-36、GT29-37、GT29-42、GT29-43、GT29-45、GT29-46、PNUGT29-1、PNUGT29-2、PNUGT29-3、PNUGT29-4、PNUGT29-9、PNUGT29-14或PNUGT29-15编码DNA序列和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等。所述的DNA序列可有效连接到表达载体中的适当启动子上,以指导mRNA合成。这些启动子的代表性例子有:大肠杆菌的lac或trp启动子;λ噬菌体PL启动子;真核启动子包括CMV立即早期启动子、HSV胸苷激酶启动子、早期和晚期SV40启动子、反转录病毒的LTRs和其他一些已知的可控制基因在原核或真核细胞或其病毒中表达的启动子。表达载体还包括翻译起始用的核糖体结合位点和转录终止子。
此外,表达载体优选地包含一个或多个选择性标记基因,以提供用于选择转化的宿主细胞的表型性状,如真核细胞培养用的二氢叶酸还原酶、新霉素抗性以及绿色荧光蛋白(GFP),或用于大肠杆菌的四环素或氨苄青霉素抗性。
包含上述的适当DNA序列以及适当启动子或者控制序列的载体,可以用于转化适 当的宿主细胞,以使其能够表达蛋白质。
宿主细胞可以是原核细胞,如细菌细胞;或是低等真核细胞,如酵母细胞;或是高等真核细胞,如哺乳动物细胞。代表性例子有:大肠杆菌,链霉菌属;鼠伤寒沙门氏菌的细菌细胞;真菌细胞如酵母;植物细胞;果蝇S2或Sf9的昆虫细胞;CHO、COS、293细胞、或Bowes黑素瘤细胞的动物细胞等。
本发明的多核苷酸在高等真核细胞中表达时,如果在载体中插入增强子序列时将会使转录得到增强。增强子是DNA的顺式作用因子,通常大约有10到300个碱基对,作用于启动子以增强基因的转录。可举的例子包括在复制起始点晚期一侧的100到270个碱基对的SV40增强子、在复制起始点晚期一侧的多瘤增强子以及腺病毒增强子等。
本领域一般技术人员都清楚如何选择适当的载体、启动子、增强子和宿主细胞。
用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物如大肠杆菌时,能吸收DNA的感受态细胞可在指数生长期后收获,用CaCl2法处理,所用的步骤在本领域众所周知。另一种方法是使用MgCl2。如果需要,转化也可用电穿孔的方法进行。当宿主是真核生物,可选用如下的DNA转染方法:磷酸钙共沉淀法,常规机械方法如显微注射、电穿孔、脂质体包装等。
获得的转化子可以用常规方法培养,表达本发明的基因所编码的多肽。根据所用的宿主细胞,培养中所用的培养基可选自各种常规培养基。在适于宿主细胞生长的条件下进行培养。当宿主细胞生长到适当的细胞密度后,用合适的方法(如温度转换或化学诱导)诱导选择的启动子,将细胞再培养一段时间。
在上面的方法中的重组多肽可在细胞内、或在细胞膜上表达、或分泌到细胞外。如果需要,可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化重组的蛋白。这些方法是本领域技术人员所熟知的。这些方法的例子包括但并不限于:常规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(HPLC)和其它各种液相层析技术及这些方法的结合。
应用
本发明涉及的活性多肽或糖基转移酶可用于人工合成已知人参皂苷及新人参皂 苷及其衍生物,能够将CK,DMG,F2,Rd,F1,Rh1和Rg1等分别转化为人参皂苷Rg3、人参皂苷Rd、人参皂苷Rb1、人参皂苷Rb3、皂苷DMGG、皂苷DMGX、绞股蓝皂苷LXXV、绞股蓝皂苷XVII、绞股蓝皂苷XIII、绞股蓝皂苷IX、三七皂苷U和、三七皂苷R1、和三七皂苷R2、三七皂苷R3、3-O-β-(D-xylopyranosyl)-β-(D-glucopyranosyl)-PPD;3-O-β-(D-xylopyranosyl)-β-(D-glucopyranosyl)-CK、20-O-Glucosylginsenoside Rf和Ginsenoside F3。
本发明的主要优点:
(1)本发明的糖基转移酶可以特异性和高效地将四环三萜化合物底物的C-20位的第一个糖基上/或C-6或C-3位的第一个糖基上转入糖基或置换糖基以延伸糖链;
(2)本发明的糖基转移酶特别能够分别将CK,DMG,F2,Rd,F1,Rh1和Rg1转化为具有活性的人参皂苷Rg3、人参皂苷Rd、人参皂苷Rb1、人参皂苷Rb3、皂苷DMGG、皂苷DMGX、绞股蓝皂苷LXXV、绞股蓝皂苷XVII、绞股蓝皂苷XIII、绞股蓝皂苷IX、三七皂苷U和、三七皂苷R1、和三七皂苷R2、三七皂苷R3、3-O-β-(D-xylopyranosyl)-β-(D-glucopyranosyl)-PPD;3-O-β-(D-xylopyranosyl)-β-(D-glucopyranosyl)-CK、20-O-Glucosylginsenoside Rf和Ginsenoside F3。.
(3)人参皂苷Rb1具有保护神经细胞和抗炎症抗氧化的功效;人参皂苷Rb3具有减缓心肌缺血和抗抑郁的功效。三七皂苷R1是三七皂苷的主要活性成分,具有抗炎的功效。三七皂苷R2具有神经保护功效。
实施例1 人参糖基转移酶及其编码基因的分离
提取人参RNA并进行反转录,获得人参的cDNA。以该cDNA为模板使用引物对1(SEQ ID NO.:1和SEQ ID NO.:2)或者引物对2(SEQ ID NO.:9和SEQ ID NO.:10)或者引物对3(SEQ ID NO.:113和SEQ ID NO.:114)进行PCR扩增,获得1.4-1.5kb的扩增产物。DNA聚合酶选用宝生物工程有限公司的高保真的KOD DNA聚合酶。PCR产物经琼脂糖凝胶电泳检测。
在紫外下照射,切下目标DNA条带。然后采用Axygen Gel Extraction Kit(AEYGEN公司)从琼脂糖凝胶中回收DNA即为扩增出的DNA片段。将此DNA片段用宝生物工程有限公司的rTaq DNA聚合酶在末端加A后与市售的克隆载体pMD18-T Vector连接,连接产物转化市售的大肠杆菌EPI300感受态细胞,将转化后的大肠杆菌菌液涂布在添加AMP 50ug/mL、IPTG0.5mM、X-Gal 25μg/mL的LB平板上,并进一步通过PCR和酶切验证重组克隆。选取若干个克隆提取重组质粒后进行测序,获得29个不同的核酸序列,分别命名为GT29-32(SEQ ID NO.: 3),GT29-33(SEQ ID NO.:5)、GT29-34(SEQ ID NO.:7)、GT29-4(SEQ ID NO.:11)、GT29-5(SEQ ID NO.:13)、GT29-7(SEQ ID NO.:15)、GT29-9(SEQ ID NO.:17),GT29-11(SEQ ID NO.:19)、GT29-13(SEQ ID NO.:21)、GT29-17(SEQ ID NO.:23)、GT29-18(SEQ ID NO.:25)、GT29-19(SEQ ID NO.:116)、GT29-20(SEQ ID NO.:118)、GT29-21(SEQ ID NO.:120)、GT29-22(SEQ ID NO.:122)、GT29-23(SEQ ID NO.:124)、GT29-24(SEQ ID NO.:27)、GT29-25(SEQ ID NO.:29)、GT29-36(SEQ ID NO.:89),GT29-37(SEQ ID NO.:91),GT29-42(SEQ ID NO.:93),GT29-42(SEQ ID NO.:95)、GT29-45(SEQ ID NO.:97)和GT29-46(SEQ ID NO.:99)。用BESTORF软件寻找ORF。通过序列比对,扩展产物都具有糖基转移酶第1家族保守功能域,表明是糖基转移酶基因。
GT29-32:糖基转移酶基因GT29-32编码一个含有442个氨基酸的蛋白质GT29-32,具有序列表中SEQ ID NO:4所示的氨基酸序列。用软件预测到该蛋白质的理论分子量大小为49.2kDa,等电点pI为6.09。该糖基转移酶与已有功能鉴定的糖基转移酶UGTPg29(Genbank accession AKA44579.1)的氨基酸序列一致性为92%。
GT29-33:糖基转移酶基因GT29-33编码一个含有448个氨基酸的蛋白质GT29-33,具有序列表中SEQ ID NO:6所示的氨基酸序列。用软件预测到该蛋白质的理论分子量大小为50.0kDa,等电点pI为6.77。该糖基转移酶与已有功能鉴定的糖基转移酶UGTPg29的氨基酸序列一致性为90%。
GT29-34:糖基转移酶基因GT29-34编码一个含有446个氨基酸的蛋白质GT29-34,具有序列表中SEQ ID NO:8所示的氨基酸序列。用软件预测到该蛋白质的理论分子量大小为49.7kDa,等电点pI为6.23。该糖基转移酶与已有功能鉴定的糖基转移酶UGTPg29的氨基酸序列一致性为90%。
GT29-4:糖基转移酶基因GT29-4编码一个含有446个氨基酸的蛋白质GT29-4,具有序列表中SEQ ID NO:12所示的氨基酸序列。用软件预测到该蛋白质的理论分子量大小为49.8kDa,等电点pI为5.63。该糖基转移酶与已有功能鉴定的糖基转移酶UGTPg29的氨基酸序列一致性为92%。
GT29-5:糖基转移酶基因GT29-5编码一个含有446个氨基酸的蛋白质GT29-5,具有序列表中SEQ ID NO:14所示的氨基酸序列。用软件预测到该蛋白质的理论分子量大小为49.7kDa,等电点pI为5.93。该糖基转移酶与已有功能鉴定的糖基转移酶UGTPg29的氨基酸序列一致性为93%。
GT29-7:糖基转移酶基因GT29-7编码一个含有446个氨基酸的蛋白质GT29-7,具有序列表中SEQ ID NO:16所示的氨基酸序列。用软件预测到该蛋白质的理论分子量大小为49.8kDa,等电点pI为5.8。该糖基转移酶与已有功能鉴定的糖基转移酶UGTPg29的氨基酸序列一致性为92%。
GT29-9:糖基转移酶基因GT29-9编码一个含有446个氨基酸的蛋白质GT29-9,具有序列表中SEQ ID NO:18所示的氨基酸序列。用软件预测到该蛋白质的理论分子量大小为49.8kDa,等电点pI为5.93。该糖基转移酶与已有功能鉴定的糖基转移酶UGTPg29的氨基酸序列一致性为92%。
GT29-11:糖基转移酶基因GT29-11编码一个含有446个氨基酸的蛋白质GT29-11,具有序列表中SEQ ID NO:20所示的氨基酸序列。用软件预测到该蛋白质的理论分子量大小为49.9kDa,等电点pI为5.90。该糖基转移酶与已有功能鉴定的糖基转移酶UGTPg29的氨基酸序列一致性为91%。
GT29-13:糖基转移酶基因GT29-13编码一个含有446个氨基酸的蛋白质GT29-13,具有序列表中SEQ ID NO:22所示的氨基酸序列。用软件预测到该蛋白质的理论分子量大小为49.9kDa,等电点pI为5.93。该糖基转移酶与已有功能鉴定的糖基转移酶UGTPg29的氨基酸序列一致性为91%。
GT29-17:糖基转移酶基因GT29-17编码一个含有442个氨基酸的蛋白质GT29-17,具有序列表中SEQ ID NO:24所示的氨基酸序列。用软件预测到该蛋白质的理论分子量大小为49.3kDa,等电点pI为5.35。该糖基转移酶与已有功能鉴定的糖基转移酶UGTPg29的氨基酸序列一致性为93%。
GT29-18:糖基转移酶基因GT29-18编码一个含有446个氨基酸的蛋白质GT29-18,具有序列表中SEQ ID NO:26所示的氨基酸序列。用软件预测到该蛋白质的理论分子量大小为49.9kDa,等电点pI为5.93。该糖基转移酶与已有功能鉴定的糖基转移酶UGTPg29的氨基酸序列一致性为91%。
GT29-24:糖基转移酶基因GT29-24编码一个含有446个氨基酸的蛋白质GT29-24,具有序列表中SEQ ID NO:28所示的氨基酸序列。用软件预测到该蛋白质的理论分子量大小为49.9kDa,等电点pI为5.93。该糖基转移酶与已有功能鉴定的糖基转移酶UGTPg29的氨基酸序列一致性为91%。
GT29-25:糖基转移酶基因GT29-25编码一个含有446个氨基酸的蛋白质 GT29-25,具有序列表中SEQ ID NO:30所示的氨基酸序列。用软件预测到该蛋白质的理论分子量大小为49.9kDa,等电点pI为5.93。该糖基转移酶与已有功能鉴定的糖基转移酶UGTPg29的氨基酸序列一致性为91%。
GT29-19:糖基转移酶基因GT29-19编码一个含有442个氨基酸的蛋白质GT29-19,具有序列表中SEQ ID NO:116所示的氨基酸序列。用软件预测到该蛋白质的理论分子量大小为49.1kDa,等电点pI为5.47。
GT29-20:糖基转移酶基因GT29-20编码一个含有442个氨基酸的蛋白质GT29-20,具有序列表中SEQ ID NO:118所示的氨基酸序列。用软件预测到该蛋白质的理论分子量大小为49.1kDa,等电点pI为5.93。
GT29-21:糖基转移酶基因GT29-21编码一个含有442个氨基酸的蛋白质GT29-21,具有序列表中SEQ ID NO:120所示的氨基酸序列。用软件预测到该蛋白质的理论分子量大小为49.1kDa,等电点pI为5.80。
GT29-22:糖基转移酶基因GT29-22编码一个含有442个氨基酸的蛋白质GT29-22,具有序列表中SEQ ID NO:122所示的氨基酸序列。用软件预测到该蛋白质的理论分子量大小为49.1kDa,等电点pI为5.93。
GT29-23:糖基转移酶基因GT29-23编码一个含有442个氨基酸的蛋白质GT29-23,具有序列表中SEQ ID NO:124所示的氨基酸序列。用软件预测到该蛋白质的理论分子量大小为49.0kDa,等电点pI为5.61。
GT29-36:糖基转移酶基因GT29-36编码一个含有442个氨基酸的蛋白质GT29-36,具有序列表中SEQ ID NO:102所示的氨基酸序列。用软件预测到该蛋白质的理论分子量大小为49.1kDa,等电点pI为5.93。
GT29-37:糖基转移酶基因GT29-37编码一个含有442个氨基酸的蛋白质GT29-37,具有序列表中SEQ ID NO:104所示的氨基酸序列。用软件预测到该蛋白质的理论分子量大小为49.1kDa,等电点pI为5.62。
GT29-42:糖基转移酶基因GT29-42编码一个含有444个氨基酸的蛋白质GT29-42,具有序列表中SEQ ID NO:106所示的氨基酸序列。用软件预测到该蛋白质的理论分子量大小为49.4kDa,等电点pI为6.16。
GT29-43:糖基转移酶基因GT29-43编码一个含有442个氨基酸的蛋白质GT29-43,具有序列表中SEQ ID NO:108所示的氨基酸序列。用软件预测到该蛋 白质的理论分子量大小为49.1kDa,等电点pI为5.78。
GT29-45:糖基转移酶基因GT29-45编码一个含有448个氨基酸的蛋白质GT29-45,具有序列表中SEQ ID NO:110所示的氨基酸序列。用软件预测到该蛋白质的理论分子量大小为50.0kDa,等电点pI为7.25。
GT29-46:糖基转移酶基因GT29-46编码一个含有442个氨基酸的蛋白质GT29-46,具有序列表中SEQ ID NO:112所示的氨基酸序列。用软件预测到该蛋白质的理论分子量大小为49.1kDa,等电点pI为5.48。
实施例2 糖基转移酶基因GT29-32,GT29-33和GT29-34在大肠杆菌中的表达
以实施例1构建的含有GT29-32、GT29-33和GT29-34基因的质粒GT29-32-pMD18T、GT29-33-pMD18T和GT29-34-pMD18T为模板,以表1所示的引物扩增目标基因GT29-32、GT29-33和GT29-34。
表达载体pET28a(购自Merck公司)用NcoI/SalI酶切后,将GT29-32、GT29-33和GT29-34克隆到pET28a中(一步法克隆试剂盒,购自诺维赞),构建大肠杆菌表达载体GT29-32-pET28a、GT29-33-pET28a和GT29-34-pET28a。利用pET28a上的6×His tag序列使重组蛋白GT29-32、GT29-33和GT29-34的C末端带有6×His tag标签。质粒分别转化到市售的E.coli BL21中,构建重组菌株BL21-GT29-32、BL21-GT29-33和BL21-GT29-34。接种一个重组子到LB培养基中,37℃ 200rpm培养至OD600约0.6-0.8,使菌液降温至4℃,加入终浓度为100μM的IPTG,18℃ 120rpm诱导表达16h。4℃离心收集菌体,超声破碎细胞,4℃ 12000g离心10min收集细胞裂解液上清,取样品进行SDS-PAGE电泳和western blot。SDS-PAGE显示GT29-32-pET28a、GT29-33-pET28a和GT29-34-pET28a的重组转化子与空载体pET28a重组转化子细胞裂解液没有明显区别,可溶表达量并不明显(图1A)。抗6×His tag Western Blot(图1B)表明,在45-55kD之间有明显条带,糖基转移酶GT29-32,GT29-33和GT29-34在大肠杆菌中有少量可溶表达。
表1,扩增基因所用的引物
实施例3 GT29-32,GT29-33和GT29-34的体外转糖基活性和产物鉴定
以实施例2中重组大肠杆菌BL21-GT29-32、BL21-GT29-33和BL21-GT29-34的细胞裂解液上清为粗酶液来进行转糖基反应,转空载体pET28a重组大肠杆菌的细胞裂解液作为对照。
如图2所示:以原人参二醇型人参皂苷CK为糖基受体,UDP-glucose为糖基供体,GT29-32和GT29-34能够催化其生成一种新的产物;
如图3所示:以人参皂苷Rd为糖基受体,UDP-glucose为糖基供体,GT29-32,GT29-33和GT29-34能够催化其生成Rb1。HPLC的结果与TLC的结果一致。
因此,GT29-32和GT29-34能够催化CK的C20-O-Glc延伸一分子葡萄糖生成人参皂苷Gypenoside LXXV。以UDP-xylose为糖基供体时,GT29-32可以催化Rd生成三种产物。其中一种产物在TLC上的迁移率与Rb3一致,即GT29-32能够在C20-O-Glc延伸一分子木糖生成Rb3(图2)。HPLC的结果与TLC一致,GT29-32催化Rd和UDP-xylose生成三种产物(图4)。
以原人参三醇型人参皂苷F1为糖基受体,UDP-glucose为糖基供体,GT29-32能催化生成一种新产物,推测也是在F1的C20-O-Glc延伸一分子葡萄糖,产物为Notoginsenoside R3(图5和图6)。
以原人参二醇型人参皂苷CK为糖基受体,UDP-阿拉伯糖为糖基供体,GT29-32,GT29-33和GT29-34能催化CK的C-20第一个糖基延伸一个阿拉伯糖基生成Ginsenoside F3,其中GT29-32的活性最强(图17)。
实施例4 糖基转移酶基因GT29-4,GT29-5,GT29-7,GT29-9,GT29-11,GT29-13,GT29-17,GT29-18,GT29-24和GT29-25在大肠杆菌中的表达
以实施例1构建的含有GT29-4、GT29-5、GT29-7、GT29-9、GT29-11、GT29-13、GT29-17、GT29-18、GT29-24和GT29-25基因的质粒GT29-4-pMD18T、GT29-5-pMD18T、GT29-7-pMD18T、GT29-9-pMD18T、GT29-11-pMD18T、GT29-13-pMD18T、GT29-17-pMD18T、GT29-18-pMD18T、GT29-24-pMD18T和GT29-25-pMD18T为模板,以表1所示引物扩增目标基因GT29-4、GT29-5、GT29-7、GT29-9、GT29-11、GT29-13、GT29-17、GT29-18、GT29-24和GT29-25。表达载体pET28a(购自Merck公司)用NcoI/SalI酶切后,将GT29-11、GT29-13、GT29-17、GT29-18、GT29-24和GT29-25克隆到pET28a中(一步法克隆试剂盒,购自诺维赞),构建大肠杆菌表达载体GT29-4-pET28a、GT29-5-pET28a、GT29-7-pET28a、GT29-9-pET28a、GT29-11-pET28a、GT29-13-pET28a、GT29-17-pET28a、GT29-18-pET28a、GT29-24-pET28a和GT29-25-pET28a。
利用pET28a上的6×His tag序列使重组蛋白GT29-4-pET28a、GT29-5-pET28a、GT29-7-pET28a、GT29-9-pET28a、GT29-11-pET28a、GT29-13-pET28a、GT29-17-pET28a、GT29-18-pET28a、GT29-24和GT29-25的C末端带有6×His tag标签。质粒分别转化到市售的E.coli BL21中,构建重组菌株BL21-GT29-4、 BL21-GT29-5、BL21-GT29-7、BL21-GT29-9、BL21-GT29-11、BL21-GT29-13、BL21-GT29-17、BL21-GT29-18、BL21-GT29-24和BL21-GT29-25。接种一个重组子到LB培养基中,37℃ 200rpm培养至OD600约0.6-0.8,使菌液降温至4℃,加入终浓度为100μM的IPTG,18℃ 120rpm诱导表达16h。4℃离心收集菌体,超声破碎细胞,4℃ 12000g离心10min收集细胞裂解液上清,取样品进行SDS-PAGE电泳和western blot。
SDS-PAGE显示GT29-4-pET28a、GT29-5-pET28a、GT29-7-pET28a、GT29-9-pET28a、GT29-11-pET28a、GT29-13-pET28a、GT29-17-pET28a、GT29-18-pET28a、GT29-24-pET28a和GT29-25-pET28a的重组转化子与空载体pET28a重组转化子细胞裂解液没有明显区别,可溶表达量并不明显。抗6×His tag Western Blot表明,在45-55kD之间有明显条带,糖基转移酶GT29-4、GT29-5、GT29-7、GT29-9、GT29-11、GT29-13、GT29-17、GT29-18、GT29-24和GT29-25在大肠杆菌中有少量可溶表达。
实施例5 GT29-4、GT29-5、GT29-7、GT29-9、GT29-11、GT29-13、GT29-17、GT29-18、GT29-24和GT29-25的体外转糖基活性和产物鉴定
以实施例2中重组大肠杆菌BL21-GT29-4、BL21-GT29-5、BL21-GT29-7、BL21-GT29-9、BL21-GT29-11、BL21-GT29-13、BL21-GT29-17、BL21-GT29-18、BL21-GT29-24和BL21-GT29-25的细胞裂解液上清为粗酶液来进行转糖基反应,转空载体pET28a重组大肠杆菌的细胞裂解液作为对照。
如图7所示,以原人参二醇型人参皂苷Rg1为糖基受体,UDP-xylose为糖基供体,GT29-4、GT29-5、GT29-7、GT29-9、GT29-11、GT29-13、GT29-17、GT29-18、GT29-24和GT29-25能够催化其生成三七皂苷R1。HPLC的结果与TLC的结果一致(图8和图9)。因此,GT29-4、GT29-5、GT29-7、GT29-9、GT29-11、GT29-13、GT29-17、GT29-18、GT29-24和GT29-25能够催化Rg1的C6-O-Glc延伸一分子木糖生成三七皂苷R1。
如图10所示,GT29-24和GT29-25能够以原人参二醇型人参皂苷Rh2为糖基受体,UDP-glucose为糖基供体,催化Rh2的C-3位糖基延伸一个葡萄糖基生产人参皂苷Rg3。当底物更换成F2时,GT29-24和GT29-25还能进一步催化F2的C-3位糖基延伸一个葡萄糖基生产人参皂苷Rd。
实施例6 三七糖基转移酶及其编码基因的分离
提取三七RNA并进行反转录,获得三七的cDNA。以该cDNA为模板使用引物对1(SEQ ID NO.:82和SEQ ID NO.:83),引物对2(SEQ ID NO.:84和SEQ ID NO.:85)引物对3(SEQ ID NO.:84和SEQ ID NO.:86)引物对4(SEQ ID NO.:87 和SEQ ID NO.:88,)进行PCR扩增,获得1.4-1.5kb的扩增产物。DNA聚合酶选用宝生物工程有限公司的高保真的KOD DNA聚合酶。PCR产物经琼脂糖凝胶电泳检测。
是否可写参照实施例1选取若干个克隆提取重组质粒后进行测序,获得14个不同的核酸序列,分别命名为PNUGT29-1(SEQ ID NO.:38),PNUGT29-2(SEQ ID NO.:40)、PNUGT29-3(SEQ ID NO.:42)、PNUGT29-4(SEQ ID NO.:44)、PNUGT29-5(SEQ ID NO.:46)、PNUGT29-6(SEQ ID NO.:48)、PNUGT29-7(SEQ ID NO.:50),PNUGT29-8(SEQ ID NO.:52)、PNUGT29-9(SEQ ID NO.:54)PNUGT29-14(SEQ ID NO.:56)和PNUGT29-15(SEQ ID NO.:58)。用BESTORF软件寻找ORF。通过序列比对,扩展产物都具有糖基转移酶第1家族保守功能域,表明是糖基转移酶基因。
PNUGT29-1:糖基转移酶基因PNUGT29-1编码一个含有447个氨基酸的蛋白质PNUGT29-1,具有序列表中SEQ ID NO:39所示的氨基酸序列。用软件预测到该蛋白质的理论分子量大小为49.688kDa,等电点pI为6.58。
PNUGT29-2:糖基转移酶基因PNUGT29-2编码一个含有442个氨基酸的蛋白质PNUGT29-2,具有序列表中SEQ ID NO:41所示的氨基酸序列。用软件预测到该蛋白质的理论分子量大小为49.118kDa,等电点pI为6.20。
PNUGT29-3:糖基转移酶基因PNUGT29-3编码一个含有447个氨基酸的蛋白质PNUGT29-3,具有序列表中SEQ ID NO:43所示的氨基酸序列。用软件预测到该蛋白质的理论分子量大小为49.729kDa,等电点pI为6.58。
PNUGT29-4:糖基转移酶基因PNUGT29-4编码一个含有447个氨基酸的蛋白质PNUGT29-4,具有序列表中SEQ ID NO:45所示的氨基酸序列。用软件预测到该蛋白质的理论分子量大小为49.715kDa,等电点pI为6.58。
PNUGT29-5:糖基转移酶基因PNUGT29-5编码一个含有447个氨基酸的蛋白质PNUGT29-5,具有序列表中SEQ ID NO:47所示的氨基酸序列。用软件预测到该蛋白质的理论分子量大小为49.718kDa,等电点pI为6.45。
PNUGT29-6:糖基转移酶基因PNUGT29-6编码一个含有447个氨基酸的蛋白质PNUGT29-6,具有序列表中SEQ ID NO:49所示的氨基酸序列。用软件预测到该蛋白质的理论分子量大小为49.657kDa,等电点pI为6.70。
PNUGT29-7:糖基转移酶基因PNUGT29-7编码一个含有447个氨基酸的蛋白质PNUGT29-7,具有序列表中SEQ ID NO:51所示的氨基酸序列。用软件预测到 该蛋白质的理论分子量大小为49.749kDa,等电点pI为6.58。
PNUGT29-8:糖基转移酶基因PNUGT29-8编码一个含有447个氨基酸的蛋白质PNUGT29-8,具有序列表中SEQ ID NO:53所示的氨基酸序列。用软件预测到该蛋白质的理论分子量大小为49.657kDa,等电点pI为6.70。
PNUGT29-9:糖基转移酶基因PNUGT29-9编码一个含有447个氨基酸的蛋白质PNUGT29-9,具有序列表中SEQ ID NO:55所示的氨基酸序列。用软件预测到该蛋白质的理论分子量大小为49.695kDa,等电点pI为6.58。
PNUGT29-14:糖基转移酶基因PNUGT29-14编码一个含有447个氨基酸的蛋白质PNUGT29-14,具有序列表中SEQ ID NO:57所示的氨基酸序列。用软件预测到该蛋白质的理论分子量大小为49.778kDa,等电点pI为6.70。
PNUGT29-15:糖基转移酶基因PNUGT29-15编码一个含有447个氨基酸的蛋白质PNUGT29-15,具有序列表中SEQ ID NO:59所示的氨基酸序列。用软件预测到该蛋白质的理论分子量大小为49.755kDa,等电点pI为6.63。
实施例7 三七糖基转移酶基因PNUGT29-1,PNUGT29-2,PNUGT29-3,PNUGT29-4,PNUGT29-5,PNUGT29-6,PNUGT29-7,PNUGT29-8,PNUGT29-9,PNUGT29-14和PNUGT29-15在大肠杆菌中的表达
以实施例6构建的含有PNUGT29-1,PNUGT29-2,PNUGT29-3,PNUGT29-4,PNUGT29-5,PNUGT29-6,PNUGT29-7,PNUGT29-8,PNUGT29-9,PNUGT29-14和PNUGT29-15基因的质粒PNUGT29-1-pMD18T、PNUGT29-2-pMD18T、PNUGT29-3-pMD18T、PNUGT29-4-pMD18T、PNUGT29-5-pMD18T、PNUGT29-6-pMD18T、PNUGT29-7-pMD18T、PNUGT29-8-pMD18T、PNUGT29-9-pMD18T、PNUGT29-14-pMD18T和PNUGT29-15-pMD18T为模板,以表1所示的引物扩增目标基因PNUGT29-1,PNUGT29-2,PNUGT29-3,PNUGT29-4,PNUGT29-5,PNUGT29-6,PNUGT29-7,PNUGT29-8,PNUGT29-9,PNUGT29-14和PNUGT29-15。参照实施例2的方法,构建重组菌株BL21-PNUGT29-1、BL21-PNUGT29-2、BL21-PNUGT29-3、BL21-PNUGT29-4、BL21-PNUGT29-5、BL21-PNUGT29-6、BL21-PNUGT29-7、BL21-PNUGT29-8、BL21-PNUGT29-9、BL21-PNUGT29-14和BL21-PNUGT29-15并取样品进行SDS-PAGE 电泳和western blot。抗6×His tag Western Blot(图10)表明,在45-65kD之间有明显条带,糖基转移酶PNUGT29-1,PNUGT29-2,PNUGT29-3,PNUGT29-4,PNUGT29-5,PNUGT29-6,PNUGT29-7,PNUGT29-8,PNUGT29-9,PNUGT29-14和PNUGT29-15在大肠杆菌中有少量可溶表达。
表2,扩增基因所用的引物
实施例8 三七糖基转移酶PNUGT29-1,PNUGT29-2,PNUGT29-3,PNUGT29-4,PNUGT29-5,PNUGT29-6,PNUGT29-7,PNUGT29-8,PNUGT29-9,PNUGT29-14和PNUGT29-15的体外转糖基活性和产物鉴定
以实施例7中重组大肠杆菌BL21-PNUGT29-1、BL21-PNUGT29-2、BL21-PNUGT29-3、BL21-PNUGT29-4、BL21-PNUGT29-5、BL21-PNUGT29-6、BL21-PNUGT29-7、BL21-PNUGT29-8、BL21-PNUGT29-9、BL21-PNUGT29-14和BL21-PNUGT29-15的细胞裂解液上清为粗酶液来进行转糖基反应,转空载体pET28a重组大肠杆菌的细胞裂解液作为对照。
如图11所示:以原人参二醇型人参皂苷Rd为糖基受体,UDP-glucose为糖基 供体,PNUGT29-1,PNUGT29-2,PNUGT29-3,PNUGT29-4,PNUGT29-5,PNUGT29-6,PNUGT29-7,PNUGT29-8,PNUGT29-9、PNUGT29-14,PNUGT29-15能催化Rd的C-20位糖基延伸一个葡萄糖基生成Rb1。
如图12所示:以原人参二醇型人参皂苷CK为糖基受体,UDP-glucose为糖基供体,PNUGT29-1,PNUGT29-2,PNUGT29-3,PNUGT29-4,PNUGT29-5,PNUGT29-6,PNUGT29-7,PNUGT29-8,PNUGT29-9、PNUGT29-14,PNUGT29-15能够催化C-20位糖基延伸一个葡萄糖基生成绞股蓝皂苷Gypenoside LXXV。
如图13所示:以原人参二醇型人参皂苷Rh2为糖基受体,UDP-glucose为糖基供体,PNUGT29-1,PNUGT29-2,PNUGT29-3,PNUGT29-4,PNUGT29-5,PNUGT29-6,PNUGT29-7,PNUGT29-8,PNUGT29-9、PNUGT29-14,PNUGT29-15能催化Rh2的C-3位糖基延伸一个葡萄糖基生成Rg3。
实施例9 糖基转移酶基因GT29-19、GT29-20、GT29-21、GT29-22、GT29-23、GT29-36、GT29-37、GT29-42、GT29-43、GT29-45和GT29-46在大肠杆菌中的表达
以实施例1构建的含有GT29-19、GT29-20、GT29-21、GT29-22、GT29-23、GT29-36、GT29-37、GT29-42、GT29-43、GT29-45和GT29-46基因的质粒GT29-19-pMD18T、GT29-20-pMD18T、GT29-21-pMD18T、GT29-22-pMD18T、GT29-23-pMD18T、GT29-36-pMD18T、GT29-37-pMD18T、GT29-42-pMD18T、GT29-43-pMD18T、GT29-45-pMD18T、和GT29-46-pMD18T为模板,以表1所示的引物扩增目标基因GT29-36、GT29-37、GT29-42、GT29-43、GT29-45和GT29-46。
参照实施例2,构建重组菌株BL21-GT29-19、BL21-GT29-20、BL21-GT29-21、BL21-GT29-22、BL21-GT29-23、BL21-GT29-36、BL21-GT29-37、BL21-GT29-42、BL21-GT29-43、BL21-GT29-45和BL21-GT29-46,并取样品进行SDS-PAGE电泳和western blot。
以原人参二醇型人参皂苷Rh2为糖基受体,UDP-glucose为糖基供体,上述糖基转移酶GT29-19、GT29-20、GT29-21、GT29-22、GT29-23、GT29-36、GT29-37、GT29-42、GT29-43、GT29-45和GT29-46都能够催化Rh2的C-3位糖基再延伸一个葡萄糖基生成人参皂苷Rg3,图15显示了GT29-45和GT29-46能催化Rh2生成Rg3。
以原人参二醇型人参皂苷Rd为糖基受体,UDP-xylose为糖基供体,上述糖基转移酶GT29-19、GT29-20、GT29-21、GT29-22、GT29-23、GT29-36、GT29-37、GT29-42、GT29-43都能够催化Rd C-3位的第二个葡萄糖置换为木糖生成一种新的三萜皂苷(3-O-β-(D-xylopyranosyl)-β-(D-glucopyranosyl),20-O-β- (D-glucopyranosyl)-PPD),其中GT29-36、GT29-37、GT29-42和GT29-43的活性最强(图14)。
如图16所示:以原人参二醇型人参皂苷CK为糖基受体,UDP-glucose为糖基供体,GT29-45和GT29-46能催化CK的C-20位糖基再延伸一个葡萄糖基生产绞股蓝皂苷Gypenoside LXXV,其中GT29-45的活性较强。
实施例10 糖基转移酶活性的进一步验证
对以上的实施例3、5、8进行重复,区别在于更换了其它糖基供体和底物,实验结果如表3-表5所示:
表3
表4
表5
*NS代表未示出
由表3-表5可见,本发明糖基转移酶可以利用常见的糖基供体和底物,对四环三萜类物质的不同部位均具有糖基延伸或者糖基置换的活性。
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。