CN115678952A

CN115678952A - 鼠李糖高度专一的糖基转移酶及其应用

Info

Publication number: CN115678952A
Application number: CN202110871374.0A
Authority: CN
Inventors: 严兴; 王平平; 李超静
Original assignee: Shenghe Everything Suzhou Biotechnology Co ltd
Current assignee: Shenghe Everything Suzhou Biotechnology Co ltd
Priority date: 2021-07-30
Filing date: 2021-07-30
Publication date: 2023-02-03
Also published as: WO2023006109A1; CN117897480A; KR20240032944A

Abstract

本发明提供了一种鼠李糖高度专一的糖基转移酶及其应用。本发明首次揭示一种专一性糖基转移酶，其可催化底物特定位置发生鼠李糖基化，以及提高催化活性。具体地，本发明的专一性糖基转移酶能特异和高效地催化四环三萜化合物底物的C‑6位在第一个糖基上发生糖基化，以延伸鼠李糖基团。本发明的专一性糖基转移酶具有良好的特异性和高效性，可应用于构建人工合成人参皂苷及多种新人参皂苷及其衍生物，在药学等领域具有良好的应用价值。

Description

鼠李糖高度专一的糖基转移酶及其应用

技术领域

本发明涉及生物技术和植物生物学领域，具体地，本发明涉及一种鼠李糖高度专一的糖基转移酶及其应用。

背景技术

人参皂苷是从人参属植物(如人参、三七和西洋参等)和绞股蓝中分离到的皂苷的总称，是一类三萜化合物。人参皂苷亦可以根据其分离的来源称为人参皂苷，三七皂苷和绞股蓝皂苷。人参皂苷是这些药用植物中的主要生物活性成份。目前，已经分离出了约150种皂苷。从结构上来看，人参皂苷主要是皂苷元经过糖基化后形成的生物活性小分子。人参皂苷的皂苷元只有有限的几种，主要是达玛烷型四环三萜的原人参二醇和原人参三醇，以及齐墩果烷酸。皂苷元通过糖基化后，可以提高水溶性，改变其亚细胞定位，并产生出不同的生物活性。绝大部分原人参二醇型皂苷是在C3和/或C20位羟基进行糖基化修饰，而原人参三醇型皂苷是在C6和/或 C20的羟基上进行糖基化修饰。不同类型的糖基以及不同程度的糖基化修饰产生了分子结构繁多的人参皂苷。

鼠李糖基化修饰的人参皂苷具有丰富的生物活性。例如Rg2是在Rh1的 C6-O-Glc延伸一分子鼠李糖，Rg2在治疗抑郁、改善心功能、提高学习记忆能力、抗老年痴呆等方面具有很好功效；人参皂苷Re是在Rg1的C6-O-Glc延伸一分子鼠李糖，可能通过促进肠道组织中胰高血糖素样肽-1的分泌来发挥降血糖、治疗糖尿病的作用。

人参皂苷以人参或者三七的总皂苷或者丰富皂苷为原料，依赖化学、酶和微生物发酵的水解方法进行制备。由于野生的人参资源已基本耗竭，人参皂苷资源目前来源于人参或三七的人工栽培，而其人工栽培的生长周期长(一般需要5-7年以上)，并且受到地域的限制，还经常受到病虫害而需要施用大量的农药，所以，人参或三七的人工栽培有严重的连作障碍(人参或三七种植地需要休耕5-15年以上才能克服连作障碍)，所以人参皂苷的产量、品质及安全性都面临挑战。

合成生物学的发展为植物来源的天然产物的异源合成提供了新的机遇。以酵母为底盘，通过代谢途径的组装和优化，已经实现了用廉价的单糖来发酵合成青蒿酸或者双氢青蒿酸，继而再通过一步化学转化的方法生产青蒿素，这表明合成生物学在天然产物的药物合成方面具有的巨大潜力。利用酵母底盘细胞通过合成生物学方法异源合成人参皂苷单体，原料为廉价的单糖，制备过程为安全性可调控的发酵过程，避免了任何外来污染(例如，原料植物人工种植时使用的农药)，因此，通过合成生物学技术制备人参皂苷单体，不仅具有成本优势，而且，可以保证成品的品质与安全性。利用合成生物学技术制备足够量的各种高纯度的天然与非天然的人参皂苷单体，用于活性测定及临床实验，促进稀有人参皂苷的创新药物研发。

近年来通过对人参、三七和西洋参的转录组和功能基因组研究，人参皂苷皂苷元合成途径的解析已经有了非常大的进展。2006年，日本和韩国科学家分别鉴定了将环氧角鲨烯转化为达玛烯二醇的萜环化酶元件达(玛烯二醇合成酶， PgDDS)。2011年到2012年，韩国科学家又鉴定了把达玛烯二醇氧化为原人参二醇以及把原人参二醇进一步氧化为原人参三醇的细胞色素P450元件CYP716A4和 CYP716A53v2。

利用合成生物学方法来人工合成这些具有药用活性的人参皂苷，不仅需要构建合成皂苷元的代谢途径，还需要鉴定催化人参皂苷的糖基化的UDP-糖基转移酶。 UDP-糖基转移酶的功能是将糖基供体(核苷二磷酸糖，例如UDP-葡萄糖、UDP-鼠李糖、UDP-木糖和UDP-阿拉伯糖)上的糖基转移到不同的糖基受体上。从目前已测序的植物基因组分析，植物基因组往往编码了上百种以上不同的糖基转移酶。 2015年中国学者鉴定了能在原人参三醇C6位转入一个葡萄糖基的UDP-糖基转移酶元件(UGTPg100)。中国学者在专利(PCT/CN2015/081111)公开了可以在原人参三醇型皂苷的C6位进行糖链延伸的糖基转移酶(gGT29-7等)，如，gGT29-7可以利用UDP-Xyl催化Rh1的C6位延伸一分子木糖基生成三七皂苷R2，可以利用 UDP-Glc催化Rh1的C6位延伸一分子葡萄糖糖基生成Rf，但基本无法利用UDP-Rha；专利(PCT/CN2015/081111)公开的gGT29-7的突变体 gGT29-7(N343G,A359P)具利用UDP-Rha催化Rh1的C6位延伸一分子鼠李糖基生成 Rg2，但活性非常低，仅大约9％转化率。并且gGT29-7(N343G,A359P)除了以 UDP-Rha为供体进行转糖基反应之外，仍然还可以以UDP-glc为供体进行转糖基反应且催化效率高于以UDP-Rha为糖基供体的催化反应。所以 gGT29-7(N343G,A359P)催化UDP-Rha的活性低且不专一，导致大量副产物的合成，不能满足应用的需求。

发明内容

在以上背景下，本发明人从人参中筛选获得能在C6位延伸UPD-鼠李糖的糖基转移酶URT94-1和URT94-2，可以专一性得以UDP-Rha为糖基供体，高效催化人参皂苷Rh1、人参皂苷Rg1或三七R3的C-6位第一个糖基上延伸一分子鼠李糖从而分别获得人参皂苷 Rg2、人参皂苷Re或者Yesanchinoside E。但是，URT94-1和URT94-2不能利用UDP- 葡萄糖为糖基供体催化上述皂苷底物。因此这些糖基转移酶为人参皂苷Rg2、人参皂苷 Re和Yesanchinoside E等皂苷的高效制备提供了高度专一性的糖基转移酶。

在本发明的第一方面，提供一种在四环三萜(类)化合物的C-6位的第一个糖基上连接鼠李糖基的方法，包括：以专一性糖基转移酶进行转移，所述专一性糖基转移酶是具有SEQ ID NO:2或SEQ ID NO:4所示氨基酸序列的多肽，或其保守性变异多肽。

在本发明的另一方面，提供专一性糖基转移酶的用途，用于在四环三萜(类)化合物的C-6位的第一个糖基上连接鼠李糖基(包括用于作为该反应的催化剂)，所述专一性糖基转移酶是具有SEQ ID NO:2或SEQ ID NO:4所示氨基酸序列的多肽，或其保守性变异多肽。

在一个或多个实施方案中，所述的鼠李糖基由糖基供体提供；较佳地，所述糖基供体是携带鼠李糖基团的糖基供体；更佳地，所述的糖基供体包括(但不限于)：尿苷二磷酸(UDP)-鼠李糖，鸟苷二磷酸(GDP)-鼠李糖，腺苷二磷酸(ADP)-鼠李糖，胞苷二磷酸(CDP)-鼠李糖，胸苷二磷酸(TDP)-鼠李糖。

在一个或多个实施方案中，所述的四环三萜化合物为式(I)化合物，在C-6位的糖基上连接糖基的化合物为式(II)化合物；

其中，R1和R2为H或者糖基，R3为单糖糖基，R4为鼠李糖基；较佳地，所述的糖基或单糖糖基(R3)选自：葡萄糖基、木糖基、阿拉伯糖基或鼠李糖基；

较佳地，当R1为H、R2和R3为葡萄糖基时，所述式(I)化合物为人参皂苷 Rg1，所述式(II)化合物为人参皂苷Re；当R1和R2为H、R3为葡萄糖基时，所述式(I)化合物为人参皂苷Rh1，所述的式(II)化合物为人参皂苷Rg2。

在一个或多个实施方案中，所述的四环三萜化合物为式(III)化合物，在C-6位的糖基上连接糖基的化合物为式(IV)化合物；

其中，R1为H或糖基，R2、R3、R4为单糖糖基，R5为鼠李糖基；较佳地，所述的糖基(R1)或单糖糖基(R2、R3、R4)选自：葡萄糖基、木糖基、阿拉伯糖基或鼠李糖基；

较佳地，当R1为H、R2、R3和R4为葡萄糖基、R5为鼠李糖基时，所述式 (III)化合物为三七皂苷R3，式(IV)化合物为Yesanchinoside E。

在一个或多个实施方案中，基团种类、底物或产物如下表所示：

底物	R1	R2	R3	R4	产物
						人参皂苷Rg1	H	Glc	Glc	Rha	人参皂苷Re
人参皂苷Rh1	H	H	Glc	Rha	人参皂苷Rg2

底物

R1

R2

R3

R4

R5

产物

三七皂苷R3

H

Glc

Rha

Yesanchinoside E

在一个或多个实施方案中，所述反应式中(I)、(III)化合物包括但不限于：S构型或R构型的达玛烷型四环三萜化合物、羊毛脂烷型四环三萜化合物、去水甘遂烷(apotirucallane)型四环三萜、甘遂烷型四环三萜化合物、环阿屯烷(环阿尔廷烷) 型四环三萜化合物、葫芦烷四环三萜化合物、或楝烷型四环三萜化合物。

在一个或多个实施方案中，所述反应式中(II)或(IV)化合物包括人参皂苷Rg2、人参皂苷Re、Yesanchinoside E。

在本发明的另一方面，提供一种胞内在四环三萜(类)化合物的C-6位的第一个糖基上连接鼠李糖基的方法，包括：

(a)在宿主细胞内引入四环三萜化合物反应前体或表达/形成其的构建体，以及引入专一性糖基转移酶或表达其的构建体，获得重组的宿主细胞；所述专一性糖基转移酶是具有SEQ ID NO:2或SEQ ID NO:4所示氨基酸序列的多肽，或其保守性变异多肽；所述宿主细胞内存在携带鼠李糖基团的糖基供体或引入有携带鼠李糖基团的糖基供体(包括能形成该糖基供体的构建体/前体)；

(b)培养(a)的重组的宿主细胞，获得C-6位的第一个糖基上连接鼠李糖基的四环三萜化合物产物；

较佳地，所述四环三萜化合物反应前体包括：人参皂苷Rg1，人参皂苷Rh1，三七皂苷R3；相应的产物包括：人参皂苷Re，人参皂苷Rg2，Yesanchinoside E；

较佳地，所述的糖基供体包括(但不限于)：尿苷二磷酸(UDP)-鼠李糖，鸟苷二磷酸(GDP)-鼠李糖，腺苷二磷酸(ADP)-鼠李糖，胞苷二磷酸(CDP)-鼠李糖，胸苷二磷酸(TDP)-鼠李糖。

在一个或多个实施方案中，所述方法还包括：向反应体系中提供用于调节酶活性的添加物。

在一个或多个实施方案中，所述的用于调节酶活性的添加物是：提高酶活性或抑制酶活性的添加物。

在一个或多个实施方案中，所述的用于调节酶活性的添加物选自下组：Ca²⁺、 Co² ⁺、Mn²⁺、Ba²⁺、Al3+、Ni²⁺、Zn²⁺、或Fe²⁺。

在一个或多个实施方案中，所述的用于调节酶活性的添加物是：可以生成 Ca²⁺、Co²⁺、Mn²⁺、Ba²⁺、Al3+、Ni²⁺、Zn²⁺、或Fe²⁺的物质。

在一个或多个实施方案中，反应体系的pH为：pH4.0-10.0，优选pH为5.5-9.0。

在一个或多个实施方案中，反应体系的温度为：10℃-105℃，优选20℃-50℃。

在本发明的另一方面，提供一种专一性糖基转移酶，其是具有SEQ ID NO:2 或SEQID NO:4所示氨基酸序列的多肽，或其保守性变异多肽；较佳地，所述保守性变异多肽包括：

(1)由SEQ ID NO:2或SEQ ID NO:4所示序列的多肽经过一个或多个(如1-20 个，较佳地1-10个；更佳地1-5个；更佳地1-3个)氨基酸残基的取代、缺失或添加而形成的，且具有在四环三萜化合物的C-6位的第一个糖基上连接鼠李糖基功能的多肽；

(2)氨基酸序列与SEQ ID NO:2或SEQ ID NO:4所示序列的多肽有50％以上 (较佳地60％以上；更佳地70％以上；更佳地80％以上；更佳地85％以上；更佳地 90％以上；更佳地95％以上；更佳地98％以上；更佳地99％以上)相同性，且具有在四环三萜化合物的C-6位的第一个糖基上连接鼠李糖基功能的多肽；或

(3)在SEQ ID NO:2或SEQ ID NO:4所示序列的多肽的N或C末端添加标签序列，或在其N末端添加信号肽序列后形成的多肽。

在本发明的另一方面，提供分离的多核苷酸，所述多核苷酸编码所述的专一性糖基转移酶。

在一个或多个实施方案中，编码所述的专一性糖基转移酶的多核苷酸包括选自下组的多核苷酸：(A)如SEQ ID NO:1或3所示的核苷酸序列；(B)与SEQ ID NO: 1或3所示序列有至少95％相同性的核苷酸序列；(E)在SEQ ID NO:1或3所示序列的5’端和/或3’端截短或添加1-60个(较佳地1-30，更佳地1-10个)核苷酸所形成的核苷酸序列；(F)(A)-(E)任一所述的核苷酸序列的互补序列；(G)(A)-(F)所述序列的长20-50个碱基的片段。

在一个或多个实施方案中，所述多核苷酸序列选自SEQ ID NO:1、3中任一或其互补序列。

在本发明的另一方面，提供一种核酸构建物(构建体)，其包含所述的多核苷酸，或表达所述的专一性糖基转移酶；较佳地，所述核酸构建物是表达载体或同源重组载体。

在本发明的另一方面，提供一种重组宿主细胞，其表达所述的专一性糖基转移酶，或含有所述的多核苷酸，或含有所述的核酸构建物；较佳地，该重组宿主细胞中还含有四环三萜化合物反应前体或表达/形成其的构建体；较佳地，该重组宿主细胞中还存在携带鼠李糖基团的糖基供体或引入有携带鼠李糖基团的糖基供体 (包括能形成该糖基供体的构建体/前体)；

在一个或多个实施方案中，所述四环三萜化合物反应前体包括：人参皂苷Rg1，人参皂苷Rh1，三七皂苷R3；相应的产物包括：人参皂苷Re，人参皂苷Rg2， Yesanchinoside E。

在一个或多个实施方案中，所述的糖基供体包括(但不限于)：尿苷二磷酸 (UDP)-鼠李糖，尿苷二磷酸(UDP)-鼠李糖，鸟苷二磷酸(GDP)-鼠李糖，腺苷二磷酸(ADP)-鼠李糖，胞苷二磷酸(CDP)-鼠李糖，胸苷二磷酸(TDP)-鼠李糖。

在一个或多个实施方案中，宿主细胞为原核细胞或真核细胞。

在一个或多个实施方案中，宿主细胞为真核细胞，如酵母细胞或植物细胞。在一个或多个实施方案中，宿主细胞为酿酒酵母细胞。在一个或多个实施方案中，宿主细胞为人参细胞或三七细胞。

在一个或多个实施方案中，宿主细胞为原核细胞，如大肠杆菌。

在一个或多个实施方案中，宿主细胞不是天然产生本发明所述专一性糖基转移酶处理后形成的产物的细胞；例如，其不是天然产生式(II)、(IV)化合物的细胞。

在一个或多个实施方案中，所述的宿主细胞不是天然产生以下物质中的一种或多种的细胞：人参皂苷Rh1、人参皂苷Rg1、三七皂苷R3、人参皂苷Rg2、人参皂苷Re、Yesanchinoside E。

在一个或多个实施方案中，所述宿主细胞还具有选自下述的特征：

(a)表达达玛烯二醇和/或原人参二醇类皂苷和/或原人参三醇类皂苷合成代谢途径中的关键酶与该酶具有50％序列相同性的突变体；

(b)表达包含(a)所述酶的功能片段或与该片段具有50％序列相同性的突变体的多肽；

(c)含有(a)所述酶或(b)所述多肽的多核苷酸或其互补序列，和/或

(d)含有包含(c)所述编码序列的核酸构建物。

在一个或多个实施方案中，原人参三醇类皂苷包含人参皂苷Rh1、人参皂苷 Rg1、三七皂苷R3、人参皂苷Rg2、人参皂苷Re、Yesanchinoside E。

在一个或多个实施方案中，人参皂苷Rh1合成代谢途径中的关键基因包括(但不限于)：达玛烯二醇合成酶基因、细胞色素P450 CYP716A47基因和P450 CYP716A47的还原酶基因和四环三萜C6的糖基转移酶UGTPg100(Genbank accession number AKQ76388.1)，或其组合。

在一个或多个实施方案中，人参皂苷Rg1合成代谢途径中的关键基因包括(但不限于)：达玛烯二醇合成酶基因、细胞色素P450 CYP716A47基因和P450 CYP716A47的还原酶基因和四环三萜C20位和C6的糖基转移酶UGTPg1和 UGTPg100(Genbank accession numberAKQ76388.1)，或其组合。

在一个或多个实施方案中，人参皂苷Rg2合成代谢途径中的关键基因包括(但不限于)：达玛烯二醇合成酶基因、细胞色素P450 CYP716A47基因和P450 CYP716A47的还原酶基因和四环三萜C6的糖基转移酶UGTPg100(Genbank accession number AKQ76388.1)以及本发明中催化C6位糖基延伸的糖基转移酶 URT94-1和URT94-2，或其组合。

在一个或多个实施方案中，人参皂苷Re合成代谢途径中的关键基因包括(但不限于)：达玛烯二醇合成酶基因、细胞色素P450 CYP716A47基因和P450 CYP716A47的还原酶基因和四环三萜C20位和C6的糖基转移酶UGTPg1和 UGTPg100(Genbank accession numberAKQ76388.1)以及本文中催化C6位糖基延伸的糖基转移酶URT94-1和URT94-2，或其组合。

本发明另一方面，还提供本发明所述宿主细胞在制备糖基转移酶、催化试剂、或式(II)、(IV)化合物中的用途。

本发明另一方面，还提供生产糖基转移酶或式(II)或(IV)化合物的方法，包括孵育本发明所述的宿主细胞。

本发明另一方面，还提供本发明所述宿主细胞的用途，用于制备酶催化试剂，或产生糖基转移酶、或作为催化细胞、或产生式(II)、(IV)化合物。

本发明另一方面，还提供一种产生转基因植物的方法，包括步骤：将本发明所述宿主细胞再生为植物，其中所述宿主细胞为植物细胞。在一个或多个实施方案中，所述宿主细胞为人参细胞。在一个或多个实施方案中，所述宿主细胞为三七细胞。

在本发明的另一方面，提供一种用于糖基转移的试剂盒，其中包括：所述的专一性糖基转移酶，该酶能在四环三萜(类)化合物的C-6位的第一个糖基上连接鼠李糖基，所述专一性糖基转移酶是具有SEQ ID NO:2或SEQ ID NO:4所示氨基酸序列的多肽，或其保守性变异多肽。

在本发明的另一方面，提供一种用于糖基转移的试剂盒，其中包括：所述分离的多核苷酸。

在本发明的另一方面，提供一种用于糖基转移的试剂盒，其中包括：所述的核酸构建物(构建体)。

在本发明的另一方面，提供一种用于糖基转移的试剂盒，其中包括：所述的重组宿主细胞。

在一个或多个实施方案中，试剂盒中还包括：携带鼠李糖基团的糖基供体；更佳地，所述的糖基供体包括(但不限于)：尿苷二磷酸(UDP)-鼠李糖，鸟苷二磷酸 (GDP)-鼠李糖，腺苷二磷酸(ADP)-鼠李糖，胞苷二磷酸(CDP)-鼠李糖，胸苷二磷酸(TDP)-鼠李糖。

在一个或多个实施方案中，试剂盒中还包括：四环三萜化合物反应前体。

应理解，在本发明范围内中，本发明的上述各技术特征和在下文(如实施例) 中具体描述的各技术特征之间都可以互相组合，从而构成新的或优选的技术方案。限于篇幅，在此不再一一累述。

附图说明

图1、从单株人参单株植物中分别扩增了2条糖基转移酶目标条带，扩增所得产物的DNA琼脂糖凝胶电泳检测结果。

图2、通过Western Blot显示糖基转移酶URT94-1和URT94-2，在大肠杆菌中的表达情况。“1”，代表空载体pET28a大肠杆菌重组子的裂解液上清；Marker，代表蛋白质分子量标准；“2”，代表糖基转移酶BL21-URT94-1大肠杆菌重组子的裂解液上清；“3”，代表糖基转移酶BL21-URT94-2大肠杆菌重组子的裂解液上清；“4”，代表糖基转移酶BL21-gGT29-7大肠杆菌重组子的裂解液上清； “5”，代表糖基转移酶BL21-gGT29-7(N343G，A359P)大肠杆菌重组子的裂解液上清。

图3、a图表示，糖基转移酶URT94-1和URT94-2催化以原人参三醇型人参皂苷Rh1为糖基受体，UDP-Rha为糖基供体的转糖基反应的TLC图谱。“1”，代表以pet28a空载体重组子的裂解液上清作为酶液；“2”，“3”，“4”，“5”，，分别代表BL21-URT94-1，BL21-URT94-2，BL21-gGT29-7(N343G，A359P)和 BL21-gGT29-7的裂解液上清作为酶液。箭头所指为皂苷标准品的迁移位置；b图表示，糖基转移酶URT94-1和URT94-2催化以原人参三醇型人参皂苷Rh1为糖基受体，UDP-Rha为糖基供体的转糖基反应的HPLC图谱。

图4、a图表示，糖基转移酶URT94-1和URT94-2催化以原人参三醇型人参皂苷Rg1为糖基受体，UDP-Rha为糖基供体的转糖基反应的TLC图谱。“1”，代表以pet28a空载体重组子的裂解液上清作为酶液；“2”，“3”，“4”，“5”，分别代表BL21-gGT29-7，BL21-gGT29-7(N343G，A359P)，BL21-URT94-1和 BL21-URT94-2的裂解液上清作为酶液。箭头所指为皂苷标准品的迁移位置；b图表示，糖基转移酶URT94-1和URT94-2催化以原人参三醇型人参皂苷Rg1为糖基受体，UDP-Rha为糖基供体的转糖基反应的HPLC图谱。

图5、糖基转移酶URT94-1和URT94-2催化以原人参三醇型人参皂苷Rh1为糖基受体，UDP-Glc为糖基供体的转糖基反应的TLC图谱。“1”，代表以pet28a 空载体重组子的裂解液上清作为酶液；“2”，“3”，“4”，“5”，分别代表 BL21-gGT29-7，BL21-gGT29-7(N343G，A359P)，BL21-URT94-1和BL21-URT94-2 的裂解液上清作为酶液。箭头所指为皂苷标准品的迁移位置。

图6、糖基转移酶URT94-1和URT94-2催化以原人参三醇型人参皂苷Rg1为糖基受体，UDP-Glc为糖基供体的转糖基反应的TLC图谱。“1”，代表以pet28a 空载体重组子的裂解液上清作为酶液；“2”，“3”，“4”，“5”，分别代表 BL21-gGT29-7，BL21-gGT29-7(N343G，A359P)，BL21-URT94-1和BL21-URT94-2 的裂解液上清作为酶液。箭头所指为皂苷标准品的迁移位置。

具体实施方式

本发明人经过深入的研究筛选，首次提供了一种专一性糖基转移酶，其可催化底物特定位置发生鼠李糖基化，以及提高催化活性。具体地，本发明的专一性糖基转移酶能特异和高效地催化四环三萜化合物底物的C-6位在第一个糖基的羟基糖基化，以延伸鼠李糖基团。

定义

如本文所用，“分离的多肽”或“活性多肽”是指所述多肽基本上不含天然与其相关的其它蛋白、脂类、糖类或其它物质。本领域的技术人员能用标准的蛋白质纯化技术纯化所述多肽。基本上纯的多肽在非还原聚丙烯酰胺凝胶上能产生单一的主带。所述多肽的纯度还可以用氨基酸序列进行进一步分析。

如本文所用，术语“活性多肽”、“本发明的多肽及其衍生多肽”、“本发明的酶”、“糖基转移酶”可互换使用，均指URT94-1(SEQ ID NO:2)，URT94-2(SEQ ID NO:4)多肽或其衍生多肽。

如本文所用，术语“保守性变异多肽”是指基本上保持所述多肽相同的生物学功能或活性的多肽。所述的“保守性变异多肽”可以是(i)有一个或多个保守或非保守性氨基酸残基(优选保守性氨基酸残基)被取代的多肽，而这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的，或(ii)在一个或多个氨基酸残基中具有取代基团的多肽，或(iii)成熟多肽与另一个化合物(比如延长多肽半衰期的化合物，例如聚乙二醇)融合所形成的多肽，或(iv)附加的氨基酸序列融合到此多肽序列而形成的多肽(如前导序列或分泌序列或用来纯化此多肽的序列或蛋白原序列，或与抗原IgG片段的形成的融合蛋白)。根据本文的教导，这些片段、衍生物和类似物属于本领域熟练技术人员公知的范围。

如本文所用，术语“变体”或“突变体”是指与参照序列相比，通过一个或多个氨基酸的插入、缺失或取代使氨基酸序列发生变化但保留至少一种生物活性的肽或多肽。本文任一实施方案所述的突变体包括与参照序列(如本文所述的SEQ ID NO:2或4)具有至少50％、60％或70％，优选至少80％，优选至少85％，优选至少 90％，优选至少95％，优选至少97％的序列相同性并保留参照序列的生物学活性(如作为糖基转移酶)的氨基酸序列。可采用例如NCBI的BLASTp计算两条比对的序列之间的序列相同性。突变体还包括在参照序列的氨基酸序列中具有一个或多个突变(插入、缺失或取代)、同时仍保留参照序列生物学活性的氨基酸序列。所述多个突变通常指1-20个以内，例如1-15个、1-10个、1-8个、1-5个或1-3个。取代优选是保守性取代。例如，在本领域中，用性能相近或相似的氨基酸进行保守性取代时，通常不会改变蛋白质或多肽的功能。“性能相近或相似的氨基酸”包括例如，具有相似侧链的氨基酸残基的家族，这些家族包括具有碱性侧链的氨基酸(例如赖氨酸、精氨酸、组氨酸)、具有酸性侧链的氨基酸(例如天冬氨酸、谷氨酸)、具有不带电荷的极性侧链的氨基酸(例如甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸)、具有非极性侧链的氨基酸(例如丙氨酸、缬氨酸、亮氨酸、异亮氨酸脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸)、具有β-分支侧链的氨基酸(例如苏氨酸、缬氨酸、异亮氨酸)和具有芳香侧链的氨基酸(例如酪氨酸、苯丙氨酸、色氨酸、组氨酸)。因此，在本发明多肽中用来自同一侧链类的另一氨基酸残基替换一个或几个位点，将不会在实质上影响其活性。

活性多肽、其编码基因、载体及宿主

本发明人通过挖掘基因组以及转录组信息，结合大量的研究和实验工作，揭示了新型的具有专一性的糖基转移酶，其可以特异性和高效地将四环三萜化合物底物的C-6的第一个糖基上转入糖基以延伸糖链，其反应产物在药学等领域具有良好的应用价值。

本发明所述的专一性的糖基转移酶的序列优选为如SEQ ID NO:2或4所示的多肽。该多肽还包括具有与所示多肽具有相同功能的、SEQ ID NO:2或4序列的 “保守性变异多肽”。本发明还包括所述多肽的片段、衍生物和类似物。如本文所用，术语“片段”、“衍生物”和“类似物”是指基本上保持所述多肽相同的生物学功能或活性的多肽。

本发明中，所述的“保守性变异多肽”是指基本上保持所述多肽相同的生物学功能或活性的多肽。所述的“保守性变异多肽”可以是(i)有一个或多个保守或非保守性氨基酸残基(优选保守性氨基酸残基)被取代的多肽，而这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的，或(ii)在一个或多个氨基酸残基中具有取代基团的多肽，或(iii)成熟多肽与另一个化合物(比如延长多肽半衰期的化合物，例如聚乙二醇)融合所形成的多肽，或(iv)附加的氨基酸序列融合到此多肽序列而形成的多肽(如前导序列或分泌序列或用来纯化此多肽的序列或蛋白原序列，或与抗原IgG片段的形成的融合蛋白)。根据本文的教导，这些片段、衍生物和类似物属于本领域熟练技术人员公知的范围。

所述的“保守性变异多肽”可以包括(但并不限于)：一个或多个(通常为1-50 个，较佳地1-30个，更佳地1-20个，最佳地1-10个)氨基酸的缺失、插入和/或取代，以及在C末端和/或N末端添加或缺失一个或数个(如50个以内，较20个或 10个以内，更佳地为5个以内)氨基酸。例如，在本领域中，用性能相近或相似的氨基酸进行取代时，通常不会改变蛋白质的功能。又比如，在C末端和/或N末端添加一个或数个氨基酸通常也不会改变蛋白质的功能。本发明还提供所述多肽的类似物。这些类似物与天然多肽的差别可以是氨基酸序列上的差异，也可以是不影响序列的修饰形式上的差异，或者兼而有之。这些多肽包括天然或诱导的遗传变异体。诱导变异体可以通过各种技术得到，如通过辐射或暴露于诱变剂而产生随机诱变，还可通过定点诱变法或其他已知分子生物学的技术。类似物还包括具有不同于天然 L-氨基酸的残基(如D-氨基酸)的类似物，以及具有非天然存在的或合成的氨基酸 (如β、γ-氨基酸)的类似物。应理解，本发明的多肽并不限于上述例举的代表性的多肽。

本发明的URT94-1(SEQ ID NO:2)和URT94-2(SEQ ID NO:4)或其保守性变异多肽的氨基端或羧基端还可含有一个或多个多肽片段，作为蛋白标签。任何合适的标签都可以用于本发明。例如，所述的标签可以是FLAG、HA、HA1、c-Myc、Poly –His、Poly-Arg、Strep-TagII、AU1、EE、T7、4A6、ε、B、gE、以及Ty1。这些标签可用于对蛋白进行纯化。

当出于生产本发明的专一性的糖基转移酶或其它酶(例如在宿主细胞中用于反应形成本发明的专一性的糖基转移酶的底物的酶，参与本发明的产物合成途径任一步骤的酶)的目的时，为了使翻译的蛋白分泌表达(如分泌到细胞外)，还可在本发明的多肽的氨基端添加上信号肽序列。信号肽在多肽从细胞内分泌出来的过程中可被切去。

本发明的活性多肽可以是重组多肽、天然多肽、合成多肽。本发明的多肽可以是天然纯化的产物，或是化学合成的产物，或使用重组技术从原核或真核宿主(例如，细菌、酵母、高等植物)中产生。根据重组生产方案所用的宿主，本发明的多肽可以是糖基化的，或可以是非糖基化的。本发明的多肽还可包括或不包括起始的甲硫氨酸残基。

编码本发明的专一性的糖基转移酶以及其它酶的多核苷酸可以是DNA形式或 RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。术语“编码多肽的多核苷酸” 可以是包括编码此多肽的多核苷酸，也可以是还包括附加编码和/或非编码序列的多核苷酸。

本发明也涉及包含本发明的多核苷酸的载体，以及用本发明的载体或多肽编码序列经基因工程产生的宿主细胞，以及经重组技术产生本发明所述多肽的方法。

本发明涉及核酸构建物，该核酸构建物含有本文所述的多核苷酸，以及与这些序列操作性连接的一个或多个调控序列或基因组同源重组所需的序列。本发明所述的多核苷酸可以多种方式被操作以保证所述多肽或蛋白的表达。在将核酸构建物插入载体之前可根据表达载体的不同或要求而对核酸构建物进行操作。利用重组 DNA方法来改变多核苷酸序列的技术是本领域已知的。

在某些实施方案中，所述核酸构建物是载体。载体可以是克隆载体，也可以是表达载体，或者是基因敲入载体。本发明的多核苷酸可被克隆入许多类型的载体，例如，质粒、噬菌粒、噬菌体衍生物、动物病毒和粘粒。克隆载体可用于提供本发明蛋白或多肽的编码序列。表达载体可以以细菌载体或病毒载体形式提供给细胞。通常通过可操作地连接本发明的多核苷酸至启动子，并将构建体并入表达载体，实现本发明多核苷酸的表达。该载体对于复制和整合真核细胞可为合适的。典型的表达载体包含可用于调节期望核酸序列表达的表达控制序列。

基因敲入载体用于将本文所述多核苷酸序列整合到基因组的感兴趣区域。通常情况下，基因敲入载体除含有所述多核苷酸序列外，还可含有基因组同源重组所需的5’同源臂和3’同源臂。在一些实施方案中，本文的核酸构建物含有5’同源臂、本文所述多核苷酸序列和3’同源臂。在使用基因敲入载体时，可同时利用 CRISPR/Cas9技术将多核苷酸序列同源重组到感兴趣的位置。CRISPR/Cas9技术通过设计针对目的基因的向导RNA从而引导Cas9核酸酶对插入位置的基因组进行修饰，造成该基因修饰区域同源重组效率增加，将包含在基因敲入载体中的目的片段同源重组到目的位点。本领域周知CRISPR/Cas9技术的步骤以及所用的试剂，例如Cas9核酸酶。

本领域的技术人员熟知的方法能用于构建核酸构建物。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等。所述的DNA序列可有效连接到表达载体中的适当启动子上，以指导mRNA合成。这些启动子的代表性例子有：大肠杆菌的lac或trp启动子；λ噬菌体PL启动子；真核启动子包括CMV立即早期启动子、HSV胸苷激酶启动子、早期和晚期SV40启动子、反转录病毒的LTRs 和其他一些已知的可控制基因在原核或真核细胞或其病毒中表达的启动子。表达载体还包括翻译起始用的核糖体结合位点和转录终止子。此外，表达载体优选地包含一个或多个选择性标记基因，以提供用于选择转化的宿主细胞的表型性状，如真核细胞培养用的二氢叶酸还原酶、新霉素抗性以及绿色荧光蛋白(GFP)，或用于大肠杆菌的四环素或氨苄青霉素抗性。

本发明的多核苷酸在高等真核细胞中表达时，如果在载体中插入增强子序列时将会使转录得到增强。增强子是DNA的顺式作用因子，通常大约有10到300 个碱基对，作用于启动子以增强基因的转录。可举的例子包括在复制起始点晚期一侧的100到270个碱基对的SV40增强子、在复制起始点晚期一侧的多瘤增强子以及腺病毒增强子等。

本发明也提供了用于生物合成目标产物的宿主细胞。所述的宿主细胞可以为原核细胞，例如但不限于为大肠杆菌，酵母，链霉菌；更佳地为大肠杆菌细胞。细胞宿主是一种生产工具，本领域技术人员可以通过一些技术手段对多种宿主细胞进行改造，从而也实现如本发明的生物合成，由此构成的宿主细胞以及生产方法也应包含在本发明中。

通过常规的重组DNA技术，可利用本发明的多聚核苷酸序列表达或生产本文所述多肽。一般来说有以下步骤：(1)用本发明的编码所述专一性的糖基转移酶的多核苷酸(或变异体)，或用含有该多核苷酸的表达载体转化或转导合适的宿主细胞；(2)在合适的培养基中培养的宿主细胞；(3)从培养基或细胞中分离、纯化蛋白质。

包含上述的适当DNA序列以及适当启动子或者控制序列的载体，可以用于转化适当的宿主细胞，以使其能够表达蛋白质。宿主细胞可以是原核细胞，如细菌细胞；或是低等真核细胞，如酵母细胞；或是高等真核细胞，如哺乳动物细胞。代表性例子有：大肠杆菌，链霉菌属；鼠伤寒沙门氏菌的细菌细胞；真菌细胞如酵母；植物细胞；果蝇S2或Sf9的昆虫细胞；CHO、COS、293细胞、或Bowes黑素瘤细胞的动物细胞等。本领域一般技术人员都清楚如何选择适当的载体、启动子、增强子和宿主细胞。

用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。在上面的方法中的重组多肽可在细胞内、或在细胞膜上表达、或分泌到细胞外。如果需要，可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化重组的蛋白。这些方法是本领域技术人员所熟知的。这些方法的例子包括但并不限于：常规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(HPLC)和其它各种液相层析技术及这些方法的结合。

应用

本发明人致力于糖基转移酶的研究，然而在前期的工作中，尚未获得可以高效利用鼠李糖基供体、特异性在四环三萜(类)化合物的C-6位的第一个糖基上连接鼠李糖基的酶。已有的酶中，有的基本无法利用鼠李糖基供体(如UDP-Rha)；有的则活性非常低，不能完全满足应用的需求。

在以上背景下，本发明人从人参中筛选获得的能在C6位延伸鼠李糖的专一性的糖基转移酶(URT94s)，可以高效催化在原人参三醇皂苷(原人参三醇型皂苷/原人参三醇类皂苷)：人参皂苷Rh1、人参皂苷Rg1、三七皂苷R3的C-6位第一个糖基上延伸1分子鼠李糖；从而获得人参皂苷Rg2、人参皂苷Re或Yesanchinoside E。该糖基转移酶为人参皂苷Rg2或者人参皂苷Re或者Yesanchinoside E的高效制备提供的高度专一性的糖基转移酶。优选地，所述原人参三醇类皂苷包含人参皂苷 Rh1、人参皂苷Rg1。

作为本发明的一个具体实施方式，本发明的活性多肽具有糖基转移酶活性，并且能够催化以下一种或多种反应：

其中，R1和R2为H或者糖基，R3和R4为单糖糖基。

在一个或多个实施方案中，R1-R4经取代后的化合物如下所示：

底物	R1	R2	R3	R4	产物
						Rg1	H	Glc	Glc	Rha	人参皂苷Re
Rh1	H	H	Glc	Rha	人参皂苷Rg2

即当R1为H时，R2和R3为葡萄糖基时，所述的式(I)化合物为人参皂苷Rg1，且R4为鼠李糖基时，所述的式(II)化合物为三七皂苷Re；或当R1和R2为H，R3 为葡萄糖基时，所述的式(I)化合物为人参皂苷Rh1，且R4为鼠李糖基时，所述的式(II)化合物为三七皂苷Rg2。

作为本发明的另一具体实施方式，

其中，R1为H或者糖基，R2、R3、R4和R5为单糖糖基；所述多肽选自 SEQ ID NO:2或4或其衍生多肽。

在一个或多个实施方案中，R1-R5经取代后的化合物如下所示：

底物

R1

R2

R3

R4

R5

产物

三七皂苷R3

H

Glc

Rha

Yesanchinoside E

即当R1为H时，R2、R3和R4为葡萄糖基时，所述的式(III)化合物为三七皂苷R3，且R5为鼠李糖基时，所述的式(IV)化合物为Yesanchinoside E。

本发明还提供构建转基因植物的方法，包括将含有本文所述多肽或多核苷酸的宿主细胞再生为植物，所述宿主细胞是植物细胞。本领域周知再生植物细胞的方法和试剂。

本发明的糖基转移酶特别能够分别将人参皂苷Rh1转化为具有其它活性的人参皂苷Rg2。本发明的糖基转移酶特别能够分别将人参皂苷Rg1转化为具有其它活性的人参皂苷Re。

本发明涉及的活性多肽或糖基转移酶可用于人工合成已知人参皂苷及新人参皂苷及其衍生物，能够将Rh1转化为具有活性的人参皂苷Rg2，以及能够将Rg1 转化为具有活性的人参皂苷Re。

本发明还提供构建转基因植物的方法，包括用本文所述多核苷酸或核酸构建物转化植物，在植物的后代中通过杂交、筛选获得表达本文所述多肽、包含所述多核苷酸或包含所述核酸构建物的转基因阳性植物。本领域周知用核酸转化植物以及植物杂交和筛选转基因阳性植物的方法。

本发明也提供了用于生物合成目标产物或其中间体的试剂盒，其中包括：SEQ IDNO:2或4所示的新型的专一性的糖基转移酶或其保守性变异多肽；较佳地其中还包括糖基供体；较佳地其中还包括宿主细胞。更佳地，所述试剂盒中还包括说明进行生物合成的方法的使用说明书。

本发明的主要优点在于：

(1)本发明的专一性的糖基转移酶可以特异性和高效地将四环三萜化合物底物的C-6的第一个糖基上转入糖基以延伸糖链；

(2)Rh1能由本发明的糖基转移酶高效转化为具有活性的人参皂苷Rg2；Rg1 能由本发明的糖基转移酶高效转化为具有活性的人参皂苷Re。Rg2防治神经退行性疾病的活性；Re具有降血糖治疗糖尿病的活性。因此，本发明的糖基转移酶具有广泛的应用价值。

(3)催化效率高。与专利PCT/CN2015/081111披露的糖基转移酶相比，URT94-1 和URT94-2以UDP-鼠李糖为糖基供体催化Rh1的C6位延伸糖链的活性至少提高了5倍。

下面结合具体实施例，进一步阐述本发明。应理解，这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法，通常按照常规条件如J.萨姆布鲁克等编著，分子克隆实验指南，第三版，科学出版社， 2002中所述的条件，或按照制造厂商所建议的条件。

序列信息

SEQ ID NO:1(URT94-1核酸)

atggataccaatgaaaaaaccagaataaaagttgtaatgttaccatggctggcatatggtcacatatcaccctatctagagctagcaaa aaaactctcaaaacgaaatttttacatatacttttgttccacatctatcaatcttagttccatcaggaaaaaacttgcagttgatgatcacgaggcaa tacagctgatagaattccagttaacttcacaaaccgagctgccgccgcaccatcacacaaccaaaggtctccctccccatctcattcctgatttg atcaaggcccttggtatgtccggccccaacgtcatcaacattctaaatacagtaaaccctgatttaatcatctacgatgtcttccagttatgggtgc ctgcatttgcagcctctcttcaaatcccagctgtccatttccaagtagtcggagccatatcaactgccgccgcctataggtttaaggtggatccta gtataccggttccttgttcaagaatctttctggatgacaccaacataaggaaaagccccgattatgattcatcttcagcagaaaatagtggtattct tgaccttacatttggtacagctatacaatcgtcagatataatcttgatcaagagttctagagagttcgatgaaaagaatatcgaatactattcccttttgatggacaagaagattgtgcctacgggtccacttgtacaagtcaacacatctgtggctgtccataccgaaaatgagaaggacgatataatgg agtggctaagcaagaaagaagaatcctcaacagtttatgtttcttttgggagtgagtgctatttgtcagagcctaggatccgagagctggcccat gggctagagcttagcaatgtaaatttcatatgggttattagttttccagagggagatgaggaaatgtgtaatacttgtattgaagatgtattaccgg aagggtttcttgatagggtgaaagatagaggggtgattgtgagttgggccccacaggaaagaatattagggcatggtggacttgggggatttgtgagtcattgtgggtggggttctgtagtggaaggcatgagctatggagttccaataattgccatgcccgcgcaatatgaacagcctttgcatgct atgtttgtggaggaggtgggcgttggcgtggaggttctaaaagacgagagtggagaatttaggagggatgaaatagcaaaagctataaaaaa ggttgtggtggagaaaaatggagaaggtgtgaggaagaaggcaagagagatgggcaaggcaataaaaaagagaggagaagaagaagtg gaatgtgtagttgaggagttgaccaaactttgcaaaaagtatcagaaagtagcagcaggccaggggaagcgatgcccctaa

SEQ ID NO:2(URT94-1蛋白)

MDTNEKTRIKVVMLPWLAYGHISPYLELAKKLSKRNFYIYFCSTSINLSSIRKKLAVDD HEAIQLIEFQLTSQTELPPHHHTTKGLPPHLIPDLIKALGMSGPNVINILNTVNPDLIIYDVFQL WVPAFAASLQIPAVHFQVVGAISTAAAYRFKVDPSIPVPCSRIFLDDTNIRKSPDYDSSSAENS GILDLTFGTAIQSSDIILIKSSREFDEKNIEYYSLLMDKKIVPTGPLVQVNTSVAVHTENEKDDI MEWLSKKEESSTVYVSFGSECYLSEPRIRELAHGLELSNVNFIWVISFPEGDEEMCNTCIEDVL PEGFLDRVKDRGVIVSWAPQERILGHGGLGGFVSHCGWGSVVEGMSYGVPIIAMPAQYEQPL HAMFVEEVGVGVEVLKDESGEFRRDEIAKAIKKVVVEKNGEGVRKKAREMGKAIKKRGEEEVECVVEELTKLCKKYQKVAAGQGKRCP

SEQ ID NO:3(URT94-2核酸)

atggataccaatgaaaaaaccagaataaaagttgtaatgttaccatggctggcatatggtcacatatcaccctatctagagctagcaaa aaaactctcaaaacgaaatttttacatatacttttgttccacatctatcaatcttagttccatcaggaaaaaacttgcagttgatgatcacgaggcaa tacagctgatagaattccagttaacttcacaaaccgagctgccgccgcaccatcacacaaccaaaggtctccctccccatctcattcctgatttg atcaaggcccttggtatgtccggccccaacgtcatcaacattctaaatacagtaaaccctgatttaatcatctacgatgtcttccagttatgggtgc ctgcatttgcagcctctcttcaaatcccagctgtccatttccaagtagtcggagccatatcaactgccgccgcctataggtttaaggtggatccta gtataccggttccttgttcaagaatctttctggatgacaccaacataaggaaaagccccgattatgattcatcttcagcagaaaatagtggtattct tgaccttacatttggtacagctatacaatcgtcagatataatcttgatcaagagttctagagagttcgatgaaaagaatatcgaatactattcccttttgatggacaagaagattgtgcctacgggtccacttgtacaagtcaacacatctgtggctgtccataccgaaaatgagaaggacgatataatgg agtggctaagcaagaaagaagaatcctcaacagtttatgtttcttttgggagtgagtgctatttgtcagagcctaggatccgagagctggcccat gggctagagcttagcaatgtaaatttcatatgggttattagttttccagagggagatgaggaaatgtgtaatacttgtattgaagatgtattaccgg aagggtttcttgatagggtgaaagatagaggggtgattgtgagttgggccccacaggaaagaatattagggcatggtggacttgggggatttgtgagtcattgtgggtggggttctgtagtggaaggcatgagctatggagttccaataattgccatgcccgcgcaatatgaacagcctttgcatgct atgtttgtggaggaggtgggcgttggcgtggaggttctaaaagacgagagcggagaatttaggagggatgaaatagcaaaagctataaaaaa ggttgtggtggagaaaaatggagaaggtgtgaggaagaaggcaagagagatgggcaaggcaataaaaaagagaggagaagaagaagtg gaatgtgtagttgaggagttgaccaaactttgcaaaaagtatcagaaagtagcagcaggccaggggaaggaatgcccctaa

SEQ ID NO:4(URT94-2蛋白)

MDTNEKTRIKVVMLPWLAYGHISPYLELAKKLSKRNFYIYFCSTSINLSSIRKKLAVDD HEAIQLIEFQLTSQTELPPHHHTTKGLPPHLIPDLIKALGMSGPNVINILNTVNPDLIIYDVFQL WVPAFAASLQIPAVHFQVVGAISTAAAYRFKVDPSIPVPCSRIFLDDTNIRKSPDYDSSSAENS GILDLTFGTAIQSSDIILIKSSREFDEKNIEYYSLLMDKKIVPTGPLVQVNTSVAVHTENEKDDI MEWLSKKEESSTVYVSFGSECYLSEPRIRELAHGLELSNVNFIWVISFPEGDEEMCNTCIEDVL PEGFLDRVKDRGVIVSWAPQERILGHGGLGGFVSHCGWGSVVEGMSYGVPIIAMPAQYEQPL HAMFVEEVGVGVEVLKDESGEFRRDEIAKAIKKVVVEKNGEGVRKKAREMGKAIKKRGEEEVECVVEELTKLCKKYQKVAAGQGKECP

SEQ ID NO:5(引物对1-F)

cgcagtacatctaacagaaaaaga

SEQ ID NO:6(引物对1-R)

caataatttgaaaaaaaatgaatta

SEQ ID NO:7(引物对2-F)

cgtgacattaatggtgtcatttat

SEQ ID NO:8(引物对2-R)

cttttttatagcttttgctatccct

SEQ ID NO:9(URT94-1_Pet28a-F)

ctttaagaaggagatataccatggataccaatgaaaaaacca

SEQ ID NO:10(URT94-1_Pet28a-R)

ctcgagtgcggccgcaagcttggggcatcgcttcccctggcctg

SEQ ID NO:11(URT94-2_Pet28a-F)

ctttaagaaggagatataccatggataccaatgaaaaaaccaga

SEQ ID NO:12(URT94-2_Pet28a-R)

ctcgagtgcggccgcaagcttggggcattccttcccctggcctg

实施例1、人参来源的糖基转移酶URT94s的克隆

本发明人经过深入研究筛选，从单株人参植物中克隆获得两条糖基转移酶，分别命名为URT94-1和URT94-2(URT94s)。

所述URT94s的克隆：提取人参RNA并进行反转录，获得人参的cDNA。以该cDNA为模板设计2对引物(SEQ ID NO:5-SEQ ID NO:6扩增URT94-1；SEQ ID NO:7-SEQ ID NO:8扩增URT94-2)进行PCR扩增。DNA聚合酶选用宝生物工程有限公司的高保真的DNA聚合酶PrimeSTAR。PCR产物经琼脂糖凝胶电泳检测(图 1)。在紫外下照射，切下目标DNA条带。然后采用AxyPrep DNA Gel Extraction Kit(AXYGEN公司)从琼脂糖凝胶中回收DNA即为扩增出的DNA片段。将此DNA 片段用宝生物工程有限公司的rTaq DNA聚合酶在末端加A后与市售的克隆载体 pMD18T质粒连接，获得重组质粒URT94-1-pMD18T和URT94-2-pMD18T。连接产物转化市售的大肠杆菌Top10感受态细胞，将转化后的大肠杆菌菌液涂布在添加氨苄青霉素100ug/mL的LB平板上，并进一步通过PCR和酶切验证重组克隆。分别选取其中一个克隆提取重组质粒后进行测序。验证发现，URT94-1和URT94-2 是糖基转移酶基因，其ORF编码糖基转移酶第1家族保守功能域PSPG盒。

本发明人分别对URT94-1和URT94-2进行表达及转糖基反应分析。其中，2 个核酸序列(分别是SEQ ID NO:1、3)编码的糖基转移酶(分别是SEQ ID NO：2或 4)可以催化Rh1的C6位延伸1个鼠李糖基生成Rg2，催化活性相比于之前专利(PCT/CN2015/081111)公开的gGT29-7的突变体gGT29-7(N343G，A359P)，提高至少5倍，两者均无法催化Rh1的C6位延伸1个葡萄糖基生成Rf。

实验结果表明，人参来源的URT94-1和URT94-2在催化Rh1的C6位延伸一个鼠李糖基生成Rg2的转化率均达到50％以上，催化Rg1的C6位延伸一个鼠李糖基生成Re的转化率均达到50％以上，两者均无法催化Rg1的C6位延伸1个葡萄糖基生成C20-O-Glc-Rf，表明它们是UDP-鼠李糖高度专一性的糖基转移酶。

实施例2、人参糖基转移酶URT94s基因重组表达质粒构建

分别以实施例1构建的含有URT94-1和URT94-2基因的pMD18T质粒，以质粒URT94-1-pMD18T为例，正向引物包括两部分，5’端-3’端依次含有pET28a同源臂的序列20bp以及编码URT94-1的起始序列20bp，反向引物包括两部分，5’端-3’ 端依次含有pET28a同源臂的序列20bp以及编码URT94-1的末端序列20bp(SEQ ID NO:9-SEQ ID NO:10，见表1)，利用上述引物通过PCR方法扩增得了编码URT94-1 的基因(含pET28a同源臂)。DNA聚合酶选用宝生物工程有限公司的高保真DNA 聚合酶PrimeSTAR，参考其说明书设定PCR程序：94℃2min；94℃15s，57℃30s， 68℃1.5min，共33个循环；68℃10min；16℃保温。PCR产物经琼脂糖凝胶电泳检测，在紫外光下，切下与目标DNA大小一致的条带。然后采用AxyPrep DNA GelExtraction Kit(AXYGEN公司)从琼脂糖凝胶中回收DNA片段。

用Thermo公司的FD限制性内切酶NcoI和SalI双酶切质粒pET28a，37℃ 50min，然后采用AxyPrep DNA Gel Extraction Kit(AXYGEN公司)从琼脂糖凝胶中回收线性的质粒pET28a。利用上海翊圣生物科技有限公司的重组酶将酶切线性质粒分别与以上获得的URT94-1等2个UGTs进行同源重组，连接产物转化E.coli BL21(DE3)感受态细胞，并涂布于添加50μg/mL卡那霉素(Kana)的LB平板上。通过菌落PCR验证阳性转化子，并测序进一步验证重组表达质粒是否构建成功。阳性转化子称为大肠杆菌BL21-URT94-1和BL21-URT94-2。

表1、构建基因表达质粒所用的引物

实施例3、人参糖基转移酶URT94s在大肠杆菌中表达

分别将测序正确的大肠杆菌BL21-URT94-1和BL21-URT94-2两种菌，接种到50mLLB培养基中，37℃ 200rpm培养至OD600约0.6-0.8，使菌液降温至4℃，加入终浓度为200μM的IPTG，18℃ 120rpm诱导表达16h。4℃离心收集菌体，超声破碎细胞，4℃ 12000g离心10min收集细胞裂解液上清，从而获取蛋白粗酶液。pET28a上的6×His tag序列使蛋白URT94-1和URT94-2的C末端分别带有 6×His tag标签。由此对两种蛋白粗酶液进行Western blot检测蛋白表达情况。抗 6×His tag Western Blot(图2)表明，在45-55kD之间有明显条带，糖基转移酶 URT94-1和URT94-2在大肠杆菌中均有可溶表达。

实施例4、糖基转移酶URT94s以原人参三醇型皂苷Rh1为底物进行体外转糖基活性和产物鉴定

以实施例4中重组大肠杆菌BL21-URT94-1和BL21-URT94-2的细胞裂解液上清为粗酶液来进行转糖基反应，转空载体pET28a重组大肠杆菌的细胞裂解液作为对照。选取专利PCT/CN2015/081111来源的人参糖基转移酶gGT29-7， gGT29-7(N343G，A359P)作阳性对照。按照表2所呈现的反应体系进行体外转糖基化测试，35℃反应过夜。

反应结果分别用薄层层析(TLC)，高效液相色谱(HPLC)进行检测：

表2、酶活测定反应体系

如图3a-b所示，以原人参三醇型人参皂苷Rh1为糖基受体，UDP-Rha为糖基供体，BL21-URT94-1和BL21-URT94-2催化其生成Rg2，且它们的催化效率均明显优于之前公开的糖基转移酶gGT29-7(N343G，A359P)的催化效果。并且，HPLC 的结果与TLC结果一致。

因此，URT94-1、URT94-2和gGT29-7(N343G，A359P)一样，能够催化Rh1 的C6-O-Glc延伸一分子鼠李糖生成人参皂苷Rg2。

实施例5、糖基转移酶URT94s以原人参三醇型皂苷Rg1为底物进行体外转糖基活性和产物鉴定

以实施例4中重组大肠杆菌BL21-URT94-1和BL21-RT94-2的细胞裂解液上清为粗酶液来进行转糖基反应，转空载体pET28a重组大肠杆菌的细胞裂解液作为对照。选取专利PCT/CN2015/081111来源的人参糖基转移酶gGT29-7， gGT29-7(N343G，A359P)作阳性对照。按照表3所呈现的反应体系进行体外转糖基化测试，35℃，反应过夜。

以原人参三醇型人参皂苷Rg1为糖基受体，UDP-Rha为糖基供体，URT94-1 和URT94-2催化其生成Re，且催化效率均明显优于之前公开的糖基转移酶 gGT29-7(N343G，A359P)(PCT/CN2015/081111)的催化效果。并且，HPLC的结果与TLC结果一致。如图4a-b所示。

因此，URT94-1、URT94-2和gGT29-7(N343G，A359P)一样，能够催化Rg1 的C6-O-Glc延伸一分子鼠李糖生成人参皂苷Re。

实施例6、糖基转移酶URT94s以原人参三醇型皂苷Rh1/Rg1为底物，以 UDP-Glc为糖供体进行体外转糖基活性和产物鉴定

以实施例4中重组大肠杆菌BL21-URT94-1和BL21-URT94-2的细胞裂解液上清为粗酶液来进行转糖基反应，转空载体pET28a重组大肠杆菌的细胞裂解液作为对照。选取专利PCT/CN2015/081111来源的人参糖基转移酶gGT29-7， gGT29-7(N343G，A359P)作阳性对照。按照表3所呈现的反应体系进行体外转糖基化测试，35℃，反应过夜。反应结果分别用薄层层析(TLC)，高效液相色谱(HPLC) 进行检测。

表3、酶活测定反应体系

以原人参三醇型人参皂苷Rh1为糖基受体，UDP-Glc为糖基供体，URT94-1 和URT94-2不能催化其生成Rf，并且HPLC的结果与TLC结果一致。因此，与 gGT29-7和gGT29-7(N343G，A359P)不同，本发明的糖基转移酶URT94-1和 URT94-2，不能够催化Rh1的C6-O-Glc延伸一分子葡萄糖生成人参皂苷Rf，如图 5所示。

以原人参三醇型人参皂苷Rg1为糖基受体，UDP-Glc为糖基供体，URT94-1 和URT94-2不能催化其生成C20-O-Glc-Rf，并且HPLC的结果与TLC结果一致。因此，与gGT29-7和gGT29-7(N343G，A359P)不同，本发明的糖基转移酶URT94-1 和URT94-2，不能够催化Rg1的C6-O-Glc延伸一分子葡萄糖生成人参皂苷 C20-O-Glc-Rf，如图6所示。表明URT94-1和URT94-2是UDP-鼠李糖高度专一性的糖基转移酶。

实施例7、催化C6延伸一分子鼠李糖的URT94s的效率比较

来源专利PCT/CN2015/081111的糖基转移酶gGT29-7可在C6延伸一分子葡萄糖，gGT29-7(N343G，A359P)，可在C6延伸一分子葡萄糖也可以在C6延伸一分子鼠李糖。将糖基转移酶gGT29-7，gGT29-7(N343G，A359P)以及本发明糖基转移酶URT94-1和URT94-2，按照实施例4的方法对这些糖基转移酶进行表达并制备粗酶液。按实施例5进行酶催化反应，以UDP-Rha为糖基供体，以Rh1和/或 Rg1为糖基受体，35℃反应为1小时，并用HPLC对产物进行定量测定。按以下公式进行催化效率的计算：

转化效率(％)＝产物量/(底物量+产物量)

如表4显示，与专利PCT/CN2015/081111披露的糖基转移酶gGT29-7， gGT29-7(N343G，A359P)相比，URT94-1和URT94-2，以UDP-鼠李糖为糖基供体催化Rh1和/或Rg1的C6位延伸糖链的活性均得到提高。

表4、催化C6位延伸Rha的糖基转移酶的催化效率比较

因此，不同于此前的糖基转移酶，本发明的URT94-1和URT94-2可以特异性和高效地在四环三萜化合物底物的C-6的第一个糖基上进一步加上鼠李糖基以延伸糖链。

在本发明提及的所有文献都在本申请中引用作为参考，就如同每一篇文献被单独引用作为参考那样。此外应理解，在阅读了本发明的上述讲授内容之后，本领域技术人员可以对本发明作各种改动或修改，这些等价形式同样落于本申请所附权利要求书所限定的范围。

序列表

<110> 中国科学院分子植物科学卓越创新中心

<120> 鼠李糖高度专一的糖基转移酶及其应用

<130> 215522

<160> 12

<170> SIPOSequenceListing 1.0

<210> 1

<211> 1404

<212> DNA

<213> 人参(Panax L.)

<400> 1

atggatacca atgaaaaaac cagaataaaa gttgtaatgt taccatggct ggcatatggt 60

cacatatcac cctatctaga gctagcaaaa aaactctcaa aacgaaattt ttacatatac 120

ttttgttcca catctatcaa tcttagttcc atcaggaaaa aacttgcagt tgatgatcac 180

gaggcaatac agctgataga attccagtta acttcacaaa ccgagctgcc gccgcaccat 240

cacacaacca aaggtctccc tccccatctc attcctgatt tgatcaaggc ccttggtatg 300

tccggcccca acgtcatcaa cattctaaat acagtaaacc ctgatttaat catctacgat 360

gtcttccagt tatgggtgcc tgcatttgca gcctctcttc aaatcccagc tgtccatttc 420

caagtagtcg gagccatatc aactgccgcc gcctataggt ttaaggtgga tcctagtata 480

ccggttcctt gttcaagaat ctttctggat gacaccaaca taaggaaaag ccccgattat 540

gattcatctt cagcagaaaa tagtggtatt cttgacctta catttggtac agctatacaa 600

tcgtcagata taatcttgat caagagttct agagagttcg atgaaaagaa tatcgaatac 660

tattcccttt tgatggacaa gaagattgtg cctacgggtc cacttgtaca agtcaacaca 720

tctgtggctg tccataccga aaatgagaag gacgatataa tggagtggct aagcaagaaa 780

gaagaatcct caacagttta tgtttctttt gggagtgagt gctatttgtc agagcctagg 840

atccgagagc tggcccatgg gctagagctt agcaatgtaa atttcatatg ggttattagt 900

tttccagagg gagatgagga aatgtgtaat acttgtattg aagatgtatt accggaaggg 960

tttcttgata gggtgaaaga tagaggggtg attgtgagtt gggccccaca ggaaagaata 1020

ttagggcatg gtggacttgg gggatttgtg agtcattgtg ggtggggttc tgtagtggaa 1080

ggcatgagct atggagttcc aataattgcc atgcccgcgc aatatgaaca gcctttgcat 1140

gctatgtttg tggaggaggt gggcgttggc gtggaggttc taaaagacga gagtggagaa 1200

tttaggaggg atgaaatagc aaaagctata aaaaaggttg tggtggagaa aaatggagaa 1260

ggtgtgagga agaaggcaag agagatgggc aaggcaataa aaaagagagg agaagaagaa 1320

gtggaatgtg tagttgagga gttgaccaaa ctttgcaaaa agtatcagaa agtagcagca 1380

ggccagggga agcgatgccc ctaa 1404

<210> 2

<211> 467

<212> PRT

<213> 人参(Panax L.)

<400> 2

Met Asp Thr Asn Glu Lys Thr Arg Ile Lys Val Val Met Leu Pro Trp

1 5 10 15

Leu Ala Tyr Gly His Ile Ser Pro Tyr Leu Glu Leu Ala Lys Lys Leu

20 25 30

Ser Lys Arg Asn Phe Tyr Ile Tyr Phe Cys Ser Thr Ser Ile Asn Leu

35 40 45

Ser Ser Ile Arg Lys Lys Leu Ala Val Asp Asp His Glu Ala Ile Gln

50 55 60

Leu Ile Glu Phe Gln Leu Thr Ser Gln Thr Glu Leu Pro Pro His His

65 70 75 80

His Thr Thr Lys Gly Leu Pro Pro His Leu Ile Pro Asp Leu Ile Lys

85 90 95

Ala Leu Gly Met Ser Gly Pro Asn Val Ile Asn Ile Leu Asn Thr Val

100 105 110

Asn Pro Asp Leu Ile Ile Tyr Asp Val Phe Gln Leu Trp Val Pro Ala

115 120 125

Phe Ala Ala Ser Leu Gln Ile Pro Ala Val His Phe Gln Val Val Gly

130 135 140

Ala Ile Ser Thr Ala Ala Ala Tyr Arg Phe Lys Val Asp Pro Ser Ile

145 150 155 160

Pro Val Pro Cys Ser Arg Ile Phe Leu Asp Asp Thr Asn Ile Arg Lys

165 170 175

Ser Pro Asp Tyr Asp Ser Ser Ser Ala Glu Asn Ser Gly Ile Leu Asp

180 185 190

Leu Thr Phe Gly Thr Ala Ile Gln Ser Ser Asp Ile Ile Leu Ile Lys

195 200 205

Ser Ser Arg Glu Phe Asp Glu Lys Asn Ile Glu Tyr Tyr Ser Leu Leu

210 215 220

Met Asp Lys Lys Ile Val Pro Thr Gly Pro Leu Val Gln Val Asn Thr

225 230 235 240

Ser Val Ala Val His Thr Glu Asn Glu Lys Asp Asp Ile Met Glu Trp

245 250 255

Leu Ser Lys Lys Glu Glu Ser Ser Thr Val Tyr Val Ser Phe Gly Ser

260 265 270

Glu Cys Tyr Leu Ser Glu Pro Arg Ile Arg Glu Leu Ala His Gly Leu

275 280 285

Glu Leu Ser Asn Val Asn Phe Ile Trp Val Ile Ser Phe Pro Glu Gly

290 295 300

Asp Glu Glu Met Cys Asn Thr Cys Ile Glu Asp Val Leu Pro Glu Gly

305 310 315 320

Phe Leu Asp Arg Val Lys Asp Arg Gly Val Ile Val Ser Trp Ala Pro

325 330 335

Gln Glu Arg Ile Leu Gly His Gly Gly Leu Gly Gly Phe Val Ser His

340 345 350

Cys Gly Trp Gly Ser Val Val Glu Gly Met Ser Tyr Gly Val Pro Ile

355 360 365

Ile Ala Met Pro Ala Gln Tyr Glu Gln Pro Leu His Ala Met Phe Val

370 375 380

Glu Glu Val Gly Val Gly Val Glu Val Leu Lys Asp Glu Ser Gly Glu

385 390 395 400

Phe Arg Arg Asp Glu Ile Ala Lys Ala Ile Lys Lys Val Val Val Glu

405 410 415

Lys Asn Gly Glu Gly Val Arg Lys Lys Ala Arg Glu Met Gly Lys Ala

420 425 430

Ile Lys Lys Arg Gly Glu Glu Glu Val Glu Cys Val Val Glu Glu Leu

435 440 445

Thr Lys Leu Cys Lys Lys Tyr Gln Lys Val Ala Ala Gly Gln Gly Lys

450 455 460

Arg Cys Pro

465

<210> 3

<211> 1404

<212> DNA

<213> 人参(Panax L.)

<400> 3

atggatacca atgaaaaaac cagaataaaa gttgtaatgt taccatggct ggcatatggt 60

cacatatcac cctatctaga gctagcaaaa aaactctcaa aacgaaattt ttacatatac 120

ttttgttcca catctatcaa tcttagttcc atcaggaaaa aacttgcagt tgatgatcac 180

gaggcaatac agctgataga attccagtta acttcacaaa ccgagctgcc gccgcaccat 240

cacacaacca aaggtctccc tccccatctc attcctgatt tgatcaaggc ccttggtatg 300

tccggcccca acgtcatcaa cattctaaat acagtaaacc ctgatttaat catctacgat 360

gtcttccagt tatgggtgcc tgcatttgca gcctctcttc aaatcccagc tgtccatttc 420

caagtagtcg gagccatatc aactgccgcc gcctataggt ttaaggtgga tcctagtata 480

ccggttcctt gttcaagaat ctttctggat gacaccaaca taaggaaaag ccccgattat 540

gattcatctt cagcagaaaa tagtggtatt cttgacctta catttggtac agctatacaa 600

tcgtcagata taatcttgat caagagttct agagagttcg atgaaaagaa tatcgaatac 660

tattcccttt tgatggacaa gaagattgtg cctacgggtc cacttgtaca agtcaacaca 720

tctgtggctg tccataccga aaatgagaag gacgatataa tggagtggct aagcaagaaa 780

gaagaatcct caacagttta tgtttctttt gggagtgagt gctatttgtc agagcctagg 840

atccgagagc tggcccatgg gctagagctt agcaatgtaa atttcatatg ggttattagt 900

tttccagagg gagatgagga aatgtgtaat acttgtattg aagatgtatt accggaaggg 960

tttcttgata gggtgaaaga tagaggggtg attgtgagtt gggccccaca ggaaagaata 1020

ttagggcatg gtggacttgg gggatttgtg agtcattgtg ggtggggttc tgtagtggaa 1080

ggcatgagct atggagttcc aataattgcc atgcccgcgc aatatgaaca gcctttgcat 1140

gctatgtttg tggaggaggt gggcgttggc gtggaggttc taaaagacga gagcggagaa 1200

tttaggaggg atgaaatagc aaaagctata aaaaaggttg tggtggagaa aaatggagaa 1260

ggtgtgagga agaaggcaag agagatgggc aaggcaataa aaaagagagg agaagaagaa 1320

gtggaatgtg tagttgagga gttgaccaaa ctttgcaaaa agtatcagaa agtagcagca 1380

ggccagggga aggaatgccc ctaa 1404

<210> 4

<211> 467

<212> PRT

<213> 人参(Panax L.)

<400> 4

Met Asp Thr Asn Glu Lys Thr Arg Ile Lys Val Val Met Leu Pro Trp

1 5 10 15

Leu Ala Tyr Gly His Ile Ser Pro Tyr Leu Glu Leu Ala Lys Lys Leu

20 25 30

Ser Lys Arg Asn Phe Tyr Ile Tyr Phe Cys Ser Thr Ser Ile Asn Leu

35 40 45

Ser Ser Ile Arg Lys Lys Leu Ala Val Asp Asp His Glu Ala Ile Gln

50 55 60

Leu Ile Glu Phe Gln Leu Thr Ser Gln Thr Glu Leu Pro Pro His His

65 70 75 80

His Thr Thr Lys Gly Leu Pro Pro His Leu Ile Pro Asp Leu Ile Lys

85 90 95

Ala Leu Gly Met Ser Gly Pro Asn Val Ile Asn Ile Leu Asn Thr Val

100 105 110

Asn Pro Asp Leu Ile Ile Tyr Asp Val Phe Gln Leu Trp Val Pro Ala

115 120 125

Phe Ala Ala Ser Leu Gln Ile Pro Ala Val His Phe Gln Val Val Gly

130 135 140

Ala Ile Ser Thr Ala Ala Ala Tyr Arg Phe Lys Val Asp Pro Ser Ile

145 150 155 160

Pro Val Pro Cys Ser Arg Ile Phe Leu Asp Asp Thr Asn Ile Arg Lys

165 170 175

Ser Pro Asp Tyr Asp Ser Ser Ser Ala Glu Asn Ser Gly Ile Leu Asp

180 185 190

Leu Thr Phe Gly Thr Ala Ile Gln Ser Ser Asp Ile Ile Leu Ile Lys

195 200 205

Ser Ser Arg Glu Phe Asp Glu Lys Asn Ile Glu Tyr Tyr Ser Leu Leu

210 215 220

Met Asp Lys Lys Ile Val Pro Thr Gly Pro Leu Val Gln Val Asn Thr

225 230 235 240

Ser Val Ala Val His Thr Glu Asn Glu Lys Asp Asp Ile Met Glu Trp

245 250 255

Leu Ser Lys Lys Glu Glu Ser Ser Thr Val Tyr Val Ser Phe Gly Ser

260 265 270

Glu Cys Tyr Leu Ser Glu Pro Arg Ile Arg Glu Leu Ala His Gly Leu

275 280 285

Glu Leu Ser Asn Val Asn Phe Ile Trp Val Ile Ser Phe Pro Glu Gly

290 295 300

Asp Glu Glu Met Cys Asn Thr Cys Ile Glu Asp Val Leu Pro Glu Gly

305 310 315 320

Phe Leu Asp Arg Val Lys Asp Arg Gly Val Ile Val Ser Trp Ala Pro

325 330 335

Gln Glu Arg Ile Leu Gly His Gly Gly Leu Gly Gly Phe Val Ser His

340 345 350

Cys Gly Trp Gly Ser Val Val Glu Gly Met Ser Tyr Gly Val Pro Ile

355 360 365

Ile Ala Met Pro Ala Gln Tyr Glu Gln Pro Leu His Ala Met Phe Val

370 375 380

Glu Glu Val Gly Val Gly Val Glu Val Leu Lys Asp Glu Ser Gly Glu

385 390 395 400

Phe Arg Arg Asp Glu Ile Ala Lys Ala Ile Lys Lys Val Val Val Glu

405 410 415

Lys Asn Gly Glu Gly Val Arg Lys Lys Ala Arg Glu Met Gly Lys Ala

420 425 430

Ile Lys Lys Arg Gly Glu Glu Glu Val Glu Cys Val Val Glu Glu Leu

435 440 445

Thr Lys Leu Cys Lys Lys Tyr Gln Lys Val Ala Ala Gly Gln Gly Lys

450 455 460

Glu Cys Pro

465

<210> 5

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(24)

<223> 引物

<400> 5

cgcagtacat ctaacagaaa aaga 24

<210> 6

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(25)

<223> 引物

<400> 6

caataatttg aaaaaaaatg aatta 25

<210> 7

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(24)

<223> 引物

<400> 7

cgtgacatta atggtgtcat ttat 24

<210> 8

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(25)

<223> 引物

<400> 8

cttttttata gcttttgcta tccct 25

<210> 9

<211> 42

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(42)

<223> 引物

<400> 9

ctttaagaag gagatatacc atggatacca atgaaaaaac ca 42

<210> 10

<211> 44

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(44)

<223> 引物

<400> 10

ctcgagtgcg gccgcaagct tggggcatcg cttcccctgg cctg 44

<210> 11

<211> 44

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(44)

<223> 引物

<400> 11

ctttaagaag gagatatacc atggatacca atgaaaaaac caga 44

<210> 12

<211> 44

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(44)

<223> 引物

<400> 12

ctcgagtgcg gccgcaagct tggggcattc cttcccctgg cctg 44

Claims

1.一种在四环三萜化合物的C-6位的第一个糖基上连接鼠李糖基的方法，包括：以专一性糖基转移酶进行转移，所述专一性糖基转移酶是具有SEQ ID NO:2或SEQ ID NO:4所示氨基酸序列的多肽，或其保守性变异多肽。

2.专一性糖基转移酶的用途，用于在四环三萜化合物的C-6位的第一个糖基上连接鼠李糖基，所述专一性糖基转移酶是具有SEQ ID NO:2或SEQ ID NO:4所示氨基酸序列的多肽，或其保守性变异多肽。

3.如权利要求1所述的方法或权利要求2所述的用途，其特征在于，所述的鼠李糖基由糖基供体提供；较佳地，所述糖基供体是携带鼠李糖基团的糖基供体；更佳地，所述的糖基供体包括选自：尿苷二磷酸-鼠李糖，鸟苷二磷酸-鼠李糖，腺苷二磷酸-鼠李糖，胞苷二磷酸-鼠李糖，胸苷二磷酸-鼠李糖，或其组合。

4.如权利要求1所述的方法或权利要求2所述的用途，其特征在于，所述的四环三萜化合物为式(I)化合物，在C-6位的糖基上连接糖基的化合物为式(II)化合物；

其中，R1和R2为H或者糖基，R3为单糖糖基，R4为鼠李糖基；较佳地，所述的糖基或单糖糖基选自：葡萄糖基、木糖基、阿拉伯糖基或鼠李糖基；

较佳地，当R1为H、R2和R3为葡萄糖基时，所述式(I)化合物为人参皂苷Rg1，所述式(II)化合物为人参皂苷Re；当R1和R2为H、R3为葡萄糖基时，所述式(I)化合物为人参皂苷Rh1，所述的式(II)化合物为人参皂苷Rg2。

5.如权利要求1所述的方法或权利要求2所述的用途，其特征在于，所述的四环三萜化合物为式(III)化合物，在C-6位的糖基上连接糖基的化合物为式(IV)化合物；

其中，R1为H或糖基，R2、R3、R4为单糖糖基，R5为鼠李糖基；较佳地，所述的糖基或单糖糖基选自：葡萄糖基、木糖基、阿拉伯糖基或鼠李糖基；

较佳地，当R1为H、R2、R3和R4为葡萄糖基、R5为鼠李糖基时，所述式(III)化合物为三七皂苷R3，式(IV)化合物为Yesanchinoside E。

6.一种胞内在四环三萜化合物的C-6位的第一个糖基上连接鼠李糖基的方法，包括：

(a)在宿主细胞内引入四环三萜化合物反应前体或表达/形成其的构建体，以及引入专一性糖基转移酶或表达其的构建体，获得重组的宿主细胞；所述专一性糖基转移酶是具有SEQ ID NO:2或SEQ ID NO:4所示氨基酸序列的多肽，或其保守性变异多肽；所述宿主细胞内存在携带鼠李糖基团的糖基供体或引入有携带鼠李糖基团的糖基供体；

较佳地，所述的糖基供体包括选自：尿苷二磷酸-鼠李糖，鸟苷二磷酸-鼠李糖，腺苷二磷酸-鼠李糖，胞苷二磷酸-鼠李糖，胸苷二磷酸-鼠李糖，或其组合。

7.一种专一性糖基转移酶，其是具有SEQ ID NO:2或SEQ ID NO:4所示氨基酸序列的多肽，或其保守性变异多肽；较佳地，所述保守性变异多肽包括：

(1)由SEQ ID NO:2或SEQ ID NO:4所示序列的多肽经过一个或多个氨基酸残基的取代、缺失或添加而形成的，且具有在四环三萜化合物的C-6位的第一个糖基上连接鼠李糖基功能的多肽；

(2)氨基酸序列与SEQ ID NO:2或SEQ ID NO:4所示序列的多肽有50％以上相同性，且具有在四环三萜化合物的C-6位的第一个糖基上连接鼠李糖基功能的多肽；或

8.分离的多核苷酸，所述多核苷酸编码权利要求8所述的专一性糖基转移酶。

9.一种核酸构建物，其包含权利要求8所述的多核苷酸，或表达权利要求7所述的专一性糖基转移酶；较佳地，所述核酸构建物是表达载体或同源重组载体。

10.一种重组宿主细胞，其表达权利要求7所述的专一性糖基转移酶，或含有权利要求8所述的多核苷酸，或含有权利要求9所述的核酸构建物；较佳地，该重组宿主细胞中还含有四环三萜化合物反应前体或表达/形成其的构建体；较佳地，该重组宿主细胞中还存在携带鼠李糖基团的糖基供体或引入有携带鼠李糖基团的糖基供体；

较佳地，所述的糖基供体包括选自：尿苷二磷酸-鼠李糖，尿苷二磷酸-鼠李糖，鸟苷二磷酸-鼠李糖，腺苷二磷酸-鼠李糖，胞苷二磷酸鼠李糖，胸苷二磷酸-鼠李糖，或其组合。

11.一种用于糖基转移的试剂盒，其特征在于，其中包括：

权利要求7所述的专一性糖基转移酶，该酶能在四环三萜化合物的C-6位的第一个糖基上连接鼠李糖基，所述专一性糖基转移酶是具有SEQ ID NO:2或SEQ ID NO:4所示氨基酸序列的多肽，或其保守性变异多肽；或

权利要求8所述分离的多核苷酸；或

权利要求9所述的核酸构建物；或

权利要求10所述的重组宿主细胞；

较佳地，其中还包括：携带鼠李糖基团的糖基供体；更佳地，所述的糖基供体包括：尿苷二磷酸-鼠李糖，鸟苷二磷酸-鼠李糖，腺苷二磷酸-鼠李糖，胞苷二磷酸-鼠李糖，胸苷二磷酸-鼠李糖。

较佳地，其中还包括：四环三萜化合物反应前体。