CN116179504B

CN116179504B - 广金钱草碳糖基转移酶及其编码基因的应用

Info

Publication number: CN116179504B
Application number: CN202310216660.2A
Authority: CN
Inventors: 曾少华; 王瑛; 史丁丁
Original assignee: South China Botanical Garden of CAS
Current assignee: South China Botanical Garden of CAS
Priority date: 2023-03-08
Filing date: 2023-03-08
Publication date: 2023-08-15
Anticipated expiration: 2043-03-08
Also published as: CN117187207A; CN117187207B; CN116179504A

Abstract

本发明公开了一种广金钱草碳糖基转移酶及其编码基因的应用，所述广金钱草碳糖基转移酶的氨基酸序列如SEQ ID NO.9～SEQ ID NO.16所示。在本发明中，克隆表达了8个碳糖基转移酶基因GsCGT，这8个糖碳基转移酶基因编码的糖碳基转移酶是广金钱草合成夏佛塔苷或异夏佛塔苷的关键限速酶，这对于解析广金钱草夏佛塔苷的合成途径具有重要意义，有利于研究广金钱草多样的碳糖苷类化合物合成机制，对研究代谢基因簇的形成机制、进化机制和生物学功能提供启发；为未来以微生物或植物高效率系统生产C‑糖苷类化合物提供了可参考的氨基酸元件，从而利于医药、农业和食品工业规模化利用碳糖苷类化合物。

Description

广金钱草碳糖基转移酶及其编码基因的应用

技术领域

本发明属于基因工程技术领域，更具体地，本发明涉及8种广金钱草碳糖基转移酶、及其编码基因的应用。

背景技术

广金钱草属于豆科假地豆属植物，拉丁文名为Grona styracifolia(Osbeck)H.Ohashi&K.Ohashi，其作为一种传统中药，始载于《岭南草药志》，主要分布在我国广东、广西和海南等地(杨全,卢挺,桑雪雨。不同种源地广金钱草药材质量变异与遗传多样性分析。中国中药杂志,2013,38(09):1344-1348.)。1977年版《中国药典》正式收载广金钱草的干燥地上部分为药用，用于治疗排尿障碍、泌尿结石、尿路感染、水肿和黄疸等(金淑琴。金钱草、广金钱草、连钱草的考证及临床应用。首都医药,2001,11:54)。目前市场上以广金钱草为原料的中药制剂主要有石淋通片、尿石通、结石通胶囊、热淋清颗粒、复方金钱草颗粒等，并且2022年9月，国家药品监督管理局批准了广金钱草总黄酮胶囊的上市，临床数据表明，广金钱草总黄酮胶囊可溶解0.5-1cm的结石，是全球首创的防治尿结石症中药新药，明确的药理活性表明广金钱草在中药或者保健品等行业具有非常大的潜力。

根据《中国药典》记载，夏佛塔苷是广金钱草中最重要的有效成分和指标成分，按照干燥品计算，广金钱草中的夏佛塔苷含量不得少于0.13％。研究表明夏佛塔苷是广金钱草中抑制胆结石的重要成分，160mg/kg夏佛塔苷可以显著抑制胆结石(Liu M,Liu C,ChenH,et al.Prevention of cholesterol gallstone disease by schaftoside inlithogenic diet-induced C57BL/6 mouse model.European Journal of Pharmacology,2017,815(1-9))。此外，最新的研究表明夏佛塔苷具有抗炎的潜力，夏佛塔苷能抑制LPS(脂多糖)诱导的IL-1β(白细胞介素)、IL-6(白介素6)和TNF-α(肿瘤坏死因子)炎症相关的细胞因子，从而可能抑制机体的“炎症风暴”；此外夏佛塔苷可以抑制新型冠状病毒SARS-CoV-2基因组编码的2种病毒蛋白酶，分别是3C样蛋白酶(3CL^pro：IC₅₀＝1.73±0.22μmol/L)和木瓜样蛋白酶(PL^pro：IC₅₀＝3.91±0.19μmol/L)，从而可以用来治疗COVID-19(Yi Y,Zhang M,Xue H,et al.Schaftoside inhibits 3CLpro and PLpro of SARS-CoV-2 virus andregulates immune response and inflammation of host cells for the treatment ofCOVID-19.Acta Pharmaceutica Sinica B,2022,12(11):4154-4164.)。

除了药理活性外，夏佛塔苷及其同分异构体异夏佛塔苷在农业和植物学中也发挥着重要作用。山蚂蝗属植物根系所分泌的异夏佛塔苷可以抑制寄生种子胚芽生长，从而有效防治独脚金属寄生杂草对作物的侵害作用(Khan Z R,Midega Ca Fau-Bruce T J A,Bruce Tj Fau-Hooper A M,et al.Exploiting phytochemicals for developing a'push-pull'crop protection strategy for cereal farmers inAfrica.1460-2431)。此外，(异)夏佛塔苷含量与小麦叶片的耐旱性和水稻种子的抗紫外线性相关，并且还可以抑制根结线虫(Meloidogyne incognita)和褐飞虱(Nilaparvata lugens)(Wang Z L,Gao HM,Wang S,et al.Dissection of the general two-step di-C-glycosylation pathwayfor the biosynthesis of(iso)schaftosides in higher plants.Proceedings of theNational Academy of Sciences of the United States of America,2020,117(48):30816-30823)，是重要的植物防御化合物。

随着以广金钱草为原料的产品开发，单纯依靠野生资源或人工种植获得广金钱草药用成分，已经很难满足当前国内外市场对广金钱草的需求量。为提高广金钱草的产量及质量，已有研究者通过不同施氮水平(周佳民,尹小红,陈超君,et al.施氮水平对广金钱草产量和活性成分含量的影响.2010,12:1533-1536)或者氮磷钾合理配施(卢挺等，2014)来促进广金钱草的生长并提高夏佛塔苷的积累等。此外，研究人员发现不同产地(杨全,桑雪雨,唐晓敏,et al.不同产地广金钱草夏佛塔苷含量比较.2013,3:5)、不同采收时间(陈端妮,唐晓敏,张春荣。不同采收时间广金钱草药材产量和质量研究.2018,20(04):450-452)或者不同干燥方法(林裕英,赖丽嫦,陈丰连。不同干燥方法对广金钱草鲜品黄酮成分的影响.2017,040(003):589-591)等因素均会在一定程度上影响广金钱草的质量及夏佛塔苷的含量。所以为了更大程度的促进广金钱草产业健康的发展，仅从外部改善广金钱草的栽培条件还远不够。

近年来，利用微生物细胞(发酵)或是植物细胞(毛根、悬浮细胞)工厂合成药用植物活性成分已经有了非常多的应用例子，这些方法不仅可以避免药用植物种植过程中遇到的环境因素如极端气候等导致的质量下降问题，还可以避免化学合成过程中遇到的副产物多，底物昂贵、有毒试剂多等问题。因此，利用现代生物技术和基因工程可以将利用夏佛塔苷等黄酮碳糖苷类化合物的方式从传统农业种植生产转变为快捷方便的工厂化规模化生产。

目前(异)夏佛塔苷生物合成途径已基本解析清楚，比如在黄芩中参与合成(异)夏佛塔苷的结构基因已经得到了分离与功能鉴定。与常见的黄酮类化合物代谢途径不同的是，柚皮素查尔酮经细胞色素酶(F2H)催化生成2-羟基柚皮素，接着碳糖基转移酶a(CGTa)催化2-羟基柚皮素的葡萄糖糖基化，接着碳糖基转移酶b(CGTb)依次催化所获得的2-羟基柚皮素-C-葡萄糖苷的阿拉伯糖基化，随后脱水生成(异)夏佛塔苷(Wang Z L,Gao H M,Wang S,et al.Dissection of the general two-step di-C-glycosylation pathwayfor the biosynthesis of(iso)schaftosides in higher plants.Proceedings of theNational Academy of Sciences of the United States of America,2020,117(48):30816-30823)。并且2021年研究人员利用水稻等植物的结构基因结合工程菌的方式在大肠杆菌中实现了夏佛塔苷的从头合成，产量可达19.87mg/L(Chen Z,Sun Y,Wang G,Zhang Y,Zhang Q,Zhang Y,Li J,Wang Y.De novo biosynthesis of C-arabinosylated flavonesby utilization of indica rice C-glycosyltransferases.BioresourBioprocess.2021；8(1):49)。

随着现代生物技术和合成生物学技术的发展，对于功能基因的筛选、克隆和功能鉴定是进行遗传资源开发和可持续利用的基础。广金钱草中富含丰富且大量的的黄酮碳糖苷类化合物，那么广金钱草如何产生(异)夏佛塔苷？即其代谢途径中参与作用的关键限速酶、功能基因等有哪些？目前仍缺少全面系统的研究，所以，从根源上了解广金钱草中(异)夏佛塔苷的生物合成机制，分离和克隆限速酶及其基因，利用合成生物学和代谢工程手段操纵代谢途径和定向调控品质，将为广金钱草的深入挖掘和可持续发展提供一个有效可行的措施，对于缓解广金钱草的供需不平衡的压力具有非常重要的意义。

发明内容

基于此，本发明的目的在于提供一种广金钱草碳糖基转移酶及其编码基因的应用。

实现上述发明目的的技术方案包括如下。

本发明的第一方面，提供了广金钱草碳糖基转移酶在催化黄酮碳糖苷化合物合成中的应用，所述广金钱草碳糖基转移酶的氨基酸序列如SEQ ID NO.9～SEQ ID NO.16所示。

本发明的第二方面，提供了广金钱草碳糖基转移酶的编码基因在催化黄酮碳糖苷化合物合成中的应用，所述广金钱草碳糖基转移酶的编码基因的核苷酸序列如SEQ IDNO.1～SEQ ID NO.8所示。

本发明的第三方面，提供了一种插入有广金钱草碳糖基转移酶的编码基因的过表达载体在催化黄酮碳糖苷化合物合成中的应用。

本发明的第四方面，提供了一种转化有广金钱草碳糖基转移酶的编码基因的过表达载体的工程菌在催化黄酮碳糖苷化合物合成中的应用。

本发明的第五方面，提供了一种合成牡荆苷或异牡荆苷的方法，所述方法包括步骤：以UDP-glucose为供体，使用广金钱草碳糖基转移酶催化2羟基柚皮素合成牡荆苷或异牡荆苷；所述广金钱草碳糖基转移酶的氨基酸序列如SEQ ID NO.9～SEQ ID NO.14所示。

本发明的第六方面，提供了一种合成维采宁-2的方法，所述方法包括步骤：以UDP-glucose为供体，使用广金钱草碳糖基转移酶催化2羟基柚皮素合成维采宁-2；所述广金钱草碳糖基转移酶的氨基酸序列如SEQ ID NO.12～SEQ ID NO.14所示。

本发明的第七方面，提供了一种合成夏佛塔苷或异夏佛塔苷的方法，所述方法包括步骤：

(1)、以UDP-glucose为供体，使用广金钱草碳糖基转移酶催化2羟基柚皮素合成2-羟基柚皮素-C-单葡萄糖苷；所述广金钱草碳糖基转移酶的氨基酸序列如SEQ ID NO.9～SEQ ID NO.14所示；

(2)、以UDP-Arabinose为供体，使用广金钱草碳糖基转移酶催化步骤(1)的2-羟基柚皮素-C-单葡萄糖苷合成夏佛塔苷或异夏佛塔苷；所述广金钱草碳糖基转移酶的氨基酸序列如SEQ ID NO.15～SEQ ID NO.16所示。

本发明的第八方面，提供了一种合成根皮素单碳苷或根皮素双碳苷的方法，所述方法包括步骤：以UDP-glucose为供体，使用广金钱草碳糖基转移酶催化根皮素素合成根皮素单碳苷，所述广金钱草碳糖基转移酶的氨基酸序列如SEQ ID NO.9～SEQ ID NO.14所示；或以UDP-Arabinose为供体，使用广金钱草碳糖基转移酶催化根皮素合成根皮素双碳苷；所述广金钱草碳糖基转移酶的氨基酸序列如SEQ ID NO.15～SEQ ID NO.16所示。

在本发明中，克隆表达了8个碳糖基转移酶基因GsCGT，其中GsCGT1、GsCGT2、GsCGT3、GsCGT4、GsCGT5、GsCGT6可以催化2-羟基柚皮素一步C-糖基化生成2-羟基柚皮素-C-单葡萄糖苷，脱水后生成同分异构体牡荆苷和异牡荆苷；GsCGT4、GsCGT5、GsCGT6可以连续两步C-糖基化反应生成2羟基柚皮素-C-双葡萄糖苷，脱水后生成维采宁-2；GsCGT7、GsCGT8以UDP-Arabinose为糖基供体可以继续催化2-羟基柚皮素-C-单葡萄糖苷生成2羟基柚皮素-C-葡萄糖-C-阿拉伯糖苷，脱水后生成夏佛塔苷和异夏佛塔苷。因此，这8个糖碳基转移酶基因编码的糖碳基转移酶是广金钱草合成夏佛塔苷或异夏佛塔苷的关键限速酶，这对于解析广金钱草夏佛塔苷的合成途径具有重要意义，有利于研究广金钱草多样的碳糖苷类化合物合成机制，对研究代谢基因簇的形成机制、进化机制和生物学功能提供启发；为未来以微生物(大肠杆菌、酵母)或植物(番茄、烟草)高效率系统生产C-糖苷类化合物提供了可参考的氨基酸元件，从而利于医药、农业和食品工业规模化利用碳糖苷类化合物。

附图说明

图1为本发明实施例2中8个候选碳糖基转移酶基因在广金钱草不同组织的相对表达量，其中，A为广金钱草不同组织(根茎叶)的RNA提取结果；B为8个碳糖基转移酶基因的相对表达量。

图2为本发明实施例3中8个候选碳糖基转移酶基因的PCR扩增条带。

图3为本发明实施例5中8个C-糖基转移酶基因GsCGT编码的融合蛋白纯化后的SDS-PAGE示意图；其中，M为蛋白marker及蛋白分子量条带大小，第二条泳道至第九条泳道为融合蛋白(目标蛋白加上0.85kDa His标签大小)后的条带位置，由红色的三角形所示，最上方的数字表示GsCGT1、GsCGT2、GsCGT3、GsCGT4、GsCGT5、GsCGT6、GsCGT7、GsCGT8蛋白分子量(不含标签大小0.85kDa)。

图4为本发明实施例6中GsCGT1、GsCGT2、GsCGT3、GsCGT4、GsCGT5、GsCGT6以2-羟基柚皮素为底物，UDP-glucose为糖基供体的酶活反应体系的HPLC图。

图5为本发明实施例6中GsCGT1、GsCGT2、GsCGT3、GsCGT4、GsCGT5、GsCGT6以2-羟基柚皮素为底物，UDP-glucose为糖基供体的酶活反应产物在负离子模式下的质谱图。

图6为本发明实施例6中GsCGT1、GsCGT2、GsCGT3、GsCGT4、GsCGT5、GsCGT6以2-羟基柚皮素为底物，UDP-glucose为糖基供体的酶活反应产物经脱水后生成(异)牡荆苷和维采宁-2的负离子模式下的质谱图。

图7为本发明实施例6中GsCGT7、GsCGT8以2-羟基柚皮素为底物，UDP-Arabinose为糖基供体的酶活反应体系的HPLC图。

图8为本发明实施例6中GsCGT7、GsCGT8以2-羟基柚皮素为底物，UDP-Arabinose为糖基供体的酶活反应产物在负离子模式下的质谱图。

图9为本发明实施例7中GsCGT7、GsCGT8以2-羟基柚皮素-C-单葡萄糖苷为底物，UDP-Arabinose为糖基供体的酶活反应产物的HPLC图。

图10为本发明实施例7中GsCGT7、GsCGT8以2-羟基柚皮素-C-单葡萄糖苷为底物，UDP-Arabinose为糖基供体的酶活反应产物经脱水后生成(异)夏佛塔苷的负离子模式下的质谱图。

图11为本发明实施例8中GsCGTa(GsCGT1、GsCGT2、GsCGT3、GsCGT4、GsCGT5、GsCGT6)以根皮素为底物，UDP-glucose为糖基供体的酶活反应产物的HPLC图。

图12为本发明实施例8中GsCGTa(GsCGT1、GsCGT2、GsCGT3、GsCGT4、GsCGT5、GsCGT6)以根皮素为底物，UDP-glucose为糖基供体的酶活反应产物的负离子模式下的质谱图。

图13为本发明实施例8中GsCGTb(GsCGT7、GsCGT8)以根皮素为底物，UDP-Arabinose为糖基供体的酶活反应产物的HPLC图。

图14为本发明实施例8中GsCGTb(GsCGT7、GsCGT8)以根皮素为底物，UDP-Arabinose为糖基供体的酶活反应产物在负离子模式下的质谱图。

具体实施方式

为了便于理解本发明，下面将对本发明进行更全面的描述。本发明可以以许多不同的形式来实现，并不限于本文所描述的实施例。相反地，提供这些实施例的目的是使对本发明公开内容的理解更加透彻全面。

除非另有定义，本发明所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本发明的说明书中所使用的术语只是为了描述具体的实施例的目的，不用于限制本发明。本发明所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。

下列实施例中未注明具体条件的实验方法，通常按照常规条件，例如Green和Sambrook等人，分子克隆实验指南(Molecular Cloning:A Laboratory Manual,2013)中所述的条件，或按照制造厂商所建议的条件。实施例中所用到的各种常用化学试剂，均为市售产品。

在本发明中，首先根据拟南芥GT1亚家族分类方式，将广金钱草中的基因分为22个组，据报道UGT708这个家族最可能是CGT基因，从候选基因中选择8个基因，分别命名为GsCGT1、GsCGT2、GsCGT3、GsCGT4、GsCGT5、GsCGT6、GsCGT7、GsCGT8，设计特异性引物，进行qRT-PCR(Quantity Reverse Transcript Polymerase chain reaction)实验分析(图1)，在广金钱草不同组织部位进行表达量检测，这些基因在广金钱草叶片中高表达，表达模式与夏佛塔苷在广金钱草叶片中含量高一致。在CGT基因的编码区设计8对引物，以广金钱草的叶片总RNA反转录得到的cDNA为模板，以8对引物作为引物，经过PCR分别获得了GsCGT1、GsCGT2、GsCGT3、GsCGT4、GsCGT5、GsCGT6、GsCGT7、GsCGT8的全长序列，其序列分别如SEQ IDNO.1～SEQ ID NO.8所示，编码的蛋白质的氨基酸序列分别如SEQ ID NO.9～SEQ ID NO.16所示。随后，用pColdⅡ载体构建原核表达载体pColdⅡ-GsCGT1、pColdⅡ-GsCGT2、pColdⅡ-GsCGT3、pColdⅡ-GsCGT4、pColdⅡ-GsCGT5、pColdⅡ-GsCGT6、pColdⅡ-GsCGT7、pColdⅡ-GsCGT8，转化至大肠杆菌感受态细胞BL21(DE3)中，通过IPTG诱导表达，随后用镍亲和层析的方法对重组蛋白进行纯化，纯化结果经过SDS-PAGE检测(图3)。

然后，以2-羟基柚皮素作为底物对GsCGT1、GsCGT2、GsCGT3、GsCGT4、GsCGT5、GsCGT6、GsCGT7、GsCGT8酶进行酶活反应测试，酶活反应以50mM Na₂HPO₄-NaH₂PO₄(pH8.0)作为反应缓冲液，分别以尿苷二磷酸葡萄糖(UDP-glucose，品牌Angfeibio，货号AFS21005)和尿苷二磷酸阿拉伯糖(UDP-Arabinose，品牌Angfeibio，货号AF02898)作为糖基供体进行，反应完后用HPLC检测是否有产物生成。结果表明GsCGT1、GsCGT2、GsCGT3、GsCGT4、GsCGT5、GsCGT6、GsCGT7和GsCGT8分别以UDP-glucose和UDP-Arabinos为糖基供体，以2羟基柚皮素为底物的酶活反应均有相应的产物生成(结果如图4、图7、图9，其中，使用GsCGT1～GsCGT6可以合成牡荆苷、异牡荆苷和维采宁-2)。反应体系再经过LC-MS(图5、图6、图8、图10)、结合标准品可以确定图9的产物是夏佛塔苷或异夏佛塔苷(使用GsCGT7和GsCGT8，以UDP-Arabinos为糖基供体，2-羟基柚皮素-C-单葡萄糖苷为底物合成而得)。此结果说明，GsCGT1、GsCGT2、GsCGT3、GsCGT4、GsCGT5、GsCGT6、GsCGT7、GsCGT8在夏佛塔苷的合成过程中，参与碳糖基化修饰，使2羟基柚皮素分别被葡萄糖和阿拉伯糖C-糖基化后最终形成夏佛塔苷或异夏佛塔苷。纯化后的GsCGT1、GsCGT2、GsCGT3、GsCGT4、GsCGT5、GsCGT6、GsCGT7、GsCGT8碳糖基转移酶以根皮素作为反应底物，以UDP-glucose(GsCGT1、GsCGT2、GsCGT3、GsCGT4、GsCGT5、GsCGT6)和UDP-Arabinose(GsCGT7、GsCGT8)作为糖基供体，发现也可以将根皮素碳糖基化(图11、图12、图13、图14)。

在本发明的其中一些实施例中，公开了一种广金钱草碳糖基转移酶在催化黄酮碳糖苷化合物合成中的应用，所述广金钱草碳糖基转移酶的氨基酸序列如SEQ ID NO.9～SEQID NO.16所示。

SEQ ID NO.9(GsCGT1蛋白)

MSGSEHAVHLAFLPSAGLGLLNPCLRTAELFLSYGCKITLITPKPTVSLAESNLISRFCSSFPY

QVTQIDLNLLPVDPTTVNTNDPFWLQFETIRRSAHLVGPILSSLSPPLSAFVFDVSLVAPLIPIT

EKLSCPSYINFTSSARLLSFFAYLSVLADLNPDAKPCSFIGNSVKIPGIASPIPRSTVLIELLEPN

SLMESIFMADSPKLTKLNGIFINTFEEIEGEALAALTEGQVVKGLPPVYYVGPLMACEFEKV

DQVQRSSSLSSIFKWLDEQAKGSVVYVCFGNRTATRKEQIKDTALGLIESGYSFLWVVKLKE

VDKEDEENLEDVLGNELMIKVREKGVVVKEFVDQMEILGHPAVGGFVSHGGWNSTIETV

WEGVPILSWPQHGDQKLSAETTRLSGVGIWPEEWGWGTEDHVVKGKEIAKRIKEMMSNE

SLRVKAAELKEAARKAAGVGGSREVIIKRLIEEWKSNSQAT

SEQ ID NO.10(GsCGT2蛋白)

MSGSEHVVHLAFLPSAGMGLLNPCLRTAALFLRYGCKITLITPKPTVSLAESNLISRFCSSFP

HQVNQIDLNLLPVDPTTVNTNDPFWLQFETIRHSAHLVGPILSSLSPPLSAFIFDVSLVAPLIPII

EKLPCPSYTNFTSSARLLSLFAYLSVLADSNQDAKPCSFIGNGVNIPGIASPIPRSTVPSMLLK

PNSLMESIFMADSPKLTKLNGVFINTFEEFEGEALAALNEGKVVKGFPPVYGIGPIMACEFE

KVDQVQRSSSMSSTFKWLDEQAKGSVVYVCFGNRTATRREQIKDTALGLIESGYSFLWVVK

LKEVDKEEEEGLEDVLGNELMSKVREKGVVVKEYVDQMGILGHPAVGGFVSHGGWNSTI

ETVWEGVPILSWPQHGDQKISAETTRISGVGIWPEEWGWGTEDHVVKGKEIAKRIKEMMS

NESLRVKAAELKEAARKAAGVGGSHEVIIKRLIEEWKRNAKAT

SEQ ID NO.11(GsCGT3蛋白)

MSGSEDVVHLAFLPSAGMGLLNPCLRMAAQFLRYGCKITLITPKPTVSLAESNLISRFCSSFP

HQVTQIDLNLLPVDPTTVNTSDPFWLQFEIIRRSVHLVGPILSSLSPPLSAFIFDVSLVAPLIPIT

EKLSCPSYTNFTSSARLLSFFAYLSVLADSNPDAKPCSFIGKGIKIPGITSPIPRSTVPSKLLNP

NSLMESIFMADSPKLTKLNGVFINTFEEFEEEALAALNEGKVVKGLPPVYAIGPIMACEFEK

VNQVQRSSSMSSIFKWLDQQAIGSVVYVCFGNRTATRREQIKDTALGLIESGYSFLWVVKL

KEVDKEEEEGLEDVLGNELMSKVREKGVVVKEYVDQMGILGHPAVGGFVSHGGWNSTIE

TVWEGVPILSWPQHGDQKISAEATRIRGVGIWPEEWGWGTEDDVVKGKEIAKRIKEMMSN

ESLRVKAAELKEAARKAAGVGGSRDVIIKKQIEEWKRNAQAT

SEQ ID NO.12(GsCGT4蛋白)

MSPSEHDVHLVFLPSAGMGHLNPCLRIATMFLRHGCKVTLITPKPTVSIAESNLISRFCSSFP

HQVTQIDLNLITLDPTTVNTDDPFWLQFETIRRSVHLVGPILSSLSSTVPPVSAFIFDVSLISPLI

PIIEKLSCPSYIYFTSSARMLSFFALTSVLASSNPGEKPHSFIGDGVKIPGVASPIPRSSVPSMVL

KPNSLFESIFMEDSAKLTKLNGVFINSFQELEGEALAALNEGKVVEGLPPVYGIGPLMPCEF

EKVDQVQKGGSMRSILKWLDEQAKESVVYVCLGNRTETRKEQIKDTALGLIESGYSFLWV

VKLKAVDREEEEDVEDVLGNELMNKVREKGVVVKEYVDQMGILAHPAVGGFVNHGGWN

SITETVWEGVPILTWPHHGDQKITSESVRLSGVGIWPEEWGWGTEEVVKGKEIAKRIKELM

SNESLRVKTAEMKEAARKAAGVGGSCEVIVKRLIEEWKKNVKATC

SEQ ID NO.13(GsCGT5蛋白)

MSASSEHVVHLVILPCAGMGHLNPCLRIAALFLRYGCKITLITPKPTVSLAESNLISRFCSSFP

QVTQIDLNLITLDPNTVKTNDPFWLQYETVRRSVPLVAPILSSLSTVTPLSAFIFDIFLISPVIPII

EKLSCPSYTYFTSSAIMFSFYAYLSVLAAANPGAHPCSFIDVIEIPGIASPIPRSSVPPLLLQPNS

VLESIFMADSPKLTKLNGIFINSFEELEEEALAALNEGKVVKGLPPVYPLGPLMACEFDKED

QGKRGSSMMRSILRWLDEQDEASVVYVCLGSRTETRKEQIKDTALGLIESGYRFLWVVKL

KVVDIEEEEGLEDVLGSELMSKVREKGLVVKEYVDQMAILGHPAVGGFLNHGGWNSITET

VWEGVPILTWPQHGDQKITSESVRRSEVGIWPEDWGWGTEEVVKGKEIAKRLKEMMSNES

LRVKAAAMKEAARKAAGIGGSVEVIIKRQIEEWKSNVHAT

SEQ ID NO.14(GsCGT6蛋白)

MSGSEHVVHLAFLPSAGMGHLNPFLRIAALFLRHGCKVTLITPKPTVSLAESKLISRFCSSFP

KQVTQMDLNLIPVDPTTVNTTDPFWLQFETIRRSVHLVGPILSSLSPPLTAFIYDVSLITPLLPI

TEKLSCPSYIIFTSSARMLSFFAHLSVLAASNPGEHPCSFIDVIEIPGFSSPIPRSSVPPMLLQPN

SALETIFMADSPKLTKLNGIFINTFEELEGEALAALNEGKVVKGLPPVLAVGPLMACEFEEE

DQGQRSSSMTSILKWLDEQDEASVVYVCLGSRTETRKEQIKDTALGLIESGYRFLWVVKLK

MVDREEEEGLEDVLGNGLMSKVREKGVVVKEYVDQLEILSHPAVGGFVSHGGWNSTIETV

WEGVPILSWPQHGDQKMSSQTTRISGVGIWPEDWGWGTQDMVKAKEIAKRI

KEMMSNESLRVKAAEIKEAARKAAGVGGSCEVIVKRQIEEWKKNVKATSEQ ID NO.15(GsCGT7蛋白)

MSASEHVVHLAFLPSAGMGHLNPFLRTAALFLRHGCKVTLITPKPTVSLAESKLISRFCSSFP

KQVTQIDLNLIPVDPTTVNTTDPFWLQFETIRRSVHLVGPILSSLSKVTPLSAFIFDVSLISPLV

PIIEKLSCPSYIYFVALTRMLSFFAHLPVLAASNPGENPCSFIGDGVKIPGIEYPISRSSVPSLLL

QPNSLFESIFMEDSPKLTKLNGIFINTFEEMEGEALAALNEGKVVKGLPPVYAVGPLMACEF

EKVDQGLAGGSMSSILKWLDEQVKESVVYVCLGNKTVTRREQIKDMALGLIESGYSFLWV

VKLKVVDREEEESLEDVLGTELMSKVKEKGLVVKDFVDQVEILNHPSVGGFVNHGGWNSI

IEAVWVGVPILSWAQGGDQKIASEAVKISGVGVWPEEWGWGAEEVIKGKEIAKRIKEMMS

NESLRLKAAEMKEAARKAAGVGGSCEVIIKRQIEEWKKNVHATSEQ ID NO.16(GsCGT8蛋白)

MSASEHVVHLAFLPSAGMGHLNPCLRTAALFLRYGCKVTLITPKPTVSLAESNLISRFCSSFP

QQVTQVDLNLITLDPTTVNTNDPFWLQFETIRRSVHFVGPILSSLSKVTPLSAFIFDVSLISPL

VPIIEKLSCPSYIYFIAPARMFSFFAHLSVLAASNPGENPCSFIGDGVKIPGIELPISRSSVPSLLL

QPNTLFESIFMEDSPKLTKLNGVFVNTFEEMEGEALAALNEGKVVKGLPPVYGVGPFMACE

FEKVDQAQGSSSMSSIFKWLDEQAKGSVVYVCFGNKTATRREQIKDTALGLIESGYSFLWV

VKLKEVDREEGESLEDVLGTELMSKVEEKGLVVKDFVDQMKILDHPSVGGFVTHGGWNS

TIEAVWVGVPILSWPQGGDQKICSEAVKIKGVGVWPEEWGWGAEEVIKGKEIAKRIKEMM

SNESLRVKAAEMKEAARKAAGVGGSCEVIVKRQIEEWKKNVHAT

在本发明的另一些实施例中，公开了一种广金钱草碳糖基转移酶的编码基因在催化黄酮碳糖苷化合物合成中的应用，所述广金钱草碳糖基转移酶的编码基因的核苷酸序列如SEQ ID NO.1～SEQ ID NO.8所示。

SEQ ID NO.1(DsCGT1,1437bp)

ATGTCTGGTTCAGAACACGCTGTTCATTTGGCTTTCCTTCCAAGTGCTGGACTGGGACTT

CTTAACCCATGTCTTAGAACTGCAGAACTATTTCTAAGCTATGGTTGCAAAATCACACTC

ATCACTCCCAAACCCACTGTCTCTCTTGCTGAGTCCAACCTCATCTCTCGCTTTTGTTCTT

CTTTCCCTTACCAAGTTACCCAAATAGACTTAAATCTCCTCCCTGTTGATCCAACCACAG

TTAACACCAATGACCCTTTTTGGCTTCAGTTTGAAACCATTCGTCGTTCAGCTCACCTTG

TAGGTCCAATACTATCTTCACTCTCACCACCTCTCTCTGCTTTCGTCTTCGATGTGAGCTT

AGTAGCCCCTTTAATTCCAATCACTGAGAAACTGTCTTGTCCGTCTTACATAAACTTCAC

ATCTTCAGCTAGATTGCTCTCTTTTTTTGCATATCTTTCTGTTCTTGCTGATTTAAATCCAG

ACGCAAAACCTTGTTCATTCATTGGTAATAGTGTTAAAATCCCGGGCATAGCATCACCAA

TACCAAGATCCACTGTCCTTATTGAGCTTCTTGAGCCTAACTCTCTCATGGAGAGCATATT

CATGGCGGACAGTCCCAAACTCACAAAACTGAATGGGATTTTCATCAACACGTTTGAAG

AAATTGAAGGGGAAGCACTGGCAGCACTCACCGAAGGACAAGTGGTTAAAGGTTTGCC

CCCAGTGTATTATGTTGGTCCCTTAATGGCATGTGAGTTTGAGAAAGTGGATCAAGTTCA

AAGGAGTTCTTCTTTAAGTTCAATATTCAAGTGGCTTGATGAACAAGCTAAAGGGTCGG

TGGTGTATGTTTGCTTCGGGAATAGGACAGCGACAAGAAAGGAGCAAATAAAAGACAC

GGCTTTGGGGTTAATTGAAAGTGGGTATAGTTTTTTGTGGGTGGTGAAATTGAAGGAGG

TTGATAAAGAAGATGAGGAGAATTTGGAGGATGTGTTGGGGAATGAGTTGATGATTAAG

GTAAGGGAAAAAGGTGTGGTTGTGAAGGAATTTGTGGATCAAATGGAGATTCTGGGTCA

CCCTGCAGTGGGGGGGTTTGTGAGTCATGGAGGGTGGAACTCAACAATAGAGACTGTG

TGGGAAGGAGTTCCTATTCTGTCATGGCCTCAGCATGGGGATCAAAAGCTCTCCGCAGA

GACAACAAGGTTAAGTGGGGTGGGAATTTGGCCAGAAGAGTGGGGTTGGGGAACAGA

AGATCATGTAGTGAAAGGAAAGGAGATTGCTAAGAGAATCAAAGAGATGATGAGTAATG

AATCTTTGAGGGTCAAAGCTGCAGAATTGAAGGAGGCAGCTAGGAAGGCTGCGGGTGT

TGGTGGAAGTCGTGAGGTTATTATTAAGAGACTAATTGAGGAGTGGAAGAGCAATTCTC

AAGCCACTTGA

SEQ ID NO.2(GsCGT2,1437 bp)

ATGTCTGGTTCAGAACACGTTGTTCATTTGGCTTTCCTTCCAAGTGCTGGAATGGGACTT

CTTAACCCTTGTCTTAGAACCGCAGCACTGTTTCTACGCTATGGTTGCAAAATCACTCTC

ATCACTCCCAAACCCACTGTCTCTCTTGCTGAGTCCAACCTCATCTCTCGCTTTTGTTCTT

CTTTTCCTCACCAAGTTAACCAAATAGACTTAAATCTCCTCCCTGTTGATCCAACCACAG

TTAACACCAATGACCCTTTTTGGCTTCAGTTTGAAACCATTCGTCATTCAGCTCACCTTG

TAGGTCCAATACTATCTTCACTCTCACCACCTCTCTCTGCTTTCATCTTCGATGTTAGCTT

GGTAGCCCCTTTAATTCCAATCATTGAGAAACTCCCTTGCCCATCCTACACAAACTTCAC

ATCATCAGCAAGATTGCTCTCTCTTTTTGCATACCTTTCTGTTCTTGCTGATTCAAATCAA

GATGCAAAACCTTGTTCATTCATTGGTAATGGTGTTAACATCCCAGGCATAGCATCACCA

ATACCAAGATCCACTGTCCCTAGTATGCTTCTCAAGCCTAACTCTCTTATGGAGAGCATAT

TCATGGCGGACAGTCCCAAACTCACAAAGCTGAATGGGGTTTTCATCAACACGTTTGAG

GAATTTGAAGGGGAGGCCCTGGCAGCACTCAACGAAGGAAAAGTTGTTAAAGGGTTTC

CCCCAGTGTATGGCATTGGTCCCATAATGGCATGCGAGTTTGAGAAGGTCGATCAAGTTC

AAAGGAGTTCTTCCATGAGTTCAACATTCAAGTGGCTTGATGAACAAGCTAAAGGTTCG

GTGGTTTATGTTTGCTTCGGGAATAGGACAGCGACAAGAAGGGAGCAAATAAAAGACA

CGGCTTTGGGGTTAATAGAAAGTGGGTACAGTTTTTTGTGGGTGGTGAAGTTGAAGGAG

GTTGATAAAGAAGAGGAGGAGGGTTTGGAAGATGTGTTGGGGAATGAGTTGATGAGTA

AGGTAAGGGAAAAAGGTGTGGTTGTGAAGGAATATGTGGATCAGATGGGAATTCTGGGT

CACCCTGCAGTCGGGGGGTTTGTGAGTCATGGAGGTTGGAACTCAACAATAGAGACTGT

GTGGGAAGGAGTTCCTATTCTGTCTTGGCCTCAGCATGGGGATCAGAAGATCTCCGCAG

AGACAACAAGGATAAGTGGGGTGGGAATTTGGCCAGAAGAGTGGGGTTGGGGAACAG

AAGATCATGTAGTGAAAGGAAAGGAAATTGCTAAGAGAATCAAAGAGATGATGAGTAAT

GAATCTTTGAGGGTCAAGGCTGCAGAATTGAAGGAGGCAGCTAGGAAGGCTGCTGGTG

TTGGTGGCAGTCATGAGGTTATTATTAAGAGACTAATTGAGGAGTGGAAGAGGAATGCT

AAAGCCACTTGA

SEQ ID NO.3(GsCGT3,1437 bp)

ATGTCTGGTTCAGAAGACGTTGTTCATTTGGCTTTCCTTCCAAGTGCTGGAATGGGACTT

CTTAACCCATGTCTTAGAATGGCAGCACAGTTTCTACGCTATGGTTGCAAAATCACTCTC

ATCACTCCCAAACCCACTGTCTCTCTTGCTGAGTCTAACCTCATCTCTCGCTTTTGTTCTT

CTTTCCCTCATCAAGTTACACAAATAGACTTGAATCTCCTCCCTGTTGATCCAACTACAGT

AAACACCAGTGACCCTTTTTGGCTTCAGTTTGAAATCATTCGTCGTTCAGTTCACCTTGT

AGGTCCAATACTGTCTTCACTCTCACCACCTCTCTCTGCTTTCATCTTCGATGTTAGCTTA

GTAGCCCCTCTAATTCCAATCACTGAGAAGCTCTCTTGTCCATCTTACACAAACTTCACA

TCATCAGCTAGATTGCTCTCTTTTTTTGCATACCTTTCTGTTCTTGCTGATTCAAATCCAG

ACGCAAAACCTTGTTCATTCATTGGTAAGGGTATTAAAATCCCGGGCATAACATCACCAA

TACCAAGATCCACTGTCCCTAGTAAACTTCTTAACCCTAATTCTCTCATGGAGAGCATATT

CATGGCGGACAGTCCCAAACTCACAAAGCTGAATGGGGTTTTCATCAACACGTTTGAAG

AGTTTGAAGAGGAGGCACTGGCAGCACTCAACGAAGGAAAAGTTGTTAAAGGGTTGCC

CCCAGTGTATGCCATTGGTCCCATAATGGCATGTGAGTTTGAGAAGGTGAATCAAGTTCA

AAGGAGTTCATCCATGAGTTCAATATTCAAGTGGCTTGATCAACAAGCCATAGGGTCGGT

GGTGTATGTTTGCTTCGGGAATAGGACGGCGACAAGAAGGGAGCAAATAAAAGACACG

GCTTTGGGGTTAATAGAAAGTGGGTATAGTTTTTTGTGGGTGGTGAAGTTGAAGGAGGT

TGATAAAGAAGAGGAGGAGGGTTTGGAGGATGTGTTGGGGAATGAGTTGATGAGTAAG

GTAAGGGAAAAAGGTGTGGTTGTGAAGGAATATGTGGATCAGATGGGGATTCTGGGTCA

CCCTGCAGTGGGGGGGTTTGTGAGTCATGGAGGGTGGAACTCAACAATAGAGACTGTG

TGGGAAGGAGTTCCTATTCTGTCATGGCCTCAGCATGGGGATCAGAAGATCTCCGCAGA

GGCAACAAGGATAAGAGGGGTGGGAATTTGGCCAGAAGAGTGGGGTTGGGGAACAGA

AGATGATGTAGTGAAAGGAAAGGAGATTGCTAAGAGAATCAAAGAGATGATGAGTAATG

AATCTTTGAGGGTCAAAGCTGCAGAACTGAAGGAGGCAGCTAGGAAGGCTGCTGGTGT

TGGTGGGAGTCGTGACGTTATTATTAAGAAACAAATTGAAGAGTGGAAGAGGAATGCTC

AAGCCACTTGA

SEQ ID NO.4(GsCGT4,1446 bp)

ATGTCTCCTTCAGAGCATGATGTTCATTTGGTTTTCCTCCCAAGTGCTGGCATGGGACAT

CTTAACCCATGTCTTAGAATAGCAACAATGTTTCTACGCCATGGTTGCAAAGTCACTCTT

ATCACTCCCAAACCCACTGTCTCTATTGCTGAGTCTAACCTCATCTCTCGCTTTTGTTCTT

CTTTTCCTCATCAAGTTACTCAAATAGACTTAAATCTCATAACTTTGGATCCAACCACAGT

TAACACCGATGACCCTTTTTGGCTTCAGTTTGAAACTATTCGTCGTTCGGTTCACCTTGT

AGGTCCAATACTATCTTCACTCTCATCAACAGTACCCCCTGTCTCAGCTTTCATCTTCGAT

GTTAGCTTGATCTCGCCTCTAATTCCAATCATTGAGAAACTATCTTGTCCGTCTTACATTT

ACTTCACCTCATCAGCTAGAATGCTCTCTTTTTTTGCACTCACGTCTGTTCTTGCTTCTTC

CAATCCAGGTGAAAAACCTCATTCATTCATTGGTGATGGTGTTAAAATCCCAGGCGTAGC

ATCACCAATACCAAGATCTTCTGTCCCTAGTATGGTTCTTAAGCCCAACTCTCTCTTTGAG

AGCATATTCATGGAGGACAGTGCCAAACTCACTAAGCTTAATGGGGTTTTCATCAACTCG

TTTCAAGAATTGGAAGGGGAGGCACTGGCAGCACTCAACGAAGGAAAAGTGGTTGAA

GGGCTGCCCCCAGTGTATGGTATTGGTCCCTTAATGCCGTGTGAGTTTGAGAAGGTGGAT

CAAGTTCAAAAGGGTGGTTCCATGAGATCAATATTGAAGTGGCTAGATGAACAAGCTAA

AGAGTCTGTGGTATATGTTTGCTTGGGGAATAGGACGGAGACAAGAAAAGAGCAAATAA

AAGACACGGCTTTGGGGTTGATAGAAAGTGGGTATAGTTTTTTGTGGGTGGTGAAGTTG

AAGGCTGTTGATAGAGAAGAGGAGGAGGATGTGGAGGATGTGTTGGGGAATGAGTTGA

TGAATAAAGTGAGGGAAAAAGGTGTGGTTGTGAAAGAATATGTGGATCAGATGGGAATT

CTGGCTCACCCTGCAGTAGGGGGGTTTGTGAATCACGGAGGGTGGAACTCAATAACTGA

GACTGTGTGGGAAGGAGTTCCTATTTTGACATGGCCTCATCATGGGGATCAGAAGATAA

CCTCAGAGTCAGTGCGGTTAAGTGGGGTGGGAATTTGGCCTGAGGAGTGGGGGTGGGG

TACAGAAGAGGTGGTGAAAGGGAAGGAGATTGCGAAGAGAATCAAAGAGTTGATGAG

CAATGAATCTTTAAGGGTCAAAACTGCAGAAATGAAGGAGGCAGCTAGGAAGGCTGCA

GGTGTTGGTGGGAGTTGTGAGGTTATTGTTAAGAGGCTAATTGAGGAGTGGAAGAAGAA

TGTTAAAGCCACTTGCTAG

SEQ ID NO.5(GsCGT5,1437 bp)

ATGTCTGCTTCTTCAGAACATGTTGTTCATTTGGTTATACTTCCATGTGCTGGCATGGGAC

ATCTTAACCCATGTCTTAGAATAGCAGCACTGTTTCTACGCTATGGTTGCAAAATCACTCT

CATCACTCCCAAACCCACTGTCTCTCTTGCTGAGTCTAACCTCATCTCTCGCTTTTGTTCT

TCTTTCCCTCAAGTTACCCAAATAGACTTAAATCTCATAACTTTGGATCCAAACACAGTT

AAAACCAATGACCCTTTTTGGCTTCAGTATGAAACCGTTCGTCGTTCGGTTCCCCTTGTA

GCTCCAATACTATCTTCACTCTCAACAGTAACACCTCTCTCTGCTTTCATTTTTGATATTTT

CTTAATCTCGCCTGTTATTCCAATCATTGAGAAACTATCTTGTCCGTCTTACACTTACTTC

ACCTCATCAGCTATCATGTTCTCTTTTTATGCATACCTTTCTGTTCTTGCTGCTGCCAATCC

GGGTGCACACCCTTGTTCATTTATTGATGTTATCGAAATTCCAGGTATTGCGTCGCCAATA

CCAAGATCGTCGGTTCCACCTTTGCTTCTTCAACCTAACTCTGTCCTTGAGAGCATCTTC

ATGGCGGACAGTCCCAAACTCACAAAGCTCAATGGGATTTTCATCAACTCGTTTGAGGA

ATTGGAAGAAGAAGCACTTGCAGCACTCAACGAAGGAAAAGTGGTTAAAGGATTGCCT

CCAGTGTACCCTCTTGGTCCCTTAATGGCGTGTGAGTTTGACAAAGAGGATCAAGGTAA

AAGGGGTTCTTCCATGATGAGATCGATACTGAGGTGGCTTGACGAACAAGATGAAGCGT

CTGTGGTGTATGTTTGCCTGGGGAGTAGGACGGAGACAAGAAAGGAGCAAATAAAAGA

CACAGCTTTGGGGTTAATAGAAAGTGGGTATAGATTTTTGTGGGTGGTGAAGTTGAAGG

TGGTTGATATAGAAGAGGAGGAGGGTTTGGAGGATGTGTTGGGGAGTGAGTTGATGAGT

AAGGTAAGGGAAAAAGGTTTGGTTGTGAAGGAATATGTGGATCAGATGGCGATTCTGGG

TCACCCTGCAGTCGGGGGGTTTTTGAATCATGGAGGGTGGAACTCAATAACTGAGACTG

TGTGGGAAGGAGTGCCTATATTGACATGGCCTCAGCATGGGGATCAGAAGATAACCTCA

GAGTCAGTGAGGAGAAGTGAGGTAGGAATTTGGCCTGAGGATTGGGGGTGGGGTACAG

AAGAGGTGGTGAAAGGGAAGGAAATTGCCAAGAGACTCAAAGAGATGATGAGTAATGA

ATCTTTGAGGGTCAAAGCTGCAGCAATGAAGGAGGCAGCTAGGAAGGCTGCTGGTATT

GGTGGGAGTGTTGAGGTTATTATTAAGAGGCAAATTGAGGAGTGGAAGAGTAATGTTCA

TGCCACT

SEQ ID NO.6(GsCGT6,1431 bp)

ATGTCTGGTTCAGAACATGTTGTTCATTTGGCTTTCCTCCCAAGTGCTGGCATGGGACAT

CTTAATCCATTTCTTAGAATAGCAGCACTGTTTCTACGCCATGGTTGCAAAGTCACTCTCA

TCACTCCCAAACCCACTGTCTCTCTTGCTGAGTCAAAACTCATCTCTCGCTTTTGTTCTT

CTTTTCCCAAACAAGTTACCCAAATGGACTTAAATCTCATCCCTGTGGATCCAACCACAG

TTAACACCACTGACCCTTTTTGGCTTCAGTTTGAAACTATTCGTCGATCGGTTCACCTTGT

AGGTCCAATACTATCTTCACTCTCACCACCTCTCACTGCTTTCATCTACGATGTTAGCTTA

ATCACCCCTCTACTTCCAATCACTGAGAAACTCTCTTGTCCGTCTTACATAATCTTCACGT

CATCAGCTAGAATGCTCTCTTTTTTTGCACACCTTTCTGTTCTTGCTGCTTCAAATCCAGG

TGAACACCCTTGTTCATTCATTGATGTTATCGAAATCCCAGGATTTTCGTCACCAATACCA

AGATCGTCGGTTCCCCCTATGCTTCTTCAACCTAACTCTGCCCTCGAGACCATCTTCATG

GCGGACAGTCCCAAACTCACAAAGCTCAATGGGATTTTCATCAACACGTTTGAAGAATT

GGAAGGAGAAGCACTGGCAGCACTCAACGAAGGAAAAGTGGTTAAAGGGTTGCCTCC

GGTGCTAGCTGTTGGTCCCTTAATGGCGTGTGAGTTTGAGGAAGAGGATCAAGGTCAAA

GGAGTTCTTCCATGACTTCGATACTGAAGTGGCTTGACGAACAAGATGAAGCGTCGGTG

GTGTATGTTTGCTTGGGGAGTAGAACGGAGACTAGAAAAGAGCAAATAAAAGACACAG

CTTTGGGATTAATAGAAAGTGGGTATAGATTTTTGTGGGTGGTGAAGTTGAAGATGGTTG

ATAGAGAAGAGGAGGAGGGTTTGGAGGATGTGTTGGGGAATGGGTTGATGAGTAAAGT

GAGGGAAAAAGGTGTGGTTGTGAAGGAATATGTGGATCAGTTGGAGATTCTGAGTCACC

CTGCAGTGGGGGGGTTTGTGAGTCATGGAGGGTGGAACTCAACAATAGAGACTGTTTG

GGAAGGAGTGCCTATTCTATCATGGCCTCAGCATGGAGATCAGAAGATGTCCTCACAGA

CAACAAGGATAAGTGGAGTAGGAATTTGGCCTGAGGATTGGGGATGGGGTACCCAAGA

CATGGTGAAAGCAAAGGAGATTGCTAAGAGAATCAAAGAAATGATGAGCAATGAATCTT

TGAGGGTCAAAGCTGCAGAAATAAAGGAGGCAGCTAGAAAGGCTGCTGGTGTTGGTGG

AAGTTGTGAGGTTATTGTTAAGAGGCAAATTGAGGAATGGAAGAAGAATGTTAAAGCCA

CTTGA

SEQ ID NO.7(GsCGT7,1440 bp)

ATGTCTGCCTCAGAACATGTTGTTCATTTGGCTTTCCTCCCAAGTGCTGGTATGGGACAT

CTTAACCCATTTCTTAGAACAGCAGCACTGTTTCTACGCCATGGTTGCAAAGTCACTCTT

ATCACTCCCAAACCCACTGTCTCTCTTGCTGAGTCAAAACTCATCTCTCGCTTTTGTTCT

TCTTTTCCCAAACAAGTTACCCAAATAGACTTAAATCTCATCCCTGTGGATCCAACCACA

GTTAACACCACTGACCCTTTTTGGCTTCAGTTTGAAACTATTCGTCGATCGGTTCACCTT

GTAGGTCCAATACTATCTTCACTCTCAAAGGTCACACCTCTCTCCGCTTTCATCTTCGATG

TTAGCTTAATCTCCCCTCTAGTGCCGATCATTGAAAAACTATCTTGTCCGTCTTACATTTA

CTTCGTTGCACTAACTAGAATGCTCTCTTTTTTTGCACACCTTCCTGTTCTTGCTGCTTCA

AATCCAGGTGAAAACCCTTGTTCATTCATTGGTGATGGTGTTAAAATCCCAGGCATTGAA

TATCCAATATCAAGATCCTCGGTCCCTAGTTTGCTTCTTCAGCCTAACTCTCTCTTTGAGA

GCATATTCATGGAGGACAGTCCCAAACTCACGAAGCTCAACGGGATTTTTATCAACACG

TTTGAAGAAATGGAAGGGGAGGCATTGGCAGCACTTAACGAAGGAAAAGTGGTTAAAG

GGTTGCCCCCAGTGTATGCTGTTGGTCCCTTAATGGCATGTGAGTTTGAGAAGGTGGATC

AAGGTCTAGCGGGTGGTTCCATGAGTTCTATATTGAAGTGGCTTGACGAACAAGTTAAA

GAGTCTGTGGTATATGTTTGCTTAGGGAATAAGACAGTTACAAGAAGGGAGCAAATAAA

AGACATGGCTTTGGGGCTAATAGAAAGTGGGTATAGTTTTTTGTGGGTGGTGAAGTTAA

AGGTGGTTGATAGAGAAGAGGAGGAGAGTTTGGAAGATGTGTTGGGGACTGAATTGAT

GAGTAAGGTGAAGGAAAAGGGTTTGGTTGTGAAGGATTTTGTGGATCAGGTGGAGATT

CTGAATCACCCTTCAGTAGGGGGATTTGTGAATCATGGAGGGTGGAACTCAATAATAGA

GGCTGTGTGGGTAGGAGTGCCTATTTTATCATGGGCTCAGGGTGGGGATCAGAAGATAG

CCTCGGAGGCTGTGAAGATCAGTGGGGTAGGAGTTTGGCCTGAGGAATGGGGGTGGGG

AGCAGAAGAGGTTATAAAAGGGAAGGAGATTGCTAAGAGAATCAAAGAGATGATGAGC

AATGAATCTTTGAGACTCAAAGCTGCAGAAATGAAGGAGGCAGCTAGAAAGGCTGCTG

GTGTTGGTGGGAGTTGTGAGGTTATTATTAAGAGGCAAATTGAGGAGTGGAAGAAGAAT

GTTCATGCTACTTGA

SEQ ID NO.8(GsCGT8,1440 bp)

ATGTCTGCCTCAGAACATGTTGTTCATTTGGCTTTCCTCCCAAGTGCTGGCATGGGACAT

CTTAACCCATGTCTTAGAACAGCAGCACTGTTTCTACGCTATGGTTGCAAAGTCACTCTT

ATCACTCCCAAACCCACTGTCTCTCTTGCTGAGTCAAACCTCATCTCTCGCTTCTGTTCT

TCTTTCCCTCAACAAGTTACCCAAGTAGACTTAAATCTCATAACTTTGGATCCAACCACA

GTTAACACCAATGACCCTTTTTGGCTTCAGTTTGAAACCATTCGTCGTTCGGTTCACTTT

GTAGGTCCAATACTATCTTCACTCTCAAAGGTCACACCTCTCTCCGCTTTCATCTTCGATG

TTAGCTTAATCTCCCCTCTAGTGCCGATCATTGAAAAACTATCTTGTCCGTCTTACATTTA

CTTCATTGCACCAGCTAGAATGTTCTCTTTTTTTGCGCACCTATCTGTTCTTGCTGCTTCG

AATCCAGGAGAAAACCCTTGTTCATTCATTGGTGATGGTGTTAAAATCCCAGGCATTGAA

TTGCCAATATCAAGATCCTCGGTCCCTAGTTTGCTTCTTCAGCCTAACACTCTCTTTGAGA

GCATATTCATGGAGGATAGTCCCAAACTGACGAAGCTCAATGGGGTTTTTGTCAACACG

TTTGAAGAAATGGAAGGGGAAGCATTGGCAGCACTCAACGAAGGAAAAGTGGTTAAAG

GGTTGCCCCCAGTGTATGGTGTTGGTCCCTTTATGGCATGTGAGTTTGAGAAGGTCGATC

AAGCTCAAGGGAGTTCTTCCATGAGTTCAATATTCAAGTGGCTTGATGAACAAGCTAAA

GGGTCGGTGGTGTATGTTTGCTTCGGGAATAAGACAGCGACAAGAAGGGAGCAAATAA

AAGACACGGCTTTGGGGTTAATAGAAAGCGGGTATAGTTTTTTGTGGGTGGTGAAGTTG

AAGGAGGTTGATAGAGAAGAGGGTGAGAGTTTGGAAGATGTGTTGGGGACTGAATTGA

TGAGTAAGGTGGAGGAAAAGGGTTTGGTTGTGAAGGATTTTGTGGATCAGATGAAGATT

CTGGATCACCCTTCAGTGGGGGGATTTGTGACTCATGGAGGGTGGAACTCAACAATAGA

GGCTGTGTGGGTAGGAGTGCCTATTCTGTCATGGCCTCAGGGTGGGGATCAGAAGATAT

GCTCGGAGGCTGTGAAGATCAAAGGGGTAGGAGTTTGGCCTGAGGAATGGGGGTGGGG

AGCAGAAGAGGTTATAAAAGGGAAGGAGATTGCTAAGAGAATCAAAGAGATGATGAGC

AATGAATCTTTGAGAGTCAAAGCTGCAGAAATGAAGGAGGCAGCTAGAAAGGCTGCTG

GTGTTGGTGGGAGTTGTGAGGTTATTGTTAAGAGGCAAATTGAGGAGTGGAAGAAG

AATGTTCATGCTACTTGA

在本发明的另一些实施例中，公开了一种插入有广金钱草碳糖基转移酶的编码基因的过表达载体在催化黄酮碳糖苷化合物合成中的应用。

在本发明的另一些实施例中，公开了一种转化有广金钱草碳糖基转移酶的编码基因的过表达载体的工程菌在催化黄酮碳糖苷化合物合成中的应用。

在其中一些实施例中，所述黄酮碳糖苷化合物为夏佛塔苷或异夏佛塔苷。

在其中一些实施例中，所述黄酮碳糖苷化合物为牡荆苷、异牡荆苷或维采宁-2。

在本发明的另一些实施例中，公开了一种合成牡荆苷或异牡荆苷的方法，所述方法包括步骤：以UDP-glucose为供体，使用广金钱草碳糖基转移酶催化2羟基柚皮素合成牡荆苷或异牡荆苷；所述广金钱草碳糖基转移酶的氨基酸序列如SEQ ID NO.9～SEQ IDNO.14所示。

在本发明的另一些实施例中，公开了一种合成维采宁-2的方法，所述方法包括步骤：以UDP-glucose为供体，使用广金钱草碳糖基转移酶催化2羟基柚皮素合成维采宁-2；所述广金钱草碳糖基转移酶的氨基酸序列如SEQ ID NO.12～SEQ ID NO.14所示。

在本发明的另一些实施例中，公开了一种合成夏佛塔苷或异夏佛塔苷的方法，所述方法包括步骤：

在本发明的另一些实施例中，公开了一种合成根皮素单碳苷或根皮素双碳苷的方法，所述方法包括步骤：以UDP-glucose为供体，使用广金钱草碳糖基转移酶催化根皮素素合成根皮素单碳苷，所述广金钱草碳糖基转移酶的氨基酸序列如SEQ ID NO.9～SEQ IDNO.14所示；或以UDP-Arabinose为供体，使用广金钱草碳糖基转移酶催化根皮素合成根皮素双碳苷；所述广金钱草碳糖基转移酶的氨基酸序列如SEQ ID NO.15～SEQ ID NO.16所示。

以下结合附图和具体实施例来详细说明本发明。

实施例1 PSPG保守结构域预测糖基转移酶基因

利用糖基转移酶蛋白(UGT)保守序列(PSPG box：Plant Secondary ProductGlycosyltransferase)对广金钱草基因组数据库进行了检索，共鉴定到了207个UGTs。将8个GsCGT(GsCGT1、GsCGT2、GsCGT3、GsCGT4、GsCGT5、GsCGT6、GsCGT7、GsCGT8)，作为碳糖基转移酶基因的候选基因，验证其催化活性，8个GsCGTa的核苷酸序列依次如SEQ ID NO.1～SEQID NO.8所示。

实施例2 qRT-PCR表达量分析候选基因在广金钱草不同组织中的表达量

包括如下步骤：

1、使用植物RNA双柱试剂盒(品牌美基生物，货号R4151-03C)提取广金钱草不同组织(根、茎、叶)总RNA，分别使用Prime Script^TM RT Reagent Kit With gDNA Eraser(品牌Takara，货号RR047A)进行基因组DNA的消化及反转录，得到cDNA。其中，基因组DNA消化的反应体系如下：5X gDNA Eraser Buffer 2uL，gDNA Eraser 1uL，总RNA 800ng，加RNase FreeddH₂O至10uL；42℃ 5min；结束后置于冰上。反转录的反应体系如下：基因组DNA消化的反应液10uL，5X PrimeScript Buffer 2(for real time)4uL，RNase Free ddH₂O 4.0uL RTPrimer Mix 1uL，PrimeScript RT Enzyme Mix I 1uL；在37℃反应15min，85℃ 5s，置于冰上；即获得广金钱草不同组织的cDNA，并置于-20℃保存。

2、设计不同候选基因qRT-PCR的引物(如表1)，将cDNA稀释为10ng作为扩增模板，以CCRP4作为内参基因(正向引物SEQ ID NO.33：CACCCCTACTGCTGATGACG；反向引物SEQ IDNO.34：ATAGGTGAGGGAGCGGGAAT)，按照TBPremix Ex Taq^TMII(品牌Takara，货号RR820A)说明配制反应体系：TB/>Premix Ex Taq^TMII(2X)10uL,正向引物(10uM)0.8uL,反向引物(10uM)0.8uL,模板2ul,ddH₂O 6.4uL；使用Roche LightCycler 480Ⅱ定量PCR仪进行定量反应。扩增程序为：95℃变性30S，95℃ 5S、60℃ 30S、72℃ 30S、40个循环，重复3次，反应结束后继续运行溶解曲线程序，以确保目的产物的特异性扩增。

表1

3、采用2^-△△CT方法(LivakKJ,SchmittgenTD.Analysis of relative geneexpression data using real-time quantitative PCR and the 2^-△△C _T method.Methods2001,25(4):402-408)计算不同候选基因在广金钱草不同组织的相对表达量。

结果如图1所示，其中图1中的A为广金钱草不同组织(根茎叶)的RNA提取结果，可以清楚的看到RNA呈现两条带，说明提取的RNA质量较好，未降解，因此可以利用提取的根茎叶不同组织的RNA进行反转录以及进行荧光定量实验；图1中的B为8个候选碳糖基转移酶基因在不同组织中的相对表达量，结果表明，8个候选碳糖基转移酶基因相对表达量(RNA)在叶中的含量比较高，与广金钱草主要药用部位为叶片一致。

实施例3广金钱草碳糖基转移酶基因(GsCGT)的克隆分离

以在GsCGT基因的编码区设计的引物，如表2(8对引物分别涵盖pColdⅡ载体同源臂正向引物：aaagtgcatcatcatcatcatcatatg，反向引物：tatctagactgcaggtcgacaagctt，其中正向引物酶切位点为NdeI，反向引物酶切位点为HindⅢ)作为引物进行PCR扩增反应。

表2

PCR反应体系总体积为50uL，包括反转录得到的叶片cDNA(≤200ng)模板1uL，2×Pr imeSTAR Max(品牌Takara，货号R045B)25μL，正反向引物各2uL(10μM)，加ddH₂O至50uL。

反应程序为：98℃变性5min，98℃ 30sec、54℃ 30sec、72℃ 1min、33cycles，72℃延伸5min。

PCR产物进行1％琼脂糖凝胶鉴定，结果如图2所示，图2显示8个基因扩增产物仅为一条大小约为1.5kb左右的条带。将其切胶利用凝胶DNA试剂盒(品牌美基生物，货号D2111-03)回收、纯化。

测序结果表明：扩增的片段与基因组数据一致，其核苷酸序列分别如SEQ ID NO.1～SEQ ID NO.8所示。通过ExPASy网站的翻译工具(http://web.expasy.org/translate/)翻译出蛋白质序列，为C-糖基转移酶，其氨基酸序列分别如SEQ ID NO.9～SEQ ID NO.16所示。

实施例4重组表达载体构建

将pColdⅡ质粒进行酶切，酶切体系为10×Cutsmart 5μL，pColdⅡ质粒1μg，NdeI和HindⅢ内切酶(品牌NEB公司，货号R0111V和R3104V)各1μL，加ddH₂O至50uL，反应程序为37℃酶切3小时。酶切产物经1％琼脂糖凝胶电泳检测后用凝胶DNA试剂盒(品牌美基生物，货号D2111-03)切胶回收。回收之后利用SoSoo重组克隆试剂盒(品牌擎科生物，货号TSV-S1)进行连接反应，反应体系为2×SoSoo Mix 5μL，线性化的pColdⅡ载体和实施例3纯化的产物(摩尔比为1：3，pmols＝(质量ng×1000)/(片段长度bp×650daltons))，加ddH₂O至10μL。用移液器轻轻吹打混匀，低速瞬时离心所有液体到离心管底，50℃反应15min。

取100μL冰浴上融化的DH5α感受态细胞，加入连接产物，轻弹混匀，冰上静置30min。42℃水浴热激60s，迅速放置到冰浴中，静置2min，向离心管中加入700μL不含抗生素的无菌LB液体培养基，37℃，200rpm复苏1h；室温6,000rpm离心1分钟，剩余50～100μL溶液重悬菌体，均匀涂布在含100mg/L氨苄青霉素(Ampicillin，Amp)抗性的LB固体平板，倒置在37℃恒温培养箱培养16h。次日，从平板上挑取单克隆于300μL LB液体培养中(Amp抗性)，37℃，200rpm培养3h，取1μL作为菌液PCR的模板，2×T5 Super PCRMix酶(品牌擎科生物，货号TSE005)5μL，pcoldⅡ载体引物各0.4μL(正向引物SEQ ID NO.51：acgccatatcgccgaaagg；pcoldⅡ反向引物SEQ ID NO.52：ggcagggatcttagattctgtgc)，ddH₂O补齐10μL进行菌液PCR检测。

菌液PCR验证后，将条带大小正确的3个阳性单克隆摇菌提取质粒(品牌美基生物，货号P1001-03)，送生工生物工程(上海)股份有限公司测序，双向测通。将测序正确的质粒保存于-20℃冰箱，另外将含正确质粒的菌液与50％甘油1：1混匀保存于-80℃。测序结果表明，8个广金钱草碳糖基转移酶基因GsCGT均分别插入到了pColdⅡ表达载体中，即得到了8个重组表达载体。

实施例5目标蛋白诱导表达及纯化

挑实施例4中测序正确的阳性单克隆接种至5mL LB(含100mg/LAmp)培养基中，37℃，220rpm培养过夜；将菌液1：100转接至200mL LB培养基(含100mg/LAmp)中，37℃，220rpm培养至菌液为OD₆₀₀0.6左右；立即将菌液置于冰水混合物中完全冷却，然后加入IPTG终浓度为0.1mM；15℃，160rpm继续培养18h，随后所有的操作在0-4℃下进行以保持酶活力。

低温条件下，4000rpm，10min收集菌体，加入适量ddH₂O洗涤一次，菌体用20mLLysis buffer(pH8.0,50mM Tris HCl,300mM NaCl，5mM咪唑)悬浮，加入PMSF至终浓度为1mM。菌悬液放入含有冰水混合物中进行超声破碎，超声功率250W破碎30min，破碎3s，停3s。破碎完成后4℃，12000g，离心25分钟，收集上清。因为目标蛋白可以与表达载体上的组氨酸(His)标签形成融合蛋白，所以将目标蛋白粗酶溶液进行镍填料(Ni-NTAagarose，QIAGEN公司)亲和纯化。具体步骤如下：取1mLNi-NTA悬液到纯化柱中，随后用Lysis buffer平衡3次，将超声获得的20mL粗酶溶液上清加入到纯化柱中，在4℃温度下用旋转振荡器(转速为200rpm)翻转混匀1小时；将重组蛋白粗酶溶液与Ni-NTA混合物转移至空的离心管中，释放流穿液；用Washbuffer洗涤Ni-NTA填料3次；用含250mM咪唑的Elutionbuffer洗脱目标蛋白3次，收集洗脱液并转移至超滤管(品牌Millipore，货号UFC901096-1)进行后续脱盐及浓缩处理。用脱盐缓冲液(pH8.0,50mM Tris-HCl)平衡Millipore超滤管的滤膜3次，并将超滤管插在冰上预冷；加入收集的洗脱液，4℃条件下，4000g离心25分钟；加入1mL脱盐缓冲液并重复3次，最后一次脱盐后剩余浓缩液500uL左右，加入终浓度为1mM DTT，将浓缩后的重组蛋白溶液保存于-20℃。

然后通过十二烷基硫酸钠聚丙烯酰胺凝胶(SDS-PAGE)电泳检测蛋白纯化后的效果，具体步骤为：蛋白纯化后样品取20uL，并加20uL 2x Protein Loading buffer，混匀后煮沸10min，12000rpm室温离心5min，取上清20uL上样。SDS-PAGE的分离胶为12％，电泳时浓缩胶段电压为70V，至分离胶段电压为120V，电泳至溴酚蓝跑出后停止电泳并取出凝胶，将蛋白胶置于50mL ddH₂O中微波炉高火煮2min，换ddH₂O再煮3min，摇床摇5min后，置于考马斯亮蓝R250染色液中，染色30min后脱色，每隔1h更换脱色液，直至背景干净，各蛋白条带清晰。

结果如图3所示，从图3可以看出，8个广金钱草碳糖基转移酶基因(GsCGT)编码的蛋白(碳-糖基转移酶，即重组蛋白)在大肠杆菌中成功获得正确折叠的重组可溶蛋白。

用Bradford试剂(品牌Beyotime，货号P0006)检测纯化后的蛋白溶液浓度：将Bradford试剂从冰箱中拿出混匀后置于室温平衡；将标准BSA溶液稀释成0，125，250，500，1000，2000ug/mL的梯度溶液，同时在96孔酶标板中加入浓缩后的蛋白溶液样品，每个浓度3个重复，标准BSA梯度溶液及样品溶液体积为5ul，Bradford溶液为250uL，置于平板摇床混匀，37℃放置30min以后，利用酶标仪检测595nm条件下吸光值。绘制标准曲线并计算浓缩蛋白溶液浓度。

实施例6以UDP-Glucos或UDP-Arabinose为糖基供体，2-羟基柚皮素为底物进行酶活测定及产物鉴定

每100uL的反应体系包含：50mM Na₂HPO₄-NaH₂PO₄(pH8.0)，0.1mM 2-羟基柚皮素，0.5mM UDP-Glucose或UDP-Arabinose，10ug实施例5得到的重组蛋白酶(碳糖基转移酶)。混匀后35℃反应15分钟，反应结束后加入100uL甲醇终止反应。其中产物脱水处理操作为：酶催化反应结束后，加入100μL 1M盐酸，置于60℃反应2小时。反应产物进行0.22μM滤膜(品牌MOTUO，货号MT-GLT-01)过滤后取上清进行HPLC分析，程序如下：0-8.5min,15％A；8.5-12min,19％A,12-18min,19％-35％A,18-25min,35％-70％A，25-26min70-95％A,26-31min95％A，31-3595-15％(其中，A为乙腈，B为0.1％甲酸-水)；液相色谱柱子InertSustain C18(4.6×150mm，5μm)流速是1mL/min；检测波长为290nm，柱温35℃。同时以阳性对照乌拉尔甘草的CGT催化结果进行比较，根据出峰时间及紫外光谱初步预测产物结构。

之后反应体系进行LC-MS/MS检测，流动相为乙腈和0.1％甲酸-水，通过ZORBAXSB-C18高效液相柱的三重四级杆液质联用色谱仪(Thermo，TSQ ENDURA)，柱子为HSS T3(2.1*100mm 1.8μm)，负离子模式，扫描的质量范围为150～800m/z。

GsCGT1、GsCGT2、GsCGT3、GsCGT4、GsCGT5、GsCGT6以2-羟基柚皮素为底物，UDP-glucose为糖基供体的酶活反应体系HPLC图如图4所示，峰P1和P2为酶活反应产物。产物P1和P2负离子模式下的质谱图如图5所示，2-羟基柚皮素负离子模式下分子量为287，P1是2-羟基柚皮素利用1分子的UDP-glucose生成产物2-羟基柚皮素-C-单葡萄糖苷，[M-H]^-分子量为449.06(即287+162)；P2是在2-羟基柚皮素-C-单葡萄糖苷的基础上再催化1分子的UDP-glucose生成产物2-羟基柚皮素-C-双葡萄糖苷，[M-H]^-分子量为611.14(即287+162+162)。分别对产物峰P1和P2分离后，进行盐酸脱水处理，产物脱水后，在负离子模式下的质谱图如图6所示，P1生成了产物a和b，与牡荆苷、异牡荆苷标准品的保留时间以及分子量一致；P2生成产物c，与维采宁-2标准品的保留时间以及分子量一致。因此，GsCGT1、GsCGT2、GsCGT3、GsCGT4、GsCGT5、GsCGT6属于CGTa，其中GsCGT1、GsCGT2、GsCGT3只能转移一个葡萄糖残基，产生单碳糖苷产物，如生成牡荆苷(芹菜素8-C葡萄糖苷)和异牡荆苷(芹菜素6-C葡萄糖苷)。而GsCGT4、GsCGT5、GsCGT6的催化活性与阳性对照GuCGTa(乌拉尔甘草C糖基转移酶a，NCBI登录号MK894447.1)功能一致，可继续转移第二个葡萄糖残基，产生双碳糖苷产物，如生成维采宁-2(芹菜素6,8-双C葡萄糖苷)。

GsCGT7、GsCGT8以2-羟基柚皮素为底物，UDP-Arabinose为糖基供体的酶活反应体系HPLC结果如图7所示，峰P3和P4为酶活反应产物。产物P3和P4负离子模式下的质谱图如图8所示，2-羟基柚皮素负离子模式下分子量为287，P3是2-羟基柚皮素利用1分子的UDP-Arabinose生成产物2-羟基柚皮素-C-单阿拉伯糖苷，[M-H]-分子量为419.05(即287+132)；P4是在2-羟基柚皮素-C-单阿拉伯糖苷的基础上再催化1分子的UDP-Arabinose生成产物2-羟基柚皮素-C-双阿拉伯糖苷，[M-H]-分子量为551.12(即287+132+132)。因此，GsCGT7、GsCGT8属于CGTb，其中GsCGT7只能转移一个阿拉伯糖残基，产生单碳糖苷产物；GsCGT8催化活性与阳性对照GuCGTb(乌拉尔甘草C糖基转移酶b，NCBI登录号MK894448.1)功能一致，可继续转移第二个阿拉伯糖残基，产生双碳糖苷产物。

实施例7以UDP-Arabinose为糖基供体，2-羟基柚皮素-C-单葡萄糖苷为底物进行酶活测定及产物鉴定

每100uL的反应体系包含：50mM Na₂HPO₄-NaH₂PO₄(pH8.0)，0.1mM实施例6中GsCGTa获得的P1(2-羟基柚皮素-C-单葡萄糖苷)，0.5mM UDP-Arabinose，10ug实施例5得到的重组蛋白酶GsCGT7、GsCGT8(碳糖基转移酶b)。混匀后35℃反应15分钟，反应结束后加入100μL1M盐酸，置于60℃反应2小时，产物用甲醇溶解。最后反应产物进行0.22μM滤膜(品牌MOTUO，货号MT-GLT-01)过滤后取上清进行HPLC分析，程序如下：0-3min，27％MeOH；3-19min，27-35％MeOH；19-26min，35-95％MeOH；26-29min，95％MeOH；29-30min，15％MeOH；30-33，15％(其中，MeOH为甲醇，B为0.1％甲酸-水)；液相色谱柱子InertSustain C18(4.6×150mm，5μm)流速是1mL/min；检测波长为335nm，柱温40℃。同时以夏佛塔苷和异夏佛塔苷标品(北京大学药学院叶敏教授赠送)进行比较，根据出峰时间及紫外光谱初步预测产物结构。

之后反应体系进行LC-MS/MS检测，流动相为甲醇和0.1％甲酸-水，通过ZORBAXSB-C18高效液相柱的三重四级杆液质联用色谱仪(Thermo，TSQ ENDURA)，柱子为HSS T3(2.1*100mm 1.8μm)，负离子模式，扫描的质量范围为150～800m/z。

HPLC图如图9所示，催化产物P5和P6与保留时间分别与标准品夏佛塔苷(d)和异夏佛塔苷(e)相同。产物P5和P6负离子模式下的质谱图如图10所示，其中P5的[M-H]^-分子量为563.09；P6脱水后的产物b的[M-H]^-分子量为563.10；分别与夏佛塔苷、异夏佛塔苷标准品的分子量一致。说明GsCGTa(GsCGT1、GsCGT2、GsCGT3、GsCGT4、GsCGT5、GsCGT6)和GsCGTb(GsCGT7、GsCGT8)均参与了广金钱草(异)夏佛塔苷的合成。

实施例8以UDP-Glucose或UDP-Arabinose为糖基供体，根皮素作为底物进行酶活测定及产物鉴定

每100uL的反应体系包含：50mM Na₂HPO₄-NaH₂PO₄(pH8.0)，0.1mM根皮素(与2-羟基柚皮素结构相似)，0.5mM UDP-Glucose或UDP-Arabinose，10ug实施例5得到的重组蛋白酶(碳糖基转移酶)。混匀后35℃反应15分钟，反应结束后加入100uL甲醇终止反应。反应产物进行0.22μM(品牌MOTUO，货号MT-GLT-01)滤膜过滤后取上清进行HPLC分析，程序如下：0-8.5min,15％A；8.5-12min,19％A,12-18min,19％-35％A,18-25min,35％-70％A，25-26min70-95％A,26-31min 95％A，31-3595-15％(其中，A为乙腈，B为0.1％甲酸-水)；液相色谱柱子InertSustain C18(4.6×150mm，5μm)流速是1mL/min；检测波长为290nm，柱温35℃。

流动相为乙腈和0.1％甲酸-水，通过ZORBAX SB-C18高效液相柱的三重四级杆液质联用色谱仪(Thermo，TSQ ENDURA)，柱子为HSS T3(2.1*100mm 1.8μm)，负离子模式，扫描的质量范围为150-800m/z。

GsCGTa(GsCGT1、GsCGT2、GsCGT3、GsCGT4、GsCGT5、GsCGT6)以根皮素为底物，UDP-glucose为糖基供体的酶活反应产物的HPLC图如图11所示，结果表明，GsCGTa(GsCGT1、GsCGT2、GsCGT3、GsCGT4、GsCGT5、GsCGT6)均能催化根皮素产生P7，说明是单碳糖基转移酶，其中GsCGT4、GsCGT5、GsCGT6可以催化根皮素生成2个产物，分别是P7和P8，说明是双碳糖基转移酶。与以2-羟基柚皮素为底物催化结果一致。

GsCGTa(GsCGT1、GsCGT2、GsCGT3、GsCGT4、GsCGT5、GsCGT6)以根皮素为底物，UDP-glucose为糖基供体的酶活反应产物的负离子模式下的质谱图如图12所示，根皮素负离子模式下分子量为273，P7是根皮素-C-单葡萄糖苷，MW＝435.03(即273+162)，产生C糖苷特征峰[M-H-120]^-和[M-H-90]^-；P8是根皮素-C-双葡萄糖苷，MW＝597.07(即273+162+162)，产生C糖苷的特征峰[M-H-120]。与以2-羟基柚皮素为底物催化结果一致。

GsCGTb(GsCGT7、GsCGT8)以根皮素为底物，UDP-Arabinose为糖基供体的酶活反应产物的HPLC图如图13所示。结果表明，GsCGTb(GsCGT7、GsCGT8)均能催化根皮素产生P9和P10。与以2-羟基柚皮素为底物催化结果一致。

GsCGTb(GsCGT7、GsCGT8)以根皮素为底物，UDP-Arabinose为糖基供体的酶活反应产物在负离子模式下的质谱图如图14所示。根皮素负离子模式下分子量为273，P9是根皮素-C-单阿拉伯糖苷，MW＝405.20(即273+132)，产生C糖苷特征峰[M-H-60]^-和[M-H-90]^-；P10是根皮素-C-双阿拉伯糖苷，MW＝537.06(即273+132+132)，产生C糖苷的特征峰[M-H-90]^-和[M-H-120]^-和[M-H-180]。与以2-羟基柚皮素为底物催化结果一致。

以上所述实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。因此，本发明专利的保护范围应以所附权利要求为准。

Claims

1.一种广金钱草碳糖基转移酶在催化黄酮碳糖苷化合物合成中的应用，所述广金钱草碳糖基转移酶的氨基酸序列如SEQ ID NO.15所示。

2.根据权利要求1所述的应用，其特征在于，所述黄酮碳糖苷化合物为夏佛塔苷或异夏佛塔苷。

3.一种广金钱草碳糖基转移酶的编码基因在催化黄酮碳糖苷化合物合成中的应用，所述广金钱草碳糖基转移酶的编码基因的核苷酸序列如SEQ ID NO.7所示。

4.根据权利要求3所述的应用，其特征在于，所述黄酮碳糖苷化合物为夏佛塔苷或异夏佛塔苷。

5.一种插入有广金钱草碳糖基转移酶的编码基因的过表达载体在催化黄酮碳糖苷化合物合成中的应用，所述广金钱草碳糖基转移酶的编码基因的核苷酸序列如SEQ ID NO.7所示；所述黄酮碳糖苷化合物为夏佛塔苷或异夏佛塔苷。

6.一种转化有广金钱草碳糖基转移酶的编码基因的过表达载体的工程菌在催化黄酮碳糖苷化合物合成中的应用，所述广金钱草碳糖基转移酶的编码基因的核苷酸序列如SEQID NO.7所示；所述黄酮碳糖苷化合物为夏佛塔苷或异夏佛塔苷。

7.一种合成夏佛塔苷或异夏佛塔苷的方法，其特征在于，所述方法包括步骤：

(1)、以UDP-glucose为供体，使用氨基酸序列如SEQ ID NO.9～SEQ ID NO.14任一项所示的广金钱草碳糖基转移酶催化2羟基柚皮素合成2-羟基柚皮素-C-单葡萄糖苷；

(2)、以UDP-Arabinose为供体，使用氨基酸序列如SEQ ID NO.15所示的广金钱草碳糖基转移酶催化步骤(1)的2-羟基柚皮素-C-单葡萄糖苷合成夏佛塔苷或异夏佛塔苷。