CN113265433B

CN113265433B - 双功能碳苷糖基转移酶及其应用

Info

Publication number: CN113265433B
Application number: CN202010096973.5A
Authority: CN
Inventors: 王勇; 孙雨伟; 陈卓; 张前; 张英; 刘海利; 李建华
Original assignee: Center for Excellence in Molecular Plant Sciences of CAS
Current assignee: Center for Excellence in Molecular Plant Sciences of CAS
Priority date: 2020-02-17
Filing date: 2020-02-17
Publication date: 2023-12-26
Anticipated expiration: 2040-02-17
Also published as: US20230105024A1; WO2021164673A1; EP4108777A4; EP4108777A1; CN113265433A

Abstract

本发明提供了一组新型的尿苷二磷酸(UDP)‑糖基转移酶，其是双功能的碳苷阿拉伯糖基转移酶和碳苷葡萄糖基转移酶。所述的糖基转移酶能够特异和高效地催化二氢查尔酮(类)化合物或2‑羟基黄烷酮(类)化合物的碳苷阿拉伯糖基化和葡萄糖基化，从而产生一类碳苷二氢查尔酮、碳苷‑2‑羟基黄烷酮(类)化合物；碳苷‑2‑羟基黄烷酮(类)化合物通过进一步的脱水反应形成黄酮碳苷(类)化合物。本发明还涉及将这些新型UDP糖基转移酶应用于人工构建的重组表达系统，通过发酵工程生产碳苷二氢查尔酮、黄酮碳苷化合物。

Description

双功能碳苷糖基转移酶及其应用

技术领域

本发明属于合成生物学领域，更具体地，本发明涉及一种碳苷葡萄糖基和阿拉伯糖基转移酶及其应用。

背景技术

黄酮化合物是以C₆-C₃-C₆为结构母核的一类多酚羟基(类)化合物，根据母核结构及官能基取代的不同，可以分为黄酮、黄酮醇、黄烷酮、花青素、查尔酮等。黄酮(类)化合物在于植物体内常以糖苷的形式存在，这样的糖基化修饰主要由尿苷二磷酸(UDP)-糖基转移酶(UGT)催化发生。糖基与苷元母核直接以C-C键的方式连接的黄酮苷(类)化合物被称为黄酮碳苷。

黄酮碳苷(类)化合物具有多种多样的药理活性，根据报道，黄酮碳苷化合物具有显著的抗氧化作用，可以显著性抑制外源性以及内源性自由基；同时，其具有一定程度抑制细菌病毒的作用；黄酮碳苷化合物可以显著性地降低血液中总胆固醇的含量，具有治疗心脑血管疾病的药物活性；同时黄酮碳苷化合物具有显著性抗辐射以及神经保护的作用；有调查表明黄酮碳苷化合物具有相关抗代谢疾病的作用，对于糖尿病、肥胖等疾病均具有一定的治疗效果。

相对于自然界广泛存在的葡萄糖苷(类)化合物，阿拉伯糖苷(类)化合物较为稀少，而阿拉伯糖的碳苷化合物更为稀少。目前已知的具有阿拉伯糖基的黄酮碳苷有夏佛塔苷、异夏佛塔苷、新夏佛塔苷、刺苞菊苷、异刺苞菊苷、新刺苞菊苷等几种，而对于双阿拉伯糖黄酮碳苷甚至尚无命名。迄今为止，也尚无对于黄酮进行阿拉伯糖碳苷糖基化的糖基转移酶的报道。在本领域中，目前基本上只能通过从自然界分离阿拉伯糖碳苷化合物，大规模低成本的生物合成或人工合成等方面的生产工艺均需要进一步研究和开发。

发明内容

本发明的目的在于提供一种双功能碳苷糖基转移酶及其应用用。

在本发明的第一方面，提供一种催化二氢查尔酮(类)化合物或2-羟基黄烷酮(类)化合物生成碳苷二氢查尔酮(类)化合物或碳苷-2-羟基黄烷酮(类)化合物的方法，所述方法包括：以糖基转移酶进行所述催化；所述的糖基转移酶包括选自SEQ ID NO:1～12任一所述的多肽或其保守性变异多肽。

在一个优选例中，所述的二氢查尔酮(类)化合物具有式(I)的母核结构、2-羟基黄烷酮(类)化合物(较佳地为开环形式)具有式(II)的母核结构，所述碳苷二氢查尔酮(类)化合物具有式(III)的母核结构，所述碳苷-2-羟基黄烷酮(类)化合物(较佳地为开环形式)具有式(IV)的母核结构：

其中，R为糖基，其与A环以碳碳键连接。

在另一优选例中，A环或B环中，存在1～3个羟基；较佳地，A环中，羟基存在于第2’、4’和/或6’位；较佳地，B环中，羟基出现在第4位。

在另一优选例中，R在A环上的数量为1个，较佳地其存在于第3’位。

在另一优选例中，R在A环上的数量为2个，较佳地其存在于第3’和5’位；且，所述的糖基转移酶包括选自SEQ ID NO:6，7，9或11所述的多肽或其保守性变异多肽。

在另一优选例中，所述的糖基为阿拉伯糖或葡萄糖；在利用所述糖基转移酶进行糖基转移时，以携带阿拉伯糖基团或葡萄糖基团的化合物作为供体；更佳地，以UDP阿拉伯糖、UDP葡萄糖作为糖基供体。

在另一优选例中，，所述二氢查尔酮(类)化合物或2-羟基黄烷酮(类)化合物包括(但不限于)：根皮素，2-羟基柚皮素(较佳地为开环形式)，2-羟基圣草酚(较佳地为开环形式)。

在另一优选例中，所述的碳苷二氢查尔酮(类)化合物或碳苷-2-羟基黄烷酮(类)化合物包括：根皮素-C-阿拉伯糖苷，2-羟基柚皮素-C-阿拉伯糖苷，2-羟基圣草酚-C-阿拉伯糖苷，根皮素-C-双阿拉伯糖苷，2-羟基柚皮素-C-双阿拉伯糖苷，2-羟基圣草酚-C-双阿拉伯糖苷，Nothofagin，2-羟基柚皮素-C-葡萄糖苷，2-羟基圣草酚-C-葡萄糖苷，根皮素-C-双葡萄糖碳苷，2-羟基柚皮素-C-双葡萄糖苷，2-羟基圣草酚-C-双葡萄糖苷，根皮素-C-阿拉伯糖-C-葡萄糖苷，2-羟基柚皮素-C-阿拉伯糖-C-葡萄糖苷，2-羟基圣草酚-C-阿拉伯糖-C-葡萄糖苷。

在本发明的另一方面，提供糖基转移酶的用途，用于催化二氢查尔酮(类)化合物或2-羟基黄烷酮(类)化合物生成碳苷二氢查尔酮(类)化合物或碳苷-2-羟基黄烷酮(类)化合物；其中，所述的糖基转移酶包括选自SEQ ID NO:1～12任一所示的多肽或其保守性变异多肽。

在一个优选例中，所述二氢查尔酮(类)化合物具有式(I)的母核结构、所述2-羟基黄烷酮(类)化合物(较佳地为开环形式)具有式(II)的母核结构，所述碳苷二氢查尔酮(类)化合物具有式(III)的母核结构，碳苷-2-羟基黄烷酮(类)化合物(较佳地为开环形式)具有式(IV)的母核结构：

其中，R为糖基，其与A环以碳碳键连接。

在另一优选例中，R在A环上的数量为2个，较佳地其存在于第3’和5’位；且，所述的糖基转移酶包括选自SEQ ID NO:6，7，9或11所示的多肽或其保守性变异多肽。

在另一优选例中，R为单糖基。

在另一优选例中，所述的糖基为阿拉伯糖或葡萄糖；较佳地，在利用所述糖基转移酶进行糖基转移时，以携带阿拉伯糖基团或葡萄糖基团的化合物作为供体；更佳地，以UDP阿拉伯糖、UDP葡萄糖、TDP阿拉伯糖或TDP葡萄糖作为糖基供体。

在另一优选例中，所述二氢查尔酮(类)化合物或2-羟基黄烷酮(类)化合物包括(但不限于)：根皮素，2-羟基柚皮素(较佳地为开环形式)，2-羟基圣草酚(较佳地为开环形式)。

在另一优选例中，所述的保守性变异多肽选自：(1)由SEQ ID NO:1～12任一所示序列的多肽经过一个或多个(如1-20个，较佳地1-10个；更佳地1-5个；更佳地1-3个)氨基酸残基的取代、缺失或添加而形成的，且具有催化二氢查尔酮(类)化合物或2-羟基黄烷酮(类)化合物生成碳苷二氢查尔酮(类)化合物或碳苷-2-羟基黄烷酮(类)化合物功能的多肽；(2)氨基酸序列与SEQ ID NO:1～12任一所示序列的多肽有80％以上(较佳地85％以上；更佳地90％以上；更佳地95％以上；更佳地99％以上)相同性，且具有催化二氢查尔酮(类)化合物或2-羟基黄烷酮(类)化合物生成碳苷二氢查尔酮(类)化合物或碳苷-2-羟基黄烷酮(类)化合物功能的多肽；或(3)在SEQ ID NO:1～12任一所示序列的多肽的N或C末端添加标签序列，或在其N末端添加信号肽序列后形成的多肽。

在本发明的另一方面，提供一种合成(包括人工合成或体外合成)黄酮碳苷(类)化合物的方法，包括：(1)将2-羟基黄烷酮(类)化合物以糖基转移酶催化，产生碳苷-2-羟基黄烷酮(类)化合物；其中，所述的糖基转移酶包括选自SEQ ID NO:1～12任一所述的多肽或其保守性变异多肽；(2)将(1)的碳苷-2-羟基黄烷酮(类)化合物脱水，获得黄酮碳苷(类)化合物。

在一个优选例中，在(1)之前，还包括：(c)将黄烷酮(类)化合物通过黄烷酮-2-羟化酶(F2H)催化，获得2-羟基黄烷酮(类)化合物。

在另一优选例中，在(c)之前，还包括：(b)将丙二酰-CoA结构类似物(如包括其经1或多基团的取代形式)与p-香豆酰-CoA结构类似物(如包括其经1或多基团的取代形式)经查尔酮合成酶(CHS)和查尔酮异构酶(CHI)催化，获得黄烷酮(类)化合物。

在另一优选例中，在(b)之前，还包括：(a)将芳香族氨基酸经酪氨酸解氨酶(TAL)或苯丙氨酸解氨酶(PAL)和4-香豆酰-CoA连接酶(4CL)催化，获得p-香豆酰-CoA或其结构类似物。

在另一优选例中，所述的黄烷酮(类)化合物包括：柚皮素，圣草酚。

在另一优选例中，所述的丙二酰-CoA结构类似物包括：丙二酰-CoA；甲基丙二酰-CoA。

在另一优选例中，所述的p-香豆-CoA结构类似物包括：p-香豆酰-CoA；p-肉桂酰-CoA。

在另一优选例中，所述的芳香族氨基酸包括：L-酪氨酸或L-苯丙氨酸。

在另一优选例中，所述的2-羟基黄烷酮(类)化合物为2-羟基柚皮素，其是从柚皮素通过黄烷酮-2-羟化酶(F2H)催化获得。

在另一优选例中，所述2-羟基黄烷酮(类)化合物为2-羟基圣草酚，其是从圣草酚通过黄烷酮-2-羟化酶(F2H)催化获得；较佳地，所述圣草酚是从柚皮素通过黄烷酮-3’-羟化酶(F3’H)催化获得。

在本发明的另一方面，提供一种生物合成黄酮碳苷(类)化合物的方法，包括：(i)将合成柚皮素(类)化合物的前体基因、编码黄烷酮-2-羟化酶和/或黄烷酮-3’-羟化酶的基因以及编码糖基转移酶的基因共转入宿主细胞中；其中，所述的糖基转移酶包括选自SEQID NO:1～12任一所述的多肽或其保守性变异多肽；(ii)培养(i)的细胞，从而合成黄酮碳苷(类)化合物。

在一个优选例中，所述的黄烷酮-2-羟化酶和黄烷酮-3’-羟化酶为截去N端跨膜区域的P450氧化酶；较佳地，在截去N端跨膜区域后，还包括添加标签；更佳地，所述标签包括(但不限于)：2B1，17α，MBP，其具有助溶的作用。

在另一优选例中，还在宿主细胞中转入合成糖基供体的基因，所述糖基包括阿拉伯糖或葡萄糖；较佳地，所述糖基供体为携带阿拉伯糖基团或葡萄糖基团的化合物；更佳地所述糖基供体包括UDP阿拉伯糖或UDP葡萄糖。

在本发明的另一方面，提供一种遗传工程化的细胞，包括：合成黄烷酮化合物的前体基因、编码黄烷酮-2-羟化酶和/或黄烷酮-3’-羟化酶的基因以及编码糖基转移酶的基因；其中，所述的糖基转移酶包括选自SEQ ID NO:1～12任一所述的多肽或其保守性变异多肽；较佳地，所述合成黄烷酮化合物的前体基因包括TAL或PAL、4CL、CHS、CHI基因。

在另一优选例中，所述的细胞中还包括合成糖基供体的基因；较佳地，所述糖基包括阿拉伯糖或葡萄糖；较佳地，所述糖基供体为携带阿拉伯糖基团或葡萄糖基团的化合物；更佳地所述糖基供体包括UDP阿拉伯糖或UDP葡萄糖。

在本发明的另一方面，提供制备所述细胞的方法，包括：将合成黄烷酮化合物的前体基因、编码黄烷酮-2-羟化酶和/或黄烷酮-3’-羟化酶的基因以及编码糖基转移酶的基因共转入宿主细胞中；其中，所述的糖基转移酶为选自SEQ ID NO:1～12任一所述的多肽或其保守性变异多肽；较佳地，还将合成糖基供体的基因转入宿主细胞中。

在本发明的另一方面，提供一种用于生物合成黄酮碳苷化合物或其中间体的试剂盒，其中包括：SEQ ID NO:1～12所示的一条或多条多肽或其保守性变异多肽；黄烷酮-2-羟化酶和/或黄烷酮-3’-羟化酶；合成黄烷酮化合物的前体基因；和/或，合成糖基供体的多肽或其编码基因；较佳地还包括宿主细胞。

在本发明的另一方面，提供一种用于生物合成黄酮碳苷化合物或其中间体的试剂盒，其中包括所述的遗传工程化的细胞。

在本发明的另一方面，提供一种用于生物合成黄酮碳苷(类)化合物或其中间体的试剂盒，其中包括：SEQ ID NO:1～12所示的一条或多条(如2、3、4条)多肽或其保守性变异多肽；黄烷酮-2-羟化酶和/或黄烷酮-3’-羟化酶；合成柚皮素(类)化合物的前体基因；较佳地还包括宿主细胞。

在一个优选例中，所述的宿主细胞包括：原核细胞或真核细胞；较佳地，所述原核宿主细胞包括大肠杆菌或链霉菌；所述的真核细胞包括酵母。

在另一优选例中，所述的黄酮碳苷(类)化合物包括：牡荆素，异牡荆素，荭草苷，异荭草苷，芹菜素-6-C-阿拉伯糖苷，芹菜素-8-C-阿拉伯糖苷，木犀草素-6-C-阿拉伯糖苷，木犀草素-8-C-阿拉伯糖苷，维采宁-2(新西兰牡荆素，vicenin-2)，光牡荆素(lucenin 2)，芹菜素-6,8-C-双阿拉伯糖苷，木犀草素-6,8-C-双阿拉伯糖苷，夏佛塔苷，异夏佛塔苷，刺苞菊苷，异刺苞菊苷。

本发明的其它方面由于本文的公开内容，对本领域的技术人员而言是显而易见的。

附图说明

图1、CGT体外酶催化反应转化产物的HPLC分析结果；(A)以根皮素为底物；(B)以2-羟基柚皮素为底物；以UDP阿拉伯糖为糖基供体。

图2、根皮素-C-阿拉伯糖苷的二级质谱图谱。

图3、根皮素-C-阿拉伯糖苷的¹H NMR图谱。

图4、2-羟基柚皮素-C-阿拉伯糖苷的二级质谱图谱。

图5、OsiCGT6、BdCGT2和ZmCGT3对底物根皮素催化，获得根皮素-C-阿拉伯糖苷，还产生根皮素-C-双阿拉伯糖碳苷。

图6、根皮素-C-双阿拉伯糖碳苷的二级质谱图谱。

图7、CGT体外酶催化反应转化产物的HPLC分析结果；(A)以根皮素为底物；(B)以2-羟基柚皮素为底物；以UDP葡萄糖为糖基供体。

图8A、Nothofagin的二级质谱图谱。

图8B、根皮素-C-双葡萄糖碳苷的二级质谱图谱。

图9、2-羟基柚皮素-C-葡萄糖苷的二级质谱图谱。

图10、夏佛塔苷及其异构体的预测生物合成途径。

图11、质粒pYH55、质粒pCZ201的主要元件的示意图。

图12、质粒pCZ86、pCZ163、pCZ165的主要元件的示意图。

图13、质粒pCZ193、pCZ194的主要元件的示意图。

图14、HPLC、LC-MS检测工程菌株sCZ114的发酵产物的成分。

图15、芹菜素-6-C-阿拉伯糖碳苷、芹菜素-8-C-阿拉伯糖碳苷、芹菜素-6,8-C-双阿拉伯糖碳苷的预测生物合成途径。

图16、HPLC、LC-MS检测工程菌株sCZ118的发酵产物的成分。

具体实施方式

本发明人经过深入的研究，筛选出一组新型的尿苷二磷酸(UDP)-糖基转移酶，其是双功能的碳苷阿拉伯糖基转移酶和碳苷葡萄糖基转移酶。所述的糖基转移酶能够特异和高效地催化二氢查尔酮(类)化合物或2-羟基黄烷酮(类)化合物的碳苷阿拉伯糖基化和葡萄糖基化，从而产生一类碳苷二氢查尔酮(类)化合物、碳苷-2-羟基黄烷酮(类)化合物；碳苷-2-羟基黄烷酮(类)化合物通过进一步的脱水反应形成黄酮碳苷(类)化合物。本发明还涉及将这些新型UDP糖基转移酶应用于人工构建的重组表达系统，通过发酵工程生产碳苷二氢查尔酮、黄酮碳苷化合物。

活性多肽、其编码基因、载体及宿主

本发明人通过挖掘基因组以及转录组信息，结合大量的研究和实验工作，揭示了一组新的尿苷二磷酸(UDP)-糖基转移酶，其是双功转移酶，具有碳苷阿拉伯糖基转移酶(C-arabinosyltransferase)活性和碳苷葡萄糖基转移酶(C-glucosyltransferase)活性。较佳地，该组碳苷糖基转移酶来源于单子叶禾本科植物；更佳地，包括来自于毛竹(Phyllostachys edulis(或称Phyllostachys heterocycla)；Ph)、粳稻(Oryza sativajaponica；Osj)、籼稻(Oryza sativa indica；Osi)、玉米(Zea mays；Zm)、高粱(Sorghumbicolor；Sb)、二穗短柄草(Brachypodium distachyon；Bd)、谷子(Setaria italica；Si)。

作为本发明的优选方式，所述碳苷糖基转移酶是糖基转移酶PhCGT3(SEQ ID NO:1)、PhCGT4(SEQ ID NO:2)、OsjCGT3(SEQ ID NO:3)、OsiCGT4(SEQ ID NO:4)、OsiCGT5(SEQID NO:5)、OsiCGT6(SEQ ID NO:6)、BdCGT2(SEQ ID NO:7)、ZmCGT2(SEQ ID NO:8)、ZmCGT3(SEQ ID NO:9)、SiCGT3(SEQ ID NO:10)、SbCGT3(SEQ ID NO:11)、SbCGT4(SEQ ID NO:12)。

本发明也包括所述碳苷糖基转移酶的保守性变异多肽(保守性序列变体)。本发明中，所述的“保守性变异多肽”是指基本上保持所述多肽相同的生物学功能或活性的多肽。所述的“保守性变异多肽”可以是(i)有一个或多个保守或非保守性氨基酸残基(优选保守性氨基酸残基)被取代的多肽，而这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的，或(ii)在一个或多个氨基酸残基中具有取代基团的多肽，或(iii)成熟多肽与另一个化合物(比如延长多肽半衰期的化合物，例如聚乙二醇)融合所形成的多肽，或(iv)附加的氨基酸序列融合到此多肽序列而形成的多肽(如前导序列或分泌序列或用来纯化此多肽的序列或蛋白原序列，或与抗原IgG片段的形成的融合蛋白)。根据本文的教导，这些片段、衍生物和类似物属于本领域熟练技术人员公知的范围。

所述的“保守性变异多肽”可以包括(但并不限于)：一个或多个(通常为1-50个，较佳地1-30个，更佳地1-20个，最佳地1-10个)氨基酸的缺失、插入和/或取代，以及在C末端和/或N末端添加或缺失一个或数个(如50个以内，较20个或10个以内，更佳地为5个以内)氨基酸。例如，在本领域中，用性能相近或相似的氨基酸进行取代时，通常不会改变蛋白质的功能。又比如，在C末端和/或N末端添加一个或数个氨基酸通常也不会改变蛋白质的功能。本发明还提供所述多肽的类似物。这些类似物与天然多肽的差别可以是氨基酸序列上的差异，也可以是不影响序列的修饰形式上的差异，或者兼而有之。这些多肽包括天然或诱导的遗传变异体。诱导变异体可以通过各种技术得到，如通过辐射或暴露于诱变剂而产生随机诱变，还可通过定点诱变法或其他已知分子生物学的技术。类似物还包括具有不同于天然L-氨基酸的残基(如D-氨基酸)的类似物，以及具有非天然存在的或合成的氨基酸(如β、γ-氨基酸)的类似物。应理解，本发明的多肽并不限于上述例举的代表性的多肽。

作为本发明的优选方式，本发明涉及到的P450氧化酶(黄烷酮-2-羟化酶和黄烷酮-3’-羟化酶)是去除了N端的跨膜区的多肽片段，从而避免该酶被锚定于细胞膜上，使得截短后蛋白的可溶性表达增加，当被应用于生物合成途径中时，发挥更好的活性。

本发明的碳苷糖基转移酶的氨基端或羧基端还可含有一个或多个多肽片段，作为蛋白标签。任何合适的标签都可以用于本发明，包括可用于对蛋白进行纯化的标签或具有助溶性能的标签。例如，所述的标签可以是FLAG、HA、HA1、c-Myc、Poly-His、Poly-Arg、Strep-TagII、AU1、EE、T7、4A6、ε、B、gE、以及Ty1。又例如，所述的标签可以是助溶标签包括2B，17α，MBP等。

当出于生产本发明的碳苷糖基转移酶的目的时，为了使翻译的蛋白分泌表达(如分泌到细胞外)，还可在本发明的多肽的氨基端添加上信号肽序列。信号肽在多肽从细胞内分泌出来的过程中可被切去。

本发明的活性多肽可以是重组多肽、天然多肽、合成多肽。本发明的多肽可以是天然纯化的产物，或是化学合成的产物，或使用重组技术从原核或真核宿主(例如，细菌、酵母、高等植物)中产生。根据重组生产方案所用的宿主，本发明的多肽可以是糖基化的，或可以是非糖基化的。本发明的多肽还可包括或不包括起始的甲硫氨酸残基。

编码本发明的碳苷糖基转移酶的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。术语“编码多肽的多核苷酸”可以是包括编码此多肽的多核苷酸，也可以是还包括附加编码和/或非编码序列的多核苷酸。

本发明也涉及包含本发明的多核苷酸的载体，以及用本发明的载体或多肽编码序列经基因工程产生的宿主细胞，以及经重组技术产生本发明所述多肽的方法。

通过常规的重组DNA技术，可表达或生产重组的多肽。一般来说有以下步骤：(1).用编码所述多肽(含其保守性变异多肽)的多核苷酸，或用含有该多核苷酸的重组表达载体转化或转导合适的宿主细胞；(2).在合适的培养基中培养的宿主细胞；(3).从培养基或细胞中分离、纯化蛋白质。

本发明中，编码所述多肽的多核苷酸序列可插入到重组表达载体中。术语“重组表达载体”指本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒如腺病毒、逆转录病毒或其他载体。只要能在宿主体内复制和稳定，任何质粒和载体都可以用。表达载体的一个重要特征是通常含有复制起点、启动子、标记基因和翻译控制元件。较佳地，所述表达载体可以是原核表达载体。

本领域的技术人员熟知的方法能用于构建含本发明的碳苷糖基转移酶的多核苷酸和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等。所述的DNA序列可有效连接到表达载体中的适当启动子上，以指导mRNA合成。此外，表达载体优选地包含一个或多个选择性标记基因，以提供用于选择转化的宿主细胞的表型性状。

包含上述的适当DNA序列以及适当启动子或者控制序列的载体，可以用于转化适当的宿主细胞，以使其能够表达蛋白质。宿主细胞可以是原核细胞，如细菌细胞；或是低等真核细胞，如酵母细胞；或是高等真核细胞，如哺乳动物细胞。代表性例子有：大肠杆菌，链霉菌属，枯草杆菌；鼠伤寒沙门氏菌的细菌细胞；真菌细胞如酵母，植物细胞，灵芝细胞；果蝇S2或Sf9的昆虫细胞；CHO、COS、293细胞、或Bowes黑素瘤细胞的动物细胞等。

本发明也提供了用于生物合成黄酮碳苷(类)化合物或其中间体的宿主细胞，其中包括：合成黄烷酮化合物的前体基因、编码黄烷酮-2-羟化酶和/或黄烷酮-3’-羟化酶的基因以及本发明所述的编码糖基转移酶的基因。

在本发明的优选方式中，所述的宿主细胞为原核细胞，更佳地为大肠杆菌。但是应理解，细胞宿主仅是一种生产工具，本领域技术人员可以通过一些技术手段对大肠杆菌以外的其他宿主细胞进行改造，从而也实现如本发明的生物合成，由此构成的宿主细胞以及生产方法也应包含在本发明中。

应用及生产工艺

本发明的碳苷糖基转移酶或它们的保守性变异多肽，可应用于特异和高效地催化二氢查尔酮(类)化合物或2-羟基黄烷酮(类)化合物的碳苷葡萄糖基化，从而产生一类碳苷二氢查尔酮、碳苷-2-羟基黄烷酮(类)化合物；碳苷-2-羟基黄烷酮(类)化合物通过进一步的脱水反应形成黄酮碳苷(类)化合物。

因此，本发明提供了糖基转移酶的用途，用于催化二氢查尔酮(类)化合物或2-羟基黄烷酮(类)化合物生成碳苷二氢查尔酮、碳苷-2-羟基黄烷酮(类)化合物；其中，所述的糖基转移酶包括选自SEQ ID NO:1～12任一所示的多肽或其保守性变异多肽。

如本发明所用，所述的二氢查尔酮(类)化合物包括二氢查尔酮或其衍生物、结构类似物、异构体。所述的2-羟基黄烷酮(类)化合物包括2-羟基黄烷酮或其衍生物、结构类似物、异构体。所述的碳苷二氢查尔酮(类)化合物包括碳苷二氢查尔酮或其衍生物、结构类似物、异构体。所述碳苷-2-羟基黄烷酮(类)化合物包括碳苷-2-羟基黄烷酮或其衍生物、结构类似物、异构体。所述黄酮碳苷(类)化合物包括黄酮碳苷或其衍生物、结构类似物、异构体。

在本发明的优选方式中，所述的二氢查尔酮具有式(I)的母核结构、2-羟基黄烷酮(类)化合物(开环形式)具有式(II)的母核结构，所述碳苷二氢查尔酮(类)化合物具有式(III)的母核结构，碳苷-2-羟基黄烷酮(类)化合物(开环形式)具有式(IV)的母核结构：

其中，R为糖基，其与A环以碳碳键连接。所述的糖基可以是单糖、二糖或多糖基(如3个或以上(如3～10个，更具体如4、5、6、7、8、10个)单糖串联)。在优选的方式中，所述的糖基为单糖基。

在本发明的优选方式中，A环或B环中，存在1～3个羟基；较佳地，A环中，羟基存在于第2’、4’和/或6’位；较佳地，B环中，羟基出现在第4位置。

在本发明的优选方式中，R在A环上的数量为1个，较佳地其存在于第3’位；或R在A环上的数量为2个，较佳地其存在于第3’和5’位；且，所述的糖基转移酶包括选自SEQ IDNO:6，7，9或11所示的多肽或其保守性变异多肽。

本发明人发现，所述糖基转移酶是双功能性的糖基转移酶，兼具具有碳苷阿拉伯糖基转移酶活性和碳苷葡萄糖基转移酶活性能的糖基。根据不同的糖基供体，其进行相应糖基的转移。在利用所述糖基转移酶进行糖基转移时，以携带阿拉伯糖基团或葡萄糖基团的化合物作为供体；更佳地，以UDP阿拉伯糖或UDP葡萄糖作为糖基供体等化合物作为供体。应理解，其它的携带阿拉伯糖基团或葡萄糖基团的化合物也是可以作为供体的，也应被包含在本发明中。在本发明的优选实施方式中，当进行基于细胞的产物合成时，可以在细胞中转入合成所述糖基供体的基因，从而使得细胞自行合成糖基供体。可选择地，当进行基于细胞的产物合成时，也可以通过给细胞外源提供糖基供体的形式进行。

在本发明的优选方式中，所述二氢查尔酮(类)化合物或2-羟基黄烷酮(类)化合物包括但不限于：根皮素，2-羟基柚皮素(较佳地为开环形式)，2-羟基圣草酚(较佳地为开环形式)。此外，它们的类似物或基团被取代的变体形式也应被包含在内。

在本发明的优选方式中，所述碳苷二氢查尔酮(类)化合物或碳苷-2-羟基黄烷酮(类)化合物包括但不限于：根皮素-C-阿拉伯糖苷，2-羟基柚皮素-C-阿拉伯糖苷，2-羟基圣草酚-C-阿拉伯糖苷，根皮素-C-双阿拉伯糖苷，2-羟基柚皮素-C-双阿拉伯糖苷，2-羟基圣草酚-C-双阿拉伯糖苷，Nothofagin，2-羟基柚皮素-C-葡萄糖苷，2-羟基圣草酚-C-葡萄糖苷，根皮素-C-双葡萄糖碳苷，2-羟基柚皮素-C-双葡萄糖苷，2-羟基圣草酚-C-双葡萄糖苷，根皮素-C-阿拉伯糖-C-葡萄糖苷，2-羟基柚皮素-C-阿拉伯糖-C-葡萄糖苷，2-羟基圣草酚-C-阿拉伯糖-C-葡萄糖苷。此外，它们的类似物或基团被取代的变体形式也应被包含在内。

本发明也提供了催化二氢查尔酮(类)化合物或2-羟基黄烷酮(类)化合物生成碳苷二氢查尔酮、碳苷-2-羟基黄烷酮(类)化合物的方法，包括：以糖基转移酶进行所述催化；所述的糖基转移酶包括选自SEQ ID NO:1～12任一所述的多肽或其保守性变异多肽。

本发明也提供了合成黄酮碳苷化合物的方法，包括：(1)将2-羟基黄烷酮(类)化合物以糖基转移酶催化，产生碳苷-2-羟基黄烷酮(类)化合物；其中，所述的糖基转移酶包括选自SEQ ID NO:1～12任一所述的多肽或其保守性变异多肽；(2)将(1)的碳苷-2-羟基黄烷酮(类)化合物脱水，获得黄酮碳苷化合物。较佳地，在(1)之前还包括：(c)将黄酮(类)化合物通过黄烷酮-2-羟化酶(F2H)催化，获得2-羟基黄烷酮(类)化合物。更佳地，在(c)之前，还包括：(b)将丙二酰-CoA(类)化合物(如包括其经1或多基团的取代形式)与p-香豆酰-CoA(类)化合物(如包括其经1或多基团的取代形式)经查尔酮合成酶(CHS)和查尔酮异构酶(CHI)催化，获得黄酮(类)化合物。进一步更佳地，在(b)之前还包括：(a)将L-酪氨酸(类)化合物(如包括其经1或多基团的取代形式)经酪氨酸解氨酶(TAL)和4-香豆酰-辅酶A连接酶(4CL)催化，获得p-香豆酰-CoA(类)化合物。

在本发明的优选方式中，所述的黄酮(类)化合物包括：柚皮素，圣草酚；所述的丙二酰-CoA(类)化合物包括：丙二酰-CoA，甲基丙二酰-CoA；所述的p-香豆酰-CoA(类)化合物包括：p-香豆酰-CoA，p-肉桂酰-CoA；所述的L-酪氨酸(类)化合物包括：L-酪氨酸，L-苯丙氨酸。应理解，根据本发明的整体描述，它们的类似物或变异形式也可应用于本发明中。

在本发明的优选方式中，所述的2-羟基黄烷酮(类)化合物为2-羟基柚皮素，其是从柚皮素通过黄烷酮-2-羟化酶(F2H)催化获得；或所述2-羟基黄烷酮(类)化合物为2-羟基圣草酚，其是从圣草酚通过黄烷酮-2-羟化酶(F2H)催化获得；较佳地，所述圣草酚是从柚皮素通过黄烷酮-3’-羟化酶(F3’H)催化获得。应理解，根据本发明的整体描述，它们的类似物或变异形式也可应用于本发明中。

本发明也提供了生物合成黄酮碳苷化合物的方法，包括：(i)将合成柚皮素(类)化合物的前体基因、编码黄烷酮-2-羟化酶和/或黄烷酮-3’-羟化酶的基因以及编码糖基转移酶的基因共转入宿主细胞中；其中，所述的糖基转移酶包括选自SEQ ID NO:1～12任一所述的多肽或其保守性变异多肽；(ii)培养(i)的细胞，从而生物合成黄酮碳苷化合物。

在本发明的具体实施例中，这些碳苷糖基转移酶的N端或/和C端连接标签得到的融合蛋白及其衍生多肽，能够特异和高效地催化二氢查尔酮(类)化合物或2-羟基黄烷酮(类)化合物的3’位置进行C-阿拉伯糖基化或C-葡萄糖糖基化，其中在以UDP阿拉伯糖为糖基供体的情况下，OsiCGT6、BdCGT2和ZmCGT3不仅可以催化查尔酮(类)化合物3’位C-阿拉伯糖基化，更可以对已被阿拉伯糖基化的二氢查尔酮进一步C-阿拉伯糖基化，从而产生双阿拉伯糖碳苷的二氢查尔酮。在以UDP葡萄糖为糖基供体的情况下，ZmCGT3和SbCGT3不仅可以催化查尔酮(类)化合物3’位C-葡萄糖基化，更可以对3’位已被葡萄糖基化的二氢查尔酮、2-羟基黄烷酮进行进一步5’位C-葡萄糖基化，从而产生双葡萄糖碳苷的二氢查尔酮或双葡萄糖碳苷的2-羟基黄烷酮。单碳苷或双碳苷-2-羟基黄烷酮(类)化合物可以通过非酶化的脱水缩合反应生成单碳苷或双黄酮碳苷(类)化合物。

另一方面本发明通过生物工程技术，将这些新型CGT应用于人工构建的重组大肠杆菌系统，该重组微生物能够生产碳苷二氢查尔酮和黄酮碳苷(类)化合物。

相对于传统的植物提取手段，微生物发酵具有速度快、受外界因素影响较小等优势；部分化合物通过微生物合成的产量远高于植物提取，已经成为天然产物获得的一种重要手段。黄酮碳苷(类)化合物天然丰度低，并且在植物提取物中与大量结构类似的黄酮氧苷、苯丙素(类)化合物共存，使得分离纯化繁琐复杂。本发明中使用微生物发酵的方式来高效、定向得合成黄酮碳苷，极为有效地降低了分离纯化这(类)化合物的成本。

本发明也提供了用于生物合成黄酮碳苷化合物或其中间体的试剂盒，其中包括：SEQ ID NO:1～12所示的一条或多条多肽或其保守性变异多肽；黄烷酮-2-羟化酶和/或黄烷酮-3’-羟化酶；合成柚皮素(类)化合物的前体基因；较佳地还包括宿主细胞。更佳地，所述试剂盒中还包括说明进行生物合成的方法的使用说明书。

下面结合具体实施例，进一步阐述本发明。应理解，这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法，通常按照常规条件如J.萨姆布鲁克等编著，分子克隆实验指南，第三版，科学出版社，2002中所述的条件，或按照制造厂商所建议的条件。

试剂材料

毛竹采自上海辰山植物园。

粳稻、籼稻、高粱、玉米、谷子、二穗短柄草种植于中国科学院上海分子植物研究中心温室。

植物基因组DNA提取使用TIANGEN植物基因组提取试剂盒。

AxyPrep总RNA小量制备试剂盒，多聚酶链式反应(PCR)胶回收试剂盒，质粒抽提试剂盒均为美国Axygen产品。

寡核苷酸引物购自生工科技(Sangon Biotech)与金斯瑞中国(GenScriptBiotech Corp)生物科技有限公司。

合成优化序列购自金斯瑞中国(GenScript Biotech Corp)生物科技有限公司。

PrimeScript RT reagent Kit with gDNA Eraser(Perfect Real Time)聚合酶试剂盒，聚合酶链式反应(PCR)高保真酶PrimeSTAR Max DNA Polymerase为日本宝生物公司(TAKARA)产品。

限制性内切酶、T4连接酶为NEB产品。

无缝克隆试剂盒购自诺唯赞生物科技有限公司。

大肠杆菌DH10B、BL21(DE3)菌株和pET21a、pET28a载体用于基因克隆及蛋白表达。

标准品化合物柚皮素、2-羟基柚皮素、根皮素购自大连美仑生物技术有限公司，夏佛塔苷购自北京贝洛生物科技有限公司、异夏佛塔苷购自南通经纬生物科技有限公司、维采宁-2购自上海源叶生物科技有限公司。

UDP葡萄糖购自北京中泰生物有限公司。UDP阿拉伯糖购自CarboSource。

其他试剂为国产分析纯或色谱纯试剂，购自国药集团化学试剂有限公司。

实施例1、新型尿苷二磷酸(UDP)-糖基转移酶

1.碳苷糖基转移酶基因克隆和表达质粒构建

取禾本科植物(毛竹、粳稻、籼稻、高粱、谷子、二穗短柄草、玉米)成熟叶片或幼苗，清水清洗干净表面污渍，用吸水纸轻轻擦拭干叶片表面水渍，称重备用。基因组DNA的提取依照TIANGEN植物基因组提取试剂盒提供的说明书进行。

所述的碳苷糖基转移酶的氨基酸序列如下：

>PhCGT3(SEQ ID NO:1)

MAPPATLRSGEPDRDTPHVIFIPSAGMGHLYPFFRFIAALSSYGVDISVVTILPTVSAAEADHFAGLFAAFPSIRRIDFHLLPLDTNEFPGADPFFLRWEELRRSAHLLGPLIASATPRVSTIVSDVTLASHVIPIAKELHIPCHVLFISCATMLSLNAYFPVYLDTKAGMDGIGDVDIPGVCRIPKSSLPQALLDLNKLFTKQFIENGREITKADGILVNTFDALEPKALATLRDGTVVTRFPPVFAIGPLTSHSPAAGERVDAGFPLAWLAEQPTRSVVYVAFGNRNAVTLDQIREIAVGLEASGFRFLWVLKTTVVDHEDTAELKDVLGDGFLERVKGRSLVTKAWVDQEAILKHPAVGLYLSHSGWNSVAEAAAYGVPMLAWPRGGDHRVNATVVVSGGVGVWMEHWSWDGEDRLVSGKEIGDKVKEVMLDAAVRARAAKVGEEADKALTEGGSSYRSMQQFVAKLKNN*

>PhCGT4(SEQ ID NO:2)

MAPPEMLSSGEQDRGAPHVVFIPSAGMGHLLPFFRFITALSSHDVDISVVTVLPTVTTAEADHFAALFTALPRIRRINFNLLPLDASAFPGADPFFLRWESLRRSAHLLGPLLAGATPSMSAVITDVTLASQVIPIVKDELHLSCHILFPSSTTMLSLCAYFPTYLDGANADHVVSDVDVPGVRRFTKATLPQALHDPNNLFTKQFVANGRGFTKADGFLLNTFEALEPEAIAALRGGKVIPCFPPVFTVAPLKSMIPADSEKVGAGSPMAWLDEQPARSVVYVAFGNRCAVTLDQIREIAAGLETSSFRFLWVLKTTVVDREDTVELKDVLGDGFLERMQGRGLVTKAWVDQEAVLNHPAVGLFLSHSGWNSVVEAAVGGVPLLAWPRFGDHRVNATAMVSGGVGVWMEHWSWDGEDRLVSGEEIGEKVKEVMADETVRARVAKVREEAAKAVAEGGSSYRSMQEFVAKLKAN*

>OsjCGT3(SEQ ID NO:3)

MAPPPAVLSSGELGARGHTRPHVVFVPSAGMGHLLQFFRFIGALSAHDVDISVVTVFPTVSAAEADHFAALFRDYPSVRRLDFDLLPFDASEFPGGDPFLLRWEALRRSLHLLGPVIAGVTPRVTATVTDVTLVSHVNPIAKDLGVQCHVLYVSSAAMMSLCSYFPIYLDNKDAGADVGDVDIPGVRRLKRSWLPQPLLDLNKLFTKQFIENGREMVKTDGVLINTFDALEPVALAALRDGKVVRGFPPVFAVGPHSSLASEATKGAAADAEGSPMAWLRQQPARSVVYVAFGSRCAVSHEQIREIAAGLEASGSRFLWILKTTVVDRDDDAGIRDVLGDGFLERVRGRGVVTKAWVDQDAVLRDPAVGLFLSHSGWNSVIEAATAGVPLLAWPRGGDHRVAATVVASSGVGVWMEQWSWDGEEWVVSGEEIGGKVKEMMADAGVREKAAKVGEEVAKAVAVGGTSHTGILDFVAKLKAAT*

>OsiCGT4(SEQ ID NO:4)

MAPPTVLNSGEPDSRRRARPHVVFVPSAGMGHLLPFFRFIGALSAHDVDISVVTVLPTVSAAENDHFARLFQDFPSIRRVDFNLLPLDASEFPGADPFLLRWEALRRSMHLLAPAIAGVSPRATAVVTDVTLVSHVNAIAKDLQLQCHVLFISSATMMSFLSYFPIYLDNKDAQADVGDVDIPGVRRLKRSWLPQPLLDLDKLFTKQFIDNGREVVKTDGVLINTFDALEPVALAALRDGKVIRGFPSVFAVGPYSSLASETKAADAESSALAWLNQQPARSVVYVAFGNRYHVSNDQLREIAAGLEASGCRFLWIVKTTAVDRDEAAGVRDVLGDGFVDRVRGRGMVTKAWVDQEAVLGHPAVGLFLSHSGWNSVTEAAAAGVPLLAWPRAGDHRVAGTVVASSGVGVWMEQWSWDGEEWLVSGQEIGGKVKEMMADAGVRERAAKVGELAAKAVAEGGTSRTSMLEFVAKLKAT*

>OsiCGT5(SEQ ID NO:5)

MPPPTVLNSGEPDSRRRARPHVVFVPSAGMGHLLPFFRFIGALSAHDVDISVVTVLPTVSAAEADHFARLFQDFPSIRRVDFNLLPLDASEFPGADPFLLRWEALRRSMHLLAPAIAGVRPRATAVVTDVTLVSHVNPIAKDLRLQCHVLFISSATMMSLCSYFPIYLDNKDAEADVGDIDIPGVRRLKRSWLPQPLLDLDKLFTKQFIDNGREVVKTDGVLINTFDALEPVALAALRDGKVIRGFPSVFAVGPYSSLASEKKAADAESSALAWLNQQPARSVVYVAFGNRYHVSNDQLREIAAGLEASGCRFLWIVKTTAVDRDEAAGVRDVLGDGFVDRVRGRGMVTKAWVDQEAVLGHPAVGLFLSHSGWNSVTEAAAAGVPLLAWPRAGDHRVAGTVVASSGVGVWMEQWSWDGEEWLVSGQEIGGKVKEMMADAGVRERAAKVGEQAAKAVAEGGTSRTSMLEFVAKLKAA*

>OsiCGT6(SEQ ID NO:6)

MAPPTVLNSGEPDSRRRARPHVVFVPSAGMGHLLPFFRFIGALSAHDVDISVVTVLPTVSAAEADHFARLFQDFPSIRRVDFNLLPLDASEFPGADPFLLRWEALRRSMHLLAPAIAGVSPRATAVVTDVTLVSHVNPIAKDLRLQCHVLFISSATMMSLCSYFPIYLDNKDAEADVGDIDIPGVRRLKRSWLPQPLLDLDKLFTKQFIDNGREVVKTDGVLINTFDALEPVALAALRDGKVIRGFPPVFAVGPYSSLASEKKAADADQSSALAWLDQQPARSVVYVAFGNRCTVSNDQLREIAAGLEASGCRFLWILKTTVVDRDEAAAGGVRDVLGDGFMERVKGRGMVTKEWVDQEAVLGHPAVGLFLSHSGWNSVTEAAAAGVPLLAWPRGGDHRVAATVVASSGVGVWMEQWSWDGEEWLVSGEEIGGKVKEMMADDAVRERAAKVGEEAAKAVAEGGTSRTSMLEFVAKLKAA*

>BdCGT2(SEQ ID NO:7)

MADLAAMPNSGEQQGRDAPAPPHLVFVPSAGMGHLLPFTRFIADLANENVEISVVTALPTVSAAEAAHFADLFAAFPRIRRIDFNLLPFDESAFPGADPFLLRWESLRRSAQLLGPLIAAAVPRASAVVTDVTLASQVIPIAKDELNLPCHILFISCATMLSLVAYFPVYLDGAKADHLVGDVDIPGVLRLPVSSPPQVLRNPDSLFTKQFIANGRTIAKSDGILVNTFRALEPEALSALNSGKVVPGFPPVYAVGPLKSSITMTTSTGSSDKDEGAAAGGSPMAWLGEQPAGSVVYVAFGNRHGVSLEQIREIAAGLEASGCGFLWVLKTTVVDREDTAELEDVLGRGFLGRVTGRGLVTKEWVDQEAVLQHPAVGLYLSHAGWNSVTESAAYGVPMLVWPTAGDQRVIATVVASAGFGLWMEHWDWESLVSGAEIGEKVKEVMGNEGIKARAAKVSEEAAKAVAEGGSSHRSMQEFLAKLKPSTT*

>ZmCGT2(SEQ ID NO:8)

MAPPPAMQSPGELNDGAYDAPHILFIPSAGIGHLTPVFRVIAGFSSRGIDVSVVTVLPTVSAAETDYFNGLFADYPAVRRVDMHLLPLDASEFTREDPFFLRWEALRRSVHLLRPIITNAAPRITAIITDITLTSCVIPIAKELDVPCHVLFPTAATMLSLNAYYPVYLEKLKGGPEPGVIGDAVDIPGVFRVPRSALPPALLDVNKLFTKQFIDNGRAIVKADGVLVNTFDAVEPAPLAALRGGKIVPGYPPVYTIGPLKSHATKAGDKPGDALLDEWLGKQRARSVVYVAFGNRSAARLDQIREIAAGLEDSGYPFLWVLKTTKVDREDDAELAEVLGDGYLERVKGRGIVTKGWVEQEELLKHPAVGMFVSHGGWNSALEASSAGVPLLVWPQLGDHRVNAMAAVRAGIGAWAEHWSWDGEDTLVTRQEIADKVKEVMADGKLRASVAVAREEAAKAVAEGGTSYRNMHDFIAKLKGGA*

>ZmCGT3(SEQ ID NO:9)

MAPPATNSPGEVDSGGRPHVMFIPSAGMGHLIPFFRFIAALAGQSVDISVVTVLPTVSAAEEDYFTSLFAALPRVRRVDLHLLPFDASKLPSNDRDPFVLRWEALRRSAHLLGPLIAGAAPRVSAVITDVTLTSHVIPIAKELGVQCHVLFPSSATMLSLLAYTPVHIDKKAEQGSDIGDVDIPGVCRIPQSCLPQVLLHLDKLFTKQFIANGREIINADGFLVNTFDALEPVALAALRDGKVVPGFPPVYAIGPLMSQQNSVDEGGKEEGSGSPVAWLDEQPARSVVYVAFGNRCAVSHDQIREIAAGLEASNCRFLWVLKTTTVDRDDSAVLTELLGEEFLERVQGRGLVTKAWVDQEALLKHPAMGLFLSHSGWNSVTEAAAASVPLLAWPRGGDHRVNAMVTVSGGVGMWMEHWSWDGEDWLVTGVEIAKKVKEVMSDEAVRARTTRTAEEAAKAVAEGGTSYRSMEEFISSVKATVAS*

>SiCGT3(SEQ ID NO:10)

MKSPGELGSGARPHVMFIPSAGMGHLLPFLRVIAALARHDDVDVSVVTVLPTVSAAEADHLAGLFAAFPRVRRADLHLLPFDASEFPGHDPFLLRWEALRRSAHLLRPLIACGAAPRVSAIVTDVTLASHVIPISKELNVQCHVHFISCATMLSLLAKAELGPGVGDVDIPGVRRIPESYLPQPLRDLNNVFTKQFIDNGREIINADGILVNTFDALEPAALAALRDGKVVPGFPPVNAIGPLDSHTASTANAKQSEPAGSPVAWLGEQPARSVVYVAFGNRSAVSRDQLRQIAAGLEASGCRFLWVLKTTTVDKDDNTEVEDVLGCGFLERVRGRGLVTKAWVDQEALLKHPAVGLFLSHSGWNSVVEAAAAGMPLLAWPRGGDQRVNAMVVASGGFGVWMEHWSWDGEDRLVTGEEIREKVKEVMSDAAVRVRAMKTGEEAAKAVAEGGTSYRSMQEFIGKLRAT*

>SbCGT3(SEQ ID NO:11)

MATPPATKSLLGELNGGGASRPHVMFIPSAGMGHLLPFFRFIASLARHDDDVDISVVTVLPTVSAAEADHFSGLFAAFPRVRRVDFPSHDRDPFIVRWEALRRSAHLIGPLIAGAAPRVSAVITDVTLTSHVIPIAKKLGVQCHVLFISCATIKKAEQGPGAGVGAVDIPGVRRIPESCLPQPLLDLNKQFTKQFIDNGRENINADGILVNTFDALEPAALAALRDGKVVPGFPFPPVYAIGPLRSVVDKEDSSSSSPVVAWLDKQPARSVVYVAFGNRSAVSHAHIREIAAGLEASGCRFLWVLKTTKVDRDDTAELTDVLGEGFLERLHQQQGQGQGQHGMVTKEWVDQEALLKHASVGLYLSHSGWNSVTEAAAAGVPLLAWPRGGDHRVNHWSWDGEDWLVTGEEIAEKVKEVMSDAAVRARATRTGEEAAMAVAEGGTSYRSMQQFVSSLKKAT*

>SbCGT4(SEQ ID NO:12)

MSSPALSTTSSHVPRGAPHVVLFPSAGMGHLVPFTRLAVALSAGHGCDISLVTAMPTVSSAESRHIAALCAAFPAIRQLDLDLRLAPFDASSEFPGADPFYVRYEALRRAAPVLLGPLLAGAGASALVADIALASVAIPVARELHVPCFVFFTASATMFSLKAYFPTYLDAVGAGHGVGDVDVPGVYRIPSSSVPQALHDPDNIFTRQFVANGRALVTADGLLVNAFHAMEPEAVEALRGGSVVPGLPPVFAVGPLMPVSELRETGEAEQEQGNCYREWLDEQPPRSVVYVSFGSRKALPKDQMNELAAGLEACGHRFLWVVKGAVVDRDDAGELSDLLGEGFLRRVQGQGRGLVTKSWVEQEEVLRHPAVALFVSHCGWNSVTEAASGGVPVLAWPRFADQRVNARVVARAGLGVWAEQWSWEGEEAVVRAEEIAELVMEAMGDDAMAEKAANVREAASRAVADGGTSYQSLAAFVRRCTA*

以基因组DNA为模板，通过PCR扩增候选糖基转移酶基因PhCGT3、PhCGT4、OsjCGT3、OsiCGT4、OsiCGT5、OsiCGT6、BdCGT2、ZmCGT2、ZmCGT3、SiCGT3、SbCGT3、SbCGT4。PCR引物如表1所示。其中OsjCGT3、OsiCGT5、SiCGT3、SbCGT4为人工合成并经大肠杆菌密码子优化。

表1、克隆糖基转移酶所使用的引物

PCR扩增体系25μL(PrimeSTAR Max Premix，12.5μL；Primer 1/Primer 2终浓度0.2μM；gDNA<50ng；剩余体积用灭菌蒸馏水补足)。PCR反应条件：98℃预变性2min，然后98℃变性10s，55℃退火15s，72℃延伸10s，30个循环，72℃延伸10min，琼脂糖电泳检测，扩增得到约1.5kb的片段。纯化后片段使用无缝克隆的方式连入相同NdeI/NotI消化过的pET28a载体，连接产物转化大肠杆菌DH10B感受态细胞，测序确认序列。

2.碳苷糖基转移酶的蛋白表达

将重组质粒转化到大肠杆菌BL21(DE3)的感受态细胞中，在固体LB培养基(卡那霉素50μg/mL)37℃培养过夜。挑取单个克隆到2mL LB液体培养基(卡那霉素50μg/mL)，转接过夜培养的菌液到新的LB液体抗性培养基100mL中37℃，250rpm培养至OD₆₀₀＝0.5～0.6，水浴降温至16℃左右，然后加入诱导剂IPTG至终浓度0.1mM，转至16℃低温诱导培养，在摇床转速180r/min条件下继续培养20h。携带pET28a空质粒的BL21(DE3)重组菌株作为空白对照，培养操作同上。离心收菌(6000r/min，5min)，使用1mL破菌缓冲液Buffer A(20mM Tris-HCl，pH 8.0；100mM NaCl)重悬，加入DNase至终浓度为5μg/mL，Mg²⁺终浓度为2mM，蛋白酶抑制剂PMSF终浓度为1mM，冰上孵育30min后超声破碎；冷冻离心(10000rpm，30min，4℃)，通过0.2μm滤膜过滤，获得上清粗酶液，加入20％甘油冷冻保存(-20℃)。

3.碳苷糖基转移酶的体外功能鉴定

体外酶催化测定体系为100μL，反应体系包括：0.1mM的糖基受体(根皮素或2-羟基柚皮素)，0.3mM的UDP葡萄糖或0.1mM的UDP阿拉伯糖，25μL上清粗酶液，用Buffer A补足体积到100μL，于37℃反应2h。待反应结束后，加等体积甲醇终止反应，使用HPLC进行产物分析。HPLC检测条件：色谱柱：反相C18 column[SilGreen ODS column]，检测波长为280nm；流动相：乙腈(0.1％甲酸)-水(0.1％甲酸)混合物梯度洗脱，在0到20min内比例由5:95升到100:0，流速1mL/min。

根据HPLC检测结果1(图1A)，以UDP阿拉伯糖为糖基供体，OsjCGT3、OsiCGT4、OsiCGT5、OsiCGT6、BdCGT2、PhCGT3、PhCGT4、ZmCGT2、ZmCGT3、SbCGT3、SiCGT3、SbCGT4能够将底物根皮素(phloretin)转化为保留时间较小的产物。上述产物经负离子模式高分辨质谱检测确认分子式为C₂₀H₂₂O₉，二级质谱显示出戊糖碳苷特征性的[M-H-90]^—、[M-H-60]^—碎片离子峰(图2)。经过一维核磁(¹H NMR)推断该碳苷糖基化产物为根皮素阿拉伯糖碳苷(图3)。

同时，以UDP阿拉伯糖为糖基供体，OsiCGT4和OsiCGT5也可以将底物2-羟基柚皮素(2-hydroxynaringenin)转化为其阿拉伯糖基化产物(图1B)。该产物经负离子模式高分辨质谱检测确认分子式为C₂₀H₂₀O₁₀(图4)，提示该产物为2-羟基柚皮素-C-阿拉伯糖苷。

此外，以UDP阿拉伯糖为糖基供体，本发明人还发现OsiCGT6、BdCGT2和ZmCGT3催化根皮素产生根皮素阿拉伯糖碳苷的同时，还产生一个保留时间较小的化合物(图5)。该产物经负离子模式高分辨质谱检测确认分子式为C₂₅H₃₀O₁₃，二级质谱显示出双戊糖碳苷特征性的[M-H-120]^—、[M-H-150]^—、[M-H-180]^—等碎片离子峰(图6)，提示该化合物为根皮素-C-双阿拉伯糖碳苷。

根据HPLC检测结果2(图7A)，以UDP葡萄糖为糖基供体，OsjCGT3、OsiCGT4、OsiCGT5、OsiCGT6、BdCGT2、PhCGT3、PhCGT4、ZmCGT2、ZmCGT3、SbCGT3、SiCGT3、SbCGT4能够将底物根皮素(phloretin)转化为保留时间较小的产物。该化合物与标准品Nothofagin的保留时间一致，经负离子模式高分辨质谱检测确认分子式为C₂₁H₂₄O₁₀，二级质谱显示出己糖碳苷特征性的[M-H-120]^—、[M-H-90]^—碎片离子峰(图8A)。此外还发现，在ZmCGT3和SbCGT3的转化产物中出现新的产物，该产物经负离子模式高分辨质谱检测确认分子式为C₂₇H₃₄O₁₅，二级质谱显示出双己糖碳苷特征性的[M-H-180]^—、[M-H-210]^—、[M-H-240]^—碎片离子峰(图8B)，提示该产物为根皮素-C-双葡萄糖碳苷。

在以UDP葡萄糖为糖基供体时，OsjCGT3、OsiCGT6、BdCGT2、PhCGT3、ZmCGT2、ZmCGT3、SbCGT3、SiCGT3、SbCGT4也可以将底物2-羟基柚皮素(2-hydroxynaringenin)转化为其葡萄糖基化产物(图7B)。该产物经负离子模式高分辨质谱检测确认分子式为C₂₁H₂₂O₁₁，二级质谱显示出己糖碳苷特征性的[M-H-120]—碎片离子峰(图9)，提示该产物为2-羟基柚皮素-C-葡萄糖苷。

实施例2、黄酮碳苷类化合物夏佛塔苷等的合成

本实施例中，应用PhCGT1、OsiCGT4在大肠杆菌合成夏佛塔苷(schaftoside)及其异构体。

夏佛塔苷及其异构体的预测生物合成途径如图10所示。箭头TAL(或PAL)、4CL、CHS、CHI代表负责柚皮素生物合成的主要酶。箭头F2H是黄烷酮2-羟化酶(F2H)，其构成2-羟基黄烷酮的骨架。C-糖基转移酶(CGT)用箭头CGT表示。在形成C-糖基化中间体后，脱水反应在酸性溶剂中自发发生(箭头H⁺)。

1、质粒构建

(1)黄烷酮柚皮素(naringenin)合成前体基因的表达盒构建

将人工合成并经密码子优化的前体合成基因序列构建到pET28a载体上获得pET28-RtPAL，pET28-Pc4CL，pET28-PxhCHS和pET28a-MsCHI。其中，PxhCHS：GenBank登录号KF765781；MsCHI：GenBank登录号KF765782；Pc4CL：GenBank登录号KF765780；RtPAL：GenBank登录号AAA33883。

以pET28-Pc4CL为模板，4CL-F-NcoI/4CL-R-BamHI为引物对扩增Pc4CL片段，与NcoI/BamHI双酶切的pCDFDuet-1载体连接获得pYH40。

以pET28-PxhCHS为模板，CHS-F-NdeI/CHS-R-XhoI为引物对扩增PxhCHS片段，与NdeI/XhoI双酶切的pYH40连接获得pYH50。

以pET28-MsCHI为模板，T7CHI-F-XhoI/CHI-R-AvrII为引物对扩增McCHI片段，与XhoI/AvrII双酶切的pYH50连接，获得质粒pYH51。

以pET28-RtPAL为模板，T7PAL-F-BamHI/PAL-R-HindIII为引物对扩增RtPAL片段，与BamHI/HindIII双酶切的pYH51连接，获得质粒pYH55(图11)用于柚皮素(naringenin)合成的从头合成。PCR引物如表2所示。

表2、柚皮素合成前体基因的表达盒构建所使用的引物

引物	序列(5’→3’)
		4CL-F-NcoI	tataccatgggtgactgcgttgccccg(SEQ ID NO:31)
4CL-R-BamHI	cgggatccttacttcggcaggtcgccgctc(SEQ ID NO:32)
		T7PAL-F-BamHI	cgggatcccttatgcgactcctgcattag(SEQ ID NO:33)
PAL-R-HindIII	gcccaagcttttatgccagcatcttc(SEQ ID NO:34)
		CHS-F-NdeI	agatatacatatggttacggtggaagaatac(SEQ ID NO:35)
CHS-R-XhoI	ccgctcgagttaggtagccacactatgcag(SEQ ID NO:36)
		T7CHI-F-XhoI	ccgctcgagctagaaataattttgtttaac(SEQ ID NO:37)
CHI-R-AvrII	gagcctaggttagttaccgattttaaag(SEQ ID NO:38)

(2)黄烷酮-2-羟基化酶/CPR表达盒构建

以人工合成的黄烷酮-2-羟基化酶编码基因ZmCYP93G5(密码子优化)的克隆载体为模板，通过PCR扩增此P450基因。对此基因进行相应于其蛋白的N端改造，截去N端跨膜区域并加载助溶标签2B1(序列为MAKKTSSKGKLPPGPS)。

ZmCYP93G5：GenBank登录号XP_008660140.1，截去N端第1～29位残基，加载2B1，其编码基因以常规方法进行大肠杆菌偏好的密码子优化。

以拟南芥cDNA为模板，通过PCR扩增AtCPR2基因(GenBank登录号ABB88839.2，用于与P450组合，提供还原力)。

将改造后的P450基因使用引物对CZ201-F/R扩增，通过无缝克隆法插入pDuet-1载体多克隆位点1的NcoI和BamHI之间，AtCPR2使用引物对CPR-F/NotI-trCPR-R扩增后插入pDuet-1载体多克隆位点2的NdeI和XhoI位点之间，构成质粒pCZ201(图11)。PCR引物如表3所示。

表3、构建pCZ201、pCZ203和pCZ229所使用的引物

(3)CGT及UDP阿拉伯糖供给基因表达质粒构建

以籼稻基因组DNA为模板，通过PCR(引物见表1)扩增出阿拉伯糖基转移酶基因OsiCGT4。以毛竹基因组DNA为模板，通过PCR扩增出葡萄糖基转移酶基因PhCGT1(引物对为F：TGCCGCGCGGCAGCCATATGATGGGCCACCTGGTGC(SEQ ID NO:43)；R：TGGTGCTCGAGTGCGGCCGCCTAGTCCAACACTGCAAGATCCC(SEQ ID NO:44))。将扩增后片段纯化，并使用无缝克隆的方式连入相同NdeI/NotI消化过的pET28a载体，分别构成质粒pCZ86、pCZ163(图13)。以质粒pCZ163为模板，通过PCR的方式(引物见表4)扩增基因OsiCGT4。将扩增后片段纯化，并使用无缝克隆的方式连入NotI消化过的pCZ86载体，构建质粒pCZ191。

以中华根瘤菌基因组为模板，通过PCR(引物见表4)扩增出UDP木糖合酶基因SmUXS。将扩增后片段纯化，并使用无缝克隆的方式连入NotI消化过的pCZ191载体，构建质粒pCZ192。以中华根瘤菌基因组为模板，通过PCR(引物见表4)扩增出UDP木糖差向异构酶基因SmUXE。将扩增后片段纯化，并使用无缝克隆的方式连入NotI消化过的pCZ192载体，构建质粒pCZ193(图13)。

SmUXS序列(SEQ ID NO:13)：

MNYFRNDFRGTLFGTNEATDSLRRRSLQKRILVTGGAGFLGSHLCELLLGAGHEVICLDNFSTGLRRNIAPLKRFDTFRVIAHDVVEPIDLEVDEIYNLACPASPPHYQADPIQTTKTCVIGSLNLLDLAARRGARIFQASTSEIYGDPHVHPQVESYWGNVNPFGPRSCYDEGKRCAETLFFDFHKSHGVEIKIVRIFNTYGPRMRPDDGRVVSNFIVQALKGEDITIYGDGSQTRSFCFVEDLIDGFVRLMASPPSLTGPVNLGNPAEFTIGELAEEVIRLTGSRSKIVRRPLPVDDPRQRRPDISLATEELGWRPKVNLAEGLAHTIRYFDDLLSRSMRESAELV

SmUXE(SEQ ID NO:14)：

MVAPRILVTGGAGYIGSHTAKLLRLEGIEPVVYDNLTTGNRSAVRWGPFVQGDILDGRRLIEVIEAHQPDAVIHFAASAYVGESVADPAKYYNNNVRGTLSLLDACRQTGVDKVIFSSSCATYGVPAVLPIDEATPQAPINPYGKTKLVAEHMLADYAAAFALNYVSLRYFNACGADPEGDLGEWHDPETHLIPRALMAAAGRIPHLEIFGEDYDTPDGTCVRDYIHVADLASAHVLAYRHLAKGGGNVALNLGTGRGFSIKEVLRTIGEITGHDVPVVFRRRRAGDPPALYADAGLACRTLGFLPRYSDLETIVRTAAPFFGLEVRS

表4、构建pCZ191、pCZ192、pCZ193和pCZ194所使用的引物

2、用于夏佛塔苷合成的工程菌构建及发酵

将携带柚皮素合成基因的质粒pYH55，携带新型糖基转移酶PhCGT1、OsiCGT4以及UDP-阿拉伯糖合成基因SmUXS和SmUXE的质粒pCZ193与携带黄烷酮-2-羟基化酶/CPR表达盒的质粒pCZ201进行三质粒共转，转化至大肠杆菌BL21(DE3)中，获得从头发酵合成工程菌株sCZ114。

挑取上述工程菌株单克隆，接种于10mL MOPS培养基中(Spe(壮观霉素/奇霉素；spectinomycin)＝50μg/mL，Amp＝100μg/mL，Kan＝50μg/mL)，37℃培养OD₆₀₀＝0.5，降温至22℃，添加IPTG(终浓度100μM)，22℃，220rpm条件下进行发酵，持续5日。培养结束后收取样品，将菌液离心，获得上清液和菌体。菌体用水混悬，经破碎后用乙酸乙酯、正丁醇萃取；上清液用乙酸乙酯、正丁醇萃取，合并萃取液。将萃取液蒸发后用甲醇复溶，进行LC-MS分析。

发酵结果显示(图14)，经5日发酵后，发酵液中能够检测出夏佛塔苷，同时发酵液中能够检测出中间体牡荆素、异牡荆素。

因此，本发明通过异源表达中华根瘤菌来源的SmUXS和SmUXE基因在大肠杆菌构建了全新的UDP-阿拉伯糖的合成途径，并且碳苷糖基转移酶(PhCGT1、OsiCGT4)能够特异和高效地催化2-羟基黄烷酮(开环形式)类化合物(如2-羟基柚皮素)的碳苷葡萄糖基化及碳苷阿拉伯糖基化，从而产生一类碳苷-2-羟基黄烷酮类化合物(如2-羟基柚皮素-6-C-葡萄糖苷，2-羟基柚皮素-8-C-葡萄糖苷，2-羟基柚皮素-C-阿拉伯糖-C-葡萄糖苷)；这类化合物通过进一步的脱水反应形成黄酮碳苷(类)化合物(夏佛塔苷、牡荆素和异牡荆素等)。

实施例3、黄酮碳苷类化合物芹菜素-C-阿拉伯糖碳苷等的合成

本实施例中，应用OsiCGT6在大肠杆菌合成芹菜素-6-C-阿拉伯糖碳苷、芹菜素-8-C-阿拉伯糖碳苷、芹菜素-6,8-C-双阿拉伯糖碳苷。

芹菜素-6-C-阿拉伯糖碳苷、芹菜素-8-C-阿拉伯糖碳苷、芹菜素-6,8-C-双阿拉伯糖碳苷合成途径如图15所示。箭头PAL(或TAL)、4CL、CHS、CHI代表负责柚皮素生物合成的主要酶。箭头F2H是黄烷酮2-羟化酶(F2H)，其构成2-羟基黄烷酮的骨架。C-糖基转移酶(CGT)用箭头CGT表示。在形成C-糖基化中间体后，脱水反应在酸性溶剂中自发发生(箭头H⁺)。

1、质粒构建

(1)黄烷酮柚皮素(naringenin)合成前体基因的表达盒构建同实施例2。

(2)黄烷酮-2-羟基化酶/CPR表达盒构建同实施例2。

(3)CGT及UDP-阿拉伯糖供给基因表达质粒构建

以水稻基因组DNA为模板，通过PCR(引物见表1)扩增出阿拉伯糖基转移酶基因OsiCGT6。将扩增后片段纯化，并使用无缝克隆的方式连入相同NdeI/NotI消化过的pET28a载体，分别构成质粒pCZ165(图12)。以质粒pCZ193为模板，通过PCR(引物见表5)扩增出双基因SmUXS-SmUXE。将扩增后片段纯化，并使用无缝克隆的方式连入NotI消化过的pCZ165载体，构建出质粒pCZ194(图13)。

表5、构建pCZ194所使用的引物

2、用于芹菜素-C-阿拉伯糖碳苷、芹菜素-C-双阿拉伯糖碳苷合成的工程菌构建及发酵

将携带柚皮素合成基因的质粒pYH55，携带新型糖基转移酶OsiCGT6以及UDP-阿拉伯糖合成基因SmUXS和SmUXE的质粒pCZ194与携带黄烷酮-2-羟基化酶/CPR表达盒的质粒pCZ201进行三质粒共转，转化至大肠杆菌BL21(DE3)中，获得从头发酵合成工程菌株sCZ118。

挑取上述工程菌株单克隆，接种于10mL MOPS培养基中(Spe＝50μg/mL，Amp＝100μg/mL，Kan＝50μg/mL)，37℃培养OD₆₀₀＝0.5，降温至22℃，添加IPTG(终浓度100μM)，22℃，200rpm条件下进行发酵，持续5日。培养结束后收取样品，将菌液离心，获得上清液和菌体。菌体用水混悬，经破碎后用乙酸乙酯、正丁醇萃取；上清液用乙酸乙酯、正丁醇萃取，合并萃取液。将萃取液蒸发后用甲醇复溶，进行LC-MS分析。

发酵结果显示(图16)，经5日发酵后，发酵液中能够检测出芹菜素-C-阿拉伯糖碳苷、芹菜素-C-双阿拉伯糖苷。同时，在发酵液中能检测到中间体2-羟基柚皮素-C-阿拉伯糖苷和2-羟基柚皮素-C-阿拉伯糖苷的积累。

因此，本发明通过异源表达中华根瘤菌来源的SmUXS和SmUXE基因在大肠杆菌构建了全新的UDP-阿拉伯糖的合成途径，并且碳苷糖基转移酶(OsiCGT6)能够特异和高效地催化2-羟基黄烷酮(开环形式)类化合物(如2-羟基柚皮素)的碳苷单阿拉伯糖基化以及碳苷双阿拉伯糖基化，从而产生一类碳苷-2-羟基黄烷酮类化合物(如2-羟基柚皮素-阿拉伯糖苷、2-羟基柚皮素-双阿拉伯糖苷)；这类化合物通过进一步的脱水反应形成黄酮碳苷(类)化合物(单阿拉伯糖碳苷芹菜素、双阿拉伯糖碳苷芹菜素)。

在本发明提及的所有文献都在本申请中引用作为参考，就如同每一篇文献被单独引用作为参考那样。此外应理解，在阅读了本发明的上述讲授内容之后，本领域技术人员可以对本发明作各种改动或修改，这些等价形式同样落于本申请所附权利要求书所限定的范围。

序列表

<110> 中国科学院上海生命科学研究院

<120> 双功能碳苷糖基转移酶及其应用

<130> 19A754

<160> 52

<170> SIPOSequenceListing 1.0

<210> 1

<211> 473

<212> PRT

<213> 毛竹(Phyllostachys edulis)

<400> 1

Met Ala Pro Pro Ala Thr Leu Arg Ser Gly Glu Pro Asp Arg Asp Thr

1 5 10 15

Pro His Val Ile Phe Ile Pro Ser Ala Gly Met Gly His Leu Tyr Pro

20 25 30

Phe Phe Arg Phe Ile Ala Ala Leu Ser Ser Tyr Gly Val Asp Ile Ser

35 40 45

Val Val Thr Ile Leu Pro Thr Val Ser Ala Ala Glu Ala Asp His Phe

50 55 60

Ala Gly Leu Phe Ala Ala Phe Pro Ser Ile Arg Arg Ile Asp Phe His

65 70 75 80

Leu Leu Pro Leu Asp Thr Asn Glu Phe Pro Gly Ala Asp Pro Phe Phe

85 90 95

Leu Arg Trp Glu Glu Leu Arg Arg Ser Ala His Leu Leu Gly Pro Leu

100 105 110

Ile Ala Ser Ala Thr Pro Arg Val Ser Thr Ile Val Ser Asp Val Thr

115 120 125

Leu Ala Ser His Val Ile Pro Ile Ala Lys Glu Leu His Ile Pro Cys

130 135 140

His Val Leu Phe Ile Ser Cys Ala Thr Met Leu Ser Leu Asn Ala Tyr

145 150 155 160

Phe Pro Val Tyr Leu Asp Thr Lys Ala Gly Met Asp Gly Ile Gly Asp

165 170 175

Val Asp Ile Pro Gly Val Cys Arg Ile Pro Lys Ser Ser Leu Pro Gln

180 185 190

Ala Leu Leu Asp Leu Asn Lys Leu Phe Thr Lys Gln Phe Ile Glu Asn

195 200 205

Gly Arg Glu Ile Thr Lys Ala Asp Gly Ile Leu Val Asn Thr Phe Asp

210 215 220

Ala Leu Glu Pro Lys Ala Leu Ala Thr Leu Arg Asp Gly Thr Val Val

225 230 235 240

Thr Arg Phe Pro Pro Val Phe Ala Ile Gly Pro Leu Thr Ser His Ser

245 250 255

Pro Ala Ala Gly Glu Arg Val Asp Ala Gly Phe Pro Leu Ala Trp Leu

260 265 270

Ala Glu Gln Pro Thr Arg Ser Val Val Tyr Val Ala Phe Gly Asn Arg

275 280 285

Asn Ala Val Thr Leu Asp Gln Ile Arg Glu Ile Ala Val Gly Leu Glu

290 295 300

Ala Ser Gly Phe Arg Phe Leu Trp Val Leu Lys Thr Thr Val Val Asp

305 310 315 320

His Glu Asp Thr Ala Glu Leu Lys Asp Val Leu Gly Asp Gly Phe Leu

325 330 335

Glu Arg Val Lys Gly Arg Ser Leu Val Thr Lys Ala Trp Val Asp Gln

340 345 350

Glu Ala Ile Leu Lys His Pro Ala Val Gly Leu Tyr Leu Ser His Ser

355 360 365

Gly Trp Asn Ser Val Ala Glu Ala Ala Ala Tyr Gly Val Pro Met Leu

370 375 380

Ala Trp Pro Arg Gly Gly Asp His Arg Val Asn Ala Thr Val Val Val

385 390 395 400

Ser Gly Gly Val Gly Val Trp Met Glu His Trp Ser Trp Asp Gly Glu

405 410 415

Asp Arg Leu Val Ser Gly Lys Glu Ile Gly Asp Lys Val Lys Glu Val

420 425 430

Met Leu Asp Ala Ala Val Arg Ala Arg Ala Ala Lys Val Gly Glu Glu

435 440 445

Ala Asp Lys Ala Leu Thr Glu Gly Gly Ser Ser Tyr Arg Ser Met Gln

450 455 460

Gln Phe Val Ala Lys Leu Lys Asn Asn

465 470

<210> 2

<211> 474

<212> PRT

<213> 毛竹(Phyllostachys edulis)

<400> 2

Met Ala Pro Pro Glu Met Leu Ser Ser Gly Glu Gln Asp Arg Gly Ala

1 5 10 15

Pro His Val Val Phe Ile Pro Ser Ala Gly Met Gly His Leu Leu Pro

20 25 30

Phe Phe Arg Phe Ile Thr Ala Leu Ser Ser His Asp Val Asp Ile Ser

35 40 45

Val Val Thr Val Leu Pro Thr Val Thr Thr Ala Glu Ala Asp His Phe

50 55 60

Ala Ala Leu Phe Thr Ala Leu Pro Arg Ile Arg Arg Ile Asn Phe Asn

65 70 75 80

Leu Leu Pro Leu Asp Ala Ser Ala Phe Pro Gly Ala Asp Pro Phe Phe

85 90 95

Leu Arg Trp Glu Ser Leu Arg Arg Ser Ala His Leu Leu Gly Pro Leu

100 105 110

Leu Ala Gly Ala Thr Pro Ser Met Ser Ala Val Ile Thr Asp Val Thr

115 120 125

Leu Ala Ser Gln Val Ile Pro Ile Val Lys Asp Glu Leu His Leu Ser

130 135 140

Cys His Ile Leu Phe Pro Ser Ser Thr Thr Met Leu Ser Leu Cys Ala

145 150 155 160

Tyr Phe Pro Thr Tyr Leu Asp Gly Ala Asn Ala Asp His Val Val Ser

165 170 175

Asp Val Asp Val Pro Gly Val Arg Arg Phe Thr Lys Ala Thr Leu Pro

180 185 190

Gln Ala Leu His Asp Pro Asn Asn Leu Phe Thr Lys Gln Phe Val Ala

195 200 205

Asn Gly Arg Gly Phe Thr Lys Ala Asp Gly Phe Leu Leu Asn Thr Phe

210 215 220

Glu Ala Leu Glu Pro Glu Ala Ile Ala Ala Leu Arg Gly Gly Lys Val

225 230 235 240

Ile Pro Cys Phe Pro Pro Val Phe Thr Val Ala Pro Leu Lys Ser Met

245 250 255

Ile Pro Ala Asp Ser Glu Lys Val Gly Ala Gly Ser Pro Met Ala Trp

260 265 270

Leu Asp Glu Gln Pro Ala Arg Ser Val Val Tyr Val Ala Phe Gly Asn

275 280 285

Arg Cys Ala Val Thr Leu Asp Gln Ile Arg Glu Ile Ala Ala Gly Leu

290 295 300

Glu Thr Ser Ser Phe Arg Phe Leu Trp Val Leu Lys Thr Thr Val Val

305 310 315 320

Asp Arg Glu Asp Thr Val Glu Leu Lys Asp Val Leu Gly Asp Gly Phe

325 330 335

Leu Glu Arg Met Gln Gly Arg Gly Leu Val Thr Lys Ala Trp Val Asp

340 345 350

Gln Glu Ala Val Leu Asn His Pro Ala Val Gly Leu Phe Leu Ser His

355 360 365

Ser Gly Trp Asn Ser Val Val Glu Ala Ala Val Gly Gly Val Pro Leu

370 375 380

Leu Ala Trp Pro Arg Phe Gly Asp His Arg Val Asn Ala Thr Ala Met

385 390 395 400

Val Ser Gly Gly Val Gly Val Trp Met Glu His Trp Ser Trp Asp Gly

405 410 415

Glu Asp Arg Leu Val Ser Gly Glu Glu Ile Gly Glu Lys Val Lys Glu

420 425 430

Val Met Ala Asp Glu Thr Val Arg Ala Arg Val Ala Lys Val Arg Glu

435 440 445

Glu Ala Ala Lys Ala Val Ala Glu Gly Gly Ser Ser Tyr Arg Ser Met

450 455 460

Gln Glu Phe Val Ala Lys Leu Lys Ala Asn

465 470

<210> 3

<211> 481

<212> PRT

<213> 稻(Oryza sativa )

<400> 3

Met Ala Pro Pro Pro Ala Val Leu Ser Ser Gly Glu Leu Gly Ala Arg

1 5 10 15

Gly His Thr Arg Pro His Val Val Phe Val Pro Ser Ala Gly Met Gly

20 25 30

His Leu Leu Gln Phe Phe Arg Phe Ile Gly Ala Leu Ser Ala His Asp

35 40 45

Val Asp Ile Ser Val Val Thr Val Phe Pro Thr Val Ser Ala Ala Glu

50 55 60

Ala Asp His Phe Ala Ala Leu Phe Arg Asp Tyr Pro Ser Val Arg Arg

65 70 75 80

Leu Asp Phe Asp Leu Leu Pro Phe Asp Ala Ser Glu Phe Pro Gly Gly

85 90 95

Asp Pro Phe Leu Leu Arg Trp Glu Ala Leu Arg Arg Ser Leu His Leu

100 105 110

Leu Gly Pro Val Ile Ala Gly Val Thr Pro Arg Val Thr Ala Thr Val

115 120 125

Thr Asp Val Thr Leu Val Ser His Val Asn Pro Ile Ala Lys Asp Leu

130 135 140

Gly Val Gln Cys His Val Leu Tyr Val Ser Ser Ala Ala Met Met Ser

145 150 155 160

Leu Cys Ser Tyr Phe Pro Ile Tyr Leu Asp Asn Lys Asp Ala Gly Ala

165 170 175

Asp Val Gly Asp Val Asp Ile Pro Gly Val Arg Arg Leu Lys Arg Ser

180 185 190

Trp Leu Pro Gln Pro Leu Leu Asp Leu Asn Lys Leu Phe Thr Lys Gln

195 200 205

Phe Ile Glu Asn Gly Arg Glu Met Val Lys Thr Asp Gly Val Leu Ile

210 215 220

Asn Thr Phe Asp Ala Leu Glu Pro Val Ala Leu Ala Ala Leu Arg Asp

225 230 235 240

Gly Lys Val Val Arg Gly Phe Pro Pro Val Phe Ala Val Gly Pro His

245 250 255

Ser Ser Leu Ala Ser Glu Ala Thr Lys Gly Ala Ala Ala Asp Ala Glu

260 265 270

Gly Ser Pro Met Ala Trp Leu Arg Gln Gln Pro Ala Arg Ser Val Val

275 280 285

Tyr Val Ala Phe Gly Ser Arg Cys Ala Val Ser His Glu Gln Ile Arg

290 295 300

Glu Ile Ala Ala Gly Leu Glu Ala Ser Gly Ser Arg Phe Leu Trp Ile

305 310 315 320

Leu Lys Thr Thr Val Val Asp Arg Asp Asp Asp Ala Gly Ile Arg Asp

325 330 335

Val Leu Gly Asp Gly Phe Leu Glu Arg Val Arg Gly Arg Gly Val Val

340 345 350

Thr Lys Ala Trp Val Asp Gln Asp Ala Val Leu Arg Asp Pro Ala Val

355 360 365

Gly Leu Phe Leu Ser His Ser Gly Trp Asn Ser Val Ile Glu Ala Ala

370 375 380

Thr Ala Gly Val Pro Leu Leu Ala Trp Pro Arg Gly Gly Asp His Arg

385 390 395 400

Val Ala Ala Thr Val Val Ala Ser Ser Gly Val Gly Val Trp Met Glu

405 410 415

Gln Trp Ser Trp Asp Gly Glu Glu Trp Val Val Ser Gly Glu Glu Ile

420 425 430

Gly Gly Lys Val Lys Glu Met Met Ala Asp Ala Gly Val Arg Glu Lys

435 440 445

Ala Ala Lys Val Gly Glu Glu Val Ala Lys Ala Val Ala Val Gly Gly

450 455 460

Thr Ser His Thr Gly Ile Leu Asp Phe Val Ala Lys Leu Lys Ala Ala

465 470 475 480

Thr

<210> 4

<211> 476

<212> PRT

<213> 稻(Oryza sativa )

<400> 4

Met Ala Pro Pro Thr Val Leu Asn Ser Gly Glu Pro Asp Ser Arg Arg

1 5 10 15

Arg Ala Arg Pro His Val Val Phe Val Pro Ser Ala Gly Met Gly His

20 25 30

Leu Leu Pro Phe Phe Arg Phe Ile Gly Ala Leu Ser Ala His Asp Val

35 40 45

Asp Ile Ser Val Val Thr Val Leu Pro Thr Val Ser Ala Ala Glu Asn

50 55 60

Asp His Phe Ala Arg Leu Phe Gln Asp Phe Pro Ser Ile Arg Arg Val

65 70 75 80

Asp Phe Asn Leu Leu Pro Leu Asp Ala Ser Glu Phe Pro Gly Ala Asp

85 90 95

Pro Phe Leu Leu Arg Trp Glu Ala Leu Arg Arg Ser Met His Leu Leu

100 105 110

Ala Pro Ala Ile Ala Gly Val Ser Pro Arg Ala Thr Ala Val Val Thr

115 120 125

Asp Val Thr Leu Val Ser His Val Asn Ala Ile Ala Lys Asp Leu Gln

130 135 140

Leu Gln Cys His Val Leu Phe Ile Ser Ser Ala Thr Met Met Ser Phe

145 150 155 160

Leu Ser Tyr Phe Pro Ile Tyr Leu Asp Asn Lys Asp Ala Gln Ala Asp

165 170 175

Val Gly Asp Val Asp Ile Pro Gly Val Arg Arg Leu Lys Arg Ser Trp

180 185 190

Leu Pro Gln Pro Leu Leu Asp Leu Asp Lys Leu Phe Thr Lys Gln Phe

195 200 205

Ile Asp Asn Gly Arg Glu Val Val Lys Thr Asp Gly Val Leu Ile Asn

210 215 220

Thr Phe Asp Ala Leu Glu Pro Val Ala Leu Ala Ala Leu Arg Asp Gly

225 230 235 240

Lys Val Ile Arg Gly Phe Pro Ser Val Phe Ala Val Gly Pro Tyr Ser

245 250 255

Ser Leu Ala Ser Glu Thr Lys Ala Ala Asp Ala Glu Ser Ser Ala Leu

260 265 270

Ala Trp Leu Asn Gln Gln Pro Ala Arg Ser Val Val Tyr Val Ala Phe

275 280 285

Gly Asn Arg Tyr His Val Ser Asn Asp Gln Leu Arg Glu Ile Ala Ala

290 295 300

Gly Leu Glu Ala Ser Gly Cys Arg Phe Leu Trp Ile Val Lys Thr Thr

305 310 315 320

Ala Val Asp Arg Asp Glu Ala Ala Gly Val Arg Asp Val Leu Gly Asp

325 330 335

Gly Phe Val Asp Arg Val Arg Gly Arg Gly Met Val Thr Lys Ala Trp

340 345 350

Val Asp Gln Glu Ala Val Leu Gly His Pro Ala Val Gly Leu Phe Leu

355 360 365

Ser His Ser Gly Trp Asn Ser Val Thr Glu Ala Ala Ala Ala Gly Val

370 375 380

Pro Leu Leu Ala Trp Pro Arg Ala Gly Asp His Arg Val Ala Gly Thr

385 390 395 400

Val Val Ala Ser Ser Gly Val Gly Val Trp Met Glu Gln Trp Ser Trp

405 410 415

Asp Gly Glu Glu Trp Leu Val Ser Gly Gln Glu Ile Gly Gly Lys Val

420 425 430

Lys Glu Met Met Ala Asp Ala Gly Val Arg Glu Arg Ala Ala Lys Val

435 440 445

Gly Glu Leu Ala Ala Lys Ala Val Ala Glu Gly Gly Thr Ser Arg Thr

450 455 460

Ser Met Leu Glu Phe Val Ala Lys Leu Lys Ala Thr

465 470 475

<210> 5

<211> 476

<212> PRT

<213> 稻(Oryza sativa )

<400> 5

Met Pro Pro Pro Thr Val Leu Asn Ser Gly Glu Pro Asp Ser Arg Arg

1 5 10 15

Arg Ala Arg Pro His Val Val Phe Val Pro Ser Ala Gly Met Gly His

20 25 30

Leu Leu Pro Phe Phe Arg Phe Ile Gly Ala Leu Ser Ala His Asp Val

35 40 45

Asp Ile Ser Val Val Thr Val Leu Pro Thr Val Ser Ala Ala Glu Ala

50 55 60

Asp His Phe Ala Arg Leu Phe Gln Asp Phe Pro Ser Ile Arg Arg Val

65 70 75 80

Asp Phe Asn Leu Leu Pro Leu Asp Ala Ser Glu Phe Pro Gly Ala Asp

85 90 95

Pro Phe Leu Leu Arg Trp Glu Ala Leu Arg Arg Ser Met His Leu Leu

100 105 110

Ala Pro Ala Ile Ala Gly Val Arg Pro Arg Ala Thr Ala Val Val Thr

115 120 125

Asp Val Thr Leu Val Ser His Val Asn Pro Ile Ala Lys Asp Leu Arg

130 135 140

Leu Gln Cys His Val Leu Phe Ile Ser Ser Ala Thr Met Met Ser Leu

145 150 155 160

Cys Ser Tyr Phe Pro Ile Tyr Leu Asp Asn Lys Asp Ala Glu Ala Asp

165 170 175

Val Gly Asp Ile Asp Ile Pro Gly Val Arg Arg Leu Lys Arg Ser Trp

180 185 190

Leu Pro Gln Pro Leu Leu Asp Leu Asp Lys Leu Phe Thr Lys Gln Phe

195 200 205

Ile Asp Asn Gly Arg Glu Val Val Lys Thr Asp Gly Val Leu Ile Asn

210 215 220

Thr Phe Asp Ala Leu Glu Pro Val Ala Leu Ala Ala Leu Arg Asp Gly

225 230 235 240

Lys Val Ile Arg Gly Phe Pro Ser Val Phe Ala Val Gly Pro Tyr Ser

245 250 255

Ser Leu Ala Ser Glu Lys Lys Ala Ala Asp Ala Glu Ser Ser Ala Leu

260 265 270

Ala Trp Leu Asn Gln Gln Pro Ala Arg Ser Val Val Tyr Val Ala Phe

275 280 285

Gly Asn Arg Tyr His Val Ser Asn Asp Gln Leu Arg Glu Ile Ala Ala

290 295 300

Gly Leu Glu Ala Ser Gly Cys Arg Phe Leu Trp Ile Val Lys Thr Thr

305 310 315 320

Ala Val Asp Arg Asp Glu Ala Ala Gly Val Arg Asp Val Leu Gly Asp

325 330 335

Gly Phe Val Asp Arg Val Arg Gly Arg Gly Met Val Thr Lys Ala Trp

340 345 350

Val Asp Gln Glu Ala Val Leu Gly His Pro Ala Val Gly Leu Phe Leu

355 360 365

Ser His Ser Gly Trp Asn Ser Val Thr Glu Ala Ala Ala Ala Gly Val

370 375 380

Pro Leu Leu Ala Trp Pro Arg Ala Gly Asp His Arg Val Ala Gly Thr

385 390 395 400

Val Val Ala Ser Ser Gly Val Gly Val Trp Met Glu Gln Trp Ser Trp

405 410 415

Asp Gly Glu Glu Trp Leu Val Ser Gly Gln Glu Ile Gly Gly Lys Val

420 425 430

Lys Glu Met Met Ala Asp Ala Gly Val Arg Glu Arg Ala Ala Lys Val

435 440 445

Gly Glu Gln Ala Ala Lys Ala Val Ala Glu Gly Gly Thr Ser Arg Thr

450 455 460

Ser Met Leu Glu Phe Val Ala Lys Leu Lys Ala Ala

465 470 475

<210> 6

<211> 479

<212> PRT

<213> 稻(Oryza sativa )

<400> 6

Met Ala Pro Pro Thr Val Leu Asn Ser Gly Glu Pro Asp Ser Arg Arg

1 5 10 15

Arg Ala Arg Pro His Val Val Phe Val Pro Ser Ala Gly Met Gly His

20 25 30

Leu Leu Pro Phe Phe Arg Phe Ile Gly Ala Leu Ser Ala His Asp Val

35 40 45

Asp Ile Ser Val Val Thr Val Leu Pro Thr Val Ser Ala Ala Glu Ala

50 55 60

Asp His Phe Ala Arg Leu Phe Gln Asp Phe Pro Ser Ile Arg Arg Val

65 70 75 80

Asp Phe Asn Leu Leu Pro Leu Asp Ala Ser Glu Phe Pro Gly Ala Asp

85 90 95

Pro Phe Leu Leu Arg Trp Glu Ala Leu Arg Arg Ser Met His Leu Leu

100 105 110

Ala Pro Ala Ile Ala Gly Val Ser Pro Arg Ala Thr Ala Val Val Thr

115 120 125

Asp Val Thr Leu Val Ser His Val Asn Pro Ile Ala Lys Asp Leu Arg

130 135 140

Leu Gln Cys His Val Leu Phe Ile Ser Ser Ala Thr Met Met Ser Leu

145 150 155 160

Cys Ser Tyr Phe Pro Ile Tyr Leu Asp Asn Lys Asp Ala Glu Ala Asp

165 170 175

Val Gly Asp Ile Asp Ile Pro Gly Val Arg Arg Leu Lys Arg Ser Trp

180 185 190

Leu Pro Gln Pro Leu Leu Asp Leu Asp Lys Leu Phe Thr Lys Gln Phe

195 200 205

Ile Asp Asn Gly Arg Glu Val Val Lys Thr Asp Gly Val Leu Ile Asn

210 215 220

Thr Phe Asp Ala Leu Glu Pro Val Ala Leu Ala Ala Leu Arg Asp Gly

225 230 235 240

Lys Val Ile Arg Gly Phe Pro Pro Val Phe Ala Val Gly Pro Tyr Ser

245 250 255

Ser Leu Ala Ser Glu Lys Lys Ala Ala Asp Ala Asp Gln Ser Ser Ala

260 265 270

Leu Ala Trp Leu Asp Gln Gln Pro Ala Arg Ser Val Val Tyr Val Ala

275 280 285

Phe Gly Asn Arg Cys Thr Val Ser Asn Asp Gln Leu Arg Glu Ile Ala

290 295 300

Ala Gly Leu Glu Ala Ser Gly Cys Arg Phe Leu Trp Ile Leu Lys Thr

305 310 315 320

Thr Val Val Asp Arg Asp Glu Ala Ala Ala Gly Gly Val Arg Asp Val

325 330 335

Leu Gly Asp Gly Phe Met Glu Arg Val Lys Gly Arg Gly Met Val Thr

340 345 350

Lys Glu Trp Val Asp Gln Glu Ala Val Leu Gly His Pro Ala Val Gly

355 360 365

Leu Phe Leu Ser His Ser Gly Trp Asn Ser Val Thr Glu Ala Ala Ala

370 375 380

Ala Gly Val Pro Leu Leu Ala Trp Pro Arg Gly Gly Asp His Arg Val

385 390 395 400

Ala Ala Thr Val Val Ala Ser Ser Gly Val Gly Val Trp Met Glu Gln

405 410 415

Trp Ser Trp Asp Gly Glu Glu Trp Leu Val Ser Gly Glu Glu Ile Gly

420 425 430

Gly Lys Val Lys Glu Met Met Ala Asp Asp Ala Val Arg Glu Arg Ala

435 440 445

Ala Lys Val Gly Glu Glu Ala Ala Lys Ala Val Ala Glu Gly Gly Thr

450 455 460

Ser Arg Thr Ser Met Leu Glu Phe Val Ala Lys Leu Lys Ala Ala

465 470 475

<210> 7

<211> 487

<212> PRT

<213> 二穗短柄草(Brachypodium distachyon)

<400> 7

Met Ala Asp Leu Ala Ala Met Pro Asn Ser Gly Glu Gln Gln Gly Arg

1 5 10 15

Asp Ala Pro Ala Pro Pro His Leu Val Phe Val Pro Ser Ala Gly Met

20 25 30

Gly His Leu Leu Pro Phe Thr Arg Phe Ile Ala Asp Leu Ala Asn Glu

35 40 45

Asn Val Glu Ile Ser Val Val Thr Ala Leu Pro Thr Val Ser Ala Ala

50 55 60

Glu Ala Ala His Phe Ala Asp Leu Phe Ala Ala Phe Pro Arg Ile Arg

65 70 75 80

Arg Ile Asp Phe Asn Leu Leu Pro Phe Asp Glu Ser Ala Phe Pro Gly

85 90 95

Ala Asp Pro Phe Leu Leu Arg Trp Glu Ser Leu Arg Arg Ser Ala Gln

100 105 110

Leu Leu Gly Pro Leu Ile Ala Ala Ala Val Pro Arg Ala Ser Ala Val

115 120 125

Val Thr Asp Val Thr Leu Ala Ser Gln Val Ile Pro Ile Ala Lys Asp

130 135 140

Glu Leu Asn Leu Pro Cys His Ile Leu Phe Ile Ser Cys Ala Thr Met

145 150 155 160

Leu Ser Leu Val Ala Tyr Phe Pro Val Tyr Leu Asp Gly Ala Lys Ala

165 170 175

Asp His Leu Val Gly Asp Val Asp Ile Pro Gly Val Leu Arg Leu Pro

180 185 190

Val Ser Ser Pro Pro Gln Val Leu Arg Asn Pro Asp Ser Leu Phe Thr

195 200 205

Lys Gln Phe Ile Ala Asn Gly Arg Thr Ile Ala Lys Ser Asp Gly Ile

210 215 220

Leu Val Asn Thr Phe Arg Ala Leu Glu Pro Glu Ala Leu Ser Ala Leu

225 230 235 240

Asn Ser Gly Lys Val Val Pro Gly Phe Pro Pro Val Tyr Ala Val Gly

245 250 255

Pro Leu Lys Ser Ser Ile Thr Met Thr Thr Ser Thr Gly Ser Ser Asp

260 265 270

Lys Asp Glu Gly Ala Ala Ala Gly Gly Ser Pro Met Ala Trp Leu Gly

275 280 285

Glu Gln Pro Ala Gly Ser Val Val Tyr Val Ala Phe Gly Asn Arg His

290 295 300

Gly Val Ser Leu Glu Gln Ile Arg Glu Ile Ala Ala Gly Leu Glu Ala

305 310 315 320

Ser Gly Cys Gly Phe Leu Trp Val Leu Lys Thr Thr Val Val Asp Arg

325 330 335

Glu Asp Thr Ala Glu Leu Glu Asp Val Leu Gly Arg Gly Phe Leu Gly

340 345 350

Arg Val Thr Gly Arg Gly Leu Val Thr Lys Glu Trp Val Asp Gln Glu

355 360 365

Ala Val Leu Gln His Pro Ala Val Gly Leu Tyr Leu Ser His Ala Gly

370 375 380

Trp Asn Ser Val Thr Glu Ser Ala Ala Tyr Gly Val Pro Met Leu Val

385 390 395 400

Trp Pro Thr Ala Gly Asp Gln Arg Val Ile Ala Thr Val Val Ala Ser

405 410 415

Ala Gly Phe Gly Leu Trp Met Glu His Trp Asp Trp Glu Ser Leu Val

420 425 430

Ser Gly Ala Glu Ile Gly Glu Lys Val Lys Glu Val Met Gly Asn Glu

435 440 445

Gly Ile Lys Ala Arg Ala Ala Lys Val Ser Glu Glu Ala Ala Lys Ala

450 455 460

Val Ala Glu Gly Gly Ser Ser His Arg Ser Met Gln Glu Phe Leu Ala

465 470 475 480

Lys Leu Lys Pro Ser Thr Thr

485

<210> 8

<211> 482

<212> PRT

<213> 玉米(Zea mays)

<400> 8

Met Ala Pro Pro Pro Ala Met Gln Ser Pro Gly Glu Leu Asn Asp Gly

1 5 10 15

Ala Tyr Asp Ala Pro His Ile Leu Phe Ile Pro Ser Ala Gly Ile Gly

20 25 30

His Leu Thr Pro Val Phe Arg Val Ile Ala Gly Phe Ser Ser Arg Gly

35 40 45

Ile Asp Val Ser Val Val Thr Val Leu Pro Thr Val Ser Ala Ala Glu

50 55 60

Thr Asp Tyr Phe Asn Gly Leu Phe Ala Asp Tyr Pro Ala Val Arg Arg

65 70 75 80

Val Asp Met His Leu Leu Pro Leu Asp Ala Ser Glu Phe Thr Arg Glu

85 90 95

Asp Pro Phe Phe Leu Arg Trp Glu Ala Leu Arg Arg Ser Val His Leu

100 105 110

Leu Arg Pro Ile Ile Thr Asn Ala Ala Pro Arg Ile Thr Ala Ile Ile

115 120 125

Thr Asp Ile Thr Leu Thr Ser Cys Val Ile Pro Ile Ala Lys Glu Leu

130 135 140

Asp Val Pro Cys His Val Leu Phe Pro Thr Ala Ala Thr Met Leu Ser

145 150 155 160

Leu Asn Ala Tyr Tyr Pro Val Tyr Leu Glu Lys Leu Lys Gly Gly Pro

165 170 175

Glu Pro Gly Val Ile Gly Asp Ala Val Asp Ile Pro Gly Val Phe Arg

180 185 190

Val Pro Arg Ser Ala Leu Pro Pro Ala Leu Leu Asp Val Asn Lys Leu

195 200 205

Phe Thr Lys Gln Phe Ile Asp Asn Gly Arg Ala Ile Val Lys Ala Asp

210 215 220

Gly Val Leu Val Asn Thr Phe Asp Ala Val Glu Pro Ala Pro Leu Ala

225 230 235 240

Ala Leu Arg Gly Gly Lys Ile Val Pro Gly Tyr Pro Pro Val Tyr Thr

245 250 255

Ile Gly Pro Leu Lys Ser His Ala Thr Lys Ala Gly Asp Lys Pro Gly

260 265 270

Asp Ala Leu Leu Asp Glu Trp Leu Gly Lys Gln Arg Ala Arg Ser Val

275 280 285

Val Tyr Val Ala Phe Gly Asn Arg Ser Ala Ala Arg Leu Asp Gln Ile

290 295 300

Arg Glu Ile Ala Ala Gly Leu Glu Asp Ser Gly Tyr Pro Phe Leu Trp

305 310 315 320

Val Leu Lys Thr Thr Lys Val Asp Arg Glu Asp Asp Ala Glu Leu Ala

325 330 335

Glu Val Leu Gly Asp Gly Tyr Leu Glu Arg Val Lys Gly Arg Gly Ile

340 345 350

Val Thr Lys Gly Trp Val Glu Gln Glu Glu Leu Leu Lys His Pro Ala

355 360 365

Val Gly Met Phe Val Ser His Gly Gly Trp Asn Ser Ala Leu Glu Ala

370 375 380

Ser Ser Ala Gly Val Pro Leu Leu Val Trp Pro Gln Leu Gly Asp His

385 390 395 400

Arg Val Asn Ala Met Ala Ala Val Arg Ala Gly Ile Gly Ala Trp Ala

405 410 415

Glu His Trp Ser Trp Asp Gly Glu Asp Thr Leu Val Thr Arg Gln Glu

420 425 430

Ile Ala Asp Lys Val Lys Glu Val Met Ala Asp Gly Lys Leu Arg Ala

435 440 445

Ser Val Ala Val Ala Arg Glu Glu Ala Ala Lys Ala Val Ala Glu Gly

450 455 460

Gly Thr Ser Tyr Arg Asn Met His Asp Phe Ile Ala Lys Leu Lys Gly

465 470 475 480

Gly Ala

<210> 9

<211> 483

<212> PRT

<213> 玉米(Zea mays)

<400> 9

Met Ala Pro Pro Ala Thr Asn Ser Pro Gly Glu Val Asp Ser Gly Gly

1 5 10 15

Arg Pro His Val Met Phe Ile Pro Ser Ala Gly Met Gly His Leu Ile

20 25 30

Pro Phe Phe Arg Phe Ile Ala Ala Leu Ala Gly Gln Ser Val Asp Ile

35 40 45

Ser Val Val Thr Val Leu Pro Thr Val Ser Ala Ala Glu Glu Asp Tyr

50 55 60

Phe Thr Ser Leu Phe Ala Ala Leu Pro Arg Val Arg Arg Val Asp Leu

65 70 75 80

His Leu Leu Pro Phe Asp Ala Ser Lys Leu Pro Ser Asn Asp Arg Asp

85 90 95

Pro Phe Val Leu Arg Trp Glu Ala Leu Arg Arg Ser Ala His Leu Leu

100 105 110

Gly Pro Leu Ile Ala Gly Ala Ala Pro Arg Val Ser Ala Val Ile Thr

115 120 125

Asp Val Thr Leu Thr Ser His Val Ile Pro Ile Ala Lys Glu Leu Gly

130 135 140

Val Gln Cys His Val Leu Phe Pro Ser Ser Ala Thr Met Leu Ser Leu

145 150 155 160

Leu Ala Tyr Thr Pro Val His Ile Asp Lys Lys Ala Glu Gln Gly Ser

165 170 175

Asp Ile Gly Asp Val Asp Ile Pro Gly Val Cys Arg Ile Pro Gln Ser

180 185 190

Cys Leu Pro Gln Val Leu Leu His Leu Asp Lys Leu Phe Thr Lys Gln

195 200 205

Phe Ile Ala Asn Gly Arg Glu Ile Ile Asn Ala Asp Gly Phe Leu Val

210 215 220

Asn Thr Phe Asp Ala Leu Glu Pro Val Ala Leu Ala Ala Leu Arg Asp

225 230 235 240

Gly Lys Val Val Pro Gly Phe Pro Pro Val Tyr Ala Ile Gly Pro Leu

245 250 255

Met Ser Gln Gln Asn Ser Val Asp Glu Gly Gly Lys Glu Glu Gly Ser

260 265 270

Gly Ser Pro Val Ala Trp Leu Asp Glu Gln Pro Ala Arg Ser Val Val

275 280 285

Tyr Val Ala Phe Gly Asn Arg Cys Ala Val Ser His Asp Gln Ile Arg

290 295 300

Glu Ile Ala Ala Gly Leu Glu Ala Ser Asn Cys Arg Phe Leu Trp Val

305 310 315 320

Leu Lys Thr Thr Thr Val Asp Arg Asp Asp Ser Ala Val Leu Thr Glu

325 330 335

Leu Leu Gly Glu Glu Phe Leu Glu Arg Val Gln Gly Arg Gly Leu Val

340 345 350

Thr Lys Ala Trp Val Asp Gln Glu Ala Leu Leu Lys His Pro Ala Met

355 360 365

Gly Leu Phe Leu Ser His Ser Gly Trp Asn Ser Val Thr Glu Ala Ala

370 375 380

Ala Ala Ser Val Pro Leu Leu Ala Trp Pro Arg Gly Gly Asp His Arg

385 390 395 400

Val Asn Ala Met Val Thr Val Ser Gly Gly Val Gly Met Trp Met Glu

405 410 415

His Trp Ser Trp Asp Gly Glu Asp Trp Leu Val Thr Gly Val Glu Ile

420 425 430

Ala Lys Lys Val Lys Glu Val Met Ser Asp Glu Ala Val Arg Ala Arg

435 440 445

Thr Thr Arg Thr Ala Glu Glu Ala Ala Lys Ala Val Ala Glu Gly Gly

450 455 460

Thr Ser Tyr Arg Ser Met Glu Glu Phe Ile Ser Ser Val Lys Ala Thr

465 470 475 480

Val Ala Ser

<210> 10

<211> 467

<212> PRT

<213> 谷子(Setaria italica)

<400> 10

Met Lys Ser Pro Gly Glu Leu Gly Ser Gly Ala Arg Pro His Val Met

1 5 10 15

Phe Ile Pro Ser Ala Gly Met Gly His Leu Leu Pro Phe Leu Arg Val

20 25 30

Ile Ala Ala Leu Ala Arg His Asp Asp Val Asp Val Ser Val Val Thr

35 40 45

Val Leu Pro Thr Val Ser Ala Ala Glu Ala Asp His Leu Ala Gly Leu

50 55 60

Phe Ala Ala Phe Pro Arg Val Arg Arg Ala Asp Leu His Leu Leu Pro

65 70 75 80

Phe Asp Ala Ser Glu Phe Pro Gly His Asp Pro Phe Leu Leu Arg Trp

85 90 95

Glu Ala Leu Arg Arg Ser Ala His Leu Leu Arg Pro Leu Ile Ala Cys

100 105 110

Gly Ala Ala Pro Arg Val Ser Ala Ile Val Thr Asp Val Thr Leu Ala

115 120 125

Ser His Val Ile Pro Ile Ser Lys Glu Leu Asn Val Gln Cys His Val

130 135 140

His Phe Ile Ser Cys Ala Thr Met Leu Ser Leu Leu Ala Lys Ala Glu

145 150 155 160

Leu Gly Pro Gly Val Gly Asp Val Asp Ile Pro Gly Val Arg Arg Ile

165 170 175

Pro Glu Ser Tyr Leu Pro Gln Pro Leu Arg Asp Leu Asn Asn Val Phe

180 185 190

Thr Lys Gln Phe Ile Asp Asn Gly Arg Glu Ile Ile Asn Ala Asp Gly

195 200 205

Ile Leu Val Asn Thr Phe Asp Ala Leu Glu Pro Ala Ala Leu Ala Ala

210 215 220

Leu Arg Asp Gly Lys Val Val Pro Gly Phe Pro Pro Val Asn Ala Ile

225 230 235 240

Gly Pro Leu Asp Ser His Thr Ala Ser Thr Ala Asn Ala Lys Gln Ser

245 250 255

Glu Pro Ala Gly Ser Pro Val Ala Trp Leu Gly Glu Gln Pro Ala Arg

260 265 270

Ser Val Val Tyr Val Ala Phe Gly Asn Arg Ser Ala Val Ser Arg Asp

275 280 285

Gln Leu Arg Gln Ile Ala Ala Gly Leu Glu Ala Ser Gly Cys Arg Phe

290 295 300

Leu Trp Val Leu Lys Thr Thr Thr Val Asp Lys Asp Asp Asn Thr Glu

305 310 315 320

Val Glu Asp Val Leu Gly Cys Gly Phe Leu Glu Arg Val Arg Gly Arg

325 330 335

Gly Leu Val Thr Lys Ala Trp Val Asp Gln Glu Ala Leu Leu Lys His

340 345 350

Pro Ala Val Gly Leu Phe Leu Ser His Ser Gly Trp Asn Ser Val Val

355 360 365

Glu Ala Ala Ala Ala Gly Met Pro Leu Leu Ala Trp Pro Arg Gly Gly

370 375 380

Asp Gln Arg Val Asn Ala Met Val Val Ala Ser Gly Gly Phe Gly Val

385 390 395 400

Trp Met Glu His Trp Ser Trp Asp Gly Glu Asp Arg Leu Val Thr Gly

405 410 415

Glu Glu Ile Arg Glu Lys Val Lys Glu Val Met Ser Asp Ala Ala Val

420 425 430

Arg Val Arg Ala Met Lys Thr Gly Glu Glu Ala Ala Lys Ala Val Ala

435 440 445

Glu Gly Gly Thr Ser Tyr Arg Ser Met Gln Glu Phe Ile Gly Lys Leu

450 455 460

Arg Ala Thr

465

<210> 11

<211> 459

<212> PRT

<213> 高粱(Sorghum bicolor)

<400> 11

Met Ala Thr Pro Pro Ala Thr Lys Ser Leu Leu Gly Glu Leu Asn Gly

1 5 10 15

Gly Gly Ala Ser Arg Pro His Val Met Phe Ile Pro Ser Ala Gly Met

20 25 30

Gly His Leu Leu Pro Phe Phe Arg Phe Ile Ala Ser Leu Ala Arg His

35 40 45

Asp Asp Asp Val Asp Ile Ser Val Val Thr Val Leu Pro Thr Val Ser

50 55 60

Ala Ala Glu Ala Asp His Phe Ser Gly Leu Phe Ala Ala Phe Pro Arg

65 70 75 80

Val Arg Arg Val Asp Phe Pro Ser His Asp Arg Asp Pro Phe Ile Val

85 90 95

Arg Trp Glu Ala Leu Arg Arg Ser Ala His Leu Ile Gly Pro Leu Ile

100 105 110

Ala Gly Ala Ala Pro Arg Val Ser Ala Val Ile Thr Asp Val Thr Leu

115 120 125

Thr Ser His Val Ile Pro Ile Ala Lys Lys Leu Gly Val Gln Cys His

130 135 140

Val Leu Phe Ile Ser Cys Ala Thr Ile Lys Lys Ala Glu Gln Gly Pro

145 150 155 160

Gly Ala Gly Val Gly Ala Val Asp Ile Pro Gly Val Arg Arg Ile Pro

165 170 175

Glu Ser Cys Leu Pro Gln Pro Leu Leu Asp Leu Asn Lys Gln Phe Thr

180 185 190

Lys Gln Phe Ile Asp Asn Gly Arg Glu Asn Ile Asn Ala Asp Gly Ile

195 200 205

Leu Val Asn Thr Phe Asp Ala Leu Glu Pro Ala Ala Leu Ala Ala Leu

210 215 220

Arg Asp Gly Lys Val Val Pro Gly Phe Pro Phe Pro Pro Val Tyr Ala

225 230 235 240

Ile Gly Pro Leu Arg Ser Val Val Asp Lys Glu Asp Ser Ser Ser Ser

245 250 255

Ser Pro Val Val Ala Trp Leu Asp Lys Gln Pro Ala Arg Ser Val Val

260 265 270

Tyr Val Ala Phe Gly Asn Arg Ser Ala Val Ser His Ala His Ile Arg

275 280 285

Glu Ile Ala Ala Gly Leu Glu Ala Ser Gly Cys Arg Phe Leu Trp Val

290 295 300

Leu Lys Thr Thr Lys Val Asp Arg Asp Asp Thr Ala Glu Leu Thr Asp

305 310 315 320

Val Leu Gly Glu Gly Phe Leu Glu Arg Leu His Gln Gln Gln Gly Gln

325 330 335

Gly Gln Gly Gln His Gly Met Val Thr Lys Glu Trp Val Asp Gln Glu

340 345 350

Ala Leu Leu Lys His Ala Ser Val Gly Leu Tyr Leu Ser His Ser Gly

355 360 365

Trp Asn Ser Val Thr Glu Ala Ala Ala Ala Gly Val Pro Leu Leu Ala

370 375 380

Trp Pro Arg Gly Gly Asp His Arg Val Asn His Trp Ser Trp Asp Gly

385 390 395 400

Glu Asp Trp Leu Val Thr Gly Glu Glu Ile Ala Glu Lys Val Lys Glu

405 410 415

Val Met Ser Asp Ala Ala Val Arg Ala Arg Ala Thr Arg Thr Gly Glu

420 425 430

Glu Ala Ala Met Ala Val Ala Glu Gly Gly Thr Ser Tyr Arg Ser Met

435 440 445

Gln Gln Phe Val Ser Ser Leu Lys Lys Ala Thr

450 455

<210> 12

<211> 482

<212> PRT

<213> 高粱(Sorghum bicolor)

<400> 12

Met Ser Ser Pro Ala Leu Ser Thr Thr Ser Ser His Val Pro Arg Gly

1 5 10 15

Ala Pro His Val Val Leu Phe Pro Ser Ala Gly Met Gly His Leu Val

20 25 30

Pro Phe Thr Arg Leu Ala Val Ala Leu Ser Ala Gly His Gly Cys Asp

35 40 45

Ile Ser Leu Val Thr Ala Met Pro Thr Val Ser Ser Ala Glu Ser Arg

50 55 60

His Ile Ala Ala Leu Cys Ala Ala Phe Pro Ala Ile Arg Gln Leu Asp

65 70 75 80

Leu Asp Leu Arg Leu Ala Pro Phe Asp Ala Ser Ser Glu Phe Pro Gly

85 90 95

Ala Asp Pro Phe Tyr Val Arg Tyr Glu Ala Leu Arg Arg Ala Ala Pro

100 105 110

Val Leu Leu Gly Pro Leu Leu Ala Gly Ala Gly Ala Ser Ala Leu Val

115 120 125

Ala Asp Ile Ala Leu Ala Ser Val Ala Ile Pro Val Ala Arg Glu Leu

130 135 140

His Val Pro Cys Phe Val Phe Phe Thr Ala Ser Ala Thr Met Phe Ser

145 150 155 160

Leu Lys Ala Tyr Phe Pro Thr Tyr Leu Asp Ala Val Gly Ala Gly His

165 170 175

Gly Val Gly Asp Val Asp Val Pro Gly Val Tyr Arg Ile Pro Ser Ser

180 185 190

Ser Val Pro Gln Ala Leu His Asp Pro Asp Asn Ile Phe Thr Arg Gln

195 200 205

Phe Val Ala Asn Gly Arg Ala Leu Val Thr Ala Asp Gly Leu Leu Val

210 215 220

Asn Ala Phe His Ala Met Glu Pro Glu Ala Val Glu Ala Leu Arg Gly

225 230 235 240

Gly Ser Val Val Pro Gly Leu Pro Pro Val Phe Ala Val Gly Pro Leu

245 250 255

Met Pro Val Ser Glu Leu Arg Glu Thr Gly Glu Ala Glu Gln Glu Gln

260 265 270

Gly Asn Cys Tyr Arg Glu Trp Leu Asp Glu Gln Pro Pro Arg Ser Val

275 280 285

Val Tyr Val Ser Phe Gly Ser Arg Lys Ala Leu Pro Lys Asp Gln Met

290 295 300

Asn Glu Leu Ala Ala Gly Leu Glu Ala Cys Gly His Arg Phe Leu Trp

305 310 315 320

Val Val Lys Gly Ala Val Val Asp Arg Asp Asp Ala Gly Glu Leu Ser

325 330 335

Asp Leu Leu Gly Glu Gly Phe Leu Arg Arg Val Gln Gly Gln Gly Arg

340 345 350

Gly Leu Val Thr Lys Ser Trp Val Glu Gln Glu Glu Val Leu Arg His

355 360 365

Pro Ala Val Ala Leu Phe Val Ser His Cys Gly Trp Asn Ser Val Thr

370 375 380

Glu Ala Ala Ser Gly Gly Val Pro Val Leu Ala Trp Pro Arg Phe Ala

385 390 395 400

Asp Gln Arg Val Asn Ala Arg Val Val Ala Arg Ala Gly Leu Gly Val

405 410 415

Trp Ala Glu Gln Trp Ser Trp Glu Gly Glu Glu Ala Val Val Arg Ala

420 425 430

Glu Glu Ile Ala Glu Leu Val Met Glu Ala Met Gly Asp Asp Ala Met

435 440 445

Ala Glu Lys Ala Ala Asn Val Arg Glu Ala Ala Ser Arg Ala Val Ala

450 455 460

Asp Gly Gly Thr Ser Tyr Gln Ser Leu Ala Ala Phe Val Arg Arg Cys

465 470 475 480

Thr Ala

<210> 13

<211> 348

<212> PRT

<213> 中华根瘤菌(Sinorhizobium sp.)

<400> 13

Met Asn Tyr Phe Arg Asn Asp Phe Arg Gly Thr Leu Phe Gly Thr Asn

1 5 10 15

Glu Ala Thr Asp Ser Leu Arg Arg Arg Ser Leu Gln Lys Arg Ile Leu

20 25 30

Val Thr Gly Gly Ala Gly Phe Leu Gly Ser His Leu Cys Glu Leu Leu

35 40 45

Leu Gly Ala Gly His Glu Val Ile Cys Leu Asp Asn Phe Ser Thr Gly

50 55 60

Leu Arg Arg Asn Ile Ala Pro Leu Lys Arg Phe Asp Thr Phe Arg Val

65 70 75 80

Ile Ala His Asp Val Val Glu Pro Ile Asp Leu Glu Val Asp Glu Ile

85 90 95

Tyr Asn Leu Ala Cys Pro Ala Ser Pro Pro His Tyr Gln Ala Asp Pro

100 105 110

Ile Gln Thr Thr Lys Thr Cys Val Ile Gly Ser Leu Asn Leu Leu Asp

115 120 125

Leu Ala Ala Arg Arg Gly Ala Arg Ile Phe Gln Ala Ser Thr Ser Glu

130 135 140

Ile Tyr Gly Asp Pro His Val His Pro Gln Val Glu Ser Tyr Trp Gly

145 150 155 160

Asn Val Asn Pro Phe Gly Pro Arg Ser Cys Tyr Asp Glu Gly Lys Arg

165 170 175

Cys Ala Glu Thr Leu Phe Phe Asp Phe His Lys Ser His Gly Val Glu

180 185 190

Ile Lys Ile Val Arg Ile Phe Asn Thr Tyr Gly Pro Arg Met Arg Pro

195 200 205

Asp Asp Gly Arg Val Val Ser Asn Phe Ile Val Gln Ala Leu Lys Gly

210 215 220

Glu Asp Ile Thr Ile Tyr Gly Asp Gly Ser Gln Thr Arg Ser Phe Cys

225 230 235 240

Phe Val Glu Asp Leu Ile Asp Gly Phe Val Arg Leu Met Ala Ser Pro

245 250 255

Pro Ser Leu Thr Gly Pro Val Asn Leu Gly Asn Pro Ala Glu Phe Thr

260 265 270

Ile Gly Glu Leu Ala Glu Glu Val Ile Arg Leu Thr Gly Ser Arg Ser

275 280 285

Lys Ile Val Arg Arg Pro Leu Pro Val Asp Asp Pro Arg Gln Arg Arg

290 295 300

Pro Asp Ile Ser Leu Ala Thr Glu Glu Leu Gly Trp Arg Pro Lys Val

305 310 315 320

Asn Leu Ala Glu Gly Leu Ala His Thr Ile Arg Tyr Phe Asp Asp Leu

325 330 335

Leu Ser Arg Ser Met Arg Glu Ser Ala Glu Leu Val

340 345

<210> 14

<211> 328

<212> PRT

<213> 中华根瘤菌(Sinorhizobium sp.)

<400> 14

Met Val Ala Pro Arg Ile Leu Val Thr Gly Gly Ala Gly Tyr Ile Gly

1 5 10 15

Ser His Thr Ala Lys Leu Leu Arg Leu Glu Gly Ile Glu Pro Val Val

20 25 30

Tyr Asp Asn Leu Thr Thr Gly Asn Arg Ser Ala Val Arg Trp Gly Pro

35 40 45

Phe Val Gln Gly Asp Ile Leu Asp Gly Arg Arg Leu Ile Glu Val Ile

50 55 60

Glu Ala His Gln Pro Asp Ala Val Ile His Phe Ala Ala Ser Ala Tyr

65 70 75 80

Val Gly Glu Ser Val Ala Asp Pro Ala Lys Tyr Tyr Asn Asn Asn Val

85 90 95

Arg Gly Thr Leu Ser Leu Leu Asp Ala Cys Arg Gln Thr Gly Val Asp

100 105 110

Lys Val Ile Phe Ser Ser Ser Cys Ala Thr Tyr Gly Val Pro Ala Val

115 120 125

Leu Pro Ile Asp Glu Ala Thr Pro Gln Ala Pro Ile Asn Pro Tyr Gly

130 135 140

Lys Thr Lys Leu Val Ala Glu His Met Leu Ala Asp Tyr Ala Ala Ala

145 150 155 160

Phe Ala Leu Asn Tyr Val Ser Leu Arg Tyr Phe Asn Ala Cys Gly Ala

165 170 175

Asp Pro Glu Gly Asp Leu Gly Glu Trp His Asp Pro Glu Thr His Leu

180 185 190

Ile Pro Arg Ala Leu Met Ala Ala Ala Gly Arg Ile Pro His Leu Glu

195 200 205

Ile Phe Gly Glu Asp Tyr Asp Thr Pro Asp Gly Thr Cys Val Arg Asp

210 215 220

Tyr Ile His Val Ala Asp Leu Ala Ser Ala His Val Leu Ala Tyr Arg

225 230 235 240

His Leu Ala Lys Gly Gly Gly Asn Val Ala Leu Asn Leu Gly Thr Gly

245 250 255

Arg Gly Phe Ser Ile Lys Glu Val Leu Arg Thr Ile Gly Glu Ile Thr

260 265 270

Gly His Asp Val Pro Val Val Phe Arg Arg Arg Arg Ala Gly Asp Pro

275 280 285

Pro Ala Leu Tyr Ala Asp Ala Gly Leu Ala Cys Arg Thr Leu Gly Phe

290 295 300

Leu Pro Arg Tyr Ser Asp Leu Glu Thr Ile Val Arg Thr Ala Ala Pro

305 310 315 320

Phe Phe Gly Leu Glu Val Arg Ser

325

<210> 15

<211> 34

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 15

tgccgcgcgg cagccatatg atggctccgc cggc 34

<210> 16

<211> 51

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 16

tggtgctcga gtgcggccgc ttaattattc ttgagcttgg caacaaactg c 51

<210> 17

<211> 39

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 17

tgccgcgcgg cagccatatg atggccccac ctgaaatgc 39

<210> 18

<211> 46

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 18

tggtgctcga gtgcggccgc ttaattagcc ttgagcttgg caacaa 46

<210> 19

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 19

tgccgcgcgg cagccatatg atggcaccgc caacgg 36

<210> 20

<211> 45

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 20

tggtgctcga gtgcggccgc ttaagtggcc ttgagctttg caaca 45

<210> 21

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 21

tgccgcgcgg cagccatatg atggcaccgc caacgg 36

<210> 22

<211> 45

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 22

tggtgctcga gtgcggccgc ttaagcagcc ttgagctttg caaca 45

<210> 23

<211> 38

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 23

tgccgcgcgg cagccatatg atggctgatc tggcggcg 38

<210> 24

<211> 48

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 24

tggtgctcga gtgcggccgc ttaggtagta ctaggcttga gcttggcg 48

<210> 25

<211> 34

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 25

tgccgcgcgg cagccatatg atggctccgc cgcc 34

<210> 26

<211> 44

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 26

tggtgctcga gtgcggccgc tcaagctcct cccttaagct tggc 44

<210> 27

<211> 33

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 27

tgccgcgcgg cagccatatg atggccccgc cgg 33

<210> 28

<211> 39

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 28

tggtgctcga gtgcggccgc tcaagacgcc acggttgct 39

<210> 29

<211> 34

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 29

tgccgcgcgg cagccatatg atggcaccgc cggc 34

<210> 30

<211> 37

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 30

tggtgctcga gtgcggccgc tcaagggctg cagtgcg 37

<210> 31

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 31

tataccatgg gtgactgcgt tgccccg 27

<210> 32

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 32

cgggatcctt acttcggcag gtcgccgctc 30

<210> 33

<211> 29

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 33

cgggatccct tatgcgactc ctgcattag 29

<210> 34

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 34

gcccaagctt ttatgccagc atcttc 26

<210> 35

<211> 31

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 35

agatatacat atggttacgg tggaagaata c 31

<210> 36

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 36

ccgctcgagt taggtagcca cactatgcag 30

<210> 37

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 37

ccgctcgagc tagaaataat tttgtttaac 30

<210> 38

<211> 28

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 38

gagcctaggt tagttaccga ttttaaag 28

<210> 39

<211> 40

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 39

agctcccacc aggacctagc atgagcacct ggtccaaccg 40

<210> 40

<211> 43

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 40

gagctcgaat tcggatccac tagtttaggt cgccgcacgc gcc 43

<210> 41

<211> 31

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 41

tatacatatg tcctcttctt cttcttcgtc a 31

<210> 42

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 42

aattgcggcc gcttaccata catctctaag at 32

<210> 43

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 43

tgccgcgcgg cagccatatg atgggccacc tggtgc 36

<210> 44

<211> 43

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 44

tggtgctcga gtgcggccgc ctagtccaac actgcaagat ccc 43

<210> 45

<211> 52

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 45

atcttgcagt gttggactag tttgtttaac tttaagaagg agatatacca tg 52

<210> 46

<211> 59

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 46

gtggtggtgg tgctcgagta agcttgcggg atccgccgct taagtggcct tgagctttt 59

<210> 47

<211> 55

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 47

ttaactttaa gaaggagata tacatatgaa ttattttaga aatgacttca gggga 55

<210> 48

<211> 52

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 48

gtggtggtgg tgctcgagta agcttgcggg atcctcagac cagctccgca ct 52

<210> 49

<211> 47

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 49

tcgtcagtca ggatctgtga gcggcaataa ttttgtttaa ctttaag 47

<210> 50

<211> 59

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 50

tggtggtgct cgagtgcggc agggatcctc atgctagccg ctcatgaccg gacctccag 59

<210> 51

<211> 86

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 51

caaagctcaa ggctgcttag cggcaataat tttgtttaac tttaagaagg agatatacat 60

atgaattatt ttagaaatga cttcag 86

<210> 52

<211> 59

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 52

ggtggtgctc gagtgcggca gggatcctca tgctagccgc tcatgaccgg acctccagc 59

Claims

1.一种催化二氢查尔酮化合物或2-羟基黄烷酮化合物生成碳苷二氢查尔酮化合物或碳苷-2-羟基黄烷酮化合物的方法，其特征在于，所述方法包括：以糖基转移酶进行所述催化；所述的糖基转移酶为SEQ ID NO: 6所示的多肽；

所述的二氢查尔酮化合物具有式(I)的母核结构、2-羟基黄烷酮化合物具有式(II)的母核结构，所述碳苷二氢查尔酮化合物具有式(III)的母核结构，所述碳苷-2-羟基黄烷酮化合物具有式(IV)的母核结构：

(I)； (II)；

(III)； (IV)；

其中，R为糖基，其与A环以碳碳键连接；所述二氢查尔酮化合物或2-羟基黄烷酮化合物为根皮素或2-羟基柚皮素；所述碳苷二氢查尔酮化合物或碳苷-2-羟基黄烷酮化合物选自：根皮素-C-阿拉伯糖苷，2-羟基柚皮素-C-阿拉伯糖苷，根皮素-C-双阿拉伯糖苷，2-羟基柚皮素-C-双阿拉伯糖苷，2-羟基柚皮素-C-葡萄糖苷，根皮素-C-双葡萄糖碳苷或2-羟基柚皮素-C-阿拉伯糖-C-葡萄糖苷；

在利用所述糖基转移酶进行糖基转移时，以携带阿拉伯糖基团或葡萄糖基团的化合物作为供体。

2.如权利要求1所述的方法，其特征在于，以UDP阿拉伯糖或UDP葡萄糖作为糖基供体。

3.糖基转移酶的用途，用于催化二氢查尔酮化合物或2-羟基黄烷酮化合物生成碳苷二氢查尔酮化合物或碳苷-2-羟基黄烷酮化合物；其中，所述的糖基转移酶为SEQ ID NO: 6所示的多肽；

所述二氢查尔酮化合物具有式(I)的母核结构、所述2-羟基黄烷酮化合物具有式(II)的母核结构，所述碳苷二氢查尔酮化合物具有式(III)的母核结构，碳苷-2-羟基黄烷酮化合物具有式(IV)的母核结构：

(I)； (II)；

(III)； (IV)；

4.如权利要求3所述的用途，其特征在于，以UDP阿拉伯糖、UDP葡萄糖作为糖基供体。

5.一种合成黄酮碳苷化合物的方法，其特征在于，包括：

(1) 将2-羟基黄烷酮化合物以糖基转移酶催化，产生碳苷-2-羟基黄烷酮化合物；其中，所述的糖基转移酶为SEQ ID NO: 6所示的多肽；

(2) 将(1)的碳苷-2-羟基黄烷酮化合物脱水，获得黄酮碳苷化合物；

其中，所述2-羟基黄烷酮化合物具有式(II)的母核结构，所述碳苷-2-羟基黄烷酮化合物具有式(IV)的母核结构：

(II)； (IV)；

其中，R为糖基，其与A环以碳碳键连接；所述2-羟基黄烷酮化合物为2-羟基柚皮素；所述碳苷-2-羟基黄烷酮化合物选自：2-羟基柚皮素-C-双阿拉伯糖苷，2-羟基柚皮素-C-葡萄糖苷或2-羟基柚皮素-C-阿拉伯糖-C-葡萄糖苷；所述的黄酮碳苷化合物选自：芹菜素-6-C-阿拉伯糖苷，芹菜素-8-C-阿拉伯糖苷或芹菜素-6,8-C-双阿拉伯糖苷。

6.如权利要求5所述的方法，其特征在于，在(1)之前，还包括：(c)将黄烷酮化合物通过黄烷酮-2-羟化酶催化，获得2-羟基黄烷酮化合物。

7.如权利要求6所述的方法，其特征在于，在(c)之前，还包括：(b)将丙二酰-CoA结构类似物与p-香豆酰-CoA结构类似物经查尔酮合成酶和查尔酮异构酶催化，获得黄烷酮化合物。

8.如权利要求7所述的方法，其特征在于，在(b)之前，还包括：(a)将芳香族氨基酸经酪氨酸解氨酶或苯丙氨酸解氨酶和4-香豆酰-CoA连接酶催化，获得p-香豆酰-CoA或其结构类似物。

9.如权利要求8所述的方法，其特征在于，所述的黄烷酮化合物为柚皮素；

所述的丙二酰-CoA结构类似物包括：丙二酰-CoA；甲基丙二酰-CoA；

所述的p-香豆酰-CoA结构类似物包括：p-香豆酰-CoA；p-肉桂酰-CoA；或

所述的芳香族氨基酸包括：l-酪氨酸或l-苯丙氨酸。

10.如权利要求5～8任一所述的方法，其特征在于，所述2-羟基柚皮素是从柚皮素通过黄烷酮-2-羟化酶催化获得。

11.一种生物合成黄酮碳苷化合物的方法，其特征在于，包括：

(i) 将合成黄烷酮化合物的前体基因、编码黄烷酮-2-羟化酶和/或黄烷酮-3’-羟化酶的基因以及编码糖基转移酶的基因共转入宿主细胞中；其中，所述的糖基转移酶选自SEQID NO: 6所示的多肽；所述合成黄烷酮化合物的前体基因包括PAL、4CL、CHS、CHI基因；

(ii) 培养(i)的细胞，从而合成黄酮碳苷化合物；

所述的黄酮碳苷化合物选自：芹菜素-6-C-阿拉伯糖苷，芹菜素-8-C-阿拉伯糖苷或芹菜素-6,8-C-双阿拉伯糖苷；还在宿主细胞中转入合成糖基供体的基因，所述糖基包括阿拉伯糖或葡萄糖；所述糖基供体为携带阿拉伯糖基团或葡萄糖基团的化合物。

12.如权利要求11所述的方法，其特征在于，所述的黄烷酮-2-羟化酶和黄烷酮-3’-羟化酶为截去N端跨膜区域的P450氧化酶，在截去N端跨膜区域后，还包括添加标签；所述标签包括：2B1，17α或MBP。

13.如权利要求11所述的方法，其特征在于，所述糖基供体包括UDP阿拉伯糖或UDP葡萄糖。

14.一种生物合成黄酮碳苷化合物的遗传工程化的细胞，其特征在于，其中包括：合成黄烷酮化合物的前体基因、编码黄烷酮-2-羟化酶和/或黄烷酮-3’-羟化酶的基因以及编码糖基转移酶的基因；其中，所述的糖基转移酶为SEQ ID NO: 6所示的多肽；所述合成黄烷酮化合物的前体基因包括PAL、4CL、CHS、CHI基因；所述细胞不能繁殖为植物；所述的黄烷酮-2-羟化酶和黄烷酮-3’-羟化酶为截去N端跨膜区域的P450氧化酶，在截去N端跨膜区域后，还包括添加标签；所述标签包括：2B1，17α或MBP；所述的黄酮碳苷化合物选自：芹菜素-6-C-阿拉伯糖苷，芹菜素-8-C-阿拉伯糖苷或芹菜素-6,8-C-双阿拉伯糖苷；所述的细胞为大肠杆菌；所述的细胞中还包括合成糖基供体的基因。

15.制备权利要求14的细胞的方法，其特征在于，包括：将合成黄烷酮化合物的前体基因、编码黄烷酮-2-羟化酶和/或黄烷酮-3’-羟化酶的基因、编码糖基转移酶的基因共转入宿主细胞中；其中，所述的糖基转移酶为SEQ ID NO: 16所示的多肽；还将合成糖基供体的基因转入宿主细胞中；所述的黄烷酮-2-羟化酶和黄烷酮-3’-羟化酶为截去N端跨膜区域的P450氧化酶，在截去N端跨膜区域后，还包括添加标签；所述标签包括：2B1，17α或MBP；所述的黄酮碳苷化合物选自：芹菜素-6-C-阿拉伯糖苷，芹菜素-8-C-阿拉伯糖苷或芹菜素-6,8-C-双阿拉伯糖苷。

16.一种用于合成黄酮碳苷化合物或其中间体的试剂盒，其中包括权利要求14所述的遗传工程化的细胞。