CN113136373A

CN113136373A - 新型碳苷糖基转移酶及其应用

Info

Publication number: CN113136373A
Application number: CN202010066924.7A
Authority: CN
Inventors: 王勇; 孙雨伟; 陈卓; 张前; 张英; 刘海利; 李建华
Original assignee: Center for Excellence in Molecular Plant Sciences of CAS
Current assignee: Center for Excellence in Molecular Plant Sciences of CAS
Priority date: 2020-01-20
Filing date: 2020-01-20
Publication date: 2021-07-20
Anticipated expiration: 2040-01-20
Also published as: US20230066984A1; EP4095145A4; CN113136373B; WO2021147575A1; EP4095145A1

Abstract

本发明提供了一组新型的尿苷二磷酸(UDP)‑糖基转移酶，其是碳苷糖基转移酶。所述的糖基转移酶能够特异和高效地催化二氢查尔酮(类)化合物或2‑羟基黄烷酮(类)化合物的碳苷葡萄糖基化，从而产生一类碳苷二氢查尔酮(类)化合物或碳苷‑2‑羟基黄烷酮(类)化合物；碳苷‑2‑羟基黄烷酮(类)化合物通过进一步的脱水反应形成黄酮碳苷(类)化合物。本发明还涉及将这些新型UDP糖基转移酶应用于人工构建的重组表达系统，通过发酵工程生产碳苷二氢查尔酮(类)化合物或黄酮碳苷(类)化合物。

Description

新型碳苷糖基转移酶及其应用

技术领域

本发明属于合成生物学领域，更具体地，本发明涉及新型碳苷糖基转移酶及其应用。

背景技术

黄酮化合物是以C₆-C₃-C₆为结构母核的一类多酚羟基类化合物，根据母核结构及官能基取代的不同，可以分为黄酮、黄酮醇、黄烷酮、花青素、查尔酮等。黄酮类化合物在于植物体内常以糖苷的形式存在，这样的糖基化修饰主要由尿苷二磷酸(UDP)-糖基转移酶(UGT)催化发生。糖基与苷元母核直接以C-C键的方式连接的黄酮苷类化合物被称为黄酮碳苷。

黄酮碳苷(类)化合物具有多种多样的药理活性，根据报道，黄酮碳苷(类)化合物具有显著的抗氧化作用，可以显著性抑制外源性以及内源性自由基；同时，其具有一定程度抑制细菌病毒的作用；黄酮碳苷(类)化合物可以显著性地降低血液中总胆固醇的含量，具有治疗心脑血管疾病的药物活性；同时黄酮碳苷(类)化合物具有显著性抗辐射以及神经保护的作用；有调查表明黄酮碳苷(类)化合物具有相关抗代谢疾病的作用，对于糖尿病、肥胖等疾病均具有一定的治疗效果。

但是，黄酮碳苷(类)化合物相对于氧苷类化合物而言是更为稀有的，迄今为止从自然界中分离到的黄酮碳苷仅有几十种。并且，本领域中目前基本上只能通过从自然界分离黄酮碳苷(类)化合物，大规模低成本的生物合成或人工合成等方面的生产工艺均需要进一步研究和开发。

发明内容

本发明的目的在于提供新型碳苷糖基转移酶及其应用。

在本发明的第一方面，提供一种催化二氢查尔酮(类)化合物或2-羟基黄烷酮(类)化合物生成碳苷二氢查尔酮(类)化合物或碳苷-2-羟基黄烷酮(类)化合物的方法，包括：以糖基转移酶进行所述催化；所述的糖基转移酶为选自SEQ ID NO:1～20任一所述的多肽或其保守性序列变体。

在一个优选例中，所述二氢查尔酮(类)化合物具有式(I)的母核结构，所述2-羟基黄烷酮(类)化合物(较佳地为开环形式)具有式(II)的母核结构，所述碳苷二氢查尔酮(类)化合物具有式(III)的母核结构，或所述碳苷-2-羟基黄烷酮(类)化合物(较佳地为开环形式)具有式(IV)的母核结构：

其中，R为糖基，其与A环以碳碳键连接。

在另一优选例中，A环或B环中，存在1～3个羟基；较佳地，A环中，羟基存在于第2’、4’和/或6’位；较佳地，B环中，羟基出现在第4位。

在另一优选例中，R在A环上的数量为1个，较佳地其存在于第3’位。

在另一优选例中，R在A环上的数量为2个，较佳地其存在于第3’和5’位；且，所述的糖基转移酶为选自SEQ ID NO:6，8，10，17，19或20所述的多肽或其保守性序列变体。

在另一优选例中，所述的二氢查尔酮(类)化合物或2-羟基黄烷酮(类)化合物(较佳地为开环形式)包括(但不限于)：根皮素，2-羟基柚皮素(较佳地为开环形式)，2-羟基柚皮素(较佳地为开环形式)，2-羟基圣草酚。

在另一优选例中，所述的碳苷二氢查尔酮(类)化合物或碳苷-2-羟基黄烷酮(类)化合物包括(但不限于)：Nothofagin，根皮素-3’,5’-C-葡萄糖双碳苷，2-羟基柚皮素-6-C(8-C)-葡萄糖苷，2-羟基圣草酚-6-C(8-C)-葡萄糖苷。

在另一优选例中，所述的保守性变异多肽选自：(1)由SEQ ID NO:1～20任一所示序列的多肽经过一个或多个(如1-20个，较佳地1-10个；更佳地1-5个；更佳地1-3个)氨基酸残基的取代、缺失或添加而形成的，且具有催化二氢查尔酮(类)化合物或2-羟基黄烷酮(类)化合物生成碳苷二氢查尔酮(类)化合物或碳苷-2-羟基黄烷酮(类)化合物功能的多肽；(2)氨基酸序列与SEQ ID NO:1～20任一所示序列的多肽有80％以上(较佳地85％以上；更佳地90％以上；更佳地95％以上；更佳地99％以上)相同性，且具有催化二氢查尔酮(类)化合物或-羟基黄烷酮(类)化合物生成碳苷二氢查尔酮(类)化合物或碳苷-2-羟基黄烷酮(类)化合物功能的多肽；或(3)在SEQ ID NO:1～20任一所示序列的多肽的N或C末端添加标签序列，或在其N末端添加信号肽序列后形成的多肽。

在本发明的另一方面，提供糖基转移酶的用途，用于催化二氢查尔酮(类)化合物或2-羟基黄烷酮(类)化合物生成碳苷二氢查尔酮(类)化合物或碳苷-2-羟基黄烷酮(类)化合物；其中，所述的糖基转移酶为选自SEQ ID NO:1～20任一所示的多肽或其保守性变异多肽。

在一个优选例中，所述的二氢查尔酮(类)化合物具有式(I)的母核结构，所述2-羟基黄烷酮(类)化合物(较佳地为开环形式)具有式(II)的母核结构，所述碳苷二氢查尔酮(类)化合物具有式(III)的母核结构，或所述碳苷-2-羟基黄烷酮(类)化合物(较佳地为开环形式)具有式(IV)的母核结构：

其中，R为糖基，其与A环以碳碳键连接。

在另一优选例中，R在A环上的数量为1个，较佳地其存在于3’位置。

在另一优选例中，R在A环上的数量为2个，较佳地其存在于第3’和5’位；且，所述的糖基转移酶为选自SEQ ID NO:6，8，10，17，19或20所示的多肽或其保守性变异多肽。

在另一优选例中，R为单糖基。

在另一优选例中，所述的糖基为葡萄糖；较佳地，在利用所述糖基转移酶进行糖基转移时，以携带葡萄糖基团的化合物作为供体；更佳地，以UDP葡萄糖作为糖基供体。

在另一优选例中，所述二氢查尔酮(类)化合物或2-羟基黄烷酮(类)化合物包括(但不限于)：根皮素，2-羟基柚皮素(较佳地为开环形式)，2-羟基圣草酚(较佳地为开环形式)。

在另一优选例中，所述碳苷二氢查尔酮(类)化合物或碳苷-2-羟基黄烷酮(类)化合物包括(但不限于)：Nothofagin，根皮素-3’,5’-C-葡萄糖碳苷，2-羟基柚皮素-6-C(8-C)-葡萄糖苷，2-羟基圣草酚-6-C(8-C)-葡萄糖苷。

在本发明的另一方面，提供一种合成(包括人工合成或体外合成)黄酮碳苷(类)化合物的方法，包括：(1)将2-羟基黄烷酮(类)化合物以糖基转移酶催化，产生碳苷-2-羟基黄烷酮(类)化合物；其中，所述的糖基转移酶为选自SEQ ID NO:1～20任一所述的多肽或其保守性序列变体；(2)将(1)的碳苷-2-羟基黄烷酮(类)化合物脱水，获得黄酮碳苷(类)化合物。

在一个优选例中，在(1)之前，还包括：(c)将黄烷酮(类)化合物通过黄烷酮-2-羟化酶(F2H)催化，获得2-羟基黄烷酮(类)化合物。

在另一优选例中，在(c)之前，还包括：(b)将丙二酰-CoA结构类似物(如包括其经1或多基团的取代形式)与p-香豆酰-CoA结构类似物(如包括其经1或多基团的取代形式)经查尔酮合成酶(CHS)和查尔酮异构酶(CHI)催化，获得黄烷酮(类)化合物。

在另一优选例中，在(b)之前，还包括：(a)将芳香族氨基酸经酪氨酸解氨酶(TAL)或苯丙氨酸解氨酶(PAL)和4-香豆酰-CoA连接酶(4CL)催化，获得p-香豆酰-CoA结构类似物。

在另一优选例中，所述的黄烷酮(类)化合物包括：柚皮素，圣草酚；所述的丙二酰-CoA结构类似物包括：丙二酰-CoA或甲基丙二酰-CoA；所述的p-香豆酰-CoA结构类似物包括：p-香豆酰-CoA或p-肉桂酰-CoA；所述的芳香族氨基酸包括：L-酪氨酸或L-苯丙氨酸。

在另一优选例中，所述的2-羟基黄烷酮(类)化合物为2-羟基柚皮素，其是从柚皮素通过黄烷酮-2-羟化酶(F2H)催化获得；或所述2-羟基黄烷酮(类)化合物为2-羟基圣草酚，其是从圣草酚通过黄烷酮-2-羟化酶(F2H)催化获得；较佳地，所述圣草酚是从柚皮素通过黄烷酮-3’-羟化酶(F3’H)催化获得。

在本发明的另一方面，提供一种生物合成黄酮碳苷(类)化合物的方法，包括：(i)将合成柚皮素(类)化合物的前体基因、编码黄烷酮-2-羟化酶和/或黄烷酮-3’-羟化酶的基因以及编码糖基转移酶的基因共转入宿主细胞中；其中，所述的糖基转移酶为选自SEQ IDNO:1～20任一所述的多肽或其保守性序列变体；(ii)培养(i)的细胞，从而生物合成黄酮碳苷(类)化合物。

在一个优选例中，所述的黄烷酮-2-羟化酶和黄烷酮-3’-羟化酶为截去N端跨膜区域的P450氧化酶；较佳地，在截去N端跨膜区域后，还包括添加标签；更佳地，所述标签包括(但不限于)：2B1，17α，MBP。

在本发明的另一方面，提供一种遗传工程化的细胞，其中包括：合成柚皮素化合物的前体基因、编码黄烷酮-2-羟化酶和/或黄烷酮-3’-羟化酶的基因以及编码糖基转移酶的基因；其中，所述的糖基转移酶为选自SEQ ID NO:1～20任一所述的多肽或其保守性序列变体。

在本发明的另一方面，提供制备所述的遗传工程化的细胞的方法，包括：将合成柚皮素化合物的前体基因、编码黄烷酮-2-羟化酶和/或黄烷酮-3’-羟化酶的基因以及编码糖基转移酶的基因共转入宿主细胞中；其中，所述的糖基转移酶为选自SEQ ID NO:1～20任一所述的多肽或其保守性序列变体。

在本发明的另一方面，提供一种用于生物合成黄酮碳苷(类)化合物或其中间体的试剂盒，其中包括：SEQ ID NO:1～20所示的一条或多条(如2、3、4条)多肽或其保守性变异多肽；黄烷酮-2-羟化酶和/或黄烷酮-3’-羟化酶；合成柚皮素(类)化合物的前体基因；较佳地还包括宿主细胞。

在另一优选例中，所述的细胞包括：原核细胞或真核细胞；较佳地，所述原核宿主细胞包括大肠杆菌，酵母，链霉菌。

在另一优选例中，所述的黄酮碳苷(类)化合物包括(但不限于)：牡荆素，异牡荆素，荭草苷，异荭草苷，维采宁-2(新西兰牡荆素，vicenin-2)，光牡荆素(lucenin 2)。

本发明的其它方面由于本文的公开内容，对本领域的技术人员而言是显而易见的。

附图说明

图1、应用HPLC进行碳苷糖基转移酶的体外功能鉴定；(A)以根皮素为底物；(B)以2-羟基柚皮素为底物。

图2、Nothofagin的负离子模式高分辨二级质谱图谱。

图3、Nothofagin的(A)¹H，(B)¹³C和(C)二维HMBC核磁图谱。

图4、2-羟基柚皮素-C-葡萄糖苷的二级质谱图谱。

图5、PhCGT1和PgCGT1对底物2-羟基柚皮素的米氏方程曲线。

图6、二氢查尔酮双碳苷(根皮素-3’,5’-C-双葡萄糖苷)的负离子模式高分辨质谱检测结果图。

图7、(A)pYH055合成柚皮素基因表达盒示意图；(B)pCZ201、pCZ203和pCZ229携带P450/CPR表达盒示意图。

图8、pCZ261、pCZ265携带双元P450/CPR表达盒示意图。

图9、牡荆素、异牡荆素生产菌株sCZ2、sCZ4和sCZ29发酵液的LC-MS分析结果。

图10、荭草苷、异荭草苷生产菌株sCZ63和sCZ67发酵液的LC-MS分析结果。

图11、黄酮-单葡萄糖碳苷的预期的生物合成途径。

图12、维采宁-2(芹菜素-6,8-双葡萄糖苷)的预测的生物合成途径。

图13、HPLC、LC-MS检测维采宁-2生产菌株发酵产物的成分

具体实施方式

本发明人经过深入的研究，筛选出一组新型的尿苷二磷酸(UDP)-糖基转移酶，其是碳苷糖基转移酶。所述的糖基转移酶能够特异和高效地催化二氢查尔酮(类)化合物或2-羟基黄烷酮(类)化合物的碳苷葡萄糖基化，从而产生一类碳苷二氢查尔酮(类)化合物或碳苷-2-羟基黄烷酮(类)化合物；碳苷-2-羟基黄烷酮(类)化合物通过进一步的脱水反应形成黄酮碳苷(类)化合物。本发明还涉及将这些新型UDP糖基转移酶应用于人工构建的重组表达系统，通过发酵工程生产碳苷二氢查尔酮(类)化合物或黄酮碳苷(类)化合物。

活性多肽、其编码基因、载体及宿主

本发明人通过挖掘基因组以及转录组信息，结合大量的研究和实验工作，揭示了一组新的尿苷二磷酸(UDP)-糖基转移酶，其是碳苷糖基转移酶(C-glycosyltransferase，CGT)。较佳地，该组碳苷糖基转移酶来源于单子叶禾本科植物；更佳地，包括来自于毛竹(Phyllostachys edulis(或称Phyllostachys heterocycla)；Ph)、淡竹(Phyllostachysglauca；Pg)、高节竹(Phyllostachys prominens；Pp)、粳稻(Oryza Sativa japonica；Os)、玉米(Zea mays；Zm)、小麦(Triticum aestivum；Ta)、高粱(Sorghum bicolor；Sb)、二穗短柄草(Brachypodium distachyon；Bd)、谷子(Setaria italica；Si)。

作为本发明的优选方式，所述碳苷糖基转移酶包括选自下组的糖基转移酶：PhCGT1(SEQ ID NO:1)、PgCGT1(SEQ ID NO:2)、PpCGT1(SEQ ID NO:3)、PhCGT2(SEQ ID NO:4)、OsCGT2(SEQ ID NO:5)、SbCGT1(SEQ ID NO:6)、SbCGT2(SEQ ID NO:7)、TaCGT1-A(SEQID NO:8)、TaCGT1-B(SEQ ID NO:9)、TaCGT1-D(SEQ ID NO:10)、TaCGT2-A(SEQ ID NO:11)、TaCGT2-B(SEQ ID NO:12)、TaCGT2-D(SEQ ID NO:13)、ZmCGT4(SEQ ID NO:14)、ZmCGT5(SEQID NO:15)、BdCGT1(SEQ ID NO:16)、SiCGT1(SEQ ID NO:17)、SiCGT2(SEQ ID NO:18)、OsCGT(SEQ ID NO:19)、ZmCGT(SEQ ID NO:20)。

本发明也包括所述碳苷糖基转移酶的保守性变异多肽，本发明也包括所述黄烷酮-2-羟化酶、查尔酮合成酶、查尔酮异构酶、酪氨酸解氨酶、苯丙氨酸解氨酶、4-香豆酰-CoA连接酶等的保守性变异多肽。本发明中，所述的“保守性变异多肽”是指基本上保持所述多肽相同的生物学功能或活性的多肽。所述的“保守性变异多肽”可以是(i)有一个或多个保守或非保守性氨基酸残基(优选保守性氨基酸残基)被取代的多肽，而这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的，或(ii)在一个或多个氨基酸残基中具有取代基团的多肽，或(iii)成熟多肽与另一个化合物(比如延长多肽半衰期的化合物，例如聚乙二醇)融合所形成的多肽，或(iv)附加的氨基酸序列融合到此多肽序列而形成的多肽(如前导序列或分泌序列或用来纯化此多肽的序列或蛋白原序列，或与抗原IgG片段的形成的融合蛋白)。根据本文的教导，这些片段、衍生物和类似物属于本领域熟练技术人员公知的范围。

所述的“保守性变异多肽”可以包括(但并不限于)：一个或多个(通常为1-50个，较佳地1-30个，更佳地1-20个，最佳地1-10个)氨基酸的缺失、插入和/或取代，以及在C末端和/或N末端添加或缺失一个或数个(如50个以内，较20个或10个以内，更佳地为5个以内)氨基酸。例如，在本领域中，用性能相近或相似的氨基酸进行取代时，通常不会改变蛋白质的功能。又比如，在C末端和/或N末端添加一个或数个氨基酸通常也不会改变蛋白质的功能。本发明还提供所述多肽的类似物。这些类似物与天然多肽的差别可以是氨基酸序列上的差异，也可以是不影响序列的修饰形式上的差异，或者兼而有之。这些多肽包括天然或诱导的遗传变异体。诱导变异体可以通过各种技术得到，如通过辐射或暴露于诱变剂而产生随机诱变，还可通过定点诱变法或其他已知分子生物学的技术。类似物还包括具有不同于天然L-氨基酸的残基(如D-氨基酸)的类似物，以及具有非天然存在的或合成的氨基酸(如β、γ-氨基酸)的类似物。应理解，本发明的多肽并不限于上述例举的代表性的多肽。

作为本发明的优选方式，本发明涉及到的P450氧化酶(黄烷酮-2-羟化酶和黄烷酮-3’-羟化酶)是去除了N端的跨膜区的多肽片段，可使得截短后蛋白的可溶性表达增加，当被应用于生物合成途径中时，发挥更好的活性。

本发明的碳苷糖基转移酶的氨基端或羧基端还可含有一个或多个多肽片段，作为蛋白标签。例如，所述的标签可以是FLAG、HA、HA1、c-Myc、Poly-His、Poly-Arg、Strep-TagII、AU1、EE、T7、4A6、ε、B、gE、以及Ty1。又例如，所述的标签可以包括2B，17α，MBP等。

当出于生产本发明的碳苷糖基转移酶的目的时，为了使翻译的蛋白分泌表达(如分泌到细胞外)，还可在本发明的多肽的氨基端添加上信号肽序列。信号肽在多肽从细胞内分泌出来的过程中可被切去。

本发明的活性多肽可以是重组多肽、天然多肽、合成多肽。本发明的多肽可以是天然纯化的产物，或是化学合成的产物，或使用重组技术从原核或真核宿主(例如，细菌、酵母、高等植物)中产生。根据重组生产方案所用的宿主，本发明的多肽可以是糖基化的，或可以是非糖基化的。本发明的多肽还可包括或不包括起始的甲硫氨酸残基。

编码本发明的碳苷糖基转移酶的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。术语“编码多肽的多核苷酸”可以是包括编码此多肽的多核苷酸，也可以是还包括附加编码和/或非编码序列的多核苷酸。

本发明也涉及包含本发明的多核苷酸的载体，以及用本发明的载体或多肽编码序列经基因工程产生的宿主细胞，以及经重组技术产生本发明所述多肽的方法。

通过常规的重组DNA技术，可表达或生产重组的多肽。一般来说有以下步骤：(1).用编码所述多肽(含其保守性变异多肽)的多核苷酸，或用含有该多核苷酸的重组表达载体转化或转导合适的宿主细胞；(2).在合适的培养基中培养的宿主细胞；(3).从培养基或细胞中分离、纯化蛋白质。

本发明中，编码所述多肽的多核苷酸序列可插入到重组表达载体中。术语“重组表达载体”指本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒如腺病毒、逆转录病毒或其他载体。只要能在宿主体内复制和稳定，任何质粒和载体都可以用。表达载体的一个重要特征是通常含有复制起点、启动子、标记基因和翻译控制元件。较佳地，所述表达载体可以是原核表达载体。

本领域的技术人员熟知的方法能用于构建含本发明的碳苷糖基转移酶的多核苷酸和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等。所述的DNA序列可有效连接到表达载体中的适当启动子上，以指导mRNA合成。此外，表达载体优选地包含一个或多个选择性标记基因，以提供用于选择转化的宿主细胞的表型性状。

包含上述的适当DNA序列以及适当启动子或者控制序列的载体，可以用于转化适当的宿主细胞，以使其能够表达蛋白质。宿主细胞可以是原核细胞，如细菌细胞；或是低等真核细胞，如酵母细胞；或是高等真核细胞，如哺乳动物细胞。代表性例子有：大肠杆菌，链霉菌属，枯草杆菌；鼠伤寒沙门氏菌的细菌细胞；真菌细胞如酵母，植物细胞，灵芝细胞；果蝇S2或Sf9的昆虫细胞；CHO、COS、293细胞、或Bowes黑素瘤细胞的动物细胞等。

本发明也提供了用于生物合成黄酮碳苷(类)化合物或其中间体的宿主细胞，其中包括：合成柚皮素化合物的前体基因、编码黄烷酮-2-羟化酶和/或黄烷酮-3’-羟化酶的基因以及本发明所述的编码糖基转移酶的基因。

在本发明的优选方式中，所述的宿主细胞为原核细胞，更佳地为大肠杆菌，酵母，链霉菌。但是应理解，细胞宿主仅是一种生产工具，本领域技术人员可以通过一些技术手段对大肠杆菌以外的其他宿主细胞进行改造，从而也实现如本发明的生物合成，由此构成的宿主细胞以及生产方法也应包含在本发明中。

应用及生产工艺

本发明的碳苷糖基转移酶或它们的保守性变异多肽，可应用于特异和高效地催化二氢查尔酮(类)化合物或2-羟基黄烷酮(类)化合物的碳苷葡萄糖基化，从而产生一类碳苷二氢查尔酮(类)化合物或碳苷-2-羟基黄烷酮(类)化合物；碳苷-2-羟基黄烷酮(类)化合物通过进一步的脱水反应形成黄酮碳苷(类)化合物。

因此，本发明提供了糖基转移酶的用途，用于催化二氢查尔酮(类)化合物或2-羟基黄烷酮(类)化合物生成碳苷二氢查尔酮(类)化合物或碳苷-2-羟基黄烷酮(类)化合物；其中，所述的糖基转移酶为选自SEQ ID NO:1～20任一所示的多肽或其保守性变异多肽。

如本发明所用，所述的二氢查尔酮(类)化合物包括二氢查尔酮或其衍生物、结构类似物、异构体。所述的2-羟基黄烷酮(类)化合物包括2-羟基黄烷酮或其衍生物、结构类似物、异构体。所述的碳苷二氢查尔酮(类)化合物包括碳苷二氢查尔酮或其衍生物、结构类似物、异构体。所述碳苷-2-羟基黄烷酮(类)化合物包括碳苷-2-羟基黄烷酮或其衍生物、结构类似物、异构体。所述黄酮碳苷(类)化合物包括黄酮碳苷或其衍生物、结构类似物、异构体。

在本发明的优选方式中，所述的二氢查尔酮具有式(I)的母核结构、2-羟基黄烷酮(类)化合物(开环形式)具有式(II)的母核结构，所述碳苷二氢查尔酮类化合物具有式(III)的母核结构，碳苷-2-羟基黄烷酮(类)化合物(开环形式)具有式(IV)的母核结构：

其中，R为糖基，其与A环以碳碳键连接。所述的糖基可以是单糖、二糖或多糖基(如3个或以上(如3～10个，更具体如4、5、6、7、8、10个)单糖串联)。在优选的方式中，所述的糖基为单糖基。

在本发明的优选方式中，A环或B环中，存在1～3个羟基；较佳地，A环中，羟基存在于第2’、4’和/或6’位；较佳地，B环中，羟基出现在第4位置。

在本发明的优选方式中，R在A环上的数量为1个，较佳地其存在于第3’位；或R在A环上的数量为2个，较佳地其存在于第3’和5’位；且，所述的糖基转移酶为选自SEQ ID NO:6，8，10，17，19或20所示的多肽或其保守性变异多肽。

在本发明的优选方式中，所述的二氢查尔酮(类)化合物或2-羟基黄烷酮(类)化合物包括：根皮素，2-羟基柚皮素(开环形式)，2-羟基柚皮素(开环形式)，2-羟基圣草酚；和/或所述的碳苷二氢查尔酮(类)化合物或碳苷-2-羟基黄烷酮(类)化合物包括：Nothofagin，根皮素-3”,5”-C-葡萄糖碳苷，2-羟基柚皮素-6-C(8-C)-葡萄糖苷，2-羟基圣草酚-6-C(8-C)-葡萄糖苷。此外，它们的类似物或基团被取代的变体形式也应被包含在内。

本发明中优选地以UDP葡萄糖作为糖基供体，应理解，其它的携带葡萄糖基团的化合物也是可以作为供体的，也应被包含在本发明中。

本发明也提供了催化二氢查尔酮(类)化合物或2-羟基黄烷酮(类)化合物生成碳苷二氢查尔酮(类)化合物或碳苷-2-羟基黄烷酮(类)化合物的方法，包括：以糖基转移酶进行所述催化；所述的糖基转移酶为选自SEQ ID NO:1～20任一所述的多肽或其保守性序列变体。

本发明也提供了合成黄酮碳苷(类)化合物的方法，包括：(1)将2-羟基黄烷酮(类)化合物以糖基转移酶催化，产生碳苷-2-羟基黄烷酮(类)化合物；其中，所述的糖基转移酶为选自SEQ ID NO:1～20任一所述的多肽或其保守性序列变体；(2)将(1)的碳苷-2-羟基黄烷酮(类)化合物脱水，获得黄酮碳苷(类)化合物。较佳地，在(1)之前还包括：(c)将黄酮类化合物通过黄烷酮-2-羟化酶(F2H)催化，获得2-羟基黄烷酮(类)化合物。更佳地，在(c)之前，还包括：(b)将丙二酰-CoA类化合物(如包括其经1或多基团的取代形式)与p-香豆酰-CoA类化合物(如包括其经1或多基团的取代形式)经查尔酮合成酶(CHS)和查尔酮异构酶(CHI)催化，获得黄酮类化合物。进一步更佳地，在(b)之前还包括：(a)将L-酪氨酸类化合物(如包括其经1或多基团的取代形式)经酪氨酸解氨酶(TAL)和4-香豆酰-辅酶A连接酶(4CL)催化，获得p-香豆酰-CoA类化合物。

在本发明的优选方式中，所述的黄酮类化合物包括：柚皮素，圣草酚；所述的丙二酰-CoA类化合物包括：丙二酰-CoA，甲基丙二酰-CoA；所述的p-香豆酰-CoA类化合物包括：p-香豆酰-CoA，p-肉桂酰-CoA；所述的L-酪氨酸类化合物包括：L-酪氨酸，L-苯丙氨酸。应理解，根据本发明的整体描述，它们的类似物或变异形式也可应用于本发明中。

在本发明的优选方式中，所述的2-羟基黄烷酮(类)化合物为2-羟基柚皮素，其是从柚皮素通过黄烷酮-2-羟化酶(F2H)催化获得；或所述2-羟基黄烷酮(类)化合物为2-羟基圣草酚，其是从圣草酚通过黄烷酮-2-羟化酶(F2H)催化获得；较佳地，所述圣草酚是从柚皮素通过黄烷酮-3’-羟化酶(F3’H)催化获得。应理解，根据本发明的整体描述，它们的类似物或变异形式也可应用于本发明中。

本发明也提供了生物合成黄酮碳苷(类)化合物的方法，包括：(i)将合成柚皮素类化合物的前体基因、编码黄烷酮-2-羟化酶和/或黄烷酮-3’-羟化酶的基因以及编码糖基转移酶的基因共转入宿主细胞中；其中，所述的糖基转移酶为选自SEQ ID NO:1～20任一所述的多肽或其保守性序列变体；(ii)培养(i)的细胞，从而生物合成黄酮碳苷(类)化合物。

在本发明的具体实施例中，这些碳苷糖基转移酶的N端或/和C端连接标签得到的融合蛋白及其衍生多肽，能够特异和高效地催化二氢查尔酮(类)化合物或2-羟基黄烷酮(类)化合物的3’位置进行C-葡萄糖糖基化，其中，PhCGT1具有更优于之前所报道类似碳苷糖基转移酶的活性，而SbCGT1、TaCGT1-A、TaCGT1-D、SiCGT1、OsCGT和ZmCGT不仅可以催化查尔酮类化合物3’位C-糖基化，更可以对3’位已被糖基化的二氢查尔酮(类)化合物或2-羟基黄烷酮(类)化合物进行进一步5’位C-糖基化，从而产生双碳苷二氢查尔酮(类)化合物或双碳苷-2-羟基黄烷酮。单碳苷或双碳苷-2-羟基黄烷酮(类)化合物可以通过非酶化的脱水缩合反应生成单碳苷或双黄酮碳苷(类)化合物。另一方面本发明通过生物工程技术，将这些新型CGT应用于人工构建的重组大肠杆菌系统，该重组微生物能够生产碳苷二氢查尔酮和黄酮碳苷(类)化合物。

相对于传统的植物提取手段，微生物发酵具有速度快、受外界因素影响较小等优势；部分化合物通过微生物合成的产量远高于植物提取，已经成为天然产物获得的一种重要手段。黄酮碳苷(类)化合物天然丰度低，并且在植物提取物中与大量结构类似的黄酮氧苷、苯丙素类化合物共存，使得分离纯化繁琐复杂。本发明中使用微生物发酵的方式来高效、定向得合成黄酮碳苷，极为有效地降低了分离纯化这类化合物的成本。

本发明也提供了用于生物合成黄酮碳苷(类)化合物或其中间体的试剂盒，其中包括：SEQ ID NO:1～20所示的一条或多条多肽或其保守性变异多肽；黄烷酮-2-羟化酶和/或黄烷酮-3’-羟化酶；合成柚皮素类化合物的前体基因；较佳地还包括宿主细胞。更佳地，所述试剂盒中还包括说明进行生物合成的方法的使用说明书。

下面结合具体实施例，进一步阐述本发明。应理解，这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法，通常按照常规条件如J.萨姆布鲁克等编著，分子克隆实验指南，第三版，科学出版社，2002中所述的条件，或按照制造厂商所建议的条件。

试剂材料

毛竹、淡竹与高节竹采自上海辰山植物园。

粳稻、高粱、玉米、小麦、谷子、二穗短柄草种植于中国科学院上海分子植物研究中心温室。

植物基因组DNA提取使用TIANGEN植物基因组提取试剂盒。

AxyPrep总RNA小量制备试剂盒，多聚酶链式反应(PCR)胶回收试剂盒，质粒抽提试剂盒均为美国Axygen产品。

聚合酶链式反应(PCR)高保真酶PrimeSTAR Max DNA Polymerase为日本宝生物公司(TAKARA)产品。

限制性内切酶、T4连接酶为NEB产品。

无缝克隆试剂盒购自诺唯赞生物科技有限公司。

大肠杆菌DH10B、Rosetta(DE3)菌株和pET21a、pET28a载体用于基因克隆及蛋白表达。

标准品化合物柚皮素、2-羟基柚皮素、根皮素、荭草苷、异荭草苷、牡荆素、异牡荆素购自大连美仑生物技术有限公司。

UDP葡萄糖购自北京中泰生物有限公司。

其他试剂为国产分析纯或色谱纯试剂，购自国药集团化学试剂有限公司。

实施例1、新型尿苷二磷酸(UDP)-糖基转移酶

1.碳苷糖基转移酶基因克隆和表达质粒构建

取禾本科植物(粳稻、玉米、小麦、高粱、谷子、二穗短柄草、毛竹、淡竹、高节竹)成熟叶片或幼苗，清水清洗干净表面污渍，用吸水纸轻轻擦拭干叶片表面水渍，称重备用。基因组DNA的提取依照TIANGEN植物基因组提取试剂盒提供的说明书进行。

所述的碳苷糖基转移酶的氨基酸序列如下：

>PhCGT1(SEQ ID NO:1)

MPTSGGRTGDRPHVILLPSAGMGHLVPFSRLAVALSSGHGCDVSVVAVLPTVSAAESRHLQGLLDASPAVRRLDLHLAPFDESEFPGADPFFLRFEAMRRSAPLLGPLLADTGASALVTDIALASVVIPVAKEIHLPCYVLFTASAAMLSFCAYFPTYLDTNAGRVVGDVDIPGVYRIPKASIPQALHDPNHLFTRQFVANGQDLAKADGVLVNTFDALELEAVTALRQGSVAAGFPPVFSVGPLVTVNLPAGEAAKESGNDYMYWLDAQPAQSVVYVSFGSRKAISRDQVRELAIGLEASGQPFLWVVKSTVVDRDDSAELSELLGEGFLERVQGQGFVTKAWVEQEEVLKHESIGLFISHCGWNSVTEAAASGVPVLAWPRFGDQRVNAGVVARGGLGVWVERWSWEGEEDVVSGEEIAEKVKAVMADETVRKKAASVGEAAVKEFADGGTSYRSLTEFVRRCRDLAVLD*

>PgCGT1(SEQ ID NO:2)

MPTSGSRTGGRPHVILLPSAGMGHLVPFSRLAVALSSGHGCDVSVVAVLPTVSAAESRHLQGLLDASPAVRRLDLHLAPFDESEFPGADPFFLRFEAMRRSAPLLGPLLADTGASALVTDIALASVVIPVAKEIHLPCYVLFTASAAMLSFCAYFPTYLDTNAGRVVGDVDIPGVYRIPKASIPQALHDPNHLFTRQFVANGQDLAKADGVLVNTFDALELEAVTALRQGSVAAGFPPVFSVGPLVTVNLPAGEAAKESGNDYMYWLDAQPARSVVYVSFGSRKAISRNQVRELAVGLEASGQRFLWVVKSTVVDRDDSAELSELLDEGFLERVQGRGLVTKAWVEQEEVLKHESIGLFISHCGWNSVTEAAASGVPVLAWPRFGDQRVNAGVVARGGLGVWVERWSWEGEEGVVSGEEIAEKVKAVMADETVRKKAASVGEAAVKEFADGGTSYRSLTEFVRRCRDLAVLD*

>PpCGT1(SEQ ID NO:3)

MPTSGSRTGGRPHVILLPSAGMGHLVPFSRLAVALSSGHGCDVSVVAVLPTVSAAESRHLQGLLDASPAVRRLDLHLAPFDESEFPGADPFFLRFEAMRRSAPLLGPLLADTGESALVTDIALASVVIPVAKEIHLPCYVLFTASAAMLSFCAYFPTYLDTNAGRVVGDVDIPGVYRIPKASIPQALHDRNHLFTRQFVANGQDLAKADGVLVNTFDALELEAVTALRQGSVAAGFPPVFSVGPLVTVNLPAGEAAKESGNDYMYWLDAQPARSVVYVSFGSRKAISRNQVRELAVGLEASGQRFLWVVKSTVVDRDDSAELSELLDEGFLERVQGRGLVTKAWVEQEEVLKHESIGLFISHCGWNSVTEAAASGVPVLAWPRFGDQRVNAGVVARGGLGVWVERWSWEGEEGVVSGEEIAEKVKAVMADETVRKKAASVGEAAVKEFADGGTSYRSLTEFVRRCRDLAVLD*

>PhCGT2(SEQ ID NO:4)

MASRAMPSSSDRTGGAPRVVLLPSAGMGHLVPFGRLAVALSSGHACDVSVVTVLPTVSSAESKHLQGLFDAFPAVRRLDLHLAPFDASEFSDADPFYVRYEAVRRSAPLLGPLLADADASALVADIALASVVIPVAKELLIPCYIFFTASATMFSLLAYFPTYLHSNAGHSIGDVDVPGVYRIPMSSIPQALHDPNNLFTQQFVANGRSLAEADGLLVNTFDAFEPEAVTALRHGTVAPGFPPVFALGPLSPVGFPAGEAARESGNYTTWLDAQPARSVVYVSFGSRKALLRDQLSELAAGLEASGCRFLWVVKGTVVDRDDDRELRELLGEVFLQRVNGRALVTKAWVEQEEVLKHPAVGLFISHCGWNSVTEATVSGVPVLAWPRFADQRVSAGVVARRGLGVWVERWSWEGEERVVTGDEIAEKVKSVLADETLRKNSTMVREAAAAAVATGGTSYRSLAKFVRRCST*

>OsCGT2(SEQ ID NO:5)

MCSAATPNSGDVRATPGSSRPHVVLLPSAGMGHLVPFTRLAAALCSGHGCDVSLVAAVPTVSSAEARHLAAHFTAFPAVRRLELDLASLDVSEFAGADPFYVRYEAIRRSASLLAPLLAGGASAAASALVADIALASVVIPVAKDLRLPCYVFFTASATMFSFLAYLPTYLDANAGGGHAIGDVDVPGVCRVPTSSVPQALHDPDDIFTRQFIANARSLANADGLVVNAFDALEPEAVAALRQGTVAAGLPPVFAVGPLSPAPIPAKDSGSYLPWLDAQPARSVVYVSFGSRKALPRDQLSELAAGLEASGHRFLWVVKGAVVDRDDAGELTDLLGEAFLQRIHGRGLVTMAWVRQEEVLNHPSVGLFISHCGWNSVTEAAASGVPVVAWPRFADQRVNAGVVARAGIGVWVDTWSWEGEDDGVVSAEDIAGKVRSAMADEGVRKAAASVREAAARAVAAGGSSYRSLAELVRRCRDGLVITNGM*

>SbCGT1(SEQ ID NO:6)

MAPPATKSLGELDGGARPHVMFIPSAGMGHLLPFFRVIAALAAHDVVDISVVTVLPTVSAAEADHFASLFAALPRVSRVDFHLLPFDASSEFPGHDPFLLRWEALRRSAHLFRPLIAGAAGPRVSAVVTDVTLTSHVIPIAKELGVQCHVLFVSCATMLSLAAYTPVHLDKKNKGEHGPGVGVGVGVGDVDIPGVRRIPQSYLPQPLLDLNKLFTKQFIDNGREIINADGFLVNTFDALEPVALAALRDGKVVAGFPPVYAIGPLRSKEEEATTGSPPVAWLDEQPARSVVYVAFGNRNAVSLEQIREIAAGLEASGCRFLWVLKTTTVDRDDTAELTDDVLGEGFLERVQGRGLVTKAWVDQEAVLKHASVGLFLSHSGWNSVTEAAAAGVPLLAWPRGGDHRVNATVVVSGGVGVWMEQWSWDGEDWLVTGEEIGKKVKEVMSDAAVRARATRTGEEAAKAVAEGGTSYRSMQKFISSLKAHCSP*

>SbCGT2(SEQ ID NO:7)

MAPSAMPASGDHTGATPHVVLLPSAGMGHLVPFARLAVALSEGHGCDVSFAAVLPTVSSAESRHLRALFAAAPAVRRLDFRLAPFDESQFPGADPFFLRFEALRRSAPLLGPLLDAAQASALVTDIVLASVVLPVAKARGVPCYVLFTSSAAMLSLCAYFPAHLDANAAAGGGRLGVGDVDIPGVYRIPKSSVPQALHDPKHLFTQQFVANGRGLVAADGILVNTFDAFEPDAITALRQGSVVSDFPPVFAVGPLQPVRFQVAEKPAHYMRWLSAQPARSVVYVSFGSRKAISTDQLRELAAGLEASGQRFLWVVKSTVVDRDDAADLADLLGDGFLERVQGRAFVTKGWVEQEEILQHGSVGLFISHCGWNSVTEAAAFGVPVLAWPRFGDQRVNAAVVARGGLGAWEERWTWDGEKGLVTGEEVAEKINAVVGNDVVARKAARVGDAAAAAAGKGGTSYQSLADFVGRCRDAGW*

>TaCGT1-A(SEQ ID NO:8)

MPTSGDGPTSQPHVVLLPSAGMGHLVPFSRLAVALSSAHGCDVSLVTVLPTVSSAESSHLEALFGAFPAVRRLEFHLADFDASEFPNADPFFLRFEAMRRSAPLLLGPLLARASATALVTDIALSSVVIPVAKQLRLPCYVLFTASAAMLSLCVHFPAYLDANGNGLVGDVDIPGVYQIPKASVPQALHDPKHLFTRQFVANGRELAKSDGVLVNSFDAFEPEAIAALREGAVSAAGFFPPVFSVGPLAPVSFPAGNNNRADYIQWLEAQPARSVVYVSFGSRKAVARDQLRELAAGLEASGHRFLWVVKSTVVDRDDDADLGELLGEGFLERVQGRGMVTKGWVEQEDVLKQESVGLFISHCGWNSVTEAAAGGLPVLAWPRFGDQRVNAGVVARSGLGVWVDSWSWEGEEGVVSGESIAEKVKAVMGDEIARNKAVSVRDAAAKAVADGGTSYRNLARFAQRCRDGRVRE*

>TaCGT1-B(SEQ ID NO:9)

MPTSGDGSGALPHVVLLPSAGMGHLVPFSRLAVSFSSSDHGCGVSVVTVLPTVSSAESAHLDALFGACPAVRRLDFHLARFDASEFPGADPFFLRFEAMRRSAPLLGPLLAGAGASALVTDIALASVVIPVARELRLPCYVLFTASAAMLSLCVHFPAYLDANAGGPVGDVDIPGVYRVPKASIPQALHHPEHLFTRQFVANGRELAKSDGLLVNSFDEFEPEAISALRDGSVAAGFPPVFSVGPLAPVSFSAGEPPENQADYMRWLEAQPTRSVVYVSFGSRKAISKDQLKELAVGLEASGHRFLWVVKSTVVDREDEAELSELLGEGFLERVHGRGMVTKGWVEQEEVLKQESIGLFISHCGWNSVTEAAANGLPVLAWPRFGDQRVNAGVVARSGLGVWEERWSWEGEEGVVSGENIAEKVKAVMADETVRNKAVSVQDAAAKAVADGGTSYRSLAQFVQRCRDLSVSK*

>TaCGT1-D(SEQ ID NO:10)

MPTSGDASGALPHPHVVLLPSAGMGHLVPFSRLAVSLSSPGHGCGVSVATVLPTVSSAESAHLDALFGACPAVRRLDFHLAPFDASEFPGADPFFLRFEAMRRSAPLLGPLLAGAGASALVTDIALASVVIPVARDLRLPCYVLFTASAAMLSLCVHFPAYLDANAGGPVGDVGIPGVYRVPKASIPQALHHPEHLFTQQFVANGRELAKADGLLVNSFDAFEPEAIAALRNGSVAAGFPPVFSVGPLAPVSFSASEPPENQADYMRWLEAQPARSVVYVSFGSRKAISKDQLRELAVGLEASGHRFLWVVKSTVVDRDDEAELSELLGEGFLERVQGRGMVTKGWVEQEEVLKQESIGLFISHCGWNSVTEAAANGLPVLAWPRFGDQRVNAGVVARSGLGVWEERWSWEGEEGTVSGHNIAEKVKTVMADKTVRNKAVSVQDAAAEAVADGGTSYRSLAQFVQRCRDLSVSK*

>TaCGT2-A(SEQ ID NO:11)

MASSSRDDRAGAAAPRPRIVLLPSAGMGHLAPFSRLAAALSSGHACDVSLVTVLPTVSSAESGQLDALFAAFPAVRRLDFHLPPLDAPELSGADPFYVHYEATRRSARLLAPLLAAADASALIADISLASVLIPVASELRLPCYVFFTASATMFSFYAYYPTYLDATGAGDADVPGVYRIPKSSFPQALHDRNNLFTQQFVANGRSLSKADGLLINTFDDLEPEAVTALRQGSVVPGFPPVFTVGPLSPVSFPARASSDYSAWLDAQPERSVVYVSFGSRKALARDQLSELADGLEASGCRFLWVVKGAVVDKDDGAELSELLGEGFLQRVSGRALVTKAWVEQGEVLKHPAIGMFVSHCGWNSLTEAFATGVPVLAWPRFADQRVNAGIVARCGAGVWVERWSWEGDDGVVKGEEIAEKVKSVMADEMLRRSSTVVREAATTAVAGGGTSYRSLAELVARCCHGSALQ*

>TaCGT2-B(SEQ ID NO:12)

MASSPRDDRAGAAAPRPRIVLLPSASMGHLAPFSRLAAALSSGHACDVSLVTVLPTVSSAESGQLDALFAAFPAVRRLDFQLPPLDAPELSGADPFYVHYEATRRSARLLAPLLAAADASVLVADISLASVLIPVASELRLPCYVFFTASATMFSFYAYYPTYLDAAGAGDADVPGVYRIPKSSFPQALHDRNNLFTQQFVANGRSLSKADGLLINTFDALEPEAVTALRQGSVVPGCPPVFTVGPLSPVSFPARASADYSACLDAQPERSVVYVSFGSRKALARDQLSELADGLEASGCRFLWVVKGAVVDKDDGAELSELLGEGFLQRVSGRALVTKAWVEQGEVLKHPAIGMFVSHCGWDSLTEAFATGVPVLAWPRFADQRVNAGIVARCGAGVWVERWSWEGDEGVVKGEEIAEKVKSVMANEMLRRSSTMVREAAMTAVAGGGTSYRSLAELVARCCDGSASQ*

>TaCGT2-D(SEQ ID NO:13)

MASSSRDDRAGAAAPRPRIVLIPSAGMGHLAPFSRLAAALSSGHTCNVSLVTVLPTVSSAESGHLDALFAAFPAVRRLDFQLPPLDAPELSGADPFYVHYEATRRSARLLAPLLAAADASALVADISLASVLIPVASELRLPCYVFFTASATMFSFYAYYPTYLDAAGAGDADVPGVYRIPKSSFPQALHDRNNLFTQQFVANGQSLSKADGLLINTFDALEPEAVTALRQGSVVPGFPPVFNVGPLSPVSFPARASSDYSAWLDAQPERSVVYVSFGSRKALARDQLSELADGLEASGCRFLWVVKGTVVDKDDGAELSELLGEGFLQRVSGRALVTKAWVEQGEVLKHPAIGMFVSHCGWNSLTEAFASGVPVLAWPRFADQRVNAGIVARRGAGVWVERWSWEGDDGVVKGEEIAEKVKSVMADEMLRRSSTVVREAAMTAVAGGGTSYRSLAELVARCCDGSASNAPSEA*

>ZmCGT4(SEQ ID NO:14)

MSSPAPSSASRSSHGSRGSPRIVLFPSAGMGHLVPFTRLAVALSAGHGCEISLLTALPTVSSAESRHIAALYAAFPAIRQLDLRFAPFDASSEFPGADPFYLRYEALRRCAPSLLGPLLAGAGASALVVDMALASVAIPVARELHVPCFVFFTASATMLSFKAYFPTYLDDVGAGHGVGDVDVPGVYRIPSSSVPQALHDPDNIFTRQFVANGRALATADGLLVNAFHAMEPEAVEALQGRFVLSVLPPVFAVGPLMPVNDLRETGEAAQKQGNYRAWLDEQPPRSVVYVSFGSRKALPKDQIKELAAGLEACGHRFLWVVKGAVVDRDDAGELSELLGEAFLRRVHGRGLVTKSWVEQEEVLRHPAVALFVSHCGWNSVTEAVSSGVPVLAWPRFADQRVNARVVVRCGLGVWADQWSWEGEEALVRAEEITALVMEAMEDDAMAVKAANVREAASRAVVDGGTSYRSLAAFVRRCTA*

>ZmCGT5(SEQ ID NO:15)

MSSPAPSSPSRSSHGSRSSPRIVLFPSAGMGHLVPFTRLAVALSAGHGCDISLVTALPTVSSAESRHIAALYAAFPAIRQLDLRFAPFDASSEFPGADPFYLRYEALRRCAPSLLGPLLAGAGASALVVDMALASVAIPVARELHVPCFVFFTASATMLSFKAYFPTYLDDVGAGHGVGDVDVPGVYRIPSSSVPQALHDPDNIFTRQFVANGRALATADGLLVNAFHAMEPEAVEALQGRFVLSVLPPVFAVGPLMPVNDLRETGEAAQKQGNYRAWLDEQPPRSVVYVSFGSRKALPKDQIKELAAGLEACGHRFLWVVKGAVVDRDDAGELSELLGEAFLRRVHGRGLVTKSWVEQEEVLRHPAVALFVSHCGWNSVTEAVSSGVPVLAWPRFADQRVNARVVVRCGLGVWADQWSWEGEEALVRAEEITALVMEAMEDDAMAVKAANVREAASRAVVDGGTSYRSLAAFVRRCTA*

>BdCGT1(SEQ ID NO:16)

>SiCGT1(SEQ ID NO:17)

MPTSGDHSGARPHVVLLPSAGMGHLVPFGRLAVALSAGHGCDVSVAAVLPTVSSAEARHLEALFAAADPAVRRLDFRLAPFDASEFPGADPFFLRFEAMRRSAPLLGPLLATAGASAVVTDIVLASVVLPVARECGVPCYVLFTASAAMLAFCAHFPGYLDANSAAGRAGVVGDVDIPGVYRIPKSSVPQALHDPKHLFTQQFVANGRGLVDADGILVNTFDALEPEAVTALRKGKVVSSFPLVFAVGPLLPVMFPAKDPAGYMQWLDAQPARSVVYVSFGSRTAISPDQLLELAAGLEASGHRFLWVVKSTVVDRDDAGELGDLLGHGFLERVRGRALVTKGWVEQEEILQHGSVGLFVSHCGWNSVTEAAAFGVPVLAWPRFGDQRINAAVVTRGGLGAWEERWSWDGEEGLVSGEEVGEKIKAVMADETVAKKAAAVGDAAAAAATSKGGTSYRSLAEFVGRCRDAGSRQDR*

>SiCGT2(SEQ ID NO:18)

MSSPPPPNSTSDDCQGTAATPHIVLFPSAGMGHLVPFTRLAVALSAGHCCDVSLVTALPTVSSAESCHIAALFAAFPAVRRLDLRLAPLDASSEFPGADPFYVRYEALRRSTPLLLGPLLAGASASALVADIALASVAIPVARELRVPCYVFFTASATMLSFKAYFPTYLDANGGAGHSVGDVDVPGVCRVPRSSIPQALHDPDDIFTRQFVANGRALVAADGLLVNAFEAMEPEAVAALLGGSVVASLPPVFAVGPLMPLNLREAAEEQGNYRAWLDAQPPRSVVYVSFGSRKALARDQIRELAAWLEACGHRFLWVVKGAVVDRDDACELSDLLGEGFQRRVEGRGLVTKSWVEQDEVLRHPAVGLFVSHCGWNSVTEAAANGVPVLAWPRFADQRVNARVVARAGFGVWVERWSWEGEEAVVGAEEIAEQVVAAMGDQAVAEKAASVRDEAARAVADGGTSQQSLAEFVRRCRGGLAGPGTDLGRTWTARG*

>OsCGT(SEQ ID NO:19)

MPSSGDAAGRRPHVVLIPSAGMGHLVPFGRLAVALSSGHGCDVSLVTVLPTVSTAESKHLDALFDAFPAVRRLDFELAPFDASEFPSADPFFLRFEAMRRSAPLLGPLLTGAGASALATDIALTSVVIPVAKEQGLPCHILFTASAAMLSLCAYFPTYLDANAGDGGGVGDVDIPGVYRIPKASIPQALHDPNHLFTRQFVANGRSLTSAAGILVNTFDALEPEAVAALQQGKVASGFPPVFAVGPLLPASNQAKDPQANYMEWLDAQPARSVVYVSFGSRKAISGEQLRELAAGLETSGHRFLWVVKSTVVDRDDAAELGELLGEGFLKRVEKRGLVTKAWVDQEEVLKHESVALFVSHCGWNSVTEAAASGVPVLALPRFGDQRVNSGVVARAGLGVWADTWSWEGEAGVIGAEEISEKVKAAMADEALRRKAASLAKAAAKAVAGGGSSHRCLVEFARLCQGGTCRTN*

>ZmCGT(SEQ ID NO:20)

MAANGGDHTSARPHVVLLPSAGMGHLVPFARLAVALSEGHGCNVSVAAVQPTVSSAESRLLDALFVAAAPAVRRLDFRLAPFDESEFPGADPFFLRFEATRRSAPLLGPLLDAAEASALVTDIVLASVALPVARERGVPCYVLFTSSAAMLSLCAYFPAYLDAHAAAGSVGVGVGNVDIPGVFRIPKSSVPQALHDPDHLFTQQFVANGRCLVACDGILVNTFDAFEPDAVTALRQGSITVSGGFPPVFTVGPMLPVRFQAEETADYMRWLSAQPPRSVVYVSFGSRKAIPRDQLRELAAGLEASGKRFLWVVKSTIVDRDDTADLGGLLGDGFLERVQGRAFVTMGWVEQEEILQHGSVGLFISHCGWNSLTEAAAFGVPVLAWPRFGDQRVNAALVARSGLGAWEEGWTWDGEEGLTTRKEVAKKIKGMMGYDAVAEKAAKVGDAAAAAIAKCGTSYQSLEEFVQRCRDAERK*

以基因组DNA为模板，通过PCR扩增候选糖基转移酶基因：PhCGT1(SEQ ID NO:1)、PgCGT1(SEQ ID NO:2)、PpCGT1(SEQ ID NO:3)、PhCGT2(SEQ ID NO:4)、OsCGT2(SEQ ID NO:5)、SbCGT1(SEQ ID NO:6)、SbCGT2(SEQ ID NO:7)、TaCGT1-A(SEQ ID NO:8)、TaCGT1-B(SEQID NO:9)、TaCGT1-D(SEQ ID NO:10)、TaCGT2-A(SEQ ID NO:11)、TaCGT2-B(SEQ ID NO:12)、TaCGT2-D(SEQ ID NO:13)、ZmCGT4(SEQ ID NO:14)、ZmCGT5(SEQ ID NO:15)、BdCGT1(SEQ ID NO:16)、SiCGT1(SEQ ID NO:17)、SiCGT2(SEQ ID NO:18)、OsCGT(SEQ ID NO:19)、ZmCGT(SEQ ID NO:20)。PCR引物如表1所示。其中，PhCGT1、PgCGT1、PpCGT1使用同样引物对(Ph708UGT1-F/Ph708UGT1-R)扩增；TaCGT1-B、TaCGT2-B、SiCGT1、ZmCGT为人工合成并经大肠杆菌密码子优化。

表1、克隆糖基转移酶所使用的引物

PCR扩增体系25μL(PrimeSTAR Max Premix，12.5μL；Primer 1/Primer 2终浓度0.2μM；gDNA<50ng；剩余体积用灭菌蒸馏水补足)。PCR反应条件：98℃预变性2min，然后98℃变性10s，55℃退火15s，72℃延伸10s，30个循环，72℃延伸10min，琼脂糖电泳检测，扩增得到约1.5kb的片段。纯化后片段使用无缝克隆的方式连入相同NdeI/NotI消化过的pET28a载体，连接产物转化大肠杆菌DH10B感受态细胞，测序确认序列。

2.碳苷糖基转移酶的蛋白表达

将重组质粒转化到大肠杆菌BL21(DE3)的感受态细胞中，在固体LB培养基(卡那霉素50μg/mL)37℃培养过夜。挑取单个克隆到2mL LB液体培养基(卡那霉素50μg/mL)，转接过夜培养的菌液到新的LB液体抗性培养基100mL中37℃，250rpm培养至OD₆₀₀＝0.5～0.6，水浴降温至16℃左右，然后加入诱导剂IPTG至终浓度0.1mM，转至16℃低温诱导培养，在摇床转速180r/min条件下继续培养20h。携带pET28a空质粒的BL21(DE3)重组菌株作为空白对照，培养操作同上。离心收菌(6000r/min，5min)，使用1mL破菌缓冲液Buffer A(20mM Tris-HCl，pH 8.0；100mM NaCl)重悬，加入DNase至终浓度为5μg/mL，Mg²⁺终浓度为2mM，蛋白酶抑制剂PMSF终浓度为1mM，冰上孵育30min后超声破碎；冷冻离心(10000rpm，30min，4℃)，通过0.2μm滤膜过滤，获得上清粗酶液，加入20％甘油冷冻保存(-20℃)。

3.碳苷糖基转移酶的体外功能鉴定

体外酶催化测定体系为100μL，反应体系包括：0.1mM的糖基受体(根皮素或2-羟基柚皮素)，0.3mM的UDP葡萄糖，25μL上清粗酶液，用Buffer A补足体积到100μL，于37℃反应2h。待反应结束后，加等体积甲醇终止反应，使用HPLC进行产物分析。HPLC检测条件：色谱柱：反相C18 column[SilGreen ODS column(

4.6×250mm)]，检测波长为280nm；流动相：乙腈(0.1％甲酸)-水(0.1％甲酸)混合物梯度洗脱，在0到20min内比例由5:95升到100:0，流速1mL/min。

根据HPLC检测结果1(图1A)，PhCGT1、PgCGT1、PpCGT1、PhCGT2、OsCGT2、SbCGT1、SbCGT2、TaCGT1-A、TaCGT1-B、TaCGT1-D、TaCGT2-A、TaCGT2-B、TaCGT2-D、ZmCGT4、ZmCGT5、BdCGT1、SiCGT1、SiCGT2、OsCGT、ZmCGT能够将底物根皮素(phloretin)转化为保留时间较小的产物。上述产物经负离子模式高分辨质谱检测确认分子式为C₂₁H₂₄O₁₀，二级质谱显示出己糖碳苷特征性的[M-H-90]—、[M-H-120]—碎片离子峰(图2)。经过一维核磁(¹H NMR、¹³CNMR)、二维核磁HMBC波谱鉴定该碳苷糖基化产物为Nothofagin(图3)。

同时，上述20条碳苷糖基转移酶可以将底物2-羟基柚皮素(2-hydroxynaringenin)转化为其糖基化产物(图1B)。该产物经负离子模式高分辨质谱检测确认分子式为C₂₁H₂₂O₁₁，二级质谱显示出己糖碳苷特征性的[M-H-120]—碎片离子峰(图4)，提示该产物为2-羟基柚皮素-C-葡萄糖苷(2-hydroxynaringenin-C-glucoside)。

本发明人对于新发现的碳苷糖基转移酶进行酶动力学参数的测定，发现PhCGT1和PgCGT1对于2-羟基柚皮素的K_m值为所有碳苷糖基转移酶中最低，分别达到了1.75±0.66和2.75±0.75μM(图5)。K_m值为酶促反应的速度为最大反应速度一半时的底物浓度，K_m值越低说明所述碳苷糖基转移酶的酶催化活性高。

此外，本发明人还发现SbCGT1、TaCGT1-A、TaCGT1-D、SiCGT1、OsCGT和ZmCGT不仅可以催化根皮素在3’位置糖基化，更可以对3’位已被糖基化的根皮素进行进一步5’位的碳苷糖基化，从而产生一个二氢查尔酮双碳苷(根皮素-3’,5’-C-葡萄糖碳苷，图1A)。该产物经负离子模式高分辨质谱检测确认分子式为C₂₇H₃₄O₁₅，二级质谱显示出双己糖碳苷特征性的[M-H-180]—、[M-H-210]—、[M-H-240]—碎片离子峰(图6)。

实施例2、以本发明的糖基转移酶合成牡荆素、异牡荆素、荭草苷和异荭草苷本实施例中，应用PhCGT1在大肠杆菌合成牡荆素(vitexin)、异牡荆素(isovitexin)、荭草苷(orientin)和异荭草苷(isoorientin)

黄酮-C-单葡糖苷的预测的生物合成途径如图11。箭头TAL(或PAL)、4CL、CHS、CHI代表负责柚皮素生物合成的主要酶。箭头F2H、F3’H是黄烷酮2-羟化酶(F2H)和黄烷酮3’-羟化酶(F3’H)，其构成羟基化黄烷酮的骨架。C-糖基转移酶(CGT)用箭头CGT表示。在形成C-糖基化中间体后，脱水反应在酸性溶剂中自发发生(箭头H⁺)或由脱水酶(箭头DH)催化。

1、质粒构建

(1)黄烷酮柚皮素(naringenin)合成前体基因的表达盒构建

将人工合成并经密码子优化的前体合成基因序列构建到pET28a载体上获得pET28-RtPAL，pET28-Pc4CL，pET28-PxhCHS和pET28a-MsCHI。其中，PxhCHS：GenBank登录号KF765781；MsCHI：GenBank登录号KF765782；Pc4CL：GenBank登录号KF765780；RtPAL：GenBank登录号AAA33883。

以pET28-Pc4CL为模板，4CL-F-NcoI/4CL-R-BamHI为引物对扩增Pc4CL片段，与NcoI/BamHI双酶切的pCDFDuet-1载体连接获得pYH40。

以pET28-PxhCHS为模板，CHS-F-NdeI/CHS-R-XhoI为引物对扩增PxhCHS片段，与NdeI/XhoI双酶切的pYH40连接获得pYH50。

以pET28-MsCHI为模板，T7CHI-F-XhoI/CHI-R-AvrII为引物对扩增McCHI片段，与XhoI/AvrII双酶切的pYH50连接，获得质粒pYH51。

以pET28-RtPAL为模板，T7PAL-F-BamHI/PAL-R-HindIII为引物对扩增RtPAL片段，与BamHI/HindIII双酶切的pYH51连接，获得质粒pYH55(pYH055)用于柚皮素(naringenin)合成的从头合成(图7A)。PCR引物如表2所示。

表2、柚皮素合成前体基因的表达盒构建所使用的引物

引物	序列(SEQ ID NO:)
		4CL-F-NcoI	tataccatgggtgactgcgttgccccg(47)
4CL-R-BamHI	cgggatccttacttcggcaggtcgccgctc(48)
		T7PAL-F-BamHI	cgggatcccttatgcgactcctgcattag(49)
PAL-R-HindIII	gcccaagcttttatgccagcatcttc(50)
		CHS-F-NdeI	agatatacatatggttacggtggaagaatac(51)
CHS-R-XhoI	ccgctcgagttaggtagccacactatgcag(52)
		T7CHI-F-XhoI	ccgctcgagctagaaataattttgtttaac(53)
RbsCHI-F-XhoI	ccgctcgagcgatcccgcgaaattaatacg(54)
		CHI-R-AvrII	gagcctaggttagttaccgattttaaag(55)

(2)黄烷酮-2-羟基化酶/CPR表达盒构建

以人工合成的黄烷酮-2-羟基化酶编码基因OsCYP93G2(密码子优化)、ZmCYP93G5(密码子优化)或SbCYP93G3(密码子优化)的克隆载体为模板，通过PCR扩增所述三个P450基因。对上述三个基因进行相应于其蛋白的N端改造，截去N端跨膜区域并加载标签2B1(序列为MAKKTSSKGKLPPGPS)。

OsCYP93G2：GenBank登录号XP_015642954.1，截去N端第1～26位残基，加载2B1，其编码基因以常规方法进行大肠杆菌偏好的密码子优化；

ZmCYP93G5：GenBank登录号XP_008660140.1，截去N端第1～29位残基，加载2B1，其编码基因以常规方法进行大肠杆菌偏好的密码子优化；

SbCYP93G3：GenBank登录号XP_002461286.1，截去N端第1～37位残基，加载2B1，其编码基因以常规方法进行大肠杆菌偏好的密码子优化；

以拟南芥cDNA为模板，通过PCR扩增AtCPR2基因(GenBank登录号ABB88839.2，用于与P450组合，提供还原力)。

将改造后的P450基因使用引物对CZ201-F/R、CZ203-F/R、CZ229-F/R分别扩增，通过无缝克隆法插入pDuet-1载体多克隆位点1的NcoI和BamHI之间，AtCPR2使用引物对CPR-F/NotI-trCPR-R扩增后插入pDuet-1载体多克隆位点2的NdeI和XhoI位点之间，分别构成质粒pCZ201、pCZ203和pCZ229(图7B)。PCR引物如表3所示。

表3、构建pCZ201、pCZ203和pCZ229所使用的引物

(3)黄烷酮-2-羟基化酶/黄烷酮-3’羟基化酶/CPR表达盒构建

以人工合成的黄烷酮-3’-羟基化酶AtCYP75B1(密码子优化)、OsCYP75B3(密码子优化)的克隆载体为模板，通过PCR扩增所述P450基因。对所述基因进行N端改造，截去N端跨膜区域并加载标签2B1(序列为MAKKTSSKGKLPPGPS)。

AtCYP75B1：GenBank登录号NP_196416.1，截去’N端第1～21位残基，加载2B1，常规方法进行大肠杆菌偏好的密码子优化；

OsCYP75B3：GenBank登录号XP_015613041.1，截去’N端第1～26位，加载2B1，常规方法进行大肠杆菌偏好的密码子优化；

将改造后的P450基因使用引物对CZ261-F/R和CZ265-F/R分别扩增，与黄烷酮-2-羟基化酶中较优的ZmCYP93G5编码基因通过融合PCR分别连接。将连接后的双元P450组合通过无缝克隆法插入pDuet-1载体多克隆位点1的NcoI和BamHI之间，AtCPR2使用引物对CPR-F/NotI-trCPR-R(表3)扩增后插入pDuet-1载体多克隆位点2的NdeI和XhoI位点之间，构成质粒pCZ261和pCZ265(图8)。PCR引物如表4所示。

表4、构建pCZ261和pCZ265所使用的引物

(4)PhCGT1表达质粒构建

以毛竹基因组DNA为模板，通过PCR(引物见表1)扩增PhCGT1。将扩增后片段纯化，并使用无缝克隆的方式连入相同NdeI/NotI消化过的pET28a载体，构成质粒pCZ86。

2、用于牡荆素/异牡荆素合成的工程菌构建及发酵

将携带柚皮素合成基因的质粒pYH55，新型糖基转移酶PhCGT1的质粒pCZ86分别与携带黄烷酮-2-羟基化酶/CPR表达盒的质粒pCZ201、pCZ203和pCZ229进行三质粒共转，转化至大肠杆菌BL21(DE3)中，获得从头发酵合成工程菌株sCZ2、sCZ4和sCZ29。

挑取上述工程菌株单克隆，接种于10mL MOPS培养基中(Spe＝50μg/mL，Amp＝100μg/mL，Kan＝50μg/mL)，37℃培养OD₆₀₀＝0.5，降温至22℃，添加IPTG(终浓度100μM)，22℃，200rpm条件下进行发酵，持续5日。培养结束后收取样品，将菌液离心，获得上清液和菌体。菌体用水混悬，经破碎后用乙酸乙酯、正丁醇萃取；上清液用乙酸乙酯、正丁醇萃取，合并萃取液。将萃取液蒸发后用甲醇复溶，进行LC-MS分析。

发酵结果显示(图9)，经5日发酵后，发酵液中能够检测出牡荆素和异牡荆素，比例约为4：6，同时发酵液中能够检测出中间体2-羟基柚皮素-C-葡萄糖苷(即：2-羟基柚皮素-6(8)-C-葡萄糖苷)。

因此，本发明的碳苷糖基转移酶(如PhCGT1)能够特异和高效地催化2-羟基黄烷酮(开环形式)类化合物(如2-羟基柚皮素)的碳苷葡萄糖基化，从而产生一类碳苷-2-羟基黄烷酮类化合物(如2-羟基柚皮素-C-葡萄糖苷)；这类化合物通过进一步的脱水反应形成黄酮碳苷(类)化合物(如牡荆素和异牡荆素)。

3、用于荭草苷/异荭草苷合成的工程菌构建及发酵

将携带柚皮素合成基因的质粒pYH55，新型糖基转移酶PhCGT1的质粒pCZ86分别与携带黄烷酮-2-羟基化酶/黄烷酮-3’-羟基化酶/CPR表达盒的质粒pCZ261和pCZ265进行三质粒共转，转化至大肠杆菌BL21(DE3)中，获得从头发酵合成工程菌株sCZ63和sCZ67。

发酵结果显示(图10)，经5日发酵后，发酵液中能够检测出荭草苷和异荭草苷的混合物，比例约为4：6。同时发酵液中能够检测到一定比例的(占比约20～25％)未经3’羟基化修饰的牡荆素和异牡荆素。在菌株sCZ63中检测到中间体2-羟基柚皮素-C-葡萄糖苷和2-羟基圣草酚-C-葡萄糖苷的积累。

因此，本发明的碳苷糖基转移酶(如PhCGT1)能够特异和高效地催化二氢查尔酮、2-羟基黄烷酮(开环形式)类化合物(如2-羟基圣草酚)的碳苷葡萄糖基化，从而产生一类碳苷二氢查尔酮类化合物(如2-羟基圣草酚-C-葡萄糖苷)；这类化合物通过进一步的脱水反应形成黄酮碳苷(类)化合物(如荭草苷和异荭草苷)。

实施例3、以本发明的糖基转移酶合成维采宁-2

本实施例中，以TaCGT1-D在大肠杆菌合成维采宁-2(vicenin-2)。维采宁-2(芹菜素-6,8-双葡萄糖苷)的预测的生物合成途径如图12。TAL(或PAL)、4CL、CHS、CHI代表负责柚皮素生物合成的主要酶。箭头F2H是黄烷酮2-羟化酶(F2H)，其构成2-羟基黄烷酮的骨架。C-糖基转移酶(CGT)用箭头CGT表示。在形成C-糖基化中间体后，脱水反应在酸性溶剂中自发发生(箭头H⁺)。

1、质粒构建

(1)黄烷酮柚皮素(naringenin)合成前体基因的表达盒构建同实施例2。

(2)黄烷酮-2-羟基化酶/CPR表达盒构建同实施例2。

(3)TaCGT1-D表达质粒构建：以小麦基因组DNA为模板，通过PCR(引物见表1)扩增TaCGT1-D。将扩增后片段纯化，并使用无缝克隆的方式连入相同NdeI/NotI消化过的pET28a载体，构成质粒pCZ173。

2、用于维采宁-2合成的工程菌构建及发酵

将携带柚皮素合成基因的质粒pYH55，新型糖基转移酶TaCGT1-D的质粒pCZ173分别与携带黄烷酮-2-羟基化酶/CPR表达盒的质粒pCZ201进行三质粒共转，转化至大肠杆菌BL21(DE3)中，获得从头发酵合成工程菌株sCZ117。

挑取上述工程菌株单克隆，接种于10mL MOPS培养基中(Spe＝50μg/mL，Amp＝100μg/mL，Kan＝50μg/mL)，37℃培养OD₆₀₀＝0.5，降温至22℃，添加IPTG(终浓度100μM)，22℃，250rpm条件下进行发酵，持续5日。培养结束后收取样品，将菌液离心，获得上清液和菌体。菌体用水混悬，经破碎后用乙酸乙酯、正丁醇萃取；上清液用乙酸乙酯、正丁醇萃取，合并萃取液。将萃取液蒸发后用甲醇复溶，进行LC-MS分析。

发酵结果显示，经5日发酵后，发酵液中能够检测出维采宁2(图13)，同时发酵液中能够检测出中间体牡荆素与异牡荆素。

因此，本发明的碳苷糖基转移酶(如TaCGT1-D)能够特异和高效地催化2-羟基黄烷酮(开环形式)类化合物(如2-羟基柚皮素)的双葡萄糖碳苷糖基化，从而产生一类双葡萄糖碳苷-2-羟基黄烷酮类化合物(如2-羟基柚皮素-C-双葡萄糖苷)；这类化合物通过进一步的脱水反应形成双葡萄糖碳苷黄酮(类)化合物(维采宁-2)。

在本发明提及的所有文献都在本申请中引用作为参考，就如同每一篇文献被单独引用作为参考那样。此外应理解，在阅读了本发明的上述讲授内容之后，本领域技术人员可以对本发明作各种改动或修改，这些等价形式同样落于本申请所附权利要求书所限定的范围。

序列表

<110> 中国科学院上海生命科学研究院

<120> 新型碳苷糖基转移酶及其应用

<130> 196900

<160> 67

<170> SIPOSequenceListing 1.0

<210> 1

<211> 472

<212> PRT

<213> 毛竹(Phyllostachys edulis)

<400> 1

Met Pro Thr Ser Gly Gly Arg Thr Gly Asp Arg Pro His Val Ile Leu

1 5 10 15

Leu Pro Ser Ala Gly Met Gly His Leu Val Pro Phe Ser Arg Leu Ala

20 25 30

Val Ala Leu Ser Ser Gly His Gly Cys Asp Val Ser Val Val Ala Val

35 40 45

Leu Pro Thr Val Ser Ala Ala Glu Ser Arg His Leu Gln Gly Leu Leu

50 55 60

Asp Ala Ser Pro Ala Val Arg Arg Leu Asp Leu His Leu Ala Pro Phe

65 70 75 80

Asp Glu Ser Glu Phe Pro Gly Ala Asp Pro Phe Phe Leu Arg Phe Glu

85 90 95

Ala Met Arg Arg Ser Ala Pro Leu Leu Gly Pro Leu Leu Ala Asp Thr

100 105 110

Gly Ala Ser Ala Leu Val Thr Asp Ile Ala Leu Ala Ser Val Val Ile

115 120 125

Pro Val Ala Lys Glu Ile His Leu Pro Cys Tyr Val Leu Phe Thr Ala

130 135 140

Ser Ala Ala Met Leu Ser Phe Cys Ala Tyr Phe Pro Thr Tyr Leu Asp

145 150 155 160

Thr Asn Ala Gly Arg Val Val Gly Asp Val Asp Ile Pro Gly Val Tyr

165 170 175

Arg Ile Pro Lys Ala Ser Ile Pro Gln Ala Leu His Asp Pro Asn His

180 185 190

Leu Phe Thr Arg Gln Phe Val Ala Asn Gly Gln Asp Leu Ala Lys Ala

195 200 205

Asp Gly Val Leu Val Asn Thr Phe Asp Ala Leu Glu Leu Glu Ala Val

210 215 220

Thr Ala Leu Arg Gln Gly Ser Val Ala Ala Gly Phe Pro Pro Val Phe

225 230 235 240

Ser Val Gly Pro Leu Val Thr Val Asn Leu Pro Ala Gly Glu Ala Ala

245 250 255

Lys Glu Ser Gly Asn Asp Tyr Met Tyr Trp Leu Asp Ala Gln Pro Ala

260 265 270

Gln Ser Val Val Tyr Val Ser Phe Gly Ser Arg Lys Ala Ile Ser Arg

275 280 285

Asp Gln Val Arg Glu Leu Ala Ile Gly Leu Glu Ala Ser Gly Gln Pro

290 295 300

Phe Leu Trp Val Val Lys Ser Thr Val Val Asp Arg Asp Asp Ser Ala

305 310 315 320

Glu Leu Ser Glu Leu Leu Gly Glu Gly Phe Leu Glu Arg Val Gln Gly

325 330 335

Gln Gly Phe Val Thr Lys Ala Trp Val Glu Gln Glu Glu Val Leu Lys

340 345 350

His Glu Ser Ile Gly Leu Phe Ile Ser His Cys Gly Trp Asn Ser Val

355 360 365

Thr Glu Ala Ala Ala Ser Gly Val Pro Val Leu Ala Trp Pro Arg Phe

370 375 380

Gly Asp Gln Arg Val Asn Ala Gly Val Val Ala Arg Gly Gly Leu Gly

385 390 395 400

Val Trp Val Glu Arg Trp Ser Trp Glu Gly Glu Glu Asp Val Val Ser

405 410 415

Gly Glu Glu Ile Ala Glu Lys Val Lys Ala Val Met Ala Asp Glu Thr

420 425 430

Val Arg Lys Lys Ala Ala Ser Val Gly Glu Ala Ala Val Lys Glu Phe

435 440 445

Ala Asp Gly Gly Thr Ser Tyr Arg Ser Leu Thr Glu Phe Val Arg Arg

450 455 460

Cys Arg Asp Leu Ala Val Leu Asp

465 470

<210> 2

<211> 472

<212> PRT

<213> 淡竹(Phyllostachys glauca)

<400> 2

Met Pro Thr Ser Gly Ser Arg Thr Gly Gly Arg Pro His Val Ile Leu

1 5 10 15

Leu Pro Ser Ala Gly Met Gly His Leu Val Pro Phe Ser Arg Leu Ala

20 25 30

Val Ala Leu Ser Ser Gly His Gly Cys Asp Val Ser Val Val Ala Val

35 40 45

Leu Pro Thr Val Ser Ala Ala Glu Ser Arg His Leu Gln Gly Leu Leu

50 55 60

Asp Ala Ser Pro Ala Val Arg Arg Leu Asp Leu His Leu Ala Pro Phe

65 70 75 80

Asp Glu Ser Glu Phe Pro Gly Ala Asp Pro Phe Phe Leu Arg Phe Glu

85 90 95

Ala Met Arg Arg Ser Ala Pro Leu Leu Gly Pro Leu Leu Ala Asp Thr

100 105 110

Gly Ala Ser Ala Leu Val Thr Asp Ile Ala Leu Ala Ser Val Val Ile

115 120 125

Pro Val Ala Lys Glu Ile His Leu Pro Cys Tyr Val Leu Phe Thr Ala

130 135 140

Ser Ala Ala Met Leu Ser Phe Cys Ala Tyr Phe Pro Thr Tyr Leu Asp

145 150 155 160

Thr Asn Ala Gly Arg Val Val Gly Asp Val Asp Ile Pro Gly Val Tyr

165 170 175

Arg Ile Pro Lys Ala Ser Ile Pro Gln Ala Leu His Asp Pro Asn His

180 185 190

Leu Phe Thr Arg Gln Phe Val Ala Asn Gly Gln Asp Leu Ala Lys Ala

195 200 205

Asp Gly Val Leu Val Asn Thr Phe Asp Ala Leu Glu Leu Glu Ala Val

210 215 220

Thr Ala Leu Arg Gln Gly Ser Val Ala Ala Gly Phe Pro Pro Val Phe

225 230 235 240

Ser Val Gly Pro Leu Val Thr Val Asn Leu Pro Ala Gly Glu Ala Ala

245 250 255

Lys Glu Ser Gly Asn Asp Tyr Met Tyr Trp Leu Asp Ala Gln Pro Ala

260 265 270

Arg Ser Val Val Tyr Val Ser Phe Gly Ser Arg Lys Ala Ile Ser Arg

275 280 285

Asn Gln Val Arg Glu Leu Ala Val Gly Leu Glu Ala Ser Gly Gln Arg

290 295 300

Phe Leu Trp Val Val Lys Ser Thr Val Val Asp Arg Asp Asp Ser Ala

305 310 315 320

Glu Leu Ser Glu Leu Leu Asp Glu Gly Phe Leu Glu Arg Val Gln Gly

325 330 335

Arg Gly Leu Val Thr Lys Ala Trp Val Glu Gln Glu Glu Val Leu Lys

340 345 350

His Glu Ser Ile Gly Leu Phe Ile Ser His Cys Gly Trp Asn Ser Val

355 360 365

Thr Glu Ala Ala Ala Ser Gly Val Pro Val Leu Ala Trp Pro Arg Phe

370 375 380

Gly Asp Gln Arg Val Asn Ala Gly Val Val Ala Arg Gly Gly Leu Gly

385 390 395 400

Val Trp Val Glu Arg Trp Ser Trp Glu Gly Glu Glu Gly Val Val Ser

405 410 415

Gly Glu Glu Ile Ala Glu Lys Val Lys Ala Val Met Ala Asp Glu Thr

420 425 430

Val Arg Lys Lys Ala Ala Ser Val Gly Glu Ala Ala Val Lys Glu Phe

435 440 445

Ala Asp Gly Gly Thr Ser Tyr Arg Ser Leu Thr Glu Phe Val Arg Arg

450 455 460

Cys Arg Asp Leu Ala Val Leu Asp

465 470

<210> 3

<211> 472

<212> PRT

<213> 高节竹(Phyllostachys prominens)

<400> 3

Met Pro Thr Ser Gly Ser Arg Thr Gly Gly Arg Pro His Val Ile Leu

1 5 10 15

Leu Pro Ser Ala Gly Met Gly His Leu Val Pro Phe Ser Arg Leu Ala

20 25 30

Val Ala Leu Ser Ser Gly His Gly Cys Asp Val Ser Val Val Ala Val

35 40 45

Leu Pro Thr Val Ser Ala Ala Glu Ser Arg His Leu Gln Gly Leu Leu

50 55 60

Asp Ala Ser Pro Ala Val Arg Arg Leu Asp Leu His Leu Ala Pro Phe

65 70 75 80

Asp Glu Ser Glu Phe Pro Gly Ala Asp Pro Phe Phe Leu Arg Phe Glu

85 90 95

Ala Met Arg Arg Ser Ala Pro Leu Leu Gly Pro Leu Leu Ala Asp Thr

100 105 110

Gly Glu Ser Ala Leu Val Thr Asp Ile Ala Leu Ala Ser Val Val Ile

115 120 125

Pro Val Ala Lys Glu Ile His Leu Pro Cys Tyr Val Leu Phe Thr Ala

130 135 140

Ser Ala Ala Met Leu Ser Phe Cys Ala Tyr Phe Pro Thr Tyr Leu Asp

145 150 155 160

Thr Asn Ala Gly Arg Val Val Gly Asp Val Asp Ile Pro Gly Val Tyr

165 170 175

Arg Ile Pro Lys Ala Ser Ile Pro Gln Ala Leu His Asp Arg Asn His

180 185 190

Leu Phe Thr Arg Gln Phe Val Ala Asn Gly Gln Asp Leu Ala Lys Ala

195 200 205

Asp Gly Val Leu Val Asn Thr Phe Asp Ala Leu Glu Leu Glu Ala Val

210 215 220

Thr Ala Leu Arg Gln Gly Ser Val Ala Ala Gly Phe Pro Pro Val Phe

225 230 235 240

Ser Val Gly Pro Leu Val Thr Val Asn Leu Pro Ala Gly Glu Ala Ala

245 250 255

Lys Glu Ser Gly Asn Asp Tyr Met Tyr Trp Leu Asp Ala Gln Pro Ala

260 265 270

Arg Ser Val Val Tyr Val Ser Phe Gly Ser Arg Lys Ala Ile Ser Arg

275 280 285

Asn Gln Val Arg Glu Leu Ala Val Gly Leu Glu Ala Ser Gly Gln Arg

290 295 300

Phe Leu Trp Val Val Lys Ser Thr Val Val Asp Arg Asp Asp Ser Ala

305 310 315 320

Glu Leu Ser Glu Leu Leu Asp Glu Gly Phe Leu Glu Arg Val Gln Gly

325 330 335

Arg Gly Leu Val Thr Lys Ala Trp Val Glu Gln Glu Glu Val Leu Lys

340 345 350

His Glu Ser Ile Gly Leu Phe Ile Ser His Cys Gly Trp Asn Ser Val

355 360 365

Thr Glu Ala Ala Ala Ser Gly Val Pro Val Leu Ala Trp Pro Arg Phe

370 375 380

Gly Asp Gln Arg Val Asn Ala Gly Val Val Ala Arg Gly Gly Leu Gly

385 390 395 400

Val Trp Val Glu Arg Trp Ser Trp Glu Gly Glu Glu Gly Val Val Ser

405 410 415

Gly Glu Glu Ile Ala Glu Lys Val Lys Ala Val Met Ala Asp Glu Thr

420 425 430

Val Arg Lys Lys Ala Ala Ser Val Gly Glu Ala Ala Val Lys Glu Phe

435 440 445

Ala Asp Gly Gly Thr Ser Tyr Arg Ser Leu Thr Glu Phe Val Arg Arg

450 455 460

Cys Arg Asp Leu Ala Val Leu Asp

465 470

<210> 4

<211> 471

<212> PRT

<213> 毛竹(Phyllostachys edulis)

<400> 4

Met Ala Ser Arg Ala Met Pro Ser Ser Ser Asp Arg Thr Gly Gly Ala

1 5 10 15

Pro Arg Val Val Leu Leu Pro Ser Ala Gly Met Gly His Leu Val Pro

20 25 30

Phe Gly Arg Leu Ala Val Ala Leu Ser Ser Gly His Ala Cys Asp Val

35 40 45

Ser Val Val Thr Val Leu Pro Thr Val Ser Ser Ala Glu Ser Lys His

50 55 60

Leu Gln Gly Leu Phe Asp Ala Phe Pro Ala Val Arg Arg Leu Asp Leu

65 70 75 80

His Leu Ala Pro Phe Asp Ala Ser Glu Phe Ser Asp Ala Asp Pro Phe

85 90 95

Tyr Val Arg Tyr Glu Ala Val Arg Arg Ser Ala Pro Leu Leu Gly Pro

100 105 110

Leu Leu Ala Asp Ala Asp Ala Ser Ala Leu Val Ala Asp Ile Ala Leu

115 120 125

Ala Ser Val Val Ile Pro Val Ala Lys Glu Leu Leu Ile Pro Cys Tyr

130 135 140

Ile Phe Phe Thr Ala Ser Ala Thr Met Phe Ser Leu Leu Ala Tyr Phe

145 150 155 160

Pro Thr Tyr Leu His Ser Asn Ala Gly His Ser Ile Gly Asp Val Asp

165 170 175

Val Pro Gly Val Tyr Arg Ile Pro Met Ser Ser Ile Pro Gln Ala Leu

180 185 190

His Asp Pro Asn Asn Leu Phe Thr Gln Gln Phe Val Ala Asn Gly Arg

195 200 205

Ser Leu Ala Glu Ala Asp Gly Leu Leu Val Asn Thr Phe Asp Ala Phe

210 215 220

Glu Pro Glu Ala Val Thr Ala Leu Arg His Gly Thr Val Ala Pro Gly

225 230 235 240

Phe Pro Pro Val Phe Ala Leu Gly Pro Leu Ser Pro Val Gly Phe Pro

245 250 255

Ala Gly Glu Ala Ala Arg Glu Ser Gly Asn Tyr Thr Thr Trp Leu Asp

260 265 270

Ala Gln Pro Ala Arg Ser Val Val Tyr Val Ser Phe Gly Ser Arg Lys

275 280 285

Ala Leu Leu Arg Asp Gln Leu Ser Glu Leu Ala Ala Gly Leu Glu Ala

290 295 300

Ser Gly Cys Arg Phe Leu Trp Val Val Lys Gly Thr Val Val Asp Arg

305 310 315 320

Asp Asp Asp Arg Glu Leu Arg Glu Leu Leu Gly Glu Val Phe Leu Gln

325 330 335

Arg Val Asn Gly Arg Ala Leu Val Thr Lys Ala Trp Val Glu Gln Glu

340 345 350

Glu Val Leu Lys His Pro Ala Val Gly Leu Phe Ile Ser His Cys Gly

355 360 365

Trp Asn Ser Val Thr Glu Ala Thr Val Ser Gly Val Pro Val Leu Ala

370 375 380

Trp Pro Arg Phe Ala Asp Gln Arg Val Ser Ala Gly Val Val Ala Arg

385 390 395 400

Arg Gly Leu Gly Val Trp Val Glu Arg Trp Ser Trp Glu Gly Glu Glu

405 410 415

Arg Val Val Thr Gly Asp Glu Ile Ala Glu Lys Val Lys Ser Val Leu

420 425 430

Ala Asp Glu Thr Leu Arg Lys Asn Ser Thr Met Val Arg Glu Ala Ala

435 440 445

Ala Ala Ala Val Ala Thr Gly Gly Thr Ser Tyr Arg Ser Leu Ala Lys

450 455 460

Phe Val Arg Arg Cys Ser Thr

465 470

<210> 5

<211> 485

<212> PRT

<213> 粳稻(Oryza Sativa japonica)

<400> 5

Met Cys Ser Ala Ala Thr Pro Asn Ser Gly Asp Val Arg Ala Thr Pro

1 5 10 15

Gly Ser Ser Arg Pro His Val Val Leu Leu Pro Ser Ala Gly Met Gly

20 25 30

His Leu Val Pro Phe Thr Arg Leu Ala Ala Ala Leu Cys Ser Gly His

35 40 45

Gly Cys Asp Val Ser Leu Val Ala Ala Val Pro Thr Val Ser Ser Ala

50 55 60

Glu Ala Arg His Leu Ala Ala His Phe Thr Ala Phe Pro Ala Val Arg

65 70 75 80

Arg Leu Glu Leu Asp Leu Ala Ser Leu Asp Val Ser Glu Phe Ala Gly

85 90 95

Ala Asp Pro Phe Tyr Val Arg Tyr Glu Ala Ile Arg Arg Ser Ala Ser

100 105 110

Leu Leu Ala Pro Leu Leu Ala Gly Gly Ala Ser Ala Ala Ala Ser Ala

115 120 125

Leu Val Ala Asp Ile Ala Leu Ala Ser Val Val Ile Pro Val Ala Lys

130 135 140

Asp Leu Arg Leu Pro Cys Tyr Val Phe Phe Thr Ala Ser Ala Thr Met

145 150 155 160

Phe Ser Phe Leu Ala Tyr Leu Pro Thr Tyr Leu Asp Ala Asn Ala Gly

165 170 175

Gly Gly His Ala Ile Gly Asp Val Asp Val Pro Gly Val Cys Arg Val

180 185 190

Pro Thr Ser Ser Val Pro Gln Ala Leu His Asp Pro Asp Asp Ile Phe

195 200 205

Thr Arg Gln Phe Ile Ala Asn Ala Arg Ser Leu Ala Asn Ala Asp Gly

210 215 220

Leu Val Val Asn Ala Phe Asp Ala Leu Glu Pro Glu Ala Val Ala Ala

225 230 235 240

Leu Arg Gln Gly Thr Val Ala Ala Gly Leu Pro Pro Val Phe Ala Val

245 250 255

Gly Pro Leu Ser Pro Ala Pro Ile Pro Ala Lys Asp Ser Gly Ser Tyr

260 265 270

Leu Pro Trp Leu Asp Ala Gln Pro Ala Arg Ser Val Val Tyr Val Ser

275 280 285

Phe Gly Ser Arg Lys Ala Leu Pro Arg Asp Gln Leu Ser Glu Leu Ala

290 295 300

Ala Gly Leu Glu Ala Ser Gly His Arg Phe Leu Trp Val Val Lys Gly

305 310 315 320

Ala Val Val Asp Arg Asp Asp Ala Gly Glu Leu Thr Asp Leu Leu Gly

325 330 335

Glu Ala Phe Leu Gln Arg Ile His Gly Arg Gly Leu Val Thr Met Ala

340 345 350

Trp Val Arg Gln Glu Glu Val Leu Asn His Pro Ser Val Gly Leu Phe

355 360 365

Ile Ser His Cys Gly Trp Asn Ser Val Thr Glu Ala Ala Ala Ser Gly

370 375 380

Val Pro Val Val Ala Trp Pro Arg Phe Ala Asp Gln Arg Val Asn Ala

385 390 395 400

Gly Val Val Ala Arg Ala Gly Ile Gly Val Trp Val Asp Thr Trp Ser

405 410 415

Trp Glu Gly Glu Asp Asp Gly Val Val Ser Ala Glu Asp Ile Ala Gly

420 425 430

Lys Val Arg Ser Ala Met Ala Asp Glu Gly Val Arg Lys Ala Ala Ala

435 440 445

Ser Val Arg Glu Ala Ala Ala Arg Ala Val Ala Ala Gly Gly Ser Ser

450 455 460

Tyr Arg Ser Leu Ala Glu Leu Val Arg Arg Cys Arg Asp Gly Leu Val

465 470 475 480

Ile Thr Asn Gly Met

485

<210> 6

<211> 487

<212> PRT

<213> 高粱(Sorghum bicolor)

<400> 6

Met Ala Pro Pro Ala Thr Lys Ser Leu Gly Glu Leu Asp Gly Gly Ala

1 5 10 15

Arg Pro His Val Met Phe Ile Pro Ser Ala Gly Met Gly His Leu Leu

20 25 30

Pro Phe Phe Arg Val Ile Ala Ala Leu Ala Ala His Asp Val Val Asp

35 40 45

Ile Ser Val Val Thr Val Leu Pro Thr Val Ser Ala Ala Glu Ala Asp

50 55 60

His Phe Ala Ser Leu Phe Ala Ala Leu Pro Arg Val Ser Arg Val Asp

65 70 75 80

Phe His Leu Leu Pro Phe Asp Ala Ser Ser Glu Phe Pro Gly His Asp

85 90 95

Pro Phe Leu Leu Arg Trp Glu Ala Leu Arg Arg Ser Ala His Leu Phe

100 105 110

Arg Pro Leu Ile Ala Gly Ala Ala Gly Pro Arg Val Ser Ala Val Val

115 120 125

Thr Asp Val Thr Leu Thr Ser His Val Ile Pro Ile Ala Lys Glu Leu

130 135 140

Gly Val Gln Cys His Val Leu Phe Val Ser Cys Ala Thr Met Leu Ser

145 150 155 160

Leu Ala Ala Tyr Thr Pro Val His Leu Asp Lys Lys Asn Lys Gly Glu

165 170 175

His Gly Pro Gly Val Gly Val Gly Val Gly Val Gly Asp Val Asp Ile

180 185 190

Pro Gly Val Arg Arg Ile Pro Gln Ser Tyr Leu Pro Gln Pro Leu Leu

195 200 205

Asp Leu Asn Lys Leu Phe Thr Lys Gln Phe Ile Asp Asn Gly Arg Glu

210 215 220

Ile Ile Asn Ala Asp Gly Phe Leu Val Asn Thr Phe Asp Ala Leu Glu

225 230 235 240

Pro Val Ala Leu Ala Ala Leu Arg Asp Gly Lys Val Val Ala Gly Phe

245 250 255

Pro Pro Val Tyr Ala Ile Gly Pro Leu Arg Ser Lys Glu Glu Glu Ala

260 265 270

Thr Thr Gly Ser Pro Pro Val Ala Trp Leu Asp Glu Gln Pro Ala Arg

275 280 285

Ser Val Val Tyr Val Ala Phe Gly Asn Arg Asn Ala Val Ser Leu Glu

290 295 300

Gln Ile Arg Glu Ile Ala Ala Gly Leu Glu Ala Ser Gly Cys Arg Phe

305 310 315 320

Leu Trp Val Leu Lys Thr Thr Thr Val Asp Arg Asp Asp Thr Ala Glu

325 330 335

Leu Thr Asp Asp Val Leu Gly Glu Gly Phe Leu Glu Arg Val Gln Gly

340 345 350

Arg Gly Leu Val Thr Lys Ala Trp Val Asp Gln Glu Ala Val Leu Lys

355 360 365

His Ala Ser Val Gly Leu Phe Leu Ser His Ser Gly Trp Asn Ser Val

370 375 380

Thr Glu Ala Ala Ala Ala Gly Val Pro Leu Leu Ala Trp Pro Arg Gly

385 390 395 400

Gly Asp His Arg Val Asn Ala Thr Val Val Val Ser Gly Gly Val Gly

405 410 415

Val Trp Met Glu Gln Trp Ser Trp Asp Gly Glu Asp Trp Leu Val Thr

420 425 430

Gly Glu Glu Ile Gly Lys Lys Val Lys Glu Val Met Ser Asp Ala Ala

435 440 445

Val Arg Ala Arg Ala Thr Arg Thr Gly Glu Glu Ala Ala Lys Ala Val

450 455 460

Ala Glu Gly Gly Thr Ser Tyr Arg Ser Met Gln Lys Phe Ile Ser Ser

465 470 475 480

Leu Lys Ala His Cys Ser Pro

485

<210> 7

<211> 476

<212> PRT

<213> 高粱(Sorghum bicolor)

<400> 7

Met Ala Pro Ser Ala Met Pro Ala Ser Gly Asp His Thr Gly Ala Thr

1 5 10 15

Pro His Val Val Leu Leu Pro Ser Ala Gly Met Gly His Leu Val Pro

20 25 30

Phe Ala Arg Leu Ala Val Ala Leu Ser Glu Gly His Gly Cys Asp Val

35 40 45

Ser Phe Ala Ala Val Leu Pro Thr Val Ser Ser Ala Glu Ser Arg His

50 55 60

Leu Arg Ala Leu Phe Ala Ala Ala Pro Ala Val Arg Arg Leu Asp Phe

65 70 75 80

Arg Leu Ala Pro Phe Asp Glu Ser Gln Phe Pro Gly Ala Asp Pro Phe

85 90 95

Phe Leu Arg Phe Glu Ala Leu Arg Arg Ser Ala Pro Leu Leu Gly Pro

100 105 110

Leu Leu Asp Ala Ala Gln Ala Ser Ala Leu Val Thr Asp Ile Val Leu

115 120 125

Ala Ser Val Val Leu Pro Val Ala Lys Ala Arg Gly Val Pro Cys Tyr

130 135 140

Val Leu Phe Thr Ser Ser Ala Ala Met Leu Ser Leu Cys Ala Tyr Phe

145 150 155 160

Pro Ala His Leu Asp Ala Asn Ala Ala Ala Gly Gly Gly Arg Leu Gly

165 170 175

Val Gly Asp Val Asp Ile Pro Gly Val Tyr Arg Ile Pro Lys Ser Ser

180 185 190

Val Pro Gln Ala Leu His Asp Pro Lys His Leu Phe Thr Gln Gln Phe

195 200 205

Val Ala Asn Gly Arg Gly Leu Val Ala Ala Asp Gly Ile Leu Val Asn

210 215 220

Thr Phe Asp Ala Phe Glu Pro Asp Ala Ile Thr Ala Leu Arg Gln Gly

225 230 235 240

Ser Val Val Ser Asp Phe Pro Pro Val Phe Ala Val Gly Pro Leu Gln

245 250 255

Pro Val Arg Phe Gln Val Ala Glu Lys Pro Ala His Tyr Met Arg Trp

260 265 270

Leu Ser Ala Gln Pro Ala Arg Ser Val Val Tyr Val Ser Phe Gly Ser

275 280 285

Arg Lys Ala Ile Ser Thr Asp Gln Leu Arg Glu Leu Ala Ala Gly Leu

290 295 300

Glu Ala Ser Gly Gln Arg Phe Leu Trp Val Val Lys Ser Thr Val Val

305 310 315 320

Asp Arg Asp Asp Ala Ala Asp Leu Ala Asp Leu Leu Gly Asp Gly Phe

325 330 335

Leu Glu Arg Val Gln Gly Arg Ala Phe Val Thr Lys Gly Trp Val Glu

340 345 350

Gln Glu Glu Ile Leu Gln His Gly Ser Val Gly Leu Phe Ile Ser His

355 360 365

Cys Gly Trp Asn Ser Val Thr Glu Ala Ala Ala Phe Gly Val Pro Val

370 375 380

Leu Ala Trp Pro Arg Phe Gly Asp Gln Arg Val Asn Ala Ala Val Val

385 390 395 400

Ala Arg Gly Gly Leu Gly Ala Trp Glu Glu Arg Trp Thr Trp Asp Gly

405 410 415

Glu Lys Gly Leu Val Thr Gly Glu Glu Val Ala Glu Lys Ile Asn Ala

420 425 430

Val Val Gly Asn Asp Val Val Ala Arg Lys Ala Ala Arg Val Gly Asp

435 440 445

Ala Ala Ala Ala Ala Ala Gly Lys Gly Gly Thr Ser Tyr Gln Ser Leu

450 455 460

Ala Asp Phe Val Gly Arg Cys Arg Asp Ala Gly Trp

465 470 475

<210> 8

<211> 472

<212> PRT

<213> 小麦(Triticum aestivum)

<400> 8

Met Pro Thr Ser Gly Asp Gly Pro Thr Ser Gln Pro His Val Val Leu

1 5 10 15

Leu Pro Ser Ala Gly Met Gly His Leu Val Pro Phe Ser Arg Leu Ala

20 25 30

Val Ala Leu Ser Ser Ala His Gly Cys Asp Val Ser Leu Val Thr Val

35 40 45

Leu Pro Thr Val Ser Ser Ala Glu Ser Ser His Leu Glu Ala Leu Phe

50 55 60

Gly Ala Phe Pro Ala Val Arg Arg Leu Glu Phe His Leu Ala Asp Phe

65 70 75 80

Asp Ala Ser Glu Phe Pro Asn Ala Asp Pro Phe Phe Leu Arg Phe Glu

85 90 95

Ala Met Arg Arg Ser Ala Pro Leu Leu Leu Gly Pro Leu Leu Ala Arg

100 105 110

Ala Ser Ala Thr Ala Leu Val Thr Asp Ile Ala Leu Ser Ser Val Val

115 120 125

Ile Pro Val Ala Lys Gln Leu Arg Leu Pro Cys Tyr Val Leu Phe Thr

130 135 140

Ala Ser Ala Ala Met Leu Ser Leu Cys Val His Phe Pro Ala Tyr Leu

145 150 155 160

Asp Ala Asn Gly Asn Gly Leu Val Gly Asp Val Asp Ile Pro Gly Val

165 170 175

Tyr Gln Ile Pro Lys Ala Ser Val Pro Gln Ala Leu His Asp Pro Lys

180 185 190

His Leu Phe Thr Arg Gln Phe Val Ala Asn Gly Arg Glu Leu Ala Lys

195 200 205

Ser Asp Gly Val Leu Val Asn Ser Phe Asp Ala Phe Glu Pro Glu Ala

210 215 220

Ile Ala Ala Leu Arg Glu Gly Ala Val Ser Ala Ala Gly Phe Phe Pro

225 230 235 240

Pro Val Phe Ser Val Gly Pro Leu Ala Pro Val Ser Phe Pro Ala Gly

245 250 255

Asn Asn Asn Arg Ala Asp Tyr Ile Gln Trp Leu Glu Ala Gln Pro Ala

260 265 270

Arg Ser Val Val Tyr Val Ser Phe Gly Ser Arg Lys Ala Val Ala Arg

275 280 285

Asp Gln Leu Arg Glu Leu Ala Ala Gly Leu Glu Ala Ser Gly His Arg

290 295 300

Phe Leu Trp Val Val Lys Ser Thr Val Val Asp Arg Asp Asp Asp Ala

305 310 315 320

Asp Leu Gly Glu Leu Leu Gly Glu Gly Phe Leu Glu Arg Val Gln Gly

325 330 335

Arg Gly Met Val Thr Lys Gly Trp Val Glu Gln Glu Asp Val Leu Lys

340 345 350

Gln Glu Ser Val Gly Leu Phe Ile Ser His Cys Gly Trp Asn Ser Val

355 360 365

Thr Glu Ala Ala Ala Gly Gly Leu Pro Val Leu Ala Trp Pro Arg Phe

370 375 380

Gly Asp Gln Arg Val Asn Ala Gly Val Val Ala Arg Ser Gly Leu Gly

385 390 395 400

Val Trp Val Asp Ser Trp Ser Trp Glu Gly Glu Glu Gly Val Val Ser

405 410 415

Gly Glu Ser Ile Ala Glu Lys Val Lys Ala Val Met Gly Asp Glu Ile

420 425 430

Ala Arg Asn Lys Ala Val Ser Val Arg Asp Ala Ala Ala Lys Ala Val

435 440 445

Ala Asp Gly Gly Thr Ser Tyr Arg Asn Leu Ala Arg Phe Ala Gln Arg

450 455 460

Cys Arg Asp Gly Arg Val Arg Glu

465 470

<210> 9

<211> 472

<212> PRT

<213> 小麦(Triticum aestivum)

<400> 9

Met Pro Thr Ser Gly Asp Gly Ser Gly Ala Leu Pro His Val Val Leu

1 5 10 15

Leu Pro Ser Ala Gly Met Gly His Leu Val Pro Phe Ser Arg Leu Ala

20 25 30

Val Ser Phe Ser Ser Ser Asp His Gly Cys Gly Val Ser Val Val Thr

35 40 45

Val Leu Pro Thr Val Ser Ser Ala Glu Ser Ala His Leu Asp Ala Leu

50 55 60

Phe Gly Ala Cys Pro Ala Val Arg Arg Leu Asp Phe His Leu Ala Arg

65 70 75 80

Phe Asp Ala Ser Glu Phe Pro Gly Ala Asp Pro Phe Phe Leu Arg Phe

85 90 95

Glu Ala Met Arg Arg Ser Ala Pro Leu Leu Gly Pro Leu Leu Ala Gly

100 105 110

Ala Gly Ala Ser Ala Leu Val Thr Asp Ile Ala Leu Ala Ser Val Val

115 120 125

Ile Pro Val Ala Arg Glu Leu Arg Leu Pro Cys Tyr Val Leu Phe Thr

130 135 140

Ala Ser Ala Ala Met Leu Ser Leu Cys Val His Phe Pro Ala Tyr Leu

145 150 155 160

Asp Ala Asn Ala Gly Gly Pro Val Gly Asp Val Asp Ile Pro Gly Val

165 170 175

Tyr Arg Val Pro Lys Ala Ser Ile Pro Gln Ala Leu His His Pro Glu

180 185 190

His Leu Phe Thr Arg Gln Phe Val Ala Asn Gly Arg Glu Leu Ala Lys

195 200 205

Ser Asp Gly Leu Leu Val Asn Ser Phe Asp Glu Phe Glu Pro Glu Ala

210 215 220

Ile Ser Ala Leu Arg Asp Gly Ser Val Ala Ala Gly Phe Pro Pro Val

225 230 235 240

Phe Ser Val Gly Pro Leu Ala Pro Val Ser Phe Ser Ala Gly Glu Pro

245 250 255

Pro Glu Asn Gln Ala Asp Tyr Met Arg Trp Leu Glu Ala Gln Pro Thr

260 265 270

Arg Ser Val Val Tyr Val Ser Phe Gly Ser Arg Lys Ala Ile Ser Lys

275 280 285

Asp Gln Leu Lys Glu Leu Ala Val Gly Leu Glu Ala Ser Gly His Arg

290 295 300

Phe Leu Trp Val Val Lys Ser Thr Val Val Asp Arg Glu Asp Glu Ala

305 310 315 320

Glu Leu Ser Glu Leu Leu Gly Glu Gly Phe Leu Glu Arg Val His Gly

325 330 335

Arg Gly Met Val Thr Lys Gly Trp Val Glu Gln Glu Glu Val Leu Lys

340 345 350

Gln Glu Ser Ile Gly Leu Phe Ile Ser His Cys Gly Trp Asn Ser Val

355 360 365

Thr Glu Ala Ala Ala Asn Gly Leu Pro Val Leu Ala Trp Pro Arg Phe

370 375 380

Gly Asp Gln Arg Val Asn Ala Gly Val Val Ala Arg Ser Gly Leu Gly

385 390 395 400

Val Trp Glu Glu Arg Trp Ser Trp Glu Gly Glu Glu Gly Val Val Ser

405 410 415

Gly Glu Asn Ile Ala Glu Lys Val Lys Ala Val Met Ala Asp Glu Thr

420 425 430

Val Arg Asn Lys Ala Val Ser Val Gln Asp Ala Ala Ala Lys Ala Val

435 440 445

Ala Asp Gly Gly Thr Ser Tyr Arg Ser Leu Ala Gln Phe Val Gln Arg

450 455 460

Cys Arg Asp Leu Ser Val Ser Lys

465 470

<210> 10

<211> 474

<212> PRT

<213> 小麦(Triticum aestivum)

<400> 10

Met Pro Thr Ser Gly Asp Ala Ser Gly Ala Leu Pro His Pro His Val

1 5 10 15

Val Leu Leu Pro Ser Ala Gly Met Gly His Leu Val Pro Phe Ser Arg

20 25 30

Leu Ala Val Ser Leu Ser Ser Pro Gly His Gly Cys Gly Val Ser Val

35 40 45

Ala Thr Val Leu Pro Thr Val Ser Ser Ala Glu Ser Ala His Leu Asp

50 55 60

Ala Leu Phe Gly Ala Cys Pro Ala Val Arg Arg Leu Asp Phe His Leu

65 70 75 80

Ala Pro Phe Asp Ala Ser Glu Phe Pro Gly Ala Asp Pro Phe Phe Leu

85 90 95

Arg Phe Glu Ala Met Arg Arg Ser Ala Pro Leu Leu Gly Pro Leu Leu

100 105 110

Ala Gly Ala Gly Ala Ser Ala Leu Val Thr Asp Ile Ala Leu Ala Ser

115 120 125

Val Val Ile Pro Val Ala Arg Asp Leu Arg Leu Pro Cys Tyr Val Leu

130 135 140

Phe Thr Ala Ser Ala Ala Met Leu Ser Leu Cys Val His Phe Pro Ala

145 150 155 160

Tyr Leu Asp Ala Asn Ala Gly Gly Pro Val Gly Asp Val Gly Ile Pro

165 170 175

Gly Val Tyr Arg Val Pro Lys Ala Ser Ile Pro Gln Ala Leu His His

180 185 190

Pro Glu His Leu Phe Thr Gln Gln Phe Val Ala Asn Gly Arg Glu Leu

195 200 205

Ala Lys Ala Asp Gly Leu Leu Val Asn Ser Phe Asp Ala Phe Glu Pro

210 215 220

Glu Ala Ile Ala Ala Leu Arg Asn Gly Ser Val Ala Ala Gly Phe Pro

225 230 235 240

Pro Val Phe Ser Val Gly Pro Leu Ala Pro Val Ser Phe Ser Ala Ser

245 250 255

Glu Pro Pro Glu Asn Gln Ala Asp Tyr Met Arg Trp Leu Glu Ala Gln

260 265 270

Pro Ala Arg Ser Val Val Tyr Val Ser Phe Gly Ser Arg Lys Ala Ile

275 280 285

Ser Lys Asp Gln Leu Arg Glu Leu Ala Val Gly Leu Glu Ala Ser Gly

290 295 300

His Arg Phe Leu Trp Val Val Lys Ser Thr Val Val Asp Arg Asp Asp

305 310 315 320

Glu Ala Glu Leu Ser Glu Leu Leu Gly Glu Gly Phe Leu Glu Arg Val

325 330 335

Gln Gly Arg Gly Met Val Thr Lys Gly Trp Val Glu Gln Glu Glu Val

340 345 350

Leu Lys Gln Glu Ser Ile Gly Leu Phe Ile Ser His Cys Gly Trp Asn

355 360 365

Ser Val Thr Glu Ala Ala Ala Asn Gly Leu Pro Val Leu Ala Trp Pro

370 375 380

Arg Phe Gly Asp Gln Arg Val Asn Ala Gly Val Val Ala Arg Ser Gly

385 390 395 400

Leu Gly Val Trp Glu Glu Arg Trp Ser Trp Glu Gly Glu Glu Gly Thr

405 410 415

Val Ser Gly His Asn Ile Ala Glu Lys Val Lys Thr Val Met Ala Asp

420 425 430

Lys Thr Val Arg Asn Lys Ala Val Ser Val Gln Asp Ala Ala Ala Glu

435 440 445

Ala Val Ala Asp Gly Gly Thr Ser Tyr Arg Ser Leu Ala Gln Phe Val

450 455 460

Gln Arg Cys Arg Asp Leu Ser Val Ser Lys

465 470

<210> 11

<211> 469

<212> PRT

<213> 小麦(Triticum aestivum)

<400> 11

Met Ala Ser Ser Ser Arg Asp Asp Arg Ala Gly Ala Ala Ala Pro Arg

1 5 10 15

Pro Arg Ile Val Leu Leu Pro Ser Ala Gly Met Gly His Leu Ala Pro

20 25 30

Phe Ser Arg Leu Ala Ala Ala Leu Ser Ser Gly His Ala Cys Asp Val

35 40 45

Ser Leu Val Thr Val Leu Pro Thr Val Ser Ser Ala Glu Ser Gly Gln

50 55 60

Leu Asp Ala Leu Phe Ala Ala Phe Pro Ala Val Arg Arg Leu Asp Phe

65 70 75 80

His Leu Pro Pro Leu Asp Ala Pro Glu Leu Ser Gly Ala Asp Pro Phe

85 90 95

Tyr Val His Tyr Glu Ala Thr Arg Arg Ser Ala Arg Leu Leu Ala Pro

100 105 110

Leu Leu Ala Ala Ala Asp Ala Ser Ala Leu Ile Ala Asp Ile Ser Leu

115 120 125

Ala Ser Val Leu Ile Pro Val Ala Ser Glu Leu Arg Leu Pro Cys Tyr

130 135 140

Val Phe Phe Thr Ala Ser Ala Thr Met Phe Ser Phe Tyr Ala Tyr Tyr

145 150 155 160

Pro Thr Tyr Leu Asp Ala Thr Gly Ala Gly Asp Ala Asp Val Pro Gly

165 170 175

Val Tyr Arg Ile Pro Lys Ser Ser Phe Pro Gln Ala Leu His Asp Arg

180 185 190

Asn Asn Leu Phe Thr Gln Gln Phe Val Ala Asn Gly Arg Ser Leu Ser

195 200 205

Lys Ala Asp Gly Leu Leu Ile Asn Thr Phe Asp Asp Leu Glu Pro Glu

210 215 220

Ala Val Thr Ala Leu Arg Gln Gly Ser Val Val Pro Gly Phe Pro Pro

225 230 235 240

Val Phe Thr Val Gly Pro Leu Ser Pro Val Ser Phe Pro Ala Arg Ala

245 250 255

Ser Ser Asp Tyr Ser Ala Trp Leu Asp Ala Gln Pro Glu Arg Ser Val

260 265 270

Val Tyr Val Ser Phe Gly Ser Arg Lys Ala Leu Ala Arg Asp Gln Leu

275 280 285

Ser Glu Leu Ala Asp Gly Leu Glu Ala Ser Gly Cys Arg Phe Leu Trp

290 295 300

Val Val Lys Gly Ala Val Val Asp Lys Asp Asp Gly Ala Glu Leu Ser

305 310 315 320

Glu Leu Leu Gly Glu Gly Phe Leu Gln Arg Val Ser Gly Arg Ala Leu

325 330 335

Val Thr Lys Ala Trp Val Glu Gln Gly Glu Val Leu Lys His Pro Ala

340 345 350

Ile Gly Met Phe Val Ser His Cys Gly Trp Asn Ser Leu Thr Glu Ala

355 360 365

Phe Ala Thr Gly Val Pro Val Leu Ala Trp Pro Arg Phe Ala Asp Gln

370 375 380

Arg Val Asn Ala Gly Ile Val Ala Arg Cys Gly Ala Gly Val Trp Val

385 390 395 400

Glu Arg Trp Ser Trp Glu Gly Asp Asp Gly Val Val Lys Gly Glu Glu

405 410 415

Ile Ala Glu Lys Val Lys Ser Val Met Ala Asp Glu Met Leu Arg Arg

420 425 430

Ser Ser Thr Val Val Arg Glu Ala Ala Thr Thr Ala Val Ala Gly Gly

435 440 445

Gly Thr Ser Tyr Arg Ser Leu Ala Glu Leu Val Ala Arg Cys Cys His

450 455 460

Gly Ser Ala Leu Gln

465

<210> 12

<211> 469

<212> PRT

<213> 小麦(Triticum aestivum)

<400> 12

Met Ala Ser Ser Pro Arg Asp Asp Arg Ala Gly Ala Ala Ala Pro Arg

1 5 10 15

Pro Arg Ile Val Leu Leu Pro Ser Ala Ser Met Gly His Leu Ala Pro

20 25 30

Phe Ser Arg Leu Ala Ala Ala Leu Ser Ser Gly His Ala Cys Asp Val

35 40 45

Ser Leu Val Thr Val Leu Pro Thr Val Ser Ser Ala Glu Ser Gly Gln

50 55 60

Leu Asp Ala Leu Phe Ala Ala Phe Pro Ala Val Arg Arg Leu Asp Phe

65 70 75 80

Gln Leu Pro Pro Leu Asp Ala Pro Glu Leu Ser Gly Ala Asp Pro Phe

85 90 95

Tyr Val His Tyr Glu Ala Thr Arg Arg Ser Ala Arg Leu Leu Ala Pro

100 105 110

Leu Leu Ala Ala Ala Asp Ala Ser Val Leu Val Ala Asp Ile Ser Leu

115 120 125

Ala Ser Val Leu Ile Pro Val Ala Ser Glu Leu Arg Leu Pro Cys Tyr

130 135 140

Val Phe Phe Thr Ala Ser Ala Thr Met Phe Ser Phe Tyr Ala Tyr Tyr

145 150 155 160

Pro Thr Tyr Leu Asp Ala Ala Gly Ala Gly Asp Ala Asp Val Pro Gly

165 170 175

Val Tyr Arg Ile Pro Lys Ser Ser Phe Pro Gln Ala Leu His Asp Arg

180 185 190

Asn Asn Leu Phe Thr Gln Gln Phe Val Ala Asn Gly Arg Ser Leu Ser

195 200 205

Lys Ala Asp Gly Leu Leu Ile Asn Thr Phe Asp Ala Leu Glu Pro Glu

210 215 220

Ala Val Thr Ala Leu Arg Gln Gly Ser Val Val Pro Gly Cys Pro Pro

225 230 235 240

Val Phe Thr Val Gly Pro Leu Ser Pro Val Ser Phe Pro Ala Arg Ala

245 250 255

Ser Ala Asp Tyr Ser Ala Cys Leu Asp Ala Gln Pro Glu Arg Ser Val

260 265 270

Val Tyr Val Ser Phe Gly Ser Arg Lys Ala Leu Ala Arg Asp Gln Leu

275 280 285

Ser Glu Leu Ala Asp Gly Leu Glu Ala Ser Gly Cys Arg Phe Leu Trp

290 295 300

Val Val Lys Gly Ala Val Val Asp Lys Asp Asp Gly Ala Glu Leu Ser

305 310 315 320

Glu Leu Leu Gly Glu Gly Phe Leu Gln Arg Val Ser Gly Arg Ala Leu

325 330 335

Val Thr Lys Ala Trp Val Glu Gln Gly Glu Val Leu Lys His Pro Ala

340 345 350

Ile Gly Met Phe Val Ser His Cys Gly Trp Asp Ser Leu Thr Glu Ala

355 360 365

Phe Ala Thr Gly Val Pro Val Leu Ala Trp Pro Arg Phe Ala Asp Gln

370 375 380

Arg Val Asn Ala Gly Ile Val Ala Arg Cys Gly Ala Gly Val Trp Val

385 390 395 400

Glu Arg Trp Ser Trp Glu Gly Asp Glu Gly Val Val Lys Gly Glu Glu

405 410 415

Ile Ala Glu Lys Val Lys Ser Val Met Ala Asn Glu Met Leu Arg Arg

420 425 430

Ser Ser Thr Met Val Arg Glu Ala Ala Met Thr Ala Val Ala Gly Gly

435 440 445

Gly Thr Ser Tyr Arg Ser Leu Ala Glu Leu Val Ala Arg Cys Cys Asp

450 455 460

Gly Ser Ala Ser Gln

465

<210> 13

<211> 474

<212> PRT

<213> 小麦(Triticum aestivum)

<400> 13

Met Ala Ser Ser Ser Arg Asp Asp Arg Ala Gly Ala Ala Ala Pro Arg

1 5 10 15

Pro Arg Ile Val Leu Ile Pro Ser Ala Gly Met Gly His Leu Ala Pro

20 25 30

Phe Ser Arg Leu Ala Ala Ala Leu Ser Ser Gly His Thr Cys Asn Val

35 40 45

Ser Leu Val Thr Val Leu Pro Thr Val Ser Ser Ala Glu Ser Gly His

50 55 60

Leu Asp Ala Leu Phe Ala Ala Phe Pro Ala Val Arg Arg Leu Asp Phe

65 70 75 80

Gln Leu Pro Pro Leu Asp Ala Pro Glu Leu Ser Gly Ala Asp Pro Phe

85 90 95

Tyr Val His Tyr Glu Ala Thr Arg Arg Ser Ala Arg Leu Leu Ala Pro

100 105 110

Leu Leu Ala Ala Ala Asp Ala Ser Ala Leu Val Ala Asp Ile Ser Leu

115 120 125

Ala Ser Val Leu Ile Pro Val Ala Ser Glu Leu Arg Leu Pro Cys Tyr

130 135 140

Val Phe Phe Thr Ala Ser Ala Thr Met Phe Ser Phe Tyr Ala Tyr Tyr

145 150 155 160

Pro Thr Tyr Leu Asp Ala Ala Gly Ala Gly Asp Ala Asp Val Pro Gly

165 170 175

Val Tyr Arg Ile Pro Lys Ser Ser Phe Pro Gln Ala Leu His Asp Arg

180 185 190

Asn Asn Leu Phe Thr Gln Gln Phe Val Ala Asn Gly Gln Ser Leu Ser

195 200 205

Lys Ala Asp Gly Leu Leu Ile Asn Thr Phe Asp Ala Leu Glu Pro Glu

210 215 220

Ala Val Thr Ala Leu Arg Gln Gly Ser Val Val Pro Gly Phe Pro Pro

225 230 235 240

Val Phe Asn Val Gly Pro Leu Ser Pro Val Ser Phe Pro Ala Arg Ala

245 250 255

Ser Ser Asp Tyr Ser Ala Trp Leu Asp Ala Gln Pro Glu Arg Ser Val

260 265 270

Val Tyr Val Ser Phe Gly Ser Arg Lys Ala Leu Ala Arg Asp Gln Leu

275 280 285

Ser Glu Leu Ala Asp Gly Leu Glu Ala Ser Gly Cys Arg Phe Leu Trp

290 295 300

Val Val Lys Gly Thr Val Val Asp Lys Asp Asp Gly Ala Glu Leu Ser

305 310 315 320

Glu Leu Leu Gly Glu Gly Phe Leu Gln Arg Val Ser Gly Arg Ala Leu

325 330 335

Val Thr Lys Ala Trp Val Glu Gln Gly Glu Val Leu Lys His Pro Ala

340 345 350

Ile Gly Met Phe Val Ser His Cys Gly Trp Asn Ser Leu Thr Glu Ala

355 360 365

Phe Ala Ser Gly Val Pro Val Leu Ala Trp Pro Arg Phe Ala Asp Gln

370 375 380

Arg Val Asn Ala Gly Ile Val Ala Arg Arg Gly Ala Gly Val Trp Val

385 390 395 400

Glu Arg Trp Ser Trp Glu Gly Asp Asp Gly Val Val Lys Gly Glu Glu

405 410 415

Ile Ala Glu Lys Val Lys Ser Val Met Ala Asp Glu Met Leu Arg Arg

420 425 430

Ser Ser Thr Val Val Arg Glu Ala Ala Met Thr Ala Val Ala Gly Gly

435 440 445

Gly Thr Ser Tyr Arg Ser Leu Ala Glu Leu Val Ala Arg Cys Cys Asp

450 455 460

Gly Ser Ala Ser Asn Ala Pro Ser Glu Ala

465 470

<210> 14

<211> 479

<212> PRT

<213> 玉米(Zea mays)

<400> 14

Met Ser Ser Pro Ala Pro Ser Ser Ala Ser Arg Ser Ser His Gly Ser

1 5 10 15

Arg Gly Ser Pro Arg Ile Val Leu Phe Pro Ser Ala Gly Met Gly His

20 25 30

Leu Val Pro Phe Thr Arg Leu Ala Val Ala Leu Ser Ala Gly His Gly

35 40 45

Cys Glu Ile Ser Leu Leu Thr Ala Leu Pro Thr Val Ser Ser Ala Glu

50 55 60

Ser Arg His Ile Ala Ala Leu Tyr Ala Ala Phe Pro Ala Ile Arg Gln

65 70 75 80

Leu Asp Leu Arg Phe Ala Pro Phe Asp Ala Ser Ser Glu Phe Pro Gly

85 90 95

Ala Asp Pro Phe Tyr Leu Arg Tyr Glu Ala Leu Arg Arg Cys Ala Pro

100 105 110

Ser Leu Leu Gly Pro Leu Leu Ala Gly Ala Gly Ala Ser Ala Leu Val

115 120 125

Val Asp Met Ala Leu Ala Ser Val Ala Ile Pro Val Ala Arg Glu Leu

130 135 140

His Val Pro Cys Phe Val Phe Phe Thr Ala Ser Ala Thr Met Leu Ser

145 150 155 160

Phe Lys Ala Tyr Phe Pro Thr Tyr Leu Asp Asp Val Gly Ala Gly His

165 170 175

Gly Val Gly Asp Val Asp Val Pro Gly Val Tyr Arg Ile Pro Ser Ser

180 185 190

Ser Val Pro Gln Ala Leu His Asp Pro Asp Asn Ile Phe Thr Arg Gln

195 200 205

Phe Val Ala Asn Gly Arg Ala Leu Ala Thr Ala Asp Gly Leu Leu Val

210 215 220

Asn Ala Phe His Ala Met Glu Pro Glu Ala Val Glu Ala Leu Gln Gly

225 230 235 240

Arg Phe Val Leu Ser Val Leu Pro Pro Val Phe Ala Val Gly Pro Leu

245 250 255

Met Pro Val Asn Asp Leu Arg Glu Thr Gly Glu Ala Ala Gln Lys Gln

260 265 270

Gly Asn Tyr Arg Ala Trp Leu Asp Glu Gln Pro Pro Arg Ser Val Val

275 280 285

Tyr Val Ser Phe Gly Ser Arg Lys Ala Leu Pro Lys Asp Gln Ile Lys

290 295 300

Glu Leu Ala Ala Gly Leu Glu Ala Cys Gly His Arg Phe Leu Trp Val

305 310 315 320

Val Lys Gly Ala Val Val Asp Arg Asp Asp Ala Gly Glu Leu Ser Glu

325 330 335

Leu Leu Gly Glu Ala Phe Leu Arg Arg Val His Gly Arg Gly Leu Val

340 345 350

Thr Lys Ser Trp Val Glu Gln Glu Glu Val Leu Arg His Pro Ala Val

355 360 365

Ala Leu Phe Val Ser His Cys Gly Trp Asn Ser Val Thr Glu Ala Val

370 375 380

Ser Ser Gly Val Pro Val Leu Ala Trp Pro Arg Phe Ala Asp Gln Arg

385 390 395 400

Val Asn Ala Arg Val Val Val Arg Cys Gly Leu Gly Val Trp Ala Asp

405 410 415

Gln Trp Ser Trp Glu Gly Glu Glu Ala Leu Val Arg Ala Glu Glu Ile

420 425 430

Thr Ala Leu Val Met Glu Ala Met Glu Asp Asp Ala Met Ala Val Lys

435 440 445

Ala Ala Asn Val Arg Glu Ala Ala Ser Arg Ala Val Val Asp Gly Gly

450 455 460

Thr Ser Tyr Arg Ser Leu Ala Ala Phe Val Arg Arg Cys Thr Ala

465 470 475

<210> 15

<211> 479

<212> PRT

<213> 玉米(Zea mays)

<400> 15

Met Ser Ser Pro Ala Pro Ser Ser Pro Ser Arg Ser Ser His Gly Ser

1 5 10 15

Arg Ser Ser Pro Arg Ile Val Leu Phe Pro Ser Ala Gly Met Gly His

20 25 30

Leu Val Pro Phe Thr Arg Leu Ala Val Ala Leu Ser Ala Gly His Gly

35 40 45

Cys Asp Ile Ser Leu Val Thr Ala Leu Pro Thr Val Ser Ser Ala Glu

50 55 60

Ser Arg His Ile Ala Ala Leu Tyr Ala Ala Phe Pro Ala Ile Arg Gln

65 70 75 80

Leu Asp Leu Arg Phe Ala Pro Phe Asp Ala Ser Ser Glu Phe Pro Gly

85 90 95

Ala Asp Pro Phe Tyr Leu Arg Tyr Glu Ala Leu Arg Arg Cys Ala Pro

100 105 110

Ser Leu Leu Gly Pro Leu Leu Ala Gly Ala Gly Ala Ser Ala Leu Val

115 120 125

Val Asp Met Ala Leu Ala Ser Val Ala Ile Pro Val Ala Arg Glu Leu

130 135 140

His Val Pro Cys Phe Val Phe Phe Thr Ala Ser Ala Thr Met Leu Ser

145 150 155 160

Phe Lys Ala Tyr Phe Pro Thr Tyr Leu Asp Asp Val Gly Ala Gly His

165 170 175

Gly Val Gly Asp Val Asp Val Pro Gly Val Tyr Arg Ile Pro Ser Ser

180 185 190

Ser Val Pro Gln Ala Leu His Asp Pro Asp Asn Ile Phe Thr Arg Gln

195 200 205

Phe Val Ala Asn Gly Arg Ala Leu Ala Thr Ala Asp Gly Leu Leu Val

210 215 220

Asn Ala Phe His Ala Met Glu Pro Glu Ala Val Glu Ala Leu Gln Gly

225 230 235 240

Arg Phe Val Leu Ser Val Leu Pro Pro Val Phe Ala Val Gly Pro Leu

245 250 255

Met Pro Val Asn Asp Leu Arg Glu Thr Gly Glu Ala Ala Gln Lys Gln

260 265 270

Gly Asn Tyr Arg Ala Trp Leu Asp Glu Gln Pro Pro Arg Ser Val Val

275 280 285

Tyr Val Ser Phe Gly Ser Arg Lys Ala Leu Pro Lys Asp Gln Ile Lys

290 295 300

Glu Leu Ala Ala Gly Leu Glu Ala Cys Gly His Arg Phe Leu Trp Val

305 310 315 320

Val Lys Gly Ala Val Val Asp Arg Asp Asp Ala Gly Glu Leu Ser Glu

325 330 335

Leu Leu Gly Glu Ala Phe Leu Arg Arg Val His Gly Arg Gly Leu Val

340 345 350

Thr Lys Ser Trp Val Glu Gln Glu Glu Val Leu Arg His Pro Ala Val

355 360 365

Ala Leu Phe Val Ser His Cys Gly Trp Asn Ser Val Thr Glu Ala Val

370 375 380

Ser Ser Gly Val Pro Val Leu Ala Trp Pro Arg Phe Ala Asp Gln Arg

385 390 395 400

Val Asn Ala Arg Val Val Val Arg Cys Gly Leu Gly Val Trp Ala Asp

405 410 415

Gln Trp Ser Trp Glu Gly Glu Glu Ala Leu Val Arg Ala Glu Glu Ile

420 425 430

Thr Ala Leu Val Met Glu Ala Met Glu Asp Asp Ala Met Ala Val Lys

435 440 445

Ala Ala Asn Val Arg Glu Ala Ala Ser Arg Ala Val Val Asp Gly Gly

450 455 460

Thr Ser Tyr Arg Ser Leu Ala Ala Phe Val Arg Arg Cys Thr Ala

465 470 475

<210> 16

<211> 472

<212> PRT

<213> 二穗短柄草(Brachypodium distachyon)

<400> 16

Met Pro Thr Ser Gly Asp Gly Pro Thr Ser Gln Pro His Val Val Leu

1 5 10 15

Leu Pro Ser Ala Gly Met Gly His Leu Val Pro Phe Ser Arg Leu Ala

20 25 30

Val Ala Leu Ser Ser Ala His Gly Cys Asp Val Ser Leu Val Thr Val

35 40 45

Leu Pro Thr Val Ser Ser Ala Glu Ser Ser His Leu Glu Ala Leu Phe

50 55 60

Gly Ala Phe Pro Ala Val Arg Arg Leu Glu Phe His Leu Ala Asp Phe

65 70 75 80

Asp Ala Ser Glu Phe Pro Asn Ala Asp Pro Phe Phe Leu Arg Phe Glu

85 90 95

Ala Met Arg Arg Ser Ala Pro Leu Leu Leu Gly Pro Leu Leu Ala Arg

100 105 110

Ala Ser Ala Thr Ala Leu Val Thr Asp Ile Ala Leu Ser Ser Val Val

115 120 125

Ile Pro Val Ala Lys Gln Leu Arg Leu Pro Cys Tyr Val Leu Phe Thr

130 135 140

Ala Ser Ala Ala Met Leu Ser Leu Cys Val His Phe Pro Ala Tyr Leu

145 150 155 160

Asp Ala Asn Gly Asn Gly Leu Val Gly Asp Val Asp Ile Pro Gly Val

165 170 175

Tyr Gln Ile Pro Lys Ala Ser Val Pro Gln Ala Leu His Asp Pro Lys

180 185 190

His Leu Phe Thr Arg Gln Phe Val Ala Asn Gly Arg Glu Leu Ala Lys

195 200 205

Ser Asp Gly Val Leu Val Asn Ser Phe Asp Ala Phe Glu Pro Glu Ala

210 215 220

Ile Ala Ala Leu Arg Glu Gly Ala Val Ser Ala Ala Gly Phe Phe Pro

225 230 235 240

Pro Val Phe Ser Val Gly Pro Leu Ala Pro Val Ser Phe Pro Ala Gly

245 250 255

Asn Asn Asn Arg Ala Asp Tyr Ile Gln Trp Leu Glu Ala Gln Pro Ala

260 265 270

Arg Ser Val Val Tyr Val Ser Phe Gly Ser Arg Lys Ala Val Ala Arg

275 280 285

Asp Gln Leu Arg Glu Leu Ala Ala Gly Leu Glu Ala Ser Gly His Arg

290 295 300

Phe Leu Trp Val Val Lys Ser Thr Val Val Asp Arg Asp Asp Asp Ala

305 310 315 320

Asp Leu Gly Glu Leu Leu Gly Glu Gly Phe Leu Glu Arg Val Gln Gly

325 330 335

Arg Gly Met Val Thr Lys Gly Trp Val Glu Gln Glu Asp Val Leu Lys

340 345 350

Gln Glu Ser Val Gly Leu Phe Ile Ser His Cys Gly Trp Asn Ser Val

355 360 365

Thr Glu Ala Ala Ala Gly Gly Leu Pro Val Leu Ala Trp Pro Arg Phe

370 375 380

Gly Asp Gln Arg Val Asn Ala Gly Val Val Ala Arg Ser Gly Leu Gly

385 390 395 400

Val Trp Val Asp Ser Trp Ser Trp Glu Gly Glu Glu Gly Val Val Ser

405 410 415

Gly Glu Ser Ile Ala Glu Lys Val Lys Ala Val Met Gly Asp Glu Ile

420 425 430

Ala Arg Asn Lys Ala Val Ser Val Arg Asp Ala Ala Ala Lys Ala Val

435 440 445

Ala Asp Gly Gly Thr Ser Tyr Arg Asn Leu Ala Arg Phe Ala Gln Arg

450 455 460

Cys Arg Asp Gly Arg Val Arg Glu

465 470

<210> 17

<211> 475

<212> PRT

<213> 谷子(Setaria italica)

<400> 17

Met Pro Thr Ser Gly Asp His Ser Gly Ala Arg Pro His Val Val Leu

1 5 10 15

Leu Pro Ser Ala Gly Met Gly His Leu Val Pro Phe Gly Arg Leu Ala

20 25 30

Val Ala Leu Ser Ala Gly His Gly Cys Asp Val Ser Val Ala Ala Val

35 40 45

Leu Pro Thr Val Ser Ser Ala Glu Ala Arg His Leu Glu Ala Leu Phe

50 55 60

Ala Ala Ala Asp Pro Ala Val Arg Arg Leu Asp Phe Arg Leu Ala Pro

65 70 75 80

Phe Asp Ala Ser Glu Phe Pro Gly Ala Asp Pro Phe Phe Leu Arg Phe

85 90 95

Glu Ala Met Arg Arg Ser Ala Pro Leu Leu Gly Pro Leu Leu Ala Thr

100 105 110

Ala Gly Ala Ser Ala Val Val Thr Asp Ile Val Leu Ala Ser Val Val

115 120 125

Leu Pro Val Ala Arg Glu Cys Gly Val Pro Cys Tyr Val Leu Phe Thr

130 135 140

Ala Ser Ala Ala Met Leu Ala Phe Cys Ala His Phe Pro Gly Tyr Leu

145 150 155 160

Asp Ala Asn Ser Ala Ala Gly Arg Ala Gly Val Val Gly Asp Val Asp

165 170 175

Ile Pro Gly Val Tyr Arg Ile Pro Lys Ser Ser Val Pro Gln Ala Leu

180 185 190

His Asp Pro Lys His Leu Phe Thr Gln Gln Phe Val Ala Asn Gly Arg

195 200 205

Gly Leu Val Asp Ala Asp Gly Ile Leu Val Asn Thr Phe Asp Ala Leu

210 215 220

Glu Pro Glu Ala Val Thr Ala Leu Arg Lys Gly Lys Val Val Ser Ser

225 230 235 240

Phe Pro Leu Val Phe Ala Val Gly Pro Leu Leu Pro Val Met Phe Pro

245 250 255

Ala Lys Asp Pro Ala Gly Tyr Met Gln Trp Leu Asp Ala Gln Pro Ala

260 265 270

Arg Ser Val Val Tyr Val Ser Phe Gly Ser Arg Thr Ala Ile Ser Pro

275 280 285

Asp Gln Leu Leu Glu Leu Ala Ala Gly Leu Glu Ala Ser Gly His Arg

290 295 300

Phe Leu Trp Val Val Lys Ser Thr Val Val Asp Arg Asp Asp Ala Gly

305 310 315 320

Glu Leu Gly Asp Leu Leu Gly His Gly Phe Leu Glu Arg Val Arg Gly

325 330 335

Arg Ala Leu Val Thr Lys Gly Trp Val Glu Gln Glu Glu Ile Leu Gln

340 345 350

His Gly Ser Val Gly Leu Phe Val Ser His Cys Gly Trp Asn Ser Val

355 360 365

Thr Glu Ala Ala Ala Phe Gly Val Pro Val Leu Ala Trp Pro Arg Phe

370 375 380

Gly Asp Gln Arg Ile Asn Ala Ala Val Val Thr Arg Gly Gly Leu Gly

385 390 395 400

Ala Trp Glu Glu Arg Trp Ser Trp Asp Gly Glu Glu Gly Leu Val Ser

405 410 415

Gly Glu Glu Val Gly Glu Lys Ile Lys Ala Val Met Ala Asp Glu Thr

420 425 430

Val Ala Lys Lys Ala Ala Ala Val Gly Asp Ala Ala Ala Ala Ala Ala

435 440 445

Thr Ser Lys Gly Gly Thr Ser Tyr Arg Ser Leu Ala Glu Phe Val Gly

450 455 460

Arg Cys Arg Asp Ala Gly Ser Arg Gln Asp Arg

465 470 475

<210> 18

<211> 494

<212> PRT

<213> 谷子(Setaria italica)

<400> 18

Met Ser Ser Pro Pro Pro Pro Asn Ser Thr Ser Asp Asp Cys Gln Gly

1 5 10 15

Thr Ala Ala Thr Pro His Ile Val Leu Phe Pro Ser Ala Gly Met Gly

20 25 30

His Leu Val Pro Phe Thr Arg Leu Ala Val Ala Leu Ser Ala Gly His

35 40 45

Cys Cys Asp Val Ser Leu Val Thr Ala Leu Pro Thr Val Ser Ser Ala

50 55 60

Glu Ser Cys His Ile Ala Ala Leu Phe Ala Ala Phe Pro Ala Val Arg

65 70 75 80

Arg Leu Asp Leu Arg Leu Ala Pro Leu Asp Ala Ser Ser Glu Phe Pro

85 90 95

Gly Ala Asp Pro Phe Tyr Val Arg Tyr Glu Ala Leu Arg Arg Ser Thr

100 105 110

Pro Leu Leu Leu Gly Pro Leu Leu Ala Gly Ala Ser Ala Ser Ala Leu

115 120 125

Val Ala Asp Ile Ala Leu Ala Ser Val Ala Ile Pro Val Ala Arg Glu

130 135 140

Leu Arg Val Pro Cys Tyr Val Phe Phe Thr Ala Ser Ala Thr Met Leu

145 150 155 160

Ser Phe Lys Ala Tyr Phe Pro Thr Tyr Leu Asp Ala Asn Gly Gly Ala

165 170 175

Gly His Ser Val Gly Asp Val Asp Val Pro Gly Val Cys Arg Val Pro

180 185 190

Arg Ser Ser Ile Pro Gln Ala Leu His Asp Pro Asp Asp Ile Phe Thr

195 200 205

Arg Gln Phe Val Ala Asn Gly Arg Ala Leu Val Ala Ala Asp Gly Leu

210 215 220

Leu Val Asn Ala Phe Glu Ala Met Glu Pro Glu Ala Val Ala Ala Leu

225 230 235 240

Leu Gly Gly Ser Val Val Ala Ser Leu Pro Pro Val Phe Ala Val Gly

245 250 255

Pro Leu Met Pro Leu Asn Leu Arg Glu Ala Ala Glu Glu Gln Gly Asn

260 265 270

Tyr Arg Ala Trp Leu Asp Ala Gln Pro Pro Arg Ser Val Val Tyr Val

275 280 285

Ser Phe Gly Ser Arg Lys Ala Leu Ala Arg Asp Gln Ile Arg Glu Leu

290 295 300

Ala Ala Trp Leu Glu Ala Cys Gly His Arg Phe Leu Trp Val Val Lys

305 310 315 320

Gly Ala Val Val Asp Arg Asp Asp Ala Cys Glu Leu Ser Asp Leu Leu

325 330 335

Gly Glu Gly Phe Gln Arg Arg Val Glu Gly Arg Gly Leu Val Thr Lys

340 345 350

Ser Trp Val Glu Gln Asp Glu Val Leu Arg His Pro Ala Val Gly Leu

355 360 365

Phe Val Ser His Cys Gly Trp Asn Ser Val Thr Glu Ala Ala Ala Asn

370 375 380

Gly Val Pro Val Leu Ala Trp Pro Arg Phe Ala Asp Gln Arg Val Asn

385 390 395 400

Ala Arg Val Val Ala Arg Ala Gly Phe Gly Val Trp Val Glu Arg Trp

405 410 415

Ser Trp Glu Gly Glu Glu Ala Val Val Gly Ala Glu Glu Ile Ala Glu

420 425 430

Gln Val Val Ala Ala Met Gly Asp Gln Ala Val Ala Glu Lys Ala Ala

435 440 445

Ser Val Arg Asp Glu Ala Ala Arg Ala Val Ala Asp Gly Gly Thr Ser

450 455 460

Gln Gln Ser Leu Ala Glu Phe Val Arg Arg Cys Arg Gly Gly Leu Ala

465 470 475 480

Gly Pro Gly Thr Asp Leu Gly Arg Thr Trp Thr Ala Arg Gly

485 490

<210> 19

<211> 471

<212> PRT

<213> 粳稻(Oryza Sativa japonica)

<400> 19

Met Pro Ser Ser Gly Asp Ala Ala Gly Arg Arg Pro His Val Val Leu

1 5 10 15

Ile Pro Ser Ala Gly Met Gly His Leu Val Pro Phe Gly Arg Leu Ala

20 25 30

Val Ala Leu Ser Ser Gly His Gly Cys Asp Val Ser Leu Val Thr Val

35 40 45

Leu Pro Thr Val Ser Thr Ala Glu Ser Lys His Leu Asp Ala Leu Phe

50 55 60

Asp Ala Phe Pro Ala Val Arg Arg Leu Asp Phe Glu Leu Ala Pro Phe

65 70 75 80

Asp Ala Ser Glu Phe Pro Ser Ala Asp Pro Phe Phe Leu Arg Phe Glu

85 90 95

Ala Met Arg Arg Ser Ala Pro Leu Leu Gly Pro Leu Leu Thr Gly Ala

100 105 110

Gly Ala Ser Ala Leu Ala Thr Asp Ile Ala Leu Thr Ser Val Val Ile

115 120 125

Pro Val Ala Lys Glu Gln Gly Leu Pro Cys His Ile Leu Phe Thr Ala

130 135 140

Ser Ala Ala Met Leu Ser Leu Cys Ala Tyr Phe Pro Thr Tyr Leu Asp

145 150 155 160

Ala Asn Ala Gly Asp Gly Gly Gly Val Gly Asp Val Asp Ile Pro Gly

165 170 175

Val Tyr Arg Ile Pro Lys Ala Ser Ile Pro Gln Ala Leu His Asp Pro

180 185 190

Asn His Leu Phe Thr Arg Gln Phe Val Ala Asn Gly Arg Ser Leu Thr

195 200 205

Ser Ala Ala Gly Ile Leu Val Asn Thr Phe Asp Ala Leu Glu Pro Glu

210 215 220

Ala Val Ala Ala Leu Gln Gln Gly Lys Val Ala Ser Gly Phe Pro Pro

225 230 235 240

Val Phe Ala Val Gly Pro Leu Leu Pro Ala Ser Asn Gln Ala Lys Asp

245 250 255

Pro Gln Ala Asn Tyr Met Glu Trp Leu Asp Ala Gln Pro Ala Arg Ser

260 265 270

Val Val Tyr Val Ser Phe Gly Ser Arg Lys Ala Ile Ser Gly Glu Gln

275 280 285

Leu Arg Glu Leu Ala Ala Gly Leu Glu Thr Ser Gly His Arg Phe Leu

290 295 300

Trp Val Val Lys Ser Thr Val Val Asp Arg Asp Asp Ala Ala Glu Leu

305 310 315 320

Gly Glu Leu Leu Gly Glu Gly Phe Leu Lys Arg Val Glu Lys Arg Gly

325 330 335

Leu Val Thr Lys Ala Trp Val Asp Gln Glu Glu Val Leu Lys His Glu

340 345 350

Ser Val Ala Leu Phe Val Ser His Cys Gly Trp Asn Ser Val Thr Glu

355 360 365

Ala Ala Ala Ser Gly Val Pro Val Leu Ala Leu Pro Arg Phe Gly Asp

370 375 380

Gln Arg Val Asn Ser Gly Val Val Ala Arg Ala Gly Leu Gly Val Trp

385 390 395 400

Ala Asp Thr Trp Ser Trp Glu Gly Glu Ala Gly Val Ile Gly Ala Glu

405 410 415

Glu Ile Ser Glu Lys Val Lys Ala Ala Met Ala Asp Glu Ala Leu Arg

420 425 430

Arg Lys Ala Ala Ser Leu Ala Lys Ala Ala Ala Lys Ala Val Ala Gly

435 440 445

Gly Gly Ser Ser His Arg Cys Leu Val Glu Phe Ala Arg Leu Cys Gln

450 455 460

Gly Gly Thr Cys Arg Thr Asn

465 470

<210> 20

<211> 475

<212> PRT

<213> 玉米(Zea mays)

<400> 20

Met Ala Ala Asn Gly Gly Asp His Thr Ser Ala Arg Pro His Val Val

1 5 10 15

Leu Leu Pro Ser Ala Gly Met Gly His Leu Val Pro Phe Ala Arg Leu

20 25 30

Ala Val Ala Leu Ser Glu Gly His Gly Cys Asn Val Ser Val Ala Ala

35 40 45

Val Gln Pro Thr Val Ser Ser Ala Glu Ser Arg Leu Leu Asp Ala Leu

50 55 60

Phe Val Ala Ala Ala Pro Ala Val Arg Arg Leu Asp Phe Arg Leu Ala

65 70 75 80

Pro Phe Asp Glu Ser Glu Phe Pro Gly Ala Asp Pro Phe Phe Leu Arg

85 90 95

Phe Glu Ala Thr Arg Arg Ser Ala Pro Leu Leu Gly Pro Leu Leu Asp

100 105 110

Ala Ala Glu Ala Ser Ala Leu Val Thr Asp Ile Val Leu Ala Ser Val

115 120 125

Ala Leu Pro Val Ala Arg Glu Arg Gly Val Pro Cys Tyr Val Leu Phe

130 135 140

Thr Ser Ser Ala Ala Met Leu Ser Leu Cys Ala Tyr Phe Pro Ala Tyr

145 150 155 160

Leu Asp Ala His Ala Ala Ala Gly Ser Val Gly Val Gly Val Gly Asn

165 170 175

Val Asp Ile Pro Gly Val Phe Arg Ile Pro Lys Ser Ser Val Pro Gln

180 185 190

Ala Leu His Asp Pro Asp His Leu Phe Thr Gln Gln Phe Val Ala Asn

195 200 205

Gly Arg Cys Leu Val Ala Cys Asp Gly Ile Leu Val Asn Thr Phe Asp

210 215 220

Ala Phe Glu Pro Asp Ala Val Thr Ala Leu Arg Gln Gly Ser Ile Thr

225 230 235 240

Val Ser Gly Gly Phe Pro Pro Val Phe Thr Val Gly Pro Met Leu Pro

245 250 255

Val Arg Phe Gln Ala Glu Glu Thr Ala Asp Tyr Met Arg Trp Leu Ser

260 265 270

Ala Gln Pro Pro Arg Ser Val Val Tyr Val Ser Phe Gly Ser Arg Lys

275 280 285

Ala Ile Pro Arg Asp Gln Leu Arg Glu Leu Ala Ala Gly Leu Glu Ala

290 295 300

Ser Gly Lys Arg Phe Leu Trp Val Val Lys Ser Thr Ile Val Asp Arg

305 310 315 320

Asp Asp Thr Ala Asp Leu Gly Gly Leu Leu Gly Asp Gly Phe Leu Glu

325 330 335

Arg Val Gln Gly Arg Ala Phe Val Thr Met Gly Trp Val Glu Gln Glu

340 345 350

Glu Ile Leu Gln His Gly Ser Val Gly Leu Phe Ile Ser His Cys Gly

355 360 365

Trp Asn Ser Leu Thr Glu Ala Ala Ala Phe Gly Val Pro Val Leu Ala

370 375 380

Trp Pro Arg Phe Gly Asp Gln Arg Val Asn Ala Ala Leu Val Ala Arg

385 390 395 400

Ser Gly Leu Gly Ala Trp Glu Glu Gly Trp Thr Trp Asp Gly Glu Glu

405 410 415

Gly Leu Thr Thr Arg Lys Glu Val Ala Lys Lys Ile Lys Gly Met Met

420 425 430

Gly Tyr Asp Ala Val Ala Glu Lys Ala Ala Lys Val Gly Asp Ala Ala

435 440 445

Ala Ala Ala Ile Ala Lys Cys Gly Thr Ser Tyr Gln Ser Leu Glu Glu

450 455 460

Phe Val Gln Arg Cys Arg Asp Ala Glu Arg Lys

465 470 475

<210> 21

<211> 36

<212> DNA

<213> 引物(Primer)

<400> 21

tgccgcgcgg cagccatatg atgggccacc tggtgc 36

<210> 22

<211> 43

<212> DNA

<213> 引物(Primer)

<400> 22

tggtgctcga gtgcggccgc ctagtccaac actgcaagat ccc 43

<210> 23

<211> 39

<212> DNA

<213> 引物(Primer)

<400> 23

tgccgcgcgg cagccatatg atgtgttcgg cggcaacac 39

<210> 24

<211> 45

<212> DNA

<213> 引物(Primer)

<400> 24

tggtgctcga gtgcggccgc tcacattccg ttcgtgatga caagc 45

<210> 25

<211> 37

<212> DNA

<213> 引物(Primer)

<400> 25

tgccgcgcgg cagccatatg atggccccat cggcgat 37

<210> 26

<211> 37

<212> DNA

<213> 引物(Primer)

<400> 26

tggtgctcga gtgcggccgc ctaccacccc gcgtcgc 37

<210> 27

<211> 41

<212> DNA

<213> 引物(Primer)

<400> 27

tgccgcgcgg cagccatatg atgtcctcgc cggcattatc a 41

<210> 28

<211> 37

<212> DNA

<213> 引物(Primer)

<400> 28

tggtgctcga gtgcggccgc tcacgccgtg caacgac 37

<210> 29

<211> 36

<212> DNA

<213> 引物(Primer)

<400> 29

tgccgcgcgg cagccatatg atgccgacct ccggcg 36

<210> 30

<211> 53

<212> DNA

<213> 引物(Primer)

<400> 30

tggtgctcga gtgcggccgc ttattccgtg ttcacgcttc ttctaaatgt agc 53

<210> 31

<211> 36

<212> DNA

<213> 引物(Primer)

<400> 31

tgccgcgcgg cagccatatg atgccgacct ccggcg 36

<210> 32

<211> 45

<212> DNA

<213> 引物(Primer)

<400> 32

tggtgctcga gtgcggccgc ttacttgctg acgcttagat cccgg 45

<210> 33

<211> 41

<212> DNA

<213> 引物(Primer)

<400> 33

tgccgcgcgg cagccatatg atggcctcca gctcgagaga c 41

<210> 34

<211> 48

<212> DNA

<213> 引物(Primer)

<400> 34

tggtgctcga gtgcggccgc ttactgtaag gcactaccat gacagcag 48

<210> 35

<211> 39

<212> DNA

<213> 引物(Primer)

<400> 35

tgccgcgcgg cagccatatg atggcctcca gctccagag 39

<210> 36

<211> 37

<212> DNA

<213> 引物(Primer)

<400> 36

tggtgctcga gtgcggccgc tcacgcctct gacggcg 37

<210> 37

<211> 36

<212> DNA

<213> 引物(Primer)

<400> 37

tgccgcgcgg cagccatatg atgtcctcgc cggcac 36

<210> 38

<211> 38

<212> DNA

<213> 引物(Primer)

<400> 38

tggtgctcga gtgcggccgc tcatgcggtg caacgacg 38

<210> 39

<211> 36

<212> DNA

<213> 引物(Primer)

<400> 39

tgccgcgcgg cagccatatg atgtcctcgc cggcac 36

<210> 40

<211> 46

<212> DNA

<213> 引物(Primer)

<400> 40

tggtgctcga gtgcggccgc ttatataact tcacgcggtg caatgc 46

<210> 41

<211> 36

<212> DNA

<213> 引物(Primer)

<400> 41

tgccgcgcgg cagccatatg atgccgacct ccggcg 36

<210> 42

<211> 44

<212> DNA

<213> 引物(Primer)

<400> 42

tggtgctcga gtgcggccgc ttactcacgc actcttccat cccg 44

<210> 43

<211> 38

<212> DNA

<213> 引物(Primer)

<400> 43

tgccgcgcgg cagccatatg atgtcctcac cgccaccg 38

<210> 44

<211> 40

<212> DNA

<213> 引物(Primer)

<400> 44

tggtgctcga gtgcggccgc tcatcctcgc gctgtccacg 40

<210> 45

<211> 37

<212> DNA

<213> 引物(Primer)

<400> 45

tgccgcgcgg cagccatatg atgccgagct ctggcga 37

<210> 46

<211> 44

<212> DNA

<213> 引物(Primer)

<400> 46

tggtgctcga gtgcggccgc tcaattagtg cgacatgttc cccc 44

<210> 47

<211> 27

<212> DNA

<213> 引物(Primer)

<400> 47

tataccatgg gtgactgcgt tgccccg 27

<210> 48

<211> 30

<212> DNA

<213> 引物(Primer)

<400> 48

cgggatcctt acttcggcag gtcgccgctc 30

<210> 49

<211> 29

<212> DNA

<213> 引物(Primer)

<400> 49

cgggatccct tatgcgactc ctgcattag 29

<210> 50

<211> 26

<212> DNA

<213> 引物(Primer)

<400> 50

gcccaagctt ttatgccagc atcttc 26

<210> 51

<211> 31

<212> DNA

<213> 引物(Primer)

<400> 51

agatatacat atggttacgg tggaagaata c 31

<210> 52

<211> 30

<212> DNA

<213> 引物(Primer)

<400> 52

ccgctcgagt taggtagcca cactatgcag 30

<210> 53

<211> 30

<212> DNA

<213> 引物(Primer)

<400> 53

ccgctcgagc tagaaataat tttgtttaac 30

<210> 54

<211> 30

<212> DNA

<213> 引物(Primer)

<400> 54

ccgctcgagc gatcccgcga aattaatacg 30

<210> 55

<211> 28

<212> DNA

<213> 引物(Primer)

<400> 55

gagcctaggt tagttaccga ttttaaag 28

<210> 56

<211> 40

<212> DNA

<213> 引物(Primer)

<400> 56

agctcccacc aggacctagc atgagcacct ggtccaaccg 40

<210> 57

<211> 43

<212> DNA

<213> 引物(Primer)

<400> 57

gagctcgaat tcggatccac tagtttaggt cgccgcacgc gcc 43

<210> 58

<211> 38

<212> DNA

<213> 引物(Primer)

<400> 58

ctcccaccag gacctagcat gcgtagcgcg ggtagccg 38

<210> 59

<211> 43

<212> DNA

<213> 引物(Primer)

<400> 59

tcgaattcgg atccactagt ttagctataa aagctcggca gcg 43

<210> 60

<211> 45

<212> DNA

<213> 引物(Primer)

<400> 60

agctcccacc aggacctagc atgatcattc gttggcgttg gaaca 45

<210> 61

<211> 45

<212> DNA

<213> 引物(Primer)

<400> 61

gagctcgaat tcggatccac tagtttaggt cgctttaccg gtcgc 45

<210> 62

<211> 31

<212> DNA

<213> 引物(Primer)

<400> 62

tatacatatg tcctcttctt cttcttcgtc a 31

<210> 63

<211> 32

<212> DNA

<213> 引物(Primer)

<400> 63

aattgcggcc gcttaccata catctctaag at 32

<210> 64

<211> 50

<212> DNA

<213> 引物(Primer)

<400> 64

cgacctaaac tagtggatcc taatacgact cactataggg gaattgtgag 50

<210> 65

<211> 40

<212> DNA

<213> 引物(Primer)

<400> 65

cttaagcatt atgcggccgc ttaaccgctg cccagaccat 40

<210> 66

<211> 50

<212> DNA

<213> 引物(Primer)

<400> 66

cgacctaaac tagtggatcc taatacgact cactataggg gaattgtgag 50

<210> 67

<211> 41

<212> DNA

<213> 引物(Primer)

<400> 67

cttaagcatt atgcggccgc ttaaacgcca tacgcgctcg g 41

Claims

1.一种催化二氢查尔酮化合物或2-羟基黄烷酮化合物生成碳苷二氢查尔酮化合物或碳苷-2-羟基黄烷酮化合物的方法，包括：以糖基转移酶进行所述催化；所述的糖基转移酶为选自SEQ ID NO:1～20任一所述的多肽或其保守性序列变体。

2.如权利要求1所述的方法，其特征在于，所述二氢查尔酮化合物具有式(I)的母核结构，所述2-羟基黄烷酮化合物具有式(II)的母核结构，所述碳苷二氢查尔酮化合物具有式(III)的母核结构，或所述碳苷-2-羟基黄烷酮化合物具有式(IV)的母核结构：

其中，R为糖基，其与A环以碳碳键连接。

3.如权利要求2所述的方法，其特征在于，A环或B环中，存在1～3个羟基；较佳地，A环中，羟基存在于第2’、4’和/或6’位；较佳地，B环中，羟基出现在第4位。

4.如权利要求3所述的方法，其特征在于，R在A环上的数量为1个，较佳地其存在于第3’位；或

R在A环上的数量为2个，较佳地其存在于第3’和5’位；且，所述的糖基转移酶为选自SEQID NO:6，8，10，17，19或20所述的多肽或其保守性序列变体。

5.如权利要求4所述的方法，其特征在于，所述的二氢查尔酮化合物或2-羟基黄烷酮化合物包括：根皮素，2-羟基柚皮素，2-羟基圣草酚；和/或

所述的碳苷二氢查尔酮化合物或碳苷-2-羟基黄烷酮化合物包括：Nothofagin，根皮素-3’,5’-C-葡萄糖双碳苷，2-羟基柚皮素-6-C(8-C)-葡萄糖苷，2-羟基圣草酚-6-C(8-C)-葡萄糖苷。

6.如权利要求2所述的方法，其特征在于，所述的糖基为葡萄糖；较佳地，在利用所述糖基转移酶进行糖基转移时，以携带葡萄糖基团的化合物作为供体；更佳地，以UDP葡萄糖作为糖基供体。

7.糖基转移酶的用途，用于催化二氢查尔酮化合物或2-羟基黄烷酮化合物生成碳苷二氢查尔酮化合物或碳苷-2-羟基黄烷酮化合物；其中，所述的糖基转移酶为选自SEQ ID NO:1～20任一所示的多肽或其保守性变异多肽。

8.如权利要求7所述的用途，其特征在于，所述的二氢查尔酮化合物具有式(I)的母核结构，所述2-羟基黄烷酮化合物具有式(II)的母核结构，所述碳苷二氢查尔酮化合物具有式(III)的母核结构，或所述碳苷-2-羟基黄烷酮化合物具有式(IV)的母核结构：

其中，R为糖基，其与A环以碳碳键连接。

9.如权利要求8所述的用途，其特征在于，A环或B环中，存在1～3个羟基；较佳地，A环中，羟基存在于第2’、4’和/或6’位；较佳地，B环中，羟基出现在第4位。

10.如权利要求9所述的用途，其特征在于，R在A环上的数量为1个，较佳地其存在于3’位置；或

R在A环上的数量为2个，较佳地其存在于第3’和5’位；且，所述的糖基转移酶为选自SEQID NO:6，8，10，17，19或20所示的多肽或其保守性变异多肽。

11.如权利要求10所述的用途，其特征在于，所述二氢查尔酮化合物或2-羟基黄烷酮化合物包括：根皮素，2-羟基柚皮素，2-羟基圣草酚；和/或

所述碳苷二氢查尔酮化合物或碳苷-2-羟基黄烷酮化合物包括：Nothofagin，根皮素-3’,5’-C-葡萄糖双碳苷，2-羟基柚皮素-6-C(8-C)-葡萄糖苷，2-羟基圣草酚-6-C(8-C)-葡萄糖苷。

12.如权利要求1～11任一所述，其特征在于，所述的保守性变异多肽选自：

(1)由SEQ ID NO:1～20任一所示序列的多肽经过一个或多个氨基酸残基的取代、缺失或添加而形成的，且具有催化二氢查尔酮化合物或2-羟基黄烷酮化合物生成碳苷二氢查尔酮化合物或碳苷-2-羟基黄烷酮化合物功能的多肽；

(2)氨基酸序列与SEQ ID NO:1～20任一所示序列的多肽有80％以上相同性，且具有催化二氢查尔酮化合物或-羟基黄烷酮化合物生成碳苷二氢查尔酮化合物或碳苷-2-羟基黄烷酮化合物功能的多肽；或

(3)在SEQ ID NO:1～20任一所示序列的多肽的N或C末端添加标签序列，或在其N末端添加信号肽序列后形成的多肽。

13.一种合成黄酮碳苷化合物的方法，其特征在于，包括：

(1)将2-羟基黄烷酮化合物以糖基转移酶催化，产生碳苷-2-羟基黄烷酮化合物；其中，所述的糖基转移酶为选自SEQ ID NO:1～20任一所述的多肽或其保守性序列变体；

(2)将(1)的碳苷-2-羟基黄烷酮化合物脱水，获得黄酮碳苷化合物。

14.如权利要求13所述的方法，其特征在于，在(1)之前，还包括：(c)将黄烷酮化合物通过黄烷酮-2-羟化酶催化，获得2-羟基黄烷酮化合物。

15.如权利要求14所述的方法，其特征在于，在(c)之前，还包括：(b)将丙二酰-CoA结构类似物与p-香豆酰-CoA结构类似物经查尔酮合成酶和查尔酮异构酶催化，获得黄烷酮化合物。

16.如权利要求15所述的方法，其特征在于，在(b)之前，还包括：(a)将芳香族氨基酸经酪氨酸解氨酶或苯丙氨酸解氨酶和4-香豆酰-CoA连接酶催化，获得p-香豆酰-CoA结构类似物。

17.如权利要求14～16任一所述的方法，其特征在于，所述的黄烷酮化合物包括：柚皮素，圣草酚；

所述的丙二酰-CoA结构类似物包括：丙二酰-CoA或甲基丙二酰-CoA；

所述的p-香豆-CoA结构类似物包括：p-香豆酰-CoA或p-肉桂酰-CoA；

所述的芳香族氨基酸包括：L-酪氨酸或L-苯丙氨酸。

18.如权利要求13～16任一所述的方法，其特征在于，所述的2-羟基黄烷酮化合物为2-羟基柚皮素，其是从柚皮素通过黄烷酮-2-羟化酶催化获得；或

所述2-羟基黄烷酮化合物为2-羟基圣草酚，其是从圣草酚通过黄烷酮-2-羟化酶催化获得；较佳地，所述圣草酚是从柚皮素通过黄烷酮-3’-羟化酶催化获得。

19.一种生物合成黄酮碳苷化合物的方法，其特征在于，包括：

(i)将合成柚皮素化合物的前体基因、编码黄烷酮-2-羟化酶和/或黄烷酮-3’-羟化酶的基因以及编码糖基转移酶的基因共转入宿主细胞中；其中，所述的糖基转移酶为选自SEQID NO:1～20任一所述的多肽或其保守性序列变体；

(ii)培养(i)的细胞，从而生物合成黄酮碳苷化合物。

20.如权利要求19所述的方法，其特征在于，所述的黄烷酮-2-羟化酶和黄烷酮-3’-羟化酶为截去N端跨膜区域的P450氧化酶；较佳地，在截去N端跨膜区域后，还包括添加标签；更佳地，所述标签包括：2B1，17α，MBP。

21.一种遗传工程化的细胞，其特征在于，其中包括：合成柚皮素化合物的前体基因、编码黄烷酮-2-羟化酶和/或黄烷酮-3’-羟化酶的基因以及编码糖基转移酶的基因；其中，所述的糖基转移酶为选自SEQ ID NO:1～20任一所述的多肽或其保守性序列变体。

22.制备权利要求21的细胞的方法，其特征在于，包括：将合成柚皮素化合物的前体基因、编码黄烷酮-2-羟化酶和/或黄烷酮-3’-羟化酶的基因以及编码糖基转移酶的基因共转入宿主细胞中；其中，所述的糖基转移酶为选自SEQ ID NO:1～20任一所述的多肽或其保守性序列变体。

23.一种用于生物合成黄酮碳苷化合物或其中间体的试剂盒，其中包括：SEQ ID NO:1～20所示的一条或多条多肽或其保守性变异多肽；黄烷酮-2-羟化酶和/或黄烷酮-3’-羟化酶；合成柚皮素化合物的前体基因；较佳地还包括宿主细胞；或

其中包括权利要求21所述的遗传工程化的细胞。

24.如权利要求19～23任一所述，其特征在于，所述的细胞包括：原核细胞或真核细胞；较佳地，所述原核宿主细胞包括大肠杆菌，酵母，链霉菌。

25.如权利要求13～23任一所述，其特征在于，所述的黄酮碳苷化合物包括：牡荆素，异牡荆素，荭草苷，异荭草苷，维采宁-2，光牡荆素。