CN113265433B - 双功能碳苷糖基转移酶及其应用 - Google Patents

双功能碳苷糖基转移酶及其应用 Download PDF

Info

Publication number
CN113265433B
CN113265433B CN202010096973.5A CN202010096973A CN113265433B CN 113265433 B CN113265433 B CN 113265433B CN 202010096973 A CN202010096973 A CN 202010096973A CN 113265433 B CN113265433 B CN 113265433B
Authority
CN
China
Prior art keywords
ala
val
leu
gly
compound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010096973.5A
Other languages
English (en)
Other versions
CN113265433A (zh
Inventor
王勇
孙雨伟
陈卓
张前
张英
刘海利
李建华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Center for Excellence in Molecular Plant Sciences of CAS
Original Assignee
Center for Excellence in Molecular Plant Sciences of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Center for Excellence in Molecular Plant Sciences of CAS filed Critical Center for Excellence in Molecular Plant Sciences of CAS
Priority to CN202010096973.5A priority Critical patent/CN113265433B/zh
Priority to US17/904,131 priority patent/US20230105024A1/en
Priority to EP21757647.9A priority patent/EP4108777A4/en
Priority to PCT/CN2021/076398 priority patent/WO2021164673A1/zh
Publication of CN113265433A publication Critical patent/CN113265433A/zh
Application granted granted Critical
Publication of CN113265433B publication Critical patent/CN113265433B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/02Oxygen as only ring hetero atoms
    • C12P17/06Oxygen as only ring hetero atoms containing a six-membered hetero ring, e.g. fluorescein
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/02Monosaccharides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/12Disaccharides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/18Preparation of compounds containing saccharide radicals produced by the action of a glycosyl transferase, e.g. alpha-, beta- or gamma-cyclodextrins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/02Pentosyltransferases (2.4.2)
    • C12Y204/02043Lipid IVA 4-amino-4-deoxy-L-arabinosyltransferase (2.4.2.43)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/101Plasmid DNA for bacteria

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明提供了一组新型的尿苷二磷酸(UDP)‑糖基转移酶,其是双功能的碳苷阿拉伯糖基转移酶和碳苷葡萄糖基转移酶。所述的糖基转移酶能够特异和高效地催化二氢查尔酮(类)化合物或2‑羟基黄烷酮(类)化合物的碳苷阿拉伯糖基化和葡萄糖基化,从而产生一类碳苷二氢查尔酮、碳苷‑2‑羟基黄烷酮(类)化合物;碳苷‑2‑羟基黄烷酮(类)化合物通过进一步的脱水反应形成黄酮碳苷(类)化合物。本发明还涉及将这些新型UDP糖基转移酶应用于人工构建的重组表达系统,通过发酵工程生产碳苷二氢查尔酮、黄酮碳苷化合物。

Description

双功能碳苷糖基转移酶及其应用
技术领域
本发明属于合成生物学领域,更具体地,本发明涉及一种碳苷葡萄糖基和阿拉伯糖基转移酶及其应用。
背景技术
黄酮化合物是以C6-C3-C6为结构母核的一类多酚羟基(类)化合物,根据母核结构及官能基取代的不同,可以分为黄酮、黄酮醇、黄烷酮、花青素、查尔酮等。黄酮(类)化合物在于植物体内常以糖苷的形式存在,这样的糖基化修饰主要由尿苷二磷酸(UDP)-糖基转移酶(UGT)催化发生。糖基与苷元母核直接以C-C键的方式连接的黄酮苷(类)化合物被称为黄酮碳苷。
黄酮碳苷(类)化合物具有多种多样的药理活性,根据报道,黄酮碳苷化合物具有显著的抗氧化作用,可以显著性抑制外源性以及内源性自由基;同时,其具有一定程度抑制细菌病毒的作用;黄酮碳苷化合物可以显著性地降低血液中总胆固醇的含量,具有治疗心脑血管疾病的药物活性;同时黄酮碳苷化合物具有显著性抗辐射以及神经保护的作用;有调查表明黄酮碳苷化合物具有相关抗代谢疾病的作用,对于糖尿病、肥胖等疾病均具有一定的治疗效果。
相对于自然界广泛存在的葡萄糖苷(类)化合物,阿拉伯糖苷(类)化合物较为稀少,而阿拉伯糖的碳苷化合物更为稀少。目前已知的具有阿拉伯糖基的黄酮碳苷有夏佛塔苷、异夏佛塔苷、新夏佛塔苷、刺苞菊苷、异刺苞菊苷、新刺苞菊苷等几种,而对于双阿拉伯糖黄酮碳苷甚至尚无命名。迄今为止,也尚无对于黄酮进行阿拉伯糖碳苷糖基化的糖基转移酶的报道。在本领域中,目前基本上只能通过从自然界分离阿拉伯糖碳苷化合物,大规模低成本的生物合成或人工合成等方面的生产工艺均需要进一步研究和开发。
发明内容
本发明的目的在于提供一种双功能碳苷糖基转移酶及其应用用。
在本发明的第一方面,提供一种催化二氢查尔酮(类)化合物或2-羟基黄烷酮(类)化合物生成碳苷二氢查尔酮(类)化合物或碳苷-2-羟基黄烷酮(类)化合物的方法,所述方法包括:以糖基转移酶进行所述催化;所述的糖基转移酶包括选自SEQ ID NO:1~12任一所述的多肽或其保守性变异多肽。
在一个优选例中,所述的二氢查尔酮(类)化合物具有式(I)的母核结构、2-羟基黄烷酮(类)化合物(较佳地为开环形式)具有式(II)的母核结构,所述碳苷二氢查尔酮(类)化合物具有式(III)的母核结构,所述碳苷-2-羟基黄烷酮(类)化合物(较佳地为开环形式)具有式(IV)的母核结构:
其中,R为糖基,其与A环以碳碳键连接。
在另一优选例中,A环或B环中,存在1~3个羟基;较佳地,A环中,羟基存在于第2’、4’和/或6’位;较佳地,B环中,羟基出现在第4位。
在另一优选例中,R在A环上的数量为1个,较佳地其存在于第3’位。
在另一优选例中,R在A环上的数量为2个,较佳地其存在于第3’和5’位;且,所述的糖基转移酶包括选自SEQ ID NO:6,7,9或11所述的多肽或其保守性变异多肽。
在另一优选例中,所述的糖基为阿拉伯糖或葡萄糖;在利用所述糖基转移酶进行糖基转移时,以携带阿拉伯糖基团或葡萄糖基团的化合物作为供体;更佳地,以UDP阿拉伯糖、UDP葡萄糖作为糖基供体。
在另一优选例中,,所述二氢查尔酮(类)化合物或2-羟基黄烷酮(类)化合物包括(但不限于):根皮素,2-羟基柚皮素(较佳地为开环形式),2-羟基圣草酚(较佳地为开环形式)。
在另一优选例中,所述的碳苷二氢查尔酮(类)化合物或碳苷-2-羟基黄烷酮(类)化合物包括:根皮素-C-阿拉伯糖苷,2-羟基柚皮素-C-阿拉伯糖苷,2-羟基圣草酚-C-阿拉伯糖苷,根皮素-C-双阿拉伯糖苷,2-羟基柚皮素-C-双阿拉伯糖苷,2-羟基圣草酚-C-双阿拉伯糖苷,Nothofagin,2-羟基柚皮素-C-葡萄糖苷,2-羟基圣草酚-C-葡萄糖苷,根皮素-C-双葡萄糖碳苷,2-羟基柚皮素-C-双葡萄糖苷,2-羟基圣草酚-C-双葡萄糖苷,根皮素-C-阿拉伯糖-C-葡萄糖苷,2-羟基柚皮素-C-阿拉伯糖-C-葡萄糖苷,2-羟基圣草酚-C-阿拉伯糖-C-葡萄糖苷。
在本发明的另一方面,提供糖基转移酶的用途,用于催化二氢查尔酮(类)化合物或2-羟基黄烷酮(类)化合物生成碳苷二氢查尔酮(类)化合物或碳苷-2-羟基黄烷酮(类)化合物;其中,所述的糖基转移酶包括选自SEQ ID NO:1~12任一所示的多肽或其保守性变异多肽。
在一个优选例中,所述二氢查尔酮(类)化合物具有式(I)的母核结构、所述2-羟基黄烷酮(类)化合物(较佳地为开环形式)具有式(II)的母核结构,所述碳苷二氢查尔酮(类)化合物具有式(III)的母核结构,碳苷-2-羟基黄烷酮(类)化合物(较佳地为开环形式)具有式(IV)的母核结构:
其中,R为糖基,其与A环以碳碳键连接。
在另一优选例中,A环或B环中,存在1~3个羟基;较佳地,A环中,羟基存在于第2’、4’和/或6’位;较佳地,B环中,羟基出现在第4位。
在另一优选例中,R在A环上的数量为1个,较佳地其存在于第3’位。
在另一优选例中,R在A环上的数量为2个,较佳地其存在于第3’和5’位;且,所述的糖基转移酶包括选自SEQ ID NO:6,7,9或11所示的多肽或其保守性变异多肽。
在另一优选例中,R为单糖基。
在另一优选例中,所述的糖基为阿拉伯糖或葡萄糖;较佳地,在利用所述糖基转移酶进行糖基转移时,以携带阿拉伯糖基团或葡萄糖基团的化合物作为供体;更佳地,以UDP阿拉伯糖、UDP葡萄糖、TDP阿拉伯糖或TDP葡萄糖作为糖基供体。
在另一优选例中,所述二氢查尔酮(类)化合物或2-羟基黄烷酮(类)化合物包括(但不限于):根皮素,2-羟基柚皮素(较佳地为开环形式),2-羟基圣草酚(较佳地为开环形式)。
在另一优选例中,所述的碳苷二氢查尔酮(类)化合物或碳苷-2-羟基黄烷酮(类)化合物包括:根皮素-C-阿拉伯糖苷,2-羟基柚皮素-C-阿拉伯糖苷,2-羟基圣草酚-C-阿拉伯糖苷,根皮素-C-双阿拉伯糖苷,2-羟基柚皮素-C-双阿拉伯糖苷,2-羟基圣草酚-C-双阿拉伯糖苷,Nothofagin,2-羟基柚皮素-C-葡萄糖苷,2-羟基圣草酚-C-葡萄糖苷,根皮素-C-双葡萄糖碳苷,2-羟基柚皮素-C-双葡萄糖苷,2-羟基圣草酚-C-双葡萄糖苷,根皮素-C-阿拉伯糖-C-葡萄糖苷,2-羟基柚皮素-C-阿拉伯糖-C-葡萄糖苷,2-羟基圣草酚-C-阿拉伯糖-C-葡萄糖苷。
在另一优选例中,所述的保守性变异多肽选自:(1)由SEQ ID NO:1~12任一所示序列的多肽经过一个或多个(如1-20个,较佳地1-10个;更佳地1-5个;更佳地1-3个)氨基酸残基的取代、缺失或添加而形成的,且具有催化二氢查尔酮(类)化合物或2-羟基黄烷酮(类)化合物生成碳苷二氢查尔酮(类)化合物或碳苷-2-羟基黄烷酮(类)化合物功能的多肽;(2)氨基酸序列与SEQ ID NO:1~12任一所示序列的多肽有80%以上(较佳地85%以上;更佳地90%以上;更佳地95%以上;更佳地99%以上)相同性,且具有催化二氢查尔酮(类)化合物或2-羟基黄烷酮(类)化合物生成碳苷二氢查尔酮(类)化合物或碳苷-2-羟基黄烷酮(类)化合物功能的多肽;或(3)在SEQ ID NO:1~12任一所示序列的多肽的N或C末端添加标签序列,或在其N末端添加信号肽序列后形成的多肽。
在本发明的另一方面,提供一种合成(包括人工合成或体外合成)黄酮碳苷(类)化合物的方法,包括:(1)将2-羟基黄烷酮(类)化合物以糖基转移酶催化,产生碳苷-2-羟基黄烷酮(类)化合物;其中,所述的糖基转移酶包括选自SEQ ID NO:1~12任一所述的多肽或其保守性变异多肽;(2)将(1)的碳苷-2-羟基黄烷酮(类)化合物脱水,获得黄酮碳苷(类)化合物。
在一个优选例中,在(1)之前,还包括:(c)将黄烷酮(类)化合物通过黄烷酮-2-羟化酶(F2H)催化,获得2-羟基黄烷酮(类)化合物。
在另一优选例中,在(c)之前,还包括:(b)将丙二酰-CoA结构类似物(如包括其经1或多基团的取代形式)与p-香豆酰-CoA结构类似物(如包括其经1或多基团的取代形式)经查尔酮合成酶(CHS)和查尔酮异构酶(CHI)催化,获得黄烷酮(类)化合物。
在另一优选例中,在(b)之前,还包括:(a)将芳香族氨基酸经酪氨酸解氨酶(TAL)或苯丙氨酸解氨酶(PAL)和4-香豆酰-CoA连接酶(4CL)催化,获得p-香豆酰-CoA或其结构类似物。
在另一优选例中,所述的黄烷酮(类)化合物包括:柚皮素,圣草酚。
在另一优选例中,所述的丙二酰-CoA结构类似物包括:丙二酰-CoA;甲基丙二酰-CoA。
在另一优选例中,所述的p-香豆-CoA结构类似物包括:p-香豆酰-CoA;p-肉桂酰-CoA。
在另一优选例中,所述的芳香族氨基酸包括:L-酪氨酸或L-苯丙氨酸。
在另一优选例中,所述的2-羟基黄烷酮(类)化合物为2-羟基柚皮素,其是从柚皮素通过黄烷酮-2-羟化酶(F2H)催化获得。
在另一优选例中,所述2-羟基黄烷酮(类)化合物为2-羟基圣草酚,其是从圣草酚通过黄烷酮-2-羟化酶(F2H)催化获得;较佳地,所述圣草酚是从柚皮素通过黄烷酮-3’-羟化酶(F3’H)催化获得。
在本发明的另一方面,提供一种生物合成黄酮碳苷(类)化合物的方法,包括:(i)将合成柚皮素(类)化合物的前体基因、编码黄烷酮-2-羟化酶和/或黄烷酮-3’-羟化酶的基因以及编码糖基转移酶的基因共转入宿主细胞中;其中,所述的糖基转移酶包括选自SEQID NO:1~12任一所述的多肽或其保守性变异多肽;(ii)培养(i)的细胞,从而合成黄酮碳苷(类)化合物。
在一个优选例中,所述的黄烷酮-2-羟化酶和黄烷酮-3’-羟化酶为截去N端跨膜区域的P450氧化酶;较佳地,在截去N端跨膜区域后,还包括添加标签;更佳地,所述标签包括(但不限于):2B1,17α,MBP,其具有助溶的作用。
在另一优选例中,还在宿主细胞中转入合成糖基供体的基因,所述糖基包括阿拉伯糖或葡萄糖;较佳地,所述糖基供体为携带阿拉伯糖基团或葡萄糖基团的化合物;更佳地所述糖基供体包括UDP阿拉伯糖或UDP葡萄糖。
在本发明的另一方面,提供一种遗传工程化的细胞,包括:合成黄烷酮化合物的前体基因、编码黄烷酮-2-羟化酶和/或黄烷酮-3’-羟化酶的基因以及编码糖基转移酶的基因;其中,所述的糖基转移酶包括选自SEQ ID NO:1~12任一所述的多肽或其保守性变异多肽;较佳地,所述合成黄烷酮化合物的前体基因包括TAL或PAL、4CL、CHS、CHI基因。
在另一优选例中,所述的细胞中还包括合成糖基供体的基因;较佳地,所述糖基包括阿拉伯糖或葡萄糖;较佳地,所述糖基供体为携带阿拉伯糖基团或葡萄糖基团的化合物;更佳地所述糖基供体包括UDP阿拉伯糖或UDP葡萄糖。
在本发明的另一方面,提供制备所述细胞的方法,包括:将合成黄烷酮化合物的前体基因、编码黄烷酮-2-羟化酶和/或黄烷酮-3’-羟化酶的基因以及编码糖基转移酶的基因共转入宿主细胞中;其中,所述的糖基转移酶为选自SEQ ID NO:1~12任一所述的多肽或其保守性变异多肽;较佳地,还将合成糖基供体的基因转入宿主细胞中。
在本发明的另一方面,提供一种用于生物合成黄酮碳苷化合物或其中间体的试剂盒,其中包括:SEQ ID NO:1~12所示的一条或多条多肽或其保守性变异多肽;黄烷酮-2-羟化酶和/或黄烷酮-3’-羟化酶;合成黄烷酮化合物的前体基因;和/或,合成糖基供体的多肽或其编码基因;较佳地还包括宿主细胞。
在本发明的另一方面,提供一种用于生物合成黄酮碳苷化合物或其中间体的试剂盒,其中包括所述的遗传工程化的细胞。
在本发明的另一方面,提供一种用于生物合成黄酮碳苷(类)化合物或其中间体的试剂盒,其中包括:SEQ ID NO:1~12所示的一条或多条(如2、3、4条)多肽或其保守性变异多肽;黄烷酮-2-羟化酶和/或黄烷酮-3’-羟化酶;合成柚皮素(类)化合物的前体基因;较佳地还包括宿主细胞。
在一个优选例中,所述的宿主细胞包括:原核细胞或真核细胞;较佳地,所述原核宿主细胞包括大肠杆菌或链霉菌;所述的真核细胞包括酵母。
在另一优选例中,所述的黄酮碳苷(类)化合物包括:牡荆素,异牡荆素,荭草苷,异荭草苷,芹菜素-6-C-阿拉伯糖苷,芹菜素-8-C-阿拉伯糖苷,木犀草素-6-C-阿拉伯糖苷,木犀草素-8-C-阿拉伯糖苷,维采宁-2(新西兰牡荆素,vicenin-2),光牡荆素(lucenin 2),芹菜素-6,8-C-双阿拉伯糖苷,木犀草素-6,8-C-双阿拉伯糖苷,夏佛塔苷,异夏佛塔苷,刺苞菊苷,异刺苞菊苷。
本发明的其它方面由于本文的公开内容,对本领域的技术人员而言是显而易见的。
附图说明
图1、CGT体外酶催化反应转化产物的HPLC分析结果;(A)以根皮素为底物;(B)以2-羟基柚皮素为底物;以UDP阿拉伯糖为糖基供体。
图2、根皮素-C-阿拉伯糖苷的二级质谱图谱。
图3、根皮素-C-阿拉伯糖苷的1H NMR图谱。
图4、2-羟基柚皮素-C-阿拉伯糖苷的二级质谱图谱。
图5、OsiCGT6、BdCGT2和ZmCGT3对底物根皮素催化,获得根皮素-C-阿拉伯糖苷,还产生根皮素-C-双阿拉伯糖碳苷。
图6、根皮素-C-双阿拉伯糖碳苷的二级质谱图谱。
图7、CGT体外酶催化反应转化产物的HPLC分析结果;(A)以根皮素为底物;(B)以2-羟基柚皮素为底物;以UDP葡萄糖为糖基供体。
图8A、Nothofagin的二级质谱图谱。
图8B、根皮素-C-双葡萄糖碳苷的二级质谱图谱。
图9、2-羟基柚皮素-C-葡萄糖苷的二级质谱图谱。
图10、夏佛塔苷及其异构体的预测生物合成途径。
图11、质粒pYH55、质粒pCZ201的主要元件的示意图。
图12、质粒pCZ86、pCZ163、pCZ165的主要元件的示意图。
图13、质粒pCZ193、pCZ194的主要元件的示意图。
图14、HPLC、LC-MS检测工程菌株sCZ114的发酵产物的成分。
图15、芹菜素-6-C-阿拉伯糖碳苷、芹菜素-8-C-阿拉伯糖碳苷、芹菜素-6,8-C-双阿拉伯糖碳苷的预测生物合成途径。
图16、HPLC、LC-MS检测工程菌株sCZ118的发酵产物的成分。
具体实施方式
本发明人经过深入的研究,筛选出一组新型的尿苷二磷酸(UDP)-糖基转移酶,其是双功能的碳苷阿拉伯糖基转移酶和碳苷葡萄糖基转移酶。所述的糖基转移酶能够特异和高效地催化二氢查尔酮(类)化合物或2-羟基黄烷酮(类)化合物的碳苷阿拉伯糖基化和葡萄糖基化,从而产生一类碳苷二氢查尔酮(类)化合物、碳苷-2-羟基黄烷酮(类)化合物;碳苷-2-羟基黄烷酮(类)化合物通过进一步的脱水反应形成黄酮碳苷(类)化合物。本发明还涉及将这些新型UDP糖基转移酶应用于人工构建的重组表达系统,通过发酵工程生产碳苷二氢查尔酮、黄酮碳苷化合物。
活性多肽、其编码基因、载体及宿主
本发明人通过挖掘基因组以及转录组信息,结合大量的研究和实验工作,揭示了一组新的尿苷二磷酸(UDP)-糖基转移酶,其是双功转移酶,具有碳苷阿拉伯糖基转移酶(C-arabinosyltransferase)活性和碳苷葡萄糖基转移酶(C-glucosyltransferase)活性。较佳地,该组碳苷糖基转移酶来源于单子叶禾本科植物;更佳地,包括来自于毛竹(Phyllostachys edulis(或称Phyllostachys heterocycla);Ph)、粳稻(Oryza sativajaponica;Osj)、籼稻(Oryza sativa indica;Osi)、玉米(Zea mays;Zm)、高粱(Sorghumbicolor;Sb)、二穗短柄草(Brachypodium distachyon;Bd)、谷子(Setaria italica;Si)。
作为本发明的优选方式,所述碳苷糖基转移酶是糖基转移酶PhCGT3(SEQ ID NO:1)、PhCGT4(SEQ ID NO:2)、OsjCGT3(SEQ ID NO:3)、OsiCGT4(SEQ ID NO:4)、OsiCGT5(SEQID NO:5)、OsiCGT6(SEQ ID NO:6)、BdCGT2(SEQ ID NO:7)、ZmCGT2(SEQ ID NO:8)、ZmCGT3(SEQ ID NO:9)、SiCGT3(SEQ ID NO:10)、SbCGT3(SEQ ID NO:11)、SbCGT4(SEQ ID NO:12)。
本发明也包括所述碳苷糖基转移酶的保守性变异多肽(保守性序列变体)。本发明中,所述的“保守性变异多肽”是指基本上保持所述多肽相同的生物学功能或活性的多肽。所述的“保守性变异多肽”可以是(i)有一个或多个保守或非保守性氨基酸残基(优选保守性氨基酸残基)被取代的多肽,而这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的,或(ii)在一个或多个氨基酸残基中具有取代基团的多肽,或(iii)成熟多肽与另一个化合物(比如延长多肽半衰期的化合物,例如聚乙二醇)融合所形成的多肽,或(iv)附加的氨基酸序列融合到此多肽序列而形成的多肽(如前导序列或分泌序列或用来纯化此多肽的序列或蛋白原序列,或与抗原IgG片段的形成的融合蛋白)。根据本文的教导,这些片段、衍生物和类似物属于本领域熟练技术人员公知的范围。
所述的“保守性变异多肽”可以包括(但并不限于):一个或多个(通常为1-50个,较佳地1-30个,更佳地1-20个,最佳地1-10个)氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加或缺失一个或数个(如50个以内,较20个或10个以内,更佳地为5个以内)氨基酸。例如,在本领域中,用性能相近或相似的氨基酸进行取代时,通常不会改变蛋白质的功能。又比如,在C末端和/或N末端添加一个或数个氨基酸通常也不会改变蛋白质的功能。本发明还提供所述多肽的类似物。这些类似物与天然多肽的差别可以是氨基酸序列上的差异,也可以是不影响序列的修饰形式上的差异,或者兼而有之。这些多肽包括天然或诱导的遗传变异体。诱导变异体可以通过各种技术得到,如通过辐射或暴露于诱变剂而产生随机诱变,还可通过定点诱变法或其他已知分子生物学的技术。类似物还包括具有不同于天然L-氨基酸的残基(如D-氨基酸)的类似物,以及具有非天然存在的或合成的氨基酸(如β、γ-氨基酸)的类似物。应理解,本发明的多肽并不限于上述例举的代表性的多肽。
作为本发明的优选方式,本发明涉及到的P450氧化酶(黄烷酮-2-羟化酶和黄烷酮-3’-羟化酶)是去除了N端的跨膜区的多肽片段,从而避免该酶被锚定于细胞膜上,使得截短后蛋白的可溶性表达增加,当被应用于生物合成途径中时,发挥更好的活性。
本发明的碳苷糖基转移酶的氨基端或羧基端还可含有一个或多个多肽片段,作为蛋白标签。任何合适的标签都可以用于本发明,包括可用于对蛋白进行纯化的标签或具有助溶性能的标签。例如,所述的标签可以是FLAG、HA、HA1、c-Myc、Poly-His、Poly-Arg、Strep-TagII、AU1、EE、T7、4A6、ε、B、gE、以及Ty1。又例如,所述的标签可以是助溶标签包括2B,17α,MBP等。
当出于生产本发明的碳苷糖基转移酶的目的时,为了使翻译的蛋白分泌表达(如分泌到细胞外),还可在本发明的多肽的氨基端添加上信号肽序列。信号肽在多肽从细胞内分泌出来的过程中可被切去。
本发明的活性多肽可以是重组多肽、天然多肽、合成多肽。本发明的多肽可以是天然纯化的产物,或是化学合成的产物,或使用重组技术从原核或真核宿主(例如,细菌、酵母、高等植物)中产生。根据重组生产方案所用的宿主,本发明的多肽可以是糖基化的,或可以是非糖基化的。本发明的多肽还可包括或不包括起始的甲硫氨酸残基。
编码本发明的碳苷糖基转移酶的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。术语“编码多肽的多核苷酸”可以是包括编码此多肽的多核苷酸,也可以是还包括附加编码和/或非编码序列的多核苷酸。
本发明也涉及包含本发明的多核苷酸的载体,以及用本发明的载体或多肽编码序列经基因工程产生的宿主细胞,以及经重组技术产生本发明所述多肽的方法。
通过常规的重组DNA技术,可表达或生产重组的多肽。一般来说有以下步骤:(1).用编码所述多肽(含其保守性变异多肽)的多核苷酸,或用含有该多核苷酸的重组表达载体转化或转导合适的宿主细胞;(2).在合适的培养基中培养的宿主细胞;(3).从培养基或细胞中分离、纯化蛋白质。
本发明中,编码所述多肽的多核苷酸序列可插入到重组表达载体中。术语“重组表达载体”指本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒如腺病毒、逆转录病毒或其他载体。只要能在宿主体内复制和稳定,任何质粒和载体都可以用。表达载体的一个重要特征是通常含有复制起点、启动子、标记基因和翻译控制元件。较佳地,所述表达载体可以是原核表达载体。
本领域的技术人员熟知的方法能用于构建含本发明的碳苷糖基转移酶的多核苷酸和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等。所述的DNA序列可有效连接到表达载体中的适当启动子上,以指导mRNA合成。此外,表达载体优选地包含一个或多个选择性标记基因,以提供用于选择转化的宿主细胞的表型性状。
包含上述的适当DNA序列以及适当启动子或者控制序列的载体,可以用于转化适当的宿主细胞,以使其能够表达蛋白质。宿主细胞可以是原核细胞,如细菌细胞;或是低等真核细胞,如酵母细胞;或是高等真核细胞,如哺乳动物细胞。代表性例子有:大肠杆菌,链霉菌属,枯草杆菌;鼠伤寒沙门氏菌的细菌细胞;真菌细胞如酵母,植物细胞,灵芝细胞;果蝇S2或Sf9的昆虫细胞;CHO、COS、293细胞、或Bowes黑素瘤细胞的动物细胞等。
本发明也提供了用于生物合成黄酮碳苷(类)化合物或其中间体的宿主细胞,其中包括:合成黄烷酮化合物的前体基因、编码黄烷酮-2-羟化酶和/或黄烷酮-3’-羟化酶的基因以及本发明所述的编码糖基转移酶的基因。
在本发明的优选方式中,所述的宿主细胞为原核细胞,更佳地为大肠杆菌。但是应理解,细胞宿主仅是一种生产工具,本领域技术人员可以通过一些技术手段对大肠杆菌以外的其他宿主细胞进行改造,从而也实现如本发明的生物合成,由此构成的宿主细胞以及生产方法也应包含在本发明中。
应用及生产工艺
本发明的碳苷糖基转移酶或它们的保守性变异多肽,可应用于特异和高效地催化二氢查尔酮(类)化合物或2-羟基黄烷酮(类)化合物的碳苷葡萄糖基化,从而产生一类碳苷二氢查尔酮、碳苷-2-羟基黄烷酮(类)化合物;碳苷-2-羟基黄烷酮(类)化合物通过进一步的脱水反应形成黄酮碳苷(类)化合物。
因此,本发明提供了糖基转移酶的用途,用于催化二氢查尔酮(类)化合物或2-羟基黄烷酮(类)化合物生成碳苷二氢查尔酮、碳苷-2-羟基黄烷酮(类)化合物;其中,所述的糖基转移酶包括选自SEQ ID NO:1~12任一所示的多肽或其保守性变异多肽。
如本发明所用,所述的二氢查尔酮(类)化合物包括二氢查尔酮或其衍生物、结构类似物、异构体。所述的2-羟基黄烷酮(类)化合物包括2-羟基黄烷酮或其衍生物、结构类似物、异构体。所述的碳苷二氢查尔酮(类)化合物包括碳苷二氢查尔酮或其衍生物、结构类似物、异构体。所述碳苷-2-羟基黄烷酮(类)化合物包括碳苷-2-羟基黄烷酮或其衍生物、结构类似物、异构体。所述黄酮碳苷(类)化合物包括黄酮碳苷或其衍生物、结构类似物、异构体。
在本发明的优选方式中,所述的二氢查尔酮具有式(I)的母核结构、2-羟基黄烷酮(类)化合物(开环形式)具有式(II)的母核结构,所述碳苷二氢查尔酮(类)化合物具有式(III)的母核结构,碳苷-2-羟基黄烷酮(类)化合物(开环形式)具有式(IV)的母核结构:
其中,R为糖基,其与A环以碳碳键连接。所述的糖基可以是单糖、二糖或多糖基(如3个或以上(如3~10个,更具体如4、5、6、7、8、10个)单糖串联)。在优选的方式中,所述的糖基为单糖基。
在本发明的优选方式中,A环或B环中,存在1~3个羟基;较佳地,A环中,羟基存在于第2’、4’和/或6’位;较佳地,B环中,羟基出现在第4位置。
在本发明的优选方式中,R在A环上的数量为1个,较佳地其存在于第3’位;或R在A环上的数量为2个,较佳地其存在于第3’和5’位;且,所述的糖基转移酶包括选自SEQ IDNO:6,7,9或11所示的多肽或其保守性变异多肽。
本发明人发现,所述糖基转移酶是双功能性的糖基转移酶,兼具具有碳苷阿拉伯糖基转移酶活性和碳苷葡萄糖基转移酶活性能的糖基。根据不同的糖基供体,其进行相应糖基的转移。在利用所述糖基转移酶进行糖基转移时,以携带阿拉伯糖基团或葡萄糖基团的化合物作为供体;更佳地,以UDP阿拉伯糖或UDP葡萄糖作为糖基供体等化合物作为供体。应理解,其它的携带阿拉伯糖基团或葡萄糖基团的化合物也是可以作为供体的,也应被包含在本发明中。在本发明的优选实施方式中,当进行基于细胞的产物合成时,可以在细胞中转入合成所述糖基供体的基因,从而使得细胞自行合成糖基供体。可选择地,当进行基于细胞的产物合成时,也可以通过给细胞外源提供糖基供体的形式进行。
在本发明的优选方式中,所述二氢查尔酮(类)化合物或2-羟基黄烷酮(类)化合物包括但不限于:根皮素,2-羟基柚皮素(较佳地为开环形式),2-羟基圣草酚(较佳地为开环形式)。此外,它们的类似物或基团被取代的变体形式也应被包含在内。
在本发明的优选方式中,所述碳苷二氢查尔酮(类)化合物或碳苷-2-羟基黄烷酮(类)化合物包括但不限于:根皮素-C-阿拉伯糖苷,2-羟基柚皮素-C-阿拉伯糖苷,2-羟基圣草酚-C-阿拉伯糖苷,根皮素-C-双阿拉伯糖苷,2-羟基柚皮素-C-双阿拉伯糖苷,2-羟基圣草酚-C-双阿拉伯糖苷,Nothofagin,2-羟基柚皮素-C-葡萄糖苷,2-羟基圣草酚-C-葡萄糖苷,根皮素-C-双葡萄糖碳苷,2-羟基柚皮素-C-双葡萄糖苷,2-羟基圣草酚-C-双葡萄糖苷,根皮素-C-阿拉伯糖-C-葡萄糖苷,2-羟基柚皮素-C-阿拉伯糖-C-葡萄糖苷,2-羟基圣草酚-C-阿拉伯糖-C-葡萄糖苷。此外,它们的类似物或基团被取代的变体形式也应被包含在内。
本发明也提供了催化二氢查尔酮(类)化合物或2-羟基黄烷酮(类)化合物生成碳苷二氢查尔酮、碳苷-2-羟基黄烷酮(类)化合物的方法,包括:以糖基转移酶进行所述催化;所述的糖基转移酶包括选自SEQ ID NO:1~12任一所述的多肽或其保守性变异多肽。
本发明也提供了合成黄酮碳苷化合物的方法,包括:(1)将2-羟基黄烷酮(类)化合物以糖基转移酶催化,产生碳苷-2-羟基黄烷酮(类)化合物;其中,所述的糖基转移酶包括选自SEQ ID NO:1~12任一所述的多肽或其保守性变异多肽;(2)将(1)的碳苷-2-羟基黄烷酮(类)化合物脱水,获得黄酮碳苷化合物。较佳地,在(1)之前还包括:(c)将黄酮(类)化合物通过黄烷酮-2-羟化酶(F2H)催化,获得2-羟基黄烷酮(类)化合物。更佳地,在(c)之前,还包括:(b)将丙二酰-CoA(类)化合物(如包括其经1或多基团的取代形式)与p-香豆酰-CoA(类)化合物(如包括其经1或多基团的取代形式)经查尔酮合成酶(CHS)和查尔酮异构酶(CHI)催化,获得黄酮(类)化合物。进一步更佳地,在(b)之前还包括:(a)将L-酪氨酸(类)化合物(如包括其经1或多基团的取代形式)经酪氨酸解氨酶(TAL)和4-香豆酰-辅酶A连接酶(4CL)催化,获得p-香豆酰-CoA(类)化合物。
在本发明的优选方式中,所述的黄酮(类)化合物包括:柚皮素,圣草酚;所述的丙二酰-CoA(类)化合物包括:丙二酰-CoA,甲基丙二酰-CoA;所述的p-香豆酰-CoA(类)化合物包括:p-香豆酰-CoA,p-肉桂酰-CoA;所述的L-酪氨酸(类)化合物包括:L-酪氨酸,L-苯丙氨酸。应理解,根据本发明的整体描述,它们的类似物或变异形式也可应用于本发明中。
在本发明的优选方式中,所述的2-羟基黄烷酮(类)化合物为2-羟基柚皮素,其是从柚皮素通过黄烷酮-2-羟化酶(F2H)催化获得;或所述2-羟基黄烷酮(类)化合物为2-羟基圣草酚,其是从圣草酚通过黄烷酮-2-羟化酶(F2H)催化获得;较佳地,所述圣草酚是从柚皮素通过黄烷酮-3’-羟化酶(F3’H)催化获得。应理解,根据本发明的整体描述,它们的类似物或变异形式也可应用于本发明中。
本发明也提供了生物合成黄酮碳苷化合物的方法,包括:(i)将合成柚皮素(类)化合物的前体基因、编码黄烷酮-2-羟化酶和/或黄烷酮-3’-羟化酶的基因以及编码糖基转移酶的基因共转入宿主细胞中;其中,所述的糖基转移酶包括选自SEQ ID NO:1~12任一所述的多肽或其保守性变异多肽;(ii)培养(i)的细胞,从而生物合成黄酮碳苷化合物。
在本发明的具体实施例中,这些碳苷糖基转移酶的N端或/和C端连接标签得到的融合蛋白及其衍生多肽,能够特异和高效地催化二氢查尔酮(类)化合物或2-羟基黄烷酮(类)化合物的3’位置进行C-阿拉伯糖基化或C-葡萄糖糖基化,其中在以UDP阿拉伯糖为糖基供体的情况下,OsiCGT6、BdCGT2和ZmCGT3不仅可以催化查尔酮(类)化合物3’位C-阿拉伯糖基化,更可以对已被阿拉伯糖基化的二氢查尔酮进一步C-阿拉伯糖基化,从而产生双阿拉伯糖碳苷的二氢查尔酮。在以UDP葡萄糖为糖基供体的情况下,ZmCGT3和SbCGT3不仅可以催化查尔酮(类)化合物3’位C-葡萄糖基化,更可以对3’位已被葡萄糖基化的二氢查尔酮、2-羟基黄烷酮进行进一步5’位C-葡萄糖基化,从而产生双葡萄糖碳苷的二氢查尔酮或双葡萄糖碳苷的2-羟基黄烷酮。单碳苷或双碳苷-2-羟基黄烷酮(类)化合物可以通过非酶化的脱水缩合反应生成单碳苷或双黄酮碳苷(类)化合物。
另一方面本发明通过生物工程技术,将这些新型CGT应用于人工构建的重组大肠杆菌系统,该重组微生物能够生产碳苷二氢查尔酮和黄酮碳苷(类)化合物。
相对于传统的植物提取手段,微生物发酵具有速度快、受外界因素影响较小等优势;部分化合物通过微生物合成的产量远高于植物提取,已经成为天然产物获得的一种重要手段。黄酮碳苷(类)化合物天然丰度低,并且在植物提取物中与大量结构类似的黄酮氧苷、苯丙素(类)化合物共存,使得分离纯化繁琐复杂。本发明中使用微生物发酵的方式来高效、定向得合成黄酮碳苷,极为有效地降低了分离纯化这(类)化合物的成本。
本发明也提供了用于生物合成黄酮碳苷化合物或其中间体的试剂盒,其中包括:SEQ ID NO:1~12所示的一条或多条多肽或其保守性变异多肽;黄烷酮-2-羟化酶和/或黄烷酮-3’-羟化酶;合成柚皮素(类)化合物的前体基因;较佳地还包括宿主细胞。更佳地,所述试剂盒中还包括说明进行生物合成的方法的使用说明书。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如J.萨姆布鲁克等编著,分子克隆实验指南,第三版,科学出版社,2002中所述的条件,或按照制造厂商所建议的条件。
试剂材料
毛竹采自上海辰山植物园。
粳稻、籼稻、高粱、玉米、谷子、二穗短柄草种植于中国科学院上海分子植物研究中心温室。
植物基因组DNA提取使用TIANGEN植物基因组提取试剂盒。
AxyPrep总RNA小量制备试剂盒,多聚酶链式反应(PCR)胶回收试剂盒,质粒抽提试剂盒均为美国Axygen产品。
寡核苷酸引物购自生工科技(Sangon Biotech)与金斯瑞中国(GenScriptBiotech Corp)生物科技有限公司。
合成优化序列购自金斯瑞中国(GenScript Biotech Corp)生物科技有限公司。
PrimeScript RT reagent Kit with gDNA Eraser(Perfect Real Time)聚合酶试剂盒,聚合酶链式反应(PCR)高保真酶PrimeSTAR Max DNA Polymerase为日本宝生物公司(TAKARA)产品。
限制性内切酶、T4连接酶为NEB产品。
无缝克隆试剂盒购自诺唯赞生物科技有限公司。
大肠杆菌DH10B、BL21(DE3)菌株和pET21a、pET28a载体用于基因克隆及蛋白表达。
标准品化合物柚皮素、2-羟基柚皮素、根皮素购自大连美仑生物技术有限公司,夏佛塔苷购自北京贝洛生物科技有限公司、异夏佛塔苷购自南通经纬生物科技有限公司、维采宁-2购自上海源叶生物科技有限公司。
UDP葡萄糖购自北京中泰生物有限公司。UDP阿拉伯糖购自CarboSource。
其他试剂为国产分析纯或色谱纯试剂,购自国药集团化学试剂有限公司。
实施例1、新型尿苷二磷酸(UDP)-糖基转移酶
1.碳苷糖基转移酶基因克隆和表达质粒构建
取禾本科植物(毛竹、粳稻、籼稻、高粱、谷子、二穗短柄草、玉米)成熟叶片或幼苗,清水清洗干净表面污渍,用吸水纸轻轻擦拭干叶片表面水渍,称重备用。基因组DNA的提取依照TIANGEN植物基因组提取试剂盒提供的说明书进行。
所述的碳苷糖基转移酶的氨基酸序列如下:
>PhCGT3(SEQ ID NO:1)
MAPPATLRSGEPDRDTPHVIFIPSAGMGHLYPFFRFIAALSSYGVDISVVTILPTVSAAEADHFAGLFAAFPSIRRIDFHLLPLDTNEFPGADPFFLRWEELRRSAHLLGPLIASATPRVSTIVSDVTLASHVIPIAKELHIPCHVLFISCATMLSLNAYFPVYLDTKAGMDGIGDVDIPGVCRIPKSSLPQALLDLNKLFTKQFIENGREITKADGILVNTFDALEPKALATLRDGTVVTRFPPVFAIGPLTSHSPAAGERVDAGFPLAWLAEQPTRSVVYVAFGNRNAVTLDQIREIAVGLEASGFRFLWVLKTTVVDHEDTAELKDVLGDGFLERVKGRSLVTKAWVDQEAILKHPAVGLYLSHSGWNSVAEAAAYGVPMLAWPRGGDHRVNATVVVSGGVGVWMEHWSWDGEDRLVSGKEIGDKVKEVMLDAAVRARAAKVGEEADKALTEGGSSYRSMQQFVAKLKNN*
>PhCGT4(SEQ ID NO:2)
MAPPEMLSSGEQDRGAPHVVFIPSAGMGHLLPFFRFITALSSHDVDISVVTVLPTVTTAEADHFAALFTALPRIRRINFNLLPLDASAFPGADPFFLRWESLRRSAHLLGPLLAGATPSMSAVITDVTLASQVIPIVKDELHLSCHILFPSSTTMLSLCAYFPTYLDGANADHVVSDVDVPGVRRFTKATLPQALHDPNNLFTKQFVANGRGFTKADGFLLNTFEALEPEAIAALRGGKVIPCFPPVFTVAPLKSMIPADSEKVGAGSPMAWLDEQPARSVVYVAFGNRCAVTLDQIREIAAGLETSSFRFLWVLKTTVVDREDTVELKDVLGDGFLERMQGRGLVTKAWVDQEAVLNHPAVGLFLSHSGWNSVVEAAVGGVPLLAWPRFGDHRVNATAMVSGGVGVWMEHWSWDGEDRLVSGEEIGEKVKEVMADETVRARVAKVREEAAKAVAEGGSSYRSMQEFVAKLKAN*
>OsjCGT3(SEQ ID NO:3)
MAPPPAVLSSGELGARGHTRPHVVFVPSAGMGHLLQFFRFIGALSAHDVDISVVTVFPTVSAAEADHFAALFRDYPSVRRLDFDLLPFDASEFPGGDPFLLRWEALRRSLHLLGPVIAGVTPRVTATVTDVTLVSHVNPIAKDLGVQCHVLYVSSAAMMSLCSYFPIYLDNKDAGADVGDVDIPGVRRLKRSWLPQPLLDLNKLFTKQFIENGREMVKTDGVLINTFDALEPVALAALRDGKVVRGFPPVFAVGPHSSLASEATKGAAADAEGSPMAWLRQQPARSVVYVAFGSRCAVSHEQIREIAAGLEASGSRFLWILKTTVVDRDDDAGIRDVLGDGFLERVRGRGVVTKAWVDQDAVLRDPAVGLFLSHSGWNSVIEAATAGVPLLAWPRGGDHRVAATVVASSGVGVWMEQWSWDGEEWVVSGEEIGGKVKEMMADAGVREKAAKVGEEVAKAVAVGGTSHTGILDFVAKLKAAT*
>OsiCGT4(SEQ ID NO:4)
MAPPTVLNSGEPDSRRRARPHVVFVPSAGMGHLLPFFRFIGALSAHDVDISVVTVLPTVSAAENDHFARLFQDFPSIRRVDFNLLPLDASEFPGADPFLLRWEALRRSMHLLAPAIAGVSPRATAVVTDVTLVSHVNAIAKDLQLQCHVLFISSATMMSFLSYFPIYLDNKDAQADVGDVDIPGVRRLKRSWLPQPLLDLDKLFTKQFIDNGREVVKTDGVLINTFDALEPVALAALRDGKVIRGFPSVFAVGPYSSLASETKAADAESSALAWLNQQPARSVVYVAFGNRYHVSNDQLREIAAGLEASGCRFLWIVKTTAVDRDEAAGVRDVLGDGFVDRVRGRGMVTKAWVDQEAVLGHPAVGLFLSHSGWNSVTEAAAAGVPLLAWPRAGDHRVAGTVVASSGVGVWMEQWSWDGEEWLVSGQEIGGKVKEMMADAGVRERAAKVGELAAKAVAEGGTSRTSMLEFVAKLKAT*
>OsiCGT5(SEQ ID NO:5)
MPPPTVLNSGEPDSRRRARPHVVFVPSAGMGHLLPFFRFIGALSAHDVDISVVTVLPTVSAAEADHFARLFQDFPSIRRVDFNLLPLDASEFPGADPFLLRWEALRRSMHLLAPAIAGVRPRATAVVTDVTLVSHVNPIAKDLRLQCHVLFISSATMMSLCSYFPIYLDNKDAEADVGDIDIPGVRRLKRSWLPQPLLDLDKLFTKQFIDNGREVVKTDGVLINTFDALEPVALAALRDGKVIRGFPSVFAVGPYSSLASEKKAADAESSALAWLNQQPARSVVYVAFGNRYHVSNDQLREIAAGLEASGCRFLWIVKTTAVDRDEAAGVRDVLGDGFVDRVRGRGMVTKAWVDQEAVLGHPAVGLFLSHSGWNSVTEAAAAGVPLLAWPRAGDHRVAGTVVASSGVGVWMEQWSWDGEEWLVSGQEIGGKVKEMMADAGVRERAAKVGEQAAKAVAEGGTSRTSMLEFVAKLKAA*
>OsiCGT6(SEQ ID NO:6)
MAPPTVLNSGEPDSRRRARPHVVFVPSAGMGHLLPFFRFIGALSAHDVDISVVTVLPTVSAAEADHFARLFQDFPSIRRVDFNLLPLDASEFPGADPFLLRWEALRRSMHLLAPAIAGVSPRATAVVTDVTLVSHVNPIAKDLRLQCHVLFISSATMMSLCSYFPIYLDNKDAEADVGDIDIPGVRRLKRSWLPQPLLDLDKLFTKQFIDNGREVVKTDGVLINTFDALEPVALAALRDGKVIRGFPPVFAVGPYSSLASEKKAADADQSSALAWLDQQPARSVVYVAFGNRCTVSNDQLREIAAGLEASGCRFLWILKTTVVDRDEAAAGGVRDVLGDGFMERVKGRGMVTKEWVDQEAVLGHPAVGLFLSHSGWNSVTEAAAAGVPLLAWPRGGDHRVAATVVASSGVGVWMEQWSWDGEEWLVSGEEIGGKVKEMMADDAVRERAAKVGEEAAKAVAEGGTSRTSMLEFVAKLKAA*
>BdCGT2(SEQ ID NO:7)
MADLAAMPNSGEQQGRDAPAPPHLVFVPSAGMGHLLPFTRFIADLANENVEISVVTALPTVSAAEAAHFADLFAAFPRIRRIDFNLLPFDESAFPGADPFLLRWESLRRSAQLLGPLIAAAVPRASAVVTDVTLASQVIPIAKDELNLPCHILFISCATMLSLVAYFPVYLDGAKADHLVGDVDIPGVLRLPVSSPPQVLRNPDSLFTKQFIANGRTIAKSDGILVNTFRALEPEALSALNSGKVVPGFPPVYAVGPLKSSITMTTSTGSSDKDEGAAAGGSPMAWLGEQPAGSVVYVAFGNRHGVSLEQIREIAAGLEASGCGFLWVLKTTVVDREDTAELEDVLGRGFLGRVTGRGLVTKEWVDQEAVLQHPAVGLYLSHAGWNSVTESAAYGVPMLVWPTAGDQRVIATVVASAGFGLWMEHWDWESLVSGAEIGEKVKEVMGNEGIKARAAKVSEEAAKAVAEGGSSHRSMQEFLAKLKPSTT*
>ZmCGT2(SEQ ID NO:8)
MAPPPAMQSPGELNDGAYDAPHILFIPSAGIGHLTPVFRVIAGFSSRGIDVSVVTVLPTVSAAETDYFNGLFADYPAVRRVDMHLLPLDASEFTREDPFFLRWEALRRSVHLLRPIITNAAPRITAIITDITLTSCVIPIAKELDVPCHVLFPTAATMLSLNAYYPVYLEKLKGGPEPGVIGDAVDIPGVFRVPRSALPPALLDVNKLFTKQFIDNGRAIVKADGVLVNTFDAVEPAPLAALRGGKIVPGYPPVYTIGPLKSHATKAGDKPGDALLDEWLGKQRARSVVYVAFGNRSAARLDQIREIAAGLEDSGYPFLWVLKTTKVDREDDAELAEVLGDGYLERVKGRGIVTKGWVEQEELLKHPAVGMFVSHGGWNSALEASSAGVPLLVWPQLGDHRVNAMAAVRAGIGAWAEHWSWDGEDTLVTRQEIADKVKEVMADGKLRASVAVAREEAAKAVAEGGTSYRNMHDFIAKLKGGA*
>ZmCGT3(SEQ ID NO:9)
MAPPATNSPGEVDSGGRPHVMFIPSAGMGHLIPFFRFIAALAGQSVDISVVTVLPTVSAAEEDYFTSLFAALPRVRRVDLHLLPFDASKLPSNDRDPFVLRWEALRRSAHLLGPLIAGAAPRVSAVITDVTLTSHVIPIAKELGVQCHVLFPSSATMLSLLAYTPVHIDKKAEQGSDIGDVDIPGVCRIPQSCLPQVLLHLDKLFTKQFIANGREIINADGFLVNTFDALEPVALAALRDGKVVPGFPPVYAIGPLMSQQNSVDEGGKEEGSGSPVAWLDEQPARSVVYVAFGNRCAVSHDQIREIAAGLEASNCRFLWVLKTTTVDRDDSAVLTELLGEEFLERVQGRGLVTKAWVDQEALLKHPAMGLFLSHSGWNSVTEAAAASVPLLAWPRGGDHRVNAMVTVSGGVGMWMEHWSWDGEDWLVTGVEIAKKVKEVMSDEAVRARTTRTAEEAAKAVAEGGTSYRSMEEFISSVKATVAS*
>SiCGT3(SEQ ID NO:10)
MKSPGELGSGARPHVMFIPSAGMGHLLPFLRVIAALARHDDVDVSVVTVLPTVSAAEADHLAGLFAAFPRVRRADLHLLPFDASEFPGHDPFLLRWEALRRSAHLLRPLIACGAAPRVSAIVTDVTLASHVIPISKELNVQCHVHFISCATMLSLLAKAELGPGVGDVDIPGVRRIPESYLPQPLRDLNNVFTKQFIDNGREIINADGILVNTFDALEPAALAALRDGKVVPGFPPVNAIGPLDSHTASTANAKQSEPAGSPVAWLGEQPARSVVYVAFGNRSAVSRDQLRQIAAGLEASGCRFLWVLKTTTVDKDDNTEVEDVLGCGFLERVRGRGLVTKAWVDQEALLKHPAVGLFLSHSGWNSVVEAAAAGMPLLAWPRGGDQRVNAMVVASGGFGVWMEHWSWDGEDRLVTGEEIREKVKEVMSDAAVRVRAMKTGEEAAKAVAEGGTSYRSMQEFIGKLRAT*
>SbCGT3(SEQ ID NO:11)
MATPPATKSLLGELNGGGASRPHVMFIPSAGMGHLLPFFRFIASLARHDDDVDISVVTVLPTVSAAEADHFSGLFAAFPRVRRVDFPSHDRDPFIVRWEALRRSAHLIGPLIAGAAPRVSAVITDVTLTSHVIPIAKKLGVQCHVLFISCATIKKAEQGPGAGVGAVDIPGVRRIPESCLPQPLLDLNKQFTKQFIDNGRENINADGILVNTFDALEPAALAALRDGKVVPGFPFPPVYAIGPLRSVVDKEDSSSSSPVVAWLDKQPARSVVYVAFGNRSAVSHAHIREIAAGLEASGCRFLWVLKTTKVDRDDTAELTDVLGEGFLERLHQQQGQGQGQHGMVTKEWVDQEALLKHASVGLYLSHSGWNSVTEAAAAGVPLLAWPRGGDHRVNHWSWDGEDWLVTGEEIAEKVKEVMSDAAVRARATRTGEEAAMAVAEGGTSYRSMQQFVSSLKKAT*
>SbCGT4(SEQ ID NO:12)
MSSPALSTTSSHVPRGAPHVVLFPSAGMGHLVPFTRLAVALSAGHGCDISLVTAMPTVSSAESRHIAALCAAFPAIRQLDLDLRLAPFDASSEFPGADPFYVRYEALRRAAPVLLGPLLAGAGASALVADIALASVAIPVARELHVPCFVFFTASATMFSLKAYFPTYLDAVGAGHGVGDVDVPGVYRIPSSSVPQALHDPDNIFTRQFVANGRALVTADGLLVNAFHAMEPEAVEALRGGSVVPGLPPVFAVGPLMPVSELRETGEAEQEQGNCYREWLDEQPPRSVVYVSFGSRKALPKDQMNELAAGLEACGHRFLWVVKGAVVDRDDAGELSDLLGEGFLRRVQGQGRGLVTKSWVEQEEVLRHPAVALFVSHCGWNSVTEAASGGVPVLAWPRFADQRVNARVVARAGLGVWAEQWSWEGEEAVVRAEEIAELVMEAMGDDAMAEKAANVREAASRAVADGGTSYQSLAAFVRRCTA*
以基因组DNA为模板,通过PCR扩增候选糖基转移酶基因PhCGT3、PhCGT4、OsjCGT3、OsiCGT4、OsiCGT5、OsiCGT6、BdCGT2、ZmCGT2、ZmCGT3、SiCGT3、SbCGT3、SbCGT4。PCR引物如表1所示。其中OsjCGT3、OsiCGT5、SiCGT3、SbCGT4为人工合成并经大肠杆菌密码子优化。
表1、克隆糖基转移酶所使用的引物
PCR扩增体系25μL(PrimeSTAR Max Premix,12.5μL;Primer 1/Primer 2终浓度0.2μM;gDNA<50ng;剩余体积用灭菌蒸馏水补足)。PCR反应条件:98℃预变性2min,然后98℃变性10s,55℃退火15s,72℃延伸10s,30个循环,72℃延伸10min,琼脂糖电泳检测,扩增得到约1.5kb的片段。纯化后片段使用无缝克隆的方式连入相同NdeI/NotI消化过的pET28a载体,连接产物转化大肠杆菌DH10B感受态细胞,测序确认序列。
2.碳苷糖基转移酶的蛋白表达
将重组质粒转化到大肠杆菌BL21(DE3)的感受态细胞中,在固体LB培养基(卡那霉素50μg/mL)37℃培养过夜。挑取单个克隆到2mL LB液体培养基(卡那霉素50μg/mL),转接过夜培养的菌液到新的LB液体抗性培养基100mL中37℃,250rpm培养至OD600=0.5~0.6,水浴降温至16℃左右,然后加入诱导剂IPTG至终浓度0.1mM,转至16℃低温诱导培养,在摇床转速180r/min条件下继续培养20h。携带pET28a空质粒的BL21(DE3)重组菌株作为空白对照,培养操作同上。离心收菌(6000r/min,5min),使用1mL破菌缓冲液Buffer A(20mM Tris-HCl,pH 8.0;100mM NaCl)重悬,加入DNase至终浓度为5μg/mL,Mg2+终浓度为2mM,蛋白酶抑制剂PMSF终浓度为1mM,冰上孵育30min后超声破碎;冷冻离心(10000rpm,30min,4℃),通过0.2μm滤膜过滤,获得上清粗酶液,加入20%甘油冷冻保存(-20℃)。
3.碳苷糖基转移酶的体外功能鉴定
体外酶催化测定体系为100μL,反应体系包括:0.1mM的糖基受体(根皮素或2-羟基柚皮素),0.3mM的UDP葡萄糖或0.1mM的UDP阿拉伯糖,25μL上清粗酶液,用Buffer A补足体积到100μL,于37℃反应2h。待反应结束后,加等体积甲醇终止反应,使用HPLC进行产物分析。HPLC检测条件:色谱柱:反相C18 column[SilGreen ODS column],检测波长为280nm;流动相:乙腈(0.1%甲酸)-水(0.1%甲酸)混合物梯度洗脱,在0到20min内比例由5:95升到100:0,流速1mL/min。
根据HPLC检测结果1(图1A),以UDP阿拉伯糖为糖基供体,OsjCGT3、OsiCGT4、OsiCGT5、OsiCGT6、BdCGT2、PhCGT3、PhCGT4、ZmCGT2、ZmCGT3、SbCGT3、SiCGT3、SbCGT4能够将底物根皮素(phloretin)转化为保留时间较小的产物。上述产物经负离子模式高分辨质谱检测确认分子式为C20H22O9,二级质谱显示出戊糖碳苷特征性的[M-H-90]、[M-H-60]碎片离子峰(图2)。经过一维核磁(1H NMR)推断该碳苷糖基化产物为根皮素阿拉伯糖碳苷(图3)。
同时,以UDP阿拉伯糖为糖基供体,OsiCGT4和OsiCGT5也可以将底物2-羟基柚皮素(2-hydroxynaringenin)转化为其阿拉伯糖基化产物(图1B)。该产物经负离子模式高分辨质谱检测确认分子式为C20H20O10(图4),提示该产物为2-羟基柚皮素-C-阿拉伯糖苷。
此外,以UDP阿拉伯糖为糖基供体,本发明人还发现OsiCGT6、BdCGT2和ZmCGT3催化根皮素产生根皮素阿拉伯糖碳苷的同时,还产生一个保留时间较小的化合物(图5)。该产物经负离子模式高分辨质谱检测确认分子式为C25H30O13,二级质谱显示出双戊糖碳苷特征性的[M-H-120]、[M-H-150]、[M-H-180]等碎片离子峰(图6),提示该化合物为根皮素-C-双阿拉伯糖碳苷。
根据HPLC检测结果2(图7A),以UDP葡萄糖为糖基供体,OsjCGT3、OsiCGT4、OsiCGT5、OsiCGT6、BdCGT2、PhCGT3、PhCGT4、ZmCGT2、ZmCGT3、SbCGT3、SiCGT3、SbCGT4能够将底物根皮素(phloretin)转化为保留时间较小的产物。该化合物与标准品Nothofagin的保留时间一致,经负离子模式高分辨质谱检测确认分子式为C21H24O10,二级质谱显示出己糖碳苷特征性的[M-H-120]、[M-H-90]碎片离子峰(图8A)。此外还发现,在ZmCGT3和SbCGT3的转化产物中出现新的产物,该产物经负离子模式高分辨质谱检测确认分子式为C27H34O15,二级质谱显示出双己糖碳苷特征性的[M-H-180]、[M-H-210]、[M-H-240]碎片离子峰(图8B),提示该产物为根皮素-C-双葡萄糖碳苷。
在以UDP葡萄糖为糖基供体时,OsjCGT3、OsiCGT6、BdCGT2、PhCGT3、ZmCGT2、ZmCGT3、SbCGT3、SiCGT3、SbCGT4也可以将底物2-羟基柚皮素(2-hydroxynaringenin)转化为其葡萄糖基化产物(图7B)。该产物经负离子模式高分辨质谱检测确认分子式为C21H22O11,二级质谱显示出己糖碳苷特征性的[M-H-120]—碎片离子峰(图9),提示该产物为2-羟基柚皮素-C-葡萄糖苷。
实施例2、黄酮碳苷类化合物夏佛塔苷等的合成
本实施例中,应用PhCGT1、OsiCGT4在大肠杆菌合成夏佛塔苷(schaftoside)及其异构体。
夏佛塔苷及其异构体的预测生物合成途径如图10所示。箭头TAL(或PAL)、4CL、CHS、CHI代表负责柚皮素生物合成的主要酶。箭头F2H是黄烷酮2-羟化酶(F2H),其构成2-羟基黄烷酮的骨架。C-糖基转移酶(CGT)用箭头CGT表示。在形成C-糖基化中间体后,脱水反应在酸性溶剂中自发发生(箭头H+)。
1、质粒构建
(1)黄烷酮柚皮素(naringenin)合成前体基因的表达盒构建
将人工合成并经密码子优化的前体合成基因序列构建到pET28a载体上获得pET28-RtPAL,pET28-Pc4CL,pET28-PxhCHS和pET28a-MsCHI。其中,PxhCHS:GenBank登录号KF765781;MsCHI:GenBank登录号KF765782;Pc4CL:GenBank登录号KF765780;RtPAL:GenBank登录号AAA33883。
以pET28-Pc4CL为模板,4CL-F-NcoI/4CL-R-BamHI为引物对扩增Pc4CL片段,与NcoI/BamHI双酶切的pCDFDuet-1载体连接获得pYH40。
以pET28-PxhCHS为模板,CHS-F-NdeI/CHS-R-XhoI为引物对扩增PxhCHS片段,与NdeI/XhoI双酶切的pYH40连接获得pYH50。
以pET28-MsCHI为模板,T7CHI-F-XhoI/CHI-R-AvrII为引物对扩增McCHI片段,与XhoI/AvrII双酶切的pYH50连接,获得质粒pYH51。
以pET28-RtPAL为模板,T7PAL-F-BamHI/PAL-R-HindIII为引物对扩增RtPAL片段,与BamHI/HindIII双酶切的pYH51连接,获得质粒pYH55(图11)用于柚皮素(naringenin)合成的从头合成。PCR引物如表2所示。
表2、柚皮素合成前体基因的表达盒构建所使用的引物
引物 序列(5’→3’)
4CL-F-NcoI tataccatgggtgactgcgttgccccg(SEQ ID NO:31)
4CL-R-BamHI cgggatccttacttcggcaggtcgccgctc(SEQ ID NO:32)
T7PAL-F-BamHI cgggatcccttatgcgactcctgcattag(SEQ ID NO:33)
PAL-R-HindIII gcccaagcttttatgccagcatcttc(SEQ ID NO:34)
CHS-F-NdeI agatatacatatggttacggtggaagaatac(SEQ ID NO:35)
CHS-R-XhoI ccgctcgagttaggtagccacactatgcag(SEQ ID NO:36)
T7CHI-F-XhoI ccgctcgagctagaaataattttgtttaac(SEQ ID NO:37)
CHI-R-AvrII gagcctaggttagttaccgattttaaag(SEQ ID NO:38)
(2)黄烷酮-2-羟基化酶/CPR表达盒构建
以人工合成的黄烷酮-2-羟基化酶编码基因ZmCYP93G5(密码子优化)的克隆载体为模板,通过PCR扩增此P450基因。对此基因进行相应于其蛋白的N端改造,截去N端跨膜区域并加载助溶标签2B1(序列为MAKKTSSKGKLPPGPS)。
ZmCYP93G5:GenBank登录号XP_008660140.1,截去N端第1~29位残基,加载2B1,其编码基因以常规方法进行大肠杆菌偏好的密码子优化。
以拟南芥cDNA为模板,通过PCR扩增AtCPR2基因(GenBank登录号ABB88839.2,用于与P450组合,提供还原力)。
将改造后的P450基因使用引物对CZ201-F/R扩增,通过无缝克隆法插入pDuet-1载体多克隆位点1的NcoI和BamHI之间,AtCPR2使用引物对CPR-F/NotI-trCPR-R扩增后插入pDuet-1载体多克隆位点2的NdeI和XhoI位点之间,构成质粒pCZ201(图11)。PCR引物如表3所示。
表3、构建pCZ201、pCZ203和pCZ229所使用的引物
(3)CGT及UDP阿拉伯糖供给基因表达质粒构建
以籼稻基因组DNA为模板,通过PCR(引物见表1)扩增出阿拉伯糖基转移酶基因OsiCGT4。以毛竹基因组DNA为模板,通过PCR扩增出葡萄糖基转移酶基因PhCGT1(引物对为F:TGCCGCGCGGCAGCCATATGATGGGCCACCTGGTGC(SEQ ID NO:43);R:TGGTGCTCGAGTGCGGCCGCCTAGTCCAACACTGCAAGATCCC(SEQ ID NO:44))。将扩增后片段纯化,并使用无缝克隆的方式连入相同NdeI/NotI消化过的pET28a载体,分别构成质粒pCZ86、pCZ163(图13)。以质粒pCZ163为模板,通过PCR的方式(引物见表4)扩增基因OsiCGT4。将扩增后片段纯化,并使用无缝克隆的方式连入NotI消化过的pCZ86载体,构建质粒pCZ191。
以中华根瘤菌基因组为模板,通过PCR(引物见表4)扩增出UDP木糖合酶基因SmUXS。将扩增后片段纯化,并使用无缝克隆的方式连入NotI消化过的pCZ191载体,构建质粒pCZ192。以中华根瘤菌基因组为模板,通过PCR(引物见表4)扩增出UDP木糖差向异构酶基因SmUXE。将扩增后片段纯化,并使用无缝克隆的方式连入NotI消化过的pCZ192载体,构建质粒pCZ193(图13)。
SmUXS序列(SEQ ID NO:13):
MNYFRNDFRGTLFGTNEATDSLRRRSLQKRILVTGGAGFLGSHLCELLLGAGHEVICLDNFSTGLRRNIAPLKRFDTFRVIAHDVVEPIDLEVDEIYNLACPASPPHYQADPIQTTKTCVIGSLNLLDLAARRGARIFQASTSEIYGDPHVHPQVESYWGNVNPFGPRSCYDEGKRCAETLFFDFHKSHGVEIKIVRIFNTYGPRMRPDDGRVVSNFIVQALKGEDITIYGDGSQTRSFCFVEDLIDGFVRLMASPPSLTGPVNLGNPAEFTIGELAEEVIRLTGSRSKIVRRPLPVDDPRQRRPDISLATEELGWRPKVNLAEGLAHTIRYFDDLLSRSMRESAELV
SmUXE(SEQ ID NO:14):
MVAPRILVTGGAGYIGSHTAKLLRLEGIEPVVYDNLTTGNRSAVRWGPFVQGDILDGRRLIEVIEAHQPDAVIHFAASAYVGESVADPAKYYNNNVRGTLSLLDACRQTGVDKVIFSSSCATYGVPAVLPIDEATPQAPINPYGKTKLVAEHMLADYAAAFALNYVSLRYFNACGADPEGDLGEWHDPETHLIPRALMAAAGRIPHLEIFGEDYDTPDGTCVRDYIHVADLASAHVLAYRHLAKGGGNVALNLGTGRGFSIKEVLRTIGEITGHDVPVVFRRRRAGDPPALYADAGLACRTLGFLPRYSDLETIVRTAAPFFGLEVRS
表4、构建pCZ191、pCZ192、pCZ193和pCZ194所使用的引物
2、用于夏佛塔苷合成的工程菌构建及发酵
将携带柚皮素合成基因的质粒pYH55,携带新型糖基转移酶PhCGT1、OsiCGT4以及UDP-阿拉伯糖合成基因SmUXS和SmUXE的质粒pCZ193与携带黄烷酮-2-羟基化酶/CPR表达盒的质粒pCZ201进行三质粒共转,转化至大肠杆菌BL21(DE3)中,获得从头发酵合成工程菌株sCZ114。
挑取上述工程菌株单克隆,接种于10mL MOPS培养基中(Spe(壮观霉素/奇霉素;spectinomycin)=50μg/mL,Amp=100μg/mL,Kan=50μg/mL),37℃培养OD600=0.5,降温至22℃,添加IPTG(终浓度100μM),22℃,220rpm条件下进行发酵,持续5日。培养结束后收取样品,将菌液离心,获得上清液和菌体。菌体用水混悬,经破碎后用乙酸乙酯、正丁醇萃取;上清液用乙酸乙酯、正丁醇萃取,合并萃取液。将萃取液蒸发后用甲醇复溶,进行LC-MS分析。
发酵结果显示(图14),经5日发酵后,发酵液中能够检测出夏佛塔苷,同时发酵液中能够检测出中间体牡荆素、异牡荆素。
因此,本发明通过异源表达中华根瘤菌来源的SmUXS和SmUXE基因在大肠杆菌构建了全新的UDP-阿拉伯糖的合成途径,并且碳苷糖基转移酶(PhCGT1、OsiCGT4)能够特异和高效地催化2-羟基黄烷酮(开环形式)类化合物(如2-羟基柚皮素)的碳苷葡萄糖基化及碳苷阿拉伯糖基化,从而产生一类碳苷-2-羟基黄烷酮类化合物(如2-羟基柚皮素-6-C-葡萄糖苷,2-羟基柚皮素-8-C-葡萄糖苷,2-羟基柚皮素-C-阿拉伯糖-C-葡萄糖苷);这类化合物通过进一步的脱水反应形成黄酮碳苷(类)化合物(夏佛塔苷、牡荆素和异牡荆素等)。
实施例3、黄酮碳苷类化合物芹菜素-C-阿拉伯糖碳苷等的合成
本实施例中,应用OsiCGT6在大肠杆菌合成芹菜素-6-C-阿拉伯糖碳苷、芹菜素-8-C-阿拉伯糖碳苷、芹菜素-6,8-C-双阿拉伯糖碳苷。
芹菜素-6-C-阿拉伯糖碳苷、芹菜素-8-C-阿拉伯糖碳苷、芹菜素-6,8-C-双阿拉伯糖碳苷合成途径如图15所示。箭头PAL(或TAL)、4CL、CHS、CHI代表负责柚皮素生物合成的主要酶。箭头F2H是黄烷酮2-羟化酶(F2H),其构成2-羟基黄烷酮的骨架。C-糖基转移酶(CGT)用箭头CGT表示。在形成C-糖基化中间体后,脱水反应在酸性溶剂中自发发生(箭头H+)。
1、质粒构建
(1)黄烷酮柚皮素(naringenin)合成前体基因的表达盒构建同实施例2。
(2)黄烷酮-2-羟基化酶/CPR表达盒构建同实施例2。
(3)CGT及UDP-阿拉伯糖供给基因表达质粒构建
以水稻基因组DNA为模板,通过PCR(引物见表1)扩增出阿拉伯糖基转移酶基因OsiCGT6。将扩增后片段纯化,并使用无缝克隆的方式连入相同NdeI/NotI消化过的pET28a载体,分别构成质粒pCZ165(图12)。以质粒pCZ193为模板,通过PCR(引物见表5)扩增出双基因SmUXS-SmUXE。将扩增后片段纯化,并使用无缝克隆的方式连入NotI消化过的pCZ165载体,构建出质粒pCZ194(图13)。
表5、构建pCZ194所使用的引物
2、用于芹菜素-C-阿拉伯糖碳苷、芹菜素-C-双阿拉伯糖碳苷合成的工程菌构建及发酵
将携带柚皮素合成基因的质粒pYH55,携带新型糖基转移酶OsiCGT6以及UDP-阿拉伯糖合成基因SmUXS和SmUXE的质粒pCZ194与携带黄烷酮-2-羟基化酶/CPR表达盒的质粒pCZ201进行三质粒共转,转化至大肠杆菌BL21(DE3)中,获得从头发酵合成工程菌株sCZ118。
挑取上述工程菌株单克隆,接种于10mL MOPS培养基中(Spe=50μg/mL,Amp=100μg/mL,Kan=50μg/mL),37℃培养OD600=0.5,降温至22℃,添加IPTG(终浓度100μM),22℃,200rpm条件下进行发酵,持续5日。培养结束后收取样品,将菌液离心,获得上清液和菌体。菌体用水混悬,经破碎后用乙酸乙酯、正丁醇萃取;上清液用乙酸乙酯、正丁醇萃取,合并萃取液。将萃取液蒸发后用甲醇复溶,进行LC-MS分析。
发酵结果显示(图16),经5日发酵后,发酵液中能够检测出芹菜素-C-阿拉伯糖碳苷、芹菜素-C-双阿拉伯糖苷。同时,在发酵液中能检测到中间体2-羟基柚皮素-C-阿拉伯糖苷和2-羟基柚皮素-C-阿拉伯糖苷的积累。
因此,本发明通过异源表达中华根瘤菌来源的SmUXS和SmUXE基因在大肠杆菌构建了全新的UDP-阿拉伯糖的合成途径,并且碳苷糖基转移酶(OsiCGT6)能够特异和高效地催化2-羟基黄烷酮(开环形式)类化合物(如2-羟基柚皮素)的碳苷单阿拉伯糖基化以及碳苷双阿拉伯糖基化,从而产生一类碳苷-2-羟基黄烷酮类化合物(如2-羟基柚皮素-阿拉伯糖苷、2-羟基柚皮素-双阿拉伯糖苷);这类化合物通过进一步的脱水反应形成黄酮碳苷(类)化合物(单阿拉伯糖碳苷芹菜素、双阿拉伯糖碳苷芹菜素)。
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
序列表
<110> 中国科学院上海生命科学研究院
<120> 双功能碳苷糖基转移酶及其应用
<130> 19A754
<160> 52
<170> SIPOSequenceListing 1.0
<210> 1
<211> 473
<212> PRT
<213> 毛竹(Phyllostachys edulis)
<400> 1
Met Ala Pro Pro Ala Thr Leu Arg Ser Gly Glu Pro Asp Arg Asp Thr
1 5 10 15
Pro His Val Ile Phe Ile Pro Ser Ala Gly Met Gly His Leu Tyr Pro
20 25 30
Phe Phe Arg Phe Ile Ala Ala Leu Ser Ser Tyr Gly Val Asp Ile Ser
35 40 45
Val Val Thr Ile Leu Pro Thr Val Ser Ala Ala Glu Ala Asp His Phe
50 55 60
Ala Gly Leu Phe Ala Ala Phe Pro Ser Ile Arg Arg Ile Asp Phe His
65 70 75 80
Leu Leu Pro Leu Asp Thr Asn Glu Phe Pro Gly Ala Asp Pro Phe Phe
85 90 95
Leu Arg Trp Glu Glu Leu Arg Arg Ser Ala His Leu Leu Gly Pro Leu
100 105 110
Ile Ala Ser Ala Thr Pro Arg Val Ser Thr Ile Val Ser Asp Val Thr
115 120 125
Leu Ala Ser His Val Ile Pro Ile Ala Lys Glu Leu His Ile Pro Cys
130 135 140
His Val Leu Phe Ile Ser Cys Ala Thr Met Leu Ser Leu Asn Ala Tyr
145 150 155 160
Phe Pro Val Tyr Leu Asp Thr Lys Ala Gly Met Asp Gly Ile Gly Asp
165 170 175
Val Asp Ile Pro Gly Val Cys Arg Ile Pro Lys Ser Ser Leu Pro Gln
180 185 190
Ala Leu Leu Asp Leu Asn Lys Leu Phe Thr Lys Gln Phe Ile Glu Asn
195 200 205
Gly Arg Glu Ile Thr Lys Ala Asp Gly Ile Leu Val Asn Thr Phe Asp
210 215 220
Ala Leu Glu Pro Lys Ala Leu Ala Thr Leu Arg Asp Gly Thr Val Val
225 230 235 240
Thr Arg Phe Pro Pro Val Phe Ala Ile Gly Pro Leu Thr Ser His Ser
245 250 255
Pro Ala Ala Gly Glu Arg Val Asp Ala Gly Phe Pro Leu Ala Trp Leu
260 265 270
Ala Glu Gln Pro Thr Arg Ser Val Val Tyr Val Ala Phe Gly Asn Arg
275 280 285
Asn Ala Val Thr Leu Asp Gln Ile Arg Glu Ile Ala Val Gly Leu Glu
290 295 300
Ala Ser Gly Phe Arg Phe Leu Trp Val Leu Lys Thr Thr Val Val Asp
305 310 315 320
His Glu Asp Thr Ala Glu Leu Lys Asp Val Leu Gly Asp Gly Phe Leu
325 330 335
Glu Arg Val Lys Gly Arg Ser Leu Val Thr Lys Ala Trp Val Asp Gln
340 345 350
Glu Ala Ile Leu Lys His Pro Ala Val Gly Leu Tyr Leu Ser His Ser
355 360 365
Gly Trp Asn Ser Val Ala Glu Ala Ala Ala Tyr Gly Val Pro Met Leu
370 375 380
Ala Trp Pro Arg Gly Gly Asp His Arg Val Asn Ala Thr Val Val Val
385 390 395 400
Ser Gly Gly Val Gly Val Trp Met Glu His Trp Ser Trp Asp Gly Glu
405 410 415
Asp Arg Leu Val Ser Gly Lys Glu Ile Gly Asp Lys Val Lys Glu Val
420 425 430
Met Leu Asp Ala Ala Val Arg Ala Arg Ala Ala Lys Val Gly Glu Glu
435 440 445
Ala Asp Lys Ala Leu Thr Glu Gly Gly Ser Ser Tyr Arg Ser Met Gln
450 455 460
Gln Phe Val Ala Lys Leu Lys Asn Asn
465 470
<210> 2
<211> 474
<212> PRT
<213> 毛竹(Phyllostachys edulis)
<400> 2
Met Ala Pro Pro Glu Met Leu Ser Ser Gly Glu Gln Asp Arg Gly Ala
1 5 10 15
Pro His Val Val Phe Ile Pro Ser Ala Gly Met Gly His Leu Leu Pro
20 25 30
Phe Phe Arg Phe Ile Thr Ala Leu Ser Ser His Asp Val Asp Ile Ser
35 40 45
Val Val Thr Val Leu Pro Thr Val Thr Thr Ala Glu Ala Asp His Phe
50 55 60
Ala Ala Leu Phe Thr Ala Leu Pro Arg Ile Arg Arg Ile Asn Phe Asn
65 70 75 80
Leu Leu Pro Leu Asp Ala Ser Ala Phe Pro Gly Ala Asp Pro Phe Phe
85 90 95
Leu Arg Trp Glu Ser Leu Arg Arg Ser Ala His Leu Leu Gly Pro Leu
100 105 110
Leu Ala Gly Ala Thr Pro Ser Met Ser Ala Val Ile Thr Asp Val Thr
115 120 125
Leu Ala Ser Gln Val Ile Pro Ile Val Lys Asp Glu Leu His Leu Ser
130 135 140
Cys His Ile Leu Phe Pro Ser Ser Thr Thr Met Leu Ser Leu Cys Ala
145 150 155 160
Tyr Phe Pro Thr Tyr Leu Asp Gly Ala Asn Ala Asp His Val Val Ser
165 170 175
Asp Val Asp Val Pro Gly Val Arg Arg Phe Thr Lys Ala Thr Leu Pro
180 185 190
Gln Ala Leu His Asp Pro Asn Asn Leu Phe Thr Lys Gln Phe Val Ala
195 200 205
Asn Gly Arg Gly Phe Thr Lys Ala Asp Gly Phe Leu Leu Asn Thr Phe
210 215 220
Glu Ala Leu Glu Pro Glu Ala Ile Ala Ala Leu Arg Gly Gly Lys Val
225 230 235 240
Ile Pro Cys Phe Pro Pro Val Phe Thr Val Ala Pro Leu Lys Ser Met
245 250 255
Ile Pro Ala Asp Ser Glu Lys Val Gly Ala Gly Ser Pro Met Ala Trp
260 265 270
Leu Asp Glu Gln Pro Ala Arg Ser Val Val Tyr Val Ala Phe Gly Asn
275 280 285
Arg Cys Ala Val Thr Leu Asp Gln Ile Arg Glu Ile Ala Ala Gly Leu
290 295 300
Glu Thr Ser Ser Phe Arg Phe Leu Trp Val Leu Lys Thr Thr Val Val
305 310 315 320
Asp Arg Glu Asp Thr Val Glu Leu Lys Asp Val Leu Gly Asp Gly Phe
325 330 335
Leu Glu Arg Met Gln Gly Arg Gly Leu Val Thr Lys Ala Trp Val Asp
340 345 350
Gln Glu Ala Val Leu Asn His Pro Ala Val Gly Leu Phe Leu Ser His
355 360 365
Ser Gly Trp Asn Ser Val Val Glu Ala Ala Val Gly Gly Val Pro Leu
370 375 380
Leu Ala Trp Pro Arg Phe Gly Asp His Arg Val Asn Ala Thr Ala Met
385 390 395 400
Val Ser Gly Gly Val Gly Val Trp Met Glu His Trp Ser Trp Asp Gly
405 410 415
Glu Asp Arg Leu Val Ser Gly Glu Glu Ile Gly Glu Lys Val Lys Glu
420 425 430
Val Met Ala Asp Glu Thr Val Arg Ala Arg Val Ala Lys Val Arg Glu
435 440 445
Glu Ala Ala Lys Ala Val Ala Glu Gly Gly Ser Ser Tyr Arg Ser Met
450 455 460
Gln Glu Phe Val Ala Lys Leu Lys Ala Asn
465 470
<210> 3
<211> 481
<212> PRT
<213> 稻(Oryza sativa )
<400> 3
Met Ala Pro Pro Pro Ala Val Leu Ser Ser Gly Glu Leu Gly Ala Arg
1 5 10 15
Gly His Thr Arg Pro His Val Val Phe Val Pro Ser Ala Gly Met Gly
20 25 30
His Leu Leu Gln Phe Phe Arg Phe Ile Gly Ala Leu Ser Ala His Asp
35 40 45
Val Asp Ile Ser Val Val Thr Val Phe Pro Thr Val Ser Ala Ala Glu
50 55 60
Ala Asp His Phe Ala Ala Leu Phe Arg Asp Tyr Pro Ser Val Arg Arg
65 70 75 80
Leu Asp Phe Asp Leu Leu Pro Phe Asp Ala Ser Glu Phe Pro Gly Gly
85 90 95
Asp Pro Phe Leu Leu Arg Trp Glu Ala Leu Arg Arg Ser Leu His Leu
100 105 110
Leu Gly Pro Val Ile Ala Gly Val Thr Pro Arg Val Thr Ala Thr Val
115 120 125
Thr Asp Val Thr Leu Val Ser His Val Asn Pro Ile Ala Lys Asp Leu
130 135 140
Gly Val Gln Cys His Val Leu Tyr Val Ser Ser Ala Ala Met Met Ser
145 150 155 160
Leu Cys Ser Tyr Phe Pro Ile Tyr Leu Asp Asn Lys Asp Ala Gly Ala
165 170 175
Asp Val Gly Asp Val Asp Ile Pro Gly Val Arg Arg Leu Lys Arg Ser
180 185 190
Trp Leu Pro Gln Pro Leu Leu Asp Leu Asn Lys Leu Phe Thr Lys Gln
195 200 205
Phe Ile Glu Asn Gly Arg Glu Met Val Lys Thr Asp Gly Val Leu Ile
210 215 220
Asn Thr Phe Asp Ala Leu Glu Pro Val Ala Leu Ala Ala Leu Arg Asp
225 230 235 240
Gly Lys Val Val Arg Gly Phe Pro Pro Val Phe Ala Val Gly Pro His
245 250 255
Ser Ser Leu Ala Ser Glu Ala Thr Lys Gly Ala Ala Ala Asp Ala Glu
260 265 270
Gly Ser Pro Met Ala Trp Leu Arg Gln Gln Pro Ala Arg Ser Val Val
275 280 285
Tyr Val Ala Phe Gly Ser Arg Cys Ala Val Ser His Glu Gln Ile Arg
290 295 300
Glu Ile Ala Ala Gly Leu Glu Ala Ser Gly Ser Arg Phe Leu Trp Ile
305 310 315 320
Leu Lys Thr Thr Val Val Asp Arg Asp Asp Asp Ala Gly Ile Arg Asp
325 330 335
Val Leu Gly Asp Gly Phe Leu Glu Arg Val Arg Gly Arg Gly Val Val
340 345 350
Thr Lys Ala Trp Val Asp Gln Asp Ala Val Leu Arg Asp Pro Ala Val
355 360 365
Gly Leu Phe Leu Ser His Ser Gly Trp Asn Ser Val Ile Glu Ala Ala
370 375 380
Thr Ala Gly Val Pro Leu Leu Ala Trp Pro Arg Gly Gly Asp His Arg
385 390 395 400
Val Ala Ala Thr Val Val Ala Ser Ser Gly Val Gly Val Trp Met Glu
405 410 415
Gln Trp Ser Trp Asp Gly Glu Glu Trp Val Val Ser Gly Glu Glu Ile
420 425 430
Gly Gly Lys Val Lys Glu Met Met Ala Asp Ala Gly Val Arg Glu Lys
435 440 445
Ala Ala Lys Val Gly Glu Glu Val Ala Lys Ala Val Ala Val Gly Gly
450 455 460
Thr Ser His Thr Gly Ile Leu Asp Phe Val Ala Lys Leu Lys Ala Ala
465 470 475 480
Thr
<210> 4
<211> 476
<212> PRT
<213> 稻(Oryza sativa )
<400> 4
Met Ala Pro Pro Thr Val Leu Asn Ser Gly Glu Pro Asp Ser Arg Arg
1 5 10 15
Arg Ala Arg Pro His Val Val Phe Val Pro Ser Ala Gly Met Gly His
20 25 30
Leu Leu Pro Phe Phe Arg Phe Ile Gly Ala Leu Ser Ala His Asp Val
35 40 45
Asp Ile Ser Val Val Thr Val Leu Pro Thr Val Ser Ala Ala Glu Asn
50 55 60
Asp His Phe Ala Arg Leu Phe Gln Asp Phe Pro Ser Ile Arg Arg Val
65 70 75 80
Asp Phe Asn Leu Leu Pro Leu Asp Ala Ser Glu Phe Pro Gly Ala Asp
85 90 95
Pro Phe Leu Leu Arg Trp Glu Ala Leu Arg Arg Ser Met His Leu Leu
100 105 110
Ala Pro Ala Ile Ala Gly Val Ser Pro Arg Ala Thr Ala Val Val Thr
115 120 125
Asp Val Thr Leu Val Ser His Val Asn Ala Ile Ala Lys Asp Leu Gln
130 135 140
Leu Gln Cys His Val Leu Phe Ile Ser Ser Ala Thr Met Met Ser Phe
145 150 155 160
Leu Ser Tyr Phe Pro Ile Tyr Leu Asp Asn Lys Asp Ala Gln Ala Asp
165 170 175
Val Gly Asp Val Asp Ile Pro Gly Val Arg Arg Leu Lys Arg Ser Trp
180 185 190
Leu Pro Gln Pro Leu Leu Asp Leu Asp Lys Leu Phe Thr Lys Gln Phe
195 200 205
Ile Asp Asn Gly Arg Glu Val Val Lys Thr Asp Gly Val Leu Ile Asn
210 215 220
Thr Phe Asp Ala Leu Glu Pro Val Ala Leu Ala Ala Leu Arg Asp Gly
225 230 235 240
Lys Val Ile Arg Gly Phe Pro Ser Val Phe Ala Val Gly Pro Tyr Ser
245 250 255
Ser Leu Ala Ser Glu Thr Lys Ala Ala Asp Ala Glu Ser Ser Ala Leu
260 265 270
Ala Trp Leu Asn Gln Gln Pro Ala Arg Ser Val Val Tyr Val Ala Phe
275 280 285
Gly Asn Arg Tyr His Val Ser Asn Asp Gln Leu Arg Glu Ile Ala Ala
290 295 300
Gly Leu Glu Ala Ser Gly Cys Arg Phe Leu Trp Ile Val Lys Thr Thr
305 310 315 320
Ala Val Asp Arg Asp Glu Ala Ala Gly Val Arg Asp Val Leu Gly Asp
325 330 335
Gly Phe Val Asp Arg Val Arg Gly Arg Gly Met Val Thr Lys Ala Trp
340 345 350
Val Asp Gln Glu Ala Val Leu Gly His Pro Ala Val Gly Leu Phe Leu
355 360 365
Ser His Ser Gly Trp Asn Ser Val Thr Glu Ala Ala Ala Ala Gly Val
370 375 380
Pro Leu Leu Ala Trp Pro Arg Ala Gly Asp His Arg Val Ala Gly Thr
385 390 395 400
Val Val Ala Ser Ser Gly Val Gly Val Trp Met Glu Gln Trp Ser Trp
405 410 415
Asp Gly Glu Glu Trp Leu Val Ser Gly Gln Glu Ile Gly Gly Lys Val
420 425 430
Lys Glu Met Met Ala Asp Ala Gly Val Arg Glu Arg Ala Ala Lys Val
435 440 445
Gly Glu Leu Ala Ala Lys Ala Val Ala Glu Gly Gly Thr Ser Arg Thr
450 455 460
Ser Met Leu Glu Phe Val Ala Lys Leu Lys Ala Thr
465 470 475
<210> 5
<211> 476
<212> PRT
<213> 稻(Oryza sativa )
<400> 5
Met Pro Pro Pro Thr Val Leu Asn Ser Gly Glu Pro Asp Ser Arg Arg
1 5 10 15
Arg Ala Arg Pro His Val Val Phe Val Pro Ser Ala Gly Met Gly His
20 25 30
Leu Leu Pro Phe Phe Arg Phe Ile Gly Ala Leu Ser Ala His Asp Val
35 40 45
Asp Ile Ser Val Val Thr Val Leu Pro Thr Val Ser Ala Ala Glu Ala
50 55 60
Asp His Phe Ala Arg Leu Phe Gln Asp Phe Pro Ser Ile Arg Arg Val
65 70 75 80
Asp Phe Asn Leu Leu Pro Leu Asp Ala Ser Glu Phe Pro Gly Ala Asp
85 90 95
Pro Phe Leu Leu Arg Trp Glu Ala Leu Arg Arg Ser Met His Leu Leu
100 105 110
Ala Pro Ala Ile Ala Gly Val Arg Pro Arg Ala Thr Ala Val Val Thr
115 120 125
Asp Val Thr Leu Val Ser His Val Asn Pro Ile Ala Lys Asp Leu Arg
130 135 140
Leu Gln Cys His Val Leu Phe Ile Ser Ser Ala Thr Met Met Ser Leu
145 150 155 160
Cys Ser Tyr Phe Pro Ile Tyr Leu Asp Asn Lys Asp Ala Glu Ala Asp
165 170 175
Val Gly Asp Ile Asp Ile Pro Gly Val Arg Arg Leu Lys Arg Ser Trp
180 185 190
Leu Pro Gln Pro Leu Leu Asp Leu Asp Lys Leu Phe Thr Lys Gln Phe
195 200 205
Ile Asp Asn Gly Arg Glu Val Val Lys Thr Asp Gly Val Leu Ile Asn
210 215 220
Thr Phe Asp Ala Leu Glu Pro Val Ala Leu Ala Ala Leu Arg Asp Gly
225 230 235 240
Lys Val Ile Arg Gly Phe Pro Ser Val Phe Ala Val Gly Pro Tyr Ser
245 250 255
Ser Leu Ala Ser Glu Lys Lys Ala Ala Asp Ala Glu Ser Ser Ala Leu
260 265 270
Ala Trp Leu Asn Gln Gln Pro Ala Arg Ser Val Val Tyr Val Ala Phe
275 280 285
Gly Asn Arg Tyr His Val Ser Asn Asp Gln Leu Arg Glu Ile Ala Ala
290 295 300
Gly Leu Glu Ala Ser Gly Cys Arg Phe Leu Trp Ile Val Lys Thr Thr
305 310 315 320
Ala Val Asp Arg Asp Glu Ala Ala Gly Val Arg Asp Val Leu Gly Asp
325 330 335
Gly Phe Val Asp Arg Val Arg Gly Arg Gly Met Val Thr Lys Ala Trp
340 345 350
Val Asp Gln Glu Ala Val Leu Gly His Pro Ala Val Gly Leu Phe Leu
355 360 365
Ser His Ser Gly Trp Asn Ser Val Thr Glu Ala Ala Ala Ala Gly Val
370 375 380
Pro Leu Leu Ala Trp Pro Arg Ala Gly Asp His Arg Val Ala Gly Thr
385 390 395 400
Val Val Ala Ser Ser Gly Val Gly Val Trp Met Glu Gln Trp Ser Trp
405 410 415
Asp Gly Glu Glu Trp Leu Val Ser Gly Gln Glu Ile Gly Gly Lys Val
420 425 430
Lys Glu Met Met Ala Asp Ala Gly Val Arg Glu Arg Ala Ala Lys Val
435 440 445
Gly Glu Gln Ala Ala Lys Ala Val Ala Glu Gly Gly Thr Ser Arg Thr
450 455 460
Ser Met Leu Glu Phe Val Ala Lys Leu Lys Ala Ala
465 470 475
<210> 6
<211> 479
<212> PRT
<213> 稻(Oryza sativa )
<400> 6
Met Ala Pro Pro Thr Val Leu Asn Ser Gly Glu Pro Asp Ser Arg Arg
1 5 10 15
Arg Ala Arg Pro His Val Val Phe Val Pro Ser Ala Gly Met Gly His
20 25 30
Leu Leu Pro Phe Phe Arg Phe Ile Gly Ala Leu Ser Ala His Asp Val
35 40 45
Asp Ile Ser Val Val Thr Val Leu Pro Thr Val Ser Ala Ala Glu Ala
50 55 60
Asp His Phe Ala Arg Leu Phe Gln Asp Phe Pro Ser Ile Arg Arg Val
65 70 75 80
Asp Phe Asn Leu Leu Pro Leu Asp Ala Ser Glu Phe Pro Gly Ala Asp
85 90 95
Pro Phe Leu Leu Arg Trp Glu Ala Leu Arg Arg Ser Met His Leu Leu
100 105 110
Ala Pro Ala Ile Ala Gly Val Ser Pro Arg Ala Thr Ala Val Val Thr
115 120 125
Asp Val Thr Leu Val Ser His Val Asn Pro Ile Ala Lys Asp Leu Arg
130 135 140
Leu Gln Cys His Val Leu Phe Ile Ser Ser Ala Thr Met Met Ser Leu
145 150 155 160
Cys Ser Tyr Phe Pro Ile Tyr Leu Asp Asn Lys Asp Ala Glu Ala Asp
165 170 175
Val Gly Asp Ile Asp Ile Pro Gly Val Arg Arg Leu Lys Arg Ser Trp
180 185 190
Leu Pro Gln Pro Leu Leu Asp Leu Asp Lys Leu Phe Thr Lys Gln Phe
195 200 205
Ile Asp Asn Gly Arg Glu Val Val Lys Thr Asp Gly Val Leu Ile Asn
210 215 220
Thr Phe Asp Ala Leu Glu Pro Val Ala Leu Ala Ala Leu Arg Asp Gly
225 230 235 240
Lys Val Ile Arg Gly Phe Pro Pro Val Phe Ala Val Gly Pro Tyr Ser
245 250 255
Ser Leu Ala Ser Glu Lys Lys Ala Ala Asp Ala Asp Gln Ser Ser Ala
260 265 270
Leu Ala Trp Leu Asp Gln Gln Pro Ala Arg Ser Val Val Tyr Val Ala
275 280 285
Phe Gly Asn Arg Cys Thr Val Ser Asn Asp Gln Leu Arg Glu Ile Ala
290 295 300
Ala Gly Leu Glu Ala Ser Gly Cys Arg Phe Leu Trp Ile Leu Lys Thr
305 310 315 320
Thr Val Val Asp Arg Asp Glu Ala Ala Ala Gly Gly Val Arg Asp Val
325 330 335
Leu Gly Asp Gly Phe Met Glu Arg Val Lys Gly Arg Gly Met Val Thr
340 345 350
Lys Glu Trp Val Asp Gln Glu Ala Val Leu Gly His Pro Ala Val Gly
355 360 365
Leu Phe Leu Ser His Ser Gly Trp Asn Ser Val Thr Glu Ala Ala Ala
370 375 380
Ala Gly Val Pro Leu Leu Ala Trp Pro Arg Gly Gly Asp His Arg Val
385 390 395 400
Ala Ala Thr Val Val Ala Ser Ser Gly Val Gly Val Trp Met Glu Gln
405 410 415
Trp Ser Trp Asp Gly Glu Glu Trp Leu Val Ser Gly Glu Glu Ile Gly
420 425 430
Gly Lys Val Lys Glu Met Met Ala Asp Asp Ala Val Arg Glu Arg Ala
435 440 445
Ala Lys Val Gly Glu Glu Ala Ala Lys Ala Val Ala Glu Gly Gly Thr
450 455 460
Ser Arg Thr Ser Met Leu Glu Phe Val Ala Lys Leu Lys Ala Ala
465 470 475
<210> 7
<211> 487
<212> PRT
<213> 二穗短柄草(Brachypodium distachyon)
<400> 7
Met Ala Asp Leu Ala Ala Met Pro Asn Ser Gly Glu Gln Gln Gly Arg
1 5 10 15
Asp Ala Pro Ala Pro Pro His Leu Val Phe Val Pro Ser Ala Gly Met
20 25 30
Gly His Leu Leu Pro Phe Thr Arg Phe Ile Ala Asp Leu Ala Asn Glu
35 40 45
Asn Val Glu Ile Ser Val Val Thr Ala Leu Pro Thr Val Ser Ala Ala
50 55 60
Glu Ala Ala His Phe Ala Asp Leu Phe Ala Ala Phe Pro Arg Ile Arg
65 70 75 80
Arg Ile Asp Phe Asn Leu Leu Pro Phe Asp Glu Ser Ala Phe Pro Gly
85 90 95
Ala Asp Pro Phe Leu Leu Arg Trp Glu Ser Leu Arg Arg Ser Ala Gln
100 105 110
Leu Leu Gly Pro Leu Ile Ala Ala Ala Val Pro Arg Ala Ser Ala Val
115 120 125
Val Thr Asp Val Thr Leu Ala Ser Gln Val Ile Pro Ile Ala Lys Asp
130 135 140
Glu Leu Asn Leu Pro Cys His Ile Leu Phe Ile Ser Cys Ala Thr Met
145 150 155 160
Leu Ser Leu Val Ala Tyr Phe Pro Val Tyr Leu Asp Gly Ala Lys Ala
165 170 175
Asp His Leu Val Gly Asp Val Asp Ile Pro Gly Val Leu Arg Leu Pro
180 185 190
Val Ser Ser Pro Pro Gln Val Leu Arg Asn Pro Asp Ser Leu Phe Thr
195 200 205
Lys Gln Phe Ile Ala Asn Gly Arg Thr Ile Ala Lys Ser Asp Gly Ile
210 215 220
Leu Val Asn Thr Phe Arg Ala Leu Glu Pro Glu Ala Leu Ser Ala Leu
225 230 235 240
Asn Ser Gly Lys Val Val Pro Gly Phe Pro Pro Val Tyr Ala Val Gly
245 250 255
Pro Leu Lys Ser Ser Ile Thr Met Thr Thr Ser Thr Gly Ser Ser Asp
260 265 270
Lys Asp Glu Gly Ala Ala Ala Gly Gly Ser Pro Met Ala Trp Leu Gly
275 280 285
Glu Gln Pro Ala Gly Ser Val Val Tyr Val Ala Phe Gly Asn Arg His
290 295 300
Gly Val Ser Leu Glu Gln Ile Arg Glu Ile Ala Ala Gly Leu Glu Ala
305 310 315 320
Ser Gly Cys Gly Phe Leu Trp Val Leu Lys Thr Thr Val Val Asp Arg
325 330 335
Glu Asp Thr Ala Glu Leu Glu Asp Val Leu Gly Arg Gly Phe Leu Gly
340 345 350
Arg Val Thr Gly Arg Gly Leu Val Thr Lys Glu Trp Val Asp Gln Glu
355 360 365
Ala Val Leu Gln His Pro Ala Val Gly Leu Tyr Leu Ser His Ala Gly
370 375 380
Trp Asn Ser Val Thr Glu Ser Ala Ala Tyr Gly Val Pro Met Leu Val
385 390 395 400
Trp Pro Thr Ala Gly Asp Gln Arg Val Ile Ala Thr Val Val Ala Ser
405 410 415
Ala Gly Phe Gly Leu Trp Met Glu His Trp Asp Trp Glu Ser Leu Val
420 425 430
Ser Gly Ala Glu Ile Gly Glu Lys Val Lys Glu Val Met Gly Asn Glu
435 440 445
Gly Ile Lys Ala Arg Ala Ala Lys Val Ser Glu Glu Ala Ala Lys Ala
450 455 460
Val Ala Glu Gly Gly Ser Ser His Arg Ser Met Gln Glu Phe Leu Ala
465 470 475 480
Lys Leu Lys Pro Ser Thr Thr
485
<210> 8
<211> 482
<212> PRT
<213> 玉米(Zea mays)
<400> 8
Met Ala Pro Pro Pro Ala Met Gln Ser Pro Gly Glu Leu Asn Asp Gly
1 5 10 15
Ala Tyr Asp Ala Pro His Ile Leu Phe Ile Pro Ser Ala Gly Ile Gly
20 25 30
His Leu Thr Pro Val Phe Arg Val Ile Ala Gly Phe Ser Ser Arg Gly
35 40 45
Ile Asp Val Ser Val Val Thr Val Leu Pro Thr Val Ser Ala Ala Glu
50 55 60
Thr Asp Tyr Phe Asn Gly Leu Phe Ala Asp Tyr Pro Ala Val Arg Arg
65 70 75 80
Val Asp Met His Leu Leu Pro Leu Asp Ala Ser Glu Phe Thr Arg Glu
85 90 95
Asp Pro Phe Phe Leu Arg Trp Glu Ala Leu Arg Arg Ser Val His Leu
100 105 110
Leu Arg Pro Ile Ile Thr Asn Ala Ala Pro Arg Ile Thr Ala Ile Ile
115 120 125
Thr Asp Ile Thr Leu Thr Ser Cys Val Ile Pro Ile Ala Lys Glu Leu
130 135 140
Asp Val Pro Cys His Val Leu Phe Pro Thr Ala Ala Thr Met Leu Ser
145 150 155 160
Leu Asn Ala Tyr Tyr Pro Val Tyr Leu Glu Lys Leu Lys Gly Gly Pro
165 170 175
Glu Pro Gly Val Ile Gly Asp Ala Val Asp Ile Pro Gly Val Phe Arg
180 185 190
Val Pro Arg Ser Ala Leu Pro Pro Ala Leu Leu Asp Val Asn Lys Leu
195 200 205
Phe Thr Lys Gln Phe Ile Asp Asn Gly Arg Ala Ile Val Lys Ala Asp
210 215 220
Gly Val Leu Val Asn Thr Phe Asp Ala Val Glu Pro Ala Pro Leu Ala
225 230 235 240
Ala Leu Arg Gly Gly Lys Ile Val Pro Gly Tyr Pro Pro Val Tyr Thr
245 250 255
Ile Gly Pro Leu Lys Ser His Ala Thr Lys Ala Gly Asp Lys Pro Gly
260 265 270
Asp Ala Leu Leu Asp Glu Trp Leu Gly Lys Gln Arg Ala Arg Ser Val
275 280 285
Val Tyr Val Ala Phe Gly Asn Arg Ser Ala Ala Arg Leu Asp Gln Ile
290 295 300
Arg Glu Ile Ala Ala Gly Leu Glu Asp Ser Gly Tyr Pro Phe Leu Trp
305 310 315 320
Val Leu Lys Thr Thr Lys Val Asp Arg Glu Asp Asp Ala Glu Leu Ala
325 330 335
Glu Val Leu Gly Asp Gly Tyr Leu Glu Arg Val Lys Gly Arg Gly Ile
340 345 350
Val Thr Lys Gly Trp Val Glu Gln Glu Glu Leu Leu Lys His Pro Ala
355 360 365
Val Gly Met Phe Val Ser His Gly Gly Trp Asn Ser Ala Leu Glu Ala
370 375 380
Ser Ser Ala Gly Val Pro Leu Leu Val Trp Pro Gln Leu Gly Asp His
385 390 395 400
Arg Val Asn Ala Met Ala Ala Val Arg Ala Gly Ile Gly Ala Trp Ala
405 410 415
Glu His Trp Ser Trp Asp Gly Glu Asp Thr Leu Val Thr Arg Gln Glu
420 425 430
Ile Ala Asp Lys Val Lys Glu Val Met Ala Asp Gly Lys Leu Arg Ala
435 440 445
Ser Val Ala Val Ala Arg Glu Glu Ala Ala Lys Ala Val Ala Glu Gly
450 455 460
Gly Thr Ser Tyr Arg Asn Met His Asp Phe Ile Ala Lys Leu Lys Gly
465 470 475 480
Gly Ala
<210> 9
<211> 483
<212> PRT
<213> 玉米(Zea mays)
<400> 9
Met Ala Pro Pro Ala Thr Asn Ser Pro Gly Glu Val Asp Ser Gly Gly
1 5 10 15
Arg Pro His Val Met Phe Ile Pro Ser Ala Gly Met Gly His Leu Ile
20 25 30
Pro Phe Phe Arg Phe Ile Ala Ala Leu Ala Gly Gln Ser Val Asp Ile
35 40 45
Ser Val Val Thr Val Leu Pro Thr Val Ser Ala Ala Glu Glu Asp Tyr
50 55 60
Phe Thr Ser Leu Phe Ala Ala Leu Pro Arg Val Arg Arg Val Asp Leu
65 70 75 80
His Leu Leu Pro Phe Asp Ala Ser Lys Leu Pro Ser Asn Asp Arg Asp
85 90 95
Pro Phe Val Leu Arg Trp Glu Ala Leu Arg Arg Ser Ala His Leu Leu
100 105 110
Gly Pro Leu Ile Ala Gly Ala Ala Pro Arg Val Ser Ala Val Ile Thr
115 120 125
Asp Val Thr Leu Thr Ser His Val Ile Pro Ile Ala Lys Glu Leu Gly
130 135 140
Val Gln Cys His Val Leu Phe Pro Ser Ser Ala Thr Met Leu Ser Leu
145 150 155 160
Leu Ala Tyr Thr Pro Val His Ile Asp Lys Lys Ala Glu Gln Gly Ser
165 170 175
Asp Ile Gly Asp Val Asp Ile Pro Gly Val Cys Arg Ile Pro Gln Ser
180 185 190
Cys Leu Pro Gln Val Leu Leu His Leu Asp Lys Leu Phe Thr Lys Gln
195 200 205
Phe Ile Ala Asn Gly Arg Glu Ile Ile Asn Ala Asp Gly Phe Leu Val
210 215 220
Asn Thr Phe Asp Ala Leu Glu Pro Val Ala Leu Ala Ala Leu Arg Asp
225 230 235 240
Gly Lys Val Val Pro Gly Phe Pro Pro Val Tyr Ala Ile Gly Pro Leu
245 250 255
Met Ser Gln Gln Asn Ser Val Asp Glu Gly Gly Lys Glu Glu Gly Ser
260 265 270
Gly Ser Pro Val Ala Trp Leu Asp Glu Gln Pro Ala Arg Ser Val Val
275 280 285
Tyr Val Ala Phe Gly Asn Arg Cys Ala Val Ser His Asp Gln Ile Arg
290 295 300
Glu Ile Ala Ala Gly Leu Glu Ala Ser Asn Cys Arg Phe Leu Trp Val
305 310 315 320
Leu Lys Thr Thr Thr Val Asp Arg Asp Asp Ser Ala Val Leu Thr Glu
325 330 335
Leu Leu Gly Glu Glu Phe Leu Glu Arg Val Gln Gly Arg Gly Leu Val
340 345 350
Thr Lys Ala Trp Val Asp Gln Glu Ala Leu Leu Lys His Pro Ala Met
355 360 365
Gly Leu Phe Leu Ser His Ser Gly Trp Asn Ser Val Thr Glu Ala Ala
370 375 380
Ala Ala Ser Val Pro Leu Leu Ala Trp Pro Arg Gly Gly Asp His Arg
385 390 395 400
Val Asn Ala Met Val Thr Val Ser Gly Gly Val Gly Met Trp Met Glu
405 410 415
His Trp Ser Trp Asp Gly Glu Asp Trp Leu Val Thr Gly Val Glu Ile
420 425 430
Ala Lys Lys Val Lys Glu Val Met Ser Asp Glu Ala Val Arg Ala Arg
435 440 445
Thr Thr Arg Thr Ala Glu Glu Ala Ala Lys Ala Val Ala Glu Gly Gly
450 455 460
Thr Ser Tyr Arg Ser Met Glu Glu Phe Ile Ser Ser Val Lys Ala Thr
465 470 475 480
Val Ala Ser
<210> 10
<211> 467
<212> PRT
<213> 谷子(Setaria italica)
<400> 10
Met Lys Ser Pro Gly Glu Leu Gly Ser Gly Ala Arg Pro His Val Met
1 5 10 15
Phe Ile Pro Ser Ala Gly Met Gly His Leu Leu Pro Phe Leu Arg Val
20 25 30
Ile Ala Ala Leu Ala Arg His Asp Asp Val Asp Val Ser Val Val Thr
35 40 45
Val Leu Pro Thr Val Ser Ala Ala Glu Ala Asp His Leu Ala Gly Leu
50 55 60
Phe Ala Ala Phe Pro Arg Val Arg Arg Ala Asp Leu His Leu Leu Pro
65 70 75 80
Phe Asp Ala Ser Glu Phe Pro Gly His Asp Pro Phe Leu Leu Arg Trp
85 90 95
Glu Ala Leu Arg Arg Ser Ala His Leu Leu Arg Pro Leu Ile Ala Cys
100 105 110
Gly Ala Ala Pro Arg Val Ser Ala Ile Val Thr Asp Val Thr Leu Ala
115 120 125
Ser His Val Ile Pro Ile Ser Lys Glu Leu Asn Val Gln Cys His Val
130 135 140
His Phe Ile Ser Cys Ala Thr Met Leu Ser Leu Leu Ala Lys Ala Glu
145 150 155 160
Leu Gly Pro Gly Val Gly Asp Val Asp Ile Pro Gly Val Arg Arg Ile
165 170 175
Pro Glu Ser Tyr Leu Pro Gln Pro Leu Arg Asp Leu Asn Asn Val Phe
180 185 190
Thr Lys Gln Phe Ile Asp Asn Gly Arg Glu Ile Ile Asn Ala Asp Gly
195 200 205
Ile Leu Val Asn Thr Phe Asp Ala Leu Glu Pro Ala Ala Leu Ala Ala
210 215 220
Leu Arg Asp Gly Lys Val Val Pro Gly Phe Pro Pro Val Asn Ala Ile
225 230 235 240
Gly Pro Leu Asp Ser His Thr Ala Ser Thr Ala Asn Ala Lys Gln Ser
245 250 255
Glu Pro Ala Gly Ser Pro Val Ala Trp Leu Gly Glu Gln Pro Ala Arg
260 265 270
Ser Val Val Tyr Val Ala Phe Gly Asn Arg Ser Ala Val Ser Arg Asp
275 280 285
Gln Leu Arg Gln Ile Ala Ala Gly Leu Glu Ala Ser Gly Cys Arg Phe
290 295 300
Leu Trp Val Leu Lys Thr Thr Thr Val Asp Lys Asp Asp Asn Thr Glu
305 310 315 320
Val Glu Asp Val Leu Gly Cys Gly Phe Leu Glu Arg Val Arg Gly Arg
325 330 335
Gly Leu Val Thr Lys Ala Trp Val Asp Gln Glu Ala Leu Leu Lys His
340 345 350
Pro Ala Val Gly Leu Phe Leu Ser His Ser Gly Trp Asn Ser Val Val
355 360 365
Glu Ala Ala Ala Ala Gly Met Pro Leu Leu Ala Trp Pro Arg Gly Gly
370 375 380
Asp Gln Arg Val Asn Ala Met Val Val Ala Ser Gly Gly Phe Gly Val
385 390 395 400
Trp Met Glu His Trp Ser Trp Asp Gly Glu Asp Arg Leu Val Thr Gly
405 410 415
Glu Glu Ile Arg Glu Lys Val Lys Glu Val Met Ser Asp Ala Ala Val
420 425 430
Arg Val Arg Ala Met Lys Thr Gly Glu Glu Ala Ala Lys Ala Val Ala
435 440 445
Glu Gly Gly Thr Ser Tyr Arg Ser Met Gln Glu Phe Ile Gly Lys Leu
450 455 460
Arg Ala Thr
465
<210> 11
<211> 459
<212> PRT
<213> 高粱(Sorghum bicolor)
<400> 11
Met Ala Thr Pro Pro Ala Thr Lys Ser Leu Leu Gly Glu Leu Asn Gly
1 5 10 15
Gly Gly Ala Ser Arg Pro His Val Met Phe Ile Pro Ser Ala Gly Met
20 25 30
Gly His Leu Leu Pro Phe Phe Arg Phe Ile Ala Ser Leu Ala Arg His
35 40 45
Asp Asp Asp Val Asp Ile Ser Val Val Thr Val Leu Pro Thr Val Ser
50 55 60
Ala Ala Glu Ala Asp His Phe Ser Gly Leu Phe Ala Ala Phe Pro Arg
65 70 75 80
Val Arg Arg Val Asp Phe Pro Ser His Asp Arg Asp Pro Phe Ile Val
85 90 95
Arg Trp Glu Ala Leu Arg Arg Ser Ala His Leu Ile Gly Pro Leu Ile
100 105 110
Ala Gly Ala Ala Pro Arg Val Ser Ala Val Ile Thr Asp Val Thr Leu
115 120 125
Thr Ser His Val Ile Pro Ile Ala Lys Lys Leu Gly Val Gln Cys His
130 135 140
Val Leu Phe Ile Ser Cys Ala Thr Ile Lys Lys Ala Glu Gln Gly Pro
145 150 155 160
Gly Ala Gly Val Gly Ala Val Asp Ile Pro Gly Val Arg Arg Ile Pro
165 170 175
Glu Ser Cys Leu Pro Gln Pro Leu Leu Asp Leu Asn Lys Gln Phe Thr
180 185 190
Lys Gln Phe Ile Asp Asn Gly Arg Glu Asn Ile Asn Ala Asp Gly Ile
195 200 205
Leu Val Asn Thr Phe Asp Ala Leu Glu Pro Ala Ala Leu Ala Ala Leu
210 215 220
Arg Asp Gly Lys Val Val Pro Gly Phe Pro Phe Pro Pro Val Tyr Ala
225 230 235 240
Ile Gly Pro Leu Arg Ser Val Val Asp Lys Glu Asp Ser Ser Ser Ser
245 250 255
Ser Pro Val Val Ala Trp Leu Asp Lys Gln Pro Ala Arg Ser Val Val
260 265 270
Tyr Val Ala Phe Gly Asn Arg Ser Ala Val Ser His Ala His Ile Arg
275 280 285
Glu Ile Ala Ala Gly Leu Glu Ala Ser Gly Cys Arg Phe Leu Trp Val
290 295 300
Leu Lys Thr Thr Lys Val Asp Arg Asp Asp Thr Ala Glu Leu Thr Asp
305 310 315 320
Val Leu Gly Glu Gly Phe Leu Glu Arg Leu His Gln Gln Gln Gly Gln
325 330 335
Gly Gln Gly Gln His Gly Met Val Thr Lys Glu Trp Val Asp Gln Glu
340 345 350
Ala Leu Leu Lys His Ala Ser Val Gly Leu Tyr Leu Ser His Ser Gly
355 360 365
Trp Asn Ser Val Thr Glu Ala Ala Ala Ala Gly Val Pro Leu Leu Ala
370 375 380
Trp Pro Arg Gly Gly Asp His Arg Val Asn His Trp Ser Trp Asp Gly
385 390 395 400
Glu Asp Trp Leu Val Thr Gly Glu Glu Ile Ala Glu Lys Val Lys Glu
405 410 415
Val Met Ser Asp Ala Ala Val Arg Ala Arg Ala Thr Arg Thr Gly Glu
420 425 430
Glu Ala Ala Met Ala Val Ala Glu Gly Gly Thr Ser Tyr Arg Ser Met
435 440 445
Gln Gln Phe Val Ser Ser Leu Lys Lys Ala Thr
450 455
<210> 12
<211> 482
<212> PRT
<213> 高粱(Sorghum bicolor)
<400> 12
Met Ser Ser Pro Ala Leu Ser Thr Thr Ser Ser His Val Pro Arg Gly
1 5 10 15
Ala Pro His Val Val Leu Phe Pro Ser Ala Gly Met Gly His Leu Val
20 25 30
Pro Phe Thr Arg Leu Ala Val Ala Leu Ser Ala Gly His Gly Cys Asp
35 40 45
Ile Ser Leu Val Thr Ala Met Pro Thr Val Ser Ser Ala Glu Ser Arg
50 55 60
His Ile Ala Ala Leu Cys Ala Ala Phe Pro Ala Ile Arg Gln Leu Asp
65 70 75 80
Leu Asp Leu Arg Leu Ala Pro Phe Asp Ala Ser Ser Glu Phe Pro Gly
85 90 95
Ala Asp Pro Phe Tyr Val Arg Tyr Glu Ala Leu Arg Arg Ala Ala Pro
100 105 110
Val Leu Leu Gly Pro Leu Leu Ala Gly Ala Gly Ala Ser Ala Leu Val
115 120 125
Ala Asp Ile Ala Leu Ala Ser Val Ala Ile Pro Val Ala Arg Glu Leu
130 135 140
His Val Pro Cys Phe Val Phe Phe Thr Ala Ser Ala Thr Met Phe Ser
145 150 155 160
Leu Lys Ala Tyr Phe Pro Thr Tyr Leu Asp Ala Val Gly Ala Gly His
165 170 175
Gly Val Gly Asp Val Asp Val Pro Gly Val Tyr Arg Ile Pro Ser Ser
180 185 190
Ser Val Pro Gln Ala Leu His Asp Pro Asp Asn Ile Phe Thr Arg Gln
195 200 205
Phe Val Ala Asn Gly Arg Ala Leu Val Thr Ala Asp Gly Leu Leu Val
210 215 220
Asn Ala Phe His Ala Met Glu Pro Glu Ala Val Glu Ala Leu Arg Gly
225 230 235 240
Gly Ser Val Val Pro Gly Leu Pro Pro Val Phe Ala Val Gly Pro Leu
245 250 255
Met Pro Val Ser Glu Leu Arg Glu Thr Gly Glu Ala Glu Gln Glu Gln
260 265 270
Gly Asn Cys Tyr Arg Glu Trp Leu Asp Glu Gln Pro Pro Arg Ser Val
275 280 285
Val Tyr Val Ser Phe Gly Ser Arg Lys Ala Leu Pro Lys Asp Gln Met
290 295 300
Asn Glu Leu Ala Ala Gly Leu Glu Ala Cys Gly His Arg Phe Leu Trp
305 310 315 320
Val Val Lys Gly Ala Val Val Asp Arg Asp Asp Ala Gly Glu Leu Ser
325 330 335
Asp Leu Leu Gly Glu Gly Phe Leu Arg Arg Val Gln Gly Gln Gly Arg
340 345 350
Gly Leu Val Thr Lys Ser Trp Val Glu Gln Glu Glu Val Leu Arg His
355 360 365
Pro Ala Val Ala Leu Phe Val Ser His Cys Gly Trp Asn Ser Val Thr
370 375 380
Glu Ala Ala Ser Gly Gly Val Pro Val Leu Ala Trp Pro Arg Phe Ala
385 390 395 400
Asp Gln Arg Val Asn Ala Arg Val Val Ala Arg Ala Gly Leu Gly Val
405 410 415
Trp Ala Glu Gln Trp Ser Trp Glu Gly Glu Glu Ala Val Val Arg Ala
420 425 430
Glu Glu Ile Ala Glu Leu Val Met Glu Ala Met Gly Asp Asp Ala Met
435 440 445
Ala Glu Lys Ala Ala Asn Val Arg Glu Ala Ala Ser Arg Ala Val Ala
450 455 460
Asp Gly Gly Thr Ser Tyr Gln Ser Leu Ala Ala Phe Val Arg Arg Cys
465 470 475 480
Thr Ala
<210> 13
<211> 348
<212> PRT
<213> 中华根瘤菌(Sinorhizobium sp.)
<400> 13
Met Asn Tyr Phe Arg Asn Asp Phe Arg Gly Thr Leu Phe Gly Thr Asn
1 5 10 15
Glu Ala Thr Asp Ser Leu Arg Arg Arg Ser Leu Gln Lys Arg Ile Leu
20 25 30
Val Thr Gly Gly Ala Gly Phe Leu Gly Ser His Leu Cys Glu Leu Leu
35 40 45
Leu Gly Ala Gly His Glu Val Ile Cys Leu Asp Asn Phe Ser Thr Gly
50 55 60
Leu Arg Arg Asn Ile Ala Pro Leu Lys Arg Phe Asp Thr Phe Arg Val
65 70 75 80
Ile Ala His Asp Val Val Glu Pro Ile Asp Leu Glu Val Asp Glu Ile
85 90 95
Tyr Asn Leu Ala Cys Pro Ala Ser Pro Pro His Tyr Gln Ala Asp Pro
100 105 110
Ile Gln Thr Thr Lys Thr Cys Val Ile Gly Ser Leu Asn Leu Leu Asp
115 120 125
Leu Ala Ala Arg Arg Gly Ala Arg Ile Phe Gln Ala Ser Thr Ser Glu
130 135 140
Ile Tyr Gly Asp Pro His Val His Pro Gln Val Glu Ser Tyr Trp Gly
145 150 155 160
Asn Val Asn Pro Phe Gly Pro Arg Ser Cys Tyr Asp Glu Gly Lys Arg
165 170 175
Cys Ala Glu Thr Leu Phe Phe Asp Phe His Lys Ser His Gly Val Glu
180 185 190
Ile Lys Ile Val Arg Ile Phe Asn Thr Tyr Gly Pro Arg Met Arg Pro
195 200 205
Asp Asp Gly Arg Val Val Ser Asn Phe Ile Val Gln Ala Leu Lys Gly
210 215 220
Glu Asp Ile Thr Ile Tyr Gly Asp Gly Ser Gln Thr Arg Ser Phe Cys
225 230 235 240
Phe Val Glu Asp Leu Ile Asp Gly Phe Val Arg Leu Met Ala Ser Pro
245 250 255
Pro Ser Leu Thr Gly Pro Val Asn Leu Gly Asn Pro Ala Glu Phe Thr
260 265 270
Ile Gly Glu Leu Ala Glu Glu Val Ile Arg Leu Thr Gly Ser Arg Ser
275 280 285
Lys Ile Val Arg Arg Pro Leu Pro Val Asp Asp Pro Arg Gln Arg Arg
290 295 300
Pro Asp Ile Ser Leu Ala Thr Glu Glu Leu Gly Trp Arg Pro Lys Val
305 310 315 320
Asn Leu Ala Glu Gly Leu Ala His Thr Ile Arg Tyr Phe Asp Asp Leu
325 330 335
Leu Ser Arg Ser Met Arg Glu Ser Ala Glu Leu Val
340 345
<210> 14
<211> 328
<212> PRT
<213> 中华根瘤菌(Sinorhizobium sp.)
<400> 14
Met Val Ala Pro Arg Ile Leu Val Thr Gly Gly Ala Gly Tyr Ile Gly
1 5 10 15
Ser His Thr Ala Lys Leu Leu Arg Leu Glu Gly Ile Glu Pro Val Val
20 25 30
Tyr Asp Asn Leu Thr Thr Gly Asn Arg Ser Ala Val Arg Trp Gly Pro
35 40 45
Phe Val Gln Gly Asp Ile Leu Asp Gly Arg Arg Leu Ile Glu Val Ile
50 55 60
Glu Ala His Gln Pro Asp Ala Val Ile His Phe Ala Ala Ser Ala Tyr
65 70 75 80
Val Gly Glu Ser Val Ala Asp Pro Ala Lys Tyr Tyr Asn Asn Asn Val
85 90 95
Arg Gly Thr Leu Ser Leu Leu Asp Ala Cys Arg Gln Thr Gly Val Asp
100 105 110
Lys Val Ile Phe Ser Ser Ser Cys Ala Thr Tyr Gly Val Pro Ala Val
115 120 125
Leu Pro Ile Asp Glu Ala Thr Pro Gln Ala Pro Ile Asn Pro Tyr Gly
130 135 140
Lys Thr Lys Leu Val Ala Glu His Met Leu Ala Asp Tyr Ala Ala Ala
145 150 155 160
Phe Ala Leu Asn Tyr Val Ser Leu Arg Tyr Phe Asn Ala Cys Gly Ala
165 170 175
Asp Pro Glu Gly Asp Leu Gly Glu Trp His Asp Pro Glu Thr His Leu
180 185 190
Ile Pro Arg Ala Leu Met Ala Ala Ala Gly Arg Ile Pro His Leu Glu
195 200 205
Ile Phe Gly Glu Asp Tyr Asp Thr Pro Asp Gly Thr Cys Val Arg Asp
210 215 220
Tyr Ile His Val Ala Asp Leu Ala Ser Ala His Val Leu Ala Tyr Arg
225 230 235 240
His Leu Ala Lys Gly Gly Gly Asn Val Ala Leu Asn Leu Gly Thr Gly
245 250 255
Arg Gly Phe Ser Ile Lys Glu Val Leu Arg Thr Ile Gly Glu Ile Thr
260 265 270
Gly His Asp Val Pro Val Val Phe Arg Arg Arg Arg Ala Gly Asp Pro
275 280 285
Pro Ala Leu Tyr Ala Asp Ala Gly Leu Ala Cys Arg Thr Leu Gly Phe
290 295 300
Leu Pro Arg Tyr Ser Asp Leu Glu Thr Ile Val Arg Thr Ala Ala Pro
305 310 315 320
Phe Phe Gly Leu Glu Val Arg Ser
325
<210> 15
<211> 34
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
tgccgcgcgg cagccatatg atggctccgc cggc 34
<210> 16
<211> 51
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
tggtgctcga gtgcggccgc ttaattattc ttgagcttgg caacaaactg c 51
<210> 17
<211> 39
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
tgccgcgcgg cagccatatg atggccccac ctgaaatgc 39
<210> 18
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
tggtgctcga gtgcggccgc ttaattagcc ttgagcttgg caacaa 46
<210> 19
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
tgccgcgcgg cagccatatg atggcaccgc caacgg 36
<210> 20
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
tggtgctcga gtgcggccgc ttaagtggcc ttgagctttg caaca 45
<210> 21
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
tgccgcgcgg cagccatatg atggcaccgc caacgg 36
<210> 22
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
tggtgctcga gtgcggccgc ttaagcagcc ttgagctttg caaca 45
<210> 23
<211> 38
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
tgccgcgcgg cagccatatg atggctgatc tggcggcg 38
<210> 24
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
tggtgctcga gtgcggccgc ttaggtagta ctaggcttga gcttggcg 48
<210> 25
<211> 34
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
tgccgcgcgg cagccatatg atggctccgc cgcc 34
<210> 26
<211> 44
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
tggtgctcga gtgcggccgc tcaagctcct cccttaagct tggc 44
<210> 27
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
tgccgcgcgg cagccatatg atggccccgc cgg 33
<210> 28
<211> 39
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
tggtgctcga gtgcggccgc tcaagacgcc acggttgct 39
<210> 29
<211> 34
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
tgccgcgcgg cagccatatg atggcaccgc cggc 34
<210> 30
<211> 37
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
tggtgctcga gtgcggccgc tcaagggctg cagtgcg 37
<210> 31
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 31
tataccatgg gtgactgcgt tgccccg 27
<210> 32
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
cgggatcctt acttcggcag gtcgccgctc 30
<210> 33
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 33
cgggatccct tatgcgactc ctgcattag 29
<210> 34
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 34
gcccaagctt ttatgccagc atcttc 26
<210> 35
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 35
agatatacat atggttacgg tggaagaata c 31
<210> 36
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 36
ccgctcgagt taggtagcca cactatgcag 30
<210> 37
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 37
ccgctcgagc tagaaataat tttgtttaac 30
<210> 38
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 38
gagcctaggt tagttaccga ttttaaag 28
<210> 39
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 39
agctcccacc aggacctagc atgagcacct ggtccaaccg 40
<210> 40
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 40
gagctcgaat tcggatccac tagtttaggt cgccgcacgc gcc 43
<210> 41
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 41
tatacatatg tcctcttctt cttcttcgtc a 31
<210> 42
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 42
aattgcggcc gcttaccata catctctaag at 32
<210> 43
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 43
tgccgcgcgg cagccatatg atgggccacc tggtgc 36
<210> 44
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 44
tggtgctcga gtgcggccgc ctagtccaac actgcaagat ccc 43
<210> 45
<211> 52
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 45
atcttgcagt gttggactag tttgtttaac tttaagaagg agatatacca tg 52
<210> 46
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 46
gtggtggtgg tgctcgagta agcttgcggg atccgccgct taagtggcct tgagctttt 59
<210> 47
<211> 55
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 47
ttaactttaa gaaggagata tacatatgaa ttattttaga aatgacttca gggga 55
<210> 48
<211> 52
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 48
gtggtggtgg tgctcgagta agcttgcggg atcctcagac cagctccgca ct 52
<210> 49
<211> 47
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 49
tcgtcagtca ggatctgtga gcggcaataa ttttgtttaa ctttaag 47
<210> 50
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 50
tggtggtgct cgagtgcggc agggatcctc atgctagccg ctcatgaccg gacctccag 59
<210> 51
<211> 86
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 51
caaagctcaa ggctgcttag cggcaataat tttgtttaac tttaagaagg agatatacat 60
atgaattatt ttagaaatga cttcag 86
<210> 52
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 52
ggtggtgctc gagtgcggca gggatcctca tgctagccgc tcatgaccgg acctccagc 59

Claims (16)

1.一种催化二氢查尔酮化合物或2-羟基黄烷酮化合物生成碳苷二氢查尔酮化合物或碳苷-2-羟基黄烷酮化合物的方法,其特征在于,所述方法包括:以糖基转移酶进行所述催化;所述的糖基转移酶为SEQ ID NO: 6所示的多肽;
所述的二氢查尔酮化合物具有式(I)的母核结构、2-羟基黄烷酮化合物具有式(II)的母核结构,所述碳苷二氢查尔酮化合物具有式(III)的母核结构,所述碳苷-2-羟基黄烷酮化合物具有式(IV)的母核结构:
(I); (II);
(III); (IV);
其中,R为糖基,其与A环以碳碳键连接;所述二氢查尔酮化合物或2-羟基黄烷酮化合物为根皮素或2-羟基柚皮素;所述碳苷二氢查尔酮化合物或碳苷-2-羟基黄烷酮化合物选自:根皮素-C-阿拉伯糖苷,2-羟基柚皮素-C-阿拉伯糖苷,根皮素-C-双阿拉伯糖苷,2-羟基柚皮素-C-双阿拉伯糖苷,2-羟基柚皮素-C-葡萄糖苷,根皮素-C-双葡萄糖碳苷或2-羟基柚皮素-C-阿拉伯糖-C-葡萄糖苷;
在利用所述糖基转移酶进行糖基转移时,以携带阿拉伯糖基团或葡萄糖基团的化合物作为供体。
2.如权利要求1所述的方法,其特征在于,以UDP阿拉伯糖或UDP葡萄糖作为糖基供体。
3.糖基转移酶的用途,用于催化二氢查尔酮化合物或2-羟基黄烷酮化合物生成碳苷二氢查尔酮化合物或碳苷-2-羟基黄烷酮化合物;其中,所述的糖基转移酶为SEQ ID NO: 6所示的多肽;
所述二氢查尔酮化合物具有式(I)的母核结构、所述2-羟基黄烷酮化合物具有式(II)的母核结构,所述碳苷二氢查尔酮化合物具有式(III)的母核结构,碳苷-2-羟基黄烷酮化合物具有式(IV)的母核结构:
(I); (II);
(III); (IV);
其中,R为糖基,其与A环以碳碳键连接;所述二氢查尔酮化合物或2-羟基黄烷酮化合物为根皮素或2-羟基柚皮素;所述碳苷二氢查尔酮化合物或碳苷-2-羟基黄烷酮化合物选自:根皮素-C-阿拉伯糖苷,2-羟基柚皮素-C-阿拉伯糖苷,根皮素-C-双阿拉伯糖苷,2-羟基柚皮素-C-双阿拉伯糖苷,2-羟基柚皮素-C-葡萄糖苷,根皮素-C-双葡萄糖碳苷或2-羟基柚皮素-C-阿拉伯糖-C-葡萄糖苷;
在利用所述糖基转移酶进行糖基转移时,以携带阿拉伯糖基团或葡萄糖基团的化合物作为供体。
4.如权利要求3所述的用途,其特征在于,以UDP阿拉伯糖、UDP葡萄糖作为糖基供体。
5.一种合成黄酮碳苷化合物的方法,其特征在于,包括:
(1) 将2-羟基黄烷酮化合物以糖基转移酶催化,产生碳苷-2-羟基黄烷酮化合物;其中,所述的糖基转移酶为SEQ ID NO: 6所示的多肽;
(2) 将(1)的碳苷-2-羟基黄烷酮化合物脱水,获得黄酮碳苷化合物;
其中,所述2-羟基黄烷酮化合物具有式(II)的母核结构,所述碳苷-2-羟基黄烷酮化合物具有式(IV)的母核结构:
(II); (IV);
其中,R为糖基,其与A环以碳碳键连接;所述2-羟基黄烷酮化合物为2-羟基柚皮素;所述碳苷-2-羟基黄烷酮化合物选自:2-羟基柚皮素-C-双阿拉伯糖苷,2-羟基柚皮素-C-葡萄糖苷或2-羟基柚皮素-C-阿拉伯糖-C-葡萄糖苷;所述的黄酮碳苷化合物选自:芹菜素-6-C-阿拉伯糖苷,芹菜素-8-C-阿拉伯糖苷或芹菜素-6,8-C-双阿拉伯糖苷。
6.如权利要求5所述的方法,其特征在于,在(1)之前,还包括:(c)将黄烷酮化合物通过黄烷酮-2-羟化酶催化,获得2-羟基黄烷酮化合物。
7.如权利要求6所述的方法,其特征在于,在(c)之前,还包括:(b)将丙二酰-CoA结构类似物与p-香豆酰-CoA结构类似物经查尔酮合成酶和查尔酮异构酶催化,获得黄烷酮化合物。
8.如权利要求7所述的方法,其特征在于,在(b)之前,还包括:(a)将芳香族氨基酸经酪氨酸解氨酶或苯丙氨酸解氨酶和4-香豆酰-CoA连接酶催化,获得p-香豆酰-CoA或其结构类似物。
9.如权利要求8所述的方法,其特征在于,所述的黄烷酮化合物为柚皮素;
所述的丙二酰-CoA结构类似物包括:丙二酰-CoA;甲基丙二酰-CoA;
所述的p-香豆酰-CoA结构类似物包括:p-香豆酰-CoA;p-肉桂酰-CoA;或
所述的芳香族氨基酸包括:l-酪氨酸或l-苯丙氨酸。
10.如权利要求5~8任一所述的方法,其特征在于,所述2-羟基柚皮素是从柚皮素通过黄烷酮-2-羟化酶催化获得。
11.一种生物合成黄酮碳苷化合物的方法,其特征在于,包括:
(i) 将合成黄烷酮化合物的前体基因、编码黄烷酮-2-羟化酶和/或黄烷酮-3’-羟化酶的基因以及编码糖基转移酶的基因共转入宿主细胞中;其中,所述的糖基转移酶选自SEQID NO: 6所示的多肽;所述合成黄烷酮化合物的前体基因包括PAL、4CL、CHS、CHI基因;
(ii) 培养(i)的细胞,从而合成黄酮碳苷化合物;
所述的黄酮碳苷化合物选自:芹菜素-6-C-阿拉伯糖苷,芹菜素-8-C-阿拉伯糖苷或芹菜素-6,8-C-双阿拉伯糖苷;还在宿主细胞中转入合成糖基供体的基因,所述糖基包括阿拉伯糖或葡萄糖;所述糖基供体为携带阿拉伯糖基团或葡萄糖基团的化合物。
12.如权利要求11所述的方法,其特征在于,所述的黄烷酮-2-羟化酶和黄烷酮-3’-羟化酶为截去N端跨膜区域的P450氧化酶,在截去N端跨膜区域后,还包括添加标签;所述标签包括:2B1,17α或MBP。
13.如权利要求11所述的方法,其特征在于,所述糖基供体包括UDP阿拉伯糖或UDP葡萄糖。
14.一种生物合成黄酮碳苷化合物的遗传工程化的细胞,其特征在于,其中包括:合成黄烷酮化合物的前体基因、编码黄烷酮-2-羟化酶和/或黄烷酮-3’-羟化酶的基因以及编码糖基转移酶的基因;其中,所述的糖基转移酶为SEQ ID NO: 6所示的多肽;所述合成黄烷酮化合物的前体基因包括PAL、4CL、CHS、CHI基因;所述细胞不能繁殖为植物;所述的黄烷酮-2-羟化酶和黄烷酮-3’-羟化酶为截去N端跨膜区域的P450氧化酶,在截去N端跨膜区域后,还包括添加标签;所述标签包括:2B1,17α或MBP;所述的黄酮碳苷化合物选自:芹菜素-6-C-阿拉伯糖苷,芹菜素-8-C-阿拉伯糖苷或芹菜素-6,8-C-双阿拉伯糖苷;所述的细胞为大肠杆菌;所述的细胞中还包括合成糖基供体的基因。
15.制备权利要求14的细胞的方法,其特征在于,包括:将合成黄烷酮化合物的前体基因、编码黄烷酮-2-羟化酶和/或黄烷酮-3’-羟化酶的基因、编码糖基转移酶的基因共转入宿主细胞中;其中,所述的糖基转移酶为SEQ ID NO: 16所示的多肽;还将合成糖基供体的基因转入宿主细胞中;所述的黄烷酮-2-羟化酶和黄烷酮-3’-羟化酶为截去N端跨膜区域的P450氧化酶,在截去N端跨膜区域后,还包括添加标签;所述标签包括:2B1,17α或MBP;所述的黄酮碳苷化合物选自:芹菜素-6-C-阿拉伯糖苷,芹菜素-8-C-阿拉伯糖苷或芹菜素-6,8-C-双阿拉伯糖苷。
16.一种用于合成黄酮碳苷化合物或其中间体的试剂盒,其中包括权利要求14所述的遗传工程化的细胞。
CN202010096973.5A 2020-02-17 2020-02-17 双功能碳苷糖基转移酶及其应用 Active CN113265433B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN202010096973.5A CN113265433B (zh) 2020-02-17 2020-02-17 双功能碳苷糖基转移酶及其应用
US17/904,131 US20230105024A1 (en) 2020-02-17 2021-02-09 Bifunctional C-Glycoside Glycosyltransferases and Application Thereof
EP21757647.9A EP4108777A4 (en) 2020-02-17 2021-02-09 BIFUNCTIONAL C-GLYCOSIDES GLYCOSYLTRANSFERASES AND THEIR APPLICATION
PCT/CN2021/076398 WO2021164673A1 (zh) 2020-02-17 2021-02-09 双功能碳苷糖基转移酶及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010096973.5A CN113265433B (zh) 2020-02-17 2020-02-17 双功能碳苷糖基转移酶及其应用

Publications (2)

Publication Number Publication Date
CN113265433A CN113265433A (zh) 2021-08-17
CN113265433B true CN113265433B (zh) 2023-12-26

Family

ID=77227651

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010096973.5A Active CN113265433B (zh) 2020-02-17 2020-02-17 双功能碳苷糖基转移酶及其应用

Country Status (4)

Country Link
US (1) US20230105024A1 (zh)
EP (1) EP4108777A4 (zh)
CN (1) CN113265433B (zh)
WO (1) WO2021164673A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112813084B (zh) * 2021-02-26 2022-07-19 云南农业大学 一种假地豆植物中碳糖基转移酶DhCGT1基因及应用
CN112961870B (zh) * 2021-02-26 2022-08-16 云南农业大学 一种假地豆植物中碳糖基转移酶DhCGT2基因及应用
CN114350646B (zh) * 2021-12-22 2023-08-29 北京理工大学 一种UDP-糖差向异构酶PsUGE2及其在合成阿拉伯糖苷中的应用

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008033466A2 (en) * 2006-09-14 2008-03-20 Combinatorx (Singapore) Pre. Ltd. Compositions and methods for treatment of viral diseases
CN103320409A (zh) * 2013-07-08 2013-09-25 中国海洋大学 一种葡萄糖基转移酶及其应用
EP2960330A1 (en) * 2014-06-27 2015-12-30 Technische Universität München Glycosyl transferases and their uses
CN109423486A (zh) * 2017-08-29 2019-03-05 中国科学院上海生命科学研究院 新型udp-糖基转移酶及其应用
CN110790845A (zh) * 2019-08-21 2020-02-14 南京师范大学 一种含硫苷键糖胺聚糖的制备方法及应用

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160005093A (ko) * 2013-05-29 2016-01-13 함부르크대학교 폴리페놀의 글리코실화를 촉매 작용하는 효소
CN109097377B (zh) * 2018-08-31 2021-05-28 西藏自治区农牧科学院农业研究所 一种五碳糖糖基转移酶及其用途

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008033466A2 (en) * 2006-09-14 2008-03-20 Combinatorx (Singapore) Pre. Ltd. Compositions and methods for treatment of viral diseases
CN103320409A (zh) * 2013-07-08 2013-09-25 中国海洋大学 一种葡萄糖基转移酶及其应用
EP2960330A1 (en) * 2014-06-27 2015-12-30 Technische Universität München Glycosyl transferases and their uses
CN109423486A (zh) * 2017-08-29 2019-03-05 中国科学院上海生命科学研究院 新型udp-糖基转移酶及其应用
CN110790845A (zh) * 2019-08-21 2020-02-14 南京师范大学 一种含硫苷键糖胺聚糖的制备方法及应用

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ACCESSION NO:EAZ00582.1,hypothetical protein OsI_22600 [Oryza sativa Indica Group];Genbank Database;《Genbank Database》;20150323;ORIGIN部分 *
Desmodium incanum 根化感物质黄酮碳苷的生物合成与相关糖基转移酶底物专一性研究;郝冰;《中国博士学位论文全文数据库(电子期刊)中国博士学位论文全文数据库(电子期刊)中国博士学位论文全文数据库(电子期刊)中国博士学位论文全文数据库(电子期刊)中国博士学位论文全文数据库(电子期刊)》;20160815;摘要,第71页,图6-4 *

Also Published As

Publication number Publication date
US20230105024A1 (en) 2023-04-06
WO2021164673A1 (zh) 2021-08-26
EP4108777A4 (en) 2024-07-10
EP4108777A1 (en) 2022-12-28
CN113265433A (zh) 2021-08-17

Similar Documents

Publication Publication Date Title
CN113136373B (zh) 碳苷糖基转移酶及其应用
CN113322288B (zh) 新型黄酮羟基化酶、合成黄酮碳苷类化合物的微生物及其应用
CN112080480B (zh) 糖基转移酶突变体及其应用
JP7504946B2 (ja) 一連の糖鎖伸長を触媒するudp-糖転移酵素およびその使用
CN113265433B (zh) 双功能碳苷糖基转移酶及其应用
CN110819600B (zh) 甲基转移酶及其应用
CN109423486B (zh) 新型udp-糖基转移酶及其应用
EP3848462A1 (en) Baicalein- and wild baicalein-synthesizing microorganism, preparation method for same, and applications thereof
CN112553175B (zh) 糖基转移酶ugt76g1突变体的制备及其应用
JP2024528104A (ja) ラムノースの特異性の高い糖転移酵素及びその応用
CN114277024B (zh) 一种新型三萜合酶及其应用
CN109868265B (zh) 新型糖基转移酶及其应用
CN113444703B (zh) 催化糖链延伸的糖基转移酶突变体及其应用
CN113755464B (zh) 一种参与桂叶苷B和毛蕊花糖苷生物合成的LrUGT2蛋白及其编码基因与应用
KR101581185B1 (ko) 대장균에서 페튜니아 유래 당전이효소 PeF3GalGT 유전자를 이용한 퀘세틴-3-O-갈락토사이드의 대량생산 방법
CN111019919B (zh) 用莲类黄酮c-糖基转移酶ugt708n1合成类黄酮c-糖苷的方法
WO2022131130A1 (ja) プレニルフラボノイド配糖化酵素、それをコードするポリヌクレオチド及びプレニルフラボノイド配糖体の製造方法
Nagashima et al. Cloning and characterization of glucosyltransferase cDNA from Eucalyptus perriniana cultured cells
CN118048283A (zh) 一种生产桂叶苷b和毛蕊花糖苷的基因工程菌和其应用
JP2023083908A (ja) 新規カルコン色素およびその製造用の組成物と方法
CN118421660A (zh) 一种催化碳苷合成的圆齿野鸦椿糖基转移酶及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant