CN113136373A - 新型碳苷糖基转移酶及其应用 - Google Patents

新型碳苷糖基转移酶及其应用 Download PDF

Info

Publication number
CN113136373A
CN113136373A CN202010066924.7A CN202010066924A CN113136373A CN 113136373 A CN113136373 A CN 113136373A CN 202010066924 A CN202010066924 A CN 202010066924A CN 113136373 A CN113136373 A CN 113136373A
Authority
CN
China
Prior art keywords
ala
val
leu
gly
ser
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010066924.7A
Other languages
English (en)
Other versions
CN113136373B (zh
Inventor
王勇
孙雨伟
陈卓
张前
张英
刘海利
李建华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Center for Excellence in Molecular Plant Sciences of CAS
Original Assignee
Center for Excellence in Molecular Plant Sciences of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Center for Excellence in Molecular Plant Sciences of CAS filed Critical Center for Excellence in Molecular Plant Sciences of CAS
Priority to CN202010066924.7A priority Critical patent/CN113136373B/zh
Priority to US17/793,676 priority patent/US20230066984A1/en
Priority to EP20915832.8A priority patent/EP4095145A4/en
Priority to PCT/CN2020/136886 priority patent/WO2021147575A1/zh
Publication of CN113136373A publication Critical patent/CN113136373A/zh
Application granted granted Critical
Publication of CN113136373B publication Critical patent/CN113136373B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H15/00Compounds containing hydrocarbon or substituted hydrocarbon radicals directly attached to hetero atoms of saccharide radicals
    • C07H15/20Carbocyclic rings
    • C07H15/203Monocyclic carbocyclic rings other than cyclohexane rings; Bicyclic carbocyclic ring systems
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/04Alpha- or beta- amino acids
    • C12P13/22Tryptophan; Tyrosine; Phenylalanine; 3,4-Dihydroxyphenylalanine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/02Oxygen as only ring hetero atoms
    • C12P17/06Oxygen as only ring hetero atoms containing a six-membered hetero ring, e.g. fluorescein
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/18Preparation of compounds containing saccharide radicals produced by the action of a glycosyl transferase, e.g. alpha-, beta- or gamma-cyclodextrins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • C12P19/28N-glycosides
    • C12P19/30Nucleotides
    • C12P19/32Nucleotides having a condensed ring system containing a six-membered ring having two N-atoms in the same ring, e.g. purine nucleotides, nicotineamide-adenine dinucleotide
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/44Preparation of O-glycosides, e.g. glucosides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/24Preparation of oxygen-containing organic compounds containing a carbonyl group
    • C12P7/26Ketones
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y114/00Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
    • C12Y114/11Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with 2-oxoglutarate as one donor, and incorporation of one atom each of oxygen into both donors (1.14.11)
    • C12Y114/11009Flavanone 3-dioxygenase (1.14.11.9), i.e. naringenin-3-dioxygenase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y114/00Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
    • C12Y114/14Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with reduced flavin or flavoprotein as one donor, and incorporation of one atom of oxygen (1.14.14)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y203/00Acyltransferases (2.3)
    • C12Y203/01Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
    • C12Y203/01074Naringenin-chalcone synthase (2.3.1.74), i.e. chalcone synthase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y403/00Carbon-nitrogen lyases (4.3)
    • C12Y403/01Ammonia-lyases (4.3.1)
    • C12Y403/01005Phenylalanine ammonia-lyase (4.3.1.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y403/00Carbon-nitrogen lyases (4.3)
    • C12Y403/01Ammonia-lyases (4.3.1)
    • C12Y403/01023Tyrosine ammonia-lyase (4.3.1.23)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y505/00Intramolecular lyases (5.5)
    • C12Y505/01Intramolecular lyases (5.5.1)
    • C12Y505/01006Chalcone isomerase (5.5.1.6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y602/00Ligases forming carbon-sulfur bonds (6.2)
    • C12Y602/01Acid-Thiol Ligases (6.2.1)
    • C12Y602/010124-Coumarate-CoA ligase (6.2.1.12)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明提供了一组新型的尿苷二磷酸(UDP)‑糖基转移酶,其是碳苷糖基转移酶。所述的糖基转移酶能够特异和高效地催化二氢查尔酮(类)化合物或2‑羟基黄烷酮(类)化合物的碳苷葡萄糖基化,从而产生一类碳苷二氢查尔酮(类)化合物或碳苷‑2‑羟基黄烷酮(类)化合物;碳苷‑2‑羟基黄烷酮(类)化合物通过进一步的脱水反应形成黄酮碳苷(类)化合物。本发明还涉及将这些新型UDP糖基转移酶应用于人工构建的重组表达系统,通过发酵工程生产碳苷二氢查尔酮(类)化合物或黄酮碳苷(类)化合物。

Description

新型碳苷糖基转移酶及其应用
技术领域
本发明属于合成生物学领域,更具体地,本发明涉及新型碳苷糖基转移酶及其应用。
背景技术
黄酮化合物是以C6-C3-C6为结构母核的一类多酚羟基类化合物,根据母核结构及官能基取代的不同,可以分为黄酮、黄酮醇、黄烷酮、花青素、查尔酮等。黄酮类化合物在于植物体内常以糖苷的形式存在,这样的糖基化修饰主要由尿苷二磷酸(UDP)-糖基转移酶(UGT)催化发生。糖基与苷元母核直接以C-C键的方式连接的黄酮苷类化合物被称为黄酮碳苷。
黄酮碳苷(类)化合物具有多种多样的药理活性,根据报道,黄酮碳苷(类)化合物具有显著的抗氧化作用,可以显著性抑制外源性以及内源性自由基;同时,其具有一定程度抑制细菌病毒的作用;黄酮碳苷(类)化合物可以显著性地降低血液中总胆固醇的含量,具有治疗心脑血管疾病的药物活性;同时黄酮碳苷(类)化合物具有显著性抗辐射以及神经保护的作用;有调查表明黄酮碳苷(类)化合物具有相关抗代谢疾病的作用,对于糖尿病、肥胖等疾病均具有一定的治疗效果。
但是,黄酮碳苷(类)化合物相对于氧苷类化合物而言是更为稀有的,迄今为止从自然界中分离到的黄酮碳苷仅有几十种。并且,本领域中目前基本上只能通过从自然界分离黄酮碳苷(类)化合物,大规模低成本的生物合成或人工合成等方面的生产工艺均需要进一步研究和开发。
发明内容
本发明的目的在于提供新型碳苷糖基转移酶及其应用。
在本发明的第一方面,提供一种催化二氢查尔酮(类)化合物或2-羟基黄烷酮(类)化合物生成碳苷二氢查尔酮(类)化合物或碳苷-2-羟基黄烷酮(类)化合物的方法,包括:以糖基转移酶进行所述催化;所述的糖基转移酶为选自SEQ ID NO:1~20任一所述的多肽或其保守性序列变体。
在一个优选例中,所述二氢查尔酮(类)化合物具有式(I)的母核结构,所述2-羟基黄烷酮(类)化合物(较佳地为开环形式)具有式(II)的母核结构,所述碳苷二氢查尔酮(类)化合物具有式(III)的母核结构,或所述碳苷-2-羟基黄烷酮(类)化合物(较佳地为开环形式)具有式(IV)的母核结构:
Figure BDA0002376251420000021
其中,R为糖基,其与A环以碳碳键连接。
在另一优选例中,A环或B环中,存在1~3个羟基;较佳地,A环中,羟基存在于第2’、4’和/或6’位;较佳地,B环中,羟基出现在第4位。
在另一优选例中,R在A环上的数量为1个,较佳地其存在于第3’位。
在另一优选例中,R在A环上的数量为2个,较佳地其存在于第3’和5’位;且,所述的糖基转移酶为选自SEQ ID NO:6,8,10,17,19或20所述的多肽或其保守性序列变体。
在另一优选例中,所述的二氢查尔酮(类)化合物或2-羟基黄烷酮(类)化合物(较佳地为开环形式)包括(但不限于):根皮素,2-羟基柚皮素(较佳地为开环形式),2-羟基柚皮素(较佳地为开环形式),2-羟基圣草酚。
在另一优选例中,所述的碳苷二氢查尔酮(类)化合物或碳苷-2-羟基黄烷酮(类)化合物包括(但不限于):Nothofagin,根皮素-3’,5’-C-葡萄糖双碳苷,2-羟基柚皮素-6-C(8-C)-葡萄糖苷,2-羟基圣草酚-6-C(8-C)-葡萄糖苷。
在另一优选例中,所述的保守性变异多肽选自:(1)由SEQ ID NO:1~20任一所示序列的多肽经过一个或多个(如1-20个,较佳地1-10个;更佳地1-5个;更佳地1-3个)氨基酸残基的取代、缺失或添加而形成的,且具有催化二氢查尔酮(类)化合物或2-羟基黄烷酮(类)化合物生成碳苷二氢查尔酮(类)化合物或碳苷-2-羟基黄烷酮(类)化合物功能的多肽;(2)氨基酸序列与SEQ ID NO:1~20任一所示序列的多肽有80%以上(较佳地85%以上;更佳地90%以上;更佳地95%以上;更佳地99%以上)相同性,且具有催化二氢查尔酮(类)化合物或-羟基黄烷酮(类)化合物生成碳苷二氢查尔酮(类)化合物或碳苷-2-羟基黄烷酮(类)化合物功能的多肽;或(3)在SEQ ID NO:1~20任一所示序列的多肽的N或C末端添加标签序列,或在其N末端添加信号肽序列后形成的多肽。
在本发明的另一方面,提供糖基转移酶的用途,用于催化二氢查尔酮(类)化合物或2-羟基黄烷酮(类)化合物生成碳苷二氢查尔酮(类)化合物或碳苷-2-羟基黄烷酮(类)化合物;其中,所述的糖基转移酶为选自SEQ ID NO:1~20任一所示的多肽或其保守性变异多肽。
在一个优选例中,所述的二氢查尔酮(类)化合物具有式(I)的母核结构,所述2-羟基黄烷酮(类)化合物(较佳地为开环形式)具有式(II)的母核结构,所述碳苷二氢查尔酮(类)化合物具有式(III)的母核结构,或所述碳苷-2-羟基黄烷酮(类)化合物(较佳地为开环形式)具有式(IV)的母核结构:
Figure BDA0002376251420000031
其中,R为糖基,其与A环以碳碳键连接。
在另一优选例中,A环或B环中,存在1~3个羟基;较佳地,A环中,羟基存在于第2’、4’和/或6’位;较佳地,B环中,羟基出现在第4位。
在另一优选例中,R在A环上的数量为1个,较佳地其存在于3’位置。
在另一优选例中,R在A环上的数量为2个,较佳地其存在于第3’和5’位;且,所述的糖基转移酶为选自SEQ ID NO:6,8,10,17,19或20所示的多肽或其保守性变异多肽。
在另一优选例中,R为单糖基。
在另一优选例中,所述的糖基为葡萄糖;较佳地,在利用所述糖基转移酶进行糖基转移时,以携带葡萄糖基团的化合物作为供体;更佳地,以UDP葡萄糖作为糖基供体。
在另一优选例中,所述二氢查尔酮(类)化合物或2-羟基黄烷酮(类)化合物包括(但不限于):根皮素,2-羟基柚皮素(较佳地为开环形式),2-羟基圣草酚(较佳地为开环形式)。
在另一优选例中,所述碳苷二氢查尔酮(类)化合物或碳苷-2-羟基黄烷酮(类)化合物包括(但不限于):Nothofagin,根皮素-3’,5’-C-葡萄糖碳苷,2-羟基柚皮素-6-C(8-C)-葡萄糖苷,2-羟基圣草酚-6-C(8-C)-葡萄糖苷。
在本发明的另一方面,提供一种合成(包括人工合成或体外合成)黄酮碳苷(类)化合物的方法,包括:(1)将2-羟基黄烷酮(类)化合物以糖基转移酶催化,产生碳苷-2-羟基黄烷酮(类)化合物;其中,所述的糖基转移酶为选自SEQ ID NO:1~20任一所述的多肽或其保守性序列变体;(2)将(1)的碳苷-2-羟基黄烷酮(类)化合物脱水,获得黄酮碳苷(类)化合物。
在一个优选例中,在(1)之前,还包括:(c)将黄烷酮(类)化合物通过黄烷酮-2-羟化酶(F2H)催化,获得2-羟基黄烷酮(类)化合物。
在另一优选例中,在(c)之前,还包括:(b)将丙二酰-CoA结构类似物(如包括其经1或多基团的取代形式)与p-香豆酰-CoA结构类似物(如包括其经1或多基团的取代形式)经查尔酮合成酶(CHS)和查尔酮异构酶(CHI)催化,获得黄烷酮(类)化合物。
在另一优选例中,在(b)之前,还包括:(a)将芳香族氨基酸经酪氨酸解氨酶(TAL)或苯丙氨酸解氨酶(PAL)和4-香豆酰-CoA连接酶(4CL)催化,获得p-香豆酰-CoA结构类似物。
在另一优选例中,所述的黄烷酮(类)化合物包括:柚皮素,圣草酚;所述的丙二酰-CoA结构类似物包括:丙二酰-CoA或甲基丙二酰-CoA;所述的p-香豆酰-CoA结构类似物包括:p-香豆酰-CoA或p-肉桂酰-CoA;所述的芳香族氨基酸包括:L-酪氨酸或L-苯丙氨酸。
在另一优选例中,所述的2-羟基黄烷酮(类)化合物为2-羟基柚皮素,其是从柚皮素通过黄烷酮-2-羟化酶(F2H)催化获得;或所述2-羟基黄烷酮(类)化合物为2-羟基圣草酚,其是从圣草酚通过黄烷酮-2-羟化酶(F2H)催化获得;较佳地,所述圣草酚是从柚皮素通过黄烷酮-3’-羟化酶(F3’H)催化获得。
在本发明的另一方面,提供一种生物合成黄酮碳苷(类)化合物的方法,包括:(i)将合成柚皮素(类)化合物的前体基因、编码黄烷酮-2-羟化酶和/或黄烷酮-3’-羟化酶的基因以及编码糖基转移酶的基因共转入宿主细胞中;其中,所述的糖基转移酶为选自SEQ IDNO:1~20任一所述的多肽或其保守性序列变体;(ii)培养(i)的细胞,从而生物合成黄酮碳苷(类)化合物。
在一个优选例中,所述的黄烷酮-2-羟化酶和黄烷酮-3’-羟化酶为截去N端跨膜区域的P450氧化酶;较佳地,在截去N端跨膜区域后,还包括添加标签;更佳地,所述标签包括(但不限于):2B1,17α,MBP。
在本发明的另一方面,提供一种遗传工程化的细胞,其中包括:合成柚皮素化合物的前体基因、编码黄烷酮-2-羟化酶和/或黄烷酮-3’-羟化酶的基因以及编码糖基转移酶的基因;其中,所述的糖基转移酶为选自SEQ ID NO:1~20任一所述的多肽或其保守性序列变体。
在本发明的另一方面,提供制备所述的遗传工程化的细胞的方法,包括:将合成柚皮素化合物的前体基因、编码黄烷酮-2-羟化酶和/或黄烷酮-3’-羟化酶的基因以及编码糖基转移酶的基因共转入宿主细胞中;其中,所述的糖基转移酶为选自SEQ ID NO:1~20任一所述的多肽或其保守性序列变体。
在本发明的另一方面,提供一种用于生物合成黄酮碳苷(类)化合物或其中间体的试剂盒,其中包括:SEQ ID NO:1~20所示的一条或多条(如2、3、4条)多肽或其保守性变异多肽;黄烷酮-2-羟化酶和/或黄烷酮-3’-羟化酶;合成柚皮素(类)化合物的前体基因;较佳地还包括宿主细胞。
在另一优选例中,所述的细胞包括:原核细胞或真核细胞;较佳地,所述原核宿主细胞包括大肠杆菌,酵母,链霉菌。
在另一优选例中,所述的黄酮碳苷(类)化合物包括(但不限于):牡荆素,异牡荆素,荭草苷,异荭草苷,维采宁-2(新西兰牡荆素,vicenin-2),光牡荆素(lucenin 2)。
本发明的其它方面由于本文的公开内容,对本领域的技术人员而言是显而易见的。
附图说明
图1、应用HPLC进行碳苷糖基转移酶的体外功能鉴定;(A)以根皮素为底物;(B)以2-羟基柚皮素为底物。
图2、Nothofagin的负离子模式高分辨二级质谱图谱。
图3、Nothofagin的(A)1H,(B)13C和(C)二维HMBC核磁图谱。
图4、2-羟基柚皮素-C-葡萄糖苷的二级质谱图谱。
图5、PhCGT1和PgCGT1对底物2-羟基柚皮素的米氏方程曲线。
图6、二氢查尔酮双碳苷(根皮素-3’,5’-C-双葡萄糖苷)的负离子模式高分辨质谱检测结果图。
图7、(A)pYH055合成柚皮素基因表达盒示意图;(B)pCZ201、pCZ203和pCZ229携带P450/CPR表达盒示意图。
图8、pCZ261、pCZ265携带双元P450/CPR表达盒示意图。
图9、牡荆素、异牡荆素生产菌株sCZ2、sCZ4和sCZ29发酵液的LC-MS分析结果。
图10、荭草苷、异荭草苷生产菌株sCZ63和sCZ67发酵液的LC-MS分析结果。
图11、黄酮-单葡萄糖碳苷的预期的生物合成途径。
图12、维采宁-2(芹菜素-6,8-双葡萄糖苷)的预测的生物合成途径。
图13、HPLC、LC-MS检测维采宁-2生产菌株发酵产物的成分
具体实施方式
本发明人经过深入的研究,筛选出一组新型的尿苷二磷酸(UDP)-糖基转移酶,其是碳苷糖基转移酶。所述的糖基转移酶能够特异和高效地催化二氢查尔酮(类)化合物或2-羟基黄烷酮(类)化合物的碳苷葡萄糖基化,从而产生一类碳苷二氢查尔酮(类)化合物或碳苷-2-羟基黄烷酮(类)化合物;碳苷-2-羟基黄烷酮(类)化合物通过进一步的脱水反应形成黄酮碳苷(类)化合物。本发明还涉及将这些新型UDP糖基转移酶应用于人工构建的重组表达系统,通过发酵工程生产碳苷二氢查尔酮(类)化合物或黄酮碳苷(类)化合物。
活性多肽、其编码基因、载体及宿主
本发明人通过挖掘基因组以及转录组信息,结合大量的研究和实验工作,揭示了一组新的尿苷二磷酸(UDP)-糖基转移酶,其是碳苷糖基转移酶(C-glycosyltransferase,CGT)。较佳地,该组碳苷糖基转移酶来源于单子叶禾本科植物;更佳地,包括来自于毛竹(Phyllostachys edulis(或称Phyllostachys heterocycla);Ph)、淡竹(Phyllostachysglauca;Pg)、高节竹(Phyllostachys prominens;Pp)、粳稻(Oryza Sativa japonica;Os)、玉米(Zea mays;Zm)、小麦(Triticum aestivum;Ta)、高粱(Sorghum bicolor;Sb)、二穗短柄草(Brachypodium distachyon;Bd)、谷子(Setaria italica;Si)。
作为本发明的优选方式,所述碳苷糖基转移酶包括选自下组的糖基转移酶:PhCGT1(SEQ ID NO:1)、PgCGT1(SEQ ID NO:2)、PpCGT1(SEQ ID NO:3)、PhCGT2(SEQ ID NO:4)、OsCGT2(SEQ ID NO:5)、SbCGT1(SEQ ID NO:6)、SbCGT2(SEQ ID NO:7)、TaCGT1-A(SEQID NO:8)、TaCGT1-B(SEQ ID NO:9)、TaCGT1-D(SEQ ID NO:10)、TaCGT2-A(SEQ ID NO:11)、TaCGT2-B(SEQ ID NO:12)、TaCGT2-D(SEQ ID NO:13)、ZmCGT4(SEQ ID NO:14)、ZmCGT5(SEQID NO:15)、BdCGT1(SEQ ID NO:16)、SiCGT1(SEQ ID NO:17)、SiCGT2(SEQ ID NO:18)、OsCGT(SEQ ID NO:19)、ZmCGT(SEQ ID NO:20)。
本发明也包括所述碳苷糖基转移酶的保守性变异多肽,本发明也包括所述黄烷酮-2-羟化酶、查尔酮合成酶、查尔酮异构酶、酪氨酸解氨酶、苯丙氨酸解氨酶、4-香豆酰-CoA连接酶等的保守性变异多肽。本发明中,所述的“保守性变异多肽”是指基本上保持所述多肽相同的生物学功能或活性的多肽。所述的“保守性变异多肽”可以是(i)有一个或多个保守或非保守性氨基酸残基(优选保守性氨基酸残基)被取代的多肽,而这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的,或(ii)在一个或多个氨基酸残基中具有取代基团的多肽,或(iii)成熟多肽与另一个化合物(比如延长多肽半衰期的化合物,例如聚乙二醇)融合所形成的多肽,或(iv)附加的氨基酸序列融合到此多肽序列而形成的多肽(如前导序列或分泌序列或用来纯化此多肽的序列或蛋白原序列,或与抗原IgG片段的形成的融合蛋白)。根据本文的教导,这些片段、衍生物和类似物属于本领域熟练技术人员公知的范围。
所述的“保守性变异多肽”可以包括(但并不限于):一个或多个(通常为1-50个,较佳地1-30个,更佳地1-20个,最佳地1-10个)氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加或缺失一个或数个(如50个以内,较20个或10个以内,更佳地为5个以内)氨基酸。例如,在本领域中,用性能相近或相似的氨基酸进行取代时,通常不会改变蛋白质的功能。又比如,在C末端和/或N末端添加一个或数个氨基酸通常也不会改变蛋白质的功能。本发明还提供所述多肽的类似物。这些类似物与天然多肽的差别可以是氨基酸序列上的差异,也可以是不影响序列的修饰形式上的差异,或者兼而有之。这些多肽包括天然或诱导的遗传变异体。诱导变异体可以通过各种技术得到,如通过辐射或暴露于诱变剂而产生随机诱变,还可通过定点诱变法或其他已知分子生物学的技术。类似物还包括具有不同于天然L-氨基酸的残基(如D-氨基酸)的类似物,以及具有非天然存在的或合成的氨基酸(如β、γ-氨基酸)的类似物。应理解,本发明的多肽并不限于上述例举的代表性的多肽。
作为本发明的优选方式,本发明涉及到的P450氧化酶(黄烷酮-2-羟化酶和黄烷酮-3’-羟化酶)是去除了N端的跨膜区的多肽片段,可使得截短后蛋白的可溶性表达增加,当被应用于生物合成途径中时,发挥更好的活性。
本发明的碳苷糖基转移酶的氨基端或羧基端还可含有一个或多个多肽片段,作为蛋白标签。例如,所述的标签可以是FLAG、HA、HA1、c-Myc、Poly-His、Poly-Arg、Strep-TagII、AU1、EE、T7、4A6、ε、B、gE、以及Ty1。又例如,所述的标签可以包括2B,17α,MBP等。
当出于生产本发明的碳苷糖基转移酶的目的时,为了使翻译的蛋白分泌表达(如分泌到细胞外),还可在本发明的多肽的氨基端添加上信号肽序列。信号肽在多肽从细胞内分泌出来的过程中可被切去。
本发明的活性多肽可以是重组多肽、天然多肽、合成多肽。本发明的多肽可以是天然纯化的产物,或是化学合成的产物,或使用重组技术从原核或真核宿主(例如,细菌、酵母、高等植物)中产生。根据重组生产方案所用的宿主,本发明的多肽可以是糖基化的,或可以是非糖基化的。本发明的多肽还可包括或不包括起始的甲硫氨酸残基。
编码本发明的碳苷糖基转移酶的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。术语“编码多肽的多核苷酸”可以是包括编码此多肽的多核苷酸,也可以是还包括附加编码和/或非编码序列的多核苷酸。
本发明也涉及包含本发明的多核苷酸的载体,以及用本发明的载体或多肽编码序列经基因工程产生的宿主细胞,以及经重组技术产生本发明所述多肽的方法。
通过常规的重组DNA技术,可表达或生产重组的多肽。一般来说有以下步骤:(1).用编码所述多肽(含其保守性变异多肽)的多核苷酸,或用含有该多核苷酸的重组表达载体转化或转导合适的宿主细胞;(2).在合适的培养基中培养的宿主细胞;(3).从培养基或细胞中分离、纯化蛋白质。
本发明中,编码所述多肽的多核苷酸序列可插入到重组表达载体中。术语“重组表达载体”指本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒如腺病毒、逆转录病毒或其他载体。只要能在宿主体内复制和稳定,任何质粒和载体都可以用。表达载体的一个重要特征是通常含有复制起点、启动子、标记基因和翻译控制元件。较佳地,所述表达载体可以是原核表达载体。
本领域的技术人员熟知的方法能用于构建含本发明的碳苷糖基转移酶的多核苷酸和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等。所述的DNA序列可有效连接到表达载体中的适当启动子上,以指导mRNA合成。此外,表达载体优选地包含一个或多个选择性标记基因,以提供用于选择转化的宿主细胞的表型性状。
包含上述的适当DNA序列以及适当启动子或者控制序列的载体,可以用于转化适当的宿主细胞,以使其能够表达蛋白质。宿主细胞可以是原核细胞,如细菌细胞;或是低等真核细胞,如酵母细胞;或是高等真核细胞,如哺乳动物细胞。代表性例子有:大肠杆菌,链霉菌属,枯草杆菌;鼠伤寒沙门氏菌的细菌细胞;真菌细胞如酵母,植物细胞,灵芝细胞;果蝇S2或Sf9的昆虫细胞;CHO、COS、293细胞、或Bowes黑素瘤细胞的动物细胞等。
本发明也提供了用于生物合成黄酮碳苷(类)化合物或其中间体的宿主细胞,其中包括:合成柚皮素化合物的前体基因、编码黄烷酮-2-羟化酶和/或黄烷酮-3’-羟化酶的基因以及本发明所述的编码糖基转移酶的基因。
在本发明的优选方式中,所述的宿主细胞为原核细胞,更佳地为大肠杆菌,酵母,链霉菌。但是应理解,细胞宿主仅是一种生产工具,本领域技术人员可以通过一些技术手段对大肠杆菌以外的其他宿主细胞进行改造,从而也实现如本发明的生物合成,由此构成的宿主细胞以及生产方法也应包含在本发明中。
应用及生产工艺
本发明的碳苷糖基转移酶或它们的保守性变异多肽,可应用于特异和高效地催化二氢查尔酮(类)化合物或2-羟基黄烷酮(类)化合物的碳苷葡萄糖基化,从而产生一类碳苷二氢查尔酮(类)化合物或碳苷-2-羟基黄烷酮(类)化合物;碳苷-2-羟基黄烷酮(类)化合物通过进一步的脱水反应形成黄酮碳苷(类)化合物。
因此,本发明提供了糖基转移酶的用途,用于催化二氢查尔酮(类)化合物或2-羟基黄烷酮(类)化合物生成碳苷二氢查尔酮(类)化合物或碳苷-2-羟基黄烷酮(类)化合物;其中,所述的糖基转移酶为选自SEQ ID NO:1~20任一所示的多肽或其保守性变异多肽。
如本发明所用,所述的二氢查尔酮(类)化合物包括二氢查尔酮或其衍生物、结构类似物、异构体。所述的2-羟基黄烷酮(类)化合物包括2-羟基黄烷酮或其衍生物、结构类似物、异构体。所述的碳苷二氢查尔酮(类)化合物包括碳苷二氢查尔酮或其衍生物、结构类似物、异构体。所述碳苷-2-羟基黄烷酮(类)化合物包括碳苷-2-羟基黄烷酮或其衍生物、结构类似物、异构体。所述黄酮碳苷(类)化合物包括黄酮碳苷或其衍生物、结构类似物、异构体。
在本发明的优选方式中,所述的二氢查尔酮具有式(I)的母核结构、2-羟基黄烷酮(类)化合物(开环形式)具有式(II)的母核结构,所述碳苷二氢查尔酮类化合物具有式(III)的母核结构,碳苷-2-羟基黄烷酮(类)化合物(开环形式)具有式(IV)的母核结构:
Figure BDA0002376251420000091
其中,R为糖基,其与A环以碳碳键连接。所述的糖基可以是单糖、二糖或多糖基(如3个或以上(如3~10个,更具体如4、5、6、7、8、10个)单糖串联)。在优选的方式中,所述的糖基为单糖基。
在本发明的优选方式中,A环或B环中,存在1~3个羟基;较佳地,A环中,羟基存在于第2’、4’和/或6’位;较佳地,B环中,羟基出现在第4位置。
在本发明的优选方式中,R在A环上的数量为1个,较佳地其存在于第3’位;或R在A环上的数量为2个,较佳地其存在于第3’和5’位;且,所述的糖基转移酶为选自SEQ ID NO:6,8,10,17,19或20所示的多肽或其保守性变异多肽。
在本发明的优选方式中,所述的二氢查尔酮(类)化合物或2-羟基黄烷酮(类)化合物包括:根皮素,2-羟基柚皮素(开环形式),2-羟基柚皮素(开环形式),2-羟基圣草酚;和/或所述的碳苷二氢查尔酮(类)化合物或碳苷-2-羟基黄烷酮(类)化合物包括:Nothofagin,根皮素-3”,5”-C-葡萄糖碳苷,2-羟基柚皮素-6-C(8-C)-葡萄糖苷,2-羟基圣草酚-6-C(8-C)-葡萄糖苷。此外,它们的类似物或基团被取代的变体形式也应被包含在内。
本发明中优选地以UDP葡萄糖作为糖基供体,应理解,其它的携带葡萄糖基团的化合物也是可以作为供体的,也应被包含在本发明中。
本发明也提供了催化二氢查尔酮(类)化合物或2-羟基黄烷酮(类)化合物生成碳苷二氢查尔酮(类)化合物或碳苷-2-羟基黄烷酮(类)化合物的方法,包括:以糖基转移酶进行所述催化;所述的糖基转移酶为选自SEQ ID NO:1~20任一所述的多肽或其保守性序列变体。
本发明也提供了合成黄酮碳苷(类)化合物的方法,包括:(1)将2-羟基黄烷酮(类)化合物以糖基转移酶催化,产生碳苷-2-羟基黄烷酮(类)化合物;其中,所述的糖基转移酶为选自SEQ ID NO:1~20任一所述的多肽或其保守性序列变体;(2)将(1)的碳苷-2-羟基黄烷酮(类)化合物脱水,获得黄酮碳苷(类)化合物。较佳地,在(1)之前还包括:(c)将黄酮类化合物通过黄烷酮-2-羟化酶(F2H)催化,获得2-羟基黄烷酮(类)化合物。更佳地,在(c)之前,还包括:(b)将丙二酰-CoA类化合物(如包括其经1或多基团的取代形式)与p-香豆酰-CoA类化合物(如包括其经1或多基团的取代形式)经查尔酮合成酶(CHS)和查尔酮异构酶(CHI)催化,获得黄酮类化合物。进一步更佳地,在(b)之前还包括:(a)将L-酪氨酸类化合物(如包括其经1或多基团的取代形式)经酪氨酸解氨酶(TAL)和4-香豆酰-辅酶A连接酶(4CL)催化,获得p-香豆酰-CoA类化合物。
在本发明的优选方式中,所述的黄酮类化合物包括:柚皮素,圣草酚;所述的丙二酰-CoA类化合物包括:丙二酰-CoA,甲基丙二酰-CoA;所述的p-香豆酰-CoA类化合物包括:p-香豆酰-CoA,p-肉桂酰-CoA;所述的L-酪氨酸类化合物包括:L-酪氨酸,L-苯丙氨酸。应理解,根据本发明的整体描述,它们的类似物或变异形式也可应用于本发明中。
在本发明的优选方式中,所述的2-羟基黄烷酮(类)化合物为2-羟基柚皮素,其是从柚皮素通过黄烷酮-2-羟化酶(F2H)催化获得;或所述2-羟基黄烷酮(类)化合物为2-羟基圣草酚,其是从圣草酚通过黄烷酮-2-羟化酶(F2H)催化获得;较佳地,所述圣草酚是从柚皮素通过黄烷酮-3’-羟化酶(F3’H)催化获得。应理解,根据本发明的整体描述,它们的类似物或变异形式也可应用于本发明中。
本发明也提供了生物合成黄酮碳苷(类)化合物的方法,包括:(i)将合成柚皮素类化合物的前体基因、编码黄烷酮-2-羟化酶和/或黄烷酮-3’-羟化酶的基因以及编码糖基转移酶的基因共转入宿主细胞中;其中,所述的糖基转移酶为选自SEQ ID NO:1~20任一所述的多肽或其保守性序列变体;(ii)培养(i)的细胞,从而生物合成黄酮碳苷(类)化合物。
在本发明的具体实施例中,这些碳苷糖基转移酶的N端或/和C端连接标签得到的融合蛋白及其衍生多肽,能够特异和高效地催化二氢查尔酮(类)化合物或2-羟基黄烷酮(类)化合物的3’位置进行C-葡萄糖糖基化,其中,PhCGT1具有更优于之前所报道类似碳苷糖基转移酶的活性,而SbCGT1、TaCGT1-A、TaCGT1-D、SiCGT1、OsCGT和ZmCGT不仅可以催化查尔酮类化合物3’位C-糖基化,更可以对3’位已被糖基化的二氢查尔酮(类)化合物或2-羟基黄烷酮(类)化合物进行进一步5’位C-糖基化,从而产生双碳苷二氢查尔酮(类)化合物或双碳苷-2-羟基黄烷酮。单碳苷或双碳苷-2-羟基黄烷酮(类)化合物可以通过非酶化的脱水缩合反应生成单碳苷或双黄酮碳苷(类)化合物。另一方面本发明通过生物工程技术,将这些新型CGT应用于人工构建的重组大肠杆菌系统,该重组微生物能够生产碳苷二氢查尔酮和黄酮碳苷(类)化合物。
相对于传统的植物提取手段,微生物发酵具有速度快、受外界因素影响较小等优势;部分化合物通过微生物合成的产量远高于植物提取,已经成为天然产物获得的一种重要手段。黄酮碳苷(类)化合物天然丰度低,并且在植物提取物中与大量结构类似的黄酮氧苷、苯丙素类化合物共存,使得分离纯化繁琐复杂。本发明中使用微生物发酵的方式来高效、定向得合成黄酮碳苷,极为有效地降低了分离纯化这类化合物的成本。
本发明也提供了用于生物合成黄酮碳苷(类)化合物或其中间体的试剂盒,其中包括:SEQ ID NO:1~20所示的一条或多条多肽或其保守性变异多肽;黄烷酮-2-羟化酶和/或黄烷酮-3’-羟化酶;合成柚皮素类化合物的前体基因;较佳地还包括宿主细胞。更佳地,所述试剂盒中还包括说明进行生物合成的方法的使用说明书。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如J.萨姆布鲁克等编著,分子克隆实验指南,第三版,科学出版社,2002中所述的条件,或按照制造厂商所建议的条件。
试剂材料
毛竹、淡竹与高节竹采自上海辰山植物园。
粳稻、高粱、玉米、小麦、谷子、二穗短柄草种植于中国科学院上海分子植物研究中心温室。
植物基因组DNA提取使用TIANGEN植物基因组提取试剂盒。
AxyPrep总RNA小量制备试剂盒,多聚酶链式反应(PCR)胶回收试剂盒,质粒抽提试剂盒均为美国Axygen产品。
聚合酶链式反应(PCR)高保真酶PrimeSTAR Max DNA Polymerase为日本宝生物公司(TAKARA)产品。
限制性内切酶、T4连接酶为NEB产品。
无缝克隆试剂盒购自诺唯赞生物科技有限公司。
大肠杆菌DH10B、Rosetta(DE3)菌株和pET21a、pET28a载体用于基因克隆及蛋白表达。
标准品化合物柚皮素、2-羟基柚皮素、根皮素、荭草苷、异荭草苷、牡荆素、异牡荆素购自大连美仑生物技术有限公司。
UDP葡萄糖购自北京中泰生物有限公司。
其他试剂为国产分析纯或色谱纯试剂,购自国药集团化学试剂有限公司。
实施例1、新型尿苷二磷酸(UDP)-糖基转移酶
1.碳苷糖基转移酶基因克隆和表达质粒构建
取禾本科植物(粳稻、玉米、小麦、高粱、谷子、二穗短柄草、毛竹、淡竹、高节竹)成熟叶片或幼苗,清水清洗干净表面污渍,用吸水纸轻轻擦拭干叶片表面水渍,称重备用。基因组DNA的提取依照TIANGEN植物基因组提取试剂盒提供的说明书进行。
所述的碳苷糖基转移酶的氨基酸序列如下:
>PhCGT1(SEQ ID NO:1)
MPTSGGRTGDRPHVILLPSAGMGHLVPFSRLAVALSSGHGCDVSVVAVLPTVSAAESRHLQGLLDASPAVRRLDLHLAPFDESEFPGADPFFLRFEAMRRSAPLLGPLLADTGASALVTDIALASVVIPVAKEIHLPCYVLFTASAAMLSFCAYFPTYLDTNAGRVVGDVDIPGVYRIPKASIPQALHDPNHLFTRQFVANGQDLAKADGVLVNTFDALELEAVTALRQGSVAAGFPPVFSVGPLVTVNLPAGEAAKESGNDYMYWLDAQPAQSVVYVSFGSRKAISRDQVRELAIGLEASGQPFLWVVKSTVVDRDDSAELSELLGEGFLERVQGQGFVTKAWVEQEEVLKHESIGLFISHCGWNSVTEAAASGVPVLAWPRFGDQRVNAGVVARGGLGVWVERWSWEGEEDVVSGEEIAEKVKAVMADETVRKKAASVGEAAVKEFADGGTSYRSLTEFVRRCRDLAVLD*
>PgCGT1(SEQ ID NO:2)
MPTSGSRTGGRPHVILLPSAGMGHLVPFSRLAVALSSGHGCDVSVVAVLPTVSAAESRHLQGLLDASPAVRRLDLHLAPFDESEFPGADPFFLRFEAMRRSAPLLGPLLADTGASALVTDIALASVVIPVAKEIHLPCYVLFTASAAMLSFCAYFPTYLDTNAGRVVGDVDIPGVYRIPKASIPQALHDPNHLFTRQFVANGQDLAKADGVLVNTFDALELEAVTALRQGSVAAGFPPVFSVGPLVTVNLPAGEAAKESGNDYMYWLDAQPARSVVYVSFGSRKAISRNQVRELAVGLEASGQRFLWVVKSTVVDRDDSAELSELLDEGFLERVQGRGLVTKAWVEQEEVLKHESIGLFISHCGWNSVTEAAASGVPVLAWPRFGDQRVNAGVVARGGLGVWVERWSWEGEEGVVSGEEIAEKVKAVMADETVRKKAASVGEAAVKEFADGGTSYRSLTEFVRRCRDLAVLD*
>PpCGT1(SEQ ID NO:3)
MPTSGSRTGGRPHVILLPSAGMGHLVPFSRLAVALSSGHGCDVSVVAVLPTVSAAESRHLQGLLDASPAVRRLDLHLAPFDESEFPGADPFFLRFEAMRRSAPLLGPLLADTGESALVTDIALASVVIPVAKEIHLPCYVLFTASAAMLSFCAYFPTYLDTNAGRVVGDVDIPGVYRIPKASIPQALHDRNHLFTRQFVANGQDLAKADGVLVNTFDALELEAVTALRQGSVAAGFPPVFSVGPLVTVNLPAGEAAKESGNDYMYWLDAQPARSVVYVSFGSRKAISRNQVRELAVGLEASGQRFLWVVKSTVVDRDDSAELSELLDEGFLERVQGRGLVTKAWVEQEEVLKHESIGLFISHCGWNSVTEAAASGVPVLAWPRFGDQRVNAGVVARGGLGVWVERWSWEGEEGVVSGEEIAEKVKAVMADETVRKKAASVGEAAVKEFADGGTSYRSLTEFVRRCRDLAVLD*
>PhCGT2(SEQ ID NO:4)
MASRAMPSSSDRTGGAPRVVLLPSAGMGHLVPFGRLAVALSSGHACDVSVVTVLPTVSSAESKHLQGLFDAFPAVRRLDLHLAPFDASEFSDADPFYVRYEAVRRSAPLLGPLLADADASALVADIALASVVIPVAKELLIPCYIFFTASATMFSLLAYFPTYLHSNAGHSIGDVDVPGVYRIPMSSIPQALHDPNNLFTQQFVANGRSLAEADGLLVNTFDAFEPEAVTALRHGTVAPGFPPVFALGPLSPVGFPAGEAARESGNYTTWLDAQPARSVVYVSFGSRKALLRDQLSELAAGLEASGCRFLWVVKGTVVDRDDDRELRELLGEVFLQRVNGRALVTKAWVEQEEVLKHPAVGLFISHCGWNSVTEATVSGVPVLAWPRFADQRVSAGVVARRGLGVWVERWSWEGEERVVTGDEIAEKVKSVLADETLRKNSTMVREAAAAAVATGGTSYRSLAKFVRRCST*
>OsCGT2(SEQ ID NO:5)
MCSAATPNSGDVRATPGSSRPHVVLLPSAGMGHLVPFTRLAAALCSGHGCDVSLVAAVPTVSSAEARHLAAHFTAFPAVRRLELDLASLDVSEFAGADPFYVRYEAIRRSASLLAPLLAGGASAAASALVADIALASVVIPVAKDLRLPCYVFFTASATMFSFLAYLPTYLDANAGGGHAIGDVDVPGVCRVPTSSVPQALHDPDDIFTRQFIANARSLANADGLVVNAFDALEPEAVAALRQGTVAAGLPPVFAVGPLSPAPIPAKDSGSYLPWLDAQPARSVVYVSFGSRKALPRDQLSELAAGLEASGHRFLWVVKGAVVDRDDAGELTDLLGEAFLQRIHGRGLVTMAWVRQEEVLNHPSVGLFISHCGWNSVTEAAASGVPVVAWPRFADQRVNAGVVARAGIGVWVDTWSWEGEDDGVVSAEDIAGKVRSAMADEGVRKAAASVREAAARAVAAGGSSYRSLAELVRRCRDGLVITNGM*
>SbCGT1(SEQ ID NO:6)
MAPPATKSLGELDGGARPHVMFIPSAGMGHLLPFFRVIAALAAHDVVDISVVTVLPTVSAAEADHFASLFAALPRVSRVDFHLLPFDASSEFPGHDPFLLRWEALRRSAHLFRPLIAGAAGPRVSAVVTDVTLTSHVIPIAKELGVQCHVLFVSCATMLSLAAYTPVHLDKKNKGEHGPGVGVGVGVGDVDIPGVRRIPQSYLPQPLLDLNKLFTKQFIDNGREIINADGFLVNTFDALEPVALAALRDGKVVAGFPPVYAIGPLRSKEEEATTGSPPVAWLDEQPARSVVYVAFGNRNAVSLEQIREIAAGLEASGCRFLWVLKTTTVDRDDTAELTDDVLGEGFLERVQGRGLVTKAWVDQEAVLKHASVGLFLSHSGWNSVTEAAAAGVPLLAWPRGGDHRVNATVVVSGGVGVWMEQWSWDGEDWLVTGEEIGKKVKEVMSDAAVRARATRTGEEAAKAVAEGGTSYRSMQKFISSLKAHCSP*
>SbCGT2(SEQ ID NO:7)
MAPSAMPASGDHTGATPHVVLLPSAGMGHLVPFARLAVALSEGHGCDVSFAAVLPTVSSAESRHLRALFAAAPAVRRLDFRLAPFDESQFPGADPFFLRFEALRRSAPLLGPLLDAAQASALVTDIVLASVVLPVAKARGVPCYVLFTSSAAMLSLCAYFPAHLDANAAAGGGRLGVGDVDIPGVYRIPKSSVPQALHDPKHLFTQQFVANGRGLVAADGILVNTFDAFEPDAITALRQGSVVSDFPPVFAVGPLQPVRFQVAEKPAHYMRWLSAQPARSVVYVSFGSRKAISTDQLRELAAGLEASGQRFLWVVKSTVVDRDDAADLADLLGDGFLERVQGRAFVTKGWVEQEEILQHGSVGLFISHCGWNSVTEAAAFGVPVLAWPRFGDQRVNAAVVARGGLGAWEERWTWDGEKGLVTGEEVAEKINAVVGNDVVARKAARVGDAAAAAAGKGGTSYQSLADFVGRCRDAGW*
>TaCGT1-A(SEQ ID NO:8)
MPTSGDGPTSQPHVVLLPSAGMGHLVPFSRLAVALSSAHGCDVSLVTVLPTVSSAESSHLEALFGAFPAVRRLEFHLADFDASEFPNADPFFLRFEAMRRSAPLLLGPLLARASATALVTDIALSSVVIPVAKQLRLPCYVLFTASAAMLSLCVHFPAYLDANGNGLVGDVDIPGVYQIPKASVPQALHDPKHLFTRQFVANGRELAKSDGVLVNSFDAFEPEAIAALREGAVSAAGFFPPVFSVGPLAPVSFPAGNNNRADYIQWLEAQPARSVVYVSFGSRKAVARDQLRELAAGLEASGHRFLWVVKSTVVDRDDDADLGELLGEGFLERVQGRGMVTKGWVEQEDVLKQESVGLFISHCGWNSVTEAAAGGLPVLAWPRFGDQRVNAGVVARSGLGVWVDSWSWEGEEGVVSGESIAEKVKAVMGDEIARNKAVSVRDAAAKAVADGGTSYRNLARFAQRCRDGRVRE*
>TaCGT1-B(SEQ ID NO:9)
MPTSGDGSGALPHVVLLPSAGMGHLVPFSRLAVSFSSSDHGCGVSVVTVLPTVSSAESAHLDALFGACPAVRRLDFHLARFDASEFPGADPFFLRFEAMRRSAPLLGPLLAGAGASALVTDIALASVVIPVARELRLPCYVLFTASAAMLSLCVHFPAYLDANAGGPVGDVDIPGVYRVPKASIPQALHHPEHLFTRQFVANGRELAKSDGLLVNSFDEFEPEAISALRDGSVAAGFPPVFSVGPLAPVSFSAGEPPENQADYMRWLEAQPTRSVVYVSFGSRKAISKDQLKELAVGLEASGHRFLWVVKSTVVDREDEAELSELLGEGFLERVHGRGMVTKGWVEQEEVLKQESIGLFISHCGWNSVTEAAANGLPVLAWPRFGDQRVNAGVVARSGLGVWEERWSWEGEEGVVSGENIAEKVKAVMADETVRNKAVSVQDAAAKAVADGGTSYRSLAQFVQRCRDLSVSK*
>TaCGT1-D(SEQ ID NO:10)
MPTSGDASGALPHPHVVLLPSAGMGHLVPFSRLAVSLSSPGHGCGVSVATVLPTVSSAESAHLDALFGACPAVRRLDFHLAPFDASEFPGADPFFLRFEAMRRSAPLLGPLLAGAGASALVTDIALASVVIPVARDLRLPCYVLFTASAAMLSLCVHFPAYLDANAGGPVGDVGIPGVYRVPKASIPQALHHPEHLFTQQFVANGRELAKADGLLVNSFDAFEPEAIAALRNGSVAAGFPPVFSVGPLAPVSFSASEPPENQADYMRWLEAQPARSVVYVSFGSRKAISKDQLRELAVGLEASGHRFLWVVKSTVVDRDDEAELSELLGEGFLERVQGRGMVTKGWVEQEEVLKQESIGLFISHCGWNSVTEAAANGLPVLAWPRFGDQRVNAGVVARSGLGVWEERWSWEGEEGTVSGHNIAEKVKTVMADKTVRNKAVSVQDAAAEAVADGGTSYRSLAQFVQRCRDLSVSK*
>TaCGT2-A(SEQ ID NO:11)
MASSSRDDRAGAAAPRPRIVLLPSAGMGHLAPFSRLAAALSSGHACDVSLVTVLPTVSSAESGQLDALFAAFPAVRRLDFHLPPLDAPELSGADPFYVHYEATRRSARLLAPLLAAADASALIADISLASVLIPVASELRLPCYVFFTASATMFSFYAYYPTYLDATGAGDADVPGVYRIPKSSFPQALHDRNNLFTQQFVANGRSLSKADGLLINTFDDLEPEAVTALRQGSVVPGFPPVFTVGPLSPVSFPARASSDYSAWLDAQPERSVVYVSFGSRKALARDQLSELADGLEASGCRFLWVVKGAVVDKDDGAELSELLGEGFLQRVSGRALVTKAWVEQGEVLKHPAIGMFVSHCGWNSLTEAFATGVPVLAWPRFADQRVNAGIVARCGAGVWVERWSWEGDDGVVKGEEIAEKVKSVMADEMLRRSSTVVREAATTAVAGGGTSYRSLAELVARCCHGSALQ*
>TaCGT2-B(SEQ ID NO:12)
MASSPRDDRAGAAAPRPRIVLLPSASMGHLAPFSRLAAALSSGHACDVSLVTVLPTVSSAESGQLDALFAAFPAVRRLDFQLPPLDAPELSGADPFYVHYEATRRSARLLAPLLAAADASVLVADISLASVLIPVASELRLPCYVFFTASATMFSFYAYYPTYLDAAGAGDADVPGVYRIPKSSFPQALHDRNNLFTQQFVANGRSLSKADGLLINTFDALEPEAVTALRQGSVVPGCPPVFTVGPLSPVSFPARASADYSACLDAQPERSVVYVSFGSRKALARDQLSELADGLEASGCRFLWVVKGAVVDKDDGAELSELLGEGFLQRVSGRALVTKAWVEQGEVLKHPAIGMFVSHCGWDSLTEAFATGVPVLAWPRFADQRVNAGIVARCGAGVWVERWSWEGDEGVVKGEEIAEKVKSVMANEMLRRSSTMVREAAMTAVAGGGTSYRSLAELVARCCDGSASQ*
>TaCGT2-D(SEQ ID NO:13)
MASSSRDDRAGAAAPRPRIVLIPSAGMGHLAPFSRLAAALSSGHTCNVSLVTVLPTVSSAESGHLDALFAAFPAVRRLDFQLPPLDAPELSGADPFYVHYEATRRSARLLAPLLAAADASALVADISLASVLIPVASELRLPCYVFFTASATMFSFYAYYPTYLDAAGAGDADVPGVYRIPKSSFPQALHDRNNLFTQQFVANGQSLSKADGLLINTFDALEPEAVTALRQGSVVPGFPPVFNVGPLSPVSFPARASSDYSAWLDAQPERSVVYVSFGSRKALARDQLSELADGLEASGCRFLWVVKGTVVDKDDGAELSELLGEGFLQRVSGRALVTKAWVEQGEVLKHPAIGMFVSHCGWNSLTEAFASGVPVLAWPRFADQRVNAGIVARRGAGVWVERWSWEGDDGVVKGEEIAEKVKSVMADEMLRRSSTVVREAAMTAVAGGGTSYRSLAELVARCCDGSASNAPSEA*
>ZmCGT4(SEQ ID NO:14)
MSSPAPSSASRSSHGSRGSPRIVLFPSAGMGHLVPFTRLAVALSAGHGCEISLLTALPTVSSAESRHIAALYAAFPAIRQLDLRFAPFDASSEFPGADPFYLRYEALRRCAPSLLGPLLAGAGASALVVDMALASVAIPVARELHVPCFVFFTASATMLSFKAYFPTYLDDVGAGHGVGDVDVPGVYRIPSSSVPQALHDPDNIFTRQFVANGRALATADGLLVNAFHAMEPEAVEALQGRFVLSVLPPVFAVGPLMPVNDLRETGEAAQKQGNYRAWLDEQPPRSVVYVSFGSRKALPKDQIKELAAGLEACGHRFLWVVKGAVVDRDDAGELSELLGEAFLRRVHGRGLVTKSWVEQEEVLRHPAVALFVSHCGWNSVTEAVSSGVPVLAWPRFADQRVNARVVVRCGLGVWADQWSWEGEEALVRAEEITALVMEAMEDDAMAVKAANVREAASRAVVDGGTSYRSLAAFVRRCTA*
>ZmCGT5(SEQ ID NO:15)
MSSPAPSSPSRSSHGSRSSPRIVLFPSAGMGHLVPFTRLAVALSAGHGCDISLVTALPTVSSAESRHIAALYAAFPAIRQLDLRFAPFDASSEFPGADPFYLRYEALRRCAPSLLGPLLAGAGASALVVDMALASVAIPVARELHVPCFVFFTASATMLSFKAYFPTYLDDVGAGHGVGDVDVPGVYRIPSSSVPQALHDPDNIFTRQFVANGRALATADGLLVNAFHAMEPEAVEALQGRFVLSVLPPVFAVGPLMPVNDLRETGEAAQKQGNYRAWLDEQPPRSVVYVSFGSRKALPKDQIKELAAGLEACGHRFLWVVKGAVVDRDDAGELSELLGEAFLRRVHGRGLVTKSWVEQEEVLRHPAVALFVSHCGWNSVTEAVSSGVPVLAWPRFADQRVNARVVVRCGLGVWADQWSWEGEEALVRAEEITALVMEAMEDDAMAVKAANVREAASRAVVDGGTSYRSLAAFVRRCTA*
>BdCGT1(SEQ ID NO:16)
MPTSGDGPTSQPHVVLLPSAGMGHLVPFSRLAVALSSAHGCDVSLVTVLPTVSSAESSHLEALFGAFPAVRRLEFHLADFDASEFPNADPFFLRFEAMRRSAPLLLGPLLARASATALVTDIALSSVVIPVAKQLRLPCYVLFTASAAMLSLCVHFPAYLDANGNGLVGDVDIPGVYQIPKASVPQALHDPKHLFTRQFVANGRELAKSDGVLVNSFDAFEPEAIAALREGAVSAAGFFPPVFSVGPLAPVSFPAGNNNRADYIQWLEAQPARSVVYVSFGSRKAVARDQLRELAAGLEASGHRFLWVVKSTVVDRDDDADLGELLGEGFLERVQGRGMVTKGWVEQEDVLKQESVGLFISHCGWNSVTEAAAGGLPVLAWPRFGDQRVNAGVVARSGLGVWVDSWSWEGEEGVVSGESIAEKVKAVMGDEIARNKAVSVRDAAAKAVADGGTSYRNLARFAQRCRDGRVRE*
>SiCGT1(SEQ ID NO:17)
MPTSGDHSGARPHVVLLPSAGMGHLVPFGRLAVALSAGHGCDVSVAAVLPTVSSAEARHLEALFAAADPAVRRLDFRLAPFDASEFPGADPFFLRFEAMRRSAPLLGPLLATAGASAVVTDIVLASVVLPVARECGVPCYVLFTASAAMLAFCAHFPGYLDANSAAGRAGVVGDVDIPGVYRIPKSSVPQALHDPKHLFTQQFVANGRGLVDADGILVNTFDALEPEAVTALRKGKVVSSFPLVFAVGPLLPVMFPAKDPAGYMQWLDAQPARSVVYVSFGSRTAISPDQLLELAAGLEASGHRFLWVVKSTVVDRDDAGELGDLLGHGFLERVRGRALVTKGWVEQEEILQHGSVGLFVSHCGWNSVTEAAAFGVPVLAWPRFGDQRINAAVVTRGGLGAWEERWSWDGEEGLVSGEEVGEKIKAVMADETVAKKAAAVGDAAAAAATSKGGTSYRSLAEFVGRCRDAGSRQDR*
>SiCGT2(SEQ ID NO:18)
MSSPPPPNSTSDDCQGTAATPHIVLFPSAGMGHLVPFTRLAVALSAGHCCDVSLVTALPTVSSAESCHIAALFAAFPAVRRLDLRLAPLDASSEFPGADPFYVRYEALRRSTPLLLGPLLAGASASALVADIALASVAIPVARELRVPCYVFFTASATMLSFKAYFPTYLDANGGAGHSVGDVDVPGVCRVPRSSIPQALHDPDDIFTRQFVANGRALVAADGLLVNAFEAMEPEAVAALLGGSVVASLPPVFAVGPLMPLNLREAAEEQGNYRAWLDAQPPRSVVYVSFGSRKALARDQIRELAAWLEACGHRFLWVVKGAVVDRDDACELSDLLGEGFQRRVEGRGLVTKSWVEQDEVLRHPAVGLFVSHCGWNSVTEAAANGVPVLAWPRFADQRVNARVVARAGFGVWVERWSWEGEEAVVGAEEIAEQVVAAMGDQAVAEKAASVRDEAARAVADGGTSQQSLAEFVRRCRGGLAGPGTDLGRTWTARG*
>OsCGT(SEQ ID NO:19)
MPSSGDAAGRRPHVVLIPSAGMGHLVPFGRLAVALSSGHGCDVSLVTVLPTVSTAESKHLDALFDAFPAVRRLDFELAPFDASEFPSADPFFLRFEAMRRSAPLLGPLLTGAGASALATDIALTSVVIPVAKEQGLPCHILFTASAAMLSLCAYFPTYLDANAGDGGGVGDVDIPGVYRIPKASIPQALHDPNHLFTRQFVANGRSLTSAAGILVNTFDALEPEAVAALQQGKVASGFPPVFAVGPLLPASNQAKDPQANYMEWLDAQPARSVVYVSFGSRKAISGEQLRELAAGLETSGHRFLWVVKSTVVDRDDAAELGELLGEGFLKRVEKRGLVTKAWVDQEEVLKHESVALFVSHCGWNSVTEAAASGVPVLALPRFGDQRVNSGVVARAGLGVWADTWSWEGEAGVIGAEEISEKVKAAMADEALRRKAASLAKAAAKAVAGGGSSHRCLVEFARLCQGGTCRTN*
>ZmCGT(SEQ ID NO:20)
MAANGGDHTSARPHVVLLPSAGMGHLVPFARLAVALSEGHGCNVSVAAVQPTVSSAESRLLDALFVAAAPAVRRLDFRLAPFDESEFPGADPFFLRFEATRRSAPLLGPLLDAAEASALVTDIVLASVALPVARERGVPCYVLFTSSAAMLSLCAYFPAYLDAHAAAGSVGVGVGNVDIPGVFRIPKSSVPQALHDPDHLFTQQFVANGRCLVACDGILVNTFDAFEPDAVTALRQGSITVSGGFPPVFTVGPMLPVRFQAEETADYMRWLSAQPPRSVVYVSFGSRKAIPRDQLRELAAGLEASGKRFLWVVKSTIVDRDDTADLGGLLGDGFLERVQGRAFVTMGWVEQEEILQHGSVGLFISHCGWNSLTEAAAFGVPVLAWPRFGDQRVNAALVARSGLGAWEEGWTWDGEEGLTTRKEVAKKIKGMMGYDAVAEKAAKVGDAAAAAIAKCGTSYQSLEEFVQRCRDAERK*
以基因组DNA为模板,通过PCR扩增候选糖基转移酶基因:PhCGT1(SEQ ID NO:1)、PgCGT1(SEQ ID NO:2)、PpCGT1(SEQ ID NO:3)、PhCGT2(SEQ ID NO:4)、OsCGT2(SEQ ID NO:5)、SbCGT1(SEQ ID NO:6)、SbCGT2(SEQ ID NO:7)、TaCGT1-A(SEQ ID NO:8)、TaCGT1-B(SEQID NO:9)、TaCGT1-D(SEQ ID NO:10)、TaCGT2-A(SEQ ID NO:11)、TaCGT2-B(SEQ ID NO:12)、TaCGT2-D(SEQ ID NO:13)、ZmCGT4(SEQ ID NO:14)、ZmCGT5(SEQ ID NO:15)、BdCGT1(SEQ ID NO:16)、SiCGT1(SEQ ID NO:17)、SiCGT2(SEQ ID NO:18)、OsCGT(SEQ ID NO:19)、ZmCGT(SEQ ID NO:20)。PCR引物如表1所示。其中,PhCGT1、PgCGT1、PpCGT1使用同样引物对(Ph708UGT1-F/Ph708UGT1-R)扩增;TaCGT1-B、TaCGT2-B、SiCGT1、ZmCGT为人工合成并经大肠杆菌密码子优化。
表1、克隆糖基转移酶所使用的引物
Figure BDA0002376251420000161
PCR扩增体系25μL(PrimeSTAR Max Premix,12.5μL;Primer 1/Primer 2终浓度0.2μM;gDNA<50ng;剩余体积用灭菌蒸馏水补足)。PCR反应条件:98℃预变性2min,然后98℃变性10s,55℃退火15s,72℃延伸10s,30个循环,72℃延伸10min,琼脂糖电泳检测,扩增得到约1.5kb的片段。纯化后片段使用无缝克隆的方式连入相同NdeI/NotI消化过的pET28a载体,连接产物转化大肠杆菌DH10B感受态细胞,测序确认序列。
2.碳苷糖基转移酶的蛋白表达
将重组质粒转化到大肠杆菌BL21(DE3)的感受态细胞中,在固体LB培养基(卡那霉素50μg/mL)37℃培养过夜。挑取单个克隆到2mL LB液体培养基(卡那霉素50μg/mL),转接过夜培养的菌液到新的LB液体抗性培养基100mL中37℃,250rpm培养至OD600=0.5~0.6,水浴降温至16℃左右,然后加入诱导剂IPTG至终浓度0.1mM,转至16℃低温诱导培养,在摇床转速180r/min条件下继续培养20h。携带pET28a空质粒的BL21(DE3)重组菌株作为空白对照,培养操作同上。离心收菌(6000r/min,5min),使用1mL破菌缓冲液Buffer A(20mM Tris-HCl,pH 8.0;100mM NaCl)重悬,加入DNase至终浓度为5μg/mL,Mg2+终浓度为2mM,蛋白酶抑制剂PMSF终浓度为1mM,冰上孵育30min后超声破碎;冷冻离心(10000rpm,30min,4℃),通过0.2μm滤膜过滤,获得上清粗酶液,加入20%甘油冷冻保存(-20℃)。
3.碳苷糖基转移酶的体外功能鉴定
体外酶催化测定体系为100μL,反应体系包括:0.1mM的糖基受体(根皮素或2-羟基柚皮素),0.3mM的UDP葡萄糖,25μL上清粗酶液,用Buffer A补足体积到100μL,于37℃反应2h。待反应结束后,加等体积甲醇终止反应,使用HPLC进行产物分析。HPLC检测条件:色谱柱:反相C18 column[SilGreen ODS column(
Figure BDA0002376251420000172
4.6×250mm)],检测波长为280nm;流动相:乙腈(0.1%甲酸)-水(0.1%甲酸)混合物梯度洗脱,在0到20min内比例由5:95升到100:0,流速1mL/min。
根据HPLC检测结果1(图1A),PhCGT1、PgCGT1、PpCGT1、PhCGT2、OsCGT2、SbCGT1、SbCGT2、TaCGT1-A、TaCGT1-B、TaCGT1-D、TaCGT2-A、TaCGT2-B、TaCGT2-D、ZmCGT4、ZmCGT5、BdCGT1、SiCGT1、SiCGT2、OsCGT、ZmCGT能够将底物根皮素(phloretin)转化为保留时间较小的产物。上述产物经负离子模式高分辨质谱检测确认分子式为C21H24O10,二级质谱显示出己糖碳苷特征性的[M-H-90]—、[M-H-120]—碎片离子峰(图2)。经过一维核磁(1H NMR、13CNMR)、二维核磁HMBC波谱鉴定该碳苷糖基化产物为Nothofagin(图3)。
Figure BDA0002376251420000171
同时,上述20条碳苷糖基转移酶可以将底物2-羟基柚皮素(2-hydroxynaringenin)转化为其糖基化产物(图1B)。该产物经负离子模式高分辨质谱检测确认分子式为C21H22O11,二级质谱显示出己糖碳苷特征性的[M-H-120]—碎片离子峰(图4),提示该产物为2-羟基柚皮素-C-葡萄糖苷(2-hydroxynaringenin-C-glucoside)。
Figure BDA0002376251420000181
本发明人对于新发现的碳苷糖基转移酶进行酶动力学参数的测定,发现PhCGT1和PgCGT1对于2-羟基柚皮素的Km值为所有碳苷糖基转移酶中最低,分别达到了1.75±0.66和2.75±0.75μM(图5)。Km值为酶促反应的速度为最大反应速度一半时的底物浓度,Km值越低说明所述碳苷糖基转移酶的酶催化活性高。
此外,本发明人还发现SbCGT1、TaCGT1-A、TaCGT1-D、SiCGT1、OsCGT和ZmCGT不仅可以催化根皮素在3’位置糖基化,更可以对3’位已被糖基化的根皮素进行进一步5’位的碳苷糖基化,从而产生一个二氢查尔酮双碳苷(根皮素-3’,5’-C-葡萄糖碳苷,图1A)。该产物经负离子模式高分辨质谱检测确认分子式为C27H34O15,二级质谱显示出双己糖碳苷特征性的[M-H-180]—、[M-H-210]—、[M-H-240]—碎片离子峰(图6)。
Figure BDA0002376251420000182
实施例2、以本发明的糖基转移酶合成牡荆素、异牡荆素、荭草苷和异荭草苷本实施例中,应用PhCGT1在大肠杆菌合成牡荆素(vitexin)、异牡荆素(isovitexin)、荭草苷(orientin)和异荭草苷(isoorientin)
黄酮-C-单葡糖苷的预测的生物合成途径如图11。箭头TAL(或PAL)、4CL、CHS、CHI代表负责柚皮素生物合成的主要酶。箭头F2H、F3’H是黄烷酮2-羟化酶(F2H)和黄烷酮3’-羟化酶(F3’H),其构成羟基化黄烷酮的骨架。C-糖基转移酶(CGT)用箭头CGT表示。在形成C-糖基化中间体后,脱水反应在酸性溶剂中自发发生(箭头H+)或由脱水酶(箭头DH)催化。
1、质粒构建
(1)黄烷酮柚皮素(naringenin)合成前体基因的表达盒构建
将人工合成并经密码子优化的前体合成基因序列构建到pET28a载体上获得pET28-RtPAL,pET28-Pc4CL,pET28-PxhCHS和pET28a-MsCHI。其中,PxhCHS:GenBank登录号KF765781;MsCHI:GenBank登录号KF765782;Pc4CL:GenBank登录号KF765780;RtPAL:GenBank登录号AAA33883。
以pET28-Pc4CL为模板,4CL-F-NcoI/4CL-R-BamHI为引物对扩增Pc4CL片段,与NcoI/BamHI双酶切的pCDFDuet-1载体连接获得pYH40。
以pET28-PxhCHS为模板,CHS-F-NdeI/CHS-R-XhoI为引物对扩增PxhCHS片段,与NdeI/XhoI双酶切的pYH40连接获得pYH50。
以pET28-MsCHI为模板,T7CHI-F-XhoI/CHI-R-AvrII为引物对扩增McCHI片段,与XhoI/AvrII双酶切的pYH50连接,获得质粒pYH51。
以pET28-RtPAL为模板,T7PAL-F-BamHI/PAL-R-HindIII为引物对扩增RtPAL片段,与BamHI/HindIII双酶切的pYH51连接,获得质粒pYH55(pYH055)用于柚皮素(naringenin)合成的从头合成(图7A)。PCR引物如表2所示。
表2、柚皮素合成前体基因的表达盒构建所使用的引物
引物 序列(SEQ ID NO:)
4CL-F-NcoI tataccatgggtgactgcgttgccccg(47)
4CL-R-BamHI cgggatccttacttcggcaggtcgccgctc(48)
T7PAL-F-BamHI cgggatcccttatgcgactcctgcattag(49)
PAL-R-HindIII gcccaagcttttatgccagcatcttc(50)
CHS-F-NdeI agatatacatatggttacggtggaagaatac(51)
CHS-R-XhoI ccgctcgagttaggtagccacactatgcag(52)
T7CHI-F-XhoI ccgctcgagctagaaataattttgtttaac(53)
RbsCHI-F-XhoI ccgctcgagcgatcccgcgaaattaatacg(54)
CHI-R-AvrII gagcctaggttagttaccgattttaaag(55)
(2)黄烷酮-2-羟基化酶/CPR表达盒构建
以人工合成的黄烷酮-2-羟基化酶编码基因OsCYP93G2(密码子优化)、ZmCYP93G5(密码子优化)或SbCYP93G3(密码子优化)的克隆载体为模板,通过PCR扩增所述三个P450基因。对上述三个基因进行相应于其蛋白的N端改造,截去N端跨膜区域并加载标签2B1(序列为MAKKTSSKGKLPPGPS)。
OsCYP93G2:GenBank登录号XP_015642954.1,截去N端第1~26位残基,加载2B1,其编码基因以常规方法进行大肠杆菌偏好的密码子优化;
ZmCYP93G5:GenBank登录号XP_008660140.1,截去N端第1~29位残基,加载2B1,其编码基因以常规方法进行大肠杆菌偏好的密码子优化;
SbCYP93G3:GenBank登录号XP_002461286.1,截去N端第1~37位残基,加载2B1,其编码基因以常规方法进行大肠杆菌偏好的密码子优化;
以拟南芥cDNA为模板,通过PCR扩增AtCPR2基因(GenBank登录号ABB88839.2,用于与P450组合,提供还原力)。
将改造后的P450基因使用引物对CZ201-F/R、CZ203-F/R、CZ229-F/R分别扩增,通过无缝克隆法插入pDuet-1载体多克隆位点1的NcoI和BamHI之间,AtCPR2使用引物对CPR-F/NotI-trCPR-R扩增后插入pDuet-1载体多克隆位点2的NdeI和XhoI位点之间,分别构成质粒pCZ201、pCZ203和pCZ229(图7B)。PCR引物如表3所示。
表3、构建pCZ201、pCZ203和pCZ229所使用的引物
Figure BDA0002376251420000201
(3)黄烷酮-2-羟基化酶/黄烷酮-3’羟基化酶/CPR表达盒构建
以人工合成的黄烷酮-3’-羟基化酶AtCYP75B1(密码子优化)、OsCYP75B3(密码子优化)的克隆载体为模板,通过PCR扩增所述P450基因。对所述基因进行N端改造,截去N端跨膜区域并加载标签2B1(序列为MAKKTSSKGKLPPGPS)。
AtCYP75B1:GenBank登录号NP_196416.1,截去’N端第1~21位残基,加载2B1,常规方法进行大肠杆菌偏好的密码子优化;
OsCYP75B3:GenBank登录号XP_015613041.1,截去’N端第1~26位,加载2B1,常规方法进行大肠杆菌偏好的密码子优化;
以拟南芥cDNA为模板,通过PCR扩增AtCPR2基因(GenBank登录号ABB88839.2,用于与P450组合,提供还原力)。
将改造后的P450基因使用引物对CZ261-F/R和CZ265-F/R分别扩增,与黄烷酮-2-羟基化酶中较优的ZmCYP93G5编码基因通过融合PCR分别连接。将连接后的双元P450组合通过无缝克隆法插入pDuet-1载体多克隆位点1的NcoI和BamHI之间,AtCPR2使用引物对CPR-F/NotI-trCPR-R(表3)扩增后插入pDuet-1载体多克隆位点2的NdeI和XhoI位点之间,构成质粒pCZ261和pCZ265(图8)。PCR引物如表4所示。
表4、构建pCZ261和pCZ265所使用的引物
Figure BDA0002376251420000202
(4)PhCGT1表达质粒构建
以毛竹基因组DNA为模板,通过PCR(引物见表1)扩增PhCGT1。将扩增后片段纯化,并使用无缝克隆的方式连入相同NdeI/NotI消化过的pET28a载体,构成质粒pCZ86。
2、用于牡荆素/异牡荆素合成的工程菌构建及发酵
将携带柚皮素合成基因的质粒pYH55,新型糖基转移酶PhCGT1的质粒pCZ86分别与携带黄烷酮-2-羟基化酶/CPR表达盒的质粒pCZ201、pCZ203和pCZ229进行三质粒共转,转化至大肠杆菌BL21(DE3)中,获得从头发酵合成工程菌株sCZ2、sCZ4和sCZ29。
挑取上述工程菌株单克隆,接种于10mL MOPS培养基中(Spe=50μg/mL,Amp=100μg/mL,Kan=50μg/mL),37℃培养OD600=0.5,降温至22℃,添加IPTG(终浓度100μM),22℃,200rpm条件下进行发酵,持续5日。培养结束后收取样品,将菌液离心,获得上清液和菌体。菌体用水混悬,经破碎后用乙酸乙酯、正丁醇萃取;上清液用乙酸乙酯、正丁醇萃取,合并萃取液。将萃取液蒸发后用甲醇复溶,进行LC-MS分析。
发酵结果显示(图9),经5日发酵后,发酵液中能够检测出牡荆素和异牡荆素,比例约为4:6,同时发酵液中能够检测出中间体2-羟基柚皮素-C-葡萄糖苷(即:2-羟基柚皮素-6(8)-C-葡萄糖苷)。
因此,本发明的碳苷糖基转移酶(如PhCGT1)能够特异和高效地催化2-羟基黄烷酮(开环形式)类化合物(如2-羟基柚皮素)的碳苷葡萄糖基化,从而产生一类碳苷-2-羟基黄烷酮类化合物(如2-羟基柚皮素-C-葡萄糖苷);这类化合物通过进一步的脱水反应形成黄酮碳苷(类)化合物(如牡荆素和异牡荆素)。
3、用于荭草苷/异荭草苷合成的工程菌构建及发酵
将携带柚皮素合成基因的质粒pYH55,新型糖基转移酶PhCGT1的质粒pCZ86分别与携带黄烷酮-2-羟基化酶/黄烷酮-3’-羟基化酶/CPR表达盒的质粒pCZ261和pCZ265进行三质粒共转,转化至大肠杆菌BL21(DE3)中,获得从头发酵合成工程菌株sCZ63和sCZ67。
挑取上述工程菌株单克隆,接种于10mL MOPS培养基中(Spe=50μg/mL,Amp=100μg/mL,Kan=50μg/mL),37℃培养OD600=0.5,降温至22℃,添加IPTG(终浓度100μM),22℃,200rpm条件下进行发酵,持续5日。培养结束后收取样品,将菌液离心,获得上清液和菌体。菌体用水混悬,经破碎后用乙酸乙酯、正丁醇萃取;上清液用乙酸乙酯、正丁醇萃取,合并萃取液。将萃取液蒸发后用甲醇复溶,进行LC-MS分析。
发酵结果显示(图10),经5日发酵后,发酵液中能够检测出荭草苷和异荭草苷的混合物,比例约为4:6。同时发酵液中能够检测到一定比例的(占比约20~25%)未经3’羟基化修饰的牡荆素和异牡荆素。在菌株sCZ63中检测到中间体2-羟基柚皮素-C-葡萄糖苷和2-羟基圣草酚-C-葡萄糖苷的积累。
因此,本发明的碳苷糖基转移酶(如PhCGT1)能够特异和高效地催化二氢查尔酮、2-羟基黄烷酮(开环形式)类化合物(如2-羟基圣草酚)的碳苷葡萄糖基化,从而产生一类碳苷二氢查尔酮类化合物(如2-羟基圣草酚-C-葡萄糖苷);这类化合物通过进一步的脱水反应形成黄酮碳苷(类)化合物(如荭草苷和异荭草苷)。
实施例3、以本发明的糖基转移酶合成维采宁-2
本实施例中,以TaCGT1-D在大肠杆菌合成维采宁-2(vicenin-2)。维采宁-2(芹菜素-6,8-双葡萄糖苷)的预测的生物合成途径如图12。TAL(或PAL)、4CL、CHS、CHI代表负责柚皮素生物合成的主要酶。箭头F2H是黄烷酮2-羟化酶(F2H),其构成2-羟基黄烷酮的骨架。C-糖基转移酶(CGT)用箭头CGT表示。在形成C-糖基化中间体后,脱水反应在酸性溶剂中自发发生(箭头H+)。
1、质粒构建
(1)黄烷酮柚皮素(naringenin)合成前体基因的表达盒构建同实施例2。
(2)黄烷酮-2-羟基化酶/CPR表达盒构建同实施例2。
(3)TaCGT1-D表达质粒构建:以小麦基因组DNA为模板,通过PCR(引物见表1)扩增TaCGT1-D。将扩增后片段纯化,并使用无缝克隆的方式连入相同NdeI/NotI消化过的pET28a载体,构成质粒pCZ173。
2、用于维采宁-2合成的工程菌构建及发酵
将携带柚皮素合成基因的质粒pYH55,新型糖基转移酶TaCGT1-D的质粒pCZ173分别与携带黄烷酮-2-羟基化酶/CPR表达盒的质粒pCZ201进行三质粒共转,转化至大肠杆菌BL21(DE3)中,获得从头发酵合成工程菌株sCZ117。
挑取上述工程菌株单克隆,接种于10mL MOPS培养基中(Spe=50μg/mL,Amp=100μg/mL,Kan=50μg/mL),37℃培养OD600=0.5,降温至22℃,添加IPTG(终浓度100μM),22℃,250rpm条件下进行发酵,持续5日。培养结束后收取样品,将菌液离心,获得上清液和菌体。菌体用水混悬,经破碎后用乙酸乙酯、正丁醇萃取;上清液用乙酸乙酯、正丁醇萃取,合并萃取液。将萃取液蒸发后用甲醇复溶,进行LC-MS分析。
发酵结果显示,经5日发酵后,发酵液中能够检测出维采宁2(图13),同时发酵液中能够检测出中间体牡荆素与异牡荆素。
因此,本发明的碳苷糖基转移酶(如TaCGT1-D)能够特异和高效地催化2-羟基黄烷酮(开环形式)类化合物(如2-羟基柚皮素)的双葡萄糖碳苷糖基化,从而产生一类双葡萄糖碳苷-2-羟基黄烷酮类化合物(如2-羟基柚皮素-C-双葡萄糖苷);这类化合物通过进一步的脱水反应形成双葡萄糖碳苷黄酮(类)化合物(维采宁-2)。
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
序列表
<110> 中国科学院上海生命科学研究院
<120> 新型碳苷糖基转移酶及其应用
<130> 196900
<160> 67
<170> SIPOSequenceListing 1.0
<210> 1
<211> 472
<212> PRT
<213> 毛竹(Phyllostachys edulis)
<400> 1
Met Pro Thr Ser Gly Gly Arg Thr Gly Asp Arg Pro His Val Ile Leu
1 5 10 15
Leu Pro Ser Ala Gly Met Gly His Leu Val Pro Phe Ser Arg Leu Ala
20 25 30
Val Ala Leu Ser Ser Gly His Gly Cys Asp Val Ser Val Val Ala Val
35 40 45
Leu Pro Thr Val Ser Ala Ala Glu Ser Arg His Leu Gln Gly Leu Leu
50 55 60
Asp Ala Ser Pro Ala Val Arg Arg Leu Asp Leu His Leu Ala Pro Phe
65 70 75 80
Asp Glu Ser Glu Phe Pro Gly Ala Asp Pro Phe Phe Leu Arg Phe Glu
85 90 95
Ala Met Arg Arg Ser Ala Pro Leu Leu Gly Pro Leu Leu Ala Asp Thr
100 105 110
Gly Ala Ser Ala Leu Val Thr Asp Ile Ala Leu Ala Ser Val Val Ile
115 120 125
Pro Val Ala Lys Glu Ile His Leu Pro Cys Tyr Val Leu Phe Thr Ala
130 135 140
Ser Ala Ala Met Leu Ser Phe Cys Ala Tyr Phe Pro Thr Tyr Leu Asp
145 150 155 160
Thr Asn Ala Gly Arg Val Val Gly Asp Val Asp Ile Pro Gly Val Tyr
165 170 175
Arg Ile Pro Lys Ala Ser Ile Pro Gln Ala Leu His Asp Pro Asn His
180 185 190
Leu Phe Thr Arg Gln Phe Val Ala Asn Gly Gln Asp Leu Ala Lys Ala
195 200 205
Asp Gly Val Leu Val Asn Thr Phe Asp Ala Leu Glu Leu Glu Ala Val
210 215 220
Thr Ala Leu Arg Gln Gly Ser Val Ala Ala Gly Phe Pro Pro Val Phe
225 230 235 240
Ser Val Gly Pro Leu Val Thr Val Asn Leu Pro Ala Gly Glu Ala Ala
245 250 255
Lys Glu Ser Gly Asn Asp Tyr Met Tyr Trp Leu Asp Ala Gln Pro Ala
260 265 270
Gln Ser Val Val Tyr Val Ser Phe Gly Ser Arg Lys Ala Ile Ser Arg
275 280 285
Asp Gln Val Arg Glu Leu Ala Ile Gly Leu Glu Ala Ser Gly Gln Pro
290 295 300
Phe Leu Trp Val Val Lys Ser Thr Val Val Asp Arg Asp Asp Ser Ala
305 310 315 320
Glu Leu Ser Glu Leu Leu Gly Glu Gly Phe Leu Glu Arg Val Gln Gly
325 330 335
Gln Gly Phe Val Thr Lys Ala Trp Val Glu Gln Glu Glu Val Leu Lys
340 345 350
His Glu Ser Ile Gly Leu Phe Ile Ser His Cys Gly Trp Asn Ser Val
355 360 365
Thr Glu Ala Ala Ala Ser Gly Val Pro Val Leu Ala Trp Pro Arg Phe
370 375 380
Gly Asp Gln Arg Val Asn Ala Gly Val Val Ala Arg Gly Gly Leu Gly
385 390 395 400
Val Trp Val Glu Arg Trp Ser Trp Glu Gly Glu Glu Asp Val Val Ser
405 410 415
Gly Glu Glu Ile Ala Glu Lys Val Lys Ala Val Met Ala Asp Glu Thr
420 425 430
Val Arg Lys Lys Ala Ala Ser Val Gly Glu Ala Ala Val Lys Glu Phe
435 440 445
Ala Asp Gly Gly Thr Ser Tyr Arg Ser Leu Thr Glu Phe Val Arg Arg
450 455 460
Cys Arg Asp Leu Ala Val Leu Asp
465 470
<210> 2
<211> 472
<212> PRT
<213> 淡竹(Phyllostachys glauca)
<400> 2
Met Pro Thr Ser Gly Ser Arg Thr Gly Gly Arg Pro His Val Ile Leu
1 5 10 15
Leu Pro Ser Ala Gly Met Gly His Leu Val Pro Phe Ser Arg Leu Ala
20 25 30
Val Ala Leu Ser Ser Gly His Gly Cys Asp Val Ser Val Val Ala Val
35 40 45
Leu Pro Thr Val Ser Ala Ala Glu Ser Arg His Leu Gln Gly Leu Leu
50 55 60
Asp Ala Ser Pro Ala Val Arg Arg Leu Asp Leu His Leu Ala Pro Phe
65 70 75 80
Asp Glu Ser Glu Phe Pro Gly Ala Asp Pro Phe Phe Leu Arg Phe Glu
85 90 95
Ala Met Arg Arg Ser Ala Pro Leu Leu Gly Pro Leu Leu Ala Asp Thr
100 105 110
Gly Ala Ser Ala Leu Val Thr Asp Ile Ala Leu Ala Ser Val Val Ile
115 120 125
Pro Val Ala Lys Glu Ile His Leu Pro Cys Tyr Val Leu Phe Thr Ala
130 135 140
Ser Ala Ala Met Leu Ser Phe Cys Ala Tyr Phe Pro Thr Tyr Leu Asp
145 150 155 160
Thr Asn Ala Gly Arg Val Val Gly Asp Val Asp Ile Pro Gly Val Tyr
165 170 175
Arg Ile Pro Lys Ala Ser Ile Pro Gln Ala Leu His Asp Pro Asn His
180 185 190
Leu Phe Thr Arg Gln Phe Val Ala Asn Gly Gln Asp Leu Ala Lys Ala
195 200 205
Asp Gly Val Leu Val Asn Thr Phe Asp Ala Leu Glu Leu Glu Ala Val
210 215 220
Thr Ala Leu Arg Gln Gly Ser Val Ala Ala Gly Phe Pro Pro Val Phe
225 230 235 240
Ser Val Gly Pro Leu Val Thr Val Asn Leu Pro Ala Gly Glu Ala Ala
245 250 255
Lys Glu Ser Gly Asn Asp Tyr Met Tyr Trp Leu Asp Ala Gln Pro Ala
260 265 270
Arg Ser Val Val Tyr Val Ser Phe Gly Ser Arg Lys Ala Ile Ser Arg
275 280 285
Asn Gln Val Arg Glu Leu Ala Val Gly Leu Glu Ala Ser Gly Gln Arg
290 295 300
Phe Leu Trp Val Val Lys Ser Thr Val Val Asp Arg Asp Asp Ser Ala
305 310 315 320
Glu Leu Ser Glu Leu Leu Asp Glu Gly Phe Leu Glu Arg Val Gln Gly
325 330 335
Arg Gly Leu Val Thr Lys Ala Trp Val Glu Gln Glu Glu Val Leu Lys
340 345 350
His Glu Ser Ile Gly Leu Phe Ile Ser His Cys Gly Trp Asn Ser Val
355 360 365
Thr Glu Ala Ala Ala Ser Gly Val Pro Val Leu Ala Trp Pro Arg Phe
370 375 380
Gly Asp Gln Arg Val Asn Ala Gly Val Val Ala Arg Gly Gly Leu Gly
385 390 395 400
Val Trp Val Glu Arg Trp Ser Trp Glu Gly Glu Glu Gly Val Val Ser
405 410 415
Gly Glu Glu Ile Ala Glu Lys Val Lys Ala Val Met Ala Asp Glu Thr
420 425 430
Val Arg Lys Lys Ala Ala Ser Val Gly Glu Ala Ala Val Lys Glu Phe
435 440 445
Ala Asp Gly Gly Thr Ser Tyr Arg Ser Leu Thr Glu Phe Val Arg Arg
450 455 460
Cys Arg Asp Leu Ala Val Leu Asp
465 470
<210> 3
<211> 472
<212> PRT
<213> 高节竹(Phyllostachys prominens)
<400> 3
Met Pro Thr Ser Gly Ser Arg Thr Gly Gly Arg Pro His Val Ile Leu
1 5 10 15
Leu Pro Ser Ala Gly Met Gly His Leu Val Pro Phe Ser Arg Leu Ala
20 25 30
Val Ala Leu Ser Ser Gly His Gly Cys Asp Val Ser Val Val Ala Val
35 40 45
Leu Pro Thr Val Ser Ala Ala Glu Ser Arg His Leu Gln Gly Leu Leu
50 55 60
Asp Ala Ser Pro Ala Val Arg Arg Leu Asp Leu His Leu Ala Pro Phe
65 70 75 80
Asp Glu Ser Glu Phe Pro Gly Ala Asp Pro Phe Phe Leu Arg Phe Glu
85 90 95
Ala Met Arg Arg Ser Ala Pro Leu Leu Gly Pro Leu Leu Ala Asp Thr
100 105 110
Gly Glu Ser Ala Leu Val Thr Asp Ile Ala Leu Ala Ser Val Val Ile
115 120 125
Pro Val Ala Lys Glu Ile His Leu Pro Cys Tyr Val Leu Phe Thr Ala
130 135 140
Ser Ala Ala Met Leu Ser Phe Cys Ala Tyr Phe Pro Thr Tyr Leu Asp
145 150 155 160
Thr Asn Ala Gly Arg Val Val Gly Asp Val Asp Ile Pro Gly Val Tyr
165 170 175
Arg Ile Pro Lys Ala Ser Ile Pro Gln Ala Leu His Asp Arg Asn His
180 185 190
Leu Phe Thr Arg Gln Phe Val Ala Asn Gly Gln Asp Leu Ala Lys Ala
195 200 205
Asp Gly Val Leu Val Asn Thr Phe Asp Ala Leu Glu Leu Glu Ala Val
210 215 220
Thr Ala Leu Arg Gln Gly Ser Val Ala Ala Gly Phe Pro Pro Val Phe
225 230 235 240
Ser Val Gly Pro Leu Val Thr Val Asn Leu Pro Ala Gly Glu Ala Ala
245 250 255
Lys Glu Ser Gly Asn Asp Tyr Met Tyr Trp Leu Asp Ala Gln Pro Ala
260 265 270
Arg Ser Val Val Tyr Val Ser Phe Gly Ser Arg Lys Ala Ile Ser Arg
275 280 285
Asn Gln Val Arg Glu Leu Ala Val Gly Leu Glu Ala Ser Gly Gln Arg
290 295 300
Phe Leu Trp Val Val Lys Ser Thr Val Val Asp Arg Asp Asp Ser Ala
305 310 315 320
Glu Leu Ser Glu Leu Leu Asp Glu Gly Phe Leu Glu Arg Val Gln Gly
325 330 335
Arg Gly Leu Val Thr Lys Ala Trp Val Glu Gln Glu Glu Val Leu Lys
340 345 350
His Glu Ser Ile Gly Leu Phe Ile Ser His Cys Gly Trp Asn Ser Val
355 360 365
Thr Glu Ala Ala Ala Ser Gly Val Pro Val Leu Ala Trp Pro Arg Phe
370 375 380
Gly Asp Gln Arg Val Asn Ala Gly Val Val Ala Arg Gly Gly Leu Gly
385 390 395 400
Val Trp Val Glu Arg Trp Ser Trp Glu Gly Glu Glu Gly Val Val Ser
405 410 415
Gly Glu Glu Ile Ala Glu Lys Val Lys Ala Val Met Ala Asp Glu Thr
420 425 430
Val Arg Lys Lys Ala Ala Ser Val Gly Glu Ala Ala Val Lys Glu Phe
435 440 445
Ala Asp Gly Gly Thr Ser Tyr Arg Ser Leu Thr Glu Phe Val Arg Arg
450 455 460
Cys Arg Asp Leu Ala Val Leu Asp
465 470
<210> 4
<211> 471
<212> PRT
<213> 毛竹(Phyllostachys edulis)
<400> 4
Met Ala Ser Arg Ala Met Pro Ser Ser Ser Asp Arg Thr Gly Gly Ala
1 5 10 15
Pro Arg Val Val Leu Leu Pro Ser Ala Gly Met Gly His Leu Val Pro
20 25 30
Phe Gly Arg Leu Ala Val Ala Leu Ser Ser Gly His Ala Cys Asp Val
35 40 45
Ser Val Val Thr Val Leu Pro Thr Val Ser Ser Ala Glu Ser Lys His
50 55 60
Leu Gln Gly Leu Phe Asp Ala Phe Pro Ala Val Arg Arg Leu Asp Leu
65 70 75 80
His Leu Ala Pro Phe Asp Ala Ser Glu Phe Ser Asp Ala Asp Pro Phe
85 90 95
Tyr Val Arg Tyr Glu Ala Val Arg Arg Ser Ala Pro Leu Leu Gly Pro
100 105 110
Leu Leu Ala Asp Ala Asp Ala Ser Ala Leu Val Ala Asp Ile Ala Leu
115 120 125
Ala Ser Val Val Ile Pro Val Ala Lys Glu Leu Leu Ile Pro Cys Tyr
130 135 140
Ile Phe Phe Thr Ala Ser Ala Thr Met Phe Ser Leu Leu Ala Tyr Phe
145 150 155 160
Pro Thr Tyr Leu His Ser Asn Ala Gly His Ser Ile Gly Asp Val Asp
165 170 175
Val Pro Gly Val Tyr Arg Ile Pro Met Ser Ser Ile Pro Gln Ala Leu
180 185 190
His Asp Pro Asn Asn Leu Phe Thr Gln Gln Phe Val Ala Asn Gly Arg
195 200 205
Ser Leu Ala Glu Ala Asp Gly Leu Leu Val Asn Thr Phe Asp Ala Phe
210 215 220
Glu Pro Glu Ala Val Thr Ala Leu Arg His Gly Thr Val Ala Pro Gly
225 230 235 240
Phe Pro Pro Val Phe Ala Leu Gly Pro Leu Ser Pro Val Gly Phe Pro
245 250 255
Ala Gly Glu Ala Ala Arg Glu Ser Gly Asn Tyr Thr Thr Trp Leu Asp
260 265 270
Ala Gln Pro Ala Arg Ser Val Val Tyr Val Ser Phe Gly Ser Arg Lys
275 280 285
Ala Leu Leu Arg Asp Gln Leu Ser Glu Leu Ala Ala Gly Leu Glu Ala
290 295 300
Ser Gly Cys Arg Phe Leu Trp Val Val Lys Gly Thr Val Val Asp Arg
305 310 315 320
Asp Asp Asp Arg Glu Leu Arg Glu Leu Leu Gly Glu Val Phe Leu Gln
325 330 335
Arg Val Asn Gly Arg Ala Leu Val Thr Lys Ala Trp Val Glu Gln Glu
340 345 350
Glu Val Leu Lys His Pro Ala Val Gly Leu Phe Ile Ser His Cys Gly
355 360 365
Trp Asn Ser Val Thr Glu Ala Thr Val Ser Gly Val Pro Val Leu Ala
370 375 380
Trp Pro Arg Phe Ala Asp Gln Arg Val Ser Ala Gly Val Val Ala Arg
385 390 395 400
Arg Gly Leu Gly Val Trp Val Glu Arg Trp Ser Trp Glu Gly Glu Glu
405 410 415
Arg Val Val Thr Gly Asp Glu Ile Ala Glu Lys Val Lys Ser Val Leu
420 425 430
Ala Asp Glu Thr Leu Arg Lys Asn Ser Thr Met Val Arg Glu Ala Ala
435 440 445
Ala Ala Ala Val Ala Thr Gly Gly Thr Ser Tyr Arg Ser Leu Ala Lys
450 455 460
Phe Val Arg Arg Cys Ser Thr
465 470
<210> 5
<211> 485
<212> PRT
<213> 粳稻(Oryza Sativa japonica)
<400> 5
Met Cys Ser Ala Ala Thr Pro Asn Ser Gly Asp Val Arg Ala Thr Pro
1 5 10 15
Gly Ser Ser Arg Pro His Val Val Leu Leu Pro Ser Ala Gly Met Gly
20 25 30
His Leu Val Pro Phe Thr Arg Leu Ala Ala Ala Leu Cys Ser Gly His
35 40 45
Gly Cys Asp Val Ser Leu Val Ala Ala Val Pro Thr Val Ser Ser Ala
50 55 60
Glu Ala Arg His Leu Ala Ala His Phe Thr Ala Phe Pro Ala Val Arg
65 70 75 80
Arg Leu Glu Leu Asp Leu Ala Ser Leu Asp Val Ser Glu Phe Ala Gly
85 90 95
Ala Asp Pro Phe Tyr Val Arg Tyr Glu Ala Ile Arg Arg Ser Ala Ser
100 105 110
Leu Leu Ala Pro Leu Leu Ala Gly Gly Ala Ser Ala Ala Ala Ser Ala
115 120 125
Leu Val Ala Asp Ile Ala Leu Ala Ser Val Val Ile Pro Val Ala Lys
130 135 140
Asp Leu Arg Leu Pro Cys Tyr Val Phe Phe Thr Ala Ser Ala Thr Met
145 150 155 160
Phe Ser Phe Leu Ala Tyr Leu Pro Thr Tyr Leu Asp Ala Asn Ala Gly
165 170 175
Gly Gly His Ala Ile Gly Asp Val Asp Val Pro Gly Val Cys Arg Val
180 185 190
Pro Thr Ser Ser Val Pro Gln Ala Leu His Asp Pro Asp Asp Ile Phe
195 200 205
Thr Arg Gln Phe Ile Ala Asn Ala Arg Ser Leu Ala Asn Ala Asp Gly
210 215 220
Leu Val Val Asn Ala Phe Asp Ala Leu Glu Pro Glu Ala Val Ala Ala
225 230 235 240
Leu Arg Gln Gly Thr Val Ala Ala Gly Leu Pro Pro Val Phe Ala Val
245 250 255
Gly Pro Leu Ser Pro Ala Pro Ile Pro Ala Lys Asp Ser Gly Ser Tyr
260 265 270
Leu Pro Trp Leu Asp Ala Gln Pro Ala Arg Ser Val Val Tyr Val Ser
275 280 285
Phe Gly Ser Arg Lys Ala Leu Pro Arg Asp Gln Leu Ser Glu Leu Ala
290 295 300
Ala Gly Leu Glu Ala Ser Gly His Arg Phe Leu Trp Val Val Lys Gly
305 310 315 320
Ala Val Val Asp Arg Asp Asp Ala Gly Glu Leu Thr Asp Leu Leu Gly
325 330 335
Glu Ala Phe Leu Gln Arg Ile His Gly Arg Gly Leu Val Thr Met Ala
340 345 350
Trp Val Arg Gln Glu Glu Val Leu Asn His Pro Ser Val Gly Leu Phe
355 360 365
Ile Ser His Cys Gly Trp Asn Ser Val Thr Glu Ala Ala Ala Ser Gly
370 375 380
Val Pro Val Val Ala Trp Pro Arg Phe Ala Asp Gln Arg Val Asn Ala
385 390 395 400
Gly Val Val Ala Arg Ala Gly Ile Gly Val Trp Val Asp Thr Trp Ser
405 410 415
Trp Glu Gly Glu Asp Asp Gly Val Val Ser Ala Glu Asp Ile Ala Gly
420 425 430
Lys Val Arg Ser Ala Met Ala Asp Glu Gly Val Arg Lys Ala Ala Ala
435 440 445
Ser Val Arg Glu Ala Ala Ala Arg Ala Val Ala Ala Gly Gly Ser Ser
450 455 460
Tyr Arg Ser Leu Ala Glu Leu Val Arg Arg Cys Arg Asp Gly Leu Val
465 470 475 480
Ile Thr Asn Gly Met
485
<210> 6
<211> 487
<212> PRT
<213> 高粱(Sorghum bicolor)
<400> 6
Met Ala Pro Pro Ala Thr Lys Ser Leu Gly Glu Leu Asp Gly Gly Ala
1 5 10 15
Arg Pro His Val Met Phe Ile Pro Ser Ala Gly Met Gly His Leu Leu
20 25 30
Pro Phe Phe Arg Val Ile Ala Ala Leu Ala Ala His Asp Val Val Asp
35 40 45
Ile Ser Val Val Thr Val Leu Pro Thr Val Ser Ala Ala Glu Ala Asp
50 55 60
His Phe Ala Ser Leu Phe Ala Ala Leu Pro Arg Val Ser Arg Val Asp
65 70 75 80
Phe His Leu Leu Pro Phe Asp Ala Ser Ser Glu Phe Pro Gly His Asp
85 90 95
Pro Phe Leu Leu Arg Trp Glu Ala Leu Arg Arg Ser Ala His Leu Phe
100 105 110
Arg Pro Leu Ile Ala Gly Ala Ala Gly Pro Arg Val Ser Ala Val Val
115 120 125
Thr Asp Val Thr Leu Thr Ser His Val Ile Pro Ile Ala Lys Glu Leu
130 135 140
Gly Val Gln Cys His Val Leu Phe Val Ser Cys Ala Thr Met Leu Ser
145 150 155 160
Leu Ala Ala Tyr Thr Pro Val His Leu Asp Lys Lys Asn Lys Gly Glu
165 170 175
His Gly Pro Gly Val Gly Val Gly Val Gly Val Gly Asp Val Asp Ile
180 185 190
Pro Gly Val Arg Arg Ile Pro Gln Ser Tyr Leu Pro Gln Pro Leu Leu
195 200 205
Asp Leu Asn Lys Leu Phe Thr Lys Gln Phe Ile Asp Asn Gly Arg Glu
210 215 220
Ile Ile Asn Ala Asp Gly Phe Leu Val Asn Thr Phe Asp Ala Leu Glu
225 230 235 240
Pro Val Ala Leu Ala Ala Leu Arg Asp Gly Lys Val Val Ala Gly Phe
245 250 255
Pro Pro Val Tyr Ala Ile Gly Pro Leu Arg Ser Lys Glu Glu Glu Ala
260 265 270
Thr Thr Gly Ser Pro Pro Val Ala Trp Leu Asp Glu Gln Pro Ala Arg
275 280 285
Ser Val Val Tyr Val Ala Phe Gly Asn Arg Asn Ala Val Ser Leu Glu
290 295 300
Gln Ile Arg Glu Ile Ala Ala Gly Leu Glu Ala Ser Gly Cys Arg Phe
305 310 315 320
Leu Trp Val Leu Lys Thr Thr Thr Val Asp Arg Asp Asp Thr Ala Glu
325 330 335
Leu Thr Asp Asp Val Leu Gly Glu Gly Phe Leu Glu Arg Val Gln Gly
340 345 350
Arg Gly Leu Val Thr Lys Ala Trp Val Asp Gln Glu Ala Val Leu Lys
355 360 365
His Ala Ser Val Gly Leu Phe Leu Ser His Ser Gly Trp Asn Ser Val
370 375 380
Thr Glu Ala Ala Ala Ala Gly Val Pro Leu Leu Ala Trp Pro Arg Gly
385 390 395 400
Gly Asp His Arg Val Asn Ala Thr Val Val Val Ser Gly Gly Val Gly
405 410 415
Val Trp Met Glu Gln Trp Ser Trp Asp Gly Glu Asp Trp Leu Val Thr
420 425 430
Gly Glu Glu Ile Gly Lys Lys Val Lys Glu Val Met Ser Asp Ala Ala
435 440 445
Val Arg Ala Arg Ala Thr Arg Thr Gly Glu Glu Ala Ala Lys Ala Val
450 455 460
Ala Glu Gly Gly Thr Ser Tyr Arg Ser Met Gln Lys Phe Ile Ser Ser
465 470 475 480
Leu Lys Ala His Cys Ser Pro
485
<210> 7
<211> 476
<212> PRT
<213> 高粱(Sorghum bicolor)
<400> 7
Met Ala Pro Ser Ala Met Pro Ala Ser Gly Asp His Thr Gly Ala Thr
1 5 10 15
Pro His Val Val Leu Leu Pro Ser Ala Gly Met Gly His Leu Val Pro
20 25 30
Phe Ala Arg Leu Ala Val Ala Leu Ser Glu Gly His Gly Cys Asp Val
35 40 45
Ser Phe Ala Ala Val Leu Pro Thr Val Ser Ser Ala Glu Ser Arg His
50 55 60
Leu Arg Ala Leu Phe Ala Ala Ala Pro Ala Val Arg Arg Leu Asp Phe
65 70 75 80
Arg Leu Ala Pro Phe Asp Glu Ser Gln Phe Pro Gly Ala Asp Pro Phe
85 90 95
Phe Leu Arg Phe Glu Ala Leu Arg Arg Ser Ala Pro Leu Leu Gly Pro
100 105 110
Leu Leu Asp Ala Ala Gln Ala Ser Ala Leu Val Thr Asp Ile Val Leu
115 120 125
Ala Ser Val Val Leu Pro Val Ala Lys Ala Arg Gly Val Pro Cys Tyr
130 135 140
Val Leu Phe Thr Ser Ser Ala Ala Met Leu Ser Leu Cys Ala Tyr Phe
145 150 155 160
Pro Ala His Leu Asp Ala Asn Ala Ala Ala Gly Gly Gly Arg Leu Gly
165 170 175
Val Gly Asp Val Asp Ile Pro Gly Val Tyr Arg Ile Pro Lys Ser Ser
180 185 190
Val Pro Gln Ala Leu His Asp Pro Lys His Leu Phe Thr Gln Gln Phe
195 200 205
Val Ala Asn Gly Arg Gly Leu Val Ala Ala Asp Gly Ile Leu Val Asn
210 215 220
Thr Phe Asp Ala Phe Glu Pro Asp Ala Ile Thr Ala Leu Arg Gln Gly
225 230 235 240
Ser Val Val Ser Asp Phe Pro Pro Val Phe Ala Val Gly Pro Leu Gln
245 250 255
Pro Val Arg Phe Gln Val Ala Glu Lys Pro Ala His Tyr Met Arg Trp
260 265 270
Leu Ser Ala Gln Pro Ala Arg Ser Val Val Tyr Val Ser Phe Gly Ser
275 280 285
Arg Lys Ala Ile Ser Thr Asp Gln Leu Arg Glu Leu Ala Ala Gly Leu
290 295 300
Glu Ala Ser Gly Gln Arg Phe Leu Trp Val Val Lys Ser Thr Val Val
305 310 315 320
Asp Arg Asp Asp Ala Ala Asp Leu Ala Asp Leu Leu Gly Asp Gly Phe
325 330 335
Leu Glu Arg Val Gln Gly Arg Ala Phe Val Thr Lys Gly Trp Val Glu
340 345 350
Gln Glu Glu Ile Leu Gln His Gly Ser Val Gly Leu Phe Ile Ser His
355 360 365
Cys Gly Trp Asn Ser Val Thr Glu Ala Ala Ala Phe Gly Val Pro Val
370 375 380
Leu Ala Trp Pro Arg Phe Gly Asp Gln Arg Val Asn Ala Ala Val Val
385 390 395 400
Ala Arg Gly Gly Leu Gly Ala Trp Glu Glu Arg Trp Thr Trp Asp Gly
405 410 415
Glu Lys Gly Leu Val Thr Gly Glu Glu Val Ala Glu Lys Ile Asn Ala
420 425 430
Val Val Gly Asn Asp Val Val Ala Arg Lys Ala Ala Arg Val Gly Asp
435 440 445
Ala Ala Ala Ala Ala Ala Gly Lys Gly Gly Thr Ser Tyr Gln Ser Leu
450 455 460
Ala Asp Phe Val Gly Arg Cys Arg Asp Ala Gly Trp
465 470 475
<210> 8
<211> 472
<212> PRT
<213> 小麦(Triticum aestivum)
<400> 8
Met Pro Thr Ser Gly Asp Gly Pro Thr Ser Gln Pro His Val Val Leu
1 5 10 15
Leu Pro Ser Ala Gly Met Gly His Leu Val Pro Phe Ser Arg Leu Ala
20 25 30
Val Ala Leu Ser Ser Ala His Gly Cys Asp Val Ser Leu Val Thr Val
35 40 45
Leu Pro Thr Val Ser Ser Ala Glu Ser Ser His Leu Glu Ala Leu Phe
50 55 60
Gly Ala Phe Pro Ala Val Arg Arg Leu Glu Phe His Leu Ala Asp Phe
65 70 75 80
Asp Ala Ser Glu Phe Pro Asn Ala Asp Pro Phe Phe Leu Arg Phe Glu
85 90 95
Ala Met Arg Arg Ser Ala Pro Leu Leu Leu Gly Pro Leu Leu Ala Arg
100 105 110
Ala Ser Ala Thr Ala Leu Val Thr Asp Ile Ala Leu Ser Ser Val Val
115 120 125
Ile Pro Val Ala Lys Gln Leu Arg Leu Pro Cys Tyr Val Leu Phe Thr
130 135 140
Ala Ser Ala Ala Met Leu Ser Leu Cys Val His Phe Pro Ala Tyr Leu
145 150 155 160
Asp Ala Asn Gly Asn Gly Leu Val Gly Asp Val Asp Ile Pro Gly Val
165 170 175
Tyr Gln Ile Pro Lys Ala Ser Val Pro Gln Ala Leu His Asp Pro Lys
180 185 190
His Leu Phe Thr Arg Gln Phe Val Ala Asn Gly Arg Glu Leu Ala Lys
195 200 205
Ser Asp Gly Val Leu Val Asn Ser Phe Asp Ala Phe Glu Pro Glu Ala
210 215 220
Ile Ala Ala Leu Arg Glu Gly Ala Val Ser Ala Ala Gly Phe Phe Pro
225 230 235 240
Pro Val Phe Ser Val Gly Pro Leu Ala Pro Val Ser Phe Pro Ala Gly
245 250 255
Asn Asn Asn Arg Ala Asp Tyr Ile Gln Trp Leu Glu Ala Gln Pro Ala
260 265 270
Arg Ser Val Val Tyr Val Ser Phe Gly Ser Arg Lys Ala Val Ala Arg
275 280 285
Asp Gln Leu Arg Glu Leu Ala Ala Gly Leu Glu Ala Ser Gly His Arg
290 295 300
Phe Leu Trp Val Val Lys Ser Thr Val Val Asp Arg Asp Asp Asp Ala
305 310 315 320
Asp Leu Gly Glu Leu Leu Gly Glu Gly Phe Leu Glu Arg Val Gln Gly
325 330 335
Arg Gly Met Val Thr Lys Gly Trp Val Glu Gln Glu Asp Val Leu Lys
340 345 350
Gln Glu Ser Val Gly Leu Phe Ile Ser His Cys Gly Trp Asn Ser Val
355 360 365
Thr Glu Ala Ala Ala Gly Gly Leu Pro Val Leu Ala Trp Pro Arg Phe
370 375 380
Gly Asp Gln Arg Val Asn Ala Gly Val Val Ala Arg Ser Gly Leu Gly
385 390 395 400
Val Trp Val Asp Ser Trp Ser Trp Glu Gly Glu Glu Gly Val Val Ser
405 410 415
Gly Glu Ser Ile Ala Glu Lys Val Lys Ala Val Met Gly Asp Glu Ile
420 425 430
Ala Arg Asn Lys Ala Val Ser Val Arg Asp Ala Ala Ala Lys Ala Val
435 440 445
Ala Asp Gly Gly Thr Ser Tyr Arg Asn Leu Ala Arg Phe Ala Gln Arg
450 455 460
Cys Arg Asp Gly Arg Val Arg Glu
465 470
<210> 9
<211> 472
<212> PRT
<213> 小麦(Triticum aestivum)
<400> 9
Met Pro Thr Ser Gly Asp Gly Ser Gly Ala Leu Pro His Val Val Leu
1 5 10 15
Leu Pro Ser Ala Gly Met Gly His Leu Val Pro Phe Ser Arg Leu Ala
20 25 30
Val Ser Phe Ser Ser Ser Asp His Gly Cys Gly Val Ser Val Val Thr
35 40 45
Val Leu Pro Thr Val Ser Ser Ala Glu Ser Ala His Leu Asp Ala Leu
50 55 60
Phe Gly Ala Cys Pro Ala Val Arg Arg Leu Asp Phe His Leu Ala Arg
65 70 75 80
Phe Asp Ala Ser Glu Phe Pro Gly Ala Asp Pro Phe Phe Leu Arg Phe
85 90 95
Glu Ala Met Arg Arg Ser Ala Pro Leu Leu Gly Pro Leu Leu Ala Gly
100 105 110
Ala Gly Ala Ser Ala Leu Val Thr Asp Ile Ala Leu Ala Ser Val Val
115 120 125
Ile Pro Val Ala Arg Glu Leu Arg Leu Pro Cys Tyr Val Leu Phe Thr
130 135 140
Ala Ser Ala Ala Met Leu Ser Leu Cys Val His Phe Pro Ala Tyr Leu
145 150 155 160
Asp Ala Asn Ala Gly Gly Pro Val Gly Asp Val Asp Ile Pro Gly Val
165 170 175
Tyr Arg Val Pro Lys Ala Ser Ile Pro Gln Ala Leu His His Pro Glu
180 185 190
His Leu Phe Thr Arg Gln Phe Val Ala Asn Gly Arg Glu Leu Ala Lys
195 200 205
Ser Asp Gly Leu Leu Val Asn Ser Phe Asp Glu Phe Glu Pro Glu Ala
210 215 220
Ile Ser Ala Leu Arg Asp Gly Ser Val Ala Ala Gly Phe Pro Pro Val
225 230 235 240
Phe Ser Val Gly Pro Leu Ala Pro Val Ser Phe Ser Ala Gly Glu Pro
245 250 255
Pro Glu Asn Gln Ala Asp Tyr Met Arg Trp Leu Glu Ala Gln Pro Thr
260 265 270
Arg Ser Val Val Tyr Val Ser Phe Gly Ser Arg Lys Ala Ile Ser Lys
275 280 285
Asp Gln Leu Lys Glu Leu Ala Val Gly Leu Glu Ala Ser Gly His Arg
290 295 300
Phe Leu Trp Val Val Lys Ser Thr Val Val Asp Arg Glu Asp Glu Ala
305 310 315 320
Glu Leu Ser Glu Leu Leu Gly Glu Gly Phe Leu Glu Arg Val His Gly
325 330 335
Arg Gly Met Val Thr Lys Gly Trp Val Glu Gln Glu Glu Val Leu Lys
340 345 350
Gln Glu Ser Ile Gly Leu Phe Ile Ser His Cys Gly Trp Asn Ser Val
355 360 365
Thr Glu Ala Ala Ala Asn Gly Leu Pro Val Leu Ala Trp Pro Arg Phe
370 375 380
Gly Asp Gln Arg Val Asn Ala Gly Val Val Ala Arg Ser Gly Leu Gly
385 390 395 400
Val Trp Glu Glu Arg Trp Ser Trp Glu Gly Glu Glu Gly Val Val Ser
405 410 415
Gly Glu Asn Ile Ala Glu Lys Val Lys Ala Val Met Ala Asp Glu Thr
420 425 430
Val Arg Asn Lys Ala Val Ser Val Gln Asp Ala Ala Ala Lys Ala Val
435 440 445
Ala Asp Gly Gly Thr Ser Tyr Arg Ser Leu Ala Gln Phe Val Gln Arg
450 455 460
Cys Arg Asp Leu Ser Val Ser Lys
465 470
<210> 10
<211> 474
<212> PRT
<213> 小麦(Triticum aestivum)
<400> 10
Met Pro Thr Ser Gly Asp Ala Ser Gly Ala Leu Pro His Pro His Val
1 5 10 15
Val Leu Leu Pro Ser Ala Gly Met Gly His Leu Val Pro Phe Ser Arg
20 25 30
Leu Ala Val Ser Leu Ser Ser Pro Gly His Gly Cys Gly Val Ser Val
35 40 45
Ala Thr Val Leu Pro Thr Val Ser Ser Ala Glu Ser Ala His Leu Asp
50 55 60
Ala Leu Phe Gly Ala Cys Pro Ala Val Arg Arg Leu Asp Phe His Leu
65 70 75 80
Ala Pro Phe Asp Ala Ser Glu Phe Pro Gly Ala Asp Pro Phe Phe Leu
85 90 95
Arg Phe Glu Ala Met Arg Arg Ser Ala Pro Leu Leu Gly Pro Leu Leu
100 105 110
Ala Gly Ala Gly Ala Ser Ala Leu Val Thr Asp Ile Ala Leu Ala Ser
115 120 125
Val Val Ile Pro Val Ala Arg Asp Leu Arg Leu Pro Cys Tyr Val Leu
130 135 140
Phe Thr Ala Ser Ala Ala Met Leu Ser Leu Cys Val His Phe Pro Ala
145 150 155 160
Tyr Leu Asp Ala Asn Ala Gly Gly Pro Val Gly Asp Val Gly Ile Pro
165 170 175
Gly Val Tyr Arg Val Pro Lys Ala Ser Ile Pro Gln Ala Leu His His
180 185 190
Pro Glu His Leu Phe Thr Gln Gln Phe Val Ala Asn Gly Arg Glu Leu
195 200 205
Ala Lys Ala Asp Gly Leu Leu Val Asn Ser Phe Asp Ala Phe Glu Pro
210 215 220
Glu Ala Ile Ala Ala Leu Arg Asn Gly Ser Val Ala Ala Gly Phe Pro
225 230 235 240
Pro Val Phe Ser Val Gly Pro Leu Ala Pro Val Ser Phe Ser Ala Ser
245 250 255
Glu Pro Pro Glu Asn Gln Ala Asp Tyr Met Arg Trp Leu Glu Ala Gln
260 265 270
Pro Ala Arg Ser Val Val Tyr Val Ser Phe Gly Ser Arg Lys Ala Ile
275 280 285
Ser Lys Asp Gln Leu Arg Glu Leu Ala Val Gly Leu Glu Ala Ser Gly
290 295 300
His Arg Phe Leu Trp Val Val Lys Ser Thr Val Val Asp Arg Asp Asp
305 310 315 320
Glu Ala Glu Leu Ser Glu Leu Leu Gly Glu Gly Phe Leu Glu Arg Val
325 330 335
Gln Gly Arg Gly Met Val Thr Lys Gly Trp Val Glu Gln Glu Glu Val
340 345 350
Leu Lys Gln Glu Ser Ile Gly Leu Phe Ile Ser His Cys Gly Trp Asn
355 360 365
Ser Val Thr Glu Ala Ala Ala Asn Gly Leu Pro Val Leu Ala Trp Pro
370 375 380
Arg Phe Gly Asp Gln Arg Val Asn Ala Gly Val Val Ala Arg Ser Gly
385 390 395 400
Leu Gly Val Trp Glu Glu Arg Trp Ser Trp Glu Gly Glu Glu Gly Thr
405 410 415
Val Ser Gly His Asn Ile Ala Glu Lys Val Lys Thr Val Met Ala Asp
420 425 430
Lys Thr Val Arg Asn Lys Ala Val Ser Val Gln Asp Ala Ala Ala Glu
435 440 445
Ala Val Ala Asp Gly Gly Thr Ser Tyr Arg Ser Leu Ala Gln Phe Val
450 455 460
Gln Arg Cys Arg Asp Leu Ser Val Ser Lys
465 470
<210> 11
<211> 469
<212> PRT
<213> 小麦(Triticum aestivum)
<400> 11
Met Ala Ser Ser Ser Arg Asp Asp Arg Ala Gly Ala Ala Ala Pro Arg
1 5 10 15
Pro Arg Ile Val Leu Leu Pro Ser Ala Gly Met Gly His Leu Ala Pro
20 25 30
Phe Ser Arg Leu Ala Ala Ala Leu Ser Ser Gly His Ala Cys Asp Val
35 40 45
Ser Leu Val Thr Val Leu Pro Thr Val Ser Ser Ala Glu Ser Gly Gln
50 55 60
Leu Asp Ala Leu Phe Ala Ala Phe Pro Ala Val Arg Arg Leu Asp Phe
65 70 75 80
His Leu Pro Pro Leu Asp Ala Pro Glu Leu Ser Gly Ala Asp Pro Phe
85 90 95
Tyr Val His Tyr Glu Ala Thr Arg Arg Ser Ala Arg Leu Leu Ala Pro
100 105 110
Leu Leu Ala Ala Ala Asp Ala Ser Ala Leu Ile Ala Asp Ile Ser Leu
115 120 125
Ala Ser Val Leu Ile Pro Val Ala Ser Glu Leu Arg Leu Pro Cys Tyr
130 135 140
Val Phe Phe Thr Ala Ser Ala Thr Met Phe Ser Phe Tyr Ala Tyr Tyr
145 150 155 160
Pro Thr Tyr Leu Asp Ala Thr Gly Ala Gly Asp Ala Asp Val Pro Gly
165 170 175
Val Tyr Arg Ile Pro Lys Ser Ser Phe Pro Gln Ala Leu His Asp Arg
180 185 190
Asn Asn Leu Phe Thr Gln Gln Phe Val Ala Asn Gly Arg Ser Leu Ser
195 200 205
Lys Ala Asp Gly Leu Leu Ile Asn Thr Phe Asp Asp Leu Glu Pro Glu
210 215 220
Ala Val Thr Ala Leu Arg Gln Gly Ser Val Val Pro Gly Phe Pro Pro
225 230 235 240
Val Phe Thr Val Gly Pro Leu Ser Pro Val Ser Phe Pro Ala Arg Ala
245 250 255
Ser Ser Asp Tyr Ser Ala Trp Leu Asp Ala Gln Pro Glu Arg Ser Val
260 265 270
Val Tyr Val Ser Phe Gly Ser Arg Lys Ala Leu Ala Arg Asp Gln Leu
275 280 285
Ser Glu Leu Ala Asp Gly Leu Glu Ala Ser Gly Cys Arg Phe Leu Trp
290 295 300
Val Val Lys Gly Ala Val Val Asp Lys Asp Asp Gly Ala Glu Leu Ser
305 310 315 320
Glu Leu Leu Gly Glu Gly Phe Leu Gln Arg Val Ser Gly Arg Ala Leu
325 330 335
Val Thr Lys Ala Trp Val Glu Gln Gly Glu Val Leu Lys His Pro Ala
340 345 350
Ile Gly Met Phe Val Ser His Cys Gly Trp Asn Ser Leu Thr Glu Ala
355 360 365
Phe Ala Thr Gly Val Pro Val Leu Ala Trp Pro Arg Phe Ala Asp Gln
370 375 380
Arg Val Asn Ala Gly Ile Val Ala Arg Cys Gly Ala Gly Val Trp Val
385 390 395 400
Glu Arg Trp Ser Trp Glu Gly Asp Asp Gly Val Val Lys Gly Glu Glu
405 410 415
Ile Ala Glu Lys Val Lys Ser Val Met Ala Asp Glu Met Leu Arg Arg
420 425 430
Ser Ser Thr Val Val Arg Glu Ala Ala Thr Thr Ala Val Ala Gly Gly
435 440 445
Gly Thr Ser Tyr Arg Ser Leu Ala Glu Leu Val Ala Arg Cys Cys His
450 455 460
Gly Ser Ala Leu Gln
465
<210> 12
<211> 469
<212> PRT
<213> 小麦(Triticum aestivum)
<400> 12
Met Ala Ser Ser Pro Arg Asp Asp Arg Ala Gly Ala Ala Ala Pro Arg
1 5 10 15
Pro Arg Ile Val Leu Leu Pro Ser Ala Ser Met Gly His Leu Ala Pro
20 25 30
Phe Ser Arg Leu Ala Ala Ala Leu Ser Ser Gly His Ala Cys Asp Val
35 40 45
Ser Leu Val Thr Val Leu Pro Thr Val Ser Ser Ala Glu Ser Gly Gln
50 55 60
Leu Asp Ala Leu Phe Ala Ala Phe Pro Ala Val Arg Arg Leu Asp Phe
65 70 75 80
Gln Leu Pro Pro Leu Asp Ala Pro Glu Leu Ser Gly Ala Asp Pro Phe
85 90 95
Tyr Val His Tyr Glu Ala Thr Arg Arg Ser Ala Arg Leu Leu Ala Pro
100 105 110
Leu Leu Ala Ala Ala Asp Ala Ser Val Leu Val Ala Asp Ile Ser Leu
115 120 125
Ala Ser Val Leu Ile Pro Val Ala Ser Glu Leu Arg Leu Pro Cys Tyr
130 135 140
Val Phe Phe Thr Ala Ser Ala Thr Met Phe Ser Phe Tyr Ala Tyr Tyr
145 150 155 160
Pro Thr Tyr Leu Asp Ala Ala Gly Ala Gly Asp Ala Asp Val Pro Gly
165 170 175
Val Tyr Arg Ile Pro Lys Ser Ser Phe Pro Gln Ala Leu His Asp Arg
180 185 190
Asn Asn Leu Phe Thr Gln Gln Phe Val Ala Asn Gly Arg Ser Leu Ser
195 200 205
Lys Ala Asp Gly Leu Leu Ile Asn Thr Phe Asp Ala Leu Glu Pro Glu
210 215 220
Ala Val Thr Ala Leu Arg Gln Gly Ser Val Val Pro Gly Cys Pro Pro
225 230 235 240
Val Phe Thr Val Gly Pro Leu Ser Pro Val Ser Phe Pro Ala Arg Ala
245 250 255
Ser Ala Asp Tyr Ser Ala Cys Leu Asp Ala Gln Pro Glu Arg Ser Val
260 265 270
Val Tyr Val Ser Phe Gly Ser Arg Lys Ala Leu Ala Arg Asp Gln Leu
275 280 285
Ser Glu Leu Ala Asp Gly Leu Glu Ala Ser Gly Cys Arg Phe Leu Trp
290 295 300
Val Val Lys Gly Ala Val Val Asp Lys Asp Asp Gly Ala Glu Leu Ser
305 310 315 320
Glu Leu Leu Gly Glu Gly Phe Leu Gln Arg Val Ser Gly Arg Ala Leu
325 330 335
Val Thr Lys Ala Trp Val Glu Gln Gly Glu Val Leu Lys His Pro Ala
340 345 350
Ile Gly Met Phe Val Ser His Cys Gly Trp Asp Ser Leu Thr Glu Ala
355 360 365
Phe Ala Thr Gly Val Pro Val Leu Ala Trp Pro Arg Phe Ala Asp Gln
370 375 380
Arg Val Asn Ala Gly Ile Val Ala Arg Cys Gly Ala Gly Val Trp Val
385 390 395 400
Glu Arg Trp Ser Trp Glu Gly Asp Glu Gly Val Val Lys Gly Glu Glu
405 410 415
Ile Ala Glu Lys Val Lys Ser Val Met Ala Asn Glu Met Leu Arg Arg
420 425 430
Ser Ser Thr Met Val Arg Glu Ala Ala Met Thr Ala Val Ala Gly Gly
435 440 445
Gly Thr Ser Tyr Arg Ser Leu Ala Glu Leu Val Ala Arg Cys Cys Asp
450 455 460
Gly Ser Ala Ser Gln
465
<210> 13
<211> 474
<212> PRT
<213> 小麦(Triticum aestivum)
<400> 13
Met Ala Ser Ser Ser Arg Asp Asp Arg Ala Gly Ala Ala Ala Pro Arg
1 5 10 15
Pro Arg Ile Val Leu Ile Pro Ser Ala Gly Met Gly His Leu Ala Pro
20 25 30
Phe Ser Arg Leu Ala Ala Ala Leu Ser Ser Gly His Thr Cys Asn Val
35 40 45
Ser Leu Val Thr Val Leu Pro Thr Val Ser Ser Ala Glu Ser Gly His
50 55 60
Leu Asp Ala Leu Phe Ala Ala Phe Pro Ala Val Arg Arg Leu Asp Phe
65 70 75 80
Gln Leu Pro Pro Leu Asp Ala Pro Glu Leu Ser Gly Ala Asp Pro Phe
85 90 95
Tyr Val His Tyr Glu Ala Thr Arg Arg Ser Ala Arg Leu Leu Ala Pro
100 105 110
Leu Leu Ala Ala Ala Asp Ala Ser Ala Leu Val Ala Asp Ile Ser Leu
115 120 125
Ala Ser Val Leu Ile Pro Val Ala Ser Glu Leu Arg Leu Pro Cys Tyr
130 135 140
Val Phe Phe Thr Ala Ser Ala Thr Met Phe Ser Phe Tyr Ala Tyr Tyr
145 150 155 160
Pro Thr Tyr Leu Asp Ala Ala Gly Ala Gly Asp Ala Asp Val Pro Gly
165 170 175
Val Tyr Arg Ile Pro Lys Ser Ser Phe Pro Gln Ala Leu His Asp Arg
180 185 190
Asn Asn Leu Phe Thr Gln Gln Phe Val Ala Asn Gly Gln Ser Leu Ser
195 200 205
Lys Ala Asp Gly Leu Leu Ile Asn Thr Phe Asp Ala Leu Glu Pro Glu
210 215 220
Ala Val Thr Ala Leu Arg Gln Gly Ser Val Val Pro Gly Phe Pro Pro
225 230 235 240
Val Phe Asn Val Gly Pro Leu Ser Pro Val Ser Phe Pro Ala Arg Ala
245 250 255
Ser Ser Asp Tyr Ser Ala Trp Leu Asp Ala Gln Pro Glu Arg Ser Val
260 265 270
Val Tyr Val Ser Phe Gly Ser Arg Lys Ala Leu Ala Arg Asp Gln Leu
275 280 285
Ser Glu Leu Ala Asp Gly Leu Glu Ala Ser Gly Cys Arg Phe Leu Trp
290 295 300
Val Val Lys Gly Thr Val Val Asp Lys Asp Asp Gly Ala Glu Leu Ser
305 310 315 320
Glu Leu Leu Gly Glu Gly Phe Leu Gln Arg Val Ser Gly Arg Ala Leu
325 330 335
Val Thr Lys Ala Trp Val Glu Gln Gly Glu Val Leu Lys His Pro Ala
340 345 350
Ile Gly Met Phe Val Ser His Cys Gly Trp Asn Ser Leu Thr Glu Ala
355 360 365
Phe Ala Ser Gly Val Pro Val Leu Ala Trp Pro Arg Phe Ala Asp Gln
370 375 380
Arg Val Asn Ala Gly Ile Val Ala Arg Arg Gly Ala Gly Val Trp Val
385 390 395 400
Glu Arg Trp Ser Trp Glu Gly Asp Asp Gly Val Val Lys Gly Glu Glu
405 410 415
Ile Ala Glu Lys Val Lys Ser Val Met Ala Asp Glu Met Leu Arg Arg
420 425 430
Ser Ser Thr Val Val Arg Glu Ala Ala Met Thr Ala Val Ala Gly Gly
435 440 445
Gly Thr Ser Tyr Arg Ser Leu Ala Glu Leu Val Ala Arg Cys Cys Asp
450 455 460
Gly Ser Ala Ser Asn Ala Pro Ser Glu Ala
465 470
<210> 14
<211> 479
<212> PRT
<213> 玉米(Zea mays)
<400> 14
Met Ser Ser Pro Ala Pro Ser Ser Ala Ser Arg Ser Ser His Gly Ser
1 5 10 15
Arg Gly Ser Pro Arg Ile Val Leu Phe Pro Ser Ala Gly Met Gly His
20 25 30
Leu Val Pro Phe Thr Arg Leu Ala Val Ala Leu Ser Ala Gly His Gly
35 40 45
Cys Glu Ile Ser Leu Leu Thr Ala Leu Pro Thr Val Ser Ser Ala Glu
50 55 60
Ser Arg His Ile Ala Ala Leu Tyr Ala Ala Phe Pro Ala Ile Arg Gln
65 70 75 80
Leu Asp Leu Arg Phe Ala Pro Phe Asp Ala Ser Ser Glu Phe Pro Gly
85 90 95
Ala Asp Pro Phe Tyr Leu Arg Tyr Glu Ala Leu Arg Arg Cys Ala Pro
100 105 110
Ser Leu Leu Gly Pro Leu Leu Ala Gly Ala Gly Ala Ser Ala Leu Val
115 120 125
Val Asp Met Ala Leu Ala Ser Val Ala Ile Pro Val Ala Arg Glu Leu
130 135 140
His Val Pro Cys Phe Val Phe Phe Thr Ala Ser Ala Thr Met Leu Ser
145 150 155 160
Phe Lys Ala Tyr Phe Pro Thr Tyr Leu Asp Asp Val Gly Ala Gly His
165 170 175
Gly Val Gly Asp Val Asp Val Pro Gly Val Tyr Arg Ile Pro Ser Ser
180 185 190
Ser Val Pro Gln Ala Leu His Asp Pro Asp Asn Ile Phe Thr Arg Gln
195 200 205
Phe Val Ala Asn Gly Arg Ala Leu Ala Thr Ala Asp Gly Leu Leu Val
210 215 220
Asn Ala Phe His Ala Met Glu Pro Glu Ala Val Glu Ala Leu Gln Gly
225 230 235 240
Arg Phe Val Leu Ser Val Leu Pro Pro Val Phe Ala Val Gly Pro Leu
245 250 255
Met Pro Val Asn Asp Leu Arg Glu Thr Gly Glu Ala Ala Gln Lys Gln
260 265 270
Gly Asn Tyr Arg Ala Trp Leu Asp Glu Gln Pro Pro Arg Ser Val Val
275 280 285
Tyr Val Ser Phe Gly Ser Arg Lys Ala Leu Pro Lys Asp Gln Ile Lys
290 295 300
Glu Leu Ala Ala Gly Leu Glu Ala Cys Gly His Arg Phe Leu Trp Val
305 310 315 320
Val Lys Gly Ala Val Val Asp Arg Asp Asp Ala Gly Glu Leu Ser Glu
325 330 335
Leu Leu Gly Glu Ala Phe Leu Arg Arg Val His Gly Arg Gly Leu Val
340 345 350
Thr Lys Ser Trp Val Glu Gln Glu Glu Val Leu Arg His Pro Ala Val
355 360 365
Ala Leu Phe Val Ser His Cys Gly Trp Asn Ser Val Thr Glu Ala Val
370 375 380
Ser Ser Gly Val Pro Val Leu Ala Trp Pro Arg Phe Ala Asp Gln Arg
385 390 395 400
Val Asn Ala Arg Val Val Val Arg Cys Gly Leu Gly Val Trp Ala Asp
405 410 415
Gln Trp Ser Trp Glu Gly Glu Glu Ala Leu Val Arg Ala Glu Glu Ile
420 425 430
Thr Ala Leu Val Met Glu Ala Met Glu Asp Asp Ala Met Ala Val Lys
435 440 445
Ala Ala Asn Val Arg Glu Ala Ala Ser Arg Ala Val Val Asp Gly Gly
450 455 460
Thr Ser Tyr Arg Ser Leu Ala Ala Phe Val Arg Arg Cys Thr Ala
465 470 475
<210> 15
<211> 479
<212> PRT
<213> 玉米(Zea mays)
<400> 15
Met Ser Ser Pro Ala Pro Ser Ser Pro Ser Arg Ser Ser His Gly Ser
1 5 10 15
Arg Ser Ser Pro Arg Ile Val Leu Phe Pro Ser Ala Gly Met Gly His
20 25 30
Leu Val Pro Phe Thr Arg Leu Ala Val Ala Leu Ser Ala Gly His Gly
35 40 45
Cys Asp Ile Ser Leu Val Thr Ala Leu Pro Thr Val Ser Ser Ala Glu
50 55 60
Ser Arg His Ile Ala Ala Leu Tyr Ala Ala Phe Pro Ala Ile Arg Gln
65 70 75 80
Leu Asp Leu Arg Phe Ala Pro Phe Asp Ala Ser Ser Glu Phe Pro Gly
85 90 95
Ala Asp Pro Phe Tyr Leu Arg Tyr Glu Ala Leu Arg Arg Cys Ala Pro
100 105 110
Ser Leu Leu Gly Pro Leu Leu Ala Gly Ala Gly Ala Ser Ala Leu Val
115 120 125
Val Asp Met Ala Leu Ala Ser Val Ala Ile Pro Val Ala Arg Glu Leu
130 135 140
His Val Pro Cys Phe Val Phe Phe Thr Ala Ser Ala Thr Met Leu Ser
145 150 155 160
Phe Lys Ala Tyr Phe Pro Thr Tyr Leu Asp Asp Val Gly Ala Gly His
165 170 175
Gly Val Gly Asp Val Asp Val Pro Gly Val Tyr Arg Ile Pro Ser Ser
180 185 190
Ser Val Pro Gln Ala Leu His Asp Pro Asp Asn Ile Phe Thr Arg Gln
195 200 205
Phe Val Ala Asn Gly Arg Ala Leu Ala Thr Ala Asp Gly Leu Leu Val
210 215 220
Asn Ala Phe His Ala Met Glu Pro Glu Ala Val Glu Ala Leu Gln Gly
225 230 235 240
Arg Phe Val Leu Ser Val Leu Pro Pro Val Phe Ala Val Gly Pro Leu
245 250 255
Met Pro Val Asn Asp Leu Arg Glu Thr Gly Glu Ala Ala Gln Lys Gln
260 265 270
Gly Asn Tyr Arg Ala Trp Leu Asp Glu Gln Pro Pro Arg Ser Val Val
275 280 285
Tyr Val Ser Phe Gly Ser Arg Lys Ala Leu Pro Lys Asp Gln Ile Lys
290 295 300
Glu Leu Ala Ala Gly Leu Glu Ala Cys Gly His Arg Phe Leu Trp Val
305 310 315 320
Val Lys Gly Ala Val Val Asp Arg Asp Asp Ala Gly Glu Leu Ser Glu
325 330 335
Leu Leu Gly Glu Ala Phe Leu Arg Arg Val His Gly Arg Gly Leu Val
340 345 350
Thr Lys Ser Trp Val Glu Gln Glu Glu Val Leu Arg His Pro Ala Val
355 360 365
Ala Leu Phe Val Ser His Cys Gly Trp Asn Ser Val Thr Glu Ala Val
370 375 380
Ser Ser Gly Val Pro Val Leu Ala Trp Pro Arg Phe Ala Asp Gln Arg
385 390 395 400
Val Asn Ala Arg Val Val Val Arg Cys Gly Leu Gly Val Trp Ala Asp
405 410 415
Gln Trp Ser Trp Glu Gly Glu Glu Ala Leu Val Arg Ala Glu Glu Ile
420 425 430
Thr Ala Leu Val Met Glu Ala Met Glu Asp Asp Ala Met Ala Val Lys
435 440 445
Ala Ala Asn Val Arg Glu Ala Ala Ser Arg Ala Val Val Asp Gly Gly
450 455 460
Thr Ser Tyr Arg Ser Leu Ala Ala Phe Val Arg Arg Cys Thr Ala
465 470 475
<210> 16
<211> 472
<212> PRT
<213> 二穗短柄草(Brachypodium distachyon)
<400> 16
Met Pro Thr Ser Gly Asp Gly Pro Thr Ser Gln Pro His Val Val Leu
1 5 10 15
Leu Pro Ser Ala Gly Met Gly His Leu Val Pro Phe Ser Arg Leu Ala
20 25 30
Val Ala Leu Ser Ser Ala His Gly Cys Asp Val Ser Leu Val Thr Val
35 40 45
Leu Pro Thr Val Ser Ser Ala Glu Ser Ser His Leu Glu Ala Leu Phe
50 55 60
Gly Ala Phe Pro Ala Val Arg Arg Leu Glu Phe His Leu Ala Asp Phe
65 70 75 80
Asp Ala Ser Glu Phe Pro Asn Ala Asp Pro Phe Phe Leu Arg Phe Glu
85 90 95
Ala Met Arg Arg Ser Ala Pro Leu Leu Leu Gly Pro Leu Leu Ala Arg
100 105 110
Ala Ser Ala Thr Ala Leu Val Thr Asp Ile Ala Leu Ser Ser Val Val
115 120 125
Ile Pro Val Ala Lys Gln Leu Arg Leu Pro Cys Tyr Val Leu Phe Thr
130 135 140
Ala Ser Ala Ala Met Leu Ser Leu Cys Val His Phe Pro Ala Tyr Leu
145 150 155 160
Asp Ala Asn Gly Asn Gly Leu Val Gly Asp Val Asp Ile Pro Gly Val
165 170 175
Tyr Gln Ile Pro Lys Ala Ser Val Pro Gln Ala Leu His Asp Pro Lys
180 185 190
His Leu Phe Thr Arg Gln Phe Val Ala Asn Gly Arg Glu Leu Ala Lys
195 200 205
Ser Asp Gly Val Leu Val Asn Ser Phe Asp Ala Phe Glu Pro Glu Ala
210 215 220
Ile Ala Ala Leu Arg Glu Gly Ala Val Ser Ala Ala Gly Phe Phe Pro
225 230 235 240
Pro Val Phe Ser Val Gly Pro Leu Ala Pro Val Ser Phe Pro Ala Gly
245 250 255
Asn Asn Asn Arg Ala Asp Tyr Ile Gln Trp Leu Glu Ala Gln Pro Ala
260 265 270
Arg Ser Val Val Tyr Val Ser Phe Gly Ser Arg Lys Ala Val Ala Arg
275 280 285
Asp Gln Leu Arg Glu Leu Ala Ala Gly Leu Glu Ala Ser Gly His Arg
290 295 300
Phe Leu Trp Val Val Lys Ser Thr Val Val Asp Arg Asp Asp Asp Ala
305 310 315 320
Asp Leu Gly Glu Leu Leu Gly Glu Gly Phe Leu Glu Arg Val Gln Gly
325 330 335
Arg Gly Met Val Thr Lys Gly Trp Val Glu Gln Glu Asp Val Leu Lys
340 345 350
Gln Glu Ser Val Gly Leu Phe Ile Ser His Cys Gly Trp Asn Ser Val
355 360 365
Thr Glu Ala Ala Ala Gly Gly Leu Pro Val Leu Ala Trp Pro Arg Phe
370 375 380
Gly Asp Gln Arg Val Asn Ala Gly Val Val Ala Arg Ser Gly Leu Gly
385 390 395 400
Val Trp Val Asp Ser Trp Ser Trp Glu Gly Glu Glu Gly Val Val Ser
405 410 415
Gly Glu Ser Ile Ala Glu Lys Val Lys Ala Val Met Gly Asp Glu Ile
420 425 430
Ala Arg Asn Lys Ala Val Ser Val Arg Asp Ala Ala Ala Lys Ala Val
435 440 445
Ala Asp Gly Gly Thr Ser Tyr Arg Asn Leu Ala Arg Phe Ala Gln Arg
450 455 460
Cys Arg Asp Gly Arg Val Arg Glu
465 470
<210> 17
<211> 475
<212> PRT
<213> 谷子(Setaria italica)
<400> 17
Met Pro Thr Ser Gly Asp His Ser Gly Ala Arg Pro His Val Val Leu
1 5 10 15
Leu Pro Ser Ala Gly Met Gly His Leu Val Pro Phe Gly Arg Leu Ala
20 25 30
Val Ala Leu Ser Ala Gly His Gly Cys Asp Val Ser Val Ala Ala Val
35 40 45
Leu Pro Thr Val Ser Ser Ala Glu Ala Arg His Leu Glu Ala Leu Phe
50 55 60
Ala Ala Ala Asp Pro Ala Val Arg Arg Leu Asp Phe Arg Leu Ala Pro
65 70 75 80
Phe Asp Ala Ser Glu Phe Pro Gly Ala Asp Pro Phe Phe Leu Arg Phe
85 90 95
Glu Ala Met Arg Arg Ser Ala Pro Leu Leu Gly Pro Leu Leu Ala Thr
100 105 110
Ala Gly Ala Ser Ala Val Val Thr Asp Ile Val Leu Ala Ser Val Val
115 120 125
Leu Pro Val Ala Arg Glu Cys Gly Val Pro Cys Tyr Val Leu Phe Thr
130 135 140
Ala Ser Ala Ala Met Leu Ala Phe Cys Ala His Phe Pro Gly Tyr Leu
145 150 155 160
Asp Ala Asn Ser Ala Ala Gly Arg Ala Gly Val Val Gly Asp Val Asp
165 170 175
Ile Pro Gly Val Tyr Arg Ile Pro Lys Ser Ser Val Pro Gln Ala Leu
180 185 190
His Asp Pro Lys His Leu Phe Thr Gln Gln Phe Val Ala Asn Gly Arg
195 200 205
Gly Leu Val Asp Ala Asp Gly Ile Leu Val Asn Thr Phe Asp Ala Leu
210 215 220
Glu Pro Glu Ala Val Thr Ala Leu Arg Lys Gly Lys Val Val Ser Ser
225 230 235 240
Phe Pro Leu Val Phe Ala Val Gly Pro Leu Leu Pro Val Met Phe Pro
245 250 255
Ala Lys Asp Pro Ala Gly Tyr Met Gln Trp Leu Asp Ala Gln Pro Ala
260 265 270
Arg Ser Val Val Tyr Val Ser Phe Gly Ser Arg Thr Ala Ile Ser Pro
275 280 285
Asp Gln Leu Leu Glu Leu Ala Ala Gly Leu Glu Ala Ser Gly His Arg
290 295 300
Phe Leu Trp Val Val Lys Ser Thr Val Val Asp Arg Asp Asp Ala Gly
305 310 315 320
Glu Leu Gly Asp Leu Leu Gly His Gly Phe Leu Glu Arg Val Arg Gly
325 330 335
Arg Ala Leu Val Thr Lys Gly Trp Val Glu Gln Glu Glu Ile Leu Gln
340 345 350
His Gly Ser Val Gly Leu Phe Val Ser His Cys Gly Trp Asn Ser Val
355 360 365
Thr Glu Ala Ala Ala Phe Gly Val Pro Val Leu Ala Trp Pro Arg Phe
370 375 380
Gly Asp Gln Arg Ile Asn Ala Ala Val Val Thr Arg Gly Gly Leu Gly
385 390 395 400
Ala Trp Glu Glu Arg Trp Ser Trp Asp Gly Glu Glu Gly Leu Val Ser
405 410 415
Gly Glu Glu Val Gly Glu Lys Ile Lys Ala Val Met Ala Asp Glu Thr
420 425 430
Val Ala Lys Lys Ala Ala Ala Val Gly Asp Ala Ala Ala Ala Ala Ala
435 440 445
Thr Ser Lys Gly Gly Thr Ser Tyr Arg Ser Leu Ala Glu Phe Val Gly
450 455 460
Arg Cys Arg Asp Ala Gly Ser Arg Gln Asp Arg
465 470 475
<210> 18
<211> 494
<212> PRT
<213> 谷子(Setaria italica)
<400> 18
Met Ser Ser Pro Pro Pro Pro Asn Ser Thr Ser Asp Asp Cys Gln Gly
1 5 10 15
Thr Ala Ala Thr Pro His Ile Val Leu Phe Pro Ser Ala Gly Met Gly
20 25 30
His Leu Val Pro Phe Thr Arg Leu Ala Val Ala Leu Ser Ala Gly His
35 40 45
Cys Cys Asp Val Ser Leu Val Thr Ala Leu Pro Thr Val Ser Ser Ala
50 55 60
Glu Ser Cys His Ile Ala Ala Leu Phe Ala Ala Phe Pro Ala Val Arg
65 70 75 80
Arg Leu Asp Leu Arg Leu Ala Pro Leu Asp Ala Ser Ser Glu Phe Pro
85 90 95
Gly Ala Asp Pro Phe Tyr Val Arg Tyr Glu Ala Leu Arg Arg Ser Thr
100 105 110
Pro Leu Leu Leu Gly Pro Leu Leu Ala Gly Ala Ser Ala Ser Ala Leu
115 120 125
Val Ala Asp Ile Ala Leu Ala Ser Val Ala Ile Pro Val Ala Arg Glu
130 135 140
Leu Arg Val Pro Cys Tyr Val Phe Phe Thr Ala Ser Ala Thr Met Leu
145 150 155 160
Ser Phe Lys Ala Tyr Phe Pro Thr Tyr Leu Asp Ala Asn Gly Gly Ala
165 170 175
Gly His Ser Val Gly Asp Val Asp Val Pro Gly Val Cys Arg Val Pro
180 185 190
Arg Ser Ser Ile Pro Gln Ala Leu His Asp Pro Asp Asp Ile Phe Thr
195 200 205
Arg Gln Phe Val Ala Asn Gly Arg Ala Leu Val Ala Ala Asp Gly Leu
210 215 220
Leu Val Asn Ala Phe Glu Ala Met Glu Pro Glu Ala Val Ala Ala Leu
225 230 235 240
Leu Gly Gly Ser Val Val Ala Ser Leu Pro Pro Val Phe Ala Val Gly
245 250 255
Pro Leu Met Pro Leu Asn Leu Arg Glu Ala Ala Glu Glu Gln Gly Asn
260 265 270
Tyr Arg Ala Trp Leu Asp Ala Gln Pro Pro Arg Ser Val Val Tyr Val
275 280 285
Ser Phe Gly Ser Arg Lys Ala Leu Ala Arg Asp Gln Ile Arg Glu Leu
290 295 300
Ala Ala Trp Leu Glu Ala Cys Gly His Arg Phe Leu Trp Val Val Lys
305 310 315 320
Gly Ala Val Val Asp Arg Asp Asp Ala Cys Glu Leu Ser Asp Leu Leu
325 330 335
Gly Glu Gly Phe Gln Arg Arg Val Glu Gly Arg Gly Leu Val Thr Lys
340 345 350
Ser Trp Val Glu Gln Asp Glu Val Leu Arg His Pro Ala Val Gly Leu
355 360 365
Phe Val Ser His Cys Gly Trp Asn Ser Val Thr Glu Ala Ala Ala Asn
370 375 380
Gly Val Pro Val Leu Ala Trp Pro Arg Phe Ala Asp Gln Arg Val Asn
385 390 395 400
Ala Arg Val Val Ala Arg Ala Gly Phe Gly Val Trp Val Glu Arg Trp
405 410 415
Ser Trp Glu Gly Glu Glu Ala Val Val Gly Ala Glu Glu Ile Ala Glu
420 425 430
Gln Val Val Ala Ala Met Gly Asp Gln Ala Val Ala Glu Lys Ala Ala
435 440 445
Ser Val Arg Asp Glu Ala Ala Arg Ala Val Ala Asp Gly Gly Thr Ser
450 455 460
Gln Gln Ser Leu Ala Glu Phe Val Arg Arg Cys Arg Gly Gly Leu Ala
465 470 475 480
Gly Pro Gly Thr Asp Leu Gly Arg Thr Trp Thr Ala Arg Gly
485 490
<210> 19
<211> 471
<212> PRT
<213> 粳稻(Oryza Sativa japonica)
<400> 19
Met Pro Ser Ser Gly Asp Ala Ala Gly Arg Arg Pro His Val Val Leu
1 5 10 15
Ile Pro Ser Ala Gly Met Gly His Leu Val Pro Phe Gly Arg Leu Ala
20 25 30
Val Ala Leu Ser Ser Gly His Gly Cys Asp Val Ser Leu Val Thr Val
35 40 45
Leu Pro Thr Val Ser Thr Ala Glu Ser Lys His Leu Asp Ala Leu Phe
50 55 60
Asp Ala Phe Pro Ala Val Arg Arg Leu Asp Phe Glu Leu Ala Pro Phe
65 70 75 80
Asp Ala Ser Glu Phe Pro Ser Ala Asp Pro Phe Phe Leu Arg Phe Glu
85 90 95
Ala Met Arg Arg Ser Ala Pro Leu Leu Gly Pro Leu Leu Thr Gly Ala
100 105 110
Gly Ala Ser Ala Leu Ala Thr Asp Ile Ala Leu Thr Ser Val Val Ile
115 120 125
Pro Val Ala Lys Glu Gln Gly Leu Pro Cys His Ile Leu Phe Thr Ala
130 135 140
Ser Ala Ala Met Leu Ser Leu Cys Ala Tyr Phe Pro Thr Tyr Leu Asp
145 150 155 160
Ala Asn Ala Gly Asp Gly Gly Gly Val Gly Asp Val Asp Ile Pro Gly
165 170 175
Val Tyr Arg Ile Pro Lys Ala Ser Ile Pro Gln Ala Leu His Asp Pro
180 185 190
Asn His Leu Phe Thr Arg Gln Phe Val Ala Asn Gly Arg Ser Leu Thr
195 200 205
Ser Ala Ala Gly Ile Leu Val Asn Thr Phe Asp Ala Leu Glu Pro Glu
210 215 220
Ala Val Ala Ala Leu Gln Gln Gly Lys Val Ala Ser Gly Phe Pro Pro
225 230 235 240
Val Phe Ala Val Gly Pro Leu Leu Pro Ala Ser Asn Gln Ala Lys Asp
245 250 255
Pro Gln Ala Asn Tyr Met Glu Trp Leu Asp Ala Gln Pro Ala Arg Ser
260 265 270
Val Val Tyr Val Ser Phe Gly Ser Arg Lys Ala Ile Ser Gly Glu Gln
275 280 285
Leu Arg Glu Leu Ala Ala Gly Leu Glu Thr Ser Gly His Arg Phe Leu
290 295 300
Trp Val Val Lys Ser Thr Val Val Asp Arg Asp Asp Ala Ala Glu Leu
305 310 315 320
Gly Glu Leu Leu Gly Glu Gly Phe Leu Lys Arg Val Glu Lys Arg Gly
325 330 335
Leu Val Thr Lys Ala Trp Val Asp Gln Glu Glu Val Leu Lys His Glu
340 345 350
Ser Val Ala Leu Phe Val Ser His Cys Gly Trp Asn Ser Val Thr Glu
355 360 365
Ala Ala Ala Ser Gly Val Pro Val Leu Ala Leu Pro Arg Phe Gly Asp
370 375 380
Gln Arg Val Asn Ser Gly Val Val Ala Arg Ala Gly Leu Gly Val Trp
385 390 395 400
Ala Asp Thr Trp Ser Trp Glu Gly Glu Ala Gly Val Ile Gly Ala Glu
405 410 415
Glu Ile Ser Glu Lys Val Lys Ala Ala Met Ala Asp Glu Ala Leu Arg
420 425 430
Arg Lys Ala Ala Ser Leu Ala Lys Ala Ala Ala Lys Ala Val Ala Gly
435 440 445
Gly Gly Ser Ser His Arg Cys Leu Val Glu Phe Ala Arg Leu Cys Gln
450 455 460
Gly Gly Thr Cys Arg Thr Asn
465 470
<210> 20
<211> 475
<212> PRT
<213> 玉米(Zea mays)
<400> 20
Met Ala Ala Asn Gly Gly Asp His Thr Ser Ala Arg Pro His Val Val
1 5 10 15
Leu Leu Pro Ser Ala Gly Met Gly His Leu Val Pro Phe Ala Arg Leu
20 25 30
Ala Val Ala Leu Ser Glu Gly His Gly Cys Asn Val Ser Val Ala Ala
35 40 45
Val Gln Pro Thr Val Ser Ser Ala Glu Ser Arg Leu Leu Asp Ala Leu
50 55 60
Phe Val Ala Ala Ala Pro Ala Val Arg Arg Leu Asp Phe Arg Leu Ala
65 70 75 80
Pro Phe Asp Glu Ser Glu Phe Pro Gly Ala Asp Pro Phe Phe Leu Arg
85 90 95
Phe Glu Ala Thr Arg Arg Ser Ala Pro Leu Leu Gly Pro Leu Leu Asp
100 105 110
Ala Ala Glu Ala Ser Ala Leu Val Thr Asp Ile Val Leu Ala Ser Val
115 120 125
Ala Leu Pro Val Ala Arg Glu Arg Gly Val Pro Cys Tyr Val Leu Phe
130 135 140
Thr Ser Ser Ala Ala Met Leu Ser Leu Cys Ala Tyr Phe Pro Ala Tyr
145 150 155 160
Leu Asp Ala His Ala Ala Ala Gly Ser Val Gly Val Gly Val Gly Asn
165 170 175
Val Asp Ile Pro Gly Val Phe Arg Ile Pro Lys Ser Ser Val Pro Gln
180 185 190
Ala Leu His Asp Pro Asp His Leu Phe Thr Gln Gln Phe Val Ala Asn
195 200 205
Gly Arg Cys Leu Val Ala Cys Asp Gly Ile Leu Val Asn Thr Phe Asp
210 215 220
Ala Phe Glu Pro Asp Ala Val Thr Ala Leu Arg Gln Gly Ser Ile Thr
225 230 235 240
Val Ser Gly Gly Phe Pro Pro Val Phe Thr Val Gly Pro Met Leu Pro
245 250 255
Val Arg Phe Gln Ala Glu Glu Thr Ala Asp Tyr Met Arg Trp Leu Ser
260 265 270
Ala Gln Pro Pro Arg Ser Val Val Tyr Val Ser Phe Gly Ser Arg Lys
275 280 285
Ala Ile Pro Arg Asp Gln Leu Arg Glu Leu Ala Ala Gly Leu Glu Ala
290 295 300
Ser Gly Lys Arg Phe Leu Trp Val Val Lys Ser Thr Ile Val Asp Arg
305 310 315 320
Asp Asp Thr Ala Asp Leu Gly Gly Leu Leu Gly Asp Gly Phe Leu Glu
325 330 335
Arg Val Gln Gly Arg Ala Phe Val Thr Met Gly Trp Val Glu Gln Glu
340 345 350
Glu Ile Leu Gln His Gly Ser Val Gly Leu Phe Ile Ser His Cys Gly
355 360 365
Trp Asn Ser Leu Thr Glu Ala Ala Ala Phe Gly Val Pro Val Leu Ala
370 375 380
Trp Pro Arg Phe Gly Asp Gln Arg Val Asn Ala Ala Leu Val Ala Arg
385 390 395 400
Ser Gly Leu Gly Ala Trp Glu Glu Gly Trp Thr Trp Asp Gly Glu Glu
405 410 415
Gly Leu Thr Thr Arg Lys Glu Val Ala Lys Lys Ile Lys Gly Met Met
420 425 430
Gly Tyr Asp Ala Val Ala Glu Lys Ala Ala Lys Val Gly Asp Ala Ala
435 440 445
Ala Ala Ala Ile Ala Lys Cys Gly Thr Ser Tyr Gln Ser Leu Glu Glu
450 455 460
Phe Val Gln Arg Cys Arg Asp Ala Glu Arg Lys
465 470 475
<210> 21
<211> 36
<212> DNA
<213> 引物(Primer)
<400> 21
tgccgcgcgg cagccatatg atgggccacc tggtgc 36
<210> 22
<211> 43
<212> DNA
<213> 引物(Primer)
<400> 22
tggtgctcga gtgcggccgc ctagtccaac actgcaagat ccc 43
<210> 23
<211> 39
<212> DNA
<213> 引物(Primer)
<400> 23
tgccgcgcgg cagccatatg atgtgttcgg cggcaacac 39
<210> 24
<211> 45
<212> DNA
<213> 引物(Primer)
<400> 24
tggtgctcga gtgcggccgc tcacattccg ttcgtgatga caagc 45
<210> 25
<211> 37
<212> DNA
<213> 引物(Primer)
<400> 25
tgccgcgcgg cagccatatg atggccccat cggcgat 37
<210> 26
<211> 37
<212> DNA
<213> 引物(Primer)
<400> 26
tggtgctcga gtgcggccgc ctaccacccc gcgtcgc 37
<210> 27
<211> 41
<212> DNA
<213> 引物(Primer)
<400> 27
tgccgcgcgg cagccatatg atgtcctcgc cggcattatc a 41
<210> 28
<211> 37
<212> DNA
<213> 引物(Primer)
<400> 28
tggtgctcga gtgcggccgc tcacgccgtg caacgac 37
<210> 29
<211> 36
<212> DNA
<213> 引物(Primer)
<400> 29
tgccgcgcgg cagccatatg atgccgacct ccggcg 36
<210> 30
<211> 53
<212> DNA
<213> 引物(Primer)
<400> 30
tggtgctcga gtgcggccgc ttattccgtg ttcacgcttc ttctaaatgt agc 53
<210> 31
<211> 36
<212> DNA
<213> 引物(Primer)
<400> 31
tgccgcgcgg cagccatatg atgccgacct ccggcg 36
<210> 32
<211> 45
<212> DNA
<213> 引物(Primer)
<400> 32
tggtgctcga gtgcggccgc ttacttgctg acgcttagat cccgg 45
<210> 33
<211> 41
<212> DNA
<213> 引物(Primer)
<400> 33
tgccgcgcgg cagccatatg atggcctcca gctcgagaga c 41
<210> 34
<211> 48
<212> DNA
<213> 引物(Primer)
<400> 34
tggtgctcga gtgcggccgc ttactgtaag gcactaccat gacagcag 48
<210> 35
<211> 39
<212> DNA
<213> 引物(Primer)
<400> 35
tgccgcgcgg cagccatatg atggcctcca gctccagag 39
<210> 36
<211> 37
<212> DNA
<213> 引物(Primer)
<400> 36
tggtgctcga gtgcggccgc tcacgcctct gacggcg 37
<210> 37
<211> 36
<212> DNA
<213> 引物(Primer)
<400> 37
tgccgcgcgg cagccatatg atgtcctcgc cggcac 36
<210> 38
<211> 38
<212> DNA
<213> 引物(Primer)
<400> 38
tggtgctcga gtgcggccgc tcatgcggtg caacgacg 38
<210> 39
<211> 36
<212> DNA
<213> 引物(Primer)
<400> 39
tgccgcgcgg cagccatatg atgtcctcgc cggcac 36
<210> 40
<211> 46
<212> DNA
<213> 引物(Primer)
<400> 40
tggtgctcga gtgcggccgc ttatataact tcacgcggtg caatgc 46
<210> 41
<211> 36
<212> DNA
<213> 引物(Primer)
<400> 41
tgccgcgcgg cagccatatg atgccgacct ccggcg 36
<210> 42
<211> 44
<212> DNA
<213> 引物(Primer)
<400> 42
tggtgctcga gtgcggccgc ttactcacgc actcttccat cccg 44
<210> 43
<211> 38
<212> DNA
<213> 引物(Primer)
<400> 43
tgccgcgcgg cagccatatg atgtcctcac cgccaccg 38
<210> 44
<211> 40
<212> DNA
<213> 引物(Primer)
<400> 44
tggtgctcga gtgcggccgc tcatcctcgc gctgtccacg 40
<210> 45
<211> 37
<212> DNA
<213> 引物(Primer)
<400> 45
tgccgcgcgg cagccatatg atgccgagct ctggcga 37
<210> 46
<211> 44
<212> DNA
<213> 引物(Primer)
<400> 46
tggtgctcga gtgcggccgc tcaattagtg cgacatgttc cccc 44
<210> 47
<211> 27
<212> DNA
<213> 引物(Primer)
<400> 47
tataccatgg gtgactgcgt tgccccg 27
<210> 48
<211> 30
<212> DNA
<213> 引物(Primer)
<400> 48
cgggatcctt acttcggcag gtcgccgctc 30
<210> 49
<211> 29
<212> DNA
<213> 引物(Primer)
<400> 49
cgggatccct tatgcgactc ctgcattag 29
<210> 50
<211> 26
<212> DNA
<213> 引物(Primer)
<400> 50
gcccaagctt ttatgccagc atcttc 26
<210> 51
<211> 31
<212> DNA
<213> 引物(Primer)
<400> 51
agatatacat atggttacgg tggaagaata c 31
<210> 52
<211> 30
<212> DNA
<213> 引物(Primer)
<400> 52
ccgctcgagt taggtagcca cactatgcag 30
<210> 53
<211> 30
<212> DNA
<213> 引物(Primer)
<400> 53
ccgctcgagc tagaaataat tttgtttaac 30
<210> 54
<211> 30
<212> DNA
<213> 引物(Primer)
<400> 54
ccgctcgagc gatcccgcga aattaatacg 30
<210> 55
<211> 28
<212> DNA
<213> 引物(Primer)
<400> 55
gagcctaggt tagttaccga ttttaaag 28
<210> 56
<211> 40
<212> DNA
<213> 引物(Primer)
<400> 56
agctcccacc aggacctagc atgagcacct ggtccaaccg 40
<210> 57
<211> 43
<212> DNA
<213> 引物(Primer)
<400> 57
gagctcgaat tcggatccac tagtttaggt cgccgcacgc gcc 43
<210> 58
<211> 38
<212> DNA
<213> 引物(Primer)
<400> 58
ctcccaccag gacctagcat gcgtagcgcg ggtagccg 38
<210> 59
<211> 43
<212> DNA
<213> 引物(Primer)
<400> 59
tcgaattcgg atccactagt ttagctataa aagctcggca gcg 43
<210> 60
<211> 45
<212> DNA
<213> 引物(Primer)
<400> 60
agctcccacc aggacctagc atgatcattc gttggcgttg gaaca 45
<210> 61
<211> 45
<212> DNA
<213> 引物(Primer)
<400> 61
gagctcgaat tcggatccac tagtttaggt cgctttaccg gtcgc 45
<210> 62
<211> 31
<212> DNA
<213> 引物(Primer)
<400> 62
tatacatatg tcctcttctt cttcttcgtc a 31
<210> 63
<211> 32
<212> DNA
<213> 引物(Primer)
<400> 63
aattgcggcc gcttaccata catctctaag at 32
<210> 64
<211> 50
<212> DNA
<213> 引物(Primer)
<400> 64
cgacctaaac tagtggatcc taatacgact cactataggg gaattgtgag 50
<210> 65
<211> 40
<212> DNA
<213> 引物(Primer)
<400> 65
cttaagcatt atgcggccgc ttaaccgctg cccagaccat 40
<210> 66
<211> 50
<212> DNA
<213> 引物(Primer)
<400> 66
cgacctaaac tagtggatcc taatacgact cactataggg gaattgtgag 50
<210> 67
<211> 41
<212> DNA
<213> 引物(Primer)
<400> 67
cttaagcatt atgcggccgc ttaaacgcca tacgcgctcg g 41

Claims (25)

1.一种催化二氢查尔酮化合物或2-羟基黄烷酮化合物生成碳苷二氢查尔酮化合物或碳苷-2-羟基黄烷酮化合物的方法,包括:以糖基转移酶进行所述催化;所述的糖基转移酶为选自SEQ ID NO:1~20任一所述的多肽或其保守性序列变体。
2.如权利要求1所述的方法,其特征在于,所述二氢查尔酮化合物具有式(I)的母核结构,所述2-羟基黄烷酮化合物具有式(II)的母核结构,所述碳苷二氢查尔酮化合物具有式(III)的母核结构,或所述碳苷-2-羟基黄烷酮化合物具有式(IV)的母核结构:
Figure FDA0002376251410000011
其中,R为糖基,其与A环以碳碳键连接。
3.如权利要求2所述的方法,其特征在于,A环或B环中,存在1~3个羟基;较佳地,A环中,羟基存在于第2’、4’和/或6’位;较佳地,B环中,羟基出现在第4位。
4.如权利要求3所述的方法,其特征在于,R在A环上的数量为1个,较佳地其存在于第3’位;或
R在A环上的数量为2个,较佳地其存在于第3’和5’位;且,所述的糖基转移酶为选自SEQID NO:6,8,10,17,19或20所述的多肽或其保守性序列变体。
5.如权利要求4所述的方法,其特征在于,所述的二氢查尔酮化合物或2-羟基黄烷酮化合物包括:根皮素,2-羟基柚皮素,2-羟基圣草酚;和/或
所述的碳苷二氢查尔酮化合物或碳苷-2-羟基黄烷酮化合物包括:Nothofagin,根皮素-3’,5’-C-葡萄糖双碳苷,2-羟基柚皮素-6-C(8-C)-葡萄糖苷,2-羟基圣草酚-6-C(8-C)-葡萄糖苷。
6.如权利要求2所述的方法,其特征在于,所述的糖基为葡萄糖;较佳地,在利用所述糖基转移酶进行糖基转移时,以携带葡萄糖基团的化合物作为供体;更佳地,以UDP葡萄糖作为糖基供体。
7.糖基转移酶的用途,用于催化二氢查尔酮化合物或2-羟基黄烷酮化合物生成碳苷二氢查尔酮化合物或碳苷-2-羟基黄烷酮化合物;其中,所述的糖基转移酶为选自SEQ ID NO:1~20任一所示的多肽或其保守性变异多肽。
8.如权利要求7所述的用途,其特征在于,所述的二氢查尔酮化合物具有式(I)的母核结构,所述2-羟基黄烷酮化合物具有式(II)的母核结构,所述碳苷二氢查尔酮化合物具有式(III)的母核结构,或所述碳苷-2-羟基黄烷酮化合物具有式(IV)的母核结构:
Figure FDA0002376251410000021
其中,R为糖基,其与A环以碳碳键连接。
9.如权利要求8所述的用途,其特征在于,A环或B环中,存在1~3个羟基;较佳地,A环中,羟基存在于第2’、4’和/或6’位;较佳地,B环中,羟基出现在第4位。
10.如权利要求9所述的用途,其特征在于,R在A环上的数量为1个,较佳地其存在于3’位置;或
R在A环上的数量为2个,较佳地其存在于第3’和5’位;且,所述的糖基转移酶为选自SEQID NO:6,8,10,17,19或20所示的多肽或其保守性变异多肽。
11.如权利要求10所述的用途,其特征在于,所述二氢查尔酮化合物或2-羟基黄烷酮化合物包括:根皮素,2-羟基柚皮素,2-羟基圣草酚;和/或
所述碳苷二氢查尔酮化合物或碳苷-2-羟基黄烷酮化合物包括:Nothofagin,根皮素-3’,5’-C-葡萄糖双碳苷,2-羟基柚皮素-6-C(8-C)-葡萄糖苷,2-羟基圣草酚-6-C(8-C)-葡萄糖苷。
12.如权利要求1~11任一所述,其特征在于,所述的保守性变异多肽选自:
(1)由SEQ ID NO:1~20任一所示序列的多肽经过一个或多个氨基酸残基的取代、缺失或添加而形成的,且具有催化二氢查尔酮化合物或2-羟基黄烷酮化合物生成碳苷二氢查尔酮化合物或碳苷-2-羟基黄烷酮化合物功能的多肽;
(2)氨基酸序列与SEQ ID NO:1~20任一所示序列的多肽有80%以上相同性,且具有催化二氢查尔酮化合物或-羟基黄烷酮化合物生成碳苷二氢查尔酮化合物或碳苷-2-羟基黄烷酮化合物功能的多肽;或
(3)在SEQ ID NO:1~20任一所示序列的多肽的N或C末端添加标签序列,或在其N末端添加信号肽序列后形成的多肽。
13.一种合成黄酮碳苷化合物的方法,其特征在于,包括:
(1)将2-羟基黄烷酮化合物以糖基转移酶催化,产生碳苷-2-羟基黄烷酮化合物;其中,所述的糖基转移酶为选自SEQ ID NO:1~20任一所述的多肽或其保守性序列变体;
(2)将(1)的碳苷-2-羟基黄烷酮化合物脱水,获得黄酮碳苷化合物。
14.如权利要求13所述的方法,其特征在于,在(1)之前,还包括:(c)将黄烷酮化合物通过黄烷酮-2-羟化酶催化,获得2-羟基黄烷酮化合物。
15.如权利要求14所述的方法,其特征在于,在(c)之前,还包括:(b)将丙二酰-CoA结构类似物与p-香豆酰-CoA结构类似物经查尔酮合成酶和查尔酮异构酶催化,获得黄烷酮化合物。
16.如权利要求15所述的方法,其特征在于,在(b)之前,还包括:(a)将芳香族氨基酸经酪氨酸解氨酶或苯丙氨酸解氨酶和4-香豆酰-CoA连接酶催化,获得p-香豆酰-CoA结构类似物。
17.如权利要求14~16任一所述的方法,其特征在于,所述的黄烷酮化合物包括:柚皮素,圣草酚;
所述的丙二酰-CoA结构类似物包括:丙二酰-CoA或甲基丙二酰-CoA;
所述的p-香豆-CoA结构类似物包括:p-香豆酰-CoA或p-肉桂酰-CoA;
所述的芳香族氨基酸包括:L-酪氨酸或L-苯丙氨酸。
18.如权利要求13~16任一所述的方法,其特征在于,所述的2-羟基黄烷酮化合物为2-羟基柚皮素,其是从柚皮素通过黄烷酮-2-羟化酶催化获得;或
所述2-羟基黄烷酮化合物为2-羟基圣草酚,其是从圣草酚通过黄烷酮-2-羟化酶催化获得;较佳地,所述圣草酚是从柚皮素通过黄烷酮-3’-羟化酶催化获得。
19.一种生物合成黄酮碳苷化合物的方法,其特征在于,包括:
(i)将合成柚皮素化合物的前体基因、编码黄烷酮-2-羟化酶和/或黄烷酮-3’-羟化酶的基因以及编码糖基转移酶的基因共转入宿主细胞中;其中,所述的糖基转移酶为选自SEQID NO:1~20任一所述的多肽或其保守性序列变体;
(ii)培养(i)的细胞,从而生物合成黄酮碳苷化合物。
20.如权利要求19所述的方法,其特征在于,所述的黄烷酮-2-羟化酶和黄烷酮-3’-羟化酶为截去N端跨膜区域的P450氧化酶;较佳地,在截去N端跨膜区域后,还包括添加标签;更佳地,所述标签包括:2B1,17α,MBP。
21.一种遗传工程化的细胞,其特征在于,其中包括:合成柚皮素化合物的前体基因、编码黄烷酮-2-羟化酶和/或黄烷酮-3’-羟化酶的基因以及编码糖基转移酶的基因;其中,所述的糖基转移酶为选自SEQ ID NO:1~20任一所述的多肽或其保守性序列变体。
22.制备权利要求21的细胞的方法,其特征在于,包括:将合成柚皮素化合物的前体基因、编码黄烷酮-2-羟化酶和/或黄烷酮-3’-羟化酶的基因以及编码糖基转移酶的基因共转入宿主细胞中;其中,所述的糖基转移酶为选自SEQ ID NO:1~20任一所述的多肽或其保守性序列变体。
23.一种用于生物合成黄酮碳苷化合物或其中间体的试剂盒,其中包括:SEQ ID NO:1~20所示的一条或多条多肽或其保守性变异多肽;黄烷酮-2-羟化酶和/或黄烷酮-3’-羟化酶;合成柚皮素化合物的前体基因;较佳地还包括宿主细胞;或
其中包括权利要求21所述的遗传工程化的细胞。
24.如权利要求19~23任一所述,其特征在于,所述的细胞包括:原核细胞或真核细胞;较佳地,所述原核宿主细胞包括大肠杆菌,酵母,链霉菌。
25.如权利要求13~23任一所述,其特征在于,所述的黄酮碳苷化合物包括:牡荆素,异牡荆素,荭草苷,异荭草苷,维采宁-2,光牡荆素。
CN202010066924.7A 2020-01-20 2020-01-20 碳苷糖基转移酶及其应用 Active CN113136373B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN202010066924.7A CN113136373B (zh) 2020-01-20 2020-01-20 碳苷糖基转移酶及其应用
US17/793,676 US20230066984A1 (en) 2020-01-20 2020-12-16 New Carbon Glycoside Glycosyltransferase and Use Thereof
EP20915832.8A EP4095145A4 (en) 2020-01-20 2020-12-16 NEW CARBON GLYCOSIDE GLYCOSYLTRANSFERASE AND USE THEREOF
PCT/CN2020/136886 WO2021147575A1 (zh) 2020-01-20 2020-12-16 新型碳苷糖基转移酶及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010066924.7A CN113136373B (zh) 2020-01-20 2020-01-20 碳苷糖基转移酶及其应用

Publications (2)

Publication Number Publication Date
CN113136373A true CN113136373A (zh) 2021-07-20
CN113136373B CN113136373B (zh) 2023-12-08

Family

ID=76809151

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010066924.7A Active CN113136373B (zh) 2020-01-20 2020-01-20 碳苷糖基转移酶及其应用

Country Status (4)

Country Link
US (1) US20230066984A1 (zh)
EP (1) EP4095145A4 (zh)
CN (1) CN113136373B (zh)
WO (1) WO2021147575A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112813084A (zh) * 2021-02-26 2021-05-18 云南农业大学 一种假地豆植物中碳糖基转移酶DhCGT1基因及应用
CN112961870A (zh) * 2021-02-26 2021-06-15 云南农业大学 一种假地豆植物中碳糖基转移酶DhCGT2基因及应用
CN113502278A (zh) * 2021-08-10 2021-10-15 天津大学佐治亚理工深圳学院 酶组合物及其在柚皮素生物合成中的应用

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114807159B (zh) * 2021-12-23 2023-09-29 西藏自治区农牧科学院农业研究所 一种与耐旱性相关的c-糖基黄酮代谢基因及其用途
CN117187207B (zh) * 2023-03-08 2024-03-15 中国科学院华南植物园 广金钱草黄酮碳苷糖基转移酶及其编码基因的应用

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109402154A (zh) * 2018-10-10 2019-03-01 南京林业大学 一种利用协同调控策略提高重组菌产异荭草苷产量的方法
CN109423486A (zh) * 2017-08-29 2019-03-05 中国科学院上海生命科学研究院 新型udp-糖基转移酶及其应用

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2010207265A1 (en) * 2009-01-21 2011-08-18 Suntory Holdings Limited Flavonoid-3-O-glucuronosyltransferase and polynucleotide encoding the same
CN101775050A (zh) * 2010-01-04 2010-07-14 广东省食品工业研究所 α-葡萄糖基新橙皮苷二氢查耳酮及其制备方法和应用
JP2015204752A (ja) * 2014-04-17 2015-11-19 国立大学法人信州大学 配糖化酵素、及びそれを利用した糖で二置換されたc配糖体の製造方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109423486A (zh) * 2017-08-29 2019-03-05 中国科学院上海生命科学研究院 新型udp-糖基转移酶及其应用
CN109402154A (zh) * 2018-10-10 2019-03-01 南京林业大学 一种利用协同调控策略提高重组菌产异荭草苷产量的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
SUN, Y. ET AL.: "C-glycosyltransferase [Phyllostachys edulis]", 《GENBANK DATABASE》 *
郝冰: "Desmodium incanum 根化感物质黄酮碳苷的生物合成与相关糖基转移酶底物专一性研究", 《中国博士学位论文全文数据库(电子期刊)基础科学辑》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112813084A (zh) * 2021-02-26 2021-05-18 云南农业大学 一种假地豆植物中碳糖基转移酶DhCGT1基因及应用
CN112961870A (zh) * 2021-02-26 2021-06-15 云南农业大学 一种假地豆植物中碳糖基转移酶DhCGT2基因及应用
CN112813084B (zh) * 2021-02-26 2022-07-19 云南农业大学 一种假地豆植物中碳糖基转移酶DhCGT1基因及应用
CN112961870B (zh) * 2021-02-26 2022-08-16 云南农业大学 一种假地豆植物中碳糖基转移酶DhCGT2基因及应用
CN113502278A (zh) * 2021-08-10 2021-10-15 天津大学佐治亚理工深圳学院 酶组合物及其在柚皮素生物合成中的应用
CN113502278B (zh) * 2021-08-10 2023-10-27 天津大学佐治亚理工深圳学院 酶组合物及其在柚皮素生物合成中的应用

Also Published As

Publication number Publication date
EP4095145A1 (en) 2022-11-30
EP4095145A4 (en) 2024-04-24
CN113136373B (zh) 2023-12-08
US20230066984A1 (en) 2023-03-02
WO2021147575A1 (zh) 2021-07-29

Similar Documents

Publication Publication Date Title
CN113136373B (zh) 碳苷糖基转移酶及其应用
CN113322288B (zh) 新型黄酮羟基化酶、合成黄酮碳苷类化合物的微生物及其应用
JP4474518B2 (ja) 2−ヒドロキシイソフラバノンデヒドラターゼをコードするポリヌクレオチドおよびその応用
WO2021164673A1 (zh) 双功能碳苷糖基转移酶及其应用
CN112080480A (zh) 糖基转移酶突变体及其应用
CN110819600B (zh) 甲基转移酶及其应用
CN109423486B (zh) 新型udp-糖基转移酶及其应用
CN110885846B (zh) 合成黄芩素和野黄芩素的微生物、其制备方法及其应用
JP5705550B2 (ja) フラボノイド3位グルクロン酸転移酵素、及びそれをコードするポリヌクレオチド
JP2022524214A (ja) Udp-ラムノースの生合成生産
JP2022551000A (ja) エリオジクチオールの生合成
CN112553175B (zh) 糖基转移酶ugt76g1突变体的制备及其应用
CN114277024B (zh) 一种新型三萜合酶及其应用
CN114032222B (zh) 糖链延伸糖基转移酶突变体及其编码基因以及基因工程菌和它们的应用
WO2022131130A1 (ja) プレニルフラボノイド配糖化酵素、それをコードするポリヌクレオチド及びプレニルフラボノイド配糖体の製造方法
CN113755464B (zh) 一种参与桂叶苷B和毛蕊花糖苷生物合成的LrUGT2蛋白及其编码基因与应用
CN111019919B (zh) 用莲类黄酮c-糖基转移酶ugt708n1合成类黄酮c-糖苷的方法
CN114908067B (zh) 氧甲基转移酶fsr2在催化山奈酚4`羟基氧甲基化中的应用
CN109868265B (zh) 新型糖基转移酶及其应用
CN116987683A (zh) 一种催化欧芹酚生成蛇床子素的o-甲基转移酶及其编码基因与应用
CN118165968A (zh) 新型二萜合成酶及其应用
CN116987682A (zh) 一种催化花椒毒酚生成花椒毒素的o-甲基转移酶及其编码基因与应用
CN118166046A (zh) 新型对映-贝壳杉烯羟化酶及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant