CN113574177A - 在微生物中生物合成香叶木苷和/或橙皮苷的方法 - Google Patents

在微生物中生物合成香叶木苷和/或橙皮苷的方法 Download PDF

Info

Publication number
CN113574177A
CN113574177A CN202080020228.0A CN202080020228A CN113574177A CN 113574177 A CN113574177 A CN 113574177A CN 202080020228 A CN202080020228 A CN 202080020228A CN 113574177 A CN113574177 A CN 113574177A
Authority
CN
China
Prior art keywords
sequence
seq
polypeptide
activity
nucleic acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080020228.0A
Other languages
English (en)
Inventor
西里尔·波特尼尔
安德烈·勒琼
贺勒内·斯科内克
西莉亚·罗塞尔
莱蒂提娅·朱伯特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Laboratoires Servier SAS
Original Assignee
Laboratoires Servier SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Laboratoires Servier SAS filed Critical Laboratoires Servier SAS
Publication of CN113574177A publication Critical patent/CN113574177A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/44Preparation of O-glycosides, e.g. glucosides
    • C12P19/60Preparation of O-glycosides, e.g. glucosides having an oxygen of the saccharide radical directly bound to a non-saccharide heterocyclic ring or a condensed ring system containing a non-saccharide heterocyclic ring, e.g. coumermycin, novobiocin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/02Oxygen as only ring hetero atoms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0006Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0012Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7)
    • C12N9/0036Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on NADH or NADPH (1.6)
    • C12N9/0038Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on NADH or NADPH (1.6) with a heme protein as acceptor (1.6.2)
    • C12N9/0042NADPH-cytochrome P450 reductase (1.6.2.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • C12N9/0073Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14) with NADH or NADPH as one donor, and incorporation of one atom of oxygen 1.14.13
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1003Transferases (2.) transferring one-carbon groups (2.1)
    • C12N9/1007Methyltransferases (general) (2.1.1.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1085Transferases (2.) transferring alkyl or aryl groups other than methyl groups (2.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/90Isomerases (5.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/44Preparation of O-glycosides, e.g. glucosides
    • C12P19/445The saccharide radical is condensed with a heterocyclic radical, e.g. everninomycin, papulacandin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/01Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
    • C12Y101/01133Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1) dTDP-4-dehydrorhamnose reductase (1.1.1.133)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y106/00Oxidoreductases acting on NADH or NADPH (1.6)
    • C12Y106/02Oxidoreductases acting on NADH or NADPH (1.6) with a heme protein as acceptor (1.6.2)
    • C12Y106/02004NADPH-hemoprotein reductase (1.6.2.4), i.e. NADP-cytochrome P450-reductase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y114/00Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
    • C12Y114/11Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with 2-oxoglutarate as one donor, and incorporation of one atom each of oxygen into both donors (1.14.11)
    • C12Y114/11022Flavone synthase (1.14.11.22)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y114/00Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
    • C12Y114/13Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with NADH or NADPH as one donor, and incorporation of one atom of oxygen (1.14.13)
    • C12Y114/13011Trans-cinnamate 4-monooxygenase (1.14.13.11)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y114/00Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
    • C12Y114/14Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with reduced flavin or flavoprotein as one donor, and incorporation of one atom of oxygen (1.14.14)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/01Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/01Hexosyltransferases (2.4.1)
    • C12Y204/01159Flavonol-3-O-glucoside L-rhamnosyltransferase (2.4.1.159)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/01Hexosyltransferases (2.4.1)
    • C12Y204/0117Isoflavone 7-O-glucosyltransferase (2.4.1.170)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/01Hexosyltransferases (2.4.1)
    • C12Y204/01185Flavanone 7-O-beta-glucosyltransferase (2.4.1.185)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y205/00Transferases transferring alkyl or aryl groups, other than methyl groups (2.5)
    • C12Y205/01Transferases transferring alkyl or aryl groups, other than methyl groups (2.5) transferring alkyl or aryl groups, other than methyl groups (2.5.1)
    • C12Y205/01006Methionine adenosyltransferase (2.5.1.6), i.e. adenosylmethionine synthetase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y402/00Carbon-oxygen lyases (4.2)
    • C12Y402/01Hydro-lyases (4.2.1)
    • C12Y402/01076UDP-glucose 4,6-dehydratase (4.2.1.76)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y403/00Carbon-nitrogen lyases (4.3)
    • C12Y403/01Ammonia-lyases (4.3.1)
    • C12Y403/01023Tyrosine ammonia-lyase (4.3.1.23)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y403/00Carbon-nitrogen lyases (4.3)
    • C12Y403/01Ammonia-lyases (4.3.1)
    • C12Y403/01024Phenylalanine ammonia-lyase (4.3.1.24)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y501/00Racemaces and epimerases (5.1)
    • C12Y501/03Racemaces and epimerases (5.1) acting on carbohydrates and derivatives (5.1.3)
    • C12Y501/03013Racemaces and epimerases (5.1) acting on carbohydrates and derivatives (5.1.3) dTDP-4-dehydrorhamnose 3,5-epimerase (5.1.3.13)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y505/00Intramolecular lyases (5.5)
    • C12Y505/01Intramolecular lyases (5.5.1)
    • C12Y505/01006Chalcone isomerase (5.5.1.6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y602/00Ligases forming carbon-sulfur bonds (6.2)
    • C12Y602/01Acid-Thiol Ligases (6.2.1)
    • C12Y602/010124-Coumarate-CoA ligase (6.2.1.12)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/44Preparation of O-glycosides, e.g. glucosides

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Medicinal Chemistry (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Mycology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明涉及被修饰以便能够产生香叶木苷和橙皮苷的重组微生物及其用于生产香叶木苷和/或橙皮苷的用途。

Description

在微生物中生物合成香叶木苷和/或橙皮苷的方法
技术领域
本发明涉及一种生产香叶木苷和橙皮苷的方法。
背景技术
Daflon是一种具有血管紧张和血管保护作用的黄酮类化合物的混合物。这种混合物主要由~85%的香叶木苷、~8%的橙皮苷和痕量的各种不同黄酮及其相应的氧化形式组成。
目前用于生产所述药物的方法是从小橙子的果皮酸/碱萃取黄酮类化合物的混合物,其主要含有橙皮苷(94%)以及异柚皮苷(~3%)、新枸橘苷(~2%)和橙皮素(<1%)的混合物。然后通过化学过程对该混合物进行受控氧化,将约90%的橙皮苷转化成香叶木苷和少量采取氧化形式的黄酮类化合物。
因此,Daflon的生产与橙子黄酮类化合物的纯化萃取物的供应相关,所述供应可能因气候变化、货币流动的波动和从几个国家(主要是墨西哥、地中海盆地国家和中国)的数十个地点供应的难度而变。
因此,拥有一种不依赖于橙子黄酮类化合物的纯化萃取物的变幻莫测的供应的生产Daflon的替代方法,是有价值的。因此,对于香叶木苷和橙皮苷的生物合成方法,存在着未满足的需求。
发明内容
本发明人开发了一种在重组微生物中生物合成香叶木苷和橙皮苷的方法。
因此,本发明涉及一种重组微生物,其包含:
-编码能够在橙皮素和/或香叶木素的7位中添加葡萄糖的黄烷酮7-O-β-D-葡萄糖基转移酶(UGT)的异源核酸序列;和
-编码能够将鼠李糖转移到橙皮素-7-O-葡萄糖苷和/或香叶木素-7-O-葡萄糖苷的葡萄糖的6位中的6”-O-鼠李糖基转移酶(RhaT)的异源核酸序列;和
-编码能够产生UDP-鼠李糖的UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶(RHM)的异源核酸序列。
优选地,所述黄烷酮7-O-β-D-葡萄糖基转移酶(UGT)是来自于甜橙(Citrussinensis)、克莱门柚(Citrus clementina)、拟南芥(Arabidopsis thaliana)、黄芩(Scutellaria baicalensis)或智人(Homo sapiens)的酶。特别地,所述黄烷酮7-O-β-D-葡萄糖基转移酶(UGT)可以是来自于拟南芥、黄芩或智人,优选地来自于拟南芥或黄芩的酶。优选地,所述黄烷酮7-O-β-D-葡萄糖基转移酶(UGT)来自于甜橙或黄芩。
所述黄烷酮7-O-β-D-葡萄糖基转移酶可以选自:包含选自SEQ ID NO:113、115、91、93、95、97、99和101的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽,优选地选自:包含选自SEQ ID NO:113、115、91、93、95和97的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽。特别地,它可以选自:包含选自SEQ ID NO:91、93、95、97、99和101的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽,优选地选自:包含选自SEQ ID NO:91、93、95和97的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽。优选地,所述黄烷酮7-O-β-D-葡萄糖基转移酶选自:包含选自SEQ ID NO:113和95的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽,优选地选自:包含选自SEQ ID NO:113的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽。
优选地,6”-O-鼠李糖基转移酶(RhaT)是一种植物酶,优选为柑橘属或矮牵牛(Petunia hybrida)的植物酶,优选为甜橙、柚子(Citrus maxima)或克莱门柚的植物酶,更优选为甜橙或克莱门柚的植物酶。优选地,6”-O-鼠李糖基转移酶选自:包含选自SEQ IDNO:103、105的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有6”-O-鼠李糖基转移酶活性的多肽。更特别优选地,6”-O-鼠李糖基转移酶选自:包含选自SEQ ID NO:103的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有6”-O-鼠李糖基转移酶活性的多肽。
优选地,UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶(RHM)是一种植物酶,优选地来自于甜橙或拟南芥的植物酶。优选地,UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶选自:包含选自SEQ ID NO:107、109和111的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶活性的多肽。更特别优选地,UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶选自:包含选自SEQ ID NO:107的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶活性的多肽。
在一个实施方式中,根据本发明所述的微生物还包含:
-编码酪氨酸解氨酶(TAL)的异源核酸序列,和/或编码苯丙氨酸解氨酶(PAL)的异源核酸序列和编码肉桂酸4-羟化酶(C4H)的异源核酸序列;
-编码4-香豆酰辅酶A连接酶(4CL)的异源核酸序列;
-编码柚皮素-查尔酮合酶(CHS)的异源核酸序列;
-编码查尔酮异构酶(CHI)的异源核酸序列;
-编码黄酮类化合物3’-单加氧酶(F3’H)的异源核酸序列;
-编码O-甲基-转移酶(OMT)的异源核酸序列;和
-任选地,编码能够将酪氨酸转变成L-DOPA并且也将对香豆酸转变成咖啡酸的4-甲氧基苯甲酸酯O-脱甲基酶的异源核酸序列;或编码能够将对香豆酸转变成咖啡酸的对香豆酸3-羟化酶的异源核酸序列。
优选地,所述微生物包含:
-编码酪氨酸解氨酶(TAL)的异源核酸序列,所述酪氨酸解氨酶(TAL)选自:包含选自SEQ ID NO:41和39的序列的酪氨酸解氨酶(TAL)和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有酪氨酸解氨酶活性的多肽,优选为包含选自SEQID NO:41的序列的酪氨酸解氨酶(TAL)和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有酪氨酸解氨酶活性的多肽;和
-编码4-香豆酰辅酶A连接酶(4CL)的异源核酸序列,所述4-香豆酰辅酶A连接酶(4CL)选自:包含选自SEQ ID NO:123、125、43、45、47和49的序列的4-香豆酰辅酶A连接酶(4CL)和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有4-香豆酰辅酶A连接酶活性的多肽,优选为包含选自SEQ ID NO:123、125和45的序列的4CL和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有4-香豆酰辅酶A连接酶活性的多肽,特别是编码包含选自SEQ ID NO:45的序列的4-香豆酰辅酶A连接酶(4CL)和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有4-香豆酰辅酶A连接酶活性的多肽;和
-编码查尔酮合酶(CHS)的异源核酸序列,所述查尔酮合酶(CHS)选自:包含选自SEQ ID NO:53、51、55和57的序列的查尔酮合酶(CHS)和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有查尔酮合酶活性的多肽,优选为包含选自SEQID NO:53的序列的CHS和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有查尔酮合酶活性的多肽;和
-编码查尔酮异构酶(CHI)的异源核酸序列,所述查尔酮异构酶(CHI)选自:包含选自SEQ ID NO:61和59的序列的查尔酮异构酶(CHI)和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有查尔酮异构酶活性的多肽,优选为包含选自SEQID NO:61的序列的CHI和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有查尔酮异构酶活性的多肽。
优选地,所述微生物包含编码黄酮类化合物3’-单加氧酶(F3’H)的异源核酸序列,所述黄酮类化合物3’-单加氧酶(F3’H)为来自于翠菊(Callistephus chinensis)、回回苏(Perilla frutescens var.crispa)、矮牵牛(Petunia x hybrida)、非洲菊(Gerberahybrida)、甜橙、拟南芥、山柳兰(Pilosella officinarum)、蓝眼菊(Osteospermum hybridcultivar)、黄孢原毛平革菌(Phanerochaete chrysosporium)、克莱门柚或阿维链霉菌(Streptomyces avermitilis),特别是来自于翠菊、回回苏、矮牵牛、非洲菊、甜橙、拟南芥或山柳兰的黄酮类化合物3’-单加氧酶(F3’H),优选为包含选自SEQ ID NO:7、1、3、5、9、11、13、15、17、19、21和121的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮类化合物3’-单加氧酶活性的多肽,优选地选自具有SEQ IDNO:7、11、17和121的序列的酶和与这些序列之一具有至少60、70、80、85、90或95%序列同一性并具有黄酮类化合物3’-单加氧酶活性的多肽。
更特别优选地,所述微生物包含编码黄酮类化合物3’-单加氧酶(F3’H)的异源核酸序列,所述黄酮类化合物3’-单加氧酶(F3’H)选自:包含选自SEQ ID NO:7、17和121的序列的黄酮类化合物3’-单加氧酶(F3’H)和与这些序列之一具有至少60、70、80、85、90或95%序列同一性并具有黄酮类化合物3’-单加氧酶活性的多肽,优选为包含选自SEQ ID NO:7的序列的黄酮类化合物3’-单加氧酶(F3’H)和与该序列具有至少60、70、80、85、90或95%同一性并具有黄酮类化合物3’-单加氧酶活性的多肽。
优选地,所述微生物包含编码O-甲基-转移酶(OMT)的异源核酸序列,所述O-甲基-转移酶(OMT)是来自于柑橘特别是克莱门柚或甜橙、来自于智人或来自于拟南芥的O-甲基-转移酶(OMT),优选为包含选自SEQ ID NO:119、117、87和89的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有O-甲基转移酶活性的多肽。更特别优选地,它包含编码O-甲基转移酶(OMT)的异源核酸序列,所述O-甲基转移酶(OMT)选自:包含选自SEQ ID NO:119、117和89的序列的O-甲基转移酶(OMT)和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有O-甲基转移酶活性的多肽,优选为包含选自SEQ ID NO:119和117的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有O-甲基转移酶活性的多肽。
优选地,所述微生物包含:
-编码苯丙氨酸解氨酶(PAL)的异源核酸序列,所述苯丙氨酸解氨酶(PAL)特别是包含选自SEQ ID NO:63、65和77、优选为SEQ ID NO:65和77的序列的PAL和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有苯丙氨酸解氨酶活性的多肽,更特别优选为包含选自SEQ ID NO:65的序列的苯丙氨酸解氨酶(PAL)和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有苯丙氨酸解氨酶活性的多肽;和
-编码肉桂酸4-羟化酶(C4H)的异源核酸序列,所述肉桂酸4-羟化酶(C4H)特别是包含选自SEQ ID NO:67、69和79的序列的C4H和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有肉桂酸4-羟化酶活性的多肽,最特别优选为包含选自SEQ ID NO:79的序列的肉桂酸4-羟化酶(C4H)和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有肉桂酸4-羟化酶活性的多肽。
所述微生物还可以包含编码黄酮合酶(FNS)、特别是能够从圣草酚产生木犀草素的黄酮合酶的异源核酸序列,所述黄酮合酶优选地来自于拟南芥、荷兰芹(Petroselinumcrispum)、玉米(Zea mays)、金银花(Lonicera japonica)、灰毡毛忍冬(Loniceramacranthoides)、翠菊、芹菜(Apium graveolens)、蒺藜状苜蓿(Medicago truncatula)、孜然(Cuminum cyminum)、毒欧芹(Aethusa cynapium)、圆叶当归(Angelica archangelica)、毒芹(Conium maculatum)、茶树(Camellia sinensis)、朝鲜蓟(Cynara cardunculus varscolymus)、水母雪莲(Saussurea medusa)、毛喉鞘蕊花(Plectranthus barbatus)、黄芩、旋蒴苣苔(Dorcoceras hygrometricum)、金鱼草(Antirrhinum majus)、回回苏、大丽花(Dahlia pinnata)或Erythranthe lewisii。所述黄酮合酶(FNS)可以选自:包含选自SEQID NO:33、35、37、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157和159的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮合酶活性的多肽。特别地,所述FNS可以是包含选自SEQ ID NO:33、35和37的序列的FNS和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮合酶活性的多肽,优选为包含选自SEQ ID NO:37的序列的黄酮合酶(FNS)和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮合酶活性的多肽。
此外,它还可以包含:
-编码细胞色素P450还原酶(CPR)的异源核酸序列;和/或
-编码S-腺苷甲硫氨酸合成酶(SAMT)的异源或内源核酸序列。
优选地,所述CPR包含选自SEQ ID NO:25、23、27、29和31的序列和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有细胞色素P450还原酶活性的多肽,优选地包含选自SEQ ID NO:23、25和29的序列和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有细胞色素P450还原酶活性的多肽,特别是选自SEQ ID NO:25的序列和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有细胞色素P450还原酶活性的多肽。
优选地,所述微生物是酵母或细菌,优选为酵母属的酵母、特别是酿酒酵母(Saccharomyces cerevisiae),或细菌例如大肠埃希氏杆菌(Escherichia coli)。
本发明还涉及本文中描述的微生物用于生产香叶木苷和/或橙皮苷的用途。
此外,本发明涉及一种生产香叶木苷和/或橙皮苷的方法,所述方法包括培养本文中描述的微生物和任选的收获香叶木苷和/或橙皮苷。
优选地,在使用根据本发明所述的微生物生产香叶木苷和/或橙皮苷期间,不向所述培养基供应柚皮素、芹菜素、圣草酚、木犀草素、橙皮素和/或香叶木素。
具体实施方式
对小橙子果皮中橙皮素的生物合成途径了解很少。因此,本发明人探索了几条生物合成途径,并成功地开发了在重组微生物中生物合成香叶木苷和橙皮苷。
定义
术语“微生物”是指单细胞生物体。优选地,所述微生物是细菌或酵母。
术语“重组微生物”是指在自然界中不存在,并含有在一个或多个异源遗传元件的插入、修饰或缺失后被修饰的基因组的微生物。
术语“重组核酸”是指已被修饰并且不存在于天然微生物中的核酸。例如,该术语可以是指操作性连接到不是天然启动子的启动子的编码序列或基因。它还可以是指对于包含外显子和内含子的基因来说其中内含子已被缺失的编码序列。
术语“异源”意味着所述基因已通过遗传工程引入到所述细胞中。它在其中可能以游离体或染色体形式存在。所述基因的起源可能不同于它被引入到其中的细胞的起源。然而,所述基因也可以起源于与它被引入到其中的细胞相同的物种,但它由于非天然的环境而被认为是异源的。例如,所述基因或核酸序列是异源的,因为它在其天然启动子之外的启动子控制之下,它被引入到的位置不同于它天然所处的位置。在引入异源基因之前,宿主细胞可以含有所述基因的内源拷贝,或者它可以不含内源拷贝。此外,核酸序列可能在为了在宿主微生物中表达而将编码序列优化的意义上是异源的。优选地,在本文中,异源核酸序列编码对宿主细胞来说异源的蛋白质,即不天然存在于酵母中的蛋白质。
当在本文中使用时,相对于宿主微生物,术语“本源”或“内源”是指天然存在于所述微生物中的遗传元件或蛋白质。
术语“基因”是指编码蛋白质的任何核酸。术语“基因”覆盖DNA例如cDNA或gDNA,也覆盖RNA。基因可以首先通过重组、酶和/或化学技术制备,随后在宿主细胞或体外系统中复制。基因通常包含编码所需蛋白质的开放阅读框。基因可能含有其他序列例如转录终止子或信号肽。
作为遗传密码简并性的结果,特定多肽可能被几种核酸编码。因此,给定多肽的编码序列中的密码子可以被修饰,以便在特定微生物中获得最佳表达,例如通过使用对该微生物适合的密码子转换表。核酸也可以根据特定酵母的优选GC含量进行优化,和/或被优化以减少重复序列的数目。在某些实施方式中,异源核酸被密码子优化,以在所涉及的微生物中表达。密码子优化可以通过本领域中已知的常规方法来进行(参见例如Welch,M.等,(2011),Methods in Enzymology 498:43-66)。
术语“操作性连接”是指一种配置,其中将控制序列放置在相对于编码序列适合的位置中,使得所述控制序列控制所述编码序列的表达。
术语“控制序列”是指基因的表达所需的核酸序列。控制序列可以是本源或异源的。本领域技术人员公知且目前使用的控制序列是优选的。此类控制序列包括但不限于前导序列、多腺苷化序列、前肽序列、启动子、信号肽序列和转录终止子。优选地,所述控制序列包含启动子和转录终止子。
术语“表达盒”是指包含操作性连接的编码区(即基因)和调控区(即包含一个或多个控制序列的区域)的核酸构建物。优选地,所述控制序列适合于在所述宿主微生物中使用。
当在本文中使用时,术语“表达载体”是指包含表达盒的DNA或RNA分子。优选地,表达载体是线性或环状双链DNA分子。所述载体也可以包含复制原点、选择标志物等。
出于本发明的目的,术语两个核酸序列或氨基酸序列之间的“同一性百分率”打算是指在最佳比对后获得的待比较的两个序列之间一致的核苷酸或氨基酸残基的百分率,该百分率是纯粹统计性的,并且所述两个序列之间的差异随机地并在它们的整个长度上分布。最佳比对或最适比对是使如下所述计算的待比较的两个序列之间的同一性百分率最高的比对。两个核酸或氨基酸序列之间的序列比较常规通过在这些序列已被最适对齐后比较它们来进行,所述比较按照区段或比较窗口来进行,以鉴定和比较具有序列相似性的局部区域。出于确定氨基酸序列同一性百分率的目的的比对可以以本领域中公知的各种不同方式进行,例如通过使用可以在互联网上获得的计算机软件,例如http://blast.ncbi.nlm.Nih.gov/或http://www.ebi.ac.uk/Tools/emboss/。本领域技术人员可以为测量所述比对确定适合的参数,包括为了在所比较的序列的整个长度内获得最大对齐所需的算法。出于本发明的目的,氨基酸序列同一性百分率的值是指使用EMBOSS Needle成对序列比对程序产生的值,所述程序利用Needleman-Wunsch算法产生两个序列的最适全局比对,其中所有搜索参数由默认以下参数定义:符号矩阵=BLOSUM62,开放空位=10,延长空位=0.5,末端空位罚分=假,开放末端空位=10和延长末端空位=0.5。在某些实施方式中,在本专利申请中提到的所有同一性百分率可以被设定在至少60%、至少70%、至少80%、至少85%,优选地至少90%同一性,更优选地至少95%同一性。具体来说,其中所有酶的序列同一性百分率为至少80%或至少85%、优选地至少90%或至少95%序列同一性的实施方式被认为已被描述。
在一个实施方式中,所述多肽相对于在SEQ ID NO中描述的序列可能具有1、2、3、4、5、6、7、8、9或10个添加、替换或缺失。具体来说,这些添加、替换或缺失被引入在N-端末端、C-端末端或两个末端处。
所述多肽可以任选地采取融合蛋白的形式。
当在本文中使用时,术语“过表达”和“提高的表达”可互换使用,并且意味着相对于未修饰的微生物例如野生型微生物或不包含本文中描述的遗传修饰的微生物,基因或酶的表达提高。术语“野生型”是指自然界中存在的未修饰的微生物。酶的提高的表达通常通过提高编码所述酶的基因的表达来获得。在其中所述基因或酶不天然存在于本发明的微生物中,即异源基因或酶的实施方式中,术语“过表达”和“表达”可互换使用。为了提高基因的表达,本领域技术人员可以使用任何已知的技术,例如提高所述基因在所述微生物中的拷贝数,使用诱导所述基因的高水平表达的启动子即强启动子,使用使相应的信使RNA稳定的元件或螯合核糖体结合位点(RBS)及其周围序列的序列。具体来说,过表达可以通过提高所述基因在所述微生物中的拷贝数来获得。可以通过本领域技术人员已知的重组方法将所述基因的一个或多个拷贝引入到基因组中,包括基因的替换或多拷贝整合(参见例如国际专利申请WO 2015/092013)。优选地,将包含优选地置于强启动子控制之下的所述基因的表达盒整合到基因组中。作为变化形式,所述基因可以由表达载体、优选为质粒携带,所述载体包含具有优选地置于强启动子控制之下的所述感兴趣的基因的表达盒。取决于复制原点的性质,所述表达载体可以以一个或多个拷贝存在于所述微生物中。基因的过表达也可以通过使用诱导所述基因的高水平表达的启动子来获得。例如,可以将内源基因的启动子用更强的启动子,即诱导更高表达水平的启动子代替。所述在不是天然启动子的启动子控制之下的内源基因被称为异源核酸。适合用于本发明的启动子对于本领域技术人员来说是已知的,并且可以是组成型或诱导型的,并且可以是内源或异源的。
术语“包含”也意味着“由……组成”或“基本上由……组成”。术语“基本上由……组成”意味着所述序列相对于SEQ ID NO中描述的序列可能含有1、2、3、4、5、6、7、8、9或10个添加、替换或缺失。
重组微生物
根据本发明所述的微生物可以是真核或原核微生物。
在第一实施方式中,所述微生物是真核生物。优选地,它是酵母目、锁掷酵母目和裂殖酵母目的酵母。所述酵母可以例如选自毕赤酵母(Pichia)、克鲁维酵母(Kluyveromyces)、酵母(Saccharomyces)、裂殖酵母(Schizosaccharomyces)、假丝酵母(Candida)、油脂酵母(Lipomyces)、红酵母(Rhodotorula)、红冬孢酵母(Rhodosporidium)、耶氏酵母(Yarrowia)或德巴利氏酵母(Debaryomyces)属。在一个实施方式中,所述酵母选自巴斯德毕赤酵母(Pichia pastoris)、乳酸克鲁维酵母(Kluyveromyces lactis)、马克斯克鲁维酵母(Kluyveromyces marxianus)、酿酒酵母、卡尔斯伯酵母(Saccharomycescarlsbergensis)、糖化酵母(Saccharomyces diastaticus)、道格拉斯酵母(Saccharomyces douglasii)、克氏酵母(Saccharomyces kluyveri)、诺地酵母(Saccharomyces norbensis)、卵形酵母(Saccharomyces oviformis)、粟酒裂殖酵母(Schizosaccharomyces pombe)、白假丝酵母(Candida albicans)、热带假丝酵母(Candidatropicalis)、黏红酵母(Rhodotorula glutinis)、圆红冬孢酵母(Rhodosporidiumtoruloides)、解脂耶氏酵母(Yarrowia lipolytica)、汉氏德巴利氏酵母(Debaryomyceshansenii)和斯达氏油脂酵母(Lipomyces starkeyi)。在优选实施方式中,所述微生物是酵母属酵母,优选为酿酒酵母。可选地,所述微生物可以是真菌,优选为丝状真菌。优选地,它选自曲霉(Aspergillus)、木霉(Trichoderma)、脉孢菌(Neurospora)、柄孢壳菌(Podospora)、内座壳(Endothia)、毛霉(Mucor)、旋孢腔菌(Cochiobolus)或梨孢霉(Pyricularia)属。优选地,所述真菌选自构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)、Aspergillus awomari、米曲霉(Aspergillus oryzae)、土曲霉(Aspergillus terreus)、粗糙脉孢菌(Neurospora crassa)、里氏木霉(Trichodermareesei)和绿色木霉(Trichoderma viride)。
在第二实施方式中,所述微生物是原核生物。优选地,它是细菌,尤其是选自酸杆菌门(Acidobacteria)、放线菌门(Actinobacteria)、产水菌门(Aquificae)、拟杆菌门(Bacterioidetes)、衣原体门(Chlamydiae)、绿菌门(Chlorobi)、绿弯菌门(Chloroflexi)、产金菌门(Chrysiogenetes)、蓝藻门(Cyanobacteria)、脱铁杆菌门(Deferribacteres)、栖热异常球菌门(Deinococcus-Thermus)、网团菌门(Dictyoglomi)、纤维杆菌门(Fibrobacteres)、厚壁菌门(Firmicutes)、梭杆菌门(Fusobacteria)、芽单胞菌门(Gemmatimonadetes)、硝化螺旋菌门(Nitrospirae)、浮霉菌门(Planctomycetes)、变形菌门(Proteobacteria)、螺旋体门(Spirochaetes)、热脱硫杆菌门(Thermodesulfobacteria)、热微菌门(Thermomicrobia)、热袍菌门(Thermotogae)或疣微菌门(Verrucomicrobia)。优选地,所述细菌属于Acaryochloris、醋酸杆菌属(Acetobacter)、放线杆菌属(Actinobacillus)、土壤杆菌属(Agrobacterium)、脂环酸芽胞杆菌属(Alicyclobacillus)、鱼腥藻属(Anabaena)、倒囊藻属(Anacystis)、厌氧螺菌属(Anaerobiospirillum)、产水菌属(Aquifex)、节杆菌属(Arthrobacter)、节螺藻属(Arthrospira)、固氮菌属(Azobacter)、芽孢杆菌属(Bacillus)、短杆菌属(Brevibacterium)、伯克霍尔德氏菌属(Burkholderia)、绿菌属(Chlorobium)、着色菌属(Chromatium)、绿棒菌属(Chlorobaculum)、梭菌属(Clostridium)、棒杆菌属(Corynebacterium)、贪铜菌属(Cupriavidus)、蓝丝菌属(Cyanothece)、肠杆菌属(Enterobacter)、异常球菌属(Deinococcus)、欧文氏菌属(Erwinia)、埃希氏杆菌属(Escherichia)、地杆菌属(Geobacter)、粘杆菌属(Gloeobacter)、葡糖杆菌属(Gluconobacter)、氢杆菌属(Hydrogenobacter)、克雷伯氏菌属(Klebsiella)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、曼氏杆菌属(Mannheimia)、生根瘤菌属(Mesorhizobium)、甲基杆菌属(Methylobacterium)、微杆菌属(Microbacterium)、微囊藻属(Microcystis)、硝化杆菌属(Nitrobacter)、亚硝化单胞菌属(Nitrosomonas)、硝化刺菌属(Nitrospina)、硝化螺菌属(Nitrospira)、念珠藻属(Nostoc)、席藻属(Phormidium)、原绿球藻属(Prochlorococcus)、假单胞菌属(Pseudomonas)、罗尔斯通氏菌属(Ralstonia)、根瘤菌属(Rhizobium)、红杆菌属(Rhodobacter)、红球菌属(Rhodococcus)、红假单胞菌属(Rhodopseudomonas)、红螺菌属(Rhodospirillum)、沙门氏菌属(Salmonella)、栅列藻属(Scenedesmun)、沙雷氏菌属(Serratia)、志贺氏菌属(Shigella)、葡萄球菌属(Staphylococcus)、链霉菌属(Streptomyces)、聚球藻属(Synechoccus)、集胞藻属(Synechocystis)、Thermosynechococcus、束毛藻属(Trichodesmium)或发酵单胞菌属(Zymomonas)。更优选地,所述细菌选自根癌土壤杆菌(Agrobacterium tumefaciens)、产琥珀酸厌氧螺菌(Anaerobiospirillum succiniciproducens)、产琥珀酸放线杆菌(Actinobacillus succinogenes)、Aquifex aeolicus、Aquifex pyrophilus、枯草芽孢杆菌(Bacillus subtilis)、解淀粉芽孢杆菌(Bacillus amyloliquefacines)、产氨短杆菌(Brevibacterium ammoniagenes)、Brevibacterium immariophilum、巴氏梭菌(Clostridium pasteurianum)、扬氏梭菌(Clostridium ljungdahlii)、丙酮丁醇梭菌(Clostridium acetobutylicum)、拜氏梭菌(Clostridium beigerinckii)、谷氨酸棒杆菌(Corynebacterium glutamicum)、Cupriavidus necator、耐金属贪铜菌(Cupriavidusmetallidurans)、阪崎肠杆菌(Enterobacter sakazakii)、大肠埃希氏杆菌、氧化葡萄糖酸杆菌(Gluconobacter oxydans)、嗜热氢杆菌(Hydrogenobacter thermophilus)、产酸克雷伯氏菌(Klebsiella oxytoca)、乳酸乳球菌(Lactococcus lactis)、植物乳杆菌(Lactobacillus plantarum)、产琥珀酸曼氏杆菌(Mannheimia succiniciproducens)、百脉根中生根瘤菌(Mesorhizobium loti)、铜绿假单胞菌(Pseudomonas aeruginosa)、Pseudomonas mevalonii、Pseudomonas pudica、恶臭假单胞菌(Pseudomonas putida)、荧光假单胞菌(Pseudomonas fluorescens)、埃特里根瘤菌(Rhizobium etli)、荚膜红杆菌(Rhodobacter capsulatus)、类球红杆菌(Rhodobacter sphaeroides)、深红红螺菌(Rhodospirillum rubrum)、肠沙门氏菌(Salmonella enterica)、伤寒沙门氏菌(Salmonella typhi)、鼠伤寒沙门氏菌(Salmonella typhimurium)、痢疾志贺氏菌(Shigella dysenteriae)、弗氏志贺氏菌(Shigella flexneri)、宋内志贺氏菌(Shigellasonnei)、金黄色葡萄球菌(Staphylococcus aureus)、天蓝色链霉菌(Streptomycescoelicolor)、运动发酵单胞菌(Zymomonas mobilis)、Acaryochloris marina、多变鱼腥藻(Anabaena variabilis)、钝顶节旋藻(Arthrospira platensis)、极大节旋藻(Arthrospira maxima)、Chlorobium tepidum、绿棒菌(Chlorobaculum sp.)、蓝丝菌(Cyanothece sp.)、Gloeobacter violaceus、铜绿微囊藻(Microcystis aeruginosa)、点形念珠藻(Nostoc punctiforme)、Prochlorococcus marinus、细长聚球藻(Synechococcuselongatus)、集胞藻(Synechocystis sp.)、Thermosynechococcus elongatus、红海束毛藻(Trichodesmium erythraeum)和沼泽红假单胞菌(Rhodopseudomonas palustris)。在优选实施方式中,所述微生物是大肠埃希氏杆菌,例如大肠埃希氏杆菌BL21、大肠埃希氏杆菌BL21(DE3)、大肠埃希氏杆菌MG1655或大肠埃希氏杆菌W3110及其衍生株。在可选实施方式中,所述微生物是链霉菌属细菌,特别是委内瑞拉链霉菌(Streptomyces venezuelae)。
所述微生物可能已被修饰,以提高酪氨酸和/或苯丙氨酸、优选为酪氨酸的生产。尤其是可以将负责酪氨酸和/或苯丙氨酸、优选为酪氨酸的生产的反馈抑制的基因失活。可选地或累加地,可以将用于酪氨酸和/或苯丙氨酸、优选为酪氨酸的生物合成的途径优化,尤其是通过将碳流从其他代谢途径重新导向酪氨酸和/或苯丙氨酸、优选为酪氨酸的代谢途径。这些修饰和这些基因对于本领域技术人员来说是公知的(参见US 8,809,028;Pandey等,2016,Biotechnol.Adv.,34,634-662)。
因此,在一个实施方式中,所述微生物产生大量酪氨酸和/或苯丙氨酸,特别是从简单碳源例如葡萄糖。
使产生橙皮苷和/或香叶木苷成为可能的修饰
对根据本发明所述的重组微生物进行修饰,以产生橙皮苷和/或香叶木苷。尤其是,为了使所述微生物能够从橙皮素和/或香叶木素分别合成橙皮苷和/或香叶木苷,对所述微生物进行修饰,以引入橙皮素和/或香叶木素在7位中的糖基化和将鼠李糖转移到橙皮素-7-O-葡萄糖苷和/或香叶木素-7-O-葡萄糖苷的葡萄糖的6位中所需的酶。
在第一实施方式中,所述重组微生物能够产生橙皮素和/或香叶木素:具体来说,它已为此目的进行了修饰。在可选实施方式中,可以向所述微生物提供橙皮素和/或香叶木素,例如通过向培养基添加这些化合物。
在一个特定实施方式中,所述微生物产生橙皮苷。然后可以通过化学转化、尤其是通过氧化从橙皮苷制备香叶木苷。
在优选实施方式中,所述微生物产生橙皮苷和香叶木苷。
因此,所述重组微生物包含:
a.编码能够在橙皮素和/或香叶木素的7位中添加葡萄糖的黄烷酮7-O-β-D-葡萄糖基转移酶(UGT)的异源核酸序列;
b.编码能够将鼠李糖转移到橙皮素-7-O-葡萄糖苷和/或香叶木素-7-O-葡萄糖苷的葡萄糖的6位中的6-O-鼠李糖基转移酶(RhaT)的异源核酸序列;和
c.编码能够产生UDP-鼠李糖的UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶(RHM)的异源核酸序列。
在一个实施方式中,所述黄烷酮7-O-β-D-葡萄糖基转移酶(UGT),6”-O-鼠李糖基转移酶(RhaT)和UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶(RHM)是对所述微生物来说异源的酶。
UGT:黄烷酮7-O-β-葡萄糖基转移酶
UGT是执行将葡萄糖转移到橙皮素和/或香叶木素的7位中的酶。UGT的名称是UDP-葡萄糖:黄烷酮7-O-β-D-葡萄糖基转移酶或黄烷酮7-O-β-D-葡萄糖基转移酶。它也用下述名称称呼:尿苷二磷酸葡萄糖-黄烷酮7-O-葡萄糖基转移酶,柚皮素7-O-葡萄糖基转移酶和橙皮素7-O-葡萄糖基-转移酶。该酶属于EC 2.4.1.185类别。
本发明人必须鉴定和选择能够接受橙皮素和/或香叶木素作为底物并在这些化合物的7位中添加葡萄糖的酶。优选地,所述酶被选择成对橙皮素和/或香叶木素的7位中的糖基化具有偏好性。在优选实施方式中,所述酶特异性针对橙皮素和/或香叶木素的7位。
因此,所述微生物包含编码能够在橙皮素和香叶木素的7位中添加葡萄糖的黄烷酮7-O-β-D-葡萄糖基转移酶(UGT)的异源核酸序列。
术语“7-O-β-糖基转移酶活性”是指能够在黄酮类化合物的7位中添加葡萄糖的UGT酶。为了确定是否存在7-O-β-糖基转移酶活性,可以进行酶测试,其由下述步骤组成:将黄烷酮7-O-β-D-葡萄糖基转移酶在NAD(P)H、O2和黄酮类化合物存在下,在最适条件(pH、离子等)下体外温育;通过UPLC-MS并与预期的标准品进行比较,来观察在7位中含有另外的葡萄糖的黄酮类化合物的出现。优选地,所述黄酮类化合物是橙皮素或香叶木素,并且所述在7位中含有另外的葡萄糖的黄酮类化合物是它们的在7位中具有另外的葡萄糖的形式,即橙皮素7-O-葡萄糖苷和香叶木素7-O-葡萄糖苷。
这种酶只存在于高等真核生物,特别是植物中。例如,所述酶可能源自于柑橘属植物特别是柚子、甜橙、克莱门柚、四季橘(Citrus mitis)和葡萄柚(Citrus x paradisi),枸杞属植物特别是枸杞(Lysium barbarum),矮牵牛属植物特别是矮牵牛,拟南芥属植物特别是拟南芥,或黄芩属植物特别是黄芩。
在一个实施方式中,所述UGT是来自于拟南芥、黄芩或智人的酶。优选地,所述UGT是来自于拟南芥或黄芩的酶。
在优选实施方式中,所述UGT是来自于甜橙、克莱门柚、拟南芥、黄芩或智人,优选地来自于甜橙或黄芩的酶。
在特定实施方式中,所述UGT选自:包含选自SEQ ID NO:91、93、95、97、99和101的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽,优选地选自:包含选自SEQ ID NO:91、93、95和97的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性,尤其是使用橙皮素和/或香叶木素作为底物的多肽。
在优选实施方式中,所述UGT选自:包含选自SEQ ID NO:113、115、91、93、95、97、99和101的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽,优选地选自:包含选自SEQ ID NO:113、115、91、93、95和97的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽。更特别优选地,所述UGT选自:包含选自SEQ ID NO:113、115和95的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽。
因此,所述UGT可以来自于拟南芥。编码该酶的核酸序列和蛋白质序列描述在NCBI中,分别在参考编号NM_119576和NP_567995.1下,更特别是在SEQ ID NO:91中。所述蛋白质也被描述在UniProtKB/Swiss Prot中参考编号UGT73B1下。
可选地,所述UGT来自于黄芩。在第一种情况下,编码第一UGT的核酸序列和蛋白质序列描述在NCBI中,分别在参考编号KU712253和AMK52071.1下,更特别是在SEQ ID NO:93中。所述蛋白质描述在UniProtKB/Swiss Prot中参考编号A0A140DPB7下。在第二种情况下,编码第二UGT的核酸序列和蛋白质序列描述在NCBI中,分别在参考编号KU712254和AMK52072.1下,更特别是在SEQ ID NO:95中。所述蛋白质描述在UniProtKB/Swiss Prot中参考编号A0A140DPB8下。在第三种情况下,编码第三UGT的核酸序列和蛋白质序列描述在NCBI中,分别在参考编号KU712255和AMK52073.1下,更特别是在SEQ ID NO:97中。所述蛋白质描述在UniProtKB/Swiss Prot中参考编号A0A140DPB9下。
此外,所述UGT可能来自于智人。在第一种情况下,所述UGT是UGT1A6(UDP葡萄糖醛酸基转移酶家族1成员A6)。所述蛋白质描述在UniProtKB/Swiss Prot中参考编号P19224下。共有编码序列描述在NCBI中编号CCDS2507.1下。该酶的序列描述在SEQ ID NO:99中。在第二种情况下,所述UGT是UGT1A7(UDP葡萄糖醛酸基转移酶家族1成员A7)。所述蛋白质描述在UniProtKB/Swiss Prot中参考编号Q9HAW7下。共有编码序列描述在NCBI中编号CCDS2506.1下。该酶的序列描述在SEQ ID NO:101中。
所述UGT也可能来自于柑橘属植物,特别是甜橙或克莱门柚。具体来说,来自于甜橙的UGT描述在SEQ ID NO:113中。编码该酶的核苷酸序列描述在SEQ ID NO:114中。来自于克莱门柚的UGT描述在SEQ ID NO:115中。编码该酶的核苷酸序列描述在SEQ ID NO:116中。
在优选实施方式中,所述UGT选自:包含选自SEQ ID NO:113和95的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽,优选地选自:包含选自SEQ ID NO:113的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽。
RhaT:6-O-鼠李糖基转移酶
RhaT是一种执行将鼠李糖转移到橙皮素-7-O-葡萄糖苷和/或香叶木素-7-O-葡萄糖苷的葡萄糖的6位中的酶。RhaT是6-O-鼠李糖基转移酶。这种酶属于EC 2.4.1.B53类别。
本发明人必须鉴定和选择能够接受橙皮素-7-O-葡萄糖苷和/或香叶木素-7-O-葡萄糖苷作为底物并在这些化合物的葡萄糖的6位中添加鼠李糖的酶。
因此,所述微生物包含编码能够将鼠李糖转移到橙皮素-7-O-葡萄糖苷和/或香叶木素-7-O-葡萄糖苷的葡萄糖的6位中的6-O-鼠李糖基转移酶(RhaT)的异源核酸序列。这种酶只存在于高等真核生物,特别是植物中。
术语“6-O-鼠李糖基转移酶活性”意味着通过酶RhaT在葡萄糖的6位中添加鼠李糖。为了确定是否存在6-O-鼠李糖基转移酶活性,可以进行酶测试,其由下述步骤组成:将6-O-鼠李糖基转移酶在NAD(P)H、O2和黄酮类化合物存在下,在最适条件(pH、离子等)下体外温育,通过UPLC-MS并与预期的标准品进行比较,来观察其中鼠李糖被添加到葡萄糖的6位中的黄酮类化合物的出现。优选地,所述黄酮类化合物是橙皮素7-O-葡萄糖苷或香叶木素7-O-葡萄糖苷,并且所述其中鼠李糖被添加到葡萄糖的6位中的黄酮类化合物是橙皮苷和香叶木苷。
优选地,这种酶是由柑橘属植物或矮牵牛产生的酶,优选为甜橙、柚子或克莱门柚产生的酶。优选地,所述酶是源自于甜橙或克莱门柚的酶。
在特定实施方式中,所述6-O-鼠李糖基转移酶选自:包含选自SEQ ID NO:103、105的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有6-O-鼠李糖基转移酶活性的多肽。
因此,所述RhaT可以来自于克莱门柚。它被描述在NCBI的GenBank数据库中,核酸序列在编号XM_006420965下,蛋白质序列在编号XP_006421028下,更特别是在SEQ ID NO:103中。所述蛋白质描述在UniProtKB/Swiss Prot中参考编号V4RJL6下。
所述RhaT也可以来自于甜橙。它被描述在NCBI的GenBank数据库中,核酸序列在编号DQ119035下,蛋白质序列在编码ABA18631.1下,更特别是在SEQ ID NO:105中。所述蛋白质描述在UniProtKB/Swiss Prot中参考编号A7ISD3下。
在特定实施方式中,所述RhaT来自于甜橙,并且是包含序列SEQ ID NO:105的酶或包含与其具有至少60、70、80、85、90或95%序列同一性的序列并具有6”-O-鼠李糖基转移酶活性的多肽。
在优选实施方式中,所述RhaT选自:包含选自SEQ ID NO:103的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有6”-O-鼠李糖基转移酶活性的多肽。
RHM:UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶
RHM是一种三功能酶,UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶。这种酶能够从UDP-葡萄糖产生UDP-鼠李糖。这种酶属于EC 4.2.1.76类别。UDP-鼠李糖为6-O-鼠李糖基转移酶(RhaT)活性所必需。
因此,所述微生物包含编码能够产生UDP-鼠李糖的UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶(RHM)的异源核酸序列。这种酶只存在于高等真核生物,特别是植物中。
术语“UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶活性”意味着将UDP-葡萄糖转化成UDP-鼠李糖。为了确定是否存在UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶活性,可以进行酶测试,其由下述步骤组成:将所述UDP-葡萄糖酶、NAD(P)H和O2在最适条件(pH、离子等)下体外温育,通过UPLC-MS并与预期的标准品进行比较,来观察UDP-鼠李糖的出现。
优选地,这种酶是由柑橘属植物特别是甜橙或是由拟南芥产生的酶。
在特定实施方式中,所述UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶选自:包含选自SEQ ID NO:107、109和111的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶活性的多肽。
所述RHM可以来自于甜橙。它被描述在NCBI的GenBank数据库中,核酸序列在编号XM_006477756下,蛋白质序列在编号XP_006477819.1下,更特别是在SEQ ID NO:107中。
所述RHM也可以来自于拟南芥。在第一种情况下,所述蛋白质被描述在NCBI的GenBank数据库中,核酸序列在编号AY081471下,蛋白质序列在编号AAM10033.1,更特别是在SEQ ID NO:109中。所述蛋白质描述在UniProtKB/Swiss Prot中参考编号Q9SYM5下。在第二种情况下,所述蛋白质被描述在NCBI的GenBank数据库中,核酸序列在编号AJ565874下,蛋白质序列在CAD92667.1下,更特别是在SEQ ID NO:111中。所述蛋白质描述在UniProtKB/Swiss Prot中参考编号Q9LPG6下。
在特定实施方式中,所述RHM是包含选自SEQ ID NO:107和109的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶活性的多肽。
在优选实施方式中,所述RHM选自:包含选自SEQ ID NO:107的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶活性的多肽。
酶的组合
在特定实施方式中,所述重组微生物包含:
-编码黄烷酮7-O-β-D-葡萄糖基转移酶(UGT)的异源核酸序列,所述黄烷酮7-O-β-D-葡萄糖基转移酶(UGT)来自于拟南芥、黄芩或智人,优选地来自于拟南芥或黄芩,优选为包含选自SEQ ID NO:113、115、91、93、95、97、99和101的序列的黄烷酮7-O-β-D-葡萄糖基转移酶(UGT)和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽,特别是包含选自SEQ ID NO:113、115、91、93、95和97的序列的黄烷酮7-O-β-D-葡萄糖基转移酶(UGT)和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽,最特别优选为包含选自SEQ ID NO:113、115和95的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽,特别是包含选自SEQ ID NO:113和95的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽;
-编码6-O-鼠李糖基转移酶(RhaT)的异源核酸序列,所述6-O-鼠李糖基转移酶(RhaT)来自于柑橘属或矮牵牛,优选来自于甜橙、柚子或克莱门柚,甚至更优选来自于甜橙或克莱门柚,优选为包含选自SEQ ID NO:103和105的序列的6-O-鼠李糖基转移酶(RhaT)和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有6-O-鼠李糖基转移酶活性的多肽,优选为包含选自SEQ ID NO:103的序列的RhaT和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有6”-O-鼠李糖基转移酶活性的多肽;和
-编码来自于甜橙或拟南芥的UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶(RHM)的异源核酸序列,所述RHM优选为包含选自SEQ ID NO:107、109和111的序列的RHM和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶活性的多肽,特别是包含选自SEQID NO:107和109的序列的RHM和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶活性的多肽,优选为包含选自SEQ ID NO:107的序列的RHM和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶活性的多肽。
在另一个特定实施方式中,所述重组微生物包含前述实施方式中所定义的编码6-O-鼠李糖基转移酶(RhaT)的异源核酸序列和编码UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶(RHM)的异源核酸序列,以及编码来自于拟南芥、黄芩或智人,优选地来自于拟南芥或黄芩的黄烷酮7-O-β-D-葡萄糖基转移酶(UGT)的异源核酸序列,所述黄烷酮7-O-β-D-葡萄糖基转移酶(UGT)优选为选自:包含选自SEQ ID NO:91、93、95、97、99和101的序列的黄烷酮7-O-β-D-葡萄糖基转移酶(UGT)和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽,特别是包含选自SEQ ID NO:91、93、95和97的序列的黄烷酮7-O-β-D-葡萄糖基转移酶(UGT)和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽。
在优选实施方式中,所述微生物包含:
-编码黄烷酮7-O-β-D-葡萄糖基转移酶(UGT)的异源核酸序列,所述黄烷酮7-O-β-D-葡萄糖基转移酶(UGT)选自:包含选自SEQ ID NO:113、115和95的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽,优选地选自:包含选自SEQ ID NO:113和95的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽,更特别优选地选自:包含选自SEQ ID NO:113的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽;和
-编码6”-O-鼠李糖基转移酶的异源核酸序列,所述6”-O-鼠李糖基转移酶选自:包含选自SEQ ID NO:103的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有6”-O-鼠李糖基转移酶活性的多肽;和
-编码UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶的异源核酸序列,所述UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶选自:包含选自SEQ IDNO:107的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶活性的多肽。
在特定实施方式中,上述酶是来自于高等真核生物的酶,优选为植物酶。在特定实施方式中,所述酶源自于同一属、例如同一物种的植物。
使产生橙皮素和/或香叶木素成为可能的修饰
正如前文指出的,将橙皮素和/或香叶木素供应到所述微生物,或者所述微生物能够产生橙皮素和/或香叶木素。特别地,所述微生物能够产生或已被修饰成能够产生橙皮素和/或香叶木素。因此,本发明人还开发了能够使微生物产生橙皮素和/或香叶木素的生物合成途径。
从柚皮素/芹菜素到橙皮素/香叶木素
橙皮素和/或香叶木素可以从柚皮素和芹菜素获得。
几种生物合成策略是可行的。为了制备橙皮素和/或香叶木素,需要制造两个修饰:4’位中羟基的甲基化和3’位的羟基化。因此,为了提高4’位中羟基的甲基化的特异性,似乎符合逻辑的是首先进行已经存在的羟基的甲基化,然后在3’位中添加第二个羟基。相反,本发明人得出结论,必需首先进行羟基化,然后再甲基化,尽管存在由于第二个羟基的引入而造成的甲基化特异性问题的风险。
F3’H:黄酮类化合物3’-单加氧酶
黄酮类化合物3’-单加氧酶(F3’H)是执行在柚皮素和/或芹菜素的3’位中添加羟基的酶。这种酶属于EC 1.14.14.82类别。它也被称为黄酮3’-羟化酶。
本发明人必须鉴定和选择能够接受柚皮素和/或芹菜素作为底物并且在这些化合物的3’位中添加羟基的酶。优选地,所述酶被选择成对柚皮素和/或芹菜素的3’位中的羟基化具有偏好性。在优选实施方式中,所述酶特异性针对柚皮素和/或芹菜素的3’位,特别是相对于5’位来说,以便避免在3’和5’位中的双重羟基化,并且优选地也避免5’位中的羟基化。
黄酮类化合物3’-单加氧酶(F3’H)是执行在柚皮素和/或芹菜素的3’位中添加羟基的酶。这种酶属于EC 1.14.14.82类别。它也被称为黄酮类化合物3’-羟化酶。
术语“黄酮类化合物3’-单加氧酶活性”意味着通过CPR依赖性F3’H酶将黄酮类化合物转化成3’-羟化的黄酮类化合物。为了确定是否存在黄酮类化合物3’-单加氧酶活性,可以进行酶测试,其由下述步骤组成:将黄酮类化合物3’-单加氧酶在NAD(P)H、O2和黄酮类化合物存在下,在最适条件(pH、离子等)下体外温育,通过UPLC-MS并与预期的标准品进行比较,来观察3’-羟化的黄酮类化合物的出现。优选地,所述黄酮类化合物是柚皮素或芹菜素,并且所述3’-羟化的黄酮类化合物是柚皮素或芹菜素的3’-羟化的形式,即圣草酚或木犀草素。
因此,所述微生物可以包含编码能够在柚皮素和/或芹菜素的3’位中添加羟基的黄酮类化合物3’-单加氧酶(F3’H)的异源核酸序列。
在一个实施方式中,所述F3’H是植物酶,尤其是来自于葱属(Allium)、拟南芥属(Arabidopsis)、芸苔属(Brassica)、翠菊属(Callistephus)、金鱼花属(Columnea)、柑橘属(Citrus)、石竹属(Dianthus)、龙胆属(Gentiana)、大丁草属(Gerbera)、大豆属(Glycine)、草莓属(Fragaria)、番薯属(Ipomoea)、苹果属(Malus)、紫罗兰属(Matthiola)、蓝眼菊属(Osteospermum)、稻属(Oryza)、原毛平革菌属(Phanerochaete)、紫苏属(Perilla)、欧芹属(Petroselinum)、天竺葵属(Pelargonium)、水兰属(Pilosella)、矮牵牛属(Petunia)、岩桐属(Sinningia)、高粱属(Sorghum)、蝴蝶草属(Torenia)、葡萄属(Vitis)或玉蜀黍属(Zea)的植物,例如洋葱(Allium cepa)、拟南芥、欧洲油菜(Brassica napus)、杂交金鱼花(Columnea hybrida)、翠菊、甜橙、克莱门柚、康乃馨(Dianthus caryophyllus)、野草莓(Fragaria vesca)、普通草莓(Fragaria x ananassa)、非洲菊、大豆(Glycine max)、三花龙胆(Gentiana triflora)、牵牛花(Ipomoea nil)、圆叶牵牛(Ipomoea purpurea)、三色牵牛(Ipomoea tricolor)、紫罗兰(Matthiola incana)、苹果(Malus domestica)、蓝眼菊、水稻(Oryza sativa)、黄孢原毛平革菌、山柳兰、荷兰芹、天竺葵(Pelargonium x hortorum)、回回苏、矮牵牛、Sinningia cardinalis、高粱(Sorghum bicolor)、蝴蝶草(Torenia sp)、蝴蝶草杂交栽培种(Torenia hybrid cultivar)、葡萄(Vitis vinifera)或玉米。在更特定实施方式中,所述F3’H是来自于葱属、芸苔属、翠菊属、金鱼花属、柑橘属、石竹属、龙胆属、大丁草属、大豆属、草莓属、番薯属、苹果属、紫罗兰属、蓝眼菊属、稻属、原毛平革菌属、紫苏属、欧芹属、天竺葵属、水兰属、矮牵牛属、岩桐属、高粱属、蝴蝶草属、葡萄属或玉蜀黍属的植物,例如洋葱、欧洲油菜、杂交金鱼花、翠菊、甜橙、克莱门柚、康乃馨、野草莓、普通草莓、非洲菊、大豆、三花龙胆、牵牛花、圆叶牵牛、三色牵牛、紫罗兰、苹果、蓝眼菊、水稻、黄孢原毛平革菌、山柳兰、荷兰芹、天竺葵、回回苏、矮牵牛、Sinningia cardinalis、高粱、蝴蝶草、蝴蝶草杂交栽培种、葡萄或玉米的酶。
优选地,所述F3’H是来自于回回苏、矮牵牛、翠菊、非洲菊、克莱门柚、蓝眼菊、黄孢原毛平革菌、阿维链霉菌、甜橙、拟南芥或山柳兰的酶。特别地,所述F3’H可以是来自于回回苏、矮牵牛、翠菊、非洲菊、甜橙和山柳兰的酶。
在特定实施方式中,所述F3’H选自:包含选自SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21和121、特别是SEQ ID NO:1、3、5、7、9、11、13、15、17、19和21的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮类化合物3’-单加氧酶活性的多肽,优选地选自:包含选自SEQ ID NO:1、5、7、11、17、19和121、特别是SEQID NO:1、5、7、11、17和19的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有尤其是使用柚皮素和/或芹菜素作为底物并在3’位中进行羟基化的黄酮类化合物3’-单加氧酶活性的多肽。在特定实施方式中,所述F3’H是包含选自SEQ ID NO:5、7和17的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮类化合物3’-单加氧酶活性的多肽。
在优选实施方式中,所述F3’H是包含选自SEQ ID NO:7、11、17和121的序列的酶和包含与这些序列之一具有至少60、70、75、80、85、90或95%同一性的序列并具有黄酮类化合物3’-单加氧酶活性的多肽。最特别优选地,所述F3’H可以是包含选自SEQ ID NO:7、17和121的序列的酶和包含与这些序列之一具有至少60、70、75、80、85、90或95%同一性的序列并具有黄酮类化合物3’-单加氧酶活性的多肽。
因此,所述F3’H可以来自于回回苏。编码该酶的核酸序列和蛋白质序列描述在NCBI中,分别在参考编号AB045593.1和BAB59005.1下,更特别是在SEQ ID NO:2和1中。
所述F3’H可以来自于黄孢原毛平革菌。编码该酶的核酸序列和蛋白质序列描述在NCBI中,分别在参考编号AB597870.1和BAL05157.1下,更特别是在SEQ ID NO:4和3中。
所述F3’H可以来自于矮牵牛。编码该酶的核酸序列和蛋白质序列描述在NCBI中,分别在参考编号AF155332.1和AAD56282.1中,更特别是在SEQ ID NO:6和5中。
所述F3’H可以来自于翠菊。在一个实施方式中,编码该酶的核酸序列和蛋白质序列描述在NCBI中,分别在参考编号AF313488.1和AAG49298.1下,更特别是在SEQ ID NO:8和7中。在另一个实施方式中,编码该酶的核酸序列和蛋白质序列描述在NCBI中,分别在参考编号AF313489.1和AAG49299.1下,更特别是在SEQ ID NO:10和9中。
所述F3’H可以来自于非洲菊。编码该酶的核酸序列和蛋白质序列描述在NCBI中,分别在参考编号DQ218417.1和ABA64468.1下,更特别是在SEQ ID NO:12和11中。
所述F3’H可以来自于蓝眼菊。编码该酶的核酸序列和蛋白质序列描述在NCBI中,分别在参考编号DQ250711.1和ABB29899.1下,更特别是在SEQ ID NO:14和13中。
所述F3’H可以来自于克莱门柚。编码该酶的核酸序列和蛋白质序列描述在NCBI中,分别在参考编号XM_006440673.1和XP_006440736.1下,更特别是在SEQ ID NO:16和15中。
所述F3’H可以来自于甜橙。编码该酶的核酸序列和蛋白质序列描述在NCBI中,分别在参考编号XM_006477592.2和XP_006477655.1下,更特别是在SEQ ID NO:18和17中。
所述F3’H可以来自于山柳兰。编码该酶的核酸序列和蛋白质序列描述在NCBI中,分别在参考编号DQ319866.2和ABC47161.1下,更特别是在SEQ ID NO:20和19中。
所述F3’H可以来自于阿维链霉菌。编码该酶的核酸序列和蛋白质序列描述在NCBI中,分别在参考编号SAV_4539和WP_010985964.1下,更特别是在SEQ ID NO:22和21中。
所述F3’H可以来自于拟南芥。编码该酶的核酸序列和蛋白质序列描述在NCBI中,分别在参考编号NM_120881.2和NP_196416.1下,更特别是在SEQ ID NO:122和121中。
优选地,所述F3’H是包含选自SEQ ID NO:7、11、17和121的序列的酶和包含与这些序列之一具有至少75%、至少80%、至少85%、至少90%或至少95%同一性的序列并具有黄酮类化合物3’-单加氧酶活性的多肽。最特别优选地,所述F3’H是包含选自SEQ ID NO:7、17和121的序列的酶和包含与这些序列之一具有至少75%、至少80%、至少85%、至少90%或至少95%同一性的序列并具有黄酮类化合物3’-单加氧酶活性的多肽。
根据优选实施方式,所述F3’H是包含选自SEQ ID NO:7的序列的酶和包含与序列SEQ ID NO:7具有至少75%、至少80%、至少85%、至少90%或至少95%序列同一性的序列并具有黄酮类化合物3’-单加氧酶活性的多肽。
根据另一个特定实施方式,所述F3’H是包含选自SEQ ID NO:17的序列的酶和包含与序列SEQ ID NO:17具有至少75%、至少80%、至少85%、至少90%或至少95%序列同一性的序列并具有黄酮类化合物3’-单加氧酶活性的多肽。
根据另一个特定实施方式,所述F3’H是包含选自SEQ ID NO:121的序列的酶和包含与序列SEQ ID NO:121具有至少70%、至少75%、至少80%、至少85%、至少90%或至少95%序列同一性的序列并具有黄酮类化合物3’-单加氧酶活性的多肽。
根据另一个特定实施方式,所述F3’H是包含选自SEQ ID NO:11的序列的酶和包含与序列SEQ ID NO:11具有至少75%、至少80%、至少85%、至少90%或至少95%序列同一性的序列并具有黄酮类化合物3’-单加氧酶活性的多肽。
CPR:细胞色素P450还原酶
黄酮类化合物3’-单加氧酶(F3’H)需要NADPH的存在才能进行羟基的添加。
因此,在优选实施方式中,所述微生物包含编码细胞色素P450还原酶这种NADPH-细胞色素P450还原酶的异源核酸。这种酶属于EC1.6.2.4类别。
细胞色素P450还原酶源自于真核生物,尤其是酵母例如酵母属的酵母,或来自于植物,例如拟南芥属、阿密属(Ammi)、海榄雌属(Avicennia)、山茶属(Camellia)、喜树属(Camptotheca)、长春花属(Catharanthus)、柑橘属、大豆属、向日葵属(Helianthus)、百脉根属(Lotus)、松叶菊属(Mesembryanthemum)、菜豆属(Phaseolus)、小立碗藓属(Physcomitrella)、松属(Pinus)、杨属(Populus)、芸香属(Ruta)、甘蔗属(Saccharum)、茄属(Solanum)、豇豆属(Vigna)、葡萄属或玉蜀黍属的植物。
在优选实施方式中,所述细胞色素P450还原酶源自于真核生物,例如酵母,特别是酿酒酵母,或来自于植物,例如长春花(Catharanthus roseus)或拟南芥。
在特定实施方式中,所述细胞色素P450还原酶选自:包含选自SEQ ID NO:23、25、27、29和31的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有细胞色素P450还原酶活性的多肽,优选地选自:包含选自SEQ ID NO:23、25、29和31的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有细胞色素P450还原酶活性的多肽。在非常特定实施方式中,所述细胞色素P450还原酶可以选自:包含选自SEQ ID NO:25的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有细胞色素P450还原酶活性的多肽。
例如,所述细胞色素P450还原酶可以来自于长春花。它被描述在NCBI的GenBank数据库中,核酸序列在编号X69791.1下,蛋白质序列在编号CAA49446.1下,更特别地分别在SEQ ID NO:24和23中。所述蛋白质描述在UniProtKB/Swiss Prot中参考编号Q05001下。
所述细胞色素P450还原酶可以来自于酿酒酵母。它被描述在NCBI的GenBank数据库中,核酸序列在编号NM_001179172.1下,蛋白质序列在编号NP_011908.1下,更特别地分别在SEQ ID NO:26和25中。所述蛋白质描述在UniProtKB/Swiss Prot中参考编号P16603下。
所述细胞色素P450还原酶可以是嵌合的。它被描述在Aigrain等人的文章中(2009,EMBO Reports,10,742-747)。编码该酶的核酸序列和蛋白质序列分别描述在SEQ IDNO:28和27中。
此外,所述细胞色素P450还原酶可以来自于拟南芥。当所述细胞色素P450源自于拟南芥时,它可以被命名为ATR。它被描述在NCBI的GenBank数据库中,核酸序列在编号NM_118585.4下,蛋白质序列在编号NP_194183.1下,更特别地分别在SEQ ID NO:30和29中。所述蛋白质描述在UniProtKB/Swiss Prot中参考编号Q9SB48下。
此外,所述细胞色素P450还原酶可以来自于拟南芥,并且可以被描述在NCBI的GenBank数据库中,核酸序列在编号NM_179141.2下,蛋白质序列在编号NP_849472.2下,更特别地分别在SEQ ID NO:32和31中。所述蛋白质描述在UniProtKB/Swiss Prot中参考编号Q9SUM3下。
在一个实施方式中,将编码如上所定义的CPR的序列的新拷贝引入到酵母中。在另一个实施方式中,当所述酵母是酿酒酵母并且当所述CPR源自于同一酵母时,将编码CPR的内源基因的启动子用强启动子代替。因此,相对于野生型酵母所述CPR的表达提高;因此,CPR在所述修饰的酵母中过表达。
在一个特定实施方式中,所述F3’H和CPR来自于同一起源、同一物种。
OMT:O-甲基转移酶
O-甲基转移酶(OMT)是一个非常大的酶家族,具有难以定义的靶。本发明人必须鉴定和选择能够将圣草酚和/或木犀草素在4’位(对位)中甲基化的O-甲基转移酶。
优选地,所述酶被选择成对圣草酚和/或木犀草素的4’位中的甲基化具有偏好性。在优选实施方式中,所述酶特异性针对圣草酚和/或木犀草素的4’位。术语“特异的”意味着由所述酶在圣草酚和/或木犀草素上引入的甲基在60%的情况下、优选地在70%的情况下、甚至更优选地在80%的情况下存在于4’位中,在其余情况下被引入到3’位中。
术语“4’-O-甲基转移酶活性”意味着通过4’-O-甲基转移酶将4’-羟基黄酮类化合物转化成4’-甲氧基黄酮类化合物。为了确定是否存在4’-O-甲基转移酶活性,可以进行酶测试,其由下述步骤组成:将由4’-O-甲基转移酶、4’-羟基黄酮类化合物和S-腺苷-L-甲硫氨酸组成的混合物在最适条件(pH、温度、离子等)下体外温育。在一定的温育时间后,在UPLC-MS中观察4’-甲氧基黄酮类化合物的出现,并与预期的标准品进行比较。
在本发明的情况下,所述4’-羟基黄酮类化合物是圣草酚或木犀草素,它们将分别被转化成它们的4’-甲氧基黄酮类化合物形式,即橙皮素或香叶木素。
因此,所述微生物可以包含编码能够将圣草酚和/或木犀草素在4’位中甲基化的O-甲基转移酶的异源核酸序列。
这种酶仅存在于高等真核生物,特别是植物中。
在一个实施方式中,所述O-甲基转移酶(OMT)是来自于拟南芥的酶。在另一个实施方式中,所述O-甲基转移酶(OMT)源自于高等真核生物,优选地来自于哺乳动物。特别地,所述O-甲基转移酶(OMT)是人类(智人)起源的。
在特定实施方式中,所述OMT选自:包含选自SEQ ID NO:87和89的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有尤其是使用圣草酚和/或木犀草素作为底物并在4’位中进行甲基化的O-甲基转移酶活性的多肽。
在一个实施方式中,所述OMT选自:包含选自SEQ ID NO:89的序列的酶和包含与该序列具有至少60、70、80、85、90或95%同一性的序列并具有O-甲基转移酶活性的多肽。
在另一个实施方式中,所述OMT选自:包含选自SEQ ID NO:87的序列的酶和包含与该序列具有至少60、70、80、85、90或95%同一性的序列并具有O-甲基转移酶活性的多肽。
因此,所述OMT可以来自于拟南芥。编码该酶的核酸序列和蛋白质序列描述在NCBI中,分别在参考编号NM_118755.4和NP_567739.1下。所述蛋白质也描述在UniProtKB/SwissProt中参考编号Q9C5D7下,更特别是在SEQ ID NO:87中。
可选地,所述OMT来自于智人。编码该酶的核酸序列和蛋白质序列描述在NCBI中,分别在参考编号NM_007310.2和NP_009294.1下。所述蛋白质也描述在UniProtKB/SwissProt中参考编号P21964下,更特别是在SEQ ID NO:89中。
所述来自于智人的OMT具有接受圣草酚和木犀草素作为甲基化底物的优点,而来自于拟南芥的OMT对圣草酚具有强烈偏好性。相反,如果希望相对于香叶木素更有利于橙皮素的合成,则来自于拟南芥的OMT可能具有优势。
在优选实施方式中,所述OMT是来自于柑橘属,特别是克莱门柚或甜橙的OMT。在特别优选实施方式中,所述OMT选自:包含选自SEQ ID NO:117和119的序列的酶和与这些序列之一具有至少60、70、80、85、90或95%序列同一性并具有O-甲基转移酶活性的多肽。
优选地,所述OMT选自:包含选自SEQ ID NO:117的序列的酶和包含与该序列具有至少60、70、80、85、90或95%同一性的序列并具有O-甲基转移酶活性的多肽。
可选地,所述OMT选自:包含选自SEQ ID NO:119的序列的酶和包含与该序列具有至少60、70、80、85、90或95%同一性的序列并具有O-甲基转移酶活性的多肽。
上述来自于柑橘属和拟南芥的OMT具有将圣草酚在4’位中特异性甲基化的优点。
在所述微生物的设计期间,本发明人观察到该甲基化步骤构成限速步骤之一。令人吃惊的是,尽管在所述微生物、特别是酵母中存在辅因子S-腺苷-L-甲硫氨酸,但添加增加这种辅因子的合成的酶可以消除这个步骤的限制特点。因此,在优选实施方式中,所述微生物还包含编码合成S-腺苷-L-甲硫氨酸的酶S-腺苷甲硫氨酸合成酶(SAMT)的异源或内源序列。这种酶属于EC 2.5.1.6类别。
在一个实施方式中,所述微生物包含编码具体来说能够将圣草酚和/或木犀草素在4’位中甲基化的O-甲基转移酶(OMT)的异源核酸序列和编码S-腺苷甲硫氨酸合成酶(SAMT)的异源或内源核酸序列。
在一个实施方式中,所述SAMT源自于酵母,特别是酿酒酵母,最特别地所述微生物是酵母。
在特定实施方式中,所述S-腺苷甲硫氨酸合成酶是包含选自SEQ ID NO:81的序列的酶和包含与该序列具有至少60、70、80、85、90或95%同一性的序列并具有S-腺苷甲硫氨酸合成酶活性的多肽。
例如,所述S-腺苷甲硫氨酸合成酶可以来自于酿酒酵母。它被描述在NCBI的GenBank数据库中,核酸序列在编号NM_001180810.3下,蛋白质序列在编号NP_010790.3下。所述蛋白质描述在UniProtKB/Swiss Prot中参考编号P19358下。
在一个实施方式中,将编码如上所定义的SAMT的序列的新拷贝引入到所述微生物中。在另一个实施方式中,当所述微生物是酿酒酵母时,将编码SAMT的内源基因的启动子用强启动子代替。因此,相对于野生型微生物所述SAMT的表达提高;因此,所述SAMT在所述修饰的微生物中过表达。
因此,在优选实施方式中,所述微生物包含编码能够将圣草酚和/或木犀草素在4’位中甲基化的O-甲基转移酶的异源核酸序列和编码能够产生S-腺苷-L-甲硫氨酸的S-腺苷甲硫氨酸合成酶(SAMT)的异源或内源核酸序列。
FNS:黄酮合酶
香叶木素可以从木犀草素生产。它也可以从圣草酚,通过将它转化成木犀草素然后从木犀草素制备香叶木素,或通过将它转化成橙皮素然后从橙皮素制备香叶木素来获得。能够将圣草酚转化成木犀草素和/或将橙皮素转化成香叶木素的酶是黄酮合酶(FNS)。在特定实施方式中,所述黄酮合酶还能够将圣草酚转化成木犀草素。
因此,所述微生物可以包含编码黄酮合酶、特别是能够从圣草酚产生木犀草素和/或从橙皮素产生香叶木素的黄酮合酶的异源核酸序列。
术语“黄酮合酶活性”意味着通过FNSI酶(CPR不依赖性)或FNSII酶(CPR依赖性)将黄烷酮转化成黄酮。
为了确定是否存在黄酮合酶活性,可以进行酶测试,其由下述步骤组成:在FNSI的情况下将由黄酮合酶(FNSI)、黄烷酮、2-酮基戊二酸和O2组成的混合物在最适条件(pH、温度、离子等)下体外温育,并且在FNSII的情况下将由FNSII酶、黄烷酮、NAD(P)H和O2组成的混合物在最适条件(pH、温度、离子等)下体外温育。在一定温浴时间后,在UPLC-MS中观察对应于所述黄烷酮的黄酮的出现,并与预期的标准品进行比较。优选地,所述黄烷酮是圣草酚或橙皮素,其将被分别转化成它们的黄酮形式,即木犀草素或香叶木素。
因此,在特定实施方式中,所述微生物包含编码特别是能够将圣草酚和/或木犀草素在4’位中甲基化的O-甲基转移酶(OMT)的异源核酸序列,以及编码黄酮合酶,特别是能够从圣草酚产生木犀草素和/或从橙皮素产生香叶木素的黄酮合酶的异源核酸序列。
优选地,所述黄酮合酶是源自于植物,例如犬毒芹属(Aethusa)、当归属(Angelica)、金鱼草属(Antirrhinum)、芹属(Apium)、拟南芥属、翠菊属、山茶属、毒参属(Conium)、孜然芹属(Cuminum)、菜蓟属(Cynara)、大丽花属(Dahlia)、旋蒴苣苔属(Dorcoceras)、沟酸浆属(Erythranthe)、忍冬属(Lonicera)、苜蓿属(Medicago)、稻属、紫苏属、欧芹属、香茶属(Plectranthus)、杨属、风毛菊属(Saussurea)、黄芩属(Scutellaria)或玉蜀黍属,特别是拟南芥属、忍冬属、苜蓿属、稻属、欧芹属、杨属或玉蜀黍属,尤其是拟南芥、金银花、灰毡毛忍冬、蒺藜状苜蓿、水稻、荷兰芹、美洲黑杨(Populus deltoides)、玉米、翠菊、芹菜、孜然、毒欧芹、圆叶当归、毒芹、茶树、朝鲜蓟、水母雪莲、毛喉鞘蕊花、黄芩、旋蒴苣苔、金鱼草、回回苏、大丽花或Erythranthe lewisii,特别是拟南芥、金银花、灰毡毛忍冬、蒺藜状苜蓿、水稻、荷兰芹、美洲黑杨或玉米,优选为荷兰芹,或忍冬属例如金银花和灰毡毛忍冬的酶。
在特定实施方式中,所述黄酮合酶(FNS)选自:包含选自SEQ ID NO:33、35、37、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157和159的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮合酶活性的多肽。特别地,所述黄酮合酶(FNS)选自:包含选自SEQ ID NO:33、35和37的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮合酶活性的多肽。优选地,所述FNS选自:包含选自SEQ ID NO:37的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮合酶活性的多肽。
存在两种类型的黄酮合酶(FNS):黄酮合酶1(FNSI)和黄酮合酶2(FNSII)。从黄烷酮和2-酮基戊二酸开始,FNSI能够产生相应的黄酮。FNSI酶属于EC 1.14.11.22类别。FNSII属于P450组,并需要细胞色素P450还原酶的存在。FNSII酶属于EC 1.14.13类别。
在一个实施方式中,所述FNS是I型黄酮合酶。在另一个实施方式中,所述FNS是II型黄酮合酶。在其他实施方式中,所述微生物包含I型黄酮合酶和II型黄酮合酶。
在优选实施方式中,所述微生物包含编码I型黄酮合酶(FNSI)的异源核酸序列。FNSI的优点在于它不需细胞色素P450还原酶起作用。
所述FNSI可以是来自于植物例如荷兰芹、水稻、美洲黑杨、蒺藜状苜蓿、芹菜、孜然、毒欧芹、圆叶当归或毒芹,特别是荷兰芹、水稻、美洲黑杨或蒺藜状苜蓿,优选为荷兰芹的黄酮合酶。
所述FNSI可以是包含选自SEQ ID NO:37、127、137、141、143和145的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮合酶活性的多肽。在特定情况下,所述FNSI可以是包含选自SEQ ID NO:37的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮合酶活性的多肽。
例如,所述FNSI可以来自于荷兰芹。它被描述在NCBI的GenBank数据库中,核酸序列在编号AY817680.1下,蛋白质序列在编号AAX21541.1下。所述蛋白质描述在UniProtKB/Swiss Prot中参考编号Q7XZQ8下。所述氨基酸序列和核酸序列分别描述在SEQ ID NO:37和38中。
所述FNSI也可以来自于圆叶当归。它被描述在NCBI的GenBank数据库中,核酸序列在编号DQ683352.1下,蛋白质序列在ABG78793.1下。所述氨基酸序列和核酸序列分别描述在SEQ ID NO:127和128中。
所述FNSI也可以来自于芹菜。它被描述在NCBI的GenBank数据库中,核酸序列在编号AY817676.1下,蛋白质序列在AAX21537.1下。所述氨基酸序列和核酸序列分别描述在SEQID NO:137和138中。
所述FNSI也可以来自于孜然。它被描述在NCBI的GenBank数据库中,核酸序列在编号DQ683349.1下,蛋白质序列在ABG78790.1下。所述氨基酸序列和核酸序列分别描述在SEQID NO:141和142中。
所述FNSI也可以来自于毒欧芹。它被描述在NCBI的GenBank数据库中,核酸序列在编号DQ683350.1下,蛋白质序列在编号DQ683350.1下。所述氨基酸序列和核酸序列分别描述在SEQ ID NO:143和144中。
所述FNSI也可以来自于毒芹。它被描述在NCBI的GenBank数据库中,核酸序列在编号DQ683354.1下,蛋白质序列在编号ABG78795.1下。所述氨基酸序列和核酸序列分别描述在SEQ ID NO:145和146中。
在另一个实施方式中,所述微生物包含编码II型黄酮合酶(FNSII)的异源核酸序列。
所述FNSII可以是来自于植物例如拟南芥、玉米、忍冬属例如金银花和灰毡毛忍冬、翠菊、蒺藜状苜蓿、茶树、朝鲜蓟、水母雪莲、毛喉鞘蕊花、黄芩、旋蒴苣苔、金鱼草、回回苏、大丽花或Erythranthe lewisii的黄酮合酶,特别是来自于拟南芥、玉米或忍冬属例如金银花和灰毡毛忍冬的黄酮合酶。
在特定实施方式中,所述黄酮合酶(FNSII)选自:包含选自SEQ ID NO:33、35、129、131、133、135、139、147、149、151、153、155、157和159的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮合酶活性的多肽,优选地选自:包含选自SEQ ID NO:33和35的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮合酶活性的多肽。
在一个实施方式中,所述黄酮合酶FNS是源自于金银花的FNSII。在这个实施方式中,所述酶可以是在NCBI的GenBank数据库中,核酸序列在编号KU127576.1下并且蛋白质序列在编号AMQ91109.1下,更特别地是分别在SEQ ID NO:34和33中描述的酶。
在另一个实施方式中,所述黄酮合酶FNS是源自于灰毡毛忍冬的FNSII。编码该酶的核酸序列和蛋白质序列描述在NCBI中,分别在参考编号KU127580.1和AMQ91113.1下,更特别地分别在SEQ ID NO:36和35中。
在另一个实施方式中,所述黄酮合酶FNS是源自于朝鲜蓟的FNSII。编码该酶的核酸序列和蛋白质序列描述在NCBI中,分别在参考编号JN825735.1和AFG31000.1下,更特别地分别在SEQ ID NO:130和129中。
在另一个实施方式中,所述黄酮合酶FNS是源自于回回苏的FNSII。编码该酶的核酸序列和蛋白质序列描述在NCBI中,分别在参考编号AB045592.1和BAB59004.1下,更特别地分别在SEQ ID NO:132和131中。
在另一个实施方式中,所述黄酮合酶FNS是源自于大丽花的FNSII。编码该酶的核酸序列和蛋白质序列描述在NCBI中,分别在参考编号AB769842.1和BAM72335.1下,更特别地分别在SEQ ID NO:134和133中。
在另一个实施方式中,所述黄酮合酶FNS是源自于翠菊的FNSII。编码该酶的核酸序列和蛋白质序列描述在NCBI中,分别在参考编号AF188612.1和AAF04115.1下,更特别地分别在SEQ ID NO:136和135中。
在另一个实施方式中,所述黄酮合酶FNS是源自于蒺藜状苜蓿的FNSII。编码该酶的核酸序列和蛋白质序列描述在NCBI中,分别在参考编号DQ354373.1和ABC86159.1下,更特别地分别在SEQ ID NO:140和139中。
在另一个实施方式中,所述黄酮合酶FNS是源自于茶树的FNSII。编码该酶的核酸序列和蛋白质序列描述在NCBI中,分别在参考编号FJ169499.1和ACH99109.1下,更特别地分别在SEQ ID NO:148和147中。
在另一个实施方式中,所述黄酮合酶FNS是源自于水母雪莲的FNSII。编码该酶的核酸序列和蛋白质序列描述在NCBI中,分别在参考编号KF170286.1和AGV40781.1下,更特别地分别在SEQ ID NO:150和149中。
在另一个实施方式中,所述黄酮合酶FNS是源自于毛喉鞘蕊花的FNSII。编码该酶的核酸序列和蛋白质序列描述在NCBI中,分别在参考编号KF606861.1和AHJ89438.1下,更特别地分别在SEQ ID NO:152和151中。
在另一个实施方式中,所述黄酮合酶FNS是源自于黄芩的FNSII。编码该酶的核酸序列和蛋白质序列描述在NCBI中,分别在参考编号KT963454.1和AMW91729.1下,更特别地分别在SEQ ID NO:154和153中。
在另一个实施方式中,所述黄酮合酶FNS是源自于旋蒴苣苔的FNSII。编码该酶的核酸序列和蛋白质序列描述在NCBI中,分别在参考编号KV013332.1和KZV23934.1下,更特别地分别在SEQ ID NO:156和155中。
在另一个实施方式中,所述黄酮合酶FNS是源自于金鱼草的FNSII。编码该酶的核酸序列和蛋白质序列描述在NCBI中,分别在参考编号AB028151.1和BAA84071.1下,更特别地分别在SEQ ID NO:158和157中。
在另一个实施方式中,所述黄酮合酶FNS是源自于Erythranthe lewisii的FNSII。编码该酶的核酸序列和蛋白质序列描述在NCBI中,分别在参考编号KX710102.1和AOR81894.1下,更特别地分别在SEQ ID NO:160和159中。
在特定实施方式中,所述微生物包含编码II型黄酮合酶(FNSII)和I型黄酮合酶的异源核酸序列,所述II型黄酮合酶(FNSII)和I型黄酮合酶例如选自SEQ ID NO:33、35、129、131、133、135、139、147、149、151、153、155、157和159的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮合酶活性的多肽以及包含选自SEQ ID NO:37、127、137、141、143和145的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮合酶活性的多肽,优选为选自SEQ ID NO:33和35的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮合酶活性的多肽以及包含选自SEQ ID NO:37的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮合酶活性的多肽。
所述II型FNS即FNSII需要细胞色素P450还原酶(CPR)的存在。因此,如果所述微生物不包含细胞色素P450还原酶,则必需引入异源细胞色素P450还原酶。如果所述微生物已经包含一种细胞色素P450还原酶,则可以设想将内源细胞色素P450还原酶过表达(例如通过将启动子用强启动子代替或通过添加编码序列的一个或多个拷贝)或也引入异源细胞色素P450还原酶。
在特定实施方式中,所述II型FNS和CPR来自于同一起源、同一物种。
酶的组合
因此,除了如前所述从橙皮素和/或香叶木素分别生物合成橙皮苷和/或香叶木苷所需的酶之外,所述微生物优选地还包含用于从柚皮素和/或芹菜素产生橙皮素和/或香叶木素的酶。
在第一个特定实施方式中,所述重组微生物包含:
-编码能够在橙皮素和/或香叶木素的7位中添加葡萄糖的黄烷酮7-O-β-D-葡萄糖基转移酶(UGT)的异源核酸序列,所述黄烷酮7-O-β-D-葡萄糖基转移酶(UGT)优选为来自于拟南芥、甜橙、克莱门柚、黄芩或智人,优选地来自于甜橙或黄芩的黄烷酮7-O-β-D-葡萄糖基转移酶(UGT),优选为选自:包含选自SEQ ID NO:113、115、91、93、95、97、99和101的序列的酶的黄烷酮7-O-β-D-葡萄糖基转移酶(UGT)和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽,特别是包含选自SEQ ID NO:113、115、91、93、95和97的序列的黄烷酮7-O-β-D-葡萄糖基转移酶(UGT)和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽;
-编码能够将鼠李糖转移到橙皮素-7-O-葡萄糖苷和/或香叶木素-7-O-葡萄糖苷的葡萄糖的6位中的6-O-鼠李糖基转移酶(RhaT)的异源核酸序列,所述6-O-鼠李糖基转移酶(RhaT)优选为柑橘属或矮牵牛,优选为甜橙、柚子或克莱门柚,甚至更优选为甜橙或克莱门柚的RhaT,优选为包含选自SEQ ID NO:103和105的序列的6-O-鼠李糖基转移酶(RhaT)和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有6-O-鼠李糖基转移酶活性的多肽;
-编码能够产生UDP-鼠李糖的UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶(RHM)的异源核酸序列,所述RHM优选为来自于甜橙或拟南芥的RHM,优选为包含选自SEQ ID NO:107、109和111的序列的RHM和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶活性的多肽,特别是包含选自SEQ ID NO:107和109的序列的RHM和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶活性的多肽;
-编码能够将柚皮素和/或芹菜素在3’位中羟基化,特别是能够将柚皮素和/或芹菜素在3’位中羟基化的黄酮类化合物3’-单加氧酶(F3’H)的异源核酸序列,所述黄酮类化合物3’-单加氧酶(F3’H)优选地来自于回回苏、矮牵牛、翠菊、非洲菊、甜橙、克莱门柚、蓝眼菊、黄孢原毛平革菌、阿维链霉菌或山柳兰,特别是来自于回回苏、矮牵牛、翠菊、非洲菊、甜橙或山柳兰,所述黄酮类化合物3’-单加氧酶(F3’H)优选为包含选自SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21和121的序列的F3’H和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮类化合物3’-单加氧酶活性的多肽,优选为包含选自SEQ ID NO:1、5、7、11、17、19和121的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮类化合物3’-单加氧酶活性的多肽,特别是包含选自SEQ ID NO:7、11、17和121的序列的F3’H和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮类化合物3’-单加氧酶活性的多肽;
-任选的编码细胞色素P450还原酶(CPR)的异源核酸序列,所述细胞色素P450还原酶(CPR)优选为来自于酿酒酵母或来自于植物例如长春花或拟南芥的CPR,优选为包含选自SEQ ID NO:23、25、27、29和31的序列的CPR和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有细胞色素P450还原酶活性的多肽,优选为包含选自SEQID NO:23、25、29和31的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有细胞色素P450还原酶活性的多肽;
-编码能够将圣草酚和/或木犀草素在4’位中甲基化的O-甲基转移酶(OMT)的异源核酸序列,所述O-甲基转移酶(OMT)优选为来自于拟南芥或智人的OMT,优选为包含选自SEQID NO:117、119、87和89的序列的OMT和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有尤其是使用圣草酚和/或木犀草素作为底物并在4’位中进行甲基化的O-甲基转移酶活性的多肽,优选地选自:包含选自SEQ ID NO:117、119和89的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有O-甲基转移酶活性的多肽;和
-任选的编码能够从黄烷酮产生黄酮,特别是能够将柚皮素转化成芹菜素和/或将圣草酚转化成木犀草素,优选地将圣草酚转化成木犀草素的黄酮合酶(FNS)的异源核酸序列,所述黄酮合酶(FNS)优选为来自于拟南芥、金银花、灰毡毛忍冬、蒺藜状苜蓿、水稻、荷兰芹、美洲黑杨、玉米、翠菊、芹菜、孜然、毒欧芹、圆叶当归、毒芹、茶树、朝鲜蓟、水母雪莲、毛喉鞘蕊花、黄芩、旋蒴苣苔、金鱼草、回回苏、大丽花或Erythranthe lewisii,特别是来自于拟南芥、金银花、灰毡毛忍冬、蒺藜状苜蓿、水稻、荷兰芹、美洲黑杨或玉米,优选地来自于金银花、灰毡毛忍冬和荷兰芹的FNS,优选为包含选自SEQ ID NO:33、35、37、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157和159的序列的FNS和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮合酶活性的多肽,优选地选自:包含选自SEQ ID NO:33、35和37的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮合酶活性的多肽,优选为包含选自SEQ ID NO:37的序列的黄酮合酶(FNS)和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮合酶活性的多肽。
在另一个特定实施方式中,所述重组微生物包含:
-编码能够在橙皮素和/或香叶木素的7位中添加葡萄糖的黄烷酮7-O-β-D-葡萄糖基转移酶(UGT)的异源核酸序列,所述黄烷酮7-O-β-D-葡萄糖基转移酶(UGT)优选为来自于拟南芥、黄芩或智人,优选地来自于拟南芥或黄芩的黄烷酮7-O-β-D-葡萄糖基转移酶(UGT),优选为选自:包含选自SEQ ID NO:91、93、95、97、99和101的序列的酶的黄烷酮7-O-β-D-葡萄糖基转移酶(UGT)和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽,特别是包含选自SEQ IDNO:91、93、95和97的序列的黄烷酮7-O-β-D-葡萄糖基转移酶(UGT)和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽;
-编码能够将鼠李糖转移到橙皮素-7-O-葡萄糖苷和/或香叶木素-7-O-葡萄糖苷的葡萄糖的6位中的6-O-鼠李糖基转移酶(RhaT)的异源核酸序列,所述6-O-鼠李糖基转移酶(RhaT)优选为来自于柑橘属或矮牵牛,优选为来自于甜橙、柚子或克莱门柚,甚至更优选为来自于甜橙或克莱门柚的RhaT,优选为包含选自SEQ ID NO:103和105的序列的6-O-鼠李糖基转移酶(RhaT)和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有6-O-鼠李糖基转移酶活性的多肽;
-编码能够产生UDP-鼠李糖的UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶(RHM)的异源核酸序列,所述RHM优选为来自于甜橙或拟南芥的RHM,优选为包含选自SEQ ID NO:107、109和111的序列的RHM和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶活性的多肽,特别是包含选自SEQ ID NO:107和109的序列的RHM和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶活性的多肽;
-编码能够将柚皮素和/或芹菜素在3’位中羟基化,特别是能够将柚皮素和/或芹菜素在3’位中羟基化的黄酮类化合物3’-单加氧酶(F3’H)的异源核酸序列,所述黄酮类化合物3’-单加氧酶(F3’H)优选地来自于回回苏、矮牵牛、翠菊、非洲菊、甜橙和山柳兰,优选为包含选自SEQ ID NO:1、3、5、7、9、11、13、15、17、19和21的序列的F3’H和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮类化合物3’-单加氧酶活性的多肽,优选为包含选自SEQ ID NO:1、5、7、11、17和19的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮类化合物3’-单加氧酶活性的多肽,特别是包含选自SEQ ID NO:5、7和17的序列的F3’H和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮类化合物3’-单加氧酶活性的多肽;
-任选的编码细胞色素P450还原酶(CPR)的异源核酸序列,所述细胞色素P450还原酶(CPR)优选为来自于酿酒酵母或来自于植物例如长春花或拟南芥的CPR,优选为包含选自SEQ ID NO:23、25、27、29和31的序列的CPR和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有细胞色素P450还原酶活性的多肽,优选为包含选自SEQID NO:23、25、29和31的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有细胞色素P450还原酶活性的多肽;
-编码能够将圣草酚和/或木犀草素在4’位中甲基化的O-甲基转移酶(OMT)的异源核酸序列,所述O-甲基转移酶(OMT)优选为来自于拟南芥或智人的OMT,优选为包含选自SEQID NO:87和89的序列的OMT和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有尤其是使用圣草酚和/或木犀草素作为底物并在4’位中进行甲基化的O-甲基转移酶活性的多肽,优选选自包含序列SEQ ID NO:89的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有O-甲基转移酶活性的多肽;和
-任选的编码能够从黄烷酮产生黄酮,特别是能够将柚皮素转化成芹菜素和/或将圣草酚转化成木犀草素,优选地将圣草酚转化成木犀草素的黄酮合酶(FNS)的异源核酸序列,所述黄酮合酶(FNS)优选为来自于拟南芥、金银花、灰毡毛忍冬、蒺藜状苜蓿、水稻、荷兰芹、美洲黑杨或玉米,优选地来自于金银花、灰毡毛忍冬和荷兰芹的FNS,优选为包含选自SEQ ID NO:33、35和37的序列的FNS和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮合酶活性的多肽,优选为包含选自SEQ ID NO:37的序列的黄酮合酶(FNS)和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮合酶活性的多肽。
在优选实施方式中,所述微生物包含:
-编码黄烷酮7-O-β-D-葡萄糖基转移酶的异源核酸序列,所述黄烷酮7-O-β-D-葡萄糖基转移酶选自:包含选自SEQ ID NO:113、115和95的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽,优选地选自:包含选自SEQ ID NO:113和95的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽,最特别优选地选自:包含选自SEQ ID NO:113的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽;和
-编码6”-O-鼠李糖基转移酶的异源核酸序列,所述6”-O-鼠李糖基转移酶选自:包含选自SEQ ID NO:103的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有6”-O-鼠李糖基转移酶活性的多肽;和
-编码UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶的异源核酸序列,所述UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶选自:包含选自SEQ IDNO:107的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶活性的多肽;和
-编码黄酮类化合物3’-单加氧酶(F3’H)的异源核酸序列,所述黄酮类化合物3’-单加氧酶(F3’H)选自:包含选自SEQ ID NO:7、11、17和121的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮类化合物3’-单加氧酶活性的多肽,优选为包含选自SEQ ID NO:7、17和121的序列的黄酮类化合物3’-单加氧酶(F3’H)和与这些序列之一具有至少60、70、80、85、90或95%序列同一性并具有黄酮类化合物3’-单加氧酶活性的多肽,最特别优选为包含选自SEQ ID NO:7的序列的黄酮类化合物3’-单加氧酶(F3’H)和与该序列具有至少60、70、80、85、90或95%同一性并具有黄酮类化合物3’-单加氧酶活性的多肽;
-任选的编码细胞色素P450还原酶(CPR)的异源核酸序列,所述细胞色素P450还原酶(CPR)选自:包含选自SEQ ID NO:23、25、29和31的序列的CPR和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有细胞色素P450还原酶活性的多肽,优选选自:包含选自SEQ ID NO:23、25和29的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有细胞色素P450还原酶活性的多肽,最特别优选选自:包含选自SEQ ID NO:25的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有细胞色素P450还原酶活性的多肽;和
-编码O-甲基转移酶(OMT)的异源核酸序列,所述O-甲基转移酶(OMT)能够将圣草酚和/或木犀草素在4’位中甲基化并选自:包含选自SEQ ID NO:117、119和89的序列的O-甲基转移酶(OMT)和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有尤其是使用圣草酚和/或木犀草素作为底物并在4’中进行甲基化的O-甲基转移酶活性的多肽,优选选自:包含选自SEQ ID NO:117和119的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有O-甲基转移酶活性的多肽;和
-任选的编码黄酮合酶(FNS)的异源核酸序列,所述黄酮合酶(FNS)能够从黄烷酮产生黄酮,特别是能够将柚皮素转化成芹菜素和/或将圣草酚转化成木犀草素,优选地将圣草酚转化成木犀草素,并选自:包含选自SEQ ID NO:37的序列和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮合酶活性的多肽。
优选地,所述微生物包含这些异源核酸序列中的每一者。
在另一个特定实施方式中,所述重组微生物包含:
-编码能够在橙皮素和/或香叶木素的7位中添加葡萄糖的黄烷酮7-O-β-D-葡萄糖基转移酶(UGT)的异源核酸序列;
-编码能够将鼠李糖转移到橙皮素-7-O-葡萄糖苷和/或香叶木素-7-O-葡萄糖苷的葡萄糖的6位中的6”-O-鼠李糖基转移酶(RhaT)的异源核酸序列;
-编码能够产生UDP-鼠李糖的UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶(RHM)的异源核酸序列;
-编码能够将柚皮素和/或芹菜素在3’位中羟基化的黄酮类化合物3’-单加氧酶(F3’H)的异源核酸序列;
-编码细胞色素P450还原酶的异源核酸序列;
-编码能够将圣草酚和/或木犀草素在4’位中甲基化的O-甲基转移酶的异源核酸序列;和
-编码能够从黄烷酮产生黄酮,特别是能够将柚皮素转化成芹菜素、将圣草酚转化成木犀草素和/或将橙皮素转化成香叶木素,优选地将圣草酚转化成木犀草素的黄酮合酶(FNS)的异源核酸序列。
在另一个特定实施方式中,所述重组微生物还包含编码特别是来自于酿酒酵母的S-腺苷甲硫氨酸合成酶(SAMT)的异源或内源核酸序列,所述S-腺苷甲硫氨酸合成酶(SAMT)例如为包含选自SEQ ID NO:81的序列的SAMT和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有S-腺苷甲硫氨酸合成酶活性的多肽。
每种酶可以从上文所述的酶中选择。
直至柚皮素和芹菜素
在植物中已知用于柚皮素和芹菜素的生物合成的各种不同途径,特别是从葡萄糖、酪氨酸或苯丙氨酸开始。已对微生物、尤其是大肠埃希氏杆菌和酿酒酵母进行修饰,以产生柚皮素和/或芹菜素(Hwang EI等,2003.Appl.Environ.Microbiol.2003,69(5):2699-2706;Jiang H1等,2005.Appl.Environ.Microbiol.2005,71(6):2962-9;Pandey等,2016,Biotechnol.Adv.,34,634-662)。
例如,用于柚皮素和芹菜素的生物合成的途径可以是图1中描述的途径。
在第一实施方式中,所述微生物包含从酪氨酸合成柚皮素和/或芹菜素所需的酶。
在第二实施方式中,所述微生物包含从苯丙氨酸生物合成柚皮素和/或芹菜素所需的酶。
在第三实施方式中,所述微生物包含从酪氨酸和苯丙氨酸合成柚皮素和/或芹菜素所需的酶。
TAL:酪氨酸解氨酶
TAL是酪氨酸解氨酶。这种酶能够从酪氨酸产生对香豆酸。这种酶属于EC4.3.1.23类别。
术语“苯丙氨酸解氨酶活性”意味着利用苯丙氨酸解氨酶将苯丙氨酸转化成反式-肉桂酸。为了确定是否存在苯丙氨酸解氨酶活性,可以进行酶测试,其由下述步骤组成:将由苯丙氨酸解氨酶和苯丙氨酸组成的混合物在最适条件(pH、温度、离子等)下体外温育。在一定的温浴时间后,在UPLC-MS中观察反式-肉桂酸的出现并与预期的标准品比较。
酪氨酸解氨酶(TAL)也可能具有如上所定义的苯丙氨酸解氨酶(PAL)活性和/或二羟基苯丙氨酸解氨酶(DAL)活性。
因此,所述微生物可以包含编码酪氨酸解氨酶的异源核酸序列。
优选地,这种酶是由红杆菌属的细菌或黄杆菌属(Flavobacteriaceae)的细菌产生的酶。在特定实施方式中,这种酶由荚膜红杆菌或类球红杆菌产生。在另一个特定实施方式中,这种酶由约氏黄杆菌(Flavobacterium johnsoniae)产生。在另一个实施方式中,这种酶由酵母,特别是红酵母属的酵母例如黏红酵母产生。其他生物体也产生这种酶,例如茶树、普通草莓、Ralstonia metallidurans或玉米。
在特定实施方式中,所述酪氨酸解氨酶选自:包含选自SEQ ID NO:39和41的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有酪氨酸解氨酶活性的多肽。
在一个实施方式中,所述TAL来自于约氏黄杆菌。它被描述在NCBI的GenBank数据库中,核酸序列在编号KR095306.1下,蛋白质序列在编码AKE50827.1下,更特别是在SEQ IDNO:40和39中。
在特别优选实施方式中,所述TAL来自于黏红酵母。它被描述在NCBI的GenBank数据库中,核酸序列在编号KF765779.1下,蛋白质序列在编号AGZ04575.1下,更特别地分别在SEQ ID NO:42和41中。
在特别优选实施方式中,所述酪氨酸解氨酶选自:包含选自SEQ ID NO:41的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有酪氨酸解氨酶活性的多肽。
4CL:4-香豆酰辅酶A连接酶
4CL是4-香豆酰辅酶A连接酶。这种酶能够从对香豆酸和辅酶A产生4-香豆酰辅酶A并从咖啡酸和辅酶A产生咖啡酰辅酶A。这种酶属于EC 6.2.1.12类别。
术语“4-香豆酰辅酶A连接酶活性”意味着通过4-香豆酰辅酶A连接酶将对香豆酸转化成对香豆酰辅酶A或将咖啡酸转化成咖啡酰辅酶A。为了确定是否存在4-香豆酰辅酶A连接酶活性,可以进行酶测试,其由下述步骤组成:将由4-香豆酰辅酶A连接酶、对香豆酸或咖啡酸、ATP和辅酶A组成的混合物在最适条件(pH、温度、离子等)下体外温育。在一定温育时间后,在UV分光光度计上分别以333nm和346nm的波长观察对香豆酰辅酶A或咖啡酰辅酶A的出现,并与预期的标准品进行比较。
因此,所述微生物可以包含编码4-香豆酰辅酶A连接酶的异源核酸序列。
优选地,这种酶是由植物产生的酶,例如冷杉属(Abies)、拟南芥属、藿香属(Agastache)、紫穗槐属(Amorpha)、芸苔属、柑橘属、银杉属(Cathaya)、雪松属(Cedrus)、番红花属(Crocus)、落叶松属(Larix)、羊茅属(Festuca)、大豆属、胡桃属(Juglans)、油杉属(Keteleeria)、紫草属(Lithospermum)、黑麦草属(Lolium)、百脉根属、番茄属(Lycopersicon)、苹果属、苜蓿属、松叶菊属、烟草属(Nicotiana)、长苞铁杉属(Nothotsuga)、稻属、菜豆属、天竺葵属、欧芹属、小立碗藓属、云杉属(Picea)、李属(Prunus)、金钱松属(Pseudolarix)、黄杉属(Pseudotsuga)、蔷薇属(Rosa)、悬钩子属(Rubus)、Ryza、甘蔗属、碱蓬属(Suaeda)、松属、杨属、茄属、盐芥属(Thellungiella)、小麦属(Triticum)、铁杉属(Tsuga)、葡萄属或玉蜀黍属。可选地,这种酶是由微生物例如曲霉、球腔菌(Mycosphaerella)、分枝杆菌(Mycobacterium)、奈瑟氏菌(Neisseria)、脉孢菌(Neurospora)、链霉菌、红杆菌或耶氏酵母产生的酶。
在优选实施方式中,这种酶是由植物,优选为拟南芥、克莱门柚或荷兰芹,特别是拟南芥或荷兰芹产生的酶,或由细菌,优选为链霉菌属,特别是棒状链霉菌(Streptomycesclavuligerus),产生的酶。
在特定实施方式中,所述4-香豆酰辅酶A连接酶选自:包含选自SEQ ID NO:43、45、47、49、123和125的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有4-香豆酰辅酶A连接酶活性的多肽。
在另一个特定实施方式中,所述4-香豆酰辅酶A连接酶是包含选自SEQ ID NO:43、45、47和49、优选为SEQ ID NO:45和49的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有4-香豆酰辅酶A连接酶活性的多肽。
在第一特定实施方式中,所述4CL来自于拟南芥。它被描述在NCBI的GenBank数据库中,核酸序列在编号AY099747.1下,蛋白质序列在编号AAM20598.1下,更特别地分别在SEQ ID NO:44和43中。
在第二特定实施方式中,所述4CL来自于荷兰芹。它被描述在NCBI的GenBank数据库中,核酸序列分别在编号X13324.1或X13325.1下,蛋白质序列分别在编号CAA31696.1或CAA31697.1下。所述蛋白质被描述在UniProtKB/Swiss Prot中,分别在参考编号P14912和P14913下,更特别地分别在SEQ ID NO:46和45、48和47中。优选地,所述4CL来自于荷兰芹并被描述在NCBI的GenBank数据库中,核酸序列在编号X13324.1下,蛋白质序列在编号CAA31696.1下,以及在UniProtKB/Swiss Prot中在参考编号P14912下,更特别地分别在SEQID NO:46和45中。
在第三特定实施方式中,所述4CL来自于棒状链霉菌。它被描述在NCBI的GenBank数据库中,核酸序列在编号CP016559.1下,蛋白质序列在编号ANW18832.1下,更特别地分别在SEQ ID NO:50和49中。
在第四特定实施方式中,所述4CL来自于拟南芥。这个酶的核苷酸序列和蛋白质序列分别描述在SEQ ID NO:124和123中。
在第五特定实施方式中,所述4CL来自于克莱门柚,并且这个酶的核苷酸序列和蛋白质序列分别描述在SEQ ID NO:126和125中。
在优选实施方式中,所述4CL是包含选自SEQ ID NO:45、123和125、优选为SEQ IDNO:123和45的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有4-香豆酰辅酶A连接酶活性的多肽。最特别优选地,所述4CL是包含选自SEQID NO:45的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有4-香豆酰辅酶A连接酶活性的多肽。
CHS:查尔酮合酶
CHS是查尔酮合酶。这种酶能够从4-香豆酰辅酶A和丙二酰辅酶A产生柚皮素-查尔酮并且从咖啡酰辅酶A和丙二酰辅酶A产生圣草酚-查尔酮。这种酶属于EC 2.3.1.74类别。
术语“查尔酮合酶活性”意味着利用查尔酮合酶将对香豆酰辅酶A和丙二酰辅酶A转化成柚皮素-查尔酮或将咖啡酰辅酶A和丙二酰辅酶A转化成圣草酚-查尔酮。为了确定是否存在查尔酮合酶活性,可以进行酶测试,其由下述步骤组成:将由查尔酮合酶、香豆酰辅酶A或咖啡酰辅酶A和丙二酰辅酶A组成的混合物在最适条件(pH、温度、离子等)下体外温育。在一定温育时间后,在HPLC-MS中分别观察柚皮素-查尔酮或圣草酚-查尔酮的出现,并与预期的标准品进行比较。
因此,所述微生物包含编码查尔酮合酶的异源核酸序列。
这种酶可以是由植物,尤其是拟南芥属、燕麦属(Avena)、秋英属(Cosmos)、柑橘属、胡萝卜属(Daucus)、荞麦属(Fagopyrum)、香雪兰属(Freesia)、大豆属、甘草属(Glycyrrhiza)、葎草属(Humulus)、金丝桃属(Hypericum)、大麦属(Hordeum)、胡桃属、苜蓿属、菜豆属、小立碗藓属、紫背苔属(Plagiochasma)、欧芹属、葛藤属(Pueraria)、悬钩子属、黑麦属(Secale)、黄芩属、蝇子草属(Silene)、白芥属(Sinapis)、菠菜属(Spinacia)、繁缕属(Stellaria)、小麦属、郁金香属(Tulipa)、马鞭草属(Verbena)、葡萄属或Xanthisma属植物,例如拟南芥、燕麦(Avena sativa)、黄秋英(Cosmos sulphureus)、甜橙、胡萝卜(Daucuscarota)、荞麦(Fagopyrum esculentum)、小苍兰(Freesia hybrid cultivar)、大豆、刺甘草(Glycyrrhiza echinata)、蛇麻草(Humulus lupulus)、金丝桃(Hypericumandrosaemum)、大麦(Hordeum vulgare)、胡桃(Juglans sp.)、紫花首蓿(Medicagosativa)、普通菜豆(Phaseolus vulgaris)、小立碗藓(Physcomitrella patens)、Plagiochasma appendiculatum、荷兰芹、野葛(Pueraria montana var.lobata)、覆盆子(Rubus idaeus)、黑麦(Secale cereale)、黄芩、蝇子草(Silene sp.)、白芥(Sinapisalba)、菠菜(Spinacia oleracea)、长须银柴胡(Stellaria longipes)、小麦(Triticumaestivum)、郁金香杂交种(Tulipa hybrid cultivar)、马鞭草(Verbena sp.)、葡萄或Xanthisma gracile产生的酶
优选地,这种酶是由植物,例如柑橘属植物特别是甜橙或大麦产生的酶,或由细菌,优选为链霉菌属,特别是棒状链霉菌产生的酶。
在特定实施方式中,所述查尔酮合酶选自:包含选自SEQ ID NO:51、53、55和57的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有查尔酮合酶活性的多肽,优选地选自:包含选自SEQ ID NO:53和55的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有查尔酮合酶活性的多肽。
在特别优选实施方式中,所述查尔酮合酶是包含选自SEQ ID NO:53的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有查尔酮合酶活性的多肽。
在第一特定实施方式中,所述CHS来自于大麦。它被描述在NCBI的GenBank数据库中,核酸序列在编号Y09233.1下,蛋白质序列在编号CAA70435.1下,更特别地分别在SEQ IDNO:52和51中。所述蛋白质描述在UniProtKB/Swiss Prot中参考编号Q96562下。
在第二特定实施方式中,所述CHS来自于甜橙。它被描述在NCBI的GenBank数据库中,核酸序列在编号AB009351.1下,蛋白质序列在BAA81664.1下,更特别地分别在SEQ IDNO:54和53中。
在第三特定实施方式中,所述CHS来自于甜橙。它被描述在NCBI的GenBank数据库中,核酸序列在编号XM_006489733.1下,蛋白质序列在编号XP_006489796.1下,更特别地分别在SEQ ID NO:56和55。
在第四特定实施方式中,所述CHS来自于棒状链霉菌。它被描述在NCBI的GenBank数据库中,核酸序列在编号CP016559.1下,蛋白质序列在ANW16917.1下,更特别地分别在SEQ ID NO:58和57中。
由于查尔酮合酶催化的反应需要丙二酰辅酶A的存在,因此所述微生物可以被修饰以提高丙二酰辅酶A的合成。
CHI:查尔酮异构酶
CHI是查尔酮异构酶。它能够从柚皮素查尔酮产生柚皮素并从圣草酚查尔酮产生圣草酚。这种酶属于EC 5.5.1.6类别。
术语“查尔酮异构酶活性”意味着通过查尔酮异构酶将柚皮素查尔酮或圣草酚查尔酮转化成柚皮素或圣草酚。为了确定是否存在查尔酮异构酶活性,可以进行酶测试,其由下述步骤组成:将由查尔酮异构酶、柚皮素查尔酮或圣草酚查尔酮组成的混合物在最适条件(pH、温度、离子等)下体外温育。在一定温育时间后,在HPLC-MS中分别观察柚皮素或圣草酚的出现,并与预期的标准品进行比较。
因此,所述微生物包含编码查尔酮异构酶的异源核酸序列。
这种酶可以源自于植物,尤其是拟南芥属、银杏属(Ginkgo)、文心兰属(Oncidium)、紫苏属、柑橘属或胡芦巴属(Trigonella)的植物,例如拟南芥、银杏(Ginkgobiloba)、文心兰(Oncidium Gower Ramsey)、白苏(Perilla frutescens)、甜橙或胡芦巴(Trigonella foenum-graecum)。
优选地,这种酶是由植物例如拟南芥产生的酶,或由细菌,优选为链霉菌属,特别是棒状链霉菌产生的酶。
在特定实施方式中,所述查尔酮异构酶选自:包含选自SEQ ID NO:59和61的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有查尔酮异构酶活性的多肽。
在优选实施方式中,所述查尔酮异构酶选自:包含选自SEQ ID NO:61的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有查尔酮异构酶活性的多肽。
在第一特定实施方式中,所述CHI来自于棒状链霉菌。它被描述在NCBI的GenBank数据库中,核酸序列在编号CP016559.1下,蛋白质序列在编号ANW16918.1下,更特别地分别在SEQ ID NO:60和59中。
在第二特定实施方式中,所述CHI来自于拟南芥。它被描述在NCBI的GenBank数据库中,核酸序列在编号NM_115370.4下,蛋白质序列在编号NP_191072.1下,更特别地分别在SEQ ID NO:62和61中。
FNS:黄酮合酶
芹菜素可以使用黄酮合酶(FNS)从柚皮素制备。它能够从柚皮素产生芹菜素。
因此,所述微生物可以包含编码特别是能够从柚皮素产生芹菜素的黄酮合酶的异源核酸序列,和/或编码特别是能够从圣草酚产生木犀草素的黄酮合酶的异源核酸序列,和/或编码特别是能够从橙皮素产生香叶木素的黄酮合酶的异源核酸序列。
所述FNS可以从上文中描述的FNS中选择。
从苯丙氨酸开始
可选地或另外地,所述微生物还可以包含从苯丙氨酸合成对香豆酸所需的酶。
在这种情形中,所述微生物还可以包含编码苯丙氨酸解氨酶(PAL)的异源核酸序列和编码肉桂酸4-羟化酶(C4H)的异源核酸序列。
所述PAL属于EC 4.3.1.24类别。它能够从苯丙氨酸产生肉桂酸。
术语“苯丙氨酸解氨酶活性”意味着利用苯丙氨酸解氨酶将苯丙氨酸转化成反式-肉桂酸。为了确定是否存在苯丙氨酸解氨酶活性,可以进行酶测试,其由下述步骤组成:将由苯丙氨酸解氨酶和苯丙氨酸组成的混合物在最适条件(pH、温度、离子等)下体外温育。在一定温育时间后,在UPLC-MS中观察反式-肉桂酸的出现,并与预期的标准品进行比较。
在现有技术中已经描述了几种酶。优选地,所述酶源自于植物,例如拟南芥属、藿香属、凤梨属(Ananas)、天门冬属(Asparagus)、芸苔属、Bromheadia、刺竹属(Bambusa)、甜菜属(Beta)、桦木属(Betula)、柑橘属、黄瓜属(Cucumis)、山茶属、辣椒属(Capsicum)、决明子属(Cassia)、长春花属、鹰嘴豆属(Cicer)、西瓜属(Citrullus)、咖啡属(Coffea)、南瓜属(Cucurbita)、狗牙根属(Cynodon)、胡萝卜属、石斛兰属(Dendrobium)、石竹属、毛地黄属(Digitalis)、薯蓣属(Dioscorea)、桉属(Eucalyptus)、Gallus、银杏属、大豆属、大麦属、向日葵属、番薯属、莴苣属(Lactuca)、紫草属、百脉根属、番茄属、苜蓿属、苹果属、木薯属(Manihot)、苜蓿属、松叶菊属、烟草属、木犀榄属(Olea)、稻属、菜豆属、松属、杨属、豌豆属(Pisum)、鳄梨属(Persea)、欧芹属、蝴蝶兰属(Phalaenopsis)、刚竹属(Phyllostachys)、小立碗藓属、云杉属、梨属(Pyrus)、李属、栎属(Quercus)、萝卜属(Raphanus)、地黄属(Rehmannia)、悬钩子属、茄属、高粱属、楔柱豆属(Sphenostylis)、繁缕属、柱花草属(Stylosanthes)、小麦属、三叶草属(Trifolium)、越橘属(Vaccinium)、豇豆属、葡萄属、玉蜀黍属或百日菊属(Zinnia)的植物。例如,可以提到的是来自于拟南芥或荷兰芹的酶。在优选实施方式中,所述PAL来自于甜橙。
此外,苯丙氨酸解氨酶(PAL)也可能具有如下所定义的酪氨酸解氨酶(TAL)活性和/或二羟基苯丙氨酸解氨酶(DAL)活性。
在特定实施方式中,所述苯丙氨酸解氨酶(PAL)选自:包含选自SEQ ID NO:63、65和77的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有苯丙氨酸解氨酶活性的多肽。
在优选实施方式中,所述PAL选自:包含选自SEQ ID NO:65和77的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有苯丙氨酸解氨酶活性的多肽。最特别优选地,所述PAL选自:包含选自SEQ ID NO:65的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有苯丙氨酸解氨酶活性的多肽。
在特定实施方式中,所述来自于甜橙的PAL被描述在NCBI的GenBank数据库中,核苷酸序列在编号XM_006481431.2下,蛋白质序列在编号XP_006481494.1下,更特别地分别在SEQ ID NO:64和63中。
在另一个特定实施方式中,所述来自于甜橙的PAL被描述在NCBI的GenBank数据库中,核苷酸序列在编号XM_006488000.2下,蛋白质序列在编号XP_006488063.1下,更特别地分别在SEQ ID NO:66和65中。
在另一个特定实施方式中,所述来自于拟南芥的PAL被描述在NCBI的GenBank数据库中,核苷酸序列在编号NM_115186.4下,蛋白质序列在编号NP_190894.1下,更特别地分别在SEQ ID NO:78和77中。
任选地,如果设想从酪氨酸和苯丙氨酸开始生物合成,则所述PAL和TAL可以用苯丙氨酸/酪氨酸解氨酶(PTAL)代替或补充。PTAL属于EC 4.3.1.25类别。
C4H属于EC 1.14.13.11类别。它能够从肉桂酸产生对香豆酸。
术语“反式-肉桂酸4-单加氧酶活性”意味着通过反式-肉桂酸4-单加氧酶(CPR依赖性)将反式-肉桂酸转化成对香豆酸。为了确定是否存在反式-肉桂酸4-单加氧酶活性,可以进行酶测试,其由下述步骤组成:将由反式-肉桂酸4-单加氧酶、肉桂酸、NADPH、H+和O2组成的混合物在最适条件(pH、温度、离子等)下体外温育。在一定温育时间后,在UPLC-MS中观察4-羟基肉桂酸(对香豆酸)的出现,并与预期的标准品进行比较。
在现有技术中已经描述了几种酶。优选地,所述酶源自于植物,例如拟南芥属、阿密属、海榄雌属、山茶属、喜树属、长春花属、柑橘属、大豆属、向日葵属、百脉根属、松叶菊属、Physcomitreila、菜豆属、松属、杨属、芸香属、甘蔗属、茄属、葡萄属、豇豆属或玉蜀黍属的植物。在优选实施方式中,所述肉桂酸4-羟化酶(C4H)来自于甜橙或拟南芥。
在特定实施方式中,所述肉桂酸4-羟化酶(C4H)选自:包含选自SEQ ID NO:67、69和79的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有肉桂酸4-羟化酶活性的多肽。
在优选实施方式中,所述C4H选自:包含选自SEQ ID NO:79的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有肉桂酸4-羟化酶活性的多肽。
在特定实施方式中,所述来自于甜橙的C4H被描述在NCBI的GenBank数据库中,核苷酸序列在编号NM_001288840.1下,蛋白质序列在编号NP_001275769.1下,更特别地分别在SEQ ID NO:68和67中。
在另一个特定实施方式中,所述来自于甜橙的C4H被描述在NCBI的GenBank数据库中,核苷酸序列在编号NM_001288895.1下,蛋白质序列在编号NP_001275824.1下,更特别地分别在SEQ ID NO:70和69中。
在另一个特定实施方式中,所述来自于拟南芥的C4H被描述在NCBI的GenBank数据库中,核苷酸序列在编号NM_128601.3下,蛋白质序列在编号NP_180607.1下,更特别地分别在SEQ ID NO:80和79中。
通过咖啡酸进行
在其他实施方式中,圣草酚的生物合成可以包括从酪氨酸合成L-DOPA(3,4-二羟基-L-苯丙氨酸),然后从L-DOPA(3,4-二羟基-L-苯丙氨酸)合成咖啡酸。为此,需要下述酶。为了将酪氨酸转变成L-DOPA(3,4-二羟基-L-苯丙氨酸),需要两个亚基HpaB和HpaC。
HpaB是4-羟基苯乙酸3-单加氧酶加氧酶亚基(HpaB).
优选地,该酶是由细菌、优选为大肠埃希氏杆菌产生的酶。
在特定实施方式中,所述4-羟基苯乙酸3-单加氧酶加氧酶(HpaB)是包含选自SEQID NO:83的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有4-羟基苯乙酸3-单加氧酶活性的多肽。
在特定实施方式中,所述HpaB来自于大肠埃希氏杆菌。它被描述在NCBI的GenBank数据库中,蛋白质序列在编号CAQ34705.1下,更特别是在SEQ ID NO:83中。编码该酶的核酸序列描述在SEQ ID NO:84中。所述蛋白质描述在UniProtKB/Swiss Prot中参考编号A0A140NG21下。
HpaC是4-羟基苯乙酸3-单加氧酶还原酶亚基。因此,所述微生物可以包含编码4-羟基苯乙酸3-单加氧酶还原酶亚基(HpaC)的异源核酸序列。
术语“对香豆酸3-羟化酶活性”意味着使用由HpaB(4-羟基苯乙酸3-羟化酶氧化酶)和HpaC(4-羟基苯乙酸3-羟化酶还原酶)组成的酶复合体将对香豆酸转化成咖啡酸和/或将L-酪氨酸转化成L-DOPA。为了确定是否存在对香豆酸3-羟化酶活性,可以进行酶测试,其由下述步骤组成:将由酶HpaB、HpaC、对香豆酸或L-酪氨酸、FAD和NADH组成的混合物在最适条件(pH、温度、离子等)下体外温育。在一定温育时间后,在HPLC-MS中观察咖啡酸或L-DOPA的出现,并与预期的标准品进行比较。
优选地,这种酶是由细菌、优选为大肠埃希氏杆菌产生的酶。
在特定实施方式中,所述4-羟基苯乙酸3-单加氧酶还原酶(HpaC)是包含选自SEQID NO:85的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有4-羟基苯乙酸3-单加氧酶活性的多肽。
在特定实施方式中,所述HpaC来自于大肠埃希氏杆菌。它被描述在NCBI的GenBank数据库中,蛋白质序列在编号CAQ34704.1下,更特别是在SEQ ID NO:85中。编码该酶的核酸序列被描述在SEQ ID NO:86中。所述蛋白质描述在UniProtKB/Swiss Prot中参考编号A0A140NG67下。
合在一起,HpaB和HpaC能够从酪氨酸产生L-DOPA(3,4-二羟基-L-苯丙氨酸)。
因此,所述微生物可以包含编码4-羟基苯乙酸3-单加氧酶加氧酶(HpaB)的异源核酸序列和编码4-羟基苯乙酸3-单加氧酶还原酶(HpaC)的异源核酸序列。
此外,这个途径还需要存在能够从L-DOPA(3,4-二羟基-L-苯丙氨酸)合成咖啡酸的酶,即二羟基苯丙氨酸解氨酶(DAL)。该酶属于EC 4.3.1.11类别。
术语“二羟基苯丙氨酸解氨酶活性”意味着利用二羟基苯丙氨酸解氨酶将L-DOPA转化成反式-咖啡酸。为了确定是否存在二羟基苯丙氨酸解氨酶活性,可以进行酶测试,其由下述步骤组成:将由二羟基苯丙氨酸解氨酶和L-DOPA(左旋多巴)组成的混合物在最适条件(pH、温度、离子等)下体外温育。在一定温育时间后,在UPLC-MS中观察反式-咖啡酸的出现,并与预期的标准品进行比较。
此外,二羟基苯丙氨酸解氨酶(DAL)也可能具有酪氨酸解氨酶(TAL)活性和/或苯丙氨酸解氨酶(PAL)活性。
因此,所述微生物可以包含编码4-羟基苯乙酸3-单加氧酶加氧酶亚基(HpaB)的异源核酸序列、编码4-羟基苯乙酸3-单加氧酶还原酶亚基(HpaC)的异源核酸序列和编码二羟基苯丙氨酸解氨酶(DAL)的异源核酸序列。
作为使用HpaB和HpaC或与它们组合的替代方式,可以使用将酪氨酸转变成L-DOPA的酶和将对香豆酸转变成咖啡酸的酶。
这些酶分别是:4-甲氧基苯甲酸酯O-脱甲基酶,也被称为4-甲氧基苯甲酸酯单加氧酶(O-脱甲基化),其具有L-酪氨酸羟化酶活性,属于EC 1.14.99.15类别;和对香豆酸3-羟化酶,其具有对香豆酸3-羟化酶活性,属于EC 1.14.13类别。
这些各种不同的酶均形成细胞色素P450(CYP)家族的一部分。
术语“L-酪氨酸羟化酶活性”意味着使用对香豆酸3-羟化酶(CPR依赖性)将对香豆酸转化成咖啡酸和/或将L-酪氨酸转化成L-DOPA。为了确定是否存在L-酪氨酸羟化酶活性,可以进行酶测试,其由下述步骤组成:将由对香豆酸3-羟化酶、对香豆酸或L-酪氨酸和必需的辅因子组成的混合物在最适条件(pH、温度、离子等)下体外温育。在一定温育时间后,在HPLC-MS中观察咖啡酸或L-DOPA的出现,并与预期的标准品进行比较。
术语“对香豆酸3-羟化酶活性”意味着使用对香豆酸3-羟化酶(CPR依赖性)将对香豆酸转化成咖啡酸和/或将L-酪氨酸转化成L-DOPA。为了确定是否存在对香豆酸3-羟化酶活性,可以进行酶测试,其由下述步骤组成:将由对香豆酸3-羟化酶、对香豆酸或L-酪氨酸组成的混合物在最适条件(pH、温度、离子等)下体外温育。在一定温育时间后,在HPLC-MS中观察咖啡酸或L-DOPA的出现,并与预期的标准品进行比较。
因此,所述重组微生物可以包含编码能够将酪氨酸转变成L-DOPA并且也将对香豆酸转变成咖啡酸的4-甲氧基苯甲酸酯O-脱甲基酶(CYP)的异源核酸序列。
在一个实施方式中,所述4-甲氧基苯甲酸酯O-脱甲基酶是细菌酶,尤其是来自于沼泽红假单胞菌、恶臭假单胞菌或大肠埃希氏杆菌的细菌酶,植物酶,尤其是来自于甜菜(Βeta vulgaris)的植物酶,哺乳动物酶,尤其是来自于穴兔(Oryctolagus cuniculus)的哺乳动物酶,或真菌酶,尤其是来自于黏红酵母的真菌酶。在特定实施方式中,所述4-甲氧基苯甲酸酯O-脱甲基酶是来自于沼泽红假单胞菌、西班牙糖丝菌(Saccharothrixespanaensis)或甜菜的酶。
在特定实施方式中,所述4-甲氧基苯甲酸酯O-脱甲基酶选自:包含选自SEQ IDNO:73和75的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有L-酪氨酸水解酶活性的多肽。
所述4-甲氧基苯甲酸酯O-脱甲基酶也可以来自于甜菜。编码该酶的核酸序列和蛋白质序列分别描述在SEQ ID NO:74和73中。所述蛋白质描述在UniProtKB/Swiss Prot中参考编号P0DKI2下。
此外,所述4-甲氧基苯甲酸酯O-脱甲基酶可以来自于西班牙糖丝菌。编码该酶的核酸序列和蛋白质序列描述在NCBI中,分别在参考编号NC_005296.1和WP_011157377.1下,更特别是在SEQ ID NO:76和75中。所述蛋白质描述在UniProtKB/Swiss Prot中参考编号Q6N8N2下。
在一个实施方式中,所述微生物可以包含编码4-甲氧基苯甲酸酯O-脱甲基酶的异源核酸序列和编码二羟基苯丙氨酸解氨酶(DAL)的异源核酸序列。
因此,所述重组微生物可以包含编码能够将对香豆酸转变成咖啡酸的香豆酸3-羟化酶(Coum3H)的异源核酸序列。
在一个实施方式中,所述香豆酸3-羟化酶是细菌酶,尤其是来自于糖丝菌属(Saccharothrix)的细菌酶。
在特定实施方式中,所述4-甲氧基苯甲酸酯O-脱甲基酶选自:包含选自SEQ IDNO:71的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有香豆酸3-羟化酶活性的多肽。
编码该酶的核酸序列和蛋白质序列描述在NCBI中,分别在参考编号DQ357071.1和ABC88666.1下,更特别是在SEQ ID NO:72和71中。
在一个实施方式中,所述微生物可以包含编码香豆酸3-羟化酶的异源核酸序列和编码二羟基苯丙氨酸解氨酶(DAL)的异源核酸序列。
酶的其他组合
因此,除了如上所述从柚皮素和/或芹菜素生物合成橙皮苷和/或香叶木苷所需的酶之外,所述微生物优选地还包含用于从酪氨酸和/或苯丙氨酸、优选地从酪氨酸产生柚皮素和/或芹菜素的酶。
因此,根据特定实施方式,所述微生物包含:
-编码能够在橙皮素和/或香叶木素的7位中添加葡萄糖的黄烷酮7-O-β-D-葡萄糖基转移酶(UGT)的异源核酸序列,
-编码能够将鼠李糖转移到橙皮素-7-O-葡萄糖苷和/或香叶木素-7-O-葡萄糖苷的葡萄糖的6位中的6”-O-鼠李糖基转移酶(RhaT)的异源核酸序列,
-编码能够产生UDP-鼠李糖的UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶(RHM)的异源核酸序列,
-编码能够将圣草酚和/或木犀草素在4’位中甲基化的O-甲基转移酶(OMT)的异源核酸序列,
-编码F3’H酶的异源核酸序列,
-和任选的编码FNS酶的异源核酸序列和编码CPR酶的异源核酸序列,
并且还包含
-编码酪氨酸解氨酶(TAL)的异源核酸序列、编码4-香豆酰辅酶A连接酶(4CL)的异源核酸序列、编码查尔酮合酶(CHS)的异源核酸序列和编码查尔酮异构酶(CHI)的异源核酸序列。
在一个实施方式中,所述微生物包含:
-编码能够将圣草酚和/或木犀草素在4’位中甲基化的O-甲基转移酶(OMT)的异源核酸序列,所述O-甲基转移酶(OMT)优选为来自于克莱门柚、甜橙、拟南芥或智人的OMT,优选为包含选自SEQ ID NO:117、119、87和89的序列的OMT和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有尤其是使用圣草酚和/或木犀草素作为底物并在4’位中进行甲基化的O-甲基转移酶活性的多肽,优选为包含选自SEQ ID NO:117和119的序列的OMT和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有O-甲基转移酶活性的多肽,最特别优选为包含选自SEQ ID NO:117的序列的OMT和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有O-甲基转移酶活性的多肽;和
-编码能够将柚皮素和/或芹菜素在3’位中羟基化的黄酮类化合物3’-单加氧酶(F3’H)的异源核酸序列,所述黄酮类化合物3’-单加氧酶(F3’H)选自:包含选自SEQ ID NO:7、11、17和121的序列的黄酮类化合物3’-单加氧酶(F3’H)和包含与这些序列之一具有至少75%、至少80%、至少85%、至少90%或至少95%同一性的序列并具有黄酮类化合物3’-单加氧酶活性的多肽,优选为包含选自SEQ ID NO:7、17和121的序列的酶和包含与这些序列之一具有至少75%、至少80%、至少85%、至少90%或至少95%同一性的序列并具有黄酮类化合物3’-单加氧酶活性的多肽,最特别优选为包含选自SEQ ID NO:7的序列的酶和包含与该序列具有至少75%、至少80%、至少85%、至少90%或至少95%同一性的序列并具有黄酮类化合物3’-单加氧酶活性的多肽;和
-任选的编码细胞色素P450还原酶(CPR)的异源核酸序列,所述细胞色素P450还原酶(CPR)选自:包含选自SEQ ID NO:23、25、27、29和31的序列的细胞色素P450还原酶(CPR)和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有细胞色素P450还原酶活性的多肽,优选选自:包含选自SEQ ID NO:23、25和29的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有细胞色素P450还原酶活性的多肽,特别是选自:包含选自SEQ ID NO:25的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有细胞色素P450还原酶活性的多肽;和
-任选的编码黄酮合酶(FNS)的异源核酸序列,所述黄酮合酶(FNS)选自:包含选自SEQ ID NO:33、35、37、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157和159的序列的黄酮合酶(FNS)和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮合酶活性的多肽,特别是包含选自SEQ ID NO:33、35和37的序列的黄酮合酶(FNS)和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮合酶活性的多肽,优选为包含选自SEQ ID NO:37的序列的黄酮合酶(FNS)和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮合酶活性的多肽;和
-编码来自于黏红酵母或约氏黄杆菌的酪氨酸解氨酶(TAL)的异源核酸序列,所述酪氨酸解氨酶(TAL)特别是包含选自SEQ ID NO:41和39的序列的TAL和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有酪氨酸解氨酶活性的多肽,优选为包含选自SEQ ID NO:41的序列的TAL和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有酪氨酸解氨酶活性的多肽;和
-编码来自于拟南芥、克莱门柚、荷兰芹或棒状链霉菌的4-香豆酰辅酶A连接酶(4CL)的异源核酸序列,所述4-香豆酰辅酶A连接酶(4CL)特别是包含选自SEQ ID NO:123、125、45、43、47和49的序列的4CL和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有4-香豆酰辅酶A连接酶活性的多肽,优选为包含选自SEQ ID NO:123、125和45的序列的4CL和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有4-香豆酰辅酶A连接酶活性的多肽,最特别优选为包含选自SEQ ID NO:45的序列的4CL和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有4-香豆酰辅酶A连接酶活性的多肽;和
-编码来自于甜橙、大麦或棒状链霉菌的查尔酮合酶(CHS)的异源核酸序列,所述查尔酮合酶(CHS)特别是包含选自SEQ ID NO:53、51、55和57的序列的CHS和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有查尔酮合酶活性的多肽,优选为包含选自SEQ ID NO:53的序列的CHS和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有查尔酮合酶活性的多肽;和
-编码来自于拟南芥或棒状链霉菌的查尔酮异构酶(CHI)的异源核酸序列,所述查尔酮异构酶(CHI)特别是包含选自SEQ ID NO:61和59的序列的CHI和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有查尔酮异构酶活性的多肽,优选为包含选自SEQ ID NO:61的序列的CHI和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有查尔酮异构酶活性的多肽。
优选地,在这个实施方式中,所述微生物包含上述酶UGT、RhaT和RHM的组合之一,特别是
-黄烷酮7-O-β-D-葡萄糖基转移酶,其选自:包含选自SEQ ID NO:113和95的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽,优选地选自:包含选自SEQ ID NO:113的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽;和
-6”-O-鼠李糖基转移酶,其选自:包含选自SEQ ID NO:103的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有6”-O-鼠李糖基转移酶活性的多肽;和
-UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶,其选自:包含选自SEQ ID NO:107的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶活性的多肽。
优选地,在这个实施方式中,所述微生物还包含:
-编码苯丙氨酸解氨酶(PAL)的异源核酸序列,所述苯丙氨酸解氨酶(PAL)特别是包含选自SEQ ID NO:63、65和77、优选为SEQ ID NO:65和77的序列的PAL和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有苯丙氨酸解氨酶活性的多肽,更特别优选为包含选自SEQ ID NO:65的序列的苯丙氨酸解氨酶(PAL)和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有苯丙氨酸解氨酶活性的多肽;和
-编码肉桂酸4-羟化酶(C4H)的异源核酸序列,所述肉桂酸4-羟化酶(C4H)特别是包含选自SEQ ID NO:67、69和79的序列的C4H和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有肉桂酸4-羟化酶活性的多肽,最特别优选为包含选自SEQ ID NO:79的序列的肉桂酸4-羟化酶(C4H)和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有肉桂酸4-羟化酶活性的多肽。
在另一个实施方式中,所述微生物包含:
-编码O-甲基转移酶(OMT)的异源核酸序列,所述O-甲基转移酶(OMT)选自:包含选自SEQ ID NO:117和119的序列的O-甲基转移酶(OMT)和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有O-甲基转移酶活性的多肽,最特别优选为包含选自SEQ ID NO:117的序列的OMT和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有O-甲基转移酶活性的多肽;和
-编码能够将柚皮素和/或芹菜素在3’位中羟基化的黄酮类化合物3’-单加氧酶(F3’H)的异源核酸序列,所述黄酮类化合物3’-单加氧酶(F3’H)选自:包含选自SEQ ID NO:7、17和121的序列的黄酮类化合物3’-单加氧酶(F3’H)和包含与这些序列之一具有至少75%、至少80%、至少85%、至少90%或至少95%同一性的序列并具有黄酮类化合物3’-单加氧酶活性的多肽,优选为包含选自SEQ ID NO:7的序列的酶和包含与该序列具有至少75%、至少80%、至少85%、至少90%或至少95%同一性的序列并具有黄酮类化合物3’-单加氧酶活性的多肽;和
-任选的编码细胞色素P450还原酶(CPR)的异源核酸序列,所述细胞色素P450还原酶(CPR)选自:包含选自SEQ ID NO:23、25和29的序列的细胞色素P450还原酶(CPR)和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有细胞色素P450还原酶活性的多肽,优选为包含选自SEQ ID NO:25的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有细胞色素P450还原酶活性的多肽;和
-任选的编码黄酮合酶(FNS)的异源核酸序列,所述黄酮合酶(FNS)选自:包含选自SEQ ID NO:37的序列的黄酮合酶(FNS)和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮合酶活性的多肽;和
-编码酪氨酸解氨酶(TAL)的异源核酸序列,所述酪氨酸解氨酶(TAL)选自:包含选自SEQ ID NO:41的序列的酪氨酸解氨酶(TAL)和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有酪氨酸解氨酶活性的多肽;
-编码4-香豆酰辅酶A连接酶(4CL)的异源核酸序列,所述4-香豆酰辅酶A连接酶(4CL)选自:包含选自SEQ ID NO:123、125和45的序列的4-香豆酰辅酶A连接酶(4CL)和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有4-香豆酰辅酶A连接酶活性的多肽,最特别优选为包含选自SEQ ID NO:45的序列的4CL和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有4-香豆酰辅酶A连接酶活性的多肽;和
-编码查尔酮合酶(CHS)的异源核酸序列,所述查尔酮合酶(CHS)选自:包含选自SEQ ID NO:53的序列的查尔酮合酶(CHS)和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有查尔酮合酶活性的多肽;和
-编码查尔酮异构酶(CHI)的异源核酸序列,所述查尔酮异构酶(CHI)选自:包含选自SEQ ID NO:61的序列的查尔酮异构酶(CHI)和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有查尔酮异构酶活性的多肽。
优选地,在这个实施方式中,所述微生物包含上述酶UGT、RhaT和RHM的组合之一,特别是:
-黄烷酮7-O-β-D-葡萄糖基转移酶,其选自:包含选自SEQ ID NO:113和95的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽,优选地选自:包含选自SEQ ID NO:113的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽;和
-6”-O-鼠李糖基转移酶,其选自:包含选自SEQ ID NO:103的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有6”-O-鼠李糖基转移酶活性的多肽;和
-UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶,其选自:包含选自SEQ ID NO:107的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶活性的多肽。
优选地,在这个实施方式中,所述微生物还包含如前面的实施方式中所述的编码苯丙氨酸解氨酶(PAL)的异源核酸序列和编码肉桂酸4-羟化酶(C4H)的异源核酸序列。
任选地,在这些各种不同的实施方式中,所述微生物还包含编码特别是来自于酿酒酵母的S-腺苷甲硫氨酸合成酶(SAMT)的异源或内源核酸序列,所述S-腺苷甲硫氨酸合成酶(SAMT)选自例如包含选自SEQ ID NO:81的序列的SAMT和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有S-腺苷甲硫氨酸合成酶活性的多肽。
在另一个特定实施方式中,所述微生物包含:
-编码来自于拟南芥、黄芩或智人,优选地来自于拟南芥或黄芩的黄烷酮7-O-β-D-葡萄糖基转移酶(UGT)的异源核酸序列,所述黄烷酮7-O-β-D-葡萄糖基转移酶(UGT)优选地选自:包含选自SEQ ID NO:91、93、95、97、99和101的序列的酶的黄烷酮7-O-β-D-葡萄糖基转移酶(UGT)和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽,特别是包含选自SEQ ID NO:91、93、95和97的序列的黄烷酮7-O-β-D-葡萄糖基转移酶(UGT)和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽,优选为包含选自SEQ ID NO:113的序列的UGT和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽;
-编码柑橘属或矮牵牛,优选为甜橙、柚子或克莱门柚,甚至更优选为甜橙或克莱门柚的6”-O-鼠李糖基转移酶(RhaT)的异源核酸序列,所述6”-O-鼠李糖基转移酶(RhaT)优选为包含选自SEQ ID NO:103和105的序列的6”-O-鼠李糖基转移酶(RhaT)和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有6”-O-鼠李糖基转移酶活性的多肽,优选为包含选自SEQ ID NO:103的序列的RhaT和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有6”-O-鼠李糖基转移酶活性的多肽;和
-编码来自于甜橙或拟南芥的UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶(RHM)的异源核酸序列,所述RHM优选为包含选自SEQ ID NO:107、109和111的序列的RHM和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶活性的多肽,特别是包含选自SEQID NO:107和109的序列的RHM和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶活性的多肽,优选为包含选自SEQ ID NO:107的序列的RHM和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶活性的多肽;
-编码能够将柚皮素和/或芹菜素在3’位中羟基化的黄酮类化合物3’-单加氧酶(F3’H)的异源核酸序列,所述黄酮类化合物3’-单加氧酶(F3’H)优选地来自于回回苏、矮牵牛、翠菊、非洲菊、甜橙、克莱门柚、蓝眼菊、黄孢原毛平革菌、阿维链霉菌或山柳兰,特别是来自于回回苏、矮牵牛、翠菊、非洲菊、甜橙或山柳兰,优选为包含选自SEQ ID NO:1、3、5、7、9、11、13、15、17、19和21的序列的F3’H和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮类化合物3’-单加氧酶活性的多肽,优选为包含选自SEQID NO:1、5、7、11、17和19的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮类化合物3’-单加氧酶活性的多肽,特别是包含选自SEQID NO:5、7和17的序列的F3’H和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮类化合物3’-单加氧酶活性的多肽,更特别优选为包含选自SEQ ID NO:7的序列的F3’H和包含与序列SEQ ID NO:7具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮类化合物3’-单加氧酶活性的多肽;
-任选的编码细胞色素P450还原酶(CPR)的异源核酸序列,所述细胞色素P450还原酶(CPR)优选为来自于酿酒酵母或来自于植物例如长春花或拟南芥的CPR,优选为包含选自SEQ ID NO:23、25、27、29和31的序列的CPR和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有细胞色素P450还原酶活性的多肽,优选选自:包含选自SEQ ID NO:23、25和29的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有细胞色素P450还原酶活性的多肽,特别是包含选自SEQ ID NO:25的序列的CPR和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有细胞色素P450还原酶活性的多肽;
-编码能够将圣草酚和/或木犀草素在4’位中甲基化的O-甲基转移酶(OMT)的异源核酸序列,所述O-甲基转移酶(OMT)优选为来自于拟南芥或智人的OMT,优选为包含选自SEQID NO:87和89的序列的OMT和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有尤其是使用圣草酚和/或木犀草素作为底物并在4’位中进行甲基化的O-甲基转移酶活性的多肽,优选为包含选自SEQ ID NO:89的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有O-甲基转移酶活性的多肽;
-任选的编码特别是来自于酿酒酵母的S-腺苷甲硫氨酸合成酶(SAMT)的异源或内源核酸序列,所述S-腺苷甲硫氨酸合成酶(SAMT)选自例如包含选自SEQ ID NO:81的序列的SAMT和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有S-腺苷甲硫氨酸合成酶活性的多肽;和
-任选的编码能够将柚皮素转化成芹菜素、将圣草酚转化成木犀草素和/或将橙皮素转化成香叶木素,优选地将圣草酚转化成木犀草素的黄酮合酶(FNS)的异源核酸序列,所述黄酮合酶(FNS)优选为来自于拟南芥、金银花、灰毡毛忍冬、蒺藜状苜蓿、水稻、荷兰芹、美洲黑杨、玉米、翠菊、芹菜、蒺藜状苜蓿、孜然、毒欧芹、圆叶当归、毒芹、茶树、朝鲜蓟、水母雪莲、毛喉鞘蕊花、黄芩、旋蒴苣苔、金鱼草、回回苏、大丽花或Erythranthe lewisii,特别是来自于拟南芥、金银花、灰毡毛忍冬、蒺藜状苜蓿、水稻、荷兰芹、美洲黑杨或玉米,优选地来自于金银花、灰毡毛忍冬和荷兰芹的FNS,优选为包含选自SEQ ID NO:33、35、37、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157和159的序列的FNS和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮合酶活性的多肽,优选为包含选自SEQ ID NO:33、35和37的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮合酶活性的多肽,优选为包含选自SEQ ID NO:37的序列的黄酮合酶(FNS)和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮合酶活性的多肽;
-编码能够从酪氨酸产生对香豆酸,优选地来自于黏红酵母或约氏黄杆菌的酪氨酸解氨酶(TAL)的异源核酸序列,所述酪氨酸解氨酶(TAL)特别是包含选自SEQ ID NO:39和41的序列的TAL和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有酪氨酸解氨酶活性的多肽,优选为包含选自SEQ ID NO:41的序列的TAL和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有酪氨酸解氨酶活性的多肽;
-编码能够从对香豆酸和辅酶A产生香豆酰辅酶A,优选地选自拟南芥、荷兰芹或棒状链霉菌的4-香豆酰辅酶A连接酶(4CL)的异源核酸序列,所述4-香豆酰辅酶A连接酶(4CL)选自:包含选自SEQ ID NO:43、45、47和49的序列的4CL和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有4-香豆酰辅酶A连接酶活性的多肽,优选为包含选自SEQ ID NO:45的序列的4CL和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有4-香豆酰辅酶A连接酶活性的多肽;
-编码能够从4-香豆酰辅酶A和丙二酰辅酶A产生柚皮素-查尔酮,优选地来自于甜橙、大麦或棒状链霉菌的查尔酮合酶(CHS)的异源核酸序列,所述查尔酮合酶(CHS)特别是包含选自SEQ ID NO:51、53、55和57的序列的CHS和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有查尔酮合酶活性的多肽,优选为包含选自SEQ IDNO:53和55的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有查尔酮合酶活性的多肽,更特别优选为包含选自SEQ ID NO:53的序列的CHS和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有查尔酮合酶活性的多肽;
-编码能够从柚皮素查尔酮产生柚皮素,优选地来自于拟南芥或棒状链霉菌的查尔酮异构酶(CHI)的异源核酸序列,所述查尔酮异构酶(CHI)特别是包含选自SEQ ID NO:59和61的序列的CHI和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有查尔酮异构酶活性的多肽,更特别优选为包含选自SEQ ID NO:61的序列的CHI和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有查尔酮异构酶活性的多肽。
在另一个特定实施方式中,所述微生物包含如前面的实施方式中所述的编码酶UGT、RhaT、RHM、F3’H、OMT、4CL、CHS和CHI的异源核酸序列以及任选的编码酶CPR、FNS和SAMT的异源核酸序列,并且还包含:
-编码苯丙氨酸解氨酶(PAL)的异源核酸序列,所述苯丙氨酸解氨酶(PAL)特别是包含选自SEQ ID NO:63、65和77的序列的PAL和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有苯丙氨酸解氨酶活性的多肽,特别是包含选自SEQID NO:65的序列的PAL和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有苯丙氨酸解氨酶活性的多肽的异源核酸序列,以及编码肉桂酸4-羟化酶(C4H)的异源核酸序列,所述肉桂酸4-羟化酶(C4H)特别是包含选自SEQ ID NO:67、69和79的序列的C4H和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有能够从苯丙氨酸产生对香豆酸的肉桂酸4-羟化酶活性的多肽,特别是包含选自SEQ ID NO:79的序列的C4H和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有肉桂酸4-羟化酶活性的多肽。
在第三特定实施方式中,所述微生物包含如前面的实施方式中所述的编码酶UGT、RhaT、RHM、F3’H、OMT、4CL、CHS和CHI的异源核酸序列以及任选的编码酶CPR、FNS和SAMT的异源核酸序列,并且还包含:
-编码能够从L-DOPA(3,4-二羟基-L-苯丙氨酸)产生咖啡酸的二羟基苯丙氨酸解氨酶(DAL)的异源核酸序列;
-编码4-羟基苯乙酸3-单加氧酶加氧酶亚基(HpaB)的异源核酸序列,所述4-羟基苯乙酸3-单加氧酶加氧酶亚基(HpaB)优选地选自:包含选自SEQ ID NO:83的序列的4-羟基苯乙酸3-单加氧酶加氧酶亚基(HpaB)和包含与其具有至少60、70、80、85、90或95%序列同一性的序列并具有4-羟基苯乙酸3-单加氧酶加氧酶活性的多肽,以及编码4-羟基苯乙酸3-单加氧酶还原酶亚基(HpaC)的异源核酸序列,所述4-羟基苯乙酸3-单加氧酶还原酶亚基(HpaC)优选地选自:包含选自SEQ ID NO:85的序列的4-羟基苯乙酸3-单加氧酶还原酶亚基(HpaC)和包含与其具有至少60、70、80、85、90或95%序列同一性的序列并具有4-羟基苯乙酸3-单加氧酶还原酶活性的多肽;或编码能够将酪氨酸转变成L-DOPA并且也将对香豆酸转变成咖啡酸的4-甲氧基苯甲酸酯O-脱甲基酶的异源核酸序列,所述4-甲氧基苯甲酸酯O-脱甲基酶优选地选自:包含选自SEQ ID NO:73和75的序列的4-甲氧基苯甲酸酯O-脱甲基酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有L-酪氨酸羟化酶活性的多肽;或编码能够将对香豆酸转变成咖啡酸的对香豆酸3-羟化酶的异源核酸序列,所述对香豆酸3-羟化酶优选地选自:包含选自SEQ ID NO:71的序列的对香豆酸3-羟化酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有对香豆酸3-羟化酶活性的多肽。
在另一个特定实施方式中,所述微生物包含如前面的实施方式中所述的编码酶UGT、RhaT、RHM、F3’H、OMT、4CL、CHS和CHI的异源核酸序列以及任选的编码酶CPR、FNS和SAMT的异源核酸序列,并且还包含:
-编码能够从酪氨酸产生对香豆酸的优选地来自于黏红酵母或约氏黄杆菌的酪氨酸解氨酶(TAL)的异源核酸序列,所述酪氨酸解氨酶(TAL)特别是包含选自SEQ ID NO:39和41的序列的TAL和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有酪氨酸解氨酶活性的多肽,优选为包含选自SEQ ID NO:41的序列的TAL和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有酪氨酸解氨酶活性的多肽的异源核酸序列;
-任选的编码苯丙氨酸解氨酶(PAL)的异源核酸序列,所述苯丙氨酸解氨酶(PAL)特别是包含选自SEQ ID NO:63、65和77的序列的PAL和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有苯丙氨酸解氨酶活性的多肽,优选为包含选自SEQ ID NO:65的序列的PAL和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有苯丙氨酸解氨酶活性的多肽;和编码肉桂酸4-羟化酶(C4H)的异源核酸序列,所述肉桂酸4-羟化酶(C4H)特别是包含选自SEQ ID NO:67、69和79的序列的C4H和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有能够从苯丙氨酸产生对香豆酸的肉桂酸4-羟化酶活性的多肽,优选为包含选自SEQ ID NO:79的序列的C4H和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有肉桂酸4-羟化酶活性的多肽;
-任选的编码4-羟基苯乙酸3-单加氧酶加氧酶亚基(HpaB)的异源核酸序列,所述4-羟基苯乙酸3-单加氧酶加氧酶亚基(HpaB)优选地选自:包含选自SEQ ID NO:83的序列的4-羟基苯乙酸3-单加氧酶加氧酶亚基(HpaB)和包含与其具有至少60、70、80、85、90或95%序列同一性的序列并具有4-羟基苯乙酸3-单加氧酶加氧酶活性的多肽,和编码4-羟基苯乙酸3-单加氧酶还原酶亚基(HpaC)的异源核酸序列,所述4-羟基苯乙酸3-单加氧酶还原酶亚基(HpaC)优选地选自:包含选自SEQ ID NO:85的序列的4-羟基苯乙酸3-单加氧酶还原酶亚基(HpaC)和包含与其具有至少60、70、80、85、90或95%序列同一性的序列并具有4-羟基苯乙酸3-单加氧酶还原酶活性的多肽;或编码能够将酪氨酸转变成L-DOPA并且也将对香豆酸转变成咖啡酸的4-甲氧基苯甲酸酯O-脱甲基酶的异源核酸序列,所述4-甲氧基苯甲酸酯O-脱甲基酶优选地选自:包含选自SEQ ID NO:73和75的序列的4-甲氧基苯甲酸酯O-脱甲基酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有L-酪氨酸水解酶活性的多肽;或编码能够将对香豆酸转变成咖啡酸的对香豆酸3-羟化酶的异源核酸序列,所述对香豆酸3-羟化酶优选地选自:包含选自SEQ ID NO:71的序列的对香豆酸3-羟化酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有对香豆酸3-羟化酶活性的多肽;
-任选的编码能够从L-DOPA(3,4-二羟基-L-苯丙氨酸)产生咖啡酸的二羟基苯丙氨酸解氨酶(DAL)的异源核酸序列。
在另一个特定实施方式中,所述微生物包含:
-编码黄烷酮7-O-β-D-葡萄糖基转移酶(UGT)的异源核酸序列,所述黄烷酮7-O-β-D-葡萄糖基转移酶(UGT)选自:包含选自SEQ ID NO:113的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽;
-编码6”-O-鼠李糖基转移酶(RhaT)的异源核酸序列,所述6”-O-鼠李糖基转移酶(RhaT)选自:包含选自SEQ ID NO:103的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有6”-O-鼠李糖基转移酶活性的多肽;和
-编码UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶(RHM)的异源核酸序列,所述RHM选自:包含选自SEQ ID NO:107的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶活性的多肽;
-编码苯丙氨酸解氨酶(PAL)的异源核酸序列,所述苯丙氨酸解氨酶(PAL)选自:包含选自SEQ ID NO:65的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有苯丙氨酸解氨酶活性的多肽;
-编码肉桂酸4-羟化酶(C4H)的异源核酸序列,所述肉桂酸4-羟化酶(C4H)选自:包含选自SEQ ID NO:79的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有肉桂酸4-羟化酶活性的多肽;
-编码酪氨酸解氨酶(TAL)的异源核酸序列,所述酪氨酸解氨酶(TAL)选自:包含选自SEQ ID NO:41的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有酪氨酸解氨酶活性的多肽;
-编码4-香豆酰辅酶A连接酶(4CL)的异源核酸序列,所述4-香豆酰辅酶A连接酶(4CL)选自:包含选自SEQ ID NO:45或123的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有4-香豆酰辅酶A连接酶活性的多肽,优选为包含选自SEQ ID NO:45的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有4-香豆酰辅酶A连接酶活性的多肽;
-编码查尔酮合酶(CHS)的异源核酸序列,所述查尔酮合酶(CHS)选自:包含选自SEQ ID NO:53的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有查尔酮合酶活性的多肽;
-编码查尔酮异构酶(CHI)的异源核酸序列,所述查尔酮异构酶(CHI)选自:包含选自SEQ ID NO:61的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有查尔酮异构酶活性的多肽;
-编码黄酮类化合物3’-单加氧酶(F3’H)的异源核酸序列,所述黄酮类化合物3’-单加氧酶(F3’H)选自:包含选自SEQ ID NO:7的序列的酶和包含与序列SEQ ID NO:7具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮类化合物3’-单加氧酶活性的多肽;
-编码黄酮合酶(FNS)的异源核酸序列,所述黄酮合酶(FNS)选自:包含选自SEQ IDNO:37的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮合酶活性的多肽;和
-编码细胞色素P450还原酶(CPR)的异源核酸序列,所述细胞色素P450还原酶(CPR)选自:包含选自SEQ ID NO:25的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有细胞色素P450还原酶活性的多肽;和
-编码能够将圣草酚和/或木犀草素在4’位中甲基化的O-甲基转移酶(OMT)的异源核酸序列,所述O-甲基转移酶(OMT)选自:包含选自SEQ ID NO:117和119的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有O-甲基转移酶活性的多肽,优选为包含选自SEQ ID NO:117的序列的OMT和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有O-甲基转移酶活性的多肽。
优选地,所述微生物还包含编码S-腺苷甲硫氨酸合成酶(SAMT)的异源或内源核酸序列,所述S-腺苷甲硫氨酸合成酶(SAMT)特别是包含选自SEQ ID NO:81的序列的SAMT和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有S-腺苷甲硫氨酸合成酶活性的多肽。
所述酶或一组酶的起源可以被选择成使得它们的起源相同或相近。例如,所述酶或一组酶可以从细菌,例如从同一属或同一物种的细菌获得。在另一个实例中,所述酶或一组酶可以从植物,例如从同一属或同一物种的植物获得。原因是这些共同的起源能够使所述酶一起最适地发挥作用。
在一个实施方式中,所述微生物包含用于酪氨酸生物合成的代谢途径。尤其是,所述微生物可能已被修饰,以具有相对于野生型菌株提高的酪氨酸生产。尤其是,所述微生物可能已被修饰,以使碳流重新导向酪氨酸生物合成。此外,所述微生物可能已被修饰,以降低或抑制酪氨酸生物合成反馈抑制。
在另一个实施方式中,所述微生物包含用于苯丙氨酸生物合成的代谢途径。尤其是,所述微生物可能已被修饰,以具有相对于野生型菌株提高的苯丙氨酸生产。尤其是,所述微生物可能已被修饰,以使碳流重新导向苯丙氨酸生物合成。此外,所述微生物可能已被修饰,以降低或抑制苯丙氨酸生物合成反馈抑制。
在另一个实施方式中,所述微生物包含用于苯丙氨酸和酪氨酸生物合成的代谢途径。尤其是,所述微生物可能已被修饰,以具有相对于野生型菌株提高的苯丙氨酸和酪氨酸生产。尤其是,所述微生物可能已被修饰,以使碳流重新导向苯丙氨酸和酪氨酸生物合成。此外,所述微生物可能已被修饰,以降低或抑制苯丙氨酸和酪氨酸生物合成反馈抑制。
重组核酸和表达盒
编码如前所述的酶的每个核酸序列被包括在表达盒中。优选地,所述编码核酸序列已被优化用于在宿主微生物中表达。所述编码核酸序列被操作性连接到所述基因的表达、尤其是转录和翻译所需的元件。这些元件被选择成在宿主重组微生物中有功能。这些元件可以包括例如转录启动子、转录激活子、终止子序列和起始和终止密码子。随着需要在其中表达的宿主细胞而选择这些元件的方法对于本领域技术人员来说是公知的。
优选地,所述启动子是强启动子。所述启动子任选地可以是可诱导的。
例如,如果所述微生物是原核的,则所述启动子可以选自下述启动子:Lacl,LacZ,pLacT,ptac,pARA,pBAD,噬菌体T3或T7的RNA聚合酶启动子,多角体蛋白启动子,λ噬菌体的PR或PL启动子。在一个特定实施方式中,所述启动子是pLac。如果所述微生物是真核的,特别是酵母,则所述启动子可以选自下述启动子:启动子pTDH3,启动子pTEF1,启动子pTEF2,启动子pCCW12,启动子pHHF2,启动子pHTB2和启动子pRPL18B。可以在酵母中使用的诱导型启动子的实例是启动子tetO-2、GAL10、GAL10-CYC1和PHO5。
包含编码所描述的酶或它们中的一些的组合的核酸序列的表达盒的全部或一部分,可以被包含在共同的表达载体或不同的表达载体中。
因此,本发明涉及一种载体,其包含选自编码黄烷酮7-O-β-D-葡萄糖基转移酶(UGT)的异源核酸序列、编码6”-O-鼠李糖基转移酶(RhaT)的异源核酸序列和编码UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶(RHM)的异源核酸序列的两个核酸序列;优选地,载体包含这三个序列。
因此,具体来说,本发明涉及包含两个核酸序列的载体,所述核酸序列选自:
(i)编码来自于拟南芥、黄芩或智人,优选地来自于拟南芥或黄芩的黄烷酮7-O-β-D-葡萄糖基转移酶(UGT)的异源核酸序列,所述黄烷酮7-O-β-D-葡萄糖基转移酶(UGT)优选地选自:包含选自SEQ ID NO:113、115、91、93、95、97、99和101的序列的酶的黄烷酮7-O-β-D-葡萄糖基转移酶(UGT)和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽,特别是包含选自SEQ ID NO:113、115、91、93、95和97或选自SEQ ID NO:113和95的序列的黄烷酮7-O-β-D-葡萄糖基转移酶(UGT)和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽,优选为包含选自SEQ ID NO:113的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽;
(ii)编码柑橘属或矮牵牛,优选甜橙、柚子或克莱门柚,甚至更优选甜橙或克莱门柚的6”-O-鼠李糖基转移酶(RhaT)的异源核酸序列,所述6”-O-鼠李糖基转移酶(RhaT)优选为包含选自SEQ ID NO:103和105的序列的6”-O-鼠李糖基转移酶(RhaT)和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有6”-O-鼠李糖基转移酶活性的多肽,优选为包含选自SEQ ID NO:103的序列的RhaT和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有6”-O-鼠李糖基转移酶活性的多肽;和
(iii)编码来自于甜橙或拟南芥的UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶(RHM)的异源核酸序列,所述RHM优选为包含选自SEQ ID NO:107、109和111的序列的RHM和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶活性的多肽,特别是包含选自SEQ ID NO:107和109的序列的RHM和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶活性的多肽,优选为包含选自SEQ ID NO:107的序列的RHM和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶活性的多肽。
具体来说,所述载体可以包含选自下述的两个核酸序列:
(i)编码来自于拟南芥、黄芩或智人,优选地来自于拟南芥或黄芩的黄烷酮7-O-β-D-葡萄糖基转移酶(UGT)的异源核酸序列,所述黄烷酮7-O-β-D-葡萄糖基转移酶(UGT)优选地选自:包含选自SEQ ID NO:91、93、95、97、99和101的序列的酶的黄烷酮7-O-β-D-葡萄糖基转移酶(UGT)和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽,特别是包含选自SEQ ID NO:91、93、95和97的序列的黄烷酮7-O-β-D-葡萄糖基转移酶(UGT)和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽;
(ii)编码柑橘属或矮牵牛,优选为甜橙,柚子或克莱门柚,甚至更优选为甜橙或克莱门柚的6”-O-鼠李糖基转移酶(RhaT)的异源核酸序列,所述6”-O-鼠李糖基转移酶(RhaT)优选为包含选自SEQ ID NO:103和105的序列的6”-O-鼠李糖基转移酶(RhaT)和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有6”-O-鼠李糖基转移酶活性的多肽;和
(iii)编码来自于甜橙或拟南芥的UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶(RHM)的异源核酸序列,所述RHM优选为包含选自SEQ ID NO:107、109和111的序列的RHM和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶活性的多肽,特别是包含选自SEQ ID NO:107和109的序列的RHM和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶活性的多肽。
优选地,所述载体包含选自下述的两个核酸序列:
(i)编码黄烷酮7-O-β-D-葡萄糖基转移酶(UGT)的异源核酸序列,所述黄烷酮7-O-β-D-葡萄糖基转移酶(UGT)选自:包含选自SEQ ID NO:113和95的序列的酶的和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽,优选为包含选自SEQ ID NO:113的序列的黄烷酮7-O-β-D-葡萄糖基转移酶(UGT)和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽;
(ii)编码6”-O-鼠李糖基转移酶(RhaT)的异源核酸序列,所述6”-O-鼠李糖基转移酶(RhaT)选自:包含选自SEQ ID NO:103的序列的6”-O-鼠李糖基转移酶(RhaT)和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有6”-O-鼠李糖基转移酶活性的多肽;和
(iii)编码UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶(RHM)的异源核酸序列,所述RHM选自:包含选自SEQ IDNO:107的序列的RHM和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶活性的多肽。
在优选实施方式中,所述微生物包含所有三个核酸序列。
所述编码核酸序列和酶序列如上文所述。术语“包含核酸序列”还意味着包含含有所述核酸序列的表达盒。
任选地,所述载体还可以包含选自下述的一个或多个核酸序列:编码O-甲基转移酶(OMT)的核酸序列,编码F3’H的核酸序列,编码CPR的核酸序列,编码FNS的核酸序列,编码SAMT的核酸序列,编码TAL的核酸序列,编码4CL的核酸序列,编码CHS的核酸序列,编码CHI的核酸序列,编码PAL的核酸序列,编码C4H的核酸序列,编码HpaB的核酸序列和编码DAL的核酸序列,这些酶中的每一种如上文所定义,并且还包括其组合。
优选地,所述载体还包含选自下述的一个或多个序列:编码OMT的核酸序列,编码F3’H的核酸序列,编码CPR的核酸序列,编码FNS的核酸序列,编码TAL的核酸序列,编码4CL的核酸序列,编码CHS的核酸序列,编码CHI的核酸序列,编码PAL的核酸序列和编码C4H的核酸序列。
具体来说,所述载体还可以包含选自下述的一个或多个核酸序列:
-编码黄酮类化合物3’-单加氧酶(F3’H)的异源核酸序列,所述黄酮类化合物3’-单加氧酶(F3’H)能够将柚皮素和/或芹菜素在3’位中羟基化,所述黄酮类化合物3’-单加氧酶(F3’H)优选地来自于回回苏、矮牵牛、翠菊、非洲菊、甜橙、拟南芥、克莱门柚、蓝眼菊、黄孢原毛平革菌、阿维链霉菌或山柳兰,特别是来自于回回苏、矮牵牛、翠菊、非洲菊、甜橙或山柳兰,优选为包含选自SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21和121的序列的F3’H和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮类化合物3’-单加氧酶活性的多肽,优选地选自:包含选自SEQ ID NO:1、5、7、11、17、19和121的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮类化合物3’-单加氧酶活性的多肽,特别是包含选自SEQ ID NO:5、7、17和121的序列的F3’H和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮类化合物3’-单加氧酶活性的多肽,优选为包含选自SEQ ID NO:7的序列的酶和包含与该序列具有至少75%、至少80%、至少85%、至少90%或至少95%同一性的序列并具有黄酮类化合物3’-单加氧酶活性的多肽;
-编码细胞色素P450还原酶(CPR)的异源核酸序列,所述细胞色素P450还原酶(CPR)优选为来自于酿酒酵母或来自于植物例如长春花或拟南芥的CPR,优选为包含选自SEQ ID NO:23、25、27、29和31的序列的CPR和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有细胞色素P450还原酶活性的多肽,优选为包含选自SEQID NO:23、25和29的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有细胞色素P450还原酶活性的多肽,优选为包含选自SEQ ID NO:25的序列的CPR和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有细胞色素P450还原酶活性的多肽;
-编码能够将圣草酚和/或木犀草素在4’位中甲基化的O-甲基转移酶(OMT)的异源核酸序列,所述O-甲基转移酶(OMT)优选为来自于拟南芥或智人的OMT,优选为包含选自SEQID NO:117、119、87和89的序列的OMT和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有尤其是使用圣草酚和/或木犀草素作为底物并在4’位中进行甲基化的O-甲基转移酶活性的多肽,优选地选自:包含选自SEQ ID NO:117、119和89的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有O-甲基转移酶活性的多肽;
-编码能够将柚皮素转化成芹菜素、将圣草酚转化成木犀草素和/或将橙皮素转化成香叶木素,优选地将圣草酚转化成木犀草素的黄酮合酶(FNS)的异源核酸序列,所述黄酮合酶(FNS)优选为来自于拟南芥、金银花、灰毡毛忍冬、蒺藜状苜蓿、水稻、荷兰芹、美洲黑杨、玉米、翠菊、芹菜、蒺藜状苜蓿、孜然、毒欧芹、圆叶当归、毒芹、茶树、朝鲜蓟、水母雪莲、毛喉鞘蕊花、黄芩、旋蒴苣苔、金鱼草、回回苏、大丽花或Erythranthe lewisii,特别是来自于拟南芥、金银花、灰毡毛忍冬、蒺藜状苜蓿、水稻、荷兰芹、美洲黑杨或玉米,优选地来自于金银花、灰毡毛忍冬和荷兰芹的FNS,优选为包含选自SEQ ID NO:33、35、37、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157和159的序列的FNS和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮合酶活性的多肽,优选地选自:包含选自SEQ ID NO:33、35和37的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮合酶活性的多肽,优选为包含选自SEQ ID NO:37的序列的黄酮合酶(FNS)和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮合酶活性的多肽;
-编码S-腺苷甲硫氨酸合成酶(SAMT)的异源或内源核酸序列,所述S-腺苷甲硫氨酸合成酶(SAMT)特别是来自于酿酒酵母,例如包含选自SEQ ID NO:81的序列的SAMT和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有S-腺苷甲硫氨酸合成酶活性的多肽;
-编码能够从酪氨酸产生对香豆酸的酪氨酸解氨酶(TAL)的异源核酸序列,所述酪氨酸解氨酶(TAL)优选地来自于黏红酵母或约氏黄杆菌,特别是包含选自SEQ ID NO:39和41的序列的TAL和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有酪氨酸解氨酶活性的多肽,优选为包含选自SEQ ID NO:41的序列的TAL和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有酪氨酸解氨酶活性的多肽;
-编码能够从对香豆酸和辅酶A产生香豆酰辅酶A的4-香豆酰辅酶A连接酶(4CL)的异源核酸序列,所述4-香豆酰辅酶A连接酶(4CL)优选地来自于拟南芥、克莱门柚、荷兰芹或棒状链霉菌,特别是包含选自SEQ ID NO:43、45、47、49、123和125的序列的4CL和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有4-香豆酰辅酶A连接酶活性的多肽,优选为包含选自SEQ ID NO:123、125和45的序列的4CL和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有4-香豆酰辅酶A连接酶活性的多肽,特别是包含选自SEQ ID NO:45的序列的4CL和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有4-香豆酰辅酶A连接酶活性的多肽;
-编码能够从4-香豆酰辅酶A和丙二酰辅酶A产生柚皮素-查尔酮的查尔酮合酶(CHS)的异源核酸序列,所述查尔酮合酶(CHS)优选地来自于甜橙、大麦或棒状链霉菌,特别是包含选自SEQ ID NO:51、53、55和57的序列的CHS和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有查尔酮合酶活性的多肽,优选地选自:包含选自SEQ ID NO:53和55的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有查尔酮合酶活性的多肽,优选为包含选自SEQ ID NO:53的序列的CHS和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有查尔酮合酶活性的多肽;
-编码能够从柚皮素查尔酮产生柚皮素的查尔酮异构酶(CHI)的异源核酸序列,所述查尔酮异构酶(CHI)优选地来自于拟南芥或棒状链霉菌,特别是包含选自SEQ ID NO:59和61的序列的CHI和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有查尔酮异构酶活性的多肽,优选为包含选自SEQ ID NO:61的序列的CHI和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有查尔酮异构酶活性的多肽;
-编码苯丙氨酸解氨酶(PAL)的异源核酸序列,所述苯丙氨酸解氨酶(PAL)特别是包含选自SEQ ID NO:63、65和77的序列的PAL和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有苯丙氨酸解氨酶活性的多肽,优选为包含选自SEQID NO:65的序列的PAL和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有苯丙氨酸解氨酶活性的多肽;和
-编码肉桂酸4-羟化酶(C4H)的异源核酸序列,所述肉桂酸4-羟化酶(C4H)特别是包含选自SEQ ID NO:67、69和79的序列的C4H和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有能够从苯丙氨酸产生对香豆酸的肉桂酸4-羟化酶活性的多肽,优选为包含选自SEQ ID NO:79的序列的C4H和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有肉桂酸4-羟化酶活性的多肽;
-编码4-羟基苯乙酸3-单加氧酶加氧酶亚基(HpaB)的核酸序列,所述4-羟基苯乙酸3-单加氧酶加氧酶亚基(HpaB)优选地选自:包含选自SEQ ID NO:83的序列的4-羟基苯乙酸3-单加氧酶加氧酶亚基(HpaB)和包含与其具有至少60、70、80、85、90或95%序列同一性的序列并具有4-羟基苯乙酸3-单加氧酶加氧酶活性的多肽,和编码4-羟基苯乙酸3-单加氧酶还原酶亚基(HpaC)的核酸序列,所述4-羟基苯乙酸3-单加氧酶还原酶亚基(HpaC)优选地选自:包含选自SEQ ID NO:85的序列的4-羟基苯乙酸3-单加氧酶还原酶亚基(HpaC)和包含与其具有至少60、70、80、85、90或95%序列同一性的序列并具有4-羟基苯乙酸3-单加氧酶还原酶活性的多肽;或编码能够将酪氨酸转变成L-DOPA并且也将对香豆酸转变成咖啡酸的4-甲氧基苯甲酸酯O-脱甲基酶的核酸序列,所述4-甲氧基苯甲酸酯O-脱甲基酶优选地选自:包含选自SEQ ID NO:73和75的序列的4-甲氧基苯甲酸酯O-脱甲基酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有L-酪氨酸水解酶活性的多肽;或编码能够将对香豆酸转变成咖啡酸的对香豆酸3-羟化酶的异源核酸序列,所述对香豆酸3-羟化酶优选地选自包含序列SEQ ID NO:71的对香豆酸3-羟化酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有对香豆酸3-羟化酶活性的多肽;和
-编码二羟基苯丙氨酸解氨酶(DAL)的核酸序列。
具体来说,所述载体还可以包含选自下述的一个或多个核酸序列:
-编码能够将柚皮素和/或芹菜素在3’位中羟基化的黄酮类化合物3’-单加氧酶(F3’H)的异源核酸序列,所述黄酮类化合物3’-单加氧酶(F3’H)优选地来自于回回苏、矮牵牛、翠菊、非洲菊、甜橙和山柳兰,优选为包含选自SEQ ID NO:1、3、5、7、9、11、13、15、17、19和21的序列的F3’H和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮类化合物3’-单加氧酶活性的多肽,优选地选自:包含选自SEQ ID NO:1、5、7、11、17和19的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮类化合物3’-单加氧酶活性的多肽,特别是包含选自SEQ ID NO:5、7和17的序列的F3’H和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮类化合物3’-单加氧酶活性的多肽;
-编码细胞色素P450还原酶(CPR)的异源核酸序列,所述细胞色素P450还原酶(CPR)优选为来自于酿酒酵母或来自于植物例如长春花或拟南芥的CPR,优选为包含选自SEQ ID NO:23、25、27、29和31的序列的CPR和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有细胞色素P450还原酶活性的多肽,优选地选自:包含选自SEQ ID NO:23、25和29的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有细胞色素P450还原酶活性的多肽;
-编码能够将圣草酚和/或木犀草素在4’位中甲基化的O-甲基转移酶(OMT)的异源核酸序列,所述O-甲基转移酶(OMT)优选为来自于拟南芥或智人的OMT,优选为包含选自SEQID NO:87和89的序列的OMT和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有尤其是使用圣草酚和/或木犀草素作为底物并在4’位中进行甲基化的O-甲基转移酶活性的多肽,优选地选自包含序列SEQ ID NO:89的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有O-甲基转移酶活性的多肽;
-编码能够将柚皮素转化成芹菜素、将圣草酚转化成木犀草素和/或将橙皮素转化成香叶木素,优选地将圣草酚转化成木犀草素的黄酮合酶(FNS)的异源核酸序列,所述黄酮合酶(FNS)优选为来自于的拟南芥、金银花、灰毡毛忍冬、蒺藜状苜蓿、水稻、荷兰芹、美洲黑杨或玉米,优选地来自于金银花、灰毡毛忍冬和荷兰芹的FNS,优选为包含选自SEQ ID NO:33、35和37的序列的FNS和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮合酶活性的多肽,优选选自:包含选自SEQ ID NO:33、35和37的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮合酶活性的多肽,优选为包含选自SEQ ID NO:37的序列的黄酮合酶(FNS)和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮合酶活性的多肽;
-编码S-腺苷甲硫氨酸合成酶(SAMT)的异源或内源核酸序列,所述S-腺苷甲硫氨酸合成酶(SAMT)特别是来自于酿酒酵母的SAMT,例如包含选自SEQ ID NO:81的序列的SAMT和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有S-腺苷甲硫氨酸合成酶活性的多肽;
-编码能够从酪氨酸产生对香豆酸的酪氨酸解氨酶(TAL)的异源核酸序列,所述酪氨酸解氨酶(TAL)优选地来自于黏红酵母或约氏黄杆菌,特别是包含选自SEQ ID NO:39和41的序列的TAL和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有酪氨酸解氨酶活性的多肽,优选为包含选自SEQ ID NO:41的序列的TAL和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有酪氨酸解氨酶活性的多肽;
-编码能够从对香豆酸和辅酶A产生香豆酰辅酶A的4-香豆酰辅酶A连接酶(4CL)的异源核酸序列,所述4-香豆酰辅酶A连接酶(4CL)优选地来自于拟南芥、荷兰芹或棒状链霉菌,特别是包含选自SEQ ID NO:43、45、47和49的序列的4CL和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有4-香豆酰辅酶A连接酶活性的多肽;
-编码能够从4-香豆酰辅酶A和丙二酰辅酶A产生柚皮素-查尔酮的查尔酮合酶(CHS)的异源核酸序列,所述查尔酮合酶(CHS)优选地来自于甜橙、大麦或棒状链霉菌,特别是包含选自SEQ ID NO:51、53、55和57的序列的CHS和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有查尔酮合酶活性的多肽,优选为包含选自SEQ IDNO:53和55的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有查尔酮合酶活性的多肽;
-编码能够从柚皮素查尔酮产生柚皮素的查尔酮异构酶(CHI)的异源核酸序列,所述查尔酮异构酶(CHI)优选地来自于拟南芥或棒状链霉菌,特别是包含选自SEQ ID NO:59和61的序列的CHI和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有查尔酮异构酶活性的多肽;
-编码苯丙氨酸解氨酶(PAL)的异源核酸序列,所述苯丙氨酸解氨酶(PAL)特别是包含选自SEQ ID NO:63、65和77的序列的PAL和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有苯丙氨酸解氨酶活性的多肽;和
-编码肉桂酸4-羟化酶(C4H)的异源核酸序列,所述肉桂酸4-羟化酶(C4H)特别是包含选自SEQ ID NO:67、69和79的序列的C4H和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有能够从苯丙氨酸产生对香豆酸的肉桂酸4-羟化酶活性的多肽;
-编码4-羟基苯乙酸3-单加氧酶加氧酶亚基(HpaB)的核酸序列,所述4-羟基苯乙酸3-单加氧酶加氧酶亚基(HpaB)优选地选自:包含选自SEQ ID NO:83的序列的4-羟基苯乙酸3-单加氧酶加氧酶亚基(HpaB)和包含与其具有至少60、70、80、85、90或95%序列同一性的序列并具有4-羟基苯乙酸3-单加氧酶加氧酶活性的多肽,和编码4-羟基苯乙酸3-单加氧酶还原酶亚基(HpaC)的核酸序列,所述4-羟基苯乙酸3-单加氧酶还原酶亚基(HpaC)优选地选自:包含选自SEQ ID NO:85的序列的4-羟基苯乙酸3-单加氧酶还原酶亚基(HpaC)和包含与其具有至少60、70、80、85、90或95%序列同一性的序列并具有4-羟基苯乙酸3-单加氧酶还原酶活性的多肽;或编码能够将酪氨酸转变成L-DOPA并且也将对香豆酸转变成咖啡酸的4-甲氧基苯甲酸酯O-脱甲基酶的核酸序列,所述4-甲氧基苯甲酸酯O-脱甲基酶优选地选自:包含选自SEQ ID NO:73和75的序列的4-甲氧基苯甲酸酯O-脱甲基酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有L-酪氨酸水解酶活性的多肽;或编码能够将对香豆酸转变成咖啡酸的对香豆酸3-羟化酶的异源核酸序列,所述对香豆酸3-羟化酶优选地选自包含序列SEQ ID NO:71的对香豆酸3-羟化酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有对香豆酸3-羟化酶活性的多肽;和
-编码二羟基苯丙氨酸解氨酶(DAL)的核酸序列。
优选地,所述载体还可以包含选自下述的一个或多个核酸序列:
-编码黄酮类化合物3’-单加氧酶(F3’H)的异源核酸序列,所述黄酮类化合物3’-单加氧酶(F3’H)特别是包含选自SEQ ID NO:7、11、17和121的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮类化合物3’-单加氧酶活性的多肽,优选地选自:包含选自SEQ ID NO:7、17和121的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮类化合物3’-单加氧酶活性的多肽,最特别优选为包含选自SEQ ID NO:7的序列的F3’H和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮类化合物3’-单加氧酶活性的多肽;
-编码细胞色素P450还原酶(CPR)的异源核酸序列,所述细胞色素P450还原酶(CPR)选自:包含选自SEQ ID NO:23、25、27、29和31的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有细胞色素P450还原酶活性的多肽,优选地选自:包含选自SEQ ID NO:23、25和29的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有细胞色素P450还原酶活性的多肽,最特别优选地选自:包含选自SEQ ID NO:25的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有细胞色素P450还原酶活性的多肽;
-编码能够将圣草酚和/或木犀草素在4’位中甲基化的O-甲基转移酶(OMT)的异源核酸序列,所述O-甲基转移酶(OMT)选自:包含选自SEQ ID NO:117和119的序列的O-甲基转移酶(OMT)和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有尤其是使用圣草酚和/或木犀草素作为底物并在4’位中进行甲基化的O-甲基转移酶活性的多肽,优选地选自:包含选自SEQ ID NO:117的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有O-甲基转移酶活性的多肽;
-编码的黄酮合酶(FNS)的异源核酸序列,所述黄酮合酶(FNS)选自:包含选自SEQID NO:37的序列的黄酮合酶(FNS)和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮合酶活性的多肽;
-编码S-腺苷甲硫氨酸合成酶(SAMT)的异源或内源核酸序列,所述S-腺苷甲硫氨酸合成酶(SAMT)选自:包含选自SEQ ID NO:81的序列的S-腺苷甲硫氨酸合成酶(SAMT)和与该序列具有至少60、70、80、85、90或95%序列同一性并具有S-腺苷甲硫氨酸合成酶活性的多肽;
-编码能够从酪氨酸产生对香豆酸的酪氨酸解氨酶(TAL)的异源核酸序列,所述酪氨酸解氨酶(TAL)选自:包含选自SEQ ID NO:41的序列的酪氨酸解氨酶(TAL)和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有酪氨酸解氨酶活性的多肽;
-编码能够从对香豆酸和辅酶A产生香豆酰辅酶A的4-香豆酰辅酶A连接酶(4CL)的异源核酸序列,所述4-香豆酰辅酶A连接酶(4CL)选自:包含选自SEQ ID NO:123、125和45的序列的4-香豆酰辅酶A连接酶(4CL)和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有4-香豆酰辅酶A连接酶活性的多肽,优选为包含选自SEQ IDNO:45的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有4-香豆酰辅酶A连接酶活性的多肽;
-编码能够从4-香豆酰辅酶A和丙二酰辅酶A产生柚皮素-查尔酮的查尔酮合酶(CHS)的异源核酸序列,所述查尔酮合酶(CHS)选自:包含选自SEQ ID NO:53的序列的查尔酮合酶(CHS)和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有查尔酮合酶活性的多肽;
-编码能够从柚皮素查尔酮产生柚皮素的查尔酮异构酶(CHI)的异源核酸序列,所述查尔酮异构酶(CHI)选自:包含选自SEQ ID NO:61的序列的查尔酮异构酶(CHI)和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有查尔酮异构酶活性的多肽;
-编码苯丙氨酸解氨酶(PAL)的异源核酸序列,所述苯丙氨酸解氨酶(PAL)包含选自SEQ ID NO:65和77的序列的苯丙氨酸解氨酶(PAL)和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有苯丙氨酸解氨酶活性的多肽,优选为包含选自SEQ ID NO:65的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有苯丙氨酸解氨酶活性的多肽;和
-编码肉桂酸4-羟化酶(C4H)的异源核酸序列,所述肉桂酸4-羟化酶(C4H)包含选自SEQ ID NO:79的序列的肉桂酸4-羟化酶(C4H)和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有能够从苯丙氨酸产生对香豆酸的肉桂酸4-羟化酶活性的多肽。
在特定实施方式中,所述载体包含:
-编码特别是能够将圣草酚和/或木犀草素在4’位中甲基化的O-甲基转移酶的核酸序列,和编码特别是能够在柚皮素和/或芹菜素的3’位中添加羟基的黄酮类化合物3’-单加氧酶(F3’H)的异源核酸序列;或
-编码特别是能够将圣草酚和/或木犀草素在4’位中甲基化的O-甲基转移酶(OMT)的核酸序列;编码特别是能够在柚皮素和/或芹菜素的3’位中添加羟基的黄酮类化合物3’-单加氧酶(F3’H)的异源核酸序列;和编码细胞色素P450还原酶的异源核酸序列;或
-编码特别是能够将圣草酚和/或木犀草素在4’位中甲基化的O-甲基转移酶(OMT)的异源核酸序列;和编码能够将柚皮素转化成芹菜素、将圣草酚转化成木犀草素和/或将橙皮素转化成香叶木素,优选地将圣草酚转化成木犀草素的黄酮合酶(FNS)的异源核酸序列;或
-编码能够将圣草酚和/或木犀草素在4’位中甲基化的O-甲基转移酶的异源核酸序列;编码能够在柚皮素和/或芹菜素的3’位中羟基化的黄酮类化合物3’-单加氧酶(F3’H)的异源核酸序列;编码细胞色素P450还原酶的异源核酸序列;和编码能够将柚皮素转化成芹菜素、将圣草酚转化成木犀草素和/或将橙皮素转化成香叶木素,优选地将圣草酚转化成木犀草素的黄酮合酶(FNS)的异源核酸序列。
因此,所述载体可以包含从其中选择的几个核酸序列,尤其是从其中选择的1、2、3、4、5、6、7、8、9或10个核酸序列。
所述载体尤其可以包含如上所述的特定编码序列的组合。
载体包含编码序列,所述编码序列可以是异源的,只要所述编码序列可以为所述宿主微生物进行优化即可,可以在异源启动子控制之下,和/或可以与不源自于同一起源生物和/或不以同样的排列方式存在的编码序列组合。
所述载体可以是能够在其中插入外来核酸的任何DNA序列,所述载体使得可以将外来DNA引入到宿主微生物中。例如,所述载体可以是质粒、噬菌粒、粘粒、人工染色体,尤其是YAC或BAC。
所述表达载体可以包含编码选择标志物的核酸序列。所述选择标志物可以是一种或多种抗生素的抗性基因或营养缺陷型基因。所述营养缺陷型基因可以是例如URA3、LEU2、HIS3或TRP1。所述抗生素抗性基因优选可以是例如氨苄青霉素、卡那霉素、潮霉素、遗传霉素和/或诺尔丝菌素的抗性基因。
载体在宿主微生物中的引入是本领域技术人员公知的方法。尤其是几种方法被描述在《分子生物学现代方法》(Current Protocols in Molecular Biology),13.7.1-13.7.10或Ellis T.等,Integrative Biology,2011,3(2),109-118中。
所述宿主微生物可以被瞬时或稳定转化/转染,并且所述核酸、表达盒或载体可以以游离体形式或并入在宿主微生物的基因组中的形式包含在其中。
所述表达载体还可以包含允许所述载体、表达盒或核酸在宿主微生物的基因组中定点插入的一个或多个序列。
全部或一部分包含编码如上所述的酶或某些酶的组合的核酸序列的表达盒,可以被插入到所述重组微生物的染色体中。
相反,全部或一部分包含编码如上所述的酶或某些酶的组合的核酸序列的表达盒,可以以游离体形式,尤其是质粒形式保留。
任选地,所述微生物可能包含编码如前所述的酶的核酸序列的几个拷贝。尤其是,它可能包含编码如前所述的酶的核酸序列的2至10个拷贝,例如2、3、4、5、6、7、8、9或10个拷贝。
本发明涉及一种制备根据本发明所述的微生物的方法,所述方法包括将编码特别是能够在橙皮素和香叶木素的7位中添加葡萄糖的黄烷酮7-O-β-D-葡萄糖基转移酶(UGT)、特别是能够将鼠李糖转移到橙皮素-7-O-葡萄糖苷和/或香叶木素-7-O-葡萄糖苷的葡萄糖的6位中的6”-O-鼠李糖基转移酶(RhaT)和特别是能够产生UDP-鼠李糖的UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶(RHM)的核酸序列引入到微生物中,并选择包含所述核酸序列的微生物。
所述方法还可以包括引入选自下述的一个或多个核酸序列:
-编码能够将柚皮素和/或芹菜素在3’位中羟基化的黄酮类化合物3’-单加氧酶(F3’H)的异源核酸序列,所述黄酮类化合物3’-单加氧酶(F3’H)优选地来自于回回苏、矮牵牛、翠菊、非洲菊、甜橙、克莱门柚、蓝眼菊、黄孢原毛平革菌、阿维链霉菌或山柳兰,特别是来自于回回苏、矮牵牛、翠菊、非洲菊、甜橙或山柳兰,优选为包含选自SEQ ID NO:1、3、5、7、9、11、13、15、17、19和21的序列的F3’H和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮类化合物3’-单加氧酶活性的多肽,优选地选自:包含选自SEQ ID NO:1、5、7、11、17和19的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮类化合物3’-单加氧酶活性的多肽,特别是包含选自SEQ ID NO:5、7和17的序列的F3’H和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮类化合物3’-单加氧酶活性的多肽,优选为包含选自SEQ ID NO:7的序列的F3’H和包含与序列SEQ ID NO:7具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮类化合物3’-单加氧酶活性的多肽;
-编码细胞色素P450还原酶(CPR)的异源核酸序列,所述细胞色素P450还原酶(CPR)优选为来自于酿酒酵母或来自于植物例如长春花或拟南芥的CPR,优选为包含选自SEQ ID NO:23、25、27、29和31的序列的CPR和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有细胞色素P450还原酶活性的多肽,优选地选自:包含选自SEQ ID NO:23、25、29和31的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有细胞色素P450还原酶活性的多肽,特别是包含选自SEQ IDNO:25的序列的CPR和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有细胞色素P450还原酶活性的多肽;
-编码能够将圣草酚和/或木犀草素在4’位中甲基化的O-甲基转移酶(OMT)的异源核酸序列,所述O-甲基转移酶(OMT)优选为来自于拟南芥或智人的OMT,优选为包含选自SEQID NO:87和89的序列的OMT和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有尤其是使用圣草酚和/或木犀草素作为底物并在4’位中进行甲基化的O-甲基转移酶活性的多肽,优选地选自:包含选自SEQ ID NO:89的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有O-甲基转移酶活性的多肽;
-编码能够将柚皮素转化成芹菜素、将圣草酚转化成木犀草素和/或将橙皮素转化成香叶木素,优选地将圣草酚转化成木犀草素的黄酮合酶(FNS)的异源核酸序列,所述黄酮合酶(FNS)优选为来自于拟南芥、金银花、灰毡毛忍冬、蒺藜状苜蓿、水稻、荷兰芹、美洲黑杨、玉米、翠菊、芹菜、蒺藜状苜蓿、孜然、毒欧芹、圆叶当归、毒芹、茶树、朝鲜蓟、水母雪莲、毛喉鞘蕊花、黄芩、旋蒴苣苔、金鱼草、回回苏、大丽花或Erythranthe lewisii,特别是来自于拟南芥、金银花、灰毡毛忍冬、蒺藜状苜蓿、水稻、荷兰芹、美洲黑杨或玉米,优选地来自于金银花、灰毡毛忍冬和荷兰芹的FNS,优选为包含选自SEQ ID NO:33、35、37、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157和159的序列的FNS和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮合酶活性的多肽,优选地选自:包含选自SEQ ID NO:33、35和37的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮合酶活性的多肽,优选为包含选自SEQ ID NO:37的序列的黄酮合酶(FNS)和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮合酶活性的多肽;
-编码S-腺苷甲硫氨酸合成酶(SAMT)的异源或内源核酸序列,所述S-腺苷甲硫氨酸合成酶(SAMT)特别是来自于酿酒酵母的SAMT,例如包含选自SEQ ID NO:81的序列的SAMT和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有S-腺苷甲硫氨酸合成酶活性的多肽;
-编码能够从酪氨酸产生对香豆酸的酪氨酸解氨酶(TAL)的异源核酸序列,所述酪氨酸解氨酶(TAL)优选地来自于黏红酵母或约氏黄杆菌,特别是包含选自SEQ ID NO:39和41的序列的TAL和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有酪氨酸解氨酶活性的多肽,优选为包含选自SEQ ID NO:41的序列的TAL和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有酪氨酸解氨酶活性的多肽;
-编码能够从对香豆酸和辅酶A产生香豆酰辅酶A的4-香豆酰辅酶A连接酶(4CL)的异源核酸序列,所述-香豆酰辅酶A连接酶(4CL)优选地来自于拟南芥、荷兰芹或棒状链霉菌,特别是包含选自SEQ ID NO:43、45、47和49的序列的4CL和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有4-香豆酰辅酶A连接酶活性的多肽,优选为包含选自SEQ ID NO:45的序列的4CL和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有4-香豆酰辅酶A连接酶活性的多肽;
-编码能够从4-香豆酰辅酶A和丙二酰辅酶A产生柚皮素-查尔酮的查尔酮合酶(CHS)的异源核酸序列,所述查尔酮合酶(CHS)优选地来自于甜橙、大麦或棒状链霉菌,特别是包含选自SEQ ID NO:51、53、55和57的序列的CHS和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有查尔酮合酶活性的多肽,优选地选自:包含选自SEQ ID NO:53和55的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有查尔酮合酶活性的多肽,更特别优选为包含选自SEQ ID NO:53的序列的CHS和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有查尔酮合酶活性的多肽;
-编码能够从柚皮素查尔酮产生柚皮素的查尔酮异构酶(CHI)的异源核酸序列,所述查尔酮异构酶(CHI)优选地来自于拟南芥或棒状链霉菌,特别是包含选自SEQ ID NO:59和61的序列的CHI和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有查尔酮异构酶活性的多肽,优选为包含选自SEQ ID NO:61的序列的CHI和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有查尔酮异构酶活性的多肽;
-编码苯丙氨酸解氨酶(PAL)的异源核酸序列,所述苯丙氨酸解氨酶(PAL)特别是包含选自SEQ ID NO:63、65和77的序列的PAL和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有苯丙氨酸解氨酶活性的多肽,特别是包含选自SEQID NO:65的序列的PAL和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有苯丙氨酸解氨酶活性的多肽;和
-编码肉桂酸4-羟化酶(C4H)的异源核酸序列,所述肉桂酸4-羟化酶(C4H)特别是包含选自SEQ ID NO:67、69和79的序列的C4H和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有能够从苯丙氨酸产生对香豆酸的肉桂酸4-羟化酶活性的多肽,特别是包含选自SEQ ID NO:79的序列的C4H和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有肉桂酸4-羟化酶活性的多肽;
-编码4-羟基苯乙酸3-单加氧酶加氧酶亚基(HpaB)的核酸序列,所述4-羟基苯乙酸3-单加氧酶加氧酶亚基(HpaB)优选地选自:包含选自SEQ ID NO:83的序列的4-羟基苯乙酸3-单加氧酶加氧酶亚基(HpaB)和包含与其具有至少60、70、80、85、90或95%序列同一性的序列并具有4-羟基苯乙酸3-单加氧酶加氧酶活性的多肽,和编码4-羟基苯乙酸3-单加氧酶还原酶亚基(HpaC)的核酸序列,所述4-羟基苯乙酸3-单加氧酶还原酶亚基(HpaC)优选地选自:包含选自SEQ ID NO:85的序列的4-羟基苯乙酸3-单加氧酶还原酶亚基(HpaC)和包含与其具有至少60、70、80、85、90或95%序列同一性的序列并具有4-羟基苯乙酸3-单加氧酶还原酶活性的多肽;或编码能够将酪氨酸转变成L-DOPA并且也将对香豆酸转变成咖啡酸的4-甲氧基苯甲酸酯O-脱甲基酶的核酸序列,优选地包含选自SEQ ID NO:73和75的序列的4-甲氧基苯甲酸酯O-脱甲基酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有L-酪氨酸水解酶活性的多肽;或编码能够将对香豆酸转变成咖啡酸的对香豆酸3-羟化酶的异源核酸序列,所述对香豆酸3-羟化酶优选地选自包含序列SEQ IDNO:71的对香豆酸3-羟化酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有对香豆酸3-羟化酶活性的多肽;和
-编码二羟基苯丙氨酸解氨酶(DAL)的核酸序列。
根据优选实施方式,所述包括引入下述核酸序列:
(i)编码黄烷酮7-O-β-D-葡萄糖基转移酶(UGT)的异源核酸序列,所述黄烷酮7-O-β-D-葡萄糖基转移酶(UGT)来自于拟南芥、黄芩或智人,优选地来自于拟南芥或黄芩,优选地选自:包含选自SEQ ID NO:113、115、91、93、95、97、99和101的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽,特别是包含选自SEQ ID NO:113和95的序列的黄烷酮7-O-β-D-葡萄糖基转移酶(UGT)和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽;
(ii)编码6”-O-鼠李糖基转移酶(RhaT)的异源核酸序列,所述6”-O-鼠李糖基转移酶(RhaT)来自于柑橘属或矮牵牛,优选地来自于甜橙、柚子或克莱门柚,甚至更优选地来自于甜橙或克莱门柚,优选为包含选自SEQ ID NO:103和105的序列的RhaT和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有6”-O-鼠李糖基转移酶活性的多肽,特别是包含选自SEQ ID NO:103的序列的6”-O-鼠李糖基转移酶(RhaT)和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有6”-O-鼠李糖基转移酶活性的多肽;和
(iii)编码UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶(RHM)的异源核酸序列,所述RHM来自于甜橙或拟南芥,优选为包含选自SEQ ID NO:107、109和111的序列的RHM和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶活性的多肽,特别是包含选自SEQ ID NO:107的序列的RHM和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶活性的多肽;
和选自下述的至少一个核酸序列:
-编码能够将圣草酚和/或木犀草素在4’位中甲基化的O-甲基转移酶(OMT)的异源核酸序列,所述O-甲基转移酶(OMT)优选为来自于克莱门柚、甜橙、拟南芥或智人的OMT,优选为包含选自SEQ ID NO:117、119、87和89的序列的OMT和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有尤其是使用圣草酚和/或木犀草素作为底物并在4’位中进行甲基化的O-甲基转移酶活性的多肽,优选为包含选自SEQ ID NO:117和119的序列的OMT和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有O-甲基转移酶活性的多肽,最特别优选为包含选自SEQ ID NO:117的序列的OMT和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有O-甲基转移酶活性的多肽;
-编码能够将柚皮素和/或芹菜素在3’位中羟基化的黄酮类化合物3’-单加氧酶(F3’H)的异源核酸序列,所述黄酮类化合物3’-单加氧酶(F3’H)特别是包含选自SEQ IDNO:7、11、17和121的序列的酶和包含与这些序列之一具有至少75%、至少80%、至少85%、至少90%或至少95%同一性的序列并具有黄酮类化合物3’-单加氧酶活性的多肽,优选为包含选自SEQ ID NO:7、17和121的序列的酶和包含与这些序列之一具有至少75%、至少80%、至少85%、至少90%或至少95%同一性的序列并具有黄酮类化合物3’-单加氧酶活性的多肽,最特别优选为包含选自SEQ ID NO:7的序列的酶和包含与该序列具有至少75%、至少80%、至少85%、至少90%或至少95%同一性的序列并具有黄酮类化合物3’-单加氧酶活性的多肽;和
-编码细胞色素P450还原酶(CPR)的异源核酸序列,所述细胞色素P450还原酶(CPR)选自:包含选自SEQ ID NO:23、25、27、29和31的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有细胞色素P450还原酶活性的多肽,优选地选自:包含选自SEQ ID NO:23、25和29的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有细胞色素P450还原酶活性的多肽,特别是包含选自SEQ ID NO:25的序列的CPR和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有细胞色素P450还原酶活性的多肽;和
-编码FNS的异源核酸序列,所述FNS特别是包含选自SEQ ID NO:33、35、37、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157和159的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮合酶活性的多肽,特别是包含选自SEQ ID NO:33、35和37的序列的黄酮合酶(FNS)和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮合酶活性的多肽,优选为包含选自SEQ ID NO:37的序列的黄酮合酶(FNS)和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮合酶活性的多肽;和
-编码S-腺苷甲硫氨酸合成酶(SAMT)的核酸序列,所述S-腺苷甲硫氨酸合成酶(SAMT)特别是来自于酿酒酵母,例如包含选自SEQ ID NO:81的序列的SAMT和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有S-腺苷甲硫氨酸合成酶活性的多肽;和
-编码酪氨酸解氨酶(TAL)的异源核酸序列,所述酪氨酸解氨酶(TAL)来自于黏红酵母或约氏黄杆菌,特别是包含选自SEQ ID NO:41和39的序列的TAL和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有酪氨酸解氨酶活性的多肽,优选为包含选自SEQ ID NO:41的序列的TAL和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有酪氨酸解氨酶活性的多肽;
-编码4-香豆酰辅酶A连接酶(4CL)的异源核酸序列,所述4-香豆酰辅酶A连接酶(4CL)来自于拟南芥、克莱门柚、荷兰芹或棒状链霉菌,特别是包含选自SEQ ID NO:123、125、45、43、47和49的序列的4CL和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有4-香豆酰辅酶A连接酶活性的多肽,优选为包含选自SEQ ID NO:123、125和45的序列的4CL和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有4-香豆酰辅酶A连接酶活性的多肽,最特别优选为包含选自SEQ ID NO:45的序列的4CL和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有4-香豆酰辅酶A连接酶活性的多肽;和
-编码查尔酮合酶(CHS)的异源核酸序列,所述查尔酮合酶(CHS)来自于甜橙、大麦或棒状链霉菌,特别是包含选自SEQ ID NO:53、51、55和57的序列的CHS和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有查尔酮合酶活性的多肽,优选为包含选自SEQ ID NO:53的序列的CHS和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有查尔酮合酶活性的多肽;和
-编码查尔酮异构酶(CHI)的异源核酸序列,所述查尔酮异构酶(CHI)来自于拟南芥或棒状链霉菌,特别是包含选自SEQ ID NO:61和59的序列的CHI和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有查尔酮异构酶活性的多肽,优选为包含选自SEQ ID NO:61的序列的CHI和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有查尔酮异构酶活性的多肽。
优选地,所述方法包括引入所有这些序列。
优选地,所述方法还包括引入:
-编码苯丙氨酸解氨酶(PAL)的异源核酸序列,所述苯丙氨酸解氨酶(PAL)特别是包含选自SEQ ID NO:63、65和77、优选为SEQ ID NO:65和77的序列的PAL和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有苯丙氨酸解氨酶活性的多肽,更特别优选为包含选自SEQ ID NO:65的序列的苯丙氨酸解氨酶(PAL)和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有苯丙氨酸解氨酶活性的多肽;和
-编码肉桂酸4-羟化酶(C4H)的异源核酸序列,所述肉桂酸4-羟化酶(C4H)特别是包含选自SEQ ID NO:67、69和79的序列的C4H和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有肉桂酸4-羟化酶活性的多肽,最特别优选为包含选自SEQ ID NO:79的序列的肉桂酸4-羟化酶(C4H)和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有肉桂酸4-羟化酶活性的多肽。
优选地,所述方法包括引入如上所述的特定编码序列的组合。
香叶木苷和/或橙皮苷的生产
本发明涉及根据本发明所述的微生物用于生产香叶木苷和/或橙皮苷的用途。在第一优选实施方式中,本发明涉及根据本发明所述的微生物用于生产香叶木苷的用途。在第二优选实施方式中,本发明涉及根据本发明所述的微生物用于生产橙皮苷的用途。在优选实施方式中,本发明涉及根据本发明所述的微生物用于生产香叶木苷和橙皮苷的用途。
本发明还涉及一种生产香叶木苷和/或橙皮苷的方法,所述方法包括培养根据本发明所述的微生物,尤其是在允许或有利于香叶木苷和/或橙皮苷的生产的条件下培养根据本发明所述的微生物,和任选地回收和/或纯化生产的香叶木苷和/或橙皮苷。
用于培养根据本发明所述的微生物的条件可以根据本领域技术人员公知的常规技术进行改变。
将所述微生物在适合的培养基中培养。术语“适合的培养基”通常是指提供对所述微生物的维持和/或生长来说必需或有益的营养物例如碳源、氮源如硫酸铵、磷源如磷酸二氢钾、微量元素如铜、碘、铁、镁、锌或钼盐、维生素和其他生长因子例如氨基酸或其他生长促进剂的培养基。如果需要,可以添加消泡剂。根据本发明,这种适合的培养基可以是化学限定的或复合的。因此,所述培养基可以与合成培养基在组成上一致或相近,正如由Verduyn等人(Yeast.1992.8:501–17)确定并由Visser等人(Biotechnology andBioengineering.2002.79:674–81)改变的,或者是可商购的例如YNB培养基(酵母氮源基础培养基,MP Biomedicals或Sigma-Aldrich)。尤其是,所述培养基可以包含简单碳源例如葡萄糖、果糖、木糖、乙醇、甘油、半乳糖、蔗糖、纤维素、纤维二糖、淀粉、葡萄糖聚合物、糖蜜或这些糖的副产品。
优选地,香叶木苷和/或橙皮苷通过根据本发明所述的微生物的生产在不向所述培养基供应柚皮素、芹菜素、圣草酚、木犀草素、橙皮素和/或香叶木素,优选地不向所述培养基供应柚皮素、芹菜素、圣草酚、木犀草素、橙皮素和香叶木素的情况下获得。
根据本发明,可以设想用于感兴趣的分子的工业规模生产的任何培养方法。有利情况下,所述培养在生物反应器中进行,尤其是采取分批、补料分批、恒化和/或连续培养模式。在过程中使用维生素的受控补料也可能对生产率有益(Alfenore等,Appl.Microbiol.Biotechnol.2002.60:67–72)。
所述培养通常在生物反应器中进行,可能具有使用适合的培养基在三角瓶中的固体和/或液体预培养步骤。
通常,用于培养根据本发明所述的微生物的条件可以由本领域技术人员根据所述微生物容易地改变。例如,尤其是对于酵母来说,培养温度在20℃至40℃之间,优选地在28℃至35℃之间,对于酿酒酵母来说更具体为约30℃。
根据本发明所述的微生物可以培养1至30天,优选为1至10天。
根据本发明所述的微生物能够产生最低量为1mg/l培养基,优选地10、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100mg/l培养基,任选地150、200、250、300、350、400、450、500、600、700、800、900或1000mg/l培养基的香叶木苷和/或橙皮苷。
附图说明
图1:用于生产橙皮苷和香叶木苷的代谢途径的描述。
图2:通过菌株FL_405(F3’H4+CPR2)从柚皮素生产圣草酚。对照菌株:CF235。在菌株FL-405中观察柚皮素峰的消失和圣草酚峰的出现。
图3:通过菌株FL_405(F3’H4+CPR2)从芹菜素生产木犀草素。对照菌株:CF235。在菌株FL-405中观察芹菜素峰的消失和木犀草素峰的出现。
图4:通过菌株SC744(FNSII1+CPR2)从柚皮素生产芹菜素。对照菌株:CF234。在所述菌株中观察柚皮素峰的消失和芹菜素峰的出现。
图5:通过SC744(FNSII1+CPR2)从圣草酚生产木犀草素。对照菌株:CF234。在所述菌株中观察圣草酚峰的消失和木犀草素峰的出现。
图6:通过菌株SC1500生产圣草酚和木犀草素。对照菌株:CF237。观察圣草酚和木犀草素峰。
图7:通过菌株SC 1612(MET+SAM)和SC 1614(MET+SAM)从圣草酚生产橙皮素。对照菌株:CF235。在所述菌株中观察圣草酚峰的消失和橙皮素峰的出现。
图8:通过菌株SC 1612(MET+SAM)和SC 1614(MET+SAM)从木犀草素生产香叶木素。对照菌株:CF235。在所述菌株中观察木犀草素峰的消失和香叶木素峰的出现。
图9:通过菌株SC744(FNSII+CPR)从橙皮素生产香叶木素。对照菌株:CF234。在所述菌株中观察橙皮素峰的消失和香叶木素峰的出现。
图10:通过大肠埃希氏杆菌EC26(MET+SAM)从圣草酚生产橙皮素。对照菌株:大肠埃希氏杆菌MH1。在所述菌株中观察圣草酚峰的消失和橙皮素峰的出现。
图11:通过大肠埃希氏杆菌EC26(MET+SAM)从木犀草素生产香叶木素。对照菌株:大肠埃希氏杆菌MH1。在所述菌株中观察木犀草素峰的消失和香叶木素峰的出现。
图12:通过大肠埃希氏杆菌EC30(FNSII)从橙皮素生产香叶木素。对照菌株:大肠埃希氏杆菌MH1。在所述菌株中观察橙皮素峰的消失和香叶木素峰的出现。
图13:通过菌株SC1508生产橙皮素和香叶木素。对照菌株:CF237。观察橙皮素和香叶木素峰。
图14:通过菌株FL 547(GT+RHM+RHAT)从橙皮素生产橙皮苷。对照菌株:CF 233。观察橙皮素峰的消失和橙皮苷峰的出现。
图15:通过菌株FL 547(GT+RHM+RHAT)从香叶木素生产香叶木苷。对照菌株:CF233。观察香叶木素峰的消失和香叶木苷峰的出现。
图16:通过大肠埃希氏杆菌EC38、EC45和EC47(GT+RHM+RHAT)从橙皮素生产橙皮苷。对照菌株:大肠埃希氏杆菌MH1。观察橙皮素峰的消失和橙皮苷峰的出现。
图17:通过大肠埃希氏杆菌EC38、EC45和EC47(GT+RHM+RHAT)从香叶木素生产香叶木苷。对照菌株:大肠埃希氏杆菌MH1。观察香叶木素峰的消失和香叶木苷峰的出现。
图18:通过菌株SC1509、SC1530、SC1529、SC1568和SC2410生产橙皮苷和香叶木苷。对照菌株:CF237。观察橙皮苷和香叶木苷峰。
图19:通过菌株SC2424、SC2425、SC2426、SC2427、SC2428和SC1500生产圣草酚和木犀草素。对照菌株:CF237。
图20:通过菌株SC2147、SC2151、SC1612和SC1614生产橙皮素和高圣草酚。对照菌株:CF235。
图21:通过菌株SC2147、SC2151、SC1612和SC1614生产香叶木素和金圣草黄素。对照菌株:CF235。
图22:通过大肠埃希氏杆菌EC41(MET+SAM)从圣草酚生产橙皮素。对照菌株:大肠埃希氏杆菌MH1。在所述菌株中观察圣草酚峰的消失和橙皮素峰的出现。
图23:通过大肠埃希氏杆菌EC43(MET+SAM)从圣草酚生产橙皮素。对照菌株:大肠埃希氏杆菌MH1。在所述菌株中观察圣草酚峰的消失和橙皮素峰的出现。
图24:通过大肠埃希氏杆菌EC43(MET+SAM)从木犀草素生产香叶木素。对照菌株:大肠埃希氏杆菌MH1。在所述菌株中观察木犀草素峰的消失和香叶木素峰的出现。
图25:通过菌株SC2408生产橙皮素和香叶木素。对照菌株:CF237。观察橙皮素和香叶木素峰。
图26:通过菌株SC2409生产橙皮素和香叶木素。对照菌株:CF237。观察橙皮素和香叶木素峰。
图27:通过菌株SC2408、SC2409和SC1508生产橙皮素和香叶木素。对照菌株:CF237。
图28:通过菌株SC1579、SC1584、SC1621和SC1626生产橙皮苷和香叶木苷。
图29:通过菌株SC2429至SC2434、SC2436至SC2444、SC2446至SC2454、SC2456至SC2464和SC2466从柚皮素生产香叶木素。
[表1]序列描述
Figure BDA0003256092340001191
Figure BDA0003256092340001201
Figure BDA0003256092340001211
Figure BDA0003256092340001221
Figure BDA0003256092340001231
Figure BDA0003256092340001241
实施例
材料和方法
菌株
在实施例中使用的酵母从酿酒酵母FY1679-28A(Tettelin等,1995https://doi.org/10.1016/S1067-2389(06)80008-7)获得。这种酵母对尿嘧啶、色氨酸、组氨酸和亮氨酸四重营养缺陷。在实施例中使用的细菌菌株从大肠埃希氏杆菌MH1获得。
标准品
标准品从供应商Extrasynthèse,France获得(柚皮素、芹菜素、圣草酚、木犀草素、橙皮素、橙皮苷、香叶木素和香叶木苷)。
基因克隆
被优化以在酵母中表达的基因由Eurofins Genomics,Ebersberg,Germany或Biomatik,Cambridge,Canada或Twist Biosciences,San Francisco,USA或DCBiosciences,Dundee,UK合成。来自于酿酒酵母的基因cpr2(SEQ ID NO:26)通过PCR从基因组DNA扩增。
所述通过合成或PCR扩增获得的基因在5’和3’末端处包含BbsI(GAAGAC)或BsaI(GGTCTC)限制性位点。
将所有基因、启动子和终止子限制克隆在用于在酵母中表达的载体pSBK或用于在大肠埃希氏杆菌中表达的载体pSB1K3中。启动子和(Wargner等,2015DOI:10.1016/j.fgb.2015.12.001)通过PCR从酿酒酵母或大肠埃希氏杆菌的基因组DNA回收。
载体pSBK包含用于酵母的URA或LEU或TRP或HIS选择标志物,载体pSB1K3包含卡那霉素抗性标志物。
培养条件
将菌株在24孔板(Starlab,Orsay,Fr)中,在1ml增补有20g/l葡萄糖的最低氮源基础培养基(Dutscher,Brumath,Fr)(对于酵母来说)和1ml增补有4g.l-1葡萄糖的M9(对于大肠埃希氏杆菌来说)中,在30℃培养72小时,并以200rpm连续搅拌。在某些情况下,以100mg.l-1的浓度添加柚皮素或芹菜素以确定F3’H的活性,以100mg.l-1的浓度添加柚皮素或圣草酚以确定FNSII的活性,以100mg.l-1的浓度添加圣草酚或木犀草素以确定MET的活性,以100mg.l-1的浓度添加橙皮素或香叶木素以确定GT的活性,并添加橙皮素7-O-葡萄糖苷和/或香叶木素7-O-葡萄糖苷以确定RHM和RHAT的活性。
每种菌株使用在相同条件下培养的24小时预培养物以0.2的OD接种。
分析方法
样品的制备:将1mL培养物在-80℃冷冻,然后在0.10mbar下冷冻干燥12小时。然后将样品转移到1mL二甲基亚砜(DMSO)中,以1000rpm搅拌30秒,然后在室温下以3000rpm离心5分钟。在离心后,将已知体积的上清液添加到已知体积的溶解在甲醇中的内标混合物中。
所述内标的终浓度是:
·香叶木苷C13 0.5mg/L
·香叶木素C13 0.015mg/L
通过UHPLC-TQ分析:将样品使用偶联到Quantis三重四级杆MS(Thermo)的Vanquish-H UHPLC机器(Thermo)进行分析。柱是与HSST3 1.8μm 2.1×5mm预柱组合的Waters Acquity UPLC@USST3柱(8μm 2.1×100mm)。
流动相A是在LC/MS级水中的0.1%甲酸溶液,流动相B是在纯LC/MS级乙腈中的0.1%甲酸溶液。柱温为50℃,样品更换器的温度为10℃。
为了检测感兴趣的黄酮类化合物,使用了两种色谱条件:
[表2]色谱条件方法1
时间(min) 流速(ml/min) 流动相A(%) 流动相B(%)
0 0.5 73 27
8 0.5 73 27
[表3]色谱条件方法2
时间(min) 流速(ml/min) 流动相A(%) 流动相B(%)
0 0.5 83 17
3.75 0.5 83 17
4 0.5 73 27
8.5 0.5 73 27
11.0 0.5 50 50
13.0 0.5 0 100
13.5 0.5 83 17
15.0 0.5 83 17
对于感兴趣的分子来说监测的离子和片段化条件是:
[表4]对于方法1来说
Figure BDA0003256092340001271
[表5]对于方法2来说
Figure BDA0003256092340001281
F3’H
用于每种F3’H的构建物在带有URA选择标志物的载体中制造(表6)。包含每种SAM2和各种CPR中的仅仅一者的构建物在带有LEU选择标志物的载体中产生(表7)。也产生了仅包含URA或LEU选择标志物的两个载体作为对照。所述标志物基因使得可以检测和选择已并入感兴趣的基因的细胞。
[表6]测试的各种不同F3’H构建物的列表
Figure BDA0003256092340001291
[表7]使用各种不同CPR制造的构建物的列表
Figure BDA0003256092340001292
Figure BDA0003256092340001301
分别使用表6中列出的所有F3’H产生了几个菌株,以便可以使用表7的构建物对它们各自进行测试。
这些各种不同的组装体能够检查F3’H的酶活性,并且也能确定最高效的F3’H-CPR对。
例如,菌株FL 405含有构建物FL 26和FL 401。
含有构建物TT URA和TT LEU的对照菌株(不含基因)被称为CF235。
FNSII
对于每种下述FNSII,制造了在TRP载体中的构建物(表8)。将各自含有SAM2和不同的CPR的带有LEU选择标志物的相同载体用于测试所述FNSII(表9)。
[表8]包含所测试的各种不同FNSII的构建物
Figure BDA0003256092340001302
Figure BDA0003256092340001311
[表9]使用各种不同CPR制造的构建物的列表
Figure BDA0003256092340001312
分别使用表8中列出的每种FNSII的构建物和表9的每种CPR的构建物产生了几个菌株。
这些各种不同的组装体能够检查FNSII的酶活性,并且也能确定最高效的FNSII。
例如,菌株SC 744含有构建物FL 620和FL 401。
含有构建物TT TRP和TT LEU的对照菌株(不含基因)被称为CF234。
制造了类似的构建物以测试SEQ ID NO:127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157和159的FNSII。
直至圣草酚/木犀草素的酵母
还测试了包含直至圣草酚和木犀草素的途径的菌株:
-包含构建物FL 26、FL 602、FL 808和FL 822的菌株SC1500;
-包含构建物FL 1031+FL 602+FL 822+TT HIS的菌株SC2424;
-包含构建物FL 26+FL 602+FL 822+TT HIS的菌株SC2425;
-包含构建物FL 31+FL 602+FL 822+TT HIS的菌株SC2426;
-包含构建物FL 1031、FL 602、FL 808和FL 822的菌株SC2427;和
-包含构建物FL 31+FL 602+FL 808+FL 822的菌株SC2428。
[表10]用于包含直至圣草酚和木犀草素的途径的菌株的构建物的列表
Figure BDA0003256092340001321
Figure BDA0003256092340001331
含有构建物TT URA、TT TRP、TT HIS和TT LEU的对照菌株(不含基因)被称为CF237。
MET:
为了测试每种MET,制造了表11中呈现的构建物。所述标志物基因使得能够检测和选择已并入感兴趣的基因的细胞。
[表11]为测试各种不同MET而制造的构建物的列表
Figure BDA0003256092340001332
Figure BDA0003256092340001341
产生了4个菌株SC1612、SC1614、SC2147和SC2151,其中SC1612带有FL 121和FL266,SC1614带有FL 121和FL 268,SC2147带有FL 475和FL 121,并且SC2151带有FL 469和FL 121,用于将圣草酚转变成橙皮素,以便确定哪种MET最为高效。
含有构建物TT LEU和TT URA的对照菌株(不含基因)被称为CF235。
F3’H、MET、FNS、CPR:从柚皮素生产香叶木素
[表12]用于在酿酒酵母(SC)中测试酶的构建物的列表
Figure BDA0003256092340001342
Figure BDA0003256092340001351
构建了下述菌株:
SC2429:FL 1111+FL 1031+FL 121
SC2430:FL 1112+FL 1031+FL 121
SC2431:FL 1113+FL 1031+FL 121
SC2432:FL 1114+FL 1031+FL 121
SC2433:FL 1115+FL 1031+FL 121
SC2439:FL 1111+FL 1031+TT LEU
SC2440:FL 1112+FL 1031+TT LEU
SC2441:FL 1113+FL 1031+TT LEU
SC2442:FL 1114+FL 1031+TT LEU
SC2443:FL 1115+FL 1031+TT LEU
SC2434:FL 1116+FL 1031+FL 121
SC2436:FL 1118+FL 1031+FL 121
SC2437:FL 1119+FL 1031+FL 121
SC2438:FL 1120+FL 1031+FL 121
SC2444:FL 1116+FL 1031+TT LEU
SC2446:FL 1118+FL 1031+TT LEU
SC2447:FL 1119+FL 1031+TT LEU
SC2448:FL 1120+FL 1031+TT LEU
SC2449:FL 1111+FL 26+FL 121
SC2450:FL 1112+FL 26+FL 121
SC2451:FL 1113+FL 26+FL 121
SC2452:FL 1114+FL 26+FL 121
SC2453:FL 1115+FL 26+FL 121
SC2459:FL 1111+FL 26+TT LEU
SC2460:FL 1112+FL 26+TT LEU
SC2461:FL 1113+FL 26+TT LEU
SC2462:FL 1114+FL 26+TT LEU
SC2463:FL 1115+FL 26+TT LEU
SC2454:FL 1116+FL 26+FL 121
SC2456:FL 1118+FL 26+FL 121
SC2457:FL 1119+FL 26+FL 121
SC2458:FL 1120+FL 26+FL 121
SC2464:FL 1116+FL 26+TT LEU
SC2466:FL 1118+FL 26+TT LEU
SC2467:FL 1119+FL 26+TT LEU
SC2468:FL 1120+FL 26+TT LEU
含有构建物TT URA、TT TRP、TT HIS和TT LEU的对照菌株(不含基因)被称为CF237。
直至橙皮素/香叶木素的大肠埃希氏杆菌
[表13]用于在大肠埃希氏杆菌中测试酶的构建物的列表
Figure BDA0003256092340001361
Figure BDA0003256092340001371
直至橙皮素/香叶木素的酵母
还测试了包含直至橙皮素/香叶木素的途径的3个菌株。菌株SC1508包含表14的构建物FL 121+FL 268+FL 602+FL 808。菌株SC2408包含表14的构建物FL 121+FL 469+FL602+FL 808。菌株SC2409包含表14的构建物FL 121+FL 475+FL 602+FL 808。
[表14]在本实施例中使用的构建物的列表
Figure BDA0003256092340001372
Figure BDA0003256092340001381
含有构建物TT LEU、TT URA、TT TRP和TT HIS的对照菌株(不含基因)被称为CF237。
GT
为了测试每种GT,制造了表15中呈现的构建物。所述标志物基因使得能够检测和选择已并入感兴趣的基因的细胞。
[表15]用于测试各种不同GT的构建物的列表
Figure BDA0003256092340001382
Figure BDA0003256092340001391
Figure BDA0003256092340001401
带有各种不同GT的各种不同构建物能够检查GT的酶活性,并且也能确定最高效的GT。
含有构建物TT URA的对照菌株(不含基因)被称为CF233。
RHM
为了测试每个RHM,制造了在表16中呈现的构建物。
[表16]用于测试各种不同RHM的构建物的列表
Figure BDA0003256092340001402
带有各种不同RHM的各种不同构建物能够检查RHM的酶活性,并且也能够确定最高效的RHM。
含有构建物TT URA的对照菌株(不含基因)被称为CF233。
RHAT
为了测试每种RHAT,制造了在表17中呈现的构建物。
[表17]用于测试各种不同RHAT的构建物的列表
Figure BDA0003256092340001411
使用各种不同的RHAT制造的各种不同组装体能够检查RHAT的酶活性,并且还能够确定最高效的RHAT。
含有构建物TT URA的对照菌株(不含基因)被称为CF233。
直至橙皮苷/香叶木苷的大肠埃希氏杆菌
[表18]为了在大肠埃希氏杆菌中测试途径而产生的菌株的列表
Figure BDA0003256092340001412
Figure BDA0003256092340001421
直至橙皮苷/香叶木苷的酵母
还产生了包含完整途径的9个菌株。
菌株SC1509包含构建物FL 121+FL 511+FL 602+FL 808。
菌株SC1530包含构建物FL 121+FL 603+FL 602+FL 808。
菌株SC1529包含构建物FL 121+FL 554+FL 602+FL 808。
菌株SC1568包含构建物FL 121+FL 556+FL 602+FL 808。
菌株SC2410包含构建物FL 121+FL 1100+FL 602+FL 808。
菌株SC1579包含构建物FL 401+FL 547+FL 602+FL 828。
菌株SC1584包含构建物FL 401+FL 554+FL 602+FL 828。
菌株SC1621包含构建物FL 401+FL 556+FL 602+FL 828。
菌株SC1626包含构建物FL 401+FL 603+FL 602+FL 828。
[表19]用于产生直至橙皮苷/香叶木苷的菌株的构建物的列表
Figure BDA0003256092340001422
Figure BDA0003256092340001431
Figure BDA0003256092340001441
含有构建物TT LEU、TT URA、TT TRP和TT HIS的对照菌株(不含基因)被称为CF237。
结果
F3’H
下面的表20和21示出了通过将包含表6中列出的F3’H和表7的构建物的菌株分别在柚皮素和芹菜素存在下培养而获得的圣草酚(表20)和木犀草素(表21)的生产。
[表20]圣草酚的浓度(单位为mg.l-1)
Figure BDA0003256092340001451
QL:低于定量极限
所述各种不同的菌株确实能够根据所使用的F3’H和CPR从柚皮素产生不同浓度的圣草酚(参见图2)。
[表21]木犀草素的浓度(单位为mg.l-1)
Figure BDA0003256092340001452
Figure BDA0003256092340001461
QL:低于定量极限
所述各种不同的菌株确实能够根据所使用的F3’H和CPR从芹菜素产生不同浓度的木犀草素(参见图3)。
FNS
下面的表22和23示出了通过将包含表8中列出的FNSII和表9的构建物的菌株分别在柚皮素和圣草酚存在下培养而获得的芹菜素(表22)和木犀草素(表23)。
[表22]芹菜素的浓度(单位为mg.l-1)
Figure BDA0003256092340001462
[表23]木犀草素的浓度(单位为mg.l-1)
Figure BDA0003256092340001471
所述各种不同的菌株确实能够根据所使用的FNS从柚皮素和圣草酚产生不同浓度的芹菜素和木犀草素(图4和5)。
使用SEQ ID NO:127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157和159的FNSII获得了类似的结果。
F3’H、MET、FNS、CPR:从柚皮素生产香叶木素
通过菌株SC2429至SC2434、SC2436至SC2444、SC2446至SC2454、SC2456至SC2464和SC2466至SC2468从柚皮素生产香叶木素的结果呈现在图29中。
所有所述菌株均能从柚皮素生产香叶木素。香叶木素的生产主要通过添加CPR来提高。
直至圣草酚/木犀草素的酵母
菌株SC2424、SC2425、SC2426、SC2427、SC1500和SC2428含有直至圣草酚和木犀草素的途径的所有酶,并且能够从葡萄糖生产木犀草素和圣草酚。
菌株SC1500的结果对应于图6,其中观察到圣草酚和木犀草素峰。对于菌株SC2424、SC2425、SC2426、SC2427和SC2428获得了类似的结果。菌株SC2424、SC2425、SC2426、SC2427、SC1500和SC2428中的每一者的圣草酚和木犀草素的生产呈现在图19中。
应该指出,向生物合成途径添加酶PAL和C4H能够获得明显更高的圣草酚和木犀草素浓度。这些浓度可以比使用除了PAL和C4H之外含有相同酶的菌株所获得浓度高多达6倍(参考图19,例如通过将不含PAL/C4H的菌株SC2425与含有PAL/C4H的菌株SC1500比较或将不含PAL/C4H的菌株SC2426与含有PAL/C4H的菌株SC2428比较)。
MET
通过菌株SC1612、SC1614、SC2147和SC2151从圣草酚和木犀草素生产橙皮素和香叶木素的结果分别呈现在图7、8、20和21中。
酵母菌株SC1612、SC1614、SC2147和SC2151确实能够生产橙皮素和/或香叶木素。
从圣草酚开始,菌株SC2147、SC2151和SC1612能够特异性生产橙皮素,即特异性将圣草酚的4’位中的羟基甲基化(图20)。菌株SC1614就其本身而言产生橙皮素和高圣草酚的混合物。
此外,值得注意的是,菌株SC2151能够生产约40mg/L的橙皮素(图20)。菌株SC2147、SC1612和SC1614就其本身而言能够从木犀草素产生香叶木素(图21)。
FNSII
通过菌株SC744从橙皮素生产香叶木素的结果呈现在图9中。
酵母菌株SC744确实能够从橙皮素产生香叶木素。
直至橙皮素/香叶木素的大肠埃希氏杆菌
通过菌株EC26、EC41和EC43从圣草酚生产橙皮素的结果呈现在图10、22和23中,并且通过菌株EC26和EC43从木犀草素生产香叶木素的结果呈现在图11和24中。
大肠埃希氏杆菌菌株EC26、EC41和EC43确实能够产生橙皮素和/或香叶木素。
通过菌株EC30从橙皮素生产香叶木素的结果呈现在图12中。
大肠埃希氏杆菌菌株EC30确实能够从橙皮素产生香叶木素。
直至橙皮素/香叶木素的酵母
通过菌株SC1508、SC2408和SC2409从葡萄糖生产橙皮素和香叶木素的结果呈现在图13、25和26中。
含有直至橙皮素和香叶木素的途径的所有酶的酵母菌株SC1508、SC2408和SC2409能够从葡萄糖生产橙皮素和/或香叶木素(图27)。值得注意的是,菌株SC2408产生约25mg/L的橙皮素和约5mg/L的香叶木素。
GT
[表24]根据所使用的GT而变的橙皮素、橙皮素7-O-葡萄糖苷和橙皮苷的浓度(单位为mg.l-1)
Figure BDA0003256092340001491
Figure BDA0003256092340001501
//量未测定
[表25]根据所使用的GT而变的香叶木素、香叶木素7-O-葡萄糖苷和香叶木苷的浓度(单位为mg.l-1)
Figure BDA0003256092340001502
所述各种不同菌株确实能够根据所使用的GT,从橙皮素和香叶木素产生不同浓度的橙皮苷和/或香叶木苷。
RHM
[表26]根据所使用的RHM而变的橙皮素、橙皮素7-O-葡萄糖苷和橙皮苷的浓度(单位为mg.l-1)
橙皮素 橙皮素7-O-葡萄糖苷 橙皮苷
培养基 90±8.1 N/D N/D
对照- 84.2±4.6 N/D N/D
FL 545-RHM SEQ ID No 108 59.2±1.1 7.1±0.3 70.4±2.2
FL 512-RHM SEQ ID No 110 45.6±2.4 N/D 82.2±5.2
[表27]根据所使用的RHM而变的香叶木素、香叶木素7-O-葡萄糖苷和香叶木苷的浓度(单位为mg.l-1)
Figure BDA0003256092340001511
所述各种不同的菌株确实能够根据所使用的RHM,从橙皮素和香叶木素产生不同浓度的橙皮苷和香叶木苷。
RHAT
[表28]根据所使用的RHAT而变的橙皮素、橙皮素7-O-葡萄糖苷和橙皮苷的浓度(单位为mg.l-1)
Figure BDA0003256092340001512
[表29]根据所使用的RHAT而变的香叶木素、香叶木素7-O-葡萄糖苷和香叶木苷的浓度(单位为mg/mol)
Figure BDA0003256092340001521
所述各种不同的菌株确实能够根据所使用的GT、RHM和RHAT,从橙皮素和香叶木素产生不同浓度的橙皮苷和香叶木苷。
通过菌株FL 547从橙皮素和香叶木素生产橙皮苷和香叶木苷的结果分别呈现在图14和15中。
所测试的带有各种不同构建物的酵母确实能够产生橙皮苷和香叶木苷。
直至橙皮苷/香叶木苷的大肠埃希氏杆菌
通过菌株EC38、EC45和EC47从橙皮素生产橙皮苷的结果呈现在图16中。
这些菌株确实能够从橙皮素产生橙皮苷。
通过菌株EC38、EC45和EC47从香叶木素生产香叶木苷的结果呈现在图17中。
这些菌株确实能够从香叶木素产生香叶木苷。
直至橙皮苷/香叶木苷的酵母
通过菌株SC1509、SC1530、SC1529、SC1568和SC2410从葡萄糖生产橙皮苷和香叶木苷的结果呈现在图18中。通过菌株SC1579、SC1584、SC1621和SC1626从香叶木苷生产橙皮苷的结果呈现在图28中。
含有所述途径的所有酶的所有所述菌株均能产生橙皮苷和/或香叶木苷。
序列表
<110> 法国施维雅药厂(LES LABORATOIRES SERVIER)
<120> 在微生物中生物合成香叶木苷和/或橙皮苷的方法
<130> B2959PC
<160> 160
<170> PatentIn 3.5版
<210> 1
<211> 524
<212> PRT
<213> 白苏(Perilla frutescens)
<400> 1
Met Ser Ile Ser Ala Ala Val Ser Leu Ile Ile Cys Thr Ser Ile Leu
1 5 10 15
Gly Val Leu Val Tyr Phe Leu Phe Leu Arg Arg Gly Gly Gly Ser Asn
20 25 30
Gly Arg Pro Leu Pro Pro Gly Pro Arg Pro Trp Pro Ile Val Gly Asn
35 40 45
Leu Pro Gln Leu Gly Pro Lys Pro His Gln Ser Met Ala Ala Leu Ala
50 55 60
Arg Val His Gly Pro Leu Met His Leu Lys Met Gly Phe Val His Val
65 70 75 80
Val Val Ala Ala Ser Ala Thr Val Ala Glu Lys Phe Leu Lys Val His
85 90 95
Asp Thr Asn Phe Leu Ser Arg Pro Pro Asn Ser Gly Ala Glu His Ile
100 105 110
Ala Tyr Asn Tyr Asn Asp Leu Val Phe Ala Pro His Gly Pro Arg Trp
115 120 125
Arg Leu Leu Arg Lys Ile Cys Ala Leu His Leu Phe Ser Ser Lys Ala
130 135 140
Leu Asp Asp Phe Arg His Val Arg Glu Glu Glu Val Gly Ile Leu Ile
145 150 155 160
Arg Asn Leu Ala Ser Val Gly Glu Met Pro Ala Ser Ile Gly Gln Met
165 170 175
Met Tyr Val Cys Ala Thr Asn Ala Ile Ser Arg Val Met Leu Gly Arg
180 185 190
His Val Leu Gly Asp Glu His Arg Gly Ala Ala Gly Gly Gly Asp Thr
195 200 205
Thr Ala Glu Glu Phe Lys Ala Met Val Val Glu Leu Met Ala Leu Ala
210 215 220
Gly Val Phe Asn Val Gly Asp Phe Ile Pro Pro Leu Lys Gly Leu Asp
225 230 235 240
Leu Gln Gly Val Val Ala Lys Met Lys Lys Leu His Gln Arg Phe Asp
245 250 255
Ala Phe Phe Ser Gly Ile Leu His Asp His Lys Ile Asn Gly Ser Asn
260 265 270
Ala Ala Glu Gly His Val Asp Leu Leu Thr Thr Leu Ile Ser Leu Lys
275 280 285
Asp Val Asp Asn Asn Gly Glu Gly Gly Lys Leu Thr Asp Thr Glu Ile
290 295 300
Lys Ala Leu Leu Leu Asn Leu Phe Thr Ala Gly Thr Asp Thr Thr Ser
305 310 315 320
Ser Thr Val Glu Trp Ala Ile Thr Glu Leu Ile Arg Asn Pro Asn Ile
325 330 335
Leu Ala Arg Val Arg Lys Glu Leu Asp Leu Ile Val Gly Lys Asp Lys
340 345 350
Leu Val Lys Glu Ser Asp Leu Gly Gln Leu Thr Tyr Leu Gln Ala Val
355 360 365
Ile Lys Glu Asn Phe Arg Leu His Pro Ser Thr Pro Leu Ser Leu Pro
370 375 380
Arg Val Ala Gln Glu Ser Cys Glu Ile Asn Gly Tyr Tyr Ile Pro Lys
385 390 395 400
Asp Ser Thr Leu Leu Val Asn Val Trp Ala Ile Gly Arg Asp Pro Asn
405 410 415
Val Trp Pro Asp Pro Leu Glu Phe Arg Pro Glu Arg Phe Leu Met Gly
420 425 430
Gly Glu Lys Pro Asn Val Asp Val Arg Gly Asn Asp Phe Glu Leu Ile
435 440 445
Pro Phe Gly Ser Gly Arg Arg Ile Cys Ala Gly Met Asn Leu Gly Ile
450 455 460
Arg Met Val Gln Leu Leu Ile Ala Thr Met Val His Ala Phe Asp Phe
465 470 475 480
Glu Leu Ala Asn Gly Gln Leu Ala Lys Asp Leu Asn Met Glu Glu Ala
485 490 495
Tyr Gly Ile Thr Leu Gln Arg Ala Asp Pro Leu Val Val His Pro Arg
500 505 510
Pro Arg Leu Ala Arg His Val Tyr Gln Ala Gln Val
515 520
<210> 2
<211> 1575
<212> DNA
<213> 人工序列
<220>
<223> SEQ ID NO:1的编码序列
<400> 2
atgtccatct ctgccgccgt ttctttgatc atctgtactt ccattttggg tgttttggtt 60
tacttcttgt tcttgagaag aggtggtggt tctaacggta gaccattgcc accaggtcca 120
agaccatggc caattgtcgg taacttgcca caattgggtc caaagccaca ccaatctatg 180
gctgccttgg ccagagttca cggtccattg atgcacttga agatgggttt cgttcacgtt 240
gttgttgccg cctccgccac cgttgctgaa aagttcttga aggttcacga caccaacttc 300
ttgtctagac caccaaactc cggtgccgaa cacattgctt acaactacaa cgacttggtt 360
ttcgctccac acggtccaag atggagattg ttgagaaaga tttgtgcctt gcacttgttc 420
tcctccaagg ccttggatga cttcagacac gttagagaag aagaagttgg tatcttgatt 480
agaaacttgg cttctgttgg tgaaatgcca gcttctatcg gtcaaatgat gtacgtttgt 540
gccactaacg ctatctctag agtcatgttg ggtagacacg ttttgggtga cgaacacaga 600
ggtgccgccg gtggtggtga taccactgct gaagaattca aggctatggt tgttgaattg 660
atggctttgg ccggtgtttt caacgttggt gatttcattc caccattgaa gggtttggac 720
ttgcaaggtg ttgttgctaa gatgaagaag ttgcaccaaa gattcgacgc tttcttctct 780
ggtatcttgc acgatcacaa gatcaacggt tctaacgccg ctgaaggtca cgttgacttg 840
ttgactactt tgatttcttt gaaggacgtt gacaacaacg gtgaaggtgg taagttgacc 900
gatactgaaa ttaaggcttt gttgttgaac ttgttcactg ctggtactga cactacttct 960
tctactgttg aatgggccat cactgaattg atcagaaacc caaacatttt ggctagagtt 1020
agaaaggaat tggacttgat cgttggtaag gataagttgg ttaaggaatc cgatttgggt 1080
caattgacct acttgcaagc cgttatcaag gaaaacttca gattgcaccc atctactcca 1140
ttgtctttgc caagagtcgc tcaagaatct tgtgaaatca acggttacta catcccaaag 1200
gattctacct tgttggtcaa cgtttgggcc atcggtagag atccaaacgt ttggccagat 1260
ccattggaat tcagaccaga aagattcttg atgggtggtg aaaagccaaa cgttgatgtt 1320
agaggtaacg atttcgaatt gattccattc ggttctggta gaagaatttg tgctggtatg 1380
aacttgggta ttagaatggt tcaattgttg attgctacta tggttcacgc tttcgatttc 1440
gaattggcta acggtcaatt ggccaaggac ttgaacatgg aagaagctta cggtattact 1500
ttgcaaagag ccgacccatt ggttgtccac ccaagaccaa gattggccag acacgtttac 1560
caagctcaag tttaa 1575
<210> 3
<211> 627
<212> PRT
<213> 黄孢原毛平革菌(Phanerochaete chrysosporium)
<400> 3
Met Ser Pro Leu Leu Ser Ala Val Pro Ala Ala Ala Leu Pro Leu Leu
1 5 10 15
Ala Ala Ala Met Tyr Val Leu Trp Thr Phe Leu Ala Leu Leu Val Arg
20 25 30
Gln Ala Arg Ser Pro Leu Arg His Leu Arg Gly Pro Pro Ser Pro Ser
35 40 45
Phe Leu Val Gly Asn Leu Arg Glu Met His Asp Gln Glu Asn Thr Ala
50 55 60
Leu Phe Ala Arg Trp Glu His Arg Tyr Gly Ser Thr Phe Val Tyr His
65 70 75 80
Gly Phe Leu Gly Gly Ala Arg Leu Leu Thr Thr Asp Pro Val Ala Val
85 90 95
Ala His Ile Leu Ala His Gly Tyr Asp Phe Pro Lys Pro Glu Phe Ile
100 105 110
Arg Asp Ala Leu Ala Ser Met Ala Ala Gly His Glu Gly Leu Leu Val
115 120 125
Val Glu Gly Asp Gly His Arg Arg Gln Arg Lys Ile Leu Ser Pro Ala
130 135 140
Phe Ala Thr Pro His Ile Lys Ser Leu Ser Pro Ile Ile Trp Ser Lys
145 150 155 160
Ala Thr Gln Leu Arg Asp Val Trp Ile Asp Leu Ala Ser Ser Pro Ser
165 170 175
Leu Thr Pro Ala Ala Thr Pro Ser Asp Pro Leu Ala His Ala Glu Glu
180 185 190
Gln Pro Ala Arg Ala Ser Gly Phe Leu Pro Asn Pro Phe Ser Ser Phe
195 200 205
Leu Ser Ser Lys Ala His Pro Arg Ser Ala Leu Pro Arg Ala Glu Ala
210 215 220
His Pro Glu Asp Arg Met Ser Ser Pro Gly Thr Lys Val Asp Val Leu
225 230 235 240
Ala Trp Leu Ala Arg Ala Thr Leu Asp Val Ile Gly Glu Ala Gly Phe
245 250 255
Gly Tyr Ala Phe Asn Ser Val Arg Ala Ala Ala Cys Pro Gly Asp Ala
260 265 270
Ala Glu Asp Glu Leu Ala Arg Ala Phe Ala Val Ile Phe Ser Thr Ala
275 280 285
Arg Lys Phe Arg Leu Ile Thr Val Leu Gln Val Trp Phe Pro Phe Leu
290 295 300
Arg Arg Phe Arg Arg Asn Ser Ala Ala Glu Asp His Ala Arg Ala Thr
305 310 315 320
Met Arg Arg Ile Gly Leu Ala Leu Ile Ala Glu Arg Arg Gln Glu Val
325 330 335
Leu Asp Asp Lys Ala His Ala Ser Gln Glu Ala Met Asp Gly Lys Asp
340 345 350
Leu Leu Thr Val Met Ile Lys Ser Ser Leu Ser Ser Asp Pro Ser Gln
355 360 365
Gln Leu Ser Thr Asn Glu Met Leu Cys Gln Ile Ala Thr Phe Leu Ala
370 375 380
Ala Gly His Glu Thr Ser Ala Ser Ala Leu Ser Trp Ala Leu Tyr Ala
385 390 395 400
Leu Ala Arg Ala Pro Ala Cys Gln His Thr Leu Arg Arg Glu Leu Arg
405 410 415
Ala Leu Thr Leu Pro Ala Asp Pro Ser Ala Ala Asp Leu Gln Ala Val
420 425 430
Leu Ala Leu Pro Tyr Leu Asp Ala Val Val Arg Glu Thr Leu Arg Val
435 440 445
His Ala Pro Val Thr Ser Thr Met Arg Val Ala Ala His Asp Ala Ala
450 455 460
Val Pro Val Gly Thr Pro Phe Arg Asp Ala His Gly Ala Gln His Ala
465 470 475 480
Ala Ile Arg Leu Arg Ala Gly Asp Val Val Thr Leu Pro Leu Gln Ala
485 490 495
Met Asn Lys Ala Arg Ala Leu Trp Gly Ala Asp Ala Ala Cys Phe Arg
500 505 510
Pro Glu Arg Trp Leu Ala His Gly Asp Ala Pro Arg Glu Pro Arg Gly
515 520 525
Leu Trp Gly Gly Val Met Thr Phe Gly Thr Gly Val Val Ala Asn Gly
530 535 540
Asn Arg Ser Cys Ile Gly Tyr Arg Phe Ala Val Asn Glu Ile Lys Leu
545 550 555 560
Phe Leu Tyr Ala Leu Val Arg Asp Ile Glu Phe Thr Ile Asp Pro Trp
565 570 575
Ile Glu Ile Glu Lys Arg Val Asn Val Val Thr Arg Pro Cys Val Lys
580 585 590
Ser Glu Pro His Leu Gly Asn Gln Met Pro Leu Arg Leu Arg Arg Val
595 600 605
Ala Val Glu Glu Thr Val Gly Asp Ser Ser Gly Asp Gly Ala Pro Arg
610 615 620
Thr Val Ser
625
<210> 4
<211> 1884
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:3的编码序列
<400> 4
atgtccccat tgttgtctgc cgttccagcc gccgctttgc cattgttggc cgccgctatg 60
tacgttttgt ggactttctt ggctttgttg gttagacaag ccagatcccc attgagacac 120
ttgagaggtc caccatctcc atctttcttg gtcggtaact tgagagaaat gcacgaccaa 180
gaaaacaccg ctttgttcgc tagatgggaa cacagatacg gttctacctt cgtctaccac 240
ggtttcttgg gtggtgccag attgttgacc accgacccag tcgccgtcgc ccacatcttg 300
gcccacggtt acgacttccc aaagccagaa ttcatcagag atgccttggc ttctatggcc 360
gccggtcacg aaggtttgtt ggtcgtcgaa ggtgacggtc acaggagaca aagaaagatc 420
ttgtccccag ctttcgccac tccacacatc aagtctttgt ctccaatcat ctggtctaag 480
gctactcaat tgagagatgt ttggattgac ttggcctctt ctccatcctt gactccagct 540
gctaccccat ccgacccatt ggctcacgct gaagaacaac cagctagagc ttctggtttc 600
ttgccaaacc cattctcttc tttcttgtca tctaaggctc acccaagatc cgctttgcca 660
agagctgaag ctcacccaga agatagaatg tcctctccag gtaccaaggt cgacgttttg 720
gcttggttgg ctagagccac tttggacgtc atcggtgaag ccggtttcgg ttacgctttc 780
aactctgtca gagccgctgc ttgtccaggt gacgccgctg aagatgaatt ggctagagct 840
ttcgctgtca tcttctctac tgctagaaag ttcagattga tcactgtctt gcaagtttgg 900
ttcccattct tgagaagatt cagaagaaac tctgctgctg aagatcacgc tagagctact 960
atgagaagaa tcggtttggc tttgatcgct gaaaggagac aagaagtctt ggacgacaag 1020
gctcacgcct ctcaagaagc tatggatggt aaggacttgt tgactgtcat gatcaagtca 1080
tctttgtcat ccgatccatc tcaacaattg tctactaacg aaatgttgtg tcaaatcgct 1140
actttcttgg ctgctggtca cgaaacctct gcttctgctt tgtcttgggc cttgtacgcc 1200
ttggctagag ctccagcttg tcaacacact ttgagaagag aattgagagc tttgactttg 1260
ccagctgacc catctgccgc tgacttgcaa gctgttttgg ctttgccata cttggacgcc 1320
gtcgttagag aaactttgag agttcacgct ccagttactt ctactatgag agtcgctgct 1380
cacgacgccg ctgttccagt cggtactcca ttcagagatg ctcacggtgc tcaacacgcc 1440
gctatcagat tgagagctgg tgacgtcgtc actttgccat tgcaagctat gaacaaggcc 1500
agagctttgt ggggtgccga cgccgcttgt ttcagaccag aaagatggtt ggctcacggt 1560
gacgccccaa gagaaccaag aggtttgtgg ggtggtgtca tgactttcgg taccggtgtc 1620
gtcgctaacg gtaacagatc ttgtattggt tacagattcg ctgttaacga aatcaagttg 1680
ttcttgtacg ccttggttag agacatcgaa ttcactatcg acccatggat cgaaatcgaa 1740
aagagagtta acgtcgtcac cagaccatgt gtcaagtccg aaccacactt gggtaaccaa 1800
atgccattga gattgagaag agtcgctgtt gaagaaactg ttggtgattc ttctggtgac 1860
ggtgctccaa gaactgtttc ttaa 1884
<210> 5
<211> 513
<212> PRT
<213> 矮牵牛(Petunia x hybrida)
<400> 5
Met Ser Glu Ile Leu Ser Leu Ile Leu Tyr Thr Val Ile Phe Ser Phe
1 5 10 15
Leu Leu Gln Phe Ile Leu Arg Ser Phe Phe Arg Lys Arg Tyr Pro Leu
20 25 30
Pro Leu Pro Pro Gly Pro Lys Pro Trp Pro Ile Ile Gly Asn Leu Val
35 40 45
His Leu Gly Pro Lys Pro His Gln Ser Thr Ala Ala Met Ala Gln Thr
50 55 60
Tyr Gly Pro Leu Met Tyr Leu Lys Met Gly Phe Val Asp Val Val Val
65 70 75 80
Ala Ala Ser Ala Ser Val Ala Ala Gln Phe Leu Lys Thr His Asp Ala
85 90 95
Asn Phe Ser Ser Arg Pro Pro Asn Ser Gly Ala Glu His Met Ala Tyr
100 105 110
Asn Tyr Gln Asp Leu Val Phe Ala Pro Tyr Gly Pro Arg Trp Arg Met
115 120 125
Leu Arg Lys Ile Cys Ser Val His Leu Phe Ser Thr Lys Ala Leu Asp
130 135 140
Asp Phe Arg His Val Arg Gln Asp Glu Val Lys Thr Leu Thr Arg Ala
145 150 155 160
Leu Ala Ser Ala Gly Gln Lys Pro Val Lys Leu Gly Gln Leu Leu Asn
165 170 175
Val Cys Thr Thr Asn Ala Leu Ala Arg Val Met Leu Gly Lys Arg Val
180 185 190
Phe Ala Asp Gly Ser Gly Asp Val Asp Pro Gln Ala Ala Glu Phe Lys
195 200 205
Ser Met Val Val Glu Met Met Val Val Ala Gly Val Phe Asn Ile Gly
210 215 220
Asp Phe Ile Pro Gln Leu Asn Trp Leu Asp Ile Gln Gly Val Ala Ala
225 230 235 240
Lys Met Lys Lys Leu His Ala Arg Phe Asp Ala Phe Leu Thr Asp Ile
245 250 255
Leu Glu Glu His Lys Gly Lys Ile Phe Gly Glu Met Lys Asp Leu Leu
260 265 270
Ser Thr Leu Ile Ser Leu Lys Asn Asp Asp Ala Asp Asn Asp Gly Gly
275 280 285
Lys Leu Thr Asp Thr Glu Ile Lys Ala Leu Leu Leu Asn Leu Phe Val
290 295 300
Ala Gly Thr Asp Thr Ser Ser Ser Thr Val Glu Trp Ala Ile Ala Glu
305 310 315 320
Leu Ile Arg Asn Pro Lys Ile Leu Ala Gln Ala Gln Gln Glu Ile Asp
325 330 335
Lys Val Val Gly Arg Asp Arg Leu Val Gly Glu Leu Asp Leu Ala Gln
340 345 350
Leu Thr Tyr Leu Glu Ala Ile Val Lys Glu Thr Phe Arg Leu His Pro
355 360 365
Ser Thr Pro Leu Ser Leu Pro Arg Ile Ala Ser Glu Ser Cys Glu Ile
370 375 380
Asn Gly Tyr Phe Ile Pro Lys Gly Ser Thr Leu Leu Leu Asn Val Trp
385 390 395 400
Ala Ile Ala Arg Asp Pro Asn Ala Trp Ala Asp Pro Leu Glu Phe Arg
405 410 415
Pro Glu Arg Phe Leu Pro Gly Gly Glu Lys Pro Lys Val Asp Val Arg
420 425 430
Gly Asn Asp Phe Glu Val Ile Pro Phe Gly Ala Gly Arg Arg Ile Cys
435 440 445
Ala Gly Met Asn Leu Gly Ile Arg Met Val Gln Leu Met Ile Ala Thr
450 455 460
Leu Ile His Ala Phe Asn Trp Asp Leu Val Ser Gly Gln Leu Pro Glu
465 470 475 480
Met Leu Asn Met Glu Glu Ala Tyr Gly Leu Thr Leu Gln Arg Ala Asp
485 490 495
Pro Leu Val Val His Pro Arg Pro Arg Leu Glu Ala Gln Ala Tyr Ile
500 505 510
Gly
<210> 6
<211> 1542
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:5的编码序列
<400> 6
atgtccgaaa tcttgtcttt gattttgtac accgtcattt tctctttctt gttgcaattc 60
attttgagat ctttcttcag aaagagatac ccattgccat tgccaccagg tccaaagcca 120
tggccaatta tcggtaactt ggtccacttg ggtccaaagc cacaccaatc tactgctgcc 180
atggctcaaa cttacggtcc attgatgtac ttgaagatgg gtttcgttga cgttgttgtt 240
gctgcctctg cttctgttgc tgctcaattc ttaaagactc acgatgctaa cttctcttct 300
agaccaccaa actctggtgc tgaacacatg gcttacaact accaagattt ggttttcgct 360
ccatacggtc caagatggag aatgttgaga aagatttgtt ctgttcactt gttctctacc 420
aaggctttgg atgacttcag acacgtcaga caagatgaag ttaagacttt gactagagct 480
ttggcttctg ctggtcaaaa gccagtcaag ttgggtcaat tgttgaacgt ttgtactact 540
aacgctttgg ctagagttat gttgggtaag agagttttcg ccgacggttc tggtgatgtt 600
gatccacaag ctgctgaatt caagtctatg gttgttgaaa tgatggttgt cgccggtgtt 660
ttcaacattg gtgatttcat tccacaattg aactggttgg atattcaagg tgttgccgct 720
aagatgaaga agttgcacgc tagattcgac gctttcttga ctgatatctt ggaagaacac 780
aagggtaaga ttttcggtga aatgaaggat ttgttgtcta ctttgatctc tttgaagaac 840
gatgatgctg ataacgatgg tggtaagttg actgatactg aaattaaggc tttgttgttg 900
aacttgttcg ttgctggtac tgacacttct tcttctactg ttgaatgggc cattgctgaa 960
ttgattagaa acccaaagat cttggcccaa gcccaacaag aaatcgacaa ggtcgttggt 1020
agagacagat tggttggtga attggacttg gcccaattga cttacttgga agctatcgtc 1080
aaggaaacct tcagattgca cccatctacc ccattgtctt tgccaagaat tgcttctgaa 1140
tcttgtgaaa tcaacggtta cttcattcca aagggttcta ctttgttgtt gaacgtttgg 1200
gccattgcta gagatccaaa cgcttgggct gatccattgg aattcagacc agaaagattc 1260
ttgccaggtg gtgaaaagcc aaaggttgat gtcagaggta acgacttcga agtcatccca 1320
ttcggtgctg gtagaagaat ttgtgctggt atgaacttgg gtatcagaat ggtccaattg 1380
atgattgcta ctttgatcca cgctttcaac tgggatttgg tatctggtca attgccagaa 1440
atgttgaaca tggaagaagc ttacggtttg accttgcaaa gagctgatcc attggttgtt 1500
cacccaagac caagattgga agcccaagct tacattggtt aa 1542
<210> 7
<211> 519
<212> PRT
<213> 翠菊(Callistephus chinensis)
<400> 7
Met Ser Thr Ile Leu Pro Phe Ile Phe Tyr Thr Cys Ile Thr Ala Leu
1 5 10 15
Val Leu Tyr Val Leu Leu Asn Leu Leu Thr Arg Asn Pro Asn Arg Leu
20 25 30
Pro Pro Gly Pro Thr Pro Trp Pro Ile Val Gly Asn Leu Pro His Leu
35 40 45
Gly Met Ile Pro His His Ser Leu Ala Ala Leu Ala Gln Lys Tyr Gly
50 55 60
Pro Leu Met His Leu Arg Leu Gly Phe Val Asp Val Val Val Ala Ala
65 70 75 80
Ser Ala Ser Val Ala Ala Gln Phe Leu Lys Thr His Asp Ala Asn Phe
85 90 95
Ala Ser Arg Pro Pro Asn Ser Gly Ala Lys His Ile Ala Tyr Asn Tyr
100 105 110
Gln Asp Leu Val Phe Ala Pro Tyr Gly Pro Arg Trp Arg Met Leu Arg
115 120 125
Lys Ile Cys Ser Val His Leu Phe Ser Thr Lys Ala Leu Asp Asp Phe
130 135 140
Arg His Val Arg Glu Glu Glu Val Ala Ile Leu Thr Arg Val Leu Val
145 150 155 160
His Ala Gly Glu Ser Ala Val Lys Leu Gly Gln Leu Leu Asn Val Cys
165 170 175
Thr Thr Asn Ala Leu Ala Arg Val Met Leu Gly Arg Arg Val Phe Ala
180 185 190
Asp Gly Ser Glu Gly Arg Gly Val Asp Pro Lys Ala Asp Glu Phe Lys
195 200 205
Asp Met Val Val Glu Leu Met Glu Leu Ala Gly Glu Phe Asn Ile Gly
210 215 220
Asp Phe Ile Pro Pro Leu Asp Cys Leu Asp Leu Gln Gly Ile Thr Lys
225 230 235 240
Lys Met Lys Lys Leu His Ala Arg Phe Asp Lys Phe Leu Asn Ile Ile
245 250 255
Leu Asp Asp His Lys Ile Glu Lys Gly Ala Ala Gly Arg Arg His Ser
260 265 270
Asp Leu Leu Thr Thr Leu Ile Ser Leu Lys Asp Val Asp Ala Ala Asp
275 280 285
Asp Asp Glu Glu Gly Lys Leu Ser Asp Ile Glu Ile Lys Ala Leu Leu
290 295 300
Leu Asn Leu Phe Ala Ala Gly Thr Asp Thr Ser Ser Ser Thr Val Glu
305 310 315 320
Trp Ala Val Ala Glu Leu Ile Arg His Pro Glu Leu Leu Lys Gln Ala
325 330 335
Arg Glu Glu Met Asp Ile Val Val Gly Arg Asp Arg Leu Val Thr Glu
340 345 350
Leu Asp Leu Ser Arg Leu Thr Phe Leu Gln Ala Ile Val Lys Glu Thr
355 360 365
Phe Arg Leu His Pro Ser Thr Pro Leu Ser Leu Pro Arg Met Ala Ser
370 375 380
Glu Ser Cys Glu Val Asp Gly Tyr Tyr Ile Pro Lys Gly Ser Thr Leu
385 390 395 400
Leu Val Asn Val Trp Ala Ile Ala Arg Asp Pro Lys Met Trp Thr Asn
405 410 415
Pro Leu Glu Phe Arg Pro Ser Arg Phe Leu Pro Gly Gly Glu Lys Pro
420 425 430
Asp Ala Asp Ile Lys Gly Asn Asp Phe Glu Val Ile Pro Phe Gly Ala
435 440 445
Gly Arg Arg Ile Cys Ala Gly Met Ser Leu Gly Met Arg Met Val Gln
450 455 460
Leu Leu Ile Ala Thr Leu Val Gln Thr Phe Asp Trp Glu Leu Ala Asn
465 470 475 480
Gly Leu Asp Pro Glu Lys Leu Asn Met Glu Glu Ala Tyr Gly Leu Thr
485 490 495
Leu Gln Arg Ala Glu Pro Leu Met Val His Pro Arg Pro Arg Leu Ser
500 505 510
Pro His Val Tyr Glu Ser Arg
515
<210> 8
<211> 1560
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:7的编码序列
<400> 8
atgtccacca ttttgccatt cattttctac acttgtatca ctgccttggt tttgtacgtt 60
ttgttgaact tgttgaccag aaacccaaac agattgccac caggtccaac cccatggcca 120
atcgttggta acttgccaca cttgggtatg atcccacacc actctttggc tgccttggcc 180
caaaagtacg gtccattgat gcacttgaga ttgggtttcg ttgacgttgt cgttgccgct 240
tctgcttccg ttgctgctca attcttaaag actcacgacg ctaacttcgc ttctagacca 300
ccaaactctg gtgccaagca cattgcctac aactaccaag atttggtttt cgctccatac 360
ggtccaagat ggagaatgtt gagaaagatt tgttctgttc acttgttctc cactaaggct 420
ttggacgact tcagacacgt tagagaagaa gaagttgcta tcttgactag agttttggtc 480
cacgctggtg aatctgctgt taagttgggt caattgttga acgtttgtac cactaacgct 540
ttggctagag ttatgttggg tagaagagtt ttcgctgacg gttctgaagg tagaggtgtc 600
gacccaaagg ctgatgaatt caaggacatg gttgttgaat tgatggaatt ggccggtgaa 660
ttcaacatcg gtgacttcat cccaccattg gactgtttgg atttgcaagg tatcaccaag 720
aagatgaaga agttgcacgc tagattcgac aagttcttga acatcatctt ggacgaccac 780
aagatcgaaa agggtgctgc cggtagaagg cactctgact tgttgaccac tttgatttct 840
ttgaaggatg ttgatgctgc tgatgatgat gaagaaggta agttgtctga cattgaaatc 900
aaggctttgt tgttgaactt gttcgctgct ggtactgaca cttcttcttc taccgttgaa 960
tgggctgttg ccgaattgat tagacaccca gaattgttga agcaagctag agaagaaatg 1020
gatatcgttg ttggtagaga cagattggtt accgaattgg acttgtctag attgactttc 1080
ttgcaagcca ttgttaagga aaccttcaga ttgcacccat ctactccatt gtccttgcca 1140
agaatggctt ctgaatcttg tgaagttgat ggttactaca ttccaaaggg ttccactttg 1200
ttggttaacg tttgggccat cgccagagat ccaaagatgt ggactaaccc attggaattc 1260
agaccatcta gattcttgcc aggtggtgaa aagccagatg ctgatatcaa gggtaacgat 1320
ttcgaagtca tcccattcgg tgccggtaga agaatctgtg ctggtatgtc tttgggtatg 1380
agaatggtcc aattgttgat tgctactttg gtccaaacct tcgattggga attggctaac 1440
ggtttggacc cagaaaagtt gaacatggaa gaagcttacg gtttgacctt gcaaagagct 1500
gaaccattga tggttcaccc aagaccaaga ttgtctccac acgtttacga atctagataa 1560
<210> 9
<211> 511
<212> PRT
<213> 翠菊(Callistephus chinensis)
<400> 9
Met Ser Ser Ile Leu Ser Leu Leu Val Tyr Phe Cys Ile Ser Leu Leu
1 5 10 15
Val Ile Ile Ala Leu Val Asn Met Phe Ile Thr Arg His Thr Asn Arg
20 25 30
Leu Pro Pro Gly Pro Ala Pro Trp Pro Val Val Gly Asn Leu Pro His
35 40 45
Leu Gly Ala Ile Pro His His Thr Leu Ala Ala Leu Ala Thr Lys Tyr
50 55 60
Gly Pro Leu Val Tyr Leu Arg Leu Gly Phe Val His Val Val Val Ala
65 70 75 80
Ser Ser Pro Ser Val Ala Ala Gln Phe Leu Lys Val His Asp Leu Lys
85 90 95
Phe Ala Ser Arg Pro Pro Asn Ser Gly Ala Lys His Ile Ala Tyr Asn
100 105 110
Tyr Gln Asp Met Val Phe Ala Pro Tyr Gly Pro Gln Trp Thr Met Phe
115 120 125
Arg Lys Ile Cys Lys Asp His Leu Phe Ser Ser Lys Ala Leu Asp Asp
130 135 140
Phe Arg His Val Arg Gln Glu Glu Val Ala Ile Leu Ala Arg Gly Leu
145 150 155 160
Ala Gly Ala Gly Arg Ser Lys Val Asn Leu Gly Gln Gln Leu Asn Met
165 170 175
Cys Thr Ala Asn Thr Leu Ala Arg Met Met Leu Asp Lys Arg Val Phe
180 185 190
Gly Asn Glu Ser Gly Gly Asp Asp Pro Lys Ala Asn Glu Phe Lys Glu
195 200 205
Met Ala Thr Glu Leu Met Phe Leu Ala Gly Gln Phe Asn Ile Gly Asp
210 215 220
Tyr Ile Pro Val Leu Asp Trp Leu Asp Leu Gln Gly Ile Val Lys Lys
225 230 235 240
Met Lys Lys Leu His Thr Arg Phe Asp Lys Phe Leu Asp Val Ile Leu
245 250 255
Asp Glu His Lys Val Ile Ala Ser Gly His Ile Asp Met Leu Ser Thr
260 265 270
Leu Ile Ser Leu Lys Asp Asp Thr Ser Val Asp Gly Arg Lys Pro Ser
275 280 285
Asp Ile Glu Ile Lys Ala Leu Leu Leu Glu Leu Phe Val Ala Gly Thr
290 295 300
Asp Thr Ser Ser Asn Thr Val Glu Trp Ala Ile Ala Glu Leu Ile Arg
305 310 315 320
Gln Pro His Leu Leu Lys Arg Ala Gln Glu Glu Met Asp Ser Val Val
325 330 335
Gly Gln Asn Arg Leu Val Thr Glu Met Asp Leu Ser Gln Leu Thr Phe
340 345 350
Leu Gln Ala Ile Val Lys Glu Ala Phe Arg Leu His Pro Ser Thr Pro
355 360 365
Leu Ser Leu Pro Arg Ile Ala Ser Glu Ser Cys Glu Val Asp Gly Tyr
370 375 380
Tyr Ile Pro Lys Gly Ser Thr Leu Leu Val Asn Ile Trp Ala Ile Gly
385 390 395 400
Arg His Pro Glu Val Trp Thr Asp Pro Leu Glu Phe Arg Pro Thr Arg
405 410 415
Phe Leu Pro Gly Gly Glu Lys Pro Gly Ile Val Val Lys Val Asn Asp
420 425 430
Phe Glu Val Leu Pro Phe Gly Ala Gly Arg Arg Ile Cys Ala Gly Met
435 440 445
Ser Leu Ala Leu Arg Thr Val Gln Leu Leu Met Gly Thr Leu Val Gln
450 455 460
Ala Phe Asp Trp Glu Leu Ala Asn Gly Ile Lys Pro Glu Lys Leu Asn
465 470 475 480
Met Asp Glu Ala Phe Gly Leu Ser Val Gln Arg Ala Glu Pro Leu Val
485 490 495
Val His Pro Arg Pro Arg Leu Pro Pro His Val Tyr Lys Ser Gly
500 505 510
<210> 10
<211> 1536
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:9的编码序列
<400> 10
atgtcctcta ttttgtcttt gttggtctac ttctgtatct ctttgttggt tatcattgct 60
ttggttaaca tgttcatcac cagacacacc aacagattgc caccaggtcc agccccatgg 120
ccagtcgtcg gtaacttgcc acacttgggt gctattccac accacacttt ggctgctttg 180
gctactaagt acggtccatt ggtttacttg agattgggtt tcgttcacgt tgttgttgcc 240
tcttctccat ccgttgctgc tcaattcttg aaggttcacg acttgaagtt cgcctctaga 300
ccaccaaact ctggtgctaa gcacatcgct tacaactacc aagatatggt tttcgctcca 360
tacggtccac aatggactat gttcagaaag atttgtaagg atcacttgtt ctcttctaag 420
gctttggatg atttcagaca cgttagacaa gaagaagttg ctatcttggc tagaggtttg 480
gctggtgctg gtagatctaa ggttaacttg ggtcaacaat tgaacatgtg taccgctaac 540
actttggcta gaatgatgtt ggacaagaga gttttcggta acgaatctgg tggtgatgat 600
ccaaaggcta acgaattcaa ggaaatggct actgaattga tgttcttggc tggtcaattc 660
aacattggtg actacatccc agttttggac tggttggact tgcaaggtat tgttaagaag 720
atgaagaagt tgcacactag attcgataag ttcttggacg ttatcttgga tgaacacaag 780
gttatcgctt ctggtcacat cgacatgttg tctactttga tttctttgaa ggatgatacc 840
tctgttgacg gtagaaagcc atccgacatc gaaatcaagg ctttgttgtt ggaattgttc 900
gttgctggta ctgacacttc ttctaacacc gttgaatggg ctatcgctga attgattaga 960
caaccacact tgttgaagag agcccaagaa gaaatggact ctgttgttgg tcaaaacaga 1020
ttggttaccg aaatggactt gtctcaattg actttcttgc aagccattgt taaggaagcc 1080
ttcagattgc acccatctac tccattgtcc ttgccaagaa ttgcttccga atcttgtgaa 1140
gttgatggtt actacatccc aaagggttcc actttgttgg ttaacatctg ggccattggt 1200
agacacccag aagtttggac cgacccattg gaattcagac caactagatt cttgccaggt 1260
ggtgaaaagc caggtattgt cgtcaaggtt aacgatttcg aagtcttgcc attcggtgcc 1320
ggtagaagaa tctgtgctgg tatgtctttg gccttgagaa ctgtccaatt gttgatgggt 1380
actttggtcc aagccttcga ttgggaattg gctaacggta tcaagccaga aaagttgaac 1440
atggacgaag ccttcggttt gtctgttcaa agagctgaac cattggttgt tcacccaaga 1500
ccaagattgc caccacacgt ttacaagtct ggttaa 1536
<210> 11
<211> 513
<212> PRT
<213> 非洲菊(Gerbera hybrida)
<400> 11
Met Ser Thr Pro Leu Thr Leu Leu Ile Gly Thr Cys Val Thr Gly Leu
1 5 10 15
Phe Leu Tyr Val Leu Leu Asn Arg Cys Thr Arg Asn Pro Asn Arg Leu
20 25 30
Pro Pro Gly Pro Thr Pro Trp Pro Val Val Gly Asn Leu Pro His Leu
35 40 45
Gly Thr Ile Pro His His Ser Leu Ala Ala Met Ala Lys Lys Tyr Gly
50 55 60
Pro Leu Met His Leu Arg Leu Gly Phe Val Asp Val Val Val Ala Ala
65 70 75 80
Ser Ala Ser Val Ala Ala Gln Phe Leu Lys Thr His Asp Ala Asn Phe
85 90 95
Ala Asp Arg Pro Pro Asn Ser Gly Ala Lys His Ile Ala Tyr Asn Tyr
100 105 110
Gln Asp Leu Val Phe Ala Pro Tyr Gly Pro Arg Trp Arg Met Leu Arg
115 120 125
Lys Ile Cys Ser Val His Leu Phe Ser Thr Lys Ala Leu Asp Asp Phe
130 135 140
Arg His Val Arg Gln Glu Glu Val Ala Ile Leu Ala Arg Ala Leu Val
145 150 155 160
Gly Ala Gly Lys Ser Pro Val Lys Leu Gly Gln Leu Leu Asn Val Cys
165 170 175
Thr Thr Asn Ala Leu Ala Arg Val Met Leu Gly Arg Arg Val Phe Asp
180 185 190
Ser Gly Asp Ala Gln Ala Asp Glu Phe Lys Asp Met Val Val Glu Leu
195 200 205
Met Val Leu Ala Gly Glu Phe Asn Ile Gly Asp Phe Ile Pro Val Leu
210 215 220
Asp Trp Leu Asp Leu Gln Gly Val Thr Lys Lys Met Lys Lys Leu His
225 230 235 240
Ala Lys Phe Asp Ser Phe Leu Asn Thr Ile Leu Glu Glu His Lys Thr
245 250 255
Gly Ala Gly Asp Gly Val Ala Ser Gly Lys Val Asp Leu Leu Ser Thr
260 265 270
Leu Ile Ser Leu Lys Asp Asp Ala Asp Gly Glu Gly Gly Lys Leu Ser
275 280 285
Asp Ile Glu Ile Lys Ala Leu Leu Leu Asn Leu Phe Thr Ala Gly Thr
290 295 300
Asp Thr Ser Ser Ser Thr Ile Glu Trp Ala Ile Ala Glu Leu Ile Arg
305 310 315 320
Asn Pro Gln Leu Leu Asn Gln Ala Arg Lys Glu Met Asp Thr Ile Val
325 330 335
Gly Gln Asp Arg Leu Val Thr Glu Ser Asp Leu Gly Gln Leu Thr Phe
340 345 350
Leu Gln Ala Ile Ile Lys Glu Thr Phe Arg Leu His Pro Ser Thr Pro
355 360 365
Leu Ser Leu Pro Arg Met Ala Leu Glu Ser Cys Glu Val Gly Gly Tyr
370 375 380
Tyr Ile Pro Lys Gly Ser Thr Leu Leu Val Asn Val Trp Ala Ile Ser
385 390 395 400
Arg Asp Pro Lys Ile Trp Ala Asp Pro Leu Glu Phe Gln Pro Thr Arg
405 410 415
Phe Leu Pro Gly Gly Glu Lys Pro Asn Thr Asp Ile Lys Gly Asn Asp
420 425 430
Phe Glu Val Ile Pro Phe Gly Ala Gly Arg Arg Ile Cys Val Gly Met
435 440 445
Ser Leu Gly Leu Arg Met Val Gln Leu Leu Thr Ala Thr Leu Ile His
450 455 460
Ala Phe Asp Trp Glu Leu Ala Asp Gly Leu Asn Pro Lys Lys Leu Asn
465 470 475 480
Met Glu Glu Ala Tyr Gly Leu Thr Leu Gln Arg Ala Ala Pro Leu Val
485 490 495
Val His Pro Arg Pro Arg Leu Ala Pro His Val Tyr Glu Thr Thr Lys
500 505 510
Val
<210> 12
<211> 1542
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:11的编码序列
<400> 12
atgtccactc cattgacttt gttgatcggt acctgtgtca ctggtttgtt cttgtacgtt 60
ttgttgaaca gatgtaccag aaacccaaac agattgccac caggtccaac tccatggcca 120
gtcgtcggta acttgccaca cttgggtact atcccacacc actctttggc tgctatggct 180
aagaagtacg gtccattgat gcacttgaga ttgggtttcg tcgacgtcgt tgttgccgcc 240
tccgcctccg tcgccgctca attcttaaag actcacgacg ctaacttcgc cgatagacca 300
ccaaactccg gtgccaagca catcgcttac aactaccaag atttggtttt cgctccatac 360
ggtccaagat ggagaatgtt gagaaagatt tgttctgttc acttgttctc caccaaggct 420
ttggatgatt tcagacacgt cagacaagaa gaagttgcta tcttggctag agctttggtc 480
ggtgccggta agtctccagt taagttgggt caattgttga acgtttgtac cactaacgct 540
ttggctagag ttatgttggg tagaagagtt ttcgactccg gtgatgctca agctgatgaa 600
ttcaaggaca tggttgttga attgatggtt ttggccggtg aattcaacat cggtgacttc 660
atcccagttt tggactggtt ggacttgcaa ggtgttacta agaagatgaa gaagttgcac 720
gctaagttcg actctttctt gaacactatc ttggaagaac acaagaccgg tgccggtgac 780
ggtgtcgctt ctggtaaggt tgacttgttg tctactttga tttctttgaa ggatgacgct 840
gatggtgaag gtggtaagtt gtctgacatt gaaatcaagg ctttgttgtt gaacttgttc 900
actgctggta ctgacacttc ttcttctact attgaatggg ctatcgctga attgattaga 960
aacccacaat tgttgaacca agccagaaag gaaatggaca ccatcgttgg tcaagacaga 1020
ttggttaccg aatctgactt gggtcaattg actttcttgc aagccattat caaggaaact 1080
ttcagattgc acccatctac cccattgtct ttgccaagaa tggctttgga atcttgtgaa 1140
gttggtggtt actacatccc aaagggttcc actttgttgg ttaacgtttg ggccatttct 1200
agagatccaa agatttgggc cgatccattg gaattccaac caactagatt cttgccaggt 1260
ggtgaaaagc caaacactga tatcaagggt aacgatttcg aagtcatccc attcggtgcc 1320
ggtagaagaa tttgtgtcgg tatgtctttg ggtttgagaa tggtccaatt gttgactgct 1380
accttgatcc acgccttcga ttgggaattg gctgatggtt tgaacccaaa gaagttgaac 1440
atggaagaag cttacggttt gaccttgcaa agagccgctc cattggttgt tcacccaaga 1500
ccaagattgg ccccacacgt ttacgaaact actaaggtct aa 1542
<210> 13
<211> 515
<212> PRT
<213> 蓝眼菊(Osteospermum hybrid cultivar)
<400> 13
Met Ser Thr Ile Leu Pro Leu Val Leu Tyr Ser Cys Ile Thr Gly Leu
1 5 10 15
Val Ile Tyr Val Leu Leu Asn Leu Arg Thr Arg His Ser Asn Arg Leu
20 25 30
Pro Pro Gly Pro Thr Pro Trp Pro Ile Val Gly Asn Leu Pro His Leu
35 40 45
Gly Val Val Pro His His Ser Leu Ala Ala Met Ala Glu Lys Tyr Gly
50 55 60
Pro Leu Met His Leu Arg Leu Gly Phe Val Asp Val Val Val Ala Ala
65 70 75 80
Ser Ala Ala Val Ala Ala Gln Phe Leu Lys Val His Asp Ala Asn Phe
85 90 95
Ala Ser Arg Pro Pro Asn Ser Gly Ala Lys His Ile Ala Tyr Asn Tyr
100 105 110
Gln Asp Leu Val Phe Ala Pro Tyr Tyr Gly Pro Arg Trp Arg Met Leu
115 120 125
Arg Lys Ile Cys Ser Val His Leu Phe Ser Ser Lys Ala Leu Asp Asp
130 135 140
Phe Arg His Val Arg Gln Glu Glu Val Ala Ile Leu Thr Arg Ala Leu
145 150 155 160
Ile Gly Ala Gly Asp Ser Pro Val Lys Leu Gly Gln Leu Leu Asn Val
165 170 175
Cys Thr Thr Asn Ala Leu Ala Arg Val Met Leu Gly Lys Arg Val Phe
180 185 190
Gly Asp Arg Ser Gly Gly Gly Asp Pro Lys Ala Asp Glu Phe Lys Asp
195 200 205
Met Val Val Glu Val Met Glu Leu Ala Gly Glu Phe Asn Ile Gly Asp
210 215 220
Phe Ile Pro Val Leu Asp Ser Leu Asp Leu Gln Gly Ile Ala Lys Lys
225 230 235 240
Met Lys Glu Leu His Val Arg Phe Asp Ser Phe Leu Gly Lys Ile Leu
245 250 255
Glu Glu His Lys Thr Gly Asn Gly Gly Ala Ser Ser Gln His Thr Asp
260 265 270
Leu Leu Thr Thr Leu Ile Ser Leu Lys Asp Asp Thr Asp Glu Glu Gly
275 280 285
Gly Lys Leu Ser Asp Ile Glu Ile Lys Ala Leu Leu Leu Asn Leu Phe
290 295 300
Thr Ala Gly Thr Asp Thr Ser Ser Ser Thr Val Glu Trp Ala Ile Ala
305 310 315 320
Glu Leu Ile Arg His Pro Gln Leu Leu Lys Gln Ala Gln Glu Glu Ile
325 330 335
Asp Asn Val Val Gly Arg Asp His Leu Val Thr Glu Leu Asp Leu Thr
340 345 350
Gln Leu Pro Phe Leu Gln Ala Ile Val Lys Glu Thr Phe Arg Leu His
355 360 365
Pro Ser Thr Pro Leu Ser Leu Pro Arg Ile Ala Ser Glu Ser Cys Glu
370 375 380
Val Asn Gly Tyr His Ile Pro Lys Gly Ser Thr Leu Leu Val Asn Val
385 390 395 400
Trp Ala Ile Ala Arg Asp Pro Lys Met Trp Ser Glu Pro Leu Glu Phe
405 410 415
Arg Pro Ala Arg Phe Leu Pro Gly Gly Glu Lys Pro Asp Ala Asp Val
420 425 430
Lys Gly Asn Asp Phe Glu Val Ile Pro Phe Gly Ala Gly Arg Arg Ser
435 440 445
Cys Ala Gly Met Ser Leu Gly Leu Arg Met Val Gln Leu Leu Val Ala
450 455 460
Thr Leu Val Gln Thr Phe Asp Trp Glu Leu Ala Asn Gly Leu Lys Pro
465 470 475 480
Glu Lys Leu Asn Met Glu Glu Ala Tyr Gly Leu Thr Leu Gln Arg Ala
485 490 495
Ala Pro Leu Leu Val His Pro Lys Pro Arg Leu Ala Pro His Val Tyr
500 505 510
Gly Ser Asn
515
<210> 14
<211> 1548
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:13的编码序列
<400> 14
atgtccacca ttttgccatt ggttttgtac tcttgtatca ctggtttggt tatctacgtt 60
ttgttgaact tgagaaccag acactctaac agattgccac caggtccaac tccatggcca 120
atcgtcggta acttgccaca cttgggtgtt gttccacacc actctttggc tgctatggct 180
gaaaagtacg gtccattgat gcacttgaga ttgggtttcg ttgacgttgt tgttgctgct 240
tctgctgccg ttgctgctca attcttgaag gttcacgatg ctaacttcgc ttctagacca 300
ccaaactccg gtgctaagca catcgcttac aactaccaag acttggtttt cgctccatac 360
tacggtccaa gatggagaat gttgagaaag atttgttccg ttcacttgtt ctcttctaag 420
gctttggatg atttcagaca cgtcagacaa gaagaagttg ctatcttgac tagagctttg 480
atcggtgccg gtgactctcc agttaagttg ggtcaattgt tgaacgtttg tactactaac 540
gctttggcta gagttatgtt gggtaagaga gttttcggtg acagatctgg tggtggtgat 600
ccaaaggctg atgaattcaa ggatatggtt gttgaagtta tggaattggc cggtgaattc 660
aacatcggtg atttcatccc agttttggat tctttggatt tgcaaggtat cgctaagaag 720
atgaaggaat tgcacgttag attcgattct ttcttgggta agatcttgga agaacacaag 780
accggtaacg gtggtgcttc ttctcaacac actgacttgt tgactacctt gatttctttg 840
aaggatgata ctgatgaaga aggtggtaag ttgtctgaca ttgaaatcaa ggctttgttg 900
ttgaacttgt tcactgctgg tactgacact tcttcttcta ccgttgaatg ggctatcgcc 960
gaattgatta gacacccaca attgttgaag caagcccaag aagaaatcga caacgttgtt 1020
ggtagagatc acttggttac cgaattggac ttgacccaat tgccattctt gcaagccatt 1080
gttaaggaaa ccttcagatt gcacccatct actccattgt ctttgccaag aattgcttcc 1140
gaatcttgtg aagtcaacgg ttaccacatc ccaaagggtt ccactttgtt ggttaacgtt 1200
tgggccatcg ccagagatcc aaagatgtgg tccgaaccat tggaattcag accagccaga 1260
ttcttgccag gtggtgaaaa gccagatgct gatgttaagg gtaacgattt cgaagtcatc 1320
ccattcggtg ccggtagaag atcttgtgct ggtatgtctt tgggtttgag aatggttcaa 1380
ttgttggttg ctactttggt tcaaaccttc gactgggaat tggctaacgg tttgaagcca 1440
gaaaagttga acatggaaga agcttacggt ttgactttgc aaagagctgc tccattgttg 1500
gttcacccaa agccaagatt ggctccacac gtttacggtt ctaactaa 1548
<210> 15
<211> 539
<212> PRT
<213> 克莱门柚(Citrus clementina)
<400> 15
Met Ser Gln Pro Leu Val Arg Leu Leu Val Pro Phe Leu Arg Phe Leu
1 5 10 15
Trp Glu Thr Lys Gln Arg Ala Met Ser Thr Leu Pro Leu Leu Ile Leu
20 25 30
Tyr Thr Ser Leu Leu Ala Ile Val Ile Ser Phe Leu Phe Ser Leu Leu
35 40 45
Arg Asn Arg Arg Arg His Ser Ser His Arg Leu Pro Pro Gly Pro Lys
50 55 60
Pro Trp Pro Ile Val Gly Asn Leu Pro His Leu Gly Pro Met Pro His
65 70 75 80
Gln Ser Ile Ala Gly Leu Ala Arg Thr His Gly Pro Leu Met Tyr Leu
85 90 95
Arg Leu Gly Phe Val Asp Val Val Val Ala Ala Ser Ala Ser Val Ala
100 105 110
Ala Gln Phe Leu Lys Ile His Asp Ser Asn Phe Ser Asn Arg Pro Pro
115 120 125
Asn Ser Gly Ala Lys His Ile Ala Tyr Asn Tyr Gln Asp Ile Val Phe
130 135 140
Arg Pro Tyr Gly Pro Arg Trp Arg Met Leu Arg Lys Ile Ser Ser Val
145 150 155 160
His Leu Phe Ser Gly Lys Ala Leu Asp Asp Tyr Arg His Val Arg Gln
165 170 175
Glu Glu Met Ala Val Leu Thr Arg Ala Leu Ala Ser Ala Gly Thr Glu
180 185 190
Pro Val Asn Leu Ala Gln Arg Leu Asn Leu Cys Val Val Asn Ala Leu
195 200 205
Gly Arg Val Met Leu Gly Phe Arg Val Phe Gly Asp Gly Thr Gly Gly
210 215 220
Ser Asp Pro Arg Ala Asp Glu Phe Lys Ser Met Val Val Glu Leu Met
225 230 235 240
Val Leu Ala Gly Val Phe Asn Val Gly Asp Phe Val Pro Ala Leu Glu
245 250 255
Arg Leu Asp Leu Gln Gly Val Ala Arg Lys Met Lys Lys Leu His Lys
260 265 270
Arg Phe Asp Val Phe Leu Ser Asp Ile Leu Glu Glu Arg Lys Met Asn
275 280 285
Gly Arg Asp Gly Gly Asn Lys Leu Thr Asp Leu Leu Gly Thr Leu Ile
290 295 300
Ser Leu Met Asp Asp Ala Asn Gly Glu Glu Lys Leu Thr Glu Thr Glu
305 310 315 320
Ile Lys Ala Leu Leu Leu Asn Met Phe Thr Ala Gly Thr Asp Thr Ser
325 330 335
Ser Ser Thr Ile Glu Trp Ala Ile Ala Glu Leu Ile Arg His Pro Lys
340 345 350
Val Trp Ala Gln Val Gln Gln Glu Leu Asp Ser Val Val Gly Arg Asp
355 360 365
Arg Leu Val Thr Glu Leu Asp Leu Pro Gln Leu Thr Tyr Leu Gln Ala
370 375 380
Val Ile Lys Glu Ile Phe Arg Leu His Pro Ser Thr Pro Leu Ser Leu
385 390 395 400
Pro Arg Ala Ala Ser Glu Ser Cys Lys Ile Asn Gly Tyr Asp Ile Pro
405 410 415
Lys Gly Ser Thr Leu Leu Val Asn Ile Trp Ala Ile Ala Arg Asp Pro
420 425 430
Asn Glu Trp Ala Asp Pro Leu Glu Phe Arg Pro Glu Arg Phe Leu Pro
435 440 445
Gly Gly Glu Lys Tyr Asn Val Asp Val Lys Gly Asn Asp Tyr Glu Leu
450 455 460
Ile Pro Phe Gly Ala Gly Arg Arg Ile Cys Ala Gly Leu Ser Trp Gly
465 470 475 480
Leu Arg Met Val Gln Leu Gly Thr Ala Thr Leu Ala His Ala Phe Asn
485 490 495
Trp Glu Leu Pro Gly Gly Leu Lys Pro Glu Lys Leu Asn Met Asp Glu
500 505 510
Ala Tyr Gly Leu Thr Leu Gln Arg Ala Ala Pro Leu Val Val His Pro
515 520 525
Arg Pro Arg Leu Ser Pro Asn Ala Tyr Gln Ala
530 535
<210> 16
<211> 1620
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:15的编码序列
<400> 16
atgtcccaac cattggttag attgttggtt ccattcttga gattcttgtg ggaaactaag 60
caaagagcta tgtctacttt gccattgttg atcttgtaca cttctttgtt ggctattgtc 120
atttctttct tgttctcttt gttgagaaac agaaggagac actcctccca cagattgcca 180
ccaggtccaa agccatggcc aatcgtcggt aacttgccac acttgggtcc aatgccacac 240
caatccatcg ctggtttggc cagaacccac ggtccattga tgtacttgag attgggtttc 300
gttgacgtcg tcgttgccgc ttccgcttcc gttgctgccc aattcttgaa gatccacgat 360
tccaacttct ccaacagacc accaaactcc ggtgccaagc acatcgctta caactaccaa 420
gacatcgttt tcagaccata cggtccaaga tggagaatgt tgagaaagat ctcttccgtt 480
cacttgttct ccggtaaggc cttggatgac tacagacacg ttagacaaga agaaatggct 540
gttttgacta gagctttggc ttctgctggt actgaaccag ttaacttggc tcaaagattg 600
aacttgtgtg ttgttaacgc cttgggtaga gttatgttgg gtttcagagt tttcggtgac 660
ggtaccggtg gttctgaccc aagagctgac gaattcaagt ctatggttgt tgaattgatg 720
gttttggctg gtgttttcaa cgtcggtgat ttcgtcccag ccttggaaag attggacttg 780
caaggtgttg ctagaaagat gaagaagttg cacaagagat tcgatgtttt cttgtctgat 840
atcttggaag aaagaaagat gaacggtaga gatggtggta acaagttgac tgacttgttg 900
ggtaccttga tttctttgat ggatgatgct aacggtgaag aaaagttgac tgaaactgaa 960
atcaaggctt tgttgttgaa catgttcact gctggtaccg acacttcttc ttctactatc 1020
gaatgggcca ttgctgaatt gatcagacac ccaaaggtct gggcccaagt ccaacaagaa 1080
ttggattctg ttgttggtag agatagattg gtcaccgaat tggacttgcc acaattgact 1140
tacttgcaag ccgttatcaa ggaaatcttc agattgcacc catctactcc attgtctttg 1200
ccaagagctg cttccgaatc ttgtaagatc aacggttacg atattccaaa gggttccact 1260
ttgttggtca acatctgggc cattgctaga gatccaaacg aatgggccga cccattggaa 1320
ttcagaccag aaagattctt gccaggtggt gaaaagtaca acgttgatgt taagggtaac 1380
gattacgaat tgatcccatt cggtgccggt agaagaattt gtgctggttt gtcttggggt 1440
ttgagaatgg ttcaattggg tactgctact ttggcccacg ctttcaactg ggaattgcca 1500
ggtggtttga agccagaaaa gttgaacatg gacgaagctt acggtttgac cttgcaaaga 1560
gctgctccat tggttgttca cccaagacca agattgtctc caaacgctta ccaagcttaa 1620
<210> 17
<211> 517
<212> PRT
<213> 甜橙(Citrus sinensis)
<400> 17
Met Ser Ser Thr Leu Pro Leu Leu Ile Leu Tyr Thr Ser Leu Leu Ala
1 5 10 15
Ile Val Ile Ser Phe Leu Phe Ser Leu Leu Arg Asn Arg Arg Arg His
20 25 30
Ser Ser His Arg Leu Pro Pro Gly Pro Lys Pro Trp Pro Ile Val Gly
35 40 45
Asn Leu Pro His Leu Gly Pro Met Pro His Gln Ser Ile Ala Gly Leu
50 55 60
Ala Arg Thr His Gly Pro Leu Met Tyr Leu Arg Leu Gly Phe Val Asp
65 70 75 80
Val Val Val Ala Ala Ser Ala Ser Val Ala Ala Gln Phe Leu Lys Ile
85 90 95
His Asp Ser Asn Phe Ser Asn Arg Pro Pro Asn Ser Gly Ala Lys His
100 105 110
Ile Ala Tyr Asn Tyr Gln Asp Ile Val Phe Arg Pro Tyr Gly Pro Arg
115 120 125
Trp Arg Met Leu Arg Lys Ile Ser Ser Val His Leu Phe Ser Gly Lys
130 135 140
Ala Leu Asp Asp Tyr Arg His Val Arg Gln Glu Glu Met Ala Val Leu
145 150 155 160
Ala Arg Ala Leu Ala Ser Ala Gly Thr Glu Pro Val Asn Leu Ala Gln
165 170 175
Arg Leu Asn Leu Cys Val Val Asn Ala Leu Gly Arg Val Met Leu Gly
180 185 190
Phe Arg Val Phe Gly Asp Gly Thr Gly Gly Ser Asp Pro Arg Ala Asp
195 200 205
Glu Phe Lys Ser Met Val Val Glu Leu Met Val Leu Ala Gly Val Phe
210 215 220
Asn Val Gly Asp Phe Val Pro Ala Leu Glu Arg Leu Asp Leu Gln Gly
225 230 235 240
Val Ala Arg Lys Met Lys Lys Leu His Lys Arg Phe Asp Val Phe Leu
245 250 255
Ser Asp Ile Leu Glu Glu Arg Lys Met Asn Gly Arg Asp Gly Gly Asn
260 265 270
Lys His Thr Asp Leu Leu Gly Thr Leu Ile Ser Leu Met Asp Asp Ala
275 280 285
Asn Gly Glu Glu Lys Leu Thr Glu Thr Glu Ile Lys Ala Leu Leu Leu
290 295 300
Asn Met Phe Thr Ala Gly Thr Asp Thr Ser Ser Ser Thr Ile Glu Trp
305 310 315 320
Ala Ile Ala Glu Leu Ile Arg His Pro Lys Val Arg Ala Gln Val Gln
325 330 335
Gln Glu Leu Asp Ser Val Val Gly Arg Asp Arg Leu Val Thr Glu Leu
340 345 350
Asp Leu Pro Gln Leu Thr Tyr Leu Gln Ala Val Ile Lys Glu Ile Phe
355 360 365
Arg Leu His Pro Ser Thr Pro Leu Ser Leu Pro Arg Ala Ala Ser Glu
370 375 380
Ser Cys Lys Ile Asn Gly Tyr Asp Ile Pro Lys Gly Ser Thr Leu Leu
385 390 395 400
Val Asn Ile Trp Ala Ile Ala Arg Asp Pro Asn Glu Trp Ala Asp Pro
405 410 415
Leu Glu Phe Arg Pro Glu Arg Phe Leu Pro Gly Gly Glu Lys Tyr Asn
420 425 430
Val Asp Val Lys Gly Asn Asp Tyr Glu Leu Ile Pro Phe Gly Ala Gly
435 440 445
Arg Arg Ile Cys Ala Gly Leu Ser Trp Gly Leu Arg Met Val Gln Leu
450 455 460
Gly Thr Ala Thr Leu Ala His Ala Phe Asn Trp Glu Leu Pro Gly Gly
465 470 475 480
Leu Lys Pro Glu Lys Leu Ser Met Asp Glu Ala Tyr Gly Leu Thr Leu
485 490 495
Gln Arg Ala Ala Pro Leu Val Val His Pro Arg Pro Arg Leu Ser Pro
500 505 510
Asn Ala Tyr Gln Ala
515
<210> 18
<211> 1554
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:17的编码序列
<400> 18
atgtcctcta ctttgccatt gttgatcttg tacacttctt tgttggctat tgtcatttct 60
ttcttgttct ctttgttgag aaacagaagg agacactcct cccacagatt gccaccaggt 120
ccaaagccat ggccaatcgt cggtaacttg ccacacttgg gtccaatgcc acaccaatcc 180
atcgctggtt tggccagaac ccacggtcca ttgatgtact tgagattggg tttcgttgac 240
gtcgtcgttg ccgcttctgc ttccgttgct gcccaattct tgaagatcca cgattccaac 300
ttctccaaca gaccaccaaa ctccggtgcc aagcacatcg cttacaacta ccaagacatc 360
gttttcagac catacggtcc aagatggaga atgttgagaa agatctcttc cgttcacttg 420
ttctccggta aggccttgga tgactacaga cacgttagac aagaagaaat ggctgttttg 480
gctagagctt tggcttctgc tggtactgaa ccagttaact tggctcaaag attgaacttg 540
tgtgttgtta acgccttggg tagagttatg ttgggtttca gagttttcgg tgacggtacc 600
ggtggttctg acccaagagc tgacgaattc aagtctatgg ttgttgaatt gatggttttg 660
gctggtgttt tcaacgtcgg tgacttcgtc ccagccttgg aaagattgga cttgcaaggt 720
gttgctagaa agatgaagaa gttgcacaag agattcgatg ttttcttgtc tgatatcttg 780
gaagaaagaa agatgaacgg tagagatggt ggtaacaagc acactgactt gttgggtacc 840
ttgatttctt tgatggatga tgctaacggt gaagaaaagt tgactgaaac tgaaatcaag 900
gctttgttgt tgaacatgtt cactgctggt accgacactt cttcttctac tatcgaatgg 960
gccattgctg aattgatcag acacccaaag gtcagagccc aagtccaaca agaattggat 1020
tctgttgttg gtagagatag attggtcacc gaattggact tgccacaatt gacttacttg 1080
caagccgtta tcaaggaaat cttcagattg cacccatcta ctccattgtc tttgccaaga 1140
gctgcttccg aatcttgtaa gatcaacggt tacgatattc caaagggttc cactttgttg 1200
gtcaacatct gggccattgc tagagatcca aacgaatggg ccgacccatt ggaattcaga 1260
ccagaaagat tcttgccagg tggtgaaaag tacaacgttg atgttaaggg taacgattac 1320
gaattgatcc cattcggtgc cggtagaaga atttgtgctg gtttgtcttg gggtttgaga 1380
atggttcaat tgggtactgc tactttggcc cacgctttca actgggaatt gccaggtggt 1440
ttgaagccag aaaagttgtc tatggacgaa gcttacggtt tgaccttgca aagagctgct 1500
ccattggttg ttcacccaag accaagattg tctccaaacg cttaccaagc ttaa 1554
<210> 19
<211> 513
<212> PRT
<213> 山柳兰(Pilosella officinarum)
<400> 19
Met Ser Thr Leu Leu Ser Leu Ile Ile Tyr Leu Cys Ile Thr Gly Val
1 5 10 15
Thr Ala Tyr Val Leu Val Asn Leu Arg Thr Arg Arg Ala Asn Arg Leu
20 25 30
Pro Pro Gly Pro Thr Pro Trp Pro Ile Val Gly Asn Leu Pro His Leu
35 40 45
Gly Thr Ile Pro His His Ser Leu Ala Asp Leu Ala Thr Arg Tyr Gly
50 55 60
Pro Leu Met His Leu Arg Leu Gly Phe Val Asp Val Val Val Ala Ala
65 70 75 80
Ser Ala Ser Val Ala Ala Gln Phe Leu Lys Thr His Asp Ala Asn Phe
85 90 95
Ala Ser Arg Pro Pro Asn Ser Gly Ala Lys His Met Ala Tyr Asn Tyr
100 105 110
Gln Asp Leu Val Phe Ala Pro Tyr Gly Pro Arg Trp Arg Met Leu Arg
115 120 125
Lys Ile Cys Ser Val His Leu Phe Ser Ala Lys Ser Leu Asp Asp Phe
130 135 140
Arg His Val Arg Gln Glu Glu Val Ala Ile Leu Thr Arg Ala Leu Val
145 150 155 160
Gly Ala Gly Lys Ser Thr Val Lys Leu Gly Gln Leu Leu His Val Cys
165 170 175
Thr Thr Asn Ala Leu Val Arg Val Met Leu Gly Arg Arg Val Phe Gly
180 185 190
Asp Gly Ser Gly Gly Gly Asp Pro Lys Ala Asp Glu Phe Lys Asn Met
195 200 205
Val Ile Glu Met Met Val Leu Ala Gly Glu Phe Asn Leu Gly Asp Phe
210 215 220
Ile Pro Val Leu Asp Leu Leu Asp Leu Gln Gly Val Thr Lys Lys Met
225 230 235 240
Lys Lys Leu His Thr Arg Phe Asp Ser Phe Leu Asn Ser Ile Leu Glu
245 250 255
Glu His Arg Thr Ser Ser Gly Gly Ala Ser Gly His Val Asp Leu Leu
260 265 270
Ser Thr Leu Ile Ser Leu Lys Asp Glu Ala Asp Gly Glu Gly Gly Lys
275 280 285
Leu Thr Asp Thr Glu Ile Lys Ala Leu Leu Leu Asn Leu Phe Val Ala
290 295 300
Gly Thr Asp Thr Ser Ser Ser Thr Val Glu Trp Ala Ile Ala Glu Leu
305 310 315 320
Ile Arg Asn Pro Gln Leu Leu Lys Gln Ala Gln Gln Glu Leu Asp Thr
325 330 335
Val Val Gly Gln Gly Arg Leu Val Asn Glu Ser Asp Leu Ser Gln Leu
340 345 350
Thr Phe Leu Gln Ala Ile Val Lys Glu Thr Phe Arg Leu His Pro Ser
355 360 365
Thr Pro Leu Ser Leu Pro Arg Ile Ala Ser Glu Ser Cys Glu Ile Asn
370 375 380
Gly Tyr Asn Ile Pro Lys Gly Ser Thr Leu Leu Val Asn Val Trp Ala
385 390 395 400
Ile Ala Arg Asp Pro Lys Met Trp Thr Glu Pro Leu Glu Phe Arg Pro
405 410 415
Ser Arg Phe Leu Pro Asp Gly Glu Lys Pro Asn Ala Asp Val Lys Gly
420 425 430
Asn Asp Phe Glu Val Ile Pro Phe Gly Ala Gly Arg Arg Ile Cys Ala
435 440 445
Gly Met Ser Leu Gly Leu Arg Met Val Gln Leu Leu Thr Ala Thr Leu
450 455 460
Ile Gln Ala Phe Asp Trp Glu Leu Ala Asn Gly Leu Glu Pro Arg Asn
465 470 475 480
Leu Asn Met Glu Glu Ala Tyr Gly Leu Thr Leu Gln Arg Ala Gln Pro
485 490 495
Leu Met Val His Pro Arg Pro Arg Leu Ala Pro His Val Tyr Gly Thr
500 505 510
Gly
<210> 20
<211> 1542
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:19的编码序列
<400> 20
atgtccacct tgttgtcctt gatcatctac ttgtgtatca ctggtgttac tgcctacgtt 60
ttggttaact tgagaactag aagagctaac agattgccac caggtccaac cccatggcca 120
atcgtcggta acttgccaca cttgggtact attccacacc actctttggc tgatttggct 180
actagatacg gtccattgat gcacttgaga ttgggtttcg ttgacgttgt tgttgccgcc 240
tctgcttccg tcgctgctca attcttaaag actcacgacg ctaacttcgc ttctagacca 300
ccaaactctg gtgctaagca catggcttac aactaccaag atttggtttt cgctccatac 360
ggtccaagat ggagaatgtt gagaaagatt tgttccgttc acttgttctc tgccaagtct 420
ttggatgatt tcagacacgt tagacaagaa gaagttgcta tcttgactag agctttggtc 480
ggtgccggta agtctactgt taagttgggt caattgttgc acgtttgtac cactaacgct 540
ttggttagag ttatgttggg tagaagagtt ttcggtgatg gttctggtgg tggtgatcca 600
aaggctgatg aattcaagaa catggttatt gaaatgatgg ttttggccgg tgaattcaac 660
ttgggtgatt tcatcccagt tttggatttg ttggacttgc aaggtgttac taagaagatg 720
aagaagttgc acactagatt cgattctttc ttgaactcta tcttggaaga acacagaact 780
tcttctggtg gtgcttctgg tcacgtcgat ttgttgtcta ctttgatttc tttgaaggat 840
gaagccgatg gtgaaggtgg taagttgact gacactgaaa ttaaggcttt gttgttgaac 900
ttgttcgttg ctggtactga cacttcttct tctaccgttg aatgggctat cgctgaattg 960
attagaaacc cacaattgtt gaagcaagcc caacaagaat tggacactgt tgttggtcaa 1020
ggtagattgg ttaacgaatc tgacttgtct caattgacct tcttgcaagc cattgttaag 1080
gaaactttca gattgcaccc atctactcca ttgtccttgc caagaatcgc ttccgaatct 1140
tgtgaaatca acggttacaa cattccaaag ggttccactt tgttggttaa cgtttgggcc 1200
atcgctagag atccaaagat gtggaccgaa ccattggaat tcagaccatc cagattcttg 1260
ccagacggtg aaaagccaaa cgctgatgtt aagggtaacg atttcgaagt catcccattc 1320
ggtgctggta gaagaatttg tgctggtatg tctttgggtt tgagaatggt ccaattgttg 1380
accgctactt tgattcaagc cttcgattgg gaattggcta acggtttgga accaagaaac 1440
ttgaacatgg aagaagccta cggtttgacc ttgcaaagag ctcaaccatt gatggttcac 1500
ccaagaccaa gattggcccc acacgtttac ggtactggtt aa 1542
<210> 21
<211> 406
<212> PRT
<213> 阿维链霉菌(Streptomyces avermitilis)
<400> 21
Met Ser Ala Ala Ala Phe Asp Leu Ala Phe Asp Pro Trp Asp Pro Ala
1 5 10 15
Phe Leu Ala Asp Pro Tyr Pro Ala Tyr Ala Asp Leu Arg Ala Lys Gly
20 25 30
Arg Val His Tyr Tyr Glu Pro Thr Asn Gln Trp Leu Val Pro His His
35 40 45
Ala Asp Val Ser Ala Leu Leu Arg Asp Arg Arg Leu Gly Arg Ala Tyr
50 55 60
Gln His Arg Tyr Thr His Glu Asp Phe Gly Arg Thr Ala Pro Pro Ala
65 70 75 80
Glu His Glu Pro Phe His Thr Leu Asn Asp His Gly Met Leu Asp Leu
85 90 95
Glu Pro Pro Asp His Thr Arg Ile Arg Arg Leu Val Ser Lys Ala Phe
100 105 110
Thr Pro Arg Thr Val Glu Gln Leu Lys Pro Tyr Val Ala Lys Leu Ala
115 120 125
Gly Glu Leu Val Asp Arg Leu Val Ala Ala Gly Gly Gly Asp Leu Leu
130 135 140
Ala Asp Val Ala Glu Pro Leu Pro Val Ala Val Ile Ala Glu Met Leu
145 150 155 160
Gly Ile Pro Glu Ser Asp Arg Ala Pro Leu Arg Pro Trp Ser Ala Asp
165 170 175
Ile Cys Gly Met Tyr Glu Leu Asn Pro Pro Lys Asp Val Ala Ala Lys
180 185 190
Ala Val Arg Ala Ser Val Glu Phe Ser Asp Tyr Leu Arg Glu Leu Ile
195 200 205
Ala Glu Arg Arg Lys Glu Pro Gly Asp Asp Leu Ile Ser Gly Leu Ile
210 215 220
Ala Ala His Asp Glu Gly Asp Arg Leu Thr Glu Gln Glu Met Ile Ser
225 230 235 240
Thr Cys Val Leu Leu Leu Asn Ala Gly His Glu Ala Thr Val Asn Ala
245 250 255
Thr Val Asn Gly Trp Tyr Ala Leu Phe Arg Asn Pro Asp Gln Leu Ala
260 265 270
Ala Leu Arg Ala Asp His Ser Leu Val Pro Ala Ala Val Glu Glu Leu
275 280 285
Met Arg Tyr Asp Thr Pro Leu Gln Leu Phe Glu Arg Trp Val Leu Asp
290 295 300
Glu Ile Glu Ile Asp Gly Thr Thr Val Pro Arg Gly Ala Glu Ile Ala
305 310 315 320
Met Leu Phe Gly Ser Ala Asn His Asp Pro Glu Val Phe Arg Asn Pro
325 330 335
Glu Lys Leu Asp Leu Thr Arg Glu Asp Asn Pro His Ile Ser Phe Ser
340 345 350
Ala Gly Ile His Tyr Cys Ile Gly Ala Pro Leu Ala Arg Ile Glu Leu
355 360 365
Ala Ala Ser Met Thr Ala Leu Leu Glu Lys Ala Pro Thr Leu Gly Leu
370 375 380
Val Ala Glu Pro Lys Arg Lys Pro Asn Phe Val Ile Arg Gly Leu Glu
385 390 395 400
Gly Leu Ser Val Ala Val
405
<210> 22
<211> 1221
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:21的编码序列
<400> 22
atgtccgctg ctgctttcga cttggccttc gacccatggg acccagcttt cttggccgac 60
ccatacccag cctacgccga tttgagagcc aagggtagag ttcactacta cgaaccaact 120
aaccaatggt tggttccaca ccacgctgac gtttctgctt tgttgagaga cagaagattg 180
ggtagagctt accaacacag atacactcac gaagatttcg gtagaaccgc tccaccagct 240
gaacacgaac cattccacac cttgaacgac cacggtatgt tggacttgga accaccagac 300
cacaccagaa tcagaagatt ggtttctaag gctttcactc caagaaccgt tgaacaattg 360
aagccatacg ttgccaagtt ggccggtgaa ttggttgaca gattggtcgc tgctggtggt 420
ggtgatttgt tggctgatgt cgccgaacca ttgccagttg ccgtcatcgc cgaaatgttg 480
ggtatcccag aatccgacag agccccatta agaccatggt ctgctgacat ctgtggtatg 540
tacgaattga acccaccaaa ggacgttgct gctaaggctg ttagagcttc tgttgaattc 600
tccgactact tgagagaatt gatcgccgaa agaagaaagg aaccaggtga cgatttgatc 660
tctggtttga tcgccgccca cgacgaaggt gacagattga ccgaacaaga aatgatctcc 720
acctgtgtct tgttgttgaa cgctggtcac gaagccaccg tcaacgccac tgtcaacggt 780
tggtacgcct tgttcagaaa cccagaccaa ttggccgcct tgagagccga ccactctttg 840
gttccagccg ccgttgaaga attgatgaga tacgacactc cattgcaatt gttcgaaaga 900
tgggtcttgg acgaaatcga aatcgacggt actactgtcc caagaggtgc tgaaatcgcc 960
atgttgttcg gttccgccaa ccacgaccca gaagttttca gaaacccaga aaagttggac 1020
ttgaccagag aagataaccc acacatttcc ttctctgctg gtatccacta ctgtatcggt 1080
gctccattgg ctagaatcga attggctgct tctatgactg ccttgttgga aaaggcccca 1140
actttgggtt tggttgctga accaaagaga aagccaaact tcgttatcag aggtttggaa 1200
ggtttgtctg tcgctgtcta a 1221
<210> 23
<211> 715
<212> PRT
<213> 长春花(Catharanthus roseus)
<400> 23
Met Ser Asp Ser Ser Ser Glu Lys Leu Ser Pro Phe Glu Leu Met Ser
1 5 10 15
Ala Ile Leu Lys Gly Ala Lys Leu Asp Gly Ser Asn Ser Ser Asp Ser
20 25 30
Gly Val Ala Val Ser Pro Ala Val Met Ala Met Leu Leu Glu Asn Lys
35 40 45
Glu Leu Val Met Ile Leu Thr Thr Ser Val Ala Val Leu Ile Gly Cys
50 55 60
Val Val Val Leu Ile Trp Arg Arg Ser Ser Gly Ser Gly Lys Lys Val
65 70 75 80
Val Glu Pro Pro Lys Leu Ile Val Pro Lys Ser Val Val Glu Pro Glu
85 90 95
Glu Ile Asp Glu Gly Lys Lys Lys Phe Thr Ile Phe Phe Gly Thr Gln
100 105 110
Thr Gly Thr Ala Glu Gly Phe Ala Lys Ala Leu Ala Glu Glu Ala Lys
115 120 125
Ala Arg Tyr Glu Lys Ala Val Ile Lys Val Ile Asp Ile Asp Asp Tyr
130 135 140
Ala Ala Asp Asp Glu Glu Tyr Glu Glu Lys Phe Arg Lys Glu Thr Leu
145 150 155 160
Ala Phe Phe Ile Leu Ala Thr Tyr Gly Asp Gly Glu Pro Thr Asp Asn
165 170 175
Ala Ala Arg Phe Tyr Lys Trp Phe Val Glu Gly Asn Asp Arg Gly Asp
180 185 190
Trp Leu Lys Asn Leu Gln Tyr Gly Val Phe Gly Leu Gly Asn Arg Gln
195 200 205
Tyr Glu His Phe Asn Lys Ile Ala Lys Val Val Asp Glu Lys Val Ala
210 215 220
Glu Gln Gly Gly Lys Arg Ile Val Pro Leu Val Leu Gly Asp Asp Asp
225 230 235 240
Gln Cys Ile Glu Asp Asp Phe Ala Ala Trp Arg Glu Asn Val Trp Pro
245 250 255
Glu Leu Asp Asn Leu Leu Arg Asp Glu Asp Asp Thr Thr Val Ser Thr
260 265 270
Thr Tyr Thr Ala Ala Ile Pro Glu Tyr Arg Val Val Phe Pro Asp Lys
275 280 285
Ser Asp Ser Leu Ile Ser Glu Ala Asn Gly His Ala Asn Gly Tyr Ala
290 295 300
Asn Gly Asn Thr Val Tyr Asp Ala Gln His Pro Cys Arg Ser Asn Val
305 310 315 320
Ala Val Arg Lys Glu Leu His Thr Pro Ala Ser Asp Arg Ser Cys Thr
325 330 335
His Leu Asp Phe Asp Ile Ala Gly Thr Gly Leu Ser Tyr Gly Thr Gly
340 345 350
Asp His Val Gly Val Tyr Cys Asp Asn Leu Ser Glu Thr Val Glu Glu
355 360 365
Ala Glu Arg Leu Leu Asn Leu Pro Pro Glu Thr Tyr Phe Ser Leu His
370 375 380
Ala Asp Lys Glu Asp Gly Thr Pro Leu Ala Gly Ser Ser Leu Pro Pro
385 390 395 400
Pro Phe Pro Pro Cys Thr Leu Arg Thr Ala Leu Thr Arg Tyr Ala Asp
405 410 415
Leu Leu Asn Thr Pro Lys Lys Ser Ala Leu Leu Ala Leu Ala Ala Tyr
420 425 430
Ala Ser Asp Pro Asn Glu Ala Asp Arg Leu Lys Tyr Leu Ala Ser Pro
435 440 445
Ala Gly Lys Asp Glu Tyr Ala Gln Ser Leu Val Ala Asn Gln Arg Ser
450 455 460
Leu Leu Glu Val Met Ala Glu Phe Pro Ser Ala Lys Pro Pro Leu Gly
465 470 475 480
Val Phe Phe Ala Ala Ile Ala Pro Arg Leu Gln Pro Arg Phe Tyr Ser
485 490 495
Ile Ser Ser Ser Pro Arg Met Ala Pro Ser Arg Ile His Val Thr Cys
500 505 510
Ala Leu Val Tyr Glu Lys Thr Pro Gly Gly Arg Ile His Lys Gly Val
515 520 525
Cys Ser Thr Trp Met Lys Asn Ala Ile Pro Leu Glu Glu Ser Arg Asp
530 535 540
Cys Ser Trp Ala Pro Ile Phe Val Arg Gln Ser Asn Phe Lys Leu Pro
545 550 555 560
Ala Asp Pro Lys Val Pro Val Ile Met Ile Gly Pro Gly Thr Gly Leu
565 570 575
Ala Pro Phe Arg Gly Phe Leu Gln Glu Arg Leu Ala Leu Lys Glu Glu
580 585 590
Gly Ala Glu Leu Gly Thr Ala Val Phe Phe Phe Gly Cys Arg Asn Arg
595 600 605
Lys Met Asp Tyr Ile Tyr Glu Asp Glu Leu Asn His Phe Leu Glu Ile
610 615 620
Gly Ala Leu Ser Glu Leu Leu Val Ala Phe Ser Arg Glu Gly Pro Thr
625 630 635 640
Lys Gln Tyr Val Gln His Lys Met Ala Glu Lys Ala Ser Asp Ile Trp
645 650 655
Arg Met Ile Ser Asp Gly Ala Tyr Val Tyr Val Cys Gly Asp Ala Lys
660 665 670
Gly Met Ala Arg Asp Val His Arg Thr Leu His Thr Ile Ala Gln Glu
675 680 685
Gln Gly Ser Met Asp Ser Thr Gln Ala Glu Gly Phe Val Lys Asn Leu
690 695 700
Gln Met Thr Gly Arg Tyr Leu Arg Asp Val Trp
705 710 715
<210> 24
<211> 2148
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:23的编码序列
<400> 24
atgtccgatt cttcttctga aaagttgtct ccattcgaat tgatgtctgc tatcttgaag 60
ggtgctaagt tggatggttc taactcttct gattctggtg ttgctgtttc tccagctgtt 120
atggctatgt tgttggaaaa caaggaattg gttatgattt tgactacttc tgttgctgtt 180
ttgatcggtt gtgtcgttgt tttgatctgg agaagatctt ccggttctgg taagaaggtc 240
gttgaaccac caaagttgat cgttccaaag tctgttgttg aaccagaaga aattgatgaa 300
ggtaagaaga agttcaccat cttcttcggt actcaaactg gtactgctga aggtttcgct 360
aaggctttgg ctgaagaagc caaggctaga tacgaaaagg ctgttatcaa ggttattgat 420
atcgatgatt acgctgctga tgatgaagaa tacgaagaaa agttcagaaa ggaaaccttg 480
gctttcttca tcttggccac ttacggtgat ggtgaaccaa ccgacaacgc tgctagattc 540
tacaagtggt tcgttgaagg taacgataga ggtgactggt tgaagaactt gcaatacggt 600
gttttcggtt tgggtaacag acaatacgaa cacttcaaca agattgctaa ggttgttgat 660
gaaaaggttg ctgaacaagg tggtaagaga attgttccat tggttttggg tgacgatgac 720
caatgtattg aagatgactt cgctgcttgg agagaaaacg tttggccaga attggataac 780
ttgttgagag atgaagatga tactactgtt tctactacct acactgctgc tattccagaa 840
tacagagttg ttttcccaga caagtctgat tctttgattt ctgaagctaa cggtcacgcc 900
aacggttacg ctaacggtaa caccgtttac gatgcccaac acccatgtag atctaacgtt 960
gctgttagaa aggaattgca cactccagct tctgatagat cttgtaccca cttggatttc 1020
gacattgctg gtactggttt gtcttacggt actggtgatc acgttggtgt ttactgtgat 1080
aacttgtctg aaaccgttga agaagctgaa agattgttga acttgccacc agaaacttac 1140
ttctctttgc acgctgataa ggaagatggt accccattgg ctggttcttc tttgccacca 1200
ccattcccac catgtacttt gagaaccgcc ttgactagat acgctgattt gttgaacact 1260
ccaaagaagt ctgctttgtt ggctttggct gcttacgctt ctgatccaaa cgaagccgat 1320
agattgaagt acttggcttc tccagccggt aaggatgaat acgctcaatc tttggttgct 1380
aaccaaagat ctttgttgga agtcatggct gaattcccat ctgctaagcc accattgggt 1440
gttttcttcg ctgctattgc tccaagattg caaccaagat tctactctat ctcttcttct 1500
ccaagaatgg ctccatctag aattcacgtc acttgtgctt tggtttacga aaagactcca 1560
ggtggtagaa ttcacaaggg tgtttgttct acttggatga agaacgccat tccattggaa 1620
gaatctagag actgttcttg ggctccaatc ttcgtcagac aatctaactt caagttgcca 1680
gccgatccaa aggttccagt tatcatgatc ggtccaggta ctggtttggc tccattcaga 1740
ggtttcttgc aagaaagatt ggctttgaag gaagaaggtg ctgaattggg tactgctgtt 1800
ttcttcttcg gttgtagaaa cagaaagatg gattacatct acgaagatga attgaaccac 1860
ttcttggaaa ttggtgcttt gtccgaattg ttggttgctt tctctagaga aggtccaact 1920
aagcaatacg ttcaacacaa gatggctgaa aaggcttctg atatttggag aatgatttct 1980
gatggtgctt acgtttacgt ctgtggtgat gccaagggta tggccagaga tgtccacaga 2040
actttgcaca ccattgctca agaacaaggt tctatggatt ctactcaagc tgaaggtttc 2100
gttaagaact tgcaaatgac cggtagatac ttgagagatg tctggtaa 2148
<210> 25
<211> 692
<212> PRT
<213> 酿酒酵母(Saccharomyces cerevisiae)
<400> 25
Met Ser Pro Phe Gly Ile Asp Asn Thr Asp Phe Thr Val Leu Ala Gly
1 5 10 15
Leu Val Leu Ala Val Leu Leu Tyr Val Lys Arg Asn Ser Ile Lys Glu
20 25 30
Leu Leu Met Ser Asp Asp Gly Asp Ile Thr Ala Val Ser Ser Gly Asn
35 40 45
Arg Asp Ile Ala Gln Val Val Thr Glu Asn Asn Lys Asn Tyr Leu Val
50 55 60
Leu Tyr Ala Ser Gln Thr Gly Thr Ala Glu Asp Tyr Ala Lys Lys Phe
65 70 75 80
Ser Lys Glu Leu Val Ala Lys Phe Asn Leu Asn Val Met Cys Ala Asp
85 90 95
Val Glu Asn Tyr Asp Phe Glu Ser Leu Asn Asp Val Pro Val Ile Val
100 105 110
Ser Ile Phe Ile Ser Thr Tyr Gly Glu Gly Asp Phe Pro Asp Gly Ala
115 120 125
Val Asn Phe Glu Asp Phe Ile Cys Asn Ala Glu Ala Gly Ala Leu Ser
130 135 140
Asn Leu Arg Tyr Asn Met Phe Gly Leu Gly Asn Ser Thr Tyr Glu Phe
145 150 155 160
Phe Asn Gly Ala Ala Lys Lys Ala Glu Lys His Leu Ser Ala Ala Gly
165 170 175
Ala Ile Arg Leu Gly Lys Leu Gly Glu Ala Asp Asp Gly Ala Gly Thr
180 185 190
Thr Asp Glu Asp Tyr Met Ala Trp Lys Asp Ser Ile Leu Glu Val Leu
195 200 205
Lys Asp Glu Leu His Leu Asp Glu Gln Glu Ala Lys Phe Thr Ser Gln
210 215 220
Phe Gln Tyr Thr Val Leu Asn Glu Ile Thr Asp Ser Met Ser Leu Gly
225 230 235 240
Glu Pro Ser Ala His Tyr Leu Pro Ser His Gln Leu Asn Arg Asn Ala
245 250 255
Asp Gly Ile Gln Leu Gly Pro Phe Asp Leu Ser Gln Pro Tyr Ile Ala
260 265 270
Pro Ile Val Lys Ser Arg Glu Leu Phe Ser Ser Asn Asp Arg Asn Cys
275 280 285
Ile His Ser Glu Phe Asp Leu Ser Gly Ser Asn Ile Lys Tyr Ser Thr
290 295 300
Gly Asp His Leu Ala Val Trp Pro Ser Asn Pro Leu Glu Lys Val Glu
305 310 315 320
Gln Phe Leu Ser Ile Phe Asn Leu Asp Pro Glu Thr Ile Phe Asp Leu
325 330 335
Lys Pro Leu Asp Pro Thr Val Lys Val Pro Phe Pro Thr Pro Thr Thr
340 345 350
Ile Gly Ala Ala Ile Lys His Tyr Leu Glu Ile Thr Gly Pro Val Ser
355 360 365
Arg Gln Leu Phe Ser Ser Leu Ile Gln Phe Ala Pro Asn Ala Asp Val
370 375 380
Lys Glu Lys Leu Thr Leu Leu Ser Lys Asp Lys Asp Gln Phe Ala Val
385 390 395 400
Glu Ile Thr Ser Lys Tyr Phe Asn Ile Ala Asp Ala Leu Lys Tyr Leu
405 410 415
Ser Asp Gly Ala Lys Trp Asp Thr Val Pro Met Gln Phe Leu Val Glu
420 425 430
Ser Val Pro Gln Met Thr Pro Arg Tyr Tyr Ser Ile Ser Ser Ser Ser
435 440 445
Leu Ser Glu Lys Gln Thr Val His Val Thr Ser Ile Val Glu Asn Phe
450 455 460
Pro Asn Pro Glu Leu Pro Asp Ala Pro Pro Val Val Gly Val Thr Thr
465 470 475 480
Asn Leu Leu Arg Asn Ile Gln Leu Ala Gln Asn Asn Val Asn Ile Ala
485 490 495
Glu Thr Asn Leu Pro Val His Tyr Asp Leu Asn Gly Pro Arg Lys Leu
500 505 510
Phe Ala Asn Tyr Lys Leu Pro Val His Val Arg Arg Ser Asn Phe Arg
515 520 525
Leu Pro Ser Asn Pro Ser Thr Pro Val Ile Met Ile Gly Pro Gly Thr
530 535 540
Gly Val Ala Pro Phe Arg Gly Phe Ile Arg Glu Arg Val Ala Phe Leu
545 550 555 560
Glu Ser Gln Lys Lys Gly Gly Asn Asn Val Ser Leu Gly Lys His Ile
565 570 575
Leu Phe Tyr Gly Ser Arg Asn Thr Asp Asp Phe Leu Tyr Gln Asp Glu
580 585 590
Trp Pro Glu Tyr Ala Lys Lys Leu Asp Gly Ser Phe Glu Met Val Val
595 600 605
Ala His Ser Arg Leu Pro Asn Thr Lys Lys Val Tyr Val Gln Asp Lys
610 615 620
Leu Lys Asp Tyr Glu Asp Gln Val Phe Glu Met Ile Asn Asn Gly Ala
625 630 635 640
Phe Ile Tyr Val Cys Gly Asp Ala Lys Gly Met Ala Lys Gly Val Ser
645 650 655
Thr Ala Leu Val Gly Ile Leu Ser Arg Gly Lys Ser Ile Thr Thr Asp
660 665 670
Glu Ala Thr Glu Leu Ile Lys Met Leu Lys Thr Ser Gly Arg Tyr Gln
675 680 685
Glu Asp Val Trp
690
<210> 26
<211> 2079
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:25的编码序列
<400> 26
atgtccccgt ttggaataga caacaccgac ttcactgtcc tggcggggct agtgcttgcc 60
gtgctactgt acgtaaagag aaactccatc aaggaactgc tgatgtccga tgacggagat 120
atcacagctg tcagctcggg caacagagac attgctcagg tggtgaccga aaacaacaag 180
aactacttgg tgttgtatgc gtcgcagact gggactgccg aggattacgc caaaaagttt 240
tccaaggagc tggtggccaa gttcaaccta aacgtgatgt gcgcagatgt tgagaactac 300
gactttgagt cgctaaacga tgtgcccgtc atagtctcga tttttatctc tacatatggt 360
gaaggagact tccccgacgg ggcggtcaac tttgaggact ttatttgtaa tgcggaagcg 420
ggtgcactat cgaacctgag gtataatatg tttggtctgg gaaattctac ttatgaattc 480
tttaatggtg ccgccaagaa ggccgagaag catctctccg ccgcgggcgc tatcagacta 540
ggcaagctcg gtgaagctga tgatggtgca ggaactacag acgaagatta catggcctgg 600
aaggactcca tcctggaggt tttgaaagac gaactgcatt tggacgaaca ggaagccaag 660
ttcacctctc aattccagta cactgtgttg aacgaaatca ctgactccat gtcgcttggt 720
gaaccctctg ctcactattt gccctcgcat cagttgaacc gcaacgcaga cggcatccaa 780
ttgggtccct tcgatttgtc tcaaccgtat attgcaccca tcgtgaaatc tcgcgaactg 840
ttctcttcca atgaccgtaa ttgcatccac tctgaatttg acttgtccgg ctctaacatc 900
aagtactcca ctggtgacca tcttgctgtt tggccttcca acccattgga aaaggtcgaa 960
cagttcttat ccatattcaa cctggaccct gaaaccattt ttgacttgaa gcccctggat 1020
cccaccgtca aagtgccctt cccaacgcca actactattg gcgctgctat taaacactat 1080
ttggaaatta caggacctgt ctccagacaa ttgttttcat ctttgattca gttcgccccc 1140
aacgctgacg tcaaggaaaa attgactctg ctttcgaaag acaaggacca attcgccgtc 1200
gagataacct ccaaatattt caacatcgca gatgctctga aatatttgtc tgatggcgcc 1260
aaatgggaca ccgtacccat gcaattcttg gtcgaatcag ttccccaaat gactcctcgt 1320
tactactcta tctcttcctc ttctctgtct gaaaagcaaa ccgtccatgt cacctccatt 1380
gtggaaaact ttcctaaccc agaattgcct gatgctcctc cagttgttgg tgttacgact 1440
aacttgttaa gaaacattca attggctcaa aacaatgtta acattgccga aactaaccta 1500
cctgttcact acgatttaaa tggcccacgt aaacttttcg ccaattacaa attgcccgtc 1560
cacgttcgtc gttctaactt cagattgcct tccaaccctt ccaccccagt tatcatgatc 1620
ggtccaggta ccggtgttgc cccattccgt gggtttatca gagagcgtgt cgcgttcctc 1680
gaatcacaaa agaagggcgg taacaacgtt tcgctaggta agcatatact gttttatgga 1740
tcccgtaaca ctgatgattt cttgtaccag gacgaatggc cagaatacgc caaaaaattg 1800
gatggttcgt tcgaaatggt cgtggcccat tccaggttgc caaacaccaa aaaagtttat 1860
gttcaagata aattaaagga ttacgaggac caagtatttg aaatgattaa caacggtgca 1920
tttatctacg tctgtggtga tgcaaagggt atggccaagg gtgtgtcaac cgcattggtt 1980
ggcatcttat cccgtggtaa atccattacc actgatgaag caacagagct aatcaagatg 2040
ctcaagactt caggtagata ccaagaagat gtctggtaa 2079
<210> 27
<211> 658
<212> PRT
<213> 人工的
<220>
<223> 嵌合细胞色素P450还原酶
<400> 27
Met Ser Pro Phe Gly Ile Asp Asn Thr Asp Phe Thr Val Leu Ala Gly
1 5 10 15
Leu Val Leu Ala Val Leu Leu Tyr Val Lys Arg Asn Ser Ile Lys Glu
20 25 30
Leu Leu Met Ser Asp Asp Gly Asp Ile Thr Ala Val Ser Ser Gly Asn
35 40 45
Arg Asp Ile Ala Gln Val Val Thr Glu Asn Asn Lys Asn Tyr Leu Val
50 55 60
Leu Tyr Ala Ser Gln Thr Gly Thr Ala Glu Asp Tyr Ala Lys Lys Phe
65 70 75 80
Ser Lys Glu Leu Val Ala Lys Phe Asn Leu Asn Val Met Cys Ala Asp
85 90 95
Val Glu Asn Tyr Asp Phe Glu Ser Leu Asn Asp Val Pro Val Ile Val
100 105 110
Ser Ile Phe Ile Ser Thr Tyr Gly Glu Gly Asp Phe Pro Asp Gly Ala
115 120 125
Val Asn Phe Glu Asp Phe Ile Cys Asn Ala Glu Ala Gly Ala Leu Ser
130 135 140
Asn Leu Arg Tyr Asn Met Phe Gly Leu Gly Asn Ser Thr Tyr Glu Phe
145 150 155 160
Phe Asn Gly Ala Ala Lys Lys Ala Glu Lys His Leu Ser Ala Ala Gly
165 170 175
Ala Ile Arg Leu Gly Lys Leu Gly Glu Ala Asp Asp Gly Ala Gly Thr
180 185 190
Thr Asp Glu Asp Tyr Met Ala Trp Lys Asp Ser Ile Leu Glu Val Leu
195 200 205
Lys Asp Glu Leu Gly Val Glu Ala Thr Gly Glu Glu Ser Ser Ile Arg
210 215 220
Gln Tyr Glu Leu Val Val His Thr Asp Ile Asp Ala Ala Lys Val Tyr
225 230 235 240
Met Gly Glu Met Gly Arg Leu Lys Ser Tyr Glu Asn Gln Lys Pro Pro
245 250 255
Phe Asp Ala Lys Asn Pro Phe Leu Ala Ala Val Thr Thr Asn Arg Lys
260 265 270
Leu Asn Gln Gly Thr Glu Arg His Leu Met His Leu Glu Leu Asp Ile
275 280 285
Ser Asp Ser Lys Ile Arg Tyr Glu Ser Gly Asp His Val Ala Val Tyr
290 295 300
Pro Ala Asn Asp Ser Ala Leu Val Asn Gln Leu Gly Lys Ile Leu Gly
305 310 315 320
Ala Asp Leu Asp Val Val Met Ser Leu Asn Asn Leu Asp Glu Glu Ser
325 330 335
Asn Lys Lys His Pro Phe Pro Cys Pro Thr Ser Tyr Arg Thr Ala Leu
340 345 350
Thr Tyr Tyr Leu Asp Ile Thr Asn Pro Pro Arg Thr Asn Val Leu Tyr
355 360 365
Glu Leu Ala Gln Tyr Ala Ser Glu Pro Ser Glu Gln Glu Leu Leu Arg
370 375 380
Lys Met Ala Ser Ser Ser Gly Glu Gly Lys Glu Leu Tyr Leu Ser Trp
385 390 395 400
Val Val Glu Ala Arg Arg His Ile Leu Ala Ile Leu Gln Asp Cys Pro
405 410 415
Ser Leu Arg Pro Pro Ile Asp His Leu Cys Glu Leu Leu Pro Arg Leu
420 425 430
Gln Ala Arg Tyr Tyr Ser Ile Ala Ser Ser Ser Lys Val His Pro Asn
435 440 445
Ser Val His Ile Cys Ala Val Val Val Glu Tyr Glu Thr Lys Ala Gly
450 455 460
Arg Ile Asn Lys Gly Val Ala Thr Asn Trp Leu Arg Ala Lys Glu Pro
465 470 475 480
Ala Gly Glu Asn Gly Gly Arg Ala Leu Val Pro Met Phe Val Arg Lys
485 490 495
Ser Gln Phe Arg Leu Pro Phe Lys Ala Thr Thr Pro Val Ile Met Val
500 505 510
Gly Pro Gly Thr Gly Val Ala Pro Phe Ile Gly Phe Ile Gln Glu Arg
515 520 525
Ala Trp Leu Arg Gln Gln Gly Lys Glu Val Gly Glu Thr Leu Leu Tyr
530 535 540
Tyr Gly Cys Arg Arg Ser Asp Glu Asp Tyr Leu Tyr Arg Glu Glu Leu
545 550 555 560
Ala Gln Phe His Arg Asp Gly Ala Leu Thr Gln Leu Asn Val Ala Phe
565 570 575
Ser Arg Glu Gln Ser His Lys Val Tyr Val Gln His Leu Leu Lys Gln
580 585 590
Asp Arg Glu His Leu Trp Lys Leu Ile Glu Gly Gly Ala His Ile Tyr
595 600 605
Val Cys Gly Asp Ala Arg Asn Met Ala Arg Asp Val Gln Asn Thr Phe
610 615 620
Tyr Asp Ile Val Ala Glu Leu Gly Ala Met Glu His Ala Gln Ala Val
625 630 635 640
Asp Tyr Ile Lys Lys Leu Met Thr Lys Gly Arg Tyr Ser Leu Asp Val
645 650 655
Trp Ser
<210> 28
<211> 1977
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:27的编码序列
<400> 28
atgtccccat tcggtatcga caacaccgac ttcactgtct tggctggttt ggttttggcc 60
gttttgttgt acgttaagag aaactccatc aaggaattgt tgatgtccga tgacggtgat 120
atcactgctg tctcttctgg taacagagac attgctcaag ttgttaccga aaacaacaag 180
aactacttgg ttttgtacgc ttctcaaact ggtactgccg aagattacgc caagaagttc 240
tccaaggaat tggttgccaa gttcaacttg aacgttatgt gtgctgatgt tgaaaactac 300
gacttcgaat ctttgaacga tgttccagtc atcgtatcta ttttcatctc tacttacggt 360
gaaggtgact tcccagacgg tgctgtcaac ttcgaagatt tcatttgtaa cgctgaagct 420
ggtgctttgt ctaacttgag atacaacatg ttcggtttgg gtaactctac ttacgaattc 480
ttcaacggtg ccgccaagaa ggccgaaaag cacttgtccg ccgctggtgc tatcagattg 540
ggtaagttgg gtgaagctga tgatggtgct ggtactactg acgaagatta catggcctgg 600
aaggactcca tcttggaagt tttgaaggac gaattgggtg ttgaagccac tggtgaagaa 660
tcctctatta gacaatacga attggttgtc cacaccgaca tcgatgctgc caaggtttac 720
atgggtgaaa tgggtagatt gaagtcttac gaaaaccaaa agccaccatt cgatgccaag 780
aacccattct tggctgctgt caccaccaac agaaagttga accaaggtac cgaaagacac 840
ttgatgcact tggaattgga catctctgac tccaagatca gatacgaatc tggtgaccac 900
gttgctgttt acccagccaa cgactctgct ttggtcaacc aattgggtaa gatcttgggt 960
gccgacttgg acgtcgtcat gtccttgaac aacttggatg aagaatccaa caagaagcac 1020
ccattcccat gtccaacttc ctacagaact gccttgacct actacttgga catcaccaac 1080
ccaccaagaa ccaacgtttt gtacgaattg gctcaatacg cctctgaacc atctgaacaa 1140
gaattgttga gaaagatggc ctcctcctcc ggtgaaggta aggaattgta cttgtcttgg 1200
gttgttgaag ccaggagaca catcttggcc atcttgcaag actgtccatc cttaagacca 1260
ccaatcgacc acttgtgtga attgttgcca agattgcaag ccagatacta ctccatcgcc 1320
tcttcctcca aggtccaccc aaactctgtt cacatctgtg ctgttgttgt tgaatacgaa 1380
accaaggctg gtagaatcaa caagggtgtt gccaccaact ggttgagagc caaggaacca 1440
gccggtgaaa acggtggtag agctttggtt ccaatgttcg ttagaaagtc ccaattcaga 1500
ttgccattca aggccaccac tccagtcatc atggttggtc caggtaccgg tgttgctcca 1560
ttcatcggtt tcatccaaga aagagcctgg ttgagacaac aaggtaagga agttggtgaa 1620
actttgttgt actacggttg tagaagatct gatgaagatt acttgtacag agaagaattg 1680
gctcaattcc acagagatgg tgctttgacc caattgaacg ttgccttctc cagagaacaa 1740
tcccacaagg tctacgtcca acacttgttg aagcaagaca gagaacactt gtggaagttg 1800
atcgaaggtg gtgcccacat ctacgtctgt ggtgatgcta gaaacatggc cagagatgtt 1860
caaaacacct tctacgacat cgttgctgaa ttgggtgcca tggaacacgc tcaagctgtt 1920
gactacatca agaagttgat gaccaagggt agatactcct tggacgtttg gtcttaa 1977
<210> 29
<211> 693
<212> PRT
<213> 拟南芥(Arabidopsis thaliana)
<400> 29
Met Ser Thr Ser Ala Leu Tyr Ala Ser Asp Leu Phe Lys Gln Leu Lys
1 5 10 15
Ser Ile Met Gly Thr Asp Ser Leu Ser Asp Asp Val Val Leu Val Ile
20 25 30
Ala Thr Thr Ser Leu Ala Leu Val Ala Gly Phe Val Val Leu Leu Trp
35 40 45
Lys Lys Thr Thr Ala Asp Arg Ser Gly Glu Leu Lys Pro Leu Met Ile
50 55 60
Pro Lys Ser Leu Met Ala Lys Asp Glu Asp Asp Asp Leu Asp Leu Gly
65 70 75 80
Ser Gly Lys Thr Arg Val Ser Ile Phe Phe Gly Thr Gln Thr Gly Thr
85 90 95
Ala Glu Gly Phe Ala Lys Ala Leu Ser Glu Glu Ile Lys Ala Arg Tyr
100 105 110
Glu Lys Ala Ala Val Lys Val Ile Asp Leu Asp Asp Tyr Ala Ala Asp
115 120 125
Asp Asp Gln Tyr Glu Glu Lys Leu Lys Lys Glu Thr Leu Ala Phe Phe
130 135 140
Cys Val Ala Thr Tyr Gly Asp Gly Glu Pro Thr Asp Asn Ala Ala Arg
145 150 155 160
Phe Tyr Lys Trp Phe Thr Glu Glu Asn Glu Arg Asp Ile Lys Leu Gln
165 170 175
Gln Leu Ala Tyr Gly Val Phe Ala Leu Gly Asn Arg Gln Tyr Glu His
180 185 190
Phe Asn Lys Ile Gly Ile Val Leu Asp Glu Glu Leu Cys Lys Lys Gly
195 200 205
Ala Lys Arg Leu Ile Glu Val Gly Leu Gly Asp Asp Asp Gln Ser Ile
210 215 220
Glu Asp Asp Phe Asn Ala Trp Lys Glu Ser Leu Trp Ser Glu Leu Asp
225 230 235 240
Lys Leu Leu Lys Asp Glu Asp Asp Lys Ser Val Ala Thr Pro Tyr Thr
245 250 255
Ala Val Ile Pro Glu Tyr Arg Val Val Thr His Asp Pro Arg Phe Thr
260 265 270
Thr Gln Lys Ser Met Glu Ser Asn Val Ala Asn Gly Asn Thr Thr Ile
275 280 285
Asp Ile His His Pro Cys Arg Val Asp Val Ala Val Gln Lys Glu Leu
290 295 300
His Thr His Glu Ser Asp Arg Ser Cys Ile His Leu Glu Phe Asp Ile
305 310 315 320
Ser Arg Thr Gly Ile Thr Tyr Glu Thr Gly Asp His Val Gly Val Tyr
325 330 335
Ala Glu Asn His Val Glu Ile Val Glu Glu Ala Gly Lys Leu Leu Gly
340 345 350
His Ser Leu Asp Leu Val Phe Ser Ile His Ala Asp Lys Glu Asp Gly
355 360 365
Ser Pro Leu Glu Ser Ala Val Pro Pro Pro Phe Pro Gly Pro Cys Thr
370 375 380
Leu Gly Thr Gly Leu Ala Arg Tyr Ala Asp Leu Leu Asn Pro Pro Arg
385 390 395 400
Lys Ser Ala Leu Val Ala Leu Ala Ala Tyr Ala Thr Glu Pro Ser Glu
405 410 415
Ala Glu Lys Leu Lys His Leu Thr Ser Pro Asp Gly Lys Asp Glu Tyr
420 425 430
Ser Gln Trp Ile Val Ala Ser Gln Arg Ser Leu Leu Glu Val Met Ala
435 440 445
Ala Phe Pro Ser Ala Lys Pro Pro Leu Gly Val Phe Phe Ala Ala Ile
450 455 460
Ala Pro Arg Leu Gln Pro Arg Tyr Tyr Ser Ile Ser Ser Ser Pro Arg
465 470 475 480
Leu Ala Pro Ser Arg Val His Val Thr Ser Ala Leu Val Tyr Gly Pro
485 490 495
Thr Pro Thr Gly Arg Ile His Lys Gly Val Cys Ser Thr Trp Met Lys
500 505 510
Asn Ala Val Pro Ala Glu Lys Ser His Glu Cys Ser Gly Ala Pro Ile
515 520 525
Phe Ile Arg Ala Ser Asn Phe Lys Leu Pro Ser Asn Pro Ser Thr Pro
530 535 540
Ile Val Met Val Gly Pro Gly Thr Gly Leu Ala Pro Phe Arg Gly Phe
545 550 555 560
Leu Gln Glu Arg Met Ala Leu Lys Glu Asp Gly Glu Glu Leu Gly Ser
565 570 575
Ser Leu Leu Phe Phe Gly Cys Arg Asn Arg Gln Met Asp Phe Ile Tyr
580 585 590
Glu Asp Glu Leu Asn Asn Phe Val Asp Gln Gly Val Ile Ser Glu Leu
595 600 605
Ile Met Ala Phe Ser Arg Glu Gly Ala Gln Lys Glu Tyr Val Gln His
610 615 620
Lys Met Met Glu Lys Ala Ala Gln Val Trp Asp Leu Ile Lys Glu Glu
625 630 635 640
Gly Tyr Leu Tyr Val Cys Gly Asp Ala Lys Gly Met Ala Arg Asp Val
645 650 655
His Arg Thr Leu His Thr Ile Val Gln Glu Gln Glu Gly Val Ser Ser
660 665 670
Ser Glu Ala Glu Ala Ile Val Lys Lys Leu Gln Thr Glu Gly Arg Tyr
675 680 685
Leu Arg Asp Val Trp
690
<210> 30
<211> 2082
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:29的编码序列
<400> 30
atgtccactt ctgctttgta cgcttccgat ttgttcaagc aattgaagtc tattatgggt 60
actgattctt tgtccgacga tgttgttttg gttattgcta ctacttcttt ggctttggtt 120
gctggtttcg ttgttttgtt gtggaagaaa actactgctg atagatctgg tgaattgaag 180
ccattgatga tcccaaagtc tttgatggct aaggacgaag atgatgattt ggatttgggt 240
tccggtaaga ctagagtctc tatcttcttc ggtactcaaa ctggtactgc tgaaggtttc 300
gctaaggctt tgtccgaaga aatcaaggct agatacgaaa aggctgctgt caaggtcatt 360
gacttggatg actacgctgc cgatgatgac caatacgaag aaaagttgaa gaaggaaact 420
ttggctttct tctgtgttgc tacttacggt gatggtgaac caactgacaa cgctgccaga 480
ttctacaagt ggttcactga agaaaacgaa agagatatca agttgcaaca attggcttac 540
ggtgttttcg ctttgggtaa cagacaatac gaacacttca acaagatcgg tatcgttttg 600
gatgaagaat tgtgtaagaa gggtgctaag agattgattg aagtcggttt gggtgatgat 660
gatcaatcta ttgaagatga tttcaacgcc tggaaggaat ctttgtggtc tgaattggac 720
aagttgttga aggacgaaga tgataagtct gttgctactc catacactgc tgttattcca 780
gaatacagag ttgttactca cgatccaaga ttcactactc aaaagtctat ggaatctaac 840
gttgccaacg gtaacactac tattgacatt caccacccat gtagagttga tgttgctgtt 900
caaaaggaat tgcacactca cgaatctgat agatcttgta ttcacttgga attcgacatc 960
tccagaactg gtattactta cgaaactggt gaccacgttg gtgtttacgc tgaaaaccac 1020
gttgaaatcg ttgaagaagc tggtaagttg ttgggtcact ctttggattt ggttttctcc 1080
atccacgctg acaaggaaga tggttcccca ttggaatctg ctgttccacc accattccca 1140
ggtccatgta ctttgggtac tggtttggct agatacgctg acttgttgaa cccaccaaga 1200
aagtctgctt tggttgcctt ggctgcctac gccactgaac catctgaagc cgaaaagttg 1260
aagcacttga cttctccaga tggtaaggat gaatactctc aatggattgt tgcttctcaa 1320
agatctttgt tggaagttat ggctgctttc ccatctgcta agccaccatt gggtgttttc 1380
ttcgctgcta tcgctccaag attgcaacca agatactact ccatctcttc ctctccaaga 1440
ttggctccat ctagagttca cgttacttcc gctttggttt acggtccaac tccaactggt 1500
agaatccaca agggtgtttg ttctacttgg atgaagaacg ctgttccagc tgaaaagtct 1560
cacgaatgtt ctggtgcccc aatcttcatt agagcttcta acttcaagtt gccatccaac 1620
ccatctactc caatcgttat ggttggtcca ggtactggtt tggctccatt cagaggtttc 1680
ttgcaagaaa gaatggcttt gaaggaagat ggtgaagaat tgggttcttc tttgttgttc 1740
ttcggttgta gaaacagaca aatggacttc atctacgaag atgaattgaa caacttcgtt 1800
gatcaaggtg ttatctctga attgatcatg gctttctcca gagaaggtgc tcaaaaggaa 1860
tacgttcaac acaagatgat ggaaaaggct gctcaagttt gggatttgat caaggaagaa 1920
ggttacttgt acgtttgtgg tgatgctaag ggtatggcta gagatgtcca cagaactttg 1980
cacaccattg ttcaagaaca agaaggtgtt tcttcttctg aagctgaagc tatcgttaag 2040
aagttgcaaa ccgaaggtag atacttgaga gatgtctggt aa 2082
<210> 31
<211> 712
<212> PRT
<213> 拟南芥(Arabidopsis thaliana)
<400> 31
Met Ser Ser Ser Ser Ser Ser Ser Thr Ser Met Ile Asp Leu Met Ala
1 5 10 15
Ala Ile Ile Lys Gly Glu Pro Val Ile Val Ser Asp Pro Ala Asn Ala
20 25 30
Ser Ala Tyr Glu Ser Val Ala Ala Glu Leu Ser Ser Met Leu Ile Glu
35 40 45
Asn Arg Gln Phe Ala Met Ile Val Thr Thr Ser Ile Ala Val Leu Ile
50 55 60
Gly Cys Ile Val Met Leu Val Trp Arg Arg Ser Gly Ser Gly Asn Ser
65 70 75 80
Lys Arg Val Glu Pro Leu Lys Pro Leu Val Ile Lys Pro Arg Glu Glu
85 90 95
Glu Ile Asp Asp Gly Arg Lys Lys Val Thr Ile Phe Phe Gly Thr Gln
100 105 110
Thr Gly Thr Ala Glu Gly Phe Ala Lys Ala Leu Gly Glu Glu Ala Lys
115 120 125
Ala Arg Tyr Glu Lys Thr Arg Phe Lys Ile Val Asp Leu Asp Asp Tyr
130 135 140
Ala Ala Asp Asp Asp Glu Tyr Glu Glu Lys Leu Lys Lys Glu Asp Val
145 150 155 160
Ala Phe Phe Phe Leu Ala Thr Tyr Gly Asp Gly Glu Pro Thr Asp Asn
165 170 175
Ala Ala Arg Phe Tyr Lys Trp Phe Thr Glu Gly Asn Asp Arg Gly Glu
180 185 190
Trp Leu Lys Asn Leu Lys Tyr Gly Val Phe Gly Leu Gly Asn Arg Gln
195 200 205
Tyr Glu His Phe Asn Lys Val Ala Lys Val Val Asp Asp Ile Leu Val
210 215 220
Glu Gln Gly Ala Gln Arg Leu Val Gln Val Gly Leu Gly Asp Asp Asp
225 230 235 240
Gln Cys Ile Glu Asp Asp Phe Thr Ala Trp Arg Glu Ala Leu Trp Pro
245 250 255
Glu Leu Asp Thr Ile Leu Arg Glu Glu Gly Asp Thr Ala Val Ala Thr
260 265 270
Pro Tyr Thr Ala Ala Val Leu Glu Tyr Arg Val Ser Ile His Asp Ser
275 280 285
Glu Asp Ala Lys Phe Asn Asp Ile Asn Met Ala Asn Gly Asn Gly Tyr
290 295 300
Thr Val Phe Asp Ala Gln His Pro Tyr Lys Ala Asn Val Ala Val Lys
305 310 315 320
Arg Glu Leu His Thr Pro Glu Ser Asp Arg Ser Cys Ile His Leu Glu
325 330 335
Phe Asp Ile Ala Gly Ser Gly Leu Thr Tyr Glu Thr Gly Asp His Val
340 345 350
Gly Val Leu Cys Asp Asn Leu Ser Glu Thr Val Asp Glu Ala Leu Arg
355 360 365
Leu Leu Asp Met Ser Pro Asp Thr Tyr Phe Ser Leu His Ala Glu Lys
370 375 380
Glu Asp Gly Thr Pro Ile Ser Ser Ser Leu Pro Pro Pro Phe Pro Pro
385 390 395 400
Cys Asn Leu Arg Thr Ala Leu Thr Arg Tyr Ala Cys Leu Leu Ser Ser
405 410 415
Pro Lys Lys Ser Ala Leu Val Ala Leu Ala Ala His Ala Ser Asp Pro
420 425 430
Thr Glu Ala Glu Arg Leu Lys His Leu Ala Ser Pro Ala Gly Lys Val
435 440 445
Asp Glu Tyr Ser Lys Trp Val Val Glu Ser Gln Arg Ser Leu Leu Glu
450 455 460
Val Met Ala Glu Phe Pro Ser Ala Lys Pro Pro Leu Gly Val Phe Phe
465 470 475 480
Ala Gly Val Ala Pro Arg Leu Gln Pro Arg Phe Tyr Ser Ile Ser Ser
485 490 495
Ser Pro Lys Ile Ala Glu Thr Arg Ile His Val Thr Cys Ala Leu Val
500 505 510
Tyr Glu Lys Met Pro Thr Gly Arg Ile His Lys Gly Val Cys Ser Thr
515 520 525
Trp Met Lys Asn Ala Val Pro Tyr Glu Lys Ser Glu Asn Cys Ser Ser
530 535 540
Ala Pro Ile Phe Val Arg Gln Ser Asn Phe Lys Leu Pro Ser Asp Ser
545 550 555 560
Lys Val Pro Ile Ile Met Ile Gly Pro Gly Thr Gly Leu Ala Pro Phe
565 570 575
Arg Gly Phe Leu Gln Glu Arg Leu Ala Leu Val Glu Ser Gly Val Glu
580 585 590
Leu Gly Pro Ser Val Leu Phe Phe Gly Cys Arg Asn Arg Arg Met Asp
595 600 605
Phe Ile Tyr Glu Glu Glu Leu Gln Arg Phe Val Glu Ser Gly Ala Leu
610 615 620
Ala Glu Leu Ser Val Ala Phe Ser Arg Glu Gly Pro Thr Lys Glu Tyr
625 630 635 640
Val Gln His Lys Met Met Asp Lys Ala Ser Asp Ile Trp Asn Met Ile
645 650 655
Ser Gln Gly Ala Tyr Leu Tyr Val Cys Gly Asp Ala Lys Gly Met Ala
660 665 670
Arg Asp Val His Arg Ser Leu His Thr Ile Ala Gln Glu Gln Gly Ser
675 680 685
Met Asp Ser Thr Lys Ala Glu Gly Phe Val Lys Asn Leu Gln Thr Ser
690 695 700
Gly Arg Tyr Leu Arg Asp Val Trp
705 710
<210> 32
<211> 2139
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:31的编码序列
<400> 32
atgtcctctt cttcttcttc ttctacctcc atgatcgatt tgatggctgc tatcatcaag 60
ggtgaaccag ttattgtctc cgacccagct aacgcctccg cttacgaatc cgttgctgct 120
gaattgtcct ctatgttgat cgaaaacaga caattcgcca tgattgttac cacttccatt 180
gctgttttga ttggttgtat cgttatgttg gtttggagaa gatccggttc tggtaactct 240
aagagagtcg aaccattgaa gccattggtt attaagccaa gagaagaaga aattgatgat 300
ggtagaaaga aggttaccat cttcttcggt actcaaactg gtactgctga aggtttcgct 360
aaggctttgg gtgaagaagc taaggctaga tacgaaaaga ccagattcaa gatcgttgat 420
ttggatgatt acgctgctga tgatgatgaa tacgaagaaa agttgaagaa ggaagatgtt 480
gctttcttct tcttggccac ttacggtgat ggtgaaccaa ccgacaacgc tgctagattc 540
tacaagtggt tcaccgaagg taacgacaga ggtgaatggt tgaagaactt gaagtacggt 600
gttttcggtt tgggtaacag acaatacgaa cacttcaaca aggttgccaa ggttgttgat 660
gacattttgg tcgaacaagg tgctcaaaga ttggttcaag ttggtttggg tgatgatgac 720
caatgtattg aagatgactt caccgcttgg agagaagctt tgtggccaga attggatact 780
atcttgagag aagaaggtga tactgctgtt gccactccat acactgctgc tgttttggaa 840
tacagagttt ctattcacga ctctgaagat gccaagttca acgatatcaa catggctaac 900
ggtaacggtt acactgtttt cgatgctcaa cacccataca aggctaacgt cgctgttaag 960
agagaattgc acactccaga atctgataga tcttgtatcc acttggaatt cgacattgct 1020
ggttctggtt tgacttacga aactggtgat cacgttggtg ttttgtgtga taacttgtct 1080
gaaactgttg atgaagcttt gagattgttg gatatgtctc cagatactta cttctctttg 1140
cacgctgaaa aggaagatgg tactccaatc tcttcttctt tgccaccacc attcccacca 1200
tgtaacttga gaactgcttt gactagatac gcttgtttgt tgtcatctcc aaagaagtct 1260
gctttggttg ctttggctgc tcacgcttct gatccaaccg aagctgaaag attgaagcac 1320
ttggcttctc cagctggtaa ggttgatgaa tactctaagt gggttgttga atctcaaaga 1380
tctttgttgg aagttatggc cgaattccca tctgccaagc caccattggg tgttttcttc 1440
gctggtgttg ctccaagatt gcaaccaaga ttctactcta tctcttcttc tccaaagatt 1500
gctgaaacta gaattcacgt cacttgtgct ttggtttacg aaaagatgcc aactggtaga 1560
attcacaagg gtgtttgttc cacttggatg aagaacgctg ttccatacga aaagtctgaa 1620
aactgttcct ctgctccaat cttcgttaga caatccaact tcaagttgcc atctgattct 1680
aaggttccaa tcatcatgat cggtccaggt actggtttgg ctccattcag aggtttcttg 1740
caagaaagat tggctttggt tgaatctggt gttgaattgg gtccatctgt tttgttcttc 1800
ggttgtagaa acagaagaat ggatttcatc tacgaagaag aattgcaaag attcgttgaa 1860
tctggtgctt tggctgaatt gtctgtcgcc ttctctagag aaggtccaac caaggaatac 1920
gttcaacaca agatgatgga caaggcttct gatatctgga acatgatctc tcaaggtgct 1980
tacttgtacg tttgtggtga cgccaagggt atggctagag atgttcacag atctttgcac 2040
actatcgctc aagaacaagg ttctatggat tctactaagg ctgaaggttt cgttaagaac 2100
ttgcaaactt ctggtagata cttgagagat gtttggtaa 2139
<210> 33
<211> 522
<212> PRT
<213> 金银花(Lonicera japonica)
<400> 33
Met Ser Trp Ile Phe Asp Leu Thr Ile Ser Phe Thr Thr Leu Leu Phe
1 5 10 15
Leu Ile Phe Thr Thr Ala Leu Leu Leu Leu Leu Lys Val Phe Lys Lys
20 25 30
Asn His Lys Leu Arg Pro Pro Pro Ser Pro Phe Thr Leu Pro Ile Ile
35 40 45
Gly His Leu His Leu Leu Gly Pro Leu Ile His Gln Ser Phe His Arg
50 55 60
Leu Ser Thr Leu Tyr Gly Pro Leu Ile Gln Leu Lys Ile Gly Tyr Ile
65 70 75 80
Pro Cys Val Val Ala Ser Thr Pro Glu Leu Ala Lys Glu Phe Leu Lys
85 90 95
Thr His Glu Leu Ala Phe Ser Ser Arg Lys His Ser Ala Ala Ile Lys
100 105 110
Leu Leu Thr Tyr Asp Val Ser Phe Ala Phe Ser Pro Tyr Gly Pro Tyr
115 120 125
Trp Lys Phe Ile Lys Lys Thr Cys Thr Phe Glu Leu Leu Gly Thr Arg
130 135 140
Asn Met Asn His Phe Leu Pro Ile Arg Thr Asn Glu Ile Arg Arg Phe
145 150 155 160
Leu Gln Val Met Leu Glu Lys Ala Lys Ala Ser Glu Gly Val Asn Val
165 170 175
Thr Glu Glu Leu Ile Lys Leu Thr Asn Asn Val Ile Ser Gln Met Met
180 185 190
Phe Ser Thr Arg Ser Ser Gly Thr Glu Gly Glu Ala Glu Glu Met Arg
195 200 205
Thr Leu Val Arg Glu Val Thr Gln Ile Phe Gly Glu Phe Asn Val Ser
210 215 220
Asp Phe Ile Lys Leu Cys Lys Asn Ile Asp Ile Gly Gly Phe Lys Lys
225 230 235 240
Arg Ser Lys Asp Ile Gln Lys Arg Tyr Asp Ala Leu Leu Glu Lys Ile
245 250 255
Ile Ser Glu Arg Glu Ser Glu Arg Ala Arg Arg Gly Lys Asn Arg Glu
260 265 270
Thr Leu Gly Glu Glu Gly Gly Lys Asp Phe Leu Asp Met Met Leu Asp
275 280 285
Thr Met Glu Asp Gly Lys Cys Glu Val Glu Ile Thr Arg Asp His Ile
290 295 300
Lys Ala Leu Val Leu Asp Phe Leu Thr Ala Ala Thr Asp Thr Thr Ala
305 310 315 320
Ile Ala Val Glu Trp Thr Leu Ala Glu Leu Ile Ser Asn Pro Glu Val
325 330 335
Phe Asp Lys Ala Arg Glu Glu Ile Asp Lys Val Val Gly Lys His Arg
340 345 350
Leu Val Thr Glu Leu Asp Thr Pro Asn Leu Pro Tyr Ile His Ala Ile
355 360 365
Ile Lys Glu Ser Phe Arg Leu His Pro Pro Ile Pro Leu Leu Ile Arg
370 375 380
Lys Ser Val Gln Asp Cys Thr Val Gly Gly Tyr His Ile Ser Ala Asn
385 390 395 400
Thr Ile Leu Phe Val Asn Ile Trp Ala Ile Gly Arg Asn Pro Lys Tyr
405 410 415
Trp Glu Ser Pro Met Lys Phe Trp Pro Glu Arg Phe Leu Glu Ser Asn
420 425 430
Gly Pro Gly Pro Val Gly Ser Met Asp Ile Lys Gly His His Tyr Glu
435 440 445
Leu Leu Pro Phe Gly Ser Gly Arg Arg Gly Cys Pro Gly Met Ala Leu
450 455 460
Ala Met Gln Glu Leu Pro Val Val Leu Ala Ala Met Ile Gln Cys Phe
465 470 475 480
Asn Trp Lys Pro Val Thr Leu Asp Gly Glu Glu Leu Asp Met Ser Glu
485 490 495
Arg Pro Gly Leu Thr Ala Pro Arg Ala His Asp Leu Val Cys Val Pro
500 505 510
Ser Ala Arg Ile Asn Ser Phe Asp Asn Phe
515 520
<210> 34
<211> 1569
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:33的编码序列
<400> 34
atgtcctgga tcttcgactt gactatctct ttcaccactt tgttgttctt gatcttcacc 60
accgccttgt tgttgttgtt gaaggttttc aagaagaacc acaagttaag accaccacca 120
tctccattca ccttgccaat catcggtcac ttgcacttgt tgggtccatt gatccaccaa 180
tccttccaca gattgtccac cttgtacggt ccattgatcc aattgaagat cggttacatc 240
ccatgtgttg ttgcctctac tccagaattg gctaaggaat tcttaaagac tcacgaattg 300
gctttctcct ctagaaagca ctccgctgcc attaagttgt tgacctacga tgtttctttc 360
gctttctctc catacggtcc atactggaag ttcatcaaaa agacttgtac cttcgaattg 420
ttgggtacta gaaacatgaa ccacttcttg ccaattagaa ccaacgaaat tagaagattc 480
ttgcaagtta tgttggaaaa ggccaaggct tctgaaggtg ttaacgttac tgaagaattg 540
atcaagttga ctaacaacgt tatctctcaa atgatgttct ctactagatc ttctggtacc 600
gaaggtgaag ctgaagaaat gagaactttg gttagagaag ttactcaaat cttcggtgaa 660
ttcaacgttt ctgatttcat caagttgtgt aagaacattg atattggtgg tttcaagaag 720
agatctaagg atatccaaaa gagatacgat gctttgttgg aaaagatcat ctctgaaaga 780
gaatctgaaa gagctagaag aggtaagaac agagaaactt tgggtgaaga aggtggtaag 840
gatttcttgg atatgatgtt ggatactatg gaagatggta agtgtgaagt tgaaatcact 900
agagatcaca ttaaggcctt ggttttggat ttcttgactg ctgccactga tactactgct 960
attgctgttg aatggacttt ggccgaattg atctctaacc cagaagtttt cgataaggct 1020
agagaagaaa tcgataaggt cgttggtaag cacagattgg tcactgaatt ggacactcca 1080
aacttgccat acatccacgc tatcatcaag gaatctttca gattgcaccc accaattcca 1140
ttgttgatca gaaagtctgt ccaagattgt actgttggtg gttaccacat ctctgctaac 1200
accatcttgt tcgtcaacat ttgggccatc ggtagaaacc caaagtactg ggaatctcca 1260
atgaagttct ggccagaaag attcttggaa tccaacggtc caggtccagt tggttctatg 1320
gatattaagg gtcaccacta cgaattgttg ccattcggtt ctggtagaag aggttgtcca 1380
ggtatggctt tggccatgca agaattgcca gttgttttgg ccgccatgat ccaatgtttc 1440
aactggaagc cagttacttt ggacggtgaa gaattggata tgtctgaaag accaggtttg 1500
actgctccaa gagcccacga tttggtttgt gttccatccg ctagaattaa ctctttcgat 1560
aacttctaa 1569
<210> 35
<211> 520
<212> PRT
<213> 灰毡毛忍冬(Lonicera macranthoides)
<400> 35
Met Ser Leu Ile Phe Asp Leu Thr Ile Ser Phe Thr Thr Leu Leu Phe
1 5 10 15
Leu Ile Phe Thr Thr Ala Leu Leu Leu Lys Val Phe Lys Lys Asn His
20 25 30
Lys Leu Gln Pro Pro Pro Ser Pro Phe Thr Leu Pro Ile Ile Gly His
35 40 45
Leu His Leu Leu Gly Pro Leu Ile His Gln Ser Phe His Arg Leu Ser
50 55 60
Thr Leu Tyr Gly Pro Leu Ile Gln Leu Lys Ile Gly Tyr Ile Pro Cys
65 70 75 80
Val Val Ala Ser Thr Pro Glu Leu Ala Lys Glu Phe Leu Lys Thr His
85 90 95
Glu Leu Ala Phe Ser Ser Arg Lys His Ser Ala Ala Ile Lys Leu Leu
100 105 110
Thr Tyr Asp Val Ser Phe Ala Phe Ala Pro Tyr Gly Pro Tyr Trp Lys
115 120 125
Phe Ile Lys Lys Thr Cys Thr Phe Glu Leu Leu Gly Thr Arg Asn Met
130 135 140
Asn His Phe Leu Pro Ile Arg Thr Asn Glu Ile Arg Arg Phe Leu Gln
145 150 155 160
Val Met Leu Glu Lys Ala Lys Ala Ser Glu Gly Val Asn Val Thr Glu
165 170 175
Glu Leu Ile Lys Leu Thr Asn Asn Val Ile Ser Gln Met Met Phe Ser
180 185 190
Thr Arg Ser Ser Gly Thr Glu Gly Glu Ala Glu Glu Val Arg Thr Leu
195 200 205
Val Arg Glu Val Thr Gln Ile Phe Gly Glu Phe Asn Val Ser Asp Phe
210 215 220
Ile Lys Leu Cys Lys Asn Ile Asp Ile Gly Gly Phe Lys Lys Arg Ser
225 230 235 240
Glu Asp Ile Gln Lys Arg Tyr Asp Ala Leu Leu Glu Lys Ile Ile Ser
245 250 255
Glu Arg Glu Ser Glu Arg Ala Arg Arg Gly Lys Asn Arg Glu Thr Leu
260 265 270
Gly Glu Glu Gly Gly Lys Asp Phe Leu Asp Met Met Leu Asp Thr Met
275 280 285
Glu Asp Gly Lys Cys Glu Val Glu Ile Thr Arg Asp His Ile Lys Ala
290 295 300
Leu Val Leu Asp Phe Leu Thr Ala Ala Thr Asp Thr Thr Ala Ile Ala
305 310 315 320
Val Glu Trp Thr Leu Ala Glu Leu Ile Ser Asn Pro Glu Val Phe Asp
325 330 335
Lys Ala Arg Glu Glu Ile Asp Lys Val Val Gly Lys His Arg Leu Val
340 345 350
Thr Glu Leu Asp Thr Pro Asn Leu Pro Tyr Ile His Ala Ile Ile Lys
355 360 365
Glu Ser Phe Arg Leu His Pro Pro Ile Pro Leu Val Ile Arg Lys Ser
370 375 380
Val Gln Asp Cys Thr Val Gly Gly Tyr His Ile Ser Ala Asn Thr Ile
385 390 395 400
Leu Phe Ile Asn Ile Trp Ala Ile Gly Arg Asn Pro Lys Tyr Trp Glu
405 410 415
Ser Pro Met Lys Phe Trp Pro Glu Arg Phe Leu Glu Ser Asn Glu Pro
420 425 430
Gly Ser Val Gly Ser Thr Asp Ile Lys Gly His His Tyr Glu Leu Leu
435 440 445
Pro Phe Gly Ser Gly Arg Arg Gly Cys Pro Gly Met Ala Leu Ala Met
450 455 460
Gln Glu Leu Pro Val Val Leu Ala Ala Met Ile Gln Cys Phe Asn Trp
465 470 475 480
Lys Pro Val Thr Leu Asp Gly Glu Glu Leu Asp Met Ser Glu Arg Pro
485 490 495
Gly Leu Thr Ala Pro Arg Ala His Asp Leu Val Cys Val Pro Ser Ala
500 505 510
Arg Ile Asn Ser Phe Asp Asn Phe
515 520
<210> 36
<211> 1563
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:35的编码序列
<400> 36
atgtccttga tcttcgactt gactatctct ttcaccactt tgttgttctt gatcttcacc 60
accgccttgt tgttgaaggt tttcaagaag aaccacaagt tgcaaccacc accatctcca 120
ttcaccttgc caatcatcgg tcacttgcac ttgttgggtc cattgatcca ccaatccttc 180
cacagattgt ccaccttgta cggtccattg atccaattga agatcggtta catcccatgt 240
gttgttgctt ctactccaga attggctaag gaattcttaa agactcacga attggctttc 300
tcctctagaa agcactccgc tgccattaag ttgttgacct acgatgtttc tttcgctttc 360
gctccatacg gtccatactg gaagttcatc aaaaagactt gtaccttcga attgttgggt 420
actagaaaca tgaaccactt cttgccaatt agaaccaacg aaattagaag attcttgcaa 480
gttatgttgg aaaaggccaa ggcttctgaa ggtgttaacg ttactgaaga attgatcaag 540
ttgactaaca acgttatctc tcaaatgatg ttctctacta gatcttctgg taccgaaggt 600
gaagctgaag aagttagaac tttggttaga gaagttactc aaatcttcgg tgaattcaac 660
gtttctgatt tcatcaagtt gtgtaagaac attgatattg gtggtttcaa gaagagatct 720
gaagatatcc aaaagagata cgatgctttg ttggaaaaga tcatctctga aagagaatct 780
gaaagagcta gaagaggtaa gaacagagaa actttgggtg aagaaggtgg taaggatttc 840
ttggacatga tgttggatac tatggaagat ggtaagtgtg aagttgaaat cactagagat 900
cacattaagg ccttggtttt ggatttcttg actgctgcca ctgatactac tgctattgct 960
gttgaatgga ctttggctga attgatctct aacccagaag ttttcgataa ggctagagaa 1020
gaaatcgata aggtcgttgg taagcacaga ttggtcactg aattggacac tccaaacttg 1080
ccatacatcc acgctatcat caaggaatct ttcagattgc acccaccaat tccattggtc 1140
atcagaaagt ctgtccaaga ttgtactgtt ggtggttacc acatctctgc taacactatc 1200
ttgttcatca acatttgggc catcggtaga aacccaaagt actgggaatc tccaatgaag 1260
ttctggccag aaagattctt ggaatccaac gaaccaggtt ctgttggttc tactgatatt 1320
aagggtcacc actacgaatt gttgccattc ggttctggta gaagaggttg tccaggtatg 1380
gctttggcca tgcaagaatt gccagttgtt ttggccgcca tgatccaatg tttcaactgg 1440
aagccagtta ctttggacgg tgaagaattg gatatgtctg aaagaccagg tttgactgct 1500
ccaagagccc acgatttggt ttgtgttcca tccgctagaa ttaactcttt cgataacttc 1560
taa 1563
<210> 37
<211> 366
<212> PRT
<213> 荷兰芹(Petroselinum crispum)
<400> 37
Met Ser Ala Pro Thr Thr Ile Thr Ala Leu Ala Lys Glu Lys Thr Leu
1 5 10 15
Asn Leu Asp Phe Val Arg Asp Glu Asp Glu Arg Pro Lys Val Ala Tyr
20 25 30
Asn Gln Phe Ser Asn Glu Ile Pro Ile Ile Ser Leu Ala Gly Leu Asp
35 40 45
Asp Asp Ser Asp Gly Arg Arg Pro Glu Ile Cys Arg Lys Ile Val Lys
50 55 60
Ala Cys Glu Asp Trp Gly Ile Phe Gln Val Val Asp His Gly Ile Asp
65 70 75 80
Ser Gly Leu Ile Ser Glu Met Thr Arg Leu Ser Arg Glu Phe Phe Ala
85 90 95
Leu Pro Ala Glu Glu Lys Leu Glu Tyr Asp Thr Thr Gly Gly Lys Arg
100 105 110
Gly Gly Phe Thr Ile Ser Thr Val Leu Gln Gly Asp Asp Ala Met Asp
115 120 125
Trp Arg Glu Phe Val Thr Tyr Phe Ser Tyr Pro Ile Asn Ala Arg Asp
130 135 140
Tyr Ser Arg Trp Pro Lys Lys Pro Glu Gly Trp Arg Ser Thr Thr Glu
145 150 155 160
Val Tyr Ser Glu Lys Leu Met Val Leu Gly Ala Lys Leu Leu Glu Val
165 170 175
Leu Ser Glu Ala Met Gly Leu Glu Lys Gly Asp Leu Thr Lys Ala Cys
180 185 190
Val Asp Met Glu Gln Lys Val Leu Ile Asn Tyr Tyr Pro Thr Cys Pro
195 200 205
Gln Pro Asp Leu Thr Leu Gly Val Arg Arg His Thr Asp Pro Gly Thr
210 215 220
Ile Thr Ile Leu Leu Gln Asp Met Val Gly Gly Leu Gln Ala Thr Arg
225 230 235 240
Asp Gly Gly Lys Thr Trp Ile Thr Val Gln Pro Val Glu Gly Ala Phe
245 250 255
Val Val Asn Leu Gly Asp His Gly His Tyr Leu Ser Asn Gly Arg Phe
260 265 270
Arg Asn Ala Asp His Gln Ala Val Val Asn Ser Thr Ser Ser Arg Leu
275 280 285
Ser Ile Ala Thr Phe Gln Asn Pro Ala Gln Asn Ala Ile Val Tyr Pro
290 295 300
Leu Lys Ile Arg Glu Gly Glu Lys Ala Ile Leu Asp Glu Ala Ile Thr
305 310 315 320
Tyr Ala Glu Met Tyr Lys Lys Cys Met Thr Lys His Ile Glu Val Ala
325 330 335
Thr Arg Lys Lys Leu Ala Lys Glu Lys Arg Leu Gln Asp Glu Lys Ala
340 345 350
Lys Leu Glu Met Lys Ser Lys Ser Ala Asp Glu Asn Leu Ala
355 360 365
<210> 38
<211> 1101
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:37的编码序列
<400> 38
atgtccgctc caactactat caccgctttg gccaaggaaa agactttgaa cttggacttc 60
gttagagatg aagatgaaag accaaaggtt gcttacaacc aattctctaa cgaaattcca 120
attatttctt tggccggttt ggatgacgat tctgatggta gaaggccaga aatctgtaga 180
aagatcgtta aggcttgtga agattggggt attttccaag ttgttgatca cggtattgac 240
tctggtttga tttccgaaat gactagattg tctagagaat tcttcgcttt gccagctgaa 300
gaaaagttgg aatacgatac tactggtggt aagagaggtg gtttcactat ctccactgtt 360
ttgcaaggtg acgacgctat ggattggaga gaattcgtta cttacttctc ttacccaatc 420
aacgctagag actactctag atggccaaag aagccagaag gttggagatc taccactgaa 480
gtttactctg aaaagttgat ggttttgggt gccaagttgt tggaagtttt gtctgaagcc 540
atgggtttgg aaaagggtga tttgactaag gcttgtgttg atatggaaca aaaggttttg 600
attaactact acccaacttg tccacaacca gacttgactt tgggtgtcag gagacacact 660
gatccaggta ctattaccat tttgttgcaa gacatggttg gtggtttgca agccaccaga 720
gatggtggta agacttggat tactgttcaa ccagttgaag gtgctttcgt tgtcaacttg 780
ggtgatcacg gtcactactt gtctaacggt agattcagaa acgctgacca ccaagctgtt 840
gttaactcta cctcttctag attgtctatt gctactttcc aaaacccagc tcaaaacgct 900
atcgtttacc cattgaagat cagagaaggt gaaaaggcta ttttggatga agccatcacc 960
tacgctgaaa tgtacaagaa gtgtatgact aagcacattg aagttgctac tagaaagaag 1020
ttggccaagg aaaagagatt gcaagacgaa aaggccaagt tggaaatgaa gtccaagtct 1080
gctgatgaaa acttggctta a 1101
<210> 39
<211> 507
<212> PRT
<213> 约氏黄杆菌(Flavobacterium johnsoniae)
<400> 39
Met Ser Asn Thr Ile Asn Glu Tyr Leu Ser Leu Glu Glu Phe Glu Ala
1 5 10 15
Ile Ile Phe Gly Asn Gln Lys Val Thr Ile Ser Asp Val Val Val Asn
20 25 30
Arg Val Asn Glu Ser Phe Asn Phe Leu Lys Glu Phe Ser Gly Asn Lys
35 40 45
Val Ile Tyr Gly Val Asn Thr Gly Phe Gly Pro Met Ala Gln Tyr Arg
50 55 60
Ile Lys Glu Ser Asp Gln Ile Gln Leu Gln Tyr Asn Leu Ile Arg Ser
65 70 75 80
His Ser Ser Gly Thr Gly Lys Pro Leu Ser Pro Val Cys Ala Lys Ala
85 90 95
Ala Ile Leu Ala Arg Leu Asn Thr Leu Ser Leu Gly Asn Ser Gly Val
100 105 110
His Pro Ser Val Ile Asn Leu Met Ser Glu Leu Ile Asn Lys Asp Ile
115 120 125
Thr Pro Leu Ile Phe Glu His Gly Gly Val Gly Ala Ser Gly Asp Leu
130 135 140
Val Gln Leu Ser His Leu Ala Leu Val Leu Ile Gly Glu Gly Glu Val
145 150 155 160
Phe Tyr Lys Gly Glu Arg Arg Pro Thr Pro Glu Val Phe Glu Ile Glu
165 170 175
Gly Leu Lys Pro Ile Gln Val Glu Ile Arg Glu Gly Leu Ala Leu Ile
180 185 190
Asn Gly Thr Ser Val Met Thr Gly Ile Gly Val Val Asn Val Tyr His
195 200 205
Ala Lys Lys Leu Leu Asp Trp Ser Leu Lys Ser Ser Cys Ala Ile Asn
210 215 220
Glu Leu Val Gln Ala Tyr Asp Asp His Phe Ser Ala Glu Leu Asn Gln
225 230 235 240
Thr Lys Arg His Lys Gly Gln Gln Glu Ile Ala Leu Lys Met Arg Gln
245 250 255
Asn Leu Ser Asp Ser Thr Leu Ile Arg Lys Arg Glu Asp His Leu Tyr
260 265 270
Ser Gly Glu Asn Thr Glu Glu Ile Phe Lys Glu Lys Val Gln Glu Tyr
275 280 285
Tyr Ser Leu Arg Cys Val Pro Gln Ile Leu Gly Pro Val Leu Glu Thr
290 295 300
Ile Asn Asn Val Ala Ser Ile Leu Glu Asp Glu Phe Asn Ser Ala Asn
305 310 315 320
Asp Asn Pro Ile Ile Asp Val Lys Asn Gln His Val Tyr His Gly Gly
325 330 335
Asn Phe His Gly Asp Tyr Ile Ser Leu Glu Met Asp Lys Leu Lys Ile
340 345 350
Val Ile Thr Lys Leu Thr Met Leu Ala Glu Arg Gln Leu Asn Tyr Leu
355 360 365
Leu Asn Ser Lys Ile Asn Glu Leu Leu Pro Pro Phe Val Asn Leu Gly
370 375 380
Thr Leu Gly Phe Asn Phe Gly Met Gln Gly Val Gln Phe Thr Ala Thr
385 390 395 400
Ser Thr Thr Ala Glu Ser Gln Met Leu Ser Asn Pro Met Tyr Val His
405 410 415
Ser Ile Pro Asn Asn Asn Asp Asn Gln Asp Ile Val Ser Met Gly Thr
420 425 430
Asn Ser Ala Val Ile Thr Ser Lys Val Ile Glu Asn Ala Phe Glu Val
435 440 445
Leu Ala Ile Glu Met Ile Thr Ile Val Gln Ala Ile Asp Tyr Leu Gly
450 455 460
Gln Lys Asp Lys Ile Ser Ser Val Ser Lys Lys Trp Tyr Asp Glu Ile
465 470 475 480
Arg Asn Ile Ile Pro Thr Phe Lys Glu Asp Gln Val Met Tyr Pro Phe
485 490 495
Val Gln Lys Val Lys Asp His Leu Ile Asn Asn
500 505
<210> 40
<211> 1524
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:39的编码序列
<400> 40
atgtccaaca ctattaacga atacttgtct ttggaagaat tcgaagccat catcttcggt 60
aaccaaaagg ttactatttc tgacgttgtc gttaacagag ttaacgaatc tttcaacttc 120
ttgaaggaat tctctggtaa caaggttatt tacggtgtta acactggttt cggtccaatg 180
gctcaataca gaattaagga atctgatcaa attcaattgc aatacaactt gattagatct 240
cactcttctg gtaccggtaa gccattgtct ccagtttgtg ctaaggctgc tattttggct 300
agattgaaca ctttgtcttt gggtaactct ggtgttcacc catctgttat caacttgatg 360
tctgaattga tcaacaagga tattacccca ttgatcttcg aacacggtgg tgttggtgcc 420
tctggtgact tggttcaatt gtctcacttg gctttggttt tgattggtga aggtgaagtt 480
ttctacaagg gtgaaagaag gccaactcca gaagttttcg aaattgaagg tttgaagcca 540
attcaagttg aaattagaga aggtttggct ttgattaacg gtacttctgt tatgactggt 600
attggtgttg ttaacgttta ccacgctaag aagttgttgg actggtcttt gaaatcttct 660
tgtgctatta acgaattggt tcaagcttac gacgatcact tctctgctga attgaaccaa 720
actaagagac acaagggtca acaagaaatt gctttgaaga tgagacaaaa cttgtctgac 780
tctactttga tcagaaagag agaagatcac ttgtactctg gtgaaaacac cgaagaaatc 840
ttcaaggaaa aggttcaaga atactactct ttgagatgtg ttccacaaat tttgggtcca 900
gttttggaaa ctattaacaa cgttgcttct attttggaag atgaattcaa ctctgctaac 960
gataacccaa ttatcgatgt taagaaccaa cacgtttacc acggtggtaa cttccacggt 1020
gattacattt ctttggaaat ggataagttg aagattgtta ttaccaagtt gactatgttg 1080
gctgaaagac aattgaacta cttgttgaac tctaagatca acgaattgtt gccaccattc 1140
gttaacttgg gtactttggg tttcaacttc ggtatgcaag gtgttcaatt cactgctact 1200
tctactactg ctgaatctca aatgttgtct aacccaatgt acgttcactc tattccaaac 1260
aacaacgaca accaagatat cgtttctatg ggtactaact ctgctgttat tacctctaag 1320
gttatcgaaa acgctttcga agttttggct atcgaaatga ttactatcgt tcaagctatt 1380
gattacttgg gtcaaaagga caagatttct tctgtttcta agaagtggta cgatgaaatt 1440
agaaacatca ttccaacttt caaggaagat caagttatgt acccattcgt tcaaaaggtt 1500
aaggatcact tgatcaacaa ctaa 1524
<210> 41
<211> 694
<212> PRT
<213> 黏红酵母(Rhodotorula glutinis)
<400> 41
Met Ser Ala Pro Arg Pro Thr Ser Gln Ser Gln Ala Arg Thr Cys Pro
1 5 10 15
Thr Thr Gln Val Thr Gln Val Asp Ile Val Glu Lys Met Leu Ala Ala
20 25 30
Pro Thr Asp Ser Thr Leu Glu Leu Asp Gly Tyr Ser Leu Asn Leu Gly
35 40 45
Asp Val Val Ser Ala Ala Arg Lys Gly Arg Pro Val Arg Val Lys Asp
50 55 60
Ser Asp Glu Ile Arg Ser Lys Ile Asp Lys Ser Val Glu Phe Leu Arg
65 70 75 80
Ser Gln Leu Ser Met Ser Val Tyr Gly Val Thr Thr Gly Phe Gly Gly
85 90 95
Ser Ala Asp Thr Arg Thr Glu Asp Ala Ile Ser Leu Gln Lys Ala Leu
100 105 110
Leu Glu His Gln Leu Cys Gly Val Leu Pro Ser Ser Phe Asp Ser Phe
115 120 125
Arg Leu Gly Arg Gly Leu Glu Asn Ser Leu Pro Leu Glu Val Val Arg
130 135 140
Gly Ala Met Thr Ile Arg Val Asn Ser Leu Thr Arg Gly His Ser Ala
145 150 155 160
Val Arg Leu Val Val Leu Glu Ala Leu Thr Asn Phe Leu Asn His Gly
165 170 175
Ile Thr Pro Ile Val Pro Leu Arg Gly Thr Ile Ser Ala Ser Gly Asp
180 185 190
Leu Ser Pro Leu Ser Tyr Ile Ala Ala Ala Ile Ser Gly His Pro Asp
195 200 205
Ser Lys Val His Val Val His Glu Gly Lys Glu Lys Ile Leu Tyr Ala
210 215 220
Arg Glu Ala Met Ala Leu Phe Asn Leu Glu Pro Val Val Leu Gly Pro
225 230 235 240
Lys Glu Gly Leu Gly Leu Val Asn Gly Thr Ala Val Ser Ala Ser Met
245 250 255
Ala Thr Leu Ala Leu His Asp Ala His Met Leu Ser Leu Leu Ser Gln
260 265 270
Ser Leu Thr Ala Met Thr Val Glu Ala Met Val Gly His Ala Gly Ser
275 280 285
Phe His Pro Phe Leu His Asp Val Thr Arg Pro His Pro Thr Gln Ile
290 295 300
Glu Val Ala Gly Asn Ile Arg Lys Leu Leu Glu Gly Ser Arg Phe Ala
305 310 315 320
Val His His Glu Glu Glu Val Lys Val Lys Asp Asp Glu Gly Ile Leu
325 330 335
Arg Gln Asp Arg Tyr Pro Leu Arg Thr Ser Pro Gln Trp Leu Gly Pro
340 345 350
Leu Val Ser Asp Leu Ile His Ala His Ala Val Leu Thr Ile Glu Ala
355 360 365
Gly Gln Ser Thr Thr Asp Asn Pro Leu Ile Asp Val Glu Asn Lys Thr
370 375 380
Ser His His Gly Gly Asn Phe Gln Ala Ala Ala Val Ala Asn Thr Met
385 390 395 400
Glu Lys Thr Arg Leu Gly Leu Ala Gln Ile Gly Lys Leu Asn Phe Thr
405 410 415
Gln Leu Thr Glu Met Leu Asn Ala Gly Met Asn Arg Gly Leu Pro Ser
420 425 430
Cys Leu Ala Ala Glu Asp Pro Ser Leu Ser Tyr His Cys Lys Gly Leu
435 440 445
Asp Ile Ala Ala Ala Ala Tyr Thr Ser Glu Leu Gly His Leu Ala Asn
450 455 460
Pro Val Thr Thr His Val Gln Pro Ala Glu Met Ala Asn Gln Ala Val
465 470 475 480
Asn Ser Leu Ala Leu Ile Ser Ala Arg Arg Thr Thr Glu Ser Asn Asp
485 490 495
Val Leu Ser Leu Leu Leu Ala Thr His Leu Tyr Cys Val Leu Gln Ala
500 505 510
Ile Asp Leu Arg Ala Ile Glu Phe Glu Phe Lys Lys Gln Phe Gly Pro
515 520 525
Ala Ile Val Ser Leu Ile Asp Gln His Phe Gly Ser Ala Met Thr Gly
530 535 540
Ser Asn Leu Arg Asp Glu Leu Val Glu Lys Val Asn Lys Thr Leu Ala
545 550 555 560
Lys Arg Leu Glu Gln Thr Asn Ser Tyr Asp Leu Val Pro Arg Trp His
565 570 575
Asp Ala Phe Ser Phe Ala Ala Gly Thr Val Val Glu Val Leu Ser Ser
580 585 590
Thr Ser Leu Ser Leu Ala Ala Val Asn Ala Trp Lys Val Ala Ala Ala
595 600 605
Glu Ser Ala Ile Ser Leu Thr Arg Gln Val Arg Glu Thr Phe Trp Ser
610 615 620
Ala Ala Ser Thr Ser Ser Pro Ala Leu Ser Tyr Leu Ser Pro Arg Thr
625 630 635 640
Gln Ile Leu Tyr Ala Phe Val Arg Glu Glu Leu Gly Val Lys Ala Arg
645 650 655
Arg Gly Asp Val Phe Leu Gly Lys Gln Glu Val Thr Ile Gly Ser Asn
660 665 670
Val Ser Lys Ile Tyr Glu Ala Ile Lys Ser Gly Arg Ile Asn Asn Val
675 680 685
Leu Leu Lys Met Leu Ala
690
<210> 42
<211> 2085
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:41的编码序列
<400> 42
atgtccgctc caagaccaac ttctcaatct caagccagaa cttgtccaac cacccaagtt 60
acccaagttg atatcgttga aaagatgttg gctgctccaa ctgattctac cttggaattg 120
gacggttact ctttgaactt gggtgatgtt gtttctgctg ctagaaaggg tagaccagtt 180
agagttaagg attctgatga aatcagatct aagatcgaca agtctgttga attcttgaga 240
tctcaattgt ctatgtctgt ttacggtgtt accaccggtt tcggtggttc cgctgacacc 300
agaaccgaag atgctatttc tttgcaaaag gctttgttgg aacaccaatt gtgtggtgtt 360
ttgccatctt ctttcgactc tttcagattg ggtagaggtt tggaaaactc tttgccattg 420
gaagttgtta gaggtgctat gaccattaga gttaactctt tgaccagagg tcactctgct 480
gttagattgg ttgttttgga agctttgacc aacttcttga accacggtat taccccaatt 540
gttccattga gaggtaccat ctccgcttct ggtgatttgt ctccattgtc ttacattgct 600
gctgctattt ctggtcaccc agattctaag gttcacgttg ttcacgaagg taaggaaaag 660
atcttgtacg ctagagaagc tatggctttg ttcaacttgg aaccagttgt tttgggtcca 720
aaggaaggtt tgggtttggt taacggtacc gctgtttccg cttctatggc taccttggct 780
ttgcacgacg ctcacatgtt gtctttgttg tctcaatctt tgaccgctat gaccgttgaa 840
gctatggttg gtcacgctgg ttctttccac ccattcttgc acgatgttac cagaccacac 900
ccaacccaaa tcgaagttgc tggtaacatt agaaagttgt tggaaggttc tagattcgct 960
gttcaccacg aagaagaagt taaggttaag gatgatgaag gtattttgag acaagataga 1020
tacccattga gaacctctcc acaatggttg ggtccattgg tttccgactt gattcacgct 1080
cacgccgttt tgaccatcga agctggtcaa tctaccaccg ataacccatt gatcgatgtt 1140
gaaaacaaga cctctcacca cggtggtaac ttccaagctg ctgctgttgc caacactatg 1200
gaaaagacca gattgggttt ggcccaaatc ggtaagttga acttcaccca attgaccgaa 1260
atgttgaacg ctggtatgaa cagaggtttg ccatcttgtt tggctgctga agatccatcc 1320
ttgtcttacc actgtaaggg tttggacatt gctgctgctg cttacacctc tgaattgggt 1380
cacttggcta acccagttac cacccacgtt caaccagctg aaatggctaa ccaagctgtt 1440
aactctttgg ctttgatttc tgctagaaga accaccgaat ctaacgacgt tttgtccttg 1500
ttgttggcta cccacttgta ctgtgttttg caagctatcg acttgagagc tattgaattc 1560
gaattcaaga agcaattcgg tccagccatt gtttctttga tcgaccaaca cttcggttct 1620
gctatgaccg gttctaactt gagagatgaa ttggttgaaa aggttaacaa gactttggcc 1680
aagagattgg aacaaaccaa ctcttacgat ttggttccaa gatggcacga cgctttctct 1740
ttcgctgctg gtactgttgt tgaagttttg tcctctacct ctttgtcttt ggctgccgtt 1800
aacgcttgga aggttgctgc tgccgaatct gctatctcct tgaccagaca agttagagaa 1860
accttctggt ccgctgcttc tacctcctct ccagctttgt cttacttgtc tccaagaacc 1920
caaatcttgt acgctttcgt tagagaagaa ttgggtgtta aggccagaag aggtgacgtt 1980
ttcttgggta agcaagaagt taccatcggt tctaacgttt ctaagattta cgaagccatc 2040
aagtctggta gaatcaacaa cgttttgttg aagatgttgg cttaa 2085
<210> 43
<211> 562
<212> PRT
<213> 拟南芥(Arabidopsis thaliana)
<400> 43
Met Ser Ala Pro Gln Glu Gln Ala Val Ser Gln Val Met Glu Lys Gln
1 5 10 15
Ser Asn Asn Asn Asn Ser Asp Val Ile Phe Arg Ser Lys Leu Pro Asp
20 25 30
Ile Tyr Ile Pro Asn His Leu Ser Leu His Asp Tyr Ile Phe Gln Asn
35 40 45
Ile Ser Glu Phe Ala Thr Lys Pro Cys Leu Ile Asn Gly Pro Thr Gly
50 55 60
His Val Tyr Thr Tyr Ser Asp Val His Val Ile Ser Arg Gln Ile Ala
65 70 75 80
Ala Asn Phe His Lys Leu Gly Val Asn Gln Asn Asp Val Val Met Leu
85 90 95
Leu Leu Pro Asn Cys Pro Glu Phe Val Leu Ser Phe Leu Ala Ala Ser
100 105 110
Phe Arg Gly Ala Thr Ala Thr Ala Ala Asn Pro Phe Phe Thr Pro Ala
115 120 125
Glu Ile Ala Lys Gln Ala Lys Ala Ser Asn Thr Lys Leu Ile Ile Thr
130 135 140
Glu Ala Arg Tyr Val Asp Lys Ile Lys Pro Leu Gln Asn Asp Asp Gly
145 150 155 160
Val Val Ile Val Cys Ile Asp Asp Asn Glu Ser Val Pro Ile Pro Glu
165 170 175
Gly Cys Leu Arg Phe Thr Glu Leu Thr Gln Ser Thr Thr Glu Ala Ser
180 185 190
Glu Val Ile Asp Ser Val Glu Ile Ser Pro Asp Asp Val Val Ala Leu
195 200 205
Pro Tyr Ser Ser Gly Thr Thr Gly Leu Pro Lys Gly Val Met Leu Thr
210 215 220
His Lys Gly Leu Val Thr Ser Val Ala Gln Gln Val Asp Gly Glu Asn
225 230 235 240
Pro Asn Leu Tyr Phe His Ser Asp Asp Val Ile Leu Cys Val Leu Pro
245 250 255
Met Phe His Ile Tyr Ala Leu Asn Ser Ile Met Leu Cys Gly Leu Arg
260 265 270
Val Gly Ala Ala Ile Leu Ile Met Pro Lys Phe Glu Ile Asn Leu Leu
275 280 285
Leu Glu Leu Ile Gln Arg Cys Lys Val Thr Val Ala Pro Met Val Pro
290 295 300
Pro Ile Val Leu Ala Ile Ala Lys Ser Ser Glu Thr Glu Lys Tyr Asp
305 310 315 320
Leu Ser Ser Ile Arg Val Val Lys Ser Gly Ala Ala Pro Leu Gly Lys
325 330 335
Glu Leu Glu Asp Ala Val Asn Ala Lys Phe Pro Asn Ala Lys Leu Gly
340 345 350
Gln Gly Tyr Gly Met Thr Glu Ala Gly Pro Val Leu Ala Met Ser Leu
355 360 365
Gly Phe Ala Lys Glu Pro Phe Pro Val Lys Ser Gly Ala Cys Gly Thr
370 375 380
Val Val Arg Asn Ala Glu Met Lys Ile Val Asp Pro Asp Thr Gly Asp
385 390 395 400
Ser Leu Ser Arg Asn Gln Pro Gly Glu Ile Cys Ile Arg Gly His Gln
405 410 415
Ile Met Lys Gly Tyr Leu Asn Asn Pro Ala Ala Thr Ala Glu Thr Ile
420 425 430
Asp Lys Asp Gly Trp Leu His Thr Gly Asp Ile Gly Leu Ile Asp Asp
435 440 445
Asp Asp Glu Leu Phe Ile Val Asp Arg Leu Lys Glu Leu Ile Lys Tyr
450 455 460
Lys Gly Phe Gln Val Ala Pro Ala Glu Leu Glu Ala Leu Leu Ile Gly
465 470 475 480
His Pro Asp Ile Thr Asp Val Ala Val Val Ala Met Lys Glu Glu Ala
485 490 495
Ala Gly Glu Val Pro Val Ala Phe Val Val Lys Ser Lys Asp Ser Glu
500 505 510
Leu Ser Glu Asp Asp Val Lys Gln Phe Val Ser Lys Gln Val Val Phe
515 520 525
Tyr Lys Arg Ile Asn Lys Val Phe Phe Thr Glu Ser Ile Pro Lys Ala
530 535 540
Pro Ser Gly Lys Ile Leu Arg Lys Asp Leu Arg Ala Lys Leu Ala Asn
545 550 555 560
Gly Leu
<210> 44
<211> 1689
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:43的编码序列
<400> 44
atgtccgctc cacaagaaca agctgtttct caagttatgg aaaagcaatc taacaacaac 60
aactctgacg tcattttcag atctaagttg ccagatattt acatcccaaa ccacttgtct 120
ttgcacgact acatcttcca aaacatctcc gaattcgcca ctaagccatg tttgatcaac 180
ggtccaaccg gtcacgttta cacttactcc gacgtccacg tcatctccag acaaatcgcc 240
gccaacttcc acaagttggg tgttaaccaa aacgacgtcg tcatgttgtt gttgccaaac 300
tgtccagaat tcgtcttgtc tttcttggcc gcctccttca gaggtgctac cgccaccgcc 360
gctaacccat tcttcactcc agctgaaatc gctaagcaag ccaaggcctc caacaccaag 420
ttgatcatca ccgaagctag atacgtcgac aagatcaagc cattgcaaaa cgacgacggt 480
gttgtcatcg tctgtatcga cgacaacgaa tccgttccaa tcccagaagg ttgtttgaga 540
ttcaccgaat tgactcaatc tactaccgaa gcttctgaag tcatcgactc tgttgaaatt 600
tctccagacg acgttgttgc tttgccatac tcctctggta ctactggttt gccaaagggt 660
gttatgttga ctcacaaggg tttggtcact tctgttgctc aacaagtcga cggtgaaaac 720
ccaaacttgt acttccactc tgatgacgtc atcttgtgtg ttttgccaat gttccacatc 780
tacgctttga actctatcat gttgtgtggt ttgagagttg gtgctgctat tttgatcatg 840
ccaaagttcg aaatcaactt gttgttggaa ttgatccaaa gatgtaaggt tactgttgct 900
ccaatggttc caccaattgt tttggccatt gctaaatctt ctgaaactga aaagtacgat 960
ttatcttcta tcagagttgt taagtctggt gctgctccat tgggtaagga attggaagat 1020
gccgttaacg ccaagttccc aaacgccaag ttgggtcaag gttacggtat gactgaagct 1080
ggtccagttt tggctatgtc tttgggtttc gctaaggaac cattcccagt taagtctggt 1140
gcttgtggta ctgttgttag aaacgctgaa atgaagatcg ttgatccaga caccggtgat 1200
tctttgtcta gaaaccaacc aggtgaaatt tgtattagag gtcaccaaat catgaagggt 1260
tacttgaaca acccagctgc tactgctgaa accattgata aggacggttg gttgcacact 1320
ggtgatattg gtttgatcga tgacgatgac gaattgttca tcgttgatag attgaaggaa 1380
ttgatcaagt acaagggttt ccaagttgct ccagctgaat tggaagcttt gttgatcggt 1440
cacccagaca ttactgatgt tgctgttgtc gctatgaagg aagaagctgc tggtgaagtt 1500
ccagttgctt tcgttgttaa gtctaaggat tctgaattgt ctgaagatga tgttaagcaa 1560
ttcgtttcta agcaagttgt tttctacaag agaatcaaca aggttttctt cactgaatcc 1620
attccaaagg ctccatctgg taagatcttg agaaaggatt tgagagctaa gttggctaac 1680
ggtttgtaa 1689
<210> 45
<211> 545
<212> PRT
<213> 荷兰芹(Petroselinum crispum)
<400> 45
Met Ser Gly Asp Cys Val Ala Pro Lys Glu Asp Leu Ile Phe Arg Ser
1 5 10 15
Lys Leu Pro Asp Ile Tyr Ile Pro Lys His Leu Pro Leu His Thr Tyr
20 25 30
Cys Phe Glu Asn Ile Ser Lys Val Gly Asp Lys Ser Cys Leu Ile Asn
35 40 45
Gly Ala Thr Gly Glu Thr Phe Thr Tyr Ser Gln Val Glu Leu Leu Ser
50 55 60
Arg Lys Val Ala Ser Gly Leu Asn Lys Leu Gly Ile Gln Gln Gly Asp
65 70 75 80
Thr Ile Met Leu Leu Leu Pro Asn Ser Pro Glu Tyr Phe Phe Ala Phe
85 90 95
Leu Gly Ala Ser Tyr Arg Gly Ala Ile Ser Thr Met Ala Asn Pro Phe
100 105 110
Phe Thr Ser Ala Glu Val Ile Lys Gln Leu Lys Ala Ser Gln Ala Lys
115 120 125
Leu Ile Ile Thr Gln Ala Cys Tyr Val Asp Lys Val Lys Asp Tyr Ala
130 135 140
Ala Glu Lys Asn Ile Gln Ile Ile Cys Ile Asp Asp Ala Pro Gln Asp
145 150 155 160
Cys Leu His Phe Ser Lys Leu Met Glu Ala Asp Glu Ser Glu Met Pro
165 170 175
Glu Val Val Ile Asn Ser Asp Asp Val Val Ala Leu Pro Tyr Ser Ser
180 185 190
Gly Thr Thr Gly Leu Pro Lys Gly Val Met Leu Thr His Lys Gly Leu
195 200 205
Val Thr Ser Val Ala Gln Gln Val Asp Gly Asp Asn Pro Asn Leu Tyr
210 215 220
Met His Ser Glu Asp Val Met Ile Cys Ile Leu Pro Leu Phe His Ile
225 230 235 240
Tyr Ser Leu Asn Ala Val Leu Cys Cys Gly Leu Arg Ala Gly Val Thr
245 250 255
Ile Leu Ile Met Gln Lys Phe Asp Ile Val Pro Phe Leu Glu Leu Ile
260 265 270
Gln Lys Tyr Lys Val Thr Ile Gly Pro Phe Val Pro Pro Ile Val Leu
275 280 285
Ala Ile Ala Lys Ser Pro Val Val Asp Lys Tyr Asp Leu Ser Ser Val
290 295 300
Arg Thr Val Met Ser Gly Ala Ala Pro Leu Gly Lys Glu Leu Glu Asp
305 310 315 320
Ala Val Arg Ala Lys Phe Pro Asn Ala Lys Leu Gly Gln Gly Tyr Gly
325 330 335
Met Thr Glu Ala Gly Pro Val Leu Ala Met Cys Leu Ala Phe Ala Lys
340 345 350
Glu Pro Tyr Glu Ile Lys Ser Gly Ala Cys Gly Thr Val Val Arg Asn
355 360 365
Ala Glu Met Lys Ile Val Asp Pro Glu Thr Asn Ala Ser Leu Pro Arg
370 375 380
Asn Gln Arg Gly Glu Ile Cys Ile Arg Gly Asp Gln Ile Met Lys Gly
385 390 395 400
Tyr Leu Asn Asp Pro Glu Ser Thr Arg Thr Thr Ile Asp Glu Glu Gly
405 410 415
Trp Leu His Thr Gly Asp Ile Gly Phe Ile Asp Asp Asp Asp Glu Leu
420 425 430
Phe Ile Val Asp Arg Leu Lys Glu Ile Ile Lys Tyr Lys Gly Phe Gln
435 440 445
Val Ala Pro Ala Glu Leu Glu Ala Leu Leu Leu Thr His Pro Thr Ile
450 455 460
Ser Asp Ala Ala Val Val Pro Met Ile Asp Glu Lys Ala Gly Glu Val
465 470 475 480
Pro Val Ala Phe Val Val Arg Thr Asn Gly Phe Thr Thr Thr Glu Glu
485 490 495
Glu Ile Lys Gln Phe Val Ser Lys Gln Val Val Phe Tyr Lys Arg Ile
500 505 510
Phe Arg Val Phe Phe Val Asp Ala Ile Pro Lys Ser Pro Ser Gly Lys
515 520 525
Ile Leu Arg Lys Asp Leu Arg Ala Arg Ile Ala Ser Gly Asp Leu Pro
530 535 540
Lys
545
<210> 46
<211> 1638
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:45的编码序列
<400> 46
atgtccggtg attgtgttgc tccaaaggaa gatttgattt tcagatctaa gttgccagat 60
atttacatcc caaagcactt gccattgcac acttactgtt tcgaaaacat ctctaaggtt 120
ggtgacaagt cctgtttgat caacggtgct actggtgaaa ctttcactta ctctcaagtt 180
gaattgttgt ccagaaaggt tgcttctggt ttgaacaagt tgggtattca acaaggtgat 240
accatcatgt tgttgttgcc aaactcccca gaatacttct tcgctttctt gggtgcttct 300
tacagaggtg ctatttctac tatggccaac ccattcttca cttctgctga agttatcaag 360
caattgaagg cttcccaagc taagttgatc attactcaag cttgttacgt tgacaaggtt 420
aaggactacg ctgctgaaaa gaacatccaa atcatttgta tcgatgatgc tccacaagat 480
tgtttgcact tctccaagtt gatggaagct gatgaatctg aaatgccaga agttgttatc 540
aactctgacg atgtcgtcgc tttgccatac tcttctggta ctactggttt gccaaagggt 600
gttatgttga ctcacaaggg tttggttact tctgttgctc aacaagttga tggtgacaac 660
ccaaacttgt acatgcactc tgaagatgtt atgatctgta tcttgccatt gttccacatt 720
tactctttga acgctgtttt gtgttgtggt ttgagagctg gtgttactat cttgattatg 780
caaaagttcg atattgttcc attcttggaa ttgatccaaa agtacaaggt tactattggt 840
ccattcgttc caccaattgt tttggctatt gctaagtctc cagttgttga taagtacgac 900
ttatcttctg ttagaactgt tatgtctggt gctgctccat tgggtaagga attggaagat 960
gctgttagag ctaagttccc aaacgccaag ttgggtcaag gttacggtat gactgaagct 1020
ggtccagttt tggctatgtg tttggctttc gctaaggaac catacgaaat caagtctggt 1080
gcctgtggta ctgttgttag aaacgctgaa atgaagattg ttgatccaga aaccaacgcc 1140
tctttgccaa gaaaccaaag aggtgaaatt tgtattagag gtgaccaaat tatgaagggt 1200
tacttgaacg atccagaatc tactagaact actatcgacg aagaaggttg gttgcacact 1260
ggtgatatcg gtttcattga cgacgatgat gaattgttca ttgttgatag attgaaggaa 1320
atcatcaagt acaagggttt ccaagttgcc ccagctgaat tggaagcttt gttgttgact 1380
cacccaacca tttccgatgc tgctgttgtt ccaatgatcg atgaaaaggc tggtgaagtt 1440
ccagttgctt tcgttgttag aactaacggt ttcaccacca ctgaagaaga aatcaagcaa 1500
ttcgtttcta agcaagttgt tttctacaag agaatcttca gagttttctt cgttgatgct 1560
attccaaagt ctccatctgg taagattttg agaaaggact tgagagctag aatcgcttcc 1620
ggtgatttgc caaagtaa 1638
<210> 47
<211> 545
<212> PRT
<213> 荷兰芹(Petroselinum crispum)
<400> 47
Met Ser Gly Asp Cys Val Ala Pro Lys Glu Asp Leu Ile Phe Arg Ser
1 5 10 15
Lys Leu Pro Asp Ile Tyr Ile Pro Lys His Leu Pro Leu His Thr Tyr
20 25 30
Cys Phe Glu Asn Ile Ser Lys Val Gly Asp Lys Ser Cys Leu Ile Asn
35 40 45
Gly Ala Thr Gly Glu Thr Phe Thr Tyr Ser Gln Val Glu Leu Leu Ser
50 55 60
Arg Lys Val Ala Ser Gly Leu Asn Lys Leu Gly Ile Gln Gln Gly Asp
65 70 75 80
Thr Ile Met Leu Leu Leu Pro Asn Ser Pro Glu Tyr Phe Phe Ala Phe
85 90 95
Leu Gly Ala Ser Tyr Arg Gly Ala Ile Ser Thr Met Ala Asn Pro Phe
100 105 110
Phe Thr Ser Ala Glu Val Ile Lys Gln Leu Lys Ala Ser Leu Ala Lys
115 120 125
Leu Ile Ile Thr Gln Ala Cys Tyr Val Asp Lys Val Lys Asp Tyr Ala
130 135 140
Ala Glu Lys Asn Ile Gln Ile Ile Cys Ile Asp Asp Ala Pro Gln Asp
145 150 155 160
Cys Leu His Phe Ser Lys Leu Met Glu Ala Asp Glu Ser Glu Met Pro
165 170 175
Glu Val Val Ile Asp Ser Asp Asp Val Val Ala Leu Pro Tyr Ser Ser
180 185 190
Gly Thr Thr Gly Leu Pro Lys Gly Val Met Leu Thr His Lys Gly Leu
195 200 205
Val Thr Ser Val Ala Gln Gln Val Asp Gly Asp Asn Pro Asn Leu Tyr
210 215 220
Met His Ser Glu Asp Val Met Ile Cys Ile Leu Pro Leu Phe His Ile
225 230 235 240
Tyr Ser Leu Asn Ala Val Leu Cys Cys Gly Leu Arg Ala Gly Val Thr
245 250 255
Ile Leu Ile Met Gln Lys Phe Asp Ile Val Pro Phe Leu Glu Leu Ile
260 265 270
Gln Lys Tyr Lys Val Thr Ile Gly Pro Phe Val Pro Pro Ile Val Leu
275 280 285
Ala Ile Ala Lys Ser Pro Val Val Asp Lys Tyr Asp Leu Ser Ser Val
290 295 300
Arg Thr Val Met Ser Gly Ala Ala Pro Leu Gly Lys Glu Leu Glu Asp
305 310 315 320
Ala Val Arg Ala Lys Phe Pro Asn Ala Lys Leu Gly Gln Gly Tyr Gly
325 330 335
Met Thr Glu Ala Gly Pro Val Leu Ala Met Cys Leu Ala Phe Ala Lys
340 345 350
Glu Pro Tyr Glu Ile Lys Ser Gly Ala Cys Gly Thr Val Val Arg Asn
355 360 365
Ala Glu Met Lys Ile Val Asp Pro Glu Thr Asn Ala Ser Leu Pro Arg
370 375 380
Asn Gln Arg Gly Glu Ile Cys Ile Arg Gly Asp Gln Ile Met Lys Gly
385 390 395 400
Tyr Leu Asn Asp Pro Glu Ser Thr Arg Thr Thr Ile Asp Glu Glu Gly
405 410 415
Trp Leu His Thr Gly Asp Ile Gly Phe Ile Asp Asp Asp Asp Glu Leu
420 425 430
Phe Ile Val Asp Arg Leu Lys Glu Ile Ile Lys Tyr Lys Gly Phe Gln
435 440 445
Val Ala Pro Ala Glu Leu Glu Ala Leu Leu Leu Thr His Pro Thr Ile
450 455 460
Ser Asp Ala Ala Val Val Pro Met Ile Asp Glu Lys Ala Gly Glu Val
465 470 475 480
Pro Val Ala Phe Val Val Arg Thr Asn Gly Phe Thr Thr Thr Glu Glu
485 490 495
Glu Ile Lys Gln Phe Val Ser Lys Gln Val Val Phe Tyr Lys Arg Ile
500 505 510
Phe Arg Val Phe Phe Val Asp Ala Ile Pro Lys Ser Pro Ser Gly Lys
515 520 525
Ile Leu Arg Lys Asp Leu Arg Ala Lys Ile Ala Ser Gly Asp Leu Pro
530 535 540
Lys
545
<210> 48
<211> 1638
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:47的编码序列
<400> 48
atgtccggtg actgtgttgc tccaaaggaa gatttgattt tcagatctaa gttgccagat 60
atttacatcc caaagcactt gccattgcac acttactgtt tcgaaaacat ctctaaggtt 120
ggtgacaagt cctgtttgat caacggtgct actggtgaaa ctttcactta ctctcaagtt 180
gaattgttgt ccagaaaggt tgcttctggt ttgaacaagt tgggtattca acaaggtgat 240
accatcatgt tgttgttgcc aaactcccca gaatacttct tcgctttctt gggtgcttct 300
tacagaggtg ctatttctac tatggccaac ccattcttca cttctgctga agttatcaag 360
caattgaagg cttccttggc taagttgatc attactcaag cttgttacgt tgacaaggtt 420
aaggactacg ctgctgaaaa gaacatccaa atcatttgta tcgatgatgc tccacaagat 480
tgtttgcact tctccaagtt gatggaagct gatgaatctg aaatgccaga agttgttatc 540
gattctgacg atgtcgtcgc tttgccatac tcttctggta ctactggttt gccaaagggt 600
gttatgttga cccacaaggg tttggttact tctgttgctc aacaagttga tggtgacaac 660
ccaaacttgt acatgcactc tgaagatgtt atgatctgta tcttgccatt gttccacatt 720
tactctttga acgctgtttt gtgttgtggt ttgagagctg gtgttactat cttgattatg 780
caaaagttcg atattgttcc attcttggaa ttgatccaaa agtacaaggt tactattggt 840
ccattcgttc caccaattgt tttggctatt gctaagtctc cagttgttga taagtacgac 900
ttatcttctg ttagaactgt tatgtctggt gctgctccat tgggtaagga attggaagat 960
gctgttagag ctaagttccc aaacgccaag ttgggtcaag gttacggtat gactgaagct 1020
ggtccagttt tggctatgtg tttggctttc gctaaggaac catacgaaat caagtctggt 1080
gcctgtggta ctgttgttag aaacgctgaa atgaagattg ttgatccaga aaccaacgcc 1140
tctttgccaa gaaaccaaag aggtgaaatt tgtattagag gtgaccaaat tatgaagggt 1200
tacttgaacg atccagaatc tactagaact actatcgacg aagaaggttg gttgcacact 1260
ggtgatatcg gtttcattga cgacgatgat gaattgttca ttgttgatag attgaaggaa 1320
atcatcaagt acaagggttt ccaagttgcc ccagctgaat tggaagcttt gttgttgact 1380
cacccaacca tttccgatgc tgctgttgtt ccaatgatcg atgaaaaggc tggtgaagtt 1440
ccagttgctt tcgttgttag aactaacggt ttcaccacca ctgaagaaga aatcaagcaa 1500
ttcgtttcta agcaagttgt tttctacaag agaatcttca gagttttctt cgttgatgct 1560
attccaaagt ctccatctgg taagattttg agaaaggact tgagagctaa gatcgcttcc 1620
ggtgatttgc caaagtaa 1638
<210> 49
<211> 579
<212> PRT
<213> 棒状链霉菌(Streptomyces clavuligerus)
<400> 49
Met Ser Ala Ser Thr Pro Ser Pro Gly Pro Ser Gly Thr Pro Ser Gly
1 5 10 15
Thr Pro Pro Ser Gly Pro Ser Gly Thr Pro Ser Pro Gly Pro Ala Gly
20 25 30
Ala Gly Thr Ala Pro Val Phe Arg Ser Arg Tyr Pro Asp Ile Glu Pro
35 40 45
Val Ser Glu Pro Leu His Glu Ala Val Leu Gly Arg Ala Ala Gly Tyr
50 55 60
Gly Ser Glu Pro Ala Leu Val Asp Gly Leu Thr Gly Ala Val Val Ser
65 70 75 80
Tyr Ala Arg Leu Asp Arg Asp His Arg Arg Ile Ala Ala Ala Leu Ala
85 90 95
Ala Ala Gly Val Arg Lys Gly Asp Val Val Ala Leu His Ser Pro Asn
100 105 110
Ser Thr Gly Tyr Pro Ala Val Leu Tyr Gly Ala Leu Arg Ala Gly Ala
115 120 125
Thr Val Thr Thr Ala His Pro Leu Ala Thr Ala Glu Glu Leu Ala Arg
130 135 140
Gln Leu Arg Asp Ser Ala Ala Arg Trp Ile Val Thr Ala Ala Pro Cys
145 150 155 160
Leu Glu Thr Ala Arg Arg Ala Ala Glu Leu Thr Pro Gly Ile Gly Glu
165 170 175
Ile Phe Val Phe Asp Arg Ala Glu Gly His Thr Gly Val Ala Ala Met
180 185 190
Leu Asp Ser Thr Ala Pro Glu Pro Ala Val Pro Val Asp Pro Asp Gln
195 200 205
Asp Val Ala Leu Leu Pro Tyr Ser Ser Gly Thr Thr Gly Thr Pro Lys
210 215 220
Gly Val Met Leu Thr His Arg Ser Leu Val Thr Asn Leu Val Gln Ala
225 230 235 240
His Arg Leu Ile Pro Leu Arg Pro Gly Asp Arg Val Leu Ala Val Leu
245 250 255
Pro Phe Phe His Ile Tyr Gly Leu Val Gly Leu Met Ser Ala Pro Leu
260 265 270
Arg Asn Gly Ala Thr Val Val Val Leu Pro Arg Phe Asp Leu Glu Gly
275 280 285
Phe Leu Ala Ala Val Glu Lys His Arg Val Thr Thr Leu Tyr Val Ala
290 295 300
Pro Pro Ile Val Leu Ala Leu Ala Lys His Pro Ala Val Ala Arg Tyr
305 310 315 320
Asp Leu Ser Ser Val Arg His Val Phe Ser Ala Ala Ala Pro Leu Asp
325 330 335
Ala Glu Ile Ala Ala Ala Cys Ala Ala Arg Val Gly Val Pro Leu Val
340 345 350
Arg Gln Ala Tyr Gly Met Thr Glu Leu Ser Pro Gly Cys Tyr Ala Val
355 360 365
Pro Leu Asp Glu Pro Ala Pro Pro Pro Gly Thr Val Gly Leu Leu Phe
370 375 380
Pro Ser Thr Glu Met Arg Leu Leu Arg Leu Asp Asp Pro Gly Arg Cys
385 390 395 400
Val Gly Pro Gly Glu Asp Gly Glu Ile Ala Ile Arg Gly Pro Gln Val
405 410 415
Met Lys Gly Tyr Leu Gly Arg Pro Glu Ala Thr Ala Glu Met Ile Asp
420 425 430
Ala Asp Gly Trp Leu Arg Thr Gly Asp Val Gly Arg Val Asp Ala Asp
435 440 445
Gly Trp Leu His Val Val Asp Arg Val Lys Glu Leu Ile Lys Tyr Lys
450 455 460
Gly Phe Gln Val Ala Pro Ala Glu Leu Glu Ala Leu Leu Leu Thr His
465 470 475 480
Gly Gly Ile Ala Asp Ala Ala Val Ile Gly Val Tyr Asp Glu Asp Glu
485 490 495
Gly Thr Glu Ile Pro His Ala Phe Val Val Arg Arg Pro Gly Gly Ala
500 505 510
Gly Asp Ser Leu Thr Ala Ala Asp Val Ala Ala His Val Ala Ala Arg
515 520 525
Val Ser Pro Tyr Lys Lys Val Arg Arg Val Ser Phe Val Ser Gly Val
530 535 540
Pro Arg Ala Ala Ser Gly Lys Ile Leu Arg Arg Glu Leu Arg Ala Ala
545 550 555 560
Arg Arg Ser Pro Arg Gly Thr Asp Pro Gly Asp Glu Asp Arg Glu Gly
565 570 575
Ala Thr Pro
<210> 50
<211> 1740
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:49的编码序列
<400> 50
atgtccgctt ctactccatc tccaggtcca tctggtaccc catccggtac tccaccatcc 60
ggtccatctg gtactccatc cccaggtcca gctggtgccg gtaccgctcc agtattcaga 120
tctagatacc cagacatcga accagtttct gaaccattgc acgaagctgt tttgggtaga 180
gccgccggtt acggttccga accagccttg gtcgacggtt tgaccggtgc cgtcgtatct 240
tacgctagat tggacagaga tcacagaaga atcgccgccg ccttggccgc cgctggtgtc 300
agaaagggtg acgtcgtcgc cttgcactct ccaaactcta ccggttaccc agccgtcttg 360
tacggtgcct tgagagccgg tgccaccgtt accactgctc acccattggc tactgctgaa 420
gaattggcca gacaattgag agactctgcc gccagatgga tcgttaccgc cgccccatgt 480
ttggaaaccg ccagaagagc cgccgaattg accccaggta tcggtgaaat cttcgtattc 540
gacagagccg aaggtcacac cggtgttgcc gctatgttgg actccaccgc tccagaacca 600
gccgtcccag tcgacccaga ccaagacgtc gctttgttgc catactcctc tggtaccacc 660
ggtaccccaa agggtgttat gttgactcac agatccttgg tcaccaactt ggtccaagcc 720
cacagattga tcccattgag gccaggtgac agagtcttgg ccgttttgcc attcttccac 780
atctacggtt tggtcggttt gatgtctgcc ccattgagaa acggtgctac cgtcgtcgtc 840
ttgccaagat tcgacttgga aggtttcttg gctgccgtcg aaaagcacag agtcaccact 900
ttgtacgttg ccccaccaat cgttttggct ttggccaagc acccagctgt tgccagatac 960
gacttgtcct ctgtcagaca cgtattctct gccgccgccc cattggacgc tgaaatcgct 1020
gctgcctgtg ccgccagagt cggtgttcca ttggtcagac aagcttacgg tatgaccgaa 1080
ttgtctccag gttgttacgc cgtcccattg gacgaaccag ccccaccacc aggtactgtc 1140
ggtttgttgt tcccatccac cgaaatgaga ttgttgagat tggacgaccc aggtagatgt 1200
gtcggtccag gtgaggacgg tgaaatcgcc atcagaggtc cacaagtcat gaagggttac 1260
ttgggtagac cagaagccac cgccgaaatg atcgacgctg atggttggtt gagaaccggt 1320
gacgtcggta gagtcgacgc tgacggttgg ttgcacgtcg ttgacagagt taaggaattg 1380
atcaagtaca agggtttcca agtcgctcca gccgaattgg aagctttgtt gttgacccac 1440
ggtggtatcg ctgacgccgc cgttatcggt gtttacgacg aggacgaagg tactgaaatc 1500
ccacacgctt tcgttgtcag aaggccaggt ggtgctggtg actccttgac cgccgccgac 1560
gtcgccgccc acgtcgccgc tagagtctcc ccatacaaga aggtcagaag agtctctttc 1620
gtatccggtg ttccaagagc cgcttctggt aagatcttga gaagagaatt gagagccgct 1680
agaagatccc caagaggtac tgacccaggt gacgaggaca gagaaggtgc cactccataa 1740
<210> 51
<211> 400
<212> PRT
<213> 大麦(Hordeum vulgare)
<400> 51
Met Ser Ala Ala Val Arg Leu Lys Glu Val Arg Met Ala Gln Arg Ala
1 5 10 15
Glu Gly Leu Ala Thr Val Leu Ala Ile Gly Thr Ala Val Pro Ala Asn
20 25 30
Cys Val Tyr Gln Ala Thr Tyr Pro Asp Tyr Tyr Phe Arg Val Thr Lys
35 40 45
Ser Glu His Leu Ala Asp Leu Lys Glu Lys Phe Gln Arg Met Cys Asp
50 55 60
Lys Ser Met Ile Arg Lys Arg His Met His Leu Thr Glu Glu Ile Leu
65 70 75 80
Ile Lys Asn Pro Lys Ile Cys Ala His Met Glu Thr Ser Leu Asp Ala
85 90 95
Arg His Ala Ile Ala Leu Val Glu Val Pro Lys Leu Gly Gln Gly Ala
100 105 110
Ala Glu Lys Ala Ile Lys Glu Trp Gly Gln Pro Leu Ser Lys Ile Thr
115 120 125
His Leu Val Phe Cys Thr Thr Ser Gly Val Asp Met Pro Gly Ala Asp
130 135 140
Tyr Gln Leu Thr Lys Leu Leu Gly Leu Ser Pro Thr Val Lys Arg Leu
145 150 155 160
Met Met Tyr Gln Gln Gly Cys Phe Gly Gly Ala Thr Val Leu Arg Leu
165 170 175
Ala Lys Asp Ile Ala Glu Asn Asn Arg Gly Ala Arg Val Leu Val Val
180 185 190
Cys Ser Glu Ile Thr Ala Met Ala Phe Arg Gly Pro Cys Lys Ser His
195 200 205
Leu Asp Ser Leu Val Gly His Ala Leu Phe Gly Asp Gly Ala Ala Ala
210 215 220
Ala Ile Ile Gly Ala Asp Pro Asp Gln Leu Asp Glu Gln Pro Val Phe
225 230 235 240
Gln Leu Val Ser Ala Ser Gln Thr Ile Leu Pro Glu Ser Glu Gly Ala
245 250 255
Ile Asp Gly His Leu Thr Glu Ala Gly Leu Thr Ile His Leu Leu Lys
260 265 270
Asp Val Pro Gly Leu Ile Ser Glu Asn Ile Glu Gln Ala Leu Glu Asp
275 280 285
Ala Phe Glu Pro Leu Gly Ile His Asn Trp Asn Ser Ile Phe Trp Ile
290 295 300
Ala His Pro Gly Gly Pro Ala Ile Leu Asp Arg Val Glu Asp Arg Val
305 310 315 320
Gly Leu Asp Lys Lys Arg Met Arg Ala Ser Arg Glu Val Leu Ser Glu
325 330 335
Tyr Gly Asn Met Ser Ser Ala Ser Val Leu Phe Val Leu Asp Val Met
340 345 350
Arg Lys Ser Ser Ala Lys Asp Gly Leu Ala Thr Thr Gly Glu Gly Lys
355 360 365
Asp Trp Gly Val Leu Phe Gly Phe Gly Pro Gly Leu Thr Val Glu Thr
370 375 380
Leu Val Leu His Ser Val Pro Val Pro Val Pro Thr Ala Ala Ser Ala
385 390 395 400
<210> 52
<211> 1203
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:51的编码序列
<400> 52
atgtccgctg ctgttagatt gaaggaagtt agaatggctc aaagagctga aggtttggct 60
actgttttgg ccattggtac cgccgttcca gccaactgtg tttaccaagc tacctaccca 120
gactactact tcagagtcac taagtctgaa cacttggctg acttgaagga aaagttccaa 180
agaatgtgtg acaagtccat gatcagaaag agacacatgc acttgaccga agaaatcttg 240
attaagaacc caaagatctg tgctcacatg gaaacctctt tggacgctag acacgccatt 300
gctttggtcg aagtcccaaa gttgggtcaa ggtgctgctg aaaaggctat caaggaatgg 360
ggtcaaccat tgtccaagat cacccacttg gttttctgta ctacctctgg tgtcgacatg 420
ccaggtgccg actaccaatt gaccaagttg ttgggtttgt ccccaactgt taagagattg 480
atgatgtacc aacaaggttg tttcggtggt gccactgttt tgagattggc caaggacatc 540
gctgaaaaca acagaggtgc tagagttttg gttgtctgtt ctgaaatcac cgccatggcc 600
ttcagaggtc catgtaagtc ccacttggac tctttggtcg gtcacgcttt gttcggtgat 660
ggtgctgctg ctgccatcat cggtgctgac ccagaccaat tggacgaaca accagttttc 720
caattggttt ctgcttctca aaccatcttg ccagaatctg aaggtgccat cgacggtcac 780
ttgactgaag ctggtttgac catccacttg ttgaaggacg ttccaggttt gatctctgaa 840
aacatcgaac aagctttgga agatgctttc gaaccattgg gtatccacaa ctggaactcc 900
atcttctgga ttgctcaccc aggtggtcca gccatcttgg acagagtcga agatagagtt 960
ggtttggaca agaagagaat gagagcttct agagaagttt tgtctgaata cggtaacatg 1020
tcctctgctt ctgttttgtt cgtcttggac gttatgagaa agtcatccgc caaggatggt 1080
ttggccacta ctggtgaagg taaggactgg ggtgtcttgt tcggtttcgg tccaggtttg 1140
accgtcgaaa ctttggtctt gcactctgtc ccagtcccag tcccaaccgc cgcttctgct 1200
taa 1203
<210> 53
<211> 392
<212> PRT
<213> 甜橙(Citrus sinensis)
<400> 53
Met Ser Ala Thr Val Gln Glu Ile Arg Asn Ala Gln Arg Ala Asp Gly
1 5 10 15
Pro Ala Thr Val Leu Ala Ile Gly Thr Ala Thr Pro Ala His Ser Val
20 25 30
Asn Gln Ala Asp Tyr Pro Asp Tyr Tyr Phe Arg Ile Thr Lys Ser Glu
35 40 45
His Met Thr Glu Leu Lys Glu Lys Phe Lys Arg Met Cys Asp Lys Ser
50 55 60
Met Ile Lys Lys Arg Tyr Met Tyr Leu Thr Glu Glu Ile Leu Lys Glu
65 70 75 80
Asn Pro Asn Met Cys Ala Tyr Met Ala Pro Ser Leu Asp Ala Arg Gln
85 90 95
Asp Ile Val Val Val Glu Val Pro Lys Leu Gly Lys Glu Ala Ala Thr
100 105 110
Lys Ala Ile Lys Glu Trp Gly Gln Pro Lys Ser Lys Ile Thr His Leu
115 120 125
Ile Phe Cys Thr Thr Ser Gly Val Asp Met Pro Gly Ala Asp Tyr Gln
130 135 140
Leu Thr Lys Leu Ile Gly Leu Arg Pro Ser Val Lys Arg Phe Met Met
145 150 155 160
Tyr Gln Gln Gly Cys Phe Ala Gly Gly Thr Val Leu Arg Leu Ala Lys
165 170 175
Asp Leu Ala Glu Asn Asn Lys Gly Ala Arg Val Leu Val Val Cys Ser
180 185 190
Glu Ile Thr Ala Val Thr Phe Arg Gly Pro Ala Asp Thr His Leu Asp
195 200 205
Ser Leu Val Gly Gln Ala Leu Phe Gly Asp Gly Ala Ala Ala Val Ile
210 215 220
Val Gly Ala Asp Pro Asp Thr Ser Val Glu Arg Pro Leu Tyr Gln Leu
225 230 235 240
Val Ser Thr Ser Gln Thr Ile Leu Pro Asp Ser Asp Gly Ala Ile Asp
245 250 255
Gly His Leu Arg Glu Val Gly Leu Thr Phe His Leu Leu Lys Asp Val
260 265 270
Pro Gly Leu Ile Ser Lys Asn Ile Glu Lys Ser Leu Ser Glu Ala Phe
275 280 285
Ala Pro Leu Gly Ile Ser Asp Trp Asn Ser Ile Phe Trp Ile Ala His
290 295 300
Pro Gly Gly Pro Ala Ile Leu Asp Gln Val Glu Ser Lys Leu Gly Leu
305 310 315 320
Lys Gly Glu Lys Leu Lys Ala Thr Arg Gln Val Leu Ser Glu Tyr Gly
325 330 335
Asn Met Ser Ser Ala Cys Val Leu Phe Ile Leu Asp Glu Met Arg Lys
340 345 350
Lys Ser Val Glu Glu Ala Lys Ala Thr Thr Gly Glu Gly Leu Asp Trp
355 360 365
Gly Val Leu Phe Gly Phe Gly Pro Gly Leu Thr Val Glu Thr Val Val
370 375 380
Leu His Ser Val Pro Ile Lys Ala
385 390
<210> 54
<211> 1179
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:53的编码序列
<400> 54
atgtccgcta ccgttcaaga aatcagaaac gctcaaagag ccgacggtcc agccaccgtc 60
ttggccatcg gtactgccac tccagcccac tctgtcaacc aagctgatta cccagactac 120
tacttcagaa tcactaagtc tgaacacatg actgaattga aggaaaagtt caagagaatg 180
tgtgacaagt ctatgattaa gaagagatac atgtacttga ctgaagaaat tttgaaggaa 240
aacccaaaca tgtgtgctta catggctcca tctttggacg ctagacaaga cattgttgtt 300
gtcgaagttc caaagttggg taaggaagct gctactaagg ccatcaagga atggggtcaa 360
ccaaagtcta agatcaccca cttgatcttc tgtaccacct ccggtgtcga catgccaggt 420
gccgactacc aattgaccaa gttgatcggt ttaagaccat ccgtcaagag attcatgatg 480
taccaacaag gttgtttcgc cggtggtact gttttgagat tggctaagga cttggctgaa 540
aacaacaagg gtgctagagt tttggttgtc tgttctgaaa tcactgctgt cactttcaga 600
ggtccagccg atactcactt ggattctttg gttggtcaag ctttgttcgg tgatggtgct 660
gctgctgtta tcgttggtgc cgatccagac acttctgtcg aaagaccatt gtaccaattg 720
gtttctactt ctcaaactat cttgccagac tctgacggtg ctattgacgg tcacttgaga 780
gaagtcggtt tgactttcca cttgttgaag gacgtcccag gtttgatctc taagaacatc 840
gaaaagtctt tgtctgaagc tttcgcccca ttgggtatct ctgactggaa ctctatcttc 900
tggatcgctc acccaggtgg tccagctatt ttggaccaag ttgaatctaa gttgggtttg 960
aagggtgaaa agttgaaggc cactagacaa gttttgtctg aatacggtaa catgtcatct 1020
gcttgtgtct tgttcatctt ggacgaaatg agaaagaagt ctgttgaaga agctaaggcc 1080
accaccggtg aaggtttgga ttggggtgtt ttgttcggtt tcggtccagg tttgaccgtc 1140
gaaaccgttg ttttgcactc tgtcccaatc aaggcttaa 1179
<210> 55
<211> 391
<212> PRT
<213> 甜橙(Citrus sinensis)
<400> 55
Met Ser Leu Thr Val Asp Glu Val Arg Lys Ala Gln Arg Ala Glu Gly
1 5 10 15
Pro Ala Thr Ile Met Ala Ile Gly Thr Ala Thr Pro Pro Asn Cys Val
20 25 30
Asp Gln Ser Thr Tyr Pro Asp Tyr Tyr Phe Arg Ile Thr Asn Ser Glu
35 40 45
His Met Thr Asp Leu Lys Glu Lys Phe Lys Arg Met Cys Asp Lys Ser
50 55 60
Met Ile Lys Lys Arg Tyr Met Tyr Leu Thr Glu Glu Ile Leu Lys Glu
65 70 75 80
Asn Pro Asn Val Cys Ala Tyr Met Ala Pro Ser Leu Asp Thr Arg Gln
85 90 95
Asp Met Val Val Val Glu Val Pro Arg Leu Gly Lys Glu Ala Ala Thr
100 105 110
Lys Ala Ile Lys Glu Trp Gly Gln Pro Lys Ser Lys Ile Thr His Leu
115 120 125
Val Phe Cys Thr Thr Ser Gly Val Asp Met Pro Gly Ala Asp Tyr Arg
130 135 140
Leu Thr Lys Leu Leu Gly Leu Arg Pro Ser Val Lys Arg Leu Met Met
145 150 155 160
Tyr Gln Gln Gly Cys Phe Ala Gly Gly Thr Val Leu Arg Leu Ala Lys
165 170 175
Asp Leu Ala Glu Asn Asn Lys Gly Ala Arg Val Leu Val Val Cys Ser
180 185 190
Glu Ile Thr Ala Val Thr Phe Arg Gly Pro Ser Asp Thr His Leu Asp
195 200 205
Ser Leu Val Gly Gln Ala Leu Phe Gly Asp Gly Ala Ala Ala Ile Ile
210 215 220
Ile Gly Ala Asp Pro Ile Pro Glu Ile Glu Lys Pro Met Phe Glu Leu
225 230 235 240
Val Ser Thr Ala Gln Thr Ile Leu Pro Asp Ser Asp Gly Ser Ile Asp
245 250 255
Gly His Leu Arg Glu Val Gly Leu Thr Phe His Leu Leu Lys Asp Val
260 265 270
Pro Gly Leu Ile Ser Lys Asn Ile Gln Lys Ser Leu Thr Glu Ala Phe
275 280 285
Lys Pro Leu Gly Ile Ser Asp Trp Asn Ser Ile Phe Trp Ile Ala His
290 295 300
Pro Gly Gly Pro Thr Ile Leu Asp Gln Val Glu Glu Lys Leu Gly Leu
305 310 315 320
Lys Pro Glu Lys Leu Arg Ala Thr Arg His Val Leu Ser Glu Tyr Gly
325 330 335
Asn Met Ser Ser Ala Cys Val Leu Phe Ile Leu Asp Glu Met Arg Lys
340 345 350
Lys Ser Ala Glu Asp Gly Leu Glu Thr Ala Gly Glu Gly Leu Glu Trp
355 360 365
Gly Val Leu Phe Gly Phe Gly Pro Gly Leu Thr Val Glu Thr Val Val
370 375 380
Leu His Ser Val Ala Ala Ala
385 390
<210> 56
<211> 1176
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:55的编码序列
<400> 56
atgtccttga ccgtcgatga agttagaaag gctcaaagag ccgaaggtcc agccactatc 60
atggccattg gtactgctac cccaccaaac tgtgttgatc aatctactta cccagattac 120
tacttcagaa tcactaactc tgaacacatg actgatttga aggaaaagtt caagagaatg 180
tgtgacaagt ccatgatcaa gaagagatac atgtacttga ctgaagaaat cttgaaggaa 240
aacccaaacg tttgtgctta catggctcca tctttggata ctagacaaga tatggttgtt 300
gttgaagttc caagattggg taaggaagct gccaccaagg ccattaagga atggggtcaa 360
ccaaagtcca agatcaccca cttggtattc tgtaccactt ctggtgttga catgccaggt 420
gccgattaca gattgactaa gttgttgggt ttaagaccat ccgtcaagag attgatgatg 480
taccaacaag gttgtttcgc cggtggtact gttttgagat tggccaagga cttggccgaa 540
aacaacaagg gtgctagagt cttggttgtt tgttccgaaa tcaccgctgt tactttcaga 600
ggtccatctg acacccactt ggattctttg gttggtcaag ccttgttcgg tgatggtgct 660
gctgctatta tcattggtgc cgacccaatc ccagaaatcg aaaagccaat gttcgaattg 720
gtatctactg cccaaactat cttgccagat tctgatggtt ctatcgacgg tcacttgaga 780
gaagttggtt tgaccttcca cttgttgaag gatgttccag gtttgatttc taagaacatc 840
caaaagtctt tgaccgaagc tttcaagcca ttgggtatct ctgactggaa ctctattttc 900
tggatcgctc acccaggtgg tccaactatt ttggaccaag tcgaagaaaa gttgggtttg 960
aagccagaaa agttgagagc cactagacac gttttgtctg aatacggtaa catgtcatct 1020
gcttgtgttt tgttcatttt ggacgaaatg agaaagaagt ctgctgaaga tggtttggaa 1080
accgctggtg aaggtttgga atggggtgtc ttgttcggtt tcggtccagg tttgactgtt 1140
gaaaccgttg tcttgcactc tgttgccgct gcttaa 1176
<210> 57
<211> 352
<212> PRT
<213> 棒状链霉菌(Streptomyces clavuligerus)
<400> 57
Met Ser Ala Val Leu Cys Lys Pro Ala Ile Ala Val Pro Asp His Ile
1 5 10 15
Ile Thr Asn Glu Glu Thr Leu Glu Leu Ala Arg Arg Leu His Ser Asp
20 25 30
His Pro Gln Leu Ala Leu Ala Cys Arg Leu Ile Glu His Thr Gly Val
35 40 45
Arg Lys Arg His Leu Ile Gln Pro Ile Asp Glu Val Leu Lys His Pro
50 55 60
Gly Leu Asp Ala Arg Ser Ala Thr Tyr Glu Thr Glu Ser Lys Ala Arg
65 70 75 80
Val Pro Ser Val Val Arg Arg Ala Leu Asp Gln Ala Glu Leu Glu Pro
85 90 95
Asp Gln Ile Asp Leu Ile Ile Tyr Val Ser Cys Thr Gly Phe Met Met
100 105 110
Pro Ser Leu Ala Ser Trp Leu Val Asn Thr Met Gly Phe Arg Ala Asp
115 120 125
Thr Arg Gln Leu Pro Ile Ala Gln Leu Gly Cys Ala Ala Gly Gly Ala
130 135 140
Ala Val Asn Arg Ala His Asp Phe Cys Thr Ala Tyr Pro Gly Thr Asn
145 150 155 160
Val Leu Ile Val Ala Cys Glu Phe Cys Ser Leu Cys Tyr Gln Pro Thr
165 170 175
Asp Leu Gly Ile Gly Ser Leu Leu Ser Asn Gly Leu Phe Gly Asp Gly
180 185 190
Ile Ala Ala Ala Val Val Arg Gly Glu Glu Gly Thr Gly Met Arg Leu
195 200 205
Glu Arg Asn Gly Thr Tyr Leu Ile Pro His Thr Glu Glu Trp Ile Ser
210 215 220
Tyr Ala Val Arg Ser Thr Gly Phe His Phe Gln Leu Asp Lys Arg Val
225 230 235 240
Pro Gly Thr Met Glu Pro Leu Ser Pro Ala Leu Arg Ala Leu Ala Glu
245 250 255
Gln His Gln Trp Asn Ala Gly Lys Leu Asp Phe Tyr Ile Ile His Ala
260 265 270
Gly Gly Pro Arg Ile Leu Asp Asp Leu Ser Arg Phe Leu Asp Val Pro
275 280 285
Pro Gly Ala Phe Arg His Ser Arg Ala Thr Leu Thr Glu Tyr Gly Asn
290 295 300
Ile Ala Ser Ala Val Val Leu Asp Ala Leu Gly Arg Leu Phe Asp Glu
305 310 315 320
Gln Ser Ala Leu Asp Gly His His Gly Met Leu Ala Gly Phe Gly Pro
325 330 335
Gly Ile Ile Ala Glu Met Ser Leu Gly Thr Trp Val Ser Pro Glu Ser
340 345 350
<210> 58
<211> 1059
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:57的编码序列
<400> 58
atgtccgctg ttttgtgtaa gccagccatc gccgttccag accacatcat caccaacgaa 60
gaaaccttgg aattggctag aagattgcac tctgaccacc cacaattggc tttggcttgt 120
agattgatcg aacacactgg tgttagaaag agacacttga tccaaccaat cgacgaagtt 180
ttgaagcacc caggtttgga cgctagatct gccacctacg aaaccgaatc caaggctaga 240
gttccatctg ttgttagaag agctttggac caagctgaat tggaaccaga tcaaatcgac 300
ttgatcatct acgtatcctg taccggtttc atgatgccat ccttggcctc ctggttggtc 360
aacaccatgg gtttcagagc tgacaccaga caattgccaa tcgcccaatt gggttgtgct 420
gctggtggtg ctgccgtcaa cagagcccac gacttctgta ccgcctaccc aggtaccaac 480
gtcttgatcg ttgcctgtga attctgttct ttgtgttacc aaccaaccga tttgggtatc 540
ggttctttgt tgtccaacgg tttgttcggt gacggtatcg ccgccgctgt tgtcagaggt 600
gaagaaggta ccggtatgag attggaaaga aacggtacct acttgatccc acacaccgaa 660
gaatggatct cctacgctgt tagatccacc ggtttccact tccaattgga caagagagtc 720
ccaggtacca tggaaccatt gtctccagct ttgagagcct tggccgaaca acaccaatgg 780
aacgccggta agttggactt ctacatcatc cacgctggtg gtccaagaat cttggacgat 840
ttgtctagat tcttggacgt tccaccaggt gccttcagac actctagagc cactttgacc 900
gaatacggta acatcgcctc tgccgtcgtt ttggacgcct tgggtagatt gttcgacgaa 960
caatccgcct tggacggtca ccacggtatg ttggctggtt tcggtccagg tatcatcgcc 1020
gaaatgtcct tgggtacctg ggtttctcca gaatcctaa 1059
<210> 59
<211> 401
<212> PRT
<213> 棒状链霉菌(Streptomyces clavuligerus)
<400> 59
Met Ser Ser Thr Gly Ser Ser Ala His Tyr Cys Pro Phe Asp Tyr Ala
1 5 10 15
Glu Ala Leu Glu Phe Asp Pro Thr Leu Arg Arg Phe Met Arg Glu Glu
20 25 30
Pro Val Ala Arg Ile Arg Leu Pro His Gly Ala Gly Glu Ala Trp Leu
35 40 45
Val Thr Gly Tyr Asp Asp Val Arg Thr Val Thr Thr Asp Arg Arg Phe
50 55 60
Ser Arg His Ala Val Val Gly Arg Asp Phe Pro Arg Met Thr Pro Glu
65 70 75 80
Pro Ile Val Gln Asp Glu Ala Ile Asn Val Met Asp Pro Pro Ala Ser
85 90 95
Ser Arg Leu Arg Ser Leu Val Ser Lys Gly Phe Ala Pro Glu Gln Ile
100 105 110
Glu Arg Met Arg Pro Tyr Ile Gln Arg Ala Val Asp Asp Leu Leu Asp
115 120 125
Arg Met Ala Glu Asp Ser Ser Ala Asp Leu Met Arg His Leu Ala Gly
130 135 140
Pro Leu Pro Leu Ile Thr Ile Cys Glu Val Leu Glu Ile Pro Pro Ala
145 150 155 160
Asp Gln Glu Thr Leu Arg Gly His Ala Arg Thr Met Met Asn Ile Ser
165 170 175
Val Asp Asn Lys Ala Ala Ala Val Arg Ala Lys Ala Asp Leu Arg Ala
180 185 190
Tyr Phe Ala Asp Leu Thr Ala Arg Arg Arg Ala Asp Pro Gly Glu Asp
195 200 205
Leu Ile Ser Val Leu Ala Thr Ala Arg Asp Gly Asp Glu Leu Leu Asp
210 215 220
Asp Gln Glu Leu Thr Val Met Ala Met Val Leu Leu Ile Thr Gly Gln
225 230 235 240
Asp Thr Thr Thr Tyr Glu Leu Gly Asn Leu Ser Tyr Thr Leu Leu Thr
245 250 255
Arg Pro Asp Val Arg Asp Leu Leu Arg Asp Arg Pro Glu Arg Leu Ala
260 265 270
Gln Thr Ile Asn Glu Leu Leu Arg Phe Ile Pro Phe Arg Lys Gly Val
275 280 285
Gly Ile Pro Arg Val Ala Thr Glu Asp Val Glu Leu Ser Gly Val Thr
290 295 300
Ile Pro Ala Gly Asp Ile Val His Val Ser Tyr Leu Thr Ala Asn Arg
305 310 315 320
Asp Gly Arg Lys Phe Asp Arg Pro Asp Glu Leu Asp Phe Asp Arg Thr
325 330 335
Ala Pro Ser His Met Thr Phe Gly Trp Gly Ala His His Cys Leu Gly
340 345 350
Ala Pro Leu Ala Gln Ala Glu Met Glu Thr Ala Phe Arg Thr Leu Leu
355 360 365
Glu Arg Phe Pro Gly Ile Ala Leu Ala Lys Pro Ala Glu Asp Val Glu
370 375 380
Trp Asn Thr Thr Ser Ile Trp Arg Tyr Pro Leu Ala Leu Pro Val Thr
385 390 395 400
Trp
<210> 60
<211> 1206
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:59的编码序列
<400> 60
atgtcctcca ccggttcctc tgctcactac tgtccattcg actacgccga agccttggaa 60
ttcgacccaa ctttgagaag attcatgaga gaagaaccag tcgctagaat cagattgcca 120
cacggtgctg gtgaagcttg gttggtcacc ggttacgacg atgttagaac cgttaccacc 180
gacagaagat tctctagaca cgccgttgtc ggtagagact tcccaagaat gactccagaa 240
ccaatcgtcc aagacgaagc catcaacgtc atggacccac cagcttcttc tagattgaga 300
tctttggttt ccaagggttt cgccccagaa caaatcgaaa gaatgaggcc atacatccaa 360
agagccgttg acgacttgtt ggacagaatg gctgaggact cctccgccga cttgatgaga 420
cacttggctg gtccattgcc attgatcacc atctgtgaag tcttggaaat cccaccagcc 480
gaccaagaaa ccttgagagg tcacgccaga actatgatga acatctctgt tgacaacaag 540
gccgccgccg ttagagccaa ggccgatttg agagcctact tcgctgactt gactgccaga 600
agaagagctg acccaggtga ggacttgatc tctgttttgg ccactgccag ggacggtgac 660
gaattgttgg acgaccaaga attgaccgtc atggctatgg tcttgttgat caccggtcaa 720
gacaccacca cctacgaatt gggtaacttg tcctacacct tgttgaccag accagacgtc 780
agagatttgt tgagagacag accagaaaga ttggctcaaa ctatcaacga attgttgaga 840
ttcatcccat tcagaaaggg tgtcggtatc ccaagagttg ccaccgagga cgttgaattg 900
tctggtgtta ctatcccagc cggtgacatc gtccacgtat cctacttgac cgccaacaga 960
gatggtagaa agttcgacag accagacgaa ttggacttcg acagaaccgc cccatcccac 1020
atgaccttcg gttggggtgc tcaccactgt ttgggtgccc cattggctca agccgaaatg 1080
gaaaccgcct tcagaacttt gttggaaaga ttcccaggta tcgctttggc taagccagcc 1140
gaggacgttg aatggaacac cacctctatc tggagatacc cattggcttt gccagtcacc 1200
tggtaa 1206
<210> 61
<211> 246
<212> PRT
<213> 拟南芥(Arabidopsis thaliana)
<400> 61
Met Ser Ser Ser Asn Ala Cys Ala Ser Pro Ser Pro Phe Pro Ala Val
1 5 10 15
Thr Lys Leu His Val Asp Ser Val Thr Phe Val Pro Ser Val Lys Ser
20 25 30
Pro Ala Ser Ser Asn Pro Leu Phe Leu Gly Gly Ala Gly Val Arg Gly
35 40 45
Leu Asp Ile Gln Gly Lys Phe Val Ile Phe Thr Val Ile Gly Val Tyr
50 55 60
Leu Glu Gly Asn Ala Val Pro Ser Leu Ser Val Lys Trp Lys Gly Lys
65 70 75 80
Thr Thr Glu Glu Leu Thr Glu Ser Ile Pro Phe Phe Arg Glu Ile Val
85 90 95
Thr Gly Ala Phe Glu Lys Phe Ile Lys Val Thr Met Lys Leu Pro Leu
100 105 110
Thr Gly Gln Gln Tyr Ser Glu Lys Val Thr Glu Asn Cys Val Ala Ile
115 120 125
Trp Lys Gln Leu Gly Leu Tyr Thr Asp Cys Glu Ala Lys Ala Val Glu
130 135 140
Lys Phe Leu Glu Ile Phe Lys Glu Glu Thr Phe Pro Pro Gly Ser Ser
145 150 155 160
Ile Leu Phe Ala Leu Ser Pro Thr Gly Ser Leu Thr Val Ala Phe Ser
165 170 175
Lys Asp Asp Ser Ile Pro Glu Thr Gly Ile Ala Val Ile Glu Asn Lys
180 185 190
Leu Leu Ala Glu Ala Val Leu Glu Ser Ile Ile Gly Lys Asn Gly Val
195 200 205
Ser Pro Gly Thr Arg Leu Ser Val Ala Glu Arg Leu Ser Gln Leu Met
210 215 220
Met Lys Asn Lys Asp Glu Lys Glu Val Ser Asp His Ser Val Glu Glu
225 230 235 240
Lys Leu Ala Lys Glu Asn
245
<210> 62
<211> 741
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:61的编码序列
<400> 62
atgtcctcta gcaatgcgtg tgcctccccg tccccgttcc cggctgttac gaagctgcat 60
gtcgattcag ttacctttgt cccgtccgtg aagtccccgg cgagcagcaa cccgctgttt 120
ctgggcggtg caggtgtccg tggtctggat attcagggca aatttgtgat tttcaccgtg 180
atcggcgttt atctggaagg caatgcggtc ccgtcactgt cggtgaaatg gaagggtaaa 240
accacggaag aactgaccga atctattccg tttttccgcg aaatcgttac gggcgcgttc 300
gaaaagttca tcaaggtcac catgaaactg ccgctgacgg gtcagcaata ttcagaaaag 360
gttaccgaaa actgcgtcgc catctggaaa caactgggcc tgtacacgga ctgtgaagcg 420
aaggccgtcg aaaagtttct ggaaattttc aaagaagaaa cctttccgcc gggcagttcc 480
atcctgttcg cactgagccc gaccggttct ctgacggttg ctttcagtaa agatgactcc 540
atcccggaaa ccggcattgc agtgatcgaa aacaagctgc tggcagaagc tgttctggaa 600
agcattatcg gcaaaaatgg tgtgtcaccg ggtacgcgtc tgtcggttgc ggaacgcctg 660
agccagctga tgatgaaaaa taaagatgaa aaggaagtgt cggaccacag cgttgaagaa 720
aaactggcaa aggaaaacta a 741
<210> 63
<211> 719
<212> PRT
<213> 甜橙(Citrus sinensis)
<400> 63
Met Ser Glu Ile Gly Ala Thr Thr Glu Asn Gly His Gln Asn Gly Gly
1 5 10 15
Leu Glu Gly Leu Cys Lys Asn Asn Asn Tyr Asn Tyr Ser Ser Gly Asp
20 25 30
Ala Leu Asn Trp Gly Val Met Ala Glu Thr Leu Lys Gly Ser His Leu
35 40 45
Glu Glu Val Lys Arg Met Val Ala Glu Tyr Arg Lys Pro Val Val Asn
50 55 60
Leu Gly Gly Glu Thr Leu Thr Val Ala Gln Val Ala Ala Ile Ala Thr
65 70 75 80
Ser Ser Thr Asn Val Glu Leu Ser Glu Ser Ala Arg Glu Gly Val Lys
85 90 95
Ala Ser Ser Asp Trp Val Met Glu Ser Met Asn Lys Gly Thr Asp Ser
100 105 110
Tyr Gly Val Thr Thr Gly Phe Gly Ala Thr Ser His Arg Arg Thr Lys
115 120 125
Asn Gly Gly Ala Leu Gln Lys Glu Leu Ile Arg Phe Leu Asn Ala Gly
130 135 140
Ile Phe Gly Asn Gly Thr Glu Ser Ser His Thr Leu Pro His Ser Ala
145 150 155 160
Thr Arg Ala Ala Met Leu Val Arg Val Asn Thr Leu Leu Gln Gly Tyr
165 170 175
Ser Gly Ile Arg Phe Glu Ile Leu Glu Ala Ile Thr Lys Leu Leu Asn
180 185 190
His Asn Ile Thr Pro Cys Leu Pro Leu Arg Gly Thr Ile Thr Ala Ser
195 200 205
Gly Asp Leu Val Pro Leu Ser Tyr Ile Ala Gly Leu Leu Thr Gly Arg
210 215 220
Pro Asn Ser Lys Ala Thr Gly Pro Asn Gly Glu Ile Ile Asp Ala Gln
225 230 235 240
Glu Ala Ser Lys Gln Ala Gly Phe Gly Phe Phe Glu Leu Gln Pro Lys
245 250 255
Glu Gly Leu Ala Leu Val Asn Gly Thr Ala Val Gly Ser Gly Leu Ala
260 265 270
Ser Met Val Leu Phe Glu Ala Asn Asn Leu Ala Leu Leu Ser Glu Ile
275 280 285
Leu Ser Ala Ile Phe Ala Glu Val Met Gln Gly Lys Pro Glu Phe Thr
290 295 300
Asp His Leu Thr His Lys Leu Lys His His Pro Gly Gln Ile Glu Ala
305 310 315 320
Ala Ala Ile Met Glu His Ile Leu Asp Gly Ser Ser Tyr Val Asn Val
325 330 335
Ala Lys Lys Leu His Glu Ile Asp Pro Leu Gln Lys Pro Lys Gln Asp
340 345 350
Arg Tyr Ala Leu Arg Thr Ser Pro Gln Trp Leu Gly Pro Gln Ile Glu
355 360 365
Val Ile Arg Phe Ala Thr Lys Ser Ile Glu Arg Glu Ile Asn Ser Val
370 375 380
Asn Asp Asn Pro Leu Ile Asp Val Ser Arg Asn Lys Ala Leu His Gly
385 390 395 400
Gly Asn Phe Gln Gly Thr Pro Ile Gly Val Ser Met Asp Asn Thr Arg
405 410 415
Leu Ala Ile Ala Ala Ile Gly Lys Leu Met Phe Ala Gln Phe Ser Glu
420 425 430
Leu Val Asn Asp Phe Tyr Asn Asn Gly Leu Pro Ser Asn Leu Ser Gly
435 440 445
Gly Arg Asn Pro Ser Leu Asp Tyr Gly Phe Lys Gly Ala Glu Ile Ala
450 455 460
Met Ala Ser Tyr Cys Ser Glu Leu Gln Phe Leu Ala Asn Pro Val Thr
465 470 475 480
Asn His Val Gln Ser Ala Glu Gln His Asn Gln Asp Val Asn Ser Leu
485 490 495
Gly Leu Ile Ser Ser Arg Lys Thr Ala Glu Ala Val Asp Ile Leu Lys
500 505 510
Leu Met Ser Ser Thr Phe Leu Val Ala Leu Cys Gln Ala Ile Asp Leu
515 520 525
Arg His Leu Glu Glu Asn Leu Lys His Thr Val Lys Asn Thr Val Ser
530 535 540
Gln Val Ala Lys Lys Val Leu Thr Val Gly Ala Ser Gly Glu Leu His
545 550 555 560
Pro Ser Arg Phe Cys Glu Lys Asp Leu Leu Lys Ala Ala Asp Arg Glu
565 570 575
His Val Phe Ala Tyr Ile Asp Asp Pro Cys Ser Ala Thr Tyr Pro Leu
580 585 590
Met Gln Lys Leu Arg Gln Val Leu Val Glu His Ala Leu Asn Asn Gly
595 600 605
Glu Asn Glu Lys Thr Ala Asn Ser Ser Ile Phe Gln Lys Ile Ala Ala
610 615 620
Phe Glu Glu Glu Leu Lys Thr Val Leu Pro Lys Glu Val Glu Asn Ala
625 630 635 640
Arg Gln Thr Val Glu Asn Gly Ser Pro Thr Ile Pro Asn Arg Ile Lys
645 650 655
Glu Cys Arg Ser Tyr Pro Leu Tyr Arg Phe Val Arg Glu Gly Leu Gly
660 665 670
Ser Asn Phe Leu Thr Gly Glu Lys Val Thr Ser Pro Gly Glu Glu Phe
675 680 685
Asp Lys Val Phe Thr Ala Met Cys Gln Gly Lys Ile Ile Asp Pro Met
690 695 700
Leu Glu Cys Leu Arg Glu Trp Asn Gly Ala Pro Leu Pro Ile Cys
705 710 715
<210> 64
<211> 2160
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:63的编码序列
<400> 64
atgtccgaaa tcggtgccac tactgaaaac ggtcaccaaa acggtggcct cgaaggcttg 60
tgtaagaaca ataactacaa ctactcttct ggtgatgctt tgaactgggg tgttatggct 120
gaaactttga agggttctca cttggaagaa gttaagagaa tggttgctga atacagaaag 180
ccagttgtca acttgggtgg tgaaactttg accgttgctc aagttgctgc cattgccact 240
tcctctacta acgttgaatt gtctgaatct gccagagaag gtgtcaaggc ctcttctgat 300
tgggttatgg aatctatgaa caagggtacc gactcttacg gtgttactac tggcttcggt 360
gccacttcgc acagaagaac caagaacggt ggtgctttgc aaaaggaatt gattagattc 420
ttgaacgctg gtatcttcgg taacggtact gaatcttctc acactttgcc acactctgct 480
actagagctg ccatgttggt tcgtgttaac acattgttgc aaggttactc cggtatcaga 540
ttcgaaatct tggaagctat cactaagttg ttgaaccaca acatcactcc atgtttgcca 600
ttgagaggta ctatcactgc ttctggtgat ttggttccat tgtcctacat agccggcttg 660
ttgaccggtc gtccaaactc taaggccacc ggtccaaacg gtgaaatcat tgatgcccaa 720
gaagcctcta agcaagctgg tttcggtttc ttcgaattgc aaccaaagga gggcttggct 780
ctcgtcaacg gtactgctgt tggttctggt ttggcttcta tggttttgtt cgaagctaac 840
aatctcgcgt tgttgtcgga aattttgtct gctattttcg ctgaagtcat gcaaggtaag 900
ccagaattca ccgatcactt gactcacaag ttgaagcacc acccaggtca aattgaagct 960
gctgctatca tggaacacat cttggatggt tcttcttacg ttaacgttgc taagaagttg 1020
cacgaaattg atccattgca aaagccaaag caagatagat acgccttgag aacttctcca 1080
caatggttgg gtccacaaat cgaagttatt agattcgcta ccaagtctat tgaaagagaa 1140
atcaactctg ttaacgacaa cccattgatc gacgtttcta gaaacaaggc cttgcacggt 1200
ggtaacttcc aaggtacccc aattggtgtc tctatggaca acaccagatt ggctattgct 1260
gctatcggta agttgatgtt cgcccaattc tctgaattgg tcaacgattt ctacaacaac 1320
ggtttgccat ctaacttgtc tggtggtaga aacccatctt tggattacgg tttcaagggt 1380
gctgaaattg ctatggcttc ctactgttct gaattgcaat tcttggccaa cccagttact 1440
aaccacgtcc aatctgctga acaacacaac caagatgtta actccttggg tttgatctct 1500
tccagaaaga ctgctgaagc tgtcgacatc ttgaagttga tgtcatccac tttcttggtt 1560
gctttgtgtc aagctattga tttgagacac ttggaagaaa acttgaagca cactgtcaag 1620
aacactgtct ctcaagttgc taagaaggtc ttgaccgtcg gtgcttctgg tgaattgcac 1680
ccatctagat tctgtgaaaa ggatttgttg aaggctgctg atagagaaca cgttttcgct 1740
tacattgatg acccatgttc tgctacctac ccattgatgc aaaagttgag acaagttttg 1800
gttgaacacg ctttgaacaa cggtgaaaac gaaaagactg ccaactcttc tatcttccaa 1860
aagattgctg ccttcgaaga agaattaaag accgttttgc caaaggaagt tgaaaacgcc 1920
agacaaactg ttgaaaacgg ttctccaact attccaaaca gaatcaagga atgtagatct 1980
tacccattgt acagattcgt tagagaaggt ttgggttcta acttcttgac tggtgaaaag 2040
gttacttctc caggtgaaga attcgacaag gttttcactg ctatgtgtca aggtaagatc 2100
attgatccaa tgttggaatg tttgagagaa tggaacggtg ccccattgcc aatttgttaa 2160
<210> 65
<211> 715
<212> PRT
<213> 甜橙(Citrus sinensis)
<400> 65
Met Ser Glu Ala Ser His Glu Asn Gln Ser Gly Gly Asn Ile Pro Ser
1 5 10 15
Gly Lys Leu Cys Thr Asn Ile Asp Pro Leu Asn Trp Val Ser Ala Ser
20 25 30
Glu Ser Leu Lys Gly Ser His Leu Asp Glu Val Lys Arg Met Val Ser
35 40 45
Glu Tyr Arg Lys Gln Val Val Arg Leu Gly Gly Glu Thr Leu Thr Ile
50 55 60
Ala Gln Val Ala Ala Val Ala Ser Arg Asp Gly Gly Val Thr Val Glu
65 70 75 80
Leu Asn Glu Glu Ala Arg Ala Gly Val Lys Ala Ser Ser Asp Trp Val
85 90 95
Met Glu Ser Met Asn Lys Gly Thr Asp Ser Tyr Gly Ile Thr Thr Gly
100 105 110
Phe Gly Ala Thr Ser His Arg Arg Thr Lys Gln Gly Ala Ala Leu Gln
115 120 125
Lys Glu Leu Ile Arg Phe Leu Asn Ala Gly Ile Phe Gly Lys Gly Thr
130 135 140
Glu Ser Cys Gln Met Leu Pro His Thr Ala Thr Arg Ala Ala Met Leu
145 150 155 160
Val Arg Ile Asn Thr Leu Leu Gln Gly Tyr Ser Gly Ile Arg Phe Glu
165 170 175
Ile Leu Glu Ala Ile Thr Lys Phe Leu Asn Arg Asn Ile Thr Pro Cys
180 185 190
Leu Pro Leu Arg Ala Ser Ile Thr Ala Ser Gly Asp Leu Ile Pro Phe
195 200 205
Ser Tyr Ile Ala Gly Leu Leu Thr Gly Arg Leu Asn Ser Val Ala Val
210 215 220
Gly Pro Asn Gly Glu Ser Leu Asn Ala Ala Glu Ala Phe Ser Gln Ala
225 230 235 240
Gly Ile Asp Gly Gly Phe Phe Glu Leu Gln Pro Lys Glu Gly Leu Ala
245 250 255
Leu Val Asn Gly Thr Gly Val Gly Ala Gly Leu Ala Ser Ile Val Leu
260 265 270
Phe Glu Ala Asn Ile Leu Thr Val Leu Ser Glu Val Leu Ser Ala Ile
275 280 285
Phe Ala Glu Ala Met Leu Gly Lys Pro Glu Phe Thr Asp His Leu Thr
290 295 300
His Lys Leu Lys His His Pro Gly Gln Ile Glu Ala Ala Ala Ile Met
305 310 315 320
Glu His Ile Leu Asp Gly Ser Ser Tyr Val Lys Ala Ala Gln Lys Leu
325 330 335
His Glu Ile Asp Pro Leu Gln Lys Pro Lys Gln Asp Arg Tyr Ala Leu
340 345 350
Arg Thr Ser Pro Gln Trp Leu Gly Pro Gln Ala Glu Val Ile Arg Ala
355 360 365
Ser Thr Lys Ser Ile Glu Arg Glu Ile Asn Ser Val Asn Asp Asn Pro
370 375 380
Leu Ile Asp Val Ser Arg Asn Lys Ala Leu His Gly Gly Asn Phe Gln
385 390 395 400
Gly Thr Pro Ile Gly Val Ser Met Asp Asn Ser Arg Leu Ala Ile Ala
405 410 415
Ser Ile Gly Lys Leu Met Phe Ala Gln Phe Ser Glu Leu Val Asn Asp
420 425 430
Phe Tyr Ser Asn Gly Leu Pro Ser Asn Leu Ser Gly Gly Arg Asn Pro
435 440 445
Ser Leu Asp Tyr Gly Phe Lys Gly Ala Glu Ile Ala Met Ala Ala Tyr
450 455 460
Cys Ser Glu Leu Gln Phe Leu Ala Asn Pro Val Thr Asn His Val Gln
465 470 475 480
Ser Ala Glu Gln His Asn Gln Asp Val Asn Ser Leu Gly Leu Ile Ser
485 490 495
Ala Arg Lys Thr Ala Glu Ala Val Asp Ile Leu Lys Leu Met Ser Ser
500 505 510
Thr Tyr Leu Ile Ala Leu Cys Gln Ala Ile Asp Leu Arg His Leu Glu
515 520 525
Glu Asn Leu Lys Ser Thr Val Lys Asn Thr Ile Ser Gln Val Val Lys
530 535 540
Lys Val Leu Thr Met Gly Val Asn Gly Glu Leu His Pro Ser Arg Phe
545 550 555 560
Cys Glu Lys Asp Leu Leu Lys Val Val Asp Arg Glu Tyr Val Phe Ser
565 570 575
Tyr Ala Asp Asp Pro Cys Ser Ala Thr Tyr Pro Leu Met Gln Lys Leu
580 585 590
Arg Gln Val Leu Val Asp His Ala Leu Thr Asn Asn Glu Asp Leu Lys
595 600 605
Asn Ala Asn Ala Ser Ile Phe Leu Lys Ile Gly Ala Phe Glu Glu Glu
610 615 620
Leu Lys Thr Leu Leu Pro Lys Glu Val Glu Ser Ala Arg Ser Ala Phe
625 630 635 640
Glu Ser Gly Asn Leu Glu Ile Pro Asn Arg Ile Lys Glu Cys Arg Ser
645 650 655
Tyr Pro Leu Tyr Arg Phe Val Arg Glu Glu Leu Gly Ala Arg Tyr Leu
660 665 670
Thr Gly Glu Lys Ala Ile Ser Pro Gly Glu Glu Cys Asp Lys Val Phe
675 680 685
Thr Ala Ile Cys Gln Gly Lys Ile Ile Asp Pro Leu Leu Glu Cys Leu
690 695 700
Lys Glu Trp Asp Gly Ser Pro Leu Pro Ile Cys
705 710 715
<210> 66
<211> 2148
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:65的编码序列
<400> 66
atgtccgaag cttctcacga aaaccaatct ggtggtaaca ttccatctgg taagttgtgt 60
actaacattg atccattgaa ctgggtttct gcttctgaat ctttgaaggg ttctcacttg 120
gatgaagtta agagaatggt ttctgaatac agaaagcaag ttgttagatt gggtggtgaa 180
accttgacta tcgctcaagt tgctgctgtt gcttctagag atggtggtgt cactgttgaa 240
ttgaacgaag aagccagagc tggtgtcaag gcttcttctg attgggttat ggaatctatg 300
aacaagggta ctgattctta cggcatcact actggcttcg gtgctacttc gcacagaaga 360
accaagcaag gtgctgcctt gcaaaaggaa ttgattagat tcttgaacgc tggtatcttc 420
ggtaagggta ctgaatcctg tcaaatgttg ccacacactg ctactagagc tgctatgctc 480
gttcgtatca acacattgtt gcaaggttac tctggtatta gattcgaaat tttggaagct 540
atcactaagt tcttgaacag aaacattact ccatgtttgc cattgagagc ctccatcact 600
gcgtcgggtg atctcatccc attctcgtac atcgccggtt tgttgaccgg tagattgaac 660
tctgttgctg ttggtccaaa cggtgaatct ttgaacgctg ctgaagcttt ctctcaagct 720
ggtattgatg gtggtttctt cgaattgcaa ccaaaggagg gcttggcgtt ggttaacggt 780
actggtgttg gtgctggttt ggcttctatt gttttgttcg aagctaacat tttgactgtt 840
ttgtccgaag ttttgtctgc tattttcgct gaagctatgt tgggtaagcc agaattcact 900
gatcacttga ctcacaagtt gaagcaccac ccaggtcaaa ttgaagctgc tgctatcatg 960
gaacacatct tggatggttc ttcttacgtt aaggctgctc aaaagttgca cgaaattgac 1020
ccattgcaaa agccaaagca agatagatac gctttgagaa cttctccaca atggttgggt 1080
ccacaagctg aagttattag agcttctact aagtctattg aaagagaaat taactctgtt 1140
aacgataacc cattgattga tgtttctaga aacaaggctt tgcacggtgg taacttccaa 1200
ggtaccccaa ttggtgtctc tatggataac tctagattgg ctattgcttc tattggtaag 1260
ttgatgttcg ctcaattctc tgaattggtt aacgatttct actctaacgg tttgccatct 1320
aacttgtctg gtggtagaaa cccatctttg gattacggtt tcaagggtgc cgaaatcgct 1380
atggctgctt actgttccga attgcaattc ttggccaacc cagttactaa ccacgtccaa 1440
tctgctgaac aacacaacca agatgttaac tctttgggtt tgatctctgc cagaaagact 1500
gctgaagctg ttgatatctt gaagttgatg tcctctactt acttgattgc tttgtgtcaa 1560
gctatcgact tgagacactt ggaagaaaac ttgaagtcta ctgttaagaa cactatctct 1620
caagttgtta agaaggtctt gactatgggt gtcaacggtg aattgcaccc atctagattc 1680
tgtgaaaagg atttgttgaa ggttgttgat agagaatacg ttttctctta cgctgatgat 1740
ccatgttctg ctacttaccc attgatgcaa aagttgagac aagtcttggt tgatcacgct 1800
ttgactaaca acgaagattt gaagaacgct aacgcttcta tcttcttgaa aataggtgcg 1860
ttcgaagaag aactcaagac cttgttgcca aaggaagttg aatctgctag atctgctttc 1920
gaatctggta acttggaaat cccaaacaga attaaggaat gtagatccta cccattgtac 1980
agattcgtta gagaagaatt gggtgctaga tacttgactg gtgaaaaggc tatctctcca 2040
ggtgaagaat gtgataaggt tttcactgct atttgtcaag gtaagatcat tgatccattg 2100
ttggaatgtt tgaaggaatg ggatggttct ccattgccaa tttgttaa 2148
<210> 67
<211> 537
<212> PRT
<213> 甜橙(Citrus sinensis)
<400> 67
Met Ser Ala Asn Leu Val Thr Ile Ser Phe Phe Ser Ile Leu Leu Thr
1 5 10 15
Ile Ser Leu Leu Ser Phe Asn Lys Ser Leu Asn Leu Ile Ser Ile Thr
20 25 30
Leu Pro Leu Val Pro Leu Ile Ala Tyr Val Leu Lys Ser Phe Leu Lys
35 40 45
Ser Ser Lys Ala Phe Tyr Pro Pro Thr Pro Ile Ser Ile Pro Ile Phe
50 55 60
Gly Asn Trp Leu Gln Val Gly Asn Asp Leu Asn His Arg Leu Leu Ala
65 70 75 80
Ser Met Ala Gln Ile Tyr Gly Pro Val Phe Arg Leu Lys Leu Gly Ser
85 90 95
Lys Asn Leu Ile Val Val Ser Glu Pro Asp Leu Ala Thr Gln Val Leu
100 105 110
His Thr Gln Gly Val Glu Phe Gly Ser Arg Pro Arg Asn Val Val Phe
115 120 125
Asp Ile Phe Thr Gly Asn Gly Gln Asp Met Val Phe Thr Val Tyr Gly
130 135 140
Glu His Trp Arg Lys Met Arg Arg Ile Met Thr Leu Pro Phe Phe Thr
145 150 155 160
Asn Lys Val Val His Asn Tyr Ser Asp Met Trp Glu Gln Glu Met Asp
165 170 175
Leu Val Val His Asp Leu Lys Asn Asp Tyr Glu Ser Val Ser Thr Lys
180 185 190
Gly Ile Val Ile Arg Lys Arg Leu Gln Leu Met Leu Tyr Asn Ile Met
195 200 205
Tyr Arg Met Met Phe Asp Ala Lys Phe Glu Ser Gln Glu Asp Pro Leu
210 215 220
Phe Ile Glu Ala Thr Arg Phe Asn Ser Glu Arg Ser Arg Leu Ala Gln
225 230 235 240
Ser Phe Glu Tyr Asn Tyr Gly Asp Phe Ile Pro Leu Leu Arg Pro Phe
245 250 255
Leu Arg Gly Tyr Leu Asn Lys Cys Arg Asp Leu Gln Cys Arg Arg Leu
260 265 270
Ala Phe Phe Asn Asn Asn Phe Val Glu Lys Arg Arg Lys Ile Met Ala
275 280 285
Ala Asn Gly Glu Lys His Lys Ile Ser Cys Ala Ile Asp His Ile Ile
290 295 300
Asp Ala Gln Met Lys Gly Glu Ile Thr Glu Glu Asn Val Ile Tyr Ile
305 310 315 320
Val Glu Asn Ile Asn Val Ala Ala Ile Glu Thr Thr Leu Trp Ser Met
325 330 335
Glu Trp Ala Ile Ala Glu Leu Val Asn His Pro Glu Val Gln Gln Lys
340 345 350
Ile Arg Arg Glu Ile Ser Thr Val Leu Lys Gly Asn Pro Val Thr Glu
355 360 365
Ser Asn Leu His Glu Leu Pro Tyr Leu Gln Ala Ala Val Lys Glu Val
370 375 380
Leu Arg Leu His Thr Pro Ile Pro Leu Leu Val Pro His Met Asn Leu
385 390 395 400
Glu Glu Ala Lys Leu Gly Gly Phe Thr Ile Pro Lys Glu Ser Lys Ile
405 410 415
Val Val Asn Ala Trp Trp Leu Ala Asn Asn Pro Lys Trp Trp Glu Lys
420 425 430
Pro Glu Glu Phe Arg Pro Glu Arg Phe Leu Glu Glu Glu Cys Asn Ile
435 440 445
Asp Ala Val Ala Gly Gly Gly Lys Val Asp Phe Arg Tyr Leu Pro Phe
450 455 460
Gly Val Gly Arg Arg Ser Cys Pro Gly Ile Ile Leu Ala Leu Pro Ile
465 470 475 480
Leu Gly Leu Val Ile Ala Lys Leu Val Thr Ser Phe Glu Met Lys Ala
485 490 495
Pro Gln Gly Ile Asp Lys Ile Asp Val Ser Glu Lys Gly Gly Gln Phe
500 505 510
Ser Leu His Ile Ala Asn His Ser Thr Val Val Phe Asp Pro Ile Met
515 520 525
Glu Ser Leu Ser Gln Pro Met Pro Gln
530 535
<210> 68
<211> 1614
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:67的编码序列
<400> 68
atgtccgcta acttggttac tatttctttc ttctctatct tgttgactat ctctttgttg 60
tctttcaaca agtctttgaa cttgatctct atcactttgc cattggttcc attgattgct 120
tacgttttga agtccttctt gaagtcatct aaggccttct acccaccaac tccaatctct 180
atcccaatct tcggtaactg gttgcaagtt ggtaacgact tgaaccacag attgttggct 240
tctatggctc aaatttacgg tccagttttc agattgaagt tgggttctaa gaacttgatc 300
gttgtttctg aaccagacct cgctactcaa gtgctacaca ctcaaggtgt tgaattcggt 360
tccagaccaa gaaacgttgt tttcgatatt ttcactggta acggtcaaga catggtattt 420
actgtctacg gcgaacactg gagaaagatg agaagaatta tgactttgcc attcttcacc 480
aacaaggttg ttcacaacta ctctgacatg tgggaacaag aaatggactt ggttgttcac 540
gacttgaaga acgattacga gtctgtaagc actaagggta ttgttattag aaagagattg 600
caattgatgt tgtacaacat tatgtacaga atgatgttcg atgctaagtt cgaatctcaa 660
gaagatccat tgttcattga agctactaga ttcaactctg aaagatctag attggcgcag 720
agcttcgaat acaactacgg tgatttcatt ccattgttaa gaccattctt gagaggttac 780
ttgaacaagt gtagagactt gcaatgtaga agattggctt tcttcaacaa caacttcgtt 840
gaaaagagaa gaaagatcat ggctgccaac ggtgaaaagc acaagatctc ttgtgccatt 900
gatcacatca ttgatgctca aatgaagggt gaaatcactg aagaaaacgt tatttacatt 960
gttgaaaaca tcaacgttgc tgctatcgaa actactttgt ggtccatgga atgggctatc 1020
gctgaattgg tcaaccaccc agaagttcaa caaaagatca gaagagaaat ctctactgtc 1080
ttgaagggta acccagtcac tgaatctaac ttgcacgaat tgccatactt gcaagccgct 1140
gttaaggaag ttttgagatt gcacactcca attccattgt tggttccaca catgaacttg 1200
gaagaagcta agttgggtgg tttcactatt ccaaaggaat ccaagattgt tgttaacgct 1260
tggtggttgg ctaacaaccc aaagtggtgg gaaaagccag aagaattcag accagaaaga 1320
ttcttggaag aagaatgtaa cattgatgct gttgctggtg gtggtaaggt tgacttcaga 1380
tacttgccat tcggtgttgg tagaagatct tgtccaggta taatattggc tctcccaatc 1440
ttgggcttgg ttattgctaa gttggttact tctttcgaaa tgaaggctcc acaaggtatc 1500
gataagattg acgtttctga aaagggtggt caattctctt tgcacattgc taaccactct 1560
actgttgtct ttgatccaat catggaatct ttgtcccaac caatgccaca ataa 1614
<210> 69
<211> 520
<212> PRT
<213> 甜橙(Citrus sinensis)
<400> 69
Met Ser Asp Leu Asn Gly Trp Cys Asn Ser Gly Asn Gln Asn Met Cys
1 5 10 15
Cys Cys Gln Ser Tyr Val Lys Arg Gly Tyr Asp Arg Val Leu Ser Phe
20 25 30
Asn Gly Leu Ile Thr Val Ser Lys Leu Arg Gly Lys Arg Phe Lys Leu
35 40 45
Pro Pro Gly Pro Leu Pro Val Pro Val Phe Gly Asn Trp Leu Gln Val
50 55 60
Gly Asp Asp Leu Asn His Arg Asn Leu Ser Asp Leu Ala Lys Lys Tyr
65 70 75 80
Gly Asp Val Leu Leu Leu Arg Met Gly Gln Arg Asn Leu Val Val Val
85 90 95
Ser Ser Pro Asp His Ala Lys Glu Val Leu His Thr Gln Gly Val Glu
100 105 110
Phe Gly Ser Arg Thr Arg Asn Val Val Phe Asp Ile Phe Thr Gly Lys
115 120 125
Gly Gln Asp Met Val Phe Thr Val Tyr Gly Glu His Trp Arg Lys Met
130 135 140
Arg Arg Ile Met Thr Val Pro Phe Phe Thr Asn Lys Val Val Gln Gln
145 150 155 160
Gln Arg Phe Asn Trp Glu Asp Glu Ala Ala Arg Val Val Glu Asp Val
165 170 175
Lys Lys Asp Pro Glu Ala Ala Thr Asn Gly Ile Val Leu Arg Arg Arg
180 185 190
Leu Gln Leu Met Met Tyr Asn Asn Met Tyr Arg Ile Met Phe Asp Arg
195 200 205
Arg Phe Glu Ser Gln Asp Asp Pro Leu Phe Asn Arg Leu Lys Ala Leu
210 215 220
Asn Gly Glu Arg Ser Arg Leu Ala Gln Ser Phe Glu Tyr Asn Tyr Gly
225 230 235 240
Asp Phe Ile Pro Ile Leu Arg Pro Phe Leu Arg Gly Tyr Leu Lys Ile
245 250 255
Cys Lys Glu Val Lys Glu Arg Arg Leu Gln Leu Phe Lys Asp Tyr Phe
260 265 270
Val Glu Glu Arg Lys Lys Leu Ala Ser Thr Lys Ser Met Ser Asn Glu
275 280 285
Ser Leu Lys Cys Ala Ile Asp His Ile Leu Asp Ala Gln Thr Lys Gly
290 295 300
Glu Ile Asn Glu Asp Asn Val Leu Tyr Ile Val Glu Asn Ile Asn Val
305 310 315 320
Ala Ala Ile Glu Thr Thr Leu Trp Ser Ile Glu Trp Gly Ile Ala Glu
325 330 335
Leu Val Asn His Pro Glu Ile Gln Lys Lys Leu Arg Asn Glu Leu Asp
340 345 350
Thr Val Leu Gly Pro Gly His Gln Ile Thr Glu Pro Asp Thr His Lys
355 360 365
Leu Pro Tyr Leu Gln Ala Val Ile Lys Glu Thr Leu Arg Leu Arg Met
370 375 380
Ala Ile Pro Leu Leu Val Pro His Met Asn Leu His Asp Ala Lys Leu
385 390 395 400
Gly Gly Tyr Asp Val Pro Ala Glu Ser Lys Ile Leu Val Asn Ala Trp
405 410 415
Trp Leu Ala Asn Asn Pro Ala Gln Trp Lys Lys Pro Glu Glu Phe Arg
420 425 430
Pro Glu Arg Phe Leu Glu Glu Glu Ser Lys Val Glu Ala Asn Gly Asn
435 440 445
Asp Phe Arg Tyr Leu Pro Phe Gly Val Gly Arg Arg Ser Cys Pro Gly
450 455 460
Ile Ile Leu Ala Leu Pro Ile Leu Gly Ile Thr Ile Gly Arg Leu Val
465 470 475 480
Gln Asn Phe Glu Leu Leu Pro Pro Pro Gly Gln Ser Lys Ile Asp Thr
485 490 495
Ala Glu Lys Gly Gly Gln Phe Ser Leu His Ile Leu Lys His Ser Thr
500 505 510
Ile Val Ala Lys Pro Arg Ser Phe
515 520
<210> 70
<211> 1563
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:69的编码序列
<400> 70
atgtccgact tgaacggttg gtgtaactct ggtaaccaaa acatgtgttg ttgtcaatct 60
tacgttaaga gaggttacga tagagttttg tctttcaacg gtttgattac cgtttctaag 120
ttgagaggta agagattcaa gttgccacca ggtccattgc cagtcccagt tttcggtaac 180
tggttgcaag tcggtgatga cttgaaccac agaaacttgt ccgacttggc caagaagtac 240
ggtgatgtct tgttgttgag aatgggtcaa agaaacttgg tcgtcgtttc ttctccagac 300
cacgccaagg aagtcttgca cactcaaggt gttgaattcg gttctagaac tcgtaatgtc 360
gtgttcgaca tcttcactgg taagggtcaa gatatggttt tcactgtcta cggcgaacac 420
tggagaaaga tgagaagaat catgaccgtc ccattcttca ctaacaaggt tgttcaacaa 480
caaagattca actgggaaga tgaagccgct agagtcgttg aagatgttaa gaaggaccca 540
gaagctgcta ccaacggtat cgtcttgaga agaagattgc aattgatgat gtacaacaac 600
atgtacagaa ttatgttcga tagaagattc gaatctcaag atgatccatt gttcaacaga 660
ttgaaggctt tgaacggtga aagatctaga ttggcgcaga gcttcgaata caactacggt 720
gatttcattc caattttaag accattcttg agaggttact tgaagatttg taaggaagtt 780
aaggaaagaa gattgcaatt gttcaaggac tacttcgttg aagaaagaaa gaagttggct 840
tctactaagt ctatgtctaa cgaatctttg aagtgtgcta tcgatcacat tttggacgct 900
caaactaagg gtgaaatcaa cgaagataac gttttgtaca tcgttgaaaa catcaacgtt 960
gccgctatcg aaactacttt gtggtctatc gaatggggta ttgctgaatt ggttaaccac 1020
ccagaaatcc aaaagaagtt gagaaacgaa ttggacaccg ttttgggtcc aggtcaccaa 1080
atcactgaac cagacaccca caagttgcca tacttgcaag ccgttatcaa ggaaactttg 1140
agattgagaa tggctattcc attgttggtt ccacacatga acttgcacga cgccaagttg 1200
ggtggttacg acgtcccagc tgaatctaag atcttggtta acgcttggtg gttggccaac 1260
aacccagccc aatggaagaa gccagaagaa ttcagaccag aaagattctt ggaagaagaa 1320
tccaaggttg aagctaacgg taacgacttc agatacttgc cattcggtgt tggtagaaga 1380
tcttgtccag gtataatatt ggctctccca attttgggca tcactattgg tagattggtt 1440
caaaacttcg aattgttgcc accaccaggt caatctaaga ttgacactgc tgaaaagggt 1500
ggtcaattct ctttgcacat tttgaagcac tctaccattg ttgccaagcc aagatctttc 1560
taa 1563
<210> 71
<211> 513
<212> PRT
<213> 西班牙糖丝菌(Saccharothrix espanaensis)
<400> 71
Met Ser Thr Ile Thr Ser Pro Ala Pro Ala Gly Arg Leu Asn Asn Val
1 5 10 15
Arg Pro Met Thr Gly Glu Glu Tyr Leu Glu Ser Leu Arg Asp Gly Arg
20 25 30
Glu Val Tyr Ile Tyr Gly Glu Arg Val Asp Asp Val Thr Thr His Leu
35 40 45
Ala Phe Arg Asn Ser Val Arg Ser Ile Ala Arg Leu Tyr Asp Val Leu
50 55 60
His Asp Pro Ala Ser Glu Gly Val Leu Arg Val Pro Thr Asp Thr Gly
65 70 75 80
Asn Gly Gly Phe Thr His Pro Phe Phe Lys Thr Ala Arg Ser Ser Glu
85 90 95
Asp Leu Val Ala Ala Arg Glu Ala Ile Val Gly Trp Gln Arg Leu Val
100 105 110
Tyr Gly Trp Met Gly Arg Thr Pro Asp Tyr Lys Ala Ala Phe Phe Gly
115 120 125
Thr Leu Asp Ala Asn Ala Glu Phe Tyr Gly Pro Phe Glu Ala Asn Ala
130 135 140
Arg Arg Trp Tyr Arg Asp Ala Gln Glu Arg Val Leu Tyr Phe Asn His
145 150 155 160
Ala Ile Val His Pro Pro Val Asp Arg Asp Arg Pro Ala Asp Arg Thr
165 170 175
Ala Asp Ile Cys Val His Val Glu Glu Glu Thr Asp Ser Gly Leu Ile
180 185 190
Val Ser Gly Ala Lys Val Val Ala Thr Gly Ser Ala Met Thr Asn Ala
195 200 205
Asn Leu Ile Ala His Tyr Gly Leu Pro Val Arg Asp Lys Lys Phe Gly
210 215 220
Leu Val Phe Thr Val Pro Met Asn Ser Pro Gly Leu Lys Leu Ile Cys
225 230 235 240
Arg Thr Ser Tyr Glu Leu Met Val Ala Thr Gln Gly Ser Pro Phe Asp
245 250 255
Tyr Pro Leu Ser Ser Arg Leu Asp Glu Asn Asp Ser Ile Met Ile Phe
260 265 270
Asp Arg Val Leu Val Pro Trp Glu Asn Val Phe Met Tyr Asp Ala Gly
275 280 285
Ala Ala Asn Ser Phe Ala Thr Gly Ser Gly Phe Leu Glu Arg Phe Thr
290 295 300
Phe His Gly Cys Thr Arg Leu Ala Val Lys Leu Asp Phe Ile Ala Gly
305 310 315 320
Cys Val Met Lys Ala Val Glu Val Thr Gly Thr Thr His Phe Arg Gly
325 330 335
Val Gln Ala Gln Val Gly Glu Val Leu Asn Trp Arg Asp Val Phe Trp
340 345 350
Gly Leu Ser Asp Ala Met Ala Lys Ser Pro Asn Ser Trp Val Gly Gly
355 360 365
Ser Val Gln Pro Asn Leu Asn Tyr Gly Leu Ala Tyr Arg Thr Phe Met
370 375 380
Gly Val Gly Tyr Pro Arg Ile Lys Glu Ile Ile Gln Gln Thr Leu Gly
385 390 395 400
Ser Gly Leu Ile Tyr Leu Asn Ser Ser Ala Ala Asp Trp Lys Asn Pro
405 410 415
Asp Val Arg Pro Tyr Leu Asp Arg Tyr Leu Arg Gly Ser Arg Gly Ile
420 425 430
Gln Ala Ile Asp Arg Val Lys Leu Leu Lys Leu Leu Trp Asp Ala Val
435 440 445
Gly Thr Glu Phe Ala Gly Arg His Glu Leu Tyr Glu Arg Asn Tyr Gly
450 455 460
Gly Asp His Glu Gly Ile Arg Val Gln Thr Leu Gln Ala Tyr Gln Ala
465 470 475 480
Asn Gly Gln Ala Ala Ala Leu Lys Gly Phe Ala Glu Gln Cys Met Ser
485 490 495
Glu Tyr Asp Leu Asp Gly Trp Thr Arg Pro Asp Leu Ile Asn Pro Gly
500 505 510
Thr
<210> 72
<211> 1542
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:71的编码序列
<400> 72
atgtccacca tcacttctcc agctccagct ggtagattga acaacgtcag accaatgact 60
ggtgaagaat acttggaatc tttgagagat ggtagagaag tctacatcta cggtgaaaga 120
gtcgacgacg tcaccactca cttggccttc agaaactctg ttagatccat cgctagattg 180
tacgacgttt tgcacgaccc agcttcggag ggtgtactaa gagttccaac cgacactggt 240
aatggtggct tcactcatcc attcttcaag accgcccgtt cttctgaaga tttggtcgcc 300
gctagagaag ccatcgtcgg ttggcaaaga ttggtttacg gttggatggg tagaacccca 360
gattacaagg ctgcgttctt cggtactctc gacgccaacg ccgaattcta cggtccattc 420
gaagccaacg ccagaagatg gtacagagat gcccaagaaa gagttttgta cttcaaccac 480
gctatcgttc acccaccagt cgacagagac agaccagccg acagaaccgc cgacatctgt 540
gttcacgttg aagaagaaac cgactctggt ttgatcgttt ccggtgccaa ggttgtcgct 600
accggttccg ctatgaccaa cgctaacttg atcgctcact acggtttgcc agttagagac 660
aagaagttcg gtttggtttt cactgtccca atgaactctc caggtttgaa gttgatctgt 720
agaacctcct acgaattgat ggtcgctact caaggttctc cattcgacta cccattatct 780
tctagattgg acgaaaacga ctctatcatg atcttcgaca gagttttggt tccatgggaa 840
aacgttttca tgtacgacgc tggtgctgcc aactccttcg ccaccggttc tggtttcttg 900
gaaagattca ccttccacgg ttgtaccaga ttggctgtca agttggactt catcgccggt 960
tgtgtcatga aggctgttga agtcaccggt accactcact tcagaggtgt tcaagctcaa 1020
gtcggtgaag ttttgaactg gagagatgtt ttctggggtt tgtccgacgc tatggccaag 1080
tctccaaact cttgggtcgg tggttctgtt caaccaaact tgaactacgg tttggcttac 1140
agaaccttca tgggtgttgg ttacccaaga atcaaggaaa tcatccaaca aaccttgggt 1200
tctggtttga tctacttgaa ctcctctgcc gccgactgga agaacccaga cgtcagacca 1260
tacttggaca gatacttgag aggttctaga ggtatccaag ctatcgacag agtcaagttg 1320
ttgaagttgt tgtgggacgc tgtcggtacc gaattcgccg gtagacacga attgtacgaa 1380
agaaactacg gtggtgacca cgaaggtatc agagttcaaa ccttgcaagc ttaccaagct 1440
aacggtcagg cggccgctct caagggtttc gcggaacaat gtatgtccga atacgacttg 1500
gacggttgga ctagaccaga cttgatcaac ccaggtacct aa 1542
<210> 73
<211> 498
<212> PRT
<213> 甜菜(Beta vulgaris)
<400> 73
Met Ser Asp His Ala Thr Leu Ala Met Ile Leu Ala Ile Leu Phe Ile
1 5 10 15
Ser Phe His Phe Ile Lys Leu Leu Phe Ser Gln Gln Thr Thr Lys Leu
20 25 30
Leu Pro Pro Gly Pro Lys Pro Leu Pro Ile Ile Gly Asn Ile Leu Glu
35 40 45
Val Gly Lys Lys Pro His Arg Ser Phe Ala Asn Leu Ala Lys Ile His
50 55 60
Gly Pro Leu Ile Ser Leu Arg Leu Gly Ser Val Thr Thr Ile Val Val
65 70 75 80
Ser Ser Ala Asp Val Ala Lys Glu Met Phe Leu Lys Lys Asp His Pro
85 90 95
Leu Ser Asn Arg Thr Ile Pro Asn Ser Val Thr Ala Gly Asp His His
100 105 110
Lys Leu Thr Met Ser Trp Leu Pro Val Ser Pro Lys Trp Arg Asn Phe
115 120 125
Arg Lys Ile Thr Ala Val His Leu Leu Ser Pro Gln Arg Leu Asp Ala
130 135 140
Cys Gln Thr Phe Arg His Ala Lys Val Gln Gln Leu Tyr Glu Tyr Val
145 150 155 160
Gln Glu Cys Ala Gln Lys Gly Gln Ala Val Asp Ile Gly Lys Ala Ala
165 170 175
Phe Thr Thr Ser Leu Asn Leu Leu Ser Lys Leu Phe Phe Ser Val Glu
180 185 190
Leu Ala His His Lys Ser His Thr Ser Gln Glu Phe Lys Glu Leu Ile
195 200 205
Trp Asn Ile Met Glu Asp Ile Gly Lys Pro Asn Tyr Ala Asp Tyr Phe
210 215 220
Pro Ile Leu Gly Cys Val Asp Pro Ser Gly Ile Arg Arg Arg Leu Ala
225 230 235 240
Cys Ser Phe Asp Lys Leu Ile Ala Val Phe Gln Gly Ile Ile Cys Glu
245 250 255
Arg Leu Ala Pro Asp Ser Ser Thr Thr Thr Thr Thr Thr Thr Asp Asp
260 265 270
Val Leu Asp Val Leu Leu Gln Leu Phe Lys Gln Asn Glu Leu Thr Met
275 280 285
Gly Glu Ile Asn His Leu Leu Val Asp Ile Phe Asp Ala Gly Thr Asp
290 295 300
Thr Thr Ser Ser Thr Leu Glu Trp Val Met Thr Glu Leu Ile Arg Asn
305 310 315 320
Pro Glu Met Met Glu Lys Ala Gln Glu Glu Ile Lys Gln Val Leu Gly
325 330 335
Lys Asp Lys Gln Ile Gln Glu Ser Asp Ile Ile Asn Leu Pro Tyr Leu
340 345 350
Gln Ala Ile Ile Lys Glu Thr Leu Arg Leu His Pro Pro Thr Val Phe
355 360 365
Leu Leu Pro Arg Lys Ala Asp Thr Asp Val Glu Leu Tyr Gly Tyr Ile
370 375 380
Val Pro Lys Asp Ala Gln Ile Leu Val Asn Leu Trp Ala Ile Gly Arg
385 390 395 400
Asp Pro Asn Ala Trp Gln Asn Ala Asp Ile Phe Ser Pro Glu Arg Phe
405 410 415
Ile Gly Cys Glu Ile Asp Val Lys Gly Arg Asp Phe Gly Leu Leu Pro
420 425 430
Phe Gly Ala Gly Arg Arg Ile Cys Pro Gly Met Asn Leu Ala Ile Arg
435 440 445
Met Leu Thr Leu Met Leu Ala Thr Leu Leu Gln Phe Phe Asn Trp Lys
450 455 460
Leu Glu Gly Asp Ile Ser Pro Lys Asp Leu Asp Met Asp Glu Lys Phe
465 470 475 480
Gly Ile Ala Leu Gln Lys Thr Lys Pro Leu Lys Leu Ile Pro Ile Pro
485 490 495
Arg Tyr
<210> 74
<211> 1497
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:73的编码序列
<400> 74
atgtccgatc acgctacttt ggcgatgata ttggccatcc tattcatttc tttccacttc 60
atcaagttgt tgttctctca acaaactacc aagttgttgc caccaggtcc aaagccattg 120
ccaatcattg gtaacatctt ggaagttggt aagaagccac acagatcttt cgctaacttg 180
gctaagattc acggtccatt gatctctttg agattgggtt ctgttactac tattgttgtt 240
tcttctgctg atgttgctaa ggaaatgttc ttgaagaagg accacccatt gtctaacaga 300
actattccaa actctgtcac tgccggtgac caccacaagt tgaccatgtc ttggttgcca 360
gtttctccaa agtggagaaa cttcagaaag attactgccg tccacttgtt gtctccacaa 420
agattggatg cttgtcaaac cttcagacac gccaaggttc aacaattgta cgaatacgtt 480
caagaatgtg ctcaaaaggg tcaagctgtt gatattggta aggctgcttt cactacctcc 540
ttgaacttgt tgtctaagtt gttcttctct gttgaattgg cccaccacaa gtctcacact 600
tctcaagaat tcaaggaatt gatctggaac attatggaag atattggtaa gccaaactac 660
gctgattact tcccaatttt gggttgtgtt gatccatctg gtattagaag aagattggct 720
tgttctttcg acaagttgat tgctgttttc caaggtatca tctgtgaaag attggctcca 780
gattcttcta ctacaaccac tactaccact gatgatgttt tggacgtttt gttgcaattg 840
ttcaagcaaa acgaattgac tatgggtgaa attaaccact tgttggtcga cattttcgat 900
gctggtactg acactacttc ttctactttg gaatgggtca tgactgaatt gattagaaac 960
ccagaaatga tggaaaaggc tcaagaagaa attaagcaag ttttgggtaa ggataagcaa 1020
attcaagaat ctgacattat taacttgcca tacttgcaag ccattatcaa ggaaactttg 1080
agattgcacc caccaactgt tttcttgttg ccaagaaagg ccgacactga tgttgaattg 1140
tacggttaca ttgttccaaa ggatgctcaa atcttggtta acttgtgggc tattggtaga 1200
gatccaaacg cttggcaaaa cgctgatatt ttctctccag aaagattcat cggttgtgaa 1260
attgatgtca agggtagaga tttcggtttg ttgccattcg gtgccggtag aagaatctgt 1320
ccaggtatga acttggccat tagaatgttg actttgatgt tggctacttt gttgcaattc 1380
ttcaactgga agttggaagg tgacatctct ccaaaggact tggacatgga tgaaaagttc 1440
ggtattgctt tgcaaaagac taagccattg aagttgattc caatcccaag atactaa 1497
<210> 75
<211> 413
<212> PRT
<213> 沼泽红假单胞菌(Rhodopseudomonas palustris)
<400> 75
Met Ser Thr Thr Ala Pro Ser Leu Val Pro Val Thr Thr Pro Ser Gln
1 5 10 15
His Gly Ala Gly Val Pro His Leu Gly Ile Asp Pro Phe Ala Leu Asp
20 25 30
Tyr Phe Ala Asp Pro Tyr Pro Glu Gln Glu Thr Leu Arg Glu Ala Gly
35 40 45
Pro Val Val Tyr Leu Asp Lys Trp Asn Val Tyr Gly Val Ala Arg Tyr
50 55 60
Ala Glu Val Tyr Ala Val Leu Asn Asp Pro Leu Thr Phe Cys Ser Ser
65 70 75 80
Arg Gly Val Gly Leu Ser Asp Phe Lys Lys Glu Lys Pro Trp Arg Pro
85 90 95
Pro Ser Leu Ile Leu Glu Ala Asp Pro Pro Ala His Thr Arg Thr Arg
100 105 110
Ala Val Leu Ser Lys Val Leu Ser Pro Ala Thr Met Lys Arg Leu Arg
115 120 125
Asp Gly Phe Ala Ala Ala Ala Asp Ala Lys Ile Asp Glu Leu Leu Ala
130 135 140
Arg Gly Gly Asn Ile Asp Ala Ile Ala Asp Leu Ala Glu Ala Tyr Pro
145 150 155 160
Leu Ser Val Phe Pro Asp Ala Met Gly Leu Lys Gln Glu Gly Arg Glu
165 170 175
Asn Leu Leu Pro Tyr Ala Gly Leu Val Leu Asn Ala Phe Gly Pro Pro
180 185 190
Asn Glu Leu Arg Gln Ser Ala Ile Glu Arg Ser Ala Pro His Gln Ala
195 200 205
Tyr Val Ala Glu Gln Cys Gln Arg Pro Asn Leu Ala Pro Gly Gly Phe
210 215 220
Gly Ala Cys Ile His Ala Phe Ser Asp Thr Gly Glu Ile Thr Pro Glu
225 230 235 240
Glu Ala Pro Leu Leu Val Arg Ser Leu Leu Ser Ala Gly Leu Asp Thr
245 250 255
Thr Val Asn Gly Ile Ala Ala Ala Val Tyr Cys Leu Ala Arg Phe Pro
260 265 270
Asp Glu Phe Ala Arg Leu Arg Ala Asp Pro Ser Leu Ala Arg Asn Ala
275 280 285
Phe Glu Glu Ala Val Arg Phe Glu Ser Pro Val Gln Thr Phe Phe Arg
290 295 300
Thr Thr Thr Arg Asp Val Glu Leu Ala Gly Ala Thr Ile Gly Glu Gly
305 310 315 320
Glu Lys Val Leu Met Phe Leu Gly Ser Ala Asn Arg Asp Pro Arg Arg
325 330 335
Trp Asp Asp Pro Asp Arg Tyr Asp Ile Thr Arg Lys Thr Ser Gly His
340 345 350
Val Gly Phe Gly Ser Gly Val His Met Cys Val Gly Gln Leu Val Ala
355 360 365
Arg Leu Glu Gly Glu Val Val Leu Ala Ala Leu Ala Arg Lys Val Ala
370 375 380
Ala Ile Glu Ile Ala Gly Pro Leu Lys Arg Arg Phe Asn Asn Thr Leu
385 390 395 400
Arg Gly Leu Glu Ser Leu Pro Ile Gln Leu Thr Pro Ala
405 410
<210> 76
<211> 1242
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:75的编码序列
<400> 76
atgtccacca ctgctccatc tttggttcca gttaccactc catcccaaca cggtgctggt 60
gttccacact tgggtatcga tccattcgct ttggactact tcgccgatcc atacccagaa 120
caagaaactt tgagagaagc tggtccagtt gtctacttgg acaagtggaa cgtctacggt 180
gtcgccagat acgctgaagt atacgccgta ctcaacgatc cattgacctt ctgttcctct 240
agaggtgttg gtttgtctga tttcaagaag gaaaagccat ggaggccacc atctttgatc 300
ttggaagccg acccaccagc tcacaccaga accagagctg ttttgtctaa ggttttgtct 360
ccagctacta tgaagagatt gagagatggt ttcgctgctg ctgctgacgc caagatcgat 420
gaattgttgg ccagaggtgg taacatcgat gctatcgccg acttggccga agcctaccca 480
ttgtctgttt tcccagatgc gatgggtttg aagcaagaag gcagagaaaa cttgttgcca 540
tacgcgggct tggttttgaa cgcattcggt ccaccaaacg aattgagaca atctgctatc 600
gaaagatctg ctccacacca agcctacgtt gccgaacaat gtcaaagacc aaacttggct 660
ccaggtggtt tcggtgcctg tatccacgcc ttctctgaca ccggtgaaat cactccagaa 720
gaagccccat tgttggttag atctttgttg tctgctggtt tggacactac cgtcaacggt 780
attgctgctg ctgtttactg tttggctaga ttcccagacg aattcgctag attgagagcc 840
gatccatctt tggccagaaa cgccttcgaa gaagctgtta gattcgaatc tccagttcaa 900
accttcttca gaaccaccac tagagatgtc gaattggctg gtgccactat cggtgaaggt 960
gaaaaggttt tgatgttctt gggttccgcc aacagagatc caagaagatg ggacgatcca 1020
gacagatacg acatcaccag aaagacctct gggcatgtcg gcttcggttc tggtgttcac 1080
atgtgtgtcg gtcaattggt cgccagattg gaaggtgaag ttgttttggc cgctttggct 1140
agaaaggttg ctgctatcga aatcgccggt ccattgaaga gaagattcaa caacactttg 1200
agaggtttgg aatctttgcc aatccaattg actccagctt aa 1242
<210> 77
<211> 718
<212> PRT
<213> 拟南芥(Arabidopsis thaliana)
<400> 77
Met Ser Asp Gln Ile Glu Ala Met Leu Cys Gly Gly Gly Glu Lys Thr
1 5 10 15
Lys Val Ala Val Thr Thr Lys Thr Leu Ala Asp Pro Leu Asn Trp Gly
20 25 30
Leu Ala Ala Asp Gln Met Lys Gly Ser His Leu Asp Glu Val Lys Lys
35 40 45
Met Val Glu Glu Tyr Arg Arg Pro Val Val Asn Leu Gly Gly Glu Thr
50 55 60
Leu Thr Ile Gly Gln Val Ala Ala Ile Ser Thr Val Gly Gly Ser Val
65 70 75 80
Lys Val Glu Leu Ala Glu Thr Ser Arg Ala Gly Val Lys Ala Ser Ser
85 90 95
Asp Trp Val Met Glu Ser Met Asn Lys Gly Thr Asp Ser Tyr Gly Val
100 105 110
Thr Thr Gly Phe Gly Ala Thr Ser His Arg Arg Thr Lys Asn Gly Thr
115 120 125
Ala Leu Gln Thr Glu Leu Ile Arg Phe Leu Asn Ala Gly Ile Phe Gly
130 135 140
Asn Thr Lys Glu Thr Cys His Thr Leu Pro Gln Ser Ala Thr Arg Ala
145 150 155 160
Ala Met Leu Val Arg Val Asn Thr Leu Leu Gln Gly Tyr Ser Gly Ile
165 170 175
Arg Phe Glu Ile Leu Glu Ala Ile Thr Ser Leu Leu Asn His Asn Ile
180 185 190
Ser Pro Ser Leu Pro Leu Arg Gly Thr Ile Thr Ala Ser Gly Asp Leu
195 200 205
Val Pro Leu Ser Tyr Ile Ala Gly Leu Leu Thr Gly Arg Pro Asn Ser
210 215 220
Lys Ala Thr Gly Pro Asp Gly Glu Ser Leu Thr Ala Lys Glu Ala Phe
225 230 235 240
Glu Lys Ala Gly Ile Ser Thr Gly Phe Phe Asp Leu Gln Pro Lys Glu
245 250 255
Gly Leu Ala Leu Val Asn Gly Thr Ala Val Gly Ser Gly Met Ala Ser
260 265 270
Met Val Leu Phe Glu Ala Asn Val Gln Ala Val Leu Ala Glu Val Leu
275 280 285
Ser Ala Ile Phe Ala Glu Val Met Ser Gly Lys Pro Glu Phe Thr Asp
290 295 300
His Leu Thr His Arg Leu Lys His His Pro Gly Gln Ile Glu Ala Ala
305 310 315 320
Ala Ile Met Glu His Ile Leu Asp Gly Ser Ser Tyr Met Lys Leu Ala
325 330 335
Gln Lys Val His Glu Met Asp Pro Leu Gln Lys Pro Lys Gln Asp Arg
340 345 350
Tyr Ala Leu Arg Thr Ser Pro Gln Trp Leu Gly Pro Gln Ile Glu Val
355 360 365
Ile Arg Gln Ala Thr Lys Ser Ile Glu Arg Glu Ile Asn Ser Val Asn
370 375 380
Asp Asn Pro Leu Ile Asp Val Ser Arg Asn Lys Ala Ile His Gly Gly
385 390 395 400
Asn Phe Gln Gly Thr Pro Ile Gly Val Ser Met Asp Asn Thr Arg Leu
405 410 415
Ala Ile Ala Ala Ile Gly Lys Leu Met Phe Ala Gln Phe Ser Glu Leu
420 425 430
Val Asn Asp Phe Tyr Asn Asn Gly Leu Pro Ser Asn Leu Thr Ala Ser
435 440 445
Ser Asn Pro Ser Leu Asp Tyr Gly Phe Lys Gly Ala Glu Ile Ala Met
450 455 460
Ala Ser Tyr Cys Ser Glu Leu Gln Tyr Leu Ala Asn Pro Val Thr Ser
465 470 475 480
His Val Gln Ser Ala Glu Gln His Asn Gln Asp Val Asn Ser Leu Gly
485 490 495
Leu Ile Ser Ser Arg Lys Thr Ser Glu Ala Val Asp Ile Leu Lys Leu
500 505 510
Met Ser Thr Thr Phe Leu Val Gly Ile Cys Gln Ala Val Asp Leu Arg
515 520 525
His Leu Glu Glu Asn Leu Arg Gln Thr Val Lys Asn Thr Val Ser Gln
530 535 540
Val Ala Lys Lys Val Leu Thr Thr Gly Ile Asn Gly Glu Leu His Pro
545 550 555 560
Ser Arg Phe Cys Glu Lys Asp Leu Leu Lys Val Val Asp Arg Glu Gln
565 570 575
Val Phe Thr Tyr Val Asp Asp Pro Cys Ser Ala Thr Tyr Pro Leu Met
580 585 590
Gln Arg Leu Arg Gln Val Ile Val Asp His Ala Leu Ser Asn Gly Glu
595 600 605
Thr Glu Lys Asn Ala Val Thr Ser Ile Phe Gln Lys Ile Gly Ala Phe
610 615 620
Glu Glu Glu Leu Lys Ala Val Leu Pro Lys Glu Val Glu Ala Ala Arg
625 630 635 640
Ala Ala Tyr Gly Asn Gly Thr Ala Pro Ile Pro Asn Arg Ile Lys Glu
645 650 655
Cys Arg Ser Tyr Pro Leu Tyr Arg Phe Val Arg Glu Glu Leu Gly Thr
660 665 670
Lys Leu Leu Thr Gly Glu Lys Val Val Ser Pro Gly Glu Glu Phe Asp
675 680 685
Lys Val Phe Thr Ala Met Cys Glu Gly Lys Leu Ile Asp Pro Leu Met
690 695 700
Asp Cys Leu Lys Glu Trp Asn Gly Ala Pro Ile Pro Ile Cys
705 710 715
<210> 78
<211> 2157
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:77的编码序列
<400> 78
atgtccgatc aaatcgaagc tatgttgtgt ggtggtggtg aaaaaacaaa agttgctgtt 60
actactaaga ccttggccga tccattgaat tggggtttgg ctgctgatca aatgaagggt 120
tctcatttgg atgaagtcaa gaagatggtc gaagaataca gaaggccagt tgttaatttg 180
ggtggtgaaa ctttgactat tggtcaagtt gctgctattt ctactgttgg tggttctgtt 240
aaggttgaat tggctgaaac ttctagagct ggtgttaagg cttcttctga ttgggttatg 300
gaatctatga acaagggtac tgattcttac ggtgttacta caggttttgg tgctacttct 360
catagaagaa ctaagaatgg tactgccttg caaaccgaat tgatcagatt tttgaacgcc 420
ggtattttcg gtaacaccaa agaaacttgt cataccttgc cacaatctgc tactagagct 480
gctatgttgg ttagagttaa cactttgttg caaggttact ccggtatcag attcgaaatt 540
ttggaagcta tcacctcctt gttgaaccat aacatttctc catctttgcc attgagaggt 600
actattactg cttctggtga tttggttcca ttgtcttata ttgctggttt gttgactggt 660
agaccaaact ctaaagctac tggtccagat ggtgaatcat tgactgctaa agaagctttt 720
gaaaaggctg gtatctctac tggttttttc gacttgcaac ctaaagaagg tttggctttg 780
gttaatggta cagctgttgg ttctggtatg gcttctatgg ttttgtttga agctaacgtt 840
caagctgttt tggccgaagt tttgtctgct atttttgctg aagttatgtc cggtaagcca 900
gaattcactg atcatttgac ccatagattg aaacatcacc caggtcaaat tgaagctgct 960
gcaattatgg aacatatctt ggatggttcc tcttacatga agttggctca aaaagttcac 1020
gaaatggacc cattgcaaaa gccaaaacaa gatagatacg ctttgagaac ttctccacaa 1080
tggttgggtc cacaaataga agttattaga caagccacca agtccatcga aagagaaatc 1140
aattctgtta acgacaaccc attgatcgac gtcagtagaa acaaagctat tcatggtggt 1200
aacttccaag gtactccaat tggtgtttct atggacaaca ctagattggc tattgctgcc 1260
attggtaaat tgatgttcgc tcaattctcc gaattggtca acgattttta caacaacggt 1320
ttgccttcta acttgaccgc ttcttctaat ccatcattgg attacggttt taagggtgct 1380
gaaattgcta tggcttcata ctgttctgaa ttgcaatact tggctaaccc agttacctct 1440
catgttcaat ctgctgaaca acacaatcaa gacgttaact ccttgggttt gatctcttct 1500
agaaagactt ctgaagccgt tgacatcttg aagttgatgt ctactacatt cttggtcggt 1560
atttgccaag ctgttgattt gagacatttg gaagaaaact tgagacaaac cgtcaagaac 1620
accgtttcac aagttgctaa gaaagttttg accaccggta ttaacggtga attgcatcca 1680
tctagattct gcgaaaagga tttgttgaag gtcgttgata gagaacaagt tttcacctac 1740
gttgatgatc catgttctgc tacttatcca ttgatgcaaa gattgagaca agtcatcgtt 1800
gatcatgctt tgtctaatgg tgaaaccgaa aagaacgctg ttacctccat tttccaaaag 1860
attggtgctt tcgaagaaga attgaaggcc gttttgccaa aagaagttga agcagctaga 1920
gcagcttacg gtaacggtac tgctccaatt ccaaatagaa tcaaagaatg cagatcctac 1980
ccattataca gattcgttag agaagaatta ggtactaagt tgttgaccgg tgaaaaggtt 2040
gtttctccag gtgaagaatt cgataaggtt ttcactgcta tgtgcgaagg taaattgatc 2100
gatccattga tggactgctt gaaagaatgg aatggtgctc ctattcctat ctgctaa 2157
<210> 79
<211> 506
<212> PRT
<213> 拟南芥(Arabidopsis thaliana)
<400> 79
Met Ser Asp Leu Leu Leu Leu Glu Lys Ser Leu Ile Ala Val Phe Val
1 5 10 15
Ala Val Ile Leu Ala Thr Val Ile Ser Lys Leu Arg Gly Lys Lys Leu
20 25 30
Lys Leu Pro Pro Gly Pro Ile Pro Ile Pro Ile Phe Gly Asn Trp Leu
35 40 45
Gln Val Gly Asp Asp Leu Asn His Arg Asn Leu Val Asp Tyr Ala Lys
50 55 60
Lys Phe Gly Asp Leu Phe Leu Leu Arg Met Gly Gln Arg Asn Leu Val
65 70 75 80
Val Val Ser Ser Pro Asp Leu Thr Lys Glu Val Leu Leu Thr Gln Gly
85 90 95
Val Glu Phe Gly Ser Arg Thr Arg Asn Val Val Phe Asp Ile Phe Thr
100 105 110
Gly Lys Gly Gln Asp Met Val Phe Thr Val Tyr Gly Glu His Trp Arg
115 120 125
Lys Met Arg Arg Ile Met Thr Val Pro Phe Phe Thr Asn Lys Val Val
130 135 140
Gln Gln Asn Arg Glu Gly Trp Glu Phe Glu Ala Ala Ser Val Val Glu
145 150 155 160
Asp Val Lys Lys Asn Pro Asp Ser Ala Thr Lys Gly Ile Val Leu Arg
165 170 175
Lys Arg Leu Gln Leu Met Met Tyr Asn Asn Met Phe Arg Ile Met Phe
180 185 190
Asp Arg Arg Phe Glu Ser Glu Asp Asp Pro Leu Phe Leu Arg Leu Lys
195 200 205
Ala Leu Asn Gly Glu Arg Ser Arg Leu Ala Gln Ser Phe Glu Tyr Asn
210 215 220
Tyr Gly Asp Phe Ile Pro Ile Leu Arg Pro Phe Leu Arg Gly Tyr Leu
225 230 235 240
Lys Ile Cys Gln Asp Val Lys Asp Arg Arg Ile Ala Leu Phe Lys Lys
245 250 255
Tyr Phe Val Asp Glu Arg Lys Gln Ile Ala Ser Ser Lys Pro Thr Gly
260 265 270
Ser Glu Gly Leu Lys Cys Ala Ile Asp His Ile Leu Glu Ala Glu Gln
275 280 285
Lys Gly Glu Ile Asn Glu Asp Asn Val Leu Tyr Ile Val Glu Asn Ile
290 295 300
Asn Val Ala Ala Ile Glu Thr Thr Leu Trp Ser Ile Glu Trp Gly Ile
305 310 315 320
Ala Glu Leu Val Asn His Pro Glu Ile Gln Ser Lys Leu Arg Asn Glu
325 330 335
Leu Asp Thr Val Leu Gly Pro Gly Val Gln Val Thr Glu Pro Asp Leu
340 345 350
His Lys Leu Pro Tyr Leu Gln Ala Val Val Lys Glu Thr Leu Arg Leu
355 360 365
Arg Met Ala Ile Pro Leu Leu Val Pro His Met Asn Leu His Asp Ala
370 375 380
Lys Leu Ala Gly Tyr Asp Ile Pro Ala Glu Ser Lys Ile Leu Val Asn
385 390 395 400
Ala Trp Trp Leu Ala Asn Asn Pro Asn Ser Trp Lys Lys Pro Glu Glu
405 410 415
Phe Arg Pro Glu Arg Phe Phe Glu Glu Glu Ser His Val Glu Ala Asn
420 425 430
Gly Asn Asp Phe Arg Tyr Val Pro Phe Gly Val Gly Arg Arg Ser Cys
435 440 445
Pro Gly Ile Ile Leu Ala Leu Pro Ile Leu Gly Ile Thr Ile Gly Arg
450 455 460
Met Val Gln Asn Phe Glu Leu Leu Pro Pro Pro Gly Gln Ser Lys Val
465 470 475 480
Asp Thr Ser Glu Lys Gly Gly Gln Phe Ser Leu His Ile Leu Asn His
485 490 495
Ser Ile Ile Val Met Lys Pro Arg Asn Cys
500 505
<210> 80
<211> 1521
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:79的编码序列
<400> 80
atgtccgact tgttgttgtt ggaaaagtcc ttgattgctg ttttcgttgc tgttattttg 60
gccaccgtta tctctaaatt gagaggtaag aaattgaagt tgccaccagg tccaattcca 120
atcccaattt ttggtaattg gttgcaagtt ggtgatgact tgaaccacag aaacttggtt 180
gattacgcta aaaagttcgg tgatttgttc ttgttgagaa tgggtcaaag aaatttggtc 240
gttgtttcct caccagactt gaccaaagaa gttttgttga ctcaaggtgt cgaattcggt 300
tccagaacta gaaatgttgt tttcgatatc ttcaccggta agggtcaaga tatggttttt 360
actgtttacg gtgaacattg gagaaagatg agaagaatta tgaccgttcc attcttcacc 420
aacaaggttg tccaacaaaa cagagaaggt tgggaatttg aagctgcttc tgttgttgaa 480
gatgtcaaga agaatccaga ttctgctact aagggtatcg ttttgagaaa aagattgcaa 540
ttgatgatgt acaacaacat gttcagaatc atgttcgaca gaagatttga atccgaagat 600
gaccctttgt ttttgagatt gaaggctttg aacggtgaaa gatctagatt ggctcaatcc 660
ttcgaataca actacggtga tttcatccca atcttaagac cattcttgag aggttacttg 720
aagatctgcc aagatgttaa ggatagaaga atcgccttgt tcaaaaagta cttcgttgac 780
gaaagaaagc aaatcgcttc ttctaaacct actggttctg aaggtttgaa gtgcgccatt 840
gatcatattt tggaagctga acaaaagggt gaaatcaacg aagataacgt cttgtacatc 900
gtcgaaaaca ttaacgttgc tgctattgaa actaccttgt ggtctattga atggggtatt 960
gctgaattgg ttaatcaccc agaaatccaa tccaagttga gaaacgaatt ggatactgtt 1020
ttgggtccag gtgttcaagt tactgaacct gacttgcata agttgccata cttgcaagct 1080
gttgtaaaag aaaccttgag attaagaatg gccatccctt tgttggttcc acatatgaac 1140
ttgcatgatg ctaaattggc cggttatgat attccagccg aatccaagat tttggttaat 1200
gcttggtggt tggctaacaa tccaaattct tggaaaaagc cagaagaatt cagaccagaa 1260
agatttttcg aagaagaaag tcacgttgaa gccaacggta atgattttag atacgttcca 1320
tttggtgttg gtagaagatc ttgtccaggt attatcttgg ctttgccaat tttgggtatt 1380
accatcggta gaatggtcca aaacttcgaa ttattgccac cacctggtca atctaaggtt 1440
gatacttctg aaaagggtgg tcaattctcc ttgcatattt tgaaccactc catcatcgtt 1500
atgaagccaa gaaactgtta a 1521
<210> 81
<211> 384
<212> PRT
<213> 酿酒酵母(Saccharomyces cerevisiae)
<400> 81
Met Ser Lys Ser Lys Thr Phe Leu Phe Thr Ser Glu Ser Val Gly Glu
1 5 10 15
Gly His Pro Asp Lys Ile Cys Asp Gln Val Ser Asp Ala Ile Leu Asp
20 25 30
Ala Cys Leu Glu Gln Asp Pro Phe Ser Lys Val Ala Cys Glu Thr Ala
35 40 45
Ala Lys Thr Gly Met Ile Met Val Phe Gly Glu Ile Thr Thr Lys Ala
50 55 60
Arg Leu Asp Tyr Gln Gln Ile Val Arg Asp Thr Ile Lys Lys Ile Gly
65 70 75 80
Tyr Asp Asp Ser Ala Lys Gly Phe Asp Tyr Lys Thr Cys Asn Val Leu
85 90 95
Val Ala Ile Glu Gln Gln Ser Pro Asp Ile Ala Gln Gly Leu His Tyr
100 105 110
Glu Lys Ser Leu Glu Asp Leu Gly Ala Gly Asp Gln Gly Ile Met Phe
115 120 125
Gly Tyr Ala Thr Asp Glu Thr Pro Glu Gly Leu Pro Leu Thr Ile Leu
130 135 140
Leu Ala His Lys Leu Asn Met Ala Met Ala Asp Ala Arg Arg Asp Gly
145 150 155 160
Ser Leu Pro Trp Leu Arg Pro Asp Thr Lys Thr Gln Val Thr Val Glu
165 170 175
Tyr Glu Asp Asp Asn Gly Arg Trp Val Pro Lys Arg Ile Asp Thr Val
180 185 190
Val Ile Ser Ala Gln His Ala Asp Glu Ile Ser Thr Ala Asp Leu Arg
195 200 205
Thr Gln Leu Gln Lys Asp Ile Val Glu Lys Val Ile Pro Lys Asp Met
210 215 220
Leu Asp Glu Asn Thr Lys Tyr Phe Ile Gln Pro Ser Gly Arg Phe Val
225 230 235 240
Ile Gly Gly Pro Gln Gly Asp Ala Gly Leu Thr Gly Arg Lys Ile Ile
245 250 255
Val Asp Ala Tyr Gly Gly Ala Ser Ser Val Gly Gly Gly Ala Phe Ser
260 265 270
Gly Lys Asp Tyr Ser Lys Val Asp Arg Ser Ala Ala Tyr Ala Ala Arg
275 280 285
Trp Val Ala Lys Ser Leu Val Ala Ala Gly Leu Cys Lys Arg Val Gln
290 295 300
Val Gln Phe Ser Tyr Ala Ile Gly Ile Ala Glu Pro Leu Ser Leu His
305 310 315 320
Val Asp Thr Tyr Gly Thr Ala Thr Lys Ser Asp Asp Glu Ile Ile Glu
325 330 335
Ile Ile Lys Lys Asn Phe Asp Leu Arg Pro Gly Val Leu Val Lys Glu
340 345 350
Leu Asp Leu Ala Arg Pro Ile Tyr Leu Pro Thr Ala Ser Tyr Gly His
355 360 365
Phe Thr Asn Gln Glu Tyr Ser Trp Glu Lys Pro Lys Lys Leu Glu Phe
370 375 380
<210> 82
<211> 1155
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:81的编码序列
<400> 82
atgtccaaga gcaaaacttt cttatttacc tctgaatccg tcggtgaagg tcacccagac 60
aagatttgtg accaagtttc tgatgctatt ttggacgctt gtttagaaca agatccattc 120
tccaaggttg cctgtgaaac agctgccaaa actggtatga ttatggtttt cggtgaaatt 180
accaccaaag ctagacttga ctaccaacaa atagtaagag ataccatcaa gaagattggt 240
tatgacgatt ctgccaaggg tttcgactac aagacatgta atgttttagt agctatcgaa 300
caacaatctc cagatatcgc tcaaggtctg cactatgaaa agagcttaga agatttaggt 360
gctggtgacc aaggtataat gtttggttac gctacagacg aaactccaga agggttacca 420
ttgaccattc ttttggctca caaattgaac atggctatgg cagatgctag aagagatggt 480
tctctcccat ggttgaggcc agacacaaag actcaagtca ctgtcgaata cgaggacgac 540
aatggtagat gggttccaaa gaggatagat accgttgtta tttctgctca acatgctgat 600
gaaatttcca ccgctgactt gagaactcaa cttcaaaaag atattgttga aaaggtcata 660
ccaaaggata tgttagacga aaataccaaa tatttcatcc aaccatccgg tagattcgtc 720
atcggtggtc ctcaaggtga cgctggtttg accggtagaa agattattgt cgacgcttac 780
ggtggtgcct catccgtcgg tggtggtgcc ttctccggta aggactattc caaggtcgat 840
cgttccgctg cttacgctgc tagatgggtt gccaagtctc tagttgccgc tggtttgtgt 900
aagagagtcc aagtccaatt ttcatatgct attggtattg ctgaaccatt gtctttacat 960
gtggacacct atggtacagc tacaaaatca gatgacgaaa tcattgaaat tattaagaag 1020
aacttcgact tgaggccagg tgtgttagta aaggaattag atttggctag accaatttac 1080
ttaccaaccg cttcttatgg tcacttcact aatcaagagt actcatggga aaaaccaaag 1140
aaattggaat tttaa 1155
<210> 83
<211> 521
<212> PRT
<213> 大肠埃希氏杆菌(Escherichia coli)
<400> 83
Met Ser Lys Pro Glu Asp Phe Arg Ala Ser Thr Gln Arg Pro Phe Thr
1 5 10 15
Gly Glu Glu Tyr Leu Lys Ser Leu Gln Asp Gly Arg Glu Ile Tyr Ile
20 25 30
Tyr Gly Glu Arg Val Lys Asp Val Thr Thr His Pro Ala Phe Arg Asn
35 40 45
Ala Ala Ala Ser Val Ala Gln Leu Tyr Asp Ala Leu His Lys Pro Glu
50 55 60
Met Gln Asp Ser Leu Cys Trp Asn Thr Asp Thr Gly Ser Gly Gly Tyr
65 70 75 80
Thr His Lys Phe Phe Arg Val Ala Lys Ser Ala Asp Asp Leu Arg Gln
85 90 95
Gln Arg Asp Ala Ile Ala Glu Trp Ser Arg Leu Ser Tyr Gly Trp Met
100 105 110
Gly Arg Thr Pro Asp Tyr Lys Ala Ala Phe Gly Cys Ala Leu Gly Ala
115 120 125
Asn Pro Gly Phe Tyr Gly Gln Phe Glu Gln Asn Ala Arg Asn Trp Tyr
130 135 140
Thr Arg Ile Gln Glu Thr Gly Leu Tyr Phe Asn His Ala Ile Val Asn
145 150 155 160
Pro Pro Ile Asp Arg His Leu Pro Thr Asp Lys Val Lys Asp Val Tyr
165 170 175
Ile Lys Leu Glu Lys Glu Thr Asp Ala Gly Ile Ile Val Ser Gly Ala
180 185 190
Lys Val Val Ala Thr Asn Ser Ala Leu Thr His Tyr Asn Met Ile Gly
195 200 205
Phe Gly Ser Ala Gln Val Met Gly Glu Asn Pro Asp Phe Ala Leu Met
210 215 220
Phe Val Ala Pro Met Asp Ala Asp Gly Val Lys Leu Ile Ser Arg Ala
225 230 235 240
Ser Tyr Glu Met Val Ala Gly Ala Thr Gly Ser Pro Tyr Asp Tyr Pro
245 250 255
Leu Ser Ser Arg Phe Asp Glu Asn Asp Ala Ile Leu Val Met Asp Asn
260 265 270
Val Leu Ile Pro Trp Glu Asn Val Leu Ile Tyr Arg Asp Phe Asp Arg
275 280 285
Cys Arg Arg Trp Thr Met Glu Gly Gly Phe Ala Arg Met Tyr Pro Leu
290 295 300
Gln Ala Cys Val Arg Leu Ala Val Lys Leu Asp Phe Ile Thr Ala Leu
305 310 315 320
Leu Lys Lys Ser Leu Glu Cys Thr Gly Thr Leu Glu Phe Arg Gly Val
325 330 335
Gln Ala Asp Leu Gly Glu Val Val Ala Trp Arg Asn Thr Phe Trp Ala
340 345 350
Leu Ser Asp Ser Met Cys Ser Glu Ala Thr Pro Trp Val Asn Gly Ala
355 360 365
Tyr Leu Pro Asp His Ala Ala Leu Gln Thr Tyr Arg Val Leu Ala Pro
370 375 380
Met Ala Tyr Ala Lys Ile Lys Asn Ile Ile Glu Arg Asn Val Thr Ser
385 390 395 400
Gly Leu Ile Tyr Leu Pro Ser Ser Ala Arg Asp Leu Asn Asn Pro Gln
405 410 415
Ile Asp Gln Tyr Leu Ala Lys Tyr Val Arg Gly Ser Asn Gly Met Asp
420 425 430
His Val Gln Arg Ile Lys Ile Leu Lys Leu Met Trp Asp Ala Ile Gly
435 440 445
Ser Glu Phe Gly Gly Arg His Glu Leu Tyr Glu Ile Asn Tyr Ser Gly
450 455 460
Ser Gln Asp Glu Ile Arg Leu Gln Cys Leu Arg Gln Ala Gln Asn Ser
465 470 475 480
Gly Asn Met Asp Lys Met Met Ala Met Val Asp Arg Cys Leu Ser Glu
485 490 495
Tyr Asp Gln Asp Gly Trp Thr Val Pro His Leu His Asn Asn Asp Asp
500 505 510
Ile Asn Met Leu Asp Lys Leu Leu Lys
515 520
<210> 84
<211> 1566
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:83的编码序列
<400> 84
atgtccaaac cagaagattt ccgcgccagt acccaacgtc ctttcaccgg ggaagagtat 60
ctgaaaagcc tgcaggatgg tcgcgagatc tatatctatg gcgagcgagt gaaagacgtc 120
accactcatc cggcatttcg taatgcggca gcgtctgttg cccagctgta cgacgcactg 180
cacaaaccgg agatgcagga ctctctgtgt tggaacaccg acaccggcag cggcggctat 240
acccataaat tcttccgcgt ggcgaaaagt gccgacgacc tgcgccagca acgcgacgcc 300
atcgctgagt ggtcacgcct gagctatggc tggatgggcc gtaccccaga ctacaaagcc 360
gctttcggtt gcgcactggg cgcgaatccg ggcttttacg gtcagttcga gcagaacgcc 420
cgtaactggt acacccgtat tcaggaaact ggcctctact ttaaccacgc gattgttaac 480
ccaccgatcg atcgtcattt gccgaccgat aaagtgaaag acgtttacat caagctggaa 540
aaagagactg acgccgggat tatcgtcagc ggtgcgaaag tggttgccac caactcggcg 600
ctgactcact acaacatgat tggcttcggc tcggcacaag tgatgggcga aaacccggac 660
ttcgcactga tgttcgttgc gccaatggat gccgatggcg tgaaattaat ctcccgcgcc 720
tcttatgaga tggtcgcggg tgctaccggc tcgccatacg actacccgct ctccagccgc 780
ttcgatgaga acgatgcgat tctggtgatg gataacgtgc tgattccatg ggaaaacgtg 840
ctgatctacc gcgattttga tcgctgccgt cgctggacga tggaaggcgg ttttgcccgt 900
atgtatccgc tgcaagcctg tgtgcgcctg gcagtgaaat tagacttcat tacggcactg 960
ctgaaaaaat cactcgaatg taccggcacc ctggagttcc gtggtgtgca ggccgatctc 1020
ggtgaagtgg tagcgtggcg caacaccttc tgggcattga gtgactcgat gtgttcagaa 1080
gcaacgccgt gggtcaacgg ggcttattta ccggatcatg ccgcactgca aacctatcgc 1140
gtactggcac caatggccta cgcgaagatc aaaaacatta tcgaacgcaa cgttaccagt 1200
ggcctgatct atctcccttc cagtgcccgt gacctgaata atccgcagat cgaccagtat 1260
ctggcgaagt atgtgcgcgg ttcgaacggt atggatcacg tccagcgcat caagatcctc 1320
aaactgatgt gggatgctat tggcagcgaa tttggtggtc gtcacgaact gtatgaaatc 1380
aactactccg gtagccagga tgagattcgc ctgcagtgtc tgcgccaggc acaaaactcc 1440
ggcaatatgg acaagatgat ggcgatggtt gatcgctgcc tgtcggaata cgaccaggac 1500
ggctggactg tgccgcacct gcacaacaac gacgatatca acatgctgga taagctgctg 1560
aaataa 1566
<210> 85
<211> 171
<212> PRT
<213> 大肠埃希氏杆菌(Escherichia coli)
<400> 85
Met Ser Gln Leu Asp Glu Gln Arg Leu Arg Phe Arg Asp Ala Met Ala
1 5 10 15
Ser Leu Ser Ala Ala Val Asn Ile Ile Thr Thr Glu Gly Asp Ala Gly
20 25 30
Gln Cys Gly Ile Thr Ala Thr Ala Val Cys Ser Val Thr Asp Thr Pro
35 40 45
Pro Ser Leu Met Val Cys Ile Asn Ala Asn Ser Ala Met Asn Pro Val
50 55 60
Phe Gln Gly Asn Gly Lys Leu Cys Val Asn Val Leu Asn His Glu Gln
65 70 75 80
Glu Leu Met Ala Arg His Phe Ala Gly Met Thr Gly Met Ala Met Glu
85 90 95
Glu Arg Phe Ser Leu Ser Cys Trp Gln Lys Gly Pro Leu Ala Gln Pro
100 105 110
Val Leu Lys Gly Ser Leu Ala Ser Leu Glu Gly Glu Ile Arg Asp Val
115 120 125
Gln Ala Ile Gly Thr His Leu Val Tyr Leu Val Glu Ile Lys Asn Ile
130 135 140
Ile Leu Ser Ala Glu Gly His Gly Leu Ile Tyr Phe Lys Arg Arg Phe
145 150 155 160
His Pro Val Met Leu Glu Met Glu Ala Ala Ile
165 170
<210> 86
<211> 516
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:85的编码序列
<400> 86
atgtcccaat tagatgaaca acgcctgcgc tttcgtgacg cgatggccag cctgtcggca 60
gcggtaaata ttatcaccac cgagggcgac gccggacaat gcgggattac ggcaacggcc 120
gtctgctcgg tcacggatac accaccgtcg ctgatggtgt gcattaacgc caacagtgcg 180
atgaacccgg tttttcaggg caacggcaag ttgtgcgtca acgtcctcaa ccatgagcag 240
gaactgatgg cacgccactt cgcgggcatg acaggcatgg cgatggaaga gcgttttagc 300
ctctcatgct ggcaaaaagg tccgctggcg cagccggtgc taaaaggttc gctggccagt 360
cttgaaggtg agatccgcga tgtgcaggca attggcacac atctggtgta tctggtggag 420
attaaaaaca tcatcctcag tgcagaaggt catggactta tctactttaa acgccgtttc 480
catccggtga tgctggaaat ggaagctgcg atttaa 516
<210> 87
<211> 233
<212> PRT
<213> 拟南芥(Arabidopsis thaliana)
<400> 87
Met Ser Ala Lys Asp Glu Ala Lys Gly Leu Leu Lys Ser Glu Glu Leu
1 5 10 15
Tyr Lys Tyr Ile Leu Glu Thr Ser Val Tyr Pro Arg Glu Pro Glu Val
20 25 30
Leu Arg Glu Leu Arg Asn Ile Thr His Asn His Pro Gln Ala Gly Met
35 40 45
Ala Thr Ala Pro Asp Ala Gly Gln Leu Met Gly Met Leu Leu Asn Leu
50 55 60
Val Asn Ala Arg Lys Thr Ile Glu Val Gly Val Phe Thr Gly Tyr Ser
65 70 75 80
Leu Leu Leu Thr Ala Leu Thr Leu Pro Glu Asp Gly Lys Val Ile Ala
85 90 95
Ile Asp Met Asn Arg Asp Ser Tyr Glu Ile Gly Leu Pro Val Ile Lys
100 105 110
Lys Ala Gly Val Glu His Lys Ile Asp Phe Lys Glu Ser Glu Ala Leu
115 120 125
Pro Ala Leu Asp Glu Leu Leu Asn Asn Lys Val Asn Glu Gly Gly Phe
130 135 140
Asp Phe Ala Phe Val Asp Ala Asp Lys Leu Asn Tyr Trp Asn Tyr His
145 150 155 160
Glu Arg Leu Ile Arg Leu Ile Lys Val Gly Gly Ile Ile Val Tyr Asp
165 170 175
Asn Thr Leu Trp Gly Gly Ser Val Ala Glu Pro Asp Ser Ser Thr Pro
180 185 190
Glu Trp Arg Ile Glu Val Lys Lys Ala Thr Leu Glu Leu Asn Lys Lys
195 200 205
Leu Ser Ala Asp Gln Arg Val Gln Ile Ser Gln Ala Ala Leu Gly Asp
210 215 220
Gly Ile Thr Ile Cys Arg Arg Leu Tyr
225 230
<210> 88
<211> 702
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:87的编码序列
<400> 88
atgtccgcta aggatgaagc caagggtttg ttgaagtctg aagaattgta caagtacatc 60
ttggaaactt ctgtttaccc aagagaacca gaagttttga gagaattgag aaacattact 120
cacaaccacc cacaagctgg tatggctact gctccagacg ctggtcaatt gatgggtatg 180
ttgttgaact tggttaacgc tagaaagact atcgaagttg gtgttttcac tggttactct 240
ttgttgttga ctgctttgac tttgccagaa gatggtaagg ttatcgccat tgacatgaac 300
agagactctt acgaaatcgg tttgccagtt atcaagaagg ctggtgttga acacaagatt 360
gatttcaagg aatctgaagc tttgccagcc ttggacgaat tgttgaacaa caaggttaac 420
gaaggtggtt tcgacttcgc tttcgttgat gctgacaagt tgaactactg gaactaccac 480
gaaagattga ttagattgat caaggttggt ggtatcatcg tttacgataa cactttgtgg 540
ggtggttctg ttgctgaacc agactcttcc actccagaat ggagaatcga agtcaagaag 600
gctaccttgg aattgaacaa gaagttgtct gctgatcaaa gagttcaaat ctctcaagct 660
gctttgggtg atggtatcac tatttgtaga agattgtact aa 702
<210> 89
<211> 222
<212> PRT
<213> 智人(Homo sapiens)
<400> 89
Met Ser Gly Asp Thr Lys Glu Gln Arg Ile Leu Asn His Val Leu Gln
1 5 10 15
His Ala Glu Pro Gly Asn Ala Gln Ser Val Leu Glu Ala Ile Asp Thr
20 25 30
Tyr Cys Glu Gln Lys Glu Trp Ala Met Asn Val Gly Asp Lys Lys Gly
35 40 45
Lys Ile Val Asp Ala Val Ile Gln Glu His Gln Pro Ser Val Leu Leu
50 55 60
Glu Leu Gly Ala Tyr Cys Gly Tyr Ser Ala Val Arg Met Ala Arg Leu
65 70 75 80
Leu Ser Pro Gly Ala Arg Leu Ile Thr Ile Glu Ile Asn Pro Asp Cys
85 90 95
Ala Ala Ile Thr Gln Arg Met Val Asp Phe Ala Gly Val Lys Asp Lys
100 105 110
Val Thr Leu Val Val Gly Ala Ser Gln Asp Ile Ile Pro Gln Leu Lys
115 120 125
Lys Lys Tyr Asp Val Asp Thr Leu Asp Met Val Phe Leu Asp His Trp
130 135 140
Lys Asp Arg Tyr Leu Pro Asp Thr Leu Leu Leu Glu Glu Cys Gly Leu
145 150 155 160
Leu Arg Lys Gly Thr Val Leu Leu Ala Asp Asn Val Ile Cys Pro Gly
165 170 175
Ala Pro Asp Phe Leu Ala His Val Arg Gly Ser Ser Cys Phe Glu Cys
180 185 190
Thr His Tyr Gln Ser Phe Leu Glu Tyr Arg Glu Val Val Asp Gly Leu
195 200 205
Glu Lys Ala Ile Tyr Lys Gly Pro Gly Ser Glu Ala Gly Pro
210 215 220
<210> 90
<211> 669
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:89的编码序列
<400> 90
atgtccggtg acaccaagga acaaagaatc ttgaaccacg ttttgcaaca cgctgaacca 60
ggtaacgctc aatctgtttt ggaagccatt gacacctact gtgaacaaaa ggaatgggcc 120
atgaacgttg gtgacaagaa gggtaagatc gttgacgccg ttattcaaga acaccaacca 180
tccgttttgt tggaattggg tgcctactgt ggttactctg ctgttagaat ggccagattg 240
ttgtctccag gtgctagatt gatcaccatc gaaatcaacc cagactgtgc cgccatcacc 300
caaagaatgg ttgatttcgc tggtgttaag gacaaggtca ccttggttgt tggtgcttcc 360
caagacatca tcccacaatt gaagaagaag tacgatgttg acactttgga catggttttc 420
ttggaccact ggaaggacag atacttgcca gacactttgt tgttggaaga atgtggtttg 480
ttgagaaagg gtactgtttt gttggctgac aacgttatct gtccaggtgc tccagacttc 540
ttggctcacg ttagaggttc ttcttgtttc gaatgtactc actaccaatc tttcttggaa 600
tacagagaag ttgttgacgg tttggaaaag gccatctaca agggtccagg ttctgaagct 660
ggtccataa 669
<210> 91
<211> 489
<212> PRT
<213> 拟南芥(Arabidopsis thaliana)
<400> 91
Met Ser Gly Thr Pro Val Glu Val Ser Lys Leu His Phe Leu Leu Phe
1 5 10 15
Pro Phe Met Ala His Gly His Met Ile Pro Thr Leu Asp Met Ala Lys
20 25 30
Leu Phe Ala Thr Lys Gly Ala Lys Ser Thr Ile Leu Thr Thr Pro Leu
35 40 45
Asn Ala Lys Leu Phe Phe Glu Lys Pro Ile Lys Ser Phe Asn Gln Asp
50 55 60
Asn Pro Gly Leu Glu Asp Ile Thr Ile Gln Ile Leu Asn Phe Pro Cys
65 70 75 80
Thr Glu Leu Gly Leu Pro Asp Gly Cys Glu Asn Thr Asp Phe Ile Phe
85 90 95
Ser Thr Pro Asp Leu Asn Val Gly Asp Leu Ser Gln Lys Phe Leu Leu
100 105 110
Ala Met Lys Tyr Phe Glu Glu Pro Leu Glu Glu Leu Leu Val Thr Met
115 120 125
Arg Pro Asp Cys Leu Val Gly Asn Met Phe Phe Pro Trp Ser Thr Lys
130 135 140
Val Ala Glu Lys Phe Gly Val Pro Arg Leu Val Phe His Gly Thr Gly
145 150 155 160
Tyr Phe Ser Leu Cys Ala Ser His Cys Ile Arg Leu Pro Lys Asn Val
165 170 175
Ala Thr Ser Ser Glu Pro Phe Val Ile Pro Asp Leu Pro Gly Asp Ile
180 185 190
Leu Ile Thr Glu Glu Gln Val Met Glu Thr Glu Glu Glu Ser Val Met
195 200 205
Gly Arg Phe Met Lys Ala Ile Arg Asp Ser Glu Arg Asp Ser Phe Gly
210 215 220
Val Leu Val Asn Ser Phe Tyr Glu Leu Glu Gln Ala Tyr Ser Asp Tyr
225 230 235 240
Phe Lys Ser Phe Val Ala Lys Arg Ala Trp His Ile Gly Pro Leu Ser
245 250 255
Leu Gly Asn Arg Lys Phe Glu Glu Lys Ala Glu Arg Gly Lys Lys Ala
260 265 270
Ser Ile Asp Glu His Glu Cys Leu Lys Trp Leu Asp Ser Lys Lys Cys
275 280 285
Asp Ser Val Ile Tyr Met Ala Phe Gly Thr Met Ser Ser Phe Lys Asn
290 295 300
Glu Gln Leu Ile Glu Ile Ala Ala Gly Leu Asp Met Ser Gly His Asp
305 310 315 320
Phe Val Trp Val Val Asn Arg Lys Gly Ser Gln Val Glu Lys Glu Asp
325 330 335
Trp Leu Pro Glu Gly Phe Glu Glu Lys Thr Lys Gly Lys Gly Leu Ile
340 345 350
Ile Arg Gly Trp Ala Pro Gln Val Leu Ile Leu Glu His Lys Ala Ile
355 360 365
Gly Gly Phe Leu Thr His Cys Gly Trp Asn Ser Leu Leu Glu Gly Val
370 375 380
Ala Ala Gly Leu Pro Met Val Thr Trp Pro Val Gly Ala Glu Gln Phe
385 390 395 400
Tyr Asn Glu Lys Leu Val Thr Gln Val Leu Lys Thr Gly Val Ser Val
405 410 415
Gly Val Lys Lys Met Met Gln Val Val Gly Asp Phe Ile Ser Arg Glu
420 425 430
Lys Val Glu Gly Ala Val Arg Glu Val Met Val Gly Glu Glu Arg Arg
435 440 445
Lys Arg Ala Lys Glu Leu Ala Glu Met Ala Lys Asn Ala Val Lys Glu
450 455 460
Gly Gly Ser Ser Asp Leu Glu Val Asp Arg Leu Met Glu Glu Leu Thr
465 470 475 480
Leu Val Lys Leu Gln Lys Glu Lys Val
485
<210> 92
<211> 1470
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:91的编码序列
<400> 92
atgtccggta ctccagtcga agtctctaag ttgcacttct tgttgttccc attcatggct 60
cacggtcaca tgatcccaac tttggacatg gctaagttgt tcgccaccaa gggtgctaag 120
tccactatct tgactactcc attgaacgcc aagttgttct tcgaaaagcc aatcaagtct 180
ttcaaccaag acaacccagg tttggaagat atcaccatcc aaatcttgaa cttcccatgt 240
actgaattgg gtttgccaga tggttgtgaa aacactgatt tcatcttctc cactccagac 300
ttgaacgttg gtgacttgtc tcaaaagttc ttgttggcta tgaagtactt cgaagaacca 360
ttggaagaat tgttggttac tatgaggcca gactgtttgg tcggtaacat gttcttccca 420
tggtccacta aggttgctga aaagttcggt gttccaagat tggttttcca cggtactggt 480
tacttctctt tgtgtgcttc tcactgtatc agattgccaa agaacgttgc tacttcttct 540
gaaccattcg ttattccaga tttgccaggt gacattttga ttactgaaga acaagtcatg 600
gaaactgaag aagaatctgt tatgggtaga ttcatgaagg ctatcagaga ctctgaaaga 660
gattctttcg gtgttttggt taactctttc tacgaattgg aacaagctta ctctgattac 720
ttcaagtctt tcgttgctaa gagagcttgg cacatcggtc cattgtcctt gggtaacaga 780
aagttcgaag aaaaggctga aagaggtaag aaggcttcta ttgatgaaca cgaatgtttg 840
aagtggttgg actccaagaa gtgtgattct gttatttaca tggccttcgg taccatgtcc 900
tctttcaaga acgaacaatt gatcgaaatt gctgctggtt tggatatgtc tggtcacgat 960
ttcgtctggg ttgttaacag aaagggttct caagttgaaa aggaagattg gttgccagaa 1020
ggtttcgaag aaaagaccaa gggtaagggt ttgatcatca gaggttgggc tccacaagtt 1080
ttgatcttgg aacacaaggc tattggtggt ttcttgactc actgtggttg gaactctttg 1140
ttggaaggtg ttgctgctgg tttgccaatg gttacttggc cagttggtgc cgaacaattc 1200
tacaacgaaa agttggttac tcaagtttta aagactggtg tttctgttgg tgttaagaag 1260
atgatgcaag ttgttggtga cttcatttct agagaaaagg ttgaaggtgc tgttagagaa 1320
gttatggttg gtgaagaaag aagaaagaga gccaaggaat tggctgaaat ggctaagaac 1380
gctgttaagg aaggtggttc ttctgatttg gaagttgata gattgatgga agaattgact 1440
ttggttaagt tgcaaaagga aaaggtttaa 1470
<210> 93
<211> 470
<212> PRT
<213> 黄芩(Scutellaria baicalensis)
<400> 93
Met Ser Gly Gln Leu His Ile Val Leu Val Pro Met Ile Ala His Gly
1 5 10 15
His Met Ile Pro Met Leu Asp Met Ala Lys Leu Phe Ser Ser Arg Gly
20 25 30
Val Arg Thr Thr Ile Ile Ala Thr Pro Ala Phe Ala Glu Pro Ile Arg
35 40 45
Lys Ala Arg Glu Ser Gly His Asp Ile Gly Leu Thr Thr Thr Lys Phe
50 55 60
Pro Pro Lys Gly Ser Ser Leu Pro Asp Asn Ile Leu Ser Leu Asp Gln
65 70 75 80
Val Thr His Asp Leu Leu Pro His Phe Phe Arg Ala Leu Glu Leu Leu
85 90 95
Gln Glu Pro Val Glu Glu Ile Met Glu Asp Leu Lys Pro Asn Cys Leu
100 105 110
Val Ser Asp Met Phe Leu Pro Trp Thr Thr Asp Ser Ala Ala Lys Phe
115 120 125
Gly Ile Pro Arg Leu Leu Phe His Gly Thr Ser Leu Phe Ala Arg Cys
130 135 140
Phe Ala Glu Gln Met Ser Leu Gln Lys Pro Tyr Lys Asn Val Ser Ser
145 150 155 160
Asp Ser Glu Pro Phe Val Leu Arg Gly Leu Pro His Glu Val Ser Phe
165 170 175
Val Arg Thr Gln Ile Pro Gly Tyr Glu Leu Gln Glu Gly Gly Asp Asp
180 185 190
Ala Phe Ser Lys Met Ala Lys Gln Met Arg Asp Ala Asp Lys Lys Ser
195 200 205
Tyr Gly Asp Val Ile Asn Ser Phe Glu Glu Leu Glu Ser Glu Tyr Val
210 215 220
Asp His Tyr Lys Asn Val Phe Gly Lys Lys Ala Trp His Ile Gly Pro
225 230 235 240
Leu Ser Leu Cys Asn Asn Arg Ala Glu Gln Lys Ser Pro Ile Asp Asp
245 250 255
His Glu Cys Leu Ala Trp Leu Asn Ser Lys Lys Pro Asn Ser Val Val
260 265 270
Tyr Met Cys Phe Gly Ser Met Ala Thr Phe Ser Pro Ala Gln Leu His
275 280 285
Glu Thr Ala Val Gly Leu Glu Ser Ser Gly Gln Asp Phe Ile Trp Val
290 295 300
Val Arg Asn Gly Gly Glu Asn Glu Asp Trp Leu Pro Gln Gly Phe Glu
305 310 315 320
Glu Arg Ile Lys Gly Lys Gly Leu Met Ile Arg Gly Trp Ala Pro Gln
325 330 335
Val Val Ile Leu Asp His Pro Ser Thr Gly Ala Phe Val Thr His Cys
340 345 350
Gly Trp Asn Ser Thr Leu Glu Gly Ile Cys Ala Gly Leu Pro Met Val
355 360 365
Thr Trp Pro Val Phe Ala Glu Gln Phe Tyr Asn Glu Lys Leu Val Thr
370 375 380
Glu Val Leu Lys Thr Gly Val Ser Val Gly Asn Lys Lys Trp Gln Arg
385 390 395 400
Val Gly Glu Trp Val Gly Ser Glu Ala Val Lys Glu Ala Val Glu Trp
405 410 415
Val Met Val Gly Asp Gly Ala Ala Glu Met Arg Ser Arg Ala Asn Tyr
420 425 430
Tyr Lys Glu Met Ala Arg Lys Ala Val Glu Asp Gly Gly Ser Ser Tyr
435 440 445
Asn Asn Leu Asn Ala Leu Ile Gln Glu Leu Ser Ala Tyr Val Pro Pro
450 455 460
Met Lys Gln Gly Leu Asn
465 470
<210> 94
<211> 1413
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:93的编码序列
<400> 94
atgtccggtc aattgcacat cgtcttggtt ccaatgatcg ctcacggtca catgatccca 60
atgttggaca tggccaagtt gttctcttcc agaggtgtca gaaccaccat catcgccact 120
ccagccttcg ctgaaccaat cagaaaggcc agagaatctg gtcacgacat cggtttgacc 180
accaccaagt tcccaccaaa gggttcctct ttgccagaca acatcttgtc tttggatcaa 240
gttactcacg atttgttgcc acacttcttc agagccttgg aattgttgca agaaccagtt 300
gaagaaatca tggaagattt gaagccaaac tgtttggttt ctgacatgtt cttgccatgg 360
actaccgact ctgctgccaa gttcggtatt ccaagattgt tgttccacgg tacctctttg 420
ttcgctagat gtttcgctga acaaatgtct ttgcaaaagc catacaagaa cgtttcttct 480
gattccgaac cattcgtttt gagaggtttg ccacacgaag tttctttcgt tagaactcaa 540
atcccaggtt acgaattgca agaaggtggt gatgatgcct tctctaagat ggctaagcaa 600
atgagagatg ctgataagaa gtcttacggt gacgttatca actctttcga agaattggaa 660
tctgaatacg ttgatcacta caagaacgtt ttcggtaaga aggcttggca catcggtcca 720
ttgtctttgt gtaacaacag agctgaacaa aagtctccaa tcgacgatca cgaatgtttg 780
gcttggttga actctaagaa gccaaactct gttgtttaca tgtgtttcgg ttctatggcc 840
actttctctc cagcccaatt gcacgaaact gctgtcggtt tggaatcctc tggtcaagat 900
ttcatctggg ttgttagaaa cggtggtgaa aacgaagatt ggttgccaca aggtttcgaa 960
gaaagaatca agggtaaggg tttgatgatc agaggttggg ccccacaagt tgttattttg 1020
gatcacccat ctactggtgc tttcgttact cactgtggtt ggaactctac tttggaaggt 1080
atctgtgctg gtttgccaat ggttacttgg ccagttttcg ctgaacaatt ctacaacgaa 1140
aagttggtta ctgaagtttt aaagactggt gtttctgttg gtaacaagaa gtggcaaaga 1200
gttggtgaat gggttggttc tgaagccgtt aaggaagctg ttgaatgggt catggtcggt 1260
gacggtgctg ctgaaatgag atctagagct aactactaca aggaaatggc tagaaaggct 1320
gttgaagatg gtggttcttc ttacaacaac ttgaacgctt tgatccaaga attgtctgcc 1380
tacgtcccac caatgaagca aggtttgaac taa 1413
<210> 95
<211> 470
<212> PRT
<213> 黄芩(Scutellaria baicalensis)
<400> 95
Met Ser Gly Gln Leu His Ile Val Leu Val Pro Met Ile Ala His Gly
1 5 10 15
His Met Ile Pro Met Leu Asp Met Ala Lys Leu Phe Ser Ser Arg Gly
20 25 30
Val Lys Thr Thr Ile Ile Ala Thr Pro Ala Phe Ala Glu Pro Ile Arg
35 40 45
Lys Ala Arg Glu Ser Gly His Asp Ile Gly Leu Thr Thr Thr Lys Phe
50 55 60
Pro Pro Lys Gly Ser Ser Leu Pro Asp Asn Ile Trp Ser Leu Asp Gln
65 70 75 80
Val Thr Asp Asp Leu Leu Pro His Phe Phe Arg Ala Leu Glu Leu Leu
85 90 95
Gln Glu Pro Val Glu Glu Ile Met Glu Asp Leu Lys Pro Asn Cys Leu
100 105 110
Val Ser Asp Met Phe Leu Pro Trp Thr Thr Asp Ser Ala Ala Lys Phe
115 120 125
Gly Ile Pro Arg Leu Leu Phe His Gly Thr Ser Leu Phe Ala Arg Cys
130 135 140
Phe Ala Glu Gln Met Ser Leu Gln Lys Pro Tyr Lys Asn Val Ser Ser
145 150 155 160
Asp Ser Glu Pro Phe Val Leu Arg Gly Leu Pro His Glu Val Ser Phe
165 170 175
Val Arg Thr Gln Ile Pro Gly Tyr Glu Leu Gln Glu Gly Gly Asp Asp
180 185 190
Ala Phe Ser Lys Met Ala Lys Gln Met Arg Asp Ala Asp Lys Lys Ser
195 200 205
Tyr Gly Asp Val Ile Asn Asn Phe Glu Glu Leu Glu Ser Glu Tyr Val
210 215 220
Asp His Tyr Lys Asn Val Phe Gly Lys Lys Ala Trp His Ile Gly Pro
225 230 235 240
Leu Ser Leu Cys Asn Asn Arg Ala Glu Gln Lys Ser Pro Ile Asp Asp
245 250 255
His Glu Cys Leu Ala Trp Leu Asn Ser Lys Lys Pro Asn Ser Val Val
260 265 270
Tyr Met Cys Phe Gly Ser Met Ala Thr Phe Thr Pro Ala Gln Leu His
275 280 285
Glu Thr Ala Val Gly Leu Glu Ser Ser Gly Gln Asp Phe Ile Trp Val
290 295 300
Val Arg Asn Gly Gly Glu Asn Glu Asp Trp Leu Pro Gln Gly Phe Glu
305 310 315 320
Glu Arg Ile Lys Gly Lys Gly Leu Met Ile Arg Gly Trp Ala Pro Gln
325 330 335
Val Met Ile Leu Asp His Pro Ser Thr Gly Ala Phe Val Thr His Cys
340 345 350
Gly Trp Asn Ser Thr Leu Glu Gly Ile Cys Ala Gly Leu Pro Met Val
355 360 365
Thr Trp Pro Val Phe Ala Glu Gln Phe Tyr Asn Glu Lys Leu Val Thr
370 375 380
Glu Val Leu Lys Thr Gly Val Ser Val Gly Asn Lys Lys Trp Gln Arg
385 390 395 400
Val Gly Glu Gly Val Gly Ser Glu Ala Val Lys Glu Ala Val Glu Arg
405 410 415
Val Met Val Gly Asp Gly Ala Ala Glu Met Arg Ser Arg Ala Ile Tyr
420 425 430
Tyr Lys Glu Met Ala Arg Lys Ala Val Glu Glu Gly Gly Ser Ser Tyr
435 440 445
Asn Asn Leu Asn Ala Leu Ile Glu Glu Leu Ser Ala Tyr Val Pro Pro
450 455 460
Met Lys Gln Gly Leu Asn
465 470
<210> 96
<211> 1413
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:95的编码序列
<400> 96
atgtccggtc aattgcacat cgtcttggtt ccaatgatcg ctcacggtca catgatccca 60
atgttggaca tggccaagtt gttctcttcc agaggtgtca agaccaccat catcgccact 120
ccagccttcg ctgaaccaat cagaaaggcc agagaatctg gtcacgacat cggtttgacc 180
accaccaagt tcccaccaaa gggttcctct ttgccagaca acatctggtc tttggatcaa 240
gttactgatg atttgttgcc acacttcttc agagccttgg aattgttgca agaaccagtt 300
gaagaaatca tggaagattt gaagccaaac tgtttggttt ctgacatgtt cttgccatgg 360
actaccgact ctgctgccaa gttcggtatt ccaagattgt tgttccacgg tacctctttg 420
ttcgctagat gtttcgctga acaaatgtct ttgcaaaagc catacaagaa cgtttcttct 480
gattccgaac cattcgtttt gagaggtttg ccacacgaag tttctttcgt tagaactcaa 540
atcccaggtt acgaattgca agaaggtggt gatgatgcct tctctaagat ggctaagcaa 600
atgagagatg ctgataagaa gtcttacggt gacgttatca acaacttcga agaattggaa 660
tctgaatacg ttgatcacta caagaacgtt ttcggtaaga aggcttggca catcggtcca 720
ttgtctttgt gtaacaacag agctgaacaa aagtctccaa tcgacgatca cgaatgtttg 780
gcttggttga actctaagaa gccaaactct gttgtttaca tgtgtttcgg ttctatggcc 840
actttcactc cagcccaatt gcacgaaact gctgtcggtt tggaatcctc tggtcaagat 900
ttcatctggg ttgttagaaa cggtggtgaa aacgaagatt ggttgccaca aggtttcgaa 960
gaaagaatca agggtaaggg tttgatgatc agaggttggg ccccacaagt tatgattttg 1020
gatcacccat ctactggtgc tttcgttact cactgtggtt ggaactctac tttggaaggt 1080
atctgtgctg gtttgccaat ggttacttgg ccagttttcg ctgaacaatt ctacaacgaa 1140
aagttggtta ctgaagtttt aaagactggt gtttctgttg gtaacaagaa gtggcaaaga 1200
gttggtgaag gtgttggttc tgaagctgtt aaggaagctg ttgaaagagt catggtcggt 1260
gacggtgctg ctgaaatgag atctagagct atctactaca aggaaatggc tagaaaggct 1320
gttgaagaag gtggttcttc ttacaacaac ttgaacgctt tgatcgaaga attgtctgcc 1380
tacgtcccac caatgaagca aggtttgaac taa 1413
<210> 97
<211> 477
<212> PRT
<213> 黄芩(Scutellaria baicalensis)
<400> 97
Met Ser Gly Gln Leu His Ile Val Leu Val Pro Met Ile Ala His Gly
1 5 10 15
His Met Ile Pro Met Leu Asp Met Ala Lys Leu Phe Ser Ser Arg Gly
20 25 30
Val Lys Thr Thr Ile Ile Ala Thr Pro Ala Phe Ala Glu Pro Ile Arg
35 40 45
Lys Ala Arg Glu Ser Gly His Asp Ile Gly Leu Thr Thr Thr Lys Phe
50 55 60
Pro Pro Lys Gly Ser Ser Leu Pro Asp Asn Ile Arg Ser Leu Asp Gln
65 70 75 80
Val Thr Gly Asp Leu Leu Pro His Phe Phe Arg Ala Leu Glu Leu Leu
85 90 95
Gln Glu Pro Val Glu Glu Ile Met Glu Asp Leu Lys Pro Asn Cys Leu
100 105 110
Val Ser Asp Met Phe Leu Pro Trp Thr Thr Asp Ser Ala Ala Lys Phe
115 120 125
Gly Ile Pro Arg Leu Val Phe His Gly Thr Ser Leu Phe Ala Arg Cys
130 135 140
Phe Ser Glu Gln Met Ser Ile Gln Lys Pro Tyr Lys Asn Val Ser Ser
145 150 155 160
Asp Ser Glu Pro Phe Val Leu Arg Gly Leu Pro His Glu Val Ser Phe
165 170 175
Val Arg Thr Gln Ile Pro Asp Tyr Glu Leu Gln Glu Gly Gly Asp Asp
180 185 190
Ala Phe Ser Lys Met Ala Lys Gln Met Arg Asp Ala Asp Lys Lys Ser
195 200 205
Tyr Gly Asp Val Ile Asn Ser Phe Glu Glu Leu Glu Ser Glu Tyr Ala
210 215 220
Asp Tyr Asn Lys Asn Val Phe Gly Lys Lys Ala Trp His Ile Gly Pro
225 230 235 240
Leu Lys Leu Phe Asn Asn Arg Ala Glu Gln Lys Ser Ser Gln Arg Gly
245 250 255
Lys Glu Ser Ala Ile Asp Asp His Glu Cys Leu Ala Trp Leu Asn Ser
260 265 270
Lys Lys Pro Asn Ser Val Val Tyr Met Cys Phe Gly Ser Met Ala Thr
275 280 285
Phe Thr Pro Ala Gln Leu His Glu Thr Ala Val Gly Leu Glu Ser Ser
290 295 300
Gly Gln Asp Phe Ile Trp Val Val Arg Asn Gly Gly Lys Asn Glu Asp
305 310 315 320
Trp Leu Pro Gln Gly Phe Glu Glu Arg Ile Lys Gly Lys Gly Leu Met
325 330 335
Ile Arg Gly Trp Ala Pro Gln Val Met Ile Leu Asp His Pro Ser Thr
340 345 350
Gly Ala Phe Val Thr His Cys Gly Trp Asn Ser Thr Leu Glu Gly Ile
355 360 365
Cys Ala Gly Leu Pro Met Val Thr Trp Pro Val Phe Ala Glu Gln Phe
370 375 380
Tyr Asn Glu Lys Leu Val Thr Glu Val Leu Lys Thr Gly Val Ser Val
385 390 395 400
Gly Asn Lys Lys Trp Gln Arg Val Gly Glu Gly Val Gly Ser Glu Ala
405 410 415
Val Lys Glu Ala Val Glu Arg Val Met Val Gly Asp Gly Ala Ala Glu
420 425 430
Met Arg Ser Arg Ala Val Tyr Tyr Lys Glu Met Ala Arg Lys Ala Val
435 440 445
Glu Glu Gly Gly Ser Ser Tyr Asn Asn Leu Asn Ala Leu Ile Gln Glu
450 455 460
Leu Ser Ala Tyr Val Pro Pro Met Lys Gln Gly Leu Asn
465 470 475
<210> 98
<211> 1434
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:97的编码序列
<400> 98
atgtccggtc aattgcacat cgtcttggtt ccaatgatcg ctcacggtca catgatccca 60
atgttggaca tggccaagtt gttctcttcc agaggtgtca agaccaccat catcgccact 120
ccagccttcg ctgaaccaat cagaaaggcc agagaatctg gtcacgacat cggtttgacc 180
accaccaagt tcccaccaaa gggttcctct ttgccagaca acatcagatc tttggatcaa 240
gttactggtg atttgttgcc acacttcttc agagccttgg aattgttgca agaaccagtt 300
gaagaaatca tggaagattt gaagccaaac tgtttggttt ctgacatgtt cttgccatgg 360
actaccgact ctgctgccaa gttcggtatt ccaagattgg ttttccacgg tacctctttg 420
ttcgctagat gtttctctga acaaatgtct atccaaaagc catacaagaa cgtttcttct 480
gattccgaac cattcgtttt gagaggtttg ccacacgaag tttctttcgt tagaactcaa 540
atcccagatt acgaattgca agaaggtggt gatgatgcct tctctaagat ggctaagcaa 600
atgagagatg ctgataagaa gtcttacggt gacgttatca actctttcga agaattggaa 660
tctgaatacg ctgattacaa caagaacgtt ttcggtaaga aggcttggca catcggtcca 720
ttgaagttgt tcaacaacag agctgaacaa aagtcatctc aaagaggtaa ggaatctgcc 780
atcgacgatc acgaatgttt ggcttggttg aactctaaga agccaaactc tgttgtttac 840
atgtgtttcg gttctatggc cactttcact ccagcccaat tgcacgaaac tgctgtcggt 900
ttggaatcct ctggtcaaga tttcatctgg gttgttagaa acggtggtaa gaacgaagat 960
tggttgccac aaggtttcga agaaagaatc aagggtaagg gtttgatgat cagaggttgg 1020
gccccacaag ttatgatttt ggatcaccca tctactggtg ctttcgttac tcactgtggt 1080
tggaactcta ctttggaagg tatctgtgcc ggtttgccaa tggttacttg gccagttttc 1140
gctgaacaat tctacaacga aaagttggtt actgaagttt taaagactgg tgtttctgtt 1200
ggtaacaaga agtggcaaag agttggtgaa ggtgttggtt ctgaagctgt taaggaagct 1260
gttgaaagag tcatggtcgg tgacggtgct gctgaaatga gatctagagc tgtctactac 1320
aaggaaatgg ctagaaaggc tgttgaagaa ggtggttctt cttacaacaa cttgaacgct 1380
ttgatccaag aattgtctgc ctacgttcca ccaatgaagc aaggtttgaa ctaa 1434
<210> 99
<211> 533
<212> PRT
<213> 智人(Homo sapiens)
<400> 99
Met Ser Ala Cys Leu Leu Arg Ser Phe Gln Arg Ile Ser Ala Gly Val
1 5 10 15
Phe Phe Leu Ala Leu Trp Gly Met Val Val Gly Asp Lys Leu Leu Val
20 25 30
Val Pro Gln Asp Gly Ser His Trp Leu Ser Met Lys Asp Ile Val Glu
35 40 45
Val Leu Ser Asp Arg Gly His Glu Ile Val Val Val Val Pro Glu Val
50 55 60
Asn Leu Leu Leu Lys Glu Ser Lys Tyr Tyr Thr Arg Lys Ile Tyr Pro
65 70 75 80
Val Pro Tyr Asp Gln Glu Glu Leu Lys Asn Arg Tyr Gln Ser Phe Gly
85 90 95
Asn Asn His Phe Ala Glu Arg Ser Phe Leu Thr Ala Pro Gln Thr Glu
100 105 110
Tyr Arg Asn Asn Met Ile Val Ile Gly Leu Tyr Phe Ile Asn Cys Gln
115 120 125
Ser Leu Leu Gln Asp Arg Asp Thr Leu Asn Phe Phe Lys Glu Ser Lys
130 135 140
Phe Asp Ala Leu Phe Thr Asp Pro Ala Leu Pro Cys Gly Val Ile Leu
145 150 155 160
Ala Glu Tyr Leu Gly Leu Pro Ser Val Tyr Leu Phe Arg Gly Phe Pro
165 170 175
Cys Ser Leu Glu His Thr Phe Ser Arg Ser Pro Asp Pro Val Ser Tyr
180 185 190
Ile Pro Arg Cys Tyr Thr Lys Phe Ser Asp His Met Thr Phe Ser Gln
195 200 205
Arg Val Ala Asn Phe Leu Val Asn Leu Leu Glu Pro Tyr Leu Phe Tyr
210 215 220
Cys Leu Phe Ser Lys Tyr Glu Glu Leu Ala Ser Ala Val Leu Lys Arg
225 230 235 240
Asp Val Asp Ile Ile Thr Leu Tyr Gln Lys Val Ser Val Trp Leu Leu
245 250 255
Arg Tyr Asp Phe Val Leu Glu Tyr Pro Arg Pro Val Met Pro Asn Met
260 265 270
Val Phe Ile Gly Gly Ile Asn Cys Lys Lys Arg Lys Asp Leu Ser Gln
275 280 285
Glu Phe Glu Ala Tyr Ile Asn Ala Ser Gly Glu His Gly Ile Val Val
290 295 300
Phe Ser Leu Gly Ser Met Val Ser Glu Ile Pro Glu Lys Lys Ala Met
305 310 315 320
Ala Ile Ala Asp Ala Leu Gly Lys Ile Pro Gln Thr Val Leu Trp Arg
325 330 335
Tyr Thr Gly Thr Arg Pro Ser Asn Leu Ala Asn Asn Thr Ile Leu Val
340 345 350
Lys Trp Leu Pro Gln Asn Asp Leu Leu Gly His Pro Met Thr Arg Ala
355 360 365
Phe Ile Thr His Ala Gly Ser His Gly Val Tyr Glu Ser Ile Cys Asn
370 375 380
Gly Val Pro Met Val Met Met Pro Leu Phe Gly Asp Gln Met Asp Asn
385 390 395 400
Ala Lys Arg Met Glu Thr Lys Gly Ala Gly Val Thr Leu Asn Val Leu
405 410 415
Glu Met Thr Ser Glu Asp Leu Glu Asn Ala Leu Lys Ala Val Ile Asn
420 425 430
Asp Lys Ser Tyr Lys Glu Asn Ile Met Arg Leu Ser Ser Leu His Lys
435 440 445
Asp Arg Pro Val Glu Pro Leu Asp Leu Ala Val Phe Trp Val Glu Phe
450 455 460
Val Met Arg His Lys Gly Ala Pro His Leu Arg Pro Ala Ala His Asp
465 470 475 480
Leu Thr Trp Tyr Gln Tyr His Ser Leu Asp Val Ile Gly Phe Leu Leu
485 490 495
Ala Val Val Leu Thr Val Ala Phe Ile Thr Phe Lys Cys Cys Ala Tyr
500 505 510
Gly Tyr Arg Lys Cys Leu Gly Lys Lys Gly Arg Val Lys Lys Ala His
515 520 525
Lys Ser Lys Thr His
530
<210> 100
<211> 1602
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:99的编码序列
<400> 100
atgtccgcct gtttgttgag atctttccaa agaatttctg ctggtgtttt cttcttggct 60
ttgtggggta tggttgttgg tgacaagttg ttggttgtcc cacaagacgg ttctcactgg 120
ttgtctatga aggatatcgt tgaagttttg tctgacagag gtcacgaaat tgttgttgtt 180
gttccagaag ttaacttgtt gttgaaggaa tccaagtact acactagaaa gatctaccca 240
gttccatacg accaagaaga attgaagaac agataccaat ctttcggtaa caaccacttc 300
gctgaaagat ctttcttgac tgctccacaa actgaataca gaaacaacat gattgttatt 360
ggtttgtact tcatcaactg tcaatctttg ttgcaagaca gagacacctt gaacttcttc 420
aaggaatcta agttcgatgc tttgttcact gacccagcct tgccatgtgg tgttatcttg 480
gctgaatact tgggtttgcc atctgtttac ttgttcagag gtttcccatg ttccttggaa 540
cacactttct ctagatctcc agacccagtt tcctacattc caagatgtta cactaagttc 600
tctgaccaca tgactttctc ccaaagagtt gccaacttct tggttaactt gttggaacca 660
tacttgttct actgtttgtt ctctaagtac gaagaattgg cttctgctgt cttgaagaga 720
gatgttgata tcatcacctt gtaccaaaag gtatctgttt ggttgttgag atacgacttc 780
gttttggaat acccaagacc agtcatgcca aacatggtat tcattggtgg tatcaactgt 840
aagaagagaa aggacttgtc tcaagaattc gaagcctaca ttaacgcttc tggtgaacac 900
ggtattgttg ttttctcttt gggttctatg gtatctgaaa ttccagaaaa gaaggctatg 960
gctattgctg atgctttggg taagatccca caaactgtct tgtggagata cactggtacc 1020
agaccatcta acttggctaa caacactatc ttggttaagt ggttgccaca aaacgatttg 1080
ttgggtcacc caatgaccag agccttcatc acccacgctg gttcccacgg tgtttacgaa 1140
tctatctgta acggtgttcc aatggttatg atgccattgt tcggtgatca aatggacaac 1200
gctaagagaa tggaaactaa gggtgctggt gttaccttga acgttttgga aatgacttct 1260
gaagatttgg aaaacgcttt gaaggctgtc atcaacgaca agtcttacaa ggaaaacatc 1320
atgagattgt cctctttgca caaggacaga ccagttgaac cattggactt ggccgttttc 1380
tgggttgaat tcgttatgag acacaagggt gctccacact taagaccagc tgcccacgac 1440
ttgacctggt accaatacca ctccttggac gttattggtt tcttgttggc cgtcgttttg 1500
actgttgcct tcatcacctt caagtgttgt gcttacggtt acagaaagtg tttgggtaag 1560
aagggtagag ttaagaaggc ccacaagtcc aagacccact aa 1602
<210> 101
<211> 531
<212> PRT
<213> 智人(Homo sapiens)
<400> 101
Met Val Ala Arg Ala Gly Trp Thr Gly Leu Leu Pro Leu Tyr Val Cys
1 5 10 15
Leu Leu Leu Thr Cys Gly Phe Ala Lys Ala Gly Lys Leu Leu Val Val
20 25 30
Pro Met Asp Gly Ser His Trp Phe Thr Met Gln Ser Val Val Glu Lys
35 40 45
Leu Ile Leu Arg Gly His Glu Val Val Val Val Met Pro Glu Val Ser
50 55 60
Trp Gln Leu Gly Arg Ser Leu Asn Cys Thr Val Lys Thr Tyr Ser Thr
65 70 75 80
Ser Tyr Thr Leu Glu Asp Gln Asp Arg Glu Phe Met Val Phe Ala Asp
85 90 95
Ala Arg Trp Thr Ala Pro Leu Arg Ser Ala Phe Ser Leu Leu Thr Ser
100 105 110
Ser Ser Asn Gly Ile Phe Asp Leu Phe Phe Ser Asn Cys Arg Ser Leu
115 120 125
Phe Asn Asp Arg Lys Leu Val Glu Tyr Leu Lys Glu Ser Cys Phe Asp
130 135 140
Ala Val Phe Leu Asp Pro Phe Asp Ala Cys Gly Leu Ile Val Ala Lys
145 150 155 160
Tyr Phe Ser Leu Pro Ser Val Val Phe Ala Arg Gly Ile Phe Cys His
165 170 175
Tyr Leu Glu Glu Gly Ala Gln Cys Pro Ala Pro Leu Ser Tyr Val Pro
180 185 190
Arg Leu Leu Leu Gly Phe Ser Asp Ala Met Thr Phe Lys Glu Arg Val
195 200 205
Trp Asn His Ile Met His Leu Glu Glu His Leu Phe Cys Pro Tyr Phe
210 215 220
Phe Lys Asn Val Leu Glu Ile Ala Ser Glu Ile Leu Gln Thr Pro Val
225 230 235 240
Thr Ala Tyr Asp Leu Tyr Ser His Thr Ser Ile Trp Leu Leu Arg Thr
245 250 255
Asp Phe Val Leu Glu Tyr Pro Lys Pro Val Met Pro Asn Met Ile Phe
260 265 270
Ile Gly Gly Ile Asn Cys His Gln Gly Lys Pro Val Pro Met Glu Phe
275 280 285
Glu Ala Tyr Ile Asn Ala Ser Gly Glu His Gly Ile Val Val Phe Ser
290 295 300
Leu Gly Ser Met Val Ser Glu Ile Pro Glu Lys Lys Ala Met Ala Ile
305 310 315 320
Ala Asp Ala Leu Gly Lys Ile Pro Gln Thr Val Leu Trp Arg Tyr Thr
325 330 335
Gly Thr Arg Pro Ser Asn Leu Ala Asn Asn Thr Ile Leu Val Lys Trp
340 345 350
Leu Pro Gln Asn Asp Leu Leu Gly His Pro Met Thr Arg Ala Phe Ile
355 360 365
Thr His Ala Gly Ser His Gly Val Tyr Glu Ser Ile Cys Asn Gly Val
370 375 380
Pro Met Val Met Met Pro Leu Phe Gly Asp Gln Met Asp Asn Ala Lys
385 390 395 400
Arg Met Glu Thr Lys Gly Ala Gly Val Thr Leu Asn Val Leu Glu Met
405 410 415
Thr Ser Glu Asp Leu Glu Asn Ala Leu Lys Ala Val Ile Asn Asp Lys
420 425 430
Ser Tyr Lys Glu Asn Ile Met Arg Leu Ser Ser Leu His Lys Asp Arg
435 440 445
Pro Val Glu Pro Leu Asp Leu Ala Val Phe Trp Val Glu Phe Val Met
450 455 460
Arg His Lys Gly Ala Pro His Leu Arg Pro Ala Ala His Asp Leu Thr
465 470 475 480
Trp Tyr Gln Tyr His Ser Leu Asp Val Ile Gly Phe Leu Leu Ala Val
485 490 495
Val Leu Thr Val Ala Phe Ile Thr Phe Lys Cys Cys Ala Tyr Gly Tyr
500 505 510
Arg Lys Cys Leu Gly Lys Lys Gly Arg Val Lys Lys Ala His Lys Ser
515 520 525
Lys Thr His
530
<210> 102
<211> 1596
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:101的编码序列
<400> 102
atgtccgcta gagctggttg gactggtttg ttgccattgt acgtttgttt gttgttgacc 60
tgtggtttcg ccaaggctgg taagttgttg gttgttccaa tggatggttc tcactggttc 120
accatgcaat ctgttgttga aaagttgatc ttgagaggtc acgaagttgt cgttgtcatg 180
ccagaagttt cttggcaatt gggtagatct ttgaactgta ctgttaagac ttactctacc 240
tcttacactt tggaagatca agacagagaa ttcatggttt tcgccgatgc tagatggact 300
gctccattga gatctgcttt ctctttgttg acttcttctt ccaacggtat tttcgacttg 360
ttcttctcta actgtagatc tttgttcaac gacagaaagt tggttgaata cttgaaggaa 420
tcttgtttcg atgctgtttt cttggatcca ttcgatgcct gtggtttgat tgttgccaag 480
tacttctcct tgccatctgt tgtattcgcc agaggtatct tctgtcacta cttggaagaa 540
ggtgctcaat gtccagctcc attgtcctac gtcccaagat tgttgttggg tttctctgac 600
gccatgactt tcaaggaaag agtttggaac cacatcatgc acttggaaga acacttgttc 660
tgtccatact tcttcaagaa cgtcttggaa atcgcctctg aaattttgca aaccccagtc 720
actgcttacg atttgtactc tcacacttct atttggttgt tgagaactga cttcgttttg 780
gaatacccaa agccagttat gccaaacatg atcttcattg gtggtatcaa ctgtcaccaa 840
ggtaagccag ttccaatgga attcgaagcc tacattaacg cttctggtga acacggtatt 900
gttgttttct ctttgggttc tatggtatct gaaattccag aaaagaaggc tatggctatt 960
gctgatgctt tgggtaagat cccacaaact gtcttgtgga gatacactgg taccagacca 1020
tctaacttgg ctaacaacac tatcttggtt aagtggttgc cacaaaacga tttgttgggt 1080
cacccaatga ccagagcctt catcacccac gctggttccc acggtgttta cgaatctatc 1140
tgtaacggtg ttccaatggt tatgatgcca ttgttcggtg atcaaatgga caacgctaag 1200
agaatggaaa ctaagggtgc tggtgttacc ttgaacgttt tggaaatgac ttctgaagat 1260
ttggaaaacg ctttgaaggc tgtcatcaac gacaagtctt acaaggaaaa catcatgaga 1320
ttgtcctctt tgcacaagga cagaccagtt gaaccattgg acttggccgt tttctgggtt 1380
gaattcgtta tgagacacaa gggtgctcca cacttaagac cagctgccca cgacttgacc 1440
tggtaccaat accactcctt ggacgttatt ggtttcttgt tggccgtcgt tttgactgtt 1500
gccttcatca ccttcaagtg ttgtgcttac ggttacagaa agtgtttggg taagaagggt 1560
agagttaaga aggcccacaa gtccaagacc cactaa 1596
<210> 103
<211> 482
<212> PRT
<213> 克莱门柚(Citrus clementina)
<400> 103
Met Ser His Ala Ser Ser Asn Met His Ala Pro Ser Asn Gln His His
1 5 10 15
Lys Met Gly Thr Glu Ser Ala Glu Ala Asp Gln Leu His Val Val Met
20 25 30
Phe Pro Trp Phe Ala Phe Gly His Ile Ser Pro Phe Val Gln Leu Ser
35 40 45
Asn Lys Leu Ser Leu His Gly Val Lys Val Ser Phe Phe Ser Ala Pro
50 55 60
Gly Asn Ile Pro Arg Ile Lys Ser Ser Leu Asn Leu Thr Pro Met Ala
65 70 75 80
Asp Ile Ile Pro Leu Gln Ile Pro His Val Asp Gly Leu Pro Pro Gly
85 90 95
Leu Asp Ser Thr Ser Glu Met Thr Pro His Met Ala Glu Leu Leu Lys
100 105 110
Gln Ala Leu Asp Leu Met Gln Pro Gln Ile Lys Thr Leu Leu Ser Gln
115 120 125
Leu Lys Pro His Phe Val Phe Phe Asp Phe Thr His Tyr Trp Leu Pro
130 135 140
Gly Leu Val Gly Ser Gln Leu Gly Ile Lys Thr Val Asn Phe Ser Val
145 150 155 160
Phe Ser Ala Ile Ser Gln Ala Tyr Leu Val Val Pro Ala Arg Lys Leu
165 170 175
Asn Asn Ser Leu Ala Asp Leu Met Lys Ser Pro Asp Gly Phe Pro Ala
180 185 190
Thr Ser Ile Thr Ser Leu Asp Glu Phe Val Ala Arg Asp Tyr Leu Tyr
195 200 205
Val Tyr Thr Lys Phe Asn Gly Gly Pro Ser Val Tyr Glu Arg Gly Ile
210 215 220
Gln Gly Val Asp Gly Cys Asp Val Leu Ala Ile Lys Thr Cys Asn Glu
225 230 235 240
Met Glu Gly Pro Tyr Leu Asp Phe Val Arg Thr Gln Phe Lys Lys Pro
245 250 255
Val Leu Leu Thr Gly Pro Leu Val Asn Pro Glu Pro Pro Ser Gly Glu
260 265 270
Leu Glu Glu Arg Trp Ala Lys Trp Leu Cys Lys Tyr Pro Pro Lys Ser
275 280 285
Val Ile Tyr Cys Ser Phe Gly Ser Glu Thr Phe Leu Thr Val Asp Gln
290 295 300
Ile Lys Glu Leu Ala Ile Gly Leu Glu Ile Thr Gly Leu Pro Phe Phe
305 310 315 320
Leu Val Leu Asn Phe Pro Pro Asn Val Asp Ala Gln Ser Glu Leu Val
325 330 335
Arg Thr Leu Pro Pro Gly Phe Met Asp Arg Val Lys Asp Arg Gly Val
340 345 350
Val His Thr Gly Trp Val Gln Gln Gln Leu Ile Leu Arg His Glu Ser
355 360 365
Val Gly Cys Tyr Val Cys His Ser Gly Phe Ser Ser Val Thr Glu Ala
370 375 380
Val Ile Ser Asp Cys Gln Leu Val Leu Leu Pro Leu Lys Gly Asp Gln
385 390 395 400
Phe Leu Asn Ser Lys Leu Val Ala Gly Asp Leu Lys Ala Gly Val Glu
405 410 415
Val Asn Arg Arg Asp His Asp Gly His Phe Gly Lys Glu Asp Ile Phe
420 425 430
Lys Ala Val Lys Thr Val Met Val Asp Val Asn Lys Glu Pro Gly Ala
435 440 445
Ser Ile Arg Ala Asn Gln Lys Trp Trp Arg Glu Phe Leu Leu Asn Gly
450 455 460
Gln Ile Gln Asp Lys Phe Ile Ala Asp Phe Val Lys Asp Leu Lys Thr
465 470 475 480
Leu Ala
<210> 104
<211> 1449
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:103的编码序列
<400> 104
atgtcccacg cctcttctaa catgcacgcc ccatctaacc aacaccacaa gatgggtact 60
gaatctgctg aagctgatca attgcacgtt gttatgttcc catggttcgc tttcggtcac 120
atctctccat tcgttcaatt gtccaacaag ttgtctttgc acggtgtcaa ggtatctttc 180
ttctctgctc caggtaacat tccaagaatc aagtcatctt tgaacttgac tccaatggcc 240
gacattatcc cattgcaaat cccacacgtc gatggtttgc caccaggttt ggattctacc 300
tctgaaatga ctccacacat ggctgaattg ttgaagcaag ccttggactt gatgcaacca 360
caaatcaaga ctttgttgtc tcaattgaag ccacacttcg ttttcttcga tttcacccac 420
tactggttgc caggtttggt tggttctcaa ttgggtatca agactgttaa cttctctgtt 480
ttctctgcca tttctcaagc ctacttggtt gttccagcca gaaagttgaa caactctttg 540
gctgatttga tgaagtctcc agatggtttc ccagctactt ccattacctc tttggatgaa 600
ttcgttgcta gagattactt gtacgtttac actaagttca acggtggtcc atctgtttac 660
gaaagaggta ttcaaggtgt tgatggttgt gatgttttgg ccatcaagac ttgtaacgaa 720
atggaaggtc catacttgga tttcgttaga acccaattca agaagccagt tttgttgacc 780
ggtccattgg ttaacccaga accaccatcc ggtgaattgg aagaaagatg ggctaagtgg 840
ttgtgtaagt acccaccaaa gtctgttatt tactgttcct tcggttctga aactttcttg 900
accgttgatc aaatcaagga attggccatt ggtttggaaa ttactggttt gccattcttc 960
ttggtcttga acttcccacc aaacgtcgat gctcaatctg aattggtcag aactttgcca 1020
ccaggtttca tggacagagt taaggacaga ggtgttgttc acactggttg ggttcaacaa 1080
caattgattt tgagacacga atctgttggt tgttacgttt gtcactctgg tttctcttct 1140
gttactgaag ctgttatttc tgattgtcaa ttggttttgt tgccattgaa gggtgaccaa 1200
ttcttgaact ccaagttggt tgctggtgac ttgaaggctg gtgttgaagt taacagaaga 1260
gatcacgatg gtcacttcgg taaggaagat attttcaagg ctgttaagac tgttatggtt 1320
gatgttaaca aggaaccagg tgcttctatc agagctaacc aaaagtggtg gagagaattc 1380
ttgttgaacg gtcaaattca agataagttc attgctgatt tcgtcaagga tttaaagacc 1440
ttggcttaa 1449
<210> 105
<211> 476
<212> PRT
<213> 甜橙(Citrus sinensis)
<400> 105
Met Ser His Ala Pro Ser Asn Gln His His Lys Met Gly Thr Glu Ser
1 5 10 15
Ala Glu Ala Asp Gln Leu His Val Val Met Phe Pro Trp Phe Ala Ser
20 25 30
Gly His Ile Ser Pro Phe Val Gln Leu Ser Asn Lys Leu Ser Leu His
35 40 45
Gly Val Lys Val Ser Phe Phe Ser Ala Pro Gly Asn Ile Pro Arg Ile
50 55 60
Lys Ser Ser Leu Asn Leu Thr Pro Met Ala Asp Ile Ile Pro Leu Gln
65 70 75 80
Ile Pro His Val Asp Gly Leu Pro Pro Gly Leu Asp Ser Thr Ser Glu
85 90 95
Met Thr Pro His Met Ala Glu Leu Leu Lys Gln Ala Leu Asp Leu Met
100 105 110
Gln Pro Gln Ile Lys Thr Leu Leu Ser Gln Leu Lys Pro His Phe Val
115 120 125
Phe Phe Asp Phe Thr His Tyr Trp Leu Pro Gly Leu Val Gly Ser Gln
130 135 140
Leu Gly Ile Lys Thr Val Asn Phe Ser Val Phe Ser Ala Ile Ser Gln
145 150 155 160
Ala Tyr Leu Val Val Pro Ala Arg Lys Leu Asn Asn Ser Leu Ala Asp
165 170 175
Leu Met Lys Ser Pro Asp Gly Phe Pro Ala Thr Ser Ile Thr Ser Leu
180 185 190
Asp Glu Phe Val Ala Arg Asp Tyr Leu Tyr Val Tyr Thr Lys Phe Asn
195 200 205
Gly Gly Pro Ser Val Tyr Glu Arg Gly Ile Gln Gly Val Asp Gly Cys
210 215 220
Asp Val Leu Ala Ile Lys Thr Cys Asn Glu Met Glu Gly Pro Tyr Leu
225 230 235 240
Asp Phe Val Arg Thr Gln Phe Lys Lys Pro Val Leu Leu Thr Gly Pro
245 250 255
Leu Val Asn Pro Glu Pro Pro Ser Gly Glu Leu Glu Glu Arg Trp Ala
260 265 270
Asn Trp Leu Gly Lys Phe Pro Pro Lys Ser Val Ile Tyr Cys Ser Phe
275 280 285
Gly Ser Glu Thr Phe Leu Thr Val Asp Gln Ile Lys Glu Leu Ala Ile
290 295 300
Gly Leu Glu Ile Thr Gly Leu Pro Phe Phe Leu Val Leu Asn Phe Pro
305 310 315 320
Pro Asn Val Asp Gly Gln Ser Glu Leu Val Arg Thr Leu Pro Pro Gly
325 330 335
Phe Met Asp Arg Val Lys Asp Arg Gly Val Val His Thr Gly Trp Val
340 345 350
Gln Gln Gln Leu Ile Leu Arg His Glu Ser Val Gly Cys Tyr Val Cys
355 360 365
His Ser Gly Phe Ser Ser Val Thr Glu Ala Val Ile Ser Asp Cys Gln
370 375 380
Leu Val Leu Leu Pro Leu Lys Gly Asp Gln Phe Leu Asn Ser Lys Leu
385 390 395 400
Val Ala Gly Asp Leu Lys Ala Gly Val Glu Val Asn Arg Arg Asp His
405 410 415
Asp Gly His Phe Gly Lys Glu Asp Ile Phe Lys Ala Val Lys Thr Val
420 425 430
Met Val Asp Val Asn Lys Glu Pro Gly Ala Ser Ile Arg Ala Asn Gln
435 440 445
Lys Trp Trp Arg Glu Phe Leu Leu Asn Gly Gln Ile Gln Asp Lys Phe
450 455 460
Ile Ala Asp Phe Val Lys Asp Leu Lys Ala Leu Ala
465 470 475
<210> 106
<211> 1431
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:105的编码序列
<400> 106
atgtcccacg ccccatctaa ccaacaccac aagatgggta ctgaatctgc tgaagctgat 60
caattgcacg ttgttatgtt cccatggttc gcttctggtc acatctctcc attcgttcaa 120
ttgtccaaca agttgtcttt gcacggtgtc aaggtatctt tcttctctgc tccaggtaac 180
attccaagaa tcaagtcatc tttgaacttg actccaatgg ccgacattat cccattgcaa 240
atcccacacg tcgatggttt gccaccaggt ttggattcta cctctgaaat gactccacac 300
atggctgaat tgttgaagca agccttggac ttgatgcaac cacaaatcaa gactttgttg 360
tctcaattga agccacactt cgttttcttc gatttcaccc actactggtt gccaggtttg 420
gttggttctc aattgggtat caagaccgtt aacttctctg ttttctctgc catttctcaa 480
gcctacttgg ttgtcccagc cagaaagttg aacaactctt tggctgattt gatgaagtct 540
ccagatggtt tcccagctac ttccattacc tctttggatg aattcgttgc tagagattac 600
ttgtacgttt acactaagtt caacggtggt ccatctgttt acgaaagagg tattcaaggt 660
gttgatggtt gtgatgtttt ggccatcaag acttgtaacg aaatggaagg tccatacttg 720
gatttcgtta gaacccaatt caagaagcca gttttgttga ccggtccatt ggttaaccca 780
gaaccaccat ccggtgaatt ggaagaaaga tgggctaact ggttgggtaa gttcccacca 840
aagtctgtca tttactgttc tttcggttct gaaactttct tgaccgttga tcaaatcaag 900
gaattggcca ttggtttgga aattactggt ttgccattct tcttggtctt gaacttccca 960
ccaaacgttg atggtcaatc tgaattggtc agaactttgc caccaggttt catggacaga 1020
gttaaggaca gaggtgttgt tcacactggt tgggttcaac aacaattgat tttgagacac 1080
gaatctgttg gttgttacgt ttgtcactct ggtttctctt ctgttactga agctgttatt 1140
tctgattgtc aattggtttt gttgccattg aagggtgacc aattcttgaa ctccaagttg 1200
gttgctggtg acttgaaggc tggtgttgaa gttaacagaa gagatcacga tggtcacttc 1260
ggtaaggaag atattttcaa ggctgttaag actgttatgg ttgatgttaa caaggaacca 1320
ggtgcttcta tcagagctaa ccaaaagtgg tggagagaat tcttgttgaa cggtcaaatt 1380
caagataagt tcattgctga tttcgtcaag gatttgaagg ccttggctta a 1431
<210> 107
<211> 669
<212> PRT
<213> 甜橙(Citrus sinensis)
<400> 107
Met Ser Ala Thr Tyr Thr Pro Lys Asn Ile Leu Ile Thr Gly Ala Ala
1 5 10 15
Gly Phe Ile Ala Ser His Val Cys Asn Arg Leu Ile Arg Asn Tyr Pro
20 25 30
Glu Tyr Lys Ile Val Val Leu Asp Lys Leu Asp Tyr Cys Ser Asn Leu
35 40 45
Lys Asn Leu Ile Pro Ser Lys Ala Ser Ser Asn Phe Lys Phe Val Lys
50 55 60
Gly Asp Ile Ala Ser Ala Asp Leu Val Asn Phe Leu Leu Ile Thr Glu
65 70 75 80
Ser Ile Asp Thr Ile Met His Phe Ala Ala Gln Thr His Val Asp Asn
85 90 95
Ser Phe Gly Asn Ser Phe Glu Phe Thr Lys Asn Asn Ile Tyr Gly Thr
100 105 110
His Val Leu Leu Glu Ala Cys Lys Val Thr Gly Gln Ile Arg Arg Phe
115 120 125
Ile His Val Ser Thr Asp Glu Val Tyr Gly Glu Thr Asp Glu Asp Ala
130 135 140
Val Val Gly Asn His Glu Ala Ser Gln Leu Leu Pro Thr Asn Pro Tyr
145 150 155 160
Ser Ala Thr Lys Ala Gly Ala Glu Met Leu Val Met Ala Tyr Gly Arg
165 170 175
Ser Tyr Gly Leu Pro Val Ile Thr Thr Arg Gly Asn Asn Val Tyr Gly
180 185 190
Pro Asn Gln Phe Pro Glu Lys Leu Ile Pro Lys Phe Ile Leu Leu Ala
195 200 205
Met Arg Gly Leu Pro Leu Pro Ile His Gly Asp Gly Ser Asn Val Arg
210 215 220
Ser Tyr Leu Tyr Cys Glu Asp Val Ala Glu Ala Phe Glu Cys Ile Leu
225 230 235 240
His Lys Gly Glu Val Gly His Val Tyr Asn Val Gly Thr Lys Lys Glu
245 250 255
Arg Arg Val Ile Asp Val Ala Lys Asp Ile Cys Lys Leu Phe Ser Met
260 265 270
Asp Pro Glu Thr Ser Ile Lys Phe Val Glu Asn Arg Pro Phe Asn Asp
275 280 285
Gln Arg Tyr Phe Leu Asp Asp Gln Lys Leu Thr Ser Leu Gly Trp Ser
290 295 300
Glu Arg Thr Ile Trp Glu Glu Gly Leu Arg Lys Thr Ile Glu Trp Tyr
305 310 315 320
Thr Gln Asn Pro Asp Trp Trp Gly Asp Val Ser Gly Ala Leu Leu Pro
325 330 335
His Pro Arg Met Leu Met Met Pro Gly Gly Arg His Phe Asp Gly Ser
340 345 350
Glu Glu Asn Lys Ala Val Ser Ser Val Ser Thr Asn Asn Ile Gln Ser
355 360 365
Arg Met Val Val Pro Val Ser Lys Cys Ser Ser Pro Arg Lys Pro Ser
370 375 380
Met Lys Phe Leu Ile Tyr Gly Arg Thr Gly Trp Ile Gly Gly Leu Leu
385 390 395 400
Gly Lys Leu Cys Glu Lys Glu Gly Ile Pro Phe Glu Tyr Gly Lys Gly
405 410 415
Arg Leu Glu Asp Arg Ser Ser Leu Ile Ala Asp Val Gln Ser Val Lys
420 425 430
Pro Thr His Val Phe Asn Ala Ala Gly Val Thr Gly Arg Pro Asn Val
435 440 445
Asp Trp Cys Glu Ser His Lys Thr Asp Thr Ile Arg Thr Asn Val Ala
450 455 460
Gly Thr Leu Thr Leu Ala Asp Val Cys Arg Asp His Gly Ile Leu Met
465 470 475 480
Met Asn Tyr Ala Thr Gly Cys Ile Phe Glu Tyr Asp Ala Ala His Pro
485 490 495
Glu Gly Ser Gly Ile Gly Tyr Lys Glu Glu Asp Thr Pro Asn Phe Thr
500 505 510
Gly Ser Phe Tyr Ser Lys Thr Lys Ala Met Val Glu Glu Leu Leu Lys
515 520 525
Glu Tyr Asp Asn Val Cys Thr Leu Arg Val Arg Met Pro Ile Ser Ser
530 535 540
Asp Leu Asn Asn Pro Arg Asn Phe Ile Thr Lys Ile Ser Arg Tyr Asn
545 550 555 560
Lys Val Val Asn Ile Pro Asn Ser Met Thr Val Leu Asp Glu Leu Leu
565 570 575
Pro Ile Ser Ile Glu Met Ala Lys Arg Asn Leu Arg Gly Ile Trp Asn
580 585 590
Phe Thr Asn Pro Gly Val Val Ser His Asn Glu Ile Leu Glu Met Tyr
595 600 605
Lys Lys Tyr Ile Asn Pro Glu Phe Lys Trp Val Asn Phe Thr Leu Asp
610 615 620
Glu Gln Ala Lys Val Ile Val Ala Pro Arg Ser Asn Asn Glu Met Asp
625 630 635 640
Ala Ser Lys Leu Lys Lys Glu Phe Pro Glu Leu Leu Ser Ile Lys Asp
645 650 655
Ser Leu Ile Lys Tyr Val Phe Glu Pro Asn Lys Lys Thr
660 665
<210> 108
<211> 2010
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:107的编码序列
<400> 108
atgtccgcta cttacacccc aaagaacatc ttgatcactg gtgctgctgg tttcattgct 60
tcccacgttt gtaacagatt gattagaaac tacccagaat acaagattgt tgttttggac 120
aagttggatt actgttctaa cttgaagaac ttgatcccat ccaaggcttc ctccaacttc 180
aagttcgtta agggtgacat tgcctctgct gacttggtca acttcttgtt gatcaccgaa 240
tccattgaca ctattatgca cttcgctgct caaactcacg ttgacaactc tttcggtaac 300
tctttcgaat tcaccaagaa caacatctac ggtactcacg tcttgttgga agcctgtaag 360
gttactggtc aaatcagaag attcatccac gtatctactg atgaagtcta cggtgaaact 420
gatgaagatg ctgttgttgg taaccacgaa gcttcccaat tgttgccaac taacccatac 480
tctgctacta aggctggtgc tgaaatgttg gttatggctt acggtagatc ttacggtttg 540
ccagttatta ctaccagagg taacaacgtt tacggtccaa accaattccc agaaaagttg 600
attccaaagt tcatcttgtt ggccatgaga ggtttgccat tgccaattca cggtgatggt 660
tctaacgtta gatcttactt gtactgtgaa gatgttgctg aagctttcga atgtattttg 720
cacaagggtg aagttggtca cgtttacaac gttggtacta agaaggaaag aagagttatt 780
gatgttgcta aggatatttg taagttgttc tctatggacc cagaaacttc tatcaagttc 840
gttgaaaaca gaccattcaa cgatcaaaga tacttcttgg atgatcaaaa gttgacttct 900
ttgggttggt ctgaaagaac catctgggaa gaaggtttga gaaagactat tgaatggtac 960
actcaaaacc cagattggtg gggtgatgtc tctggtgctt tgttgccaca cccaagaatg 1020
ttgatgatgc caggtggtag acacttcgat ggttctgaag aaaacaaggc tgtttcctct 1080
gtctctacta acaacattca atccagaatg gttgttccag tttccaagtg ttcttctcca 1140
agaaagccat ccatgaagtt cttgatctac ggtagaactg gttggattgg tggtttgttg 1200
ggtaagttgt gtgaaaagga aggtattcca ttcgaatacg gtaagggtag attggaagat 1260
agatcttctt tgattgctga tgttcaatct gttaagccaa ctcacgtttt caacgctgct 1320
ggtgttactg gtagaccaaa cgttgattgg tgtgaatctc acaagactga caccattaga 1380
accaacgttg ctggtacctt gaccttggct gatgtttgta gagatcacgg tatcttgatg 1440
atgaactacg ctaccggttg tatcttcgaa tacgatgctg ctcacccaga aggttctggt 1500
attggttaca aggaagaaga tactccaaac ttcactggtt ctttctactc taagaccaag 1560
gccatggttg aagaattgtt gaaggaatac gacaacgttt gtactttgag agtcagaatg 1620
ccaatctctt ctgacttgaa caacccaaga aacttcatta ccaagatttc tagatacaac 1680
aaggttgtca acattccaaa ctctatgact gttttggatg aattgttgcc aatttctatt 1740
gaaatggcta agagaaactt gagaggtatt tggaacttca ctaacccagg tgttgtttct 1800
cacaacgaaa ttttggaaat gtacaagaag tacattaacc cagaattcaa gtgggttaac 1860
ttcactttgg atgaacaagc taaggttatc gtcgccccaa gatctaacaa cgaaatggat 1920
gcttctaagt tgaagaagga attcccagaa ttgttgtcca tcaaggattc tttgatcaag 1980
tacgtattcg aaccaaacaa gaaaacctaa 2010
<210> 109
<211> 670
<212> PRT
<213> 拟南芥(Arabidopsis thaliana)
<400> 109
Met Ser Ala Ser Tyr Thr Pro Lys Asn Ile Leu Ile Thr Gly Ala Ala
1 5 10 15
Gly Phe Ile Ala Ser His Val Ala Asn Arg Leu Ile Arg Ser Tyr Pro
20 25 30
Asp Tyr Lys Ile Val Val Leu Asp Lys Leu Asp Tyr Cys Ser Asn Leu
35 40 45
Lys Asn Leu Asn Pro Ser Lys His Ser Pro Asn Phe Lys Phe Val Lys
50 55 60
Gly Asp Ile Ala Ser Ala Asp Leu Val Asn His Leu Leu Ile Thr Glu
65 70 75 80
Gly Ile Asp Thr Ile Met His Phe Ala Ala Gln Thr His Val Asp Asn
85 90 95
Ser Phe Gly Asn Ser Phe Glu Phe Thr Lys Asn Asn Ile Tyr Gly Thr
100 105 110
His Val Leu Leu Glu Ala Cys Lys Val Thr Gly Gln Ile Arg Arg Phe
115 120 125
Ile His Val Ser Thr Asp Glu Val Tyr Gly Glu Thr Asp Glu Asp Ala
130 135 140
Leu Val Gly Asn His Glu Ala Ser Gln Leu Leu Pro Thr Asn Pro Tyr
145 150 155 160
Ser Ala Thr Lys Ala Gly Ala Glu Met Leu Val Met Ala Tyr Gly Arg
165 170 175
Ser Tyr Gly Leu Pro Val Ile Thr Thr Arg Gly Asn Asn Val Tyr Gly
180 185 190
Pro Asn Gln Phe Pro Glu Lys Leu Ile Pro Lys Phe Ile Leu Leu Ala
195 200 205
Met Arg Gly Gln Val Leu Pro Ile His Gly Asp Gly Ser Asn Val Arg
210 215 220
Ser Tyr Leu Tyr Cys Glu Asp Val Ala Glu Ala Phe Glu Val Val Leu
225 230 235 240
His Lys Gly Glu Val Gly His Val Tyr Asn Ile Gly Thr Lys Lys Glu
245 250 255
Arg Arg Val Asn Asp Val Ala Lys Asp Ile Cys Lys Leu Phe Asn Met
260 265 270
Asp Pro Glu Ala Asn Ile Lys Phe Val Asp Asn Arg Pro Phe Asn Asp
275 280 285
Gln Arg Tyr Phe Leu Asp Asp Gln Lys Leu Lys Lys Leu Gly Trp Ser
290 295 300
Glu Arg Thr Thr Trp Glu Glu Gly Leu Lys Lys Thr Met Asp Trp Tyr
305 310 315 320
Thr Gln Asn Pro Glu Trp Trp Gly Asp Val Ser Gly Ala Leu Leu Pro
325 330 335
His Pro Arg Met Leu Met Met Pro Gly Gly Arg His Phe Asp Gly Ser
340 345 350
Glu Asp Asn Ser Leu Ala Ala Thr Leu Ser Glu Lys Pro Ser Gln Thr
355 360 365
His Met Val Val Pro Ser Gln Arg Ser Asn Gly Thr Pro Gln Lys Pro
370 375 380
Ser Leu Lys Phe Leu Ile Tyr Gly Lys Thr Gly Trp Ile Gly Gly Leu
385 390 395 400
Leu Gly Lys Ile Cys Asp Lys Gln Gly Ile Ala Tyr Glu Tyr Gly Lys
405 410 415
Gly Arg Leu Glu Asp Arg Ser Ser Leu Leu Gln Asp Ile Gln Ser Val
420 425 430
Lys Pro Thr His Val Phe Asn Ser Ala Gly Val Thr Gly Arg Pro Asn
435 440 445
Val Asp Trp Cys Glu Ser His Lys Thr Glu Thr Ile Arg Ala Asn Val
450 455 460
Ala Gly Thr Leu Thr Leu Ala Asp Val Cys Arg Glu His Gly Leu Leu
465 470 475 480
Met Met Asn Phe Ala Thr Gly Cys Ile Phe Glu Tyr Asp Asp Lys His
485 490 495
Pro Glu Gly Ser Gly Ile Gly Phe Lys Glu Glu Asp Thr Pro Asn Phe
500 505 510
Thr Gly Ser Phe Tyr Ser Lys Thr Lys Ala Met Val Glu Glu Leu Leu
515 520 525
Lys Glu Tyr Asp Asn Val Cys Thr Leu Arg Val Arg Met Pro Ile Ser
530 535 540
Ser Asp Leu Asn Asn Pro Arg Asn Phe Ile Thr Lys Ile Ser Arg Tyr
545 550 555 560
Asn Lys Val Val Asn Ile Pro Asn Ser Met Thr Val Leu Asp Glu Leu
565 570 575
Leu Pro Ile Ser Ile Glu Met Ala Lys Arg Asn Leu Lys Gly Ile Trp
580 585 590
Asn Phe Thr Asn Pro Gly Val Val Ser His Asn Glu Ile Leu Glu Met
595 600 605
Tyr Arg Asp Tyr Ile Asn Pro Glu Phe Lys Trp Ala Asn Phe Thr Leu
610 615 620
Glu Glu Gln Ala Lys Val Ile Val Ala Pro Arg Ser Asn Asn Glu Met
625 630 635 640
Asp Ala Ser Lys Leu Lys Lys Glu Phe Pro Glu Leu Leu Ser Ile Lys
645 650 655
Glu Ser Leu Ile Lys Tyr Ala Tyr Gly Pro Asn Lys Lys Thr
660 665 670
<210> 110
<211> 2013
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:109的编码序列
<400> 110
atgtccgctt cttacactcc aaagaacatt ttgatcaccg gtgctgctgg tttcattgct 60
tctcacgtcg ccaacagatt gatcagatct tacccagatt acaagatcgt tgttttggac 120
aagttggatt actgttctaa cttgaagaac ttgaacccat ctaagcactc tccaaacttc 180
aagttcgtca agggtgatat cgcttctgct gacttggtta accacttgtt gatcactgaa 240
ggtattgaca ccatcatgca cttcgctgct caaactcacg tcgacaactc cttcggtaac 300
tctttcgaat tcactaagaa caacatctac ggtactcacg tcttgttgga agcttgtaag 360
gttactggtc aaattagaag attcattcac gtttctactg atgaagttta cggtgaaact 420
gatgaagatg ctttggttgg taaccacgaa gcttctcaat tgttgccaac taacccatac 480
tctgccacta aggctggtgc tgaaatgttg gttatggctt acggtagatc ttacggtttg 540
ccagttatta ccactagagg taacaacgtc tacggtccaa accaattccc agaaaagttg 600
attccaaagt tcattttgtt ggctatgaga ggtcaagttt tgccaattca cggtgatggt 660
tctaacgtca gatcttactt gtactgtgag gacgttgctg aagctttcga agttgttttg 720
cacaagggtg aagttggtca cgtttacaac attggtacta agaaggaaag aagagttaac 780
gatgttgcca aggacatctg taagttgttc aacatggacc cagaagctaa catcaagttc 840
gtcgacaaca gaccattcaa cgatcaaaga tacttcttgg acgatcaaaa gttgaagaag 900
ttgggttggt ctgaaagaac cacttgggaa gaaggtttga agaaaactat ggattggtac 960
actcaaaacc cagaatggtg gggtgatgtt tctggtgctt tgttgccaca cccaagaatg 1020
ttgatgatgc caggtggtag acacttcgat ggttccgaag ataactcttt ggctgctact 1080
ttgtctgaaa agccatctca aacccacatg gttgttccat ctcaaagatc taacggtact 1140
ccacaaaagc catctttgaa gttcttgatc tacggtaaga ccggttggat cggtggtttg 1200
ttgggtaaga tctgtgataa gcaaggtatt gcttacgaat acggtaaggg tagattggaa 1260
gatagatctt ctttgttgca agatattcaa tctgttaagc caacccacgt tttcaactcc 1320
gctggtgtta ctggtagacc aaacgttgac tggtgtgaat ctcacaagac cgaaactatc 1380
agagccaacg ttgctggtac tttgactttg gctgatgtct gtagagaaca cggtttgttg 1440
atgatgaact tcgctactgg ttgtatcttc gaatacgacg acaagcaccc agaaggttct 1500
ggtattggtt tcaaggaaga agatactcca aacttcactg gttctttcta ctctaagacc 1560
aaggccatgg tcgaagaatt gttgaaggaa tacgacaacg tttgtacttt gagagttaga 1620
atgccaatct cctctgattt gaacaaccca agaaacttca tcaccaagat ctccagatac 1680
aacaaggttg ttaacatccc aaactctatg actgttttgg acgaattgtt gccaatctcc 1740
atcgaaatgg ctaagagaaa cttgaagggt atctggaact tcactaaccc aggtgttgtt 1800
tctcacaacg aaatcttgga aatgtacaga gactacatca acccagaatt caagtgggct 1860
aacttcactt tggaagaaca agctaaggtc attgttgctc caagatctaa caacgaaatg 1920
gatgcttcca agttgaagaa ggaattccca gaattgttgt ctatcaagga atctttgatt 1980
aagtacgctt acggtccaaa caagaaaacc taa 2013
<210> 111
<211> 668
<212> PRT
<213> 拟南芥(Arabidopsis thaliana)
<400> 111
Met Ser Asp Asp Thr Thr Tyr Lys Pro Lys Asn Ile Leu Ile Thr Gly
1 5 10 15
Ala Ala Gly Phe Ile Ala Ser His Val Ala Asn Arg Leu Ile Arg Asn
20 25 30
Tyr Pro Asp Tyr Lys Ile Val Val Leu Asp Lys Leu Asp Tyr Cys Ser
35 40 45
Asp Leu Lys Asn Leu Asp Pro Ser Phe Ser Ser Pro Asn Phe Lys Phe
50 55 60
Val Lys Gly Asp Ile Ala Ser Asp Asp Leu Val Asn Tyr Leu Leu Ile
65 70 75 80
Thr Glu Asn Ile Asp Thr Ile Met His Phe Ala Ala Gln Thr His Val
85 90 95
Asp Asn Ser Phe Gly Asn Ser Phe Glu Phe Thr Lys Asn Asn Ile Tyr
100 105 110
Gly Thr His Val Leu Leu Glu Ala Cys Lys Val Thr Gly Gln Ile Arg
115 120 125
Arg Phe Ile His Val Ser Thr Asp Glu Val Tyr Gly Glu Thr Asp Glu
130 135 140
Asp Ala Ala Val Gly Asn His Glu Ala Ser Gln Leu Leu Pro Thr Asn
145 150 155 160
Pro Tyr Ser Ala Thr Lys Ala Gly Ala Glu Met Leu Val Met Ala Tyr
165 170 175
Gly Arg Ser Tyr Gly Leu Pro Val Ile Thr Thr Arg Gly Asn Asn Val
180 185 190
Tyr Gly Pro Asn Gln Phe Pro Glu Lys Met Ile Pro Lys Phe Ile Leu
195 200 205
Leu Ala Met Ser Gly Lys Pro Leu Pro Ile His Gly Asp Gly Ser Asn
210 215 220
Val Arg Ser Tyr Leu Tyr Cys Glu Asp Val Ala Glu Ala Phe Glu Val
225 230 235 240
Val Leu His Lys Gly Glu Ile Gly His Val Tyr Asn Val Gly Thr Lys
245 250 255
Arg Glu Arg Arg Val Ile Asp Val Ala Arg Asp Ile Cys Lys Leu Phe
260 265 270
Gly Lys Asp Pro Glu Ser Ser Ile Gln Phe Val Glu Asn Arg Pro Phe
275 280 285
Asn Asp Gln Arg Tyr Phe Leu Asp Asp Gln Lys Leu Lys Lys Leu Gly
290 295 300
Trp Gln Glu Arg Thr Asn Trp Glu Asp Gly Leu Lys Lys Thr Met Asp
305 310 315 320
Trp Tyr Thr Gln Asn Pro Glu Trp Trp Gly Asp Val Ser Gly Ala Leu
325 330 335
Leu Pro His Pro Arg Met Leu Met Met Pro Gly Gly Arg Leu Ser Asp
340 345 350
Gly Ser Ser Glu Lys Lys Asp Val Ser Ser Asn Thr Val Gln Thr Phe
355 360 365
Thr Val Val Thr Pro Lys Asn Gly Asp Ser Gly Asp Lys Ala Ser Leu
370 375 380
Lys Phe Leu Ile Tyr Gly Lys Thr Gly Trp Leu Gly Gly Leu Leu Gly
385 390 395 400
Lys Leu Cys Glu Lys Gln Gly Ile Thr Tyr Glu Tyr Gly Lys Gly Arg
405 410 415
Leu Glu Asp Arg Ala Ser Leu Val Ala Asp Ile Arg Ser Ile Lys Pro
420 425 430
Thr His Val Phe Asn Ala Ala Gly Leu Thr Gly Arg Pro Asn Val Asp
435 440 445
Trp Cys Glu Ser His Lys Pro Glu Thr Ile Arg Val Asn Val Ala Gly
450 455 460
Thr Leu Thr Leu Ala Asp Val Cys Arg Glu Asn Asp Leu Leu Met Met
465 470 475 480
Asn Phe Ala Thr Gly Cys Ile Phe Glu Tyr Asp Ala Thr His Pro Glu
485 490 495
Gly Ser Gly Ile Gly Phe Lys Glu Glu Asp Lys Pro Asn Phe Phe Gly
500 505 510
Ser Phe Tyr Ser Lys Thr Lys Ala Met Val Glu Glu Leu Leu Arg Glu
515 520 525
Phe Asp Asn Val Cys Thr Leu Arg Val Arg Met Pro Ile Ser Ser Asp
530 535 540
Leu Asn Asn Pro Arg Asn Phe Ile Thr Lys Ile Ser Arg Tyr Asn Lys
545 550 555 560
Val Val Asp Ile Pro Asn Ser Met Thr Val Leu Asp Glu Leu Leu Pro
565 570 575
Ile Ser Ile Glu Met Ala Lys Arg Asn Leu Arg Gly Ile Trp Asn Phe
580 585 590
Thr Asn Pro Gly Val Val Ser His Asn Glu Ile Leu Glu Met Tyr Lys
595 600 605
Asn Tyr Ile Glu Pro Gly Phe Lys Trp Ser Asn Phe Thr Val Glu Glu
610 615 620
Gln Ala Lys Val Ile Val Ala Ala Arg Ser Asn Asn Glu Met Asp Gly
625 630 635 640
Ser Lys Leu Ser Lys Glu Phe Pro Glu Met Leu Ser Ile Lys Glu Ser
645 650 655
Leu Leu Lys Tyr Val Phe Glu Pro Asn Lys Arg Thr
660 665
<210> 112
<211> 2007
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:111的编码序列
<400> 112
atgtccgatg atactactta caagccaaag aacattttga ttactggtgc tgctggtttc 60
attgcttctc acgttgccaa cagattgatc agaaactacc cagattacaa gatcgttgtt 120
ttggacaagt tggattactg ttctgatttg aagaacttgg atccatcttt ctcttctcca 180
aacttcaagt tcgtcaaggg tgatatcgct tctgatgatt tggttaacta cttgttgatc 240
actgaaaaca ttgatactat catgcacttc gctgctcaaa ctcacgttga taactctttc 300
ggtaactctt tcgaattcac caagaacaac atttacggta ctcacgtttt gttggaagcc 360
tgtaaggtta ctggtcaaat cagaagattc atccacgttt ctaccgatga agtctacggt 420
gaaaccgatg aagatgctgc tgttggtaac cacgaagctt ctcaattgtt gccaactaac 480
ccatactctg ctactaaggc tggtgctgaa atgttggtta tggcttacgg tagatcttac 540
ggtttgccag ttattactac tagaggtaac aacgtttacg gtccaaacca attcccagaa 600
aagatgattc caaagttcat cttgttggct atgtctggta agccattgcc aatccacggt 660
gatggttcta acgtcagatc ttacttgtac tgtgaggacg ttgctgaagc tttcgaagtt 720
gttttgcaca agggtgaaat cggtcacgtc tacaacgtcg gtactaagag agaaagaaga 780
gttatcgatg ttgctagaga catctgtaag ttgttcggta aggacccaga atcttctatt 840
caattcgttg aaaacagacc attcaacgat caaagatact tcttggatga tcaaaagttg 900
aagaagttgg gttggcaaga aagaactaac tgggaagatg gtttgaagaa aactatggac 960
tggtacactc aaaacccaga atggtggggt gatgtttctg gtgctttgtt gccacaccca 1020
agaatgttga tgatgccagg tggtagattg tctgatggtt cttctgaaaa gaaggacgtt 1080
tcttctaaca ctgtccaaac tttcactgtt gttactccaa agaacggtga ttctggtgac 1140
aaggcttctt tgaagttctt gatctacggt aagactggtt ggttgggtgg tttgttgggt 1200
aagttgtgtg aaaagcaagg tattacttac gaatacggta agggtagatt ggaagataga 1260
gcttctttgg ttgctgatat tagatctatc aagccaactc acgttttcaa cgctgctggt 1320
ttgactggta gaccaaacgt tgactggtgt gaatctcaca agccagaaac cattagagtt 1380
aacgtcgctg gtactttgac tttggctgat gtttgtagag aaaacgattt gttgatgatg 1440
aacttcgcca ccggttgtat cttcgaatac gacgctactc acccagaagg ttctggtatc 1500
ggtttcaagg aagaagataa gccaaacttc ttcggttctt tctactctaa gaccaaggcc 1560
atggttgaag aattgttgag agaattcgac aacgtttgta ccttgagagt cagaatgcca 1620
atctcctctg acttgaacaa cccaagaaac ttcatcacta agatctctag atacaacaag 1680
gttgttgaca tcccaaactc tatgaccgtt ttggacgaat tgttgccaat ctctatcgaa 1740
atggctaaga gaaacttgag aggtatctgg aacttcacca acccaggtgt tgtttctcac 1800
aacgaaatct tggaaatgta caagaactac atcgaaccag gtttcaagtg gtccaacttc 1860
actgttgaag aacaagctaa ggtcattgtt gctgctagat ctaacaacga aatggatggt 1920
tctaagttgt ctaaggaatt cccagaaatg ttgtccatca aggaatcttt gttgaagtac 1980
gtattcgaac caaacaagag aacctaa 2007
<210> 113
<211> 482
<212> PRT
<213> 甜橙(Citrus sinensis)
<400> 113
Met Ser Lys Asp Thr Ile Val Phe Tyr Thr Ser Pro Gly Arg Gly His
1 5 10 15
Leu Asn Ser Met Val Glu Leu Gly Lys Leu Ile Leu Thr Tyr His Pro
20 25 30
Cys Phe Ser Ile Asp Ile Ile Ile Pro Thr Ala Pro Phe Val Ser Ser
35 40 45
Ala Gly Thr Asp Asp Tyr Ile Ala Ser Val Ser Ala Thr Ala Pro Ser
50 55 60
Val Thr Phe His Gln Leu Pro Pro Pro Val Ser Gly Leu Pro Asp Thr
65 70 75 80
Leu Arg Ser Pro Ala Asp Phe Pro Ala Leu Val Tyr Glu Leu Gly Glu
85 90 95
Leu Asn Asn Pro Asn Leu His Glu Thr Leu Ile Thr Ile Ser Lys Arg
100 105 110
Ser Asn Leu Lys Ala Phe Val Ile Asp Phe Leu Cys Asn Pro Ala Phe
115 120 125
Gln Val Ser Ser Ser Thr Leu Ser Ile Pro Thr Tyr Tyr Tyr Phe Thr
130 135 140
Thr Ala Gly Ser Val Leu Ala Ala Asn Leu Tyr Leu Pro Thr Leu His
145 150 155 160
Lys Asn Thr Thr Lys Ser Phe Arg Glu Leu Gly Ser Ala Leu Leu Asn
165 170 175
Phe Pro Gly Phe Pro Pro Phe Pro Ala Arg Asp Met Ala Leu Pro Met
180 185 190
His Asp Arg Glu Gly Lys Val Tyr Lys Gly Leu Val Asp Thr Gly Ile
195 200 205
Gln Met Ala Lys Ser Ala Gly Val Ile Val Asn Thr Phe Glu Leu Leu
210 215 220
Glu Glu Arg Ala Ile Lys Ala Met Leu Glu Gly Gln Cys Thr Pro Gly
225 230 235 240
Asp Thr Ser Pro Pro Leu Tyr Cys Ile Gly Pro Val Val Gly Arg Gly
245 250 255
Asn Gly Glu Asn Arg Gly Arg Asp Arg His Glu Cys Leu Ser Trp Leu
260 265 270
Asp Ser Lys Pro Ser Arg Ser Val Leu Phe Leu Cys Phe Gly Ser Leu
275 280 285
Gly Ser Phe Ser Cys Lys Gln Leu Lys Glu Met Ala Ile Gly Leu Glu
290 295 300
Arg Ser Gly Val Lys Phe Leu Trp Val Val Arg Ala Pro Ala Pro Asp
305 310 315 320
Ser Val Glu Asn Arg Ser Ser Leu Glu Ser Leu Leu Pro Glu Gly Phe
325 330 335
Leu Asp Arg Thr Lys Asp Arg Gly Leu Val Val Glu Ser Trp Ala Pro
340 345 350
Gln Val Glu Val Leu Asn His Glu Ser Val Gly Gly Phe Val Thr His
355 360 365
Cys Gly Trp Asn Ser Val Leu Glu Gly Val Cys Ala Gly Val Pro Met
370 375 380
Leu Ala Trp Pro Leu Tyr Ala Glu Gln Lys Met Ile Arg Ala Val Val
385 390 395 400
Val Glu Glu Met Lys Val Gly Leu Ala Val Thr Arg Ser Glu Glu Gly
405 410 415
Asp Gly Leu Val Ser Ser Ala Glu Leu Glu Gln Arg Val Ser Glu Leu
420 425 430
Met Asp Ser Glu Lys Gly Arg Ala Val Lys Glu Arg Ala Val Ala Met
435 440 445
Lys Glu Ala Ala Ala Ala Ala Met Arg Asp Gly Gly Ser Ser Arg Val
450 455 460
Ala Leu Asp Asn Leu Val Glu Ser Phe Lys Arg Gly Cys Ile Ala Pro
465 470 475 480
Phe Gly
<210> 114
<211> 1449
<212> DNA
<213> 人工序列
<220>
<223> SEQ ID NO:113的编码序列
<400> 114
atgtccaagg atactattgt tttctacact tctccaggta gaggtcactt gaactccatg 60
gttgaattgg gtaagttgat cttgacttac cacccatgtt tctccattga catcatcatc 120
ccaaccgccc cattcgtttc ttctgccggt accgatgatt acatcgcctc cgtttccgcc 180
actgctccat ccgttacctt ccaccaattg ccaccaccag ttagtggttt gccagacact 240
ctcagatctc cagctgactt cccagccttg gtttacgaat tgggtgaatt gaacaaccca 300
aacttgcacg aaaccttgat cactatttcc aagagatcta acttgaaggc cttcgttatc 360
gatttcttgt gtaacccagc tttccaagtt tcctcttcta ctttgtctat cccaacttac 420
tactacttca ccaccgctgg ttctgttttg gctgctaact tgtacttgcc aactttgcac 480
aagaacacca ctaagtcttt cagagaattg ggttctgctt tgttgaactt cccaggtttc 540
ccaccattcc cagctagaga catggctttg ccaatgcacg atagagaagg taaggtttac 600
aagggtttgg tcgacaccgg tatccaaatg gctaagtctg ctggtgtaat tgttaacaca 660
ttcgaattgt tggaggaaag agctatcaag gctatgttgg aaggtcaatg tactccaggt 720
gatacttctc caccattgta ctgtatcggt ccagttgttg gtagaggtaa cggtgaaaac 780
agaggtagag atagacacga atgtttgtct tggttggact ctaagccatc tagatctgtc 840
ttgttcttgt gtttcggttc tttgggttct ttctcttgta agcaattgaa ggaaatggcc 900
attggtttgg aaagatctgg tgttaagttc ttgtgggtcg ttagagctcc agctccagac 960
tctgtcgaaa acagatcttc tttggaatct ttgttgccag aaggtttctt ggatagaact 1020
aaggatagag gtttggttgt tgaatcttgg gctccacaag ttgaagtttt gaaccacgaa 1080
tctgttggcg gcttcgttac tcactgcggt tggaactctg ttttggaagg tgtttgtgcc 1140
ggtgttccaa tgttggcttg gccattgtac gccgaacaaa agatgattag agctgtcgtt 1200
gttgaagaaa tgaaggttgg tttggctgtt actagatctg aagaaggtga cggtttggtt 1260
tcttctgccg aattggaaca aagagtttct gaattgatgg actctgaaaa gggtagagct 1320
gttaaggaaa gagctgttgc tatgaaggaa gctgctgctg ctgctatgag agatggtggt 1380
tcttctagag ttgcgctcga caacttggtt gaaagcttta agagaggttg catcgctcca 1440
ttcggttaa 1449
<210> 115
<211> 477
<212> PRT
<213> 克莱门柚(Citrus clementina)
<400> 115
Met Ser Glu Lys Gln Asp His Val His Val Ala Ile Leu Pro Leu Pro
1 5 10 15
Ala Val Gly His Val Asn Ser Met Leu Asn Leu Ala Glu Leu Leu Gly
20 25 30
His Ala Gly Ile Lys Ile Thr Phe Leu Asn Thr Glu His Tyr Tyr Asp
35 40 45
Arg Val Ile Arg His Ser Ser Asp Ala Phe Ser Arg Tyr Met Gln Ile
50 55 60
Pro Gly Phe Gln Phe Lys Thr Leu Thr Asp Gly Leu Pro Arg Asp His
65 70 75 80
Pro Arg Thr Pro Asp Lys Phe Pro Glu Leu Val Asp Ser Leu Asn Cys
85 90 95
Ala Thr Pro Pro Leu Leu Lys Glu Met Val Ser Asp Ser Lys Ser Pro
100 105 110
Val Asn Cys Ile Ile Thr Asp Gly Tyr Met Ser Arg Ala Ile Asp Ala
115 120 125
Ala Arg Glu Val Gly Val Ser Ile Ile Tyr Phe Arg Thr Ile Ser Ala
130 135 140
Cys Ala Phe Trp Ser Phe His Cys Ile Pro Asp Ile Ile Asp Ala Gly
145 150 155 160
Glu Leu Pro Ile Lys Gly Thr Glu Asp Met Asp Arg Leu Ile Thr Thr
165 170 175
Val Pro Gly Met Glu Gly Phe Leu Arg Cys Arg Asp Leu Pro Ser Phe
180 185 190
Cys Arg Val Asn Asp Pro Met Asp Pro His Leu Leu Leu Phe Ala Arg
195 200 205
Glu Thr Arg Leu Ser Ala His Ala Asp Gly Leu Ile Leu Asn Thr Phe
210 215 220
Glu Asp Leu Glu Gly Pro Ile Leu Ser Gln Ile Arg Asn His Ser Cys
225 230 235 240
Pro Asn Ile Tyr Ser Ile Gly Pro Leu Asn Ala His Leu Lys Val Arg
245 250 255
Ile Pro Glu Lys Thr Tyr Ser Ser Ser Ser Leu Trp Lys Ile Asp Arg
260 265 270
Ser Cys Met Ala Trp Leu Asp Lys Gln Pro Lys Gln Ser Val Ile Tyr
275 280 285
Val Ser Phe Gly Ser Ile Ala Val Met Ser Arg Asp Gln Leu Ile Glu
290 295 300
Phe Tyr Tyr Gly Leu Val His Ser Lys Lys Asn Phe Leu Trp Val Ile
305 310 315 320
Arg Pro Asp Leu Ile Ser Gly Lys Asp Gly Glu Asn Gln Ile Pro Glu
325 330 335
Glu Leu Leu Glu Ala Thr Lys Glu Arg Gly Cys Ile Ala Gly Trp Val
340 345 350
Pro Gln Glu Glu Val Leu Ala His Ser Ala Val Gly Gly Phe Leu Thr
355 360 365
His Cys Gly Trp Asn Ser Thr Leu Glu Ser Ile Val Ala Gly Met Pro
370 375 380
Met Ile Cys Trp Pro Ser Phe Ala Asp Gln Gln Ile Asn Ser Arg Phe
385 390 395 400
Val Gly Glu Val Trp Lys Leu Gly Leu Asp Ile Lys Asp Leu Cys Asp
405 410 415
Arg Asn Ile Val Glu Lys Thr Val Asn Asp Leu Met Val Glu Arg Lys
420 425 430
Glu Glu Phe Met Glu Ser Ala Asp Arg Met Ala Asn Leu Ala Lys Lys
435 440 445
Ser Val Asn Lys Gly Gly Ser Ser Tyr Cys Asn Leu Asp Arg Leu Val
450 455 460
Asn Asp Ile Lys Met Met Ser Ser Gln Pro Gln Asn Cys
465 470 475
<210> 116
<211> 1434
<212> DNA
<213> 人工序列
<220>
<223> SEQ ID NO:115的编码序列
<400> 116
atgtccgaaa agcaagatca cgttcacgtt gctatcttgc cattgccagc cgttggtcac 60
gtcaactcca tgttgaactt ggctgaattg ttgggtcacg ccggtatcaa gattactttc 120
ttgaacaccg aacactacta cgatagagtc atcagacact cttctgatgc cttctctaga 180
tacatgcaaa ttccaggttt ccaattcaag accttgactg atggtttgcc aagagatcac 240
ccaagaactc cagataagtt cccagaattg gttgattctt tgaactgtgc cactccacca 300
ttgttgaagg aaatggtatc tgattctaag tctccagtta actgtattat cactgatggt 360
tacatgtcta gagctattga cgctgccaga gaagttggtg tttccattat ttacttcaga 420
actatttctg cttgtgcttt ctggtctttc cactgtatcc cagatatcat tgatgctggt 480
gaattgccaa tcaagggtac tgaagatatg gatagattga tcaccactgt tccaggtatg 540
gaaggtttct tgagatgtag agatttgcca tctttctgta gagttaacga cccaatggat 600
ccacacttgt tgttgttcgc tagagaaacc agattgagtg ctcatgctga cggcttgatc 660
ttgaacactt tcgaagattt ggaaggtcca atcttgtccc aaatcagaaa ccactcttgt 720
ccaaacatct actctattgg tccattgaac gctcacttga aggttagaat cccagaaaag 780
acttactcct cttcttcttt gtggaagatt gacagatctt gtatggcttg gttggacaag 840
caaccaaagc aatctgttat ctacgtatct ttcggttcta ttgctgttat gtctagagat 900
caattgatcg aattctacta cggtttggtt cactctaaga agaacttctt gtgggtcatc 960
agaccagact tgatttctgg taaggatggt gaaaaccaaa ttccagaaga attgttggaa 1020
gctaccaagg aaagaggttg tattgctggt tgggttccac aagaagaagt tttggcccac 1080
tctgctgttg gtggtttctt gacccactgt ggttggaact ctaccttgga atctatcgtt 1140
gctggtatgc caatgatttg ctggccaagc ttcgctgatc aacagatcaa ctctagattc 1200
gttggtgaag tttggaagtt gggtttggat atcaaggatt tgtgtgatag aaacattgtt 1260
gaaaagactg ttaacgattt gatggttgaa agaaaggaag aattcatgga atctgctgat 1320
agaatggcta acttggctaa gaagtctgtt aacaagggtg gttcctctta ctgtaacttg 1380
gacagattgg ttaacgatat caagatgatg tcctctcaac cacaaaactg ttaa 1434
<210> 117
<211> 354
<212> PRT
<213> 克莱门柚(Citrus clementina)
<400> 117
Met Ser Gly Ser Ile Val Asp Gly Glu Arg Asp Gln Ser Phe Ala Tyr
1 5 10 15
Ala Asn Gln Leu Ala Met Gly Thr Val Leu Pro Met Ala Met Gln Ala
20 25 30
Val Tyr Glu Leu Gly Ile Phe Gln Ile Ile Asp Lys Ala Gly Pro Gly
35 40 45
Ala Lys Leu Ser Ala Ser Asp Ile Ala Ala Gln Leu Pro Thr Lys Asn
50 55 60
Lys Asp Ala Pro Thr Met Leu Asp Arg Ile Leu Arg Leu Leu Ala Ser
65 70 75 80
Tyr Ser Val Val Glu Cys Ser Leu Asp Gly Ser Gly Ala Arg Arg Arg
85 90 95
Tyr Ser Leu Asn Ser Val Ser Lys Tyr Tyr Val Pro Asn Lys Asp Gly
100 105 110
Val Ser Leu Gly Pro Ala Leu Gln Met Ile Gln Asp Lys Val Phe Leu
115 120 125
Glu Ser Trp Ser His Leu Lys Asp Ala Ile Leu Glu Gly Gly Ile Pro
130 135 140
Phe Asn Arg Ala His Gly Met His Ala Phe Glu Tyr Gly Arg Val Asp
145 150 155 160
Pro Arg Phe Asn Lys His Phe Asn Thr Ala Met Tyr Asn His Thr Ser
165 170 175
Leu Ile Met Ser Asn Ile Leu Glu Ser Tyr Lys Gly Phe Ala Asn Ile
180 185 190
Lys Gln Leu Val Asp Val Gly Gly Asn Leu Gly Val Thr Leu Gln Ala
195 200 205
Ile Thr Ser Lys Tyr Pro Tyr Ile Lys Gly Ile Asn Phe Asp Gln Pro
210 215 220
His Val Ile Glu His Ala Pro Leu His Pro His Ile Glu His Val Ala
225 230 235 240
Gly Asp Met Phe Gln Ser Val Pro Lys Gly Asp Ala Ile Phe Leu Lys
245 250 255
Trp Ile Leu His Asp Trp Asp Asp Glu His Cys Leu Lys Leu Leu Lys
260 265 270
Asn Cys Tyr Lys Ser Val Pro Glu Asp Gly Lys Val Ile Val Val Glu
275 280 285
Leu Met Leu Pro Glu Val Pro Asn Thr Ser Ile Glu Ser Lys Ser Asn
290 295 300
Ser His Ile Asp Val Leu Met Met Thr Gln Asn Pro Gly Gly Lys Glu
305 310 315 320
Arg Thr Lys His Glu Phe Met Thr Leu Ala Thr Gly Ala Gly Phe Ser
325 330 335
Gly Ile Arg Phe Asp Leu Val Thr Gly Asn Phe Trp Val Met Glu Phe
340 345 350
Tyr Lys
<210> 118
<211> 1065
<212> DNA
<213> 人工序列
<220>
<223> SEQ ID NO:117的编码序列
<400> 118
atgtccggtt ctatcgttga tggtgaaaga gatcaatctt tcgcttacgc taaccaattg 60
gctatgggta ctgttttgcc aatggccatg caagctgttt acgaattggg tattttccaa 120
atcatcgaca aggctggtcc aggtgctaag ttgtctgctt ctgatattgc tgcccaattg 180
ccaaccaaga acaaggacgc tccaactatg ctcgacagaa tactaagatt gttggcttct 240
tactctgttg ttgaatgttc tttggatggt tctggtgcca gaagaagata ctctttgaac 300
tctgtctcca agtactacgt tccaaacaag gatggtgtct ctttgggtcc agctttgcaa 360
atgattcaag acaaggtttt cttggaatct tggtcccact tgaaggatgc tattttggaa 420
ggtggtattc cattcaacag agcccacggt atgcacgctt tcgaatacgg tagagttgac 480
ccaagattca acaagcactt caacactgct atgtacaacc acacctcttt gattatgtct 540
aacattttgg aatcttacaa gggtttcgcc aacatcaagc aattggtcga tgttggtggt 600
aacttgggcg taactctcca agccatcact tccaagtacc catacattaa gggtatcaac 660
ttcgaccaac cacacgttat tgaacacgcc ccattgcacc cacacattga acacgttgct 720
ggtgatatgt tccaatctgt tccaaagggt gacgccattt tcttgaagtg gatcttgcac 780
gattgggacg atgaacactg tttgaagttg ttgaagaact gttacaagtc tgttccagaa 840
gatggtaagg ttatcgttgt tgaattgatg ttgccagaag ttccaaacac ttctattgaa 900
tctaagtcta actcccacat tgacgttttg atgatgactc aaaacccagg tggtaaggaa 960
agaactaagc acgaattcat gaccttggct actggtgctg gtttctctgg tatcagattc 1020
gatttggtta ctggtaactt ctgggttatg gaattctaca agtaa 1065
<210> 119
<211> 250
<212> PRT
<213> 甜橙(Citrus sinensis)
<400> 119
Met Ser Ala Ala Asn Arg Glu Asp Gln Glu Glu Asn Lys Asp Arg Tyr
1 5 10 15
Phe Lys Ala Val His Gly Asn Lys Thr Leu Leu Gln Ser Glu Lys Leu
20 25 30
Tyr Glu Tyr Ile Leu Glu Thr Ser Val Tyr Pro Arg Glu Pro Gln Cys
35 40 45
Leu Lys Glu Ile Arg Glu Leu Thr Tyr Lys His Pro Leu Ser Pro Met
50 55 60
Met Thr Ser Pro Asp Glu Ala Gln Phe Phe Ser Met Leu Leu Lys Leu
65 70 75 80
Ile Asn Ala Lys Asn Thr Met Glu Ile Gly Val Phe Thr Gly Tyr Ser
85 90 95
Leu Leu Ala Thr Ala Leu Ala Ile Pro Asp Asp Gly Lys Ile Leu Ala
100 105 110
Leu Asp Ile Thr Lys Glu His Tyr Glu Lys Gly Leu Pro Ile Ile Gln
115 120 125
Lys Ala Gly Val Ala His Lys Ile Asp Phe Arg Glu Gly Pro Ala Leu
130 135 140
Pro Leu Leu Asp Gln Leu Ile Gln His Glu Lys Tyr His Gly Thr Phe
145 150 155 160
Asp Phe Val Phe Val Asp Ala Asp Lys Asp Asn Tyr Val Asn Tyr His
165 170 175
Lys Arg Leu Ile Glu Leu Val Lys Val Gly Gly Val Ile Gly Tyr Asp
180 185 190
Asn Thr Leu Trp Gly Gly Ser Val Val Ala Pro Pro Asp Ala Asp Leu
195 200 205
Asp Glu His Ile Leu Tyr Leu Arg Asp Phe Val Gln Glu Leu Asn Lys
210 215 220
Ala Leu Ala Val Asp Pro Arg Ile Glu Ile Cys Gln Leu Ser Ile Ala
225 230 235 240
Asp Gly Val Thr Leu Cys Arg Arg Ile Gly
245 250
<210> 120
<211> 753
<212> DNA
<213> 人工序列
<220>
<223> SEQ ID NO:119的编码序列
<400> 120
atgtccgctg ctaacagaga agatcaagaa gaaaacaagg atagatactt caaggctgtt 60
cacggtaaca agaccttgtt gcaatctgaa aagttgtacg aatacatctt ggaaacctct 120
gtttacccaa gagaaccaca atgtttgaag gaaatcagag aattgactta caagcaccca 180
ttgtctccaa tgatgacttc tccagatgaa gctcaattct tctctatgtt gttgaagttg 240
atcaacgcca agaacaccat ggagataggt gtattcaccg gttactcttt gttggccact 300
gccttggcca ttccagacga tggtaagatt ttggccttgg acatcaccaa ggaacactac 360
gaaaagggtt tgccaatcat tcaaaaggct ggtgttgctc acaagattga cttcagagaa 420
ggtccagctt tgccattatt ggatcaatta atccaacacg aaaagtacca tggcacattc 480
gacttcgtct ttgttgatgc tgacaaggat aactacgtta actaccacaa gagattgatt 540
gaattggtta aggttggtgg tgttattggt tacgacaaca ccttgtgggg tggttctgtt 600
gttgctccac cagatgccga cttggatgaa cacatcttgt acttgagaga tttcgttcaa 660
gaattgaaca aggccttggc cgttgatcca agaatagaaa tttgtcaatt gtccattgct 720
gatggtgtta ctttgtgtag aagaattggt taa 753
<210> 121
<211> 514
<212> PRT
<213> 拟南芥(Arabidopsis thaliana)
<400> 121
Met Ser Ala Thr Leu Phe Leu Thr Ile Leu Leu Ala Thr Val Leu Phe
1 5 10 15
Leu Ile Leu Arg Ile Phe Ser His Arg Arg Asn Arg Ser His Asn Asn
20 25 30
Arg Leu Pro Pro Gly Pro Asn Pro Trp Pro Ile Ile Gly Asn Leu Pro
35 40 45
His Met Gly Thr Lys Pro His Arg Thr Leu Ser Ala Met Val Thr Thr
50 55 60
Tyr Gly Pro Ile Leu His Leu Arg Leu Gly Phe Val Asp Val Val Val
65 70 75 80
Ala Ala Ser Lys Ser Val Ala Glu Gln Phe Leu Lys Ile His Asp Ala
85 90 95
Asn Phe Ala Ser Arg Pro Pro Asn Ser Gly Ala Lys His Met Ala Tyr
100 105 110
Asn Tyr Gln Asp Leu Val Phe Ala Pro Tyr Gly His Arg Trp Arg Leu
115 120 125
Leu Arg Lys Ile Ser Ser Val His Leu Phe Ser Ala Lys Ala Leu Glu
130 135 140
Asp Phe Lys His Val Arg Gln Glu Glu Val Gly Thr Leu Thr Arg Glu
145 150 155 160
Leu Val Arg Val Gly Thr Lys Pro Val Asn Leu Gly Gln Leu Val Asn
165 170 175
Met Cys Val Val Asn Ala Leu Gly Arg Glu Met Ile Gly Arg Arg Leu
180 185 190
Phe Gly Ala Asp Ala Asp His Lys Ala Asp Glu Phe Arg Ser Met Val
195 200 205
Thr Glu Met Met Ala Leu Ala Gly Val Phe Asn Ile Gly Asp Phe Val
210 215 220
Pro Ser Leu Asp Trp Leu Asp Leu Gln Gly Val Ala Gly Lys Met Lys
225 230 235 240
Arg Leu His Lys Arg Phe Asp Ala Phe Leu Ser Ser Ile Leu Lys Glu
245 250 255
His Glu Met Asn Gly Gln Asp Gln Lys His Thr Asp Met Leu Ser Thr
260 265 270
Leu Ile Ser Leu Lys Gly Thr Asp Leu Asp Gly Asp Gly Gly Ser Leu
275 280 285
Thr Asp Thr Glu Ile Lys Ala Leu Leu Leu Asn Met Phe Thr Ala Gly
290 295 300
Thr Asp Thr Ser Ala Ser Thr Val Asp Trp Ala Ile Ala Glu Leu Ile
305 310 315 320
Arg His Pro Asp Ile Met Val Lys Ala Gln Glu Glu Leu Asp Ile Val
325 330 335
Val Gly Arg Asp Arg Pro Val Asn Glu Ser Asp Ile Ala Gln Leu Pro
340 345 350
Tyr Leu Gln Ala Val Ile Lys Glu Asn Phe Arg Leu His Pro Pro Thr
355 360 365
Pro Leu Ser Leu Pro His Ile Ala Ser Glu Ser Cys Glu Ile Asn Gly
370 375 380
Tyr His Ile Pro Lys Gly Ser Thr Leu Leu Thr Asn Ile Trp Ala Ile
385 390 395 400
Ala Arg Asp Pro Asp Gln Trp Ser Asp Pro Leu Ala Phe Lys Pro Glu
405 410 415
Arg Phe Leu Pro Gly Gly Glu Lys Ser Gly Val Asp Val Lys Gly Ser
420 425 430
Asp Phe Glu Leu Ile Pro Phe Gly Ala Gly Arg Arg Ile Cys Ala Gly
435 440 445
Leu Ser Leu Gly Leu Arg Thr Ile Gln Phe Leu Thr Ala Thr Leu Val
450 455 460
Gln Gly Phe Asp Trp Glu Leu Ala Gly Gly Val Thr Pro Glu Lys Leu
465 470 475 480
Asn Met Glu Glu Ser Tyr Gly Leu Thr Leu Gln Arg Ala Val Pro Leu
485 490 495
Val Val His Pro Lys Pro Arg Leu Ala Pro Asn Val Tyr Gly Leu Gly
500 505 510
Ser Gly
<210> 122
<211> 1545
<212> DNA
<213> 人工序列
<220>
<223> SEQ ID NO:121的编码序列
<400> 122
atgtccgcta ctttgttctt gactatcttg ttggctactg ttttgttctt gatcttgaga 60
atcttctctc acagaagaaa cagatctcac aacaacagat tgccaccagg tccaaaccca 120
tggccaatca tcggtaactt gccacacatg ggtactaagc cacacagaac tttgtctgct 180
atggttacta cttacggtcc aatcttgcac ttgagattgg gtttcgttga cgttgttgtt 240
gctgcttcta agtctgttgc tgaacaattc ttgaagatcc acgacgctaa cttcgcttct 300
agaccaccaa actctggtgc taagcacatg gcttacaact accaagactt ggttttcgct 360
ccatacggtc acagatggag attgttgaga aagatctctt ctgttcactt gttctctgct 420
aaggctttgg aagatttcaa gcacgttaga caagaagaag ttggtacttt gactagagaa 480
ttggttagag ttggtactaa gccagttaac ttgggtcaat tggttaacat gtgtgttgtt 540
aacgctttgg gtagagaaat gatcggtaga agattgttcg gtgctgacgc tgaccacaag 600
gctgacgaat tcagatctat ggttactgaa atgatggctt tggctggtgt tttcaacatc 660
ggtgacttcg ttccatcttt ggactggttg gacttgcaag gtgttgctgg taagatgaag 720
agattgcaca agagattcga cgctttcttg tcatctatct tgaaggaaca cgaaatgaac 780
ggtcaagacc aaaagcacac tgacatgttg tctactttga tctctttgaa gggtactgac 840
ttggacggtg acggtggttc tttgactgac actgaaatca aggctttgtt gttgaacatg 900
ttcactgctg gtactgacac ttctgcttct actgttgact gggctatcgc tgaattgatc 960
agacacccag acatcatggt taaggctcaa gaagaattgg acatcgttgt tggtagagac 1020
agaccagtta acgaatctga catcgctcaa ttgccatact tgcaagctgt tatcaaggaa 1080
aacttcagat tgcacccacc aactccattg tctttgccac acatcgcttc tgaatcttgt 1140
gaaatcaacg gttaccacat cccaaagggt tctactttgt tgactaacat ctgggctatc 1200
gctagggacc cagaccaatg gtctgaccca ttggctttca agccagaaag attcttgcca 1260
ggtggtgaaa agtctggtgt tgacgttaag ggttctgact tcgaattgat cccattcggt 1320
gctggtagaa gaatctgtgc tggtttgtct ttgggtttga gaactatcca attcttgact 1380
gctactttgg ttcaaggttt cgactgggaa ttggctggtg gtgttactcc agaaaagttg 1440
aacatggaag aatcttacgg tttgactttg caaagagctg ttccattggt tgttcaccca 1500
aagccaagat tggctccaaa cgtttacggt ttgggttctg gttaa 1545
<210> 123
<211> 571
<212> PRT
<213> 拟南芥(Arabidopsis thaliana)
<400> 123
Met Ser Val Leu Gln Gln Gln Thr His Phe Leu Thr Lys Lys Ile Asp
1 5 10 15
Gln Glu Asp Glu Glu Glu Glu Pro Ser His Asp Phe Ile Phe Arg Ser
20 25 30
Lys Leu Pro Asp Ile Phe Ile Pro Asn His Leu Pro Leu Thr Asp Tyr
35 40 45
Val Phe Gln Arg Phe Ser Gly Asp Gly Asp Gly Asp Ser Ser Thr Thr
50 55 60
Cys Ile Ile Asp Gly Ala Thr Gly Arg Ile Leu Thr Tyr Ala Asp Val
65 70 75 80
Gln Ile Asn Met Arg Arg Ile Ala Thr Gly Ile His Arg Leu Gly Ile
85 90 95
Arg His Gly Asp Val Val Met Leu Leu Leu Pro Asn Ser Pro Glu Phe
100 105 110
Ala Leu Ser Phe Leu Ala Val Ala Tyr Leu Gly Ala Val Ser Thr Thr
115 120 125
Ala Asn Pro Phe Tyr Thr Gln Pro Glu Ile Ala Lys Gln Ala Lys Ala
130 135 140
Ser Ala Ala Lys Met Ile Ile Thr Lys Lys Cys Leu Val Asp Lys Leu
145 150 155 160
Thr Asn Leu Lys Asn Asp Gly Val Leu Ile Val Cys Leu Asp Asp Asp
165 170 175
Gly Asp Asn Gly Val Val Ser Ser Ser Asp Asp Gly Cys Val Ser Phe
180 185 190
Thr Glu Leu Thr Gln Ala Asp Glu Thr Glu Leu Leu Lys Pro Lys Ile
195 200 205
Ser Pro Glu Asp Thr Val Ala Met Pro Tyr Ser Ser Gly Thr Thr Gly
210 215 220
Leu Pro Lys Gly Val Met Ile Thr His Lys Gly Leu Val Thr Ser Ile
225 230 235 240
Ala Gln Lys Val Asp Gly Glu Asn Pro Asn Leu Asn Phe Thr Ala Asn
245 250 255
Asp Val Ile Leu Cys Phe Leu Pro Met Phe His Ile Tyr Ala Leu Asp
260 265 270
Ala Leu Met Leu Ser Ala Met Arg Thr Gly Ala Ala Leu Leu Ile Val
275 280 285
Pro Arg Phe Glu Leu Asn Leu Val Met Glu Leu Ile Gln Arg Tyr Lys
290 295 300
Val Thr Val Val Pro Val Ala Pro Pro Val Val Leu Ala Phe Ile Lys
305 310 315 320
Ser Pro Glu Thr Glu Arg Tyr Asp Leu Ser Ser Val Arg Ile Met Leu
325 330 335
Ser Gly Ala Ala Thr Leu Lys Lys Glu Leu Glu Asp Ala Val Arg Leu
340 345 350
Lys Phe Pro Asn Ala Ile Phe Gly Gln Gly Tyr Gly Met Thr Glu Ser
355 360 365
Gly Thr Val Ala Lys Ser Leu Ala Phe Ala Lys Asn Pro Phe Lys Thr
370 375 380
Lys Ser Gly Ala Cys Gly Thr Val Ile Arg Asn Ala Glu Met Lys Val
385 390 395 400
Val Asp Thr Glu Thr Gly Ile Ser Leu Pro Arg Asn Lys Ser Gly Glu
405 410 415
Ile Cys Val Arg Gly His Gln Leu Met Lys Gly Tyr Leu Asn Asp Pro
420 425 430
Glu Ala Thr Ala Arg Thr Ile Asp Lys Asp Gly Trp Leu His Thr Gly
435 440 445
Asp Ile Gly Phe Val Asp Asp Asp Asp Glu Ile Phe Ile Val Asp Arg
450 455 460
Leu Lys Glu Leu Ile Lys Phe Lys Gly Tyr Gln Val Ala Pro Ala Glu
465 470 475 480
Leu Glu Ala Leu Leu Ile Ser His Pro Ser Ile Asp Asp Ala Ala Val
485 490 495
Val Ala Met Lys Asp Glu Val Ala Asp Glu Val Pro Val Ala Phe Val
500 505 510
Ala Arg Ser Gln Gly Ser Gln Leu Thr Glu Asp Asp Val Lys Ser Tyr
515 520 525
Val Asn Lys Gln Val Val His Tyr Lys Arg Ile Lys Met Val Phe Phe
530 535 540
Ile Glu Val Ile Pro Lys Ala Val Ser Gly Lys Ile Leu Arg Lys Asp
545 550 555 560
Leu Arg Ala Lys Leu Glu Thr Met Cys Ser Lys
565 570
<210> 124
<211> 1716
<212> DNA
<213> 人工序列
<220>
<223> SEQ ID NO:123的编码序列
<400> 124
atgtccgttt tgcaacaaca aactcacttc ttgactaaga agatcgatca agaagatgaa 60
gaagaagaac catctcacga tttcattttc agatctaagt tgccagatat cttcatccca 120
aaccacttgc cattgaccga ttacgtattc caaagattct ccggtgatgg tgacggtgat 180
tcctctacta cctgtatcat cgacggtgcc actggccgta tcctcaccta cgccgatgtt 240
caaatcaaca tgagaagaat cgctaccggt atccacagat tgggtatcag acacggtgac 300
gtcgttatgt tgttgttgcc aaactctcca gaattcgctt tgtctttctt ggccgttgct 360
tacttgggtg ccgtttccac taccgctaac ccattctaca ctcaaccaga aatcgctaag 420
caagctaagg cctccgccgc taagatgatc atcactaaga aatgcctggt cgataagttg 480
actaacttga agaacgacgg tgttttgatc gtttgtttgg acgatgacgg tgacaatggc 540
gttgtgagct cttctgatga tggttgtgtt tctttcactg aattgactca agctgacgaa 600
actgaattgt tgaagccaaa gatctctcca gaagatactg ttgctatgcc atactcttcc 660
ggcactactg gtttaccaaa gggtgttatg attactcaca agggtttggt tacttctatc 720
gctcaaaagg tcgacggtga aaacccaaac ttgaacttca ctgccaacga cgtcatcttg 780
tgtttcttgc caatgttcca catttacgct ttggacgctt tgatgttgtc tgctatgaga 840
accggtgctg ctttgttgat cgttccaaga ttcgaattga acttggttat ggaattgatt 900
caaagataca aggtcactgt tgttccagtt gctccaccag ttgttttggc tttcattaag 960
tccccagaaa ctgaaagata cgacttatct tctgttagaa ttatgttgtc tggtgctgct 1020
actttgaaga aggaattgga agatgccgtt agattgaagt tcccaaacgc cattttcggt 1080
caaggttacg gtatgaccga atccggtact gttgctaagt cgctcgcgtt cgctaagaac 1140
ccattcaaga ccaagtccgg tgcttgtggt actgttatca gaaacgccga aatgaaggtt 1200
gtcgataccg aaaccggtat ctccttgcca agaaacaagt ctggtgaaat ctgtgtcaga 1260
ggtcaccaat tgatgaaggg ttacttgaac gatccagaag ctactgctag aaccatcgac 1320
aaggacggtt ggttgcacac tggtgatatt ggtttcgttg atgatgatga tgaaatcttc 1380
attgttgata gattgaagga attgatcaag ttcaagggtt accaagttgc tccagctgaa 1440
ttggaagctt tgttgatttc tcacccatct atcgatgatg ccgctgttgt tgctatgaag 1500
gatgaagttg ctgatgaagt tccagttgct ttcgttgcta gatctcaagg ttctcaattg 1560
actgaagatg atgtcaagtc ttacgttaac aagcaagttg ttcactacaa gagaattaag 1620
atggttttct tcatcgaagt tatcccaaag gctgtttctg gtaagatttt gagaaaggat 1680
ttgagagcta agttggaaac catgtgttct aagtaa 1716
<210> 125
<211> 561
<212> PRT
<213> 克莱门柚(Citrus clementina)
<400> 125
Met Ser Ile Ser Ile Ala Thr Lys Lys Pro Glu Leu Ser Leu Asp Ile
1 5 10 15
Ser Ser Pro Ala Pro Pro Ala Pro Ser Asn Glu Lys Ile Ala Thr His
20 25 30
Ile Phe Lys Ser Lys Leu Pro Asp Ile Pro Ile Ser Asn His Leu Pro
35 40 45
Leu His Thr Tyr Cys Phe Gln Asp Arg Leu Ser Asp Asp Pro Cys Leu
50 55 60
Ile Val Gly Leu Thr Gly Lys Thr Tyr Ser Tyr Ala Glu Thr His Leu
65 70 75 80
Ile Cys Arg Lys Thr Ala Ala Gly Leu Ser Asn Leu Gly Ile Lys Lys
85 90 95
Gly Asp Val Ile Met Ile Leu Leu Gln Asn Cys Ala Glu Phe Val Phe
100 105 110
Ser Phe Met Gly Ala Ser Met Ile Gly Ala Val Thr Thr Thr Ala Asn
115 120 125
Pro Phe Tyr Thr Ser Ala Glu Ile Leu Lys Gln Phe Arg Thr Ser Gly
130 135 140
Ala Lys Leu Ile Ile Thr Met Ser Gln Tyr Val Asp Arg Leu Pro Lys
145 150 155 160
Thr Asp Lys Asp Phe Thr Val Ile Thr Ile Asp Ala Pro Pro Glu Asn
165 170 175
Cys Leu His Phe Thr Val Leu Ser Glu Ala Asp Glu Asp Gln Ile Pro
180 185 190
Glu Val Ala Ile Glu Pro Asp Asp Pro Val Ala Leu Pro Phe Ser Ser
195 200 205
Gly Thr Thr Gly Leu Pro Lys Gly Val Val Leu Thr His Lys Ser Leu
210 215 220
Ile Thr Ser Val Ala Gln Gln Val Asp Gly Glu Asn Pro Asn Leu Tyr
225 230 235 240
Leu Thr Asn Gly Asp Val Val Leu Cys Val Leu Pro Leu Phe His Ile
245 250 255
Tyr Ser Leu Asn Ser Val Leu Leu Cys Ser Leu Arg Ala Gly Ala Gly
260 265 270
Val Leu Leu Met Gln Lys Phe Glu Ile Gly Ala Leu Leu Glu Leu Ile
275 280 285
Gln Arg His Arg Val Ser Val Ala Ala Val Val Pro Pro Leu Val Leu
290 295 300
Ala Leu Ala Lys Asn Pro Met Val Ala Asp Tyr Asp Leu Ser Ser Ile
305 310 315 320
Arg Val Val Leu Ser Gly Ala Ala Pro Leu Gly Lys Glu Leu Glu Asp
325 330 335
Ala Leu Arg Ser Arg Val Pro Gln Ala Ile Leu Gly Gln Gly Tyr Gly
340 345 350
Met Thr Glu Ala Gly Pro Val Leu Ser Met Cys Leu Gly Phe Ala Lys
355 360 365
Gln Pro Phe Pro Thr Lys Ser Gly Ser Cys Gly Thr Val Val Arg Asn
370 375 380
Ala Glu Leu Lys Val Ile Asp Pro Glu Ile Gly Ala Ser Leu Pro His
385 390 395 400
Asn Gln Pro Gly Glu Ile Cys Ile Arg Gly Pro Gln Ile Met Lys Gly
405 410 415
Tyr Leu Asn Asp Pro Glu Ala Thr Ala Ala Thr Ile Asp Val Glu Gly
420 425 430
Trp Leu His Thr Gly Asp Ile Gly Tyr Val Asp Asp Asp Asp Glu Val
435 440 445
Phe Ile Val Asp Arg Val Lys Glu Ile Ile Lys Phe Lys Gly Phe Gln
450 455 460
Val Pro Pro Ala Glu Ile Glu Ala Leu Leu Leu Ser His Pro Ser Ile
465 470 475 480
Gly Asp Ala Ala Val Val Pro Gln Lys Asp Glu Val Ala Gly Glu Val
485 490 495
Pro Val Ala Phe Val Val Arg Ser Asn Gly Phe Glu Leu Thr Glu Glu
500 505 510
Ala Ile Lys Glu Tyr Ile Ala Lys Gln Val Val Phe Tyr Lys Arg Leu
515 520 525
His Lys Ile Tyr Phe Val His Ala Ile Pro Lys Ser Pro Ser Gly Lys
530 535 540
Ile Leu Arg Lys Asp Leu Arg Ala Lys Leu Ala Ser Ser Met Pro Leu
545 550 555 560
Asn
<210> 126
<211> 1686
<212> DNA
<213> 人工序列
<220>
<223> SEQ ID NO:125的编码序列
<400> 126
atgtccatct ctatcgccac taagaagcca gaattgtctt tggatatctc ttctccagct 60
ccaccagctc catccaacga aaagatcgcc acccacattt tcaagtctaa gttgccagat 120
atcccaatct ccaaccactt gccattgcac acttactgtt tccaagatag attgtctgac 180
gacccatgtt tgatcgttgg tttgactggt aagacttact cttacgccga aactcacttg 240
atctgtagaa agaccgctgc cggtttgtct aacttgggta tcaagaaggg tgacgttatc 300
atgatcttgt tgcaaaactg tgccgaattc gttttctctt tcatgggtgc ttccatgatc 360
ggtgctgtca ctactactgc caacccattc tacacttctg ctgaaatctt gaagcaattc 420
agaacctctg gtgccaagtt gattatcact atgtctcaat acgtcgacag attgccaaag 480
actgacaagg atttcactgt tatcactatc gatgccccac cagaaaactg tttgcacttc 540
actgttttgt ctgaagctga tgaagatcaa atcccagaag ttgccatcga accagacgat 600
ccagttgctt tgccattctc ttctggtacc actggtttgc caaagggtgt tgttttgact 660
cataagagct tgatcacctc tgttgctcaa caagttgacg gtgaaaaccc aaacttgtac 720
ttgactaacg gtgacgttgt tttgtgtgtt ttgccattgt tccacattta ctctttgaac 780
tctgttttgt tgtgttcttt gagagctggt gctggtgttt tgttgatgca aaagttcgaa 840
atcggtgctt tgttggaatt gatccaaaga cacagagttt ctgttgctgc tgttgttcca 900
ccattggttt tggctttggc caagaaccca atggttgctg attacgactt gtcatctatc 960
agagttgttt tgtccggtgc tgctccattg ggtaaggaat tggaagatgc tttgagatct 1020
agagtcccac aagctatctt gggtcaaggt tacggtatga ctgaagctgg tccagttttg 1080
tctatgtgtt tgggtttcgc taagcaacca ttcccaacta agtctggttc ttgtggtacc 1140
gttgttagaa acgctgaatt gaaggttatt gacccagaaa ttggtgcctc cttgccacac 1200
aaccaaccag gtgaaatttg tatcagaggt ccacaaatta tgaagggtta cttgaacgat 1260
ccagaagcta ctgctgctac tatcgacgtt gaaggttggt tgcacactgg tgacatcggt 1320
tacgttgatg atgatgatga agttttcatc gtcgatagag tcaaggaaat catcaagttc 1380
aagggtttcc aagttccacc agctgaaatt gaagccttgt tgttgtctca cccatctatt 1440
ggtgatgctg ctgttgttcc acaaaaggat gaagttgcgg gtgaagttcc agttgcgttc 1500
gttgttcgtt cgaacggctt cgaattgacc gaggaagcca ttaaggaata catcgctaag 1560
caagttgttt tctacaagag attgcacaag atttacttcg ttcacgctat tccaaagtct 1620
ccatccggta agattttgag aaaggatttg agagccaagt tggcctcttc tatgccattg 1680
aactaa 1686
<210> 127
<211> 365
<212> PRT
<213> 圆叶当归(Angelica archangelica)
<400> 127
Met Ser Ala Pro Thr Thr Ile Thr Ala Leu Ala Gln Glu Lys Thr Leu
1 5 10 15
Asn Leu Ala Phe Val Arg Asp Glu Asp Glu Arg Pro Lys Val Ala Tyr
20 25 30
Asn Gln Phe Ser Asn Glu Ile Pro Ile Ile Ser Leu Ala Gly Met Asp
35 40 45
Asp Asp Thr Gly Arg Arg Pro Gln Ile Cys Arg Lys Ile Val Glu Ala
50 55 60
Phe Glu Asp Trp Gly Ile Phe Gln Val Val Asp His Gly Ile Asp Gly
65 70 75 80
Thr Leu Ile Ser Glu Met Thr Arg Leu Ser Arg Glu Phe Phe Ala Leu
85 90 95
Pro Ala Glu Glu Lys Leu Arg Tyr Asp Thr Thr Gly Gly Lys Arg Gly
100 105 110
Gly Phe Thr Ile Ser Thr His Leu Gln Gly Asp Asp Val Lys Asp Trp
115 120 125
Arg Glu Phe Val Thr Tyr Phe Ser Tyr Pro Ile Asp Asp Arg Asp Tyr
130 135 140
Ser Arg Trp Pro Asp Lys Pro Gln Gly Trp Arg Ser Thr Thr Glu Val
145 150 155 160
Tyr Ser Glu Lys Leu Met Val Leu Gly Ala Lys Leu Leu Glu Val Leu
165 170 175
Ser Glu Ala Met Gly Leu Glu Lys Glu Ala Leu Thr Lys Ala Cys Val
180 185 190
Asn Met Glu Gln Lys Val Leu Ile Asn Tyr Tyr Pro Thr Cys Pro Glu
195 200 205
Pro Asp Leu Thr Leu Gly Val Arg Arg His Thr Asp Pro Gly Thr Ile
210 215 220
Thr Ile Leu Leu Gln Asp Met Val Gly Gly Leu Gln Ala Thr Arg Asp
225 230 235 240
Gly Gly Lys Thr Trp Ile Thr Val Gln Pro Val Glu Gly Ala Phe Val
245 250 255
Val Asn Leu Gly Asp His Gly His Tyr Leu Ser Asn Gly Arg Phe Lys
260 265 270
Asn Ala Asp His Gln Ala Val Val Asn Ser Thr Ser Ser Arg Leu Ser
275 280 285
Ile Ala Thr Phe Gln Asn Pro Ala Gln Asn Ala Ile Val Tyr Pro Leu
290 295 300
Arg Ile Arg Glu Gly Glu Lys Ala Val Leu Asp Glu Ala Ile Thr Tyr
305 310 315 320
Ala Glu Met Tyr Lys Lys Asn Met Thr Lys His Ile Glu Val Ala Thr
325 330 335
Leu Lys Lys Leu Ala Lys Glu Lys Arg Leu Gln Glu Glu Lys Ala Lys
340 345 350
Leu Glu Thr Glu Ser Lys Ser Ala Asp Gly Ile Ser Ala
355 360 365
<210> 128
<211> 1098
<212> DNA
<213> 人工序列
<220>
<223> SEQ ID NO:127的编码序列
<400> 128
atgtccgctc caactactat cactgctttg gctcaagaaa agactttgaa cttggctttc 60
gttagagatg aagatgaaag accaaaggtt gcttacaacc aattctctaa cgaaatccca 120
atcatctctt tggctggtat ggacgacgac actggtagga ggccacaaat ctgtagaaag 180
atcgttgaag ctttcgaaga ttggggtatc ttccaagttg ttgaccacgg tatcgacggt 240
actttgatct ctgaaatgac tagattgtct agagaattct tcgctttgcc agctgaagaa 300
aagttgagat acgacactac tggtggtaag agaggtggtt tcactatctc tactcacttg 360
caaggtgacg acgttaagga ctggagagaa ttcgttactt acttctctta cccaatcgac 420
gacagagact actctagatg gccagacaag ccacaaggtt ggagatctac tactgaagtt 480
tactctgaaa agttgatggt tttgggtgct aagttgttgg aagttttgtc tgaagctatg 540
ggtttggaaa aggaagcttt gactaaggct tgtgttaaca tggaacaaaa ggttttgatc 600
aactactacc caacttgtcc agaaccagac ttgactttgg gtgttaggag acacactgac 660
ccaggtacta tcactatctt gttgcaagac atggttggtg gtttgcaagc tactagagat 720
ggtggtaaga cttggatcac tgttcaacca gttgaaggtg ctttcgttgt taacttgggt 780
gaccacggtc actacttgtc taacggtaga ttcaagaacg ctgaccacca agctgttgtt 840
aactctactt cttctagatt gtctatcgct actttccaaa acccagctca aaacgctatc 900
gtttacccat tgagaatcag agaaggtgaa aaggctgttt tggacgaagc tatcacttac 960
gctgaaatgt acaagaagaa catgactaag cacatcgaag ttgctacttt gaagaagttg 1020
gctaaggaaa agagattgca agaagaaaag gctaagttgg aaactgaatc taagtctgct 1080
gacggtatct ctgcttaa 1098
<210> 129
<211> 514
<212> PRT
<213> 朝鲜蓟(Cynara cardunculus var. scolymus)
<400> 129
Met Ser Gln Val His Glu Thr Leu Thr Pro Ala Val Ile Ala Ala Val
1 5 10 15
Val Leu Ser Ser Val Phe Leu Tyr Leu Leu Phe Lys Lys Lys Gln Asn
20 25 30
His Arg Leu Pro Pro Ser Pro Pro Ser Leu Pro Ile Ile Gly His Leu
35 40 45
His His Leu Gly Pro Leu Ile His Gln Ser Phe His His Leu Ser Thr
50 55 60
Arg Tyr Gly Pro Leu Ile His Leu Arg Leu Gly Ser Val Pro Cys Ile
65 70 75 80
Val Ala Ser Thr Pro Asp Leu Ala Arg Asp Phe Leu Lys Thr Asn Glu
85 90 95
Leu Ala Phe Ser Ser Arg Lys His Ser Leu Ala Ile Asp His Ile Thr
100 105 110
Tyr Gly Val Ala Phe Ala Phe Ala Pro Tyr Gly Pro Tyr Trp Lys Phe
115 120 125
Ile Lys Lys Met Ser Thr Val Glu Leu Leu Gly Asn Gln Asn Leu Gly
130 135 140
His Phe Leu Pro Ile Arg Thr His Glu Ile Gln Glu Leu Leu Gln Thr
145 150 155 160
Leu Thr Glu Lys Ala Lys Arg Arg Glu Ser Val Asn Leu Thr Glu Glu
165 170 175
Leu Leu Lys Leu Thr Asn Asn Val Ile Cys Gln Met Met Met Ser Ile
180 185 190
Arg Cys Ser Gly Thr Asn Ser Glu Ala Asp Glu Ala Lys Asn Leu Val
195 200 205
Arg Glu Val Thr Gln Ile Phe Gly Glu Phe Asn Val Ser Asp Phe Ile
210 215 220
Trp Phe Cys Lys Asn Ile Asp Leu Gln Gly Phe Lys Lys Arg Tyr Thr
225 230 235 240
Asp Thr His Lys Arg Tyr Asp Ala Leu Leu Glu Lys Ile Ile Phe Glu
245 250 255
Arg Glu Glu Lys Arg Arg Lys Glu Gly Lys Arg Glu Asp Gly Lys Gly
260 265 270
Lys Asp Phe Leu Asp Met Leu Leu Asp Val Leu Glu Asp Ala Lys Ala
275 280 285
Glu Ile Lys Ile Thr Arg Asp His Ile Lys Ala Leu Ile Leu Asp Phe
290 295 300
Phe Thr Ala Ala Thr Asp Thr Thr Ala Ile Ala Leu Glu Trp Met Leu
305 310 315 320
Val Glu Leu Ile Ser Asn Pro Lys Val Leu Glu Ile Ala Arg Glu Glu
325 330 335
Ile Asp Gln Val Val Gly Asn Glu Arg Leu Val Gln Glu Ser Asp Ala
340 345 350
Pro Asn Leu Pro Tyr Ile Gln Ala Ile Ile Lys Glu Ala Leu Arg Leu
355 360 365
His Pro Pro Ile Pro Met Leu Ile Arg Lys Ser Ile Glu Asp Val Ser
370 375 380
Val Gln Gly Tyr Asp Ile Pro Ala Gly Thr Met Leu Phe Val Asn Ile
385 390 395 400
Trp Ser Ile Gly Arg Asn Pro Lys Tyr Trp Glu Ser Pro Leu Glu Phe
405 410 415
Lys Pro His Arg Phe Leu Glu Asp Asp Pro Val Lys Lys Ser Leu Asp
420 425 430
Ile Lys Gly Gln Ser Phe Gln Leu Leu Pro Phe Gly Thr Gly Arg Arg
435 440 445
Gly Cys Pro Gly Ile Asn Leu Ala Met Arg Glu Leu Pro Val Val Ile
450 455 460
Ala Gly Leu Ile Gln Cys Phe Glu Trp Asn Val Asn Gly Lys Gln Val
465 470 475 480
Leu Asp Met Asp Glu Arg Ala Gly Leu Thr Ala Pro Arg Ala Ala Asp
485 490 495
Phe Val Cys Val Pro Ser Val Arg Glu Asn Ser Pro Met Met Phe Thr
500 505 510
Ser Thr
<210> 130
<211> 1545
<212> DNA
<213> 人工序列
<220>
<223> SEQ ID NO:129的编码序列
<400> 130
atgtcccaag ttcacgaaac tttgactcca gctgttatcg ctgctgttgt tttgtcatct 60
gttttcttgt acttgttgtt caagaagaag caaaaccaca gattgccacc atctccacca 120
tctttgccaa tcatcggtca cttgcaccac ttgggtccat tgatccacca atctttccac 180
cacttgtcta ctagatacgg tccattgatc cacttgagat tgggttctgt tccatgtatc 240
gttgcttcta ctccagactt ggctagagac ttcttgaaaa ctaacgaatt ggctttctct 300
tctagaaagc actctttggc tatcgaccac atcacttacg gtgttgcttt cgctttcgct 360
ccatacggtc catactggaa gttcatcaag aagatgtcta ctgttgaatt gttgggtaac 420
caaaacttgg gtcacttctt gccaatcaga actcacgaaa tccaagaatt gttgcaaact 480
ttgactgaaa aggctaagag aagagaatct gttaacttga ctgaagaatt gttgaagttg 540
actaacaacg ttatctgtca aatgatgatg tctatcagat gttctggtac taactctgaa 600
gctgacgaag ctaagaactt ggttagagaa gttactcaaa tcttcggtga attcaacgtt 660
tctgacttca tctggttctg taagaacatc gacttgcaag gtttcaagaa gagatacact 720
gacactcaca agagatacga cgctttgttg gaaaagatca tcttcgaaag agaagaaaag 780
agaagaaagg aaggtaagag agaagatggt aagggtaagg acttcttgga catgttgttg 840
gacgttttgg aagatgctaa ggctgaaatc aagatcacta gagatcacat caaggctttg 900
atcttggact tcttcactgc tgctactgac actactgcta tcgctttgga atggatgttg 960
gttgaattga tctctaaccc aaaggttttg gaaatcgcta gagaagaaat cgaccaagtt 1020
gttggtaacg aaagattggt tcaagaatct gacgctccaa acttgccata catccaagct 1080
atcatcaagg aagctttgag attgcaccca ccaatcccaa tgttgatcag aaagtctatc 1140
gaagatgttt ctgttcaagg ttacgacatc ccagctggta ctatgttgtt cgttaacatc 1200
tggtctatcg gtagaaaccc aaagtactgg gaatctccat tggaattcaa gccacacaga 1260
ttcttggaag atgacccagt taagaagtct ttggacatca agggtcaatc tttccaattg 1320
ttgccattcg gtactggtag aagaggttgt ccaggtatca acttggctat gagagaattg 1380
ccagttgtta tcgctggttt gatccaatgt ttcgaatgga acgttaacgg taagcaagtt 1440
ttggacatgg acgaaagagc tggtttgact gctccaagag ctgctgactt cgtttgtgtt 1500
ccatctgtta gagaaaactc tccaatgatg ttcacttcta cttaa 1545
<210> 131
<211> 507
<212> PRT
<213> 回回苏(Perilla frutescens var. crispa)
<400> 131
Met Ser Ala Leu Tyr Ala Ala Leu Phe Leu Leu Ser Ala Ala Val Val
1 5 10 15
Arg Ser Val Leu Asp Arg Lys Arg Gly Arg Pro Pro Tyr Pro Pro Gly
20 25 30
Pro Phe Pro Leu Pro Ile Ile Gly His Leu His Leu Leu Gly Pro Arg
35 40 45
Leu His Gln Thr Phe His Asp Leu Ser Gln Arg Tyr Gly Pro Leu Met
50 55 60
Gln Leu Arg Leu Gly Ser Ile Arg Cys Val Ile Ala Ala Ser Pro Glu
65 70 75 80
Leu Ala Lys Glu Cys Leu Lys Thr His Glu Leu Val Phe Ser Ser Arg
85 90 95
Lys His Ser Thr Ala Ile Asp Ile Val Thr Tyr Asp Ser Ser Phe Ala
100 105 110
Phe Ser Pro Tyr Gly Pro Tyr Trp Lys Phe Ile Lys Lys Leu Cys Thr
115 120 125
Tyr Glu Leu Leu Gly Ala Arg Asn Leu Ala His Phe Gln Pro Ile Arg
130 135 140
Thr Leu Glu Val Lys Ser Phe Leu Gln Ile Leu Met Arg Lys Gly Glu
145 150 155 160
Ser Gly Glu Ser Phe Asn Val Thr Glu Glu Leu Val Lys Leu Thr Ser
165 170 175
Asn Val Ile Ser His Met Met Leu Ser Ile Arg Cys Ser Glu Thr Glu
180 185 190
Ser Glu Ala Glu Ala Ala Arg Thr Val Ile Arg Glu Val Thr Gln Ile
195 200 205
Phe Gly Glu Phe Asp Val Ser Asp Ile Ile Trp Leu Cys Lys Asn Phe
210 215 220
Asp Phe Gln Gly Ile Arg Lys Arg Ser Glu Asp Ile Gln Arg Arg Tyr
225 230 235 240
Asp Ala Leu Leu Glu Lys Ile Ile Thr Asp Arg Glu Lys Gln Arg Arg
245 250 255
Thr His Gly Gly Gly Gly Gly Gly Gly Glu Ala Lys Asp Phe Leu Asp
260 265 270
Met Phe Leu Asp Ile Met Glu Ser Gly Lys Ala Glu Val Lys Phe Thr
275 280 285
Arg Glu His Leu Lys Ala Leu Ile Leu Asp Phe Phe Thr Ala Gly Thr
290 295 300
Asp Thr Thr Ala Ile Val Cys Glu Trp Ala Ile Ala Glu Val Ile Asn
305 310 315 320
Asn Pro Asn Val Leu Lys Lys Ala Gln Glu Glu Ile Ala Asn Ile Val
325 330 335
Gly Phe Asp Arg Ile Leu Gln Glu Ser Asp Ala Pro Asn Leu Pro Tyr
340 345 350
Leu Gln Ala Leu Ile Lys Glu Thr Phe Arg Leu His Pro Pro Ile Pro
355 360 365
Met Leu Ala Arg Lys Ser Ile Ser Asp Cys Val Ile Asp Gly Tyr Met
370 375 380
Ile Pro Ala Asn Thr Leu Leu Phe Val Asn Leu Trp Ser Met Gly Arg
385 390 395 400
Asn Pro Lys Ile Trp Asp Tyr Pro Thr Ala Phe Gln Pro Glu Arg Phe
405 410 415
Leu Glu Lys Glu Lys Ala Ala Ile Asp Val Lys Gly Gln His Phe Glu
420 425 430
Leu Leu Pro Phe Gly Thr Gly Arg Arg Gly Cys Pro Gly Met Leu Leu
435 440 445
Ala Ile Gln Glu Val Val Ile Ile Ile Gly Thr Met Ile Gln Cys Phe
450 455 460
Asp Trp Lys Leu Pro Asp Gly Ser Gly His Val Asp Met Ala Glu Arg
465 470 475 480
Pro Gly Leu Thr Ala Pro Arg Glu Thr Asp Leu Phe Cys Arg Val Val
485 490 495
Pro Arg Val Asp Pro Leu Val Val Ser Thr Gln
500 505
<210> 132
<211> 1524
<212> DNA
<213> 人工序列
<220>
<223> SEQ ID NO:131的编码序列
<400> 132
atgtccgctt tgtacgctgc tttgttcttg ttgtctgctg ctgttgttag atctgttttg 60
gacagaaaga gaggtagacc accataccca ccaggtccat tcccattgcc aatcatcggt 120
cacttgcact tgttgggtcc aagattgcac caaactttcc acgacttgtc tcaaagatac 180
ggtccattga tgcaattgag attgggttct atcagatgtg ttatcgctgc ttctccagaa 240
ttggctaagg aatgtttgaa aactcacgaa ttggttttct cttctagaaa gcactctact 300
gctatcgaca tcgttactta cgactcttct ttcgctttct ctccatacgg tccatactgg 360
aagttcatca agaagttgtg tacttacgaa ttgttgggtg ctagaaactt ggctcacttc 420
caaccaatca gaactttgga agttaagtct ttcttgcaaa tcttgatgag aaagggtgaa 480
tctggtgaat ctttcaacgt tactgaagaa ttggttaagt tgacttctaa cgttatctct 540
cacatgatgt tgtctatcag atgttctgaa actgaatctg aagctgaagc tgctagaact 600
gttatcagag aagttactca aatcttcggt gaattcgacg tttctgacat catctggttg 660
tgtaagaact tcgacttcca aggtatcaga aagagatctg aagatatcca aagaagatac 720
gacgctttgt tggaaaagat catcactgac agagaaaagc aaagaagaac tcacggtggt 780
ggtggtggtg gtggtgaagc taaggacttc ttggacatgt tcttggacat catggaatct 840
ggtaaggctg aagttaagtt cactagagaa cacttgaagg ctttgatctt ggacttcttc 900
actgctggta ctgacactac tgctatcgtt tgtgaatggg ctatcgctga agttatcaac 960
aacccaaacg ttttgaagaa ggctcaagaa gaaatcgcta acatcgttgg tttcgacaga 1020
atcttgcaag aatctgacgc tccaaacttg ccatacttgc aagctttgat caaggaaact 1080
ttcagattgc acccaccaat cccaatgttg gctagaaagt ctatctctga ctgtgttatc 1140
gacggttaca tgatcccagc taacactttg ttgttcgtta acttgtggtc tatgggtaga 1200
aacccaaaga tctgggacta cccaactgct ttccaaccag aaagattctt ggaaaaggaa 1260
aaggctgcta tcgacgttaa gggtcaacac ttcgaattgt tgccattcgg tactggtaga 1320
agaggttgtc caggtatgtt gttggctatc caagaagttg ttatcatcat cggtactatg 1380
atccaatgtt tcgactggaa gttgccagac ggttctggtc acgttgacat ggctgaaaga 1440
ccaggtttga ctgctccaag agaaactgac ttgttctgta gagttgttcc aagagttgac 1500
ccattggttg tttctactca ataa 1524
<210> 133
<211> 515
<212> PRT
<213> 大丽花(Dahlia pinnata)
<400> 133
Met Ser Asn Thr Leu Leu Val Leu Gln Met Val Ile Pro Ala Ile Ile
1 5 10 15
Ala Phe Val Ile Phe His Leu Leu Phe Phe Lys Ser Lys Pro Asn Arg
20 25 30
Arg Leu Pro Pro Ser Pro Pro Ser Leu Pro Ile Ile Gly His Leu His
35 40 45
His Leu Gly Pro Leu Ile His Gln Ser Phe Asn Arg Leu Ser Ala Arg
50 55 60
Tyr Gly Pro Leu Ile His Leu Arg Leu Gly Ser Val Ser Cys Val Val
65 70 75 80
Ala Asp Ala Pro Asp Leu Ala Gln Glu Leu Leu Gln Lys Asn Asp Leu
85 90 95
Ala Phe Ala Asn Arg Lys His Thr Leu Ala Ile Asp His Val Thr Tyr
100 105 110
Gly Val Ala Phe Ala Phe Ala Pro Tyr Gly Pro Tyr Trp Arg Phe Ile
115 120 125
Lys Lys Met Ser Thr Val Glu Leu Leu Gly Ile Gln Asn Leu Gly His
130 135 140
Phe Leu Pro Ile Arg Thr Gln Glu Ile His Gly Leu Leu Leu Thr Leu
145 150 155 160
Thr Glu Lys Ser Lys Gln Asn Glu Ser Val Asn Met Thr Asn Glu Leu
165 170 175
Leu Lys Leu Ser Asn Asn Ile Ile Cys Gln Met Met Met Gly Ile Arg
180 185 190
Cys Ser Gly Asn Lys Thr Glu Ala Glu Glu Ala Lys Asn Leu Val Arg
195 200 205
Glu Val Thr Thr Ile Phe Gly Glu Phe Asn Val Ser Asp Phe Ile Trp
210 215 220
Phe Cys Lys Lys Leu Asp Leu Gln Gly Phe Lys Lys Arg Tyr Glu Asp
225 230 235 240
Ile Arg Thr Arg Tyr Asp Ala Leu Leu Glu Arg Ile Ile Phe Ala Arg
245 250 255
Glu Glu Met Arg Lys Glu Gly Lys Gly Met Glu Asp Gly Lys Gly Lys
260 265 270
Asp Phe Leu Asp Met Leu Leu Asp Val Leu Glu Asp Asp Lys Ala Glu
275 280 285
Ile Lys Ile Thr Arg Asn His Ile Lys Ala Leu Ile Leu Asp Phe Val
290 295 300
Thr Ala Gly Thr Asp Thr Thr Ala Val Ile Ile Glu Trp Thr Leu Val
305 310 315 320
Glu Leu Ile Lys Asn Pro Met Val Met Glu Lys Ala Lys Gln Glu Leu
325 330 335
Asp Glu Val Val Gly Asn Thr Arg Leu Val Glu Glu Ser Asp Ala Pro
340 345 350
Lys Leu Pro Tyr Ile Gln Ala Ile Ile Lys Glu Ala Phe Arg Leu His
355 360 365
Pro Pro Ile Pro Met Ile Ile Arg Lys Ser Asn Glu Asn Val Ser Val
370 375 380
Lys Ser Gly Tyr Glu Ile Pro Ala Gly Ser Ile Leu Phe Val Asn Asn
385 390 395 400
Trp Ser Ile Gly Arg Asn Pro Lys Tyr Trp Glu Ser Pro Leu Glu Phe
405 410 415
Lys Pro Asp Arg Phe Leu Lys Glu Gly Val Leu Lys Pro Ser Leu Asp
420 425 430
Ile Arg Gly Gln Asn Phe Gln Ile Leu Pro Phe Gly Thr Gly Arg Arg
435 440 445
Ser Cys Pro Gly Ile Asn Met Ala Met Arg Gln Leu Pro Val Val Val
450 455 460
Ala Ile Leu Ile Gln Cys Phe Glu Trp Thr Val Asn Asp Lys Gln Val
465 470 475 480
Leu Asn Met Asp Glu Arg Gly Gly Leu Thr Thr Pro Arg Ala Thr Asp
485 490 495
Leu Val Cys Phe Pro Leu Leu Arg Lys Asn Ser Pro His Ser Met Phe
500 505 510
Thr Ser Val
515
<210> 134
<211> 1548
<212> DNA
<213> 人工序列
<220>
<223> SEQ ID NO:133的编码序列
<400> 134
atgtccaaca ctttgttggt tttgcaaatg gttatcccag ctatcatcgc tttcgttatc 60
ttccacttgt tgttcttcaa gtctaagcca aacagaagat tgccaccatc tccaccatct 120
ttgccaatca tcggtcactt gcaccacttg ggtccattga tccaccaatc tttcaacaga 180
ttgtctgcta gatacggtcc attgatccac ttgagattgg gttctgtttc ttgtgttgtt 240
gctgacgctc cagacttggc tcaagaattg ttgcaaaaga acgacttggc tttcgctaac 300
agaaagcaca ctttggctat cgaccacgtt acttacggtg ttgctttcgc tttcgctcca 360
tacggtccat actggagatt catcaagaag atgtctactg ttgaattgtt gggtatccaa 420
aacttgggtc acttcttgcc aatcagaact caagaaatcc acggtttgtt gttgactttg 480
actgaaaagt ctaagcaaaa cgaatctgtt aacatgacta acgaattgtt gaagttgtct 540
aacaacatca tctgtcaaat gatgatgggt atcagatgtt ctggtaacaa gactgaagct 600
gaagaagcta agaacttggt tagagaagtt actactatct tcggtgaatt caacgtttct 660
gacttcatct ggttctgtaa gaagttggac ttgcaaggtt tcaagaagag atacgaagat 720
atcagaacta gatacgacgc tttgttggaa agaatcatct tcgctagaga agaaatgaga 780
aaggaaggta agggtatgga agatggtaag ggtaaggact tcttggacat gttgttggac 840
gttttggaag atgacaaggc tgaaatcaag atcactagaa accacatcaa ggctttgatc 900
ttggacttcg ttactgctgg tactgacact actgctgtta tcatcgaatg gactttggtt 960
gaattgatca agaacccaat ggttatggaa aaggctaagc aagaattgga cgaagttgtt 1020
ggtaacacta gattggttga agaatctgac gctccaaagt tgccatacat ccaagctatc 1080
atcaaggaag ctttcagatt gcacccacca atcccaatga tcatcagaaa gtctaacgaa 1140
aacgtttctg ttaagtctgg ttacgaaatc ccagctggtt ctatcttgtt cgttaacaac 1200
tggtctatcg gtagaaaccc aaagtactgg gaatctccat tggaattcaa gccagacaga 1260
ttcttgaagg aaggtgtttt gaagccatct ttggacatca gaggtcaaaa cttccaaatc 1320
ttgccattcg gtactggtag aagatcttgt ccaggtatca acatggctat gagacaattg 1380
ccagttgttg ttgctatctt gatccaatgt ttcgaatgga ctgttaacga caagcaagtt 1440
ttgaacatgg acgaaagagg tggtttgact actccaagag ctactgactt ggtttgtttc 1500
ccattgttga gaaagaactc tccacactct atgttcactt ctgtttaa 1548
<210> 135
<211> 515
<212> PRT
<213> 翠菊(Callistephus chinensis)
<400> 135
Met Ser Asn Ile Phe Glu Val Phe Gln Ser Val Ser Pro Ala Ile Ile
1 5 10 15
Ala Ile Phe Phe Ile Ser Ser Leu Phe Ile Tyr Leu Val Leu Ile Arg
20 25 30
Asn Gln Lys Ser Leu Ser Leu Pro Pro Ser Pro Pro Ala Leu Pro Ile
35 40 45
Ile Gly His Leu His His Leu Gly Pro Leu Ile His His Ser Phe His
50 55 60
Asp Leu Ser Thr Arg Tyr Gly Pro Leu Ile His Leu Arg Leu Gly Ser
65 70 75 80
Val Pro Cys Val Val Ala Ser Thr Pro Asp Leu Ala Arg Asp Phe Leu
85 90 95
Lys Thr Asn Glu Leu Ala Phe Ser Ser Arg Lys His Ser Leu Ala Ile
100 105 110
Asp His Val Thr Tyr Gly Val Ser Phe Ala Phe Ala Pro Tyr Gly Pro
115 120 125
Tyr Trp Lys Phe Ile Lys Lys Thr Ser Ile Val Glu Leu Leu Gly Asn
130 135 140
Gln Asn Leu Ser Asn Phe Leu Pro Ile Arg Thr Gln Glu Val His Glu
145 150 155 160
Leu Leu Gln Thr Leu Met Val Lys Ser Lys Lys Asn Glu Ser Val Asn
165 170 175
Leu Ser Glu Glu Leu Leu Lys Leu Thr Asn Asn Val Ile Cys Gln Met
180 185 190
Met Met Ser Ile Arg Cys Ser Gly Thr Asn Asn Glu Ala Asp Glu Ala
195 200 205
Lys Asn Leu Val Arg Glu Val Thr Lys Ile Phe Gly Glu Phe Asn Ile
210 215 220
Ser Asp Phe Ile Cys Leu Phe Lys Asn Ile Asp Leu Gln Gly Phe Lys
225 230 235 240
Lys Arg Tyr Val Asp Thr His Thr Arg Tyr Asn Ala Leu Leu Glu Lys
245 250 255
Met Ile Phe Glu Arg Glu Glu Lys Arg Lys Gln Lys Lys Ser Glu Asp
260 265 270
Gly Lys Gly Lys Asp Phe Leu Asp Ile Leu Leu Asp Val Leu Glu Asp
275 280 285
Glu Asn Ala Glu Ile Lys Ile Thr Arg Asp His Ile Lys Ala Leu Ile
290 295 300
Leu Asp Phe Phe Thr Ala Ala Thr Asp Thr Thr Ala Ile Ser Ile Glu
305 310 315 320
Trp Thr Leu Val Glu Leu Thr Asn Asn Pro Lys Val Leu Glu Asn Ala
325 330 335
Arg Lys Glu Ile Ala Glu Val Val Gly Asp Glu Arg Leu Val Gln Glu
340 345 350
Ser Asp Ile Pro Asn Leu Pro Tyr Ile Gln Ala Ile Ile Lys Glu Thr
355 360 365
Leu Arg Met His Pro Pro Ile Pro Met Val Ile Arg Lys Ser Ile Asp
370 375 380
Asn Val Thr Val Gln Gly Tyr Asp Ile Arg Ala Gly Thr Met Leu Phe
385 390 395 400
Val Asn Ile Trp Ser Ile Gly Arg Asn Pro Leu Tyr Trp Glu Ser Pro
405 410 415
Leu Glu Phe Lys Pro His Arg Phe Leu Asp Gly His Ala Arg Asn Leu
420 425 430
Asp Val Lys Gly Gln Cys Phe Gln Leu Leu Pro Phe Gly Thr Gly Arg
435 440 445
Arg Gly Cys Pro Gly Ile Ser Leu Ala Met Arg Glu Leu Pro Val Val
450 455 460
Ile Ala Gly Leu Ile Gln Cys Phe Glu Trp Asn Ala Asn Asp Lys Glu
465 470 475 480
Val Leu Ser Met Asp Glu Arg Ala Gly Leu Thr Ala Pro Arg Ala Val
485 490 495
Asp Leu Glu Phe Val Pro Leu Met Arg Gln Asn Cys Pro Asn Ile Phe
500 505 510
Val Ser Ala
515
<210> 136
<211> 1548
<212> DNA
<213> 人工的
<220>
<223> SEQ D NO:135的编码序列
<400> 136
atgtccaaca tcttcgaagt tttccaatct gtttctccag ctatcatcgc tatcttcttc 60
atctcttctt tgttcatcta cttggttttg atcagaaacc aaaagtcttt gtctttgcca 120
ccatctccac cagctttgcc aatcatcggt cacttgcacc acttgggtcc attgatccac 180
cactctttcc acgacttgtc tactagatac ggtccattga tccacttgag attgggttct 240
gttccatgtg ttgttgcttc tactccagac ttggctagag acttcttgaa aactaacgaa 300
ttggctttct cttctagaaa gcactctttg gctatcgacc acgttactta cggtgtttct 360
ttcgctttcg ctccatacgg tccatactgg aagttcatca agaaaacttc tatcgttgaa 420
ttgttgggta accaaaactt gtctaacttc ttgccaatca gaactcaaga agttcacgaa 480
ttgttgcaaa ctttgatggt taagtctaag aagaacgaat ctgttaactt gtctgaagaa 540
ttgttgaagt tgactaacaa cgttatctgt caaatgatga tgtctatcag atgttctggt 600
actaacaacg aagctgacga agctaagaac ttggttagag aagttactaa gatcttcggt 660
gaattcaaca tctctgactt catctgtttg ttcaagaaca tcgacttgca aggtttcaag 720
aagagatacg ttgacactca cactagatac aacgctttgt tggaaaagat gatcttcgaa 780
agagaagaaa agagaaagca aaagaagtct gaagatggta agggtaagga cttcttggac 840
atcttgttgg acgttttgga agatgaaaac gctgaaatca agatcactag agatcacatc 900
aaggctttga tcttggactt cttcactgct gctactgaca ctactgctat ctctatcgaa 960
tggactttgg ttgaattgac taacaaccca aaggttttgg aaaacgctag aaaggaaatc 1020
gctgaagttg ttggtgacga aagattggtt caagaatctg acatcccaaa cttgccatac 1080
atccaagcta tcatcaagga aactttgaga atgcacccac caatcccaat ggttatcaga 1140
aagtctatcg acaacgttac tgttcaaggt tacgacatca gagctggtac tatgttgttc 1200
gttaacatct ggtctatcgg tagaaaccca ttgtactggg aatctccatt ggaattcaag 1260
ccacacagat tcttggacgg tcacgctaga aacttggacg ttaagggtca atgtttccaa 1320
ttgttgccat tcggtactgg tagaagaggt tgtccaggta tctctttggc tatgagagaa 1380
ttgccagttg ttatcgctgg tttgatccaa tgtttcgaat ggaacgctaa cgacaaggaa 1440
gttttgtcta tggacgaaag agctggtttg actgctccaa gagctgttga cttggaattc 1500
gttccattga tgagacaaaa ctgtccaaac atcttcgttt ctgcttaa 1548
<210> 137
<211> 356
<212> PRT
<213> 芹菜(Apium graveolens)
<400> 137
Met Ser Ala Pro Ser Thr Ile Thr Ala Leu Ser Gln Glu Lys Thr Leu
1 5 10 15
Asn Leu Asp Phe Val Arg Asp Glu Asp Glu Arg Pro Lys Val Ala Tyr
20 25 30
Asn Gln Phe Ser Asn Glu Val Pro Ile Ile Ser Leu Ala Gly Leu Asp
35 40 45
Asp Asp Ser Asn Gly Arg Arg Ala Glu Ile Cys Arg Lys Ile Val Glu
50 55 60
Ala Phe Glu Glu Trp Gly Ile Phe Gln Val Val Asp His Gly Ile Asp
65 70 75 80
Ser Gly Leu Ile Ser Glu Met Ser Arg Leu Ser Arg Glu Phe Phe Ala
85 90 95
Leu Pro Ala Glu Glu Lys Leu Val Tyr Asp Thr Thr Gly Glu Lys Lys
100 105 110
Gly Gly Phe Thr Ile Ser Thr His Leu Gln Gly Asp Asp Val Arg Asp
115 120 125
Trp Arg Glu Phe Val Thr Tyr Phe Ser Tyr Pro Ile Ser Ala Arg Asp
130 135 140
Tyr Ser Arg Trp Pro Lys Lys Pro Glu Gly Trp Arg Ser Thr Thr Glu
145 150 155 160
Val Tyr Ser Glu Lys Leu Met Val Leu Gly Ala Lys Leu Leu Glu Val
165 170 175
Leu Ser Glu Ala Met Gly Leu Glu Lys Glu Ala Leu Thr Lys Ala Cys
180 185 190
Val Glu Met Glu Gln Lys Val Leu Ile Asn Tyr Tyr Pro Thr Cys Pro
195 200 205
Glu Pro Asp Leu Thr Leu Gly Val Arg Arg His Thr Asp Pro Gly Thr
210 215 220
Ile Thr Ile Leu Leu Gln Asp Met Val Gly Gly Leu Gln Ala Thr Arg
225 230 235 240
Asp Gly Gly Lys Thr Trp Ile Thr Val Gln Pro Val Glu Gly Ala Phe
245 250 255
Val Val Asn Leu Gly Asp His Gly His Tyr Leu Ser Asn Gly Arg Phe
260 265 270
Arg Asn Ala Asp His Gln Ala Val Val Asn Ser Thr Ser Thr Arg Leu
275 280 285
Ser Ile Ala Thr Phe Gln Asn Pro Ala Gln Asn Ala Ile Val Tyr Pro
290 295 300
Leu Lys Ile Arg Glu Gly Glu Lys Ala Ile Leu Asp Glu Ala Ile Thr
305 310 315 320
Tyr Ala Glu Met Tyr Lys Lys Asn Met Thr Lys His Ile Ala Val Ala
325 330 335
Thr Gln Lys Lys Leu Ala Lys Glu Lys Arg Leu Gln Asp Glu Lys Ala
340 345 350
Lys Met Lys Ile
355
<210> 138
<211> 1071
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:137的编码序列
<400> 138
atgtccgctc catctactat cactgctttg tctcaagaaa agactttgaa cttggacttc 60
gttagagatg aagatgaaag accaaaggtt gcttacaacc aattctctaa cgaagttcca 120
atcatctctt tggctggttt ggacgacgac tctaacggta gaagagctga aatctgtaga 180
aagatcgttg aagctttcga agaatggggt atcttccaag ttgttgacca cggtatcgac 240
tctggtttga tctctgaaat gtctagattg tctagagaat tcttcgcttt gccagctgaa 300
gaaaagttgg tttacgacac tactggtgaa aagaagggtg gtttcactat ctctactcac 360
ttgcaaggtg acgacgttag agactggaga gaattcgtta cttacttctc ttacccaatc 420
tctgctagag actactctag atggccaaag aagccagaag gttggagatc tactactgaa 480
gtttactctg aaaagttgat ggttttgggt gctaagttgt tggaagtttt gtctgaagct 540
atgggtttgg aaaaggaagc tttgactaag gcttgtgttg aaatggaaca aaaggttttg 600
atcaactact acccaacttg tccagaacca gacttgactt tgggtgttag gagacacact 660
gacccaggta ctatcactat cttgttgcaa gacatggttg gtggtttgca agctactaga 720
gatggtggta agacttggat cactgttcaa ccagttgaag gtgctttcgt tgttaacttg 780
ggtgaccacg gtcactactt gtctaacggt agattcagaa acgctgacca ccaagctgtt 840
gttaactcta cttctactag attgtctatc gctactttcc aaaacccagc tcaaaacgct 900
atcgtttacc cattgaagat cagagaaggt gaaaaggcta tcttggacga agctatcact 960
tacgctgaaa tgtacaagaa gaacatgact aagcacatcg ctgttgctac tcaaaagaag 1020
ttggctaagg aaaagagatt gcaagacgaa aaggctaaga tgaagatcta a 1071
<210> 139
<211> 521
<212> PRT
<213> 蒺藜状苜蓿(Medicago truncatula)
<400> 139
Met Ser Glu Pro Leu Leu Leu Ala Phe Thr Leu Phe Leu Ser Ser Leu
1 5 10 15
Ile Cys Tyr Ile Ile Phe Gln Pro Ile Leu Asn Arg His Lys Asn Leu
20 25 30
Pro Pro Ser Pro Leu Phe Lys Leu Pro Ile Ile Gly His Met His Met
35 40 45
Leu Gly Pro Leu Leu His His Ser Phe Asp Arg Leu Ser Gln Lys Tyr
50 55 60
Gly Pro Ile Phe Ser Leu Asn Phe Gly Ser Val Leu Cys Val Val Ala
65 70 75 80
Ser Thr Pro His Tyr Ala Lys Gln Ile Leu Gln Ile Asn Glu His Ala
85 90 95
Phe Asn Cys Arg Asn Glu Ser Thr Ala Ile Lys Arg Leu Thr Tyr Glu
100 105 110
Ala Ser Leu Ala Phe Ala Pro Tyr Gly Glu Tyr Trp Arg Phe Ile Lys
115 120 125
Lys Leu Ser Met Asn Glu Leu Leu Gly Ser Arg Ser Ile Ser Ser Phe
130 135 140
Gln His Leu Arg Leu Gln Glu Thr His Asn Leu Leu Lys Leu Phe Ala
145 150 155 160
Asp Lys Ala Lys Asn Tyr Glu Ala Val Asn Val Thr Gln Glu Leu Leu
165 170 175
Lys Leu Ser Asn Asn Val Ile Ser Lys Met Met Leu Gly Glu Ala Glu
180 185 190
Glu Ala Arg Asp Val Val Arg Asp Val Thr Glu Ile Phe Gly Glu Phe
195 200 205
Asn Val Ser Asp Phe Ile Trp Leu Phe Lys Lys Leu Asp Leu Gln Gly
210 215 220
Phe Gly Lys Arg Ile Glu Asp Leu Phe Met Arg Phe Asp Thr Leu Val
225 230 235 240
Glu Arg Ile Ile Ser Lys Arg Glu Glu Leu Arg Lys Asn Lys Gly Arg
245 250 255
Lys Glu Asn Lys Gly Glu Gln Gly Ala Glu Phe Arg Asp Phe Leu Asp
260 265 270
Ile Leu Leu Asp Cys Ala Glu Asp Gln Asn Ser Glu Ile Lys Val Gln
275 280 285
Arg Val His Ile Lys Ala Leu Ile Met Asp Phe Phe Thr Ala Gly Thr
290 295 300
Asp Thr Thr Ser Ile Ser Thr Glu Trp Ala Leu Val Glu Leu Met Asn
305 310 315 320
Asn Pro Ser Leu Leu Gln Lys Ala Arg Glu Glu Ile Asp Asn Val Val
325 330 335
Gly Lys Asn Arg Leu Val Asp Glu Ser Asp Gly Pro Asn Leu Pro Tyr
340 345 350
Ile Gln Ala Ile Ile Lys Glu Thr Phe Arg Leu His Pro Pro Val Pro
355 360 365
Met Val Thr Arg Arg Cys Val Thr Gln Cys Lys Ile Glu Asn Tyr Val
370 375 380
Ile Pro Glu Asn Ser Leu Ile Phe Val Asn Asn Trp Ala Met Gly Arg
385 390 395 400
Asn Ser Ala Tyr Trp Asp Lys Pro Leu Glu Phe Asn Pro Glu Arg Phe
405 410 415
Leu Lys Asn Ser Thr Asn Ser Asn Gly Val Ile Asp Val Arg Gly Gln
420 425 430
Asn Phe Gln Ile Leu Pro Phe Gly Ser Gly Arg Arg Met Cys Pro Gly
435 440 445
Val Thr Leu Ala Met Gln Glu Val Pro Ala Leu Leu Gly Ala Ile Ile
450 455 460
Gln Cys Phe Asp Phe Asn Phe Val Gly Pro Lys Gly Glu Ile Leu Lys
465 470 475 480
Gly Gly Asp Ile Val Ile Asp Val Asn Glu Arg Pro Gly Leu Thr Ala
485 490 495
Pro Arg Val His Asp Leu Val Cys Val Pro Val Glu Arg Phe Ala Cys
500 505 510
Gly Gly Pro Leu Gln Ser Leu Gly Cys
515 520
<210> 140
<211> 1566
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:139的编码序列
<400> 140
atgtccgaac cattgttgtt ggctttcact ttgttcttgt catctttgat ctgttacatc 60
atcttccaac caatcttgaa cagacacaag aacttgccac catctccatt gttcaagttg 120
ccaatcatcg gtcacatgca catgttgggt ccattgttgc accactcttt cgacagattg 180
tctcaaaagt acggtccaat cttctctttg aacttcggtt ctgttttgtg tgttgttgct 240
tctactccac actacgctaa gcaaatcttg caaatcaacg aacacgcttt caactgtaga 300
aacgaatcta ctgctatcaa gagattgact tacgaagctt ctttggcttt cgctccatac 360
ggtgaatact ggagattcat caagaagttg tctatgaacg aattgttggg ttctagatct 420
atctcttctt tccaacactt gagattgcaa gaaactcaca acttgttgaa gttgttcgct 480
gacaaggcta agaactacga agctgttaac gttactcaag aattgttgaa gttgtctaac 540
aacgttatct ctaagatgat gttgggtgaa gctgaagaag ctagagatgt tgttagagat 600
gttactgaaa tcttcggtga attcaacgtt tctgacttca tctggttgtt caagaagttg 660
gacttgcaag gtttcggtaa gagaatcgaa gatttgttca tgagattcga cactttggtt 720
gaaagaatca tctctaagag agaagaattg agaaagaaca agggtagaaa ggaaaacaag 780
ggtgaacaag gtgctgaatt cagagacttc ttggacatct tgttggactg tgctgaagat 840
caaaactctg aaatcaaggt tcaaagagtt cacatcaagg ctttgatcat ggacttcttc 900
actgctggta ctgacactac ttctatctct actgaatggg ctttggttga attgatgaac 960
aacccatctt tgttgcaaaa ggctagagaa gaaatcgaca acgttgttgg taagaacaga 1020
ttggttgacg aatctgacgg tccaaacttg ccatacatcc aagctatcat caaggaaact 1080
ttcagattgc acccaccagt tccaatggtt actagaagat gtgttactca atgtaagatc 1140
gaaaactacg ttatcccaga aaactctttg atcttcgtta acaactgggc tatgggtaga 1200
aactctgctt actgggacaa gccattggaa ttcaacccag aaagattctt gaagaactct 1260
actaactcta acggtgttat cgacgttaga ggtcaaaact tccaaatctt gccattcggt 1320
tctggtagaa gaatgtgtcc aggtgttact ttggctatgc aagaagttcc agctttgttg 1380
ggtgctatca tccaatgttt cgacttcaac ttcgttggtc caaagggtga aatcttgaag 1440
ggtggtgaca tcgttatcga cgttaacgaa agaccaggtt tgactgctcc aagagttcac 1500
gacttggttt gtgttccagt tgaaagattc gcttgtggtg gtccattgca atctttgggt 1560
tgttaa 1566
<210> 141
<211> 366
<212> PRT
<213> 孜然(Cuminum cyminum)
<400> 141
Met Ser Ala Pro Thr Thr Ile Thr Ala Leu Ala Gln Glu Lys Thr Leu
1 5 10 15
Asn Ser Asp Phe Val Arg Asp Glu Asp Glu Arg Pro Lys Val Ala Tyr
20 25 30
Asn Gln Phe Ser Thr Glu Ile Pro Ile Ile Ser Leu Ala Gly Ile Asp
35 40 45
Asp Asp Ser Lys Gly Arg Arg Pro Glu Val Cys Arg Lys Ile Val Glu
50 55 60
Ala Phe Glu Asp Trp Gly Ile Phe Gln Val Val Asp His Gly Val Asp
65 70 75 80
Ser Ala Leu Ile Ser Glu Met Ser Arg Leu Ser Arg Glu Phe Phe Ala
85 90 95
Leu Pro Ala Glu Glu Lys Leu Arg Tyr Asp Thr Thr Gly Gly Lys Arg
100 105 110
Gly Gly Phe Thr Ile Ser Thr His Gln Gln Gly Asp Asp Val Arg Asp
115 120 125
Trp Arg Glu Phe Val Thr Tyr Phe Ser Tyr Pro Val Asp Ala Arg Asp
130 135 140
Tyr Ser Arg Trp Pro Glu Lys Pro Glu Gly Trp Arg Ser Val Thr Glu
145 150 155 160
Val Tyr Ser Glu Lys Leu Met Val Leu Gly Ala Lys Leu Leu Glu Val
165 170 175
Leu Ser Glu Ala Met Gly Leu Asp Lys Gly Ala Leu Thr Lys Ala Cys
180 185 190
Val Asn Met Glu Gln Lys Val Leu Ile Asn Tyr Tyr Pro Thr Cys Pro
195 200 205
Glu Pro Asp Leu Thr Leu Gly Val Arg Arg His Thr Asp Pro Gly Thr
210 215 220
Ile Thr Ile Leu Leu Gln Asp Met Val Gly Gly Leu Gln Ala Thr Arg
225 230 235 240
Asp Gly Gly Lys Thr Trp Ile Thr Val Gln Pro Val Glu Gly Val Phe
245 250 255
Val Val Asn Leu Gly Asp His Gly His Tyr Leu Ser Asn Gly Arg Phe
260 265 270
Lys Asn Ala Asp His Gln Ala Val Val Asn Ser Thr Ser Ser Arg Leu
275 280 285
Ser Ile Ala Thr Phe Gln Asn Pro Ala Gln Asn Ala Ile Val Tyr Pro
290 295 300
Leu Lys Ile Arg Glu Gly Glu Lys Pro Ile Leu Glu Glu Ala Ile Thr
305 310 315 320
Tyr Ala Glu Met Tyr Lys Lys Asn Met Thr Lys His Ile Glu Val Ala
325 330 335
Thr Gln Lys Lys Leu Ala Lys Glu Lys Arg Leu Gln Glu Glu Lys Ala
340 345 350
Lys Leu Glu Thr Lys Thr Lys Ser Ala Asp Gly Ile Leu Ala
355 360 365
<210> 142
<211> 1101
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:141的编码序列
<400> 142
atgtccgctc caactactat cactgctttg gctcaagaaa agactttgaa ctctgacttc 60
gttagagatg aagatgaaag accaaaggtt gcttacaacc aattctctac tgaaatccca 120
atcatctctt tggctggtat cgacgacgac tctaagggta ggaggccaga agtttgtaga 180
aagatcgttg aagctttcga agattggggt atcttccaag ttgttgacca cggtgttgac 240
tctgctttga tctctgaaat gtctagattg tctagagaat tcttcgcttt gccagctgaa 300
gaaaagttga gatacgacac tactggtggt aagagaggtg gtttcactat ctctactcac 360
caacaaggtg acgacgttag agactggaga gaattcgtta cttacttctc ttacccagtt 420
gacgctagag actactctag atggccagaa aagccagaag gttggagatc tgttactgaa 480
gtttactctg aaaagttgat ggttttgggt gctaagttgt tggaagtttt gtctgaagct 540
atgggtttgg acaagggtgc tttgactaag gcttgtgtta acatggaaca aaaggttttg 600
atcaactact acccaacttg tccagaacca gacttgactt tgggtgttag gagacacact 660
gacccaggta ctatcactat cttgttgcaa gacatggttg gtggtttgca agctactagg 720
gacggtggta agacttggat cactgttcaa ccagttgaag gtgttttcgt tgttaacttg 780
ggtgaccacg gtcactactt gtctaacggt agattcaaga acgctgacca ccaagctgtt 840
gttaactcta cttcttctag attgtctatc gctactttcc aaaacccagc tcaaaacgct 900
atcgtttacc cattgaagat cagagaaggt gaaaagccaa tcttggaaga agctatcact 960
tacgctgaaa tgtacaagaa gaacatgact aagcacatcg aagttgctac tcaaaagaag 1020
ttggctaagg aaaagagatt gcaagaagaa aaggctaagt tggaaactaa gactaagtct 1080
gctgacggta tcttggctta a 1101
<210> 143
<211> 356
<212> PRT
<213> 毒欧芹(Aethusa cynapium)
<400> 143
Met Ser Ala Pro Thr Thr Ile Thr Ala Leu Ser Gln Glu Lys Ser Leu
1 5 10 15
Asn Leu Asp Phe Val Arg Asp Glu Asp Glu Arg Pro Lys Val Ala Tyr
20 25 30
Asn Gln Phe Ser Asn Glu Ile Pro Ile Ile Ser Leu Ala Gly Met Asp
35 40 45
Asp Asp Ser Asn Gly Arg Arg Pro Glu Ile Cys Arg Lys Ile Val Glu
50 55 60
Ala Phe Glu Asp Trp Gly Ile Phe Gln Val Val Asp His Gly Ile Asp
65 70 75 80
Lys Gly Leu Ile Ser Gln Met Ser Arg Leu Ser Arg Glu Phe Phe Ala
85 90 95
Leu Pro Ala Glu Glu Lys Leu Arg Tyr Asp Thr Thr Gly Gly Lys Arg
100 105 110
Gly Gly Phe Thr Ile Ser Thr His Leu Gln Gly Asp Asp Val Lys Asp
115 120 125
Trp Arg Glu Phe Val Thr Tyr Phe Ser Tyr Pro Ile Glu Asp Arg Asp
130 135 140
Tyr Ser Arg Trp Pro Glu Lys Pro Glu Gly Trp Arg Ser Thr Thr Glu
145 150 155 160
Val Tyr Ser Glu Lys Leu Met Val Leu Gly Ala Lys Leu Leu Glu Val
165 170 175
Leu Ser Glu Ala Met Gly Leu Glu Lys Glu Ala Leu Thr Lys Ala Cys
180 185 190
Val Asn Met Glu Gln Lys Val Leu Ile Asn Tyr Tyr Pro Thr Cys Pro
195 200 205
Glu Pro Asp Leu Thr Leu Gly Val Arg Arg His Thr Asp Pro Gly Thr
210 215 220
Ile Thr Ile Leu Leu Gln Asp Met Val Gly Gly Leu Gln Ala Thr Arg
225 230 235 240
Asp Gly Gly Lys Thr Trp Ile Thr Val Gln Pro Val Glu Gly Ala Phe
245 250 255
Val Val Asn Leu Gly Asp His Gly His Tyr Leu Ser Asn Gly Arg Phe
260 265 270
Lys Asn Ala Asp His Gln Ala Val Val Asn Ser Thr Ser Ser Arg Leu
275 280 285
Ser Ile Ala Thr Phe Gln Asn Pro Ala Gln Asn Ala Ile Val Tyr Pro
290 295 300
Leu Lys Ile Arg Glu Gly Glu Lys Ala Ile Leu Asp Glu Ala Ile Thr
305 310 315 320
Tyr Ala Glu Met Tyr Lys Lys Asn Met Thr Lys His Ile Glu Val Ala
325 330 335
Ala Leu Lys Lys Leu Ala Lys Glu Lys Arg Leu Gln Asp Glu Lys Ala
340 345 350
Lys Leu Glu Met
355
<210> 144
<211> 1071
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:143的编码序列
<400> 144
atgtccgctc caactactat cactgctttg tctcaagaaa agtctttgaa cttggacttc 60
gttagagatg aagatgaaag accaaaggtt gcttacaacc aattctctaa cgaaatccca 120
atcatctctt tggctggtat ggacgacgac tctaacggta ggaggccaga aatctgtaga 180
aagatcgttg aagctttcga agattggggt atcttccaag ttgttgacca cggtatcgac 240
aagggtttga tctctcaaat gtctagattg tctagagaat tcttcgcttt gccagctgaa 300
gaaaagttga gatacgacac tactggtggt aagagaggtg gtttcactat ctctactcac 360
ttgcaaggtg acgacgttaa ggactggaga gaattcgtta cttacttctc ttacccaatc 420
gaagatagag actactctag atggccagaa aagccagaag gttggagatc tactactgaa 480
gtttactctg aaaagttgat ggttttgggt gctaagttgt tggaagtttt gtctgaagct 540
atgggtttgg aaaaggaagc tttgactaag gcttgtgtta acatggaaca aaaggttttg 600
atcaactact acccaacttg tccagaacca gacttgactt tgggtgttag gagacacact 660
gacccaggta ctatcactat cttgttgcaa gacatggttg gtggtttgca agctactagg 720
gacggtggta agacttggat cactgttcaa ccagttgaag gtgctttcgt tgttaacttg 780
ggtgaccacg gtcactactt gtctaacggt agattcaaga acgctgacca ccaagctgtt 840
gttaactcta cttcttctag attgtctatc gctactttcc aaaacccagc tcaaaacgct 900
atcgtttacc cattgaagat cagagaaggt gaaaaggcta tcttggacga agctatcact 960
tacgctgaaa tgtacaagaa gaacatgact aagcacatcg aagttgctgc tttgaagaag 1020
ttggctaagg aaaagagatt gcaagacgaa aaggctaagt tggaaatgta a 1071
<210> 145
<211> 366
<212> PRT
<213> 毒芹(Conium maculatum)
<400> 145
Met Ser Ala Pro Thr Thr Ile Thr Ala Leu Ala Gln Glu Lys Thr Leu
1 5 10 15
Asn Leu Ala Phe Val Arg Asp Glu Asp Glu Arg Pro Lys Val Ala Tyr
20 25 30
Asn Glu Phe Ser Asn Glu Ile Pro Ile Ile Ser Leu Ala Gly Leu Glu
35 40 45
Asn Asp Ser Asp Gly Arg Arg Pro Glu Ile Cys Arg Lys Ile Val Glu
50 55 60
Ala Phe Glu Asn Trp Gly Ile Phe Gln Val Val Asp His Gly Ile Asp
65 70 75 80
Ser Ala Leu Ile Ser Glu Met Ser Arg Leu Ser Arg Glu Phe Phe Ala
85 90 95
Leu Pro Ala Glu Glu Lys Leu Arg Tyr Asp Thr Thr Gly Gly Lys Arg
100 105 110
Gly Gly Phe Thr Ile Ser Thr His Leu Gln Gly Asp Asp Val Arg Asp
115 120 125
Trp Arg Glu Phe Val Thr Tyr Phe Ser Tyr Pro Ile Asp Ala Arg Asp
130 135 140
Tyr Ser Arg Trp Pro Asp Lys Pro Glu Gly Trp Arg Ser Ile Thr Glu
145 150 155 160
Val Tyr Ser Glu Arg Leu Met Val Leu Gly Ala Lys Leu Leu Glu Val
165 170 175
Leu Ser Glu Ala Met Gly Leu Glu Lys Glu Ala Leu Thr Lys Ala Cys
180 185 190
Val Asn Met Glu Gln Lys Val Leu Ile Asn Tyr Tyr Pro Thr Cys Pro
195 200 205
Glu Pro Asp Leu Thr Leu Gly Val Arg Arg His Thr Asp Pro Gly Thr
210 215 220
Ile Thr Val Leu Leu Gln Asp Met Val Gly Gly Leu Gln Ala Thr Arg
225 230 235 240
Asp Gly Gly Lys Thr Trp Ile Thr Val Gln Pro Val Glu Gly Ala Phe
245 250 255
Val Val Asn Leu Gly Asp His Gly His Tyr Leu Ser Asn Gly Arg Phe
260 265 270
Lys Asn Ala Asp His Gln Ala Val Val Asn Ser Ser Ser Ser Arg Leu
275 280 285
Ser Ile Ala Thr Phe Gln Asn Pro Ala Gln Asn Ala Ile Val Tyr Pro
290 295 300
Leu Lys Ile Arg Glu Gly Glu Lys Ala Ile Leu Asp Glu Ala Ile Thr
305 310 315 320
Tyr Ala Glu Met Tyr Lys Lys Asn Met Thr Lys His Ile Glu Val Ala
325 330 335
Thr Leu Lys Lys Leu Ala Lys Glu Lys Arg Leu Gln Asp Glu Lys Ala
340 345 350
Asn Met Glu Lys Lys Ser Lys Ser Ala His Gly Ile Ser Ala
355 360 365
<210> 146
<211> 1101
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:145的编码序列
<400> 146
atgtccgctc caactactat cactgctttg gctcaagaaa agactttgaa cttggctttc 60
gttagagatg aagatgaaag accaaaggtt gcttacaacg aattctctaa cgaaatccca 120
atcatctctt tggctggttt ggaaaacgac tctgacggta gaaggccaga aatctgtaga 180
aagatcgttg aagctttcga aaactggggt atcttccaag ttgttgacca cggtatcgac 240
tctgctttga tctctgaaat gtctagattg tctagagaat tcttcgcttt gccagctgaa 300
gaaaagttga gatacgacac tactggtggt aagagaggtg gtttcactat ctctactcac 360
ttgcaaggtg acgacgttag agactggaga gaattcgtta cttacttctc ttacccaatc 420
gacgctagag actactctag atggccagac aagccagaag gttggagatc tatcactgaa 480
gtttactctg aaagattgat ggttttgggt gctaagttgt tggaagtttt gtctgaagct 540
atgggtttgg aaaaggaagc tttgactaag gcttgtgtta acatggaaca aaaggttttg 600
atcaactact acccaacttg tccagaacca gacttgactt tgggtgttag aaggcacact 660
gacccaggta ctatcactgt tttgttgcaa gacatggttg gtggtttgca agctactaga 720
gatggtggta agacttggat cactgttcaa ccagttgaag gtgctttcgt tgttaacttg 780
ggtgaccacg gtcactactt gtctaacggt agattcaaga acgctgacca ccaagctgtt 840
gttaactctt cttcttctag attgtctatc gctactttcc aaaacccagc tcaaaacgct 900
atcgtttacc cattgaagat cagagaaggt gaaaaggcta tcttggacga agctatcact 960
tacgctgaaa tgtacaagaa gaacatgact aagcacatcg aagttgctac tttgaagaag 1020
ttggctaagg aaaagagatt gcaagacgaa aaggctaaca tggaaaagaa gtctaagtct 1080
gctcacggta tctctgctta a 1101
<210> 147
<211> 535
<212> PRT
<213> 茶树(Camellia sinensis)
<400> 147
Met Ser Phe Asp Leu Ile Ser Ile Ala Thr Leu Phe Phe Val Ile Ile
1 5 10 15
Ser Thr Thr Ile Leu Leu Leu Ser Ile Asn His Phe Lys Lys Pro Pro
20 25 30
His Leu Arg Arg Arg Leu Ser Leu Pro Pro Thr Pro Phe Ala Leu Pro
35 40 45
Ile Ile Gly His Leu His Leu Leu Gly Pro Ile Ile His Arg Ser Phe
50 55 60
His Asp Leu Ser Ser Arg Tyr Gly Pro Leu Phe His Leu Arg Leu Gly
65 70 75 80
Ser Val Pro Cys Phe Val Val Ser Thr Pro Glu Leu Ala Lys Glu Phe
85 90 95
Leu Leu Thr His Glu Leu Lys Phe Ser Ser Arg Arg Asp Ser Ile Ala
100 105 110
Ile Gln Arg Leu Thr Tyr Asp Ser Ala Phe Ala Phe Ala Pro Tyr Gly
115 120 125
Pro Tyr Trp Lys Phe Leu Lys Lys Leu Cys Thr Cys Asp Leu Leu Gly
130 135 140
Ala Arg Ser Ile Asn His Phe Leu Pro Thr Arg Thr Arg Glu Leu His
145 150 155 160
Cys Phe Val Arg Leu Leu Ile Asp Lys Ala Val Ala Cys Glu Pro Val
165 170 175
Asn Ile Thr Lys Glu Leu Ser Thr Leu Ala Asn Asn Ile Ile Ser Gln
180 185 190
Met Met Ile Gly Val Arg Cys Ser Gly Thr Thr Gly Glu Ala Glu Glu
195 200 205
Ala Thr Thr Leu Ala Arg Glu Val Thr Lys Ile Phe Gly Glu Phe Asn
210 215 220
Val Ser Asp Phe Met Trp Val Ile Arg Asn Phe Asp Leu Gln Gly Phe
225 230 235 240
Arg Lys Arg Val Glu Asp Ile Tyr Thr Arg Tyr Asp Ala Leu Leu Glu
245 250 255
Arg Ile Ile Thr Asn Arg Glu Glu Val Arg Glu Lys Asn Val Gln Glu
260 265 270
Arg Lys Leu Gly Val Gly Glu Gly His His Val Lys Asp Phe Leu Asp
275 280 285
Leu Leu Leu Asp Val Leu Glu Glu Asp His Ser Glu Ile Asn Phe Ser
290 295 300
Arg Asp Asn Ile Lys Gly Leu Ile Leu Asp Phe Phe Thr Ala Gly Thr
305 310 315 320
Asp Thr Ser Ser Ile Ala Ile Glu Trp Ala Leu Ala Glu Leu Ile Asn
325 330 335
Asn Pro Arg Val Leu Gln Lys Ala Gln Glu Glu Ile Asp Asn Val Val
340 345 350
Gly Lys His Arg Leu Val Ser Glu Ser Asp Gly Pro Asn Leu Pro Tyr
355 360 365
Ile Gln Ala Ile Ile Arg Glu Ala Leu Arg Leu His Pro Pro Val Pro
370 375 380
Leu Ile Thr Arg Lys Ser Ile Glu Asp Cys Met Ile Gln Gly Tyr Asn
385 390 395 400
Ile Pro Ala Asn Ser Met Leu Phe Val Asn Val Trp Ser Leu Ala Arg
405 410 415
Asn Pro Lys Tyr Trp Asp Ser Pro Leu Asp Phe Leu Pro Glu Arg Phe
420 425 430
Leu Arg Pro Glu Lys Gly Gly Pro Val Gly Pro Thr Asp Val Lys Gly
435 440 445
Gln His Phe Gln Leu Leu Pro Phe Gly Thr Gly Arg Arg Gly Cys Pro
450 455 460
Gly Thr Ser Leu Ala Met Gln Glu Leu Pro Ala Met Leu Ala Ala Met
465 470 475 480
Ile Gln Cys Phe Glu Trp Lys Val Val Asn Gln Ser Gly Asp Val Met
485 490 495
Asn Gly Asp Gly Ala Leu Asp Met Thr Glu Gln Pro Gly Met Thr Ala
500 505 510
Pro Arg Ala His Asp Leu Val Cys Met Pro Ile Pro Arg Ile Asp Gln
515 520 525
Leu Tyr Ala Leu Leu Asp Pro
530 535
<210> 148
<211> 1608
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:147的编码序列
<400> 148
atgtccttcg acttgatctc tatcgctact ttgttcttcg ttatcatctc tactactatc 60
ttgttgttgt ctatcaacca cttcaagaag ccaccacact tgagaagaag attgtctttg 120
ccaccaactc cattcgcttt gccaatcatc ggtcacttgc acttgttggg tccaatcatc 180
cacagatctt tccacgactt gtcatctaga tacggtccat tgttccactt gagattgggt 240
tctgttccat gtttcgttgt ttctactcca gaattggcta aggaattctt gttgactcac 300
gaattgaagt tctcttctag aagagactct atcgctatcc aaagattgac ttacgactct 360
gctttcgctt tcgctccata cggtccatac tggaagttct tgaagaagtt gtgtacttgt 420
gacttgttgg gtgctagatc tatcaaccac ttcttgccaa ctagaactag agaattgcac 480
tgtttcgtta gattgttgat cgacaaggct gttgcttgtg aaccagttaa catcactaag 540
gaattgtcta ctttggctaa caacatcatc tctcaaatga tgatcggtgt tagatgttct 600
ggtactactg gtgaagctga agaagctact actttggcta gagaagttac taagatcttc 660
ggtgaattca acgtttctga cttcatgtgg gttatcagaa acttcgactt gcaaggtttc 720
agaaagagag ttgaagatat ctacactaga tacgacgctt tgttggaaag aatcatcact 780
aacagagaag aagttagaga aaagaacgtt caagaaagaa agttgggtgt tggtgaaggt 840
caccacgtta aggacttctt ggacttgttg ttggacgttt tggaagaaga tcactctgaa 900
atcaacttct ctagagacaa catcaagggt ttgatcttgg acttcttcac tgctggtact 960
gacacttctt ctatcgctat cgaatgggct ttggctgaat tgatcaacaa cccaagagtt 1020
ttgcaaaagg ctcaagaaga aatcgacaac gttgttggta agcacagatt ggtttctgaa 1080
tctgacggtc caaacttgcc atacatccaa gctatcatca gagaagcttt gagattgcac 1140
ccaccagttc cattgatcac tagaaagtct atcgaagatt gtatgatcca aggttacaac 1200
atcccagcta actctatgtt gttcgttaac gtttggtctt tggctagaaa cccaaagtac 1260
tgggactctc cattggactt cttgccagaa agattcttga ggccagaaaa gggtggtcca 1320
gttggtccaa ctgacgttaa gggtcaacac ttccaattgt tgccattcgg tactggtaga 1380
agaggttgtc caggtacttc tttggctatg caagaattgc cagctatgtt ggctgctatg 1440
atccaatgtt tcgaatggaa ggttgttaac caatctggtg acgttatgaa cggtgacggt 1500
gctttggaca tgactgaaca accaggtatg actgctccaa gagctcacga cttggtttgt 1560
atgccaatcc caagaatcga ccaattgtac gctttgttgg acccataa 1608
<210> 149
<211> 517
<212> PRT
<213> 水母雪莲(Saussurea medusa)
<400> 149
Met Ser Gln Val Leu Gln Thr Leu Thr Pro Ala Val Ile Ala Ala Val
1 5 10 15
Leu Leu Ser Ser Leu Phe Leu Tyr Leu Leu Ile Lys Lys Asn Gln Asn
20 25 30
His Arg Leu Pro Pro Ser Pro Pro Ser Leu Pro Ile Ile Gly His Leu
35 40 45
His His Leu Gly Pro Leu Ile His Gln Ser Phe His His Leu Ser Thr
50 55 60
Lys Tyr Gly Pro Leu Ile His Leu Arg Leu Gly Ser Val Thr Cys Val
65 70 75 80
Val Ala Ser Thr Pro Asp Leu Ala Arg Asp Phe Leu Lys Thr Asn Glu
85 90 95
Leu Ala Phe Ser Ser Arg Lys His Ser Leu Ala Ile Asp His Ile Thr
100 105 110
Tyr Gly Val Ala Phe Ala Phe Ala Pro Tyr Gly Pro Tyr Trp Lys Phe
115 120 125
Ile Lys Lys Met Ser Thr Val Glu Leu Leu Gly Asn Gln Asn Leu Gly
130 135 140
His Phe Leu Pro Ile Arg Thr Gln Glu Ile His Glu Leu Leu His Thr
145 150 155 160
Leu Met Asn Lys Ala Lys Lys Arg Glu Ser Val Asn Leu Thr Glu Glu
165 170 175
Leu Leu Lys Leu Thr Asn Asn Val Ile Cys Gln Met Met Met Ser Ile
180 185 190
Arg Cys Ser Gly Thr Asn Ser Glu Ala Asp Glu Ala Lys Asn Leu Val
195 200 205
Arg Glu Val Thr Gln Ile Phe Gly Glu Phe Asn Val Ser Asp Phe Ile
210 215 220
Trp Phe Cys Lys Asn Ile Asp Leu Gln Gly Phe Lys Lys Arg Tyr Glu
225 230 235 240
Asp Thr His Arg Arg Tyr Asp Val Leu Leu Glu Lys Ile Ile Leu Glu
245 250 255
Arg Glu Glu Glu Arg Arg Lys Glu Gly Lys Arg Glu Asp Gly Asn Lys
260 265 270
Gly Lys Asp Phe Leu Asp Met Leu Leu Asp Val Leu Glu Asp Gly Lys
275 280 285
Ala Glu Ile Gln Ile Thr Arg Asp His Ile Lys Ala Leu Ile Leu Asp
290 295 300
Phe Phe Thr Ala Ala Thr Asp Thr Thr Ala Ile Ala Leu Glu Trp Met
305 310 315 320
Leu Val Glu Leu Ile Arg Asn Pro Lys Val Leu Glu Ile Ala Arg Glu
325 330 335
Glu Ile Asp His Ile Ile Gly Asn Glu Arg Leu Val Gln Glu Ser Asp
340 345 350
Ile Pro Asn Leu Pro Tyr Ile Gln Ala Ile Ile Lys Glu Thr Leu Arg
355 360 365
Leu His Pro Pro Ile Pro Met Leu Ile Arg Lys Ser Ile Glu Asn Val
370 375 380
Ser Val Gln Gly Tyr Asp Ile Pro Ala Gly Thr Met Leu Phe Val Asn
385 390 395 400
Ile Trp Ser Ile Gly Arg Asn Pro Lys Tyr Trp Glu Ser Pro Leu Glu
405 410 415
Phe Lys Pro His Arg Phe Leu Glu Glu Asp Asn Ala Leu Lys Ser Ser
420 425 430
Phe Asp Ile Lys Gly Gln Asn Phe Gln Leu Leu Pro Phe Gly Thr Gly
435 440 445
Arg Arg Gly Cys Pro Gly Ile Asn Leu Ala Met Lys Glu Leu Pro Val
450 455 460
Val Ile Ala Gly Leu Ile Gln Cys Phe Glu Trp Asn Ile Asn Glu Lys
465 470 475 480
Gln Val Leu Asp Met Asp Glu Arg Ala Gly Leu Thr Ala Pro Arg Ala
485 490 495
Ala Asp Phe Val Cys Val Pro Ser Ile Arg Glu Asp Ser Pro Lys Ser
500 505 510
Phe Ile Thr Ser Thr
515
<210> 150
<211> 1554
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:149的编码序列
<400> 150
atgtcccaag ttttgcaaac tttgactcca gctgttatcg ctgctgtttt gttgtcatct 60
ttgttcttgt acttgttgat caagaagaac caaaaccaca gattgccacc atctccacca 120
tctttgccaa tcatcggtca cttgcaccac ttgggtccat tgatccacca atctttccac 180
cacttgtcta ctaagtacgg tccattgatc cacttgagat tgggttctgt tacttgtgtt 240
gttgcttcta ctccagactt ggctagagac ttcttgaaaa ctaacgaatt ggctttctct 300
tctagaaagc actctttggc tatcgaccac atcacttacg gtgttgcttt cgctttcgct 360
ccatacggtc catactggaa gttcatcaag aagatgtcta ctgttgaatt gttgggtaac 420
caaaacttgg gtcacttctt gccaatcaga actcaagaaa tccacgaatt gttgcacact 480
ttgatgaaca aggctaagaa gagagaatct gttaacttga ctgaagaatt gttgaagttg 540
actaacaacg ttatctgtca aatgatgatg tctatcagat gttctggtac taactctgaa 600
gctgacgaag ctaagaactt ggttagagaa gttactcaaa tcttcggtga attcaacgtt 660
tctgacttca tctggttctg taagaacatc gacttgcaag gtttcaagaa gagatacgaa 720
gatactcaca gaagatacga cgttttgttg gaaaagatca tcttggaaag agaagaagaa 780
agaagaaagg aaggtaagag agaagatggt aacaagggta aggacttctt ggacatgttg 840
ttggacgttt tggaagatgg taaggctgaa atccaaatca ctagagatca catcaaggct 900
ttgatcttgg acttcttcac tgctgctact gacactactg ctatcgcttt ggaatggatg 960
ttggttgaat tgatcagaaa cccaaaggtt ttggaaatcg ctagagaaga aatcgaccac 1020
atcatcggta acgaaagatt ggttcaagaa tctgacatcc caaacttgcc atacatccaa 1080
gctatcatca aggaaacttt gagattgcac ccaccaatcc caatgttgat cagaaagtct 1140
atcgaaaacg tttctgttca aggttacgac atcccagctg gtactatgtt gttcgttaac 1200
atctggtcta tcggtagaaa cccaaagtac tgggaatctc cattggaatt caagccacac 1260
agattcttgg aagaagataa cgctttgaag tcatctttcg acatcaaggg tcaaaacttc 1320
caattgttgc cattcggtac tggtagaaga ggttgtccag gtatcaactt ggctatgaag 1380
gaattgccag ttgttatcgc tggtttgatc caatgtttcg aatggaacat caacgaaaag 1440
caagttttgg acatggacga aagagctggt ttgactgctc caagagctgc tgacttcgtt 1500
tgtgttccat ctatcagaga agattctcca aagtctttca tcacttctac ttaa 1554
<210> 151
<211> 510
<212> PRT
<213> 毛喉鞘蕊花(Plectranthus barbatus)
<400> 151
Met Ser Asp His Val Glu Ala Ala Leu Phe Ala Ala Ile Phe Leu Leu
1 5 10 15
Ser Ala Ala Leu Leu Asn His Leu Leu Thr Gly Lys Arg Arg Gln Asn
20 25 30
Ala Tyr Pro Pro Gly Pro Phe Pro Leu Pro Ile Ile Gly His Leu His
35 40 45
Leu Leu Gly Pro Arg Leu His His Thr Phe His Asp Leu Thr Gln Arg
50 55 60
Tyr Gly Pro Leu Met Gln Val Arg Leu Gly Ser Ile Arg Cys Val Ile
65 70 75 80
Ala Ala Thr Pro Glu Leu Ala Lys Glu Phe Leu Lys Thr Ser Glu Leu
85 90 95
Val Phe Ser Ala Arg Lys His Ser Thr Ala Ile Asp Ile Val Thr Tyr
100 105 110
Glu Ser Ser Phe Ala Phe Ser Pro Tyr Gly Pro Tyr Trp Lys Tyr Ile
115 120 125
Lys Lys Leu Cys Thr Tyr Glu Leu Leu Gly Ala Arg Asn Leu Asn His
130 135 140
Phe Leu Pro Ile Arg Thr Ile Glu Val Lys Thr Phe Leu Glu Ala Leu
145 150 155 160
Met Gln Lys Gly Lys Thr Gly Glu Arg Leu Asn Val Thr Glu Glu Leu
165 170 175
Val Lys Leu Thr Ser Asn Val Ile Ser Gln Met Met Leu Ser Ile Arg
180 185 190
Cys Ser Gly Thr Glu Gly Glu Thr Glu Ala Val Arg Thr Val Ile Arg
195 200 205
Glu Val Thr Gln Ile Phe Gly Glu Phe Asp Val Ala Asp Ile Ile Trp
210 215 220
Phe Cys Lys Asn Phe Asp Phe Gln Gly Ile Arg Lys Arg Ser Glu Asp
225 230 235 240
Ile Gln Arg Arg Tyr Asp Ala Leu Leu Glu Lys Ile Ile Thr Asp Arg
245 250 255
Glu Lys Gln Arg Arg Thr Gln His Gly Gly Glu Ala Lys Asp Phe Leu
260 265 270
Asp Met Phe Leu Asp Ile Met Lys Ser Gly Lys Ala Glu Val Asn Phe
275 280 285
Thr Arg Asp His Leu Lys Ala Leu Ile Leu Asp Phe Phe Thr Ala Gly
290 295 300
Thr Asp Thr Thr Ala Ile Val Val Gly Trp Ala Ile Ala Glu Leu Ile
305 310 315 320
Asn Asn Pro Asn Val Leu Lys Lys Ala Gln Ala Glu Ile Asp Lys Val
325 330 335
Val Gly Leu His Arg Ile Leu Gln Glu Ser Asp Gly Pro Asn Leu Pro
340 345 350
Tyr Leu Asn Ala Val Ile Lys Glu Thr Phe Arg Leu His Pro Pro Ile
355 360 365
Pro Met Leu Ser Arg Lys Ser Ile Ser Asp Cys Val Ile Asp Gly Tyr
370 375 380
Thr Ile Pro Ala Asn Thr Leu Leu Phe Val Asn Ile Trp Ser Met Gly
385 390 395 400
Arg Asn Pro Lys Ile Trp Asp Asn Pro Met Ala Phe Arg Pro Glu Arg
405 410 415
Phe Leu Glu Lys Glu Lys Thr Gly Ile Asp Ile Lys Gly Gln His Phe
420 425 430
Glu Leu Leu Pro Phe Gly Thr Gly Arg Arg Gly Cys Pro Gly Met Leu
435 440 445
Leu Ala Ile Arg Glu Val Val Val Ile Ile Gly Thr Val Ile Gln Cys
450 455 460
Phe Asp Trp Lys Leu Pro Val Asp Asp Val Ser Gly Leu Val Asp Met
465 470 475 480
Thr Glu Arg Pro Gly Leu Thr Ala Pro Arg Ala Asp Asp Leu Ile Cys
485 490 495
Arg Val Val Pro Arg Val Asp Pro Leu Val Val Ser Gly His
500 505 510
<210> 152
<211> 1533
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:151的编码序列
<400> 152
atgtccgacc acgttgaagc tgctttgttc gctgctatct tcttgttgtc tgctgctttg 60
ttgaaccact tgttgactgg taagagaagg caaaacgctt acccaccagg tccattccca 120
ttgccaatca tcggtcactt gcacttgttg ggtccaagat tgcaccacac tttccacgac 180
ttgactcaaa gatacggtcc attgatgcaa gttagattgg gttctatcag atgtgttatc 240
gctgctactc cagaattggc taaggaattc ttgaaaactt ctgaattggt tttctctgct 300
agaaagcact ctactgctat cgacatcgtt acttacgaat cttctttcgc tttctctcca 360
tacggtccat actggaagta catcaagaag ttgtgtactt acgaattgtt gggtgctaga 420
aacttgaacc acttcttgcc aatcagaact atcgaagtta agactttctt ggaagctttg 480
atgcaaaagg gtaagactgg tgaaagattg aacgttactg aagaattggt taagttgact 540
tctaacgtta tctctcaaat gatgttgtct atcagatgtt ctggtactga aggtgaaact 600
gaagctgtta gaactgttat cagagaagtt actcaaatct tcggtgaatt cgacgttgct 660
gacatcatct ggttctgtaa gaacttcgac ttccaaggta tcagaaagag atctgaagat 720
atccaaagaa gatacgacgc tttgttggaa aagatcatca ctgacagaga aaagcaaaga 780
agaactcaac acggtggtga agctaaggac ttcttggaca tgttcttgga catcatgaag 840
tctggtaagg ctgaagttaa cttcactaga gatcacttga aggctttgat cttggacttc 900
ttcactgctg gtactgacac tactgctatc gttgttggtt gggctatcgc tgaattgatc 960
aacaacccaa acgttttgaa gaaggctcaa gctgaaatcg acaaggttgt tggtttgcac 1020
agaatcttgc aagaatctga cggtccaaac ttgccatact tgaacgctgt tatcaaggaa 1080
actttcagat tgcacccacc aatcccaatg ttgtctagaa agtctatctc tgactgtgtt 1140
atcgacggtt acactatccc agctaacact ttgttgttcg ttaacatctg gtctatgggt 1200
agaaacccaa agatctggga caacccaatg gctttcagac cagaaagatt cttggaaaag 1260
gaaaagactg gtatcgacat caagggtcaa cacttcgaat tgttgccatt cggtactggt 1320
agaagaggtt gtccaggtat gttgttggct atcagagaag ttgttgttat catcggtact 1380
gttatccaat gtttcgactg gaagttgcca gttgacgacg tttctggttt ggttgacatg 1440
actgaaagac caggtttgac tgctccaaga gctgacgact tgatctgtag agttgttcca 1500
agagttgacc cattggttgt ttctggtcac taa 1533
<210> 153
<211> 506
<212> PRT
<213> 黄芩(Scutellaria baicalensis)
<400> 153
Met Ser Glu Val Thr Leu Asn Val Ala Leu Leu Leu Leu Ser Ala Ala
1 5 10 15
Val Cys Leu Met Val Phe Thr Gly Lys Arg Arg Arg Arg Leu Pro Asn
20 25 30
Pro Pro Gly Pro Phe Pro Leu Pro Leu Ile Gly Asn Leu Asn Leu Val
35 40 45
Ser Pro Arg Leu His His Thr Phe His Met Leu Ala Gln Arg Tyr Gly
50 55 60
Pro Ile Met Lys Phe Arg Leu Gly Ser Ile Pro Cys Leu Val Val Ser
65 70 75 80
Thr Pro Glu Leu Ala Lys Asp Ile Leu Lys Thr His Glu Leu Ile Phe
85 90 95
Ser Ser Arg Val Lys Ser Thr Ala Ile Asp Ile Val Thr Tyr Gly Val
100 105 110
Ser Phe Ala Phe Ser Pro Tyr Gly Pro Tyr Trp Lys Tyr Ile Lys Lys
115 120 125
Leu Cys Thr Tyr Glu Leu Leu Gly Ser Arg Met Leu Asn His Phe Glu
130 135 140
Pro Leu Arg Ala Leu Glu Val Arg Glu Phe Leu Lys Asp Val Met Ala
145 150 155 160
Met Gly Lys Ala Gly Lys Ser Phe Asn Val Thr Glu Glu Leu Met Lys
165 170 175
Leu Thr Ser Asn Val Met Ser Asn Met Met Leu Ser Ile Arg Ala Ala
180 185 190
Glu Ser Glu Glu Gln Ala Glu Val Ala Arg Thr Leu Ile Arg Glu Val
195 200 205
Ser Gln Leu Phe Gly Glu Phe Asp Phe Gly Asp Met Leu Trp Phe Cys
210 215 220
Lys Ser Phe Asp Phe Gln Gly Ile Lys Lys Arg Ser Lys Asp Ile Lys
225 230 235 240
Val Arg Tyr Asp Ala Leu Leu Glu Lys Ile Leu Thr Asp Arg Glu Asn
245 250 255
Val Arg Arg Gln Asn Gly Val Val Glu Pro Lys Asp Met Leu Asp Met
260 265 270
Phe Leu Asp Ile Met Glu Gly Gly Lys Thr Asp Val Glu Phe Thr Arg
275 280 285
Glu His Leu Lys Ala Val Ile Leu Asp Phe Leu Thr Ala Gly Thr Asp
290 295 300
Thr Thr Ala Ile Thr Val Glu Trp Val Leu Ala Glu Leu Met Asn Ser
305 310 315 320
Pro Lys Ala Met Lys Lys Ala Gln Asp Glu Met Asp Arg Val Val Gly
325 330 335
Arg Glu Arg Met Met Ala Glu Ser Asp Ala Pro Asn Leu Pro Tyr Phe
340 345 350
Leu Ala Ile Ile Lys Glu Thr Phe Arg Leu His Pro Pro Ile Pro Leu
355 360 365
Ile Ile Arg Arg Ser Ile Glu Asp Cys Val Ile Asp Gly Tyr His Ile
370 375 380
Pro Ala Asp Thr Leu Ala Phe Ile Asn Val Trp Ser Met Gly Arg Asn
385 390 395 400
Glu Lys Tyr Trp Asp Ser Pro Leu Ser Phe Arg Pro Glu Arg Phe Leu
405 410 415
Glu Gly Asp Asn Ala Ala Ile Asp Ile Lys Gly Met His Phe Glu Leu
420 425 430
Leu Pro Phe Gly Ser Gly Arg Arg Gly Cys Pro Gly Met Leu Ser Ala
435 440 445
Ile Gln Glu Val Leu Ile Ile Ala Gly Thr Val Ile Gln Cys Phe Asp
450 455 460
Trp Glu Gln Ala Asp Gly Ser Gly Arg Val Asp Met Ser Glu Arg Pro
465 470 475 480
Gly Leu Thr Thr Pro Arg Glu Ile Asp Leu Val Cys Arg Val Val Pro
485 490 495
Arg Val Asp Glu Arg Val Ile Ser Gly His
500 505
<210> 154
<211> 1521
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:153的编码序列
<400> 154
atgtccgaag ttactttgaa cgttgctttg ttgttgttgt ctgctgctgt ttgtttgatg 60
gttttcactg gtaagagaag aagaagattg ccaaacccac caggtccatt cccattgcca 120
ttgatcggta acttgaactt ggtttctcca agattgcacc acactttcca catgttggct 180
caaagatacg gtccaatcat gaagttcaga ttgggttcta tcccatgttt ggttgtttct 240
actccagaat tggctaagga catcttgaaa actcacgaat tgatcttctc ttctagagtt 300
aagtctactg ctatcgacat cgttacttac ggtgtttctt tcgctttctc tccatacggt 360
ccatactgga agtacatcaa gaagttgtgt acttacgaat tgttgggttc tagaatgttg 420
aaccacttcg aaccattgag agctttggaa gttagagaat tcttgaagga cgttatggct 480
atgggtaagg ctggtaagtc tttcaacgtt actgaagaat tgatgaagtt gacttctaac 540
gttatgtcta acatgatgtt gtctatcaga gctgctgaat ctgaagaaca agctgaagtt 600
gctagaactt tgatcagaga agtttctcaa ttgttcggtg aattcgactt cggtgacatg 660
ttgtggttct gtaagtcttt cgacttccaa ggtatcaaga agagatctaa ggacatcaag 720
gttagatacg acgctttgtt ggaaaagatc ttgactgaca gagaaaacgt taggagacaa 780
aacggtgttg ttgaaccaaa ggacatgttg gacatgttct tggacatcat ggaaggtggt 840
aagactgacg ttgaattcac tagagaacac ttgaaggctg ttatcttgga cttcttgact 900
gctggtactg acactactgc tatcactgtt gaatgggttt tggctgaatt gatgaactct 960
ccaaaggcta tgaagaaggc tcaagacgaa atggacagag ttgttggtag agaaagaatg 1020
atggctgaat ctgacgctcc aaacttgcca tacttcttgg ctatcatcaa ggaaactttc 1080
agattgcacc caccaatccc attgatcatc agaagatcta tcgaagattg tgttatcgac 1140
ggttaccaca tcccagctga cactttggct ttcatcaacg tttggtctat gggtagaaac 1200
gaaaagtact gggactctcc attgtctttc agaccagaaa gattcttgga aggtgacaac 1260
gctgctatcg acatcaaggg tatgcacttc gaattgttgc cattcggttc tggtagaaga 1320
ggttgtccag gtatgttgtc tgctatccaa gaagttttga tcatcgctgg tactgttatc 1380
caatgtttcg actgggaaca agctgacggt tctggtagag ttgacatgtc tgaaagacca 1440
ggtttgacta ctccaagaga aatcgacttg gtttgtagag ttgttccaag agttgacgaa 1500
agagttatct ctggtcacta a 1521
<210> 155
<211> 510
<212> PRT
<213> 旋蒴苣苔(Dorcoceras hygrometricum)
<400> 155
Met Ser Asp Leu Val Gln Ile Thr Leu Ser Ala Ala Leu Leu Leu Leu
1 5 10 15
Ser Ala Ala Phe Leu His Thr Ile Phe Ala Thr Lys Arg Arg Arg Leu
20 25 30
Ser Pro Pro Pro Gly Pro Leu Ala Leu Pro Ile Ile Gly His Leu His
35 40 45
Leu Leu Gly Pro Arg Leu His Gln Thr Phe His Asp Leu Ser Leu Arg
50 55 60
His Gly Pro Ile Phe Asn Leu Arg Leu Gly Ser Val Ala Cys Ala Val
65 70 75 80
Val Ser Thr Pro Glu Leu Ala Lys Glu Cys Leu Lys Thr His Glu Leu
85 90 95
Val Phe Ser Ser Arg Lys His Ser Thr Ala Ile Asp Ile Val Thr Tyr
100 105 110
Asp Ser Ser Phe Ala Phe Ser Pro Tyr Gly Pro Tyr Trp Lys Tyr Ile
115 120 125
Lys Lys Leu Cys Thr Tyr Glu Leu Leu Gly Ala Arg Asn Leu Leu His
130 135 140
Phe Gln Pro Ile Arg Thr Leu Glu Val Asn Ser Phe Val Gly Thr Leu
145 150 155 160
Met Asn Lys Ala Glu Ser Gly Glu Ser Phe Asn Val Thr Glu Glu Leu
165 170 175
Val Lys Leu Thr Ser Asn Val Ile Ser His Met Met Leu Gly Ile Arg
180 185 190
Cys Ser Gly Thr Glu Gly Glu Ala Glu Ala Ala Arg Thr Val Ile Arg
195 200 205
Glu Val Thr Gln Ile Phe Gly Glu Phe Asp Val Ala Asp Ile Ile Trp
210 215 220
Phe Cys Lys Asn Phe Asp Phe Gln Gly Ile Arg Lys Arg Ser Glu Asp
225 230 235 240
Ile Gln Arg Arg Tyr Asp Ala Leu Leu Glu Lys Ile Ile Thr Asp Arg
245 250 255
Glu Glu Leu Arg Arg Ser His Gly Gly Ala Ala Gly Glu Ala Arg Asp
260 265 270
Phe Leu Asp Met Phe Leu Asp Ile Met Glu Gly Gly Lys Ser Glu Val
275 280 285
Thr Phe Thr Arg Glu His Leu Lys Ala Leu Ile Leu Asp Phe Phe Thr
290 295 300
Ala Gly Thr Asp Thr Thr Ala Ile Val Thr Glu Trp Ala Ile Ser Glu
305 310 315 320
Leu Ile Asn Asn Pro Lys Val Leu Glu Lys Ala Gln Gln Glu Ile Asp
325 330 335
Lys Val Ile Gly Ser Gly Arg Leu Val Gln Glu Ser Asp Ala Pro Asn
340 345 350
Leu Pro Tyr Leu Met Ala Val Ile Lys Glu Thr Phe Arg Leu His Pro
355 360 365
Pro Ile Pro Met Leu Ser Arg Lys Ser Ile Ser Asp Cys Val Ile Asp
370 375 380
Gly Tyr Asp Val Pro Ala Lys Ser Leu Leu Phe Val Asn Ile Trp Ser
385 390 395 400
Met Gly Arg Asn Pro Lys Ile Trp Glu Ser Pro Leu Glu Phe Arg Pro
405 410 415
Glu Arg Phe Leu Glu Arg Glu Lys Ser Ser Ile Asp Ile Lys Gly Gln
420 425 430
His Phe Glu Leu Leu Pro Phe Gly Thr Gly Arg Arg Gly Cys Pro Gly
435 440 445
Met Leu Leu Gly Ile Gln Glu Val Val Ile Ile Ile Gly Thr Met Val
450 455 460
Gln Cys Phe Asp Trp Lys Leu Ser Asp Gly Ser Gly Gln Val Asp Met
465 470 475 480
Thr Glu Arg Pro Gly Leu Thr Ala Pro Arg Ala His Asp Leu Phe Cys
485 490 495
Arg Val Val Pro Arg Ile Asn Pro Val Val Val Ser Gly Asn
500 505 510
<210> 156
<211> 1533
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:155的编码序列
<400> 156
atgtccgact tggttcaaat cactttgtct gctgctttgt tgttgttgtc tgctgctttc 60
ttgcacacta tcttcgctac taagagaaga agattgtctc caccaccagg tccattggct 120
ttgccaatca tcggtcactt gcacttgttg ggtccaagat tgcaccaaac tttccacgac 180
ttgtctttga gacacggtcc aatcttcaac ttgagattgg gttctgttgc ttgtgctgtt 240
gtttctactc cagaattggc taaggaatgt ttgaaaactc acgaattggt tttctcttct 300
agaaagcact ctactgctat cgacatcgtt acttacgact cttctttcgc tttctctcca 360
tacggtccat actggaagta catcaagaag ttgtgtactt acgaattgtt gggtgctaga 420
aacttgttgc acttccaacc aatcagaact ttggaagtta actctttcgt tggtactttg 480
atgaacaagg ctgaatctgg tgaatctttc aacgttactg aagaattggt taagttgact 540
tctaacgtta tctctcacat gatgttgggt atcagatgtt ctggtactga aggtgaagct 600
gaagctgcta gaactgttat cagagaagtt actcaaatct tcggtgaatt cgacgttgct 660
gacatcatct ggttctgtaa gaacttcgac ttccaaggta tcagaaagag atctgaagat 720
atccaaagaa gatacgacgc tttgttggaa aagatcatca ctgacagaga agaattgaga 780
agatctcacg gtggtgctgc tggtgaagct agagacttct tggacatgtt cttggacatc 840
atggaaggtg gtaagtctga agttactttc actagagaac acttgaaggc tttgatcttg 900
gacttcttca ctgctggtac tgacactact gctatcgtta ctgaatgggc tatctctgaa 960
ttgatcaaca acccaaaggt tttggaaaag gctcaacaag aaatcgacaa ggttatcggt 1020
tctggtagat tggttcaaga atctgacgct ccaaacttgc catacttgat ggctgttatc 1080
aaggaaactt tcagattgca cccaccaatc ccaatgttgt ctagaaagtc tatctctgac 1140
tgtgttatcg acggttacga cgttccagct aagtctttgt tgttcgttaa catctggtct 1200
atgggtagaa acccaaagat ctgggaatct ccattggaat tcagaccaga aagattcttg 1260
gaaagagaaa agtcatctat cgacatcaag ggtcaacact tcgaattgtt gccattcggt 1320
actggtagaa gaggttgtcc aggtatgttg ttgggtatcc aagaagttgt tatcatcatc 1380
ggtactatgg ttcaatgttt cgactggaag ttgtctgacg gttctggtca agttgacatg 1440
actgaaagac caggtttgac tgctccaaga gctcacgact tgttctgtag agttgttcca 1500
agaatcaacc cagttgttgt ttctggtaac taa 1533
<210> 157
<211> 507
<212> PRT
<213> 金鱼草(Antirrhinum majus)
<400> 157
Met Ser Ser Thr Leu Val Tyr Ser Thr Leu Phe Ile Leu Ser Thr Leu
1 5 10 15
Leu Leu Thr Leu Leu Thr Arg Thr Arg Arg Lys Thr Arg Pro Pro Gly
20 25 30
Pro Leu Ala Leu Pro Leu Ile Gly His Leu His Leu Leu Gly Pro Lys
35 40 45
Leu His His Thr Phe His Gln Phe Ser Gln Arg Tyr Gly Pro Leu Ile
50 55 60
Gln Leu Tyr Leu Gly Ser Val Pro Cys Val Val Ala Ser Thr Pro Glu
65 70 75 80
Leu Ala Arg Glu Phe Leu Lys Thr His Glu Leu Asp Phe Ser Ser Arg
85 90 95
Lys His Ser Thr Ala Ile Asp Ile Val Thr Tyr Asp Ser Ser Phe Ala
100 105 110
Phe Ala Pro Tyr Gly Pro Tyr Trp Lys Phe Ile Lys Lys Leu Cys Thr
115 120 125
Tyr Glu Leu Leu Gly Ala Arg Asn Leu Ser His Phe Gln Pro Ile Arg
130 135 140
Ala Leu Glu Val Asn Ser Phe Leu Arg Ile Leu Tyr Glu Lys Thr Glu
145 150 155 160
Gln Lys Gln Ser Val Asn Val Thr Glu Glu Leu Val Lys Leu Thr Ser
165 170 175
Asn Val Ile Ser Asn Met Met Leu Gly Ile Arg Cys Ser Gly Thr Glu
180 185 190
Gly Glu Ala Glu Val Ala Arg Thr Val Ile Arg Glu Val Thr Gln Ile
195 200 205
Phe Gly Glu Phe Asp Val Ser Glu Ile Val Trp Phe Cys Lys Asn Leu
210 215 220
Asp Leu Gln Gly Ile Arg Lys Arg Ser Glu Asp Ile Arg Arg Arg Tyr
225 230 235 240
Asp Ala Leu Leu Glu Lys Ile Ile Ser Asp Arg Glu Arg Leu Arg Leu
245 250 255
Arg Gly Gly Gly Gly Gly Gly Gly Gly Glu Val Lys Asp Phe Leu Asp
260 265 270
Met Leu Leu Asp Val Met Glu Ser Glu Lys Ser Glu Val Glu Phe Thr
275 280 285
Arg Glu His Leu Lys Ala Leu Ile Leu Asp Phe Phe Thr Ala Gly Thr
290 295 300
Asp Thr Thr Ala Ile Thr Thr Glu Trp Ala Ile Ala Glu Leu Ile Ser
305 310 315 320
Asn Pro Asn Val Leu Lys Lys Ala Gln Glu Glu Met Asp Lys Val Ile
325 330 335
Gly Ser Gln Arg Leu Leu Gln Glu Ser Asp Ala Pro Asn Leu Pro Tyr
340 345 350
Leu Asn Ala Ile Ile Lys Glu Thr Phe Arg Leu His Pro Pro Ile Pro
355 360 365
Met Leu Thr Arg Lys Ser Ile Ser Asp Val Val Val Asn Gly Tyr Thr
370 375 380
Ile Pro Ala Lys Thr Leu Leu Phe Val Asn Leu Trp Ser Met Gly Arg
385 390 395 400
Asn Pro Asn Tyr Trp Glu Asn Pro Met Glu Phe Arg Pro Glu Arg Phe
405 410 415
Leu Glu Lys Gly Thr Gly Ser Ile Asp Val Lys Gly Gln His Phe Glu
420 425 430
Leu Leu Pro Phe Gly Thr Gly Arg Arg Gly Cys Pro Gly Met Leu Leu
435 440 445
Gly Met Gln Glu Leu Phe Ser Ile Ile Gly Ala Met Val Gln Cys Phe
450 455 460
Asp Trp Lys Leu Pro Asp Gly Val Lys Ser Val Asp Met Thr Glu Arg
465 470 475 480
Pro Gly Leu Thr Ala Pro Arg Ala Asn Asp Leu Val Cys Gln Leu Val
485 490 495
Pro Arg Ile Asp Pro Val Val Val Ser Gly Pro
500 505
<210> 158
<211> 1524
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:157的编码序列
<400> 158
atgtcctcta ctttggttta ctctactttg ttcatcttgt ctactttgtt gttgactttg 60
ttgactagaa ctagaagaaa gactagacca ccaggtccat tggctttgcc attgatcggt 120
cacttgcact tgttgggtcc aaagttgcac cacactttcc accaattctc tcaaagatac 180
ggtccattga tccaattgta cttgggttct gttccatgtg ttgttgcttc tactccagaa 240
ttggctagag aattcttgaa aactcacgaa ttggacttct cttctagaaa gcactctact 300
gctatcgaca tcgttactta cgactcttct ttcgctttcg ctccatacgg tccatactgg 360
aagttcatca agaagttgtg tacttacgaa ttgttgggtg ctagaaactt gtctcacttc 420
caaccaatca gagctttgga agttaactct ttcttgagaa tcttgtacga aaagactgaa 480
caaaagcaat ctgttaacgt tactgaagaa ttggttaagt tgacttctaa cgttatctct 540
aacatgatgt tgggtatcag atgttctggt actgaaggtg aagctgaagt tgctagaact 600
gttatcagag aagttactca aatcttcggt gaattcgacg tttctgaaat cgtttggttc 660
tgtaagaact tggacttgca aggtatcaga aagagatctg aagatatcag aagaagatac 720
gacgctttgt tggaaaagat catctctgac agagaaagat tgagattgag aggtggtggt 780
ggtggtggtg gtggtgaagt taaggacttc ttggacatgt tgttggacgt tatggaatct 840
gaaaagtctg aagttgaatt cactagagaa cacttgaagg ctttgatctt ggacttcttc 900
actgctggta ctgacactac tgctatcact actgaatggg ctatcgctga attgatctct 960
aacccaaacg ttttgaagaa ggctcaagaa gaaatggaca aggttatcgg ttctcaaaga 1020
ttgttgcaag aatctgacgc tccaaacttg ccatacttga acgctatcat caaggaaact 1080
ttcagattgc acccaccaat cccaatgttg actagaaagt ctatctctga cgttgttgtt 1140
aacggttaca ctatcccagc taagactttg ttgttcgtta acttgtggtc tatgggtaga 1200
aacccaaact actgggaaaa cccaatggaa ttcagaccag aaagattctt ggaaaagggt 1260
actggttcta tcgacgttaa gggtcaacac ttcgaattgt tgccattcgg tactggtaga 1320
agaggttgtc caggtatgtt gttgggtatg caagaattgt tctctatcat cggtgctatg 1380
gttcaatgtt tcgactggaa gttgccagac ggtgttaagt ctgttgacat gactgaaaga 1440
ccaggtttga ctgctccaag agctaacgac ttggtttgtc aattggttcc aagaatcgac 1500
ccagttgttg tttctggtcc ataa 1524
<210> 159
<211> 511
<212> PRT
<213> Erythranthe lewisii
<400> 159
Met Ser Asn Gln Thr Met Asp Leu Pro Glu Ile Cys Leu Tyr Ala Val
1 5 10 15
Ile Leu Phe Val Ser Thr Leu Leu Ile Leu Gly Ile Tyr Lys Arg Lys
20 25 30
Arg Ser His Ile Pro Ser Pro Pro Gly Pro Phe Ala Leu Pro Val Ile
35 40 45
Gly His Leu His Leu Leu Gly Pro Arg Ile His His Thr Phe His Asp
50 55 60
Leu Ser Gln Arg Tyr Gly Pro Leu Phe Gln Leu Ser Leu Gly Ser Val
65 70 75 80
Arg Cys Val Val Val Ser Thr Pro Glu Leu Ala Arg Glu Phe Leu Lys
85 90 95
Thr His Glu Leu Val Phe Ser Ser Arg Lys His Thr Thr Ala Ile Asp
100 105 110
Ile Val Thr Tyr Glu Ser Ser Phe Ala Phe Ser Pro Tyr Gly Pro Tyr
115 120 125
Trp Lys Tyr Ile Lys Lys Leu Cys Thr Tyr Glu Leu Leu Gly Ala Arg
130 135 140
Asn Leu Ala Asn Phe Glu Pro Val Arg Asn Val Glu Ile Lys Asp Phe
145 150 155 160
Leu Lys Val Met Ser Asn Lys Ala Asn Thr Gly Glu Ile Val Asn Val
165 170 175
Thr Glu Glu Leu Val Lys Leu Thr Ser Asn Val Ile Ser His Met Met
180 185 190
Leu Gly Ile Arg Cys Ser Gly Thr Glu Gly Glu Ala Glu Ala Ala Arg
195 200 205
Asn Val Ile Arg Asp Val Thr Gln Ile Phe Gly Glu Phe Asp Val Ser
210 215 220
Asp Ile Ile Trp Phe Cys Lys Asn Phe Asp Leu Gln Gly Ile Arg Arg
225 230 235 240
Arg Ser Glu Asp Ile Gln Lys Arg Tyr Asp Gly Leu Leu Glu Lys Ile
245 250 255
Ile Thr Asp Arg Glu Lys Thr Arg Gly Gly Gly Gly Gly Gly Val Lys
260 265 270
Asp Phe Leu Asp Met Leu Leu Asp Val Met Asp Ser Lys Asn Ser Asp
275 280 285
Val Lys Phe Thr Arg Glu His Leu Lys Ala Leu Ile Leu Asp Phe Phe
290 295 300
Thr Ala Gly Thr Asp Thr Thr Ala Ile Ala Val Glu Trp Ser Ile Ala
305 310 315 320
Glu Leu Leu Arg Asn Pro Lys Val Ile Lys Lys Ala Gln Gln Glu Ile
325 330 335
Asp Asn Val Val Gly Ser Gln Arg Leu Leu Gln Glu Ser Asp Ala Pro
340 345 350
Lys Leu Pro Tyr Ile Met Ala Ile Ile Lys Glu Thr Phe Arg Leu His
355 360 365
Pro Pro Ile Pro Met Ile Ser Arg Lys Ser Val Ser Asp Cys Ala Ile
370 375 380
Asn Gly Cys Met Ile Arg Ala Asn Thr Leu Leu Phe Val Asn Ile Trp
385 390 395 400
Ser Ile Gly Arg Asn Pro Met Tyr Trp Glu Arg Pro Met Glu Phe Arg
405 410 415
Pro Glu Arg Phe Leu Asp Pro Gly Cys Gly Ser Ile Asp Val Lys Gly
420 425 430
Gln Asn Phe Glu Leu Met Pro Phe Gly Thr Gly Arg Arg Gly Cys Pro
435 440 445
Gly Met Leu Leu Ala Met Gln Glu Leu Val Ala Ile Ile Gly Ala Met
450 455 460
Val Gln Cys Phe Glu Trp Gln Leu Pro Asp Asp Ser Gln Asp Val Asp
465 470 475 480
Met Thr Glu Arg Pro Gly Leu Thr Ala Pro Arg Ala Asn Asp Leu Phe
485 490 495
Cys Arg Val Val Pro Arg Val Asp Val Ala Val Val Ser Gly Asn
500 505 510
<210> 160
<211> 1536
<212> DNA
<213> 人工的
<220>
<223> SEQ ID NO:159的编码序列
<400> 160
atgtccaacc aaactatgga cttgccagaa atctgtttgt acgctgttat cttgttcgtt 60
tctactttgt tgatcttggg tatctacaag agaaagagat ctcacatccc atctccacca 120
ggtccattcg ctttgccagt tatcggtcac ttgcacttgt tgggtccaag aatccaccac 180
actttccacg acttgtctca aagatacggt ccattgttcc aattgtcttt gggttctgtt 240
agatgtgttg ttgtttctac tccagaattg gctagagaat tcttgaaaac tcacgaattg 300
gttttctctt ctagaaagca cactactgct atcgacatcg ttacttacga atcttctttc 360
gctttctctc catacggtcc atactggaag tacatcaaga agttgtgtac ttacgaattg 420
ttgggtgcta gaaacttggc taacttcgaa ccagttagaa acgttgaaat caaggacttc 480
ttgaaggtta tgtctaacaa ggctaacact ggtgaaatcg ttaacgttac tgaagaattg 540
gttaagttga cttctaacgt tatctctcac atgatgttgg gtatcagatg ttctggtact 600
gaaggtgaag ctgaagctgc tagaaacgtt atcagagatg ttactcaaat cttcggtgaa 660
ttcgacgttt ctgacatcat ctggttctgt aagaacttcg acttgcaagg tatcagaaga 720
agatctgaag atatccaaaa gagatacgac ggtttgttgg aaaagatcat cactgacaga 780
gaaaagacta gaggtggtgg tggtggtggt gttaaggact tcttggacat gttgttggac 840
gttatggact ctaagaactc tgacgttaag ttcactagag aacacttgaa ggctttgatc 900
ttggacttct tcactgctgg tactgacact actgctatcg ctgttgaatg gtctatcgct 960
gaattgttga gaaacccaaa ggttatcaag aaggctcaac aagaaatcga caacgttgtt 1020
ggttctcaaa gattgttgca agaatctgac gctccaaagt tgccatacat catggctatc 1080
atcaaggaaa ctttcagatt gcacccacca atcccaatga tctctagaaa gtctgtttct 1140
gactgtgcta tcaacggttg tatgatcaga gctaacactt tgttgttcgt taacatctgg 1200
tctatcggta gaaacccaat gtactgggaa agaccaatgg aattcagacc agaaagattc 1260
ttggacccag gttgtggttc tatcgacgtt aagggtcaaa acttcgaatt gatgccattc 1320
ggtactggta gaagaggttg tccaggtatg ttgttggcta tgcaagaatt ggttgctatc 1380
atcggtgcta tggttcaatg tttcgaatgg caattgccag acgactctca agacgttgac 1440
atgactgaaa gaccaggttt gactgctcca agagctaacg acttgttctg tagagttgtt 1500
ccaagagttg acgttgctgt tgtttctggt aactaa 1536

Claims (32)

1.一种重组微生物,其包含:
-编码能够在橙皮素和/或香叶木素的7位中添加葡萄糖的黄烷酮7-O-β-D-葡萄糖基转移酶(UGT)的异源核酸序列;和
-编码能够将鼠李糖转移到橙皮素-7-O-葡萄糖苷和/或香叶木素-7-O-葡萄糖苷的葡萄糖的6位中的6”-O-鼠李糖基转移酶(RhaT)的异源核酸序列;和
-编码能够产生UDP-鼠李糖的UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶(RHM)的异源核酸序列。
2.根据权利要求1所述的微生物,其中所述黄烷酮7-O-β-D-葡萄糖基转移酶是来自于甜橙(Citrus sinensis)、克莱门柚(Citrus clementina)、拟南芥(Arabidopsisthaliana)、黄芩(Scutellaria baicalensis)或智人(Homo sapiens)的酶,优选地是来自于甜橙或黄芩的酶。
3.根据权利要求1或2所述的微生物,其中所述黄烷酮7-O-β-D-葡萄糖基转移酶选自:包含选自SEQ ID NO:113、115、91、93、95、97、99和101的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽,优选地选自:包含选自SEQ ID NO:113、115、91、93、95和97的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽。
4.根据权利要求1-3中的任一项所述的微生物,其中所述黄烷酮7-O-β-D-葡萄糖基转移酶选自:包含选自SEQ ID NO:113和95的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽,优选地选自:包含选自SEQ ID NO:113的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽。
5.根据权利要求1-4中的任一项所述的微生物,其中所述6”-O-鼠李糖基转移酶是柑橘属(Citrus)或矮牵牛(Petunia hybrida)的酶,优选为甜橙、柚子(Citrus maxima)或克莱门柚的酶,更优选为甜橙或克莱门柚的酶。
6.根据权利要求1-5中的任一项所述的微生物,其中所述6”-O-鼠李糖基转移酶选自:包含选自SEQ ID NO:103和105的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有6”-O-鼠李糖基转移酶活性的多肽,优选地,所述6”-O-鼠李糖基转移酶选自:包含选自SEQ ID NO:103的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有6”-O-鼠李糖基转移酶活性的多肽。
7.根据权利要求1-6中的任一项所述的微生物,其中所述UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶来自于甜橙或拟南芥。
8.根据权利要求1-6中的任一项所述的微生物,其中所述UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶选自:包含选自SEQ ID NO:107、109和111的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶活性的多肽,优选地,所述UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶选自:包含选自SEQ ID NO:107的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶活性的多肽。
9.根据权利要求1-8中的任一项所述的微生物,其中
-所述黄烷酮7-O-β-D-葡萄糖基转移酶选自:包含选自SEQ ID NO:113和95的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽,优选地选自:包含选自SEQ ID NO:113的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽;并且
-所述6”-O-鼠李糖基转移酶选自:包含选自SEQ ID NO:103的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有6”-O-鼠李糖基转移酶活性的多肽;并且
-所述UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶选自:包含选自SEQ ID NO:107的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶活性的多肽。
10.根据权利要求1-9中的任一项所述的微生物,所述微生物还包含:
-编码酪氨酸解氨酶(TAL)的异源核酸序列;
-编码4-香豆酰辅酶A连接酶(4CL)的异源核酸序列;
-编码柚皮素-查尔酮合酶(CHS)的异源核酸序列;和
-编码查尔酮异构酶(CHI)的异源核酸序列。
11.根据权利要求10所述的微生物,其特征在于所述微生物包含:
-编码酪氨酸解氨酶(TAL)的异源核酸序列,所述酪氨酸解氨酶(TAL)来自于黏红酵母(Rhodotorula glutinis)或约氏黄杆菌(Flavobacterium johnsoniae),特别是包含选自SEQ ID NO:41和39的序列的TAL和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有酪氨酸解氨酶活性的多肽,优选为包含选自SEQ ID NO:41的序列的TAL和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有酪氨酸解氨酶活性的多肽;
-编码4-香豆酰辅酶A连接酶(4CL)的异源核酸序列,所述4-香豆酰辅酶A连接酶(4CL)来自于拟南芥、克莱门柚、荷兰芹(Petroselinum crispum)或棒状链霉菌(Streptomycesclavuligerus),优选为包含选自SEQ ID NO:123、125、43、45、47和49的序列的4CL和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有4-香豆酰辅酶A连接酶活性的多肽,特别是包含选自SEQ ID NO:123、125和45的序列的4CL和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有4-香豆酰辅酶A连接酶活性的多肽,优选为包含选自SEQ ID NO:45的序列的4CL和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有4-香豆酰辅酶A连接酶活性的多肽;
-编码查尔酮合酶(CHS)的异源核酸序列,所述查尔酮合酶(CHS)来自于甜橙、大麦(Hordeum vulgare)或棒状链霉菌,特别是包含选自SEQ ID NO:53、51、55和57的序列的CHS和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有查尔酮合酶活性的多肽,优选为包含选自SEQ ID NO:53的序列的CHS和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有查尔酮合酶活性的多肽;和
-编码查尔酮异构酶(CHI)的异源核酸序列,所述查尔酮异构酶(CHI)来自于拟南芥或棒状链霉菌,特别是包含选自SEQ ID NO:61和59的序列的CHI和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有查尔酮异构酶活性的多肽,优选为包含选自SEQ ID NO:61的序列的CHI和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有查尔酮异构酶活性的多肽。
12.根据权利要求10或11所述的微生物,其特征在于所述微生物包含:
-编码酪氨酸解氨酶(TAL)的异源核酸序列,所述酪氨酸解氨酶(TAL)选自:包含选自SEQ ID NO:41的序列的TAL和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有酪氨酸解氨酶活性的多肽;和
-编码4-香豆酰辅酶A连接酶(4CL)的异源核酸序列,所述4-香豆酰辅酶A连接酶(4CL)选自:包含选自SEQ ID NO:123、125和45的序列的4CL和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有4-香豆酰辅酶A连接酶活性的多肽;和
-编码查尔酮合酶(CHS)的异源核酸序列,所述查尔酮合酶(CHS)选自:包含选自SEQ IDNO:53的序列的CHS和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有查尔酮合酶活性的多肽;和
-编码查尔酮异构酶(CHI)的异源核酸序列,所述查尔酮异构酶(CHI)选自:包含选自SEQ ID NO:61的序列的CHI和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有查尔酮异构酶活性的多肽。
13.根据权利要求10至12中的任一项所述的微生物,其特征在于所述微生物包含:
-编码酪氨酸解氨酶(TAL)的异源核酸序列,所述酪氨酸解氨酶(TAL)选自:包含选自SEQ ID NO:41的序列的TAL和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有酪氨酸解氨酶活性的多肽;和
-编码4-香豆酰辅酶A连接酶(4CL)的异源核酸序列,所述4-香豆酰辅酶A连接酶(4CL)选自:包含选自SEQ ID NO:45的序列的4CL和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有4-香豆酰辅酶A连接酶活性的多肽;
-编码查尔酮合酶(CHS)的异源核酸序列,所述查尔酮合酶(CHS)选自:包含选自SEQ IDNO:53的序列的CHS和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有查尔酮合酶活性的多肽;和
-编码查尔酮异构酶(CHI)的异源核酸序列,所述查尔酮异构酶(CHI)选自:包含选自SEQ ID NO:61的序列的CHI和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有查尔酮异构酶活性的多肽。
14.根据权利要求1至13中的任一项所述的微生物,其特征在于所述微生物还包含编码黄酮类化合物3’-单加氧酶(F3’H)的异源核酸序列。
15.根据权利要求14所述的微生物,其特征在于所述微生物包含编码黄酮类化合物3’-单加氧酶(F3’H)的异源核酸序列,所述黄酮类化合物3’-单加氧酶(F3’H)来自于翠菊(Callistephus chinensis)、回回苏(Perilla frutescens var.crispa)、矮牵牛(Petuniax hybrida)、非洲菊(Gerbera hybrida)、甜橙、拟南芥、克莱门柚、蓝眼菊(Osteospermumhybrid cultivar)、黄孢原毛平革菌(Phanerochaete chrysosporium)、阿维链霉菌(Streptomyces avermitilis)或山柳兰(Pilosella officinarum),特别是来自于翠菊、回回苏、矮牵牛、非洲菊、甜橙、拟南芥或山柳兰,优选为包含选自SEQ ID NO:7、1、3、5、9、11、13、15、17、19、21和121的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮类化合物3’-单加氧酶活性的多肽,优选地选自具有SEQ IDNO:7、11、17和121的酶和与这些序列之一具有至少60、70、80、85、90或95%同一性并具有黄酮类化合物3’-单加氧酶活性的多肽。
16.根据权利要求14或15所述的微生物,其特征在于所述微生物包含编码黄酮类化合物3’-单加氧酶(F3’H)的异源核酸序列,所述黄酮类化合物3’-单加氧酶(F3’H)选自:包含选自SEQ ID NO:7、17和121的序列的F3’H和与这些序列之一具有至少60、70、80、85、90或95%序列同一性并具有黄酮类化合物3’-单加氧酶活性的多肽,优选为包含选自SEQ IDNO:7的序列的F3’H和与该序列具有至少60、70、80、85、90或95%同一性并具有黄酮类化合物3’-单加氧酶活性的多肽。
17.根据权利要求1至16中的任一项所述的微生物,其特征在于所述微生物还包含编码O-甲基转移酶(OMT)的异源核酸序列。
18.根据权利要求17所述的微生物,其特征在于所述微生物包含编码O-甲基转移酶(OMT)的异源核酸序列,所述O-甲基转移酶(OMT)来自于柑橘属特别是克莱门柚或甜橙、来自于智人或来自于拟南芥,优选为包含选自SEQ ID NO:119、117、87和89的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有O-甲基转移酶活性的多肽。
19.根据权利要求17或18所述的微生物,其特征在于所述微生物还包含编码O-甲基转移酶(OMT)的异源核酸序列,所述O-甲基转移酶(OMT)选自:包含选自SEQ ID NO:119、117和89的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有O-甲基转移酶活性的多肽,优选为包含选自SEQ ID NO:119和117的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有O-甲基转移酶活性的多肽。
20.根据权利要求1至19中的任一项所述的微生物,所述微生物还包含:
-编码苯丙氨酸解氨酶(PAL)的异源核酸序列,所述苯丙氨酸解氨酶(PAL)特别是包含选自SEQ ID NO:63、65和77、优选为SEQ ID NO:65和77的序列的PAL和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有苯丙氨酸解氨酶活性的多肽,更特别优选为包含选自SEQ ID NO:65的序列的苯丙氨酸解氨酶(PAL)和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有苯丙氨酸解氨酶活性的多肽;和
-编码肉桂酸4-羟化酶(C4H)的异源核酸序列,所述肉桂酸4-羟化酶(C4H)特别是包含选自SEQ ID NO:67、69和79的序列的C4H和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有肉桂酸4-羟化酶活性的多肽,最特别优选为包含选自SEQID NO:79的序列的肉桂酸4-羟化酶(C4H)和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有肉桂酸4-羟化酶活性的多肽。
21.根据权利要求1至20中的任一项所述的微生物,所述微生物还包含编码黄酮合酶(FNS)的异源或内源核酸序列。
22.根据权利要求21所述的微生物,其特征在于所述微生物包含编码黄酮合酶(FNS)的异源核酸序列,所述黄酮合酶(FNS)来自于拟南芥、金银花(Lonicera japonica)、灰毡毛忍冬(Lonicera macranthoides)、蒺藜状苜蓿(Medicago truncatula)、水稻(Oryzasativa)、荷兰芹、美洲黑杨(Populus deltoides)、玉米(Zea mays)、翠菊、芹菜(Apiumgraveolens)、蒺藜状苜蓿、孜然(Cuminum cyminum)、毒欧芹(Aethusa cynapium)、圆叶当归(Angelica archangelica)、毒芹(Conium maculatum)、茶树(Camellia sinensis)、朝鲜蓟(Cynara cardunculus var scolymus)、水母雪莲(Saussurea medusa)、毛喉鞘蕊花(Plectranthus barbatus)、黄芩、旋蒴苣苔(Dorcoceras hygrometricum)、金鱼草(Antirrhinum majus)、回回苏、大丽花(Dahlia pinnata)或Erythranthe lewisii,优选地来自于金银花、灰毡毛忍冬和荷兰芹,优选为包含选自SEQ ID NO:33、35、37、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157和159的序列的FNS和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮合酶活性的多肽,优选为包含选自SEQ ID NO:33、35和37的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮合酶活性的多肽,优选为包含选自SEQID NO:37的序列的黄酮合酶(FNS)和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮合酶活性的多肽。
23.根据权利要求1至22中的任一项所述的微生物,所述微生物还包含:
-编码细胞色素P450还原酶(CPR)的异源核酸序列;和/或
-编码S-腺苷甲硫氨酸合成酶(SAMT)的异源或内源核酸序列。
24.根据权利要求23所述的微生物,其特征在于所述微生物包含编码细胞色素P450还原酶(CPR)的异源核酸序列,所述细胞色素P450还原酶(CPR)来自于酿酒酵母(Saccharomyces cerevisiae)或来自于植物例如长春花(Catharanthus roseus)或拟南芥,优选为包含选自SEQ ID NO:25、23、27、29和31的序列的CPR和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有细胞色素P450还原酶活性的多肽,优选选自:包含选自SEQ ID NO:23、25和29的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有细胞色素P450还原酶活性的多肽,特别是选自:包含选自SEQ ID NO:25的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有细胞色素P450还原酶活性的多肽。
25.根据权利要求1至24中的任一项所述的微生物,其特征在于所述微生物包含:
-编码苯丙氨酸解氨酶(PAL)的异源核酸序列,所述苯丙氨酸解氨酶(PAL)选自:包含选自SEQ ID NO:65的序列的PAL和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有苯丙氨酸解氨酶活性的多肽;
-编码肉桂酸4-羟化酶(C4H)的异源核酸序列,所述肉桂酸4-羟化酶(C4H)选自:包含选自SEQ ID NO:79的序列的C4H和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有肉桂酸4-羟化酶活性的多肽;
-编码酪氨酸解氨酶(TAL)的异源核酸序列,所述酪氨酸解氨酶(TAL)选自:包含选自SEQ ID NO:41的序列的TAL和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有酪氨酸解氨酶活性的多肽;
-编码4-香豆酰辅酶A连接酶(4CL)的异源核酸序列,所述4-香豆酰辅酶A连接酶(4CL)选自:包含选自SEQ ID NO:45或123的序列的4CL和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有4-香豆酰辅酶A连接酶活性的多肽;
-编码查尔酮合酶(CHS)的异源核酸序列,所述查尔酮合酶(CHS)选自:包含选自SEQ IDNO:53的序列的CHS和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有查尔酮合酶活性的多肽;
-编码查尔酮异构酶(CHI)的异源核酸序列,所述查尔酮异构酶(CHI)选自:包含选自SEQ ID NO:61的序列的CHI和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有查尔酮异构酶活性的多肽;
-编码黄酮类化合物3’-单加氧酶(F3’H)的异源核酸序列,所述黄酮类化合物3’-单加氧酶(F3’H)选自:包含选自SEQ ID NO:7、17和121的序列的F3’H和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮类化合物3’-单加氧酶活性的多肽,优选为包含选自SEQ ID NO:7的序列的F3’H和包含与序列SEQ ID NO:7具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮类化合物3’-单加氧酶活性的多肽;
-编码黄酮合酶(FNS)的异源核酸序列,所述黄酮合酶(FNS)选自:包含选自SEQ ID NO:37的序列的FNS和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有黄酮合酶活性的多肽;和
-编码细胞色素P450还原酶(CPR)的异源核酸序列,所述细胞色素P450还原酶(CPR)选自:包含选自SEQ ID NO:25的序列的CPR和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有细胞色素P450还原酶活性的多肽;和
-编码O-甲基转移酶(OMT)的异源核酸序列,所述O-甲基转移酶(OMT)选自:包含选自SEQ ID NO:117和119的序列的OMT和包含与这些序列之一具有至少60、70、80、85、90或95%同一性的序列并具有O-甲基转移酶活性的多肽,优选为包含选自SEQ ID NO:117的序列的OMT和包含与该序列具有至少60、70、80、85、90或95%同一性的序列并具有O-甲基转移酶活性的多肽;和
-编码黄烷酮7-O-β-D-葡萄糖基转移酶的异源核酸序列,所述黄烷酮7-O-β-D-葡萄糖基转移酶选自:包含选自SEQ ID NO:113和95的序列的酶和包含与这些序列之一具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽,优选为包含选自SEQ ID NO:113的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有黄烷酮7-O-β-D-葡萄糖基转移酶活性的多肽;和
-编码6”-O-鼠李糖基转移酶的异源核酸序列,所述6”-O-鼠李糖基转移酶选自:包含选自SEQ ID NO:103的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有6”-O-鼠李糖基转移酶活性的多肽;和
-编码UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶的异源核酸序列,所述UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶选自:包含选自SEQ ID NO:107的序列的酶和包含与该序列具有至少60、70、80、85、90或95%序列同一性的序列并具有UDP-葡萄糖4,6-脱水酶/UDP-4-酮基-6-脱氧-D-葡萄糖3,5-差向异构酶/UDP-4-酮基-L-鼠李糖-还原酶活性的多肽。
26.根据权利要求1-25中的任一项所述的微生物,其中所述微生物是酵母或细菌,优选为酵母属(Saccharomyces)的酵母特别是酿酒酵母或细菌例如大肠埃希氏杆菌(Escherichia coli)。
27.根据权利要求1-26中的任一项所述的微生物用于生产香叶木苷和/或橙皮苷的用途。
28.一种生产香叶木苷和/或橙皮苷的方法,所述方法包括培养根据权利要求1-26中的任一项所述的微生物和收获所述香叶木苷和橙皮苷。
29.根据权利要求27所述的用途或根据权利要求28所述的方法,其用于生产橙皮苷。
30.根据权利要求27所述的用途或根据权利要求28所述的方法,其用于生产香叶木苷。
31.根据权利要求27所述的用途或根据权利要求28所述的方法,其用于生产橙皮苷和香叶木苷。
32.根据权利要求27、29、30或31所述的用途或根据权利要求28-31所述的方法,其特征在于不向培养基供应柚皮素、芹菜素、圣草酚、木犀草素、橙皮素和/或香叶木素。
CN202080020228.0A 2019-02-11 2020-02-11 在微生物中生物合成香叶木苷和/或橙皮苷的方法 Pending CN113574177A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP19305163 2019-02-11
EP19305163.8 2019-02-11
PCT/EP2020/053503 WO2020165189A1 (fr) 2019-02-11 2020-02-11 Methode de biosynthese de la diosmine et/ou de l'hesperidine dans un microorganisme

Publications (1)

Publication Number Publication Date
CN113574177A true CN113574177A (zh) 2021-10-29

Family

ID=65635605

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080020228.0A Pending CN113574177A (zh) 2019-02-11 2020-02-11 在微生物中生物合成香叶木苷和/或橙皮苷的方法

Country Status (7)

Country Link
US (1) US11987829B2 (zh)
EP (1) EP3924498A1 (zh)
KR (1) KR20210126061A (zh)
CN (1) CN113574177A (zh)
BR (1) BR112021015766A2 (zh)
CA (1) CA3129605A1 (zh)
WO (1) WO2020165189A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112391397A (zh) * 2020-11-25 2021-02-23 云南中烟工业有限责任公司 一种烟草黄酮单加氧酶基因NtCYP75B2及其应用
CN112921049A (zh) * 2021-02-06 2021-06-08 石河子大学 一种用于生产香草醛的基因片段、酿酒酵母工程菌及其构建方法
CN114164161A (zh) * 2022-02-15 2022-03-11 佛山市汇腾生物技术有限公司 一种生产新橙皮苷的双酶共表达菌株及其构建方法和应用
CN114181964A (zh) * 2021-11-02 2022-03-15 云南大学 一种表达盒组合、重组载体和重组酿酒酵母及其应用
CN114574458A (zh) * 2022-02-28 2022-06-03 江南大学 可以提高柚皮素产量的查尔酮合成酶突变体
CN117330677A (zh) * 2023-11-24 2024-01-02 成都凡微析医药科技有限公司 一种用于柑橘黄酮片生物等效性研究的香叶木素和橙皮素定量检测的方法

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220031771A1 (en) * 2020-07-31 2022-02-03 Iowa State University Research Foundation, Inc. Microencapsulated and chromosome integrated compositions for l-dopa microbiome therapy
CN112391360B (zh) * 2020-11-04 2022-09-06 江南大学 黄酮3β-羟化酶还原酶突变体及其应用
CN112725256B (zh) * 2021-02-22 2023-01-20 湖南省农产品加工研究所 重组大肠杆菌及利用重组大肠杆菌生物合成香叶木素的方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8809028B2 (en) 2011-11-07 2014-08-19 University Of Georgia Research Foundation, Inc. Biosynthesis of caffeic acid and caffeic acid derivatives by recombinant microorganisms
WO2015092013A1 (en) 2013-12-20 2015-06-25 Deinove Is-targeting system for gene insertion and genetic engineering in deinococcus bacteria
EP3321273B1 (en) 2016-08-30 2022-02-23 Chengdu Okay Pharmaceutical Co., Ltd Preparation method of diosmin
CN108504680A (zh) 2018-03-01 2018-09-07 华中农业大学 一种橙皮苷的制备方法
WO2019076021A1 (zh) 2018-04-25 2019-04-25 邦泰生物工程(深圳)有限公司 一种橙皮素的制备方法、橙皮素中间体的制备方法和用于制备橙皮素的生物酶

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112391397A (zh) * 2020-11-25 2021-02-23 云南中烟工业有限责任公司 一种烟草黄酮单加氧酶基因NtCYP75B2及其应用
CN112391397B (zh) * 2020-11-25 2023-01-31 云南中烟工业有限责任公司 一种烟草黄酮单加氧酶基因NtCYP75B2及其应用
CN112921049A (zh) * 2021-02-06 2021-06-08 石河子大学 一种用于生产香草醛的基因片段、酿酒酵母工程菌及其构建方法
CN112921049B (zh) * 2021-02-06 2024-01-23 石河子大学 一种用于生产香草醛的基因片段、酿酒酵母工程菌及其构建方法
CN114181964A (zh) * 2021-11-02 2022-03-15 云南大学 一种表达盒组合、重组载体和重组酿酒酵母及其应用
CN114164161A (zh) * 2022-02-15 2022-03-11 佛山市汇腾生物技术有限公司 一种生产新橙皮苷的双酶共表达菌株及其构建方法和应用
CN114574458A (zh) * 2022-02-28 2022-06-03 江南大学 可以提高柚皮素产量的查尔酮合成酶突变体
CN114574458B (zh) * 2022-02-28 2023-07-18 江南大学 可以提高柚皮素产量的查尔酮合成酶突变体
CN117330677A (zh) * 2023-11-24 2024-01-02 成都凡微析医药科技有限公司 一种用于柑橘黄酮片生物等效性研究的香叶木素和橙皮素定量检测的方法
CN117330677B (zh) * 2023-11-24 2024-02-23 成都凡微析医药科技有限公司 一种用于柑橘黄酮片生物等效性研究的香叶木素和橙皮素定量检测的方法

Also Published As

Publication number Publication date
EP3924498A1 (fr) 2021-12-22
US11987829B2 (en) 2024-05-21
BR112021015766A2 (pt) 2021-11-03
KR20210126061A (ko) 2021-10-19
WO2020165189A1 (fr) 2020-08-20
CA3129605A1 (fr) 2020-08-20
US20220042061A1 (en) 2022-02-10

Similar Documents

Publication Publication Date Title
CN113574177A (zh) 在微生物中生物合成香叶木苷和/或橙皮苷的方法
CN113748204A (zh) 在微生物中生物合成香叶木素和/或橙皮素的方法
AU2020200157B2 (en) Recombinant production of steviol glycosides
US20210198711A1 (en) Production of steviol glycosides in recombinant hosts
KR101983115B1 (ko) 사프란 화합물의 재조합 생성을 위한 방법 및 물질
KR102281806B1 (ko) 3-hp를 생산할 수 있는 재조합 효모 및 이를 이용한 3-hp의 제조방법
CN101160393A (zh) 用于生产白藜芦醇或者其寡聚或糖苷结合衍生物的代谢改造细胞
CN107771214A (zh) 用于具有增加的2,4‑二羟基丁酸外排物的优化的2,4‑二羟基丁酸产生的修饰的微生物
CN113755354B (zh) 利用葡萄糖生产天麻素的重组酿酒酵母及其用途
CN114207108A (zh) 产生糖基化大麻素的基因修饰的宿主细胞
CN108866030A (zh) 雷公藤三萜合酶TwOSC1及其编码基因与应用
WO2018211032A1 (en) Production of steviol glycosides in recombinant hosts
US20190071474A1 (en) Production of gibberellins in recombinant hosts
JP2021535757A (ja) バイカレインおよびスクテラレインを合成する微生物、その製造方法およびその使用
CN114703113A (zh) 一株重组拟无枝酸菌、其构建方法及应用
CN115335514A (zh) 罗汉果甙的生物合成
AU2018200459A1 (en) Recombinant production of steviol glycosides
CN109790558A (zh) 方法
KR102336516B1 (ko) 변이형 2-데옥시-실로-이노소스 합성효소
CN112877349A (zh) 一种重组表达载体、包含其的基因工程菌及其应用
CN114317306B (zh) 一种合成白藜芦醇的基因工程菌株及其构建方法与应用
CN114599778A (zh) 生产多胺缀合物的酵母
CN117413066A (zh) 使用微生物宿主的类黄酮和花青素的生物产生
CN116515876A (zh) 异源合成黄酮类化合物的调控方法与应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination