CN107109377A - 生产罗汉果苷的方法和包含其的组合物及其用途 - Google Patents

生产罗汉果苷的方法和包含其的组合物及其用途 Download PDF

Info

Publication number
CN107109377A
CN107109377A CN201580061244.3A CN201580061244A CN107109377A CN 107109377 A CN107109377 A CN 107109377A CN 201580061244 A CN201580061244 A CN 201580061244A CN 107109377 A CN107109377 A CN 107109377A
Authority
CN
China
Prior art keywords
leu
momordica grosvenori
gly
ala
val
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201580061244.3A
Other languages
English (en)
Inventor
M.伊特金
R.达维多维奇-里卡纳蒂
S.科亨
V.波特诺伊
A.多龙-费根博伊姆
M.佩特雷科夫
S.申
Y.塔德莫
Y.伯格
E.勒温索恩
N.卡特兹
A.A.沙弗
E.奥伦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State of Israel
Original Assignee
State of Israel
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State of Israel filed Critical State of Israel
Publication of CN107109377A publication Critical patent/CN107109377A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P33/00Preparation of steroids
    • C12P33/12Acting on D ring
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23LFOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
    • A23L2/00Non-alcoholic beverages; Dry compositions or concentrates therefor; Their preparation
    • A23L2/52Adding ingredients
    • A23L2/60Sweeteners
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23LFOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
    • A23L27/00Spices; Flavouring agents or condiments; Artificial sweetening agents; Table salts; Dietetic salt substitutes; Preparation or treatment thereof
    • A23L27/30Artificial sweetening agents
    • A23L27/33Artificial sweetening agents containing sugars or derivatives
    • A23L27/36Terpene glycosides
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07JSTEROIDS
    • C07J17/00Normal steroids containing carbon, hydrogen, halogen or oxygen, having an oxygen-containing hetero ring not condensed with the cyclopenta(a)hydrophenanthrene skeleton
    • C07J17/005Glycosides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • C12N9/0083Miscellaneous (1.14.99)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/90Isomerases (5.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/44Preparation of O-glycosides, e.g. glucosides
    • C12P19/56Preparation of O-glycosides, e.g. glucosides having an oxygen atom of the saccharide radical directly bound to a condensed ring system having three or more carbocyclic rings, e.g. daunomycin, adriamycin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P33/00Preparation of steroids
    • C12P33/20Preparation of steroids containing heterocyclic rings
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y114/00Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
    • C12Y114/99Miscellaneous (1.14.99)
    • C12Y114/99007Squalene monooxygenase (1.14.99.7)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/02Pentosyltransferases (2.4.2)
    • C12Y204/02017ATP phosphoribosyltransferase (2.4.2.17)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y402/00Carbon-oxygen lyases (4.2)
    • C12Y402/01Hydro-lyases (4.2.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y504/00Intramolecular transferases (5.4)
    • C12Y504/99Intramolecular transferases (5.4) transferring other groups (5.4.99)
    • C12Y504/99033Cucurbitadienol synthase (5.4.99.33)
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23VINDEXING SCHEME RELATING TO FOODS, FOODSTUFFS OR NON-ALCOHOLIC BEVERAGES AND LACTIC OR PROPIONIC ACID BACTERIA USED IN FOODSTUFFS OR FOOD PREPARATION
    • A23V2002/00Food compositions, function of food ingredients or processes for food or foodstuffs

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Polymers & Plastics (AREA)
  • Food Science & Technology (AREA)
  • Nutrition Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

提供了可用于罗汉果苷生物合成的,分离的罗汉果苷和罗汉果醇生物合成途径酶多肽。本发明的罗汉果苷生物合成途径酶包括角鲨烯环氧酶(SE)、环氧水合酶(EH)、细胞色素p450(Cyp)、葫芦二烯醇合酶(CDS)和udp‑葡糖基转移酶(UGT)。还提供了使用所述分离的罗汉果苷和罗汉果醇生物合成酶多肽产生罗汉果苷的方法,所述方法包括使罗汉果醇和/或糖基化的罗汉果醇(罗汉果苷)与至少一种本发明的UDP葡萄糖葡糖基转移酶(UGT)酶多肽接触,所述UDP葡萄糖葡糖基转移酶(UGT)酶多肽催化罗汉果醇和/或糖基化的罗汉果醇的葡糖基化,以产生具有额外的葡糖基成分的罗汉果苷,由此产生罗汉果苷。或者或另外提供的是合成罗汉果醇的方法,所述方法包括使罗汉果醇前体底物与一种或多种如本文所述的催化从罗汉果醇前体底物合成罗汉果醇的罗汉果醇生物合成途径酶多肽接触,由此合成罗汉果醇。

Description

生产罗汉果苷的方法和包含其的组合物及其用途
发明领域和背景
本发明,在其一些实施方案中,涉及生产罗汉果苷的方法,和包含其的组合物及其用途。
罗汉果苷是在葫芦科植物罗汉果(Siraitia grosvenorii)(Luo Han Guo)的果实中发现的三萜衍生的专门的次生代谢产物。它们在果实中的生物合成涉及糖苷配基罗汉果醇(mogrol)至最终甜味产物罗汉果苷V和罗汉果苷VI的多个相继的糖基化(图1)。
罗汉果苷V在食品工业中已被认为是一种天然的非糖食品甜味剂,其甜味能力是蔗糖的甜味能力约250倍(Kasai R.,等人, Sweet cucurbitane glycosides from fruitsof Siraitia siamensis (chi-zi luo-han-guo), a Chinese folk medicine. AgricBiol Chem 1989, 53(12):3347-3349.)。此外,最近的研究中已经揭示了罗汉果苷的额外的健康益处(Li等人, Chemistry and pharmacology of Siraitia grosvenorii: areview. Chin J Nat Med. 2014 12(2):89-102.)。
母体糖苷配基化合物罗汉果醇通过葫芦二烯醇(立体特异性三萜合酶,葫芦二烯醇合酶的初始产物)的连续羟基化而衍生。葫芦二烯醇随后通过尚未确定的酶在C11、C24和C25位的羟基化,产生罗汉果醇(图1)。反式C24,C25-二羟基化在三萜类葫芦二烯醇衍生物中是罕见的(Chen JC, et al., Cucurbitacins and cucurbitane glycosides:structures and biological activities. Nat. Prod. Rep. 2005, 22, 386-399),并且因此使负责酶的鉴定成为一种挑战。随后,在果实发育期间以时间连续的模式,在C3和C24位对罗汉果醇进行从1至6个葡糖基的不同程度的葡糖基化,并且葡糖基化的罗汉果醇化合物被称为罗汉果苷。罗汉果苷的甜味强度随着额外的葡萄糖部分而增加,使得M6 (具有6个葡糖基)分别比M5更甜,随后为M4 (Kasai R.,等人, Sweet cucurbitane glycosidesfrom fruits of Siraitha siamensis (chi-zi luo-han-guo), a Chinese folkmedicine. Agric Biol Chem 1989, 53(12):3347-3349)。纯化的罗汉果苷V已在日本被批准为高强度甜味剂(Jakinovich, W., Jr., Moon, C., Choi, Y. H., & Kinghorn, A.D. 1990. Evaluation of plant extracts for sweetness using the Mongoliangerbil. Journal of Natural Products, 53, 190-195),并且提取物在美国已作为非营养甜味剂和增味剂取得一般公认为安全(GRAS)的状态。
从果实提取罗汉果苷可以得到不同程度纯度的产物,通常伴有不希望的余味。此外,由于植物产量低和植物的特殊栽培要求,来自栽培果实的罗汉果苷产率是有限的。因此,能够经由生物技术方法生产甜罗汉果苷化合物是有利的。
额外的背景技术包括:
WO2013/076577公开了来自不天然产生罗汉果苷的植物,拟南芥(Arabidopsis thaliana)和甜叶菊(Stevia rebaudianan)的UGT家族的酶(UDP葡萄糖糖基转移酶)。这些酶中的四种能够进行糖苷配基罗汉果醇的糖基化,特别是在C24位置添加单一葡萄糖部分以产生M1b。来自甜叶菊的第五种酶UGT73C5显示在C3和C24的糖基化。
WO 2014086842公开了葫芦二烯醇合酶,催化C-11 OH产生的cyp450和来自罗汉果的一些UGT多肽,显示这些酶在酵母中发挥功能,并且还提供了用于产生罗汉果苷的方法。此外,他们还公开了2种环氧化物水解酶,并证明了它们水合环氧角鲨烯的能力,表明它们同样可以水合环氧葫芦二烯醇。具体而言,本发明提出了可用于罗汉果苷产生的各种生物合成途径,并提供了可用于罗汉果苷产生的酶。此外,本发明提供了可用于进行本发明方法的重组宿主。Tang等人, An efficient approach to finding Siraitia grosvenoriitriterpene biosynthetic genes by RNA-seq and digital gene expressionanalysis. BMC Genomics. 2011; 12: 343。
发明概述
根据本发明的一些实施方案的一个方面,提供了包含氨基酸序列的分离的尿苷二磷酸-葡糖基转移酶(UGT)多肽,其中所述多肽催化罗汉果醇在C24的主链葡糖基化和罗汉果苷在C3的主链葡糖基化。
根据本发明的一些实施方案,分离的UGT多肽催化:
(a)罗汉果醇在C24的主链葡糖基化;
(b)罗汉果苷在C3的主链葡糖基化;和
(c)罗汉果苷在C3的分枝葡糖基化。
根据本发明的一些实施方案,所述氨基酸序列与SEQ ID NO:34具有至少34%同一性。
根据本发明的一些实施方案,所述氨基酸序列如SEQ ID NO:34所示。
根据本发明的一些实施方案的一个方面,提供了包含氨基酸序列的分离的尿苷二磷酸-葡糖基转移酶(UGT)多肽,其中所述多肽催化罗汉果苷在C3的(1-2)和(1-6)位置的分枝葡糖基化和罗汉果苷在C24的(1-2)和(1-6)位置的分枝葡糖基化。
根据本发明的一些实施方案的一个方面,提供了包含氨基酸序列的分离的尿苷二磷酸-葡糖基转移酶(UGT)多肽,其中所述多肽催化罗汉果苷M5至罗汉果苷M6的分枝葡糖基化。
根据本发明的一些实施方案,分离的UGT多肽催化:
(a)罗汉果苷在C3的(1-2)和(1-6)位置的分枝葡糖基化;
(b)罗汉果苷在C24的(1-2)和(1-6)位置的分枝葡糖基化,和
(c)罗汉果苷M5至罗汉果苷M6的分枝葡糖基化。
根据本发明的一些实施方案,所述氨基酸序列与SEQ ID NO:38具有至少89%同一性。
根据本发明的一些实施方案的一个方面,所述氨基酸序列如SEQ ID NO:38所示。
根据本发明的一些实施方案的一个方面,提供了包含氨基酸序列的分离的尿苷二磷酸-葡糖基转移酶(UGT)多肽,其中所述多肽催化罗汉果苷IV (M4)至罗汉果苷V (M5)的分枝葡糖基化。
根据本发明的一些实施方案,所述氨基酸序列选自与SEQ ID NO:34具有至少34%同一性的序列、与SEQ ID NO:6具有至少84%同一性的序列和与SEQ ID NO:38具有至少89%同一性的序列。
根据本发明的一些实施方案,所述氨基酸序列如SEQ ID NO:6所示。
根据本发明的一些实施方案,所述氨基酸序列如SEQ ID NO:38所示。
根据本发明的一些实施方案,所述氨基酸序列如SEQ ID NO:34所示。
根据本发明的一些实施方案,所述UGT是植物UGT。
根据本发明的一些实施方案,所述植物是葫芦科的植物。
根据本发明的一些实施方案,所述植物是罗汉果。
根据本发明的一些实施方案的一个方面,提供了包含与SEQ ID NO:14具有至少94%同一性或与SEQ ID NO:16具有至少89%同一性的氨基酸序列的分离的角鲨烯环氧酶(SQE)多肽,其中所述多肽催化由角鲨烯或氧化角鲨烯合成二环氧角鲨烯。
根据本发明的一些实施方案,所述氨基酸序列如SEQ ID NO:14或SEQ ID NO:16所示。
根据本发明的一些实施方案,所述SQE是植物SQE。
根据本发明的一些实施方案的一个方面,提供了包含与SEQ ID NO:18、SEQ IDNO:22或SEQ ID NO:24具有至少75%同一性的氨基酸序列的分离的环氧化物水解酶(EH)多肽,其中所述多肽催化从3-羟基,24-25环氧葫芦二烯醇合成3,24,25-三羟基葫芦二烯醇。
根据本发明的一些实施方案,所述氨基酸序列如SEQ ID NO:18、SEQ ID NO:22和SEQ ID NO:24中任一者所示。
根据本发明的一些实施方案,所述EH是植物EH。
根据本发明的一些实施方案的一个方面,提供了从罗汉果醇前体底物合成罗汉果醇或罗汉果醇前体产物的方法,所述方法包括使至少一种罗汉果醇前体底物与罗汉果苷途径酶接触,其中:
(a)当罗汉果醇前体产物包含双环氧角鲨烯且罗汉果醇前体底物包含角鲨烯或氧化角鲨烯时,所述罗汉果苷途径酶包含如权利要求18-20中任一项中所述的角鲨烯环氧酶多肽,由此产生二环氧角鲨烯,
(b)当罗汉果醇前体产物包含3-羟基,24-25环氧葫芦二烯醇且罗汉果醇前体底物包含双环氧角鲨烯时,所述罗汉果醇途径酶包含如SEQ ID NO:12所示或与之具有60%同源性或同一性的葫芦二烯醇合成酶多肽,由此产生3-羟基,24-25环氧葫芦二烯醇,
(c)当产物包含3,24,25三羟基葫芦二烯醇且底物包含3-羟基,24-25环氧葫芦二烯醇时,所述罗汉果醇途径酶包含如权利要求21-23中任一项中所述的环氧水合酶多肽,由此产生3, 24, 25三羟基葫芦二烯醇,
(d)当产物包含罗汉果醇且罗汉果醇前体底物包含3,24,25三羟基葫芦二烯醇时,所述罗汉果醇途径酶是如SEQ ID NO:10所示或与之具有60%同源性或同一性的细胞色素P450酶,由此产生3, 11, 24, 25四羟基葫芦二烯醇(罗汉果醇)。
根据本发明的一些实施方案,所述细胞色素P 450酶包含如SEQ ID NO:10中所示的氨基酸序列。
根据本发明的一些实施方案,产生罗汉果醇产物包括以下中的至少一种:
(i)使角鲨烯或氧化角鲨烯与角鲨烯环氧酶多肽接触,由此产生二环氧角鲨烯;
(ii)使二环氧角鲨烯与葫芦二烯醇合酶接触,由此产生3-羟基,24-25环氧葫芦二烯醇;
(iii)使3-羟基,24-25环氧葫芦二烯醇与环氧水合酶接触,由此产生3,24,25三羟基葫芦二烯醇;和
(iv)使3,24-25三羟基葫芦二烯醇与细胞色素P 450酶接触,由此产生罗汉果醇产物(3,11,24,25四羟基葫芦二烯醇)。
根据本发明的一些实施方案,产生罗汉果醇产物包括至少(i)和(iv),至少(ii)和(iv),至少(iii)和(iv),至少(i)、(ii)和(iii),至少(i)、(ii)和(iv),至少(i)、(iii)和(iv),至少(ii)、(iii)和(iv)。
根据本发明的一些实施方案,产生罗汉果醇产物包括(i)、(ii)、(iii)和(iv)的全部。
根据本发明的一些实施方案的一个方面,提供了合成罗汉果苷的方法,所述方法包括将至少一种本发明的UGT多肽或其组合与至少一种UGT底物罗汉果苷前体接触。
根据本发明的一些实施方案,所述至少一种UGT多肽包含本发明的UGT多肽,所述多肽催化罗汉果醇在C24的主链葡糖基化和罗汉果苷在C3的主链葡糖基化。
根据本发明的一些实施方案,所述至少一种UGT多肽包含具有如SEQ ID NO:34所示的氨基酸序列的UGT多肽。
根据本发明的一些实施方案,所述至少一种UGT多肽包含本发明的UGT多肽,其催化罗汉果苷在C3的(1-2)和(1-6)位置的分枝葡糖基化和罗汉果苷在C24的(1-2)和(1-6)位置的分枝葡糖基化,和/或催化罗汉果苷M5至罗汉果苷M6的分枝葡糖基化。
根据本发明的一些实施方案,所述至少一种UGT多肽包含具有如SEQ ID NO:38所示的氨基酸序列的UGT多肽。
根据本发明的一些实施方案,所述至少一种UGT多肽包含本发明的UGT多肽,其催化罗汉果苷IV (M4)至罗汉果苷V (M5)的分枝葡糖基化。
根据本发明的一些实施方案,所述至少一种UGT多肽包含具有选自以下的氨基酸序列的UGT多肽:与SEQ ID NO:34具有至少34%同一性的序列、与SEQ ID NO:6具有至少84%同一性的序列和与SEQ ID NO:38具有至少89%同一性的序列。
根据本发明的一些实施方案,所述至少一种UGT多肽包含具有如SEQ ID NO:34所示的氨基酸序列的UGT多肽和具有如SEQ ID NO:38所示的氨基酸序列的UGT多肽。
根据本发明的一些实施方案,其中所述UGT底物罗汉果苷前体底物是罗汉果醇,所述方法包括:
(a)根据本发明的方法产生罗汉果醇,和
(b)根据本发明的合成罗汉果苷的方法从罗汉果醇合成罗汉果苷。
根据本发明的一些实施方案,所述罗汉果苷选自罗汉果苷I-A1、罗汉果苷I-E1、罗汉果苷IIE、罗汉果苷III、赛门苷(siamenoside)、罗汉果苷V和罗汉果苷VI。
根据本发明的一些实施方案,所述方法还包括分离罗汉果苷。
根据本发明的一些实施方案,所述方法在重组细胞中进行,所述重组细胞外源表达本发明的罗汉果苷途径酶多肽中的至少一种或其任何组合。
根据本发明的一些实施方案,所述至少一种多肽选自:具有如SEQ ID NO:34所示的氨基酸序列的多肽、具有如SEQ ID NO:38所示的氨基酸序列的多肽、具有如SEQ ID NO:14或16所示的氨基酸序列的多肽和具有如SEQ ID NO:18、22或24所示的氨基酸序列的多肽。
根据本发明的一些实施方案的一个方面,提供了包含根据本发明的罗汉果苷生物合成方法生成的罗汉果苷的组合物。
根据本发明的一些实施方案的一个方面,提供了包含核酸序列的分离的多核苷酸,所述核酸序列编码本发明的SE、CDS、EH、Cyt p450和UGT酶多肽中任一种的分离的多肽。
根据本发明的一些实施方案,核酸序列选自SEQ ID NO.5、9、11、13、15、17、21、23、33和37。
根据本发明的一些实施方案的一个方面,提供了核酸构建体,其包含本发明的分离的多核苷酸和用于指导所述分离的多核苷酸的表达的顺式作用调节元件。
根据本发明的一些实施方案,所述顺式作用调节元件包含启动子。
根据本发明的一些实施方案的一个方面,提供了异源表达本发明的分离的多核苷酸的宿主细胞。
根据本发明的一些实施方案,所述宿主细胞是微生物宿主细胞。
根据本发明的一些实施方案,所述微生物选自酵母和细菌。
根据本发明的一些实施方案,所述宿主细胞是植物宿主细胞。
根据本发明的一些实施方案,所述宿主细胞形成植物的一部分。
根据本发明的一些实施方案,所述植物是转基因植物。
根据本发明的一些实施方案,所述植物是葫芦科的植物。
根据本发明的一些实施方案,所述宿主细胞形成植物的果实或根部的一部分。
根据本发明的一些实施方案,所述宿主细胞在宿主细胞中产生罗汉果苷或罗汉果苷前体。
根据本发明的一些实施方案的一个方面,提供了本发明的宿主细胞的细胞裂解物。
根据本发明的一些实施方案的一个方面,提供了富集罗汉果苷VI到至少10% (wt/wt)的罗汉果苷VI的总浓度的组合物。
根据本发明的一些实施方案的一个方面,提供了包含罗汉果苷VI (M6)和罗汉果苷II (M2)的组合物。
根据本发明的一些实施方案的一个方面,提供了包含罗汉果苷V (M5)、VI (M6)和罗汉果苷II (M2)的组合物。
根据本发明的一些实施方案,罗汉果苷VI或罗汉果苷V的浓度足以引起风味增强。
根据本发明的一些实施方案,罗汉果苷VI的浓度为至少0.2ppm。
根据本发明的一些实施方案,所述组合物是甜味剂。
根据本发明的一些实施方案,所述组合物还包含选自以下的风味成分:蔗糖、果糖、葡萄糖、高果糖玉米糖浆、木糖、阿拉伯糖、鼠李糖、赤藓醇、木糖醇、甘露糖醇、山梨糖醇、肌醇、AceK、阿斯巴甜、纽甜(neotame)、三氯蔗糖、糖精、柚皮苷二氢查耳酮(NarDHC)、新橙皮苷二氢查耳酮(NDHC)、甜茶苷(rubusoside)、莱鲍迪苷A、甜菊苷、甜叶菊、三叶苷(trilobtain)。
根据本发明的一些实施方案,所述组合物是消耗性组合物。
根据本发明的一些实施方案,所述组合物还包含一种或多种额外的风味成分。
根据本发明的一些实施方案,所述组合物是饮料。
根据本发明的一些实施方案,所述饮料选自水性饮料、增强/稍甜化的水饮料、矿泉水、碳酸饮料、非碳酸饮料、碳酸水、静水、软饮料、非酒精饮料、酒精饮料、啤酒、葡萄酒、酒、水果饮料、汁液、果汁、蔬菜汁、肉汤饮料、咖啡、茶、红茶、绿茶、乌龙茶、草药茶、可可、茶基饮料、咖啡基饮料、可可基饮料、糖浆、乳制品、冷冻水果、冷冻果汁、水基冰、水果冰、果汁冰糕、酱料、沙拉酱、酱汁、汤和饮料植物材料或用于复原的速溶粉末。
根据本发明的一些实施方案,所述组合物为Coca-Cola®等。
根据本发明的一些实施方案,所述组合物是固体消耗品。
根据本发明的一些实施方案,所述固体消耗品选自谷物、烘焙食品、饼干、面包、早餐谷物、谷物棒、乳制品、能量棒/营养棒、格兰诺拉麦片、蛋糕、曲奇、薄脆饼干、甜甜圈、松饼、糕点、糖果、口香糖、巧克力、软糖、硬糖、棉花糖、压片、休闲食品、植物材料(完整的或研磨的)和用于复原的速溶粉末。
根据本发明的一些实施方案,所述组合物是食物。
除非另有定义,本文所使用的所有技术和/或科学术语具有与本发明所属领域普通技术人员之一通常理解的相同含义。尽管与本文所述那些类似或相当的方法和材料可用于本发明实施方案的实践和测试,但下面描述了示例性的方法和/或材料。在冲突的情况下,则以本专利说明书(包括定义)为准。另外,材料、方法和实例只是说明性的,并无意必定是限制性的。
附图的几个视图的简述
参照附图,本文以仅例示的方式描述了本发明的一些实施方案。现在具体参照附图细节,应强调,所示细节是例示方式,并用于说明性论述本发明实施方案的目的。在这一方面,连同附图的描述使本领域技术人员清楚可如何实施本发明的实施方案。
在附图中:
图1是图解说明(改编自Tang等人, An efficient approach to finding Siraitia grosvenorii triterpene biosynthetic genes by RNA-seq and digital geneexpression analysis. BMC Genomics. 2011;12:343)。罗汉果中的推定罗汉果苷生物合成途径。AACT:乙酰辅酶A乙酰转移酶,EC:2.3.1.9;HMGS:羟甲基戊二酰辅酶A合酶,EC:2.3.3.10;HMGR:3-羟基-3-甲基戊二酰辅酶A还原酶,EC:1.1.1.34;MK:甲羟戊酸激酶,EC:2.7.1.36;PMK:磷酸甲羟戊酸激酶,EC:2.7.4.2;MVD:二磷酸甲羟戊酸脱羧酶,EC:4.1.1.33;DXS:1-脱氧-D-木酮糖-5-磷酸合酶,EC:2.2.1.7;DXR:1-脱氧-D-木酮糖-5-磷酸还原异构酶,EC:1.1.1.267;MCT:2-C-甲基-D-赤藓醇4-磷酸胞苷酰转移酶,EC:2.7.7.60;CMK:4-二磷酸胞苷基-2-C-甲基-D-赤藓醇激酶,EC:2.7.1.148;MCS:2-C-甲基-D-赤藓醇2,4-环二磷酸合酶,EC:4.6.1.12;HDS:4-羟基-3-甲基丁-2-烯基二磷酸合酶,EC:1.17.7.1;IDS:4-羟基-3-甲基丁-2-烯基二磷酸还原酶(异戊烯基/二甲基烯丙基二磷酸合酶),EC:1.17.1.2;IPI:异戊烯基-二磷酸δ-异构酶,EC:5.3.3.2;GPS:牦牛儿基二磷酸合酶,EC:2.5.1.1;FPS:法呢基二磷酸合酶/法呢基焦磷酸合成酶,EC:2.5.1.10;SQS:角鲨烯合成酶;CAS:环阿屯醇合酶,EC:2.5.1.21;SQE:角鲨烯环氧酶,EC:1.14.99.7;CS:葫芦二烯醇合酶,EC:5.4.99.8;P450:细胞色素P450,EC:1.14.-.-;和UDPG:UDP-葡糖基转移酶,EC:2.4.1.E.C. 2.4.1是UGT;
图2是提出的罗汉果果实中罗汉果苷合成途径的图解说明;
图3图解说明与2,3;22,23-二氧化角鲨烯(线性,上面)和罗汉果醇(环状,下面)相关的化合物的编号系统,显示关键编号的碳(蓝色);
图4A-4B是显示在罗汉果果实发育和成熟过程中的罗汉果苷水平的图解说明。注意M2和M3的进行性损失以及M4和M5的伴随增加(图4B),表明相继的葡糖基化。数值在4A中表示为相对于最高罗汉果苷含量,以及在4B中表示为基于色谱图的峰面积的每种化合物的相对量;
图5A和5B是图解说明角鲨烯环氧酶1 (5A)和角鲨烯环氧酶2 (5B)的相对表达模式的图。在正在发育的罗汉果果实中,显示在最年轻的果实中的相对高表达;
图6A-6C显示HPLC-MS色谱图,其图解说明在酵母宿主中2,3-单氧化角鲨烯和2,3;22,23-二氧化角鲨烯的产生(6A);在表达罗汉果葫芦二烯醇合酶(SgCDS)的酵母宿主中,将这些底物环化为葫芦二烯醇和24,25-环氧葫芦二烯醇(6B)。图6C-底物和产物标准品。在酵母提取物中,通过MS和NMR鉴定葫芦二烯醇和24,25-环氧葫芦二烯醇;
图7是在正在发育的罗汉果果实中表达的8种环氧化物水解酶基因的表达模式的层次聚类热图(hierarchical cluster heat map)。呈现的果实发育的五个阶段是15、34、51、77和103天,且对应于图4A和4B中的果实发育阶段;
图8A-8B图解说明环氧化物水解酶表达对24,25-二羟基葫芦二烯醇的影响。图8A显示LC-MS色谱图,表明由于在表达葫芦二烯醇合酶(SgCDS)的酵母提取物中环氧化物水解酶基因的表达,24,25-二羟基葫芦二烯醇的增加。前三个色谱图分别显示EPH1、2和3 (SEQ IDNO.17、19和21)的效果。底部色谱图显示携带CDS、而没有额外的EPH基因的对照酵母。图8B是显示在对照酵母系和表达EPH的酵母系中的24,25-二羟基葫芦二烯醇(8A的化合物1)和24,25-环氧葫芦二烯醇(8A的化合物3)的相对水平的图;
图9是报道的罗汉果环氧化物水解酶蛋白序列的同一性-相似性矩阵。绿色[由重叠群_6184 (SEQ ID NO:39)和重叠群_8262 (SEQ ID NO:40)编码]的序列来自Tang等人(2011)中报道的数据库,并分别作为US2015/0064743的SEQ ID NO. 38和40被报道。由重叠群101438、102175、102581和22474编码的序列分别为SEQ ID NO.41、42、43和44。矩阵是使用ClustalOmega程序(wwwdotebidotacdotuk/Tools/msa/clustalo/)制备的;
图10是在正在发育的罗汉果果实中表达的细胞色素P450基因的表达模式的层次聚类热图。呈现的果实发育的五个阶段是15、34、51、77和103天,且对应于图4A和4B中的果实发育阶段;功能表达约40种候选物并测定其葫芦二烯醇羟基化活性;
图11A-11C是HPLC-MS色谱图,其显示通过细胞色素P 450 cyp102801 (SEQ ID NO:10)对葫芦二烯醇的C11-羟基化(11A)。图11B显示来自表达cyp102801的酵母系(缺乏CDS (葫芦二烯醇合酶表达))的提取物的色谱图。图11C显示来自表达CDS而不表达cyp102801的酵母宿主的酵母提取物的色谱图;
图12是用于筛选葡糖基转移酶活性的罗汉果苷底物的列表,根据各种命名法鉴定底物,以及它们的来源和用于鉴定它们的方法;
图13A-13B显示本发明的一些实施方案的尿苷二磷酸葡糖基转移酶(UGT)序列的系统发生分析。图13A是来自Clustal Omega比对的UGT蛋白序列的系统发生分析。图13B是罗汉果UGT的系统发生树。对应于相同基因家族的分枝通过颜色标记。在本申请中显示使罗汉果醇和罗汉果苷葡糖基化的罗汉果UGT以红色加框;
图14是在正在发育的罗汉果果实中表达的UGT基因的表达模式的层次聚类热图。呈现的果实发育的五个阶段是15、34、51、77和103天,且对应于图4A和4B中的果实发育阶段。功能表达约100种候选物并用罗汉果苷底物测定其UGT活性;
图15是UGT酶-糖-受体分子活性的示意图,其基于从具有在大肠杆菌中表达的单一重组UGT酶和罗汉果醇和罗汉果苷底物的无细胞葡糖基化反应鉴定的产物。图15A显示主链葡糖基化,而图15B显示分枝葡糖基化,且图15C显示图15B中呈现的分枝酶进行的主链葡糖基化。当每对环状葫芦烷环(cucrbitane ring)通过蓝色椭圆形表示(环A和B被示意性地组合成下方椭圆形,并且环C和D组合成上方椭圆形)时,糖分子的示意图显示为圆形,并且导致C-24和C-25的葫芦二烯醇分子的非环状支链部分通过短线表示。来自UGT反应的新连接的葡萄糖部分通过绿色圆形标记,衍生自底物的葡萄糖分子呈红色,并且紫色圆形表明通过NMR鉴定为C-25位葡萄糖的添加的葡萄糖的位置。当圆形指向上(左对角线或右对角线)时,其代表(1-6)糖苷键,而指向下的圆形(左对角线或右对角线)代表(1-2)糖苷键。指向左的圆形代表(1-4)糖苷键。星号表明痕量的物质;
图16显示在如图15中所示的无细胞反应介质中包括糖苷配基罗汉果醇(M)后,从每种主链葡糖基酶合成的罗汉果苷产物的HPLC/DAD色谱图。前三种酶各自合成C-3葡糖苷罗汉果醇M1E1。UGT85E5 (269-1)合成C-24葡糖苷罗汉果醇M1A和C3,C24-二葡糖苷M2E二者。产物通过MS和NMR鉴定;
图17A-17D显示HPLC/DAD色谱图,其显示UGT94C9 (289-3)使用罗汉果苷V作为底物催化罗汉果苷VI的无细胞产生[在1.9分钟洗脱的峰(m/z=1449.7113)]。图17A图解说明与无活性酶对照相比,罗汉果苷VI在反应混合物中的积累(图17B)。在反应混合物中未完全转化为罗汉果苷VI的残余罗汉果苷V在2.1分钟洗脱。(图17A)。图17C是罗汉果苷VI (鉴定为M6-II)的标准品的色谱图。使用LC-MS验证反应产物。显示了对来自17A的两种罗汉果苷VI(M6)化合物,罗汉果苷V (M5),和罗汉果苷VI (M6)标准品的所得光谱。为了区分两种罗汉果苷VI,它们被标记为M6-I (在1.5分钟洗脱)和M6-II (在1.9分钟洗脱);
图18是UGT氨基酸序列的比对的相似性和同一性成对矩阵。使用以BLOSUM62运行的MatGAT 2.02 (www.bitinckadotcom/ledion/matgat/)计算矩阵。氨基酸序列之间的百分比相似性呈现在“100%自身”对角线的左侧和下方,并且百分比同一性呈现在“100%自身”对角线的右侧和上方;
图19A和19B是色谱图,其显示UGT94-289-3在无细胞反应体系中进行相继葡糖基化以从罗汉果苷2E生成赛门苷和罗汉果苷4A。图19A是来自在UGT74-345-2和UGT94-289-3存在下,以罗汉果苷1A作为底物的反应的产物的LC-MS色谱图的实例。图19B显示罗汉果苷3x和两种罗汉果苷IV部分(罗汉果苷IVA和赛门苷)的光谱;
图20显示由重叠群19984 (其由于在果实发育中晚期表达而未被选择)编码的,来自罗汉果的候选角鲨烯环氧酶同源物的表达模式,以及其后其急剧下降;
图21显示针对果实发育中高和早期表达而选择的重叠群73966 (SEQ ID NO:17)编码的来自罗汉果的候选环氧水合酶同源物的表达模式,以及在成熟期间表达的逐渐下降;
图22显示针对果实发育中高和早期表达而选择的重叠群86123 (SEQ ID NO:19)编码的来自罗汉果的候选环氧水合酶同源物的表达模式,以及在成熟期间表达的逐渐下降;
图23显示针对果实发育中高和早期表达而选择的重叠群102640 (SEQ ID NO:3)编码的来自罗汉果的候选环氧水合酶同源物的表达模式,以及在成熟期间表达的逐渐下降;
图24显示针对果实发育中高和早期表达而选择的重叠群28382 (SEQ ID NO:4)编码的来自罗汉果的候选环氧水合酶同源物的表达模式,以及在成熟期间表达的逐渐下降。
本发明具体实施方案的描述
本发明,在其一些实施方案中,涉及生产罗汉果醇、罗汉果苷的方法,和包含其的组合物及其用途。
在详细解释本发明的至少一个实施方案之前,应当理解,本发明的应用不一定限于下面描述中描述或由实施例例举的细节。本发明能够具有其它实施方案或者以各种方式实践或进行。
罗汉果醇(3, 11, 24, 25四羟基葫芦二烯醇)是用于生物合成罗汉果苷(糖基化的罗汉果醇)的底物,在位置3, 24和/或25的碳的糖基化被葡糖基转移酶、诸如尿苷-5-二磷酸依赖性葡糖基转移酶(UGT)催化。罗汉果醇生物合成需要类固醇前体角鲨烯作为底物,并且涉及残基的环化和羟基化。目前尚不知道确切的生物化学途径,然而本发明人已经鉴定了可能在罗汉果醇的内源性生物合成中突出的罗汉果醇合成途径,已经鉴定了对罗汉果醇、罗汉果醇前体、罗汉果苷前体和罗汉果苷的产生关键的罗汉果酶,已经用重组合成的罗汉果醇/罗汉果苷途径酶成功地重构了生物合成途径的重要部分(参见实施例5和6以及图15A-15C)。基于组合的代谢概况分析、功能表达和蛋白建模结果,本发明人提出以下罗汉果的罗汉果苷生物合成的代谢途径:在果实发育的初始阶段期间,角鲨烯经由角鲨烯合酶、角鲨烯环氧酶、葫芦二烯醇合酶、环氧化物水解酶、细胞色素p450 (cyp102801)和UGT85的进行性作用代谢为二葡糖基化的M2。在果实成熟期间,存在UGT94成员,并且可能还有UGT85的进行性活性,向M2的主链葡糖基部分添加支链葡糖基,导致甜味的M4、M5和M6化合物。
来自罗汉果醇的罗汉果苷合成通过在罗汉果醇分子的碳C 3和C 24的主链葡糖基化起始,并通过进一步添加葡萄糖部分(全部都通过尿苷二磷酸-葡糖基转移酶(EC 2.4.1)催化)来进行。本发明人已经意外地发现了具有催化活性的关键UTG酶,其可能对罗汉果的罗汉果苷生物合成是关键的。
因此,根据本发明的一些方面的一些实施方案,提供了包含氨基酸序列的分离的尿苷二磷酸-葡糖基转移酶(UGT)多肽,其中所述多肽催化罗汉果醇在C24的主链葡糖基化和罗汉果苷在C3的主链葡糖基化。本发明人已经显示,该UGT在其底物特异性方面是混杂的:因此,在一些实施方案中,使用罗汉果醇作为底物,分离的UGT多肽可以催化罗汉果醇在C24的主链糖基化,可以催化C24葡糖基化的罗汉果苷在C3的主链葡糖基化,并且可以催化罗汉果苷的支链葡糖基化。在一个具体实施方案中,支链葡糖基化在C3的主链葡萄糖上。
本发明人已经将该UGT多肽鉴定为UGT85家族的成员。在一些实施方案中,催化罗汉果醇在C24的主链葡糖基化和罗汉果苷在C3的主链葡糖基化的分离的UGT多肽包含与SEQID NO:34具有至少34%同一性的氨基酸序列。在一些实施方案中,所述氨基酸序列与SEQID NO:34具有至少34%同源性。在一些实施方案中,催化罗汉果醇在C24的主链葡糖基化和罗汉果苷在C3的主链葡糖基化的分离的UGT多肽与SEQ ID NO:34具有至少35%、至少37%、至少40%、至少42%、至少45%、至少47%、至少50%、至少55%、至少58%、至少60%、至少65%、至少70%、至少75%、至少78%、至少80%、至少83%、至少88%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同源性或同一性。在一些实施方案中,所述UTG多肽包含与SEQ ID NO:34具有34-100%、40-90%、37-85%、45-80%、50-75%、55-65%、80-90%、93-100%范围内的同源性或同一性的氨基酸序列。在一个具体实施方案中,催化罗汉果醇在C24的主链葡糖基化和罗汉果苷在C3的主链葡糖基化的分离的UGT多肽的氨基酸序列如SEQ ID NO:34所示。在一些情况下,SEQ ID NO:34也称为UGT85E5、85E5和UGT85-269-1。
本发明人已经鉴定了具有对罗汉果苷合成至关重要的分枝葡糖基化活性的UGT酶。因此,根据本发明的一些方面,提供了包含氨基酸序列的分离的尿苷二磷酸-葡糖基转移酶(UGT)多肽,其中所述多肽催化罗汉果苷在C3的(1-2)和(1-6)位置的分枝葡糖基化和罗汉果苷在C24的(1-2)和(1-6)位置的分枝葡糖基化。
根据本发明的一些方面,提供了包含氨基酸序列的分离的尿苷二磷酸-葡糖基转移酶(UGT)多肽,其中所述多肽催化罗汉果苷M5至罗汉果苷M6的分枝葡糖基化。该催化活性是高度重要的,因为M6罗汉果苷是具有所有罗汉果的罗汉果苷化合物中味道最甜的罗汉果苷。
本发明人已经发现了UGT多肽,其催化罗汉果苷在C3的(1-2)和(1-6)位置的分枝葡糖基化和罗汉果苷在C24的(1-2)和(1-6)位置的分枝葡糖基化,以及罗汉果苷M5至罗汉果苷M6的分枝葡糖基化。
本发明人已经将催化罗汉果苷在C3的(1-2)和(1-6)位置的分枝葡糖基化和罗汉果苷在C24的(1-2)和(1-6)位置的分枝葡糖基化,和/或罗汉果苷M5至罗汉果苷M6的分枝葡糖基化的UGT多肽鉴定为UGT94家族的成员。在一些实施方案中,催化罗汉果苷在C3的(1-2)和(1-6)位置的分枝葡糖基化和罗汉果苷在C24的(1-2)和(1-6)位置的分枝葡糖基化和/或罗汉果苷M5至罗汉果苷M6的分枝葡糖基化的分离的UGT多肽包含与SEQ ID NO:38具有至少89%同一性的氨基酸序列。在一些实施方案中,所述氨基酸序列与SEQ ID NO:38具有至少89%同源性。在一些实施方案中,催化罗汉果苷在C3的(1-2)和(1-6)位置的分枝葡糖基化和罗汉果苷在C24的(1-2)和(1-6)位置的分枝葡糖基化和/或罗汉果苷M5至罗汉果苷M6的分枝葡糖基化的分离的UGT多肽包含与SEQ ID NO:38具有至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99或100%同源性或同一性的氨基酸序列。在一些实施方案中,所述UTG多肽包含与SEQ ID NO:38具有89-100%、90-100%、92-85%、94-80%、95-100%、96-100%、97-100%或99-100%范围内的同源性或同一性的氨基酸序列。在具体实施方案中,催化罗汉果苷在C3的(1-2)和(1-6)位置的分枝葡糖基化和罗汉果苷在C24的(1-2)和(1-6)位置的分枝葡糖基化和/或罗汉果苷M5至罗汉果苷M6的分枝葡糖基化的分离的UGT多肽包含如SEQ ID NO:38所示的氨基酸序列。在一些情况下,SEQID NO:38也称为UGT94C9和UGT94-289-3。
可以催化罗汉果苷M5至罗汉果苷M6的分枝葡糖基化的额外UTG酶多肽包括但不限于包含与SEQ ID NO:8具有至少41%同一性或同源性的氨基酸序列的UGT多肽。在一些实施方案中,所述UGT多肽包含SEQ ID NO:8所示的氨基酸序列。SEQ ID NO:8也被称为UGT73-327-2、UGT73E7和EO7。
根据本发明的一些方面,提供了包含氨基酸序列的分离的尿苷二磷酸-葡糖基转移酶(UGT)多肽,其中所述多肽催化罗汉果苷IV (M4)至罗汉果苷V (M5)的分枝葡糖基化。在一些实施方案中,催化罗汉果苷IV (M4)至罗汉果苷V (M5)的分枝葡糖基化的分离的UGT多肽包含与SEQ ID NO:38具有至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同源性或同一性的氨基酸序列,或与SEQID NO:34具有至少35%、至少37%、至少40%、至少42%、至少45%、至少47%、至少50%、至少55%、至少58%、至少60%、至少65%、至少70%、至少75%、至少78%、至少80%、至少83%、至少88%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同源性或同一性的氨基酸序列,或与SEQ ID NO:6具有至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同源性或同一性的氨基酸序列。在一些实施方案中,催化罗汉果苷IV (M4)至罗汉果苷V (M5)的分枝葡糖基化的分离的UGT多肽包含与SEQ IDNO:38具有89-100%、90-100%、92-85%、94-80%、95-100%、96-100%、97-100%或99-100%范围内的同源性或同一性,或与SEQ ID NO:6具有84-100%、86-100%、88-100%、85-95%、89-100%、90-100%、92-85%、94-86%、95-100%、96-100%、97-100%或99-100%范围内的同源性或同一性,或与SEQ ID NO:34具有34-100%、40-90%、37-85%、45-80%、50-75%、55-65%、80-90%、93-100%范围内的同源性或同一性的氨基酸序列。在一个具体实施方案中,催化罗汉果苷IV (M4)至罗汉果苷V (M5)的分枝葡糖基化的分离的UGT多肽包含如SEQ ID NO:38或SEQ ID NO:6或SEQ ID NO:34所示的氨基酸序列。在一些情况下,SEQ ID NO:6也称为UGT94A9、A09或UGT94-289-1。
在一些实施方案中,所述UTG酶多肽催化罗汉果苷或罗汉果醇的C3或C24在(1-2)和/或(1-6)位置的支链葡糖基化。然而,应当理解,在一些实施方案中,本发明的UGT酶多肽也可以包含在(1-4)位置的葡糖基化活性。
根据本发明的一些方面的一些实施方案,所述酶多肽是催化罗汉果醇合成的酶,即角鲨烯合酶、角鲨烯环氧酶、葫芦二烯醇合酶、环氧化物水解酶(也称为环氧水合酶)和细胞色素p450。
因此,根据本发明的一些方面,提供了包含与SEQ ID NO:14具有至少94%同一性或与SEQ ID NO:16具有至少89%同一性的氨基酸序列的分离的角鲨烯环氧酶(SQE,也称为SE)多肽,其中所述多肽催化由角鲨烯或氧化角鲨烯合成二环氧角鲨烯。在一些实施方案中,所述角鲨烯环氧酶(SQE)多肽包含与SEQ ID NO:14具有至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同源性或同一性或与SEQ ID NO:16具有至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同源性或同一性的氨基酸序列。在一些实施方案中,所述分离的SQE多肽包含与SEQ ID NO:14具有95-100%、96-100%、97-100%或99-100%范围内的同源性或同一性,或与SEQ ID NO:16具有89-100%、90-100%、92-100%、93-100%、94-100%、95-100%、96-100%、97-100%或99-100%范围内的同源性或同一性的氨基酸序列。在一个具体实施方案中,催化由角鲨烯或氧化角鲨烯合成二环氧角鲨烯的分离的SQE多肽包含如SEQ ID NO:14或SEQ ID NO:16所示的氨基酸序列。在一些情况下,SEQ ID NO:14也称为SE1、SQE1和重叠群18561。在一些情况下,SEQID NO:14也称为SE2、SQE2和重叠群16760。
根据本发明的一些方面,提供了包含与SEQ ID NO:18、SEQ ID NO:22或SEQ IDNO:24具有至少75%同一性的氨基酸序列的分离的环氧化物水解酶(EH,EPH)多肽,所述多肽催化从3-羟基,24-25环氧葫芦二烯醇合成3,24,25三羟基葫芦二烯醇。在一些实施方案中,所述环氧化物水解酶(EH)多肽包含与SEQ ID NO:18、SEQ ID NO:22或SEQ ID NO:24具有至少75%、至少78%、至少80%、至少83%、至少88%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同源性或同一性的氨基酸序列。在一些实施方案中,所述分离的EH多肽包含与SEQ ID NO:18或22或24具有75-100%、78-97%、80-95%、85-92%、87-98%、90-99%、92-100%、95-100%、96-100%、97-100%或99-100%范围内的同源性或同一性的氨基酸序列。在一个具体实施方案中,催化从3-羟基,24-25环氧葫芦二烯醇合成3,24,25三羟基葫芦二烯醇的分离的EH多肽包含如SEQ ID NO:18或SEQ IDNO:22或SEQ ID NO:24所示的氨基酸序列。在一些情况下,SEQ ID NO:18也称为EH1、EPH1和重叠群73966。在一些情况下,SEQ ID NO:22也称为EH3、EPH3和重叠群102640。在一些情况下,SEQ ID NO:24称为EH4、EPH4和重叠群28382。
具有所示催化活性的本发明的UGT、SQE和EH酶多肽可以包括具有所示催化活性的任何生物体的UGT、SQE和EH酶多肽。在一些实施方案中,分离的UGT、SQE或EH多肽是植物UGT、SQE或EH多肽。在一些实施方案中,所述植物是葫芦科的植物。下文可见葫芦科成员的详细、非限制性列表。在具体实施方案中,分离的UGT多肽是罗汉果UGT、SQE或EH多肽。如本文所用,短语“罗汉果醇前体”或“罗汉果醇途径前体”、“罗汉果醇前体”,“罗汉果醇前体底物”是指至少角鲨烯、单环氧角鲨烯、二环氧角鲨烯、3-羟基,24-25环氧葫芦二烯醇、3, 11二羟基24-25环氧葫芦二烯醇、3,24,25三羟基葫芦二烯醇。应当理解,由于罗汉果醇是罗汉果苷合成的底物,所以罗汉果醇前体(前体底物、罗汉果醇途径前体)也构成罗汉果苷途径前体/底物。
如本文所用,短语“罗汉果醇途径酶”是指至少角鲨烯环氧酶或与之具有至少89%同源性或同一性的能够催化从角鲨烯合成二环氧角鲨烯的酶,或至少葫芦二烯醇合成酶或与之具有60%同源性或同一性的能够催化从二环氧角鲨烯合成3-羟基,24-25环氧葫芦二烯醇的酶,或至少环氧水合酶或与之具有75%同源性或同一性的能够催化从3-羟基,24-25环氧葫芦二烯醇合成3,24,25三羟基葫芦二烯醇的酶,以及细胞色素P450酶或与之具有60%同源性或同一性的能够催化从3,24,25三羟基葫芦二烯醇合成3,11,24,25四羟基葫芦二烯醇的酶。(SQE:角鲨烯环氧酶,EC:1.14.99.7;CS:葫芦二烯醇合酶,EC:5.4.99.8;P450:细胞色素P450,EC:1.14.-.-;以及UDPG:UDP-葡糖基转移酶,EC:2.4.1。E.C. 2.4.1是UGT)
如本文所用,术语“罗汉果苷途径酶”是指至少一种或多种催化罗汉果醇(未葡糖基化)或罗汉果苷底物的葡糖基化的尿苷二磷酸-葡糖基转移酶(UGT)。
下表1包含可用于本发明的方法和组合物中的一些罗汉果醇和罗汉果苷途径酶的非限制性列表,包括可适用于本发明的一些实施方案中的同源物的实例。
表1:罗汉果醇/罗汉果苷途径酶
如本文所用,术语“罗汉果醇”是指糖苷配基化合物罗汉果醇。
糖基化的罗汉果醇或罗汉果苷是指在位置3、24和/或25具有至少一个主链葡萄糖或支链葡萄糖的罗汉果醇。根据一个具体实施方案,糖基化或葡糖基化的罗汉果醇或罗汉果苷是指在位置3和/或24具有至少一个主链葡萄糖或支链葡萄糖的罗汉果醇。
本发明的UGT酶多肽可以催化罗汉果醇或罗汉果苷底物的主链葡糖基化和/或支链葡糖基化。如本文所用,术语“主链葡糖基化”是指将葡萄糖部分共价添加至罗汉果醇或罗汉果苷底物的未葡糖基化的碳,导致单葡糖基化(M1)(当底物是糖苷配基(aglycol)罗汉果醇时)或二葡糖基化(当底物是单葡糖基化的罗汉果苷时)的罗汉果苷(M2)。葡糖基化通常位于罗汉果醇骨架的C3和C24碳。
如本文所用,术语“分枝葡糖基化”或“支链葡糖基化”是指向罗汉果苷底物的葡糖基化碳的葡萄糖共价添加葡萄糖部分,导致多葡糖基化的罗汉果苷(M2、M3、M4、M5或M6),这取决于罗汉果苷底物的葡糖苷化水平。葡糖基化通常位于罗汉果醇骨架的C3和C24碳。图12中显示了说明非限制数量的非葡糖基化的罗汉果醇,和不同形式的,在不同碳处葡糖基化,且具有不同键合的罗汉果苷的表格。
本发明的罗汉果醇生物合成途径酶和罗汉果苷生物合成途径酶多肽可用于合成罗汉果醇、罗汉果醇前体或罗汉果苷或罗汉果苷前体。
因此,根据本发明的一些方面的一些实施方案,提供了从罗汉果醇前体底物合成罗汉果醇或罗汉果醇前体产物的方法,所述方法包括使至少一种罗汉果醇前体底物与罗汉果苷途径酶接触。催化罗汉果醇、罗汉果苷或罗汉果醇或罗汉果苷前体生物合成的步骤的罗汉果苷途径酶可以如下:
(a) 当罗汉果醇前体产物包含双环氧角鲨烯且罗汉果醇前体底物包含角鲨烯或氧化角鲨烯时,所述罗汉果苷途径酶包含如本文所述的角鲨烯环氧酶多肽,由此产生二环氧角鲨烯。适用于该方法的本发明的角鲨烯环氧酶多肽包括包含SEQ ID NO:14或与之具有至少94%同一性或同源性,或包含SEQ ID NO:16或与之具有至少89%同一性或同源性的SQE多肽,或
(b) 当罗汉果醇前体产物包含3-羟基,24-25环氧葫芦二烯醇且罗汉果醇前体底物包含双环氧角鲨烯时,所述罗汉果醇途径酶包含如SEQ ID NO:12所示的或与之具有60%同源性或同一性的葫芦二烯醇合成酶多肽,由此产生3-羟基,24-25环氧葫芦二烯醇,或
(c) 当产物包含3,24,25三羟基葫芦二烯醇且底物包含3-羟基,24-25环氧葫芦二烯醇时,所述罗汉果醇途径酶包含如权利要求21-23中任一项中所述的环氧水合酶多肽,由此产生3, 24, 25三羟基葫芦二烯醇。适用于该方法中的本发明的环氧水合酶(也称为环氧化物水解酶)多肽包括包含SEQ ID NO:18、22或24或与之具有至少75%同一性或同源性的EH多肽,或
(d) 当产物包含罗汉果醇且罗汉果醇前体底物包含3,24,25三羟基葫芦二烯醇时,所述罗汉果醇途径酶是如SEQ ID NO:10所示或与之具有60%同源性或同一性的细胞色素P450酶,由此产生3, 11, 24, 25四羟基葫芦二烯醇(罗汉果醇)。
可以在表达一种或多种本发明的罗汉果苷生物合成酶多肽的细胞中重构罗汉果醇或罗汉果苷的生物合成。取决于细胞(或细胞裂解物)中罗汉果醇前体和生物合成酶的可用性,可以使用上述步骤中的任一种、一些或全部重构各个反应或其组合。因此,在一些实施方案中,产生罗汉果醇产物包括以下步骤中的至少一个:
(i) 使角鲨烯或氧化角鲨烯与本发明的角鲨烯环氧酶多肽接触,由此产生二环氧角鲨烯;
(ii) 使二环氧角鲨烯与本发明的葫芦二烯醇合酶接触,由此产生3-羟基,24-25环氧葫芦二烯醇;
(iii) 使3-羟基,24-25环氧葫芦二烯醇与本发明的环氧水合酶(环氧化物水解酶)接触,由此产生3,24,25三羟基葫芦二烯醇;和
(iv) 使3,24-25三羟基葫芦二烯醇与本发明的细胞色素P 450酶接触,由此产生罗汉果醇产物(3,11,24,25四羟基葫芦二烯醇)。
在一些实施方案中,产生罗汉果醇产物包括至少(i)和(iv),至少(ii)和(iv),至少(iii)和(iv),至少(i)、(ii)和(iii),至少(i)、(ii)和(iv),至少(i)、(iii)和(iv),至少(ii)、(iii)和(iv)以及任选地(i)、(ii)、(iii)和(iv)的全部。例如,为了在缺乏角鲨烯环氧酶或角鲨烯环氧酶缺陷、但具有完成从二氧化角鲨烯合成罗汉果醇的生物合成能力的细胞中重构或增强二氧化角鲨烯合成,该方法可以包括(i)。在能够合成二氧化角鲨烯、3-羟基,24-25环氧葫芦二烯醇和3,24-25三羟基葫芦二烯醇、但环氧化物水解酶(环氧水合酶)缺陷或缺乏环氧化物水解酶(环氧水合酶)的细胞中,该方法可以包括(iii)。在能够合成3-羟基,24-25环氧葫芦二烯醇和3,24-25三羟基葫芦二烯醇、但角鲨烯环氧酶和环氧化物水解酶(环氧水合酶)缺陷或缺乏角鲨烯环氧酶和环氧化物水解酶(环氧水合酶)的细胞中,该方法可以包括(i)和(iii)。
本发明考虑了罗汉果苷生物合成。根据本发明的一些方面的一些实施方案,提供了合成罗汉果苷的方法,所述方法包括将至少一种本发明的UGT多肽或其组合与至少一种UGT底物罗汉果苷前体接触。
根据一些实施方案,该方法包括罗汉果醇或罗汉果苷前体底物的主链和分枝葡糖基化的步骤。催化罗汉果苷或罗汉果苷前体生物合成的步骤的罗汉果苷途径酶可以如下:
(aa)当底物是罗汉果醇或在C3未葡糖基化的罗汉果苷时,催化罗汉果醇在C24的主链葡糖基化和罗汉果苷在C3的主链葡糖基化的UGT是包含SEQ ID NO:34所示的氨基酸序列或与之具有至少34%同源性或同一性的UGT。
(bb)当底物是罗汉果苷时,催化罗汉果苷在C3的(1-2)和(1-6)位置的分枝葡糖基化和/或罗汉果苷在C24的(1-2)和(1-6)位置的分枝葡糖基化的UGT包含如SEQ ID NO:38所示的或与之具有至少89%同源性或同一性的氨基酸序列。
(cc)当底物是罗汉果苷M5时,催化罗汉果苷M5至罗汉果苷M6的分枝葡糖基化的UGT包含如SEQ ID NO:38所示或与之具有至少89%同源性或同一性,或SEQ ID NO:8或与之具有至少41%同源性或同一性的氨基酸序列。
(dd)当底物是罗汉果苷IV (M4)时,催化M4至罗汉果苷V (M5)的分枝葡糖基化的UGT包含如SEQ ID NO:38或与之具有至少89%同源性或同一性的,SEQ ID NO:34或与之具有至少34%同源性或同一性的,和SEQ ID NO:6或与之具有至少84%同源性或同一性的序列中任一者所示的氨基酸序列。
因此,在一些实施方案中,所述方法包括使罗汉果苷底物与至少一种UGT多肽接触,所述UGT多肽选自如SEQ ID NO:38或与之具有至少89%同源性或同一性,SEQ ID NO:34或与之具有至少34%同源性或同一性,SEQ ID NO:8或与之具有至少41%同源性或同一性,和SEQ ID NO:6或与之具有至少84%同源性或同一性的序列所示的氨基酸序列。
在一些实施方案中,产生罗汉果苷产物包括至少(aa)和(bb),至少(aa)和(cc),至少(aa)和(dd),至少(aa)、(bb)和(cc),至少(aa)、(cc)和(dd),至少(bb)、(cc)和(dd),至少(bb)和(cc),至少(cc)和(dd)以及任选(aa)、(bb)、(cc)和(dd)的全部。例如,为了在缺乏催化在C3或C24的主链葡糖基化的UGT,或催化在C3或C24的主链葡糖基化的UGT缺陷,但具有完成从单葡糖基化的罗汉果苷合成罗汉果苷的生物合成能力的细胞中重构或增强罗汉果苷合成,该方法可以包括(aa)。在能够合成M5,但催化M5至M6的分枝葡糖基化的UGT缺陷,或缺乏催化M5至M6的分枝葡糖基化的UGT的细胞中,该方法可以包括(cc)。在能够具有完成从单葡糖基化的罗汉果苷合成罗汉果苷M5的生物合成能力,但C3或C24的主链葡糖基化以及M5至M6的分枝葡糖基化缺陷,或缺乏C3或C24的主链葡糖基化以及M5至M6的分枝葡糖基化的细胞中,该方法可以包括(aa)和(cc)。在一些实施方案中,所述方法包括使罗汉果苷底物与至少一种包含如SEQ ID NO:34所示或与之具有至少34%同源性或同一性的氨基酸序列的UGT多肽,以及包含如SEQ ID NO:8所示或与之具有至少41%同源性或同一性的氨基酸序列的UGT多肽、包含如SEQ ID NO:6所示或与之具有至少84%同源性或同一性的氨基酸序列的UGT多肽,和包含如SEQ ID NO:38所示或与之具有至少89%同源性或同一性的氨基酸序列的UGT多肽中的一种或多种。在一个具体实施方案中,所述方法包括使罗汉果苷底物至少与包含如SEQ ID NO:34所示或与之具有至少34%同源性或同一性的氨基酸序列的UGT多肽,和包含如SEQ ID NO:38所示或与之具有89%同源性或同一性的氨基酸序列的UGT多肽。
本发明考虑从罗汉果醇底物和/或前体生物合成罗汉果苷。因此,本发明的用于合成罗汉果苷的方法包括组合根据本发明的方法产生罗汉果醇和如上所述合成罗汉果苷,即组合本文所述的罗汉果醇合成的任何一个或多个或全部步骤与本文所述的罗汉果苷合成的任何一个或多个或全部步骤。
考虑所有可能的罗汉果苷产物的生产。因此,在一些实施方案中,所述罗汉果苷选自罗汉果苷I-A1、罗汉果苷I-E1、罗汉果苷IIE、罗汉果苷III、赛门苷、罗汉果苷V和罗汉果苷VI。
根据一些实施方案,该方法还包括分离罗汉果苷。罗汉果苷化合物的分离和纯化的方法是本领域众所周知的,例如,Li, D.等人l J. Nat. Med. 2007, 61, 307-312;Venkata Chaturvedula和Indra Prakash., J. Carb. Chem. 2011 30, 16-26;VenkataSai Prakash Chaturvedula, Indra Prakash. IOSR Journal of Pharmacy (IOSRPHR)2012. 2, 7-12。
如本文所用,术语“多肽”是指由链中通过肽键键合在一起的大量氨基酸残基组成的线性有机聚合物,形成蛋白分子的一部分(或全部)。多肽的氨基酸序列是指构成多肽或其部分的氨基酸的线性连续排列。
如本文所用,术语“多核苷酸”是指单链或双链核酸序列,其以RNA序列、互补多核苷酸序列(cDNA)、基因组多核苷酸序列和/或复合多核苷酸序列(例如,上述的组合)的形式分离和提供。
术语“分离的”是指至少部分地从天然环境(例如植物细胞)分离。
如本文所用,“表达”是指在mRNA和任选多肽水平的表达。
如本文所用,短语“外源多核苷酸”是指可能不在植物内天然表达的异源核酸序列(例如,来自不同物种的核酸序列)或期望在植物中过表达的异源核酸序列。可以以稳定或瞬时的方式将外源多核苷酸引入植物中,以便产生核糖核酸(RNA)分子和/或多肽分子。应当注意,外源多核苷酸可以包含与植物的内源性核酸序列具有同一性或部分同源性的核酸序列。
如本文所用,术语“内源性”是指在植物或其细胞内存在和/或天然表达的任何多核苷酸或多肽。
同源序列包括直向同源和旁系同源序列。
术语“旁系同源”涉及导致旁系同源基因的物种的基因组内的基因重复。术语“直向同源”涉及由于祖先关系而在不同生物体内的同源基因。因此,直系同源物是从给定两种物种的最后共同祖先中的单一祖先基因衍生的进化对应物,并且因此有很大可能性具有相同的功能。
在单子叶植物物种中鉴定直向同源物的一个选择是通过进行双向BLAST搜索(reciprocal BLAST search)。这可以通过第一次blast来实现,所述blast涉及将目标序列针对任何序列数据库进行blast比对,所述序列数据库例如可以在ncbi(dot)nlm(dot)nih(dot)gov找到的公开可得的NCBI数据库。如果是寻找水稻中的直向同源物,则可以将目标序列针对例如可在NCBI获得的来自日本水稻(Oryza sativa Nipponbare)的28,469个全长cDNA克隆进行blast比对。可以过滤blast结果。然后将过滤结果或未过滤结果的全长序列针对衍生出目标序列的生物体的序列进行反向blast比对(第二次blast比对)。然后比较第一次和第二次blast比对的结果。当在第一次blast比对中得到最高评分(最佳命中)的序列在第二次blast比对中将查询序列(原始目标序列)鉴定为最佳命中时,鉴定直向同源物。使用相同的推理,发现旁系同源物(同一生物体中的基因的同源物)。在大序列家族的情况下,可以使用ClustalW程序[ebi(dot)ac(dot)uk/Tools/clustalw2/index(dot)html],随后使用邻接树(wikipedia(dot)org/wiki/Neighbor-joining),其有助于显现聚类。
可以使用计算成对序列比对的任何同源性比较软件来确定同源性(例如,百分比同源性、序列同一性+序列相似性)。
如本文所用,在两个核酸或多肽序列的上下文中的“序列同一性”或“同一性”包括当比对时相同的两个序列中的残基。当就蛋白而言使用序列同一性百分比时,认识到不同的残基位置经常由于保守氨基酸取代而不同,其中氨基酸残基被取代为具有相似化学特性(例如电荷或疏水性)的其它氨基酸残基,因此不改变分子的功能特性。当序列在保守取代上不同时,百分比序列同一性可以向上调整以校正取代的保守性质。由于此类保守取代而不同的序列被认为具有“序列相似性”或“相似性”。用于进行该调整的方法是本领域技术人员众所周知的。通常,这涉及将保守取代评分为部分错配,而不是完全错配,由此增加百分比序列同一性。因此,例如,当相同的氨基酸评分为1且非保守取代评分为零时,保守取代评分为0和1之间。计算保守取代的评分,例如,根据Henikoff S和Henikoff JG.[Amino acidsubstitution matrices from protein blocks. Proc. Natl. Acad. Sci. U.S.A.1992, 89(22):10915-9]的算法。
可以使用任何同源性比较软件,包括例如国家生物技术信息中心(NCBI)的BlastN软件,诸如通过使用默认参数,确定同一性(例如,百分比同源性)。
根据本发明的一些实施方案,同一性是全局同一性,即在本发明的整个氨基酸或核酸序列上的同一性,而不是其部分上的同一性。
根据本发明的一些实施方案,术语“同源性”或“同源的”是指两个或更多个核酸序列的同一性;或两个或更多个氨基酸序列的同一性;或氨基酸序列与一个或多个核酸序列的同一性。
根据本发明的一些实施方案,同源性是全局同源性,即在本发明的整个氨基酸或核酸序列上的同源性,而不是其部分上的同源性。
可以使用WO2014/102774中描述的各种已知的序列比较工具来确定两个或更多个序列之间的同源性或同一性程度。
可以使用的局部比对工具包括但不限于tBLASTX算法,其将核苷酸查询序列(两条链)的六框概念翻译产物针对蛋白序列数据库进行比较。默认参数包括:最大靶序列:100;预期阈值:10;字体大小:3;查询范围内的最大匹配:0;评分参数:Matrix – BLOSUM62;过滤器和掩蔽:过滤器 - 低复杂度区域。
可以开发微生物、植物细胞或植物,其表达可用于生物合成罗汉果醇(三萜核心)和各种罗汉果醇糖苷(罗汉果苷)的多肽。糖苷配基罗汉果醇用不同数目的葡萄糖部分糖基化以形成各种罗汉果苷化合物。
通常,产生罗汉果苷的方法可以在体外或体内进行。本发明还包括一些步骤在体外进行,而其它步骤可以在体内进行。因此,例如,可以在体外进行第一步骤,并且在其之后可以将中间产物进料至能够进行该方法的剩余步骤的重组宿主细胞。或者,可以在体内进行第一步骤,并且在其之后中间产物可以用作体外进行的后续步骤的底物。也可以设想其它组合。当在体外进行方法时,可以分别进行该方法的每个步骤。或者,可以在相同混合物内进行一个或多个步骤。在其中该方法的一些或全部步骤分开进行的实施方案中,则每个步骤的中间产物可以在进行下一步骤之前纯化或部分纯化。
当该方法在体内进行时,所述方法使用表达一种或多种酶的重组宿主,或者该方法可以使用几种表达一种或多种酶的重组宿主。
本发明考虑罗汉果醇或罗汉果苷的重组产生。因此,在一些实施方案中,在外源表达本发明的SQE、CDS、EH、Cyt p450和UGT酶多肽中的至少一种的重组细胞中进行罗汉果醇和/或罗汉果苷生物合成的方法。在一些实施方案中,所述重组细胞表达至少一种酶多肽,所述酶多肽选自包含如SEQ ID NO:34或与之具有至少34%同一性或同源性的序列所示的氨基酸序列的UGT多肽、包含如SEQ ID NO:6或与之具有至少84%同一性或同源性的序列所示的氨基酸序列的UGT多肽、包含如SEQ ID NO:38或与之具有至少89%同一性或同源性的序列所示的氨基酸序列的UGT多肽、包含如SEQ ID NO:14或与之具有至少94%同一性或同源性的序列或SEQ ID NO:16或与之具有至少89%同一性或同源性的序列所示的氨基酸序列的SQE多肽和包含如SEQ ID NO:18、22或24中任一种或与之具有至少75%同一性或同源性的序列所示的氨基酸序列的EH多肽。
可以在宿主细胞中进行本发明的多肽的重组表达,或罗汉果醇底物、罗汉果醇和/或罗汉果苷化合物的重组产生,所述宿主细胞表达分离的多核苷酸,所述分离的多核苷酸包含编码本发明的罗汉果醇和/或罗汉果苷生物合成途径酶的分离的多肽的核酸序列。在一些实施方案中,在可用于转化宿主细胞的核酸构建体中提供分离的多核苷酸。合适的宿主细胞包括可以在发酵、植物和其它真核细胞中培养或生长的细菌、酵母和其它微生物。在一些实施方案中,本发明的一些实施方案的核酸构建体可用于转化植物细胞。
适用于本发明的方法的分离的多核苷酸包括但不限于编码如表1中所示的罗汉果醇和罗汉果苷生物合成途径酶中任一种的多核苷酸。因此,在一些实施方案中,提供了分离的多核苷酸,其包含编码如SEQ ID NO:6、10、12、14、16、22、24、34和38中任一项所述的氨基酸序列或其功能同系物的核酸序列。
上述多肽的功能同系物也适用于本文所述的方法和重组宿主中。功能同系物是与参考多肽具有序列相似性且执行参考多肽的一种或多种生化或生理功能的多肽。因此,本文所述的酶的功能同系物是与参考酶具有序列相似性且能够催化与参考酶相同的本发明方法的步骤或部分步骤的多肽。通常优选的是,功能同系物与参考多肽共享至少一定程度的序列同一性,例如如上文对本发明的UGT、SE、EH、CDS、Cyt p450酶多肽所示。
根据本发明的一些实施方案,本发明的异源多核苷酸编码包含如SEQ ID NO:34或与之具有至少34%同一性或同源性的序列所示的氨基酸序列的UGT多肽、包含如SEQ IDNO:6或与之具有至少84%同一性或同源性的序列所示的氨基酸序列的UGT多肽、包含如SEQID NO:38或与之具有至少89%同一性或同源性的序列所示的氨基酸序列的UGT多肽、包含如SEQ ID NO:14或与之具有至少94%同一性或同源性的序列或SEQ ID NO:16或与之具有至少89%同一性或同源性的序列所示的氨基酸序列的SQE多肽和包含如SEQ ID NO:18、22或24中任一种或与之具有至少75%同一性或同源性的序列所示的氨基酸序列的EH多肽。
在一些实施方案中,分离的多核苷酸包含选自SEQ ID NO.5、9、11、13、15、17、21、23、33和37的核酸序列。
如本文所用的术语“植物”涵盖全株植物、嫁接植物、植物的祖先和后代和植物部分,包括种子、枝条、茎、根(包括块茎)、根茎、接穗和植物细胞、组织和器官。所述植物可呈任何形式,包括悬浮培养物、胚芽、分生组织区、愈伤组织、叶、配子体、孢子体、花粉和小孢子。在本发明的方法中特别有用的植物包括属于绿色植物(Viridiplantee)总科的所有植物,尤其是单子叶和双子叶植物,包括草料或饲料豆科植物、观赏植物、粮食作物、树或灌木,选自包含以下的列表:相思树属(Acacia spp.)、槭树属(Acer spp.)、猕猴桃属(Actinidia spp.)、七叶树属(Aesculus spp.)、澳大利亚贝壳杉(Agathis australis)、苦合欢(Albizia amara)、三色桫椤(Alsophila tricolor)、须芒草(Andropogon spp.)、落花生属(Arachis spp)、槟榔(Areca catechu)、香桂(Astelia fragrans)、鹰嘴紫云英(Astragalus cicer)、多小叶红苏木(Baikiaea plurijuga)、桦木属(Betula spp.)、芸苔属(Brassica spp.)、木榄(Bruguiera gymnorrhiza)、伯克苏木(Burkea africana)、紫铆花(Butea frondosa)、粉质胚乳白花菜(Cadaba farinosa)、朱缨花属(Calliandra spp)、野茶树(Camellia sinensis)、美人蕉(Canna indica)、辣椒属(Capsicum spp.)、决明属(Cassia spp.)、距豌豆(Centroema pubescens)、木瓜属(Chacoomeles spp.)、肉桂(Cinnamomum cassia)、小果咖啡(Coffea arabica)、可乐豆木(Colophospermum mopane)、变异小冠花(Coronillia varia)、枸子(Cotoneaster serotina)、山楂属(Crataegusspp.)、黄瓜属(Cucumis spp.)、柏木属(Cupressus spp.)、银蕨(Cyathea dealbata)、榅桲(Cydonia oblonga)、日本柳杉(Cryptomeria japonica)、香茅属(Cymbopogon spp.)、银蕨(Cynthea dealbata)、榅桲(Cydonia oblonga)、货贝黄檀(Dalbergia monetaria)、大叶骨碎补(Davallia divaricata)、金钱草属(Desmodium spp.)、新西兰树蕨(Dicksoniasquarosa)、Dibeteropogon amplectens、迪奥豆属(Dioclea spp)、扁豆属(Dolichosspp.)、Dorycnium rectum、金字塔稗(Echinochloa pyramidalis)、Ehraffia spp.、穇子(Eleusine coracana)、幽眉草属(Eragrestis spp.)、刺桐属(Erythrina spp.)、桉属(Eucalypfus spp.)、假乌木(Euclea schimperi)、绒毛状金茅(Eulaliavi/losa)、荞麦属(Pagopyrum spp.)、费约果(Feijoa sellowlana)、草莓属(Fragaria spp.)、千斤拔属(Flemingia spp)、河岸藤露览树(Freycinetia banksli)、东亚老鹤草(Geraniumthunbergii)、银杏(GinAgo biloba)、野黄豆(Glycine javanica)、墨西哥丁香属(Gliricidia spp)、陆地棉(Gossypium hirsutum)、银禅属(Grevillea spp.)、鞘杆古夷布提木(Guibourtia coleosperma)、岩黄蓍属(Hedysarum spp.)、牛鞭草(Hemaffhiaaltissima)、黄茅(Heteropogon contoffus)、大麦(Hordeum vulgare)、红荀茅(Hyparrhenia rufa)、小连翅(Hypericum erectum)、Hypeffhelia dissolute、异花木蓝(Indigo incamata)、鸢尾属(Iris spp.)、Leptarrhena pyrolifolia、胡枝子属(Lespediza spp.)、萬苣属(Lettuca spp.)、银合欢(Leucaena leucocephala)、单罗得草(Loudetia simplex)、Lotonus bainesli、百脉根属(Lotus spp.)、硬皮豆(Macrotylomaaxillare)、苹果属(Malus spp.)、木薯(Manihot esculenta)、紫苜蓿(Medicago saliva)、水杉(Metasequoia glyptostroboides)、香蕉(Musa sapientum)、烟草属(Nicotianumspp.)、驴食豆属(Onobrychis spp.)、鸟足豆属(Ornithopus spp.)、稻属(Oryza spp.)、非洲双翼豆(Peltophorum africanum)、狼尾草属(Pennisetum spp.)、酪梨(Perseagratissima)、碧冬煎属(Petunia spp.)、菜豆属(Phaseolus spp.)、加拿利海枣(Phoenixcanariensis)、新西兰剑麻(Phormium cookianum)、石楠属(Photinia spp.)、白云杉(Picea glauca)、松属(Pinus spp.)、豌豆(Pisum sativam)、新西兰罗汉松(Podocarpustotara)、Pogonarthria fleckii、Pogonaffhria squarrosa、杨属(Populus spp.)、瓜叶牧豆(Prosopis cineraria)、花旗松(Pseudotsuga menziesii)、星状老虎剌(Pterolobiumstellatum)、西洋梨(Pyrus communis)、栎属(Quercus spp.)、厚叶石斑木(Rhaphiolepsisumbellata)、美味棒花棕(Rhopalostylis sapida)、纳塔尔漆树(Rhus natalensis)、欧洲醋栗(Ribes grossularia)、荼薦子属(Ribes spp.)、剌槐(Robinia pseudoacacia)、蔷薇属(Rosa spp.)、悬钩子属(Rubus spp.)、柳属(Salix spp.)、红裂稃草(Schyzachyriumsanguineum)、金松(Sciadopitys vefficillata)、北美红杉(Sequoia sempervirens)、巨杉(Sequoiadendron giganteum)、两色高梁(Sorghum bicolor)、菠菜属(Spinacia spp.)、流苏状鼠尾粟(Sporobolus fimbriatus)、Stiburus alopecuroides、矮柱花草(Stylosanthos humilis)、葫芦茶属(Tadehagi spp)、落羽杉(Taxodium distichum)、阿拉伯黄背草(Themeda triandra)、三叶草属(Trifolium spp.)、小麦属(Triticum spp.)、异叶铁杉(Tsuga heterophylla)、越桔属(Vaccinium spp.)、蚕豆属(Vicia spp.)、葡萄(Vitis vinifera)、锥穗沃森花(Watsonia pyramidata)、马蹄莲(Zantedeschiaaethiopica)、玉蜀黍(Zea mays)、苋菜(amaranth)、洋蓟、芦笋、球花甘蓝、抱子甘蓝(Brussels sprouts)、卷心菜、油菜(canola)、胡萝卜、花椰菜、芹菜、绿叶羽衣甘蓝(collardgreens)、亚麻、散叶甘蓝、小扁豆、油籽油菜(oilseed rape)、秋葵、洋葱、马铃薯、水稻、大豆、稻草、甜菜、甘蔗、向日葵、西红柿、南瓜茶(squashtea)、树。或者,藻类和其它非绿色植物(non-viridiplantae)可用于本发明的一些实施方案的方法。在具体实施方案中,所述植物是葫芦科的植物,诸如罗汉果。在一些实施方案中,表达本发明的多肽的植物细胞包含葫芦科植物的果实或根细胞。
本发明考虑使用核酸构建体用于转化细胞用于表达罗汉果苷生物合成途径酶多肽和产生罗汉果醇、罗汉果醇前体和罗汉果苷。因此,在一些实施方案中,提供了核酸构建体,所述核酸构建体包含本发明的分离的多核苷酸和用于指导分离的多核苷酸的表达的顺式作用调节元件。
可以使用本领域技术人员众所周知的重组DNA技术来构建可用于根据本发明的一些实施方案的方法中的构建体。可以将基因构建体插入可商购的载体中,所述载体适合于转化至植物中并适合于在转化细胞中表达目标基因。所述遗传构建体可以是表达载体,其中核酸序列与允许在植物细胞中表达的一个或多个调节序列可操作连接。
在本发明的一些实施方案的一个具体实施方案中,所述调节序列是植物可表达的启动子。
如本文所用,短语“植物可表达”是指启动子序列,包括添加至其中或其中含有的任何额外的调节元件,其至少能够在植物细胞、组织或器官、优选单子叶植物或双子叶植物细胞、组织或器官中诱导、赋予、激活或增强表达。可用于本发明一些实施方案的方法的优选启动子的实例呈现于表2、3、4和5中。
表2:用于进行本发明的一些实施方案的示例性组成型启动子
表3:用于进行本发明的一些实施方案的示例性种子优选的启动子
表4:用于进行本发明的示例性花特异性启动子
表5:用于进行本发明的替代水稻启动子
可以针对植物表达优化本发明的一些实施方案的多肽的核酸序列。此类序列修饰的实例包括但不限于改变的G/C含量以更接近于通常在目标植物物种中发现的G/C含量,以及去除植物物种中非典型发现的密码子,通常称为密码子优化。
短语“密码子优化”是指选择适当的DNA核苷酸,用于在接近目标植物内的密码子使用的结构基因或其片段内使用。因此,优化的基因或核酸序列是指其中天然或天然存在的基因的核苷酸序列已被修饰以便利用植物内统计学优选或统计学有利的密码子的基因。通常在DNA水平上检查核苷酸序列,并且使用任何合适的程序测定针对植物物种中的表达优化的编码区,例如如Sardana等人.(1996, Plant Cell Reports 15:677-681)中所述。在该方法中,密码子使用的标准偏差(密码子使用偏差的度量)可以通过如下计算:首先找到天然基因的每个密码子的使用相对于高度表达的植物基因的每个密码子的使用的平方比例偏差,随后计算平均平方偏差。所使用的公式为:1 SDCU = n = 1 N [ ( Xn - Yn ) /Yn ] 2 / N,其中Xn是指高度表达的植物基因中密码子n的使用频率,其中Yn是指目标基因中密码子n的使用频率,且N是指目标基因中的密码子的总数。使用Murray等人(1989, NucAcids Res.17:477-498)的数据汇编了来自双子叶植物的高度表达基因的密码子使用表。
一种根据特定植物细胞类型的优选密码子使用优化核酸序列的方法基于直接使用,而不进行任何额外统计计算密码子优化表,诸如在日本通过NIAS (NationalInstitute of Agrobiological Sciences) DNA文库在密码子使用数据库在线提供的那些(www.kazusa.or.jp/codon/)。密码子使用数据库含有许多不同物种的密码子使用表,其中每个密码子使用表已基于Genbank中存在的数据进行统计测定。
通过使用上述表来确定特定物种(例如,水稻)中每种氨基酸的最优选或最有利的密码子,编码目标蛋白的天然存在的核苷酸序列可以针对该特定植物物种进行密码子优化。这通过将在特定物种基因组中可能具有低统计学发生率的密码子替换为相应的密码子(考虑统计学更有利的氨基酸)来实现。然而,可以选择一种或多种不太有利的密码子来缺失现有的限制性位点,以在潜在有用的结点(5'和3'末端以添加信号肽或终止盒,可能用于切割和将片段剪接在一起以产生正确的全长序列的内部位点)生成新位点,或消除可负面影响mRNA稳定性或表达的核苷酸序列。
天然存在的编码核苷酸序列可以在任何修饰之前已经含有对应于特定植物物种中统计学有利的密码子的许多密码子。因此,天然核苷酸序列的密码子优化可以包括确定天然核苷酸序列内的哪些密码子在特定植物方面不是统计学有利的,和根据特定植物的密码子使用表来修饰这些密码子以产生密码子优化的衍生物。修饰的核苷酸序列可以针对植物密码子使用来完全或部分地优化,条件是由修饰的核苷酸序列编码的蛋白的产生水平高于由相应天然存在或天然基因编码的蛋白的水平。通过改变密码子使用构建合成基因描述于例如PCT专利申请93/07278中。
因此,本发明的一些实施方案包括上文所述的核酸序列;其片段,与其可杂交的序列,与其同源的序列,与其直向同源的序列,编码具有不同密码子使用的相似多肽的序列,特征在于突变的改变的序列,所述突变诸如天然存在或人诱导、随机或靶向方式的一个或多个核苷酸的缺失、插入或取代。
植物细胞可以用本发明的一些实施方案的核酸构建体稳定或瞬时转化。在稳定转化中,将本发明的一些实施方案的核酸分子整合至植物基因组中,因此其代表稳定和遗传的性状。在瞬时转化中,所述核酸分子由转化的细胞表达,但其未整合至基因组中,因此其代表瞬时性状。
存在将外来基因引入单子叶植物和双子叶植物中的多种方法(Potrykus, I.,Annu. Rev. Plant. Physiol., Plant. Mol. Biol. (1991) 42:205-225; Shimamoto等人., Nature (1989) 338:274-276)。
引起外源DNA稳定整合至植物基因组DNA中的主要方法包括两种主要方法:
(i)农杆菌介导的基因转移:Klee等人(1987) Annu. Rev. Plant Physiol. 38:467-486; Klee和Rogers, Cell Culture and Somatic Cell Genetics of Plants, Vol. 6,Molecular Biology of Plant Nuclear Genes, 编辑 Schell, J.,和Vasil, L. K.,Academic Publishers, San Diego, Calif. (1989) p. 2-25; Gatenby, PlantBiotechnology, 编辑 Kung, S.和Arntzen, C. J., Butterworth Publishers, Boston,Mass. (1989) p. 93-112。
(ii) 直接DNA摄取:Paszkowski等人, Cell Culture and Somatic CellGenetics of Plants, Vol. 6, Molecular Biology of Plant Nuclear Genes编辑Schell, J.,和Vasil, L. K., Academic Publishers, San Diego, Calif. (1989) p.52-68; 包括用于将DNA直接摄取至原生质体中的方法,Toriyama, K. 等人 (1988) Bio/Technology 6:1072-1074。通过植物细胞的短暂电休克诱导的DNA摄取:Zhang等人PlantCell Rep. (1988) 7:379-384. Fromm等人Nature (1986) 319:791-793。通过粒子轰击将DNA注入植物细胞,Klein等人 Bio/Technology (1988) 6:559-563; McCabe等人Bio/Technology (1988) 6:923-926; Sanford, Physiol. Plant. (1990) 79:206-209;通过使用微量吸液系统:Neuhaus等人, Theor. Appl. Genet. (1987) 75:30-36; Neuhausand Spangenberg, Physiol. Plant. (1990) 79:213-217;细胞培养物、胚胎或愈伤组织的玻璃纤维或碳化硅晶须转化,美国专利号5,464,765或通过DNA与发芽花粉的直接孵育,DeWet等人,Experimental Manipulation of Ovule Tissue, 编辑 Chapman, G. P.和Mantell, S. H.以及Daniels, W. Longman, London, (1985) p. 197-209; 和Ohta,Proc. Natl. Acad. Sci. USA (1986) 83:715-719。
土壤杆菌系统包括使用整合至植物基因组DNA中的定义DNA取代的质粒载体。植物组织的接种方法根据植物物种和土壤杆菌递送系统改变。广泛使用的方法是可用为开始全植物分化提供良好来源的任何组织外植体进行的叶盘程序。Horsch等人在PlantMolecular Biology Manual A5, Kluwer Academic Publishers, Dordrecht (1988) p.1-9中。补充方法采用与真空渗入组合的土壤杆菌递送系统。土壤杆菌系统在转基因双子叶植物的生成中尤其可行。
存在向植物细胞中直接转移DNA的各种方法。在电穿孔中,将原生质体短暂地暴露于强电场。在显微注射中,使用极小的微量移液管将DNA直接机械注入细胞中。在微粒轰击中,将DNA吸附在微弹诸如硫酸镁晶体或钨颗粒上,将微弹物理加速至细胞或植物组织中。
在稳定转化后进行植物繁殖。最常见的植物繁殖方法是通过种子。然而,通过种子繁殖的再生具有以下缺陷,由于种子由植物根据受孟德尔定律控制的遗传差异产生,所以由于杂合性在作物中缺乏均一性。基本上,每颗种子在基因上都不同并且各自将以其自身的特定性状生长。因此,优选的是,产生转化的植物,使得再生植物具有亲本转基因植物的相同性状和特征。因此,优选的是,通过提供转化植物的快速、一致生殖的微繁殖,再生转化植物。
微繁殖是由已经从所选亲本植物或栽培品种切除的单一组织片生长出新一代植物的过程。该过程允许具有表达融合蛋白的优选组织的植物大量生殖。产生的新一代植物在基因上与原始植物相同,并且具有原始植物的所有特征。微繁殖允许在短时间段内大量生产优质植物材料并且在原始转基因或转化植物特征的保持中提供了所选栽培品种的快速增殖。克隆植物的优点是植物增殖的速度和所产植物的质量和均一性。
微繁殖是需要在阶段之间改变培养基或生长条件的多阶段程序。因此,微繁殖过程涉及4个基本阶段:阶段1,初始组织培养;阶段2,组织培养增殖;阶段3,分化和植株形成;和阶段4,温室培养和硬化。在阶段1,初始组织培养期间,建立组织培养并保证无污染物。在阶段2期间,初始组织培养物增殖直至生成足够量的组织样品以满足生产目标。在阶段3期间,将阶段2中生长的组织样品分开并生长成单独的幼苗。在阶段4,将转化幼苗转移到温室中硬化,在温室中植物对光的耐受性逐渐增强,以致其可以在自然环境中生长。
尽管目前优选稳定转化,但本发明的一些实施方案还设想叶细胞、分生组织细胞或全植物的瞬时转化。
瞬时转化可以通过上述直接DNA转移方法中任一种或通过使用修饰的植物病毒的病毒感染来实现。
已显示可用于转化植物宿主的病毒包括CaMV、TMV和BV。使用植物病毒转化植物描述于美国专利号4,855,237 (BGV)、EP-A 67,553 (TMV)、日本公开申请号63-14693 (TMV)、EPA 194,809 (BV)、EPA 278,667 (BV);和Gluzman, Y.等人, Communications inMolecular Biology: Viral Vectors, Cold Spring Harbor Laboratory, New York,pp. 172-189 (1988)。在WO 87/06261中描述了用于在许多宿主(包括植物)中表达外源DNA的假病毒颗粒。
上述参考文献以及Dawson, W. O.等人, Virology (1989) 172:285-292;Takamatsu等人.EMBO J.(1987) 6:307-311;French等人. Science (1986) 231:1294-1297;和Takamatsu等人. FEBS Letters (1990) 269:73-76表明构建植物RNA病毒用于在植物中引入和表达非病毒外源核酸序列。
当病毒是DNA病毒时,可以对病毒本身进行合适的修饰。或者,可以首先将病毒克隆至细菌质粒中以便于用外来DNA构建所需病毒载体。然后可以从质粒切除病毒。如果病毒是DNA病毒,则细菌复制起点可以连接至病毒DNA,然后由细菌复制。该DNA的转录和翻译将产生衣壳蛋白,其将包裹病毒DNA。如果病毒是RNA病毒,则通常将病毒作为cDNA克隆并插入质粒。然后将质粒用于制备所有结构。然后通过转录质粒的病毒序列和翻译病毒基因以产生包裹病毒RNA的衣壳蛋白来产生RNA病毒。
上述参考文献以及美国专利号5,316,931表明构建植物RNA病毒用于在植物中引入和表达非病毒外源核酸序列(诸如包括在本发明的一些实施方案的构建体中的那些)。
在一个实施方案中,提供了植物病毒核酸,其中已经从病毒核酸缺失天然衣壳蛋白编码序列,已经插入非天然植物病毒衣壳蛋白编码序列和非天然启动子,优选地非天然衣壳蛋白编码序列的亚基因组启动子,其能够在植物宿主中表达,包装重组植物病毒核酸以及确保重组植物病毒核酸对宿主的全身感染。或者,衣壳蛋白基因可以通过在其内插入非天然核酸序列来失活,使得产生蛋白。重组植物病毒核酸可以含有一种或多种另外的非天然亚基因组启动子。每个非天然亚基因组启动子均能够在植物宿主中转录或表达相邻基因或核酸序列并且不能相互地和与天然亚基因组启动子重组。非天然(外来)核酸序列可插入天然植物病毒亚基因组启动子附近或者如果包括多于一个核酸序列,则插入天然和非天然植物病毒亚基因组启动子附近。非天然核酸序列在宿主植物中在亚基因组启动子的控制下转录或表达以生成所需产物。
在第二个实施方案中,提供了重组植物病毒核酸,除天然外壳蛋白编码序列置于非天然外壳蛋白亚基因组启动子之一而不是非天然外壳蛋白编码序列的附近外,与第一实施方案一样。
在第三个实施方案中,提供了重组植物病毒核酸,其中天然外壳蛋白基因在其亚基因组启动子的附近并且已经向病毒核酸中插入了一个或多个非天然亚基因组启动子。插入的非天然亚基因组启动子能够在植物宿主中转录或表达相邻基因并且不能相互地和与天然亚基因组启动子重组。非天然核酸序列可插入非天然亚基因组植物病毒启动子附近,以便在宿主植物中在亚基因组启动子的控制下转录或表达所述序列以生成所需产物。
在第四个实施方案中,提供了重组植物病毒核酸,除天然外壳蛋白编码序列由非天然外壳蛋白编码序列代替外,与第三实施方案一样。
病毒载体被重组植物病毒核酸编码的衣壳蛋白壳体化以产生重组植物病毒。重组植物病毒核酸或重组植物病毒用于感染适当的宿主植物。重组植物病毒核酸能够在宿主中复制,在宿主中系统性传播,并且在宿主中转录或表达外来基因(分离的核酸)以产生所需产物。
除以上外,本发明的一些实施方案的核酸分子也可引入叶绿体基因组中,从而实现叶绿体表达。
将外源核酸序列引入叶绿体基因组的技术是已知的。这种技术涉及以下过程。首先,化学处理植物细胞以便将每个细胞的叶绿体数量减少为约1个。然后,经由粒子轰击将外源核酸引入细胞中,其目的是将至少一个外源核酸分子引入叶绿体中。选择外源核酸,使得其可经由易于用叶绿体固有的酶实现的同源重组整合到叶绿体基因组中。为此,除目标基因外,外源核酸包括源自叶绿体基因组的至少一个核酸段。另外,外源核酸包括选择标记,其通过相继选择过程用于确定全部或大体上全部的叶绿体基因组拷贝在此类选择后将包括外源核酸。在美国专利号4,945,050和5,693,507中找到关于这种技术的更多详情,所述专利通过引用并入本文。因此,多肽可由叶绿体的蛋白表达系统产生并且变得整合至叶绿体的内膜中。根据本发明的一些实施方案,提供了异源表达如上所述的本发明的分离的多核苷酸的宿主细胞。所述宿主细胞可以是任何合适的宿主细胞,包括可以在发酵、植物和其它真核细胞中培养或生长的细菌、酵母和其它微生物。例如,所述宿主细胞包括用含有本文所述的核酸分子的异源核酸、诸如噬菌体DNA、质粒DNA或粘粒DNA表达载体转化的细菌细胞(例如大肠杆菌和枯草芽孢杆菌),或用含有本文所述的核酸分子的重组酵母表达载体转化的酵母(例如,酿酒酵母或粟酒酵母)。
在一些实施方案中,所述宿主细胞是酵母细胞。在一个具体实施方案中,所述酵母细胞是缺乏内源性甾醇生物合成的酵母细胞,诸如GIL77,或内源性角鲨烯环氧酶erg1基因缺陷的酵母系,如Rasbery JM等人(Jour. Biol. Chem. 2007. 282:17002-17013)中所述。
在一些实施方案中,所述宿主细胞产生罗汉果醇、罗汉果醇或罗汉果苷前体或罗汉果苷。
所述方法还可以采用重组和非重组宿主的混合物。如果使用多于一种宿主,则可以共培养宿主,或者分开培养它们。如果分开培养宿主,则可以回收中间产物并任选地将其纯化和部分纯化,并使用中间产物作为底物加入重组宿主。
本文所述的重组宿主可用于产生罗汉果苷化合物的方法。例如,如果重组宿主是微生物,则所述方法可以包括在其中催化本发明的方法的步骤的酶中的一种或多种(例如合成酶、水解酶、CYP450和/或UGT)表达的条件下使重组微生物在培养基中生长。可以使重组微生物在补料或连续过程中生长。
通常,使重组微生物在发酵罐中在定义的温度下生长所需时间段。可以从表达一种或多种酶的重组宿主制备细胞裂解物,并将其用于接触底物,使得可以产生罗汉果苷。例如,可以从表达一种或多种UGT的重组宿主制备细胞裂解物,并将其用于接触罗汉果醇或罗汉果苷,使得可以产生罗汉果苷化合物。
在一些实施方案中,罗汉果苷化合物可以使用全细胞来产生,所述全细胞被提供含有前体分子(例如,罗汉果醇)的原材料。所述原材料可以在细胞生长期间或细胞生长后提供。全细胞可以是悬浮或固定的。全细胞可以在发酵液或反应缓冲液中。在一些实施方案中,可需要渗透剂以有效地将底物转移至细胞中。
可以通过从培养基提取样品用于根据公开的方法进行分析来测定产物、底物和中间体的水平。可以使用本领域已知的各种技术从培养物或培养基回收罗汉果苷化合物。
在一些实施方案中,提供宿主细胞的细胞裂解物。此细胞裂解物可以包含本发明的罗汉果苷途径酶,以及所述途径的罗汉果醇、罗汉果醇和罗汉果苷前体和罗汉果苷产物。因此,所述细胞裂解物可用于回收罗汉果苷途径的产物(例如罗汉果醇、罗汉果苷M4、M5和M6)或回收重组表达的酶多肽。提取活性酶多肽的方法是本领域众所周知的。
本发明的细胞裂解物也可以单独或与其它合适的底物或酶组合用于无细胞细胞合成罗汉果醇、罗汉果醇或罗汉果苷前体和罗汉果苷。
重组宿主
本文献的特征还在于重组宿主。如本文所用,术语重组宿主意指其基因组已通过至少一种并入的DNA序列增强的宿主。并入的DNA序列可以是编码一种或多种多肽的异源核酸。此类DNA序列包括但不限于不是天然存在的基因,通常不转录成RNA或翻译成蛋白(“表达”)的DNA序列以及期望引入非重组宿主中的其它基因或DNA序列。应当理解,通常通过稳定引入一种或多种重组基因来增强本文所述的重组宿主的基因组。所述重组基因也可以是编码一种或多种多肽的异源核酸。通常,引入的DNA或异源核酸最初不存在于作为DNA的受体的宿主中,但在本发明的范围内的是,从给定宿主分离DNA区段并随后将一个或多个额外拷贝的该DNA引入同一宿主中,例如,以增强基因产物的产生或改变基因的表达模式。在一些情况下,引入的DNA或异源核酸将通过例如同源重组或定点诱变来修饰或甚至替代内源基因或DNA序列。
根据一个具体实施方案,所诉植物是葫芦科的植物。下面提供了示例性物种。
亚科翅子瓜亚科(zanonioideae) (小条纹花粉粒)
• 族 Zanonieae
o 亚族Fevilleinae: Fevillea
o 亚族 翅子瓜亚族(Zanoniinae): Alsomitra 翅子瓜属(Zanonia) Siolmatra 睡布袋属(Gerrardanthus) Zygosicyos 碧雷鼓属(Xerosicyos) 棒锤瓜属(Neoalsomitra)
o 亚族Gomphogyninae: 雪胆属(Hemsleya) 棒瓜属(Gomphogyne) 绞股蓝属(Gynostemma)
o 亚族Actinostemmatinae: 假贝母属(Bolbostemma)合子草属( Actinostemma)
o 亚族Sicydiinae: Sicydium Chalema Pteropepon Pseudosicydium Cyclantheropsis
亚科葫芦亚科(花柱合并为单列)
• 族 Melothrieae
o 亚族Dendrosicyinae: Kedrostis Dendrosicyos Corallocarpus 布袋属(Ibervillea) Tumamoca Halosicyos Ceratosanthes Doyerea Trochomeriopsis Seyrigia Dieterlea 葫芦属(Cucurbitella) Apodanthera Guraniopsis Melothrianthus Wilbrandia
o 亚族Guraniinae: Helmontia Psiguria Gurania
o 亚族Cucumerinae: Melancium Cucumeropsis Posadaea 垂果瓜属(Melothria) Muellarargia 马交儿属(Zehneria) 黄瓜属(Cucumis) (包括: 红钮子属(Mukia), Dicaelospermum, Cucumella, Oreosyce和Myrmecosicyos [4] ).
o 亚族Trochomeriinae: 茅瓜属(Solena) Trochomeria Dactyliandra Ctenolepsis
族 裂瓜族(Schizopeponeae): 裂瓜属(Schizopepon)
族 Joliffieae
o 亚族Thladianthinae:藏瓜属(Indofevillea) 罗汉果(Siraitia) 青牛胆属(Thladiantha) 苦瓜属(Momordica)
o 亚族Telfairiinae: Telfaria
• 族 Trichosantheae
o 亚族 油渣果亚族(Hodgsoniinae): 油渣果属(Hodgsonia)
o 亚族Ampelosicyinae: Ampelosicyos Peponium
o 亚族Trichosanthinae: 金瓜属(Gymnopetalum) 栝楼属(Trichosanthes) Tricyclandra
o 亚族Herpetosperminae: Cephalopentandra 三裂瓜属(Biswarea) 波棱瓜属(Herpetospermum) 三棱瓜属(Edgaria)
族 Benincaseae
o 亚族Benincasinae: Cogniauxia Ruthalicia 葫芦属(Lagenaria) 冬瓜属(Benincasa) Praecitrullus 西瓜属(Citrullus) Acanthosicyos Eureiandra Bambekea Nothoalsomitra 红瓜属(Coccinia) 双轮瓜属(Diplocyclos) Raphidiocystis Lemurosicyos Zombitsia 喷瓜属(Ecballium)欧洲甜瓜属( Bryonia)
o 亚族丝瓜亚族(Luffinae): 丝瓜属(Luffa)
族南瓜族(Cucurbiteae) (具散孔的,多刺花粉): 南瓜属(Cucurbita) Sicana Tecunumania Calycophysum Peponopsis Anacaona Polyclathra Schizocarpum Penelopeia Cionosicyos 泻瓜根属(Cayaponia) Selysia Abobra
族 Sicyeae (毛状蜜腺,4至10个孔沟的花粉粒)
o 亚族Cyclantherinae: Hanburia Echinopepon Marah 刺瓜属(Echinocystis) Vaseyanthus Brandegea Apatzingania Cremastopus Elateriopsis Pseudocyclanthera 辣子瓜属(Cyclanthera) Rytidostylis
o 亚族Sicyinae: 刺果瓜属(Sicyos) Sicyosperma Parasicyos Microsechium 佛手瓜属(Sechium) Sechiopsis Pterosicyos
地位未定: Odosicyos
属的按字母顺序排列:Abobra Acanthosicyos 合子草属(Actinostemma) Alsomitra Ampelosycios Anacaona Apatzingania Apodanthera Bambekea 冬瓜属(Benincasa) 三裂瓜属(Biswarea) 假贝母属(Bolbostemma) Brandegea 欧洲甜瓜属(Bryonia) Calycophysum 泻瓜根属(Cayaponia) Cephalopentandra Ceratosanthes Chalema Cionosicyos 西瓜属(Citrullus) 红瓜属(Coccinia) Cogniauxia Corallocarpus Cremastopus Ctenolepis Cucumella Cucumeropsis 黄瓜属(Cucumis) 南瓜属(Cucurbita) 葫芦属(Cucurbitella) 辣子瓜属(Cyclanthera) Dactyliandra Dendrosicyos Dicaelospermum Dieterlea 双轮瓜属(Diplocyclos) Doyerea 喷瓜属(Ecballium) 刺瓜属(Echinocystis) Echinopepon 三棱瓜属(Edgaria) Elateriopsis Eureiandra Fevillea 睡布袋属(Gerrardanthus) 棒瓜属(Gomphogyne) Gurania Guraniopsis 金瓜属(Gymnopetalum) 绞股蓝属(Gynostemma) Halosicyos Hanburia Helmontia 雪胆属(Hemsleya) 波棱瓜属(Herpetospermum) 油渣果属(Hodgsonia) 布袋属(Ibervillea) 藏瓜属(Indofevillea) Kedrostis 葫芦属(Lagenaria) Lemurosicyos 丝瓜属(Luffa) Marah Melancium 垂果瓜属(Melothria) Melothrianthus Microsechium 苦瓜属(Momordica) Muellerargia 红钮子属(Mukia) Myrmecosicyos 棒锤瓜属(Neoalsomitra) Nothoalsomitra Odosicyos Oreosyce Parasicyos Penelopeia Peponium Peponopsis Polyclathra Posadaea Praecitrullus Pseudocyclanthera Pseudosicydium Psiguria Pteropepon Pterosicyos Raphidiocystis Ruthalicia Rytidostylis Schizocarpum 裂瓜属(Schizopepon) Sechiopsis 佛手瓜属(Sechium) Selysia Seyrigia Sicana Sicydium 刺果瓜属(Sicyos) Sicyosperma Siolmatra 罗汉果(Siraitia) 茅瓜属(Solena) Tecunumania Telfairia 青牛胆属(Thladiantha) 栝楼属(Trichosanthes) Tricyclandra Trochomeria Trochomeriopsis Tumacoca Vaseyanthus Wilbrandia 碧雷鼓属(Xerosicyos) 翅子瓜属(Zanonia) 马交儿属(Zehneria) Zombitsia Zygosicyos。
葫芦属是指原产于并且最初栽培在安第斯山脉和中美洲的葫芦科Cucurbitaceae的属。葫芦种可能是驯化或非驯化的。
示例性物种包括但不限于:
• C. argyrosperma (同义词C. mixta) – pipian, 倭瓜南瓜(cushaw pumpkin);起源 - 巴拿马,墨西哥
o C. kellyana,起源 - 墨西哥西部的太平洋海岸
o C. palmeri,起源 - 墨西哥西北部的太平洋海岸
o C. sororia,起源 - 太平洋海岸墨西哥到尼加拉瓜,墨西哥东北部
C. digitata –手指葫芦;起源 - 美国西南部,墨西哥西北部
o C. californica
o C. cordata
o C. cylindrata
o C. palmata
•C. ecuadorensis,起源 - 厄瓜多尔的太平洋海岸
C. ficifolia –黑子葫芦,chilacayote;起源 - 墨西哥,巴拿马,智利北部和阿根廷
C. foetidissima –臭葫芦,水牛葫芦;起源 - 墨西哥
o C. scabridifolia,可能是C. foetidissimaC. pedatifolia的天然杂交物[67][68]
C. galeottii 知之甚少;起源 - 瓦哈卡,墨西哥
C. lundelliana,起源 - 墨西哥,危地马拉,伯利兹
C. maxima –冬季南瓜,南瓜;起源 - 阿根廷,玻利维亚,厄瓜多尔
o C. andreana,起源 - 阿根廷
C. moschata –胡桃南瓜,'Dickinson'南瓜,金色倭瓜;起源 - 玻利维亚,哥伦比亚,厄瓜多尔,墨西哥,巴拿马,波多黎各,委内瑞拉
C. okeechobeensis,起源 - 佛罗里达
o C. martinezii,起源 - 墨西哥湾海岸和山麓丘陵
C. pedatifolia,起源 - 克雷塔罗,墨西哥
o C. moorei
•C. pepo –野南瓜,夏季南瓜,绿皮西葫芦,西葫芦,小胡瓜,小青南瓜;起源 - 墨西哥,美国
oC. fraterna,起源 - 塔毛利帕斯和新莱昂,墨西哥
oC. texana,起源 - 得克萨斯,USA
C. radicans – calabacilla, calabaza de coyote;起源 - 墨西哥中部
o C. gracilior
本发明的多肽、多核苷酸、细胞和方法可用于产生罗汉果苷VI。因此,根据一些实施方案,提供了富集罗汉果苷VI至至少10 % (wt/wt)的罗汉果苷VI的总浓度的组合物。
在一些实施方案中,特别是在产生罗汉果苷的重组细胞群体中,罗汉果苷MII和MV或MVI可以以显著量一起发现。因此,根据一个实施方案,提供了包含罗汉果苷VI (M6)和罗汉果苷II (M2)的组合物,和/或包含罗汉果苷V (M5)、VI (M6)和罗汉果苷II (M2)的组合物。
在一些实施方案中,特别是在异源表达本发明的一种或多种罗汉果醇生物合成途径酶的重组细胞中产生包含罗汉果苷的组合物的情况下,所述组合物包含罗汉果苷M4、和/或M5和/或M6,以及包含至少一种编码一种或多种罗汉果醇生物合成途径酶的DNA序列(所述DNA序列缺乏至少一个内含子)的DNA。在一些实施方案中,所述序列是罗汉果醇生物合成途径多肽的完整编码序列的10%、20%、30%、40%、50%、60%或更多。在一些情况下,至少一种包含编码序列的DNA序列包含针对在重组宿主中表达优化且核酸序列与天然(例如,罗汉果)序列的不同在于至少5%、至少10%、至少15%、至少20%或更多的编码序列。
在其中期望增强甜味的一些实施方案中,罗汉果苷VI或罗汉果苷V的浓度足以引起风味增加,并且可以用作甜味剂。此组合物可以包含浓度为至少0.2ppm (例如,0.2-300ppm)或更多的罗汉果苷VI。
在一些实施方案中,本发明的组合物是消耗性组合物。
消耗品包括所有食物产品,包括但不限于谷类食品、稻米产品、木薯产品、西米产品、面包师产品、饼干产品、糕点产品、面包产品、糕点糖果产品、点心产品、树胶、口香糖、巧克力、冰块、蜂蜜产品、糖蜜产品、酵母产品、烘焙粉、盐和香料产品、开胃产品、芥末产品、醋产品、酱料(调味品)、烟草产品、雪茄、香烟、加工食品、烹煮水果和蔬菜产品、肉类和肉产品、果胶、果酱、水果沙司、蛋产品、牛奶和乳产品、酸奶、奶酪产品、黄油和黄油替代产品、乳替代产品、大豆产品、食用油和脂肪产品、药品、饮料、碳酸饮料、酒精饮料、啤酒、软饮料、矿泉水和汽水和其它非酒精饮料、水果饮料、果汁、咖啡、人造咖啡、茶、可可,包括需要复原的形式、食物提取物、植物提取物、肉类提取物、调味品、甜味剂、营养保健品、明胶、药物和非药物胶、片剂、锭剂、滴剂、乳剂、酏剂、糖浆和用于制备饮料的其它制剂及其组合。
本发明的罗汉果苷组合物可用于各种消耗品,包括但不限于水基消耗品、固体干性消耗品和乳制品、乳制品衍生产品和乳制品替代产品。在一些实施方案中,所述组合物是食物。
水基消耗品包括但不限于饮料、水、水性饮料、增强/稍甜化的水饮料、矿泉水、碳酸饮料、非碳酸饮料、碳酸水、静水、软饮料、非酒精饮料、酒精饮料、啤酒、葡萄酒、酒、水果饮料、汁液、果汁、蔬菜汁、肉汤饮料、咖啡、茶、红茶、绿茶、乌龙茶、草药茶、可可茶(水基)、茶基饮料、咖啡基饮料、可可基饮料、糖浆、冷冻水果、冷冻果汁、水基冰、水果冰、果汁冰糕、酱料、沙拉酱、酱汁、汤和饮料植物材料(完整的或研磨的)或用于复原的速溶粉末(咖啡豆、研磨咖啡、速溶咖啡、可可豆、可可粉、速溶可可、茶叶、速溶茶粉)。在一些实施方案中,所述组合物可以是饮料诸如Coca-Cola®等。
固体干性消耗品包括但不限于谷物、烘焙食品、饼干、面包、早餐谷物、谷物棒、乳制品、乳制品、能量棒/营养棒、格兰诺拉麦片、蛋糕、曲奇、薄脆饼干、甜甜圈、松饼、糕点、糖果、口香糖、巧克力、软糖、硬糖、棉花糖、压片、休闲食品和植物材料(完整的或研磨的)以及如上所提及的用于复原的速溶粉末。
对于水性或固体干性消耗品,有用浓度可以为0.2ppm (例如0.2-300ppm)或更多。
在某些产品中,通常需要较高的甜味剂浓度以达到相似的甜度强度,例如在乳制品、乳制品衍生产品和乳制品替代产品中。乳制品衍生食品含有乳或乳蛋白。乳制品替代产品含有来自植物来源(大豆、稻米和其它富含蛋白的植物材料)的蛋白(而不是衍生自哺乳动物乳的乳蛋白)。乳制品、乳制品衍生产品和乳制品替代产品包括但不限于乳、流体乳、培养乳制品、培养和非培养的乳制品基饮料、用乳杆菌培养的培养的乳制品、酸奶、酸奶基饮料、光滑奶酪、印度奶昔、奶昔、酸乳、酸乳饮料、黄油乳、克非尔(kefir)、乳基饮料、乳/果汁共混物、发酵乳饮料、冰淇淋、甜点、酸奶油、蘸酱、沙拉酱、松软干酪、冷冻酸奶、豆浆、米浆、大豆饮料、米浆饮料。
乳包括但不限于全乳、脱脂乳、炼乳、蒸乳、减脂乳、低脂乳、脱脂乳和乳固体(可能是脂肪或非脂肪的)。
对于乳制品、乳制品衍生产品和乳制品替代产品,有用的浓度为约0.3至500ppm或更高,并且可高达550ppm、600ppm、650ppm、700ppm或750ppm。
本发明的组合物还可以包括一种或多种额外的风味成分,诸如额外的甜味剂。可用于本发明的组合物的合适的风味成分的非限制性列表包括蔗糖、果糖、葡萄糖、高果糖玉米糖浆、木糖、阿拉伯糖、鼠李糖、赤藓醇、木糖醇、甘露糖醇、山梨糖醇、肌醇、AceK、阿斯巴甜、纽甜、三氯蔗糖、糖精、柚皮苷二氢查耳酮(NarDHC)、新橙皮苷二氢查耳酮(NDHC)、甜茶苷、莱鲍迪苷A、甜菊苷、甜叶菊和三叶苷。
通常用于消耗品中的甜味剂包括:
雪莲果糖浆 - 天然甜味剂。
如本文使用,术语“约”是指± 10%。
术语“包含(comprises)”、“包含(comprising)”、“包括(includes)”、“包括(including)”、“具有”及其词形变化意指“包括但不限于”。
术语“由……组成”意指“包括并限于”。
术语“基本由……组成”意味着组成、方法或结构可包括其它成分、步骤和/或部分,但只要其它成分、步骤和/或部分不实质性地改变所要求保护的组成、方法或结构的基本和新的特征。
如本文使用,单数形式“一个/种(a)”、“一个/种(an)”和“所述/该(the)”包括复数指代物,除非文中另有明确规定。例如,术语“一种化合物”或“至少一种化合物”可包括多种化合物,包括其混合物。
在整个本申请中,本发明的不同的实施方案可以范围形式呈现。应理解,范围形式的描述仅出于方便和简洁,不应解释为本发明范围的不可变更的限制。因此,范围的描述应视为具体公开了所有可能的子范围以及该范围的各个数值。例如,范围诸如1-6的描述应视为具体公开了诸如1-3、1-4、1-5、2-4、2-6、3-6等子范围,以及该范围的各个数,例如1、2、3、4、5和6。其不论范围宽度均适用。
每当本文规定数值范围时,均意指包括该指定范围内的任何所述的数值(分数或整数)。短语第一标示数字和第二标示数字“之间的范围”和“从”第一标示数字“到”第二标示数字“的范围”在本文互换使用,意指包括第一标示数字和第二标示数字和其间的所有分数和整数。
如本文使用,术语“方法”是指用于完成给定任务的方式、手段、技术和程序,包括但不限于化学、药理学、生物、生物化学和医学领域从业人员已知或容易由他们从已知的方式、手段、技术和程序开发的方式、手段、技术和程序。
当提及特定的序列表时,此提及应被理解为也包括基本上对应于其互补序列的序列,包括由于例如测序错误、克隆错误或导致碱基取代、碱基缺失或碱基添加的其它改变而导致的次要序列变异,条件是此类变异的频率为小于1/50个核苷酸,或者小于1/100个核苷酸,或者少于1/200个核苷酸,或者少于1/500个核苷酸,少于1/1000个核苷酸,或者,少于1/5,000个核苷酸,或者少于1/10,000个核苷酸。
应理解,为了清楚起见,在各个实施方案的背景下描述的本发明的某些特征,也可在单一实施方案中组合提供。相反,出于简洁起见,在单一实施方案的背景下描述的本发明的不同特征,也可单独提供或以任何合适的亚组合提供或适用于本发明的任何其它描述的实施方案。在不同实施方案的情况下描述的某些特征不视为所述实施方案的必需特征,除非该实施方案在无所述要素时是无效的。
在下面的实施例中,提供对上文描述和随附权利要求书部分要求保护的本发明的不同实施方案和方面的实验支持。
实施例
现在参照以下实施例,连同上文的描述,其以非限制性方式说明本发明的一些实施方案。
一般而言,本文使用的命名和本发明中利用的实验室程序包括分子、生物化学、微生物和重组DNA技术。文献中全面阐释了这样的技术。参见例如"Molecular Cloning:Alaboratory Manual" Sambrook等人(1989);"Current Protocols in MolecularBiology" 第I-III卷, Ausubel, R. M.编辑(1994);Ausubel等人, "Current Protocolsin Molecular Biology", John Wiley and Sons, Baltimore, Maryland (1989);Perbal, "A Practical Guide to Molecular Cloning", John Wiley & Sons, New York(1988);Watson等人, "Recombinant DNA", Scientific American Books, New York;Birren等人(编辑) "Genome Analysis:A Laboratory Manual Series", 第1-4卷, ColdSpring Harbor Laboratory Press, New York (1998);如美国专利号4,666,828、4,683,202、4,801,531、5,192,659和5,272,057;"Cell Biology:A Laboratory Handbook", 第I-III卷, Cellis, J. E.编辑(1994);“Culture of Animal Cells – A Manual of BasicTechnique” Freshney, Wiley-Liss, N. Y. (1994)第三版;"Current Protocols inImmunology" 第I-III卷, Coligan J. E.编辑(1994);Stites等人(编辑), "Basic andClinical Immunology" (第8版), Appleton和Lange, Norwalk, CT (1994);Mishell和Shiigi (编辑), "Selected Methods in Cellular Immunology", W. H. Freeman andCo., New York (1980)中所示的方法;可得的免疫测定法大量描述于专利和科学文献中,参见例如美国专利号3,791,932、3,839,153、3,850,752、3,850,578、3,853,987、3,867,517、3,879,262、3,901,654、3,935,074、3,984,533、3,996,345、4,034,074、4,098,876、4,879,219、5,011,771和5,281,521,"Oligonucleotide Synthesis" Gait, M. J.编辑(1984);“Nucleic Acid Hybridization" Hames, B. D.和Higgins S. J., 编辑(1985);"Transcription and Translation" Hames, B. D.和Higgins S. J.编辑(1984);"AnimalCell Culture" Freshney, R. I.编辑(1986);"Immobilized Cells and Enzymes" IRLPress, (1986);"A Practical Guide to Molecular Cloning" Perbal, B., (1984)以及"Methods in Enzymology" 第1-317卷, Academic Press;"PCR Protocols:A Guide ToMethods And Applications", Academic Press, San Diego, CA (1990);Marshak等人,"Strategies for Protein Purification and Characterization - A LaboratoryCourse Manual" CSHL Press (1996);其全部通过引用并入,如同在本文完全阐述一样。在整个文件中提供其它一般参考文献。其中的程序被视为是本领域中众所周知的,并且为了方便读者而提供。其中所含的全部信息通过引用并入本文。
实验程序
基因筛选
为了鉴定可参与罗汉果苷生物合成的候选罗汉果基因,本发明人已经进行了正在发育的罗汉果果实的6个阶段的详细转录组分析。果实阶段为果实成形后15、34、55、77、93、103天,其通过用通常用于生产单性结实的南瓜果实的商业果实成形激素(20 ppm NAA萘乙酸,商业制剂Alphatop, Perelman Co. Tel Aviv, Israel)处理喷洒开花期雌花来完成。将正在发育的果实取样,储存于-80℃,并用于进一步分析。从粉状果实样品提取RNA,并根据制造商的指导,使用Tru Seq®RNA样品制备试剂盒v2 (Illumina San Diego, California,USA)制备转录物。在伊利诺伊大学基因组研究中心(University of Illinois GenomeResearch Center),使用Illumina HiSeq2500技术分析RNA-seq文库,并使用标准从头组装软件包,将读数组装成转录物重叠群(contigs)。针对公共基因组数据库,包括NCBI非冗余蛋白(nr)和葫芦基因组数据库诸如甜瓜基因组(https://melonomicsdotnet/)和黄瓜基因组(wwwdotcugidotorg),注释转录物。选择注释为参与罗汉果苷代谢的各种酶(角鲨烯环氧酶、葫芦二烯醇合酶、环氧化物水解酶、细胞色素P450和UDP葡萄糖葡糖基转移酶)的候选基因的转录物,用于异源表达和功能分析。分析相同的果实样品的罗汉果苷含量,以确定连续添加葡糖基的阶段。
组织取样用于代谢概况分析
组织制备 - 对于HPLC,使用IKA A11研磨机,在液氮中,研磨新鲜或冷冻(-80℃)果实组织。然后,将600μl的甲醇:水(1:1)添加至200mg精细研磨的粉末,并将所得混合物涡旋30秒,超声处理15分钟并再次涡旋30秒。通过离心(20,000 x g)并通过使用Axiva注射器过滤器(PTFE,0.2μm)的过滤而净化样品的碎片。
HPLC-DAD:在具有Agilent 1200二极管阵列检测器(DAD)的Agilent 1200 HPLC系统上进行分析。分析柱:Zorbax Stable Bond - C18柱(4.6x150.0 mm, 5.0 μm, AgilentTechnologies, USA)。流动相含有A,含有0.1%甲酸的H2O;B,100% HPLC级乙腈。该柱用80% A平衡,并且然后注入样品,10分钟后达到90% B梯度。流动相流速为1.5 ml min-1。通过与商业标准品共迁移并通过将每个核苷峰的谱与标准品的谱匹配来鉴定每种物质。
HPLC-MS:在与Agilent 1290 Infinity DAD和Agilent 6224精确质量飞行时间(TOF)质谱(MS)联用的Agilent 1290 Infinity系列液相色谱上进行分析。分析柱为:Zorbax Extend-C18 Rapid Resolution HT柱(2.1x50.0 mm, 1.8 μm, AgilentTechnologies, Waldbronn, Germany)。使用配备有双-喷雾器正交ESI源(一个喷雾器用于分析流,并且一个用于参考化合物)的Agilent 6224 Accurate Mass TOF LC/MS系统(Agilent Technologies, Santa Clara, USA)进行质谱。流动相含有A,含有0.1%甲酸的H2O;B,100% HPLC级乙腈。该柱用80% A平衡,然后注入样品,10分钟后达到90% B梯度。流动相流速为0.4 ml min-1。通过与商业标准品共迁移并通过将推定峰的质谱与标准品的质谱匹配来鉴定每种物质。色谱图最初通过MassHunter定性分析软件v.B.05.00(Agilent)进行分析,并通过MassHunter Mass Profiler软件v.B.05.00 (Agilent)进一步分析。
UGT表达和功能分析
对于在大肠杆菌表达系统中进行的UGT表达,将所得质粒转化至大肠杆菌ArcticExpress (Agilent)中。为了表达UGT酶,将新鲜的过夜培养物在25ml含有50μg/ml卡那霉素和庆大霉素的 LB培养基中1:100稀释,并在37℃和250rpm下孵育,直到达到0.4的A600。随后,添加IPTG至0.5 mM的浓度,并在18℃和250rpm下继续孵育过夜。第二天,通过离心收获细胞,并将沉淀重悬浮于2ml 50 mM Tris HCl pH = 7.0和5mM β-巯基乙醇中。通过超声处理破碎细胞后,通过离心除去不溶物质,并将可溶性级分用于表征酶。将蛋白储存在-20℃,直到进一步分析。
UGT测定:
将底物(罗汉果苷)在50% DMSO中溶解至1mM。使用8 mM UDP-木糖和0.1mM底物和25μl酶粗提取物,在50 mM Tris HCl pH = 7.0和5 mM β-巯基乙醇中进行酶测定(终体积为100μl的反应)。在30℃下孵育过夜后,通过添加300μl甲醇和0.1%甲酸来终止反应。通过短暂涡旋来制备样品。然后,将提取物以13,000rpm离心15分钟并在LC-MS上分析。将产物与含有携带空pET28a的大肠杆菌的酶制备物的对照孵育进行比较。
实施例1: 罗汉果苷积累的时间模式
在罗汉果果实的发育期间的罗汉果苷积累显示于图4A和4B中。在冷冻粉末的甲醇提取物上进行了果实成熟期间的罗汉果的罗汉果苷的靶向代谢概况分析,并通过具有光电二极管阵列和质谱检测的HPLC进行分析。结果揭示了其独特的时间分布。罗汉果苷仅限于正在发育的果实,并且在根、茎或叶组织中没有观察到。
在已经分析的未成熟果实的最年轻阶段,在15 DAA (开花后的天数),大多数罗汉果醇以二葡糖基化的形式存在,其中C-3和C-24罗汉果醇碳各自是单葡糖基化的。没有观察到非葡糖基化的、单葡糖基化的或替代的M2化合物,其中第二葡糖基部分作为主链葡萄糖部分之一上的支链葡萄糖存在,表明罗汉果苷葡糖基化的初始代谢步骤限于两次主链葡糖基化,并且这些发生在果实发育早期。
正在发展的小果实中的总体罗汉果苷水平在整个发育中保持相似,且没有迹象表明罗汉果苷随着发育的净积累。这些结果表明罗汉果苷代谢的强烈时间分布,并且罗汉果醇合成的早期步骤和初始的主链葡糖基化限于早期果实发育,为后续的葡糖苷化准备罗汉果苷的储库。
在合成M2之后,在C24位置存在额外的支链1-6糖基化,导致M3X的积累。在后期阶段(77和90 DAA)期间,出现了许多M4化合物,主要是通过NMR确认为在C24位置的第三支链葡糖基化的赛门苷(siaminoside)。还存在替代的四葡糖基化的罗汉果苷,诸如M4A,但量小。在C3位置具有第二次葡糖基化的M5在77 DAA开始以M4化合物为代价积累,并在成熟的最后阶段期间急剧增加。在成熟的103 DAA果实中,M5,以及小痕量的IM5,占果实罗汉果苷组分的大多数。(图4B)。
因此,在分析的最年轻阶段,已经存在直至二葡糖基化的罗汉果醇M2的罗汉果苷代谢物的全部定员(full complement)。然后进行罗汉果苷合成的早期阶段的候选基因的表达,特别包括角鲨烯环氧酶、环氧化物水解酶、葫芦二烯醇合酶、cyp450和主链葡糖基化UGT。
基因克隆与合成
一般来说,合成基因订购自Gen9Bio (Cambridge MA, USA),并使用NheI和NotI限制酶亚克隆至pET28a载体中,并通过测序验证插入物。
以下实施例表明用于鉴定负责该途径的基因的方法。
实施例2: 将罗汉果葫芦二烯醇合酶(SgCDS)鉴定为使2,3-单环氧角鲨烯和2,3; 22,23-二环氧角鲨烯二者环化,分别产生葫芦二烯醇和24,25-环氧葫芦二烯醇的酶
用于合成新型反式-C24,C25-二羟基葫芦二烯醇的优选底物是2,3;22,23-二环氧角鲨烯,其在角鲨烯分子的两端,在角鲨烯的编号为C2,3和C22,23的位置对称环氧化(图3)。2,3;22,23-二环氧角鲨烯通过在角鲨烯代谢生物体(包括酵母菌株GIL77)中普遍存在的酶角鲨烯环氧酶(SQE)合成。酵母菌株GIL77是这样的菌株之一,其中编码羊毛甾醇合酶的酵母基因erg7是突变且非功能性的,由此使得2,3-环氧角鲨烯前体可用于葫芦二烯醇合酶环化反应,并允许合成葫芦二烯醇。先前已经对于南瓜物种CDS基因(在Shibuya M等人 2004.Tetrahedron 60:6995-7003中被称为CPQ)显示了这一点。尽管已知葫芦二烯醇合酶可以将2,3环氧角鲨烯环化为葫芦二烯醇(图1),但不知道其是否可以将2,3,22,23-二环氧角鲨烯环化为24,25-二环氧葫芦二烯醇,这是在提出的罗汉果的罗汉果苷合成途径中的关键中间体(图2)。
令人惊讶地,发现编码葫芦二烯醇合酶SgCDS的罗汉果基因进行2,3-环氧角鲨烯的环化(产生葫芦二烯醇)和2,3;22,23-二环氧角鲨烯的环化(产生罗汉果醇合成途径的关键底物,24,25-环氧葫芦二烯醇)。如Davidovich-Rikanati等人(Yeast.2015.32(1):103-114)中所述,在GIL77酵母菌株中异源表达SgCDS基因(序列gb/AEM42982)。简言之,培养转化的酵母,并通过用半乳糖代替葡萄糖碳源来诱导GAL1启动子。诱导2天后,在20% KOH:50%EtOH存在的情况下破坏酵母,并用己烷提取甾醇。所得细胞提取物使用APCI中间相进行LC-TOF-MS分析,且色谱图呈现于图6B中。由于内源酵母erg1角鲨烯环氧酶活性,GIL77对照培养物(图6A)产生2,3-环氧角鲨烯(R.T.12.6)和2,3;22,23-二环氧角鲨烯(R.T 9.0)。SgCDS的表达(图6B)不仅导致葫芦二烯醇的积累,而且导致24,25-环氧葫芦二烯醇(用于环氧化物水解酶的后续反应的适当底物)的积累。
角鲨烯环氧酶已经被报道进行角鲨烯的单-和二-环氧化。这已经显示在动物系统(即,在胆固醇代谢中合成24,25-环氧胆固醇,Nelson JA等人, Jour. Biol. Chem. 1981.256, 1067-1068; Bai M, 等人, Bioch. Biophys. Res. Comm. 1992. 185:323-329)和植物系统(即,Rasbery JM等人, Jour. Biol. Chem. 2007. 282:17002-17013)二者中发挥功能。
为了鉴定可参与罗汉果醇生物合成的候选罗汉果角鲨烯环氧酶基因,进行了正在发育的罗汉果果实的6个阶段的详细转录组分析。果实期为果实成形后的15、34、55、77、93和103天,并用于产生上述转录组和罗汉果苷代谢组。罗汉果转录组的数据挖掘导致选择出在结果实期间具有高和早期表达的2种候选角鲨烯环氧酶(重叠群16760和18561)(图5A和5B)。这些角鲨烯环氧酶基因可以在酵母中被克隆并表达,所述酵母诸如如上所述除去内源甾醇生物合成(Gil77)的株系或缺乏内源角鲨烯环氧酶erg1基因的酵母系,诸如RasberyJM等人(Jour. Biol. Chem. 2007. 282:17002-17013)中所述,并测定产物的罗汉果醇前体2,3;24,25-二环氧角鲨烯的产生,所述2,3;24,25-二环氧角鲨烯然后可被环化成24,25-环氧葫芦二烯醇,并继续进行罗汉果醇生物合成途径。
实施例3: 催化罗汉果醇生物合成中24,25-环氧葫芦二烯醇的水合的罗汉果环氧 水合酶的鉴定
为了鉴定可参与罗汉果醇生物合成的候选罗汉果环氧水合酶基因,进行了正在发育的罗汉果果实的6个阶段的详细转录组分析。果实期为果实成形后的15、34、55、77、93和103天,并用于产生上述转录组和罗汉果苷代谢组。罗汉果转录组的数据挖掘导致在果实发育早期具有高水平表达的4种候选环氧水合酶(重叠群73966、86123、102640和28382)的鉴定和分离(图7和21-24)。
环氧水合酶基因在GIL77酵母中表达,且测定产物的从24,25-环氧葫芦二烯醇(以前描述的SgCDS反应的产物)的24,25-二羟基葫芦二烯醇的产生。图8A和8B显示在携带SgCDS基因的GIL77酵母菌株中的三种EPH候选基因(编码序列EPH1- SEQ ID NO:17、EPH2-SEQ ID NO:19和EPH3-SEQ ID NO:21)的异源表达的效果。Cmp1 (峰)代表24,25-二羟基葫芦二烯醇产物,且Cmp3(峰)代表24,25-环氧葫芦二烯醇底物。结果显示,罗汉果 SgEPH基因的表达导致24,25-二羟基葫芦二烯醇产物的量的大量增加(图8B中显示了通过峰下面积的定量显示)。由于内源酵母环氧化物水解酶活性,没有SgEPH基因的对照菌株也积累24,25-二羟基葫芦二烯醇,但达到低得多的水平(Gil77 + SgCDS)。
图9显示在我们的转录组和基因组分析中鉴定的罗汉果的8种EPH基因与Tang等人(2011)报道且随后在WO2014086842中用于产生四羟基角鲨烯的两种EPH序列(被鉴定为WO2014086842中的Seq Id No.3840)之间的氨基酸序列同一性矩阵。
因此,该实施例的结果显示,在罗汉果转录组中鉴定为EPH基因的基因能够在角鲨烯二环氧化物的CDS催化的环化之后,进行新型反式-24,25二羟基化步骤。
实施例4: 葫芦二烯醇11-水解酶的鉴定
为了鉴定可参与罗汉果醇生物合成的候选罗汉果细胞色素p450基因,进行了正在发育的罗汉果果实的6个阶段的详细转录组分析。果实期为果实成形后的15、34、55、77、93和103天,并用于产生上述转录组和罗汉果苷代谢组。
罗汉果转录组表明,cyp450家族包含超过100个成员。基于同源性分析和表达模式的罗汉果转录组的数据挖掘得到在正在发育的果实中表达(图10)且因此选择用于功能性表达以测试其在葫芦二烯醇存在的情况下的活性的约50种细胞色素CYP450同源物。
为了测试候选p450在罗汉果醇生物合成中的可能参与并测试其功能,根据其推导的全长开放阅读框合成所有候选物的核苷酸序列(Gen9Bio, Cambridge, MA, USA),并在酵母表达载体系统中克隆。将候选p450克隆至具有两个多克隆位点(MCS)的双重表达pESC-URA载体系统(Agilent Technologies)中,用于在半乳糖诱导型GAL1和GAL10启动子下两种基因的基因表达。将每个候选CYP引入MCS2,同时将SgCDS克隆在MCS1中,并在诱导时产生葫芦二烯醇。将所得质粒转移至源自酵母缺失项目保藏中心(Brachmann CB等人 Yeast 14(2):115-32)的酿酒酵母菌株BY4743_YHR072 (MATa/α his3Δ1/his3Δ1 leu2Δ0/leu2Δ0 LYS2/lys2Δ0 met15Δ0/MET15 ura3Δ0/ura3Δ0 kanMax::erg7/ERG7),其对于羊毛甾醇合成酶Erg7是杂合的(Corey EJ等人.Proc Natl Acad Sci USA 91:2211-2215.)。为了通过提供质子源来帮助p450活性,所有酵母都用携带拟南芥NADPH细胞色素p450还原酶(AtCPR1)的pESC-HIS载体转化。培养转化的酵母,并通过用半乳糖代替葡萄糖碳源来诱导GAL1启动子,并如实施例2所述提取。所得细胞提取物使用APCI中间相进行LC-TOF-MS分析。转化的酵母提取物的提取离子色谱图显示于图11A-11C中。紧接于SgCDS和AtCRP1的重叠群102801的异源表达导致产生在8.25分钟和8.3分钟的两种主要的洗脱化合物,其中根据其443.3883和441.3727的精确质量,分别指定分子式为C30H50O2和C30H48O2(图11A)。进一步分离在8.3分钟洗脱的主要产物,用于通过NMR进行化学分析,以鉴定发现在葫芦二烯醇的C11上的OH位置。没有SgCDS的相同重叠群的表达导致没有新的化合物(图11B),表明编码的酶作用于葫芦二烯醇,而不是由酵母内生产生的羊毛甾醇。
实施例5: 用于UGT测定的罗汉果苷前体底物的制备
合成候选UGT基因序列(BioGen9, Cambridge, MA, USA),并在大肠杆菌细胞中单独表达基因。平行地,纯化用于每种葡糖基化反应的底物,包括罗汉果醇,M1-E1 M2-A1,M2A,M3,M3x,赛门苷(siamenoside),M4,M5 (描绘于图12中)。从商业罗汉果苷粉末纯化这些底物(对于M4和以上的化合物,描述于VSP Chaturvedula, I Prakash, Journal ofCarbohydrate Chemistry, 2011 30:16-26 DOI:10.1080/07328303.2011.583511;并且其他罗汉果苷描述于Sai Prakash Chaturvedula V.和Prakash I., IOSR Journal ofPharmacy.2012 2(4):2250-3013中),或通过化学和酶促水解纯化的M5并随后通过HPLC纯化。
主链葡糖基化
为了鉴定负责罗汉果醇葡糖基化的UGT家族酶,在正在发育的果实中显示表达(图14)的罗汉果基因组中总共约160种UGT的接近100种基因(图13A和13B)如上所述在大肠杆菌中功能表达。提取的重组酶用0.1 mM 10种底物(M、M1-E1、M2-A1、M2A、M2-E、M3x、M3、赛门苷、M4和M5)中每一种和8 mM UDP-葡萄糖作为葡萄糖供体进行测定。
筛选的总体结果呈现于图16A-16C中的活性矩阵中。结果鉴定了严格进行主链C3糖基化的三种基因,UGT家族的成员74、75和85(图15A列A-D)。第四种基因UGT85E5 (SEQ IDNO:33)是唯一鉴定的能够严格进行特异性C24主链葡糖基化的基因(图15A,C1)。鉴定了UGT73家族的额外酶,其进行C25葡糖基化或C24和C25葡糖基化的混合(图15A,列E-G),如通过NMR所鉴定。
值得注意的是,UGT85-269-1不仅能够进行罗汉果醇的主链C-24葡糖基化,而且随后还能够进行C-24-葡糖基化的罗汉果醇的C-3主链葡糖基化,因此本身负责二葡糖基化M2的合成。因此,UGT85-269-1酶当与罗汉果醇,而不是M1-C3孵育时产生M1-C24和M2-C3,C24(图15A,C2-3,图16)。还可以在图15A中看到,进行主链C3葡糖基化的酶也能够进行该反应,而与葡糖基化状态C24无关,无论0、1、2还是3个葡萄糖部分占据该位置(图15A,列A-D,行2-6)。
分枝葡糖基化
随后的二级分枝糖基化通过单个UGT家族UGT94的三个成员进行,UGT94对于分枝是特异性的,并且不进行主链葡糖基化(图15B列I、J、K;图15C,列M、N、O)。三种UGT94酶显示底物特异性和活性的差异,如图15B和15C中所描绘。UGT94(289-3)和UGT94(289-1)似乎是最通用的,各自导致来自M4的五葡糖基化M5,而UGT94(289-2)似乎在其底物特异性方面最为有限。图18显示本文所述的每种基因和Tang等人(2011)和WO2013/076577中描述的来自罗汉果的现有已知基因序列之间的相似性和同一性得分。使用以BLOSUM62运行的MatGAT 2.02(www.bitincka.com/ledion/matgat/)确定矩阵。
令人惊讶的是,在UGT94(289-3)与作为底物的M5的一些反应中,我们观察到M6产物(m/z 1642.5)(图17A)。此外,分枝酶UGT94(289-3)也能够进行分枝的连续反应(图19A)。当M1A1与UGT74-345-2和UGT94-289-3两者一起孵育时,我们观察到M4产物。由于UGT94-289-3可以从M4底物产生M5,如图15B中所描绘,不希望限于单一假设,如果提供足够的底物和最佳反应条件,UGT94-289-3可以进行分枝反应的完整阵列是可能的。
令人惊讶的是,UGT85E5还显示分枝活性,特别是对C-3主链葡萄糖的分枝活性(图15B,列H)),并且其也可有助于途径的分枝部分,使其成为罗汉果苷合成中的关键酶。
总之,基于组合的代谢概况分析、功能表达和蛋白建模结果,以下罗汉果苷生物合成的代谢途径是可想象的。在果实发育的初始阶段期间,角鲨烯经由角鲨烯合酶、角鲨烯环氧酶、葫芦二烯醇合酶、环氧化物水解酶、细胞色素p450 (cyp102801)和UGT85的进行性作用,代谢为二葡糖基化的M2。在果实成熟期间,存在UGT94成员,并且可能还有UGT85的进行性活性,向M2的主链葡糖基部分添加支链葡糖基,导致甜味的M4、M5和M6化合物。
图15A-15C中概述的各个反应描述于以下各个实施例中。
实施例6:
UGT74-345-2催化在位置C3添加主链葡萄糖
提供0.1mM糖苷配基罗汉果醇作为底物和8mM UDP-葡萄糖作为糖供体的含有UGT74-345-2重组酶的反应导致MI-E1的积累(图15A-A1),而含有0.1mM MI-A1作为底物的相同反应导致MII-E的积累(图15A-A2)。此外,在含有0.1mM M2-A1的反应中,测量到M3x的积累,并且在含有MII-A的反应中,观察到M3的积累(图16A-A4和A5)。此外,在MIII-A1存在的情况下,产生赛门苷(图16A-A6)。那些反应的产物的分析指出UGT74-345-2进行主链葡糖基化、将葡萄糖部分连接至罗汉果醇/罗汉果苷的C-3位置上的能力。
UGT75-281-2催化在位置C3添加主链葡萄糖
提供0.1mM糖苷配基罗汉果醇作为底物和8mM UDP-葡萄糖作为糖供体的含有UGT75- 281-2重组酶的反应导致MI-E1的积累(图15A-B1和图16),而含有0.1mM MI-A1作为底物的相同反应导致MII-E的积累(图15A-B2和图16)。此外,在含有0.1mM M2-A1的反应中,测量到M3x的积累,并且在含有MII-A的反应中,观察到M3的积累(图15A-B4和B5)。那些反应的产物的分析指出UGT75-281-2进行主链葡糖基化、将葡萄糖部分连接至罗汉果醇/罗汉果苷的C-3位置上的能力。
UGT85-269-1是一种混杂酶,并催化葡萄糖的主链和分枝添加
使用0.1mM M、M1A1、M1E1、M2A1或M2A作为底物和8mM UDP-葡萄糖作为糖供体,当将UGT85-269-1重组酶加入反应时,分别观察到M1A1、M2E、M2E、M3x或M3的积累(图16A-C1-C5和图16)。因此,UGT85-269-1是来自罗汉果苷生物合成途径的主链葡糖基转移酶,并且能够在罗汉果醇/罗汉果苷的C-3或C-24连接葡萄糖(葡糖基化)。给予M2E、M3、M3x或赛门苷作为底物,含有UGT269-1的反应分别混合累积的推定M3-C3(1-6)、异罗汉果苷4和痕量的M4、M4A和异罗汉果苷5 (图15B-H1-H3和H4)。表明UGT85-269-1可以充当来自罗汉果苷生物合成途径的主链和分枝葡糖基转移酶。
UGT85-269-4催化在位置C3添加主链葡萄糖
使用0.1mM M、M1A1 M2A1或M2A作为底物和8mM UDP-葡萄糖作为糖供体,当将UGT85- 269-4重组酶加入反应时,分别观察到M1E1、M2E、M3x或M3的积累(图15A-D1-D5和图16)。因此,UGT85-269-4是来自罗汉果苷生物合成途径的主链葡糖基转移酶,并且能够在罗汉果醇的C-3位置连接葡萄糖(葡糖基化)。
UGT73-251-5催化在位置C24或C25添加主链葡萄糖
当将UGT73-251-5重组酶加入含有0.1mM糖苷配基罗汉果醇作为底物和8mM UDP-葡萄糖作为糖供体的反应混合物时,观察到M1-A1和M1-B的积累(图15A-E1),表明UGT73-251-5充当C-24和C-25葡糖基转移酶。
UGT73-251-6催化在位置C25添加主链葡萄糖
当将UGT73-251-6重组酶加入含有0.1mM糖苷配基罗汉果醇作为底物和8mM UDP-葡萄糖作为糖供体的反应混合物时,观察到M1-B的积累(图15A-D1),表明UGT73-348-2是C-25葡糖基转移酶。
UGT73-348-2催化在位置C24添加主链葡萄糖
当将UGT73-348-2重组酶加入含有0.1mM糖苷配基罗汉果醇作为底物和8mM UDP-葡萄糖作为糖供体的反应混合物时,观察到M1-A1和M1-B的积累(图15A-G1),表明UGT73-348-2是C-24和C-25葡糖基转移酶。
UGT94-289-1催化将葡萄糖在 1-6位分枝添加至C24和C3位的主链葡萄糖
使用0.1mM罗汉果苷IIE作为底物和8mM UDP-葡萄糖作为糖供体,当将UGT94-289-1重组酶加入反应时,观察到M3x的积累(图15B-K1)。当使用M3作为底物时,赛门苷和痕量的M4在反应混合物中积聚(图15B-K2)。最后,当使用M4作为底物时,发现M5在反应混合物中积累(图15B-K4)。另外,当加入M1A1、M2A1或M2A作为葡糖基化的底物时,分别积累M2A1、M3-A1和M3-A1 (图15C-O1、O3和O4)。因此,UGT94-289-1是来自罗汉果苷生物合成途径的分枝葡糖基转移酶,并且能够在C-24和C-3葡糖基化的罗汉果苷上的(1-6)和(1-2)位置连接葡萄糖。
UGT94-289-2催化将葡萄糖在 1-6位分枝添加至C24位的主链葡萄糖
使用0.1mM罗汉果苷IIE作为底物和8mM UDP-葡萄糖作为糖供体,当将UGT94-289-2重组酶加入反应时,观察到M3x的积累(图15B-J1),而当使用M3作为底物时,在反应混合物中观察到赛门苷的积累(图15B-J2)。另外,当加入M1A1或M2A作为葡糖基化的底物时,分别积累M2A1和M3-A1 (图15C-N1和N4)。因此,UGT94-289-2是来自罗汉果苷生物合成途径的分枝葡糖基转移酶,并且能够在C-24葡糖基化的罗汉果苷上的(1-6)位置连接葡萄糖。
UGT94-289-3是一种混杂酶,其催化将葡萄糖在 1-6或1-2位分枝添加至C24和C3 位的主链葡萄糖
使用0.1mM罗汉果苷IIE作为底物和8mM UDP-葡萄糖作为糖供体,当将UGT94-289-3重组酶加入反应时,观察到M3x的积累(图15B-I1)。当使用M3、M3x M4或赛门苷作为底物,分别在反应混合物中发现赛门苷(具有痕量的M4)、具有赛门苷的M4A、M5,和M5(图16B-I2-I5和图20)。另外,当加入M1A1、M1E1、M2A1或M2作为葡糖基化的底物时,分别积累M2A1、M2-A2、M3-A1和M3-A1 (图16C-M1-M4)。因此,UGT94-289-3是来自罗汉果苷生物合成途径的分枝葡糖基转移酶,并且能够在C-24或C-3葡糖基化的罗汉果苷上的(1-6)和(1-2)位置连接葡萄糖。在UGT94-289-3与作为底物的M5的一些反应中,我们观察到M6产物(m/z 1449.7113)(图15B-I6和图17A)。
UGT73-327-2催化将葡萄糖在 1-2位分枝添加至C3位的主链葡萄糖,以从M5产生 M6
发现酶UGT73-327-2催化罗汉果苷VI的生物合成的最后一步。当将异源表达的UGT73- 327-2蛋白添加至含有0.1mM罗汉果苷V和8mM UDP-葡萄糖的反应中,在反应产物内发现罗汉果苷VI,因此将UGT73-327-2指定为可能的(1-2) C-3-Glu葡糖基转移酶(图15B-L6)。
实施例7: UGT酶的系统发生树
使用以BLOSUM62运行的MatGAT 2.02 (www.bitincka(dot)com/ledion/matgat/)测定本文所述的每种基因和来自罗汉果的9种先前已知的基因序列之间的相似性和同一性得分。图13A-B描述了当前已知的UGT以及本发明的一些实施方案的新型UGT的系统发生树。使用Clustal X软件使用默认设置进行比对。Bootstrap值也使用Clustal X软件进行(1000次迭代)。使用NJPLOT软件使树可视化。树枝上的数字显示bootstrap比例,其为在复制数据集的分析中遇到那些组的频率,因此提供了对那些组的支持索引。分枝的长度对应于每个位点的取代数。
尽管结合其具体实施方案描述了本发明,但显然,许多替代方案、修改和变化对于本领域技术人员而言将是显而易见的。因此,旨在包括落入随附权利要求书的精神和宽泛范围内的所有这样的替代方案、修改和变化。
本说明书中提及的所有出版物、专利和专利申请通过引用全文并入本说明书,其程度如同各个出版物、专利或专利申请具体且单独指明通过引用并入本文一样。另外,本申请中任何参考文献的引用或鉴定不应解释为承认这样的参考文献可作为本发明的现有技术获得。在使用章节标题的程度上,它们不应解释为必要限制性的。
序列表
<110> The State of Israel, Ministry of Agriculture & Rural
Development, Agricultural Research Organization (ARO)
(Volcani
Center)
ITKIN, Maxim
Rachel, DAVIDOVICH-RIKANATI
Shahar, COHEN
Vitaly, PORTNOY
Adi, DORON-FAIGENBOIM
Marina, PETREIKOV
Shmuel, SHEN
Yaakov, TADMOR
Yosef, BURGER
Efraim, LEWINSOHN
Nurit, KATZIR
SCHAFFER, Arthur A
Elad, OREN
<120> 生产罗汉果苷的方法和包含其的组合物及其用途
<130> 63579
<150> US 62/048,924
<151> 2014-09-11
<150> US 62/089,929
<151> 2014-12-10
<160> 59
<170> PatentIn version 3.5
<210> 1
<211> 1647
<212> DNA
<213> 罗汉果
<400> 1
atggacgaaa attataattt tttaaaagtt caaaccttca atctcaagaa attcaacaaa 60
aattttccat cgcaacgacg ccgttcacct gcaccaagta actacttcat gtgtacttca 120
cttgctgaat tccttccgtg taaaacgtgg ttccagtttg tctcagcaat attctattta 180
aatggtcctt cgcacgattt ccaccatttg cctgctgcac cgggcggcga ttccgacgga 240
agagagaaga gccgatcgcc ggaaatggac gagacgacgg tgaacggagg gcggagagcg 300
agtgatgtgg tggtgttcgc tttcccgagg cacggccata tgagtccgat gctccaattc 360
tccaagcgtt tggtctccaa aggcctccgc gtcacgtttc tcatcaccac ctctgcaact 420
gaatccctcc gactaaatct tcctccctct tcttctctcg atcttcaagt tatctccgac 480
gtccctgaaa gtaacgacat cgcgacgctc gaagggtatc ttcgaagctt caaggccact 540
gtttccaaaa ccttggcgga tttcatcgac ggaatcggaa atcctccaaa gttcatcgtt 600
tacgattcgg tcatgccgtg ggtgcaggag gtagccagag ggcgcggcct cgatgcggcg 660
ccgtttttca ctcaatcgtc cgccgttaat cacatcctca atcatgtgta cggaggatct 720
ttgagcattc cggccccgga gaacacggca gtttcgcttc cttcgatgcc ggttcttcaa 780
gccgaggatc tgccggcctt ccccgacgac ccagaagtgg ttatgaactt catgaccagt 840
caattctcca atttccagga tgcaaaatgg attttcttca acacattcga tcagctggag 900
tgcaagaaac aaagtcaggt tgttaattgg atggccgaca gatggcccat caagacagtg 960
ggaccgacca ttccatcggc atatttggac gacggtcggt tggaggatga cagggcgttt 1020
ggtctgaatc tcctaaaacc tgaagatggg aagaacacta ggcagtggca gtggttagac 1080
tcaaaagaca ctgcttctgt cctttatatt tcatttggaa gcttggctat cttacaagaa 1140
gaacaagtga aggaactggc atatttcctc aaagacacca atctttcctt cttatgggtc 1200
cttagagact cagaactcca aaagcttccc cacaactttg tacaagagac atcacacaga 1260
ggtctggttg taaactggtg ctctcaacta caagttctgt ctcacagggc tgtaagttgc 1320
tttgtgactc attgtggttg gaattcgacg ctcgaagctt tgagcttggg ggtgccgatg 1380
gtcgcaattc cacagtgggt tgatcaaacg acaaacgcca agttcgttgc agatgtttgg 1440
agagtgggag ttagagtgaa gaagaaggac gaacgcatcg taaccaagga agaactagaa 1500
gcctccatcc gacaggttgt tcaaggagag gggagaaatg agtttaaaca taatgcaatc 1560
aagtggaaga agctggctaa agaagcagtg gatgaaggtg gcagctctga taaaaacatt 1620
gaagaatttg tcaagacaat tgcatga 1647
<210> 2
<211> 456
<212> PRT
<213> 罗汉果
<400> 2
Met Asp Glu Thr Thr Val Asn Gly Gly Arg Arg Ala Ser Asp Val Val
1 5 10 15
Val Phe Ala Phe Pro Arg His Gly His Met Ser Pro Met Leu Gln Phe
20 25 30
Ser Lys Arg Leu Val Ser Lys Gly Leu Arg Val Thr Phe Leu Ile Thr
35 40 45
Thr Ser Ala Thr Glu Ser Leu Arg Leu Asn Leu Pro Pro Ser Ser Ser
50 55 60
Leu Asp Leu Gln Val Ile Ser Asp Val Pro Glu Ser Asn Asp Ile Ala
65 70 75 80
Thr Leu Glu Gly Tyr Leu Arg Ser Phe Lys Ala Thr Val Ser Lys Thr
85 90 95
Leu Ala Asp Phe Ile Asp Gly Ile Gly Asn Pro Pro Lys Phe Ile Val
100 105 110
Tyr Asp Ser Val Met Pro Trp Val Gln Glu Val Ala Arg Gly Arg Gly
115 120 125
Leu Asp Ala Ala Pro Phe Phe Thr Gln Ser Ser Ala Val Asn His Ile
130 135 140
Leu Asn His Val Tyr Gly Gly Ser Leu Ser Ile Pro Ala Pro Glu Asn
145 150 155 160
Thr Ala Val Ser Leu Pro Ser Met Pro Val Leu Gln Ala Glu Asp Leu
165 170 175
Pro Ala Phe Pro Asp Asp Pro Glu Val Val Met Asn Phe Met Thr Ser
180 185 190
Gln Phe Ser Asn Phe Gln Asp Ala Lys Trp Ile Phe Phe Asn Thr Phe
195 200 205
Asp Gln Leu Glu Cys Lys Val Val Asn Trp Met Ala Asp Arg Trp Pro
210 215 220
Ile Lys Thr Val Gly Pro Thr Ile Pro Ser Ala Tyr Leu Asp Asp Gly
225 230 235 240
Arg Leu Glu Asp Asp Arg Ala Phe Gly Leu Asn Leu Leu Lys Pro Glu
245 250 255
Asp Gly Lys Asn Thr Arg Gln Trp Gln Trp Leu Asp Ser Lys Asp Thr
260 265 270
Ala Ser Val Leu Tyr Ile Ser Phe Gly Ser Leu Ala Ile Leu Gln Glu
275 280 285
Glu Gln Val Lys Glu Leu Ala Tyr Phe Leu Lys Asp Thr Asn Leu Ser
290 295 300
Phe Leu Trp Val Leu Arg Asp Ser Glu Leu Gln Lys Leu Pro His Asn
305 310 315 320
Phe Val Gln Glu Thr Ser His Arg Gly Leu Val Val Asn Trp Cys Ser
325 330 335
Gln Leu Gln Val Leu Ser His Arg Ala Val Ser Cys Phe Val Thr His
340 345 350
Cys Gly Trp Asn Ser Thr Leu Glu Ala Leu Ser Leu Gly Val Pro Met
355 360 365
Val Ala Ile Pro Gln Trp Val Asp Gln Thr Thr Asn Ala Lys Phe Val
370 375 380
Ala Asp Val Trp Arg Val Gly Val Arg Val Lys Lys Lys Asp Glu Arg
385 390 395 400
Ile Val Thr Lys Glu Glu Leu Glu Ala Ser Ile Arg Gln Val Val Gln
405 410 415
Gly Glu Gly Arg Asn Glu Phe Lys His Asn Ala Ile Lys Trp Lys Lys
420 425 430
Leu Ala Lys Glu Ala Val Asp Glu Gly Gly Ser Ser Asp Lys Asn Ile
435 440 445
Glu Glu Phe Val Lys Thr Ile Ala
450 455
<210> 3
<211> 1479
<212> DNA
<213> 罗汉果
<400> 3
atggcttctc ttctcagcca gattcacatt gttgtgattc cattgatgac tcaaggtcac 60
ctgatccctg cagccgacat ggcaaagcta ttggcagagc gcggcgttac cgtcactatc 120
atcaccaccc ctctcaacgc caagcggatt cagacgctcg ttgatcgcgc tcgagaggcc 180
aatctcgatc tccgacttgt cgaccgactc aacattccgc tcgctgagtt cggcttgccg 240
gaagggtgtg agagcgtaga tcgagtcccc tcgcgggaac tgtttaagaa tttctttttg 300
gctctcaacg acttgcaaaa acccctcgag aggctcgtcg ctaggttgca accacgcccc 360
agctgcgtaa ttgctgataa aaatctgcca tgggtggtag gtgtttgtga aaagttccaa 420
gtgacgaggt tttcgtttga tggcactagt tgtttttctc tgttatgttc taacaacata 480
cgtgcgtcta aggtcctcga gagtgtgaat tcggtatcag agagcttttt ggttcctggg 540
ttacctgata ggattgaagt tactgcagct caattaccag cagacttgaa tccaggttca 600
tatttaaaag agctacatga aagtggaaga attgctcatg agaatgccta tgggttgctg 660
gttaatagtt tcgaggagtt ggaatctgaa tacttgaagg aatatcgaaa ggtgaaaggc 720
gataaaatct ggtgcattgg ccctgtgtcc ctatccaata agacaggcgt ggaaagggcc 780
caacgcggcg gcatagccgc acaagatgct gacaagtgct tgcgctggct cgattcatgg 840
cctaagagct ctgttgttta cgtttgtatt gggagcctca gccggctttc atctcaacaa 900
agttcagagc ttgctttagc cttagaagaa tcaaaccaac cattcatttg ggtcgtaaag 960
gaagaggaga agcatgaaac atcaaagact acatcgacgg tcggatccat gagagctttt 1020
gaagaaagga cgaagggaag agggattctg ctgaagggtt gggctccgca gctgcagatc 1080
ttgtcgcacc cggccgtcgg agcatttcta acccactgcg gctggaactc tgttctggaa 1140
ggcgtctgcg ccggtgttcc attgatcaca tggcccatgt tcgccgacca gttctttaac 1200
gagaaggaag ttgttgaagt tttgaagatt ggggaagaag ttggaaacaa gaagacggtg 1260
ccattggggg atgaagagaa gagcgaggtg gtgatcggca gagaggagat taagaaggct 1320
attggtgcgg taatggagga aggagcagag gcagagagaa gaaagagagc gagaaggctg 1380
gctgagaagg caaacaaagc tatggaagat ggggggagtt cttatgttaa tgttacacga 1440
ttggttgaac atatcaagca actggtgctt gaaaaatga 1479
<210> 4
<211> 492
<212> PRT
<213> 罗汉果
<400> 4
Met Ala Ser Leu Leu Ser Gln Ile His Ile Val Val Ile Pro Leu Met
1 5 10 15
Thr Gln Gly His Leu Ile Pro Ala Ala Asp Met Ala Lys Leu Leu Ala
20 25 30
Glu Arg Gly Val Thr Val Thr Ile Ile Thr Thr Pro Leu Asn Ala Lys
35 40 45
Arg Ile Gln Thr Leu Val Asp Arg Ala Arg Glu Ala Asn Leu Asp Leu
50 55 60
Arg Leu Val Asp Arg Leu Asn Ile Pro Leu Ala Glu Phe Gly Leu Pro
65 70 75 80
Glu Gly Cys Glu Ser Val Asp Arg Val Pro Ser Arg Glu Leu Phe Lys
85 90 95
Asn Phe Phe Leu Ala Leu Asn Asp Leu Gln Lys Pro Leu Glu Arg Leu
100 105 110
Val Ala Arg Leu Gln Pro Arg Pro Ser Cys Val Ile Ala Asp Lys Asn
115 120 125
Leu Pro Trp Val Val Gly Val Cys Glu Lys Phe Gln Val Thr Arg Phe
130 135 140
Ser Phe Asp Gly Thr Ser Cys Phe Ser Leu Leu Cys Ser Asn Asn Ile
145 150 155 160
Arg Ala Ser Lys Val Leu Glu Ser Val Asn Ser Val Ser Glu Ser Phe
165 170 175
Leu Val Pro Gly Leu Pro Asp Arg Ile Glu Val Thr Ala Ala Gln Leu
180 185 190
Pro Ala Asp Leu Asn Pro Gly Ser Tyr Leu Lys Glu Leu His Glu Ser
195 200 205
Gly Arg Ile Ala His Glu Asn Ala Tyr Gly Leu Leu Val Asn Ser Phe
210 215 220
Glu Glu Leu Glu Ser Glu Tyr Leu Lys Glu Tyr Arg Lys Val Lys Gly
225 230 235 240
Asp Lys Ile Trp Cys Ile Gly Pro Val Ser Leu Ser Asn Lys Thr Gly
245 250 255
Val Glu Arg Ala Gln Arg Gly Gly Ile Ala Ala Gln Asp Ala Asp Lys
260 265 270
Cys Leu Arg Trp Leu Asp Ser Trp Pro Lys Ser Ser Val Val Tyr Val
275 280 285
Cys Ile Gly Ser Leu Ser Arg Leu Ser Ser Gln Gln Ser Ser Glu Leu
290 295 300
Ala Leu Ala Leu Glu Glu Ser Asn Gln Pro Phe Ile Trp Val Val Lys
305 310 315 320
Glu Glu Glu Lys His Glu Thr Ser Lys Thr Thr Ser Thr Val Gly Ser
325 330 335
Met Arg Ala Phe Glu Glu Arg Thr Lys Gly Arg Gly Ile Leu Leu Lys
340 345 350
Gly Trp Ala Pro Gln Leu Gln Ile Leu Ser His Pro Ala Val Gly Ala
355 360 365
Phe Leu Thr His Cys Gly Trp Asn Ser Val Leu Glu Gly Val Cys Ala
370 375 380
Gly Val Pro Leu Ile Thr Trp Pro Met Phe Ala Asp Gln Phe Phe Asn
385 390 395 400
Glu Lys Glu Val Val Glu Val Leu Lys Ile Gly Glu Glu Val Gly Asn
405 410 415
Lys Lys Thr Val Pro Leu Gly Asp Glu Glu Lys Ser Glu Val Val Ile
420 425 430
Gly Arg Glu Glu Ile Lys Lys Ala Ile Gly Ala Val Met Glu Glu Gly
435 440 445
Ala Glu Ala Glu Arg Arg Lys Arg Ala Arg Arg Leu Ala Glu Lys Ala
450 455 460
Asn Lys Ala Met Glu Asp Gly Gly Ser Ser Tyr Val Asn Val Thr Arg
465 470 475 480
Leu Val Glu His Ile Lys Gln Leu Val Leu Glu Lys
485 490
<210> 5
<211> 1362
<212> DNA
<213> 罗汉果
<400> 5
atggatgccc agcgaggtca caccacaacc attttgatgt ttccatggct cggctatggc 60
catctttcgg ctttcctaga gttggccaaa agcctctcaa ggaggaactt ccatatctac 120
ttctgttcaa cctctgttaa cctcgacgcc attaaaccaa agcttccttc ttcttcctct 180
tctgattcca tccaacttgt ggaactttgt cttccatctt ctcctgatca gctccctcct 240
catcttcaca caaccaacgc cctcccccct cacctcatgc ccactctcca ccaagccttc 300
tccatggctg cccaacactt tgctgccatt ttacacacac ttgctccgca tctcctcatt 360
tacgactctt tccaaccttg ggctcctcaa ctagcttcat ccctcaacat tccagccatc 420
aacttcaata ctacgggagc ttcagtcctg acccgaatgc ttcacgctac tcactaccca 480
agttctaaat tcccaatttc agagtttgtt ctccacgatt attggaaagc catgtacagc 540
gccgccggtg gggctgttac aaaaaaagac cacaaaattg gagaaacact tgcgaattgc 600
ttgcatgctt cttgtagtgt aattctaatc aatagtttca gagagctcga ggagaaatat 660
atggattatc tctccgttct cttgaacaag aaagttgttc cggttggtcc tttggtttac 720
gaaccgaatc aagacgggga agatgaaggt tattcaagca tcaaaaattg gcttgacaaa 780
aaggaaccgt cctccaccgt cttcgtttca tttggaagcg aatacttccc gtcaaaggaa 840
gaaatggaag agatagccca tgggttagag gcgagcgagg ttcatttcat ctgggtcgtt 900
aggtttcctc aaggagacaa caccagcgcc attgaagatg ccttgccgaa ggggtttctg 960
gagagggtgg gagagagagg gatggtggtg aagggttggg ctcctcaggc gaagatactg 1020
aagcattgga gcacaggggg attcgtgagc cactgtggat ggaactcggt gatggaaagc 1080
atgatgtttg gcgttcccat aataggggtt ccgatgcatc tggaccagcc ctttaacgcc 1140
ggactcgcgg aagaagctgg cgtcggcgtg gaggccaagc gagatccaga cggcaaaatt 1200
caaagagacg aagttgcaaa gttgatcaaa gaagtggtgg ttgagaaaac cagagaagac 1260
gtgcggaaga aagcaagaga aatgagtgag attttgagga gcaaaggaga ggagaagatg 1320
gatgagatgg tggctgcaat ctctctcttt cttaaaatat ga 1362
<210> 6
<211> 453
<212> PRT
<213> 罗汉果
<400> 6
Met Asp Ala Gln Arg Gly His Thr Thr Thr Ile Leu Met Phe Pro Trp
1 5 10 15
Leu Gly Tyr Gly His Leu Ser Ala Phe Leu Glu Leu Ala Lys Ser Leu
20 25 30
Ser Arg Arg Asn Phe His Ile Tyr Phe Cys Ser Thr Ser Val Asn Leu
35 40 45
Asp Ala Ile Lys Pro Lys Leu Pro Ser Ser Ser Ser Ser Asp Ser Ile
50 55 60
Gln Leu Val Glu Leu Cys Leu Pro Ser Ser Pro Asp Gln Leu Pro Pro
65 70 75 80
His Leu His Thr Thr Asn Ala Leu Pro Pro His Leu Met Pro Thr Leu
85 90 95
His Gln Ala Phe Ser Met Ala Ala Gln His Phe Ala Ala Ile Leu His
100 105 110
Thr Leu Ala Pro His Leu Leu Ile Tyr Asp Ser Phe Gln Pro Trp Ala
115 120 125
Pro Gln Leu Ala Ser Ser Leu Asn Ile Pro Ala Ile Asn Phe Asn Thr
130 135 140
Thr Gly Ala Ser Val Leu Thr Arg Met Leu His Ala Thr His Tyr Pro
145 150 155 160
Ser Ser Lys Phe Pro Ile Ser Glu Phe Val Leu His Asp Tyr Trp Lys
165 170 175
Ala Met Tyr Ser Ala Ala Gly Gly Ala Val Thr Lys Lys Asp His Lys
180 185 190
Ile Gly Glu Thr Leu Ala Asn Cys Leu His Ala Ser Cys Ser Val Ile
195 200 205
Leu Ile Asn Ser Phe Arg Glu Leu Glu Glu Lys Tyr Met Asp Tyr Leu
210 215 220
Ser Val Leu Leu Asn Lys Lys Val Val Pro Val Gly Pro Leu Val Tyr
225 230 235 240
Glu Pro Asn Gln Asp Gly Glu Asp Glu Gly Tyr Ser Ser Ile Lys Asn
245 250 255
Trp Leu Asp Lys Lys Glu Pro Ser Ser Thr Val Phe Val Ser Phe Gly
260 265 270
Ser Glu Tyr Phe Pro Ser Lys Glu Glu Met Glu Glu Ile Ala His Gly
275 280 285
Leu Glu Ala Ser Glu Val His Phe Ile Trp Val Val Arg Phe Pro Gln
290 295 300
Gly Asp Asn Thr Ser Ala Ile Glu Asp Ala Leu Pro Lys Gly Phe Leu
305 310 315 320
Glu Arg Val Gly Glu Arg Gly Met Val Val Lys Gly Trp Ala Pro Gln
325 330 335
Ala Lys Ile Leu Lys His Trp Ser Thr Gly Gly Phe Val Ser His Cys
340 345 350
Gly Trp Asn Ser Val Met Glu Ser Met Met Phe Gly Val Pro Ile Ile
355 360 365
Gly Val Pro Met His Leu Asp Gln Pro Phe Asn Ala Gly Leu Ala Glu
370 375 380
Glu Ala Gly Val Gly Val Glu Ala Lys Arg Asp Pro Asp Gly Lys Ile
385 390 395 400
Gln Arg Asp Glu Val Ala Lys Leu Ile Lys Glu Val Val Val Glu Lys
405 410 415
Thr Arg Glu Asp Val Arg Lys Lys Ala Arg Glu Met Ser Glu Ile Leu
420 425 430
Arg Ser Lys Gly Glu Glu Lys Met Asp Glu Met Val Ala Ala Ile Ser
435 440 445
Leu Phe Leu Lys Ile
450
<210> 7
<211> 1476
<212> DNA
<213> 罗汉果
<400> 7
atgggctccg ccggcgtcga actgaaggtg gctttcctgc catttgcagc tccaggtcac 60
atgattccct tgatgaacat agccagactc ttcgccatgc acggcgccga cgtcaccttc 120
atcaccaccc cggccactgc ctcccgcttc caaaacgtcg tcgactccga tctccgacgc 180
ggccacaaaa tcaaactcca tacatttcaa ctgccctctg cagaagccgg tctccccccc 240
ggcgtcgaga gcttcaacga atgcacttct aaagagatga ccgaaaaact cttcggcgca 300
tttgaaatgc tcaacggaga catcgaacag ttcctcaaag gggctaaagt cgactgcatt 360
gtgagcgata cgattctcgt ttggaccttg gacgccgctg caaggctcgg gattccgagg 420
atagctttcc gatcttcagg attcttttcg gaatgtattc atcactcttt aaggtgtcac 480
aagcctcaca agaaggtggg atccgataca gagccgttta tatttcctgg tttaccgcat 540
aagattgaga taacgagatt gaatatacca caatggtatt cagaagaagg ctatattcag 600
catattgaaa agatgaaaga aatggacaaa aagagttatg cggtactgct aaataccttc 660
tatgagcttg aggctgatta tgttgaatat tttgaatctg ttattgggtt gaaaacatgg 720
atcgtagggc cagtttcctt atgggctaac gagggtggag gcaaaaacga ctcaagaact 780
gagaacaaca acgctgagtt gatggaatgg ctggactcca aacagcctaa ttcagttctg 840
tatgttagtt ttggtagcat gacgaagttc ccatctgctc aggtgctcga aatagctcac 900
ggccttgaag attctggctg ccatttcatt tgggtggttc gaaagatgaa cgaaagtgaa 960
gcagctgatg aagaatttcc agaggggttc gaggagagag tgagagagag caagagaggt 1020
ttgatcataa gagattgggc gccgcaagaa ttgattttga atcatgcagc tgttgggggg 1080
tttgtcactc actgtggctg gaattcaatt ctcgaaagtg tatgtgctgg tcggccgatc 1140
atcgcgtggc cgttgtcggc ggaacagttt ttcaacgaga agtttgtaac tcgtgtattg 1200
aaagttggag tttcaattgg tgtaagaaaa tggtggggct cgacgagttc agaaacttta 1260
gatgtggtga aaagggatcg aattgcagaa gcagtggcga ggttgatggg agatgacaga 1320
gaggtggttg aaatgagaga tggagttaga gaactttcac atgcagcgaa gagagcaata 1380
aaggaaggtg gatcttctca ctcaaccttg ctctcattga tccatgaact caagaccatg 1440
aaatttaaac gccaaagtag taatgtggat ggataa 1476
<210> 8
<211> 491
<212> PRT
<213> 罗汉果
<400> 8
Met Gly Ser Ala Gly Val Glu Leu Lys Val Ala Phe Leu Pro Phe Ala
1 5 10 15
Ala Pro Gly His Met Ile Pro Leu Met Asn Ile Ala Arg Leu Phe Ala
20 25 30
Met His Gly Ala Asp Val Thr Phe Ile Thr Thr Pro Ala Thr Ala Ser
35 40 45
Arg Phe Gln Asn Val Val Asp Ser Asp Leu Arg Arg Gly His Lys Ile
50 55 60
Lys Leu His Thr Phe Gln Leu Pro Ser Ala Glu Ala Gly Leu Pro Pro
65 70 75 80
Gly Val Glu Ser Phe Asn Glu Cys Thr Ser Lys Glu Met Thr Glu Lys
85 90 95
Leu Phe Gly Ala Phe Glu Met Leu Asn Gly Asp Ile Glu Gln Phe Leu
100 105 110
Lys Gly Ala Lys Val Asp Cys Ile Val Ser Asp Thr Ile Leu Val Trp
115 120 125
Thr Leu Asp Ala Ala Ala Arg Leu Gly Ile Pro Arg Ile Ala Phe Arg
130 135 140
Ser Ser Gly Phe Phe Ser Glu Cys Ile His His Ser Leu Arg Cys His
145 150 155 160
Lys Pro His Lys Lys Val Gly Ser Asp Thr Glu Pro Phe Ile Phe Pro
165 170 175
Gly Leu Pro His Lys Ile Glu Ile Thr Arg Leu Asn Ile Pro Gln Trp
180 185 190
Tyr Ser Glu Glu Gly Tyr Ile Gln His Ile Glu Lys Met Lys Glu Met
195 200 205
Asp Lys Lys Ser Tyr Ala Val Leu Leu Asn Thr Phe Tyr Glu Leu Glu
210 215 220
Ala Asp Tyr Val Glu Tyr Phe Glu Ser Val Ile Gly Leu Lys Thr Trp
225 230 235 240
Ile Val Gly Pro Val Ser Leu Trp Ala Asn Glu Gly Gly Gly Lys Asn
245 250 255
Asp Ser Arg Thr Glu Asn Asn Asn Ala Glu Leu Met Glu Trp Leu Asp
260 265 270
Ser Lys Gln Pro Asn Ser Val Leu Tyr Val Ser Phe Gly Ser Met Thr
275 280 285
Lys Phe Pro Ser Ala Gln Val Leu Glu Ile Ala His Gly Leu Glu Asp
290 295 300
Ser Gly Cys His Phe Ile Trp Val Val Arg Lys Met Asn Glu Ser Glu
305 310 315 320
Ala Ala Asp Glu Glu Phe Pro Glu Gly Phe Glu Glu Arg Val Arg Glu
325 330 335
Ser Lys Arg Gly Leu Ile Ile Arg Asp Trp Ala Pro Gln Glu Leu Ile
340 345 350
Leu Asn His Ala Ala Val Gly Gly Phe Val Thr His Cys Gly Trp Asn
355 360 365
Ser Ile Leu Glu Ser Val Cys Ala Gly Arg Pro Ile Ile Ala Trp Pro
370 375 380
Leu Ser Ala Glu Gln Phe Phe Asn Glu Lys Phe Val Thr Arg Val Leu
385 390 395 400
Lys Val Gly Val Ser Ile Gly Val Arg Lys Trp Trp Gly Ser Thr Ser
405 410 415
Ser Glu Thr Leu Asp Val Val Lys Arg Asp Arg Ile Ala Glu Ala Val
420 425 430
Ala Arg Leu Met Gly Asp Asp Arg Glu Val Val Glu Met Arg Asp Gly
435 440 445
Val Arg Glu Leu Ser His Ala Ala Lys Arg Ala Ile Lys Glu Gly Gly
450 455 460
Ser Ser His Ser Thr Leu Leu Ser Leu Ile His Glu Leu Lys Thr Met
465 470 475 480
Lys Phe Lys Arg Gln Ser Ser Asn Val Asp Gly
485 490
<210> 9
<211> 1422
<212> DNA
<213> 罗汉果
<400> 9
atgtggactg tcgtgctcgg tttggcgacg ctgtttgtcg cctactacat ccattggatt 60
aacaaatgga gagattccaa gttcaacgga gttctgccgc cgggcaccat gggtttgccg 120
ctcatcggag agacgattca actgagtcga cccagtgact ccctcgacgt tcaccctttc 180
atccagaaaa aagttgaaag atacgggccg atcttcaaaa catgtctggc cggaaggccg 240
gtggtggtgt cggcggacgc agagttcaac aactacataa tgctgcagga aggaagagca 300
gtggaaatgt ggtatttgga tacgctctcc aaatttttcg gcctcgacac cgagtggctc 360
aaagctctgg gcctcatcca caagtacatc agaagcatta ctctcaatca cttcggcgcc 420
gaggccctgc gggagagatt tcttcctttt attgaagcat cctccatgga agcccttcac 480
tcctggtcta ctcaacctag cgtcgaagtc aaaaatgcct ccgctctcat ggtttttagg 540
acctcggtga ataagatgtt cggtgaggat gcgaagaagc tatcgggaaa tatccctggg 600
aagttcacga agcttctagg aggatttctc agtttaccac tgaattttcc cggcaccacc 660
taccacaaat gcttgaagga tatgaaggaa atccagaaga agctaagaga ggttgtagac 720
gatagattgg ctaatgtggg ccctgatgtg gaagatttct tggggcaagc ccttaaagat 780
aaggaatcag agaagttcat ttcagaggag ttcatcatcc aactgttgtt ttctatcagt 840
tttgctagct ttgagtccat ctccaccact cttactttga ttctcaagct ccttgatgaa 900
cacccagaag tagtgaaaga gttggaagct gaacacgagg cgattcgaaa agctagagca 960
gatccagatg gaccaattac ttgggaagaa tacaaatcca tgacttttac attacaagtc 1020
atcaatgaaa ccctaaggtt ggggagtgtc acacctgcct tgttgaggaa aacagttaaa 1080
gatcttcaag taaaaggata cataatcccg gaaggatgga caataatgct tgtcaccgct 1140
tcacgtcaca gagacccaaa agtctataag gaccctcata tcttcaatcc atggcgttgg 1200
aaggacttgg actcaattac catccaaaag aacttcatgc cttttggggg aggcttaagg 1260
cattgtgctg gtgctgagta ctctaaagtc tacttgtgca ccttcttgca catcctctgt 1320
accaaatacc gatggaccaa acttggggga ggaaggattg caagagctca tatattgagt 1380
tttgaagatg ggttacatgt gaagttcaca cccaaggaat ga 1422
<210> 10
<211> 473
<212> PRT
<213> 罗汉果
<400> 10
Met Trp Thr Val Val Leu Gly Leu Ala Thr Leu Phe Val Ala Tyr Tyr
1 5 10 15
Ile His Trp Ile Asn Lys Trp Arg Asp Ser Lys Phe Asn Gly Val Leu
20 25 30
Pro Pro Gly Thr Met Gly Leu Pro Leu Ile Gly Glu Thr Ile Gln Leu
35 40 45
Ser Arg Pro Ser Asp Ser Leu Asp Val His Pro Phe Ile Gln Lys Lys
50 55 60
Val Glu Arg Tyr Gly Pro Ile Phe Lys Thr Cys Leu Ala Gly Arg Pro
65 70 75 80
Val Val Val Ser Ala Asp Ala Glu Phe Asn Asn Tyr Ile Met Leu Gln
85 90 95
Glu Gly Arg Ala Val Glu Met Trp Tyr Leu Asp Thr Leu Ser Lys Phe
100 105 110
Phe Gly Leu Asp Thr Glu Trp Leu Lys Ala Leu Gly Leu Ile His Lys
115 120 125
Tyr Ile Arg Ser Ile Thr Leu Asn His Phe Gly Ala Glu Ala Leu Arg
130 135 140
Glu Arg Phe Leu Pro Phe Ile Glu Ala Ser Ser Met Glu Ala Leu His
145 150 155 160
Ser Trp Ser Thr Gln Pro Ser Val Glu Val Lys Asn Ala Ser Ala Leu
165 170 175
Met Val Phe Arg Thr Ser Val Asn Lys Met Phe Gly Glu Asp Ala Lys
180 185 190
Lys Leu Ser Gly Asn Ile Pro Gly Lys Phe Thr Lys Leu Leu Gly Gly
195 200 205
Phe Leu Ser Leu Pro Leu Asn Phe Pro Gly Thr Thr Tyr His Lys Cys
210 215 220
Leu Lys Asp Met Lys Glu Ile Gln Lys Lys Leu Arg Glu Val Val Asp
225 230 235 240
Asp Arg Leu Ala Asn Val Gly Pro Asp Val Glu Asp Phe Leu Gly Gln
245 250 255
Ala Leu Lys Asp Lys Glu Ser Glu Lys Phe Ile Ser Glu Glu Phe Ile
260 265 270
Ile Gln Leu Leu Phe Ser Ile Ser Phe Ala Ser Phe Glu Ser Ile Ser
275 280 285
Thr Thr Leu Thr Leu Ile Leu Lys Leu Leu Asp Glu His Pro Glu Val
290 295 300
Val Lys Glu Leu Glu Ala Glu His Glu Ala Ile Arg Lys Ala Arg Ala
305 310 315 320
Asp Pro Asp Gly Pro Ile Thr Trp Glu Glu Tyr Lys Ser Met Thr Phe
325 330 335
Thr Leu Gln Val Ile Asn Glu Thr Leu Arg Leu Gly Ser Val Thr Pro
340 345 350
Ala Leu Leu Arg Lys Thr Val Lys Asp Leu Gln Val Lys Gly Tyr Ile
355 360 365
Ile Pro Glu Gly Trp Thr Ile Met Leu Val Thr Ala Ser Arg His Arg
370 375 380
Asp Pro Lys Val Tyr Lys Asp Pro His Ile Phe Asn Pro Trp Arg Trp
385 390 395 400
Lys Asp Leu Asp Ser Ile Thr Ile Gln Lys Asn Phe Met Pro Phe Gly
405 410 415
Gly Gly Leu Arg His Cys Ala Gly Ala Glu Tyr Ser Lys Val Tyr Leu
420 425 430
Cys Thr Phe Leu His Ile Leu Cys Thr Lys Tyr Arg Trp Thr Lys Leu
435 440 445
Gly Gly Gly Arg Ile Ala Arg Ala His Ile Leu Ser Phe Glu Asp Gly
450 455 460
Leu His Val Lys Phe Thr Pro Lys Glu
465 470
<210> 11
<211> 2277
<212> DNA
<213> 人工序列
<220>
<223> 编码SgCDS葫芦巴二烯醇合成酶的优化核酸序列
<400> 11
atgtggaggt taaaggtcgg agcggaatcc gttggtgaga acgacgaaaa atggttaaag 60
tcaatatcaa accatttggg taggcaagtt tgggaatttt gtccagatgc gggtactcaa 120
caacagctgc tacaagttca taaagcacgt aaagctttcc acgatgaccg tttccacaga 180
aaacagtcat cagacttgtt catcacgatc cagtacggca aagaggttga aaacggaggc 240
aaaaccgctg gagtaaaatt aaaagaaggc gaggaagtca ggaaagaagc cgtagaaagc 300
tcacttgaaa gagctctatc tttttactca tctatacaaa cgagtgacgg aaactgggct 360
tccgatctag gtggaccaat gttcttactg cctggtttag ttattgcact ttatgtcaca 420
ggggttttaa actccgtatt atctaaacat catagacaag agatgtgtag atacgtttat 480
aatcatcaaa acgaggatgg cggatggggg ttacacatcg agggaccttc aacaatgttt 540
ggttcagctc taaactatgt agctcttagg ttattgggcg aagatgctaa tgctggtgca 600
atgcccaaag caagagcatg gatcttagat catggaggtg ccacggggat tacaagttgg 660
gggaaattgt ggctaagtgt tctgggtgta tatgagtggt ccggaaataa tccactacca 720
cccgaattct ggttatttcc atactttctg ccttttcatc caggcagaat gtggtgtcat 780
tgcagaatgg tctatttacc tatgagttac ctatacggta aaagattcgt aggtccaatt 840
actcccatcg tgttgtcttt gagaaaggaa ttatacgcag ttccgtatca cgaaattgac 900
tggaataaat ctagaaatac ttgtgctaaa gaagatctat actatcctca tcccaagatg 960
caagacattt tgtggggaag tttacaccat gtctatgaac ccttatttac aagatggcct 1020
gcgaaaagat tgagagaaaa agcgctacag actgccatgc agcatattca ttatgaagat 1080
gaaaacacaa gatatatttg tttaggacct gtaaataaag tattgaatct tttatgttgt 1140
tgggttgaag acccttattc agacgccttc aagttgcatt tacaaagagt acatgactac 1200
ttatgggtcg ctgaagacgg aatgaaaatg caaggctata atggaagtca gctgtgggac 1260
acagcctttt caatacaagc aattgtttct accaagctag tagataacta cggcccaact 1320
ttgagaaagg cccatgactt tgttaagtcc agccagatcc aacaagattg tcctggtgat 1380
ccaaacgtct ggtataggca tattcacaag ggtgcctggc cctttagcac tagagaccat 1440
ggttggttga tttccgactg tacggccgaa ggcttaaaag ctgcattgat gctaagtaag 1500
ttaccctccg aaacagtagg ggagagttta gaaagaaata gactatgcga cgctgtaaat 1560
gtcttattat ctttacaaaa cgacaatgga ggttttgctt catacgaatt aacaagatcc 1620
tacccttggt tagaactgat taacccagct gaaacttttg gtgatattgt catcgattat 1680
ccctatgttg aatgtacgtc tgcgactatg gaagccttga ctttatttaa gaaacttcat 1740
ccaggccaca ggactaagga gatagatact gctattgttc gtgcggctaa cttcttggaa 1800
aacatgcaaa gaactgatgg aagttggtac ggttgttggg gggtgtgttt cacatatgct 1860
ggctggtttg gaataaaggg tttggttgcc gctgggagaa cgtataataa ttgtttagca 1920
ataaggaaag cttgcgactt tcttttgagt aaggaattac ctggcggtgg atggggagag 1980
tcttaccttt catgccaaaa taaggtgtac acgaacctag aaggtaatag acctcacttg 2040
gtaaataccg cctgggtttt aatggccttg atcgaagcag gacaagccga gagagatcca 2100
acaccattgc atcgtgctgc cagactatta ataaatagtc aactagagaa cggtgacttc 2160
ccacagcaag aaatcatggg tgtttttaat aaaaactgta tgataactta tgccgcatat 2220
cgtaatatat tcccaatttg ggcgttagga gagtattgtc acagagtact tactgaa 2277
<210> 12
<211> 759
<212> PRT
<213> 罗汉果
<400> 12
Met Trp Arg Leu Lys Val Gly Ala Glu Ser Val Gly Glu Asn Asp Glu
1 5 10 15
Lys Trp Leu Lys Ser Ile Ser Asn His Leu Gly Arg Gln Val Trp Glu
20 25 30
Phe Cys Pro Asp Ala Gly Thr Gln Gln Gln Leu Leu Gln Val His Lys
35 40 45
Ala Arg Lys Ala Phe His Asp Asp Arg Phe His Arg Lys Gln Ser Ser
50 55 60
Asp Leu Phe Ile Thr Ile Gln Tyr Gly Lys Glu Val Glu Asn Gly Gly
65 70 75 80
Lys Thr Ala Gly Val Lys Leu Lys Glu Gly Glu Glu Val Arg Lys Glu
85 90 95
Ala Val Glu Ser Ser Leu Glu Arg Ala Leu Ser Phe Tyr Ser Ser Ile
100 105 110
Gln Thr Ser Asp Gly Asn Trp Ala Ser Asp Leu Gly Gly Pro Met Phe
115 120 125
Leu Leu Pro Gly Leu Val Ile Ala Leu Tyr Val Thr Gly Val Leu Asn
130 135 140
Ser Val Leu Ser Lys His His Arg Gln Glu Met Cys Arg Tyr Val Tyr
145 150 155 160
Asn His Gln Asn Glu Asp Gly Gly Trp Gly Leu His Ile Glu Gly Pro
165 170 175
Ser Thr Met Phe Gly Ser Ala Leu Asn Tyr Val Ala Leu Arg Leu Leu
180 185 190
Gly Glu Asp Ala Asn Ala Gly Ala Met Pro Lys Ala Arg Ala Trp Ile
195 200 205
Leu Asp His Gly Gly Ala Thr Gly Ile Thr Ser Trp Gly Lys Leu Trp
210 215 220
Leu Ser Val Leu Gly Val Tyr Glu Trp Ser Gly Asn Asn Pro Leu Pro
225 230 235 240
Pro Glu Phe Trp Leu Phe Pro Tyr Phe Leu Pro Phe His Pro Gly Arg
245 250 255
Met Trp Cys His Cys Arg Met Val Tyr Leu Pro Met Ser Tyr Leu Tyr
260 265 270
Gly Lys Arg Phe Val Gly Pro Ile Thr Pro Ile Val Leu Ser Leu Arg
275 280 285
Lys Glu Leu Tyr Ala Val Pro Tyr His Glu Ile Asp Trp Asn Lys Ser
290 295 300
Arg Asn Thr Cys Ala Lys Glu Asp Leu Tyr Tyr Pro His Pro Lys Met
305 310 315 320
Gln Asp Ile Leu Trp Gly Ser Leu His His Val Tyr Glu Pro Leu Phe
325 330 335
Thr Arg Trp Pro Ala Lys Arg Leu Arg Glu Lys Ala Leu Gln Thr Ala
340 345 350
Met Gln His Ile His Tyr Glu Asp Glu Asn Thr Arg Tyr Ile Cys Leu
355 360 365
Gly Pro Val Asn Lys Val Leu Asn Leu Leu Cys Cys Trp Val Glu Asp
370 375 380
Pro Tyr Ser Asp Ala Phe Lys Leu His Leu Gln Arg Val His Asp Tyr
385 390 395 400
Leu Trp Val Ala Glu Asp Gly Met Lys Met Gln Gly Tyr Asn Gly Ser
405 410 415
Gln Leu Trp Asp Thr Ala Phe Ser Ile Gln Ala Ile Val Ser Thr Lys
420 425 430
Leu Val Asp Asn Tyr Gly Pro Thr Leu Arg Lys Ala His Asp Phe Val
435 440 445
Lys Ser Ser Gln Ile Gln Gln Asp Cys Pro Gly Asp Pro Asn Val Trp
450 455 460
Tyr Arg His Ile His Lys Gly Ala Trp Pro Phe Ser Thr Arg Asp His
465 470 475 480
Gly Trp Leu Ile Ser Asp Cys Thr Ala Glu Gly Leu Lys Ala Ala Leu
485 490 495
Met Leu Ser Lys Leu Pro Ser Glu Thr Val Gly Glu Ser Leu Glu Arg
500 505 510
Asn Arg Leu Cys Asp Ala Val Asn Val Leu Leu Ser Leu Gln Asn Asp
515 520 525
Asn Gly Gly Phe Ala Ser Tyr Glu Leu Thr Arg Ser Tyr Pro Trp Leu
530 535 540
Glu Leu Ile Asn Pro Ala Glu Thr Phe Gly Asp Ile Val Ile Asp Tyr
545 550 555 560
Pro Tyr Val Glu Cys Thr Ser Ala Thr Met Glu Ala Leu Thr Leu Phe
565 570 575
Lys Lys Leu His Pro Gly His Arg Thr Lys Glu Ile Asp Thr Ala Ile
580 585 590
Val Arg Ala Ala Asn Phe Leu Glu Asn Met Gln Arg Thr Asp Gly Ser
595 600 605
Trp Tyr Gly Cys Trp Gly Val Cys Phe Thr Tyr Ala Gly Trp Phe Gly
610 615 620
Ile Lys Gly Leu Val Ala Ala Gly Arg Thr Tyr Asn Asn Cys Leu Ala
625 630 635 640
Ile Arg Lys Ala Cys Asp Phe Leu Leu Ser Lys Glu Leu Pro Gly Gly
645 650 655
Gly Trp Gly Glu Ser Tyr Leu Ser Cys Gln Asn Lys Val Tyr Thr Asn
660 665 670
Leu Glu Gly Asn Arg Pro His Leu Val Asn Thr Ala Trp Val Leu Met
675 680 685
Ala Leu Ile Glu Ala Gly Gln Ala Glu Arg Asp Pro Thr Pro Leu His
690 695 700
Arg Ala Ala Arg Leu Leu Ile Asn Ser Gln Leu Glu Asn Gly Asp Phe
705 710 715 720
Pro Gln Gln Glu Ile Met Gly Val Phe Asn Lys Asn Cys Met Ile Thr
725 730 735
Tyr Ala Ala Tyr Arg Asn Ile Phe Pro Ile Trp Ala Leu Gly Glu Tyr
740 745 750
Cys His Arg Val Leu Thr Glu
755
<210> 13
<211> 1575
<212> DNA
<213> 人工序列
<220>
<223> 编码角鲨烯环氧酶的优化核酸序列
<400> 13
atggtcgatc agtgtgctct gggctggatc ctggcgtcag tgcttggtgc agctgcatta 60
tatttcctat ttggaagaaa aaacggggga gtttcaaacg aaagaagaca tgaatcaatt 120
aagaacattg caactacgaa tggtgaatac aagtcttcca actctgatgg tgatatcatt 180
atcgtgggcg ccggtgtagc aggatctgct ttggcatata cattagggaa agacggtcgt 240
agagttcatg tgatagagag agatcttacg gaaccggaca ggattgttgg tgaacttttg 300
cagccgggcg gatacttaaa actgacggaa ctaggtttag aggattgcgt tgatgacatt 360
gatgctcaaa gagtttacgg ctacgccttg ttcaaagacg gtaaagatac taggttaagt 420
tatcctctag aaaaatttca ttccgacgtt gctggcagat cctttcacaa cggaagattt 480
atacaaagaa tgagagaaaa agccgctagt ctaccaaatg tatccttgga acaaggtaca 540
gttacatcct tattagaaga gaatggtatt atcaaaggcg tgcaatataa aacgaaaacc 600
ggacaagaaa tgactgctta tgccccatta acaatcgtgt gtgatggctg cttctctaat 660
ttgagaagat ctctttgtaa tccaaaggtt gacgttccta gctgctttgt tggtttggtt 720
ttggaaaatt gcgatttacc gtatgctaac catggacatg ttatcctagc agatccgtct 780
ccaattctgt tctacagaat tagttcaact gaaattagat gtttggttga tgtccctggt 840
cagaaggttc caagtatctc caacggtgaa atggctaatt acctaaaaaa cgttgttgct 900
ccgcaaattc ccagccagtt gtacgactct ttcgttgccg cgatagacaa aggtaatatc 960
agaacgatgc cgaataggtc catgcctgct gacccatatc ccaccccagg agcgttattg 1020
atgggtgatg cttttaatat gagacatcca ttaacaggcg gagggatgac tgttgctttg 1080
tctgatgttg tcgtcttgag agatttatta aaaccgcttc gtgatctaaa cgatgcacct 1140
acattgtcaa agtatttaga ggccttttac acgttgagga agcctgttgc tagtaccatt 1200
aatacgttgg ctggagctct gtataaggtg ttttgcgcct caccagacca agctagaaaa 1260
gaaatgcgtc aagcttgttt cgactaccta agtctgggtg gtatatttag taacggtcct 1320
gtctctctat tgtcagggct aaacccacgt cctattagtc ttgtcttgca cttcttcgca 1380
gtggcgattt atggtgttgg taggttgctg attccgtttc ccagtcctaa acgtgtgtgg 1440
ataggtgcaa gaattatctc tggtgcgtca gcgattattt ttccaattat taaggctgaa 1500
ggtgtgagac aaatgttttt ccctgctact gttgccgcgt attacagagc accaagggtt 1560
gtcaagggca gataa 1575
<210> 14
<211> 524
<212> PRT
<213> 罗汉果
<400> 14
Met Val Asp Gln Cys Ala Leu Gly Trp Ile Leu Ala Ser Val Leu Gly
1 5 10 15
Ala Ala Ala Leu Tyr Phe Leu Phe Gly Arg Lys Asn Gly Gly Val Ser
20 25 30
Asn Glu Arg Arg His Glu Ser Ile Lys Asn Ile Ala Thr Thr Asn Gly
35 40 45
Glu Tyr Lys Ser Ser Asn Ser Asp Gly Asp Ile Ile Ile Val Gly Ala
50 55 60
Gly Val Ala Gly Ser Ala Leu Ala Tyr Thr Leu Gly Lys Asp Gly Arg
65 70 75 80
Arg Val His Val Ile Glu Arg Asp Leu Thr Glu Pro Asp Arg Ile Val
85 90 95
Gly Glu Leu Leu Gln Pro Gly Gly Tyr Leu Lys Leu Thr Glu Leu Gly
100 105 110
Leu Glu Asp Cys Val Asp Asp Ile Asp Ala Gln Arg Val Tyr Gly Tyr
115 120 125
Ala Leu Phe Lys Asp Gly Lys Asp Thr Arg Leu Ser Tyr Pro Leu Glu
130 135 140
Lys Phe His Ser Asp Val Ala Gly Arg Ser Phe His Asn Gly Arg Phe
145 150 155 160
Ile Gln Arg Met Arg Glu Lys Ala Ala Ser Leu Pro Asn Val Ser Leu
165 170 175
Glu Gln Gly Thr Val Thr Ser Leu Leu Glu Glu Asn Gly Ile Ile Lys
180 185 190
Gly Val Gln Tyr Lys Thr Lys Thr Gly Gln Glu Met Thr Ala Tyr Ala
195 200 205
Pro Leu Thr Ile Val Cys Asp Gly Cys Phe Ser Asn Leu Arg Arg Ser
210 215 220
Leu Cys Asn Pro Lys Val Asp Val Pro Ser Cys Phe Val Gly Leu Val
225 230 235 240
Leu Glu Asn Cys Asp Leu Pro Tyr Ala Asn His Gly His Val Ile Leu
245 250 255
Ala Asp Pro Ser Pro Ile Leu Phe Tyr Arg Ile Ser Ser Thr Glu Ile
260 265 270
Arg Cys Leu Val Asp Val Pro Gly Gln Lys Val Pro Ser Ile Ser Asn
275 280 285
Gly Glu Met Ala Asn Tyr Leu Lys Asn Val Val Ala Pro Gln Ile Pro
290 295 300
Ser Gln Leu Tyr Asp Ser Phe Val Ala Ala Ile Asp Lys Gly Asn Ile
305 310 315 320
Arg Thr Met Pro Asn Arg Ser Met Pro Ala Asp Pro Tyr Pro Thr Pro
325 330 335
Gly Ala Leu Leu Met Gly Asp Ala Phe Asn Met Arg His Pro Leu Thr
340 345 350
Gly Gly Gly Met Thr Val Ala Leu Ser Asp Val Val Val Leu Arg Asp
355 360 365
Leu Leu Lys Pro Leu Arg Asp Leu Asn Asp Ala Pro Thr Leu Ser Lys
370 375 380
Tyr Leu Glu Ala Phe Tyr Thr Leu Arg Lys Pro Val Ala Ser Thr Ile
385 390 395 400
Asn Thr Leu Ala Gly Ala Leu Tyr Lys Val Phe Cys Ala Ser Pro Asp
405 410 415
Gln Ala Arg Lys Glu Met Arg Gln Ala Cys Phe Asp Tyr Leu Ser Leu
420 425 430
Gly Gly Ile Phe Ser Asn Gly Pro Val Ser Leu Leu Ser Gly Leu Asn
435 440 445
Pro Arg Pro Ile Ser Leu Val Leu His Phe Phe Ala Val Ala Ile Tyr
450 455 460
Gly Val Gly Arg Leu Leu Ile Pro Phe Pro Ser Pro Lys Arg Val Trp
465 470 475 480
Ile Gly Ala Arg Ile Ile Ser Gly Ala Ser Ala Ile Ile Phe Pro Ile
485 490 495
Ile Lys Ala Glu Gly Val Arg Gln Met Phe Phe Pro Ala Thr Val Ala
500 505 510
Ala Tyr Tyr Arg Ala Pro Arg Val Val Lys Gly Arg
515 520
<210> 15
<211> 1587
<212> DNA
<213> 人工序列
<220>
<223> 编码角鲨烯环氧酶的优化核酸序列
<400> 15
atggttgatc aatgtgcctt aggttggatc ttagcttccg ctttgggttt agtcattgct 60
ttgtgtttct tcgttgcccc aagaagaaac catagaggtg tcgattccaa agaaagagat 120
gaatgtgtcc aatctgctgc tactaccaag ggtgaatgca gatttaacga cagagatgtc 180
gatgtcattg ttgttggtgc tggtgttgcc ggttctgctt tggctcacac tttgggtaag 240
gatggtagaa gagttcatgt tatcgaaaga gacttaaccg aaccagacag aattgttggt 300
gagttgttgc aaccaggtgg ttacttgaaa ttgattgagt tgggtttgca agactgtgtt 360
gaagagatcg acgctcaaag agtttacggt tatgctttat tcaaggacgg taagaatacc 420
cgtttatcct acccattgga aaatttccat tctgacgttt ctggtagatc tttccacaac 480
ggtagattta ttcaaagaat gagagaaaaa gccgcttctt taccaaacgt tagattggaa 540
caaggtactg ttacttcttt gttagaagaa aaaggtacca ttaaaggtgt tcaatacaag 600
tccaaaaacg gtgaagaaaa gaccgcttac gctcctttga ccatcgtttg tgacggttgt 660
ttttctaact tgagaagatc tttgtgtaac cctatggttg atgttccatc ttactttgtc 720
ggtttggttt tggaaaattg tgaattgcca tttgccaacc atggtcacgt tattttgggt 780
gacccttccc caattttgtt ctaccaaatt tcccgtactg aaatcagatg tttggtcgat 840
gttccaggtc aaaaagttcc ttctatcgcc aacggtgaaa tggagaagta tttaaagacc 900
gtcgttgctc cacaagtccc tccacaaatt tacgactcct tcatcgctgc tattgacaag 960
ggtaacatca gaactatgcc aaatagatcc atgccagctg ctccacaccc aaccccaggt 1020
gccttattaa tgggtgacgc ttttaacatg cgtcacccat tgaccggtgg tggtatgact 1080
gtcgctttgt ctgacattgt tgtcttgcgt aacttattga agccattgaa ggacttgtct 1140
gacgcctcta ccttgtgtaa gtacttggaa tccttctaca ctttgagaaa gccagttgct 1200
tccactatca acaccttggc tggtgccttg tacaaggttt tctgtgcttc tccagaccaa 1260
gctagaaaag aaatgagaca agcttgtttt gactacttat ctttgggtgg tattttctct 1320
aacggtccag tttccttgtt gtccggtttg aaccctagac cattgtcctt agttttgcac 1380
tttttcgccg tcgctatcta cggtgttggt agattgttgt tgccattccc ttctgtcaag 1440
ggtatctgga ttggtgctag attgatctac tctgcttctg gtattatctt cccaatcatt 1500
agagccgaag gtgtcagaca aatgttcttc ccagccactg ttcctgctta ctaccgttcc 1560
ccaccagttt tcaagccaat cgtttaa 1587
<210> 16
<211> 528
<212> PRT
<213> 罗汉果
<400> 16
Met Val Asp Gln Cys Ala Leu Gly Trp Ile Leu Ala Ser Ala Leu Gly
1 5 10 15
Leu Val Ile Ala Leu Cys Phe Phe Val Ala Pro Arg Arg Asn His Arg
20 25 30
Gly Val Asp Ser Lys Glu Arg Asp Glu Cys Val Gln Ser Ala Ala Thr
35 40 45
Thr Lys Gly Glu Cys Arg Phe Asn Asp Arg Asp Val Asp Val Ile Val
50 55 60
Val Gly Ala Gly Val Ala Gly Ser Ala Leu Ala His Thr Leu Gly Lys
65 70 75 80
Asp Gly Arg Arg Val His Val Ile Glu Arg Asp Leu Thr Glu Pro Asp
85 90 95
Arg Ile Val Gly Glu Leu Leu Gln Pro Gly Gly Tyr Leu Lys Leu Ile
100 105 110
Glu Leu Gly Leu Gln Asp Cys Val Glu Glu Ile Asp Ala Gln Arg Val
115 120 125
Tyr Gly Tyr Ala Leu Phe Lys Asp Gly Lys Asn Thr Arg Leu Ser Tyr
130 135 140
Pro Leu Glu Asn Phe His Ser Asp Val Ser Gly Arg Ser Phe His Asn
145 150 155 160
Gly Arg Phe Ile Gln Arg Met Arg Glu Lys Ala Ala Ser Leu Pro Asn
165 170 175
Val Arg Leu Glu Gln Gly Thr Val Thr Ser Leu Leu Glu Glu Lys Gly
180 185 190
Thr Ile Lys Gly Val Gln Tyr Lys Ser Lys Asn Gly Glu Glu Lys Thr
195 200 205
Ala Tyr Ala Pro Leu Thr Ile Val Cys Asp Gly Cys Phe Ser Asn Leu
210 215 220
Arg Arg Ser Leu Cys Asn Pro Met Val Asp Val Pro Ser Tyr Phe Val
225 230 235 240
Gly Leu Val Leu Glu Asn Cys Glu Leu Pro Phe Ala Asn His Gly His
245 250 255
Val Ile Leu Gly Asp Pro Ser Pro Ile Leu Phe Tyr Gln Ile Ser Arg
260 265 270
Thr Glu Ile Arg Cys Leu Val Asp Val Pro Gly Gln Lys Val Pro Ser
275 280 285
Ile Ala Asn Gly Glu Met Glu Lys Tyr Leu Lys Thr Val Val Ala Pro
290 295 300
Gln Val Pro Pro Gln Ile Tyr Asp Ser Phe Ile Ala Ala Ile Asp Lys
305 310 315 320
Gly Asn Ile Arg Thr Met Pro Asn Arg Ser Met Pro Ala Ala Pro His
325 330 335
Pro Thr Pro Gly Ala Leu Leu Met Gly Asp Ala Phe Asn Met Arg His
340 345 350
Pro Leu Thr Gly Gly Gly Met Thr Val Ala Leu Ser Asp Ile Val Val
355 360 365
Leu Arg Asn Leu Leu Lys Pro Leu Lys Asp Leu Ser Asp Ala Ser Thr
370 375 380
Leu Cys Lys Tyr Leu Glu Ser Phe Tyr Thr Leu Arg Lys Pro Val Ala
385 390 395 400
Ser Thr Ile Asn Thr Leu Ala Gly Ala Leu Tyr Lys Val Phe Cys Ala
405 410 415
Ser Pro Asp Gln Ala Arg Lys Glu Met Arg Gln Ala Cys Phe Asp Tyr
420 425 430
Leu Ser Leu Gly Gly Ile Phe Ser Asn Gly Pro Val Ser Leu Leu Ser
435 440 445
Gly Leu Asn Pro Arg Pro Leu Ser Leu Val Leu His Phe Phe Ala Val
450 455 460
Ala Ile Tyr Gly Val Gly Arg Leu Leu Leu Pro Phe Pro Ser Val Lys
465 470 475 480
Gly Ile Trp Ile Gly Ala Arg Leu Ile Tyr Ser Ala Ser Gly Ile Ile
485 490 495
Phe Pro Ile Ile Arg Ala Glu Gly Val Arg Gln Met Phe Phe Pro Ala
500 505 510
Thr Val Pro Ala Tyr Tyr Arg Ser Pro Pro Val Phe Lys Pro Ile Val
515 520 525
<210> 17
<211> 951
<212> DNA
<213> 人工序列
<220>
<223> 编码环氧水合酶的优化核酸序列
<400> 17
atggaaaaca tcgaacacac cactgtccaa actaacggta tcaagatgca cgtcgctgct 60
attggtactg gtccaccagt tttgttgttg catggtttcc cagaattgtg gtattcttgg 120
agacaccaat tgttgtactt gtcttctgct ggttacagag ctatcgctcc agacttgaga 180
ggttacggtg ataccgacgc tccaccttcc ccatcttcct ataccgcttt acacattgtc 240
ggtgatttgg tcggtttgtt ggacgtcttg ggtatcgaaa aagtcttctt aatcggtcac 300
gactggggtg ccatcatcgc ctggtacttc tgtttattca gacctgatag aatcaaagct 360
ttggttaact tgtctgttca attcttccca agaaacccaa ccaccccatt tgttaagggt 420
ttcagagccg tcttgggtga tcaattttac atggttagat tccaagaacc aggtaaagct 480
gaagaagaat tcgcttccgt tgatattaga gaattcttca agaatgtttt gtccaacaga 540
gatccacaag ctccatattt gccaaatgaa gttaagttcg aaggtgtccc accaccagct 600
ttggctccat ggttgacccc agaagatatc gatgtctacg ctgacaaatt cgctgaaact 660
ggtttcactg gtggtttgaa ctactacaga gcctttgaca gaacctggga attaactgct 720
ccatggaccg gtgcccgtat tggtgtccca gtcaagttca ttgtcggtga tttggacttg 780
acttaccact ttccaggtgc tcaaaaatac attcacggtg aaggtttcaa gaaggctgtc 840
ccaggtttgg aagaagttgt cgttatggag gatacctctc acttcattaa ccaagaaaga 900
ccacacgaaa ttaattctca catccacgat ttcttctcta agttctgtta a 951
<210> 18
<211> 316
<212> PRT
<213> 罗汉果
<400> 18
Met Glu Asn Ile Glu His Thr Thr Val Gln Thr Asn Gly Ile Lys Met
1 5 10 15
His Val Ala Ala Ile Gly Thr Gly Pro Pro Val Leu Leu Leu His Gly
20 25 30
Phe Pro Glu Leu Trp Tyr Ser Trp Arg His Gln Leu Leu Tyr Leu Ser
35 40 45
Ser Ala Gly Tyr Arg Ala Ile Ala Pro Asp Leu Arg Gly Tyr Gly Asp
50 55 60
Thr Asp Ala Pro Pro Ser Pro Ser Ser Tyr Thr Ala Leu His Ile Val
65 70 75 80
Gly Asp Leu Val Gly Leu Leu Asp Val Leu Gly Ile Glu Lys Val Phe
85 90 95
Leu Ile Gly His Asp Trp Gly Ala Ile Ile Ala Trp Tyr Phe Cys Leu
100 105 110
Phe Arg Pro Asp Arg Ile Lys Ala Leu Val Asn Leu Ser Val Gln Phe
115 120 125
Phe Pro Arg Asn Pro Thr Thr Pro Phe Val Lys Gly Phe Arg Ala Val
130 135 140
Leu Gly Asp Gln Phe Tyr Met Val Arg Phe Gln Glu Pro Gly Lys Ala
145 150 155 160
Glu Glu Glu Phe Ala Ser Val Asp Ile Arg Glu Phe Phe Lys Asn Val
165 170 175
Leu Ser Asn Arg Asp Pro Gln Ala Pro Tyr Leu Pro Asn Glu Val Lys
180 185 190
Phe Glu Gly Val Pro Pro Pro Ala Leu Ala Pro Trp Leu Thr Pro Glu
195 200 205
Asp Ile Asp Val Tyr Ala Asp Lys Phe Ala Glu Thr Gly Phe Thr Gly
210 215 220
Gly Leu Asn Tyr Tyr Arg Ala Phe Asp Arg Thr Trp Glu Leu Thr Ala
225 230 235 240
Pro Trp Thr Gly Ala Arg Ile Gly Val Pro Val Lys Phe Ile Val Gly
245 250 255
Asp Leu Asp Leu Thr Tyr His Phe Pro Gly Ala Gln Lys Tyr Ile His
260 265 270
Gly Glu Gly Phe Lys Lys Ala Val Pro Gly Leu Glu Glu Val Val Val
275 280 285
Met Glu Asp Thr Ser His Phe Ile Asn Gln Glu Arg Pro His Glu Ile
290 295 300
Asn Ser His Ile His Asp Phe Phe Ser Lys Phe Cys
305 310 315
<210> 19
<211> 951
<212> DNA
<213> 人工序列
<220>
<223> 编码环氧水合酶的优化核酸序列
<400> 19
atggatcaaa ttgaacacat cactattaac accaacggta tcaaaatgca tatcgcctct 60
gttggtactg gtcctgttgt tttgttgttg catggtttcc cagaattgtg gtactcttgg 120
cgtcatcaat tgttgtattt gtcctctgtc ggttacagag ctattgctcc agatttaaga 180
ggttacggtg atactgactc tccagcctct ccaacttctt ataccgcttt gcatatcgtt 240
ggtgacttgg tcggtgcttt ggatgaattg ggtattgaaa aggtcttctt ggtcggtcat 300
gattgggctg ccatcatcgc ttggtacttt tgtttgttta gaccagatcg tattaaagct 360
ttagttaatt tgtctgttca attcatccca agaaacccag ctatcccatt tattgaaggt 420
ttcagaaccg cttttggtga tgatttctac atgtgtagat tccaagttcc aggtgaagct 480
gaagaagact ttgcttctat tgatactgct caattgttca aaacctcctt gtgtaacaga 540
tcctccgctc caccatgctt gccaaaagaa atcggtttca gagctattcc accaccagaa 600
aatttgccat cttggttgac cgaggaagac attaattact acgctgctaa gttcaagcaa 660
accggtttca ctggtgcttt aaactactat agagctttcg atttgacctg ggaattaact 720
gctccatgga ccggtgctca aattcaagtc ccagtcaagt tcattgttgg tgattctgac 780
ttgacttacc attttccagg tgctaaggaa tacatccaca acggtggttt caagaaggac 840
gttccattgt tggaagaagt tgttgttgtc aaggacgctt gtcacttcat caaccaagaa 900
agaccacaag aaattaacgc tcacattcat gactttatta acaagttcta a 951
<210> 20
<211> 316
<212> PRT
<213> 罗汉果
<400> 20
Met Asp Gln Ile Glu His Ile Thr Ile Asn Thr Asn Gly Ile Lys Met
1 5 10 15
His Ile Ala Ser Val Gly Thr Gly Pro Val Val Leu Leu Leu His Gly
20 25 30
Phe Pro Glu Leu Trp Tyr Ser Trp Arg His Gln Leu Leu Tyr Leu Ser
35 40 45
Ser Val Gly Tyr Arg Ala Ile Ala Pro Asp Leu Arg Gly Tyr Gly Asp
50 55 60
Thr Asp Ser Pro Ala Ser Pro Thr Ser Tyr Thr Ala Leu His Ile Val
65 70 75 80
Gly Asp Leu Val Gly Ala Leu Asp Glu Leu Gly Ile Glu Lys Val Phe
85 90 95
Leu Val Gly His Asp Trp Ala Ala Ile Ile Ala Trp Tyr Phe Cys Leu
100 105 110
Phe Arg Pro Asp Arg Ile Lys Ala Leu Val Asn Leu Ser Val Gln Phe
115 120 125
Ile Pro Arg Asn Pro Ala Ile Pro Phe Ile Glu Gly Phe Arg Thr Ala
130 135 140
Phe Gly Asp Asp Phe Tyr Met Cys Arg Phe Gln Val Pro Gly Glu Ala
145 150 155 160
Glu Glu Asp Phe Ala Ser Ile Asp Thr Ala Gln Leu Phe Lys Thr Ser
165 170 175
Leu Cys Asn Arg Ser Ser Ala Pro Pro Cys Leu Pro Lys Glu Ile Gly
180 185 190
Phe Arg Ala Ile Pro Pro Pro Glu Asn Leu Pro Ser Trp Leu Thr Glu
195 200 205
Glu Asp Ile Asn Tyr Tyr Ala Ala Lys Phe Lys Gln Thr Gly Phe Thr
210 215 220
Gly Ala Leu Asn Tyr Tyr Arg Ala Phe Asp Leu Thr Trp Glu Leu Thr
225 230 235 240
Ala Pro Trp Thr Gly Ala Gln Ile Gln Val Pro Val Lys Phe Ile Val
245 250 255
Gly Asp Ser Asp Leu Thr Tyr His Phe Pro Gly Ala Lys Glu Tyr Ile
260 265 270
His Asn Gly Gly Phe Lys Lys Asp Val Pro Leu Leu Glu Glu Val Val
275 280 285
Val Val Lys Asp Ala Cys His Phe Ile Asn Gln Glu Arg Pro Gln Glu
290 295 300
Ile Asn Ala His Ile His Asp Phe Ile Asn Lys Phe
305 310 315
<210> 21
<211> 945
<212> DNA
<213> 人工序列
<220>
<223> 编码环氧水合酶的优化核酸序列
<400> 21
atggagaaga ttgaacactc tactatcgct actaatggta tcaatatgca cgttgcctct 60
gctggttctg gtccagctgt tttgtttttg cacggtttcc cagaattatg gtattcctgg 120
agacaccaat tgttgtactt gtcttctttg ggttacagag ctattgctcc agatttgaga 180
ggtttcggtg acaccgatgc tccaccatct ccatcctcct acaccgccca ccacatcgtt 240
ggtgatttgg tcggtttgtt ggatcaatta ggtgtcgatc aagtcttttt ggttggtcat 300
gattggggtg ctatgatggc ctggtacttc tgtttgttcc gtccagacag agtcaaggcc 360
ttagttaatt tatctgtcca cttcacccca cgtaacccag ctatctctcc attagatggt 420
ttccgtttga tgttgggtga tgatttctac gtttgtaagt ttcaagaacc aggtgtcgct 480
gaagccgatt tcggttctgt tgatactgcc actatgttta aaaagttctt gaccatgaga 540
gatccacgtc cacctattat tccaaacggt ttcagatcct tggccacccc agaagctttg 600
ccatcctggt tgactgaaga ggatatcgat tactttgctg ccaaattcgc taagactggt 660
tttactggtg gtttcaacta ctacagagct atcgacttga cctgggagtt gactgctcca 720
tggtccggtt ctgaaatcaa ggttccaact aagtttattg ttggtgactt agacttggtt 780
taccatttcc caggtgttaa ggaatacatt cacggtggtg gtttcaagaa ggacgttcca 840
ttcttggaag aagttgtcgt catggaaggt gctgctcatt ttatcaacca agaaaaagct 900
gacgaaatta attctttgat ctatgacttc attaaacaat tctag 945
<210> 22
<211> 314
<212> PRT
<213> 罗汉果
<400> 22
Met Glu Lys Ile Glu His Ser Thr Ile Ala Thr Asn Gly Ile Asn Met
1 5 10 15
His Val Ala Ser Ala Gly Ser Gly Pro Ala Val Leu Phe Leu His Gly
20 25 30
Phe Pro Glu Leu Trp Tyr Ser Trp Arg His Gln Leu Leu Tyr Leu Ser
35 40 45
Ser Leu Gly Tyr Arg Ala Ile Ala Pro Asp Leu Arg Gly Phe Gly Asp
50 55 60
Thr Asp Ala Pro Pro Ser Pro Ser Ser Tyr Thr Ala His His Ile Val
65 70 75 80
Gly Asp Leu Val Gly Leu Leu Asp Gln Leu Gly Val Asp Gln Val Phe
85 90 95
Leu Val Gly His Asp Trp Gly Ala Met Met Ala Trp Tyr Phe Cys Leu
100 105 110
Phe Arg Pro Asp Arg Val Lys Ala Leu Val Asn Leu Ser Val His Phe
115 120 125
Thr Pro Arg Asn Pro Ala Ile Ser Pro Leu Asp Gly Phe Arg Leu Met
130 135 140
Leu Gly Asp Asp Phe Tyr Val Cys Lys Phe Gln Glu Pro Gly Val Ala
145 150 155 160
Glu Ala Asp Phe Gly Ser Val Asp Thr Ala Thr Met Phe Lys Lys Phe
165 170 175
Leu Thr Met Arg Asp Pro Arg Pro Pro Ile Ile Pro Asn Gly Phe Arg
180 185 190
Ser Leu Ala Thr Pro Glu Ala Leu Pro Ser Trp Leu Thr Glu Glu Asp
195 200 205
Ile Asp Tyr Phe Ala Ala Lys Phe Ala Lys Thr Gly Phe Thr Gly Gly
210 215 220
Phe Asn Tyr Tyr Arg Ala Ile Asp Leu Thr Trp Glu Leu Thr Ala Pro
225 230 235 240
Trp Ser Gly Ser Glu Ile Lys Val Pro Thr Lys Phe Ile Val Gly Asp
245 250 255
Leu Asp Leu Val Tyr His Phe Pro Gly Val Lys Glu Tyr Ile His Gly
260 265 270
Gly Gly Phe Lys Lys Asp Val Pro Phe Leu Glu Glu Val Val Val Met
275 280 285
Glu Gly Ala Ala His Phe Ile Asn Gln Glu Lys Ala Asp Glu Ile Asn
290 295 300
Ser Leu Ile Tyr Asp Phe Ile Lys Gln Phe
305 310
<210> 23
<211> 951
<212> DNA
<213> 人工序列
<220>
<223> 编码环氧水合酶的优化核酸序列
<400> 23
atggaaaaga ttgaacacac cactatttct accaatggta tcaacatgca tgttgcctct 60
attggttctg gtccagctgt cttgttcttg cacggtttcc cagaattgtg gtattcttgg 120
agacaccaat tattattctt gtcttccatg ggttacagag ctatcgctcc agacttaaga 180
ggttttggtg acaccgacgc tccaccatct ccatcttctt acaccgctca ccacattgtc 240
ggtgacttgg tcggtttgtt agaccaattg ggtattgacc aagttttttt ggttggtcac 300
gactggggtg ctatgatggc ctggtacttt tgtttgttcc gtccagatag agttaaggct 360
ttggtcaatt tatctgtcca cttcttacgt agacacccat ctatcaaatt tgttgatggt 420
ttcagagcct tattaggtga tgatttttac ttctgtcaat tccaagaacc aggtgtcgct 480
gaagccgact tcggttctgt cgatgttgct accatgttga agaaattctt gaccatgaga 540
gatccaagac ctccaatgat tcctaaggaa aagggtttca gagccttgga aactccagat 600
ccattgccag cctggttaac tgaagaagac attgactact tcgccggtaa gtttcgtaag 660
accggtttta ccggtggttt taattactac agagccttca acttgacttg ggagttgacc 720
gctccatggt ctggttctga aatcaaggtc gctgccaagt tcattgttgg tgatttagac 780
ttggtttatc acttccctgg tgccaaggag tatatccatg gtggtggttt caaaaaggac 840
gtccctttgt tggaggaagt tgttgttgtt gatggtgctg ctcacttcat caaccaagaa 900
agaccagctg aaatttcttc cttgatttac gactttatca agaagttcta a 951
<210> 24
<211> 316
<212> PRT
<213> 罗汉果
<400> 24
Met Glu Lys Ile Glu His Thr Thr Ile Ser Thr Asn Gly Ile Asn Met
1 5 10 15
His Val Ala Ser Ile Gly Ser Gly Pro Ala Val Leu Phe Leu His Gly
20 25 30
Phe Pro Glu Leu Trp Tyr Ser Trp Arg His Gln Leu Leu Phe Leu Ser
35 40 45
Ser Met Gly Tyr Arg Ala Ile Ala Pro Asp Leu Arg Gly Phe Gly Asp
50 55 60
Thr Asp Ala Pro Pro Ser Pro Ser Ser Tyr Thr Ala His His Ile Val
65 70 75 80
Gly Asp Leu Val Gly Leu Leu Asp Gln Leu Gly Ile Asp Gln Val Phe
85 90 95
Leu Val Gly His Asp Trp Gly Ala Met Met Ala Trp Tyr Phe Cys Leu
100 105 110
Phe Arg Pro Asp Arg Val Lys Ala Leu Val Asn Leu Ser Val His Phe
115 120 125
Leu Arg Arg His Pro Ser Ile Lys Phe Val Asp Gly Phe Arg Ala Leu
130 135 140
Leu Gly Asp Asp Phe Tyr Phe Cys Gln Phe Gln Glu Pro Gly Val Ala
145 150 155 160
Glu Ala Asp Phe Gly Ser Val Asp Val Ala Thr Met Leu Lys Lys Phe
165 170 175
Leu Thr Met Arg Asp Pro Arg Pro Pro Met Ile Pro Lys Glu Lys Gly
180 185 190
Phe Arg Ala Leu Glu Thr Pro Asp Pro Leu Pro Ala Trp Leu Thr Glu
195 200 205
Glu Asp Ile Asp Tyr Phe Ala Gly Lys Phe Arg Lys Thr Gly Phe Thr
210 215 220
Gly Gly Phe Asn Tyr Tyr Arg Ala Phe Asn Leu Thr Trp Glu Leu Thr
225 230 235 240
Ala Pro Trp Ser Gly Ser Glu Ile Lys Val Ala Ala Lys Phe Ile Val
245 250 255
Gly Asp Leu Asp Leu Val Tyr His Phe Pro Gly Ala Lys Glu Tyr Ile
260 265 270
His Gly Gly Gly Phe Lys Lys Asp Val Pro Leu Leu Glu Glu Val Val
275 280 285
Val Val Asp Gly Ala Ala His Phe Ile Asn Gln Glu Arg Pro Ala Glu
290 295 300
Ile Ser Ser Leu Ile Tyr Asp Phe Ile Lys Lys Phe
305 310 315
<210> 25
<211> 1599
<212> DNA
<213> 罗汉果
<400> 25
atgctgatgc acgctctcac ccctacagct cctttcttct ctataaaacc taacacagaa 60
cccccttctg ctaccacacg gcagccaccc atggattccc caccccaaaa acctcacttc 120
cttctcttcc ctttcatggc tcagggccac atgatcccca tgattgacct tgccaagctt 180
ctggcccagc gaggagccat tattactgtc gtcaccacgc cccacaatgc tgctcgctac 240
cactctgttc tcgctcgcgc cattgattct gggttacaca tccatgtcct ccaacttcag 300
tttccatgca acgaaggcgg gttgccagaa gggtgcgaga atttcgactt gttaccttca 360
cttggttctg cctccacatt cttcagagca acattcctcc tttacgaacc atcggaaaaa 420
gtgttcgagg aactcatccc ccgccccacc tgcataatct ccgatatgtg tctgccctgg 480
accgtacgac ttgctcagaa atatcacgtc ccaaggctcg ttttctacag tttgagctgc 540
ttctttcttc tctgtatgcg gagtttaaaa aacaatcaag ctcttataag ctccaagtct 600
gattctgagt tggtaacttt ctcagacttg cctgatccag tcgagtttct caagtcgcag 660
ctgcctaaat ccaacgatga agaaatggca aagtttggtt atgaaatagg ggaggccgat 720
cggcaatcac acggcgttat tgtgaatgta tttgaggaga tggagccgaa gtatcttgcg 780
gagtatagaa aggaaagaga atcgccggaa aaagtgtggt gcgtcggccc agtttcgctt 840
tgcaacgaca acaaactcga caaggctcag agaggcaaca aagcctccat cgacgaacgc 900
gaatgcatcg agtggctcga cgggcagcag ccgtcttcag tggtttacgt gtctttagga 960
agtctgtgca atttggtgac ggcgcaactt attgagctgg gtttgggttt ggaggcatca 1020
aacaaaccat tcatttgggt catacgaaaa ggaaacataa cagaggagtt acagaaatgg 1080
ctggtggagt atgatttcga ggagaaaact aaagggagag ggctcgtgat tcttggctgg 1140
gctccccaag ttctgatact atcgcaccct gcaatcggat gctttttgac gcactgcggt 1200
tggaactcaa gcatcgaagg aatatcggcc ggcatgccca tgatcacttg gccacttttt 1260
gccgatcaag tcttcaacga gaagctaatc gtagagatac tcagaatcgg tgtaagtgtg 1320
ggcatggaaa cagctatgca ctggggagag gaagaggaga aaggggtggt ggtaaagaga 1380
gagaaagtga gagaagccat agaaagggcg atggatggag atgagagaga agagaggagg 1440
gagagatgca aagagcttgc tgaaatggcg aagagagccg tagaagaagg ggggtcgtct 1500
catcggaacc tgacgctgct aactgaagat attcttgtta atggaggagg tcaagagaga 1560
atggatgatg ctgatgattt tcctactata gttaattga 1599
<210> 26
<211> 502
<212> PRT
<213> 罗汉果
<400> 26
Met Asp Ser Pro Pro Gln Lys Pro His Phe Leu Leu Phe Pro Phe Met
1 5 10 15
Ala Gln Gly His Met Ile Pro Met Ile Asp Leu Ala Lys Leu Leu Ala
20 25 30
Gln Arg Gly Ala Ile Ile Thr Val Val Thr Thr Pro His Asn Ala Ala
35 40 45
Arg Tyr His Ser Val Leu Ala Arg Ala Ile Asp Ser Gly Leu His Ile
50 55 60
His Val Leu Gln Leu Gln Phe Pro Cys Asn Glu Gly Gly Leu Pro Glu
65 70 75 80
Gly Cys Glu Asn Phe Asp Leu Leu Pro Ser Leu Gly Ser Ala Ser Thr
85 90 95
Phe Phe Arg Ala Thr Phe Leu Leu Tyr Glu Pro Ser Glu Lys Val Phe
100 105 110
Glu Glu Leu Ile Pro Arg Pro Thr Cys Ile Ile Ser Asp Met Cys Leu
115 120 125
Pro Trp Thr Val Arg Leu Ala Gln Lys Tyr His Val Pro Arg Leu Val
130 135 140
Phe Tyr Ser Leu Ser Cys Phe Phe Leu Leu Cys Met Arg Ser Leu Lys
145 150 155 160
Asn Asn Gln Ala Leu Ile Ser Ser Lys Ser Asp Ser Glu Leu Val Thr
165 170 175
Phe Ser Asp Leu Pro Asp Pro Val Glu Phe Leu Lys Ser Gln Leu Pro
180 185 190
Lys Ser Asn Asp Glu Glu Met Ala Lys Phe Gly Tyr Glu Ile Gly Glu
195 200 205
Ala Asp Arg Gln Ser His Gly Val Ile Val Asn Val Phe Glu Glu Met
210 215 220
Glu Pro Lys Tyr Leu Ala Glu Tyr Arg Lys Glu Arg Glu Ser Pro Glu
225 230 235 240
Lys Val Trp Cys Val Gly Pro Val Ser Leu Cys Asn Asp Asn Lys Leu
245 250 255
Asp Lys Ala Gln Arg Gly Asn Lys Ala Ser Ile Asp Glu Arg Glu Cys
260 265 270
Ile Glu Trp Leu Asp Gly Gln Gln Pro Ser Ser Val Val Tyr Val Ser
275 280 285
Leu Gly Ser Leu Cys Asn Leu Val Thr Ala Gln Leu Ile Glu Leu Gly
290 295 300
Leu Gly Leu Glu Ala Ser Asn Lys Pro Phe Ile Trp Val Ile Arg Lys
305 310 315 320
Gly Asn Ile Thr Glu Glu Leu Gln Lys Trp Leu Val Glu Tyr Asp Phe
325 330 335
Glu Glu Lys Thr Lys Gly Arg Gly Leu Val Ile Leu Gly Trp Ala Pro
340 345 350
Gln Val Leu Ile Leu Ser His Pro Ala Ile Gly Cys Phe Leu Thr His
355 360 365
Cys Gly Trp Asn Ser Ser Ile Glu Gly Ile Ser Ala Gly Met Pro Met
370 375 380
Ile Thr Trp Pro Leu Phe Ala Asp Gln Val Phe Asn Glu Lys Leu Ile
385 390 395 400
Val Glu Ile Leu Arg Ile Gly Val Ser Val Gly Met Glu Thr Ala Met
405 410 415
His Trp Gly Glu Glu Glu Glu Lys Gly Val Val Val Lys Arg Glu Lys
420 425 430
Val Arg Glu Ala Ile Glu Arg Ala Met Asp Gly Asp Glu Arg Glu Glu
435 440 445
Arg Arg Glu Arg Cys Lys Glu Leu Ala Glu Met Ala Lys Arg Ala Val
450 455 460
Glu Glu Gly Gly Ser Ser His Arg Asn Leu Thr Leu Leu Thr Glu Asp
465 470 475 480
Ile Leu Val Asn Gly Gly Gly Gln Glu Arg Met Asp Asp Ala Asp Asp
485 490 495
Phe Pro Thr Ile Val Asn
500
<210> 27
<211> 1575
<212> DNA
<213> 罗汉果
<400> 27
atggagaaac tgcaggagaa gcttcggaaa ataaaacgtg ctgtccacgg ggctggcact 60
ctccaaagac caaaatgcta ttgtcaagtc aagctcttcc catctcccca agcaattaaa 120
agagaaagac ctcactttct gctcttccct ttcatggctc agggccacat gatccccatg 180
attgacctcg ccaagcttct ggctcagcga ggagccattg tcactatcct caccacgccc 240
cacaatgctg ctcgcaccca ctcagttctt gctcgcgcca tcgattctgg gttacaaatc 300
cgtgtccgcc cacttcagtt tccatgcaaa gaagccggcc tgccagaagg gtgcgagaat 360
ctcgacttgt taccttcact tggttctgcc tccacattct tcagagcaac atgtctcctt 420
tacgacccat cggaaaaact gttcgaggaa ctcagccccc ggccgacttg cataatctcc 480
gatatgtgtc tgccctggac catacgactt gctcagaaat atcacgtacc aaggctcgtt 540
ttctacagtt tgagctgctt ctttcttctc tgtatgcgga gtttaaaaaa caatccagcg 600
cttattagct ccaagtctga ttctgagttc gtaactttct ctgacttgcc tgatccagtc 660
gagtttctca agtcggagct acctaaatcc accgatgaag acttggtgaa gtttagttat 720
gaaatggggg aggccgatcg gaagtcatac ggcgttattt taaatatatt tgaggagatg 780
gaaccaaagt atcttgcgga atatggaaac gaaagagaat cgccggaaaa agtctggtgc 840
gtcggcccag tttcgctttg caacgacaac aaactcgaca aggctcagag aggcaacaaa 900
gcctccatcg acgaacgtga atgcatcaag tggctcggcg ggcagcagcc gtcttcagtg 960
gtttacgcgt ctttaggaag cttatgcaat ctggttacgg cgcaattcat agagttgggt 1020
ttgggtttgg aggcatcaaa taaaccattt atttgggtca ttagaaaagg aaacataaca 1080
gaagagctac aaaaatggct tgtggagtat gatttcgagg agaaaactaa agggagaggg 1140
ctggtgattc ttggctgggc tccccaagtt ctgatactgt cccacccttc aatcggatgc 1200
tttttgacgc actgtggttg gaactcaagc atcgaaggga tatcggccgg cgtgccaatg 1260
gtcacctggc cgcttttttc ggatcaagtc ttcaacgaga agctaattgt acaaatactc 1320
agaatcggcg taagtgtagg cgcggaaact gctatgaact ggggagagga agaggagaaa 1380
ggggtagtag tgaagagaga gaaagtgagg gaagccatag aaaggatgat ggatggagat 1440
gagagagaag agaggagaga gagatgcaaa gagcttgctg agacggcgaa gagagctata 1500
gaagaagggg gctcgtctca ccggaacctc acgctgttga ttgaagatat aggtacttca 1560
ttgaggaggt tgtga 1575
<210> 28
<211> 488
<212> PRT
<213> 罗汉果
<400> 28
Met Asp Ser Pro Pro His Arg Pro His Phe Leu Leu Phe Pro Phe Met
1 5 10 15
Ala Gln Gly His Met Ile Pro Met Ile Asp Leu Ala Lys Leu Leu Ala
20 25 30
Gln Arg Gly Ala Ile Val Thr Ile Leu Thr Thr Pro His Asn Ala Ala
35 40 45
Arg Thr His Ser Val Leu Ala Arg Ala Ile Asp Ser Gly Leu Gln Ile
50 55 60
Arg Val Arg Pro Leu Gln Phe Pro Cys Lys Glu Ala Gly Leu Pro Glu
65 70 75 80
Gly Cys Glu Asn Leu Asp Leu Leu Pro Ser Leu Gly Ser Ala Ser Thr
85 90 95
Phe Phe Arg Ala Thr Cys Leu Leu Tyr Asp Pro Ser Glu Lys Leu Phe
100 105 110
Glu Glu Leu Ser Pro Arg Pro Thr Cys Ile Ile Ser Asp Met Cys Leu
115 120 125
Pro Trp Thr Ile Arg Leu Ala Gln Lys Tyr His Val Pro Arg Leu Val
130 135 140
Phe Tyr Ser Leu Ser Cys Phe Phe Leu Leu Cys Met Arg Ser Leu Lys
145 150 155 160
Asn Asn Pro Ala Leu Ile Ser Ser Lys Ser Asp Ser Glu Phe Val Thr
165 170 175
Phe Ser Asp Leu Pro Asp Pro Val Glu Phe Leu Lys Ser Glu Leu Pro
180 185 190
Lys Ser Thr Asp Glu Asp Leu Val Lys Phe Ser Tyr Glu Met Gly Glu
195 200 205
Ala Asp Arg Lys Ser Tyr Gly Val Ile Leu Asn Ile Phe Glu Glu Met
210 215 220
Glu Pro Lys Tyr Leu Ala Glu Tyr Gly Asn Glu Arg Glu Ser Pro Glu
225 230 235 240
Lys Val Trp Cys Val Gly Pro Val Ser Leu Cys Asn Asp Asn Lys Leu
245 250 255
Asp Lys Ala Gln Arg Gly Asn Lys Ala Ser Ile Asp Glu Arg Glu Cys
260 265 270
Ile Lys Trp Leu Gly Gly Gln Gln Pro Ser Ser Val Val Tyr Ala Ser
275 280 285
Leu Gly Ser Leu Cys Asn Leu Val Thr Ala Gln Phe Ile Glu Leu Gly
290 295 300
Leu Gly Leu Glu Ala Ser Asn Lys Pro Phe Ile Trp Val Ile Arg Lys
305 310 315 320
Gly Asn Ile Thr Glu Glu Leu Gln Lys Trp Leu Val Glu Tyr Asp Phe
325 330 335
Glu Glu Lys Thr Lys Gly Arg Gly Leu Val Ile Leu Gly Trp Ala Pro
340 345 350
Gln Val Leu Ile Leu Ser His Pro Ser Ile Gly Cys Phe Leu Thr His
355 360 365
Cys Gly Trp Asn Ser Ser Ile Glu Gly Ile Ser Ala Gly Val Pro Met
370 375 380
Val Thr Trp Pro Leu Phe Ser Asp Gln Val Phe Asn Glu Lys Leu Ile
385 390 395 400
Val Gln Ile Leu Arg Ile Gly Val Ser Val Gly Ala Glu Thr Ala Met
405 410 415
Asn Trp Gly Glu Glu Glu Glu Lys Gly Val Val Val Lys Arg Glu Lys
420 425 430
Val Arg Glu Ala Ile Glu Arg Met Met Asp Gly Asp Glu Arg Glu Glu
435 440 445
Arg Arg Glu Arg Cys Lys Glu Leu Ala Glu Thr Ala Lys Arg Ala Ile
450 455 460
Glu Glu Gly Gly Ser Ser His Arg Asn Leu Thr Leu Leu Ile Glu Asp
465 470 475 480
Ile Gly Thr Ser Leu Arg Arg Leu
485
<210> 29
<211> 1416
<212> DNA
<213> 罗汉果
<400> 29
atgatgagaa accaccattt ccttctggta tgtttccctt ctcaaggcta tataaaccct 60
tcccttcaac tcgccaggcg actgataagc ctcggcgtta atgtcacctt cgccaccacc 120
gtcctcgccg gccgccgcat gaagaacaaa acccaccaaa ctgcaacaac accaggcttg 180
tctttcgcta ctttctccga tggcttcgat gacgaaaccc tcaaacccaa cggcgacttg 240
acccactact tctcggagct caggcgctgc ggctctgaat ctctaaccca tctcattact 300
tctgcagcaa acgaaggtcg tccgattacc ttcgtaatct atagcctcct gctctcttgg 360
gcggctgata ttgccagcac atatgacatc ccgtcagcac ttttttttgc tcagcctgcg 420
acggttttgg ctttgtactt ctattacttc catggttatg gtgataccat ttgcagcaaa 480
ctccaagacc catcttcgta catagaatta ccaggtttgc cgttgctcac tagtcaggac 540
atgccctctt tcttctcccc ttccggcccc catgctttca ttctccctcc aatgagagag 600
caggctgaat tcctcggccg acaaagccaa ccaaaagtac tagtgaacac cttcgacgcg 660
ttagaggcag acgccttgag agccattgat aagttgaaga tgttggcgat tggacccttg 720
attccatctg ctttactggg tggaaacgat tcctctgatg catcattttg tggtgatctt 780
tttcaagtct cgtcagagga ttatatagaa tggttgaact ccaagcctga ctcgtcggtc 840
gtttacatat cagttggatc catctgcgtg ctgtctgatg aacaagagga cgagcttgtg 900
catgctttat taaacagtgg ccacacgttc ttgtgggtaa agagatcgaa agagaacaac 960
gaaggagtaa aacaagaaac agacgaggag aagttgaaga agctggaaga gcaagggaaa 1020
atggtgtcgt ggtgccgtca agttgaagtg ttgaaacacc ctgcgttggg ttgttttctg 1080
acgcactgtg ggtggaactc gactattgaa agcttggttt cagggctgcc ggtggttgct 1140
tttccgcagc agatagatca agccaccaac gcgaagctca tagaggacgt gtggaagacg 1200
ggagtgaggg tgaaggccaa tacagaagga attgtggaga gggaagaaat caggaggtgc 1260
ttggatttgg tgatggggag cagagatggg caaaaggaag agatagagag aaatgccaaa 1320
aagtggaaag aattggctag acaggccatc ggtgaaggtg ggtcatcaga ttcgaatctt 1380
aagacttttc tatgggagat tgatctagaa atttag 1416
<210> 30
<211> 471
<212> PRT
<213> 罗汉果
<400> 30
Met Met Arg Asn His His Phe Leu Leu Val Cys Phe Pro Ser Gln Gly
1 5 10 15
Tyr Ile Asn Pro Ser Leu Gln Leu Ala Arg Arg Leu Ile Ser Leu Gly
20 25 30
Val Asn Val Thr Phe Ala Thr Thr Val Leu Ala Gly Arg Arg Met Lys
35 40 45
Asn Lys Thr His Gln Thr Ala Thr Thr Pro Gly Leu Ser Phe Ala Thr
50 55 60
Phe Ser Asp Gly Phe Asp Asp Glu Thr Leu Lys Pro Asn Gly Asp Leu
65 70 75 80
Thr His Tyr Phe Ser Glu Leu Arg Arg Cys Gly Ser Glu Ser Leu Thr
85 90 95
His Leu Ile Thr Ser Ala Ala Asn Glu Gly Arg Pro Ile Thr Phe Val
100 105 110
Ile Tyr Ser Leu Leu Leu Ser Trp Ala Ala Asp Ile Ala Ser Thr Tyr
115 120 125
Asp Ile Pro Ser Ala Leu Phe Phe Ala Gln Pro Ala Thr Val Leu Ala
130 135 140
Leu Tyr Phe Tyr Tyr Phe His Gly Tyr Gly Asp Thr Ile Cys Ser Lys
145 150 155 160
Leu Gln Asp Pro Ser Ser Tyr Ile Glu Leu Pro Gly Leu Pro Leu Leu
165 170 175
Thr Ser Gln Asp Met Pro Ser Phe Phe Ser Pro Ser Gly Pro His Ala
180 185 190
Phe Ile Leu Pro Pro Met Arg Glu Gln Ala Glu Phe Leu Gly Arg Gln
195 200 205
Ser Gln Pro Lys Val Leu Val Asn Thr Phe Asp Ala Leu Glu Ala Asp
210 215 220
Ala Leu Arg Ala Ile Asp Lys Leu Lys Met Leu Ala Ile Gly Pro Leu
225 230 235 240
Ile Pro Ser Ala Leu Leu Gly Gly Asn Asp Ser Ser Asp Ala Ser Phe
245 250 255
Cys Gly Asp Leu Phe Gln Val Ser Ser Glu Asp Tyr Ile Glu Trp Leu
260 265 270
Asn Ser Lys Pro Asp Ser Ser Val Val Tyr Ile Ser Val Gly Ser Ile
275 280 285
Cys Val Leu Ser Asp Glu Gln Glu Asp Glu Leu Val His Ala Leu Leu
290 295 300
Asn Ser Gly His Thr Phe Leu Trp Val Lys Arg Ser Lys Glu Asn Asn
305 310 315 320
Glu Gly Val Lys Gln Glu Thr Asp Glu Glu Lys Leu Lys Lys Leu Glu
325 330 335
Glu Gln Gly Lys Met Val Ser Trp Cys Arg Gln Val Glu Val Leu Lys
340 345 350
His Pro Ala Leu Gly Cys Phe Leu Thr His Cys Gly Trp Asn Ser Thr
355 360 365
Ile Glu Ser Leu Val Ser Gly Leu Pro Val Val Ala Phe Pro Gln Gln
370 375 380
Ile Asp Gln Ala Thr Asn Ala Lys Leu Ile Glu Asp Val Trp Lys Thr
385 390 395 400
Gly Val Arg Val Lys Ala Asn Thr Glu Gly Ile Val Glu Arg Glu Glu
405 410 415
Ile Arg Arg Cys Leu Asp Leu Val Met Gly Ser Arg Asp Gly Gln Lys
420 425 430
Glu Glu Ile Glu Arg Asn Ala Lys Lys Trp Lys Glu Leu Ala Arg Gln
435 440 445
Ala Ile Gly Glu Gly Gly Ser Ser Asp Ser Asn Leu Lys Thr Phe Leu
450 455 460
Trp Glu Ile Asp Leu Glu Ile
465 470
<210> 31
<211> 1458
<212> DNA
<213> 罗汉果
<400> 31
atggcggagc aagctcatga tcttcttcac gtcctccttt ttccgtttcc ggcggagggc 60
cacatcaagc ccttcctctg tctcgccgag ctcctctgca acgccggctt ccatgtcacc 120
ttcctcaaca ccgactacaa ccaccgccgc ctccacaacc tccatctcct cgccgcccgc 180
tttccctcac ttcatttcga gtccatttcc gacggcctcc cgcccgatca gcctcgagat 240
atactggacc ccaagttttt tatatccatc tgtcaagtca ctaaacccct tttccgggag 300
ctcctccttt cctacaaacg catttccagt gtccagaccg gccgcccgcc aataacttgc 360
gttattacag atgtgatttt tcgttttccg atcgacgtag ctgaagaact ggatattcct 420
gtgtttagtt tctgtacttt cagtgcccgt ttcatgtttc tttacttctg gattcccaag 480
ctcattgaag atggccagct tccataccca aacggcaata tcaaccagaa actctacggt 540
gttgctcctg aggcggaagg ccttttaaga tgtaaagatt tgccgggaca ttgggctttc 600
gcagacgaac taaaagatga tcaacttaac tttgtggacc agacaacggc gtcatctcga 660
tcctccggtc tcattctcaa cacattcgac gacctcgaag ctccatttct ggggcgtctc 720
tccaccatct ttaagaaaat ctacgccgtt ggacccatcc actctctgtt gaactcccac 780
cactgtgggc tttggaaaga agatcacagt tgcctggcgt ggctcgactc ccgggccgcg 840
aaatccgtcg tgttcgtcag cttcgggagc ttggtgaaga taacaagtag gcagctgatg 900
gagttttggc atggcttgct caacagtgga aagtcgttcc tcttcgtgtt gagatctgac 960
gtagttgagg gcgatgatga aaaacaagtc gtcaaagaaa tttacgagac gaaggcagag 1020
gggaaatggt tggttgtggg gtgggctccg caagagaagg tgttagccca tgaagctgtt 1080
ggtggatttc tgacccattc gggctggaac tccattttag agagcattgc tgctggggtt 1140
cctatgatct cctgccccaa aattggagac cagtccagta actgtacgtg gatcagtaaa 1200
gtatggaaaa ttgggcttga aatggaggat cggtacgacc gggtttcggt cgaaacaatg 1260
gttagatcta taatggaaca agaaggtgag aaaatgcaga agacaattgc agaattagca 1320
aaacaagcta agtataaagt tagtaaagat ggaacatcat atcaaaattt agaatgttta 1380
atccaagata ttaaaaaact gaaccaaatt gagggtttta tcaacaaccc caattttagt 1440
gatttattaa gggtttag 1458
<210> 32
<211> 485
<212> PRT
<213> 罗汉果
<400> 32
Met Ala Glu Gln Ala His Asp Leu Leu His Val Leu Leu Phe Pro Phe
1 5 10 15
Pro Ala Glu Gly His Ile Lys Pro Phe Leu Cys Leu Ala Glu Leu Leu
20 25 30
Cys Asn Ala Gly Phe His Val Thr Phe Leu Asn Thr Asp Tyr Asn His
35 40 45
Arg Arg Leu His Asn Leu His Leu Leu Ala Ala Arg Phe Pro Ser Leu
50 55 60
His Phe Glu Ser Ile Ser Asp Gly Leu Pro Pro Asp Gln Pro Arg Asp
65 70 75 80
Ile Leu Asp Pro Lys Phe Phe Ile Ser Ile Cys Gln Val Thr Lys Pro
85 90 95
Leu Phe Arg Glu Leu Leu Leu Ser Tyr Lys Arg Ile Ser Ser Val Gln
100 105 110
Thr Gly Arg Pro Pro Ile Thr Cys Val Ile Thr Asp Val Ile Phe Arg
115 120 125
Phe Pro Ile Asp Val Ala Glu Glu Leu Asp Ile Pro Val Phe Ser Phe
130 135 140
Cys Thr Phe Ser Ala Arg Phe Met Phe Leu Tyr Phe Trp Ile Pro Lys
145 150 155 160
Leu Ile Glu Asp Gly Gln Leu Pro Tyr Pro Asn Gly Asn Ile Asn Gln
165 170 175
Lys Leu Tyr Gly Val Ala Pro Glu Ala Glu Gly Leu Leu Arg Cys Lys
180 185 190
Asp Leu Pro Gly His Trp Ala Phe Ala Asp Glu Leu Lys Asp Asp Gln
195 200 205
Leu Asn Phe Val Asp Gln Thr Thr Ala Ser Ser Arg Ser Ser Gly Leu
210 215 220
Ile Leu Asn Thr Phe Asp Asp Leu Glu Ala Pro Phe Leu Gly Arg Leu
225 230 235 240
Ser Thr Ile Phe Lys Lys Ile Tyr Ala Val Gly Pro Ile His Ser Leu
245 250 255
Leu Asn Ser His His Cys Gly Leu Trp Lys Glu Asp His Ser Cys Leu
260 265 270
Ala Trp Leu Asp Ser Arg Ala Ala Lys Ser Val Val Phe Val Ser Phe
275 280 285
Gly Ser Leu Val Lys Ile Thr Ser Arg Gln Leu Met Glu Phe Trp His
290 295 300
Gly Leu Leu Asn Ser Gly Lys Ser Phe Leu Phe Val Leu Arg Ser Asp
305 310 315 320
Val Val Glu Gly Asp Asp Glu Lys Gln Val Val Lys Glu Ile Tyr Glu
325 330 335
Thr Lys Ala Glu Gly Lys Trp Leu Val Val Gly Trp Ala Pro Gln Glu
340 345 350
Lys Val Leu Ala His Glu Ala Val Gly Gly Phe Leu Thr His Ser Gly
355 360 365
Trp Asn Ser Ile Leu Glu Ser Ile Ala Ala Gly Val Pro Met Ile Ser
370 375 380
Cys Pro Lys Ile Gly Asp Gln Ser Ser Asn Cys Thr Trp Ile Ser Lys
385 390 395 400
Val Trp Lys Ile Gly Leu Glu Met Glu Asp Arg Tyr Asp Arg Val Ser
405 410 415
Val Glu Thr Met Val Arg Ser Ile Met Glu Gln Glu Gly Glu Lys Met
420 425 430
Gln Lys Thr Ile Ala Glu Leu Ala Lys Gln Ala Lys Tyr Lys Val Ser
435 440 445
Lys Asp Gly Thr Ser Tyr Gln Asn Leu Glu Cys Leu Ile Gln Asp Ile
450 455 460
Lys Lys Leu Asn Gln Ile Glu Gly Phe Ile Asn Asn Pro Asn Phe Ser
465 470 475 480
Asp Leu Leu Arg Val
485
<210> 33
<211> 1425
<212> DNA
<213> 罗汉果
<400> 33
atggtgcaac ctcgggtact gctgtttcct ttcccggcac tgggccacgt gaagcccttc 60
ttatcactgg cggagctgct ttccgacgcc ggcatagacg tcgtcttcct cagcaccgag 120
tataaccacc gtcggatctc caacactgaa gccctagcct cccgcttccc gacgcttcat 180
ttcgaaacta taccggatgg cctgccgcct aatgagtcgc gcgctcttgc cgacggccca 240
ctgtatttct ccatgcgtga gggaactaaa ccgagattcc ggcaactgat tcaatctctt 300
aacgacggtc gttggcccat cacctgtatt atcactgaca tcatgttatc ttctccgatt 360
gaagtagcgg aagaatttgg gattccagta attgccttct gcccctgcag tgctcgctac 420
ttatcgattc acttttttat accgaagctc gttgaggaag gtcaaattcc atacgcagat 480
gacgatccga ttggagagat ccagggggtg cccttgttcg aaggtctttt gcgacggaat 540
catttgcctg gttcttggtc tgataaatct gcagatatat ctttctcgca tggcttgatt 600
aatcagaccc ttgcagctgg tcgagcctcg gctcttatac tcaacacctt cgacgagctc 660
gaagctccat ttctgaccca tctctcttcc attttcaaca aaatctacac cattggaccc 720
ctccatgctc tgtccaaatc aaggctcggc gactcctcct cctccgcttc tgccctctcc 780
ggattctgga aagaggatag agcctgcatg tcctggctcg actgtcagcc gccgagatct 840
gtggttttcg tcagtttcgg gagtacgatg aagatgaaag ccgatgaatt gagagagttc 900
tggtatgggt tggtgagcag cgggaaaccg ttcctctgcg tgttgagatc cgacgttgtt 960
tccggcggag aagcggcgga attgatcgaa cagatggcgg aggaggaggg agctggaggg 1020
aagctgggaa tggtagtgga gtgggcagcg caagagaagg tcctgagcca ccctgccgtc 1080
ggtgggtttt tgacgcactg cgggtggaac tcaacggtgg aaagcattgc cgcgggagtt 1140
ccgatgatgt gctggccgat tctcggcgac caacccagca acgccacttg gatcgacaga 1200
gtgtggaaaa ttggggttga aaggaacaat cgtgaatggg acaggttgac ggtggagaag 1260
atggtgagag cattgatgga aggccaaaag agagtggaga ttcagagatc aatggagaag 1320
ctttcaaagt tggcaaatga gaaggttgtc aggggtgggt tgtcttttga taacttggaa 1380
gttctcgttg aagacatcaa aaaattgaaa ccatataaat tttaa 1425
<210> 34
<211> 419
<212> PRT
<213> 罗汉果
<400> 34
Met Val Gln Pro Arg Val Leu Leu Phe Pro Phe Pro Ala Leu Gly His
1 5 10 15
Val Lys Pro Phe Leu Ser Leu Ala Glu Leu Leu Ser Asp Ala Gly Ile
20 25 30
Asp Val Val Phe Leu Ser Thr Glu Tyr Asn His Arg Arg Ile Ser Asn
35 40 45
Thr Glu Ala Leu Ala Ser Arg Phe Pro Thr Leu His Phe Glu Thr Ile
50 55 60
Pro Asp Gly Leu Pro Pro Asn Glu Ser Arg Ala Leu Ala Asp Gly Pro
65 70 75 80
Leu Tyr Phe Ser Met Arg Glu Gly Thr Lys Pro Arg Phe Arg Gln Leu
85 90 95
Ile Gln Ser Leu Asn Asp Gly Arg Trp Pro Ile Thr Cys Ile Ile Thr
100 105 110
Asp Ile Met Leu Ser Ser Pro Ile Glu Val Ala Glu Glu Phe Gly Ile
115 120 125
Pro Val Ile Ala Phe Cys Pro Cys Ser Ala Arg Tyr Leu Ser Ile His
130 135 140
Phe Phe Ile Pro Lys Leu Val Glu Glu Gly Gln Ile Pro Tyr Ala Asp
145 150 155 160
Asp Asp Pro Ile Gly Glu Ile Gln Gly Val Pro Leu Phe Glu Gly Leu
165 170 175
Leu Arg Arg Asn His Leu Pro Gly Ser Trp Ser Asp Lys Ser Ala Asp
180 185 190
Ile Ser Phe Ser His Gly Leu Ile Asn Gln Thr Leu Ala Ala Gly Arg
195 200 205
Ala Ser Ala Leu Ile Leu Asn Thr Phe Asp Glu Leu Glu Ala Pro Phe
210 215 220
Leu Thr His Leu Ser Ser Ile Phe Asn Lys Ile Tyr Thr Ile Gly Pro
225 230 235 240
Leu His Ala Leu Ser Lys Ser Arg Leu Gly Asp Ser Ser Ser Ser Ala
245 250 255
Ser Ala Leu Ser Gly Phe Trp Lys Glu Asp Arg Ala Cys Met Ser Trp
260 265 270
Leu Asp Cys Gln Pro Pro Arg Ser Val Val Phe Val Ser Phe Gly Ser
275 280 285
Thr Met Lys Met Lys Ala Asp Glu Leu Arg Glu Phe Trp Tyr Gly Leu
290 295 300
Val Ser Ser Gly Lys Pro Phe Leu Cys Val Leu Arg Ser Asp Val Val
305 310 315 320
Ser Gly Gly Glu Ala Ala Glu Leu Ile Glu Gln Met Ala Glu Glu Glu
325 330 335
Gly Ala Gly Gly Lys Leu Gly Met Val Val Glu Trp Ala Ala Gln Glu
340 345 350
Lys Val Leu Ser His Pro Ala Val Gly Gly Phe Leu Thr His Cys Gly
355 360 365
Trp Asn Ser Thr Val Glu Ser Ile Ala Ala Gly Val Pro Met Met Cys
370 375 380
Trp Pro Ile Leu Gly Asp Gln Pro Ser Asn Ala Thr Trp Ile Asp Arg
385 390 395 400
Val Trp Lys Ile Gly Val Glu Arg Asn Asn Arg Glu Trp Asp Arg Leu
405 410 415
Thr Val Glu
<210> 35
<211> 1422
<212> DNA
<213> 罗汉果
<400> 35
atggatgccc agcaaggtca caccaccacc attttgatgc ttccatgggt cggctacggc 60
catctcttgc ctttcctcga gctggccaaa agcctctcca ggaggaaatt attccacatc 120
tacttctgtt caacgtctgt tagcctcgac gccattaaac caaagcttcc tccttctatc 180
tcttctgatg attccatcca acttgtggaa cttcgtctcc cttcttctcc tgagttacct 240
cctcatcttc acacaaccaa cggccttccc tctcacctca tgcccgctct ccaccaagcc 300
ttcgtcatgg ctgcccaaca ctttcaggtc attttacaaa cacttgcccc gcatctcctc 360
atttatgaca ttctccaacc ttgggctcct caagtggctt catccctcaa cattccagcc 420
atcaacttca gtactaccgg agcttcaatg ctttctcgaa cgcttcaccc tactcactac 480
ccaagttcta aattcccaat ctcagagttt gttcttcaca atcactggag agccatgtac 540
accaccgccg atggggctct tacagaagaa ggccacaaaa ttgaagaaac acttgcgaat 600
tgcttgcata cttcttgcgg ggtagttttg gtcaatagtt tcagagagct tgagacgaaa 660
tatatcgatt atctctctgt tctcttgaac aagaaagttg ttccggtcgg tcctttggtt 720
tacgaaccga atcaagaagg ggaagatgaa ggttattcaa gcatcaaaaa ttggcttgac 780
aaaaaggaac cgtcctcaac cgtcttcgtt tcatttggaa ccgaatactt cccgtcaaag 840
gaagaaatgg aagagatagc gtatgggtta gagctgagcg aggttaattt catctgggtc 900
cttagatttc ctcaaggaga cagcaccagc accattgaag acgccttgcc gaaggggttt 960
ctggagagag cgggagagag ggcgatggtg gtgaagggtt gggctcctca ggcgaagata 1020
ctgaagcatt ggagcacagg ggggcttgtg agtcactgtg gatggaactc gatgatggag 1080
ggcatgatgt ttggcgtacc cataatagcg gttccgatgc atctggacca gccctttaac 1140
gccggactcg tggaagaagc tggcgtcggc gtggaagcca agcgagattc ggacggcaaa 1200
attcaaagag aagaagttgc aaagtcgatc aaagaagtgg tgattgagaa aaccagggaa 1260
gacgtgagga agaaagcaag agaaatggac accaaacacg gacctaccta ttttagtcgg 1320
tcgaaagtta gcagttttgg aaggctatat aaaatcaacc gaccaactac actgacggtt 1380
ggtcgatttt ggtcgaaaca gatcaagatg aagcgagagt aa 1422
<210> 36
<211> 459
<212> PRT
<213> 罗汉果
<400> 36
Met Asp Ala Gln Gln Gly His Thr Thr Thr Ile Leu Met Leu Pro Trp
1 5 10 15
Val Gly Tyr Gly His Leu Leu Pro Phe Leu Glu Leu Ala Lys Ser Leu
20 25 30
Ser Arg Arg Lys Leu Phe His Ile Tyr Phe Cys Ser Thr Ser Val Ser
35 40 45
Leu Asp Ala Ile Lys Pro Lys Leu Pro Pro Ser Ile Ser Ser Asp Asp
50 55 60
Ser Ile Gln Leu Val Glu Leu Arg Leu Pro Ser Ser Pro Glu Leu Pro
65 70 75 80
Pro His Leu His Thr Thr Asn Gly Leu Pro Ser His Leu Met Pro Ala
85 90 95
Leu His Gln Ala Phe Val Met Ala Ala Gln His Phe Gln Val Ile Leu
100 105 110
Gln Thr Leu Ala Pro His Leu Leu Ile Tyr Asp Ile Leu Gln Pro Trp
115 120 125
Ala Pro Gln Val Ala Ser Ser Leu Asn Ile Pro Ala Ile Asn Phe Ser
130 135 140
Thr Thr Gly Ala Ser Met Leu Ser Arg Thr Leu His Pro Thr His Tyr
145 150 155 160
Pro Ser Ser Lys Phe Pro Ile Ser Glu Phe Val Leu His Asn His Trp
165 170 175
Arg Ala Met Tyr Thr Thr Ala Asp Gly Ala Leu Thr Glu Glu Gly His
180 185 190
Lys Ile Glu Glu Thr Leu Ala Asn Cys Leu His Thr Ser Cys Gly Val
195 200 205
Val Leu Val Asn Ser Phe Arg Glu Leu Glu Thr Lys Tyr Ile Asp Tyr
210 215 220
Leu Ser Val Leu Leu Asn Lys Lys Val Val Pro Val Gly Pro Leu Val
225 230 235 240
Tyr Glu Pro Asn Gln Glu Gly Glu Asp Glu Gly Tyr Ser Ser Ile Lys
245 250 255
Asn Trp Leu Asp Lys Lys Glu Pro Ser Ser Thr Val Phe Val Ser Phe
260 265 270
Gly Thr Glu Tyr Phe Pro Ser Lys Glu Glu Met Glu Glu Ile Ala Tyr
275 280 285
Gly Leu Glu Leu Ser Glu Val Asn Phe Ile Trp Val Leu Arg Phe Pro
290 295 300
Gln Gly Asp Ser Thr Ser Thr Ile Glu Asp Ala Leu Pro Lys Gly Phe
305 310 315 320
Leu Glu Arg Ala Gly Glu Arg Ala Met Val Val Lys Gly Trp Ala Pro
325 330 335
Gln Ala Lys Ile Leu Lys His Trp Ser Thr Gly Gly Leu Val Ser His
340 345 350
Cys Gly Trp Asn Ser Met Met Glu Gly Met Met Phe Gly Val Pro Ile
355 360 365
Ile Ala Val Pro Met His Leu Asp Gln Pro Phe Asn Ala Gly Leu Val
370 375 380
Glu Glu Ala Gly Val Gly Val Glu Ala Lys Arg Asp Ser Asp Gly Lys
385 390 395 400
Ile Gln Arg Glu Glu Val Ala Lys Ser Ile Lys Glu Val Val Ile Glu
405 410 415
Lys Thr Arg Glu Asp Val Arg Lys Lys Ala Arg Glu Met Gly Glu Ile
420 425 430
Leu Arg Ser Lys Gly Asp Glu Lys Ile Asp Glu Leu Val Ala Glu Ile
435 440 445
Ser Leu Leu Arg Lys Lys Ala Pro Cys Ser Ile
450 455
<210> 37
<211> 1359
<212> DNA
<213> 罗汉果
<400> 37
atggatgctg cccaacaagg tgacaccaca accattttga tgcttccatg gctcggctat 60
ggccatcttt cagcttttct cgagctggcc aaaagcctct caaggaggaa cttccatatc 120
tacttctgtt caacctctgt taatcttgac gccattaaac caaagcttcc ttcttctttc 180
tctgattcca ttcaatttgt ggagctccat ctcccttctt ctcctgagtt ccctcctcat 240
cttcacacaa ccaacggcct tccccctacc ctcatgcccg ctctccacca agccttctcc 300
atggctgccc agcactttga gtccatttta caaacacttg ccccgcacct tctcatttat 360
gactctcttc aaccttgggc tcctcgggta gcttcatccc tcaaaattcc ggccatcaac 420
ttcaatacca cgggagtttt cgtcatttct caagggyttc accctattca ctacccacat 480
tctaaattcc cattctcaga gttcgttctt cacaatcatt ggaaagccat gtactccact 540
gccgatggag cttctaccga aagaacccgc aaacgtggag aagcgtttct gtattgcttg 600
catgcttctt gtagtgtaat tctaatcaat agtttcagag agctcgaggg gaaatatatg 660
gattatctct ctgttctctt gaacaagaaa gttgttccgg ttggtccttt ggtttacgaa 720
ccgaatcaag acggggaaga tgaaggttat tcaagcatca aaaattggct tgacaaaaag 780
gaaccgtcct ccaccgtctt cgtgtcattt ggaagcgaat acttcccgtc aaaggaagaa 840
atggaagaga tagcccatgg gttagaggcg agcgaggtta atttcatctg ggtcgttagg 900
tttcctcaag gagacaacac cagcggcatt gaagatgcct tgccgaaggg ttttctggag 960
agggcgggag agagagggat ggtggtgaag ggttgggctc ctcaggcgaa gatactgaag 1020
cattggagca cagggggatt cgtgagccac tgtggatgga actcggtgat ggagagcatg 1080
atgtttggcg ttcccataat aggggttccg atgcatgtgg accagccctt taacgccgga 1140
ctcgtggaag aagctggcgt cggcgtggag gccaagcgag atccagacgg caaaattcaa 1200
agagacgaag ttgcaaagtt gatcaaagaa gtggtggttg agaaaaccag agaagatgtg 1260
cggaagaaag caagagaaat gagtgagatt ttgaggagca agggagagga gaagtttgat 1320
gagatggtcg ctgaaatttc tctcttgctt aaaatatga 1359
<210> 38
<211> 452
<212> PRT
<213> 罗汉果
<400> 38
Met Asp Ala Ala Gln Gln Gly Asp Thr Thr Thr Ile Leu Met Leu Pro
1 5 10 15
Trp Leu Gly Tyr Gly His Leu Ser Ala Phe Leu Glu Leu Ala Lys Ser
20 25 30
Leu Ser Arg Arg Asn Phe His Ile Tyr Phe Cys Ser Thr Ser Val Asn
35 40 45
Leu Asp Ala Ile Lys Pro Lys Leu Pro Ser Ser Phe Ser Asp Ser Ile
50 55 60
Gln Phe Val Glu Leu His Leu Pro Ser Ser Pro Glu Phe Pro Pro His
65 70 75 80
Leu His Thr Thr Asn Gly Leu Pro Pro Thr Leu Met Pro Ala Leu His
85 90 95
Gln Ala Phe Ser Met Ala Ala Gln His Phe Glu Ser Ile Leu Gln Thr
100 105 110
Leu Ala Pro His Leu Leu Ile Tyr Asp Ser Leu Gln Pro Trp Ala Pro
115 120 125
Arg Val Ala Ser Ser Leu Lys Ile Pro Ala Ile Asn Phe Asn Thr Thr
130 135 140
Gly Val Phe Val Ile Ser Gln Gly Leu His Pro Ile His Tyr Pro His
145 150 155 160
Ser Lys Phe Pro Phe Ser Glu Phe Val Leu His Asn His Trp Lys Ala
165 170 175
Met Tyr Ser Thr Ala Asp Gly Ala Ser Thr Glu Arg Thr Arg Lys Arg
180 185 190
Gly Glu Ala Phe Leu Tyr Cys Leu His Ala Ser Cys Ser Val Ile Leu
195 200 205
Ile Asn Ser Phe Arg Glu Leu Glu Gly Lys Tyr Met Asp Tyr Leu Ser
210 215 220
Val Leu Leu Asn Lys Lys Val Val Pro Val Gly Pro Leu Val Tyr Glu
225 230 235 240
Pro Asn Gln Asp Gly Glu Asp Glu Gly Tyr Ser Ser Ile Lys Asn Trp
245 250 255
Leu Asp Lys Lys Glu Pro Ser Ser Thr Val Phe Val Ser Phe Gly Ser
260 265 270
Glu Tyr Phe Pro Ser Lys Glu Glu Met Glu Glu Ile Ala His Gly Leu
275 280 285
Glu Ala Ser Glu Val Asn Phe Ile Trp Val Val Arg Phe Pro Gln Gly
290 295 300
Asp Asn Thr Ser Gly Ile Glu Asp Ala Leu Pro Lys Gly Phe Leu Glu
305 310 315 320
Arg Ala Gly Glu Arg Gly Met Val Val Lys Gly Trp Ala Pro Gln Ala
325 330 335
Lys Ile Leu Lys His Trp Ser Thr Gly Gly Phe Val Ser His Cys Gly
340 345 350
Trp Asn Ser Val Met Glu Ser Met Met Phe Gly Val Pro Ile Ile Gly
355 360 365
Val Pro Met His Val Asp Gln Pro Phe Asn Ala Gly Leu Val Glu Glu
370 375 380
Ala Gly Val Gly Val Glu Ala Lys Arg Asp Pro Asp Gly Lys Ile Gln
385 390 395 400
Arg Asp Glu Val Ala Lys Leu Ile Lys Glu Val Val Val Glu Lys Thr
405 410 415
Arg Glu Asp Val Arg Lys Lys Ala Arg Glu Met Ser Glu Ile Leu Arg
420 425 430
Ser Lys Gly Glu Glu Lys Phe Asp Glu Met Val Ala Glu Ile Ser Leu
435 440 445
Leu Leu Lys Ile
450
<210> 39
<211> 317
<212> PRT
<213> 罗汉果
<400> 39
Met Asp Ala Ile Glu His Arg Thr Val Ser Val Asn Gly Ile Asn Met
1 5 10 15
His Val Ala Glu Lys Gly Glu Gly Pro Val Val Leu Leu Leu His Gly
20 25 30
Phe Pro Glu Leu Trp Tyr Ser Trp Arg His Gln Ile Leu Ala Leu Ser
35 40 45
Ser Leu Gly Tyr Arg Ala Val Ala Pro Asp Leu Arg Gly Tyr Gly Asp
50 55 60
Thr Asp Ala Pro Gly Ser Ile Ser Ser Tyr Thr Cys Phe His Ile Val
65 70 75 80
Gly Asp Leu Val Ala Leu Val Glu Ser Leu Gly Met Asp Arg Val Phe
85 90 95
Val Val Ala His Asp Trp Gly Ala Met Ile Ala Trp Cys Leu Cys Leu
100 105 110
Phe Arg Pro Glu Met Val Lys Ala Phe Val Cys Leu Ser Val Pro Phe
115 120 125
Arg Gln Arg Asn Pro Lys Met Lys Pro Val Gln Ser Met Arg Ala Phe
130 135 140
Phe Gly Asp Asp Tyr Tyr Ile Cys Arg Phe Gln Asn Pro Gly Glu Ile
145 150 155 160
Glu Glu Glu Met Ala Gln Val Gly Ala Arg Glu Val Leu Arg Gly Ile
165 170 175
Leu Thr Ser Arg Arg Pro Gly Pro Pro Ile Leu Pro Lys Gly Gln Ala
180 185 190
Phe Arg Ala Arg Pro Gly Ala Ser Thr Ala Leu Pro Ser Trp Leu Ser
195 200 205
Glu Lys Asp Leu Ser Phe Phe Ala Ser Lys Tyr Asp Gln Lys Gly Phe
210 215 220
Thr Gly Pro Leu Asn Tyr Tyr Arg Ala Met Asp Leu Asn Trp Glu Leu
225 230 235 240
Thr Ala Ser Trp Thr Gly Val Gln Val Lys Val Pro Val Lys Tyr Ile
245 250 255
Val Gly Asp Val Asp Met Val Phe Thr Thr Pro Gly Val Lys Glu Tyr
260 265 270
Val Asn Gly Gly Gly Phe Lys Lys Asp Val Pro Phe Leu Gln Glu Val
275 280 285
Val Ile Met Glu Gly Val Gly His Phe Ile Asn Gln Glu Lys Pro Glu
290 295 300
Glu Ile Ser Ser His Ile His Asp Phe Ile Ser Lys Phe
305 310 315
<210> 40
<211> 316
<212> PRT
<213> 罗汉果
<400> 40
Met Asp Glu Ile Glu His Ile Thr Ile Asn Thr Asn Gly Ile Lys Met
1 5 10 15
His Ile Ala Ser Val Gly Thr Gly Pro Val Val Leu Leu Leu His Gly
20 25 30
Phe Pro Glu Leu Trp Tyr Ser Trp Arg His Gln Leu Leu Tyr Leu Ser
35 40 45
Ser Val Gly Tyr Arg Ala Ile Ala Pro Asp Leu Arg Gly Tyr Gly Asp
50 55 60
Thr Asp Ser Pro Ala Ser Pro Thr Ser Tyr Thr Ala Leu His Ile Val
65 70 75 80
Gly Asp Leu Val Gly Ala Leu Asp Glu Leu Gly Ile Glu Lys Val Phe
85 90 95
Leu Val Gly His Asp Trp Gly Ala Ile Ile Ala Trp Tyr Phe Cys Leu
100 105 110
Phe Arg Pro Asp Arg Ile Lys Ala Leu Val Asn Leu Ser Val Gln Phe
115 120 125
Ile Pro Arg Asn Pro Ala Ile Pro Phe Ile Glu Gly Phe Arg Thr Ala
130 135 140
Phe Gly Asp Asp Phe Tyr Ile Cys Arg Phe Gln Val Pro Gly Glu Ala
145 150 155 160
Glu Glu Asp Phe Ala Ser Ile Asp Thr Ala Gln Leu Phe Lys Thr Ser
165 170 175
Leu Cys Asn Arg Ser Ser Ala Pro Pro Cys Leu Pro Lys Glu Ile Gly
180 185 190
Phe Arg Ala Ile Pro Pro Pro Glu Asn Leu Pro Ser Trp Leu Thr Glu
195 200 205
Glu Asp Ile Asn Phe Tyr Ala Ala Lys Phe Lys Gln Thr Gly Phe Thr
210 215 220
Gly Ala Leu Asn Tyr Tyr Arg Ala Phe Asp Leu Thr Trp Glu Leu Thr
225 230 235 240
Ala Pro Trp Thr Gly Ala Gln Ile Gln Val Pro Val Lys Phe Ile Val
245 250 255
Gly Asp Ser Asp Leu Thr Tyr His Phe Pro Gly Ala Lys Glu Tyr Ile
260 265 270
His Asn Gly Gly Phe Lys Arg Asp Val Pro Leu Leu Glu Glu Val Val
275 280 285
Val Val Lys Asp Ala Cys His Phe Ile Asn Gln Glu Arg Pro Gln Glu
290 295 300
Ile Asn Ala His Ile His Asp Phe Ile Asn Lys Phe
305 310 315
<210> 41
<211> 325
<212> PRT
<213> 罗汉果
<400> 41
Met Glu Lys Glu Ser Glu Ile His Ser Ile Arg His Thr Thr Val Ser
1 5 10 15
Val Asn Gly Ile Asn Met His Val Ala Glu Lys Gly Glu Gly Pro Leu
20 25 30
Val Leu Phe Ile His Gly Phe Pro Glu Leu Trp Tyr Ser Trp Arg His
35 40 45
Gln Ile Leu Asp Leu Ala Ser Leu Gly Tyr Arg Ala Val Ala Pro Asp
50 55 60
Leu Arg Gly Tyr Gly Asp Ser Asp Ala Pro Pro Ser Ala Ser Ser Tyr
65 70 75 80
Thr Ser Phe His Ile Val Gly Asp Leu Ile Ala Leu Leu Asp Ala Ile
85 90 95
Val Gly Val Glu Glu Lys Val Phe Val Val Ala His Asp Trp Gly Ala
100 105 110
Ile Ile Ala Trp Tyr Leu Cys Leu Tyr Arg Pro Asp Arg Ile Lys Ala
115 120 125
Leu Val Asn Leu Ser Val Ala Phe Ile Arg Arg Asn Pro Lys Gly Lys
130 135 140
Pro Val Glu Trp Ile Arg Ala Leu Tyr Gly Asp Asp His Tyr Met Cys
145 150 155 160
Arg Cys Gln Glu Pro Gly Glu Ile Glu Gly Glu Phe Ala Glu Ile Gly
165 170 175
Thr Glu Arg Val Leu Thr Gln Phe Leu Thr Tyr His Ser Pro Lys Pro
180 185 190
Leu Met Leu Pro Lys Gly Lys Ala Phe Gly His Pro Leu Asp Thr Pro
195 200 205
Ile Pro Leu Pro Pro Trp Leu Ser His Gln Asp Ile Glu Tyr Tyr Ala
210 215 220
Ser Lys Phe Asp Lys Lys Gly Phe Thr Gly Pro Val Asn Tyr Tyr Arg
225 230 235 240
Asn Leu Asp Arg Asn Trp Glu Leu Asn Ala Pro Phe Thr Arg Ala Gln
245 250 255
Val Lys Val Pro Val Lys Phe Ile Val Gly Asp Leu Asp Leu Thr Tyr
260 265 270
His Ser Phe Gly Thr Lys Glu Tyr Ile His Ser Gly Glu Met Lys Lys
275 280 285
Asp Val Pro Phe Leu Gln Glu Val Val Val Met Glu Gly Val Gly His
290 295 300
Phe Ile Gln Ser Glu Lys Pro His Glu Ile Ser Asp His Ile Tyr Gln
305 310 315 320
Phe Ile Lys Lys Phe
325
<210> 42
<211> 316
<212> PRT
<213> 罗汉果
<400> 42
Met Glu Lys Ile Glu His Thr Ile Ile Thr Thr Asn Gly Ile Asn Met
1 5 10 15
His Val Ala Ser Ile Gly Thr Gly Pro Ala Val Leu Phe Leu His Gly
20 25 30
Phe Pro Glu Leu Trp Tyr Ser Trp Arg His Gln Leu Leu Ser Phe Ser
35 40 45
Ser Leu Gly Tyr Arg Ala Ile Ala Pro Asp Leu Arg Gly Tyr Gly Asp
50 55 60
Ser Asp Ala Pro Pro Ser Pro Ser Ser Tyr Thr Val Phe His Ile Val
65 70 75 80
Gly Asp Leu Val Gly Leu Leu Asp Gln Leu Gly Ile Asp Gln Val Phe
85 90 95
Leu Val Gly His Asp Trp Gly Ala Ser Ile Ala Trp Tyr Phe Ser Leu
100 105 110
Leu Arg Pro Asp Arg Ile Lys Ala Leu Val Asn Leu Ser Val Gln Tyr
115 120 125
Phe Pro Arg Asn Pro Ala Arg Asn Thr Val Glu Ala Leu Arg Ala Leu
130 135 140
Phe Gly Asp Asp Tyr Tyr Val Cys Arg Phe Gln Glu Pro Gly Glu Met
145 150 155 160
Glu Glu Asp Phe Ala Ser Ile Asp Thr Ala Val Ile Phe Lys Ile Phe
165 170 175
Leu Ser Ser Arg Asp Pro Arg Pro Pro Cys Ile Pro Lys Ala Val Gly
180 185 190
Phe Arg Ala Phe Pro Val Pro Asp Ser Leu Pro Ser Trp Leu Ser Glu
195 200 205
Glu Asp Ile Ser Tyr Tyr Ala Ser Lys Phe Ser Lys Lys Gly Phe Thr
210 215 220
Gly Gly Leu Asn Tyr Tyr Arg Ala Leu Ala Leu Asn Trp Glu Leu Thr
225 230 235 240
Ala Pro Trp Thr Gly Thr Gln Ile Lys Val Pro Thr Lys Phe Ile Val
245 250 255
Gly Asp Leu Asp Leu Thr Tyr His Ile Pro Gly Ser Lys Glu Tyr Ile
260 265 270
His Lys Gly Gly Phe Glu Arg Asp Val Pro Ser Leu Glu Glu Val Val
275 280 285
Val Ile Glu Gly Ala Ala His Phe Val Asn Gln Glu Arg Pro Glu Glu
290 295 300
Ile Ser Lys His Ile Tyr Asp Phe Ile Lys Lys Phe
305 310 315
<210> 43
<211> 317
<212> PRT
<213> 罗汉果
<400> 43
Met Asp Ala Ile Glu His Arg Thr Val Ser Val Asn Gly Ile Asn Met
1 5 10 15
His Val Ala Glu Lys Gly Glu Gly Pro Val Val Leu Leu Leu His Gly
20 25 30
Phe Pro Glu Leu Trp Tyr Ser Trp Arg His Gln Ile Leu Ala Leu Ser
35 40 45
Ser Leu Gly Tyr Arg Ala Val Ala Pro Asp Leu Arg Gly Tyr Gly Asp
50 55 60
Thr Asp Ala Pro Gly Ser Ile Ser Ser Tyr Thr Cys Phe His Ile Val
65 70 75 80
Gly Asp Leu Val Ala Leu Val Glu Ser Leu Gly Val Asp Arg Val Phe
85 90 95
Val Val Ala His Asp Trp Gly Ala Met Ile Ala Trp Cys Leu Cys Leu
100 105 110
Phe Arg Pro Glu Met Val Lys Ala Phe Val Cys Leu Ser Val Pro Phe
115 120 125
Arg Gln Arg Asn Pro Lys Met Lys Pro Val Gln Ser Met Arg Ala Phe
130 135 140
Phe Gly Asp Asp Tyr Tyr Ile Cys Arg Phe Gln Asn Pro Gly Glu Ile
145 150 155 160
Glu Glu Glu Met Ala Gln Val Gly Ala Arg Glu Val Leu Arg Gly Ile
165 170 175
Leu Thr Ser Arg Arg Pro Gly Pro Pro Ile Leu Pro Lys Gly Gln Ala
180 185 190
Phe Arg Ala Arg Pro Gly Ala Ser Thr Ala Leu Pro Ser Trp Leu Ser
195 200 205
Glu Lys Asp Leu Ser Phe Phe Ala Ser Lys Tyr Asp Gln Lys Gly Phe
210 215 220
Thr Gly Pro Leu Asn Tyr Tyr Arg Ala Met Asp Leu Asn Trp Glu Leu
225 230 235 240
Thr Ala Ser Trp Thr Gly Val Gln Val Lys Val Pro Val Lys Tyr Ile
245 250 255
Val Gly Asp Val Asp Met Val Phe Thr Thr Pro Gly Val Lys Glu Tyr
260 265 270
Val Asn Gly Gly Gly Phe Lys Lys Asp Val Pro Phe Leu Gln Glu Val
275 280 285
Val Ile Met Glu Gly Val Gly His Phe Ile Asn Gln Glu Lys Pro Glu
290 295 300
Glu Ile Ser Ser His Ile His Asp Phe Ile Ser Arg Phe
305 310 315
<210> 44
<211> 311
<212> PRT
<213> 罗汉果
<400> 44
Met Asp Gln Ile Gln His Lys Phe Ile Asp Ile Arg Gly Leu Lys Leu
1 5 10 15
His Ile Ala Glu Ile Gly Thr Gly Ser Pro Ala Val Val Phe Leu His
20 25 30
Gly Phe Pro Glu Ile Trp Tyr Ser Trp Arg His Gln Met Val Ala Ala
35 40 45
Ala Ala Val Gly Tyr Arg Ala Ile Ser Pro Asp Leu Arg Gly Tyr Gly
50 55 60
Phe Ser Asp Pro His Pro Gln Pro Gln Asn Ala Ser Phe Asp Asp Phe
65 70 75 80
Val Glu Asp Thr Leu Ala Ile Leu Asp Phe Leu His Ile Pro Lys Ala
85 90 95
Phe Leu Val Gly Lys Asp Phe Gly Ser Trp Pro Val Tyr Leu Phe Ser
100 105 110
Leu Val His Pro Thr Arg Val Ala Gly Ile Val Ser Leu Gly Val Pro
115 120 125
Phe Leu Pro Pro Asn Pro Lys Arg Tyr Arg Asp Leu Pro Glu Gly Phe
130 135 140
Tyr Ile Phe Arg Trp Lys Glu Ser Gly Arg Ala Glu Ala Asp Phe Gly
145 150 155 160
Arg Phe Asp Val Lys Thr Val Leu Arg Arg Ile Tyr Thr Leu Phe Ser
165 170 175
Arg Ser Glu Ile Pro Ile Ala Glu Lys Asp Gln Glu Ile Met Asp Met
180 185 190
Val Asp Glu Ser Thr Pro Pro Pro Pro Trp Leu Thr Asp Glu Asp Leu
195 200 205
Ala Ala Tyr Ala Thr Ala Tyr Glu His Ser Gly Phe Glu Ser Ala Leu
210 215 220
Gln Val Pro Tyr Arg Arg Arg His Gln Glu Leu Gly Met Ser Asn Pro
225 230 235 240
Arg Val Asp Val Pro Val Leu Leu Ile Ile Gly Gly Lys Asp Tyr Phe
245 250 255
Leu Lys Phe Pro Gly Ile Glu Asp Tyr Ile Lys Ser Glu Lys Met Arg
260 265 270
Glu Ile Val Pro Asp Leu Glu Val Ala Asp Leu Ala Asp Gly Thr His
275 280 285
Phe Met Gln Glu Gln Phe Pro Ala Gln Val Asn His Leu Leu Ile Ser
290 295 300
Phe Leu Gly Lys Arg Asn Thr
305 310
<210> 45
<211> 759
<212> PRT
<213> 罗汉果i
<400> 45
Met Trp Arg Leu Lys Val Gly Ala Glu Ser Val Gly Glu Asn Asp Glu
1 5 10 15
Lys Trp Leu Lys Ser Ile Ser Asn His Leu Gly Arg Gln Val Trp Glu
20 25 30
Phe Cys Pro Asp Ala Gly Thr Gln Gln Gln Leu Leu Gln Val His Lys
35 40 45
Ala Arg Lys Ala Phe His Asp Asp Arg Phe His Arg Lys Gln Ser Ser
50 55 60
Asp Leu Phe Ile Thr Ile Gln Tyr Gly Lys Glu Val Glu Asn Gly Gly
65 70 75 80
Lys Thr Ala Gly Val Lys Leu Lys Glu Gly Glu Glu Val Arg Lys Glu
85 90 95
Ala Val Glu Ser Ser Leu Glu Arg Ala Leu Ser Phe Tyr Ser Ser Ile
100 105 110
Gln Thr Ser Asp Gly Asn Trp Ala Ser Asp Leu Gly Gly Pro Met Phe
115 120 125
Leu Leu Pro Gly Leu Val Ile Ala Leu Tyr Val Thr Gly Val Leu Asn
130 135 140
Ser Val Leu Ser Lys His His Arg Gln Glu Met Cys Arg Tyr Val Tyr
145 150 155 160
Asn His Gln Asn Glu Asp Gly Gly Trp Gly Leu His Ile Glu Gly Pro
165 170 175
Ser Thr Met Phe Gly Ser Ala Leu Asn Tyr Val Ala Leu Arg Leu Leu
180 185 190
Gly Glu Asp Ala Asn Ala Gly Ala Met Pro Lys Ala Arg Ala Trp Ile
195 200 205
Leu Asp His Gly Gly Ala Thr Gly Ile Thr Ser Trp Gly Lys Leu Trp
210 215 220
Leu Ser Val Leu Gly Val Tyr Glu Trp Ser Gly Asn Asn Pro Leu Pro
225 230 235 240
Pro Glu Phe Trp Leu Phe Pro Tyr Phe Leu Pro Phe His Pro Gly Arg
245 250 255
Met Trp Cys His Cys Arg Met Val Tyr Leu Pro Met Ser Tyr Leu Tyr
260 265 270
Gly Lys Arg Phe Val Gly Pro Ile Thr Pro Ile Val Leu Ser Leu Arg
275 280 285
Lys Glu Leu Tyr Ala Val Pro Tyr His Glu Ile Asp Trp Asn Lys Ser
290 295 300
Arg Asn Thr Cys Ala Lys Glu Asp Leu Tyr Tyr Pro His Pro Lys Met
305 310 315 320
Gln Asp Ile Leu Trp Gly Ser Leu His His Val Tyr Glu Pro Leu Phe
325 330 335
Thr Arg Trp Pro Ala Lys Arg Leu Arg Glu Lys Ala Leu Gln Thr Ala
340 345 350
Met Gln His Ile His Tyr Glu Asp Glu Asn Thr Arg Tyr Ile Cys Leu
355 360 365
Gly Pro Val Asn Lys Val Leu Asn Leu Leu Cys Cys Trp Val Glu Asp
370 375 380
Pro Tyr Ser Asp Ala Phe Lys Leu His Leu Gln Arg Val His Asp Tyr
385 390 395 400
Leu Trp Val Ala Glu Asp Gly Met Lys Met Gln Gly Tyr Asn Gly Ser
405 410 415
Gln Leu Trp Asp Thr Ala Phe Ser Ile Gln Ala Ile Val Ser Thr Lys
420 425 430
Leu Val Asp Asn Tyr Gly Pro Thr Leu Arg Lys Ala His Asp Phe Val
435 440 445
Lys Ser Ser Gln Ile Gln Gln Asp Cys Pro Gly Asp Pro Asn Val Trp
450 455 460
Tyr Arg His Ile His Lys Gly Ala Trp Pro Phe Ser Thr Arg Asp His
465 470 475 480
Gly Trp Leu Ile Ser Asp Cys Thr Ala Glu Gly Leu Lys Ala Ala Leu
485 490 495
Met Leu Ser Lys Leu Pro Ser Glu Thr Val Gly Glu Ser Leu Glu Arg
500 505 510
Asn Arg Leu Cys Asp Ala Val Asn Val Leu Leu Ser Leu Gln Asn Asp
515 520 525
Asn Gly Gly Phe Ala Ser Tyr Glu Leu Thr Arg Ser Tyr Pro Trp Leu
530 535 540
Glu Leu Ile Asn Pro Ala Glu Thr Phe Gly Asp Ile Val Ile Asp Tyr
545 550 555 560
Pro Tyr Val Glu Cys Thr Ser Ala Thr Met Glu Ala Leu Thr Leu Phe
565 570 575
Lys Lys Leu His Pro Gly His Arg Thr Lys Glu Ile Asp Thr Ala Ile
580 585 590
Val Arg Ala Ala Asn Phe Leu Glu Asn Met Gln Arg Thr Asp Gly Ser
595 600 605
Trp Tyr Gly Cys Trp Gly Val Cys Phe Thr Tyr Ala Gly Trp Phe Gly
610 615 620
Ile Lys Gly Leu Val Ala Ala Gly Arg Thr Tyr Asn Asn Cys Leu Ala
625 630 635 640
Ile Arg Lys Ala Cys Asp Phe Leu Leu Ser Lys Glu Leu Pro Gly Gly
645 650 655
Gly Trp Gly Glu Ser Tyr Leu Ser Cys Gln Asn Lys Val Tyr Thr Asn
660 665 670
Leu Glu Gly Asn Arg Pro His Leu Val Asn Thr Ala Trp Val Leu Met
675 680 685
Ala Leu Ile Glu Ala Gly Gln Ala Glu Arg Asp Pro Thr Pro Leu His
690 695 700
Arg Ala Ala Arg Leu Leu Ile Asn Ser Gln Leu Glu Asn Gly Asp Phe
705 710 715 720
Pro Gln Gln Glu Ile Met Gly Val Phe Asn Lys Asn Cys Met Ile Thr
725 730 735
Tyr Ala Ala Tyr Arg Asn Ile Phe Pro Ile Trp Ala Leu Gly Glu Tyr
740 745 750
Cys His Arg Val Leu Thr Glu
755
<210> 46
<211> 524
<212> PRT
<213> 香瓜(Cucumis melo)
<400> 46
Met Val Asp Gln Cys Ala Leu Gly Trp Ile Leu Ala Ser Val Leu Gly
1 5 10 15
Ala Ser Ala Leu Tyr Leu Leu Phe Gly Lys Lys Asn Cys Gly Val Leu
20 25 30
Asn Glu Arg Arg Arg Glu Ser Leu Lys Asn Ile Ala Thr Thr Asn Gly
35 40 45
Glu Cys Lys Ser Ser Asn Ser Asp Gly Asp Ile Ile Ile Val Gly Ala
50 55 60
Gly Val Ala Gly Ser Ala Leu Ala Tyr Thr Leu Ala Lys Asp Gly Arg
65 70 75 80
Gln Val His Val Ile Glu Arg Asp Leu Ser Glu Pro Asp Arg Ile Val
85 90 95
Gly Glu Leu Leu Gln Pro Gly Gly Tyr Leu Lys Leu Thr Glu Leu Gly
100 105 110
Leu Glu Asp Cys Val Asp Asp Ile Asp Ala Gln Arg Val Tyr Gly Tyr
115 120 125
Ala Leu Phe Lys Asp Gly Lys Asp Thr Arg Leu Ser Tyr Pro Leu Glu
130 135 140
Lys Phe His Ser Asp Val Ser Gly Arg Ser Phe His Asn Gly Arg Phe
145 150 155 160
Ile Gln Arg Met Arg Glu Lys Ala Ala Ser Leu Pro Asn Val Arg Leu
165 170 175
Glu Gln Gly Thr Val Thr Ser Leu Leu Glu Glu Asn Gly Thr Ile Lys
180 185 190
Gly Val Gln Tyr Lys Asn Lys Ser Gly Gln Glu Met Thr Ala Tyr Ala
195 200 205
Pro Leu Thr Ile Val Cys Asp Gly Cys Phe Ser Asn Leu Arg Arg Ser
210 215 220
Leu Cys Asn Pro Lys Val Asp Val Pro Ser Cys Phe Val Gly Leu Ile
225 230 235 240
Leu Glu Asn Cys Asp Leu Pro Tyr Ala Asn His Gly His Val Ile Leu
245 250 255
Ala Asp Pro Ser Pro Ile Leu Phe Tyr Pro Ile Ser Ser Thr Glu Ile
260 265 270
Arg Cys Leu Val Asp Val Pro Gly Gln Lys Val Pro Ser Ile Ser Asn
275 280 285
Gly Glu Met Ala Asn Tyr Leu Lys Asn Val Val Ala Pro Gln Ile Pro
290 295 300
Pro Gln Leu Tyr Asn Ser Phe Ile Ala Ala Ile Asp Lys Gly Asn Ile
305 310 315 320
Arg Thr Met Pro Asn Arg Ser Met Pro Ala Asp Pro Tyr Pro Thr Pro
325 330 335
Gly Ala Leu Leu Met Gly Asp Ala Phe Asn Met Arg His Pro Leu Thr
340 345 350
Gly Gly Gly Met Thr Val Ala Leu Ser Asp Ile Val Val Leu Arg Asp
355 360 365
Leu Leu Lys Pro Leu Arg Asp Leu Asn Asp Ala Pro Thr Leu Cys Lys
370 375 380
Tyr Leu Glu Ala Phe Tyr Thr Leu Arg Lys Pro Val Ala Ser Thr Ile
385 390 395 400
Asn Thr Leu Ala Gly Ala Leu Tyr Lys Val Phe Cys Ala Ser Pro Asp
405 410 415
Gln Ala Arg Lys Glu Met Arg Gln Ala Cys Phe Asp Tyr Leu Ser Leu
420 425 430
Gly Gly Ile Phe Ser Asn Gly Pro Val Ser Leu Leu Ser Gly Leu Asn
435 440 445
Pro Arg Pro Leu Ser Leu Val Leu His Phe Phe Ala Val Ala Ile Tyr
450 455 460
Gly Val Gly Arg Leu Leu Ile Pro Phe Pro Ser Pro Lys Arg Val Trp
465 470 475 480
Ile Gly Ala Arg Leu Ile Ser Gly Ala Ser Ala Ile Ile Phe Pro Ile
485 490 495
Ile Lys Ala Glu Gly Val Arg Gln Met Phe Phe Pro Lys Thr Val Ala
500 505 510
Ala Tyr Tyr Arg Ala Pro Pro Val Val Arg Glu Arg
515 520
<210> 47
<211> 528
<212> PRT
<213> 黄瓜(Cucumis sativus)
<400> 47
Met Val Asp His Cys Thr Phe Gly Trp Ile Phe Ser Ala Phe Leu Ala
1 5 10 15
Phe Val Ile Ala Phe Ser Phe Phe Leu Ser Pro Arg Lys Asn Arg Arg
20 25 30
Gly Arg Gly Thr Asn Ser Thr Pro Arg Arg Asp Cys Leu Ser Ser Ser
35 40 45
Ala Thr Thr Asn Gly Glu Cys Arg Ser Val Asp Gly Asp Ala Asp Val
50 55 60
Ile Ile Val Gly Ala Gly Val Ala Gly Ser Ala Leu Ala His Thr Leu
65 70 75 80
Gly Lys Asp Gly Arg Arg Val His Val Ile Glu Arg Asp Leu Thr Glu
85 90 95
Pro Asp Arg Ile Val Gly Glu Leu Leu Gln Pro Gly Gly Tyr Leu Lys
100 105 110
Leu Ile Glu Leu Gly Leu Gln Asp Cys Val Glu Glu Ile Asp Ala Gln
115 120 125
Lys Val Tyr Gly Tyr Ala Leu Phe Lys Asp Gly Lys Ser Thr Arg Leu
130 135 140
Ser Tyr Pro Leu Glu Asn Phe Gln Ser Asp Val Ser Gly Arg Ser Phe
145 150 155 160
His Asn Gly Arg Phe Ile Gln Arg Met Arg Glu Lys Ala Ala Phe Leu
165 170 175
Pro Asn Val Arg Leu Glu Gln Gly Thr Val Thr Ser Leu Leu Glu Glu
180 185 190
Lys Gly Thr Ile Thr Gly Val Gln Tyr Lys Ser Lys Asn Gly Glu Gln
195 200 205
Lys Thr Ala Tyr Ala Pro Leu Thr Ile Val Cys Asp Gly Cys Phe Ser
210 215 220
Asn Leu Arg Arg Ser Leu Cys Asn Pro Met Val Asp Val Pro Ser Cys
225 230 235 240
Phe Val Gly Leu Val Leu Glu Asn Cys Gln Leu Pro Tyr Ala Asn Leu
245 250 255
Gly His Val Val Leu Gly Asp Pro Ser Pro Ile Leu Phe Tyr Pro Ile
260 265 270
Ser Ser Thr Glu Ile Arg Cys Leu Val Asp Val Pro Gly Gln Lys Val
275 280 285
Pro Ser Ile Ser Asn Gly Glu Met Glu Lys Tyr Leu Lys Thr Val Val
290 295 300
Ala Pro Gln Val Pro Pro Gln Ile His Asp Ala Phe Ile Ala Ala Ile
305 310 315 320
Glu Lys Gly Asn Ile Arg Thr Met Pro Asn Arg Ser Met Pro Ala Ala
325 330 335
Pro Gln Pro Thr Pro Gly Ala Leu Leu Met Gly Asp Ala Phe Asn Met
340 345 350
Arg His Pro Leu Thr Gly Gly Gly Met Thr Val Ala Leu Ser Asp Ile
355 360 365
Val Val Leu Arg Asn Leu Leu Lys Pro Leu Lys Asp Leu Asn Asp Ala
370 375 380
Pro Thr Leu Cys Lys Tyr Leu Glu Ser Phe Tyr Thr Leu Arg Lys Pro
385 390 395 400
Val Ala Ser Thr Ile Asn Thr Leu Ala Gly Ala Leu Tyr Lys Val Phe
405 410 415
Cys Ala Ser Ser Asp Gln Ala Arg Lys Glu Met Arg Gln Ala Cys Phe
420 425 430
Asp Tyr Leu Ser Leu Gly Gly Ile Phe Ser Asn Gly Pro Val Ser Leu
435 440 445
Leu Ser Gly Leu Asn Pro Arg Pro Leu Ser Leu Val Leu His Phe Phe
450 455 460
Ala Val Ala Ile Tyr Gly Val Gly Arg Leu Leu Leu Pro Phe Pro Ser
465 470 475 480
Pro Lys Gly Ile Trp Ile Gly Ala Arg Leu Val Tyr Ser Ala Ser Gly
485 490 495
Ile Ile Phe Pro Ile Ile Lys Ala Glu Gly Val Arg Gln Met Phe Phe
500 505 510
Pro Ala Thr Val Pro Ala Tyr Tyr Arg Thr Pro Pro Val Phe Asn Ser
515 520 525
<210> 48
<211> 318
<212> PRT
<213> 黄瓜(Cucumis sativus)
<400> 48
Met Glu Thr Ile Asn His Ile Thr Val Gln Thr Asn Gly Ile Asn Leu
1 5 10 15
His Val Ala Thr Ala Gly Pro Val Thr Gly Pro Pro Val Leu Leu Leu
20 25 30
His Gly Phe Pro Glu Leu Trp Tyr Ser Trp Arg His Gln Ile Ile Phe
35 40 45
Leu Ser Ser Val Gly Tyr Arg Val Ile Ala Pro Asp Leu Arg Gly Tyr
50 55 60
Gly Asp Ser Asp Ala Pro Pro Ser Ser Asp Thr Tyr Thr Ala Leu His
65 70 75 80
Ile Val Gly Asp Val Val Gly Leu Leu Asn Glu Leu Gly Ile Asp Lys
85 90 95
Val Leu Leu Val Gly His Asp Trp Gly Ala Leu Ile Ala Trp Tyr Phe
100 105 110
Cys Leu Phe Arg Pro Asp Arg Ile Lys Ala Ser Val Ile Leu Ser Val
115 120 125
Gln Phe Phe Pro Arg Asn Pro Lys Val Ser Phe Val Glu Gly Phe Lys
130 135 140
Ala Val Leu Gly Asp Gln Phe Tyr Met Val Arg Phe Gln Glu Pro Gly
145 150 155 160
Lys Ala Glu Lys Glu Phe Ala Ser Val Asp Ile Arg Glu Phe Phe Lys
165 170 175
Asn Val Met Ser Asn Arg Asp Pro Ser Ala Pro Tyr Leu Pro Gly Glu
180 185 190
Glu Lys Phe Glu Gly Val Pro Pro Pro Ser Leu Ala Pro Trp Leu Thr
195 200 205
Pro Gln Asp Ile Asp Tyr Tyr Ala Gln Lys Phe Ser His Ser Gly Phe
210 215 220
Thr Gly Gly Leu Asn Tyr Tyr Arg Ala Phe Asp Arg Thr Trp Glu Leu
225 230 235 240
Thr Ala Pro Trp Thr Ala Ala Glu Ile Lys Val Pro Val Lys Phe Ile
245 250 255
Val Gly Asp Leu Asp Leu Thr Tyr His Phe Pro Gly Gly Gln Asp Tyr
260 265 270
Ile Asn Gly Asp Ala Phe Arg Lys Asp Val Pro Gly Leu Glu Glu Val
275 280 285
Ile Val Met Lys Asp Thr Ser His Phe Ile Asn Gln Glu Arg Pro Asp
290 295 300
Glu Ile Asn Cys His Ile His Asp Phe Phe Asn Lys Phe Cys
305 310 315
<210> 49
<211> 316
<212> PRT
<213> 香瓜(Cucumis melo)
<400> 49
Met Asp Ala Ile Gln His Thr Thr Ile Lys Thr Asn Gly Ile Lys Met
1 5 10 15
His Ile Ala Ser Val Gly Asn Gly Pro Val Val Leu Leu Leu His Gly
20 25 30
Phe Pro Glu Leu Trp Tyr Ser Trp Arg His Gln Leu Leu Tyr Leu Ser
35 40 45
Ser Val Gly Tyr Arg Ala Ile Ala Pro Asp Leu Arg Gly Tyr Gly Asp
50 55 60
Thr Asp Ser Pro Glu Ser His Thr Ser Tyr Thr Ala Leu His Ile Val
65 70 75 80
Gly Asp Leu Val Gly Ala Leu Asp Glu Leu Gly Ile Glu Lys Val Phe
85 90 95
Leu Val Gly His Asp Trp Gly Ala Ile Ile Ala Trp Tyr Phe Cys Leu
100 105 110
Phe Arg Pro Glu Arg Ile Lys Ala Leu Val Asn Leu Ser Val Gln Phe
115 120 125
Phe Pro Arg Asn Pro Ala Ile Ser Phe Ile Gln Arg Phe Arg Ala Ala
130 135 140
Tyr Gly Asp Asp Phe Tyr Met Cys Arg Phe Gln Val Pro Gly Glu Ala
145 150 155 160
Glu Ala Asp Phe Ala Cys Ile Asp Thr Ala Gln Leu Phe Lys Thr Thr
165 170 175
Leu Ser Asn Arg Ser Thr Lys Ala Pro Cys Leu Pro Lys Glu Tyr Gly
180 185 190
Phe Arg Ala Ile Pro Pro Pro Glu Asn Leu Pro Ser Trp Leu Thr Glu
195 200 205
Glu Asp Ile Asn Tyr Tyr Ala Ala Lys Phe Lys Glu Thr Gly Phe Thr
210 215 220
Gly Ala Leu Asn Tyr Tyr Arg Ala Phe Asp Leu Thr Trp Glu Leu Thr
225 230 235 240
Ala Pro Trp Thr Gly Val Gln Ile Gln Val Pro Val Lys Phe Ile Val
245 250 255
Gly Asp Ser Asp Leu Thr Tyr His Phe Lys Gly Ala Lys Glu Tyr Ile
260 265 270
His Glu Gly Gly Phe Lys Arg Asp Val Pro Leu Leu Glu Glu Val Val
275 280 285
Ile Val Glu Asn Ala Gly His Phe Val His Glu Glu Lys Pro His Glu
290 295 300
Ile Asn Thr His Ile His Asp Phe Ile Lys Lys Phe
305 310 315
<210> 50
<211> 315
<212> PRT
<213> 香瓜(Cucumis melo)
<400> 50
Met Asp Lys Ile Gln His Ser Thr Ile Ser Thr Asn Gly Ile Asn Ile
1 5 10 15
His Phe Ala Ser Ile Gly Ser Gly Pro Val Val Leu Phe Leu His Gly
20 25 30
Phe Pro Glu Leu Trp Tyr Ser Trp Arg His Gln Leu Leu Phe Leu Ala
35 40 45
Ser Lys Gly Phe Arg Ala Ile Ala Pro Asp Leu Arg Gly Phe Gly Asp
50 55 60
Ser Asp Ala Pro Pro Ser Pro Ser Ser Tyr Thr Pro His His Ile Val
65 70 75 80
Gly Asp Leu Ile Gly Leu Leu Asp His Leu Gly Ile Asp Gln Val Phe
85 90 95
Leu Val Gly His Asp Trp Gly Ala Met Met Ala Trp Tyr Phe Cys Leu
100 105 110
Phe Arg Pro Asp Arg Val Lys Ala Leu Val Asn Leu Ser Val His Tyr
115 120 125
Thr Pro Arg Asn Pro Ala Gly Ser Pro Leu Ala Val Thr Arg Arg Tyr
130 135 140
Leu Gly Asp Asp Phe Tyr Ile Cys Lys Phe Gln Glu Pro Gly Val Ala
145 150 155 160
Glu Ala Asp Phe Gly Ser Val Asp Thr Ala Thr Met Met Lys Lys Phe
165 170 175
Leu Thr Met Arg Asp Pro Arg Pro Ala Ile Ile Pro Asn Gly Phe Lys
180 185 190
Thr Leu Leu Glu Thr Pro Glu Ile Leu Pro Ser Trp Leu Thr Glu Glu
195 200 205
Asp Ile Glu Tyr Phe Ala Ser Lys Phe Ser Lys Thr Gly Phe Thr Gly
210 215 220
Gly Phe Asn Tyr Tyr Arg Ala Leu Asp Ile Thr Trp Glu Leu Thr Gly
225 230 235 240
Pro Trp Ser Arg Ala Gln Ile Lys Val Pro Thr Lys Phe Ile Val Gly
245 250 255
Asp Leu Asp Leu Val Tyr Asn Phe Pro Gly Ala Lys Glu Tyr Ile His
260 265 270
Gly Gly Gly Phe Lys Lys Asp Val Pro Leu Leu Glu Asp Val Val Val
275 280 285
Ile Glu Gly Ala Ala His Phe Ile Asn Gln Glu Lys Pro Asp Glu Ile
290 295 300
Ser Ser Leu Ile Tyr Asp Phe Ile Thr Lys Phe
305 310 315
<210> 51
<211> 322
<212> PRT
<213> 黄瓜(Cucumis sativus)
<400> 51
Met Glu Lys Ile Glu His Thr Thr Ile Pro Thr Asn Gly Ile Asn Met
1 5 10 15
His Val Ala Ser Ile Gly Ser Gly Pro Ala Val Leu Phe Leu His Gly
20 25 30
Phe Pro Gln Leu Trp Tyr Ser Trp Arg His Gln Leu Leu Phe Leu Ala
35 40 45
Ser Lys Gly Phe Arg Ala Leu Ala Pro Asp Leu Arg Gly Phe Gly Asp
50 55 60
Thr Asp Ala Pro Pro Ser Pro Ser Ser Tyr Thr Phe His His Ile Ile
65 70 75 80
Gly Asp Leu Ile Gly Leu Leu Asp His Phe Gly Leu Asp Lys Val Phe
85 90 95
Leu Val Gly His Asp Trp Gly Ala Val Ile Ala Trp Tyr Phe Cys Leu
100 105 110
Phe Arg Pro Asp Arg Val Lys Ala Leu Val Asn Leu Ser Val His Tyr
115 120 125
Leu Lys Arg His Pro Ser Ile Asn Phe Val Asp Gly Phe Arg Ala Ser
130 135 140
Ala Gly Glu Asn Phe Tyr Ile Cys Gln Phe Gln Glu Ala Gly Val Ala
145 150 155 160
Glu Ala Asp Phe Gly Ser Val Asp Thr Ala Thr Met Met Lys Lys Phe
165 170 175
Met Gly Met Arg Asp Pro Val Ala Pro Pro Ile Tyr Asn Thr Lys Glu
180 185 190
Lys Gly Phe Ser Ser Leu Glu Thr Pro Asn Pro Leu Pro Cys Trp Leu
195 200 205
Thr Glu Glu Asp Val Asp Phe Phe Ala Ser Lys Phe Ser Lys Thr Gly
210 215 220
Phe Thr Gly Gly Phe Asn Tyr Tyr Arg Ala Leu Asn Leu Ser Trp Glu
225 230 235 240
Leu Thr Ala Ala Trp Asn Gly Ser Lys Ile Glu Val Pro Val Lys Phe
245 250 255
Ile Val Gly Asp Leu Asp Leu Val Tyr His Phe Pro Gly Ala Lys Glu
260 265 270
Tyr Ile Asn Gly Gly Glu Phe Lys Lys Asp Val Pro Phe Leu Glu Glu
275 280 285
Val Val Val Ile Lys Asp Ala Ala His Phe Ile Asn Gln Glu Lys Pro
290 295 300
His Gln Ile Asn Ser Leu Ile Tyr His Phe Ile Asn Lys Phe Val Ser
305 310 315 320
Ser Ile
<210> 52
<211> 473
<212> PRT
<213> 罗汉果
<400> 52
Met Trp Thr Val Val Leu Gly Leu Ala Thr Leu Phe Val Ala Tyr Tyr
1 5 10 15
Ile His Trp Ile Asn Lys Trp Arg Asp Ser Lys Phe Asn Gly Val Leu
20 25 30
Pro Pro Gly Thr Met Gly Leu Pro Leu Ile Gly Glu Thr Ile Gln Leu
35 40 45
Ser Arg Pro Ser Asp Ser Leu Asp Val His Pro Phe Ile Gln Lys Lys
50 55 60
Val Glu Arg Tyr Gly Pro Ile Phe Lys Thr Cys Leu Ala Gly Arg Pro
65 70 75 80
Val Val Val Ser Ala Asp Ala Glu Phe Asn Asn Tyr Ile Met Leu Gln
85 90 95
Glu Gly Arg Ala Val Glu Met Trp Tyr Leu Asp Thr Leu Ser Lys Phe
100 105 110
Phe Gly Leu Asp Thr Glu Trp Leu Lys Ala Leu Gly Leu Ile His Lys
115 120 125
Tyr Ile Arg Ser Ile Thr Leu Asn His Phe Gly Ala Glu Ala Leu Arg
130 135 140
Glu Arg Phe Leu Pro Phe Ile Glu Ala Ser Ser Met Glu Ala Leu His
145 150 155 160
Ser Trp Ser Thr Gln Pro Ser Val Glu Val Lys Asn Ala Ser Ala Leu
165 170 175
Met Val Phe Arg Thr Ser Val Asn Lys Met Phe Gly Glu Asp Ala Lys
180 185 190
Lys Leu Ser Gly Asn Ile Pro Gly Lys Phe Thr Lys Leu Leu Gly Gly
195 200 205
Phe Leu Ser Leu Pro Leu Asn Phe Pro Gly Thr Thr Tyr His Lys Cys
210 215 220
Leu Lys Asp Met Lys Glu Ile Gln Lys Lys Leu Arg Glu Val Val Asp
225 230 235 240
Asp Arg Leu Ala Asn Val Gly Pro Asp Val Glu Asp Phe Leu Gly Gln
245 250 255
Ala Leu Lys Asp Lys Glu Ser Glu Lys Phe Ile Ser Glu Glu Phe Ile
260 265 270
Ile Gln Leu Leu Phe Ser Ile Ser Phe Ala Ser Phe Glu Ser Ile Ser
275 280 285
Thr Thr Leu Thr Leu Ile Leu Lys Leu Leu Asp Glu His Pro Glu Val
290 295 300
Val Lys Glu Leu Glu Ala Glu His Glu Ala Ile Arg Lys Ala Arg Ala
305 310 315 320
Asp Pro Asp Gly Pro Ile Thr Trp Glu Glu Tyr Lys Ser Met Thr Phe
325 330 335
Thr Leu Gln Val Ile Asn Glu Thr Leu Arg Leu Gly Ser Val Thr Pro
340 345 350
Ala Leu Leu Arg Lys Thr Val Lys Asp Leu Gln Val Lys Gly Tyr Ile
355 360 365
Ile Pro Glu Gly Trp Thr Ile Met Leu Val Thr Ala Ser Arg His Arg
370 375 380
Asp Pro Lys Val Tyr Lys Asp Pro His Ile Phe Asn Pro Trp Arg Trp
385 390 395 400
Lys Asp Leu Asp Ser Ile Thr Ile Gln Lys Asn Phe Met Pro Phe Gly
405 410 415
Gly Gly Leu Arg His Cys Ala Gly Ala Glu Tyr Ser Lys Val Tyr Leu
420 425 430
Cys Thr Phe Leu His Ile Leu Cys Thr Lys Tyr Arg Trp Thr Lys Leu
435 440 445
Gly Gly Gly Thr Ile Ala Arg Ala His Ile Leu Ser Phe Glu Asp Gly
450 455 460
Leu His Val Lys Phe Thr Pro Lys Glu
465 470
<210> 53
<211> 480
<212> PRT
<213> 香瓜(Cucumis melo)
<400> 53
Met Ala Ser Thr His Ile Leu Leu Phe Pro Phe Met Ala Gln Gly His
1 5 10 15
Met Ile Pro Met Ile Asp Leu Ala Lys Leu Leu Ala His His Gly Phe
20 25 30
Ile Ile Thr Ile Val Thr Thr Pro His Asn Ala Asp Arg Tyr His Ser
35 40 45
Val Leu Ala Arg Ala Thr His Ser Gly Leu Gln Ile His Val Ala Leu
50 55 60
Leu Pro Phe Pro Ser Thr Gln Val Gly Leu Pro Glu Gly Cys Glu Asn
65 70 75 80
Leu Asp Leu Leu Pro Leu His Leu Ser Ser Ser Met Ser Ala Phe Cys
85 90 95
Arg Ala Thr Ser Leu Leu Tyr Glu Pro Ser Glu Lys Leu Leu Gln Gln
100 105 110
Leu Cys Pro Arg Pro Ser Cys Ile Ile Ser Asp Met Cys Leu Pro Trp
115 120 125
Thr Leu Arg Leu Ala Gln Asn His Gln Ile Pro Arg Leu Val Phe Tyr
130 135 140
Ser Leu Ser Cys Phe Phe Leu Leu Cys Met Arg Ser Leu Lys Thr Asn
145 150 155 160
His Ser Leu Val Thr Ser Ile Ser Asp Ser Glu Phe Leu Thr Leu Ser
165 170 175
Asp Leu Pro Asp Pro Val Glu Ile Arg Lys Ser Gln Leu Ser Arg Val
180 185 190
Lys Asn Glu Glu Met Gly Lys Leu Ser Tyr Glu Met Val Glu Ala Asp
195 200 205
Arg Leu Ser His Gly Val Ile Leu Asn Val Phe Glu Glu Met Glu Ala
210 215 220
Glu Tyr Val Ala Glu Tyr Arg Lys Asn Arg Asp Leu Pro Gln Lys Val
225 230 235 240
Trp Cys Val Gly Pro Leu Ser Leu Cys Asn Asp Asn Lys Leu Asp Lys
245 250 255
Ala Glu Arg Gly Glu Lys Ser Ser Ile His Glu Asp Glu Cys Ile Lys
260 265 270
Trp Leu Asn Gly Gln Gln Pro Ser Ser Val Val Tyr Val Ser Met Gly
275 280 285
Ser Leu Cys Asn Leu Ser Thr Pro Gln Leu Val Glu Leu Gly Leu Gly
290 295 300
Leu Glu Ala Ser Lys Lys Pro Phe Ile Trp Val Ile Arg Lys Gly Asn
305 310 315 320
Leu Thr Glu Glu Leu Gln Arg Trp Ile Met Glu Tyr Asp Phe Glu Arg
325 330 335
Lys Thr Glu Gly Trp Gly Leu Val Ile Arg Gly Trp Ala Pro Gln Val
340 345 350
Ala Ile Leu Ser His Ser Ala Ile Gly Gly Phe Leu Thr His Cys Gly
355 360 365
Trp Asn Ser Ser Ile Glu Gly Ile Ala Ala Gly Val Pro Met Met Thr
370 375 380
Trp Pro Leu Phe Ala Asp Gln Val Phe Asn Ala Lys Leu Ile Val Glu
385 390 395 400
Val Leu Lys Val Gly Val Ser Val Gly Glu Glu Thr Ala Leu His Trp
405 410 415
Gly Glu Glu Ala Glu Lys Glu Val Met Val Lys Arg Glu Glu Val Arg
420 425 430
Glu Ala Ile Glu Arg Val Met Asp Gly Glu Asn Arg Glu Glu Met Lys
435 440 445
Gln Arg Ser Lys Lys Leu Ala Glu Met Ala Lys Arg Ala Val Glu Glu
450 455 460
Gly Gly Ser Ser His Arg Asn Leu Lys Arg Leu Ile Glu Glu Ile Val
465 470 475 480
<210> 54
<211> 497
<212> PRT
<213> 香瓜(Cucumis melo)
<400> 54
Met Ala Ser Thr Leu Ser Asn Gln Leu Glu Leu Gln Pro His Phe Val
1 5 10 15
Leu Val Pro Leu Met Ala Gln Gly His Met Ile Pro Met Ile Asp Ile
20 25 30
Ala Thr Leu Leu Ala Arg Arg Gly Val Phe Val Thr Phe Val Thr Thr
35 40 45
Pro Tyr Asn Ala Thr Arg Leu Glu Ser Phe Phe Ala Arg Ala Lys Gln
50 55 60
Ser Ser Leu Ser Ile Ser Leu Leu Glu Ile Pro Phe Pro Cys Leu Gln
65 70 75 80
Val Gly Leu Pro Leu Gly Cys Glu Asn Leu Asp Thr Leu Pro Ser Arg
85 90 95
Ser Leu Leu Arg Asn Phe Tyr Lys Ala Leu Ser Leu Leu Gln Gln Pro
100 105 110
Leu Glu Gln Phe Leu Ser Arg His His Leu Asn Pro Thr Cys Ile Ile
115 120 125
Ser Asp Lys Tyr Leu Tyr Trp Thr Ala Gln Thr Ala His Lys Phe Lys
130 135 140
Cys Pro Arg Val Val Phe His Gly Thr Gly Cys Phe Ser Leu Leu Ser
145 150 155 160
Ser His Asn Leu Gln Leu Tyr Ser Pro His Thr Ser Ile Asp Ser Asn
165 170 175
Ser Gln Pro Phe Leu Val Pro Gly Leu Pro His Lys Ile Glu Ile Thr
180 185 190
Lys Ser Gln Leu Pro Gly Ser Leu Ile Lys Ser Pro Asp Phe Asp Asp
195 200 205
Phe Arg Asp Lys Ile Thr Lys Ala Glu Gln Glu Ala Tyr Gly Val Val
210 215 220
Val Asn Ser Phe Ser Glu Leu Glu Asn Gly Tyr Tyr Gln Asn Tyr Glu
225 230 235 240
Arg Ala Ile Ser Lys Lys Leu Trp Cys Ile Gly Pro Val Ser Leu Cys
245 250 255
Asn Glu Asn Ser Ile Glu Lys Tyr Asn Arg Gly Asn Lys Ala Ser Ile
260 265 270
Glu Gln Ser Asn Cys Leu Asn Trp Leu Asp Ser Met Ile Pro Lys Ser
275 280 285
Val Leu Tyr Ile Cys Leu Gly Ser Leu Cys Arg Met Leu Pro Ser Gln
290 295 300
Leu Ile Gln Leu Gly Gln Cys Leu Glu Ser Ser Thr Arg Pro Phe Ile
305 310 315 320
Trp Val Ile Lys Asn Arg Asp Glu Asn Cys Ser Glu Leu Glu Lys Trp
325 330 335
Leu Ser Glu Glu Glu Phe Glu Arg Lys Thr Lys Gly Arg Gly Leu Ile
340 345 350
Ile Arg Gly Trp Ala Pro Gln Leu Leu Ile Leu Ser His Trp Ser Thr
355 360 365
Gly Gly Phe Leu Thr His Cys Gly Trp Asn Ser Thr Val Glu Gly Ile
370 375 380
Gly Asn Gly Val Pro Met Ile Thr Trp Pro Gln Phe Ala Glu Gln Phe
385 390 395 400
Leu Asn Glu Lys Leu Val Val Glu Ile Leu Lys Ile Gly Val Arg Val
405 410 415
Gly Val Glu Gly Ala Val Arg Trp Gly Glu Glu Glu Arg Val Gly Val
420 425 430
Met Ala Lys Lys Glu Glu Ile Glu Lys Ala Ile Glu Met Val Met Asp
435 440 445
Gly Gly Glu Glu Gly Glu Glu Arg Arg Arg Arg Val Gly Asp Leu Ser
450 455 460
Lys Met Ala Pro Lys Ala Met Glu Asn Gly Gly Ser Ser Tyr Val Asn
465 470 475 480
Leu Ser Leu Phe Ile Glu Asp Val Met Ala Gln Ser Ala His Leu Lys
485 490 495
Ala
<210> 55
<211> 477
<212> PRT
<213> 黄瓜(Cucumis sativus)
<400> 55
Met Asp Pro Lys Asn Thr Gln Leu Arg Ile Phe Phe Phe Pro Phe Met
1 5 10 15
Ala Gln Gly His Thr Ile Pro Ala Ile Asp Met Ala Lys Leu Phe Ala
20 25 30
Ser Arg Gly Ala Asp Val Ala Ile Ile Thr Thr Pro Leu Asn Ala Pro
35 40 45
Leu Ile Ala Lys Ser Ile Asn Lys Phe Asp Arg Pro Gly Arg Lys Ile
50 55 60
Glu Leu Leu Ile Ile Asp Phe Pro Ser Val Ala Val Gly Leu Pro Asp
65 70 75 80
Gly Cys Glu Ser Leu Asp Leu Ala Arg Ser Pro Glu Met Phe Gln Ser
85 90 95
Phe Phe Arg Ala Thr Thr Leu Leu Glu Pro Gln Ile Asp Gln Ile Leu
100 105 110
Asp His His Arg Pro His Cys Leu Val Ala Asp Thr Phe Phe Pro Trp
115 120 125
Thr Thr Asp Leu Ala Ala Lys Tyr Gly Ile Pro Arg Val Val Phe His
130 135 140
Gly Thr Cys Phe Phe Ala Leu Cys Ala Ala Ala Ser Leu Ile Ala Asn
145 150 155 160
Arg Pro Tyr Lys Lys Val Ser Ser Asp Leu Glu Pro Phe Val Ile Pro
165 170 175
Gly Leu Pro Asp Glu Ile Lys Leu Thr Arg Ser Gln Val Pro Gly Phe
180 185 190
Leu Lys Glu Glu Val Glu Thr Asp Phe Ile Lys Leu Tyr Trp Ala Ser
195 200 205
Lys Glu Val Glu Ser Arg Cys Tyr Gly Phe Leu Ile Asn Ser Phe Tyr
210 215 220
Glu Leu Glu Pro Ala Tyr Ala Asp Tyr Tyr Arg Asn Val Leu Gly Arg
225 230 235 240
Arg Ala Trp His Ile Gly Pro Leu Ser Leu Tyr Ser Asn Val Glu Glu
245 250 255
Asp Asn Val Gln Arg Gly Ser Ser Ser Ser Ile Ser Glu Asp Gln Cys
260 265 270
Leu Lys Trp Leu Asp Ser Lys Asn Pro Asp Ser Val Leu Tyr Val Ser
275 280 285
Phe Gly Ser Leu Ala Ser Leu Thr Asn Ser Gln Leu Leu Glu Ile Ala
290 295 300
Lys Gly Leu Glu Gly Thr Gly Gln Asn Phe Ile Trp Val Val Lys Lys
305 310 315 320
Ala Lys Gly Asp Gln Glu Glu Trp Leu Pro Glu Gly Phe Glu Lys Arg
325 330 335
Val Glu Gly Lys Gly Leu Ile Ile Arg Gly Trp Ala Pro Gln Val Leu
340 345 350
Ile Leu Asp His Arg Ser Ile Gly Gly Phe Val Thr His Cys Gly Trp
355 360 365
Asn Ser Ala Leu Glu Gly Val Thr Ala Gly Val Pro Met Val Thr Trp
370 375 380
Pro Asn Ser Ala Glu Gln Phe Tyr Asn Glu Lys Leu Ile Thr Asp Val
385 390 395 400
Leu Gln Ile Gly Val Gly Val Gly Ala Leu Tyr Trp Gly Arg Ala Gly
405 410 415
Lys Asp Glu Ile Lys Ser Glu Ala Ile Glu Lys Ala Val Asn Arg Val
420 425 430
Met Val Gly Glu Glu Ala Glu Glu Met Arg Ser Arg Ala Lys Ala Leu
435 440 445
Gly Ile Gln Ala Arg Lys Ala Ile Val Glu Gly Gly Ser Ser Ser Ser
450 455 460
Asp Leu Asn Ala Phe Phe Lys Asp Leu Arg Ser Gln Ile
465 470 475
<210> 56
<211> 467
<212> PRT
<213> 香瓜(Cucumis melo)
<400> 56
Met Glu Met Thr Ala Ala Asn Gly Gly Gly Glu Arg Ile Lys Gln Ser
1 5 10 15
His Val Ile Val Phe Pro Phe Pro Arg His Gly His Met Ser Pro Met
20 25 30
Leu Gln Phe Ser Lys Arg Leu Ile Ser Lys Gly Leu Leu Leu Thr Phe
35 40 45
Leu Ile Thr Ser Ser Ala Ser Gln Ser Leu Thr Ile Asn Ile Pro Pro
50 55 60
Ser Pro Ser Phe His Phe Lys Ile Ile Ser Asp Leu Pro Glu Ser Asp
65 70 75 80
Asp Val Ala Thr Leu Asp Ala Tyr Leu Arg Ser Phe Arg Ala Ala Val
85 90 95
Thr Lys Ser Leu Ser Asn Phe Ile Asp Glu Val Leu Thr Ser Ser Ser
100 105 110
Asn Glu Glu Val Pro Pro Thr Leu Ile Val Tyr Asp Ser Val Met Pro
115 120 125
Trp Val Gln Ser Val Ala Ala Glu Arg Gly Leu Asp Ser Ala Pro Phe
130 135 140
Phe Thr Glu Ser Ala Ala Val Asn His Leu Leu His Leu Val Tyr Gly
145 150 155 160
Gly Ser Leu Ser Ile Pro Pro Pro Asp Asn Val Val Val Ser Leu Pro
165 170 175
Ser Glu Ile Val Leu Gln Pro Glu Asp Leu Pro Ser Phe Pro Asp Asp
180 185 190
Pro Glu Val Val Leu Asp Phe Met Thr Ser Gln Phe Ser His Leu Glu
195 200 205
Asn Val Lys Trp Ile Phe Ile Asn Thr Phe Asp Arg Leu Glu Ser Lys
210 215 220
Val Val Asn Trp Met Ala Lys Thr Leu Pro Ile Lys Thr Val Gly Pro
225 230 235 240
Thr Ile Pro Ser Ala Tyr Leu Asp Gly Arg Leu Glu Lys Asp Lys Ala
245 250 255
Tyr Gly Leu Asn Val Ser Lys Ser Asn Asn Gly Lys Cys Pro Ile Lys
260 265 270
Trp Leu Asp Ser Lys Glu Thr Ala Ser Val Ile Tyr Ile Ser Phe Gly
275 280 285
Ser Leu Val Ile Leu Ser Glu Glu Gln Val Lys Glu Leu Thr Asn Leu
290 295 300
Leu Arg Asp Thr Asp Phe Ser Phe Leu Trp Val Leu Arg Glu Ser Glu
305 310 315 320
Met Val Lys Leu Pro Lys Asn Phe Val Gln Asp Thr Ser Asp Arg Gly
325 330 335
Leu Ile Val Asn Trp Cys Cys Gln Leu Gln Val Leu Ser His Lys Ala
340 345 350
Val Ser Cys Phe Val Thr His Cys Gly Trp Asn Ser Thr Leu Glu Ala
355 360 365
Leu Ser Leu Gly Val Pro Met Val Ala Ile Pro Gln Trp Ile Asp Gln
370 375 380
Thr Thr Asn Ala Lys Phe Val Ala Asp Val Trp Arg Val Gly Val Arg
385 390 395 400
Val Lys Lys Asn Glu Lys Ser Val Ala Ile Lys Glu Glu Leu Glu Ala
405 410 415
Ser Ile Arg Lys Ile Val Val Gln Gly Asn Gly Thr Asn Glu Phe Lys
420 425 430
Gln Asn Ala Ile Lys Trp Lys Asn Leu Ala Lys Glu Ala Val Asp Glu
435 440 445
Arg Gly Ser Ser Asp Lys Asn Ile Glu Glu Phe Val Gln Ala Leu Val
450 455 460
Ala Ser Asn
465
<210> 57
<211> 464
<212> PRT
<213> 黄瓜(Cucumis sativus)
<400> 57
Met Arg Asn His His Phe Leu Ile Val Cys Phe Pro Ser Gln Gly Tyr
1 5 10 15
Ile Asn Pro Ser Leu Gln Leu Ala Asn Lys Leu Thr Ser Leu Asn Ile
20 25 30
Glu Val Thr Phe Ala Thr Thr Val Thr Ala Ser Arg Arg Met Lys Ile
35 40 45
Thr Gln Gln Ile Ser Ser Pro Ser Thr Leu Ser Phe Ala Thr Phe Ser
50 55 60
Asp Gly Phe Asp Asp Glu Asn His Lys Thr Ser Asp Phe Asn His Phe
65 70 75 80
Phe Ser Glu Leu Lys Arg Cys Gly Ser Gln Ser Leu Thr Asp Leu Ile
85 90 95
Thr Ser Phe Arg Asp Arg His Arg Arg Pro Phe Thr Phe Val Ile Tyr
100 105 110
Ser Leu Leu Leu Asn Trp Ala Ala Asp Val Ala Thr Ser Phe Asn Ile
115 120 125
Pro Ser Ala Leu Phe Ser Ala Gln Pro Ala Thr Val Leu Ala Leu Tyr
130 135 140
Tyr Tyr Tyr Phe His Gly Phe Glu Asp Glu Ile Thr Asn Lys Leu Gln
145 150 155 160
Asn Asp Gly Pro Ser Ser Leu Ser Ile Glu Leu Pro Gly Leu Pro Leu
165 170 175
Leu Phe Lys Ser His Glu Met Pro Ser Phe Phe Ser Pro Ser Gly Gln
180 185 190
His Ala Phe Ile Ile Pro Trp Met Arg Glu Gln Met Glu Phe Leu Gly
195 200 205
Gln Gln Lys Gln Pro Ile Lys Val Leu Val Asn Thr Phe His Ala Leu
210 215 220
Glu Asn Glu Ala Leu Arg Ala Ile His Glu Leu Glu Met Ile Ala Ile
225 230 235 240
Gly Pro Leu Ile Ser Gln Phe Arg Gly Asp Leu Phe Gln Val Ser Asn
245 250 255
Glu Asp Tyr Tyr Met Glu Trp Leu Asn Ser Lys Ser Asn Cys Ser Val
260 265 270
Val Tyr Leu Ser Phe Gly Ser Ile Cys Val Leu Ser Lys Glu Gln Glu
275 280 285
Glu Glu Ile Leu Tyr Gly Leu Phe Glu Ser Gly Tyr Pro Phe Leu Trp
290 295 300
Val Met Arg Ser Lys Ser Asp Glu Asp Glu Glu Lys Trp Lys Glu Leu
305 310 315 320
Val Glu Gly Lys Gly Lys Ile Val Ser Trp Cys Arg Gln Ile Glu Val
325 330 335
Leu Lys His Pro Ser Leu Gly Cys Phe Met Ser His Cys Gly Trp Asn
340 345 350
Ser Thr Leu Glu Ser Leu Ser Phe Gly Leu Pro Met Val Ala Phe Pro
355 360 365
Gln Gln Val Asp Gln Pro Thr Asn Ala Lys Leu Val Glu Asp Val Trp
370 375 380
Lys Met Gly Val Arg Val Lys Gly Asn Leu Glu Gly Ile Val Glu Arg
385 390 395 400
Glu Glu Ile Arg Arg Cys Leu Asp Leu Val Met Asn Arg Lys Tyr Ile
405 410 415
Asn Gly Glu Arg Glu Glu Thr Glu Lys Asn Val Glu Lys Trp Lys Lys
420 425 430
Leu Ala Trp Glu Ala Met Asp Glu Gly Gly Ser Ser Ile Leu Asn Leu
435 440 445
Ala Asn Phe Val Asp Glu Ile Asp Val Gly Asp Glu Leu Ala Asp Ser
450 455 460
<210> 58
<211> 471
<212> PRT
<213> 黄瓜(Cucumis sativus)
<400> 58
Met Gly Leu Ser Pro Thr Asp His Val Leu Leu Phe Pro Phe Pro Ala
1 5 10 15
Lys Gly His Ile Lys Pro Phe Phe Cys Leu Ala His Leu Leu Cys Asn
20 25 30
Ala Gly Leu Arg Val Thr Phe Leu Ser Thr Glu His His His Gln Lys
35 40 45
Leu His Asn Leu Thr His Leu Ala Ala Gln Ile Pro Ser Leu His Phe
50 55 60
Gln Ser Ile Ser Asp Gly Leu Ser Leu Asp His Pro Arg Asn Leu Leu
65 70 75 80
Asp Gly Gln Leu Phe Lys Ser Met Pro Gln Val Thr Lys Pro Leu Phe
85 90 95
Arg Gln Leu Leu Leu Ser Tyr Lys Asp Gly Thr Ser Pro Ile Thr Cys
100 105 110
Val Ile Thr Asp Leu Ile Leu Arg Phe Pro Met Asp Val Ala Gln Glu
115 120 125
Leu Asp Ile Pro Val Phe Cys Phe Ser Thr Phe Ser Ala Arg Phe Leu
130 135 140
Phe Leu Tyr Phe Ser Ile Pro Lys Leu Leu Glu Asp Gly Gln Ile Pro
145 150 155 160
Tyr Pro Glu Gly Asn Ser Asn Gln Val Leu His Gly Ile Pro Gly Ala
165 170 175
Glu Gly Leu Leu Arg Cys Lys Asp Leu Pro Gly Tyr Trp Ser Val Glu
180 185 190
Ala Val Ala Asn Tyr Asn Pro Met Asn Phe Val Asn Gln Thr Ile Ala
195 200 205
Thr Ser Lys Ser His Gly Leu Ile Leu Asn Thr Phe Asp Glu Leu Glu
210 215 220
Val Pro Phe Ile Thr Asn Leu Ser Lys Ile Tyr Lys Lys Val Tyr Thr
225 230 235 240
Ile Gly Pro Ile His Ser Leu Leu Lys Lys Ser Val Gln Thr Gln Tyr
245 250 255
Glu Phe Trp Lys Glu Asp His Ser Cys Leu Ala Trp Leu Asp Ser Gln
260 265 270
Pro Pro Arg Ser Val Met Phe Val Ser Phe Gly Ser Ile Val Lys Leu
275 280 285
Lys Ser Ser Gln Leu Lys Glu Phe Trp Asn Gly Leu Val Asp Ser Gly
290 295 300
Lys Ala Phe Leu Leu Val Leu Arg Ser Asp Ala Leu Val Glu Glu Thr
305 310 315 320
Gly Glu Glu Asp Glu Lys Gln Lys Glu Leu Val Ile Lys Glu Ile Met
325 330 335
Glu Thr Lys Glu Glu Gly Arg Trp Val Ile Val Asn Trp Ala Pro Gln
340 345 350
Glu Lys Val Leu Glu His Lys Ala Ile Gly Gly Phe Leu Thr His Ser
355 360 365
Gly Trp Asn Ser Thr Leu Glu Ser Val Ala Val Gly Val Pro Met Val
370 375 380
Ser Trp Pro Gln Ile Gly Asp Gln Pro Ser Asn Ala Thr Trp Leu Ser
385 390 395 400
Lys Val Trp Lys Ile Gly Val Glu Met Glu Asp Ser Tyr Asp Arg Ser
405 410 415
Thr Val Glu Ser Lys Val Arg Ser Ile Met Glu His Glu Asp Lys Lys
420 425 430
Met Glu Asn Ala Ile Val Glu Leu Ala Lys Arg Val Asp Asp Arg Val
435 440 445
Ser Lys Glu Gly Thr Ser Tyr Gln Asn Leu Gln Arg Leu Ile Glu Asp
450 455 460
Ile Glu Gly Phe Lys Leu Asn
465 470
<210> 59
<211> 452
<212> PRT
<213> 黄瓜(Cucumis sativus)
<400> 59
Met Asp Val Gln Lys Ser Arg Asp Thr Pro Thr Thr Ile Leu Met Leu
1 5 10 15
Pro Trp Ile Gly Tyr Gly His Leu Ser Ala Tyr Leu Glu Leu Ala Lys
20 25 30
Val Leu Ser Arg Arg Asn Asn Phe Leu Ile Tyr Phe Cys Ser Thr Pro
35 40 45
Val Asn Leu Asp Ser Ile Lys Pro Arg Leu Ile Pro Ser Ser Ser Ile
50 55 60
Gln Phe Val Glu Leu His Leu Pro Ser Ser Pro Glu Phe Pro Pro His
65 70 75 80
Leu His Thr Thr Asn Ala Leu Pro Pro Arg Leu Thr Pro Thr Leu His
85 90 95
Lys Ala Phe Ala Ala Ala Ala Ser Pro Phe Glu Ala Ile Leu Gln Thr
100 105 110
Leu Cys Pro His Leu Leu Ile Tyr Asp Ser Leu Gln Gln Trp Ala Pro
115 120 125
Gln Ile Ala Ser Ser Leu Asn Ile Pro Ala Ile Asn Phe Asn Thr Thr
130 135 140
Ala Ala Ser Ile Ile Ser His Ala Leu His Asn Ile Asn Tyr Pro Asp
145 150 155 160
Thr Lys Phe Pro Leu Ser Asp Trp Val Leu His Asn Tyr Trp Lys Gly
165 170 175
Lys Tyr Thr Thr Ala Asn Glu Ala Thr Leu Glu Arg Ile Arg Arg Val
180 185 190
Arg Glu Ser Phe Leu Tyr Cys Leu Ser Ala Ser Arg Asp Ile Thr Leu
195 200 205
Ile Ser Ser Cys Arg Glu Ile Glu Gly Glu Tyr Met Asp Tyr Leu Ser
210 215 220
Val Leu Leu Lys Lys Lys Val Ile Ala Val Gly Pro Leu Val Tyr Glu
225 230 235 240
Pro Arg Glu Asp Asp Glu Asp Glu Asp Tyr Ser Arg Ile Lys Asn Trp
245 250 255
Leu Asp Lys Lys Glu Ala Leu Ser Thr Val Leu Val Ser Phe Gly Ser
260 265 270
Glu Phe Phe Pro Ser Lys Glu Glu Met Glu Glu Ile Gly Cys Gly Leu
275 280 285
Glu Glu Ser Gly Ala Asn Phe Ile Trp Val Ile Arg Ser Pro Lys Gly
290 295 300
Glu Glu Asn Lys Arg Val Glu Glu Ala Leu Pro Glu Gly Phe Val Glu
305 310 315 320
Lys Ala Gly Glu Arg Ala Met Ile Val Lys Glu Trp Ala Pro Gln Gly
325 330 335
Lys Ile Leu Lys His Arg Ser Ile Gly Gly Phe Val Ser His Cys Gly
340 345 350
Trp Asn Ser Val Met Glu Ser Ile Met Leu Gly Val Pro Val Ile Ala
355 360 365
Val Pro Met His Val Asp Gln Pro Tyr Asn Ala Gly Leu Val Glu Glu
370 375 380
Ala Gly Leu Gly Val Glu Ala Lys Arg Asp Pro Asp Gly Met Ile Gln
385 390 395 400
Arg Glu Glu Val Ala Lys Leu Ile Arg Glu Val Val Val Asp Lys Ser
405 410 415
Arg Glu Asp Leu Arg Thr Lys Val Ile Glu Met Gly Glu Ile Leu Arg
420 425 430
Ser Lys Gly Asp Glu Lys Ile Asp Glu Met Val Ala Gln Ile Ser Leu
435 440 445
Leu Leu Lys Ile
450

Claims (77)

1.包含氨基酸序列的分离的尿苷二磷酸-葡糖基转移酶(UGT)多肽,其中所述多肽催化罗汉果醇在C24的主链葡糖基化和罗汉果苷在C3的主链葡糖基化。
2.权利要求1的分离的UGT多肽,其中所述多肽催化:
(a) 罗汉果醇在C24的主链葡糖基化;
(b) 罗汉果苷在C3的主链葡糖基化;和
(c) 罗汉果苷在C3的分枝葡糖基化。
3.权利要求1或2的分离的UGT,其中所述氨基酸序列与SEQ ID NO:34具有至少34%同一性。
4.权利要求1或2的分离的UGT多肽,其中所述氨基酸序列如SEQ ID NO:34所示。
5.包含氨基酸序列的分离的尿苷二磷酸-葡糖基转移酶(UGT)多肽,其中所述多肽催化罗汉果苷在C3的(1-2)和(1-6)位置的分枝葡糖基化和罗汉果苷在C24的(1-2)和(1-6)位置的分枝葡糖基化。
6.包含氨基酸序列的分离的尿苷二磷酸-葡糖基转移酶(UGT)多肽,其中所述多肽催化罗汉果苷M5至罗汉果苷M6的分枝葡糖基化。
7.权利要求5或6的分离的UGT多肽,其中所述多肽催化:
(a) 罗汉果苷在C3的(1-2)和(1-6)位置的分枝葡糖基化;
(b) 罗汉果苷在C24的(1-2)和(1-6)位置的分枝葡糖基化,和
(c) 罗汉果苷M5至罗汉果苷M6的分枝葡糖基化。
8.权利要求5-7中任一项的分离的UGT,其中所述氨基酸序列与SEQ ID NO:38具有至少89%同一性。
9.权利要求5-7中任一项的分离的UGT多肽,其中所述氨基酸序列如SEQ ID NO:38所示。
10.包含氨基酸序列的分离的尿苷二磷酸-葡糖基转移酶(UGT)多肽,其中所述多肽催化罗汉果苷IV (M4)至罗汉果苷V (M5)的分枝葡糖基化。
11.权利要求10的分离的UGT,其中所述氨基酸序列选自:与SEQ ID NO:34具有至少34%同一性的序列、与SEQ ID NO:6具有至少84%同一性的序列和与SEQ ID NO:38具有至少89%同一性的序列。
12.权利要求10的分离的UGT多肽,其中所述氨基酸序列如SEQ ID NO:6所示。
13.权利要求10的分离的UGT多肽,其中所述氨基酸序列如SEQ ID NO:38所示。
14.权利要求10的分离的UGT多肽,其中所述氨基酸序列如SEQ ID NO:34所示。
15.权利要求1-14中任一项的分离的UGT多肽,其中所述UGT是植物UGT。
16.权利要求15的分离的UGT多肽,其中所述植物是葫芦科的植物。
17.权利要求15的分离的UGT多肽,其中所述植物是罗汉果。
18.分离的角鲨烯环氧酶(SQE)多肽,其包含与SEQ ID NO:14具有至少94%同一性或与SEQ ID NO:16具有至少89%同一性的氨基酸序列,其中所述多肽催化由角鲨烯或氧化角鲨烯合成二环氧角鲨烯。
19.权利要求18的分离的SQE多肽,其中所述氨基酸序列如SEQ ID NO:14或SEQ ID NO:16所示。
20.权利要求18或19的分离的SQE多肽,其中所述SQE是植物SQE。
21.分离的环氧化物水解酶(EH)多肽,包含与SEQ ID NO:18、SEQ ID NO:22或SEQ IDNO:24具有至少75%同一性的氨基酸序列,其中所述多肽催化从3-羟基,24-25环氧葫芦二烯醇合成3,24,25三羟基葫芦二烯醇。
22.权利要求21的分离的EH多肽,其中所述氨基酸序列如SEQ ID NO:18、SEQ ID NO:22和SEQ ID NO:24中任一者所示。
23.权利要求21或22的分离的EH多肽,其中所述EH是植物EH。
24.从罗汉果醇前体底物合成罗汉果醇或罗汉果醇前体产物的方法,所述方法包括使至少一种罗汉果醇前体底物与罗汉果苷途径酶接触,其中:
(a) 当所述罗汉果醇前体产物包含双环氧角鲨烯且所述罗汉果醇前体底物包含角鲨烯或氧化角鲨烯时,所述罗汉果苷途径酶包含如权利要求18-20中任一项中所述的角鲨烯环氧酶多肽,由此产生二环氧角鲨烯,
(b) 当所述罗汉果醇前体产物包含3羟基,24-25环氧葫芦二烯醇且所述罗汉果醇前体底物包含双环氧角鲨烯时,所述罗汉果醇途径酶包含如SEQ ID NO:12中所示或与之具有60%同源性或同一性的葫芦二烯醇合成酶多肽,由此产生3羟基,24-25环氧葫芦二烯醇,
(c) 当所述产物包含3,24,25三羟基葫芦二烯醇且所述底物包含3-羟基,24-25环氧葫芦二烯醇时,所述罗汉果醇途径酶包含如权利要求21-23中任一项中所述的环氧水合酶多肽,由此产生3, 24, 25三羟基葫芦二烯醇,
(d) 当所述产物包含罗汉果醇且所述罗汉果醇前体底物包含3,24,25三羟基葫芦二烯醇时,所述罗汉果醇途径酶是如SEQ ID NO:10中所示或与之具有60%同源性或同一性的细胞色素P 450酶,由此产生3, 11, 24, 25四羟基葫芦二烯醇(罗汉果醇)。
25.权利要求24的方法,其中所述细胞色素P 450酶包含如SEQ ID NO:10所示的氨基酸序列。
26.权利要求24的方法,其中产生所述罗汉果醇产物包括以下中的至少一种:
(i) 使所述角鲨烯或氧化角鲨烯与所述角鲨烯环氧酶多肽接触,由此产生二环氧角鲨烯;
(ii) 使所述二环氧角鲨烯与葫芦二烯醇合酶接触,由此产生3羟基,24-25环氧葫芦二烯醇;
(iii) 使所述3羟基,24-25环氧葫芦二烯醇与环氧水合酶接触,由此产生3,24,25三羟基葫芦二烯醇;和
(iv) 使所述3,24-25三羟基葫芦二烯醇与所述细胞色素P 450酶接触,由此产生罗汉果醇产物(3,11,24,25四羟基葫芦二烯醇)。
27.权利要求26的方法,其中产生所述罗汉果醇产物包括至少(i)和(iv)。
28.权利要求26的方法,其中产生所述罗汉果醇产物包括至少(ii)和(iv)。
29.权利要求26的方法,其中产生所述罗汉果醇产物包括至少(iii)和(iv)。
30.权利要求26的方法,其中产生所述罗汉果醇产物包括至少(i)、(ii)和(iii)。
31.权利要求26的方法,其中产生所述罗汉果醇产物包括至少(i)、(ii)和(iv)。
32.权利要求26的方法,其中产生所述罗汉果醇产物包括至少(i)、(iii)和(iv)。
33.权利要求26的方法,其中产生所述罗汉果醇产物包括至少(ii)、(iii)和(iv)。
34.权利要求26的方法,其中产生所述罗汉果醇产物包括(i)、(ii)、(iii)和(iv)的全部。
35.合成罗汉果苷的方法,所述方法包括使至少一种如权利要求1-17中任一项所述的UGT多肽或其组合与至少一种UGT底物罗汉果苷前体接触。
36.权利要求35的方法,其中所述至少一种UGT多肽包含如权利要求1-4中任一项所述的UGT多肽。
37.权利要求36的方法,其中所述至少一种UGT多肽包含权利要求4的UGT多肽。
38.权利要求35的方法,其中所述至少一种UGT多肽包含如权利要求5-9中任一项所述的UGT多肽。
39.权利要求38的方法,其中所述至少一种UGT多肽包含权利要求9的UGT多肽。
40.权利要求35的方法,其中所述至少一种UGT多肽包含如权利要求10-14中任一项所述的UGT多肽。
41.权利要求40的方法,其中所述至少一种UGT多肽包含权利要求11的UGT多肽。
42.权利要求35的方法,其中所述至少一种UGT多肽包含权利要求4的UGT多肽和权利要求9的UGT多肽。
43.权利要求35的方法,其中所述UGT底物罗汉果苷前体底物是罗汉果醇,所述方法包括:
(a) 根据权利要求26-34中任一项所述的方法产生罗汉果醇,和
(b) 根据权利要求35-42中任一项的方法从所述罗汉果醇合成所述罗汉果苷。
44.权利要求35-43中任一项的方法,其中所述罗汉果苷选自罗汉果苷I-A1、罗汉果苷I-E1、罗汉果苷IIE、罗汉果苷III、赛门苷、罗汉果苷V和罗汉果苷VI。
45.权利要求35-44中任一项的方法,其进一步包括分离所述罗汉果苷。
46.权利要求35-44中任一项的方法,其在外源表达至少一种权利要求1-23中任一项的多肽或其任何组合的重组细胞中进行。
47.权利要求46的方法,其中所述至少一种多肽选自权利要求4的多肽、权利要求9的多肽、权利要求12的多肽、权利要求19的多肽和权利要求22的多肽。
48.组合物,其包含根据权利要求35-47中任一项的方法生成的罗汉果苷。
49.分离的多核苷酸,其包含编码权利要求1-23中任一项的分离的多肽的核酸序列。
50.权利要求49的分离的多核苷酸,其中所述核酸序列选自SEQ ID NO.5、9、11、13、15、17、21、23、33和37。
51.核酸构建体,其包含权利要求49或50的分离的多核苷酸和用于指导所述分离的多核苷酸的表达的顺式作用调节元件。
52.权利要求51的核酸构建体,其中所述顺式作用调节元件包含启动子。
53.宿主细胞,其异源表达权利要求49或50的分离的多核苷酸。
54.权利要求53的宿主细胞,其为微生物宿主细胞。
55.权利要求54的宿主细胞,其中所述微生物选自酵母和细菌。
56.权利要求53的宿主细胞,其为植物宿主细胞。
57.权利要求56的宿主细胞,其形成植物的一部分。
58.权利要求57的宿主细胞,其中所述植物是转基因植物。
59.权利要求56-58中任一项的宿主细胞,其中所述植物是葫芦科的植物。
60.权利要求56-59中任一项的宿主细胞,其形成所述植物的果实或根部的一部分。
61.权利要求53-60中任一项的宿主细胞,其在宿主细胞中产生罗汉果苷或罗汉果苷前体。
62.权利要求53-61中任一项的宿主细胞的细胞裂解物。
63.富集罗汉果苷VI到至少10 % (wt/wt)的罗汉果苷VI的总浓度的组合物。
64.包含罗汉果苷VI (M6)和罗汉果苷II (M2)的组合物。
65.包含罗汉果苷V (M5)、VI (M6)和罗汉果苷II (M2)的组合物。
66.权利要求63-65中任一项的组合物,其中所述罗汉果苷VI或罗汉果苷V的浓度足以引起风味增强。
67.权利要求66的组合物,其中所述罗汉果苷VI的浓度为至少0.2ppm。
68.权利要求66或67的组合物,其为甜味剂。
69.权利要求68的组合物,其还包含选自以下的风味成分:蔗糖、果糖、葡萄糖、高果糖玉米糖浆、木糖、阿拉伯糖、鼠李糖、赤藓醇、木糖醇、甘露糖醇、山梨糖醇、肌醇、AceK、阿斯巴甜、纽甜、三氯蔗糖、糖精、柚皮苷二氢查耳酮(NarDHC)、新橙皮苷二氢查耳酮(NDHC)、甜茶苷、莱鲍迪苷A、甜菊苷、甜叶菊、三叶苷。
70.权利要求63-69中任一项的组合物,其为消耗性组合物。
71.权利要求63-70中任一项的组合物,其还包含一种或多种额外的风味成分。
72.权利要求70-71中任一项的组合物,其为饮料。
73.权利要求72的组合物,其中所述饮料选自水性饮料、增强/稍甜化的水饮料、矿泉水、碳酸饮料、非碳酸饮料、碳酸水、静水、软饮料、非酒精饮料、酒精饮料、啤酒、葡萄酒、酒、水果饮料、汁液、果汁、蔬菜汁、肉汤饮料、咖啡、茶、红茶、绿茶、乌龙茶、草药茶、可可、茶基饮料、咖啡基饮料、可可基饮料、糖浆、乳制品、冷冻水果、冷冻果汁、水基冰、水果冰、果汁冰糕、酱料、沙拉酱、酱汁、汤和饮料植物材料,或用于复原的速溶粉末。
74.权利要求73的组合物,其为Coca-Cola®等。
75.权利要求70-73中任一项的组合物,其为固体消耗品。
76.权利要求75的组合物,其中所述固体消耗品选自谷物、烘焙食品、饼干、面包、早餐谷物、谷物棒、乳制品、能量棒/营养棒、格兰诺拉麦片、蛋糕、曲奇、薄脆饼干、甜甜圈、松饼、糕点、糖果、口香糖、巧克力、软糖、硬糖、棉花糖、压片、休闲食品、植物材料(完整的或研磨的),和用于复原的速溶粉末。
77.权利要求70-76中任一项的组合物,其为食物。
CN201580061244.3A 2014-09-11 2015-09-10 生产罗汉果苷的方法和包含其的组合物及其用途 Pending CN107109377A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201462048924P 2014-09-11 2014-09-11
US62/048924 2014-09-11
US201462089929P 2014-12-10 2014-12-10
US62/089929 2014-12-10
PCT/IL2015/050933 WO2016038617A1 (en) 2014-09-11 2015-09-10 Methods of producing mogrosides and compositions comprising same and uses thereof

Publications (1)

Publication Number Publication Date
CN107109377A true CN107109377A (zh) 2017-08-29

Family

ID=55458429

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580061244.3A Pending CN107109377A (zh) 2014-09-11 2015-09-10 生产罗汉果苷的方法和包含其的组合物及其用途

Country Status (6)

Country Link
US (2) US20170283844A1 (zh)
EP (1) EP3191584A4 (zh)
CN (1) CN107109377A (zh)
CA (1) CA2972739A1 (zh)
IL (2) IL287789B2 (zh)
WO (1) WO2016038617A1 (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109402163A (zh) * 2018-09-26 2019-03-01 怀化兴科创生物技术有限公司 新的罗汉果角鲨烯环氧酶基因(Sgsqe)的应用
CN109439676A (zh) * 2018-09-26 2019-03-08 怀化兴科创生物技术有限公司 罗汉果环氧化物水解酶Sgeph5基因的应用
CN109679987A (zh) * 2018-09-27 2019-04-26 怀化兴科创生物技术有限公司 一个提高甜甙含量相关基因的应用
CN109913427A (zh) * 2017-12-29 2019-06-21 南京中医药大学 泽泻鲨烯环氧化酶及其应用
CN110669809A (zh) * 2019-11-12 2020-01-10 广西师范大学 一种酶法制备罗汉果苷iv和苷v的方法
CN110790806A (zh) * 2018-08-01 2020-02-14 中国药科大学 新型罗汉果苷衍生物及其用途
CN111518817A (zh) * 2020-05-14 2020-08-11 云南农业大学 雪胆三萜合成酶HcOSC6基因及其工程菌和在制备葫芦二烯醇中的应用
CN112041457A (zh) * 2018-02-27 2020-12-04 马努斯生物合成股份有限公司 包括罗汉果苷在内的三萜类化合物的微生物产生
CN112063678A (zh) * 2020-09-21 2020-12-11 中国药科大学 一种Siamenoside I的生物合成方法
CN112063647A (zh) * 2020-09-17 2020-12-11 云南农业大学 酿酒酵母重组菌Cuol01的构建方法、酿酒酵母重组菌Cuol02及应用
CN112334012A (zh) * 2018-04-23 2021-02-05 可口可乐公司 新型罗汉果苷、获得新型罗汉果苷的方法及用途
CN114836465A (zh) * 2022-04-15 2022-08-02 中国医学科学院药用植物研究所 利用转基因植物生产甜苷类化合物的方法
CN115335514A (zh) * 2019-10-25 2022-11-11 银杏生物制品公司 罗汉果甙的生物合成
CN115605081A (zh) * 2020-03-17 2023-01-13 可口可乐公司(Us) 新的罗汉果苷生产系统和方法
CN115697044A (zh) * 2020-03-31 2023-02-03 艾洛生物系统有限公司 西瓜和其他葫芦科中内源罗汉果苷途径基因的调控

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018089469A1 (en) * 2016-11-08 2018-05-17 Purecircle Usa Inc. Novel mogrosides and use thereof
US9101162B2 (en) 2010-09-03 2015-08-11 Purecircle Sdn Bhd High-purity mogrosides and process for their purification
IL287789B2 (en) 2014-09-11 2024-05-01 The State Of Israel Ministry Of Agriculture & Rural Development Agricultural Res Organization Aro Vo Mogroside compounds, methods for their preparation, preparations including them and their uses
CA2968331C (en) 2014-10-17 2024-02-06 Suntory Holdings Limited Mogrol glycosyltransferase and gene encoding same
MY190296A (en) 2015-10-29 2022-04-12 Firmenich Incorporated High intensity sweeteners
BR112019023104A2 (pt) 2017-05-03 2020-11-03 Firmenich Incorporated métodos para fazer adoçante de alta intensidade
MX2019014119A (es) 2017-06-02 2020-02-07 Givaudan Sa Composiciones.
WO2021214008A1 (en) 2020-04-20 2021-10-28 Givaudan Sa Compositions
EP3917323A1 (en) 2019-02-01 2021-12-08 Givaudan SA Flavour modifying ingredient derived from dietary fibre
CN110343681B (zh) * 2019-08-01 2020-12-25 安徽农业大学 合成呋喃酮及其衍生物葡萄糖苷的糖基转移酶突变体蛋白
BR112022003787A2 (pt) 2019-09-19 2022-05-24 Givaudan Sa Ingrediente modificador de sabor derivado de proteína de arroz
IL293855A (en) * 2019-12-16 2022-08-01 Manus Bio Inc Production of mogrol and mogrosides using bacteria
GB202007984D0 (en) 2020-05-28 2020-07-15 Givaudan Sa Compositions
CN112056593B (zh) * 2020-08-27 2021-08-17 湖南华诚生物资源股份有限公司 一种提高罗汉果甜苷物质含量的方法
CN112980809B (zh) * 2021-03-17 2023-04-11 云南中烟工业有限责任公司 一种烟草法尼基焦磷酸合酶基因及其应用
EP4362702A1 (en) 2021-07-01 2024-05-08 Givaudan SA Ready-to-eat and ready-to-drink products
WO2023275356A1 (en) 2021-07-01 2023-01-05 Givaudan Sa Plant-based flavour modifying ingredient
CN113929726B (zh) * 2021-11-24 2022-08-19 广西壮族自治区中国科学院广西植物研究所 一种罗汉果醇衍生化合物及其制备方法和应用

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013076577A1 (en) * 2011-11-23 2013-05-30 Evolva Sa Methods and materials for enzymatic synthesis of mogroside compounds
WO2014086842A1 (en) * 2012-12-04 2014-06-12 Evolva Sa Methods and materials for biosynthesis of mogroside compounds

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2008282805B2 (en) * 2007-08-01 2014-05-01 Chugai Pharmaceutical Co., Ltd. Screening methods using G-protein coupled receptors and related compositions
US20110027413A1 (en) 2007-08-17 2011-02-03 Zhonghua Jia Novel Sweetener ISO-Mogroside V
GB0718446D0 (en) * 2007-09-21 2007-10-31 Prendergast Patrick T Compositions and methods for the treatment of infection
US20130136838A1 (en) * 2011-09-09 2013-05-30 Rafael I. San Miguel Sweetener blend compositions
IL287789B2 (en) 2014-09-11 2024-05-01 The State Of Israel Ministry Of Agriculture & Rural Development Agricultural Res Organization Aro Vo Mogroside compounds, methods for their preparation, preparations including them and their uses
CN107466320B (zh) 2014-10-01 2021-11-05 埃沃尔瓦公司 用于生物合成罗汉果苷化合物的方法和材料
BR112019023104A2 (pt) 2017-05-03 2020-11-03 Firmenich Incorporated métodos para fazer adoçante de alta intensidade

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013076577A1 (en) * 2011-11-23 2013-05-30 Evolva Sa Methods and materials for enzymatic synthesis of mogroside compounds
WO2014086842A1 (en) * 2012-12-04 2014-06-12 Evolva Sa Methods and materials for biosynthesis of mogroside compounds

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
LI CHUN ET AL: "Chemistry and pharmacology of Siraitia grosvenorii: A review", 《CHINESE JOURNAL OF NATURAL MEDICINES》 *

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109913427B (zh) * 2017-12-29 2022-07-01 南京中医药大学 泽泻鲨烯环氧化酶及其应用
CN109913427A (zh) * 2017-12-29 2019-06-21 南京中医药大学 泽泻鲨烯环氧化酶及其应用
CN112041457A (zh) * 2018-02-27 2020-12-04 马努斯生物合成股份有限公司 包括罗汉果苷在内的三萜类化合物的微生物产生
CN112334012A (zh) * 2018-04-23 2021-02-05 可口可乐公司 新型罗汉果苷、获得新型罗汉果苷的方法及用途
CN110790806A (zh) * 2018-08-01 2020-02-14 中国药科大学 新型罗汉果苷衍生物及其用途
CN110790806B (zh) * 2018-08-01 2021-10-29 中国药科大学 新型罗汉果苷衍生物及其用途
CN109402163A (zh) * 2018-09-26 2019-03-01 怀化兴科创生物技术有限公司 新的罗汉果角鲨烯环氧酶基因(Sgsqe)的应用
CN109439676A (zh) * 2018-09-26 2019-03-08 怀化兴科创生物技术有限公司 罗汉果环氧化物水解酶Sgeph5基因的应用
CN109679987A (zh) * 2018-09-27 2019-04-26 怀化兴科创生物技术有限公司 一个提高甜甙含量相关基因的应用
CN115335514A (zh) * 2019-10-25 2022-11-11 银杏生物制品公司 罗汉果甙的生物合成
CN110669809B (zh) * 2019-11-12 2022-12-23 广西师范大学 一种酶法制备罗汉果苷iv和苷v的方法
CN110669809A (zh) * 2019-11-12 2020-01-10 广西师范大学 一种酶法制备罗汉果苷iv和苷v的方法
CN115605081A (zh) * 2020-03-17 2023-01-13 可口可乐公司(Us) 新的罗汉果苷生产系统和方法
CN115697044A (zh) * 2020-03-31 2023-02-03 艾洛生物系统有限公司 西瓜和其他葫芦科中内源罗汉果苷途径基因的调控
CN111518817A (zh) * 2020-05-14 2020-08-11 云南农业大学 雪胆三萜合成酶HcOSC6基因及其工程菌和在制备葫芦二烯醇中的应用
CN111518817B (zh) * 2020-05-14 2022-08-23 云南农业大学 雪胆三萜合成酶HcOSC6基因及其工程菌和在制备葫芦二烯醇中的应用
CN112063647A (zh) * 2020-09-17 2020-12-11 云南农业大学 酿酒酵母重组菌Cuol01的构建方法、酿酒酵母重组菌Cuol02及应用
CN112063647B (zh) * 2020-09-17 2023-05-02 云南农业大学 酿酒酵母重组菌Cuol01的构建方法、酿酒酵母重组菌Cuol02及应用
CN112063678A (zh) * 2020-09-21 2020-12-11 中国药科大学 一种Siamenoside I的生物合成方法
CN114836465A (zh) * 2022-04-15 2022-08-02 中国医学科学院药用植物研究所 利用转基因植物生产甜苷类化合物的方法
CN114836465B (zh) * 2022-04-15 2024-04-30 中国医学科学院药用植物研究所 利用转基因植物生产甜苷类化合物的方法

Also Published As

Publication number Publication date
IL251070B (en) 2021-12-01
IL287789B1 (en) 2024-01-01
IL287789A (en) 2022-01-01
EP3191584A1 (en) 2017-07-19
CA2972739A1 (en) 2016-03-17
US20170283844A1 (en) 2017-10-05
IL251070A0 (en) 2017-04-30
EP3191584A4 (en) 2018-07-18
US20220170063A1 (en) 2022-06-02
WO2016038617A1 (en) 2016-03-17
IL287789B2 (en) 2024-05-01
US12071646B2 (en) 2024-08-27

Similar Documents

Publication Publication Date Title
US12071646B2 (en) Cells comprising mogroside pathway enzymes and uses thereof
JP7061145B2 (ja) レバウディオサイドdおよびレバウディオサイドmの改良された産生方法
US11819042B2 (en) Uridine diphosphate-dependent glycosyltransferase circular permutants
KR102114493B1 (ko) 스테비올 글리코시드의 재조합 생산
KR101971818B1 (ko) 스테비올 글리코시드의 재조합 생산
EP2645847B1 (en) Microbial production of natural sweeteners, diterpenoid steviol glycosides
CN108337892A (zh) 在重组宿主中生产甜菊醇糖苷
CN109068604A (zh) 辨识与鉴别来自栽培种苹果的尿苷二磷酸葡萄糖:根皮素的4’-o-葡萄糖基转移酶的方法
CN107922913B (zh) 甜菊醇糖苷转运
WO2021190632A1 (zh) 一种羟化酶基因及其应用
CN115605081A (zh) 新的罗汉果苷生产系统和方法
Nakayasu et al. Identification of furostanol glycoside 26-O-β-glucosidase involved in steroidal saponin biosynthesis from Dioscorea esculenta
US20230114811A1 (en) Glycosyltransferases, polynucleotides encoding these and methods of use
CN108350475B (zh) 使用aobgl1同源体的甜菊醇糖苷及甜菊醇的制造方法
AU2018200459A1 (en) Recombinant production of steviol glycosides
US20240352501A1 (en) Cells comprising mogroside pathway enzymes and uses thereof
CN113174376B (zh) 多酚氧化酶的应用及合成黄酮的方法
CN108350470A (zh) 使用aobgl3同源体的甜菊醇糖苷及甜菊醇的制造方法
Wang et al. Multi-omics analysis reveals promiscuous O-glycosyltransferases involved in the diversity of flavonoid glycosides in Periploca forrestii (Apocynaceae)
WO2021202513A1 (en) Modulation of endogenous mogroside pathway genes in watermelon and other cucurbits

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination