CN110892068A - Udp-糖基转移酶 - Google Patents

Udp-糖基转移酶 Download PDF

Info

Publication number
CN110892068A
CN110892068A CN201880042712.6A CN201880042712A CN110892068A CN 110892068 A CN110892068 A CN 110892068A CN 201880042712 A CN201880042712 A CN 201880042712A CN 110892068 A CN110892068 A CN 110892068A
Authority
CN
China
Prior art keywords
leu
val
polypeptide
ile
lys
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201880042712.6A
Other languages
English (en)
Other versions
CN110892068B (zh
Inventor
维克托·马里厄斯·波尔
约翰尼斯·古斯塔夫·恩斯特·范莱文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DSM IP Assets BV
Original Assignee
DSM IP Assets BV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DSM IP Assets BV filed Critical DSM IP Assets BV
Publication of CN110892068A publication Critical patent/CN110892068A/zh
Application granted granted Critical
Publication of CN110892068B publication Critical patent/CN110892068B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/01Hexosyltransferases (2.4.1)
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23KFODDER
    • A23K20/00Accessory food factors for animal feeding-stuffs
    • A23K20/10Organic substances
    • A23K20/163Sugars; Polysaccharides
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23LFOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
    • A23L2/00Non-alcoholic beverages; Dry compositions or concentrates therefor; Their preparation
    • A23L2/52Adding ingredients
    • A23L2/60Sweeteners
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23LFOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
    • A23L27/00Spices; Flavouring agents or condiments; Artificial sweetening agents; Table salts; Dietetic salt substitutes; Preparation or treatment thereof
    • A23L27/30Artificial sweetening agents
    • A23L27/33Artificial sweetening agents containing sugars or derivatives
    • A23L27/36Terpene glycosides
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23LFOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
    • A23L29/00Foods or foodstuffs containing additives; Preparation or treatment thereof
    • A23L29/30Foods or foodstuffs containing additives; Preparation or treatment thereof containing carbohydrate syrups; containing sugars; containing sugar alcohols, e.g. xylitol; containing starch hydrolysates, e.g. dextrin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0012Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7)
    • C12N9/0036Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on NADH or NADPH (1.6)
    • C12N9/0038Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on NADH or NADPH (1.6) with a heme protein as acceptor (1.6.2)
    • C12N9/0042NADPH-cytochrome P450 reductase (1.6.2.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/44Preparation of O-glycosides, e.g. glucosides
    • C12P19/56Preparation of O-glycosides, e.g. glucosides having an oxygen atom of the saccharide radical directly bound to a condensed ring system having three or more carbocyclic rings, e.g. daunomycin, adriamycin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P33/00Preparation of steroids
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23VINDEXING SCHEME RELATING TO FOODS, FOODSTUFFS OR NON-ALCOHOLIC BEVERAGES AND LACTIC OR PROPIONIC ACID BACTERIA USED IN FOODSTUFFS OR FOOD PREPARATION
    • A23V2002/00Food compositions, function of food ingredients or processes for food or foodstuffs
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23VINDEXING SCHEME RELATING TO FOODS, FOODSTUFFS OR NON-ALCOHOLIC BEVERAGES AND LACTIC OR PROPIONIC ACID BACTERIA USED IN FOODSTUFFS OR FOOD PREPARATION
    • A23V2250/00Food ingredients
    • A23V2250/24Non-sugar sweeteners
    • A23V2250/262Stevioside

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Polymers & Plastics (AREA)
  • Food Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Nutrition Science (AREA)
  • Medicinal Chemistry (AREA)
  • Biomedical Technology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Animal Husbandry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本公开涉及一种具有UGT活性的多肽,所述多肽包含这样的氨基酸序列,所述氨基酸序列当与包含SEQ ID NO:2所示的序列的具有UGT活性的多肽进行比对时,包含至少一个对应于以下位置处的氨基酸中的任何的氨基酸取代:35、189、280、284、285、334或373,所述位置是参考SEQ ID NO:2定义的,并且其中与具有UGT活性的参考多肽相比,所述多肽具有一种或多种经修饰的特性。根据本公开的多肽可用于重组细胞中以生产甜菊醇或甜菊醇糖苷。

Description

UDP-糖基转移酶
技术领域
本公开涉及具有UGT活性的多肽并且涉及编码该多肽的核酸序列。本公开还涉及包含所述核酸序列的重组细胞,该重组细胞任选地能够产生甜菊醇或甜菊醇糖苷。本公开还涉及制备甜菊醇糖苷的方法,所述方法包括培养所述重组细胞,涉及包含通过所述方法能够获得的甜菊醇糖苷的培养液,并且涉及组合物,所述组合物包含一种或多种通过所述方法获得的甜菊醇糖苷或从所述培养液获得的甜菊醇糖苷。另外,本公开涉及包含所述组合物的食品、饲料或饮料。此外,本公开涉及将甜菊醇或第一甜菊醇糖苷分别转换为甜菊醇糖苷或第二甜菊醇糖苷的方法。
背景技术
多年生草本植物甜叶菊(Stevia rebaudiana Bert.)的叶子积聚大量被称为甜菊醇糖苷的具有强烈甜味的化合物。虽然这些化合物的生物功能尚不清楚,但它们作为替代性高效甜味剂具有商业意义。
这些甜的甜菊醇糖苷的功能和感官特性表现为优于许多高效甜味剂的功能和感官特性。此外,研究表明甜菊苷能够降低II型糖尿病患者的血糖水平,并且能够降低轻度高血压患者的血压。
甜菊醇糖苷积聚在甜叶菊叶中,其中它们可占叶干重的10%至20%。甜菊苷和莱鲍迪甙A均是热和pH稳定的,并且适用于碳酸饮料和许多其他食物。甜菊苷比蔗糖甜110与270倍之间,莱鲍迪甙A比蔗糖甜150与320倍之间。此外,莱鲍迪甙D也是在甜叶菊叶中积聚的高效二萜糖苷甜味剂。它可比蔗糖甜约200倍。莱鲍迪甙M是另一种高效二萜糖苷甜味剂。它在某些甜叶菊品种叶中以痕量存在,但已表明其具有优异的味道特征。
传统上已从甜叶菊植物中提取了甜菊醇糖苷。在甜叶菊中,(-)-贝壳杉烯酸(赤霉酸(GA)生物合成中的中间体)被转换为四环二萜甜菊醇,其然后通过多步糖基化途径进行以形成各种甜菊醇糖苷。然而,产率可以是可变的,并且受到农业和环境条件的影响。此外,甜叶菊种植需要大量的土地面积、在收获前的很长时间、密集劳动以及用于提取和纯化糖苷的额外成本。
最近,使用发酵工艺生产甜菊醇糖苷的兴趣日益增长。WO2013/110673和WO2015/007748中描述了可用于产生至少甜菊醇糖苷莱鲍迪甙A、莱鲍迪甙D和莱鲍迪甙M的微生物。
此类微生物的进一步改进是期望的,以便可产生更高量的甜菊醇糖苷和/或另外或新的甜菊醇糖苷和/或更高量的特定甜菊醇糖苷和/或具有期望比例的不同甜菊醇糖苷的甜菊醇糖苷的混合物和/或以更低量的不期望的副产物产生的甜菊醇糖苷。
附图说明
图1示出了一些而不是全部的导致甜菊醇糖苷生物合成的潜在途径的示意图。
序列表说明
SEQ ID NO:1示出了编码来自Stevia rebaudiana的UGT3多肽的核苷酸序列,该核苷酸序列经密码子对优化以用于在Yarrowia lipolytica中表达。
SEQ ID NO:2示出了来自Stevia rebaudiana的UGT3多肽的氨基酸序列。
SEQ ID NO:3至SEQ ID NO:20描述于表2中。
SEQ ID NO:21示出了编码来自Yarrowia lipolytica的羟甲基戊二酰-辅酶A还原酶多肽的核苷酸序列,该核苷酸序列经密码子对优化以用于在Yarrowia lipolytica中表达。
SEQ ID NO:22示出了编码来自Yarrowia lipolytica的香叶基香叶基二磷酸酯合酶(geranylgeranyl diphosphate synthase)多肽的核苷酸序列,该核苷酸序列经密码子对优化以用于在Yarrowia lipolytica中表达。
SEQ ID NO:23示出了编码来自Stevia rebaudiana的柯巴基焦磷酸酯合酶(copalyl pyrophosphate synthase)多肽的核苷酸序列,该核苷酸序列经密码子对优化以用于在Yarrowia lipolytica中表达。
SEQ ID NO:24示出了编码来自Stevia rebaudiana的贝壳杉烯合酶多肽的核苷酸序列,该核苷酸序列经密码子对优化以用于在Yarrowia lipolytica中表达。
SEQ ID NO:25示出了编码来自Giberella fujikuroikaurene的贝壳杉烯氧化酶多肽的核苷酸序列,该核苷酸序列经密码子对优化以用于在Yarrowia lipolytica中表达。
SEQ ID NO:26示出了编码KAH4多肽的核苷酸,该核苷酸经密码子对优化以用于在Yarrowia lipolytica中表达。
SEQ ID NO:27示出了编码来自Arabidopsis thaliana的细胞色素P450还原酶多肽的核苷酸序列,该核苷酸序列经密码子对优化以用于在Yarrowia lipolytica中表达。
SEQ ID NO:28示出了编码来自Stevia rebaudiana的UDP-葡糖基转移酶多肽的核苷酸序列,该核苷酸序列经密码子对优化以用于在Yarrowia lipolytica中表达。
SEQ ID NO:29示出了编码来自Stevia rebaudiana的UDP-葡糖基转移酶多肽的变体的核苷酸序列,该核苷酸序列经密码子对优化以用于在Yarrowia lipolytica中表达。
SEQ ID NO:30示出了编码来自Stevia rebaudiana的UDP-葡糖基转移酶多肽的核苷酸序列,该核苷酸序列经密码子对优化以用于在Yarrowia lipolytica中表达。
SEQ ID NO:31示出了pHSP启动子的序列。
SEQ ID NO:32示出了pgmT终止子的序列。
SEQ ID NO:33示出了pAgos_lox TEF1启动子的核苷酸序列。
SEQ ID NO:34示出了Agos tef1Ts_lox终止子的核苷酸序列。
发明概述
本公开基于新的UDP-糖基转移酶(UGT)多肽,即具有UDP-糖基转移酶(UGT)活性的新多肽的鉴定。这些多肽可用于产生适用于生产甜菊醇和/或一种或多种甜菊醇糖苷的重组细胞。
与表达参考UGT的重组细胞相比,此类重组细胞可产生更高量的甜菊醇糖苷和更低量的不期望的产物。产生更高量的甜菊醇糖苷和/或更低量的不期望的产物可以使甜菊醇糖苷的回收更容易。此外,可以获得更高的产率。
因此,本公开涉及一种具有UGT活性的多肽,该多肽包含这样的氨基酸序列,所述氨基酸序列当与包含SEQ ID NO:2所示的序列的UGT(来自S.rebaudiana的野生型UGT3/UGT74G1序列)比对时,包含至少一个对应于以下位置处的氨基酸中的任何的氨基酸取代:
35、189、280、284、285、334或373
所述位置是参考SEQ ID NO:2定义的,并且其中与具有UGT活性的参考多肽相比,所述多肽具有一种或多种经修饰的特性。
本公开还涉及:
-一种具有UGT活性的多肽,该多肽包含与SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18或SEQ IDNO:20中的任一者具有至少约95%的序列同一性,至少96%、至少97%、至少98%或至少99%的序列同一性的氨基酸序列;
-一种编码根据本公开的具有UGT活性的多肽的核酸序列;
-一种重组细胞,该重组细胞包含根据本公开的核酸序列,该重组细胞任选地能够产生甜菊醇或甜菊醇糖苷;
-一种制备甜菊醇糖苷的方法,该方法包括在合适的培养基中在有利于生产甜菊醇糖苷的条件下培养根据本公开的重组细胞,以及任选地回收所述甜菊醇糖苷;
-一种包含通过根据本公开的制备甜菊醇糖苷的方法能够获得的甜菊醇糖苷的培养液;
-一种组合物,该组合物包含一种或多种通过根据本公开的制备甜菊醇糖苷的方法获得的甜菊醇糖苷或从根据本公开的包含甜菊醇糖苷的培养液获得的甜菊醇糖苷;
-一种食品、饲料或饮料,该食品、饲料或饮料包含含有一种或多种根据本公开的甜菊醇糖苷的组合物;以及
-一种将甜菊醇或第一甜菊醇糖苷分别转换为甜菊醇糖苷或第二甜菊醇糖苷的方法,该方法包括:
-使甜菊醇或第一甜菊醇糖苷与根据本公开的重组细胞或其透性化(permeabilized)形式、源自该重组细胞的粗提取物或无细胞提取物或源自上述任一者的酶制备物接触;
-从而将甜菊糖醇或第一甜菊醇糖苷分别转换为甜菊醇糖苷或第二甜菊醇糖苷。
详细说明
在本说明书和所附权利要求书中,词语“包含”、“包括”和“具有”以及变化形式应被解释为包含性的。也就是说,这些词语意图表达在上下文允许的情况下可包含未具体叙述的其他要素或整数。
不使用数量词修饰时在本文中指代一个/种或多于一个/种(即一个/种或至少一个/种)的语法对象。举例来说,“要素”可意指一个/种要素或多于一个/种要素。
本文中的“莱鲍迪甙”可以缩写为“Reb”或“reb”等。
根据本公开,因此提供了一种具有UDP-糖基转移酶(UGT)活性(诸如UGT3/UGT74G1活性)的多肽。具有UGT3/UGT74G1活性的多肽是例如来自Stevia rebaudiana的UDP-糖基转移酶74G1(如在Richman等人“The Plant Journal”(2005)41:56-67中所述)。根据本公开的多肽具有UGT活性,诸如UGT3/UGT74G1活性。UGT活性是介导糖基残基从活化的核苷酸糖(即从尿苷二磷酸活化的单糖,例如尿苷二磷酸-5'-葡萄糖(UDPG))转移到受体分子(糖苷配基)的活性。在本文中,糖苷配基可以优选地为甜菊醇或甜菊醇糖苷。糖残基供体可以优选地为UDP-葡萄糖。然而,出于本公开的目的,UGT活性还涵盖其中糖残基供体为例如UDP-半乳糖、UDP-木糖、UDP-鼠李糖或UDP-葡糖醛酸酯的活性。
UGT3或UGT74G1活性可以是催化将C-19-葡萄糖添加到甜菊双糖苷的活性,即,其可以是催化将葡萄糖单元添加到甜菊双糖苷中的甜菊醇骨架的19-COOH的活性。也就是说,UGT3/UGT74G1可能够催化将甜菊双糖苷转换为甜菊苷的反应。
UGT3或UGT74G1活性也可以是将葡萄糖单元分别转移至甜菊醇的13-OH或19-COOH的活性。也就是说,UGT3/UGT74G1可能够催化将甜菊醇转换为甜菊单糖苷(steviolmonoside),优选地将甜菊醇转换为甜菊醇-19-单苷的反应。
UGT3或UGT74G1活性可以是催化将C-19-葡萄糖添加到甜菊醇的活性。也就是说,UGT3/UGT74G1可能够催化将甜菊醇转换为甜菊醇-19-单苷的反应。
UGT3或UGT74G1活性可以是催化将C-19-葡萄糖添加到莱鲍迪甙B的活性。也就是说,UGT3/UGT74G1可能够催化将莱鲍迪甙B转换为莱鲍迪甙A的反应。
UGT3/UGT74G1可以充当尿苷5'-二磷酸葡糖基:甜菊醇19-COOH转移酶和尿苷5'-二磷酸葡糖基:甜菊醇-13-O-葡糖苷19-COOH转移酶。
功能性UGT3//UGT74G1多肽还可以催化糖基转移酶反应,该糖基转移酶反应利用不同于甜菊醇、甜菊醇-13-O-葡糖苷和甜菊双糖苷的甜菊醇糖苷底物,或转移来自不同于尿苷二磷酸葡萄糖的供体的糖部分(sugar moieties)。
因此,出于本公开的目的,具有UGT活性的多肽可以是能够催化或部分催化由甜菊醇形成甜菊醇糖苷或由第一甜菊醇糖苷形成第二甜菊醇糖苷的多肽。因此,出于本公开的目的,多肽可以是具有UGT活性的多肽,即能够催化或部分催化由甜菊醇或甜菊醇糖苷形成甜菊醇糖苷的多肽。
与具有UGT活性的参考多肽相比,根据本公开的多肽具有经修饰的UGT活性。
与参考多肽相比,该多肽可具有降低的特定UGT活性(specific UGT activity)。
与参考多肽相比,该多肽可具有提高的特定UGT活性。
根据本公开的多肽可以是非天然存在的多肽。
在本文中,根据本公开的多肽可以被称为“UGT”、“UGT酶”或“UGT多肽”。在本文中,“UGT3”、“UGT3酶”或“UGT3多肽”与“UGT74G1”、“UGT74G1酶”或“UGT74多肽”意思相同。
根据本公开的UGT多肽(例如,具有一个或多个如本文所示取代的多肽)可包含这样的氨基酸序列,所述氨基酸序列具有与参考UGT多肽(诸如SEQ ID NO:2所示的UGT)至少约60%、70%、80%的同一性,例如与亲本多肽至少约85%的同一性,诸如与亲本多肽至少约90%的同一性,与亲本多肽至少约95%的同一性,与亲本多肽至少约98%的同一性,或与亲本多肽至少约99%的同一性。该UGT多肽将通常具有选自与如参考SEQ ID NO:2所定义的35、189、280、284、285、334或373对应的位置的一个或多个取代或成组取代。
与本文在参考UGT中所定义的位置之一对应的氨基酸位置可以是在多重(蛋白质)序列比对中与任何所述氨基酸位置比对的位置。
对应于位置35、189、280、284、285、334或373之一的氨基酸位置(所述位置是参考SEQ ID NO:2定义的)是当通过合适的序列比对方法来比对UGT多肽序列与SEQ ID NO:2所示的氨基酸序列时,在所述UGT多肽序列中鉴定出的位置。合适的序列比对方法是这样的方法,所述方法允许序列彼此进行比较和鉴定UGT多肽的氨基酸序列中的位置,如果与SEQ IDNO:2所示的氨基酸序列比较,则在所述位置中存在相同的氨基酸(相同的位置)、或存在另一种氨基酸(取代)、或存在一个或多个额外的氨基酸(插入或延伸),或不存在氨基酸(缺失或截短)。
允许比较两个氨基酸序列的合适方法可以是本领域技术人员已知的任何合适的成对序列比对方法,优选全局成对序列比对方法(Global Pairwise Sequence Alignmentmethod)。一种优选的全局成对序列比对方法是如本文所述的基于Needleman-Wunsch比对算法(Needleman,S.B.和Wunsch,C.D.(1970)J.Mol.Biol.48,443-453)的EMBOSS Needle方法(旨在找到两个序列沿它们的整个长度的最佳比对(包括空位))。在一个实施方式中,使用EMBOSS Needle比对方法,使用EBLOSUM62作为取代矩阵,优选使用为10的空位开放罚分和为0.5的空位延伸罚分,将氨基酸序列与SEQ ID NO:2所示的氨基酸序列进行比对。
在根据本公开的一个实施方式中,具有UGT活性的多肽中与参考SEQ ID NO:2定义的位置35、189、280、284、285、334或373处的任何氨基酸对应的位置是通过下述方法鉴定的:使用EMBOSS Needle比对方法(诸如来自EMBOSS包的NEEDLE程序),使用EBLOSUM62作为取代矩阵,使用为10的空位开放罚分和为0.5的空位延伸罚分,将本公开的具有UGT活性的多肽的氨基酸序列与SEQ ID NO:2所示的氨基酸序列进行比对。
根据本公开的UGT通常保留UGT活性。也就是说,根据本公开的UGT,尽管与参考多肽相比具有经修饰的活性,但通常能够催化上述反应。
优选地,根据本公开的UGT多肽与其所源自的参考多肽相比将通常在比活性和/或底物特异性方面表现出改善的特性。如果UGT要如下所述使用,例如在用于生产甜菊醇和/或甜菊醇糖苷的方法中使用(通过在重组细胞中表达UGT),则这种改善的特性通常将是一种相关的特性。
因此,根据本公开的UGT是通常能够增加能够产生甜菊醇和/或甜菊醇糖苷的重组细胞中所述甜菊醇和/或甜菊醇糖苷的产生的UGT(与表达参考多肽的能够产生甜菊醇和/或甜菊醇糖苷的重组细胞相比)。也就是说,与过表达参考多肽(诸如SEQ ID NO:2的UGT3)的细胞相比,重组细胞中根据本公开的UGT多肽的过表达通常将导致甜菊醇和/或甜菊醇糖苷的产生增加。
根据本公开的UGT可以是通常能够降低能够产生甜菊醇和/或甜菊醇糖苷的重组细胞中非甜菊醇糖苷(诸如一种或多种贝壳杉烯酸糖苷)的产生的UGT(与表达参考多肽的能够产生甜菊醇和/或甜菊醇糖苷的重组细胞相比)。也就是说,与过表达参考多肽(诸如SEQ ID NO:2的UGT3)的重组细胞相比,重组细胞中根据本公开的UGT多肽的过表达通常将导致甜菊醇和/或甜菊醇糖苷的产生增加。
产生较低量的非甜菊醇糖苷产物可使甜菊醇糖苷的回收更加容易。此外,可以获得更高的产率。
表现出相对于参考UGT有所改善的特性的UGT是这样的UGT,所述UGT在相关特性(例如比活性)方面展现出可测量的降低或升高,通常使得UGT更适合于本文所述的用途,例如生产甜菊醇或甜菊醇糖苷的方法中。
根据本公开的UGT多肽包含这样的氨基酸序列,所述氨基酸序列与参考多肽相比具有一个或多个氨基酸的取代、缺失和/或插入,和/或与参考多肽相比具有一个或多个截短。UGT多肽可包含一种或多种本文所述的取代。
例如本文所述的具有UGT活性的多肽包含这样的氨基酸序列,所述氨基酸序列当与包含SEQ ID NO:2所示的序列的UGT进行比对时,包含至少一个与氨基酸35、189、280、284、285、334或373中的任一者对应的氨基酸的取代,所述位置是参考SEQ ID NO:2定义的,并且其中与具有UGT活性的参考多肽相比,该UGT具有一种或多种经修饰的特性。
在一个实施方式中,具有UGT活性的参考多肽是具有根据SEQ ID NO:2的氨基酸序列的多肽。
氨基酸取代旨在表示指定位置处的氨基酸残基被不同的氨基酸替代。
因此,例如本文所述的具有UGT活性的多肽包含这样的氨基酸序列,所述氨基酸序列当与包含SEQ ID NO:2所示的序列的UGT进行比对时,包含至少一个与氨基酸35、189、280、284、285、334或373中的任一者对应的氨基酸残基的取代,所述位置是参考SEQ ID NO:2定义的,并且其中与具有UGT活性的参考多肽相比,该UGT具有一种或多种经修饰的特性。
因此,在一个或多个所述位置处存在的氨基酸将被与参考序列中该位置处出现的氨基酸不同的氨基酸替代(该位置是参考SEQ ID NO:2定义的)。
根据本公开的UGT多肽可以包含上述取代中的一种,或者可以包含它们中的两种、三种、四种、五种、六种或全部的任意组合。
根据本公开的UGT多肽可以是这样的UGT多肽,其中:
(i)在位置35处存在缬氨酸;
(ii)在位置189处存在丙氨酸;
(iii)在位置280处存在天冬酰胺;
(iv)在位置284处存在天冬酰胺;
(v)在位置285处存在甘氨酸;
(vi)在位置285处存在天冬酰胺;
(vii)在位置285处存在丝氨酸;
(viii)在位置334处存在丙氨酸;且/或
(ix)在位置373处存在丙氨酸,
所述位置是参考SEQ ID NO:2定义的。
以上定义的取代的任何组合可以用于定义根据本公开的UGT多肽。
因此,根据本公开的UGT多肽可以包含这样的氨基酸序列,所述氨基酸序列当与包含SEQ ID NO:2所示的序列的UGT比对时,至少包含与下述氨基酸中的任何对应的氨基酸的以下取代:
35和189;35和280;35和284;35和285;35和334;35和373;189和280;189和284;189和285;189和334;189和373;280和284;280和285;280和334;280和373;284和285;284和334;284和373;285和334;285和373;334和373;35、189和280;35、189和284;35、189和285;35、189和334;35、189和373;35、280和284;35、280和285;35、280和334;35、280和373;35、284和285;35、284和334;35、284和373;35、285和334;35、285和373;35、334和373;189、280和284;189、280和285;189、280和334;189、280和373;189、284和285;189、284和334;189、284和373;189、285和334;189、285和373;189、334和373;280、284和285;280、284和334;280、284和373;280、285和334;280、285和373;280、334和373;284、285和334;284、285和373;284、334和373;或者285、334和373,
所述位置是参考SEQ ID NO:2定义的。
根据本公开的UGT多肽可以包含除以上定义的七个取代位置中的一个或多个以外的附加取代,例如一个或多个附加取代、添加或缺失。
根据本公开的UGT可以包含该类别的不同类型的修饰的组合。UGT可以包含一个、两个、三个、四个、至少5个、至少10个、至少15个、至少20个、至少25个、至少30个或更多个此类修饰(它们可以均为相同类型的修饰或可以为不同类型的修饰)。通常,附加修饰可以是取代。
根据本公开的UGT多肽可以包含SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ IDNO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18或SEQ ID NO:20中任一者所示的氨基酸序列。然而,UGT多肽可以包含在位置35、189、280、284、285、334或373处的取代的任何组合,所述位置是参考适当的参考序列(诸如SEQ ID NO:2所示的参考序列)定义的。
根据本公开的重组细胞可以包含编码一种、两种、三种、四种、五种或更多种根据本公开的UGT的核酸序列。此类UGT多肽可以相同或不同。重组细胞可以包含编码包含SEQID NO:2的氨基酸序列的UGT3的核酸序列,以及编码一种或多种根据本公开的UGT的核酸序列。也就是说,细胞可以包含编码包含SEQ ID NO:2的氨基酸序列的UGT的核酸序列,以及编码一种或多种根据本公开的UGT的核酸序列,所述核酸序列中的每一者可以一个、两个、三个、四个、五个或更多个拷贝存在。
与参考多肽相比,UGT多肽通常将具有经修饰的UGT活性。通常,可以根据重组细胞中的甜菊醇和/或甜菊醇糖苷产生来定义经修饰的活性。
当UGT在重组细胞中过表达时,可以根据与过表达参考多肽(例如SEQ ID NO:2的参考多肽)的等同细胞的产生水平相比,甜菊醇和/或甜菊醇糖苷的产生增加来定义经修饰的活性。
当UGT在重组细胞中过表达时,可以根据与过表达参考多肽(例如SEQ ID NO:2的参考多肽)的等同细胞的产生水平相比,非甜菊醇糖苷(例如不期望的产物例如贝壳杉烯酸糖苷)的产生减少来定义经修饰的活性。
当UGT在重组细胞中过表达时,可以根据与过表达参考多肽(例如SEQ ID NO:2的参考多肽)的等同细胞的生产水平相比,两种甜菊醇糖苷产生的比值变化来定义经修饰的活性,例如莱鲍迪甙A:莱鲍迪甙M的比值可以增加,或者莱鲍迪甙M:莱鲍迪甙A的比值可以增加。
当UGT在重组细胞中过表达时,可以根据与过表达参考多肽(例如SEQ ID NO:2的参考多肽)的等同细胞的生产水平相比,所产生的甜菊醇糖苷的总和与贝壳杉烯酸糖苷的总和的比值变化来定义经修饰的活性,例如甜菊醇糖苷的总和与贝壳杉烯酸糖苷的总和的比值可以增大。
也可以根据UGT的稳定性提高来定义经修饰的活性,例如具有比参考多肽(例如SEQ ID NO:2的参考多肽)更长的半衰期。
UGT可以能够使生产水平提高,例如提高至少5%,至少10%,至少25%,至少50%,至少100%或更多。生产水平可以用g/L或mol/L(M)表示,因此,以g/L或mol/L表示的更高的生产水平将证明甜菊醇和/或甜菊醇糖苷的生产水平的提高。
在不期望的产物(诸如一种或多种贝壳杉烯酸糖苷)的情况下,UGT可以能够使生产水平降低,例如降低至少5%、至少10%、至少25%、至少50%或者更多。UGT可以能够使该比值降低例如至少1%、至少2%、至少5%、至少10%、至少25%、至少50%、至少100%或更多。
如上所述,这还可以根据甜菊醇糖苷的总和:贝壳杉烯酸糖苷的总和的增大来定义。
本文使用的“多肽”一词是指含有超过约7个氨基酸残基的链。本文的所有多肽序列均从左到右书写,并且从氨基末端到羧基末端的方向。本文使用的单字母氨基酸代码是本领域熟知的,可以在Sambrook等人的文献中找到(Molecular Cloning:A LaboratoryManual,第二版,Cold Spring Harbor Laboratory,Cold Spring Harbor LaboratoryPress,Cold Spring Harbor,NY,1989)。
根据本公开的UGT多肽可以是分离的(isolated)形式,诸如基本上分离的形式。“分离的”多肽或蛋白质意指从其天然环境中移出的多肽或蛋白质。例如,为了本公开的目的,在细胞中表达的重组产生的多肽和蛋白质被认为是分离的,因为它们是已经通过任何合适的技术基本上纯化的重组多肽。可以通过本领域已知的方法从重组细胞培养物中回收和纯化根据本公开的UGT多肽。
本公开的UGT多肽包括化学合成程序的产物以及通过重组技术由原核或真核细胞(包括例如细菌、酵母、高等植物、昆虫和哺乳动物细胞)产生的产物。取决于重组产生程序中使用的细胞,本公开的多肽可以是糖基化的或可以是非糖基化的。此外,根据本公开的多肽还可以包括初始修饰的甲硫氨酸残基,在一些情况下是细胞介导的过程的结果。
本公开还涉及根据本公开的UGT多肽的生物活性片段。认为此类片段包含在术语“根据本公开的UGT”内。
根据本公开的UGT多肽的生物活性片段包括含有与本文公开的变体蛋白的氨基酸序列充分相同或衍生自根据本公开的UGT蛋白的氨基酸序列的氨基酸序列的多肽,其包含比全长蛋白质少的氨基酸,但是它表现出相应的全长蛋白质的至少一种生物活性。通常,生物活性片段包含具有根据本公开的UGT蛋白的至少一种活性的结构域或基序。根据本公开的UGT的生物活性片段可以是例如长度为10、25、50、100或更多个氨基酸的多肽。此外,其中缺失蛋白质的其他区域的其他生物活性部分可以通过重组技术制备,并评估根据本公开的多肽的天然形式的一种或多种生物活性。
通常,根据本公开的UGT的蛋白质片段将包含一种或多种本文定义的取代。
本公开还涉及编码上述生物活性片段的核酸序列(该生物活性片段本身是根据本公开的UGT)。
本公开提供了编码根据本公开的UGT多肽的核酸序列(及其生物活性片段)。本公开还涉及分离的核酸序列,所述分离的核酸序列编码根据本公开的UGT多肽UGT的至少一个功能结构域。通常,这种结构域将包含本文所述的取代中的一种或多种。根据本公开的这种核酸序列可以是非天然存在的。
可以使用本领域技术人员所熟知的标准分子生物学技术结合本文提供的序列信息来产生本公开的核酸序列。例如,使用标准合成技术,可以通过PCR产生或从头合成所需的核酸分子。这种合成过程通常是自动化过程。
与编码参考UGT的核酸序列相比,根据本公开的核酸序列可包含一个或多个缺失,即空位。还可以使用适当的寡核苷酸使用定点诱变产生这种缺失/空位。产生这种缺失的技术是本领域技术人员熟知的。
此外,对应于根据本公开的核酸序列或可与根据本公开的核酸序列杂交的寡核苷酸可通过标准合成技术制备,例如使用自动DNA合成仪。
此外,互补核酸和反义核酸被包括在本公开中。与核酸序列互补的核酸分子是与所述核酸序列充分互补的核酸分子,使得它可以与所述核酸序列的至少部分杂交,从而形成稳定的双链体。
本公开的一个方面涉及编码根据本公开的UGT多肽或其生物活性片段或结构域的分离的多核苷酸或核酸,以及足以用作杂交探针以鉴定编码根据本公开的多肽的核酸分子的核酸分子,以及适合用作核酸分子扩增或突变(例如,用于制备根据本公开的核酸分子)的PCR引物的此类核酸分子的片段。
如本文所用,术语“多核苷酸”、“核酸”或“核酸分子”旨在包括DNA分子(例如,cDNA或基因组DNA)和RNA分子(例如,mRNA),以及使用核苷酸类似物生成的DNA或RNA类似物。核酸分子可以是单链或双链的,但是优选是双链DNA。可以使用寡核苷酸类似物或衍生物(例如,肌苷或硫代磷酸酯核苷酸)来合成核酸。此类寡核苷酸可用于例如制备具有改变的碱基配对能力或增强的核酸酶抗性的核酸。
“分离的多核苷酸”或“分离的核酸”通常是这样的DNA或RNA,其不与两个非编码序列紧邻(immediately contiguous),而在其源自的生物体的天然存在的基因组中其与这两个编码序列紧邻(一个在5'端,一个在3'端)。因此,在一个实施方式中,分离的多核苷酸或核酸包括与编码序列紧邻的5'非编码(例如,启动子)序列中的一些或全部。因此,该术语包括,例如,掺入载体中的重组DNA,掺入自主复制的质粒或病毒中的重组DNA,或者掺入原核生物或真核生物的基因组DNA中的重组DNA,或者作为单独的分子(例如,通过PCR或限制性内切核酸酶处理产生的cDNA或基因组DNA片段)存在而不依赖于其他序列的重组DNA。它还包括作为编码附加的多肽的杂合基因的一部分的重组DNA,该杂合基因基本上不含细胞材料、病毒材料或培养基(当通过重组DNA技术产生时)或化学前体或其他化学品(当化学合成时)。此外,“分离的多核苷酸”或“分离的核酸片段”通常是不是天然存在的片段并且在天然状态下不会发现的核酸片段。
本公开还涉及包含多核苷酸的核酸构建体,该多核苷酸包含编码根据本公开的UGT多肽的核苷酸序列,以及与该核苷酸序列可操作地连接的控制序列,从而允许该核酸序列在细胞中表达。可以将核酸构建体并入载体(诸如表达载体)和/或细胞中,以实现UGT多肽的表达。
术语“核酸构建体”在本文中是指单链或双链的核酸分子,其从天然存在的基因中分离或更典型地已经被修饰以含有以否则将不会在自然中存在的方式组合和并置的核酸序列的区段。当核酸构建体含有表达编码序列所需要的所有控制序列时,术语核酸构建体与术语“表达盒”的含义相同,其中所述控制序列可操作地连接至所述编码序列。
如本文所用,术语“可操作地连接”是指核酸序列要素(或编码序列或核酸序列)以功能关系连接。当核酸序列与另一核酸序列处于功能关系时,该核酸序列是“可操作地连接”。例如,如果启动子或增强子影响编码序列的转录,则它与编码序列可操作地连接。
如本文所用,术语“启动子”是指用于控制一个或多个基因的转录,相对于基因的转录起始位点的转录方向位于上游并且在结构上通过以下方式鉴定的核酸片段:存在DNA依赖性RNA聚合酶的结合位点、转录起始位点和本领域技术人员已知的任何其他DNA序列。“组成型”启动子是在大多数环境和发育条件下具有活性的启动子。“诱导型”启动子是在环境或发育调节下有活性的启动子。
可用于实现编码酶(诸如UGT多肽或根据本公开的重组细胞中引入的任何其他酶)的核酸序列表达的启动子可以不与编码待表达的酶的核酸序列同源,即与其可操作地连接的核酸序列(编码序列)异源的启动子。
本文中合适的启动子包括本领域技术人员熟知的组成型和诱导型天然启动子以及工程化启动子。细胞中合适的启动子可以是GAL7、GAL10或GAL1、CYC1、HIS3、ADH1、PGL、PH05、GAPDH、ADC1、TRP1、URA3、LEU2、ENO、TPI和AOX1。其他合适的启动子包括PDC、GPD1、PGK1、TEF1和TDH。
通常,编码酶的核酸序列包含终止子。在细胞中起作用的任何终止子可用于本公开。优选的终止子得自细胞的天然基因。合适的终止子序列是本领域熟知的。优选地,在根据本公开的重组细胞中,此类终止子与防止无义介导的mRNA衰变的突变组合(参见例如:Shirley等,2002,Genetics 161:1465-1482)。
本公开进一步涉及载体,优选表达载体,其包含根据本公开的核酸序列或核酸构建体(即,包含编码根据本公开的UGT多肽的序列)。
为了促进UGT的表达和/或翻译,编码UGT的核酸序列可以包含在表达载体中,使得编码UGT的基因与适当的控制序列可操作地连接以在体外或在根据本公开的重组细胞中表达和/或翻译。也就是说,本公开提供了一种表达载体,该表达载体包含根据本公开的核酸序列或核酸构建体。
表达载体可以是能够方便地进行重组DNA程序并能使编码UGT多肽的核酸序列表达的任何载体(例如,质粒或病毒)。载体的选择通常取决于载体与要引入载体的细胞的相容性。载体可以是线性或闭合的环状质粒。载体可以是自主复制型载体,即作为染色体外实体而存在、其复制独立于染色体复制的载体,例如,质粒、染色体外要素、微型染色体或人工染色体。如果打算用于真菌来源的细胞,则合适的附加型核酸构建体可以例如基于酵母2μ或pKD1质粒(Gleer等,1991,Biotechnology 9:968-975)或AMA质粒(Fierro等,1995,CurrGenet.29:482-489)。
或者,表达载体可以是当被引入细胞时整合至基因组中并与其已整合至其中的染色体一起复制的载体。整合型克隆载体可随机或在预定靶基因座处整合在细胞的染色体中。在根据本公开的一个优选实施方式中,整合型克隆载体包含DNA片段,所述DNA片段与宿主细胞基因组中预定靶基因座中的DNA序列同源以使克隆载体的整合靶向该预定基因座。为了促进靶向整合,优选在转化细胞之前将克隆载体线性化。优选进行线性化,使得克隆载体的至少一端但优选任一端的侧翼是与靶基因座同源的序列。靶基因座侧翼的同源序列的长度优选为至少20bp、至少30bp、至少50bp、至少0.1kb、至少0.2kb、至少0.5kb、至少1kb、至少2kb或更长。靶向整合到细胞基因组中(即整合在预定靶基因座中)的效率通过宿主细胞的增强的同源重组能力来增加。
克隆载体中与靶基因座同源的同源侧翼DNA序列可以源自高度表达的基因座,这意味着它们源自能够在宿主细胞中具有高表达水平的基因。能够具有高表达水平的基因,即高度表达的基因,在本文中定义为其mRNA可构成总细胞mRNA的至少0.5%(w/w)的基因,例如在诱导条件下,或者其基因产物可构成总细胞蛋白质的至少1%(w/w)或者(在分泌的基因产物的情况下)可以分泌至至少0.1g/l的水平的基因。更典型地,靶基因座可以是基因间位置,从而基因不被中断。这样的基因座也可以提供高表达水平。因此,克隆载体中的同源侧翼DNA序列可以与基因间靶基因座同源。
核酸构建体或表达载体可以在根据本公开的宿主细胞中体内组装,并且任选地,在单个步骤中整合到细胞的基因组中(参见,例如,WO2013/076280)。
可以将多于一个拷贝的根据本公开的核酸构建体或表达载体插入宿主细胞中以增加由核酸构建体内包含的核酸序列编码的UGT多肽的产生(过量表达)。这可以优选通过将两个或更多个核酸拷贝整合到其基因组中来进行,更优选通过使核酸整合靶向如上定义的基因座来进行。
本领域技术人员应理解,表达载体的设计可取决于这些因素:例如要转化的宿主细胞的选择、所需蛋白质的表达水平等。可以将根据本公开的表达载体引入宿主细胞中,从而产生由本文所述的核酸编码的蛋白质或肽(例如SEQ ID NO:2的UGT,例如功能等同物或片段,或包含一种或多种此类UGT的融合蛋白)。
可以设计根据本公开的核酸构建体和载体用于在原核宿主细胞或真核宿主细胞中表达根据本公开的UGT多肽。
可以通过常规转化或转染技术将根据本公开的核酸构建体和/或表达载体引入原核或真核细胞中。如本文所用,术语“转化”和“转染”意指用于将外来核酸(例如DNA)引入本领域技术人员熟知的细胞中的各种本领域公认的技术。用于转化或转染细胞的合适方法可以在Sambrook等人(Molecular Cloning:A Laboratory Manual,第二版,Cold SpringHarbor Laboratory,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY,1989),Davis等,Basic Methods in Molecular Biology(1986)和其他实验室手册中找到。
根据本公开的“功能等同物”是编码表现出如本文所定义的根据本公开的UGT的特定功能的多肽的分离的核酸片段。因此,功能等同物还包括生物活性片段,并且其自身包含在根据本公开的术语“UGT”(或类似物)内。
优选地,根据本公开的功能等同物包括本文描述的一个或多个取代。然而,除了上述取代之外,功能等同物还可以包括一种或多种修饰。
功能性核酸等同物通常可含有沉默突变或不改变编码的UGT多肽的生物学功能的突变。因此,本公开提供了编码UGT蛋白的核酸分子,所述UGT蛋白含有对特定生物活性(即UGT活性)不是必需的氨基酸残基的变化。
UGT蛋白的这些功能等同物的氨基酸序列与其衍生自的亲本UGT序列不同,但仍保留亲本UGT的至少一种生物活性,优选它们至少保留UGT活性。技术人员将认识到,可以通过突变将变化引入根据本公开的核酸序列中,从而导致所得蛋白质的氨基酸序列的变化而基本上不改变这种蛋白质的功能。
在一个实施方式中,分离的核酸分子包含编码蛋白质的核酸序列,其中蛋白质包含与亲本UGT或参考氨基酸序列(例如,如SEQ ID NO:2所示)具有至少约60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%同一性的氨基酸序列。
因此,根据本公开的UGT的功能等同物优选为蛋白质,该蛋白质包含与亲本UGT氨基酸序列或参考多肽序列(例如,如SEQ ID NO:2所示)具有至少约60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高同一性的氨基酸序列,并且通常还保留亲本UGT多肽的至少一种功能活性。
具有UGT活性的根据本公开的多肽可包含与SEQ ID NO:4、SEQ ID NO:6、SEQ IDNO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18或SEQ IDNO:20中的任何一个具有至少约80%序列同一性,至少约90%的序列同一性,至少约95%的序列同一性,至少约96%,至少约97%,至少约98%或至少约99%的序列同一性的氨基酸序列。
根据本公开的UGT多肽可以具有表2中定义的序列或表2中定义的取代模式(就位置而言,如果不是完全相同的氨基酸取代)。
根据本公开的UGT多肽可以例如通过筛选合适的参考多肽的突变体(例如取代突变体)库来鉴定。当在重组细胞中表达时(与表达参考多肽的相应细胞相比),可以基于候选突变体增加甜菊醇或甜菊醇糖苷产生的能力来筛选候选突变体。
根据本公开的核酸片段可包含不编码功能性多肽的序列或由其组成。此类核酸可以用作探针或PCR反应的引物。
根据本公开的核酸,无论它们编码功能性多肽还是非功能性多肽,都可以用作杂交探针或聚合酶链式反应(PCR)引物。不编码具有UGT活性的多肽的本公开的核酸分子的用途尤其包括:(1)原位杂交(例如FISH)至中期染色体扩散(spreads),以提供UGT编码基因的精确染色体定位,如Verma等,Human Chromosomes:a Manual of Basic Techniques,Pergamon Press,New York(1988)所述;(2)Northern印迹分析,用于检测UGT mRNA在特定组织和/或细胞中的表达;(3)可用作诊断工具的探针和引物,用于分析在给定的生物(例如组织)样品中可与这种探针或引物杂交的核酸的存在。
基于给定参考UGT酶的根据本公开的UGT可以通过以下标准程序获得:
-诱变(易错、掺杂低聚糖(doped oligo)、加标低聚糖
(spiked oligo))或变体的合成
-在例如Y.lipolytica或S.cerevisiae中转化
-培养转化体,选择转化体
-在例如Y.lipolytica或S.cerevisiae中表达
-初步筛选,例如基于甜菊醇或甜菊醇糖苷的产生
-鉴定改良的UGT。
在一个实施方式中,本公开涉及一种生产根据本公开的UGT多肽的方法,该方法包括:
a)选择参考UGT多肽(即模板或起始多肽);
b)取代至少一个与35、189、280、284、285、334或373中的任一者对应的氨基酸残基,
所述位置是参考SEQ ID NO:2定义的;
c)任选地取代一个或多个如b)中所定义的其他氨基酸;
d)制备由步骤a)-c)得到的UGT;
e)确定该UGT的属性,例如如实施例中所述;以及
f)选择与参考UGT多肽相比具有改变特性的UGT。
在产生根据本公开的UGT多肽的方法的一个优选实施方式中,参考UGT多肽具有SEQ ID NO:2所示的序列。
更优选地在根据本公开的方法的步骤b)中,至少一个与35、189、280、284、285、334或373中的任一者对应的氨基酸残基被取代,所述位置是参考SEQ ID NO:2定义的。参考多肽可与SEQ ID NO:2具有至少约80%的同源性。
在另一个实施方式中,本公开的特征在于细胞,例如含有根据本公开的核酸、核酸构建体或载体的转化细胞或重组细胞。根据本公开的“重组细胞”或“宿主细胞”通常是已经借助于重组DNA技术将根据本公开的核酸(即编码根据本公开的UGT的核酸)引入到其(或其祖先)中的细胞。在本公开的上下文中,根据本公开的“细胞”或所述细胞的亲本可以是任何类型的细胞。
因此,根据本公开的细胞可以包含编码一种或多种根据本公开的UGT多肽的重组核酸。
根据本公开的细胞可以是真核或原核细胞。因此,包括原核和真核细胞两者,例如细菌、真菌、酵母等,特别优选的是来自酵母(例如S.cerevisiae、Y.lipolytica和K.lactis)的细胞。宿主细胞还包括但不限于哺乳动物细胞系,诸如CHO、VERO、BHK、HeLa、COS、MDCK、293、3T3、WI38,以及脉络丛细胞系。
因此,本公开提供了用于产生UGT的方法,该方法包括在适合于产生UGT的条件下培养如本文所述的重组细胞,以及任选地回收所述UGT。通常,重组细胞能够产生甜菊醇或甜菊醇糖苷。
根据本公开的重组细胞可包含如本文所述的任何多肽。通常,根据本公开的重组细胞能够产生甜菊醇糖苷。通常,根据本公开的重组细胞能够产生糖基化的二萜,诸如甜菊醇糖苷。例如,根据本公开的重组细胞可以能够产生例如以下物质中的一种或多种:甜菊醇-13-单苷、甜菊醇-19-单苷、13-[(β-D-吡喃葡萄糖基)氧基]贝壳杉烯-16-烯-18-油酸2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖酯(13-[(β-D-Glucopyranosyl)oxy)kaur-16-en-18-oic acid 2-O-β-D-glucopyranosyl-β-D-glucopyranosyl ester)、甜茶苷、甜菊苷、甜菊醇-19-二苷、甜菊双糖苷、莱鲍迪甙A、莱鲍迪甙E、莱鲍迪甙D或莱鲍迪甙M。
根据本公开的重组细胞可以包含一种或多种编码一种或多种具有UDP-糖基转移酶(UGT)活性的多肽的重组核酸序列。
出于本公开的目的,具有UGT活性的多肽是具有糖基转移酶活性(EC2.4)的多肽,即可以充当催化剂以将单糖单元从活化的核苷酸糖(又称“糖基供体”)转移到糖基受体分子(通常是醇)的多肽。UGT的糖基供体通常是核苷酸糖尿苷二磷酸酯葡萄糖(尿嘧啶-二磷酸酯葡萄糖,UDP-葡萄糖)。
可以选择这种附加的UGT以产生期望的甜菊醇糖苷。Humphrey等,PlantMolecular Biology(2006)61:47-62和Mohamed等,J.Plant Physiology168(2011)1136-1141中示出了甜菊醇糖苷形成的示意图。此外,图1示出了甜菊醇糖苷形成的示意图。
因此,根据本公开的重组细胞可以包含一种或更多种重组核酸序列,所述重组核酸序列编码以下中的一种或更多种:
(i)具有UGT2活性的多肽;
(ii)具有UGT85C2活性的多肽;以及
(iii)具有UGT76G1活性的多肽。
根据本公开的重组细胞可以包含重组核酸序列,该重组核酸序列编码具有UGT74G1活性的多肽(不同于根据本公开的UGT多肽)。也就是说,根据本公开的重组细胞可以包含一种或多种核酸序列,该一种或多种核酸序列构成两种或更多种具有UGT活性的不同的多肽,其中一种多肽是根据本公开的UGT多肽。
适用于本公开的重组酵母可以包含这样的核酸序列,所述核酸序列编码能够催化将C-13-葡萄糖添加到甜菊醇的多肽。也就是说,适用于根据本公开的方法的重组酵母可以包含UGT,所述UGT能够催化将甜菊醇转换为甜菊单糖苷的反应。
适用于根据本公开的方法的这种重组酵母可以包含编码具有由UDP-糖基转移酶(UGT)UGT85C2所示的活性的多肽的核酸序列,由此核酸序列在转化酵母后赋予该酵母将甜菊醇转换为甜菊醇糖苷的能力。
UGT85C2活性是将葡萄糖单元转移至甜菊醇的13-OH。因此,合适的UGT85C2可充当尿苷5'-二磷酸葡糖基:甜菊醇13-OH转移酶和尿苷5'-二磷酸葡糖基:甜菊醇-19-O-葡糖苷13-OH转移酶。功能性UGT85C2多肽还可催化葡糖基转移酶反应,所述反应利用除甜菊醇和甜菊醇-19-O-葡糖苷以外的甜菊醇糖苷底物。此类序列可在本文中称为UGT1序列。
适用于本公开的重组酵母可以包含编码具有UGT2活性的多肽的核酸序列。
具有UGT2活性的多肽是充当尿苷5'-二磷酸葡糖基:甜菊醇-13-O-葡糖苷转移酶(又称甜菊醇-13-单葡萄糖苷1,2-转葡萄糖基酶)的多肽,其将葡萄糖部分(glucosemoiety)转移到受体分子甜菊醇-13-O-葡糖苷的13-O-葡萄糖的C-2'。典型地,适合的UGT2多肽还充当将葡萄糖部分转移到受体分子甜茶苷的13-O-葡萄糖的C-2'的尿苷5'-二磷酸葡糖基:甜茶苷转移酶。
具有UGT2活性的多肽也可以催化利用除甜菊醇-13-O-葡糖苷和甜茶苷以外的甜菊醇糖苷底物的反应,例如,功能性UGT2多肽可利用甜菊苷作为底物,将葡萄糖部分转移至19-O-葡萄糖残基的C-2'以产生莱鲍迪甙E。功能性UGT2多肽也可以利用莱鲍迪甙A作为底物,从而将葡萄糖部分转移至19-O-葡萄糖残基的C-2'以产生莱鲍迪甙D。
具有UGT2活性的多肽也可以从除尿苷二磷酸酯葡萄糖以外的供体转移糖部分。例如,具有UGT2活性的多肽充当尿苷5'-二磷酸D-木糖基:甜菊醇-13-O-葡糖苷转移酶,其将木糖部分(xylose moiety)转移至受体分子甜菊醇-13-O-葡糖苷的13-O-葡萄糖的C-2'。作为另一个实例,具有UGT2活性的多肽可充当尿苷5'-二磷酸L-鼠李糖基:甜菊醇-13-O-葡糖苷转移酶,其将鼠李糖部分(rhamnose moiety)转移至受体分子甜菊醇的13-O-葡萄糖的C-2'。
适用于本公开的方法的重组酵母可以包含这样的核酸序列,所述核酸序列编码能够催化甜菊苷的C-13位处的葡萄糖的C-3'的糖基化的多肽。也就是说,适用于根据本公开的方法的重组酵母可以包含UGT,所述UGT能够催化将甜菊苷转换为莱鲍迪甙A的反应。因此,这种重组酵母可以能够将甜菊苷转换为莱鲍迪甙A。此类核酸序列的表达可以赋予酵母产生至少莱鲍迪甙A的能力。
适用于本公开的方法的重组酵母可以包含这样的核酸序列,所述核酸序列编码能够催化莱鲍迪甙D的C-19位处的葡萄糖的C-3'的糖基化的多肽。也就是说,适用于根据本公开的方法的重组酵母可以包含UGT,所述UGT能够催化将莱鲍迪甙D转换为莱鲍迪甙M的反应。因此,这种重组酵母可以能够将莱鲍迪甙D转换为莱鲍迪甙M。此类核酸序列的表达可以赋予酵母产生至少莱鲍迪甙M的能力。
因此,适用于根据本公开的方法的重组酵母也可以包含编码具有由UDP-糖基转移酶(UGT)UGT76G1所示的活性的多肽的核酸序列,由此该核酸序列在转化酵母后赋予该酵母将甜菊苷转换为莱鲍迪甙A或将莱鲍迪甙D转换为莱鲍迪甙M的能力。
合适的UGT76G1向受体分子甜菊醇1,2糖苷的C-13-O-葡萄糖的C-3'添加葡萄糖部分。因此,UGT76G1充当例如尿苷5'-二磷酸葡糖基:甜菊醇13-O-1,2葡糖苷C-3'葡糖基转移酶和尿苷5'-二磷酸葡糖基:甜菊醇-19-O-葡萄糖、13-O-1,2双糖苷C-3'葡糖基转移酶。功能性UGT76G1多肽还可催化葡糖基转移酶反应,所述反应使用含有除葡萄糖以外的糖的甜菊醇糖苷底物,例如甜菊醇鼠李糖苷和甜菊醇木糖苷。此类序列可在本文中被称为UGT4序列。UGT4可以替代地或者另外地能够将RebD转换为RebM。
适用于根据本公开的方法的重组酵母通常包含编码至少一种具有UGT1活性的多肽、至少一种具有UGT2活性的多肽、至少一种具有UGT3活性的多肽和至少一种具有UGT4活性的多肽的核酸序列。这些核酸序列中的一种或更多种可以是重组的。给定的核酸可编码具有一种或更多种上述活性的多肽。例如,核酸可编码具有两种、三种或四种上述活性的多肽。优选地,用于本公开的方法的重组酵母包含UGT1、UGT2和UGT3以及UGT4活性。在WO2015/007748的表1中描述了合适的UGT1、UGT2、UGT3和UGT4序列。
根据本公开的重组细胞可以包含两种或更多种编码具有任何一种UGT活性(例如,UGT1、UGT2、UGT3或UGT4活性)的多肽的核酸序列。当根据本公开的重组细胞包含两种或更多种编码具有任何一种UGT活性的多肽的核酸序列时,这些核酸序列可以相同或不同,且/或可编码相同或不同的多肽。例如,根据本公开的重组细胞可以包含编码两种不同UGT2多肽的核酸序列。
根据本公开的重组细胞可以包含重组核酸序列,该重组核酸序列编码具有UGT3活性的多肽(不同于根据本公开的UGT3)。也就是说,根据本公开的重组细胞可以包含一种或多种核酸序列,该一种或多种核酸序列构成两种或更多种具有UGT活性的不同的多肽,其中一种多肽是根据本公开的UGT多肽。
根据本公开的重组细胞可以包含编码以下项中的一种或更多种的一种或更多种重组核酸序列:
具有对映-柯巴基焦磷酸酯合酶活性的多肽;
具有对映-贝壳杉烯合酶活性的多肽;
具有对映-贝壳杉烯氧化酶活性的多肽;以及
具有贝壳杉烯酸13-羟化酶活性的多肽。
出于本公开的目的,具有对映-柯巴基焦磷酸酯合酶(EC 5.5.1.13)的多肽能够催化以下化学反应:
Figure BDA0002335996880000251
所述酶具有一种底物,香叶基香叶基焦磷酸酯;以及一种产物,对映-柯巴基焦磷酸酯。所述酶参与赤霉素的生物合成。所述酶属于异构酶家族,特别是分子内裂解酶的类别。所述酶类别的系统名称是对映-柯巴基-二磷酸酯裂解酶(脱环)。通常使用的其他名称包括具有对映-柯巴基焦磷酸酯合酶、对映-贝壳杉烯合酶A和对映-贝壳杉烯合成酶A。
编码对映-柯巴基焦磷酸酯合酶的合适核酸序列可例如包含在WO2015/007748的SEQ ID.NO:1、3、5、7、17、19、59、61、141、142、151、152、153、154、159、160、182或184中所示的序列。
出于本公开的目的,具有对映-贝壳杉烯合酶活性(EC 4.2.3.19)的多肽是能够催化以下化学反应的多肽:
Figure BDA0002335996880000261
因此,所述酶具有一种底物,对映-柯巴基二磷酸酯;以及两种产物,对映-贝壳杉烯和二磷酸酯。
所述酶属于裂解酶家族,特别是作用于磷酸酯的碳-氧裂解酶。所述酶类别的系统名称是对映-柯巴基二磷酸酯二磷酸酯-裂解酶(环化,对映-贝壳杉烯形成)。常用的其它名称包括对映-贝壳杉烯合酶B、对映-贝壳杉烯合成酶B、对映-柯巴基-二磷酸酯二磷酸酯-裂解酶(环化)。所述酶参与双萜类生物合成。
编码对映-贝壳杉烯合酶的合适核酸序列可例如包含在WO2015/007748的SEQID.NO:9、11、13、15、17、19、63、65、143、144、155、156、157、158、159、160、183或184中列出的序列。
对映-柯巴基二磷酸酯合酶还可具有与相同蛋白质分子相关联的不同对映-贝壳杉烯合酶活性。由对映-贝壳杉烯合酶催化的反应是赤霉素的生物合成途径中的下一步骤。两种类型的酶活性是不同的,并且定点诱变以抑制蛋白质的对映-贝壳杉烯合酶活性导致对映-柯巴基焦磷酸酯的积累。
因此,根据本公开的重组细胞中使用的单个核酸序列可编码具有对映-柯巴基焦磷酸酯合酶活性和对映-贝壳杉烯合酶活性的多肽。或者,这两种活性可被两个不同的分离的核酸序列编码。
出于本公开的目的,具有对映-贝壳杉烯氧化酶活性(EC 1.14.13.78)的多肽是能够催化对映-贝壳杉烯的4-甲基的三次连续氧化以产生贝壳杉烯酸的多肽。这种活性通常需要细胞色素P450的存在。
编码对映-贝壳杉烯氧化酶的合适核酸序列可例如包含在WO2015/007748的SEQID.NO:21、23、25、67、85、145、161、162、163、180或186中列出的序列。
出于本公开的目的,具有贝壳杉烯酸13-羟化酶活性(EC 1.14.13)的多肽是能够催化使用NADPH和O2形成甜菊醇(对映-贝壳杉-16-烯-13-醇-19-酸)的多肽。这种活性也可被称为对映-贝壳杉烯酸13-羟化酶活性。
编码贝壳杉烯酸13-羟化酶的合适核酸序列可例如包含在WO2015/007748的SEQID.NO:27、29、31、33、69、89、91、93、95、97、146、164、165、166、167或185中列出的序列。
根据本公开的重组细胞可包含编码具有NADPH-细胞色素p450还原酶活性的多肽的重组核酸序列。也就是说,根据本公开的重组细胞可能够表达编码具有NADPH-细胞色素p450还原酶活性的多肽的核酸序列。出于本公开的目的,具有NADPH-细胞色素P450还原酶活性(EC 1.6.2.4;也称为NADPH:高铁血红蛋白氧化还原酶、NADPH:血红素蛋白氧化还原酶、NADPH:P450氧化还原酶、P450还原酶、POR、CPR、CYPOR)的多肽通常是一种这样的多肽,其为膜结合酶,从而允许电子从含有FAD和FMN的酶NADPH:细胞色素P450还原酶(POR;EC1.6.2.4)转移至宿主细胞的微粒体中的细胞色素P450。
在根据本公开的重组细胞中,可上调细胞产生香叶基香叶基二磷酸酯(GGPP)的能力。在本公开的上下文中上调意味着重组细胞比等同的非重组细胞产生更多的GGPP。
因此,根据本公开的重组细胞可包含编码羟甲基戊二酰基-辅酶A还原酶、法呢基-焦磷酸酯合成酶和香叶基香叶基二磷酸酯合酶的一个或多个核酸序列,由此微生物转化后所述核酸序列赋予微生物产生提高水平的GGPP的能力。因此,根据本公开的重组细胞可包含编码羟甲基戊二酰基-辅酶A还原酶、法呢基-焦磷酸酯合成酶和香叶基香叶基二磷酸酯合酶中的一种或多种的一个或多个重组核酸序列。
因此,根据本公开的重组细胞可包含编码以下中的一种或多种的核酸序列:
具有羟甲基戊二酰基-辅酶A还原酶活性的多肽;
具有法呢基-焦磷酸酯合成酶活性的多肽;
具有香叶基香叶基二磷酸酯合酶活性的多肽。
本文的宿主细胞是适于遗传操作的生物体,以及可以在可用于工业生产目标产物的细胞密度下培养的生物体。合适的宿主可以是微生物,例如可以在发酵装置中维持的微生物。宿主细胞可以是在自然界中发现的宿主细胞或遗传操作或经典诱变后来源自亲本宿主细胞的宿主细胞。
如本文所用,重组细胞是用一种或多种如本文定义的核酸序列进行遗传修饰或转化/转染的宿主。本文中的术语重组细胞还涵盖已经使用基因组编辑技术(诸如CRISPR-Cas)修饰的细胞。
一种或多种如本文定义的此类核酸序列的存在可改变微生物产生甜菊醇或甜菊醇糖苷,特别是一种或多种甜菊醇糖苷的能力。非重组细胞,即未转化/转染或遗传修饰的宿主,通常不包含一个或多个使细胞能够生产甜菊醇糖苷的核酸序列。因此,非重组细胞通常是不天然产生甜菊醇糖苷的细胞,尽管天然产生甜菊醇或甜菊醇糖苷且已根据本公开进行修饰(因此具有改变的产生甜菊醇糖苷的能力)的细胞被认为是根据本公开的重组细胞。
特别地,有可能的是,选自由对映-柯巴基焦磷酸酯合酶、对映-贝壳杉烯合酶、对映-贝壳杉烯氧化酶和贝壳杉烯酸13-羟化酶、UGTs、羟甲基戊二酰基-CoA还原酶、法呢基-焦磷酸酯合成酶、香叶基香叶基二磷酸酯合酶和NADPH-细胞色素p450还原酶组成的组的酶产自于细胞,并且赋予细胞生产甜菊醇或甜菊醇糖苷的能力可能不需要用一种或多种编码这些酶的核酸序列进行转化。根据本公开的优选细胞可以是天然能够产生GGPP(即以其非重组形式)的重组细胞。
通过经典的菌株改良可以获得宿主微生物的甜菊醇或甜菊醇糖苷生产的进一步改善。
宿主细胞可以是原核宿主细胞、古细菌宿主细胞或真核宿主细胞。
原核宿主细胞可以是但不限于细菌宿主细胞。真核宿主细胞可以是但不限于酵母、真菌、变形虫、藻类、动物、昆虫宿主细胞。
真核宿主细胞可以是真菌宿主细胞。“真菌”包括真菌(Eumycotina)亚门的所有物种(Alexopoulos,C.J.,1962,在Introductory Mycology,John Wiley&Sons,Inc.(约翰威立出版有限公司),纽约)。因此,术语真菌包括丝状真菌和酵母等等。
“丝状真菌”在本文中被定义为真核微生物,其包括真菌和卵菌亚门的所有丝状形式(如由Hawksworth等人,1995,同上所定义)。丝状真菌是以由壳多糖、纤维素、葡聚糖、壳聚糖、甘露聚糖以及其它复合多糖构成的菌丝壁为特征。营养体生长是通过菌丝延长,并且碳代谢是专性需氧的。丝状真菌菌株包括但不限于以下各项的菌株:Acremonium、Aspergillus、Agaricus、Aureobasidium、Cryptococcus、Corynascus、Chrysosporium、Filibasidium、Fusarium、Humicola、Magnaporthe、Monascus、Mucor、Myceliophthora、Mortierella、Neocallimastix、Neurospora、Paecilomyces、Penicillium、Piromyces、Phanerochaete、Podospora、Pycnoporus、Rhizopus、Schizophyllum、Sordaria、Talaromyces、Rasmsonia、Thermoascus、Thielavia、Tolypocladium、Trametes以及Trichoderma。可充当宿主细胞的优选丝状真菌菌株属于以下物种:Aspergillus niger、Aspergillus oryzae、Aspergillus fumigatus、Penicillium chrysogenum、Penicilliumcitrinum、Acremonium chrysogenum、Trichoderma reesei、Rasamsonia emersonii(先前称为Talaromyces emersonii)、Aspergillus sojae、Chrysosporium lucknowense、Myceliophtora thermophyla。用于比较转化和未转化细胞的发酵特征的参考宿主细胞包括例如Aspergillus niger CBS120.49、CBS 513.88;Aspergillus oryzae ATCC16868、ATCC 20423、IF0 4177、ATCC 1011、ATCC 9576、ATCC14488-14491、ATCC 11601、ATCC12892;Aspergillus fumigatus AF293(CBS101355);P.chrysogenum CBS 455.95;Penicilliumcitrinum ATCC 38065;Penicillium chrysogenum P2;Acremonium chrysogenum ATCC36225、ATCC 48272;Trichoderma reesei ATCC 26921、ATCC56765、ATCC 26921;Aspergillus sojae ATCC11906;Chrysosporium lucknowense ATCC44006以及所有这些菌株的衍生株。作为丝状真菌宿主细胞特别优选的是Aspergillus niger CBS 513.88及其衍生株。
真核宿主细胞可以是酵母细胞。优选的酵母宿主细胞可选自以下属:Saccharomyces(例如,S.cerevisiae、S.bayanus、S.pastorianus、S.carlsbergensis)、Brettanomyces、Kluyveromyces、Candida(例如,C.krusei、C.revkaufi、C.pulcherrima、C.tropicalis、C.utilis)、Issatchenkia(例如,I.orientalis)、Pichia(例如,P.pastoris)、Schizosaccharomyces、Hansenula、Kloeckera、Pachysolen、Schwanniomyces、Trichosporon、Yarrowia(例如,Y.lipolytica)(先前被分类为Candidalipolytica))、Yamadazyma。
原核宿主细胞可以是细菌宿主细胞。细菌宿主细胞可以是革兰氏阴性或革兰氏阳性细菌。细菌的实例包括但不限于,属于以下属的细菌:Bacillus(例如,B.subtilis、B.amyloliquefaciens、B.licheniformis、B.puntis、B.megaterium、B.halodurans、B.pumilus)、Acinetobacter、Nocardia、Xanthobacter、Escherichia(例如,大肠杆菌(例如,菌株DH1OB、Stbl2、DH5-α、DB3、DB3.1)、DB4、DB5、JDP682和ccdA-over(例如,美国申请号09/518,188)))、Streptomyces、Erwinia、Klebsiella、Serratia(S.marcessans)、Pseudomonas(例如,P.aeruginosa)、Salmonella(例如,S.typhimurium、S.typhi)。细菌还包括但不限于光合细菌(例如,绿色非硫细菌(例如,Choroflexus细菌(例如C.aurantiacus)、Chloronema(例如,C.gigateum))、绿色硫细菌(例如,Chlorobium细菌(例如,C.limicola)、Pelodictyon(例如,P.luteolum)、紫色硫细菌(例如,Chromatium(例如,C.okenii))以及紫色非硫细菌(例如,Rhodospirillum(例如,R.rubrum)、Rhodobacter(例如R.sphaeroides、R.capsulatus)和Rhodomicrobium细菌(例如R.vanellii))。
宿主细胞可以是来自非微生物生物体的宿主细胞。此类细胞的实例包括但不限于昆虫细胞(例如,Drosophila(例如,D.melanogaster)、Spodoptera(例如,S.frugiperdaSf9或Sf21细胞)和Trichoplusa(例如,High-Five细胞));线虫细胞(例如,C.elegans细胞);禽类细胞;两栖动物细胞(例如,Xenopus laevis细胞);爬行动物细胞;以及哺乳动物细胞(例如NIH3T3、293、CHO、COS、VERO、C127、BHK、Per-C6、Bowes黑色素瘤和HeLa细胞)。
本公开还提供了一种生产根据本公开的多肽的方法,所述方法包括:
(a)在有利于重组细胞产生多肽的条件下培养根据本公开的重组细胞,并且任选地,
(b)回收所述多肽。
根据本公开的重组细胞可能够在本领域中已知的任何合适的碳源上生长,并且将其转换为甜菊醇糖苷。重组细胞可能够直接转换植物生物质、纤维素、半纤维素、果胶、鼠李糖、半乳糖、岩藻糖、麦芽糖、麦芽糖糊精、核糖、核酮糖或淀粉、淀粉衍生物、蔗糖、葡萄糖、乳糖或甘油。因此,优选的细胞表达酶如用于将纤维素转换为葡萄糖单体和将半纤维素转换为木糖和阿拉伯糖单体所需的纤维素酶(内切纤维素酶和外切纤维素酶)和半纤维素酶(例如内切和外切木聚糖酶、阿拉伯糖酶),能够将果胶转换为葡萄糖醛酸和半乳糖醛酸的果胶酶或将淀粉转换为葡萄糖单体的淀粉酶。优选地,细胞能够转换选自由以下各项组成的组的碳源:葡萄糖、木糖、阿拉伯糖、蔗糖、乳糖和甘油。细胞可例如是WO03/062430、WO06/009434、EP1499708B1、WO2006096130或WO04/099381中所描述的真核细胞。
因此,在另一方面,本公开还提供了一种制备甜菊醇糖苷的方法,该方法包括在合适的培养基中在有利于生产甜菊醇糖苷的条件下培养根据本公开的重组细胞,以及任选地回收所述甜菊醇糖苷。
术语甜菊醇糖苷可以是莱鲍迪甙A(RebA)(CAS#58543-16-1)、莱鲍迪甙B(RebB)(CAS#58543-17-2)、莱鲍迪甙C(RebC)(CAS#63550-99-2)、莱鲍迪甙D(RebD)(CAS#63279-13-0)、莱鲍迪甙E(RebE)(CAS#63279-14-1)、莱鲍迪甙F(RebF)(CAS#438045-89-7)、莱鲍迪甙M(RebM)(CAS#1220616-44-3)、甜茶苷(CAS#63849-39-4),杜克甙A(CAS#64432-06-0)、莱鲍迪甙I(RebI)(MassBank记录:FU000332)、莱鲍迪甙Q(RebQ)、1,2-甜菊苷(CAS#57817-89-7)、1,3-甜菊苷(RebG)、1,2-二糖苷(MassBank记录:FU000299)、1,3-二糖苷、甜菊醇-13-O-葡萄糖苷(13-SMG)、甜菊醇-19-O-葡萄糖苷(19-SMG)、三葡糖基化甜菊醇糖苷、四糖基化甜菊醇糖苷、五葡糖基化甜菊醇糖苷、六葡糖基化甜菊醇糖苷、七葡糖基化甜菊醇糖苷,以及它们的异构体。
在制备甜菊醇糖苷的方法中使用的培养基可以是允许根据本公开的特定重组细胞生长的任何合适的培养基。培养基的基本要素是本领域的技术人员已知的,并且可适用于所选择的重组细胞。
优选地,培养基包含选自由以下各项组成的组的碳源:植物生物质、纤维素、半纤维素、果胶、鼠李糖、半乳糖、岩藻糖、果糖、麦芽糖、麦芽糖糊精、核糖、核酮糖或淀粉、淀粉衍生物、葡萄糖、蔗糖、乳糖、脂肪酸、甘油三酯和甘油。优选地,培养基还包含氮源,如尿素;或铵盐,如硫酸铵、氯化铵、硝酸铵或磷酸铵。
根据本公开的方法可以分批、分批补料或连续模式进行。也可应用单独的水解和发酵(SHF)方法或同时糖化和发酵(SSF)方法。这些方法模式的组合对于最佳生产率来说也可以是可行的。如果在方法中使用淀粉、纤维素、半纤维素或果胶作为碳源,则SSF方法可以是特别有吸引力的,其中可需要添加水解酶如纤维素酶、半纤维素酶或果胶酶以水解底物。
在用于制备甜菊醇糖苷的方法中使用的重组细胞可以是如上文所定义的任何合适的重组细胞。在所述方法中使用根据本公开的重组真核细胞可以是有利的,因为大多数真核细胞不需要用于繁殖的无菌条件并且对噬菌体感染不敏感。此外,真核细胞可在低pH下生长以防止细菌污染。
根据本公开的重组细胞可以是兼性厌氧微生物。兼性厌氧重组细胞可以需氧方式繁殖至高细胞浓度。然后可在高细胞密度下进行这种厌氧阶段,这显著地降低了所需的体积并且可使需氧微生物污染的风险最小化。
用于产生根据本公开的甜菊醇糖苷的方法可以是需氧或厌氧方法。
厌氧方法可在本文中定义为在不存在氧的情况下运行或者基本上不消耗氧(优选小于5、2.5或1mmol/L/h),并且其中有机分子充当电子供体和电子受体两者的方法。根据本公开的方法也可首先在需氧条件下运行,且随后在厌氧条件下运行。
方法也可在限氧或微需氧条件下进行。或者,方法可首先在需氧条件下运行,且随后在限氧条件下运行。限氧方法是其中氧消耗受到从气体到液体的氧传递的限制的过程。氧限制的程度由进入气流的量和组成以及所用设备的实际混合/传质特性决定。
在根据本公开的方法中产生甜菊醇糖苷可在细胞的生长阶段期间、固定(稳定状态)阶段期间或在两个阶段期间发生。在不同的温度下运行方法可以是可行的。
用于生产甜菊醇糖苷的方法可在对于重组细胞来说最佳的温度下进行。对于每种转化的重组细胞而言,最佳生长温度可不同并且是本领域技术人员已知的。最佳温度可高于野生型生物的最适温度以在非无菌条件下在最低感染敏感性和最低冷却成本的条件下有效生长生物体。或者,所述方法可在对于重组细胞的生长来说不是最佳的温度下进行。
用于产生根据本公开的甜菊醇糖苷的方法可在任何合适的pH值下进行。如果重组细胞是酵母,则培养基中的pH优选具有低于6、优选低于5.5、优选低于5、优选低于4.5、优选低于4、优选低于pH 3.5或低于pH3.0或低于pH 2.5、优选高于pH 2的值。在这些低pH值下进行所述方法的优点是可防止培养基中污染细菌的生长。
这种方法可以以工业规模进行。这种方法的产物是一种或多种甜菊醇糖苷,例如,以下各项的一种或多种,例如,甜菊醇-13-单苷、甜菊醇-19-单苷、13-[(β-D-吡喃葡萄糖基)氧基]贝壳杉烯-16-烯-18-油酸2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖酯、甜茶苷、甜菊苷、甜菊醇-19-二苷、甜菊双糖苷、莱鲍迪甙A、莱鲍迪甙E、莱鲍迪甙D或莱鲍迪甙M。
从培养基中回收甜菊醇糖苷可通过本领域已知的方法进行,例如通过蒸馏、真空萃取、溶剂萃取或蒸发。
在用于产生根据本公开的甜菊醇糖苷的方法中,实现高于5mg/l培养液、优选高于10mg/l、优选高于20mg/l、优选高于30mg/l培养液、优选高于40mg/l、更优选高于50mg/l、优选高于60mg/l、优选高于70、优选高于80mg/l、优选高于100mg/l、优选高于1g/l、优选高于5g/l、优选高于10g/l,但通常低于70g/l的浓度是可行的。
本公开还提供了一种包含能够通过根据本公开的用于制备甜菊醇糖苷的方法获得的甜菊醇糖苷的培养液。
根据本公开的培养液可包含根据本公开的重组细胞。或者,根据本公开的培养液可以是不存在或基本上不存在根据本公开的所有重组细胞的培养液,例如上清液。
在微生物中表达一种或多种甜菊醇糖苷的情况下,可需要处理此类细胞以释放它们。优选地,在细胞外产生至少一种甜菊醇糖苷,例如rebA、rebD或rebM。
与由表达参考多肽而不是根据本公开的多肽的重组细胞产生的培养液相比,根据本公开的培养液可包含多于至少一种甜菊醇糖苷,诸如rebA、rebD或rebM。
与由表达参考多肽而不是根据本公开的多肽的重组细胞产生的培养液相比,根据本公开的培养液可包含较少的至少一种非甜菊醇糖苷,例如,一种或多种贝壳杉烯酸糖苷。
本公开还提供了一种通过根据本公开的用于制备甜菊醇糖苷的方法获得的或能够从根据本公开的培养液获得的甜菊醇糖苷。这种甜菊醇糖苷可以是非天然存在的甜菊醇糖苷,也就是说不在植物中产生的甜菊醇糖苷。
本公开还提供了一种包含能够通过用于制备甜菊醇糖苷的根据本公开的方法获得的或能够从根据本公开的培养液获得的一种或更多种(例如两种或更多种)甜菊醇糖苷的组合物,例如甜味剂组合物。在这种组合物中,一种或多种甜菊醇糖苷可以是非天然存在的甜菊醇糖苷,也就是说不在植物中产生的甜菊醇糖苷。
此外,本公开提供了一种将甜菊醇或第一甜菊醇糖苷分别转换为甜菊醇糖苷或第二甜菊醇糖苷的方法,该方法包括:
-使所述甜菊醇或第一甜菊醇糖苷与根据本公开的重组细胞、源自所述重组细胞的无细胞提取物或源自上述任一者的酶制备物接触;
-从而将所述第一甜菊醇糖苷转换为所述第二甜菊醇糖苷。
第一甜菊醇糖苷可以是任何甜菊醇糖苷,诸如图1所示的甜菊醇糖苷。
第二甜菊醇糖苷可以是通过UGT酶作用于第一甜菊醇糖苷而产生的任何甜菊醇糖苷(例如图1所示的任何甜菊醇糖苷)。
在这种方法中,第二甜菊醇糖苷可以是例如rebA、rebE、rebD或RebM。
在这种方法中,第一甜菊醇糖苷可以是甜菊苷、rebB、rebA、rebE或rebD,并且第二甜菊醇糖苷可以是rebA、rebD或rebM。
优选地,第一甜菊醇糖苷是rebA并且第二甜菊醇糖苷是rebD,或者第一甜菊醇糖苷是rebD并且第二甜菊醇糖苷是rebM。第一甜菊醇糖苷可以是rebB并且第二甜菊醇糖苷可以是rebA。
也就是说,本公开涉及生物转换或生物转化的方法。
通过根据本公开的方法产生的甜菊醇糖苷或组合物可用于对于此类化合物来说已知的任何应用中。特别地,它们可例如用作甜味剂,例如用于食品或饮料中。因此,根据本公开,提供了一种包含根据本公开的甜菊醇糖苷或组合物的食品、饲料或饮料。
例如,根据本公开的甜菊醇糖苷或组合物可被配制成软饮料、配制为桌面甜味剂、口香糖、乳制品如酸奶(例如原味酸奶)、蛋糕、谷物或基于谷类的食物、营养食品、药物、食用凝胶、糖果产品、化妆品或牙膏等。此外,根据本公开的甜菊醇糖苷或组合物可用作甜味剂,不仅用于饮料、食品和其它专门用于人消费的产品,而且用于具有改进的特性的动物饲料和草料中。
因此,本发明尤其提供了一种包含根据本公开的方法制备的甜菊醇糖苷的食品、饲料或饮料。
在食品、饮料、药物、化妆品、桌面产品、口香糖的制造过程中,可使用诸如混合、捏合、溶解、酸浸、渗透、渗滤、喷洒、雾化、灌注和其它方法的常规方法。
根据本公开的甜菊醇糖苷或组合物可以以干燥形式或液体形式使用。可以在食品热处理之前或之后加入。甜味剂的量取决于使用目的。可以单独加入或者与其它化合物组合加入。
根据本公开的方法产生的化合物可以可与一种或多种其它非热量或热量甜味剂掺混。这种掺混可用于改进风味或时间特征或稳定性。广泛范围的非热量和热量甜味剂二者可适用于与根据本公开的甜菊醇糖苷或组合物掺混。例如,非热量甜味剂如罗汉果苷、莫纳甜、阿斯巴甜、安赛蜜盐、环磺酸盐、三氯蔗糖、糖精盐或赤藓糖醇。适用于与根据本公开的甜菊醇糖苷或组合物掺混的热量甜味剂包括糖醇和碳水化合物如蔗糖、葡萄糖、果糖和HFCS。还可使用甜味氨基酸,如甘氨酸、丙氨酸或丝氨酸。
根据本公开的甜菊醇糖苷或组合物可与甜味剂抑制剂如天然甜味剂抑制剂组合使用。它可与鲜味增强剂如氨基酸或其盐组合。
根据本公开的甜菊醇糖苷或组合物可与多元醇或糖醇、碳水化合物、生理活性物质或功能成分(例如类胡萝卜素、膳食纤维、脂肪酸、皂苷、抗氧化剂、营养品、类黄酮、异硫氰酸酯、苯酚、植物甾醇或甾烷醇(植物甾醇和植物甾烷醇)、多元醇、益生元、益生菌、植物雌激素、大豆蛋白、硫化物/硫醇、氨基酸、蛋白质、维生素、矿物质和/或基于健康益处如心血管、降胆固醇或抗炎分类的物质组合。
具有根据本公开的甜菊醇糖苷或组合物的组合物可包括调味剂、芳香组分、核苷酸、有机酸、有机酸盐、无机酸、苦味化合物、蛋白质或蛋白质水解产物、表面活性剂、类黄酮、收敛剂化合物、维生素、膳食纤维、抗氧化剂、脂肪酸和/或盐。
根据本公开的甜菊醇糖苷或组合物可作为高强度甜味剂应用,以产生具有改进的味道特征的零卡路里、低卡路里或糖尿病人用饮料和食品。它也可用于不能使用糖的饮料、食品、药物和其他产品中。
此外,根据本公开的甜菊醇糖苷或组合物可用作甜味剂,不仅用于饮料、食品和其它专门用于人消费的产品,而且用于具有改进的特性的动物饲料和草料中。
根据本公开的甜菊醇糖苷或组合物可用作甜味化合物的产品的实例可以是酒精饮料,如伏特加酒、葡萄酒、啤酒、烈酒、清酒等;天然果汁、提神饮料、碳酸软饮料、减肥饮料、零卡路里饮料、低卡路里饮料和食物、酸奶饮料、速溶果汁、速溶咖啡、粉末型速溶饮料、罐装产品、糖浆、发酵大豆酱、酱油、醋、调味品、蛋黄酱、番茄酱、咖喱、汤、速食肉汤、酱油粉、醋粉、多种类型的饼干、香米饼、咸饼干、面包、巧克力、焦糖、糖果、口香糖、果冻、布丁、蜜饯和腌菜、鲜奶油、果酱、橘子酱、糖花膏、奶粉、冰淇淋、冰糕、包装在瓶中的蔬菜和水果、罐装和煮熟的豆类、在甜味酱中煮熟的肉和食物、农业蔬菜食品、海鲜、火腿、香肠、鱼火腿、鱼香肠、鱼酱、油炸鱼制品、干制海产品、冷冻食品、腌渍海带、腊肉、烟草、医药产品等。原则上它可具有无限应用。
甜味组合物包括饮料,其非限制性实例包括非碳酸和碳酸饮料,如可乐、姜汁汽水、根汁汽水、苹果汁、水果味软饮料(例如柑橘味软饮料,如柠檬莱姆或橙汁)、软饮料粉等;来自水果或蔬菜的汁、包括榨汁等的汁、含有果粒的果汁、水果饮料、果汁饮料、含果汁的饮料、具有水果调味料的饮料、蔬菜汁、含蔬菜的汁以及含水果和蔬菜的混合汁;运动饮料、能量饮料、近水(near water)等的饮料(例如具有天然或合成调味剂的水);茶类或喜好型饮料如咖啡、可可、红茶、绿茶、乌龙茶等;含乳成分饮料如乳饮料、含乳成分咖啡、牛奶咖啡、奶茶、果奶饮料、饮用酸奶、乳酸菌饮料等;以及乳制品。
通常,甜味组合物中存在的甜味剂的量取决于甜味组合物的具体类型及其所需的甜度而广泛变化。本领域的普通技术人员可容易确定加入到甜味组合物中的甜味剂的适当量。
根据本公开的甜菊醇糖苷或组合物可以以干燥形式或液体形式使用。可以在食品热处理之前或之后加入。甜味剂的量取决于使用目的。可以单独加入或者与其它化合物组合加入。
在食品、饮料、药物、化妆品、桌面产品、口香糖的制造过程中,可使用诸如混合、捏合、溶解、酸浸、渗透、渗滤、喷洒、雾化、灌注和其它方法的常规方法。
因此,本公开的组合物可通过本领域的技术人员已知的提供成分的均匀或均质混合物的任何方法来制备。这些方法包括干混、喷雾干燥、团聚、湿法制粒、压实、共结晶等。
呈固体形式时,根据本公开的甜菊醇糖苷或组合物可以适于递送到待甜化的食物中的任何形式提供给消费者,所述形式包括小袋、小包、散装袋或盒、方块、片剂、喷雾或可溶解的条。所述组合物可以单位剂量或散装形式递送。
对于液体甜味剂体系和组合物而言,应开发方便范围的流体、半流体、糊状和膏状形式、使用任何形状或形式的适当包装材料的适当包装,其便于携带或分配或储存或运输含有任何上述甜味剂产品或上述产生的产品的组合的任何组合。
组合物可包含多种填充剂、功能成分、着色剂、调味剂。
术语“序列同源性”或“序列同一性”在本文中可互换使用。出于本公开的目的,在此定义为了确定两个氨基酸序列或两个核酸序列的序列同源性或序列同一性的百分比,出于最佳比较目的比对所述序列。为了优化两个序列之间的比对,可在比较的两个序列中的任一个中引入空位。这种比对可在所比较的序列的全长上进行。或者,比对可在更短的长度上进行,例如在约20、约50、约100或更多个核酸/碱基或氨基酸上进行。序列同一性是在所报告的比对区域上两个序列之间的相同匹配的百分比。
两个序列之间的序列比较和序列同一性百分比的确定可使用数学算法来完成。本领域的技术人员将意识到以下事实:若干不同的计算机程序可用于比对两个序列并确定两个序列之间的同一性(Kruskal,J.B.(1983)An overview of sequence comparison InD.Sankoff and J.B.Kruskal,(编辑),Time warps,string edits and macromolecules:the theory and practice of sequence comparison,第1-44页Addison Wesley)。两个氨基酸序列之间或两个核苷酸序列之间的序列同一性百分比可使用用于两个序列的比对的Needleman和Wunsch算法来确定(Needleman,S.B.和Wunsch,C.D.(1970)J.Mol.Biol.48,443-453)。氨基酸序列和核苷酸序列两者均可通过所述算法进行比对。Needleman-Wunsch算法已在计算机程序NEEDLE中实现。出于本公开的目的,使用了来自EMBOSS包的NEEDLE程序(2.8.0版或更高版本,EMBOSS:The European Molecular Biology Open SoftwareSuite(2000)Rice,P.Longden,I.和Bleasby,A.Trends in Genetics16,(6)第276-277页,http://emboss.bioinformatics.nl/)。对于蛋白质序列而言,EBLOSUM62用于取代矩阵。对于核苷酸序列而言,使用EDNAFULL。所使用的任选参数是空位开放罚分为10,以及空位延伸罚分为0.5。技术人员将理解的是,所有这些不同的参数将产生稍微不同的结果,但是当使用不同的算法时,两个序列的总体同一性百分比没有显著改变。
在通过如上所述的程序NEEDLE进行比对后,查询序列与根据本公开的序列之间的序列同一性的百分比计算如下:在两个序列中显示相同氨基酸或相同核苷酸的比对中的相应位置的数目除以在减去比对中的总空位数后比对的总长度。如本文定义的同一性可通过使用NOBRIEF选项从NEEDLE获得,并且在程序的输出中标记为“最长同一性”。
本公开的核酸和蛋白质序列可进一步用作“查询序列”以进行针对公共数据库的检索,以例如鉴定其它家族成员或相关序列。此类搜索可使用Altschul等人(1990)J.Mol.Biol.215:403—10的NBLAST和XBLAST程序(2.0版)进行。BLAST核苷酸搜索可用NBLAST程序(得分=100、字长=12)来进行,以获得与根据本公开的核酸分子同源的核苷酸序列。BLAST蛋白质搜索可用XBLAST程序(得分=50、字长=3)来进行,以获得与根据本公开的蛋白分子同源的氨基酸序列。为了获得用于比较目的的空位比对,可利用如在Altschul等人,(1997)Nucleic Acids Res.25(17):3389-3402中描述的空位BLAST。当利用BLAST和空位BLAST程序时,可使用相应程序(例如XBLAST和NBLAST)的默认参数。参见美国国家生物技术信息中心http://www.ncbi.nlm.nih.gov/的主页。
根据本公开的实施方式:
1.一种具有UGT活性的多肽,所述多肽包含这样的氨基酸序列,所述氨基酸序列当与包含SEQ ID NO:2所示的序列的具有UGT活性的多肽进行比对时,包含至少一个对应于以下位置处的氨基酸中的任何的氨基酸取代:
35、189、280、284、285、334或373
所述位置是参考SEQ ID NO:2定义的,并且其中与具有UGT活性的参考多肽相比,所述多肽具有一种或多种经修饰的特性。
2.根据实施方式1所述的多肽,其中所述经修饰的特性是经修饰的UGT活性。
3.根据实施方式1或2所述的多肽,其中所述UGT活性是UGT3活性。
4.根据前述实施方式中任一项所述的多肽,其中所述参考多肽包含SEQ ID NO:2的UGT。
5.根据前述实施方式中任一项所述的多肽,其中:
(i)在位置35处存在缬氨酸;
(ii)在位置189处存在丙氨酸;
(iii)在位置280处存在天冬酰胺;
(iv)在位置284处存在天冬酰胺;
(v)在位置285处存在甘氨酸;
(vi)在位置285处存在天冬酰胺;
(vii)在位置285处存在丝氨酸;
(viii)在位置334处存在丙氨酸;且/或
(ix)在位置373处存在丙氨酸,
所述位置是参考SEQ ID NO:2定义的。
6.根据前述实施方式中任一项所述的多肽,所述多肽包含与SEQ ID NO:2具有至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%的序列同一性的氨基酸序列。
7.一种具有UGT活性的多肽,所述多肽包含与SEQ ID NO:4、SEQ ID NO:6、SEQ IDNO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18或SEQ IDNO:20中的任一者具有至少约95%的序列同一性,至少96%、至少97%、至少98%或至少99%的序列同一性的氨基酸序列。
8.一种编码根据前述实施方式中任一项所述的多肽的核酸序列。
9.一种重组细胞,所述重组细胞包含根据实施方式8所述的核酸序列,任选地所述重组细胞能够产生甜菊醇或甜菊醇糖苷。
10.根据权利要求9所述的重组细胞,所述重组细胞包含一种或多种编码以下多肽的核酸序列:
具有对映-柯巴基焦磷酸酯合酶活性的多肽;
具有对映-贝壳杉烯合酶活性的多肽;
具有对映-贝壳杉烯氧化酶活性的多肽;以及
具有贝壳杉烯酸13-羟化酶活性的多肽。
11.根据实施方式9或10所述的重组细胞,所述重组细胞包含编码具有NADPH-细胞色素p450还原酶活性的多肽的核酸序列。
12.根据实施方式9至11中任一项所述的重组细胞,所述重组细胞包含编码以下中的一种或多种的一种或多种核酸序列:
(i)具有UGT2活性的多肽;
(ii)具有UGT85C2活性的多肽;以及
(iii)具有UGT76G1活性的多肽。
13.根据实施方式9至12中任一项所述的重组细胞,其中所述细胞属于以下属中的一种:Saccharomyces、Aspergillus、Pichia,Kluyveromyces、Candida、Hansenula、Humicola、Issatchenkia、Trichosporon、Brettanomyces、Pachysolen、Yarrowia、Yamadazyma或Escherichia,例如Saccharomyces cerevisiae细胞、Yarrowia lipolytica细胞、Candida krusei细胞、Issatchenkia orientalis细胞或Escherichia coli细胞。
14.一种制备甜菊醇糖苷的方法,所述方法包括在合适的培养基中在有利于生产甜菊醇糖苷的条件下培养根据实施方式9至13中任一项所述的重组细胞,以及任选地回收所述甜菊醇糖苷。
15.一种培养液,所述培养液包含通过根据实施方式14的方法能够获得的甜菊醇糖苷。
16.一种组合物,所述组合物包含一种或多种通过根据实施方式14的方法获得的甜菊醇糖苷或从根据实施方式15所述的培养液获得的甜菊醇糖苷。
17.一种食品、饲料或饮料,所述食品、饲料或饮料包含根据实施方式16所述的组合物。
18.一种将甜菊醇或第一甜菊醇糖苷分别转换为甜菊醇糖苷或第二甜菊醇糖苷的方法,所述方法包括:
-使甜菊醇或第一甜菊醇糖苷与根据实施方式9至13中任一项所述的重组细胞或其透性化形式、源自所述重组细胞的粗提取物或无细胞提取物或源自上述任一者的酶制备物接触;
-从而将甜菊醇或第一甜菊醇糖苷分别转换为甜菊醇糖苷或第二甜菊醇糖苷。
以下实施例说明了本公开:
实施例
概述
标准遗传技术(如在宿主细胞中过表达酶以及宿主细胞的另外遗传修饰)是本领域已知的方法,例如在Sambrook和Russel(2001)"Molecular Cloning:A LaboratoryManual(第3版),Cold Spring Harbor Laboratory,Cold Spring Harbor LaboratoryPress,或F.Ausubel等人编辑,"Current protocols in molecular biology",GreenPublishing and Wiley Interscience,New York(1987)中所描述的。用于真菌宿主细胞的转化和遗传修饰的方法从例如EP-A-0 635 574、WO 98/46772、WO 99/60102和WO 00/37671中获知。
实施例1.从产生甜菊醇糖苷的Yarrowia lipolytica中缺失UGT3
出于测试UGT3变体的目的,从产生甜菊醇糖苷的菌株,即菌株ML15186中去除所有UGT3拷贝。在WO2013/110673和WO2015/007748的申请中已经更详细地描述了与ML15186相似的菌株。通过使用标准分子生物学技术,从菌株ML15186中去除UGT3的两个基因组整合拷贝。PCR确认其完全缺失。所得菌株的生产实验表明产生了甜菊醇13-单苷、甜菊双糖苷和RebB。不存在诸如甜菊醇-19-单苷、甜茶苷、RebA和RebM等其他甜菊醇糖苷,以及糖基化的贝壳杉烯酸,表明该菌株中完全缺乏UGT3活性。该不含UGT3的菌株被命名为STV2181。该菌株的基因内容在下表1中给出。
表1.菌株STV2181的基因型。括号之间示出了菌株中存在的基因拷贝数
Figure BDA0002335996880000431
实施例2.产生甜菊醇糖苷的Yarrowia lipolytica中的UGT3变体表达
用侧翼为pHSP启动子(SEQ ID NO:31)和pgmT终止子(SEQ ID NO:32)的UGT3 ORF构建表达途径。在该用于UGT3的表达盒旁边,存在显性抗性标记KanMX,该显性抗性标记侧翼为启动子(SEQ ID NO:33)和终止子(SEQ ID NO:34)。表达途径还在每个端部包含同源侧翼,以供整合到基因组中选定的基因座处。利用PCR扩增表达途径,并将纯化的PCR产物转化到菌株STV2181中。使转化体在含有G418的板上生长。
下表2列出了所测试的变体。
表2.UGT3变体
变体 氨基酸变化 SEQ ID NO(氨基酸) SEQ ID NO(核苷酸)
WT - 2 1
UGT3_1 I35V 4 3
UGT3_2 S189A 6 5
UGT3_3 A280N 8 7
UGT3_4 L284N 10 9
UGT3_5 V285G 12 11
UGT3_6 V285N 14 13
UGT3_7 V285S 16 15
UGT3_8 V334A 18 17
UGT3_9 M373A 20 19
实施例3.表达UGT3变体的Yarrowia lipolytica中甜菊醇糖苷和贝壳杉烯酸糖苷 的产生
将用不同UGT3变体转化的STV2181涂布在含有G418的YPhD板上,获得单菌落分离物,并进行如下生产测试:用来自含有G418的YEPh-D琼脂板的菌落材料接种200μl含有葡萄糖的YEP作为预培养物。将预培养物在Infors培养箱中于30℃、750rpm和80%湿度下孵育72小时。用40μl的预培养物接种2.5ml的含有葡萄糖作为碳源的矿物质培养基。将这些生产培养物在Infors培养箱中于30℃、550rpm、80%湿度下孵育120小时。通过以3000xg离心10分钟使生产培养物沉淀。离心后,将上清液转移并在33%乙腈中稀释,并使用LC/MS分析甜菊醇、甜菊醇糖苷、贝壳杉烯酸(KA)和糖基化的贝壳杉烯酸(KA-糖苷)。表3中的数据代表每个UGT3基因变体至少6次重复的平均值,以及UGT3野生型(SEQ ID NO:2)的57次重复的平均值。
基于UGT3变体的使甜菊醇糖基化的能力及UGT3变体的降低的使贝壳杉烯酸糖基化的能力来选择UGT3变体。这两者之间的比值表示为比值1:(甜菊醇+甜菊醇-13-单苷+甜菊醇-19-单苷+甜茶苷+甜菊双糖苷+甜菊苷+RebB+RebA+RebE+RebD+RebM)/(贝壳杉烯酸+贝壳杉烯酸葡糖苷+贝壳杉烯酸二葡糖苷+贝壳杉烯酸三葡糖苷)。将甜菊醇糖苷、贝壳杉烯酸糖苷的产生水平和比值归一化至表达野生型UGT3序列的菌株。降低的使贝壳杉烯酸糖基化的能力可能与降低的使甜菊醇糖基化的能力相一致,这是不期望的。因此,这些变体应仍具有足够的活性以使甜菊醇(或可替代地,甜菊醇-13-单苷、甜菊双糖苷和/或RebB)的19个位置糖基化。RebA、RebD和RebM是UGT3活性的下游产物,它们也包含在表3中。将RebA、RebD和RebM产生的总和归一化至表达野生型UGT3序列的菌株的产生。可以看出,表达表3中包括的变体的菌株具有改善的甜菊醇糖苷产生和降低的贝壳杉烯酸糖苷产生。因此,它们大大改善了甜菊醇糖苷与KA糖苷的比值。该增大的比值将有益于甜菊醇糖苷的生产,其中贝壳杉烯酸糖苷的产生是不期望的。表3中列出的所有变体具有改善的RebA、RebD和RebM产生,表明对甜菊醇(或可替代地,对甜菊醇-13-单苷、甜菊双糖苷和/或RebB)具有改善的活性。这使得这些UGT3变体非常适合于生产这些甜菊醇糖苷,或由RebA、RebD或RebM产生的甜菊醇糖苷。
表3.在用WT UGT3或UGT3变体转化的菌株STV2181中,甜菊醇糖苷和贝壳杉烯酸糖 苷的归一化产生。总SG:甜菊醇+甜菊醇-13-单苷+甜菊醇-19-单苷+甜茶苷+甜菊双糖苷+甜菊苷+RebB+RebA+RebE+RebD+RebM。总KAG:贝壳杉烯酸+贝壳杉烯酸葡糖苷+贝壳杉烯酸二葡糖苷+贝壳杉烯酸三葡糖苷。比值1:用UGT3基因转化的菌株STV2181中的总SG/总KAG,以及莱鲍迪甙A、莱鲍迪甙D和莱鲍迪甙M产生的归一化总和。
Figure BDA0002335996880000451
实施例4.生物反应器中表达UGT3变体的Yarrowia lipolytica中甜菊醇糖苷和贝 壳杉烯酸糖苷的生产
将如上所述构建的四种菌株在具有50ml矿物质培养基的500mL摇瓶中在30℃和280rpm下培养2天。随后,将43ml的摇瓶内容物转移至起始体积为0.4L的发酵罐中。摇瓶中的含葡萄糖的矿物质培养基和发酵是基于Verduyn等人(Verduyn C,Postma E,ScheffersWA,Van Dijken JP.Yeast,1992年7月;8(7):501-517)。通过添加氨(9重量%)将pH控制在5.7。将温度控制在30℃。在分批阶段之后,通过控制发酵罐的葡萄糖进料来保持葡萄糖浓度受限。将培养液样品在水和33%乙腈中稀释,并用LC/MS和LC/UV进行分析。
结果示出于表4中,并且表明在生物反应器中表达UGT3变体的菌株也大大降低了糖基化贝壳杉烯酸的产生,并且增加了甜菊醇糖苷(包括甜菊醇糖苷莱鲍迪甙A、莱鲍迪甙D和莱鲍迪甙M)的产生。较高的甜菊醇糖苷相对于贝壳杉烯酸糖苷的比值(比值1)有益于从发酵液中回收甜菊醇糖苷和产物纯化。
表4.在生物反应器中在用WT UGT3或UGT3变体转化的菌株STV2181中,甜菊醇糖苷 和贝壳杉烯酸糖苷的归一化产生。总SG:甜菊醇+甜菊醇-13-单苷+甜菊醇-19-单苷+甜茶苷+甜菊双糖苷+甜菊苷+RebB+RebA+RebE+RebD+RebM。总KAG:贝壳杉烯酸+贝壳杉烯酸葡糖苷+贝壳杉烯酸二葡糖苷+贝壳杉烯酸三葡糖苷。比值1:用UGT3基因转化的菌株STV2181中的总SG/总KAG,以及莱鲍迪甙A、莱鲍迪甙D和莱鲍迪甙M产生的归一化总和。
Figure BDA0002335996880000461
序列表
<110> 帝斯曼知识产权资产管理有限公司
<120> UDP-糖基转移酶
<130> 32497-WO-PCT
<150> EP17178168.5
<151> 0032-12-07
<160> 34
<170> BiSSAP 1.3.6
<210> 1
<211> 1383
<212> DNA
<213> Stevia rebaudiana
<400> 1
atggccgagc agcagaagat caagaagtct ccccacgttc tgctcatccc cttccctctg 60
cagggccaca tcaacccctt catccagttc ggcaagcgac tcatctccaa gggtgtcaag 120
accactctgg tcaccaccat ccacaccctc aactccactc tcaaccactc caacaccacc 180
accacctcca tcgagatcca ggccatctcc gacggctgtg acgagggtgg tttcatgtct 240
gctggtgagt cttacctcga gactttcaag caggtcggtt ccaagtctct ggctgacctc 300
atcaagaagc tccagtccga gggtaccacc attgacgcca tcatctacga ctccatgacc 360
gagtgggttc tcgatgtcgc catcgagttt ggtattgacg gtggctcctt cttcacccag 420
gcctgtgtcg tcaactctct ctactaccac gtccacaagg gtctgatctc tctgcccctc 480
ggcgagactg tctccgtccc cggtttcccc gttctgcagc gatgggagac tcctctcatt 540
ctccagaacc acgagcagat ccagtccccc tggtcccaga tgctcttcgg ccagttcgcc 600
aacattgacc aggcccgatg ggttttcacc aactccttct acaagctcga ggaagaggtc 660
attgagtgga cccgaaagat ctggaacctc aaggtcattg gccccaccct cccctccatg 720
tacctcgaca agcgactcga tgacgacaag gacaacggtt tcaacctcta caaggccaac 780
caccacgagt gcatgaactg gctcgacgac aagcccaagg agtccgttgt ctacgttgcc 840
tttggctctc tggtcaagca cggccccgag caggttgagg agatcacccg agctctgatt 900
gactccgatg tcaacttcct gtgggtcatc aagcacaagg aagagggtaa gctccccgag 960
aacctgtccg aggtcatcaa gaccggcaag ggcctcattg ttgcctggtg caagcagctc 1020
gacgttctcg cccacgagtc cgtcggctgc tttgtcaccc actgcggttt caactccacc 1080
ctcgaggcta tctctctcgg tgtccccgtt gttgccatgc cccagttctc cgaccagacc 1140
accaacgcca agctcctcga tgagattctc ggtgtcggtg tccgagtcaa ggctgacgag 1200
aacggtattg tccgacgagg taacctggct tcttgtatca agatgatcat ggaggaagag 1260
cgaggtgtca tcatccgaaa gaacgccgtc aagtggaagg atctggccaa ggttgctgtc 1320
cacgagggtg gctcttccga caacgacatt gtcgagtttg tctccgagct catcaaggcc 1380
taa 1383
<210> 2
<211> 460
<212> PRT
<213> Stevia rebaudiana
<400> 2
Met Ala Glu Gln Gln Lys Ile Lys Lys Ser Pro His Val Leu Leu Ile
1 5 10 15
Pro Phe Pro Leu Gln Gly His Ile Asn Pro Phe Ile Gln Phe Gly Lys
20 25 30
Arg Leu Ile Ser Lys Gly Val Lys Thr Thr Leu Val Thr Thr Ile His
35 40 45
Thr Leu Asn Ser Thr Leu Asn His Ser Asn Thr Thr Thr Thr Ser Ile
50 55 60
Glu Ile Gln Ala Ile Ser Asp Gly Cys Asp Glu Gly Gly Phe Met Ser
65 70 75 80
Ala Gly Glu Ser Tyr Leu Glu Thr Phe Lys Gln Val Gly Ser Lys Ser
85 90 95
Leu Ala Asp Leu Ile Lys Lys Leu Gln Ser Glu Gly Thr Thr Ile Asp
100 105 110
Ala Ile Ile Tyr Asp Ser Met Thr Glu Trp Val Leu Asp Val Ala Ile
115 120 125
Glu Phe Gly Ile Asp Gly Gly Ser Phe Phe Thr Gln Ala Cys Val Val
130 135 140
Asn Ser Leu Tyr Tyr His Val His Lys Gly Leu Ile Ser Leu Pro Leu
145 150 155 160
Gly Glu Thr Val Ser Val Pro Gly Phe Pro Val Leu Gln Arg Trp Glu
165 170 175
Thr Pro Leu Ile Leu Gln Asn His Glu Gln Ile Gln Ser Pro Trp Ser
180 185 190
Gln Met Leu Phe Gly Gln Phe Ala Asn Ile Asp Gln Ala Arg Trp Val
195 200 205
Phe Thr Asn Ser Phe Tyr Lys Leu Glu Glu Glu Val Ile Glu Trp Thr
210 215 220
Arg Lys Ile Trp Asn Leu Lys Val Ile Gly Pro Thr Leu Pro Ser Met
225 230 235 240
Tyr Leu Asp Lys Arg Leu Asp Asp Asp Lys Asp Asn Gly Phe Asn Leu
245 250 255
Tyr Lys Ala Asn His His Glu Cys Met Asn Trp Leu Asp Asp Lys Pro
260 265 270
Lys Glu Ser Val Val Tyr Val Ala Phe Gly Ser Leu Val Lys His Gly
275 280 285
Pro Glu Gln Val Glu Glu Ile Thr Arg Ala Leu Ile Asp Ser Asp Val
290 295 300
Asn Phe Leu Trp Val Ile Lys His Lys Glu Glu Gly Lys Leu Pro Glu
305 310 315 320
Asn Leu Ser Glu Val Ile Lys Thr Gly Lys Gly Leu Ile Val Ala Trp
325 330 335
Cys Lys Gln Leu Asp Val Leu Ala His Glu Ser Val Gly Cys Phe Val
340 345 350
Thr His Cys Gly Phe Asn Ser Thr Leu Glu Ala Ile Ser Leu Gly Val
355 360 365
Pro Val Val Ala Met Pro Gln Phe Ser Asp Gln Thr Thr Asn Ala Lys
370 375 380
Leu Leu Asp Glu Ile Leu Gly Val Gly Val Arg Val Lys Ala Asp Glu
385 390 395 400
Asn Gly Ile Val Arg Arg Gly Asn Leu Ala Ser Cys Ile Lys Met Ile
405 410 415
Met Glu Glu Glu Arg Gly Val Ile Ile Arg Lys Asn Ala Val Lys Trp
420 425 430
Lys Asp Leu Ala Lys Val Ala Val His Glu Gly Gly Ser Ser Asp Asn
435 440 445
Asp Ile Val Glu Phe Val Ser Glu Leu Ile Lys Ala
450 455 460
<210> 3
<211> 1383
<212> DNA
<213> Artificial sequence
<220>
<223> UDP-glycosyltransferase variant encoding sequence
<400> 3
atggccgagc agcagaagat caagaagtct ccccacgttc tgctcatccc cttccctctg 60
cagggccaca tcaacccctt catccagttc ggcaagcgac tcgtctccaa gggtgtcaag 120
accactctgg tcaccaccat ccacaccctc aactccactc tcaaccactc caacaccacc 180
accacctcca tcgagatcca ggccatctcc gacggctgtg acgagggtgg tttcatgtct 240
gctggtgagt cttacctcga gactttcaag caggtcggtt ccaagtctct ggctgacctc 300
atcaagaagc tccagtccga gggtaccacc attgacgcca tcatctacga ctccatgacc 360
gagtgggttc tcgatgtcgc catcgagttt ggtattgacg gtggctcctt cttcacccag 420
gcctgtgtcg tcaactctct ctactaccac gtccacaagg gtctgatctc tctgcccctc 480
ggcgagactg tctccgtccc cggtttcccc gttctgcagc gatgggagac tcctctcatt 540
ctccagaacc acgagcagat ccagtccccc tggtcccaga tgctcttcgg ccagttcgcc 600
aacattgacc aggcccgatg ggttttcacc aactccttct acaagctcga ggaagaggtc 660
attgagtgga cccgaaagat ctggaacctc aaggtcattg gccccaccct cccctccatg 720
tacctcgaca agcgactcga tgacgacaag gacaacggtt tcaacctcta caaggccaac 780
caccacgagt gcatgaactg gctcgacgac aagcccaagg agtccgttgt ctacgttgcc 840
tttggctctc tggtcaagca cggccccgag caggttgagg agatcacccg agctctgatt 900
gactccgatg tcaacttcct gtgggtcatc aagcacaagg aagagggtaa gctccccgag 960
aacctgtccg aggtcatcaa gaccggcaag ggcctcattg ttgcctggtg caagcagctc 1020
gacgttctcg cccacgagtc cgtcggctgc tttgtcaccc actgcggttt caactccacc 1080
ctcgaggcta tctctctcgg tgtccccgtt gttgccatgc cccagttctc cgaccagacc 1140
accaacgcca agctcctcga tgagattctc ggtgtcggtg tccgagtcaa ggctgacgag 1200
aacggtattg tccgacgagg taacctggct tcttgtatca agatgatcat ggaggaagag 1260
cgaggtgtca tcatccgaaa gaacgccgtc aagtggaagg atctggccaa ggttgctgtc 1320
cacgagggtg gctcttccga caacgacatt gtcgagtttg tctccgagct catcaaggcc 1380
taa 1383
<210> 4
<211> 460
<212> PRT
<213> Artificial sequence
<220>
<223> UDP-glycosyltransferase variant
<400> 4
Met Ala Glu Gln Gln Lys Ile Lys Lys Ser Pro His Val Leu Leu Ile
1 5 10 15
Pro Phe Pro Leu Gln Gly His Ile Asn Pro Phe Ile Gln Phe Gly Lys
20 25 30
Arg Leu Val Ser Lys Gly Val Lys Thr Thr Leu Val Thr Thr Ile His
35 40 45
Thr Leu Asn Ser Thr Leu Asn His Ser Asn Thr Thr Thr Thr Ser Ile
50 55 60
Glu Ile Gln Ala Ile Ser Asp Gly Cys Asp Glu Gly Gly Phe Met Ser
65 70 75 80
Ala Gly Glu Ser Tyr Leu Glu Thr Phe Lys Gln Val Gly Ser Lys Ser
85 90 95
Leu Ala Asp Leu Ile Lys Lys Leu Gln Ser Glu Gly Thr Thr Ile Asp
100 105 110
Ala Ile Ile Tyr Asp Ser Met Thr Glu Trp Val Leu Asp Val Ala Ile
115 120 125
Glu Phe Gly Ile Asp Gly Gly Ser Phe Phe Thr Gln Ala Cys Val Val
130 135 140
Asn Ser Leu Tyr Tyr His Val His Lys Gly Leu Ile Ser Leu Pro Leu
145 150 155 160
Gly Glu Thr Val Ser Val Pro Gly Phe Pro Val Leu Gln Arg Trp Glu
165 170 175
Thr Pro Leu Ile Leu Gln Asn His Glu Gln Ile Gln Ser Pro Trp Ser
180 185 190
Gln Met Leu Phe Gly Gln Phe Ala Asn Ile Asp Gln Ala Arg Trp Val
195 200 205
Phe Thr Asn Ser Phe Tyr Lys Leu Glu Glu Glu Val Ile Glu Trp Thr
210 215 220
Arg Lys Ile Trp Asn Leu Lys Val Ile Gly Pro Thr Leu Pro Ser Met
225 230 235 240
Tyr Leu Asp Lys Arg Leu Asp Asp Asp Lys Asp Asn Gly Phe Asn Leu
245 250 255
Tyr Lys Ala Asn His His Glu Cys Met Asn Trp Leu Asp Asp Lys Pro
260 265 270
Lys Glu Ser Val Val Tyr Val Ala Phe Gly Ser Leu Val Lys His Gly
275 280 285
Pro Glu Gln Val Glu Glu Ile Thr Arg Ala Leu Ile Asp Ser Asp Val
290 295 300
Asn Phe Leu Trp Val Ile Lys His Lys Glu Glu Gly Lys Leu Pro Glu
305 310 315 320
Asn Leu Ser Glu Val Ile Lys Thr Gly Lys Gly Leu Ile Val Ala Trp
325 330 335
Cys Lys Gln Leu Asp Val Leu Ala His Glu Ser Val Gly Cys Phe Val
340 345 350
Thr His Cys Gly Phe Asn Ser Thr Leu Glu Ala Ile Ser Leu Gly Val
355 360 365
Pro Val Val Ala Met Pro Gln Phe Ser Asp Gln Thr Thr Asn Ala Lys
370 375 380
Leu Leu Asp Glu Ile Leu Gly Val Gly Val Arg Val Lys Ala Asp Glu
385 390 395 400
Asn Gly Ile Val Arg Arg Gly Asn Leu Ala Ser Cys Ile Lys Met Ile
405 410 415
Met Glu Glu Glu Arg Gly Val Ile Ile Arg Lys Asn Ala Val Lys Trp
420 425 430
Lys Asp Leu Ala Lys Val Ala Val His Glu Gly Gly Ser Ser Asp Asn
435 440 445
Asp Ile Val Glu Phe Val Ser Glu Leu Ile Lys Ala
450 455 460
<210> 5
<211> 1383
<212> DNA
<213> Artificial sequence
<220>
<223> UDP-glycosyltransferase variant encoding sequence
<400> 5
atggccgagc agcagaagat caagaagtct ccccacgttc tgctcatccc cttccctctg 60
cagggccaca tcaacccctt catccagttc ggcaagcgac tcatctccaa gggtgtcaag 120
accactctgg tcaccaccat ccacaccctc aactccactc tcaaccactc caacaccacc 180
accacctcca tcgagatcca ggccatctcc gacggctgtg acgagggtgg tttcatgtct 240
gctggtgagt cttacctcga gactttcaag caggtcggtt ccaagtctct ggctgacctc 300
atcaagaagc tccagtccga gggtaccacc attgacgcca tcatctacga ctccatgacc 360
gagtgggttc tcgatgtcgc catcgagttt ggtattgacg gtggctcctt cttcacccag 420
gcctgtgtcg tcaactctct ctactaccac gtccacaagg gtctgatctc tctgcccctc 480
ggcgagactg tctccgtccc cggtttcccc gttctgcagc gatgggagac tcctctcatt 540
ctccagaacc acgagcagat ccaggccccc tggtcccaga tgctcttcgg ccagttcgcc 600
aacattgacc aggcccgatg ggttttcacc aactccttct acaagctcga ggaagaggtc 660
attgagtgga cccgaaagat ctggaacctc aaggtcattg gccccaccct cccctccatg 720
tacctcgaca agcgactcga tgacgacaag gacaacggtt tcaacctcta caaggccaac 780
caccacgagt gcatgaactg gctcgacgac aagcccaagg agtccgttgt ctacgttgcc 840
tttggctctc tggtcaagca cggccccgag caggttgagg agatcacccg agctctgatt 900
gactccgatg tcaacttcct gtgggtcatc aagcacaagg aagagggtaa gctccccgag 960
aacctgtccg aggtcatcaa gaccggcaag ggcctcattg ttgcctggtg caagcagctc 1020
gacgttctcg cccacgagtc cgtcggctgc tttgtcaccc actgcggttt caactccacc 1080
ctcgaggcta tctctctcgg tgtccccgtt gttgccatgc cccagttctc cgaccagacc 1140
accaacgcca agctcctcga tgagattctc ggtgtcggtg tccgagtcaa ggctgacgag 1200
aacggtattg tccgacgagg taacctggct tcttgtatca agatgatcat ggaggaagag 1260
cgaggtgtca tcatccgaaa gaacgccgtc aagtggaagg atctggccaa ggttgctgtc 1320
cacgagggtg gctcttccga caacgacatt gtcgagtttg tctccgagct catcaaggcc 1380
taa 1383
<210> 6
<211> 460
<212> PRT
<213> Artificial sequence
<220>
<223> UDP-glycosyltransferase variant
<400> 6
Met Ala Glu Gln Gln Lys Ile Lys Lys Ser Pro His Val Leu Leu Ile
1 5 10 15
Pro Phe Pro Leu Gln Gly His Ile Asn Pro Phe Ile Gln Phe Gly Lys
20 25 30
Arg Leu Ile Ser Lys Gly Val Lys Thr Thr Leu Val Thr Thr Ile His
35 40 45
Thr Leu Asn Ser Thr Leu Asn His Ser Asn Thr Thr Thr Thr Ser Ile
50 55 60
Glu Ile Gln Ala Ile Ser Asp Gly Cys Asp Glu Gly Gly Phe Met Ser
65 70 75 80
Ala Gly Glu Ser Tyr Leu Glu Thr Phe Lys Gln Val Gly Ser Lys Ser
85 90 95
Leu Ala Asp Leu Ile Lys Lys Leu Gln Ser Glu Gly Thr Thr Ile Asp
100 105 110
Ala Ile Ile Tyr Asp Ser Met Thr Glu Trp Val Leu Asp Val Ala Ile
115 120 125
Glu Phe Gly Ile Asp Gly Gly Ser Phe Phe Thr Gln Ala Cys Val Val
130 135 140
Asn Ser Leu Tyr Tyr His Val His Lys Gly Leu Ile Ser Leu Pro Leu
145 150 155 160
Gly Glu Thr Val Ser Val Pro Gly Phe Pro Val Leu Gln Arg Trp Glu
165 170 175
Thr Pro Leu Ile Leu Gln Asn His Glu Gln Ile Gln Ala Pro Trp Ser
180 185 190
Gln Met Leu Phe Gly Gln Phe Ala Asn Ile Asp Gln Ala Arg Trp Val
195 200 205
Phe Thr Asn Ser Phe Tyr Lys Leu Glu Glu Glu Val Ile Glu Trp Thr
210 215 220
Arg Lys Ile Trp Asn Leu Lys Val Ile Gly Pro Thr Leu Pro Ser Met
225 230 235 240
Tyr Leu Asp Lys Arg Leu Asp Asp Asp Lys Asp Asn Gly Phe Asn Leu
245 250 255
Tyr Lys Ala Asn His His Glu Cys Met Asn Trp Leu Asp Asp Lys Pro
260 265 270
Lys Glu Ser Val Val Tyr Val Ala Phe Gly Ser Leu Val Lys His Gly
275 280 285
Pro Glu Gln Val Glu Glu Ile Thr Arg Ala Leu Ile Asp Ser Asp Val
290 295 300
Asn Phe Leu Trp Val Ile Lys His Lys Glu Glu Gly Lys Leu Pro Glu
305 310 315 320
Asn Leu Ser Glu Val Ile Lys Thr Gly Lys Gly Leu Ile Val Ala Trp
325 330 335
Cys Lys Gln Leu Asp Val Leu Ala His Glu Ser Val Gly Cys Phe Val
340 345 350
Thr His Cys Gly Phe Asn Ser Thr Leu Glu Ala Ile Ser Leu Gly Val
355 360 365
Pro Val Val Ala Met Pro Gln Phe Ser Asp Gln Thr Thr Asn Ala Lys
370 375 380
Leu Leu Asp Glu Ile Leu Gly Val Gly Val Arg Val Lys Ala Asp Glu
385 390 395 400
Asn Gly Ile Val Arg Arg Gly Asn Leu Ala Ser Cys Ile Lys Met Ile
405 410 415
Met Glu Glu Glu Arg Gly Val Ile Ile Arg Lys Asn Ala Val Lys Trp
420 425 430
Lys Asp Leu Ala Lys Val Ala Val His Glu Gly Gly Ser Ser Asp Asn
435 440 445
Asp Ile Val Glu Phe Val Ser Glu Leu Ile Lys Ala
450 455 460
<210> 7
<211> 1383
<212> DNA
<213> Artificial sequence
<220>
<223> UDP-glycosyltransferase variant encoding sequence
<400> 7
atggccgagc agcagaagat caagaagtct ccccacgttc tgctcatccc cttccctctg 60
cagggccaca tcaacccctt catccagttc ggcaagcgac tcatctccaa gggtgtcaag 120
accactctgg tcaccaccat ccacaccctc aactccactc tcaaccactc caacaccacc 180
accacctcca tcgagatcca ggccatctcc gacggctgtg acgagggtgg tttcatgtct 240
gctggtgagt cttacctcga gactttcaag caggtcggtt ccaagtctct ggctgacctc 300
atcaagaagc tccagtccga gggtaccacc attgacgcca tcatctacga ctccatgacc 360
gagtgggttc tcgatgtcgc catcgagttt ggtattgacg gtggctcctt cttcacccag 420
gcctgtgtcg tcaactctct ctactaccac gtccacaagg gtctgatctc tctgcccctc 480
ggcgagactg tctccgtccc cggtttcccc gttctgcagc gatgggagac tcctctcatt 540
ctccagaacc acgagcagat ccagtccccc tggtcccaga tgctcttcgg ccagttcgcc 600
aacattgacc aggcccgatg ggttttcacc aactccttct acaagctcga ggaagaggtc 660
attgagtgga cccgaaagat ctggaacctc aaggtcattg gccccaccct cccctccatg 720
tacctcgaca agcgactcga tgacgacaag gacaacggtt tcaacctcta caaggccaac 780
caccacgagt gcatgaactg gctcgacgac aagcccaagg agtccgttgt ctacgttaac 840
tttggctctc tggtcaagca cggccccgag caggttgagg agatcacccg agctctgatt 900
gactccgatg tcaacttcct gtgggtcatc aagcacaagg aagagggtaa gctccccgag 960
aacctgtccg aggtcatcaa gaccggcaag ggcctcattg ttgcctggtg caagcagctc 1020
gacgttctcg cccacgagtc cgtcggctgc tttgtcaccc actgcggttt caactccacc 1080
ctcgaggcta tctctctcgg tgtccccgtt gttgccatgc cccagttctc cgaccagacc 1140
accaacgcca agctcctcga tgagattctc ggtgtcggtg tccgagtcaa ggctgacgag 1200
aacggtattg tccgacgagg taacctggct tcttgtatca agatgatcat ggaggaagag 1260
cgaggtgtca tcatccgaaa gaacgccgtc aagtggaagg atctggccaa ggttgctgtc 1320
cacgagggtg gctcttccga caacgacatt gtcgagtttg tctccgagct catcaaggcc 1380
taa 1383
<210> 8
<211> 460
<212> PRT
<213> Artificial sequence
<220>
<223> UDP-glycosyltransferase variant
<400> 8
Met Ala Glu Gln Gln Lys Ile Lys Lys Ser Pro His Val Leu Leu Ile
1 5 10 15
Pro Phe Pro Leu Gln Gly His Ile Asn Pro Phe Ile Gln Phe Gly Lys
20 25 30
Arg Leu Ile Ser Lys Gly Val Lys Thr Thr Leu Val Thr Thr Ile His
35 40 45
Thr Leu Asn Ser Thr Leu Asn His Ser Asn Thr Thr Thr Thr Ser Ile
50 55 60
Glu Ile Gln Ala Ile Ser Asp Gly Cys Asp Glu Gly Gly Phe Met Ser
65 70 75 80
Ala Gly Glu Ser Tyr Leu Glu Thr Phe Lys Gln Val Gly Ser Lys Ser
85 90 95
Leu Ala Asp Leu Ile Lys Lys Leu Gln Ser Glu Gly Thr Thr Ile Asp
100 105 110
Ala Ile Ile Tyr Asp Ser Met Thr Glu Trp Val Leu Asp Val Ala Ile
115 120 125
Glu Phe Gly Ile Asp Gly Gly Ser Phe Phe Thr Gln Ala Cys Val Val
130 135 140
Asn Ser Leu Tyr Tyr His Val His Lys Gly Leu Ile Ser Leu Pro Leu
145 150 155 160
Gly Glu Thr Val Ser Val Pro Gly Phe Pro Val Leu Gln Arg Trp Glu
165 170 175
Thr Pro Leu Ile Leu Gln Asn His Glu Gln Ile Gln Ser Pro Trp Ser
180 185 190
Gln Met Leu Phe Gly Gln Phe Ala Asn Ile Asp Gln Ala Arg Trp Val
195 200 205
Phe Thr Asn Ser Phe Tyr Lys Leu Glu Glu Glu Val Ile Glu Trp Thr
210 215 220
Arg Lys Ile Trp Asn Leu Lys Val Ile Gly Pro Thr Leu Pro Ser Met
225 230 235 240
Tyr Leu Asp Lys Arg Leu Asp Asp Asp Lys Asp Asn Gly Phe Asn Leu
245 250 255
Tyr Lys Ala Asn His His Glu Cys Met Asn Trp Leu Asp Asp Lys Pro
260 265 270
Lys Glu Ser Val Val Tyr Val Asn Phe Gly Ser Leu Val Lys His Gly
275 280 285
Pro Glu Gln Val Glu Glu Ile Thr Arg Ala Leu Ile Asp Ser Asp Val
290 295 300
Asn Phe Leu Trp Val Ile Lys His Lys Glu Glu Gly Lys Leu Pro Glu
305 310 315 320
Asn Leu Ser Glu Val Ile Lys Thr Gly Lys Gly Leu Ile Val Ala Trp
325 330 335
Cys Lys Gln Leu Asp Val Leu Ala His Glu Ser Val Gly Cys Phe Val
340 345 350
Thr His Cys Gly Phe Asn Ser Thr Leu Glu Ala Ile Ser Leu Gly Val
355 360 365
Pro Val Val Ala Met Pro Gln Phe Ser Asp Gln Thr Thr Asn Ala Lys
370 375 380
Leu Leu Asp Glu Ile Leu Gly Val Gly Val Arg Val Lys Ala Asp Glu
385 390 395 400
Asn Gly Ile Val Arg Arg Gly Asn Leu Ala Ser Cys Ile Lys Met Ile
405 410 415
Met Glu Glu Glu Arg Gly Val Ile Ile Arg Lys Asn Ala Val Lys Trp
420 425 430
Lys Asp Leu Ala Lys Val Ala Val His Glu Gly Gly Ser Ser Asp Asn
435 440 445
Asp Ile Val Glu Phe Val Ser Glu Leu Ile Lys Ala
450 455 460
<210> 9
<211> 1383
<212> DNA
<213> Artificial sequence
<220>
<223> UDP-glycosyltransferase variant encoding sequence
<400> 9
atggccgagc agcagaagat caagaagtct ccccacgttc tgctcatccc cttccctctg 60
cagggccaca tcaacccctt catccagttc ggcaagcgac tcatctccaa gggtgtcaag 120
accactctgg tcaccaccat ccacaccctc aactccactc tcaaccactc caacaccacc 180
accacctcca tcgagatcca ggccatctcc gacggctgtg acgagggtgg tttcatgtct 240
gctggtgagt cttacctcga gactttcaag caggtcggtt ccaagtctct ggctgacctc 300
atcaagaagc tccagtccga gggtaccacc attgacgcca tcatctacga ctccatgacc 360
gagtgggttc tcgatgtcgc catcgagttt ggtattgacg gtggctcctt cttcacccag 420
gcctgtgtcg tcaactctct ctactaccac gtccacaagg gtctgatctc tctgcccctc 480
ggcgagactg tctccgtccc cggtttcccc gttctgcagc gatgggagac tcctctcatt 540
ctccagaacc acgagcagat ccagtccccc tggtcccaga tgctcttcgg ccagttcgcc 600
aacattgacc aggcccgatg ggttttcacc aactccttct acaagctcga ggaagaggtc 660
attgagtgga cccgaaagat ctggaacctc aaggtcattg gccccaccct cccctccatg 720
tacctcgaca agcgactcga tgacgacaag gacaacggtt tcaacctcta caaggccaac 780
caccacgagt gcatgaactg gctcgacgac aagcccaagg agtccgttgt ctacgttgcc 840
tttggctcta acgtcaagca cggccccgag caggttgagg agatcacccg agctctgatt 900
gactccgatg tcaacttcct gtgggtcatc aagcacaagg aagagggtaa gctccccgag 960
aacctgtccg aggtcatcaa gaccggcaag ggcctcattg ttgcctggtg caagcagctc 1020
gacgttctcg cccacgagtc cgtcggctgc tttgtcaccc actgcggttt caactccacc 1080
ctcgaggcta tctctctcgg tgtccccgtt gttgccatgc cccagttctc cgaccagacc 1140
accaacgcca agctcctcga tgagattctc ggtgtcggtg tccgagtcaa ggctgacgag 1200
aacggtattg tccgacgagg taacctggct tcttgtatca agatgatcat ggaggaagag 1260
cgaggtgtca tcatccgaaa gaacgccgtc aagtggaagg atctggccaa ggttgctgtc 1320
cacgagggtg gctcttccga caacgacatt gtcgagtttg tctccgagct catcaaggcc 1380
taa 1383
<210> 10
<211> 460
<212> PRT
<213> Artificial sequence
<220>
<223> UDP-glycosyltransferase variant
<400> 10
Met Ala Glu Gln Gln Lys Ile Lys Lys Ser Pro His Val Leu Leu Ile
1 5 10 15
Pro Phe Pro Leu Gln Gly His Ile Asn Pro Phe Ile Gln Phe Gly Lys
20 25 30
Arg Leu Ile Ser Lys Gly Val Lys Thr Thr Leu Val Thr Thr Ile His
35 40 45
Thr Leu Asn Ser Thr Leu Asn His Ser Asn Thr Thr Thr Thr Ser Ile
50 55 60
Glu Ile Gln Ala Ile Ser Asp Gly Cys Asp Glu Gly Gly Phe Met Ser
65 70 75 80
Ala Gly Glu Ser Tyr Leu Glu Thr Phe Lys Gln Val Gly Ser Lys Ser
85 90 95
Leu Ala Asp Leu Ile Lys Lys Leu Gln Ser Glu Gly Thr Thr Ile Asp
100 105 110
Ala Ile Ile Tyr Asp Ser Met Thr Glu Trp Val Leu Asp Val Ala Ile
115 120 125
Glu Phe Gly Ile Asp Gly Gly Ser Phe Phe Thr Gln Ala Cys Val Val
130 135 140
Asn Ser Leu Tyr Tyr His Val His Lys Gly Leu Ile Ser Leu Pro Leu
145 150 155 160
Gly Glu Thr Val Ser Val Pro Gly Phe Pro Val Leu Gln Arg Trp Glu
165 170 175
Thr Pro Leu Ile Leu Gln Asn His Glu Gln Ile Gln Ser Pro Trp Ser
180 185 190
Gln Met Leu Phe Gly Gln Phe Ala Asn Ile Asp Gln Ala Arg Trp Val
195 200 205
Phe Thr Asn Ser Phe Tyr Lys Leu Glu Glu Glu Val Ile Glu Trp Thr
210 215 220
Arg Lys Ile Trp Asn Leu Lys Val Ile Gly Pro Thr Leu Pro Ser Met
225 230 235 240
Tyr Leu Asp Lys Arg Leu Asp Asp Asp Lys Asp Asn Gly Phe Asn Leu
245 250 255
Tyr Lys Ala Asn His His Glu Cys Met Asn Trp Leu Asp Asp Lys Pro
260 265 270
Lys Glu Ser Val Val Tyr Val Ala Phe Gly Ser Asn Val Lys His Gly
275 280 285
Pro Glu Gln Val Glu Glu Ile Thr Arg Ala Leu Ile Asp Ser Asp Val
290 295 300
Asn Phe Leu Trp Val Ile Lys His Lys Glu Glu Gly Lys Leu Pro Glu
305 310 315 320
Asn Leu Ser Glu Val Ile Lys Thr Gly Lys Gly Leu Ile Val Ala Trp
325 330 335
Cys Lys Gln Leu Asp Val Leu Ala His Glu Ser Val Gly Cys Phe Val
340 345 350
Thr His Cys Gly Phe Asn Ser Thr Leu Glu Ala Ile Ser Leu Gly Val
355 360 365
Pro Val Val Ala Met Pro Gln Phe Ser Asp Gln Thr Thr Asn Ala Lys
370 375 380
Leu Leu Asp Glu Ile Leu Gly Val Gly Val Arg Val Lys Ala Asp Glu
385 390 395 400
Asn Gly Ile Val Arg Arg Gly Asn Leu Ala Ser Cys Ile Lys Met Ile
405 410 415
Met Glu Glu Glu Arg Gly Val Ile Ile Arg Lys Asn Ala Val Lys Trp
420 425 430
Lys Asp Leu Ala Lys Val Ala Val His Glu Gly Gly Ser Ser Asp Asn
435 440 445
Asp Ile Val Glu Phe Val Ser Glu Leu Ile Lys Ala
450 455 460
<210> 11
<211> 1383
<212> DNA
<213> Artificial sequence
<220>
<223> UDP-glycosyltransferase variant encoding sequence
<400> 11
atggccgagc agcagaagat caagaagtct ccccacgttc tgctcatccc cttccctctg 60
cagggccaca tcaacccctt catccagttc ggcaagcgac tcatctccaa gggtgtcaag 120
accactctgg tcaccaccat ccacaccctc aactccactc tcaaccactc caacaccacc 180
accacctcca tcgagatcca ggccatctcc gacggctgtg acgagggtgg tttcatgtct 240
gctggtgagt cttacctcga gactttcaag caggtcggtt ccaagtctct ggctgacctc 300
atcaagaagc tccagtccga gggtaccacc attgacgcca tcatctacga ctccatgacc 360
gagtgggttc tcgatgtcgc catcgagttt ggtattgacg gtggctcctt cttcacccag 420
gcctgtgtcg tcaactctct ctactaccac gtccacaagg gtctgatctc tctgcccctc 480
ggcgagactg tctccgtccc cggtttcccc gttctgcagc gatgggagac tcctctcatt 540
ctccagaacc acgagcagat ccagtccccc tggtcccaga tgctcttcgg ccagttcgcc 600
aacattgacc aggcccgatg ggttttcacc aactccttct acaagctcga ggaagaggtc 660
attgagtgga cccgaaagat ctggaacctc aaggtcattg gccccaccct cccctccatg 720
tacctcgaca agcgactcga tgacgacaag gacaacggtt tcaacctcta caaggccaac 780
caccacgagt gcatgaactg gctcgacgac aagcccaagg agtccgttgt ctacgttgcc 840
tttggctctc tgggcaagca cggccccgag caggttgagg agatcacccg agctctgatt 900
gactccgatg tcaacttcct gtgggtcatc aagcacaagg aagagggtaa gctccccgag 960
aacctgtccg aggtcatcaa gaccggcaag ggcctcattg ttgcctggtg caagcagctc 1020
gacgttctcg cccacgagtc cgtcggctgc tttgtcaccc actgcggttt caactccacc 1080
ctcgaggcta tctctctcgg tgtccccgtt gttgccatgc cccagttctc cgaccagacc 1140
accaacgcca agctcctcga tgagattctc ggtgtcggtg tccgagtcaa ggctgacgag 1200
aacggtattg tccgacgagg taacctggct tcttgtatca agatgatcat ggaggaagag 1260
cgaggtgtca tcatccgaaa gaacgccgtc aagtggaagg atctggccaa ggttgctgtc 1320
cacgagggtg gctcttccga caacgacatt gtcgagtttg tctccgagct catcaaggcc 1380
taa 1383
<210> 12
<211> 460
<212> PRT
<213> Artificial sequence
<220>
<223> UDP-glycosyltransferase variant
<400> 12
Met Ala Glu Gln Gln Lys Ile Lys Lys Ser Pro His Val Leu Leu Ile
1 5 10 15
Pro Phe Pro Leu Gln Gly His Ile Asn Pro Phe Ile Gln Phe Gly Lys
20 25 30
Arg Leu Ile Ser Lys Gly Val Lys Thr Thr Leu Val Thr Thr Ile His
35 40 45
Thr Leu Asn Ser Thr Leu Asn His Ser Asn Thr Thr Thr Thr Ser Ile
50 55 60
Glu Ile Gln Ala Ile Ser Asp Gly Cys Asp Glu Gly Gly Phe Met Ser
65 70 75 80
Ala Gly Glu Ser Tyr Leu Glu Thr Phe Lys Gln Val Gly Ser Lys Ser
85 90 95
Leu Ala Asp Leu Ile Lys Lys Leu Gln Ser Glu Gly Thr Thr Ile Asp
100 105 110
Ala Ile Ile Tyr Asp Ser Met Thr Glu Trp Val Leu Asp Val Ala Ile
115 120 125
Glu Phe Gly Ile Asp Gly Gly Ser Phe Phe Thr Gln Ala Cys Val Val
130 135 140
Asn Ser Leu Tyr Tyr His Val His Lys Gly Leu Ile Ser Leu Pro Leu
145 150 155 160
Gly Glu Thr Val Ser Val Pro Gly Phe Pro Val Leu Gln Arg Trp Glu
165 170 175
Thr Pro Leu Ile Leu Gln Asn His Glu Gln Ile Gln Ser Pro Trp Ser
180 185 190
Gln Met Leu Phe Gly Gln Phe Ala Asn Ile Asp Gln Ala Arg Trp Val
195 200 205
Phe Thr Asn Ser Phe Tyr Lys Leu Glu Glu Glu Val Ile Glu Trp Thr
210 215 220
Arg Lys Ile Trp Asn Leu Lys Val Ile Gly Pro Thr Leu Pro Ser Met
225 230 235 240
Tyr Leu Asp Lys Arg Leu Asp Asp Asp Lys Asp Asn Gly Phe Asn Leu
245 250 255
Tyr Lys Ala Asn His His Glu Cys Met Asn Trp Leu Asp Asp Lys Pro
260 265 270
Lys Glu Ser Val Val Tyr Val Ala Phe Gly Ser Leu Gly Lys His Gly
275 280 285
Pro Glu Gln Val Glu Glu Ile Thr Arg Ala Leu Ile Asp Ser Asp Val
290 295 300
Asn Phe Leu Trp Val Ile Lys His Lys Glu Glu Gly Lys Leu Pro Glu
305 310 315 320
Asn Leu Ser Glu Val Ile Lys Thr Gly Lys Gly Leu Ile Val Ala Trp
325 330 335
Cys Lys Gln Leu Asp Val Leu Ala His Glu Ser Val Gly Cys Phe Val
340 345 350
Thr His Cys Gly Phe Asn Ser Thr Leu Glu Ala Ile Ser Leu Gly Val
355 360 365
Pro Val Val Ala Met Pro Gln Phe Ser Asp Gln Thr Thr Asn Ala Lys
370 375 380
Leu Leu Asp Glu Ile Leu Gly Val Gly Val Arg Val Lys Ala Asp Glu
385 390 395 400
Asn Gly Ile Val Arg Arg Gly Asn Leu Ala Ser Cys Ile Lys Met Ile
405 410 415
Met Glu Glu Glu Arg Gly Val Ile Ile Arg Lys Asn Ala Val Lys Trp
420 425 430
Lys Asp Leu Ala Lys Val Ala Val His Glu Gly Gly Ser Ser Asp Asn
435 440 445
Asp Ile Val Glu Phe Val Ser Glu Leu Ile Lys Ala
450 455 460
<210> 13
<211> 1383
<212> DNA
<213> Artificial sequence
<220>
<223> UDP-glycosyltransferase variant encoding sequence
<400> 13
atggccgagc agcagaagat caagaagtct ccccacgttc tgctcatccc cttccctctg 60
cagggccaca tcaacccctt catccagttc ggcaagcgac tcatctccaa gggtgtcaag 120
accactctgg tcaccaccat ccacaccctc aactccactc tcaaccactc caacaccacc 180
accacctcca tcgagatcca ggccatctcc gacggctgtg acgagggtgg tttcatgtct 240
gctggtgagt cttacctcga gactttcaag caggtcggtt ccaagtctct ggctgacctc 300
atcaagaagc tccagtccga gggtaccacc attgacgcca tcatctacga ctccatgacc 360
gagtgggttc tcgatgtcgc catcgagttt ggtattgacg gtggctcctt cttcacccag 420
gcctgtgtcg tcaactctct ctactaccac gtccacaagg gtctgatctc tctgcccctc 480
ggcgagactg tctccgtccc cggtttcccc gttctgcagc gatgggagac tcctctcatt 540
ctccagaacc acgagcagat ccagtccccc tggtcccaga tgctcttcgg ccagttcgcc 600
aacattgacc aggcccgatg ggttttcacc aactccttct acaagctcga ggaagaggtc 660
attgagtgga cccgaaagat ctggaacctc aaggtcattg gccccaccct cccctccatg 720
tacctcgaca agcgactcga tgacgacaag gacaacggtt tcaacctcta caaggccaac 780
caccacgagt gcatgaactg gctcgacgac aagcccaagg agtccgttgt ctacgttgcc 840
tttggctctc tgaacaagca cggccccgag caggttgagg agatcacccg agctctgatt 900
gactccgatg tcaacttcct gtgggtcatc aagcacaagg aagagggtaa gctccccgag 960
aacctgtccg aggtcatcaa gaccggcaag ggcctcattg ttgcctggtg caagcagctc 1020
gacgttctcg cccacgagtc cgtcggctgc tttgtcaccc actgcggttt caactccacc 1080
ctcgaggcta tctctctcgg tgtccccgtt gttgccatgc cccagttctc cgaccagacc 1140
accaacgcca agctcctcga tgagattctc ggtgtcggtg tccgagtcaa ggctgacgag 1200
aacggtattg tccgacgagg taacctggct tcttgtatca agatgatcat ggaggaagag 1260
cgaggtgtca tcatccgaaa gaacgccgtc aagtggaagg atctggccaa ggttgctgtc 1320
cacgagggtg gctcttccga caacgacatt gtcgagtttg tctccgagct catcaaggcc 1380
taa 1383
<210> 14
<211> 460
<212> PRT
<213> Artificial sequence
<220>
<223> UDP-glycosyltransferase variant
<400> 14
Met Ala Glu Gln Gln Lys Ile Lys Lys Ser Pro His Val Leu Leu Ile
1 5 10 15
Pro Phe Pro Leu Gln Gly His Ile Asn Pro Phe Ile Gln Phe Gly Lys
20 25 30
Arg Leu Ile Ser Lys Gly Val Lys Thr Thr Leu Val Thr Thr Ile His
35 40 45
Thr Leu Asn Ser Thr Leu Asn His Ser Asn Thr Thr Thr Thr Ser Ile
50 55 60
Glu Ile Gln Ala Ile Ser Asp Gly Cys Asp Glu Gly Gly Phe Met Ser
65 70 75 80
Ala Gly Glu Ser Tyr Leu Glu Thr Phe Lys Gln Val Gly Ser Lys Ser
85 90 95
Leu Ala Asp Leu Ile Lys Lys Leu Gln Ser Glu Gly Thr Thr Ile Asp
100 105 110
Ala Ile Ile Tyr Asp Ser Met Thr Glu Trp Val Leu Asp Val Ala Ile
115 120 125
Glu Phe Gly Ile Asp Gly Gly Ser Phe Phe Thr Gln Ala Cys Val Val
130 135 140
Asn Ser Leu Tyr Tyr His Val His Lys Gly Leu Ile Ser Leu Pro Leu
145 150 155 160
Gly Glu Thr Val Ser Val Pro Gly Phe Pro Val Leu Gln Arg Trp Glu
165 170 175
Thr Pro Leu Ile Leu Gln Asn His Glu Gln Ile Gln Ser Pro Trp Ser
180 185 190
Gln Met Leu Phe Gly Gln Phe Ala Asn Ile Asp Gln Ala Arg Trp Val
195 200 205
Phe Thr Asn Ser Phe Tyr Lys Leu Glu Glu Glu Val Ile Glu Trp Thr
210 215 220
Arg Lys Ile Trp Asn Leu Lys Val Ile Gly Pro Thr Leu Pro Ser Met
225 230 235 240
Tyr Leu Asp Lys Arg Leu Asp Asp Asp Lys Asp Asn Gly Phe Asn Leu
245 250 255
Tyr Lys Ala Asn His His Glu Cys Met Asn Trp Leu Asp Asp Lys Pro
260 265 270
Lys Glu Ser Val Val Tyr Val Ala Phe Gly Ser Leu Asn Lys His Gly
275 280 285
Pro Glu Gln Val Glu Glu Ile Thr Arg Ala Leu Ile Asp Ser Asp Val
290 295 300
Asn Phe Leu Trp Val Ile Lys His Lys Glu Glu Gly Lys Leu Pro Glu
305 310 315 320
Asn Leu Ser Glu Val Ile Lys Thr Gly Lys Gly Leu Ile Val Ala Trp
325 330 335
Cys Lys Gln Leu Asp Val Leu Ala His Glu Ser Val Gly Cys Phe Val
340 345 350
Thr His Cys Gly Phe Asn Ser Thr Leu Glu Ala Ile Ser Leu Gly Val
355 360 365
Pro Val Val Ala Met Pro Gln Phe Ser Asp Gln Thr Thr Asn Ala Lys
370 375 380
Leu Leu Asp Glu Ile Leu Gly Val Gly Val Arg Val Lys Ala Asp Glu
385 390 395 400
Asn Gly Ile Val Arg Arg Gly Asn Leu Ala Ser Cys Ile Lys Met Ile
405 410 415
Met Glu Glu Glu Arg Gly Val Ile Ile Arg Lys Asn Ala Val Lys Trp
420 425 430
Lys Asp Leu Ala Lys Val Ala Val His Glu Gly Gly Ser Ser Asp Asn
435 440 445
Asp Ile Val Glu Phe Val Ser Glu Leu Ile Lys Ala
450 455 460
<210> 15
<211> 1383
<212> DNA
<213> Artificial sequence
<220>
<223> UDP-glycosyltransferase variant encoding sequence
<400> 15
atggccgagc agcagaagat caagaagtct ccccacgttc tgctcatccc cttccctctg 60
cagggccaca tcaacccctt catccagttc ggcaagcgac tcatctccaa gggtgtcaag 120
accactctgg tcaccaccat ccacaccctc aactccactc tcaaccactc caacaccacc 180
accacctcca tcgagatcca ggccatctcc gacggctgtg acgagggtgg tttcatgtct 240
gctggtgagt cttacctcga gactttcaag caggtcggtt ccaagtctct ggctgacctc 300
atcaagaagc tccagtccga gggtaccacc attgacgcca tcatctacga ctccatgacc 360
gagtgggttc tcgatgtcgc catcgagttt ggtattgacg gtggctcctt cttcacccag 420
gcctgtgtcg tcaactctct ctactaccac gtccacaagg gtctgatctc tctgcccctc 480
ggcgagactg tctccgtccc cggtttcccc gttctgcagc gatgggagac tcctctcatt 540
ctccagaacc acgagcagat ccagtccccc tggtcccaga tgctcttcgg ccagttcgcc 600
aacattgacc aggcccgatg ggttttcacc aactccttct acaagctcga ggaagaggtc 660
attgagtgga cccgaaagat ctggaacctc aaggtcattg gccccaccct cccctccatg 720
tacctcgaca agcgactcga tgacgacaag gacaacggtt tcaacctcta caaggccaac 780
caccacgagt gcatgaactg gctcgacgac aagcccaagg agtccgttgt ctacgttgcc 840
tttggctctc tgtccaagca cggccccgag caggttgagg agatcacccg agctctgatt 900
gactccgatg tcaacttcct gtgggtcatc aagcacaagg aagagggtaa gctccccgag 960
aacctgtccg aggtcatcaa gaccggcaag ggcctcattg ttgcctggtg caagcagctc 1020
gacgttctcg cccacgagtc cgtcggctgc tttgtcaccc actgcggttt caactccacc 1080
ctcgaggcta tctctctcgg tgtccccgtt gttgccatgc cccagttctc cgaccagacc 1140
accaacgcca agctcctcga tgagattctc ggtgtcggtg tccgagtcaa ggctgacgag 1200
aacggtattg tccgacgagg taacctggct tcttgtatca agatgatcat ggaggaagag 1260
cgaggtgtca tcatccgaaa gaacgccgtc aagtggaagg atctggccaa ggttgctgtc 1320
cacgagggtg gctcttccga caacgacatt gtcgagtttg tctccgagct catcaaggcc 1380
taa 1383
<210> 16
<211> 460
<212> PRT
<213> Artificial sequence
<220>
<223> UDP-glycosyltransferase variant
<400> 16
Met Ala Glu Gln Gln Lys Ile Lys Lys Ser Pro His Val Leu Leu Ile
1 5 10 15
Pro Phe Pro Leu Gln Gly His Ile Asn Pro Phe Ile Gln Phe Gly Lys
20 25 30
Arg Leu Ile Ser Lys Gly Val Lys Thr Thr Leu Val Thr Thr Ile His
35 40 45
Thr Leu Asn Ser Thr Leu Asn His Ser Asn Thr Thr Thr Thr Ser Ile
50 55 60
Glu Ile Gln Ala Ile Ser Asp Gly Cys Asp Glu Gly Gly Phe Met Ser
65 70 75 80
Ala Gly Glu Ser Tyr Leu Glu Thr Phe Lys Gln Val Gly Ser Lys Ser
85 90 95
Leu Ala Asp Leu Ile Lys Lys Leu Gln Ser Glu Gly Thr Thr Ile Asp
100 105 110
Ala Ile Ile Tyr Asp Ser Met Thr Glu Trp Val Leu Asp Val Ala Ile
115 120 125
Glu Phe Gly Ile Asp Gly Gly Ser Phe Phe Thr Gln Ala Cys Val Val
130 135 140
Asn Ser Leu Tyr Tyr His Val His Lys Gly Leu Ile Ser Leu Pro Leu
145 150 155 160
Gly Glu Thr Val Ser Val Pro Gly Phe Pro Val Leu Gln Arg Trp Glu
165 170 175
Thr Pro Leu Ile Leu Gln Asn His Glu Gln Ile Gln Ser Pro Trp Ser
180 185 190
Gln Met Leu Phe Gly Gln Phe Ala Asn Ile Asp Gln Ala Arg Trp Val
195 200 205
Phe Thr Asn Ser Phe Tyr Lys Leu Glu Glu Glu Val Ile Glu Trp Thr
210 215 220
Arg Lys Ile Trp Asn Leu Lys Val Ile Gly Pro Thr Leu Pro Ser Met
225 230 235 240
Tyr Leu Asp Lys Arg Leu Asp Asp Asp Lys Asp Asn Gly Phe Asn Leu
245 250 255
Tyr Lys Ala Asn His His Glu Cys Met Asn Trp Leu Asp Asp Lys Pro
260 265 270
Lys Glu Ser Val Val Tyr Val Ala Phe Gly Ser Leu Ser Lys His Gly
275 280 285
Pro Glu Gln Val Glu Glu Ile Thr Arg Ala Leu Ile Asp Ser Asp Val
290 295 300
Asn Phe Leu Trp Val Ile Lys His Lys Glu Glu Gly Lys Leu Pro Glu
305 310 315 320
Asn Leu Ser Glu Val Ile Lys Thr Gly Lys Gly Leu Ile Val Ala Trp
325 330 335
Cys Lys Gln Leu Asp Val Leu Ala His Glu Ser Val Gly Cys Phe Val
340 345 350
Thr His Cys Gly Phe Asn Ser Thr Leu Glu Ala Ile Ser Leu Gly Val
355 360 365
Pro Val Val Ala Met Pro Gln Phe Ser Asp Gln Thr Thr Asn Ala Lys
370 375 380
Leu Leu Asp Glu Ile Leu Gly Val Gly Val Arg Val Lys Ala Asp Glu
385 390 395 400
Asn Gly Ile Val Arg Arg Gly Asn Leu Ala Ser Cys Ile Lys Met Ile
405 410 415
Met Glu Glu Glu Arg Gly Val Ile Ile Arg Lys Asn Ala Val Lys Trp
420 425 430
Lys Asp Leu Ala Lys Val Ala Val His Glu Gly Gly Ser Ser Asp Asn
435 440 445
Asp Ile Val Glu Phe Val Ser Glu Leu Ile Lys Ala
450 455 460
<210> 17
<211> 1383
<212> DNA
<213> Artificial sequence
<220>
<223> UDP-glycosyltransferase variant encoding sequence
<400> 17
atggccgagc agcagaagat caagaagtct ccccacgttc tgctcatccc cttccctctg 60
cagggccaca tcaacccctt catccagttc ggcaagcgac tcatctccaa gggtgtcaag 120
accactctgg tcaccaccat ccacaccctc aactccactc tcaaccactc caacaccacc 180
accacctcca tcgagatcca ggccatctcc gacggctgtg acgagggtgg tttcatgtct 240
gctggtgagt cttacctcga gactttcaag caggtcggtt ccaagtctct ggctgacctc 300
atcaagaagc tccagtccga gggtaccacc attgacgcca tcatctacga ctccatgacc 360
gagtgggttc tcgatgtcgc catcgagttt ggtattgacg gtggctcctt cttcacccag 420
gcctgtgtcg tcaactctct ctactaccac gtccacaagg gtctgatctc tctgcccctc 480
ggcgagactg tctccgtccc cggtttcccc gttctgcagc gatgggagac tcctctcatt 540
ctccagaacc acgagcagat ccagtccccc tggtcccaga tgctcttcgg ccagttcgcc 600
aacattgacc aggcccgatg ggttttcacc aactccttct acaagctcga ggaagaggtc 660
attgagtgga cccgaaagat ctggaacctc aaggtcattg gccccaccct cccctccatg 720
tacctcgaca agcgactcga tgacgacaag gacaacggtt tcaacctcta caaggccaac 780
caccacgagt gcatgaactg gctcgacgac aagcccaagg agtccgttgt ctacgttgcc 840
tttggctctc tggtcaagca cggccccgag caggttgagg agatcacccg agctctgatt 900
gactccgatg tcaacttcct gtgggtcatc aagcacaagg aagagggtaa gctccccgag 960
aacctgtccg aggtcatcaa gaccggcaag ggcctcattg ctgcctggtg caagcagctc 1020
gacgttctcg cccacgagtc cgtcggctgc tttgtcaccc actgcggttt caactccacc 1080
ctcgaggcta tctctctcgg tgtccccgtt gttgccatgc cccagttctc cgaccagacc 1140
accaacgcca agctcctcga tgagattctc ggtgtcggtg tccgagtcaa ggctgacgag 1200
aacggtattg tccgacgagg taacctggct tcttgtatca agatgatcat ggaggaagag 1260
cgaggtgtca tcatccgaaa gaacgccgtc aagtggaagg atctggccaa ggttgctgtc 1320
cacgagggtg gctcttccga caacgacatt gtcgagtttg tctccgagct catcaaggcc 1380
taa 1383
<210> 18
<211> 460
<212> PRT
<213> Artificial sequence
<220>
<223> UDP-glycosyltransferase variant
<400> 18
Met Ala Glu Gln Gln Lys Ile Lys Lys Ser Pro His Val Leu Leu Ile
1 5 10 15
Pro Phe Pro Leu Gln Gly His Ile Asn Pro Phe Ile Gln Phe Gly Lys
20 25 30
Arg Leu Ile Ser Lys Gly Val Lys Thr Thr Leu Val Thr Thr Ile His
35 40 45
Thr Leu Asn Ser Thr Leu Asn His Ser Asn Thr Thr Thr Thr Ser Ile
50 55 60
Glu Ile Gln Ala Ile Ser Asp Gly Cys Asp Glu Gly Gly Phe Met Ser
65 70 75 80
Ala Gly Glu Ser Tyr Leu Glu Thr Phe Lys Gln Val Gly Ser Lys Ser
85 90 95
Leu Ala Asp Leu Ile Lys Lys Leu Gln Ser Glu Gly Thr Thr Ile Asp
100 105 110
Ala Ile Ile Tyr Asp Ser Met Thr Glu Trp Val Leu Asp Val Ala Ile
115 120 125
Glu Phe Gly Ile Asp Gly Gly Ser Phe Phe Thr Gln Ala Cys Val Val
130 135 140
Asn Ser Leu Tyr Tyr His Val His Lys Gly Leu Ile Ser Leu Pro Leu
145 150 155 160
Gly Glu Thr Val Ser Val Pro Gly Phe Pro Val Leu Gln Arg Trp Glu
165 170 175
Thr Pro Leu Ile Leu Gln Asn His Glu Gln Ile Gln Ser Pro Trp Ser
180 185 190
Gln Met Leu Phe Gly Gln Phe Ala Asn Ile Asp Gln Ala Arg Trp Val
195 200 205
Phe Thr Asn Ser Phe Tyr Lys Leu Glu Glu Glu Val Ile Glu Trp Thr
210 215 220
Arg Lys Ile Trp Asn Leu Lys Val Ile Gly Pro Thr Leu Pro Ser Met
225 230 235 240
Tyr Leu Asp Lys Arg Leu Asp Asp Asp Lys Asp Asn Gly Phe Asn Leu
245 250 255
Tyr Lys Ala Asn His His Glu Cys Met Asn Trp Leu Asp Asp Lys Pro
260 265 270
Lys Glu Ser Val Val Tyr Val Ala Phe Gly Ser Leu Val Lys His Gly
275 280 285
Pro Glu Gln Val Glu Glu Ile Thr Arg Ala Leu Ile Asp Ser Asp Val
290 295 300
Asn Phe Leu Trp Val Ile Lys His Lys Glu Glu Gly Lys Leu Pro Glu
305 310 315 320
Asn Leu Ser Glu Val Ile Lys Thr Gly Lys Gly Leu Ile Ala Ala Trp
325 330 335
Cys Lys Gln Leu Asp Val Leu Ala His Glu Ser Val Gly Cys Phe Val
340 345 350
Thr His Cys Gly Phe Asn Ser Thr Leu Glu Ala Ile Ser Leu Gly Val
355 360 365
Pro Val Val Ala Met Pro Gln Phe Ser Asp Gln Thr Thr Asn Ala Lys
370 375 380
Leu Leu Asp Glu Ile Leu Gly Val Gly Val Arg Val Lys Ala Asp Glu
385 390 395 400
Asn Gly Ile Val Arg Arg Gly Asn Leu Ala Ser Cys Ile Lys Met Ile
405 410 415
Met Glu Glu Glu Arg Gly Val Ile Ile Arg Lys Asn Ala Val Lys Trp
420 425 430
Lys Asp Leu Ala Lys Val Ala Val His Glu Gly Gly Ser Ser Asp Asn
435 440 445
Asp Ile Val Glu Phe Val Ser Glu Leu Ile Lys Ala
450 455 460
<210> 19
<211> 1383
<212> DNA
<213> Artificial sequence
<220>
<223> UDP-glycosyltransferase variant encoding sequence
<400> 19
atggccgagc agcagaagat caagaagtct ccccacgttc tgctcatccc cttccctctg 60
cagggccaca tcaacccctt catccagttc ggcaagcgac tcatctccaa gggtgtcaag 120
accactctgg tcaccaccat ccacaccctc aactccactc tcaaccactc caacaccacc 180
accacctcca tcgagatcca ggccatctcc gacggctgtg acgagggtgg tttcatgtct 240
gctggtgagt cttacctcga gactttcaag caggtcggtt ccaagtctct ggctgacctc 300
atcaagaagc tccagtccga gggtaccacc attgacgcca tcatctacga ctccatgacc 360
gagtgggttc tcgatgtcgc catcgagttt ggtattgacg gtggctcctt cttcacccag 420
gcctgtgtcg tcaactctct ctactaccac gtccacaagg gtctgatctc tctgcccctc 480
ggcgagactg tctccgtccc cggtttcccc gttctgcagc gatgggagac tcctctcatt 540
ctccagaacc acgagcagat ccagtccccc tggtcccaga tgctcttcgg ccagttcgcc 600
aacattgacc aggcccgatg ggttttcacc aactccttct acaagctcga ggaagaggtc 660
attgagtgga cccgaaagat ctggaacctc aaggtcattg gccccaccct cccctccatg 720
tacctcgaca agcgactcga tgacgacaag gacaacggtt tcaacctcta caaggccaac 780
caccacgagt gcatgaactg gctcgacgac aagcccaagg agtccgttgt ctacgttgcc 840
tttggctctc tggtcaagca cggccccgag caggttgagg agatcacccg agctctgatt 900
gactccgatg tcaacttcct gtgggtcatc aagcacaagg aagagggtaa gctccccgag 960
aacctgtccg aggtcatcaa gaccggcaag ggcctcattg ttgcctggtg caagcagctc 1020
gacgttctcg cccacgagtc cgtcggctgc tttgtcaccc actgcggttt caactccacc 1080
ctcgaggcta tctctctcgg tgtccccgtt gttgccgccc cccagttctc cgaccagacc 1140
accaacgcca agctcctcga tgagattctc ggtgtcggtg tccgagtcaa ggctgacgag 1200
aacggtattg tccgacgagg taacctggct tcttgtatca agatgatcat ggaggaagag 1260
cgaggtgtca tcatccgaaa gaacgccgtc aagtggaagg atctggccaa ggttgctgtc 1320
cacgagggtg gctcttccga caacgacatt gtcgagtttg tctccgagct catcaaggcc 1380
taa 1383
<210> 20
<211> 460
<212> PRT
<213> Artificial sequence
<220>
<223> UDP-glycosyltransferase variant
<400> 20
Met Ala Glu Gln Gln Lys Ile Lys Lys Ser Pro His Val Leu Leu Ile
1 5 10 15
Pro Phe Pro Leu Gln Gly His Ile Asn Pro Phe Ile Gln Phe Gly Lys
20 25 30
Arg Leu Ile Ser Lys Gly Val Lys Thr Thr Leu Val Thr Thr Ile His
35 40 45
Thr Leu Asn Ser Thr Leu Asn His Ser Asn Thr Thr Thr Thr Ser Ile
50 55 60
Glu Ile Gln Ala Ile Ser Asp Gly Cys Asp Glu Gly Gly Phe Met Ser
65 70 75 80
Ala Gly Glu Ser Tyr Leu Glu Thr Phe Lys Gln Val Gly Ser Lys Ser
85 90 95
Leu Ala Asp Leu Ile Lys Lys Leu Gln Ser Glu Gly Thr Thr Ile Asp
100 105 110
Ala Ile Ile Tyr Asp Ser Met Thr Glu Trp Val Leu Asp Val Ala Ile
115 120 125
Glu Phe Gly Ile Asp Gly Gly Ser Phe Phe Thr Gln Ala Cys Val Val
130 135 140
Asn Ser Leu Tyr Tyr His Val His Lys Gly Leu Ile Ser Leu Pro Leu
145 150 155 160
Gly Glu Thr Val Ser Val Pro Gly Phe Pro Val Leu Gln Arg Trp Glu
165 170 175
Thr Pro Leu Ile Leu Gln Asn His Glu Gln Ile Gln Ser Pro Trp Ser
180 185 190
Gln Met Leu Phe Gly Gln Phe Ala Asn Ile Asp Gln Ala Arg Trp Val
195 200 205
Phe Thr Asn Ser Phe Tyr Lys Leu Glu Glu Glu Val Ile Glu Trp Thr
210 215 220
Arg Lys Ile Trp Asn Leu Lys Val Ile Gly Pro Thr Leu Pro Ser Met
225 230 235 240
Tyr Leu Asp Lys Arg Leu Asp Asp Asp Lys Asp Asn Gly Phe Asn Leu
245 250 255
Tyr Lys Ala Asn His His Glu Cys Met Asn Trp Leu Asp Asp Lys Pro
260 265 270
Lys Glu Ser Val Val Tyr Val Ala Phe Gly Ser Leu Val Lys His Gly
275 280 285
Pro Glu Gln Val Glu Glu Ile Thr Arg Ala Leu Ile Asp Ser Asp Val
290 295 300
Asn Phe Leu Trp Val Ile Lys His Lys Glu Glu Gly Lys Leu Pro Glu
305 310 315 320
Asn Leu Ser Glu Val Ile Lys Thr Gly Lys Gly Leu Ile Val Ala Trp
325 330 335
Cys Lys Gln Leu Asp Val Leu Ala His Glu Ser Val Gly Cys Phe Val
340 345 350
Thr His Cys Gly Phe Asn Ser Thr Leu Glu Ala Ile Ser Leu Gly Val
355 360 365
Pro Val Val Ala Ala Pro Gln Phe Ser Asp Gln Thr Thr Asn Ala Lys
370 375 380
Leu Leu Asp Glu Ile Leu Gly Val Gly Val Arg Val Lys Ala Asp Glu
385 390 395 400
Asn Gly Ile Val Arg Arg Gly Asn Leu Ala Ser Cys Ile Lys Met Ile
405 410 415
Met Glu Glu Glu Arg Gly Val Ile Ile Arg Lys Asn Ala Val Lys Trp
420 425 430
Lys Asp Leu Ala Lys Val Ala Val His Glu Gly Gly Ser Ser Asp Asn
435 440 445
Asp Ile Val Glu Phe Val Ser Glu Leu Ile Lys Ala
450 455 460
<210> 21
<211> 1503
<212> DNA
<213> Artificial sequence
<220>
<223> hydroxymethylglutaryl-CoA reductase from Yarrowia lipolitica, CpO
for expression in Yarrowia lipolitica
<400> 21
atgacccagt ctgtgaaggt ggttgagaag cacgttccta tcgtcattga gaagcccagc 60
gagaaggagg aggacacctc ttctgaagac tccattgagc tgactgtcgg aaagcagccc 120
aagcccgtga ccgagacccg ttctctggac gacttggagg ctatcatgaa ggcaggtaag 180
accaagctcc tggaggacca cgaggttgtc aagctctctc tcgaaggcaa gctccctttg 240
tatgctcttg agaagcagct tggtgacaac acccgagctg ttggcatccg acgatctatc 300
atctcccagc agtctaatac caagactctt gagacctcaa agctccctta cctgcactac 360
gactacgacc gtgtttttgg agcctgttgc gagaacgtta ttggttacat gcctctcccc 420
gttggtgttg ctggccccat gaacattgat ggcaagaact accacattcc tatggccacc 480
actgagggtt gtcttgttgc ctcaaccatg cgaggttgca aggccatcaa cgccggtggc 540
ggtgttacca ctgtgcttac tcaggacggt atgacacgag gtccttgtgt ttccttcccc 600
tctctcaagc gggctggagc cgctaagatc tggcttgatt ccgaggaggg tctcaagtcc 660
atgcgaaagg ccttcaactc cacctctcga tttgctcgtc tccagtctct tcactctacc 720
cttgctggta acctgctgtt tattcgattc cgaaccacca ctggtgatgc catgggcatg 780
aacatgatct ccaagggcgt cgaacactct ctggccgtca tggtcaagga gtacggcttc 840
cctgatatgg acattgtgtc tgtctcgggt aactactgca ctgacaagaa gcccgcagcg 900
atcaactgga tcgaaggccg aggcaagagt gttgttgccg aagccaccat ccctgctcac 960
attgtcaagt ctgttctcaa aagtgaggtt gacgctcttg ttgagctcaa catcagcaag 1020
aatctgatcg gtagtgccat ggctggctct gtgggaggtt tcaatgcaca cgccgcaaac 1080
ctggtgaccg ccatctacct tgccactggc caggatcctg ctcagaatgt cgagtcttcc 1140
aactgcatca cgctgatgag caacgtcgac ggtaacctgc tcatctccgt ttccatgcct 1200
tctatcgagg tcggtaccat tggtggaggt actattttgg agccccaggg tgctatgctg 1260
gagatgcttg gcgtgcgagg tcctcacatc gagacccccg gtgccaacgc ccaacagctt 1320
gctcgcatca ttgcttctgg agttcttgca gcggagcttt cgctgtgttc tgctcttgct 1380
gccggccatc ttgtgcaaag tcatatgacc cacaaccgtt cccaggctcc tactccggcc 1440
aagcagtctc aggccgatct gcagcgtctc caaaacggtt cgaatatctg cattcggtca 1500
tag 1503
<210> 22
<211> 984
<212> DNA
<213> Artificial sequence
<220>
<223> Geranylgeranyl diphosphate synthase from Yarrowia lipolitica CpO
for expression in Yarrowia lipolitica
<400> 22
atggattata acagcgcgga tttcaaggag atctggggca aggccgccga caccgcgctg 60
ctgggaccgt acaactacct cgccaacaac cggggccaca acatcagaga acacttgatc 120
gcagcgttcg gagcggttat caaggtggac aagagcgatc tcgaaaccat ttcgcacatc 180
accaagattt tgcataactc gtcgctgctt gttgatgacg tggaagacaa ctcgatgctc 240
cgacgaggcc tgccggcagc ccattgtctg tttggagtcc cccaaaccat caactccgcc 300
aactacatgt actttgtggc tctgcaggag gtgctcaagc tcaagtctta tgatgccgtc 360
tccattttca ccgaggaaat gatcaacttg catagaggtc agggtatgga tctctactgg 420
agagaaacac tcacttgccc ctcggaagac gagtatctgg agatggtggt gcacaagacc 480
ggaggactgt ttcggctggc tctgagactt atgctgtcgg tggcatcgaa acaggaggac 540
catgaaaaga tcaactttga tctcacacac cttaccgaca cactgggagt catttaccag 600
attctggatg attacctcaa cctgcagtcc acggaattga ccgagaacaa gggattctgc 660
gaagatatca gcgaaggaaa gttttcgttt ccgctgattc acagcatccg gaccaacccg 720
gataaccacg agattctcaa cattctcaaa cagcgaacaa gcgacgcttc actcaaaaag 780
tacgccgtgg actacatgag aacagaaacc aagagtttcg actactgcct caagagaatc 840
caggccatgt cactcaaggc aagttcgtac attgatgatc tcgcagcagc cggccacgat 900
gtctccaagt tgcgagccat tttgcattat tttgtgtcca cctctgactg tgaggagaga 960
aagtactttg aggatgcgca gtga 984
<210> 23
<211> 2232
<212> DNA
<213> Artificial sequence
<220>
<223> Copalyl pyrophosphate synthase from Stevia rebaudiana CpO for
expression in Yarrowia lipolitica
<400> 23
atgtgcaagg ctgtttccaa ggagtactcc gatctgctcc agaaggacga ggcctctttc 60
accaagtggg acgacgacaa ggtcaaggac cacctcgaca ccaacaagaa cctctacccc 120
aacgacgaga tcaaggagtt tgtcgagtcc gtcaaggcca tgttcggctc catgaacgac 180
ggcgagatta atgtctctgc ttacgacacc gcctgggttg ctctggtcca ggatgtcgac 240
ggttccggct ctcctcagtt cccttcctct ctcgagtgga tcgccaacaa ccagctgtcc 300
gacggttctt ggggtgacca cctgctcttc tctgctcacg accgaatcat caacaccctg 360
gcctgtgtca ttgctctgac ctcttggaac gtccacccct ccaagtgcga gaagggtctg 420
aacttcctcc gagagaacat ctgcaagctc gaggacgaga acgccgagca catgcccatt 480
ggcttcgagg tcaccttccc ctctctgatt gacattgcca agaagctcaa cattgaggtc 540
cccgaggaca cccccgctct caaggagatc tacgctcgac gagacatcaa gctcaccaag 600
atccccatgg aggttctcca caaggtcccc accactctcc tccactctct cgagggtatg 660
cccgatctcg agtgggagaa gctgctcaag ctgcagtgca aggacggctc tttcctcttc 720
tccccctctt ccactgcctt cgccctcatg cagaccaagg acgagaagtg tctccagtac 780
ctcaccaaca ttgtcaccaa gttcaacggt ggtgtcccca acgtctaccc cgttgacctc 840
tttgagcaca tctgggttgt tgaccgactc cagcgactcg gtatcgcccg atacttcaag 900
tccgagatca aggactgtgt cgagtacatc aacaagtact ggaccaagaa cggtatctgc 960
tgggcccgaa acacccacgt ccaggacatt gacgacaccg ccatgggctt ccgagttctg 1020
cgagcccacg gctacgatgt cacccccgat gtctttcgac agtttgagaa ggacggcaag 1080
tttgtctgtt tcgccggtca gtccacccag gccgtcaccg gtatgttcaa cgtctaccga 1140
gcttctcaga tgctcttccc cggtgagcga atcctcgagg acgccaagaa gttctcctac 1200
aactacctca aggagaagca gtccaccaac gagctgctcg acaagtggat cattgccaag 1260
gatctgcccg gtgaggttgg ctacgccctc gacatcccct ggtacgcctc tctgccccga 1320
ctggagactc gatactacct cgagcagtac ggtggtgagg acgatgtctg gatcggtaag 1380
accctgtacc gaatgggcta cgtttccaac aacacctacc tcgagatggc caagctcgac 1440
tacaacaact acgttgccgt cctccagctc gagtggtaca ccatccagca gtggtacgtc 1500
gacattggta tcgagaagtt cgagtccgac aacatcaagt ccgtccttgt ctcctactac 1560
ctcgctgctg cctccatctt cgagcccgag cgatccaagg agcgaattgc ctgggccaag 1620
accaccatcc tcgtcgacaa gatcacctcc atcttcgact cctcccagtc ctccaaggaa 1680
gatatcaccg ccttcattga caagttccga aacaagtcct cctccaagaa gcactccatc 1740
aacggcgagc cctggcacga ggtcatggtt gctctcaaga aaactctcca cggctttgcc 1800
ctcgacgctc tgatgaccca ctctcaggac atccaccccc agctccacca ggcctgggag 1860
atgtggctca ccaagctcca ggacggtgtt gatgtcactg ctgagctcat ggtccagatg 1920
atcaacatga ccgccggccg atgggtttcc aaggagctcc tcacccaccc ccagtaccag 1980
cgactctcca ctgtcaccaa ctctgtctgc cacgacatca ccaagctcca caacttcaag 2040
gagaactcca ccaccgtcga ctccaaggtc caggagctgg tccagctcgt tttctccgac 2100
acccccgatg atctcgacca ggacatgaag cagaccttcc tgactgtcat gaaaactttc 2160
tactacaagg cctggtgcga ccccaacacc atcaacgacc acatctccaa ggtctttgag 2220
attgtgattt aa 2232
<210> 24
<211> 2274
<212> DNA
<213> Artificial sequence
<220>
<223> Kaurene synthase from Stevia rebaudiana CpO for expression in
Yarrowia lipolitica
<400> 24
atgacctccc acggcggcca gaccaacccc accaacctca tcattgacac caccaaggag 60
cgaatccaga agcagttcaa gaacgtcgag atctccgttt cctcctacga caccgcctgg 120
gtcgccatgg tcccctctcc caactccccc aagtctccct gcttccccga gtgtctcaac 180
tggctcatca acaaccagct caacgacggc tcttggggtc tggtcaacca cacccacaac 240
cacaaccacc ccctcctcaa ggactctctc tcttccactc tcgcctgcat tgttgctctc 300
aagcgatgga acgttggcga ggaccagatc aacaagggtc tgtctttcat tgagtccaac 360
ctcgcctccg ccaccgagaa gtcccagccc tcccccattg gctttgatat catcttcccc 420
ggtctgctcg agtacgccaa gaacctcgat atcaacctgc tctccaagca gaccgacttc 480
tctctcatgc tgcacaagcg agagctcgag cagaagcgat gccactccaa cgagatggac 540
ggctacctgg cctacatttc cgagggtctg ggtaacctct acgactggaa catggtcaag 600
aagtaccaga tgaagaacgg ttccgttttc aactccccct ctgccaccgc tgctgccttc 660
atcaaccacc agaaccccgg ctgtctcaac tacctcaact ctctgctcga caagtttggt 720
aacgccgtcc ccactgtcta cccccacgat ctcttcatcc gactctccat ggtcgacacc 780
attgagcgac tcggtatttc ccaccacttc cgagtcgaga tcaagaacgt tctcgatgag 840
acttaccgat gctgggttga gcgagatgag cagatcttca tggacgttgt cacctgtgct 900
ctggccttcc gactcctccg aatcaacggt tacgaggttt cccccgaccc cctcgccgag 960
atcaccaacg agctggctct caaggacgag tacgccgccc tcgagactta ccacgcttct 1020
cacattctgt accaagagga tctgtcctcc ggcaagcaga ttctcaagtc cgccgacttc 1080
ctcaaggaga tcatctccac tgactccaac cgactctcca agctcatcca caaggaagtc 1140
gagaacgctc tcaagttccc catcaacacc ggtctggagc gaatcaacac ccgacgaaac 1200
atccagctct acaacgtcga caacacccga attctcaaga ccacctacca ctcttccaac 1260
atctccaaca ccgactacct gcgactcgcc gtcgaggact tctacacctg ccagtccatc 1320
taccgagagg agctcaaggg tctggagcga tgggttgtcg agaacaagct cgaccagctc 1380
aagtttgccc gacaaaagac tgcctactgc tacttctccg ttgctgccac cctctcttct 1440
cccgagctct ccgacgcccg aatctcttgg gccaagaacg gtatcctgac cactgttgtc 1500
gacgacttct ttgacattgg tggcaccatt gacgagctga ccaacctcat ccagtgcgtc 1560
gagaagtgga acgtcgacgt tgacaaggac tgttgttccg agcacgtccg aatcctcttc 1620
ctggctctca aggacgccat ctgctggatc ggtgacgagg ccttcaagtg gcaggctcga 1680
gatgtcactt cccacgtcat ccagacctgg ctcgagctca tgaactccat gctgcgagag 1740
gccatctgga cccgagatgc ctacgtcccc accctcaacg agtacatgga gaacgcctac 1800
gtcagctttg ctctcggtcc cattgtcaag cccgccatct actttgtcgg tcccaagctg 1860
tccgaggaga ttgtcgagtc ctccgagtac cacaacctct tcaagctcat gtccacccag 1920
ggccgactcc tcaacgatat ccactccttc aagcgagagt tcaaggaagg taagctcaac 1980
gccgttgctc tgcacctgtc caacggtgag tccggcaagg tcgaggaaga ggtcgtcgag 2040
gagatgatga tgatgatcaa gaacaagcga aaggagctca tgaagctcat cttcgaggag 2100
aacggctcca ttgtcccccg agcctgcaag gacgccttct ggaacatgtg ccacgtcctc 2160
aacttcttct acgccaacga cgacggtttc accggcaaca ccattctcga caccgtcaag 2220
gacatcatct acaaccctct ggttctggtc aacgagaacg aggagcagag gtaa 2274
<210> 25
<211> 1578
<212> DNA
<213> Artificial sequence
<220>
<223> Kaurene oxidase from Giberella fujikuroi CpO for expression in
Yarrowia lipolitica
<400> 25
atgtccaagt ccaactccat gaactccacc tcccacgaga ctctcttcca gcagctcgtt 60
ctcggcctcg accgaatgcc cctcatggac gtccactggc tcatctacgt tgcctttggt 120
gcctggctct gctcctacgt catccacgtt ctgtcctctt cctccactgt caaggtcccc 180
gtcgtcggtt accgatccgt tttcgagccc acctggctcc tccgactgcg attcgtctgg 240
gagggtggtt ccatcattgg ccagggctac aacaagttca aggactccat cttccaggtc 300
cgaaagctcg gtaccgacat tgtcatcatc cctcccaact acattgacga ggtccgaaag 360
ctctcccagg acaagacccg atccgtcgag cccttcatca acgactttgc cggccagtac 420
acccgaggta tggtctttct gcagtccgat ctccagaacc gagtcatcca gcagcgactc 480
acccccaagc ttgtctctct caccaaggtc atgaaggaag agctcgacta cgctctgacc 540
aaggagatgc ccgacatgaa gaacgacgag tgggttgagg tcgacatctc ttccatcatg 600
gtccgactca tctctcgaat ctccgcccga gttttcctcg gccccgagca ctgccgaaac 660
caggagtggc tcaccaccac cgccgagtac tccgagtctc tcttcatcac cggcttcatc 720
ctccgagttg tcccccacat tctccgaccc ttcattgctc ctctgctgcc ctcttaccga 780
accctgctgc gaaacgtttc ttccggccga cgagtcattg gtgatatcat ccgatcccag 840
cagggtgacg gtaacgagga catcctctct tggatgcgag atgctgccac tggtgaggag 900
aagcagatcg acaacattgc ccagcgaatg ctcattctgt ctctcgcctc catccacacc 960
accgccatga ccatgaccca cgccatgtac gatctgtgtg cctgccccga gtacattgag 1020
cccctccgag atgaggtcaa gtccgtcgtt ggtgcttctg gctgggacaa gaccgctctc 1080
aaccgattcc acaagctcga ctctttcctc aaggagtccc agcgattcaa ccccgttttc 1140
ctgctcacct tcaaccgaat ctaccaccag tccatgaccc tctccgatgg taccaacatc 1200
ccctccggta cccgaattgc tgtcccctct cacgccatgc tccaggactc cgcccacgtc 1260
cccggtccca ctcctcccac tgagttcgac ggtttccgat actccaagat ccgatccgac 1320
tccaactacg cccagaagta cctcttctcc atgaccgact cttccaacat ggcctttggc 1380
tacggtaagt acgcctgccc cggccgattc tacgcctcca acgagatgaa gctgactctg 1440
gccattctgc tcctccagtt tgagttcaag ctccccgacg gtaagggccg accccgaaac 1500
atcaccatcg actccgacat gatccccgac ccccgagctc gactctgtgt ccgaaagcga 1560
tctctgcgtg acgagtaa 1578
<210> 26
<211> 1578
<212> DNA
<213> Artificial sequence
<220>
<223> kaurenoic acid 13-hydroxylase from Arabidopsis thaliana,
codon-pair optimized for expression in Yarrowia lipolitica
<400> 26
atggagtctc tggttgtcca caccgtcaac gccatctggt gcattgtcat tgtcggtatc 60
ttctccgtcg gctaccacgt ctacggccga gctgttgtcg agcagtggcg aatgcgacga 120
tctctcaagc tccagggtgt caagggtcct cctccctcca tcttcaacgg taacgtttcc 180
gagatgcagc gaatccagtc cgaggccaag cactgctccg gtgacaacat catctcccac 240
gactactctt cttctctgtt cccccacttt gaccactggc gaaagcagta cggccgaatc 300
tacacctact ccactggcct caagcagcac ctctacatca accaccccga gatggtcaag 360
gagctctccc agaccaacac cctcaacctc ggccgaatca cccacatcac caagcgactc 420
aaccccattc tcggtaacgg tatcatcacc tccaacggcc cccactgggc ccaccagcga 480
cgaatcattg cctacgagtt cacccacgac aagatcaagg gtatggtcgg tctgatggtc 540
gagtccgcca tgcccatgct caacaagtgg gaggagatgg tcaagcgagg tggtgagatg 600
ggctgtgaca tccgagtcga cgaggacctc aaggatgtct ccgctgacgt cattgccaag 660
gcctgtttcg gctcttcctt ctccaagggc aaggccatct tctccatgat ccgagatctg 720
ctcaccgcca tcaccaagcg atccgtcctc ttccgattca acggtttcac cgacatggtt 780
ttcggctcca agaagcacgg tgacgttgac attgacgctc tcgagatgga gctcgagtcc 840
tccatctggg agactgtcaa ggagcgagag attgagtgca aggacaccca caagaaggac 900
ctcatgcagc tcattctcga gggtgccatg cgatcttgtg acggtaacct gtgggacaag 960
tctgcttacc gacgattcgt tgtcgacaac tgcaagtcca tctactttgc cggccacgac 1020
tccaccgccg tttccgtttc ttggtgcctc atgctgctcg ctctcaaccc ctcttggcag 1080
gtcaagatcc gagatgagat tctgtcctcc tgcaagaacg gtatccccga cgccgagtcc 1140
atccccaacc tcaagaccgt caccatggtc atccaggaga ctatgcgact ctaccctccc 1200
gctcccattg tcggccgaga ggcctccaag gacattcgac tcggtgatct ggttgtcccc 1260
aagggtgtct gtatctggac cctcatcccc gctctgcacc gagatcccga gatctggggt 1320
cccgacgcca acgacttcaa gcccgagcga ttctccgagg gtatctccaa ggcctgcaag 1380
tacccccagt cctacatccc ctttggcctc ggcccccgaa cctgtgtcgg caagaacttt 1440
ggtatgatgg aggtcaaggt cctcgtttct ctgattgtct ccaagttctc cttcactctg 1500
tctcccacct accagcactc tccctcccac aagctgctcg tcgagcccca gcacggtgtt 1560
gtcatccgag ttgtataa 1578
<210> 27
<211> 2136
<212> DNA
<213> Artificial sequence
<220>
<223> Cytochrome P450 reductase from Arabidopsis thaliana CpO for
expression in Yarrowia lipolitica
<400> 27
atgtcctcct cttcttcttc ttccacctcc atgattgatc tcatggctgc catcatcaag 60
ggtgagcccg tcattgtctc cgaccccgcc aacgcctccg cctacgagtc cgttgctgcc 120
gagctgtcct ccatgctcat cgagaaccga cagtttgcca tgatcgtcac cacctccatt 180
gctgttctca ttggctgcat tgtcatgctc gtctggcgac gatctggctc cggtaactcc 240
aagcgagtcg agcccctcaa gcccctggtc atcaagcccc gagaagagga gatcgacgac 300
ggccgaaaga aggtcaccat cttctttggc acccagaccg gtactgctga gggcttcgcc 360
aaggctctcg gtgaggaagc caaggctcga tacgaaaaga cccgattcaa gattgtcgac 420
ctcgatgatt acgctgccga tgacgacgag tacgaggaga agctcaagaa agaggacgtt 480
gccttcttct tcctcgccac ctacggtgac ggtgagccca ccgacaacgc tgcccgattc 540
tacaagtggt tcaccgaggg taacgaccga ggcgagtggc tcaagaacct caagtacggt 600
gttttcggtc tgggcaaccg acagtacgag cacttcaaca aggttgccaa ggttgtcgac 660
gacatcctcg tcgagcaggg tgcccagcga ctcgtccagg tcggcctcgg tgatgatgac 720
cagtgcatcg aggacgactt cactgcctgg cgagaggctc tgtggcccga gctcgacacc 780
attctgcgag aggaaggtga caccgccgtt gccaccccct acaccgccgc cgtcctcgag 840
taccgagtct ccatccacga ctccgaggat gccaagttca acgacatcaa catggccaac 900
ggtaacggct acaccgtctt tgacgcccag cacccctaca aggccaacgt cgccgtcaag 960
cgagagctcc acacccccga gtccgaccga tcttgtatcc acctcgagtt tgacattgct 1020
ggttccggtc tgacctacga gactggtgac cacgttggtg tcctctgtga caacctgtcc 1080
gagactgtcg acgaggctct gcgactcctc gacatgtccc ccgacactta cttctctctg 1140
cacgccgaga aagaggacgg tactcccatc tcttcttctc tgccccctcc cttccctccc 1200
tgcaacctgc gaaccgctct gacccgatac gcctgcctcc tctcttctcc caagaagtct 1260
gctctcgttg ctctggccgc ccacgcctcc gaccccaccg aggctgagcg actcaagcac 1320
ctcgcctctc ccgctggcaa ggacgagtac tccaagtggg ttgtcgagtc ccagcgatct 1380
ctgctcgagg tcatggccga gttcccctcc gccaagcccc ctctcggtgt tttcttcgcc 1440
ggtgttgctc cccgactcca gccccgattc tactccatct cctcttcccc caagatcgcc 1500
gagactcgaa tccacgttac ctgtgctctg gtctacgaga agatgcccac cggccgaatc 1560
cacaagggtg tctgctccac ctggatgaag aacgccgttc cctacgagaa gtccgagaac 1620
tgttcctctg ctcccatctt tgtccgacag tccaacttca agctcccctc cgactccaag 1680
gtccccatca tcatgattgg ccccggtacc ggcctcgccc ccttccgagg cttcctgcag 1740
gagcgactcg ccctcgtcga gtccggtgtc gagctcggcc cctccgtcct cttctttggc 1800
tgccgaaacc gacgaatgga cttcatctac gaagaggagc tccagcgatt cgtcgagtcc 1860
ggtgctctcg ccgagctctc cgttgccttc tcccgagagg gtcccaccaa ggagtacgtc 1920
cagcacaaga tgatggacaa ggcctccgac atctggaaca tgatctccca gggcgcctac 1980
ctctacgtct gcggtgacgc caagggtatg gcccgagatg tccaccgatc tctgcacacc 2040
attgcccagg agcagggctc catggactcc accaaggccg agggtttcgt caagaacctc 2100
cagacctccg gccgatacct ccgagatgtc tggtaa 2136
<210> 28
<211> 1446
<212> DNA
<213> Artificial sequence
<220>
<223> UDP-glycosyltransferase from Stevia rebaudiana Cpo for expression
in Yarrowia lipolitica
<400> 28
atggacgcca tggccaccac cgagaagaag ccccacgtca tcttcatccc cttccccgcc 60
cagtcccaca tcaaggccat gctcaagctc gcccagctcc tccaccacaa gggcctccag 120
atcacctttg tcaacaccga cttcatccac aaccagttcc tcgagtcctc cggcccccac 180
tgtctggacg gtgctcccgg tttccgattt gagactatcc ccgatggtgt ctcccactcc 240
cccgaggcct ccatccccat ccgagagtct ctgctccgat ccattgagac taacttcctc 300
gaccgattca ttgatctcgt caccaagctc cccgatcctc ccacctgtat catctccgac 360
ggtttcctgt ccgttttcac cattgatgct gccaagaagc tcggtatccc cgtcatgatg 420
tactggactc tggctgcctg tggtttcatg ggtttctacc acatccactc tctgatcgag 480
aagggctttg ctcctctcaa ggacgcctcc tacctcacca acggttacct cgacaccgtc 540
attgactggg tccccggtat ggagggtatc cgactcaagg acttccccct cgactggtcc 600
accgacctca acgacaaggt tctcatgttc accaccgagg ctccccagcg atcccacaag 660
gtttcccacc acatcttcca caccttcgac gagctcgagc cctccatcat caagactctg 720
tctctgcgat acaaccacat ctacaccatt ggccccctcc agctcctcct cgaccagatc 780
cccgaggaga agaagcagac cggtatcacc tctctgcacg gctactctct cgtcaaggaa 840
gagcccgagt gcttccagtg gctccagtcc aaggagccca actccgttgt ctacgtcaac 900
tttggctcca ccaccgtcat gtctctcgag gacatgaccg agtttggctg gggtctggcc 960
aactccaacc actacttcct gtggatcatc cgatccaacc tcgtcattgg cgagaacgcc 1020
gttctgcctc ccgagctcga ggagcacatc aagaagcgag gcttcattgc ctcttggtgc 1080
tcccaggaga aggttctcaa gcacccctcc gtcggtggtt tcctgaccca ctgcggctgg 1140
ggctccacca ttgagtctct gtccgctggt gtccccatga tctgctggcc ctactcctgg 1200
gaccagctca ccaactgccg atacatctgc aaggagtggg aggttggtct ggagatgggt 1260
accaaggtca agcgagatga ggtcaagcga ctcgtccagg agctcatggg cgagggtggt 1320
cacaagatgc gaaacaaggc caaggactgg aaggagaagg cccgaattgc cattgccccc 1380
aacggctctt cttctctcaa cattgacaag atggtcaagg agatcactgt tctcgctcga 1440
aactaa 1446
<210> 29
<211> 1422
<212> DNA
<213> Artificial sequence
<220>
<223> variant of UDP-glycosyltransferase from Stevia rebaudiana Cpo for
expression in Yarrowia lipolitica
<400> 29
atggccacct ccgactccat tgttgacgac cgaaagaagc tccacattgt catgttcccc 60
tggctcgcct ttggccacat catcccctat ctcgagcttt ccaagctcat tgcccagaag 120
ggccacaagg tttccttcct ctccaccacc aagaacattg accgactctc ctcccacatc 180
tctcccctca tcaactttgt caagctcacc ctcccccgag tccaggagct gcccgaggac 240
gccgaggcca ccactgatgt ccaccccgag gatatcccct acctcaagaa ggcctccgac 300
ggcctccagc ccgaggtcac tgagttcctc gagcagcact ctcccgactg gatcatctac 360
gactacaccc actactggct ccccgagatt gccaagtctc tcggtgtctc tcgagcccac 420
ttctccgtca ccaccccctg ggccattgct tacatgggtc ccactgccga tgccatgatc 480
aacggttccg actaccgaac cgagcttgag gacttcaccg tccctcccaa gtggttcccc 540
ttccccacca ccgtctgctg gcgaaagcac gatctggccc gactcgtccc ctacaaggct 600
cccggtatct ccgacggtta ccgaatgggc ctcgtcatca agggctgcga ctgtctgctc 660
tccaagacct accacgagtt cggtactcag tggctccgac ttctcgagga gctgcaccga 720
gtccccgtca tccccgttgg tctgctccct ccctccatcc ccggctctga caaggacgac 780
tcttgggttt ccatcaagga gtggctcgac ggccaggaga agggctccgt tgtctacgtt 840
gctctcggtt ccgaggttct cgtcacccag gaagaggttg tcgagcttgc tcacggtctg 900
gagctgtccg gtctgccctt cttctgggcc taccgaaagc ccaagggtcc cgccaagtcc 960
gactccgtcg agcttcccga tggtttcgtc gagcgagtcc gagatcgagg tctggtctgg 1020
acctcttggg ctccccagct ccgaatcctc tcccacgagt ccgttgctgg tttcctcacc 1080
cactgcggtt ccggctccat tgtcgagggc ctcatgttcg gccaccctct catcatgctc 1140
cccatcttcg gtgaccagcc cctcaacgcc cgactccttg aggacaagca ggtcggtatc 1200
gagatccccc gaaacgagga agatggttct ttcacccgag actctgttgc cgagtctctg 1260
cgactcgtca tggtcgagga agagggtaag atctaccgag agaaggccaa ggagatgtcc 1320
aagctctttg gcgacaagga cctccaggac cagtacgtcg acgactttgt cgagtacctc 1380
cagaagcacc gacgagctgt tgccattgac cacgaaagct aa 1422
<210> 30
<211> 1377
<212> DNA
<213> Artificial sequence
<220>
<223> UDP-glycosyltransferase from Stevia rebaudiana Cpo for expression
in Yarrowia lipolitica
<400> 30
atggagaaca agaccgagac taccgtccga cgacgacgac gaatcattct cttccccgtc 60
cccttccagg gccacatcaa ccccattctg cagctcgcca acgttctgta ctccaagggc 120
ttctccatca ccatcttcca caccaacttc aacaagccca agacctccaa ctacccccac 180
ttcactttcc gattcatcct cgacaacgac ccccaggacg agcgaatctc caacctgccc 240
acccacggtc ctctggctgg tatgcgaatc cccatcatca acgagcacgg tgctgacgag 300
ctccgacgag agctcgagct gctcatgctc gcctccgaag aggacgagga agtctcctgt 360
ctgatcaccg atgctctgtg gtactttgcc cagtccgtcg ccgactctct caacctgcga 420
cgactcgttc tcatgacctc ctctctgttc aacttccacg cccacgtttc tctgccccag 480
tttgacgagc tcggttacct cgaccccgat gacaagaccc gactcgagga gcaggcttcc 540
ggtttcccca tgctcaaggt caaggacatc aagtccgcct actccaactg gcagattctc 600
aaggagattc tcggcaagat gatcaagcag accaaggcct cctccggtgt catctggaac 660
tccttcaagg agctcgagga gtccgagctc gagactgtca tccgagagat ccccgctccc 720
tctttcctca tccccctgcc caagcacctc accgcttcct cctcttctct gctcgaccac 780
gaccgaaccg tctttcagtg gctcgaccag cagccccctt cctccgtcct ctacgtttcc 840
ttcggctcca cctccgaggt cgacgagaag gacttcctcg agattgctcg aggcctcgtt 900
gactccaagc agtccttcct gtgggttgtc cgacccggct ttgtcaaggg ctccacctgg 960
gttgagcccc tgcccgatgg tttcctcggt gagcgaggcc gaattgtcaa gtgggtcccc 1020
cagcaggaag ttctggccca cggtgccatt ggtgccttct ggacccactc cggctggaac 1080
tccactctcg agtccgtctg cgagggtgtc cccatgatct tctccgactt tggcctcgac 1140
cagcccctca acgcccgata catgtccgat gttctcaagg tcggtgtcta cctcgagaac 1200
ggctgggagc gaggtgagat tgccaacgcc atccgacgag tcatggtcga cgaggaaggt 1260
gagtacatcc gacagaacgc ccgagtcctc aagcagaagg ccgatgtctc tctcatgaag 1320
ggtggttctt cttacgagtc tctcgagtct ctcgtttcct acatctcttc tttgtaa 1377
<210> 31
<211> 999
<212> DNA
<213> Artificial sequence
<220>
<223> HSP promoter
<400> 31
gtgcaatcac atgttgctac tgtacctgct gtggaccacg cacggcggaa cgtaccgtac 60
aaatattttc ttgctcacat gactctctct cggccgcgca cgccggtggc aaattgctct 120
tgcattggct ctgtctctag acgtccaaac cgtccaaagt ggcagggtga cgtgatgcga 180
cgcacgaagg agatggcccg gtggcgagga accggacacg gcgagccggc gggaaaaaag 240
gcggaaaacg aaaagcgaag ggcacaatct gacggtgcgg ctgccaccaa cccaaggagg 300
ctattttggg tcgctttcca tttcacattc gccctcaatg gccactttgc ggtggtgaac 360
atggtttctg aaacaacccc ccagaattag agtatattga tgtgtttaag attgggttgc 420
tatttggcca ttgtggggga gggtagcgac gtggaggaca ttccagggcg aattgagcct 480
agaaagtggt agcattccaa ccgtctaagt cgtccgaatt gatcgctata actatcacct 540
ctctcacatg tctacttccc caaccaacat ccccaacctc ccccacacta aagttcacgc 600
caataatgta ggcactcttt ctgggtgtgg gacagcagag caatacggag gggagattac 660
acaacgagcc acaattgggg agatggtagc catctcactc gacccgtcga cttttggcaa 720
cgctcaatta cccaccaaat ttgggctgga gttgagggga ccgtgttcca gcgctgtagg 780
accagcaaca cacacggtat caacagcaac caacgccccc gctaatgcac ccagtactgc 840
gcaggtgtgg gccaggtgcg ttccagatgc gagttggcga accctaagcc gacagtgtac 900
tttttgggac gggcagtagc aatcgtgggc ggaaaccccg gtgtatataa aggggtggag 960
aggacggatt attagcacca acacacacac ttatactac 999
<210> 32
<211> 300
<212> DNA
<213> Artificial sequence
<220>
<223> pgm terminator
<400> 32
acttcgagct aatccagtag cttacgttac ccaggggcag gtcaactggc tagccacgag 60
tctgtcccag gtcgcaattt agtgtaataa acaatatata tattgagtct aaagggaatt 120
gtagctattg tgattgtgtg attttcgtct tgctggttct tattgtgtcc cattcgtttc 180
atcctgatga ggacccctgg aaccggtgtt ttcttagtct ctgcaatcgc tagtcttgtt 240
gctatgacag ttgcgtcgac actattcagg tcatctatcg gttattctga tattataata 300
<210> 33
<211> 403
<212> DNA
<213> Artificial sequence
<220>
<223> pAgos_lox TEF1 promoter
<400> 33
taccgttcgt ataatgtatg ctatacgaag ttatgtcccc gccgggtcac ccggccagcg 60
acatggaggc ccagaatacc ctccttgaca gtcttgacgt gcgcagctca ggggcatgat 120
gtgactgtcg cccgtacatt tagcccatac atccccatgt ataatcattt gcatccatac 180
attttgatgg ccgcacggcg cgaagcaaaa attacggctc ctcgctgcag acctgcgagc 240
agggaaacgc tcccctcaca gacgcgttga attgtcccca cgccgcgccc ctgtagagaa 300
atataaaagg ttaggatttg ccactgaggt tcttctttca tatacttcct tttaaaatct 360
tgctaggata cagttctcac atcacatccg aacataaaca aca 403
<210> 34
<211> 285
<212> DNA
<213> Artificial sequence
<220>
<223> Agos tef1Ts_lox terminator
<400> 34
atcagtactg acaataaaaa gattcttgtt ttcaagaact tgtcatttgt atagtttttt 60
tatattgtag ttgttctatt ttaatcaaat gttagcgtga tttatatttt ttttcgcctc 120
gacatcatct gcccagatgc gaagttaagt gcgcagaaag taatatcatg cgtcaatcgt 180
atgtgaatgc tggtcgctat actgctgtcg attcgatact aacgccgcca tccagtgtcg 240
aaaacgagct cataacttcg tataatgtat gctatacgaa cggta 285

Claims (18)

1.一种具有UGT活性的多肽,所述多肽包含这样的氨基酸序列,所述氨基酸序列当与包含SEQ ID NO:2所示的序列的具有UGT活性的多肽进行比对时,包含至少一个对应于以下位置处的氨基酸中的任何的氨基酸取代:
35、189、280、284、285、334或373
所述位置是参考SEQ ID NO:2定义的,并且其中与具有UGT活性的参考多肽相比,所述多肽具有一种或多种经修饰的特性。
2.根据权利要求1所述的多肽,其中所述经修饰的特性是经修饰的UGT活性。
3.根据权利要求1或2所述的多肽,其中所述UGT活性是UGT3活性。
4.根据前述权利要求中任一项所述的多肽,其中所述参考多肽包含SEQ ID NO:2的UGT。
5.根据前述权利要求中任一项所述的多肽,其中:
(i)在位置35处存在缬氨酸;
(ii)在位置189处存在丙氨酸;
(iii)在位置280处存在天冬酰胺;
(iv)在位置284处存在天冬酰胺;
(v)在位置285处存在甘氨酸;
(vi)在位置285处存在天冬酰胺;
(vii)在位置285处存在丝氨酸;
(viii)在位置334处存在丙氨酸;且/或
(ix)在位置373处存在丙氨酸,
所述位置是参考SEQ ID NO:2定义的。
6.根据前述权利要求中任一项所述的多肽,所述多肽包含与SEQ ID NO:2具有至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%的序列同一性的氨基酸序列。
7.一种具有UGT活性的多肽,所述多肽包含与SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18或SEQ IDNO:20中的任一者具有至少约95%的序列同一性,至少96%、至少97%、至少98%或至少99%的序列同一性的氨基酸序列。
8.一种编码根据前述权利要求中任一项所述的多肽的核酸序列。
9.一种重组细胞,所述重组细胞包含根据权利要求8所述的核酸序列,任选地所述重组细胞能够产生甜菊醇或甜菊醇糖苷。
10.根据权利要求9所述的重组细胞,所述重组细胞包含一种或多种编码以下多肽的核酸序列:
具有对映-柯巴基焦磷酸酯合酶活性的多肽;
具有对映-贝壳杉烯合酶活性的多肽;
具有对映-贝壳杉烯氧化酶活性的多肽;以及
具有贝壳杉烯酸13-羟化酶活性的多肽。
11.根据权利要求9或10所述的重组细胞,所述重组细胞包含编码具有NADPH-细胞色素p450还原酶活性的多肽的核酸序列。
12.根据权利要求9至11中任一项所述的重组细胞,所述重组细胞包含编码以下中的一种或多种的一种或多种核酸序列:
(i)具有UGT2活性的多肽;
(ii)具有UGT85C2活性的多肽;以及
(iii)具有UGT76G1活性的多肽。
13.根据权利要求9至12中任一项所述的重组细胞,其中所述细胞属于以下属中的一种:Saccharomyces、Aspergillus、Pichia,Kluyveromyces、Candida、Hansenula、Humicola、Issatchenkia、Trichosporon、Brettanomyces、Pachysolen、Yarrowia、Yamadazyma或Escherichia,例如Saccharomyces cerevisiae细胞、Yarrowia lipolytica细胞、Candidakrusei细胞、Issatchenkia orientalis细胞或Escherichia coli细胞。
14.一种制备甜菊醇糖苷的方法,所述方法包括在合适的培养基中在有利于生产甜菊醇糖苷的条件下培养根据权利要求9至13中任一项所述的重组细胞,以及任选地回收所述甜菊醇糖苷。
15.一种培养液,所述培养液包含通过根据权利要求14的方法能够获得的甜菊醇糖苷。
16.一种组合物,所述组合物包含一种或多种通过根据权利要求14的方法获得的甜菊醇糖苷或从根据权利要求15所述的培养液获得的甜菊醇糖苷。
17.一种食品、饲料或饮料,所述食品、饲料或饮料包含根据权利要求16所述的组合物。
18.一种将甜菊醇或第一甜菊醇糖苷分别转换为甜菊醇糖苷或第二甜菊醇糖苷的方法,所述方法包括:
-使甜菊醇或第一甜菊醇糖苷与根据权利要求9至13中任一项所述的重组细胞或其透性化形式、源自所述重组细胞的粗提取物或无细胞提取物或源自上述任一者的酶制备物接触;
-从而将所述甜菊醇或第一甜菊醇糖苷分别转换为所述甜菊醇糖苷或第二甜菊醇糖苷。
CN201880042712.6A 2017-06-27 2018-06-26 Udp-糖基转移酶 Active CN110892068B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP17178168.5 2017-06-27
EP17178168 2017-06-27
PCT/EP2018/067061 WO2019002264A1 (en) 2017-06-27 2018-06-26 UDP-glycosyltransferase

Publications (2)

Publication Number Publication Date
CN110892068A true CN110892068A (zh) 2020-03-17
CN110892068B CN110892068B (zh) 2024-03-08

Family

ID=59269786

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880042712.6A Active CN110892068B (zh) 2017-06-27 2018-06-26 Udp-糖基转移酶

Country Status (4)

Country Link
US (2) US11639497B2 (zh)
EP (2) EP3645714B1 (zh)
CN (1) CN110892068B (zh)
WO (1) WO2019002264A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022084482A1 (en) 2020-10-22 2022-04-28 Dsm Ip Assets B.V. Microorganisms for diterpene production
EP4115741A1 (en) * 2021-11-16 2023-01-11 Pompadour Ibérica S.A. A beverage composition with controlled effervescence for infusion in a cold liquid

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013110673A1 (en) * 2012-01-23 2013-08-01 Dsm Ip Assets B.V. Diterpene production
US20160160257A1 (en) * 2013-07-23 2016-06-09 Dsm Ip Assets B.V. Diterpene production in yarrowia
WO2018083338A1 (en) * 2016-11-07 2018-05-11 Evolva Sa Production of steviol glycosides in recombinant hosts

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE238425T1 (de) 1993-07-23 2003-05-15 Dsm Nv Selektionmarker-genfreie rekombinante stämme: verfahren zur ihrer herstellung und die verwendung dieser stämme
CN1169961C (zh) 1997-04-11 2004-10-06 Dsm公司 基因转变作为工具用于构建重组的工业化丝状真菌
KR100648480B1 (ko) 1998-05-19 2006-11-24 디에스엠 아이피 어셋츠 비.브이. 세팔로스포린의 개선된 생체내 생산
WO2000037671A2 (en) 1998-12-22 2000-06-29 Dsm N.V. Improved in vivo production of cephalosporins
DE60325457D1 (de) 2002-01-23 2009-02-05 Royal Nedalco B V Fermentation von pentosezuckern
SE0202090D0 (sv) 2002-05-08 2002-07-04 Forskarpatent I Syd Ab A modifierd yeast consuming L-arabinose
EP1626979B1 (en) 2003-05-02 2012-06-06 Cargill, Incorporated Genetically modified yeast species and fermentation processes using genetically modified yeast
CN101914462B (zh) 2004-07-16 2013-04-24 Dsm知识产权资产有限公司 发酵木糖的真核细胞的代谢工程
WO2006096130A1 (en) 2005-03-11 2006-09-14 Forskarpatent I Syd Ab Arabinose- and xylose-fermenting saccharomyces cerevisiae strains
US9518188B2 (en) 2010-11-15 2016-12-13 John S. Lettow Method of printing a conductive article and articles made thereby
CN103975063A (zh) 2011-11-23 2014-08-06 帝斯曼知识产权资产管理有限公司 核酸组装系统
WO2015007748A1 (en) 2013-07-15 2015-01-22 Dsm Ip Assets B.V. Diterpene production
WO2016055578A1 (en) * 2014-10-08 2016-04-14 Dsm Ip Assets B.V. Steviol glycoside production

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013110673A1 (en) * 2012-01-23 2013-08-01 Dsm Ip Assets B.V. Diterpene production
US20160160257A1 (en) * 2013-07-23 2016-06-09 Dsm Ip Assets B.V. Diterpene production in yarrowia
WO2018083338A1 (en) * 2016-11-07 2018-05-11 Evolva Sa Production of steviol glycosides in recombinant hosts
CN110100006A (zh) * 2016-11-07 2019-08-06 埃沃尔瓦公司 重组宿主中甜菊糖苷的生产

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
/: "PREDICTED: UDP-glycosyltransferase 74F2 [Theobroma cacao],Genebank: XP_007033645.2", 《GENEBANK数据库》 *
/: "UDP-glucuronosyl/UDP-glucosyltransferase {ECO:0000313|EMBL:KVI01672.1}", 《UNIPROTKB数据库》 *
J.E. BRANDLE等: "Steviol glycoside biosynthesis", 《PHYTOCHEMISTRY》 *
TANG, H.等: "UDP-glucosyltransferase family protein [Medicago truncatula],Genebank: CDO53191.1", 《GENEBANK数据库》 *
李铭敏等: "甜菊糖苷的生物合成途径与生物转化制备策略的研究概述", 《食品与发酵工业》 *

Also Published As

Publication number Publication date
CN110892068B (zh) 2024-03-08
US20230295586A1 (en) 2023-09-21
US20210147816A1 (en) 2021-05-20
US11639497B2 (en) 2023-05-02
EP3645714A1 (en) 2020-05-06
EP3645714B1 (en) 2022-08-31
EP4155400A1 (en) 2023-03-29
WO2019002264A1 (en) 2019-01-03

Similar Documents

Publication Publication Date Title
EP3271457B1 (en) Udp-glycosyltransferases
US11203764B2 (en) Kaurenoic acid hydroxylases
US20230295586A1 (en) Udp-glycosyltransferases
CN107922465B (zh) 甜菊醇糖苷转运
US20240067938A1 (en) Geranylgeranyl pyrophosphate synthases
US11913034B2 (en) Kaurenoic acid hydroxylases
US10760085B2 (en) Kaurenoic acid hydroxylases

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant