CN107922465B - 甜菊醇糖苷转运 - Google Patents

甜菊醇糖苷转运 Download PDF

Info

Publication number
CN107922465B
CN107922465B CN201680047030.5A CN201680047030A CN107922465B CN 107922465 B CN107922465 B CN 107922465B CN 201680047030 A CN201680047030 A CN 201680047030A CN 107922465 B CN107922465 B CN 107922465B
Authority
CN
China
Prior art keywords
polypeptide
seq
recombinant
activity
leu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201680047030.5A
Other languages
English (en)
Other versions
CN107922465A (zh
Inventor
维克托·马里厄斯·波尔
普利斯希勒·扎尔特简斯
埃里克·范·德恩·伯格
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DSM IP Assets BV
Original Assignee
DSM IP Assets BV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DSM IP Assets BV filed Critical DSM IP Assets BV
Priority to CN202111486315.8A priority Critical patent/CN114196559A/zh
Publication of CN107922465A publication Critical patent/CN107922465A/zh
Application granted granted Critical
Publication of CN107922465B publication Critical patent/CN107922465B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/37Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
    • C07K14/39Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from yeasts
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23LFOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
    • A23L27/00Spices; Flavouring agents or condiments; Artificial sweetening agents; Table salts; Dietetic salt substitutes; Preparation or treatment thereof
    • A23L27/30Artificial sweetening agents
    • A23L27/33Artificial sweetening agents containing sugars or derivatives
    • A23L27/36Terpene glycosides
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23KFODDER
    • A23K20/00Accessory food factors for animal feeding-stuffs
    • A23K20/10Organic substances
    • A23K20/163Sugars; Polysaccharides
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23LFOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
    • A23L2/00Non-alcoholic beverages; Dry compositions or concentrates therefor; Their preparation
    • A23L2/38Other non-alcoholic beverages
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23LFOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
    • A23L2/00Non-alcoholic beverages; Dry compositions or concentrates therefor; Their preparation
    • A23L2/52Adding ingredients
    • A23L2/60Sweeteners
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23LFOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
    • A23L29/00Foods or foodstuffs containing additives; Preparation or treatment thereof
    • A23L29/30Foods or foodstuffs containing additives; Preparation or treatment thereof containing carbohydrate syrups; containing sugars; containing sugar alcohols, e.g. xylitol; containing starch hydrolysates, e.g. dextrin
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/37Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
    • C07K14/39Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from yeasts
    • C07K14/395Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from yeasts from Saccharomyces
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/37Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
    • C07K14/39Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from yeasts
    • C07K14/40Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from yeasts from Candida
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/14Fungi; Culture media therefor
    • C12N1/16Yeasts; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0006Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0012Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7)
    • C12N9/0036Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on NADH or NADPH (1.6)
    • C12N9/0038Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on NADH or NADPH (1.6) with a heme protein as acceptor (1.6.2)
    • C12N9/0042NADPH-cytochrome P450 reductase (1.6.2.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • C12N9/0073Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14) with NADH or NADPH as one donor, and incorporation of one atom of oxygen 1.14.13
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1085Transferases (2.) transferring alkyl or aryl groups other than methyl groups (2.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/90Isomerases (5.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P15/00Preparation of compounds containing at least three condensed carbocyclic rings
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/44Preparation of O-glycosides, e.g. glucosides
    • C12P19/56Preparation of O-glycosides, e.g. glucosides having an oxygen atom of the saccharide radical directly bound to a condensed ring system having three or more carbocyclic rings, e.g. daunomycin, adriamycin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/01Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
    • C12Y101/01088Hydroxymethylglutaryl-CoA reductase (1.1.1.88)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y106/00Oxidoreductases acting on NADH or NADPH (1.6)
    • C12Y106/02Oxidoreductases acting on NADH or NADPH (1.6) with a heme protein as acceptor (1.6.2)
    • C12Y106/02004NADPH-hemoprotein reductase (1.6.2.4), i.e. NADP-cytochrome P450-reductase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y114/00Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
    • C12Y114/13Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with NADH or NADPH as one donor, and incorporation of one atom of oxygen (1.14.13)
    • C12Y114/13078Ent-kaurene oxidase (1.14.13.78)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y402/00Carbon-oxygen lyases (4.2)
    • C12Y402/03Carbon-oxygen lyases (4.2) acting on phosphates (4.2.3)
    • C12Y402/03019Ent-kaurene synthase (4.2.3.19)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y505/00Intramolecular lyases (5.5)
    • C12Y505/01Intramolecular lyases (5.5.1)
    • C12Y505/01013Ent-copalyl diphosphate synthase (5.5.1.13)

Abstract

一种能够产生甜菊醇糖苷的重组宿主,所述重组宿主过表达介导甜菊醇糖苷转运的多肽,所述多肽包含SEQ ID NO:29所示的氨基酸序列或与其具有至少约50%序列同一性的氨基酸序列。一种能够产生甜菊醇糖苷的重组宿主,所述重组宿主已被修饰,优选在其基因组中被修饰,以导致介导甜菊醇糖苷转运的多肽的产生缺陷,并且所述多肽包含SEQ ID NO:29所示的氨基酸序列或与其具有至少约50%序列同一性的氨基酸序列。

Description

甜菊醇糖苷转运
发明领域
本发明涉及能够产生甜菊醇糖苷的重组宿主。本发明还涉及使用这种重组宿主制备甜菊醇糖苷的方法。本发明还涉及包含甜菊醇糖苷的发酵液、甜菊醇糖苷和包含两种或更多种甜菊醇糖苷的组合物。本发明还涉及包含甜菊醇糖苷或含有两种或更多种甜菊醇糖苷的组合物的食品、饲料或饮料。
发明背景
多年生草本植物甜叶菊(Stevia rebaudiana Bert.)的叶子积聚大量被称为甜菊醇糖苷的具有强烈甜味的化合物。虽然这些化合物的生物功能尚不清楚,但它们作为替代性高效甜味剂具有商业意义。
这些甜的甜菊醇糖苷的功能和感官特性表现为优于许多高效甜味剂的功能和感官特性。此外,研究表明甜菊苷能够降低II型糖尿病患者的血糖水平,并且能够降低轻度高血压患者的血压。
甜菊醇糖苷积聚在甜叶菊叶中,其中它们可占叶干重的10%至20%。甜菊苷和莱鲍迪甙A均是热和pH稳定的,并且适用于碳酸饮料和许多其他食物。甜菊苷比蔗糖甜110与270倍之间,莱鲍迪甙A比蔗糖甜150与320倍之间。此外,莱鲍迪甙D也是在甜叶菊叶中积聚的高效二萜糖苷甜味剂。它可比蔗糖甜约200倍。莱鲍迪甙M是另一种高效二萜糖苷甜味剂。它在某些甜叶菊品种叶中以痕量存在,但已表明其具有优异的味道特征。
传统上已从甜叶菊植物中提取了甜菊醇糖苷。在甜叶菊中,(-)-贝壳杉烯酸(赤霉酸(GA)生物合成中的中间体)被转化成四环二萜甜菊醇,其然后通过多步糖基化途径进行以形成各种甜菊醇糖苷。然而,产率可以是可变的,并且受到农业和环境条件的影响。此外,甜叶菊种植需要大量的土地面积、在收获前的很长时间、密集劳动以及用于提取和纯化糖苷的额外成本。
最近,使用发酵工艺生产甜菊醇糖苷的兴趣日益增长。WO2013/110673和WO2015/007748中描述了可用于产生至少甜菊醇糖苷莱鲍迪甙A、莱鲍迪甙D和莱鲍迪甙M的微生物。
此类微生物的进一步改进是令人希望的,以便可产生更高量的甜菊醇糖苷和/或另外或新的甜菊醇糖苷和/或更高量的特异性甜菊醇糖苷和/或具有期望比例的不同甜菊醇糖苷的甜菊醇糖苷的混合物。
发明概述
本发明基于鉴定能够介导甜菊醇糖苷转运的蛋白质。
因此,可以在重组宿主(例如微生物细胞)中过表达所述蛋白质以增加甜菊醇糖苷转运出宿主。或者,可以修饰宿主(例如微生物细胞),以相较于相应的未修饰版本的宿主表达更少所述蛋白质。在这种情况下,宿主内可以保留更多甜菊醇糖苷,其然后被糖基化成包含更高数量的糖部分的甜菊醇糖苷。
因此,本发明涉及重组宿主,例如细胞,诸如微生物细胞,其产生甜菊醇糖苷到宿主外的程度高于不过表达所述蛋白质的相应宿主。这可便于更容易地回收甜菊醇糖苷。本发明还涉及能够产生甜菊醇糖苷的重组宿主,其过表达介导甜菊醇糖苷转运的异源多肽。
因此,本发明涉及能够产生甜菊醇糖苷的重组宿主,其过表达介导甜菊醇糖苷转运的多肽,并且所述多肽包含SEQ ID NO:29所示的氨基酸序列或与其具有至少约50%序列同一性的氨基酸序列。
本发明还涉及能够产生甜菊醇糖苷的重组宿主,其已被修饰,优选在其基因组中被修饰,以导致介导甜菊醇糖苷转运的多肽的产生缺陷,并且所述多肽包含SEQ ID NO:29所示的氨基酸序列或与其具有至少约50%序列同一性的氨基酸序列。
本发明还涉及(在宿主内和/或在宿主外)包含甜菊醇糖苷的重组宿主,所述甜菊醇糖苷相较于未根据本发明修饰的相应宿主具有更高或更低的平均糖基化数。
本发明还涉及:
-一种制备甜菊醇糖苷的方法,其包括在合适的发酵培养基中发酵根据前述权利要求中任一项所述的重组宿主,以及任选地回收所述甜菊醇糖苷;
-发酵液,其包含能够通过本发明的方法获得的甜菊醇糖苷;
-通过本发明的方法或发酵液获得的甜菊醇糖苷;
-组合物,其包含两种或更多种本发明的或通过本发明的方法能够获得的甜菊醇糖苷;
-包含本发明的甜菊醇糖苷或组合物的食品、饲料或饮料。
附图简介
图1示出了编码tHMG、UGT2_1a、HPH的质粒MB6969的示意图。
图2示出了编码tHMG的质粒MB6856的示意图。
图3示出了编码tHMG的质粒MB6857的示意图。
图4示出了编码GGS的质粒MB6948的示意图。
图5示出了编码GGS的质粒MB6958的示意图。
图6示出了编码UGT1、UGT3、UGT4、NAT的质粒MB7015的示意图。
图7示出了编码tHMG、URA3、GGS的质粒MB6986的示意图。
图8示出了编码tCPS_SR、tKS_SR、KAH_4、KO_Gib、CPR_3、LEU2的质粒MB7059的示意图。
图9示出了编码tCPS_SR、tKS_SR、KAH_4、KO_Gib、CPR_3、URA3的质粒MB7100的示意图。
图10示出了编码tHMG、URA2、GGS的质粒MB6988的示意图。
图11示出了编码tCPS_SR、tKS_SR、KAH_4、KO_Gib、CPR_3、LEU2的质粒MB7044的示意图。
图12示出了编码tCPS_SR、tKS_SR、KAH_4、KO_Gib、CPR_3、URA2的质粒MB7094的示意图。
图13示出了编码CRE、neoR的质粒MB6128的示意图。
图14示出了含有KAH和HPH的构建体的示意图。
图15示出了包含tCPS_SR的构建体的示意图。
图16示出了编码tHMG、URA3、GGS的质粒MB6986的示意图。
图17示出了质粒pRS417Con5-3的示意图。
图18示出了HygB标记与转运体内部片段在质粒pRS417 5-3中组装的示意图。
图19示出了从含有HYG标记和转运体内部片段的质粒pRS417 5-3PCR扩增转运体破坏构建体的示意图。
图20示出了导致转运体基因的破坏和HygB标记的整合的基因组上重组事件的示意图。
图21示出了导致甜菊醇糖苷生物合成的潜在途径的示意图。以星号显示的化合物是13-[(β-D-吡喃葡萄糖基)氧基)贝壳杉-16-烯-18-酸2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基酯。
序列表说明
表14中示出了序列说明。可以参考序列表或者参考也示于表14中的数据库登录号来定义本文所述的序列。
发明详述
在本说明书和所附权利要求书中,词语“包含”、“包括”和“具有”以及变化形式应被解释为包含性的。也就是说,这些词语意图表达在上下文允许的情况下可包含未具体叙述的其他要素或整数。
不使用数量词修饰时在本文中指代一个/种或多于一个/种(即一个/种或至少一个/种)的语法对象。举例来说,“要素”可意指一个/种要素或多于一个/种要素。
本发明涉及鉴定能够介导甜菊醇糖苷转运的多肽。这种多肽可以直接介导甜菊醇糖苷转运,即可以是转运体蛋白,或者可以间接介导甜菊醇糖苷转运。这种多肽可以能够介导一种或更多种甜菊醇糖苷的转运。
本发明涉及过表达或具有降低表达的这种多肽的重组宿主。根据上下文,术语重组宿主或重组细胞可以互换使用。
如本文所述的这种多肽可以在能够产生一种或多种甜菊醇糖苷的重组宿主(例如重组宿主细胞)中过表达。这种细胞与不过表达所述多肽的相应细胞相比可以能够产生更多的一种或多种细胞外甜菊醇糖苷。也就是说,与相应的非重组细胞相比,根据本发明的重组细胞可以具有增加或减少的甜菊醇糖苷转运。
因此,本发明提供了能够产生甜菊醇糖苷的重组宿主,其过表达多肽,所述多肽是能够介导甜菊醇糖苷转运的多肽,并且所述多肽包含SEQ ID NO:29所示的氨基酸序列或者与其具有至少约50%序列同一性的氨基酸序列。
还可以在宿主(例如重组宿主细胞)中修饰这种多肽的表达,使得与未经类似修饰的相应细胞相比,这种多肽的表达降低。以这种方式,与未经类似修饰的相应细胞相比,一种或多种细胞外甜菊醇糖苷的量可降低。这可以允许:与未经类似修饰的相应细胞相比,一种或多种细胞内甜菊醇糖苷的糖基化增加。因此,这种宿主与未经类似修饰的相应细胞相比可以包含具有更高平均糖基化数的甜菊醇糖苷。
因此,本发明提供了能够产生甜菊醇糖苷的重组宿主,其已被修饰,优选在其基因组中被修饰,以导致多肽的产生缺陷,所述多肽是能够介导甜菊醇糖苷转运的多肽,并且所述多肽包含SEQ ID NO:29所示的氨基酸序列或与其具有至少约50%序列同一性的氨基酸序列。
本发明的宿主细胞是重组宿主细胞。从这个意义上讲,“重组”表示宿主细胞是非天然存在的宿主细胞,例如通过使用重组技术引入一个或多个核酸而被修饰。用于修饰宿主细胞以获得本发明重组宿主细胞的核酸可以是天然存在的核酸或非天然存在的核酸。
因此,关于本发明的宿主使用时,“重组”表示细胞已通过引入一种或多种异源核酸或蛋白质或改变天然核酸或蛋白质而被修饰,或者细胞来源于如此修饰的细胞。在本文中使用时,术语“异源”是指并非天然存在于宿主细胞中的核酸或氨基酸序列。换句话说,核酸或氨基酸序列与宿主细胞中天然存在的核酸或氨基酸序列不同。
本发明涉及能够产生甜菊醇糖苷的重组宿主,其过表达介导甜菊醇糖苷转运的异源多肽。这种异源多肽可以获自或来源于不同于宿主的属或种的属或种。因此,如果重组宿主是酵母,则介导甜菊醇糖苷转运的异源多肽可以获自或来源于不同的酵母属或种。
例如,如果宿主细胞是Saccharomyces(例如S.cerevisiae、S.bayanus、S.pastorianus、S.carlsbergensis),则介导甜菊醇糖苷转运的异源多肽可以获自或来源于Candida(例如C.krusei、C.revkaufi、C.pulcherrima、C.tropicalis、C.utilis)、Issatchenkia(例如I.orientalis)或Yarrowia(例如Y.lipolytica(以前归类为Candidalipolytica))。
例如,如果宿主细胞是Candida(例如C.krusei、C.revkaufi、C.pulcherrima、C.tropicalis、C.utilis),则介导甜菊醇糖苷转运的异源多肽可以获自或来源于Saccharomyces(例如S.cerevisiae、S.bayanus、S.pastorianus、S.carlsbergensis)、Issatchenkia(例如I.orientalis)或Yarrowia(例如Y.lipolytica(以前归类为Candidalipolytica))。
例如,如果宿主细胞是Issatchenkia(例如I.orientalis),则介导甜菊醇糖苷转运的异源多肽可以获自或来源于Saccharomyces(例如S.cerevisiae、S.bayanus、S.pastorianus、S.carlsbergensis)、Candida(例如C.krusei、C.revkaufi、C.pulcherrima、C.tropicalis、C.utilis)或Yarrowia(例如Y.lipolytica(以前归类为Candida lipolytica))。
例如,如果宿主细胞是Yarrowia(例如Y.lipolytica(以前归类为Candidalipolytica)),则介导甜菊醇糖苷转运的异源多肽可以获自或来源于Saccharomyces(例如S.cerevisiae、S.bayanus、S.pastorianus、S.carlsbergensis)、Candida(例如C.krusei、C.revkaufi、C.pulcherrima、C.tropicalis、C.utilis)或Issatchenkia(例如I.orientalis))。
如果宿主细胞是Saccharomyces cerevisiae,则介导甜菊醇糖苷转运的异源多肽可以获自或来源于Yarrowia lipolytica(以前归类为Candida lipolytica)、Candidakrusei或Issatchenkia orientalis。
如果宿主细胞是Yarrowia lipolytica,则介导甜菊醇糖苷转运的异源多肽可以获自或来源于Saccharomyces cerevisiae、Yarrowia lipolytica(以前归类为Candidalipolytica)或Candida krusei或Issatchenkia orientalis。
如果宿主细胞是Candida krusei或Issatchenkia orientalis,则介导甜菊醇糖苷转运的异源多肽可以获自或来源于Saccharomyces cerevisiae或Yarrowialipolytica。
术语“来源于”也涵盖术语“源自”、“获自”、“能够获自”、“分离自”和“由……产生”,其通常表示一种指定材料来源于另一种指定材料或者具有可以参照另一种指定材料描述的特征。在本文中使用时,“来源于”微生物的物质(例如,核酸分子或多肽)可以表示该物质对于该微生物是天然的或者是该微生物的天然物质,但也可以表示已从天然版本改变的物质。
因此,例如,重组细胞可表达在天然(非重组)形式的细胞内不存在的本文所定义的多肽。或者,可修饰重组细胞以使编码本文所定义的多肽的天然基因的表达程度高于天然“非重组”形式的细胞内发生的程度。
或者,可修饰重组细胞以使编码本文所定义的多肽的天然基因的表达程度低于天然“非重组”形式的细胞内发生的程度。
在本发明的细胞中,可以过表达本文所定义的多肽。在本文中,“过表达的”、“过表达”等意味着重组宿主细胞比不过表达所述多肽的相应细胞表达更多的多肽,或者所述多肽在通常不表达该蛋白质的细胞中表达。或者,可以通过表达具有更高比活性的变体多肽来实现过表达。
本发明的重组细胞可以被修饰,优选在其基因组中,以导致如本文所定义的多肽的产生缺陷。
这种细胞可以来自亲本宿主细胞并且与亲本宿主细胞相比被修饰,优选在其基因组中被修饰,以获得与其所来源自的亲本宿主细胞相比不同的基因型和/或不同的表型。
已被修饰(优选在其基因组中)以导致如本文所定义的多肽产生缺陷的这种细胞是已被修饰(优选在其基因组中)以导致表型特征的突变宿主细胞,其中当与未被修饰的亲本微生物宿主细胞相比并且在相同条件下分析时,所述细胞:a)产生更少产物或基本上不产生产物,和/或b)产生具有降低的活性或降低的比活性的产物或者没有活性或没有比活性的产物,以及这些可能性中的一种或多种的组合。
术语“重组”与“经遗传修饰”同义。
这种重组宿主可以是编码如本文所述的多肽的核酸序列的全部或部分敲除。
因此,本发明涉及过表达被鉴定为具有甜菊醇糖苷转运介导活性的多肽或所述多肽缺陷的重组宿主:通常,宿主是可用于产生甜菊醇糖苷的宿主。给定的重组宿主产生甜菊醇糖苷的能力可以是非重组形式的宿主的性质,或者可以是引入一种或多种重组核酸序列(即编码导致产生甜菊醇糖苷的酶)的结果。
出于本发明的目的,具有甜菊醇糖苷转运介导活性的多肽(即介导甜菊醇糖苷转运的多肽)是对穿过细胞膜转运一种或多种甜菊醇糖苷有影响的多肽。影响可以是直接的,即多肽可以是转运体蛋白或包含功能性转运体区域。或者,影响可以是间接的,即多肽不是转运体蛋白,但其活性仍然对甜菊醇糖苷转运有影响。
通常,效果是这样的:提高多肽的表达水平增加穿过细胞膜转运一种或多种甜菊醇糖苷的量(与多肽的表达水平更低的相应细胞相比)。相反,降低多肽的表达水平可以降低穿过细胞膜转运一种或多种甜菊醇糖苷的量(与多肽的表达水平更高的相应细胞相比)。
通常,本发明的重组宿主能够产生甜菊醇糖苷。例如,本发明的重组宿主可以能够产生例如但不限于甜菊醇-13-单糖苷、甜菊醇-19-单糖苷、13-[(β-D-吡喃葡萄糖基)氧基)贝壳杉-16-烯-18-酸2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基酯、甜茶苷、甜菊苷、甜菊醇-19-双糖苷、甜菊醇双糖苷、rebA、rebB、rebC、rebD、rebE或rebM中的一种或更多种。本发明的重组宿主可以能够产生在Ceunen和Geuns,Journal of Natural Products 76(6),1201-1228,2013中所示的甜菊醇糖苷中的一种或多种。
因此,本发明的细胞可以是这样的细胞,其中相较于不过表达或不具有本发明细胞的降低水平的表达的相应细胞,与细胞内相比的细胞外甜菊醇糖苷的总量更高或更低。
或者,相较于不过表达或不具有本发明细胞的降低水平的表达的相应细胞,本发明的细胞可以具有相同的与细胞内相比的细胞外甜菊醇糖苷的总量,但在细胞内外可以具有改变的甜菊醇糖苷分布。
因此,本发明的重组宿主能够产生甜菊醇糖苷。例如,本发明的重组宿主可以能够产生例如甜菊醇-13-单糖苷、甜菊醇-19-单糖苷、13-[(β-D-吡喃葡萄糖基)氧基)贝壳杉-16-烯-18-酸2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基酯、甜茶苷、甜菊苷、甜菊醇-19-双糖苷、甜菊醇双糖苷、rebA、rebB、rebC、rebD、rebE或rebM中的一种或更多种。
因此,本发明的重组宿主可以是这样的,其中细胞产生的rebA的至少约10%、至少约20%、至少约30%、至少约40%、至少约50%在细胞外。
因此,本发明的重组宿主可以是这样的,其中细胞产生的rebD的至少约10%、至少约20%、至少约30%、至少约40%、至少约50%在细胞外。
因此,本发明的重组宿主可以是这样的,其中细胞产生的rebM的至少约10%、至少约20%、至少约30%、至少约40%、至少约50%在细胞外。
本发明的重组宿主可以是这样的,其中细胞产生的rebA的不超过约50%、不超过约40%、不超过约30%、不超过约20%、不超过约10%在细胞外。
本发明的重组宿主可以是这样的,其中细胞产生的rebD的不超过约50%、不超过约40%、不超过约30%、不超过约20%、不超过约10%在细胞外。
本发明的重组宿主可以是这样的,其中细胞产生的rebM的不超过约50%、不超过约40%、不超过约30%、不超过约20%、不超过约10%在细胞外。
本发明的重组细胞可以是这样的,其中甜菊醇糖苷的平均糖基化数为至少3、至少4、至少5、至少6或更大。与未根据本发明修饰的相应细胞相比,平均糖基化数可以增加或降低。例如,当过表达如本文所述的多肽时,平均糖基化可降低。例如,当本发明多肽的表达降低时,平均糖基化可增加(特别是在细胞本身中)。
平均糖基化可以指本发明的重组细胞的上清液中的平均糖基化或培养液(沉淀+上清液)中的平均糖基化。
因此,本发明提供了能够产生甜菊醇糖苷的重组细胞,所述重组细胞或者过表达下述多肽或者在下述多肽的表达方面有缺陷,所述多肽包含SEQ ID NO:29所示的氨基酸序列或者与其具有至少约50%序列同一性的氨基酸序列。这种氨基酸序列具有甜菊醇糖苷转运的作用,即是甜菊醇糖苷转运的介导物。
所述多肽还可以被定义为包含以下氨基酸序列(或与其具有至少约45%序列同一性的氨基酸序列)的多肽:
MGKTEVTQESLECGSVTSSLGKKPFSIITLFTGRRIPPVPTEKPDSAEERAGILSKLTWQWLSPLLKTGYLRNIEREDLYKVRERNSAAVIQQRLESNLEKQYAKYHAKLLKKGLSEQEAHLKLQDSAKPLVLALNQTFFWKFWLAGLFALVKDLCGIASAMVSRVLIEYIQDRYLYRGTDREPKVGRGVGPSIGLFLLAVGVTFFFNHMFYNVKMVGAQARAALVAVIYSKSTRLSAKGRAQYTTGKITNLAAIDAHRVDLSCESFHYITIFLPVVGCAIAVLVVNLKVAALVGIATMIVLIFVVAGITIFSMKLRAIIVKLTDKRVTYIREALQSIRIIKYYGWEVPYCDKIKKVRLDETRNYAKMGSIRGTAIGMFQALPILAGALSFITYAALGHGTDPARMFSSLTLFNLLLPALAVLPQALQAAGDARVALRRIQRFLGAEESTPTTVFDATLESTDDAVIVEDASFIWPEVVDDKSDKEKAKDAKKEEKDKKKAEKKAKKAAKKAAKEIAVVVEEEVEHEKTEGSSESEKGTLKSTFKGFNNLSFKIKRGEFVVVTGPIGSGKSSLLAAITGSMVLTGGSVRVSSTEWIGCLEPWIQNATVRDNIVFGRKFDSEWYRTVVTACQLSQDLKIMTHGDNTMIGERGITVSGGQKARINLARAIYGNPEILIMDDVLSAVDARVGAGIVDDCLRGLAKNSTRILATHQLSVLPKADHVIFMDAEGQFHIGTYQELEADNEQFKALLAAGSMSKEEVVAVDETEVVIEGDLEDDCDNKEEYEDAAETISILADATQELQKVTTTVSAFEENDNMMEEEERMRDAVGLHVYWQYFRQANPSRVKVMMFIGMIFISMIVIAFLFVFTSVWLSFWTGDRFHASRNFYTGIYIMLGILLLLAVAGYMIVNEINSAMAARNLHNHALDSVFAARTSFFDTTPQGRIINRFTRDTDSLDNELAMRLTMLFFGVSAFFSNFLLTCVYVPYVTLVLVPVGFVFYVSLGYYRKSAREVKRIDSIERSHMMSVFNESISGMPVIIMYKAQHRLMNKLQATLDDMDSAYFLTAANQRWLSLRLDGLGSLVVLVATILVAVGVFDLTPSNMGLIISAASFIPEVMSMVAQAVAELENCMNAIERILYYKDNIPAEAAREVDGIELDQRPNWPEQGAISFNNVSMKYRDGLPYVLKSLSVDFQGGHKVGICGRTGAGKSTILQTLYRIVELAEGSITIDGVDISTIGLHQLRSQLSIIPQEPVLFLGTIRSNLDPLEQYSDAELWGSLRRSGLLDEGETEGKFHLDQKVEADGSNFSLGERQLLTLARALLRNTKILVLDEATSNVDYKTDKLVQETISREFGHCTILCIAHRLRTIAKYDRILVLESGEINQYDTPWNLYNDKEGIFRGMCDTSGLNEVDFNK(SEQ ID NO:29).
通常具有甜菊醇糖苷转运介导活性的多肽可以包含这样的氨基酸序列,所述氨基酸序列与SEQ ID NO:29具有至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%的序列同一性。
由存在于本发明的重组宿主中的重组核酸编码的、通常具有甜菊醇糖苷转运介导活性的多肽可以包含氨基酸序列,所述氨基酸序列是本文所述氨基酸序列的片段,例如这种氨基酸序列的截短版本。
也就是说,本发明还涉及重组宿主,其过表达如本文所述的具有甜菊醇糖苷转运介导活性的多肽的生物学活性片段。
本发明多肽的生物活性片段包括这样的多肽,其包含与SEQ ID NO:29的氨基酸序列足够同一或来源于SEQ ID NO:29的氨基酸序列的氨基酸序列,其比SEQ ID NO:29中给出的全长多肽包含更少氨基酸,但展示出相应全长多肽的至少一种生物学活性。
通常,生物活性片段包含具有本发明多肽的至少一种活性的结构域或基序。本发明多肽的生物活性片段可以是这样的多肽,例如,其长度为约10、约25、约50、约100或更多个氨基酸或至少约100个氨基酸、至少150、200、250、300、350、400、600、1000个氨基酸或长度达到本发明多肽的氨基酸总数。此外,多肽的其他区域缺失的其他生物学活性部分可以通过重组技术制备,并且可以评估其的一种或多种天然形式本发明多肽的生物学活性。本发明的特征还在于编码本发明多肽的上述生物活性片段的核酸片段。
本发明的重组宿主可以过表达这种多肽或所述多肽缺陷。
本发明的重组宿主可以包含编码多于一种这种多肽(例如两种、三种、四种或更多种这种多肽)的重组核酸序列。如此编码的多肽可以相同或不同。
可以修饰本发明的重组细胞以降低多于一种这种多肽(例如2、3、4或更多种这种多肽)的表达水平。
由存在于重组宿主中的重组核酸编码的过表达的多肽可以是可获自或来源于或发现于Yarrowia属的生物体中的多肽,例如可获自或来源于或发现于Yarrowialipolytica的多肽。
如本文所用,术语“多肽”是指包含通过肽键连接的氨基酸残基并含有多于五个氨基酸残基的分子。氨基酸由单字母或三字母名称标识。如本文所用的术语“蛋白质”与术语“多肽”同义,并且还可指两种或更多种多肽。因此,术语“蛋白质”、“肽”和“多肽”可互换使用。多肽可任选地进行修饰(例如,糖基化、磷酸化、酰化、法尼基化、异戊二烯化、磺化等)以增加官能度。展现活性的多肽可被称为酶。应理解,作为遗传密码简并的结果,可产生编码给定多肽的许多核苷酸序列。
由用于本发明的重组宿主的重组核酸所编码的多肽可以包含信号肽和/或前肽序列。如果本发明的多肽包含信号肽和/或前肽,可以在成熟多肽序列上计算序列同一性。
用于在本发明的重组宿主中使用的重组核酸序列可以以核酸构建体的形式提供。术语“核酸构建体”是指单链或双链的核酸分子,其从天然存在的基因中分离或已经被修饰以含有以否则将不会在自然中存在的方式组合和并置的核酸的区段。当核酸构建体含有表达编码序列所需要的所有控制序列时,术语核酸构建体与术语“表达盒”的含义相同,其中所述控制序列可操作地连接至所述编码序列。
用于在本发明的重组宿主中使用的重组核酸序列可以以表达载体的形式提供,其中多核苷酸序列可操作地连接到至少一个控制序列用于在重组宿主细胞中表达多核苷酸序列。
如本文所用的术语“可操作地连接”是指物理地连接并且彼此有功能性关系的两个或多个核酸序列元件。例如,如果启动子能够起始或调控编码序列的转录或表达,则启动子可操作地连接至编码序列,在这种情况下,所述编码序列应被理解为在启动子的“控制下”。通常,当两个核酸序列可操作地连接时,它们将处于相同的取向并且通常也在同一阅读框中。它们通常将是基本上连续的,尽管这可能不是必需的。
表达载体包含编码本文所述多肽的多核苷酸,其可操作地连接至用于在体外或在宿主细胞中表达和/或翻译多核苷酸的适当控制序列(如启动子以及转录和翻译终止信号)。
表达载体可以是能够方便地进行重组DNA程序并能使多核苷酸表达的任何载体(例如,质粒或病毒)。载体的选择通常将取决于所述载体与待引入所述载体的细胞的相容性。载体可以是线性或闭合的环状质粒。载体可以是自主复制型载体,即作为染色体外实体而存在、其复制独立于染色体复制的载体,例如,质粒、染色体外元件、微型染色体或人工染色体。
或者,载体可以是当被引入宿主细胞时整合至基因组中并与其已整合至其中的染色体一起复制的载体。整合型克隆载体可随机或在预定靶基因座处整合在宿主细胞的染色体中。载体可包含一个或多个选择性标记,其允许容易地选择转化的细胞。
可以根据本领域技术人员熟知的方法生成能够产生甜菊醇糖苷的重组宿主,所述重组宿主已被修饰(优选在其基因组中被修饰)以导致本文所述多肽的产生缺陷。可以修饰编码本文所述多肽的序列,使得发生更少或不发生多肽的表达。例如,可以部分或全部缺失编码本文所述多肽的序列。
本发明的重组宿主可以包含如本文所述的任何多肽。本发明的重组宿主可以过表达本文所述的任何多肽或有本文所述的任何多肽的缺陷。通常,本发明的重组宿主能够产生甜菊醇糖苷。例如,本发明的重组宿主可以能够产生例如甜菊醇-13-单糖苷、甜菊醇-19-单糖苷、13-[(β-D-吡喃葡萄糖基)氧基)贝壳杉-16-烯-18-酸2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基酯、甜茶苷、甜菊苷、甜菊醇-19-双糖苷、甜菊醇双糖苷、rebA、rebE、rebD或rebM中的一种或更多种。
本发明的重组宿主可包含编码具有UDP-糖基转移酶(UGT)活性的一种或多种多肽的一种或多种重组核酸序列。
为了本发明的目的,具有UGT活性的多肽是具有糖基转移酶活性(EC 2.4)的多肽,即可以充当催化剂以将单糖单元从活化的核苷酸糖(又称“糖基供体”)转移到糖基受体分子(通常是醇)的多肽。UGT的糖基供体典型地是核苷酸糖尿苷二磷酸葡萄糖(尿嘧啶-二磷酸葡萄糖,UDP-葡萄糖)。
可以选择这种另外的UGT以产生期望的甜菊醇糖苷。Humphrey等人,PlantMolecular Biology(2006)61:47-62和Mohamed等人,J.Plant Physiology 168(2011)1136-1141中示出了甜菊醇糖苷形成的示意图。另外,图21示出了甜菊醇糖苷形成的示意图。
因此,本发明的重组宿主可包含一个或多个编码以下项中的一种或多种的重组核酸序列:
(i)具有UGT74G1活性的多肽;
(ii)具有UGT2活性的多肽;
(iii)具有UGT85C2活性的多肽;和
(iv)具有UGT76G1活性的多肽。
适用于本发明的重组酵母可包含编码能够催化向甜菊醇中添加C-13-葡萄糖的多肽的核苷酸序列。也就是说,适用于本发明方法的重组酵母可包含能够催化将甜菊醇转化为甜菊单糖苷的反应的UGT。
适用于本发明方法的这种重组酵母可包含编码具有由UDP-糖基转移酶(UGT)UGT85C2所示的活性的多肽的核苷酸序列,由此酵母转化后,核苷酸序列赋予所述酵母将甜菊醇转化为甜菊单糖苷的能力。
UGT85C2活性是将葡萄糖单元转移至甜菊醇的13-OH。因此,合适的UGT85C2可充当尿苷5'-二磷酸葡糖基:甜菊醇13-OH转移酶和尿苷5'-二磷酸葡糖基:甜菊醇-19-O-糖苷13-OH转移酶。功能性UGT85C2多肽还可催化葡糖基转移酶反应,所述反应利用除甜菊醇和甜菊醇-19-O-糖苷以外的甜菊醇糖苷底物。此类序列可在本文中称为UGT1序列。
适用于本发明的重组酵母可以包含编码具有UGT2活性的多肽的核苷酸序列。
具有UGT2活性的多肽是充当尿苷5'-二磷酸葡萄糖基:甜菊醇-13-O-糖苷转移酶(又称甜菊醇-13-单葡萄糖苷1,2-转葡萄糖基酶)的多肽,其将葡萄糖部分转移到受体分子甜菊醇-13-O-糖苷的13-O-葡萄糖的C-2'。典型地,适合的UGT2多肽还可以充当将葡萄糖部分转移到受体分子甜茶苷的13-O-葡萄糖的C-2’的尿苷5'-二磷酸葡萄糖基:甜茶苷转移酶。
具有UGT2活性的多肽也可以催化利用除甜菊醇-13-O-糖苷和甜茶苷以外的甜菊醇糖苷底物的反应,例如,功能性UGT2多肽可利用甜菊苷作为底物,从而将葡萄糖部分转移至19-O-葡萄糖残基的C-2'以产生莱鲍迪甙E。功能性UGT2多肽也可以利用莱鲍迪甙A作为底物,从而将葡萄糖部分转移至19-O-葡萄糖残基的C-2'以产生莱鲍迪甙D。然而,功能性UGT2多肽可以是这样的多肽,其不将葡萄糖部分转移至在C-13位具有1,3-结合的葡萄糖的甜菊醇化合物,即将葡萄糖部分转移至甜菊醇1,3-双糖苷和1,3-甜菊苷通常不会发生。
具有UGT2活性的多肽也可以从除尿苷二磷酸葡萄糖以外的供体转移糖部分。例如,具有UGT2活性的多肽充当尿苷5'-二磷酸D-木糖基:甜菊醇-13-O-糖苷转移酶,其将木糖部分转移至受体分子甜菊醇-13-O-糖苷的13-O-葡萄糖的C-2'。作为另一个实例,具有UGT2活性的多肽可充当尿苷5'-二磷酸L-鼠李糖基:甜菊醇-13-O-糖苷转移酶,其将鼠李糖部分转移至受体分子甜菊醇的13-O-葡萄糖的C-2'。
适用于本发明方法的重组酵母可以包含编码具有UGT活性的多肽的核苷酸序列,可以包含编码能够催化向甜菊双糖苷添加C-19-葡萄糖的多肽的核苷酸序列。也就是说,本发明的重组酵母可以包含能够催化将甜菊双糖苷转化成甜菊苷的反应的UGT。因此,这种重组酵母可以能够将甜菊双糖苷转化为甜菊苷。这种核苷酸序列的表达可以赋予重组酵母生产至少甜菊苷的能力。
因此,适用于本发明方法的重组酵母还可以包含编码具有由UDP-糖基转移酶(UGT)UGT74G1所示的活性的多肽的核苷酸序列,由此当转化酵母后,所述核苷酸序列赋予细胞将甜菊双糖苷转化为甜菊苷的能力。
合适的UGT74G1多肽可以能够将葡萄糖单元分别转移至甜菊醇的13-OH和/或19-COOH。合适的UGT74G1多肽可充当尿苷5'-二磷酸葡糖基:甜菊醇19-COOH转移酶和/或尿苷5'-二磷酸葡糖基:甜菊醇-13-O-糖苷19-COOH转移酶。功能性UGT74G1多肽还可催化使用除甜菊醇和甜菊醇-13-O-糖苷以外的甜菊醇糖苷底物或者从除尿苷二磷酸葡萄糖以外的供体转移糖部分的糖基转移酶反应。此类序列可在本文中称为UGT3序列。
适用于本发明方法的重组酵母可包含编码能够催化甜菊苷的C-13位置处的葡萄糖的C-3'的葡糖基化的多肽的核苷酸序列。也就是说,适用于本发明方法的重组酵母可包含UGT,所述UGT能够催化甜菊苷转化至莱鲍迪甙A的反应。因此,这种重组酵母可以能够将甜菊苷转化为莱鲍迪甙A。这种核苷酸序列的表达可赋予酵母产生至少莱鲍迪甙A的能力。
适用于本发明方法的重组酵母可以因此还包含编码具有由UDP-糖基转移酶(UGT)UGT76G1所示的活性的多肽的核苷酸序列,由此当转化酵母后所述核苷酸序列赋予该酵母将甜菊苷转化为莱鲍迪甙A的能力。
合适的UGT76G1向受体分子甜菊醇1,2糖苷的C-13-O-葡萄糖的C-3'添加葡萄糖部分。因此,UGT76G1充当例如尿苷5'-二磷酸葡糖基:甜菊醇13-O-1,2葡糖苷C-3'葡糖基转移酶和尿苷5'-二磷酸葡糖基:甜菊醇-19-O-葡萄糖、13-O-1,2双糖苷C-3'葡糖基转移酶。功能性UGT76G1多肽还可催化葡糖基转移酶反应,所述反应使用含有除葡萄糖以外的糖的甜菊醇糖苷底物,例如甜菊醇鼠李糖苷和甜菊醇木糖苷。此类序列可在本文中称为UGT4序列。UGT4可以替代地或者另外地能够将RebD转化为RebM。
适用于本发明方法的重组酵母通常包含编码至少一种具有UGT1活性的多肽、至少一种具有UGT2活性的多肽、至少一种具有UGT3活性的多肽和至少一种具有UGT4活性的多肽的核苷酸序列。这些核酸序列中的一种或更多种可以是重组的。给定的核酸可编码具有一种或更多种上述活性的多肽。例如,核酸编码具有两种、三种或四种上述活性的多肽。优选地,用于本发明方法的重组酵母包含UGT1、UGT2和UGT3以及UGT4活性。合适的UGT1、UGT2、UGT3和UGT4序列在WO2015/007748的表1中进行了描述。
本发明的重组宿主可以包含两种或更多种编码具有任何一种UGT活性(例如,UGT1、UGT2、UGT3或UGT4活性)的多肽的核酸序列。当本发明的重组宿主包含两种或更多种编码具有任何一种UGT活性的多肽的核酸序列时,这些核酸序列可以相同或不同,和/或可编码相同或不同的多肽。特别地,本发明的重组宿主可以包含编码两种不同UGT2多肽的核酸序列。
根据本发明的重组宿主可以包含编码以下项中的一种或更多种的一种或更多种重组核苷酸序列:
具有对映-柯巴基焦磷酸合酶活性的多肽;
具有对映-贝壳杉烯合酶活性的多肽;
具有对映-贝壳杉烯氧化酶活性的多肽;以及
具有贝壳杉烯酸13-羟化酶活性的多肽。
出于本发明的目的,具有对映-柯巴基焦磷酸合酶(EC 5.5.1.13)的多肽能够催化化学反应:
Figure BDA0001575537730000171
所述酶具有一种底物,香叶基香叶基焦磷酸;以及一种产物,对映-柯巴基焦磷酸。所述酶参与赤霉素生物的合成。所述酶属于异构酶家族,特别是分子内裂解酶的类别。所述酶类别的系统名称是对映-柯巴基-二磷酸裂解酶(脱环)。通常使用的其他名称包括具有对映-柯巴基焦磷酸合酶、对映-贝壳杉烯合酶A和对映-贝壳杉烯合成酶A。
编码对映-柯巴基焦磷酸合酶的合适核酸序列可例如包含在WO2015/007748的SEQID.NO:1、3、5、7、17、19、59、61、141、142、151、152、153、154、159、160、182或184中列出的序列。
出于本发明的目的,具有对映-贝壳杉烯合酶活性(EC 4.2.3.19)的多肽是能够催化以下化学反应的多肽:
对映-柯巴基二磷酸
Figure BDA0001575537730000181
对映-贝壳杉烯+二磷酸
因此,所述酶具有一种底物,对映-柯巴基二磷酸;以及两种产物,对映-贝壳杉烯和二磷酸。
所述酶属于裂解酶家族,特别是作用于磷酸盐/酯的碳-氧裂解酶。所述酶类别的系统名称是对映-柯巴基二磷酸二磷酸-裂解酶(环化,对映-贝壳杉烯形成)。常用的其它名称包括对映-贝壳杉烯合酶B、对映-贝壳杉烯合成酶B、对映-柯巴基-二磷酸二磷酸-裂解酶和(环化)。所述酶参与双萜类生物合成。
编码对映-贝壳杉烯合酶的合适核酸序列可例如包含在WO2015/007748的SEQID.NO:9、11、13、15、17、19、63、65、143、144、155、156、157、158、159、160、183或184中列出的序列。
对映-柯巴基二磷酸合酶还可具有与相同蛋白质分子相关联的不同对映-贝壳杉烯合酶活性。由对映-贝壳杉烯合酶催化的反应是赤霉素的生物合成途径中的下一步骤。两种类型的酶活性是不同的,并且定点诱变以抑制蛋白质的对映-贝壳杉烯合酶活性导致对映-柯巴基焦磷酸的积累。
因此,本发明重组宿主中使用的单个核苷酸序列可编码具有对映-柯巴基焦磷酸合酶活性和对映-贝壳杉烯合酶活性的多肽。或者,两种活性可被两个不同的分离的核苷酸序列编码。
出于本发明的目的,具有对映-贝壳杉烯氧化酶活性(EC 1.14.13.78)的多肽是能够催化对映-贝壳杉烯的4-甲基的三次连续氧化以产生贝壳杉烯酸的多肽。这种活性通常需要细胞色素P450的存在。
编码对映-贝壳杉烯氧化酶的合适核酸序列可例如包含在WO2015/007748的SEQID.NO:21、23、25、67、85、145、161、162、163、180或186中列出的序列。
出于本发明的目的,具有贝壳杉烯酸13-羟化酶活性(EC 1.14.13)的多肽是能够催化使用NADPH和O2形成甜菊醇(对映-贝壳杉-16-烯-13-醇-19-酸)的多肽。这种活性也可称为对映-贝壳杉烯酸13-羟化酶活性。
编码贝壳杉烯酸13-羟化酶的合适核酸序列可例如包含在WO2015/007748的SEQID.NO:27、29、31、33、69、89、91、93、95、97、146、164、165、166、167或185中列出的序列。
本发明的重组宿主可包含编码具有NADPH-细胞色素p450还原酶活性的多肽的重组核酸序列。也就是说,本发明的重组宿主可能够表达编码具有NADPH-细胞色素p450还原酶活性的多肽的核苷酸序列。出于本发明的目的,具有NADPH-细胞色素P450还原酶活性(EC1.6.2.4;也称为NADPH:高铁血红蛋白氧化还原酶、NADPH:血红素蛋白氧化还原酶、NADPH:P450氧化还原酶、P450还原酶、POR、CPR、CYPOR)的多肽通常是一种这样的多肽,其为膜结合酶,从而允许电子从含有FAD和FMN的酶NADPH:细胞色素P450还原酶(POR;EC 1.6.2.4)转移至真核细胞的微粒体中的细胞色素P450。
在本发明的重组宿主中,可上调宿主产生香叶基香叶基二磷酸(GGPP)的能力。在本发明的上下文中上调意味着重组宿主比等同的非重组宿主产生更多的GGPP。
因此,本发明的重组宿主可包含编码羟甲基戊二酰基-辅酶A还原酶、法尼基-焦磷酸合成酶和香叶基香叶基二磷酸合酶的一个或多个核苷酸序列,由此宿主转化后的所述核苷酸序列赋予宿主产生提高水平的GGPP的能力。因此,根据本发明的重组宿主可包含编码羟甲基戊二酰基-辅酶A还原酶、法尼基-焦磷酸合成酶和香叶基香叶基二磷酸合酶中的一种或多种的一个或多个重组核酸序列。
因此,本发明的重组宿主可包含编码以下中的一种或多种的核酸序列:
具有羟甲基戊二酰基-辅酶A还原酶活性的多肽;
具有法尼基-焦磷酸合成酶活性的多肽;和
本发明的重组宿主可以是例如多细胞生物或其细胞或单细胞生物。本发明的宿主可以是原核、古细菌或真核宿主细胞。
原核宿主细胞可以是但不限于细菌宿主细胞。真核宿主细胞可以是但不限于酵母、真菌、变形虫、藻类、动物、昆虫宿主细胞。
真核宿主细胞可以是真菌宿主细胞。“真菌”包括真菌(Eumycotina)亚门的所有物种(Alexopoulos,C.J.,1962,在Introductory Mycology,John Wiley&Sons,Inc.(约翰威立出版有限公司),纽约)。因此,术语真菌包括丝状真菌和酵母等等。
“丝状真菌”在本文中定义为真核微生物,其包括真菌和卵菌亚门的所有丝状形式(如由Hawksworth等人,1995,同上所定义)。丝状真菌是以由壳多糖、纤维素、葡聚糖、壳聚糖、甘露聚糖以及其它复合多糖构成的菌丝壁为特征。营养体生长是通过菌丝延长,并且碳代谢是专性需氧的。丝状真菌菌株包括但不限于以下各项的菌株:Acremonium、Aspergillus、Agaricus、Aureobasidium、Cryptococcus、Corynascus、Chrysosporium、Filibasidium、Fusarium、Humicola、Magnaporthe、Monascus、Mucor、Myceliophthora、Mortierella、Neocallimastix、Neurospora、Paecilomyces、Penicillium、Piromyces、Phanerochaete、Podospora、Pycnoporus、Rhizopus、Schizophyllum、Sordaria、Talaromyces、Rasmsonia、Thermoascus、Thielavia、Tolypocladium、Trametes以及Trichoderma。可充当宿主细胞的优选丝状真菌菌株属于以下物种:Aspergillus niger、Aspergillus oryzae、Aspergillus fumigatus、Penicillium chrysogenum、Penicilliumcitrinum、Acremonium chrysogenum、Trichoderma reesei、Rasamsonia emersonii(先前称为Talaromyces emersonii)、Aspergillus sojae、Chrysosporium lucknowense、Myceliophtora thermophyla。用于比较转化和未转化细胞的发酵特征的参考宿主细胞包括例如Aspergillus niger CBS120.49、CBS 513.88;Aspergillus oryzae ATCC16868、ATCC 20423、IF0 4177、ATCC 1011、ATCC 9576、ATCC14488-14491、ATCC 11601、ATCC12892;Aspergillus fumigatus AF293(CBS101355);P.chrysogenum CBS 455.95;Penicillium citrinum ATCC 38065;Penicillium chrysogenum P2;Acremoniumchrysogenum ATCC 36225、ATCC 48272;Trichoderma reesei ATCC 26921、ATCC 56765、ATCC 26921;Aspergillus sojae ATCC11906;Chrysosporium lucknowense ATCC44006以及所有这些菌株的衍生株。作为丝状真菌宿主细胞特别优选的是Aspergillus niger CBS513.88及其衍生株。
真核宿主细胞可以是酵母细胞。优选的酵母宿主细胞可选自以下属:酵母属(例如,S.cerevisiae、S.bayanus、S.pastorianus、S.carlsbergensis)、Brettanomyces、Kluyveromyces、Candida(例如,C.krusei、C.revkaufi、C.pulcherrima、C.tropicalis、C.utilis)、Issatchenkia(例如,I.orientalis)、Pichia(例如,P.pastoris和P.kudriavzevii)、Schizosaccharomyces、Hansenula、Kloeckera、Pachysolen、Schwanniomyces、Trichosporon、Yarrowia(例如,Y.lipolytica)(先前分类为Candidalipolytica))、Yamadazyma。
原核宿主细胞可以是细菌宿主细胞。细菌宿主细胞可以是革兰氏阴性或革兰氏阳性细菌。细菌的实例包括但不限于,属于以下属的细菌:Bacillus(例如,B.subtilis、B.amyloliquefaciens、B.licheniformis、B.puntis、B.megaterium、B.halodurans、B.pumilus)、Acinetobacter、Nocardia、Xanthobacter、Escherichia(例如,大肠杆菌(例如,菌株DH1OB、Stbl2、DH5-α、DB3、DB3.1)、DB4、DB5、JDP682和ccdA-over(例如,美国申请号09/518,188)))、Streptomyces、Erwinia、Klebsiella、Serratia(S.marcessans)、Pseudomonas(例如,P.aeruginosa)、Salmonella(例如,S.typhimurium、S.typhi)。细菌还包括但不限于光合细菌(例如,绿色非硫细菌(例如,Choroflexus细菌(例如C.aurantiacus)、Chloronema(例如,C.gigateum))、绿色硫细菌(例如,Chlorobium细菌(例如,C.limicola)、Pelodictyon(例如,P.luteolum)、紫色硫细菌(例如,Chromatium(例如,C.okenii))以及紫色非硫细菌(例如,Rhodospirillum(例如,R.rubrum)、Rhodobacter(例如R.sphaeroides、R.capsulatus)和Rhodomicrobium细菌(例如R.vanellii))。
宿主细胞可以是来自非微生物生物体的宿主细胞。此类细胞的实例包括但不限于昆虫细胞(例如,Drosophila(例如,D.melanogaster)、Spodoptera(例如,S.frugiperdaSf9或Sf21细胞)和Trichoplusa(例如,High-Five细胞));线虫细胞(例如,C.elegans细胞);禽类细胞;两栖动物细胞(例如,Xenopus laevis细胞);爬行动物细胞;以及哺乳动物细胞(例如NIH3T3、293、CHO、COS、VERO、C127、BHK、Per-C6、Bowes黑色素瘤和HeLa细胞)。
根据本发明的重组宿主可能够在本领域中已知的任何合适的碳源上生长,并且将其转化为甜菊醇糖苷。重组宿主可能够直接转化植物生物质、纤维素、半纤维素、果胶、鼠李糖、半乳糖、岩藻糖、麦芽糖、麦芽糖糊精、核糖、核酮糖或淀粉、淀粉衍生物、蔗糖、乳糖和甘油。因此,优选的宿主表达酶如用于将纤维素转化成葡萄糖单体和将半纤维素转化成木糖和阿拉伯糖单体所需的纤维素酶(内切纤维素酶和外切纤维素酶)和半纤维素酶(例如内切和外切木聚糖酶、阿拉伯糖酶),能够将果胶转化成葡萄糖醛酸和半乳糖醛酸的果胶酶或将淀粉转化成葡萄糖单体的淀粉酶。优选地,宿主能够转化选自由以下各项组成的组的碳源:葡萄糖、木糖、阿拉伯糖、蔗糖、乳糖和甘油。宿主细胞可例如是WO03/062430、WO06/009434、EP1499708B1、WO2006096130或WO04/099381中所描述的真核宿主细胞。
因此,另一方面,本发明还提供了一种用于制备甜菊醇糖苷的方法,所述方法包括发酵本发明的重组宿主,所述重组宿主能够在合适的发酵培养基中产生至少一种甜菊醇糖苷;以及任选地回收所述甜菊醇糖苷。
在用于产生甜菊醇糖苷的方法中使用的发酵培养基可以是允许特定真核宿主细胞生长的任何合适的发酵培养基。发酵培养基的基本要素是本领域的技术人员已知的,并且可适用于所选择的宿主细胞。
优选地,发酵培养基包含选自由以下各项组成的组的碳源:植物生物质、纤维素、半纤维素、果胶、鼠李糖、半乳糖、岩藻糖、果糖、麦芽糖、麦芽糖糊精、核糖、核酮糖或淀粉、淀粉衍生物、蔗糖、乳糖、脂肪酸、甘油三酯和甘油。优选地,发酵培养基还包含氮源,如尿素;或铵盐,如硫酸铵、氯化铵、硝酸铵或磷酸铵。
根据本发明的发酵方法可以分批、分批补料或连续模式进行。也可应用单独的水解和发酵(SHF)方法或同时糖化和发酵(SSF)方法。这些发酵方法模式的组合对于最佳生产率来说也可以是可行的。如果在发酵方法中使用淀粉、纤维素、半纤维素或果胶作为碳源,则SSF方法可以是特别有吸引力的,其中可需要添加水解酶如纤维素酶、半纤维素酶或果胶酶以水解底物。
在用于制备甜菊醇糖苷的方法中使用的重组宿主可以是如上文所定义的任何合适的重组宿主。在所述方法中使用根据本发明的重组真核重组宿主可以是有利的,因为大多数真核细胞不需要用于繁殖的无菌条件并且对噬菌体感染不敏感。此外,真核宿主细胞可在低pH下生长以防止细菌污染。
根据本发明的重组宿主可以是兼性厌氧微生物。兼性厌氧重组宿主可以需氧方式繁殖至高细胞浓度。然后可在高细胞密度下进行这种厌氧阶段,这显著地降低了所需的发酵体积并且可使需氧微生物污染的风险最小化。
用于产生根据本发明的甜菊醇糖苷的发酵方法可以是需氧或厌氧发酵方法。
厌氧发酵方法可在本文中定义为在不存在氧的情况下运行或者基本上不消耗氧(优选小于5、2.5或1mmol/L/h),并且其中有机分子充当电子供体和电子受体两者的发酵方法。根据本发明的发酵方法也可首先在需氧条件下运行,且随后在厌氧条件下运行。
发酵方法也可在限氧或微需氧条件下进行。或者,发酵方法可首先在需氧条件下运行,且随后在限氧条件下运行。限氧发酵方法是其中氧消耗受到从气体到液体的氧传递的限制的过程。氧限制的程度由进入气流的量和组成以及所用发酵设备的实际混合/传质特性决定。
在根据本发明的方法中产生甜菊醇糖苷可在宿主细胞的生长阶段期间、固定(稳定状态)阶段期间或在两个阶段期间发生。在不同的温度下运行发酵方法可以是可行的。
用于产生甜菊醇糖苷的方法可在对于重组宿主来说最佳的温度下进行。对于每种转化的重组宿主而言,最佳生长温度可不同并且是本领域的技术人员已知的。最佳温度可高于野生型生物的最适温度以在非无菌条件下在最低感染敏感性和最低冷却成本的条件下有效生长生物体。或者,所述方法可在对于重组宿主的生长来说不是最佳的温度下进行。
用于产生根据本发明的甜菊醇糖苷的方法可在任何合适的pH值下进行。如果重组宿主是酵母,则发酵培养基中的pH优选具有低于6、优选低于5.5、优选低于5、优选低于4.5、优选低于4、优选低于pH 3.5或低于pH 3.0或低于pH 2.5、优选高于pH 2的值。在这些低pH值下进行发酵的优点是可防止发酵培养基中污染细菌的生长。
这种方法可在工业规模上进行。这种方法的产物是一种或多种甜菊醇糖苷。
从发酵培养基中回收甜菊醇糖苷可通过本领域已知的方法进行,例如通过蒸馏、真空萃取、溶剂萃取或蒸发。
在用于产生根据本发明的甜菊醇糖苷的方法中,实现高于5mg/l发酵液、优选高于10mg/l、优选高于20mg/l、优选高于30mg/l发酵液、优选高于40mg/l、更优选高于50mg/l、优选高于60mg/l、优选高于70、优选高于80mg/l、优选高于100mg/l、优选高于1g/l、优选高于5g/l、优选高于10g/l,例如至少约15g/L,例如至少约20g/l的浓度是可行的。
本发明还提供了一种包含能够通过本发明的用于制备甜菊醇糖苷的方法获得的甜菊醇糖苷的发酵液。
在本发明的重组宿主中表达一种或多种甜菊醇糖苷的情况下,可需要处理此类细胞以释放它们。优选地,在细胞外产生至少一种甜菊醇糖苷,例如rebA或rebM。
本发明还提供了一种通过根据本发明的用于制备甜菊醇糖苷的方法获得的或能够从本发明的发酵液获得的甜菊醇糖苷。这种甜菊醇糖苷可以是非天然存在的甜菊醇糖苷,也就是说不在植物中产生的甜菊醇糖苷。
还提供了通过本发明的方法能够获得的组合物(其通常包含一种或多种甜菊醇糖苷)。本发明还提供了一种包含能够通过用于制备甜菊醇糖苷的本发明的方法获得的或能够从本发明的发酵液获得的两种或更多种甜菊醇糖苷的组合物。在这种组合物中,一种或多种甜菊醇糖苷可以是非天然存在的甜菊醇糖苷,也就是说不在植物中产生的甜菊醇糖苷。这些都是本发明的组合物。
本发明的组合物可用于对于此类化合物来说已知的任何应用中。特别地,这样的组合物可例如用作甜味剂,例如用于食品或饮料中。因此,根据本发明,提供了一种包含本发明的组合物的食品、饲料或饮料。
例如,本发明的组合物可被配制成软饮料、配制为桌面甜味剂、口香糖、乳制品如酸奶(例如原味酸奶)、蛋糕、谷物或基于谷类的食物、营养食品、药物、食用凝胶、糖果产品、化妆品、牙膏或其它口腔组合物等。此外,本发明的组合物可用作甜味剂,不仅用于饮料、食品和其它专门用于人消费的产品,而且用于具有改进的特性的动物饲料和草料中。
因此,本发明尤其提供了一种包含本发明的组合物的食品、饲料或饮料。
在食品、饮料、药物、化妆品、桌面产品、口香糖的制造过程中,可使用诸如混合、捏合、溶解、酸浸、渗透、渗滤、喷洒、雾化、灌注和其它方法的常规方法。
本发明的组合物可以干或液体的形式使用。它可在食品热处理之前或之后加入。甜味剂的量取决于使用目的。它可单独添加或与其它化合物组合添加。
本发明的组合物可与一种或多种其它非热量或热量甜味剂掺混。这种掺混可用于改进风味或时间特征或稳定性。广泛范围的非热量和热量甜味剂二者可适用于与本发明的组合物掺混。例如,非热量甜味剂如罗汉果苷、莫纳甜、阿斯巴甜、安赛蜜盐、环磺酸盐、三氯蔗糖、糖精盐或赤藓糖醇。适用于与本发明的甜菊醇糖苷或组合物掺混的热量甜味剂包括糖醇和碳水化合物如蔗糖、葡萄糖、果糖和HFCS。还可使用甜味氨基酸,如甘氨酸、丙氨酸或丝氨酸。
本发明的组合物可与甜味剂抑制剂如天然甜味剂抑制剂组合使用。它可与鲜味增强剂如氨基酸或其盐组合。
本发明的组合物可与多元醇或糖醇、碳水化合物、生理活性物质或功能成分(例如类胡萝卜素、膳食纤维、脂肪酸、皂苷、抗氧化剂、营养品、类黄酮、异硫氰酸酯、苯酚、植物甾醇或甾烷醇(植物甾醇和植物甾烷醇)、多元醇、益生元、益生菌、植物雌激素、大豆蛋白、硫化物/硫醇、氨基酸、蛋白质、维生素、矿物质和/或基于健康益处如心血管、降胆固醇或抗炎分类的物质组合。
本发明的组合物可包括调味剂、芳香组分、核苷酸、有机酸、有机酸盐、无机酸、苦味化合物、蛋白质或蛋白质水解产物、表面活性剂、类黄酮、收敛剂化合物、维生素、膳食纤维、抗氧化剂、脂肪酸和/或盐。
本发明的组合物可作为高强度甜味剂应用,以产生具有改进的味道特征的零卡路里、低卡路里或糖尿病人用饮料和食品。它也可用于不能使用糖的饮料、食品、药物和其他产品中。
此外,本发明的组合物可用作甜味剂,不仅用于饮料、食品和其它专门用于人消费的产品,而且用于具有改进的特性的动物饲料和草料中。
本发明的组合物可用作甜味化合物的产品的实例可以是酒精饮料,如伏特加酒、葡萄酒、啤酒、烈酒、清酒等;天然果汁、提神饮料、碳酸软饮料、减肥饮料、零卡路里饮料、低卡路里饮料和食物、酸奶饮料、速溶果汁、速溶咖啡、粉末型速溶饮料、罐装产品、糖浆、发酵大豆酱、酱油、醋、调味品、蛋黄酱、番茄酱、咖喱、汤、速食肉汤、酱油粉、醋粉、多种类型的饼干、香米饼、咸饼干、面包、巧克力、焦糖、糖果、口香糖、果冻、布丁、蜜饯和腌菜、鲜奶油、果酱、橘子酱、糖花膏、奶粉、冰淇淋、冰糕、包装在瓶中的蔬菜和水果、罐装和煮熟的豆类、在甜味酱中煮熟的肉和食物、农业蔬菜食品、海鲜、火腿、香肠、鱼火腿、鱼香肠、鱼酱、油炸鱼制品、干制海产品、冷冻食品、腌渍海带、腊肉、烟草、医药产品等。原则上它可具有无限应用。
甜味组合物包括饮料,其非限制性实例包括非碳酸和碳酸饮料,如可乐、姜汁汽水、根汁汽水、苹果汁、水果味软饮料(例如柑橘味软饮料,如柠檬莱姆或橙汁)、软饮料粉等;来自水果或蔬菜的汁、包括榨汁等的汁、含有果粒的果汁、水果饮料、果汁饮料、含果汁的饮料、具有水果调味料的饮料、蔬菜汁、含蔬菜的汁以及含水果和蔬菜的混合汁;运动饮料、能量饮料、近水(near water)等的饮料(例如具有天然或合成调味剂的水);茶类或喜好型饮料如咖啡、可可、红茶、绿茶、乌龙茶等;含乳成分饮料如乳饮料、含乳成分咖啡、牛奶咖啡、奶茶、果奶饮料、饮用酸奶、乳酸菌饮料等;以及乳制品。
通常,甜味组合物中存在的甜味剂的量取决于甜味组合物的具体类型及其所需的甜度而广泛变化。本领域的普通技术人员可容易确定加入到甜味组合物中的甜味剂的适当量。
在食品、饮料、药物、化妆品、桌面产品、口香糖的制造过程中,可使用诸如混合、捏合、溶解、酸浸、渗透、渗滤、喷洒、雾化、灌注和其它方法的常规方法。
因此,掺入了本发明的组合物的组合物可通过本领域的技术人员已知的提供成分的均匀或均质混合物的任何方法来制备。这些方法包括干混、喷雾干燥、团聚、湿法制粒、压实、共结晶等。
呈固体形式时,本发明的组合物可以适于递送到待甜化的食物中的任何形式提供给消费者,所述形式包括小袋、小包、散装袋或盒、方块、片剂、喷雾或可溶解的条。所述组合物可以单位剂量或散装形式递送。
对于液体甜味剂体系和组合物而言,应开发方便范围的流体、半流体、糊状和膏状形式、使用任何形状或形式的适当包装材料的适当包装,其便于携带或分配或储存或运输含有任何上述甜味剂产品或上述产生的产品的组合的任何组合。
本发明的组合物可包含多种填充剂、功能成分、着色剂、调味剂。
术语“序列同源性”或“序列同一性”或“同源性”或“同一性”在本文中可互换使用。出于本发明的目的,在此定义为了确定两个氨基酸序列或两个核酸序列的序列同源性或序列同一性的百分比,出于最佳比较目的比对所述序列。为了优化两个序列之间的比对,可在比较的两个序列中的任一个中引入空位。这种比对可在所比较的序列的全长上进行。或者,比对可在更短的长度上进行,例如在约20、约50、约100或更多个核酸/碱基或氨基酸上进行。序列同一性是在所报告的比对区域上两个序列之间的相同匹配的百分比。
两个序列之间的序列比较和序列同一性百分比的确定可使用数学算法来完成。本领域的技术人员将意识到以下事实:若干不同的计算机程序可用于比对两个序列并确定两个序列之间的同一性(Kruskal,J.B.(1983)An overview of sequence comparison InD.Sankoff and J.B.Kruskal,(编辑),Time warps,string edits and macromolecules:the theory and practice of sequence comparison,第1-44页Addison Wesley)。两个氨基酸序列之间或两个核苷酸序列之间的序列同一性百分比可使用用于两个序列的比对的Needleman和Wunsch算法来确定(Needleman,S.B.和Wunsch,C.D.(1970)J.Mol.Biol.48,443-453)。氨基酸序列和核苷酸序列两者均可通过所述算法进行比对。Needleman-Wunsch算法已在计算机程序NEEDLE中实现。出于本发明的目的,使用了来自EMBOSS包的NEEDLE程序(2.8.0版或更高版本,EMBOSS:The European Molecular Biology Open SoftwareSuite(2000)Rice,P.Longden,I.和Bleasby,A.Trends in Genetics16,(6)第276-277页,http://emboss.bioinformatics.nl/)。对于蛋白质序列而言,EBLOSUM62用于取代矩阵。对于核苷酸序列而言,使用EDNAFULL。所使用的任选参数是空位开放罚分为10,以及空位延伸罚分为0.5。技术人员将理解的是,所有这些不同的参数将产生稍微不同的结果,但是当使用不同的算法时,两个序列的总体同一性百分比没有显著改变。
在通过如上所述的程序NEEDLE进行比对后,查询序列与本发明的序列之间的序列同一性的百分比计算如下:在两个序列中显示相同氨基酸或相同核苷酸的比对中的相应位置的数目除以在减去比对中的总空位数后比对的总长度。如本文定义的同一性可通过使用NOBRIEF选项从NEEDLE获得,并且在程序的输出中标记为“最长同一性”。
本发明的核酸和蛋白质序列可进一步用作“查询序列”以进行针对公共数据库的检索,以例如鉴定其它家族成员或相关序列。此类搜索可使用Altschul等人(1990)J.Mol.Biol.215:403—10的NBLAST和XBLAST程序(2.0版)进行。BLAST核苷酸搜索可用NBLAST程序(得分=100、字长=12)来进行,以获得与本发明的核酸分子同源的核苷酸序列。BLAST蛋白质搜索可用XBLAST程序(得分=50、字长=3)来进行,以获得与本发明的蛋白分子同源的氨基酸序列。为了获得用于比较目的的空位比对,可利用如在Altschul等人,(1997)Nucleic Acids Res.25(17):3389-3402中描述的空位BLAST。当利用BLAST和空位BLAST程序时,可使用相应程序(例如XBLAST和NBLAST)的默认参数。参见美国国家生物技术信息中心http://www.ncbi.nlm.nih.gov/的主页。
标准遗传技术,例如在宿主细胞中过表达酶、宿主细胞的遗传修饰或杂交技术是本领域已知的方法,例如Sambrook和Russel(2001)“Molecular Cloning:A LaboratoryManual(第3版),Cold Spring Harbor Laboratory,Cold Spring Harbor LaboratoryPress或F.Ausubel等编,“Current protocols in molecular biology”,GreenPublishing and Wiley Interscience,New York(1987)中所述。转化、遗传修饰真菌宿主细胞的方法等从例如EP-A-0 635 574、WO 98/46772、WO 99/60102和WO00/37671、WO90/14423、EP-A-0481008、EP-A-0635 574和US6,265,186中获知。
本发明的一些实施方式:
1.一种能够产生甜菊醇糖苷的重组宿主,所述重组宿主过表达介导甜菊醇糖苷转运的多肽,并且所述多肽包含SEQ ID NO:29所示的氨基酸序列或与其具有至少约50%序列同一性的氨基酸序列。
2.一种能够产生甜菊醇糖苷的重组宿主,所述重组宿主已被修饰,优选在其基因组中被修饰,以导致介导甜菊醇糖苷转运的多肽的产生缺陷,并且所述多肽包含SEQ IDNO:29所示的氨基酸序列或与其具有至少约50%序列同一性的氨基酸序列。
3.根据权利要求1所述的重组宿主,所述重组宿主包含编码多肽的重组核酸,所述多肽包含SEQ ID NO:29所示氨基酸序列或与其具有至少约50%序列同一性的氨基酸序列。
4.根据前述实施方式中任一种所述的重组宿主,其包含一种或更多种编码以下多肽的重组核苷酸序列:
具有对映-柯巴基焦磷酸合酶活性的多肽;
具有对映-贝壳杉烯合酶活性的多肽;
具有对映-贝壳杉烯氧化酶活性的多肽;以及
具有贝壳杉烯酸13-羟化酶活性的多肽。
5.根据前述实施方式中任一种所述的重组宿主,其包含编码具有NADPH-细胞色素p450还原酶活性的多肽的重组核酸序列。
6.根据前述实施方式中任一种所述的重组宿主,其包含编码以下项中的一种或更多种的重组核酸序列:
(i)具有UGT74G1活性的多肽;
(ii)具有UGT2活性的多肽;
(iii)具有UGT85C2活性的多肽;和
(iv)具有UGT76G1活性的多肽。
7.根据前述实施方式中任一种所述的重组宿主,其中所述宿主属于Saccharomyces、Aspergillus、Pichia、Kluyveromyces、Candida、Hansenula、Humicola、Issatchenkia、Trichosporon、Brettanomyces、Pachysolen、Yarrowia、Yamadazyma或Escherichia属中的一种。
8.根据实施方式7所述的重组宿主,其中所述重组宿主是Saccharomycescerevisiae细胞、Yarrowia lipolytica细胞、Candida krusei细胞、Issatchenkiaorientalis细胞或Escherichia coli细胞。
9.根据前述实施方式中任一种所述的重组宿主,其中所述宿主产生香叶基香叶基二磷酸(GGPP)的能力被上调。
10.根据前述实施方式中任一种所述的重组宿主,其包含编码以下项中的一种或多种的核酸序列:
具有羟甲基戊二酰基-辅酶A还原酶活性的多肽;或者
具有法尼基-焦磷酸合成酶活性的多肽
11.一种能够产生甜菊醇糖苷的重组宿主,所述重组宿主过表达介导甜菊醇糖苷转运的异源多肽。
12.一种制备甜菊醇糖苷的方法,所述方法包括在合适的发酵培养基中发酵根据前述实施方式中任一种所述的重组宿主,以及任选地回收所述甜菊醇糖苷。
13.根据实施方式12所述的制备甜菊醇糖苷的方法,任选地其中所述方法以工业规模进行。
14.一种发酵液,其包含通过根据实施方式12或13所述的方法能够获得的甜菊醇糖苷。
15.通过根据实施方式12或13所述的方法获得的或者从根据实施方式14所述的发酵液获得的甜菊醇糖苷。
16.通过根据实施方式12或13所述的方法能够获得的组合物,包含两种或更多种通过根据实施方式12或13所述的方法获得的甜菊醇糖苷的组合物或从根据实施方式14所述的发酵液获得的组合物。
17.一种食品、饲料或饮料,其包含根据权利要求15所述的甜菊醇糖苷或根据权利要求16所述的组合物。
在本文对专利文件或作为现有技术给出的其他材料的引用不应被认为承认该文件或材料是已知的或它包含的信息是任何这些权利要求的优先权日时公知常识的一部分。
在本文所述的每个参考文献的披露均通过引用以其全部内容并入本文。
本发明通过以下实施例来进一步说明:
实施例
概述
标准遗传技术(如在宿主细胞中过表达酶以及宿主细胞的另外遗传修饰)是本领域已知的方法,例如在Sambrook和Russel(2001)"Molecular Cloning:A LaboratoryManual(第3版),Cold Spring Harbor Laboratory,Cold Spring Harbor LaboratoryPress,或F.Ausubel等人编辑,"Current protocols in molecular biology",GreenPublishing and Wiley Interscience,New York(1987)中所描述的。用于真菌宿主细胞的转化和遗传修饰的方法从例如EP-A-0 635 574、WO 98/46772、WO 99/60102和WO 00/37671中获知。
实施例1:甜菊醇糖苷产生菌株ML14094(MAT-A谱系)的描述
将接合型MATA和MATB的两种Yarrowia lipolytica菌株工程化以用于甜菊醇糖苷的产生。将这些菌株接合,二倍体孢子形成,并选择具有甜菊醇糖苷产生的孢子。将这些孢子中的一个进一步开发用于产生甜菊醇糖苷,包括产生莱鲍迪甙A。
步骤1:用5个限定的DNA片段转化菌株ML10371(MAT-A、lys1-、ura3-、leu2-)。所有转化通过乙酸锂/PEG真菌转化方案方法进行,并在适当的基本培养基YPD+100μg/ml诺尔丝菌素或YPD+100μg/ml潮霉素上选择转化体。
1)在质粒MB6969(图1)的HindIII/NotI消化后通过凝胶纯化分离的7.0kb DNA片段。此构建体编码用于过表达连接至一起侧接lox位点(Guldener等人,1996,Lambert等人,2007)的pPGM启动子(SEQ ID NO:2)和xprT终止子(SEQ ID NO:9)以及HPH潮霉素抗性基因的UGT2_1a(SEQ ID NO:1)的合成构建体,以及用于过表达缺乏连接至pHSP启动子(SEQ IDNO:3)和cwpT终止子(SEQ ID NO:10)的5'膜锚定序列(tHMGopt:SEQ ID NO:15)的密码子优化的Y.lipolytica羟甲基戊二酰基-辅酶A还原酶开放阅读框的合成构建体。
2)在MB6856(图2)的HindIII/SspI消化后通过凝胶纯化分离的2.7kb DNA片段。此构建体编码连接至pHYPO启动子(SEQ ID NO:4)和gpdT终止子(SEQ ID NO:11)的tHMGopt(SEQ ID NO:15)。
3)在MB6857(图3)的SspI消化后通过凝胶纯化分离的2.5kbDNA片段。此构建体编码连接至pHSP启动子(SEQ ID NO:3)和cwpT终止子(SEQ ID NO:10)的tHMGopt(SEQ ID NO:15)。
4)在MB6948(图4)的SspI消化后通过凝胶纯化分离的2.0kb DNA片段。此构建体编码用于过表达连接至pHSP启动子(SEQ ID NO:3)和cwpT终止子(SEQ ID NO:10)的密码子优化的Y.lipolytica香叶基-香叶基-焦磷酸合成酶(GGSopt:SEQ ID NO:16)的合成构建体。
5)在MB6958(图5)的HindIII/SspI消化后通过凝胶纯化分离的2.2kb DNA片段。此构建体编码连接至pHYPO启动子(SEQ ID NO:4)和gpdT终止子(SEQ ID NO:11)的GGSopt(SEQ ID NO:16)。所得菌株被指定为ML13462。
步骤2.用在质粒MB7015(图6)的SfiI消化后通过凝胶纯化分离的9.7kb片段转化菌株ML13462。此构建体编码用于过表达连接至pENO(SEQ ID NO:5)启动子和gpdT终止子(SEQ ID NO:11)的UGT1(SEQ ID NO:17),连接至pHSP启动子(SEQ ID NO:3)和pgmT终止子(SEQ ID NO:12)的UGT3(SEQ ID NO:18),连接至pCWP(SEQ NO:6)启动子和pgkT终止子(SEQID NO:13)的UGT4(SEQ ID NO:19),以及lox-侧接的诺尔丝菌素抗性标记(NAT)的合成构建体。注意,lox位点的放置允许随后通过CRE重组酶介导的重组去除诺尔丝菌素抗性。诺尔丝菌素抗性分离株被指定为ML13500。
步骤3.用在质粒MB6986(图7)的PvuI/SapI消化后通过凝胶纯化分离的9.1kb片段转化菌株ML13500。此构建体编码连接至pHSP启动子(SEQ ID NO:3)和cwpT终止子(SEQ IDNO:10)的tHMGopt(SEQ ID NO:15)、lox侧接的URA3冲击(URA3blaster)原养型标记以及连接至pHYPO启动子(SEQ ID NO:4)和gpdT终止子(SEQ ID NO:11)的GGSopt(SEQ ID NO:16)。在缺乏尿嘧啶的基本培养基上选择转化体。一种选择的尿嘧啶原养型被指定为ML13723。
步骤4.用在质粒MB7059(图8)的SfiI消化后通过凝胶纯化分离的18.1kb片段转化菌株ML13723。MB7059编码连接至pCWP启动子(SEQ ID NO:6)和cwpT终止子(SEQ ID NO:10)的tCPS_SR(SEQ ID NO:20),连接至pHYPO启动子(SEQ ID NO:4)和gpdT终止子(SEQ ID NO:11)的tKS_SR(SEQ ID NO:21),连接至pHSP启动子(SEQ ID NO:3)和pgmT终止子(SEQ IDNO:12)的KAH_4(SEQ ID NO:22),连接至pTPI启动子(SEQ ID NO:7)和pgkT终止子(SEQ IDNO:13)的KO_Gib(SEQ ID NO:23),连接至pENO启动子(SEQ ID NO:5)和xprT终止子(SEQ IDNO:9)的CPR_3(SEQ ID NO:24),以及天然Y.lipolytica LEU2基因座。一种选择的莱鲍迪甙A产生转化体被指定为ML14032。
步骤5.将菌株ML14032划线至YPD并生长过夜,然后划线至5-FOA板,以允许以前引入的URA3标记的重组介导的丧失。一种选择的5-FOA抗性转化体被指定为ML14093。
步骤6.用在质粒MB7100(图9)的SfiI消化后通过凝胶纯化分离的19.0kb片段转化菌株ML14093。MB7100编码连接至pHYPO启动子(SEQ ID NO:4)和cwpT终止子(SEQ ID NO:10)的tCPS_SR(SEQ ID NO:20),连接至pCWP启动子(SEQ ID NO:6)和gpdT终止子(SEQ IDNO:11)的tKS_SR(SEQ ID NO:21),连接至pHSP启动子(SEQ ID NO:3)和pgmT终止子(SEQ IDNO:12)的KAH_4(SEQ ID NO:22),连接至pENO启动子(SEQ ID NO:5)和pgkT终止子(SEQ IDNO:13)的KO_Gib(SEQ ID NO:23),连接至pTPI启动子(SEQ ID NO:7)和xprT终止子(SEQ IDNO:9)的CPR_3(SEQ ID NO:24),以及URA3冲击原养型标记。在缺乏尿嘧啶的基本培养基上选择转化体。一种选择的莱鲍迪甙A产生尿嘧啶原养型被指定为ML14094。
实施例2.甜菊醇糖苷产生菌株ML14087(MAT-B谱系)的描述:
步骤1.用5个限定的DNA片段转化菌株ML13206(MAT-B、ade1-、ure2-、leu2-)。所有转化通过乙酸锂/PEG真菌转化方案方法进行,并在适当的基本培养基YPD+100μg/ml诺尔丝菌素或YPD+100μg/ml潮霉素上选择转化体。
1)在质粒MB6969(图1)的HindIII/NotI消化后通过凝胶纯化分离的7.0kb DNA片段。此构建体编码用于过表达连接至一起侧接lox位点(Guldener等人,1996,Lambert等人,2007)的pPGM(SEQ ID NO:2)启动子和xprT终止子(SEQ ID NO:9)以及HPH潮霉素抗性基因的UGT2_1a(SEQ ID NO:1)的密码子对优化的(CpO)ORF的合成构建体,以及用于过表达缺乏连接至pHSP启动子(SEQ ID NO:3)和cwpT终止子(SEQ ID NO:10)的5'膜锚定序列(tHMGopt:SEQ ID NO:15)的密码子优化的解脂耶氏酵母羟甲基戊二酰基-辅酶A还原酶开放阅读框的合成构建体。
2)在MB6856(图2)的HindIII/SspI消化后通过凝胶纯化分离的2.7kb DNA片段。此构建体编码连接至pHYPO启动子(SEQ ID NO:4)和gpdT终止子(SEQ ID NO:11)的tHMGopt(SEQ ID NO:15)。
3)在MB6857(图3)的SspI消化后通过凝胶纯化分离的2.5kb DNA片段。此构建体编码连接至pHSP启动子(SEQ ID NO:3)和cwpT终止子(SEQ ID NO:10)的tHMGopt(SEQ ID NO:15)。
4)在MB6948的SspI消化后通过凝胶纯化分离的2.0kb DNA片段(图4)。此构建体编码用于过表达连接至pHSP启动子(SEQ ID NO:3)和cwpT终止子(SEQ ID NO:10)的密码子优化的Y.lipolytica香叶基-香叶基-焦磷酸合成酶(GGSopt:SEQ ID NO:16)的合成构建体。
5)在MB6958(图5)的HindIII/SspI消化后通过凝胶纯化分离的2.2kb DNA片段。此构建体编码连接至pHYPO(SEQ ID NO:4)启动子和gpdT终止子(SEQ ID NO:11)的GGSopt(SEQ ID NO:16)。所得菌株被指定为ML13465。
步骤2.用2个限定的DNA片段转化菌株ML13465:
1).在质粒MB7015(图6)的SfiI消化后通过凝胶纯化分离的9.7kb片段。此构建体编码用于过表达连接至pENO启动子(SEQ ID NO:5)和gpdT(SEQ ID NO:11)终止子的UGT1(SEQ ID NO:17),连接至pHSP启动子(SEQ ID NO:3)和pgmT终止子(SEQ ID NO:12)的UGT3(SEQ ID NO:18),连接至pCWP启动子(SEQ NO:6)和pgkT终止子(SEQ ID NO:13)的UGT4(SEQID NO:19),以及lox-侧接的诺尔丝菌素抗性标记(NAT)的合成构建体。注意,lox位点的放置允许随后通过CRE重组酶介导的重组去除诺尔丝菌素抗性。
2).在质粒MB6988(图10)的PvuI/SapI消化后通过凝胶纯化分离的9.1kb片段。此构建体编码连接至pHSP启动子(SEQ ID NO:3)和cwpT终止子(SEQ ID NO:10)的tHMGopt(SEQ ID NO:15)、lox侧接的URA2冲击原养型标记以及连接至pHYPO启动子(SEQ ID NO:4)和gpdT终止子(SEQ ID NO:11)的GGSopt(SEQ ID NO:16)。在YPD+100μg/ml诺尔丝菌素上选择菌株,并将复制物接种到缺乏尿嘧啶的基本培养基上。一种诺尔丝菌素抗性尿嘧啶原养型分离株被指定为ML13490
步骤3.将菌株ML13490划线至YPD并生长过夜,然后划线至5-FOA板,以允许以前引入的URA2标记的重组介导的丧失。一种选择的5-FOA抗性转化体被指定为ML13501。
步骤4.用在质粒MB6988(图10)的PvuI/SapI消化后通过凝胶纯化分离的9.1kb片段转化菌株ML13501。在缺乏尿嘧啶的基本培养基上选择转化体。一种选择的尿嘧啶原养型微生物被指定为ML13724。
步骤5.用在质粒MB7044(图11)的SfiI消化后通过凝胶纯化分离的18.1kb片段转化菌株ML13724。MB7044编码连接至pHYPO启动子(SEQ ID NO:4)和cwpT终止子(SEQ ID NO:10)的tCPS_SR(SEQ ID NO:20),连接至pCWP启动子(SEQ ID NO:6)和gpdT终止子(SEQ IDNO:11)的tKS_SR(SEQ ID NO:21),连接至pHSP启动子(SEQ ID NO:3)和pgmT终止子(SEQ IDNO:12)的KAH_4(SEQ ID NO:22),连接至pENO启动子(SEQ ID NO:5)和pgkT终止子(SEQ IDNO:13)的KO_Gib(SEQ ID NO:23),连接至pTPI启动子(SEQ ID NO:7)和xprT终止子(SEQ IDNO:9)的CPR_3(SEQ ID NO:24)以及LEU2基因座。一种选择的莱鲍迪甙A产生转化体被指定为ML14044。
步骤6.将菌株ML14044划线至YPD并生长过夜,且然后划线至5-FOA板,以允许以前引入的URA2标记的重组介导的损失。一种选择的5’-FOA抗性转化体被指定为ML14076。
步骤7.用在质粒MB7094(图12)的SfiI消化后通过凝胶纯化分离的19.0kb片段转化菌株ML14076。MB7094编码连接至pHYPO启动子(SEQ ID NO:4)和cwpT终止子(SEQ ID NO:10)的tCPS_SR(SEQ ID NO:20),连接至pCWP启动子(SEQ ID NO:6)和gpdT终止子(SEQ IDNO:11)的tKS_SR(SEQ ID NO:21),连接至pHSP启动子(SEQ ID NO:3)和pgmT终止子(SEQ IDNO:12)的KAH_4(SEQ ID NO:22),连接至pENO启动子(SEQ ID NO:5)和pgkT终止子(SEQ IDNO:13)的KO_Gib(SEQ ID NO:23),连接至pTPI启动子(SEQ ID NO:7)和xprT终止子(SEQ IDNO:9)的CPR_3(SEQ ID NO:24)以及URA2冲击原养型标记。在缺乏尿嘧啶的基本培养基上选择转化体。一种选择的莱鲍迪甙A产生尿嘧啶原养型被指定为ML14087。
实施例3.接合MATA和MATB谱系并选择甜菊醇糖苷产生子代
允许具有互补营养缺陷(ADE1+lys1-和ade1-LYS1+)的相对接合型(ML14094和ML14087)的菌株接合,然后接种在仅允许二倍体生长的选择性培养基(缺乏腺嘌呤和赖氨酸的基本培养基)上。然后诱导二倍体细胞(ML14143)通过饥饿进行减数分裂和孢子形成,并将所得的单倍体子代复制接种以鉴定具有潮霉素和诺尔丝菌素抗性的原养型分离株。一种选择的莱鲍迪甙A产生菌株被指定为ML14737
实施例4.使菌株不含UGT21a
在用MB6128(图13)转化后从菌株ML14737去除潮霉素抗生素标记和诺尔丝菌素抗生素标记,所述MB6128编码用于组成型过表达CRE重组酶的构建体。CRE重组酶通过在Lox66和Lox71位点上的重组而缺失抗生素标记。非活性Lox72位点留在基因组中(Guldener等人,1996,Lambert等人,2007)。质粒MB6128是一种CEN质粒,其在解脂耶氏酵母中以附加体的形式复制并且其含有在天然Y.lipolyticapHHF启动子和hhfT终止子控制下的CRE重组酶编码区以及在天然Y.lipolyticapTEF1启动子和xprT终止子控制下的neoR(编码G418抗性)。在YPD+G418上选择MB6128转化体并通过成功的Cre-Lox重组筛选丧失潮霉素和诺尔丝菌素抗性的转化体后,将敏感菌落生长在非选择性培养基上以去除MB6128CEN质粒(CEN质粒自发丧失)。所得到的不含抗生素标记的变体被指定为ML14869。由于UGT2_1a连同潮霉素抗性的丧失,此菌株不再产生莱鲍迪甙A,而是产生中间体甜茶苷。
实施例5.引入UGT2_10b
用通过PCR产生且在凝胶电泳后纯化的4.2kb DNA片段转化ML14869。该片段编码潮霉素抗性和UGT2_10b(SEQ ID NO:25)的序列优化变体。如下所述通过融合PCR产生DNA片段。UGT2_10b是针对Y.lipolytica中的表达而密码子对优化的,其由DNA2.0合成,与天然Y.lipolytica pHSP启动子和gpdT终止子相连且侧翼是是连接子序列。使用合适的寡核苷酸扩增该1.4kb DNA片段,并通过凝胶电泳纯化。HPH标记侧翼为lox位点,与Ashbyagossypii pTEF1启动子和tef1T终止子相连且侧翼是是连接子序列。使用合适的寡核苷酸扩增该1.8kb DNA片段,并通过凝胶电泳纯化。通过使用这两个DNA片段进行PCR,随后进行凝胶电泳和纯化来获得4.2kb DNA片段。用这种确定的DNA片段转化ML14869并在YPD+100ug/ml潮霉素上进行选择,得到了产生莱鲍迪甙A的菌株ML14937。
实施例6.使菌株ML14937不含标记
在用编码用于组成型过表达CRE重组酶的构建体的MB6128(图13)转化之后,从菌株ML14937中除去潮霉素抗生素标记。CRE重组酶通过在Lox66和Lox71位点上重组使抗生素标记缺失。失活的Lox72位点留在基因组中(Güldener等,1996;Lambert等,2007)。质粒MB6128是一种CEN质粒,其在Y.lipolytica中附加性复制,并含有受天然Y.lipolyticapHHF启动子控制的CRE重组酶编码区、hhfT终止子、受天然Y.lipolytica PTEF1启动子控制的neoR(编码G418抗性)以及xprT终止子。在于YPD+G418上选择MB6128转化体并筛选通过成功的Cre-Lox重组而丢失潮霉素和诺尔丝菌素抗性的转化体后,使敏感性菌落在非选择性培养基上生长以除去MB6128CEN质粒(CEN质粒自发丢失)。所得到的不含抗生素标记的变体被指定为ML14958。
实施例7.用额外的基因拷贝进行转化
将菌株ML14958划线到YPD上并生长过夜,然后划线到5-FOA板上以允许URA2标记的重组介导的丢失。一个选择的5'-FOA抗性转化体被指定为ML15075。用3个确定的DNA片段转化菌株ML15075,并在含有100μg/ml潮霉素的YPD上选择转化。所述三个片段如下:
1)4.6kb DNA片段,其编码与天然Y.lipolytica pHYPO启动子和xprT终止子相连的KAH开放阅读框,还编码侧翼为lox位点的HPH潮霉素抗性基因,其是通过PCR产生的并在凝胶电泳后纯化。在Saccharomyces cerevisiae中组装序列,来自该S.cerevisiae菌株的DNA被用作PCR模板,产生了用于转化ML15075的4.6kb DNA片段(参见图14)。
2)3.3kb DNA片段,其编码与天然Y.lipolytica pHSP启动子和xprT终止子相连的tCPS开放阅读框,其是通过PCR产生的并在凝胶电泳后纯化。在Saccharomyces cerevisiae中组装序列,来自该S.cerevisiae菌株的DNA被用作PCR模板,产生了用于转化ML15075的3.3kb DNA片段(图15)。
3)9.1kb片段,其是在PvuI/SapI消化质粒MB6986后通过凝胶纯化分离的(图16)。该构建体编码与天然Y.lipolytica HSP启动子和CWP终止子相连的tHMG、侧翼为lox的URA3冲击原养型标记以及与天然Y.lipolytica HYPO启动子和GPD终止子相连的GGS1。由于ura2的突变使ML15075是营养缺陷型,因此未选择该片段。
一种选择的潮霉素抗性转化体被指定为ML15085。
实施例8.转化tHMG和GGS的额外拷贝
用8.4kb片段转化菌株ML15085,所述8.4kb片段是在PvuI/SapI消化质粒MB6988后通过凝胶纯化分离的(图10)。该构建体编码与天然Y.lipolytica的pHSP启动子和cwpT终止子相连的tHMGopt、侧翼为lox的URA2冲击原养型标记以及与天然Y.lipolytica HYPO启动子和gpdT终止子相连的GGSopt。在缺乏尿嘧啶的基本培养基上选择转化体。一个选择的尿嘧啶原养型被指定为ML15086。
实施例9.使菌株ML15086不含标记
在用编码用于组成型过表达CRE重组酶的构建体的MB6128(图13)转化之后,从菌株ML15086中除去潮霉素抗生素标记。CRE重组酶通过在Lox66和Lox71位点上重组使抗生素标记缺失。失活的Lox72位点留在基因组中(Güldener等,1996;Lambert等,2007)。质粒MB6128是一种CEN质粒,其在Y.lipolytica中附加性复制,并含有受天然Y.lipolyticapHHF启动子控制的CRE重组酶编码区、hhfT终止子、受天然Y.lipolytica pTEF1启动子控制的neoR(编码G418抗性)以及xprT终止子。
在于YPD+G418上选择MB6128转化体并筛选通过成功的Cre-Lox重组而丢失潮霉素和诺尔丝菌素抗性的转化体后,使敏感性菌落在非选择性培养基上生长以除去MB6128CEN质粒(CEN质粒自发丢失)。一种原养型、不含抗生素标记的变体被指定为ML15087。
实施例10.破坏Y.lipolytica ML15087中的YALI0C08701
为了提高靶向转运体破坏的效率并避免基因组中不被靶向的其它基因座上的整合事件,破坏YALI0C08701(SEQ ID NO:26),其是非同源末端连接中的重要因子。基于单交换整合设计破坏构建体,其中使用内部同源片段将破坏构建体靶向YALI0C08701ORF。使用利用恰当的连接子序列延伸的合适引物从Y.lipolytica基因组DNA PCR扩增用于组装破坏构建体的内部同源片段。PCR片段的总长度为600bp。这些片段的500bp与靶向的YALI0C08701同源,50bp与载体骨架和KanMX标记盒同源。用合适的引物PCR扩增KanMX标记盒。对于两个侧翼和标记盒,使用Phusion聚合酶(New England Biolabs)根据供应商的说明进行六个50μl的PCR反应。使用NucleoSpin Gel和PCR Clean-up试剂盒(Machery Nagel)纯化和浓缩PCR产物。
通过将两个侧翼、KanMX片段和线性pRS4175_3穿梭载体转化到S.cerevisiaeCEN.PK113-7D中,在体内将侧翼和标记组装在SnaBI/PmeI消化的pRS4175_3(图17)穿梭载体骨架中。转化并在30℃下在YEPhD中恢复2小时后,将细胞涂布在含有200μg/ml G418(Invitrogen)的YEPhD琼脂上。将板在30℃下孵育2天。在30℃下在YEPD+200μg/ml G418中培养转化体。分离并纯化质粒DNA。
利用诊断PCR确定破坏盒的正确组装。在六个50μl PCR反应中PCR扩增表达盒。使用NucleoSpin Gel和PCR Clean-up试剂盒(Machery Nagel)纯化和浓缩PCR产物。将1μgPCR扩增的破坏盒转化到Y.lipolytica菌株ML15087中。转化并在30℃下在YEPhD中恢复2小时后,将细胞涂布在含有400μg/ml G418的YEPhD琼脂上。将板在30℃下孵育2天。通过将转化体重新划线在含有400μg/ml G418的YEPhD琼脂上来对其进行纯化。其中一个转化体被命名为STV2049。使用适当的寡核苷酸,利用诊断PCR确定正确的整合。
实施例11.破坏Y.lipolytica STV2049中的转运体YALI0E25201
基于单交换整合设计破坏构建体,其中使用内部同源片段将破坏构建体靶向YALI0E25201ORF(SEQ ID NO:27)。用于组装破坏构建体的内部同源片段以总长度为700bp的gBlocks(IDT)的形式的合成DNA订购。这些片段的600bp与靶向转运体YALI0E25201同源,50bp与载体骨架(5和3连接子序列,图18)和HygB标记盒(c和d连接子序列,图18)同源。使用Phusion聚合酶(New England Biolabs)根据供应商的说明,利用合适的引物PCR扩增HygB标记盒。使用NucleoSpin Gel和PCR Clean-up试剂盒(Machery Nagel)纯化和浓缩PCR产物。
通过将两个侧翼、HygB片段和线性pRS4175_3穿梭载体转化到S.cerevisiae CEN-PK-7D中,在体内将侧翼和标记组装在SnaBI/PmeI消化的pRS4175_3穿梭载体骨架中。参见图18。
转化并在30℃下在YEPhD中恢复2小时后,将细胞涂布在含有200μg/ml G418(Invitrogen)的YEPhD琼脂上。将板在30℃下孵育2天。在30℃、550rpm和80%湿度下,在YEPD+200μg/ml G418中培养转化体。分离并纯化质粒DNA。利用诊断PCR确定破坏盒的正确组装。
在6个50μl PCR反应中PCR扩增(图19)表达盒。使用NucleoSpin Gel和PCR Clean-up试剂盒(Machery Nagel)纯化和浓缩PCR产物。将1μg PCR扩增的破坏盒转化到至Y.lipolytica STV2049中。转化并在30℃下在YEPhD中恢复2小时后,将细胞涂布在含有100μg/ml HygB(Invitrogen)的YEPhD琼脂上。将板在30℃下孵育2天。通过将转化体重新划线在含有100μg/ml HygB的YEPhD琼脂上来对其进行纯化。使用适当的寡核苷酸,利用诊断PCR确定正确的整合,如图20所示。
实施例12.发酵Y.lipolytica STV2049和STV2049 YALI0E25201破坏转化体
用来自YEPh-D琼脂的菌落物质接种预培养物。使预培养物在每个孔含有200μl0.5xYEP的96半深孔板中生长,所述0.5xYEP含有2%葡萄糖。用透气密封物密封板,并在30℃、80%湿度、750rpm的Infors培养箱中孵育48小时。
使用40μl 96孔预培养物接种每个孔含有2.5ml 0.25×YEP的24孔深孔板,所述0.25xYEP含有5%葡萄糖。用透气密封物密封板,并在30℃、80%湿度、500rpm的Infors培养箱中孵育120小时。
在MTP离心机中离心24孔板并收集1ml上清液。从沉淀中倾析剩余的上清液。
将上清液级分在33%乙腈中稀释1000倍。将沉淀悬浮在2.5ml milli-Q中,并将1ml转移到96孔DWP中。用铝密封物密封板并在90℃下孵育10分钟。将板冷却至室温,加入0.5ml 100%乙腈并均化。将板在2088xg下离心10分钟以沉淀细胞材料和碎片。将沉淀级分的上清液在33%乙腈中稀释33倍,从而导致了组合的50倍稀释。使用LC/MS分析样品的莱鲍迪甙A和其他甜菊醇糖苷。
我们发现:与亲本菌株相比,具有YALI0E25201破坏的菌株在上清液中产生了更低滴度的莱鲍迪甙A。与亲本菌株相比,转运体破坏菌株中莱鲍迪甙A的浓度低约三倍(见表1)。
表1.24孔发酵中的莱鲍迪甙A上清液浓度。对亲本菌株STV2049进行六个重复培 养。进行三个独立的STV2049ΔYALI0E25201转化体的重复培养。表1中的数据为取的平均 值。
Figure BDA0001575537730000421
观察到:与参考菌株相比,转运体破坏菌株的上清液中莱鲍迪甙A的浓度较低对于甜菊苷、甜茶苷同样如此;对于莱鲍迪甙D和甜菊醇-19-单糖苷程度较小(参见表2至表5)。
表2.24孔发酵中的甜菊苷上清液浓度。对亲本菌株STV2049进行六个重复培养。进 行三个独立的STV2049ΔYALI0E25201转化体的重复培养。表2中的数据为取的平均值。
Figure BDA0001575537730000431
表3.24孔发酵中的甜茶苷上清液浓度。对亲本菌株STV2049进行六个重复培养。进 行三个独立的STV2049ΔYALI0E25201转化体的重复培养。表3中的数据为取的平均值。
Figure BDA0001575537730000432
表4.24孔发酵中的莱鲍迪甙D上清液浓度。对亲本菌株STV2049进行六个重复培 养。进行三个独立的STV2049ΔYALI0E25201转化体的重复培养。表4中的数据为取的平均 值。
Figure BDA0001575537730000433
表5.24孔发酵中的甜菊醇-19-单糖苷上清液浓度。对亲本菌株STV2049进行六个 重复培养。进行三个独立的STV2049ΔYALI0E25201转化体的重复培养。表5中的数据为取的 平均值。
Figure BDA0001575537730000434
破坏转运体基因的效果对上述甜菊醇糖苷的转运最为显著,且不是甜菊醇糖苷产生总体减少的结果。当在沉淀级分中测量所有甜菊醇糖苷的浓度时(表6),就说明了这一点。此处,可以看出:在YALI0E25201破坏菌株中,转运体破坏菌株的沉淀级分中所有甜菊醇糖苷的浓度增加,指示转运减少。
表6.24孔发酵中的沉淀级分中所有甜菊醇糖苷(莱鲍迪甙A、甜菊苷、莱鲍迪甙B、 莱鲍迪甙D、甜菊醇双糖苷、甜茶苷、甜菊醇-19-单糖苷、甜菊醇-13-单糖苷和莱鲍迪甙M)总 和的浓度。对亲本菌株STV2049进行六个重复培养。进行三个独立的STV2049ΔYALI0E25201 转化体的重复培养。表6中的数据为取的平均值。
Figure BDA0001575537730000441
实施例13.在产生甜菊醇糖苷的Y.lipolytica菌株中过表达YALI0E25201转运体
为了进一步证明YALI0E25201转运体的功能性,将YALI0E25201 ORF与Y.lipolytica YP006启动子和Y.lipolytica TEF4终止子组装在表达盒中。将盒与诺尔丝菌素标记一起组装在pRS4175_3载体中。作为阴性对照,构建仅包含诺尔丝菌素标记的相同盒。PCR扩增表达盒,并将获得的片段转化到三种不同的菌株中:菌株STV2049是主要产生RebA的菌株,如上所述。另外,还包括转运体缺失菌株(STV2049 ΔYALI0E25201(如上所述))。第三种菌株是STV2170,一种主要产生RebM的菌株。STV2170的构建与菌株STV2049相似,基因型列于下表7中。
表7.菌株STV2170的基因型。括号之间表示菌株中存在的基因拷贝数
Figure BDA0001575537730000442
针对菌株和表达盒的每种组合选择六个转化体。使转化体在24孔发酵中生长,并通过LC-MS分析上清液和沉淀级分,如实施例12中所述。
表8.对照菌株(具有NatMX标记的STV2049)和YALI0E25201转运体过表达菌株(具 有转运体和NatMX标记的STV2049)在24孔发酵中的RebA上清液浓度和沉淀浓度
Figure BDA0001575537730000451
这些数据说明:YALI0E25201转运体的过表达对细胞外RebA产生具有正面影响。
表9.对照菌株(具有NatMX标记的STV2049)和YALI0E25201转运体过表达菌株(具 有转运体和NatMX标记的STV2049)在24孔发酵中的RebM上清液浓度和沉淀浓度
Figure BDA0001575537730000452
该菌株中的RebM产生低于RebA产生,但即使如此,就RebM浓度也可以看出转运体过表达的效果。由于在YALI0E25201过表达菌株中RebA被更有效地输出到细胞外,所以细胞内进一步糖基化可用的RebA较少,因此导致RebM产生较低,在沉淀级分中尤为如此。
表10.转运体缺失菌株(具有NatMX标记的STV2049ΔYALI0E25201)和过表达 YALI0E25201转运体的相同背景(具有转运体和NatMX标记的STV2049ΔYALI0E25201)在24 孔发酵中的RebA上清液浓度和沉淀浓度。
Figure BDA0001575537730000453
在YALI0E25201缺失菌株中过表达YALI0E25201转运体后,RebA的细胞外产生大幅提高,并且回复至与没有转运体缺失的参考菌株相似的水平。
表11.转运体缺失菌株(具有NatMX标记的STV2049ΔYALI0E25201)和过表达 YALI0E25201转运体的相同背景(STV2049ΔYALI0E25201YALI0E25201O.E.)在24孔发酵中 的RebM上清液浓度和沉淀浓度。
Figure BDA0001575537730000461
在转运体缺失菌株中,甜菊醇糖苷(包括RebA)在细胞中积累,从而允许在细胞内继续糖基化。因此,RebM浓度可增加。在转运体缺失菌株中,沉淀级分中的RebM浓度远高于上清液中的RebM浓度。回复转运后,这被逆转:更少累积细胞内RebM,且更多输出RebM。
表12.RebM生产对照菌株(具有NatMX标记的STV2170)和YALI0E25201转运体过表 达菌株(具有转运体和NatMX标记的STV2170)在24孔发酵中的RebA上清液浓度和沉淀浓度
Figure BDA0001575537730000462
YALI0E25201转运体的过表达导致RebA的细胞外产生大幅增加,以及沉淀中RebA的积累大幅减少。
表13.RebM产生对照菌株(具有NatMX标记的STV2170)和YALI0E25201转运体过表 达菌株(具有转运体和NatMX标记的STV2170)在24孔发酵中的RebM上清液浓度和沉淀浓度
Figure BDA0001575537730000463
YALI0E25201转运体的过表达导致RebM的细胞外产生增加,以及沉淀中RebM的积累减少。
这些数据共同表明:YALI0E25201转运体的过表达对细胞外RebA和RebM产生具有正面影响。当转运体过表达时,不仅相对于沉淀级分上清液级分中RebA和RebM产生的分布是有利的,而且YALI0E25201转运体的过表达也对RebA和RebM产生的总量具有正面影响。
表14序列表说明
Figure BDA0001575537730000471
序列表
<110> 帝斯曼知识产权资产管理有限公司
<120> 甜菊醇糖苷转运
<130> 31189-WO-PCT
<150> 62/204702
<151> 2015-08-13
<160> 34
<170> PatentIn version 3.5
<210> 1
<211> 1422
<212> DNA
<213> Artificial sequence
<220>
<223> UGT2_1a CpO for Y. lipolitica
<400> 1
atggccacct ccgactccat tgtcgacgac cgaaagcagc tgcacgttgc caccttcccc 60
tggctcgcct ttggccacat tctgccctac ctccagctct ccaagctcat tgctgagaag 120
ggccacaagg tttctttcct gtccaccacc cgaaacatcc agcgactctc ctcccacatc 180
tctcctctca tcaacgttgt ccagctcacc ctcccccgag tccaggagct ccccgaggat 240
gccgaggcca ccactgatgt ccaccccgag gacatcccct acctcaagaa ggcctccgac 300
ggtctgcagc ccgaggtcac ccgattcctc gagcagcact ctcccgactg gatcatctac 360
gactacaccc actactggct cccctccatt gctgcttctc tcggtatctc tcgagcccac 420
ttctccgtca ccaccccctg ggccattgct tacatgggcc cctctgctga cgccatgatc 480
aacggttccg acggccgaac caccgtcgag gatctcacca cccctcccaa gtggttcccc 540
ttccccacca aggtctgctg gcgaaagcac gatctcgccc gactcgtccc ctacaaggcc 600
cccggtatct ccgacggtta ccgaatgggt ctggttctca agggctccga ctgtctgctc 660
tccaagtgct accacgagtt tggtacccag tggctccccc tgctcgagac tctgcaccag 720
gtccccgttg tccccgtcgg tctgctccct cccgagatcc ccggtgacga gaaggacgag 780
acttgggttt ccatcaagaa gtggctcgac ggcaagcaga agggctccgt cgtctacgtt 840
gctctcggct ccgaggttct tgtctcccag actgaggtcg tcgagctcgc cctcggtctg 900
gagctctccg gtctgccctt cgtctgggcc taccgaaagc ccaagggtcc cgccaagtcc 960
gactccgtcg agctccccga cggtttcgtc gagcgaactc gagatcgagg tctggtctgg 1020
acctcttggg ctccccagct ccgaatcctc tcccacgagt ccgtctgcgg tttcctgacc 1080
cactgtggtt ccggctccat tgtcgagggc ctcatgttcg gccaccccct catcatgctg 1140
cccatcttcg gtgaccagcc cctcaacgcc cgactcctcg aggacaagca ggtcggtatc 1200
gagatccccc gaaacgaaga ggacggctgc ctcaccaagg agtctgttgc ccgatctctg 1260
cgatctgttg ttgtcgagaa agagggtgag atctacaagg ccaacgcccg agagctctcc 1320
aagatctaca acgacaccaa ggtcgagaag gagtacgttt cccagtttgt cgactacctc 1380
gagaagaacg cccgagctgt cgccattgac cacgagagtt aa 1422
<210> 2
<211> 803
<212> DNA
<213> Yarrowia lipolytica
<400> 2
taccaaccac agattacgac ccattcgcag tcacagttca ctagggtttg ggttgcatcc 60
gttgagagtg gtttgttttt aaccttctcc atgtgctcac tcaggttttg ggttcagatc 120
aaatcaaggc gtgaaccact gtttgaggac aaatgtgaca caaccaacca gtgtcagggg 180
caagtccgtg acaaagggga agatacaatg caattactga cagttacgga ctgcctcgat 240
gccctaacct tgccccaaaa taagacaact gtcctcgttt aagcgcaacc ctattcagcg 300
tcacgtcata atagcgtttg gatagcacta gtctatgagg agcgttttat gttgcggtga 360
gggcgattgg tgctcatatg ggttcaattg aggtggtgga acgagcttag tcttcaattg 420
aggtgcgagc gacacaattg ggtgtcacgt ggcctaattg acctcggatc gtggagtccc 480
cagttataca gcaaccacga ggtgcatgag taggagacgt caccagacaa tagggttttt 540
ttggactgga gagggtaggg caaaagcgct caacgggctg tttggggagc tatgggggag 600
gaattggcga tatttgtgag gttgacggct ccgatttgcg tgttttgtcg cttctgcatc 660
tccccatacc catatcttcc ctccccacct ctttccacga taattttacg gatcagcaat 720
aaggttcctt ctcctagttt ccacgtccat atatatctat gctgcgtcgt ccttttcgtg 780
acatcaccaa aacacataca aaa 803
<210> 3
<211> 995
<212> DNA
<213> Yarrowia lipolytica
<400> 3
ctgtacctgc tgtggaccac gcacggcgga acgtaccgta caaatatttt cttgctcaca 60
tgactctctc tcggccgcgc acgccggtgg caaattgctc ttgcattggc tctgtctcta 120
gacgtccaaa ccgtccaaag tggcagggtg acgtgatgcg acgcacgaag gagatggccc 180
ggtggcgagg aaccggacac ggcgagccgg cgggaaaaaa ggcggaaaac gaaaagcgaa 240
gggcacaatc tgacggtgcg gctgccacca acccaaggag gctattttgg gtcgctttcc 300
atttcacatt cgccctcaat ggccactttg cggtggtgaa catggtttct gaaacaaccc 360
cccagaatta gagtatattg atgtgtttaa gattgggttg ctatttggcc attgtggggg 420
agggtagcga cgtggaggac attccagggc gaattgagcc tagaaagtgg taccattcca 480
accgtctcag tcgtccgaat tgatcgctat aactatcacc tctctcacat gtctacttcc 540
ccaaccaaca tccccaacct cccccacact aaagttcacg ccaataatgt aggcactctt 600
tctgggtgtg ggacagcaga gcaatacgga ggggagatta cacaacgagc cacaattggg 660
gagatggtag ccatctcact cgacccgtcg acttttggca acgctcaatt acccaccaaa 720
tttgggctgg agttgagggg accgtgttcc agcgctgtag gaccagcaac acacacggta 780
tcaacagcaa ccaacgcccc cgctaatgca cccagtactg cgcaggtgtg ggccaggtgc 840
gttccagatg cgagttggcg aaccctaagc cgacagtgta ctttttggga cgggcagtag 900
caatcgtggg cggagacccc ggtgtatata aaggggtgga gaggacggat tattagcacc 960
aacacacaca cttatactac atgctagcca caaaa 995
<210> 4
<211> 1004
<212> DNA
<213> Yarrowia lipolytica
<400> 4
gtcagaaggg gcagctctaa acgaagaact gcggtcaggt gacacaactt tttccatctc 60
agggtgtgtc gcgtgtgctt catccaaact ttagttgggg ttcgggttcg cgcgagatga 120
tcacgtgccc tgatttggtg tcgtcccccg tcgcgctgcg cacgtgattt atttatttcc 180
ggtggctgct gtctacgcgg ggccttctct gcccttctgt ttcaaccttc gggcggttct 240
cgtaaccagc agtagcaatc catttcgaaa ctcaaagagc taaaaacgtt aaacctcagc 300
agtcgctcga cgaatgggct gcggttggga agcccacgag gcctatagcc agagcctcga 360
gttgacagga gcccagacgc cttttccaac ggcaactttt atataaaatg gcaatgtatt 420
catgcaattg cggccgtgtc aggttggaga cactggacca cactctccat tgcttcctga 480
ggagatggat cattgctagt gcatctacgc gcagcaatcc cgcaagctcg acaaccgtag 540
atgggctttg gtgggccaat caattacgca acccgcacgt taaattgtat gaggaaggaa 600
ggccacggta caaagtgggt ggtcttcacc cagtggttgt tggtggcgtc atgcagacca 660
tgcattgggg atagcacagg gttggggtgt cttgtggact caatgggtga aaggagatgg 720
aaaagggcgg tgaaaagtgg tagaatcgaa atccctgacg tcaatttata aagtaaaatg 780
cgtttctgcc attttgctcc cctccttctt tcgcaatcgc ctccccaaaa gttgtcgtgg 840
cagtacacat gcttgcatac aatgaagcta atccggcttg ctcagtagtt gctatatcca 900
ggcatggtgt gaaacccctc aaagtatata taggagcggt gagccccagt ctggggtctt 960
ttctctccat ctcaaaacta ctttctcaca tgctagccac aaaa 1004
<210> 5
<211> 1422
<212> DNA
<213> Yarrowia lipolytica
<400> 5
atttcttgtg tgtgcggcaa acgtagcaat tgcaactgca taaacgatga ttgtaaaagt 60
atcacacttt gctcagacag gttagattca cctggtacga gggcagtgtc ttaaaggttc 120
catctacctc ggcccttgtt tcttgaagag tggtcaatat gtgttttata cagctgaaat 180
ttcccctgta tgttgagatc gtgtatattg gtcataatct gggctcttta gtcgatccca 240
gttttctcgg gcaagttttt ttctccacaa agtaccgctg gaaaactcta tgtgacttgt 300
tgacagatta cttgggttat ctgcgggata tgtcttggat aggcaaccgg gcatatatca 360
ccgggcggac tgttggttct gtacgtacat acagcacttt gagctcatgt ctcacacgca 420
accatggtgc gtggaggctt tggcatcctt tctacttgta gtggctatag tacttgcagt 480
ccaagcaaac atgagtatgt gcttgtatgt actgaaaccc gtctacggta atattttaga 540
gtgtggaact atgggatgag tgctcattcg atactatgtt gtcacccgat ttgccgtttg 600
cgaggtaaga cacattcggt ggttcaggcg gctacttgta tgtagcatcc acgttcatgt 660
tttgtggatc agattaatgg tatggatatg cacggggcgt ttccccggta acgtgtaggc 720
agtccagtgc aacccagaca gctgagctct ctatagccgt gcgtgtgcgg tcatatcacg 780
ctacacttag ctacagaata aagctcggta gcgccaacag cgttgacaaa tagctcaagg 840
gcgtggagca cagggtttag gaggttttaa tgggcgagaa ggcgcgtaga tgtagtcttc 900
ctcggtccca tcggtaatca cgtgtgtgcc gatttgcaag acgaaaagcc acgagaataa 960
accgggagag gggatggaag tccccgaaca gcaaccagcc cttgccctcg tggacataac 1020
ctttcacttg ccagaactct aagcgtcacc acggtataca agcgcacgta gaagattgtg 1080
gaagtcgtgt tggagactgt tgatttgggc ggtggagggg ggtatttgag agcaagtttg 1140
agatttgtgc cattgagggg gaggttattg tggccatgca gtcggatttg ccgtcacggg 1200
accgcaacat gcttttcatt gcagtccttc aactatccat ctcacctccc ccaatggctt 1260
ttaactttcg aatgacgaaa gcacccccct ttgtacagat gactatttgg gaccaatcca 1320
atagcgcaat tgggtttgca tcatgtataa aaggagcaat cccccactag ttataaagtc 1380
acaagtatct cagtataccc gtctaaccac acatttatca cc 1422
<210> 6
<211> 865
<212> DNA
<213> Yarrowia lipolytica
<400> 6
atgctcactt ttgttgtcct gatgatctcc cgttatttcg ccgctcctct ggaaaccatc 60
cgcccgcaaa tcccctctgc ccatcttgac aatgcacaat gcatcattct cagcctgcat 120
gaatgcgaaa gatggcaata ttggtggagg aggcgacggc ggtaaacaat ggagatagag 180
accacaaaag agacctggag acccaaaatg gactcacgac aactccccca ctcccccact 240
ccccatctcc ccctgggcat cagttgccca tcggtatctc aactgtcgca ctagttagcg 300
caaccatcac atactttaga cgccaaacaa tgggacaact catcgcgccg aactatgggc 360
agattttaac tcgcacaaca ttaccccaac tctaaaaggt aacctcgacc ggaaaacggg 420
aagacaggat cagcaaccgt gatcgacaga atcttcaggg cactacagtt gatagacata 480
ggttatgttg gtaggtctag acgggcctcg gggaattgac cccaccagtt gcaagtcacg 540
tgcccctgat acagctagtt tagcacatct gcccactacg tctggacgca ccatggtggt 600
gccagtcgcg tgaactcaaa cacccactag cctcgggaag gattcagtta aatccgcacc 660
ttatttccaa cacaaagaag cggttggcgg acaaagaaca tgtcctttct ggggcactgt 720
acattccagg actctgttca aggtcaaata tacaaaacac agatagagaa acatagacag 780
ctgcggcctt ataaatacct gggcgcactt ctctcttttt ccctcctcat cacacattcg 840
ttcaccacta agtcactcgt tcaaa 865
<210> 7
<211> 880
<212> DNA
<213> Yarrowia lipolytica
<400> 7
aaacaaaaga gctgaaatca tatccttcag tagtagtata gtcctgttat cacagcatca 60
attacccccg tccaagtaag ttgattggga tttttgttta cagatacagt aatatacttg 120
actatttctt tacaggtgac tcagaaagtg catgttggaa atgagccaca gaccaagaca 180
agatatgaca aaattgcact attcgatgca gaattcgacg gtgtttccat tggtgttatg 240
acattcatct gcattcatac aaaaaagtct tggtagtggt acttttgcgt tattacctcc 300
gatatctacg caccccccaa cccccctgct acagtaaaga gtgtgagtct actgtacatg 360
cttactaaac cacctactgt acagcgaaac ccctcagcaa aatcacacaa tcagctcatt 420
acaacacacc caatgacctc accacaaatt ctatacgcct tttgacgcca ttattacagt 480
agcttgcaac gccgttgtct taggttccat ttttagtgct ctattacctc acttaacccg 540
tataggcaga tcaggccatg gcactaagtg tagagctaga ggttgatatc gccacgagtg 600
ctccatcagg gctagggtgg ggttagaaat acagtccgtg cgcactcaaa aggcgtccgg 660
gttagggcat ccgataatat cgcctggact cggcgccata ttctcgactt ctgggcgcgt 720
tgtattcatc tcctccgctt cccaacactt ccacccgttt ctccatccca accaatagaa 780
tagggtaacc ttattcggga cactttcgtc atacatagtc agatatacaa gcaatgtcac 840
tctccttcgt actcgtacat acaacacaac tacattcaaa 880
<210> 8
<211> 1000
<212> DNA
<213> Yarrowia lipolytica
<400> 8
caattcatgt atcgtgtcaa ttcatgtatc gtgtcaattc atgtatcgtg tcaatactta 60
tatctcaagt ggttgcatcg caaacagcca tcgcatactc cactctactc tcactgagtt 120
cactcttacc cggctccacc ttctagaagc caccaccgat ccaccgacga tgatcagtcc 180
accacttgct ctgaatgtgc gttggagctg caccatgatt gatgacgtca ccgccattca 240
gatagggcaa aagacgagcg ccaatcgcaa caatgggcga gtgtcgacga ctcccccgct 300
ctctgcggtt tcagcgactc caaccgtcgc caaaagaccg tcattttcgt ctaaagcgca 360
gcccagccca tctcttctaa aagattccag aaagataggg ttcaccaact acgcaccaat 420
atgtacagta tcgtagctac tccggcttgg ctgatctgag agatagagat ggctccgaaa 480
cgcggaaaac ggcggggtcg gaccgatcac gtgacacgta ctcatccgtc gcgccccgag 540
cgccatttca acaccaaata ctcccggtca cgtgccaccc cgcccgctct acccacgaga 600
tgtttctaca ctatacactg ccacgccgtc atacctgcag ctaggttaac attcgattaa 660
ttagtggagt caccagtgta caggactatg gcggaaaccg ggttacacaa accggcccgg 720
aatagcagca ttataccgct ggacgagatc accgtcaata aattgcgtcg ttactcggga 780
caaccattgc tcctccggct acacctgctc aaaggacttg ttccacactc ttccccagct 840
ctcccacgca aacaaagaga gcaaccttaa gtggacagct catgagcact cccctcgttt 900
gctgcccacg ctcgattata taaagaccag cggatcccct tctatttgga cttgcatcaa 960
ccaaccacaa cccacaccaa gcacacaaag cacaagaaca 1000
<210> 9
<211> 127
<212> DNA
<213> Yarrowia lipolytica
<400> 9
aattaacaga tagtttgccg gtgataattc tcttaacctc ccacactcct ttgacataac 60
gatttatgta acgaaactga aatttgacca gatattgttg taaatagaaa atctggcttg 120
taggtgg 127
<210> 10
<211> 200
<212> DNA
<213> Yarrowia lipolytica
<400> 10
gttttttgat caatgatcca atggctttca catacccccc cacgcctata attaaaacac 60
agagaaatat aatctaactt aataaatatt acggagaatc tttcgagtgt tcagcagaaa 120
tatagccatt gtaacaaaag ccggctatcg accgctttat cgaagaatat ttcccgcccc 180
ccagtggcca aacgatatcg 200
<210> 11
<211> 200
<212> DNA
<213> Yarrowia lipolytica
<400> 11
ctatccgaag atcaagagcg aagcaagttg taagtccagg acatgtttcc cgcccacgcg 60
agtgatttat aacacctctc ttttttgaca cccgctcgcc ttgaaattca tgtcacataa 120
attatagtca acgacgtttg aataacttgt cttgtagttc gatgatgatc atatgattac 180
attaatagta attactgtat 200
<210> 12
<211> 200
<212> DNA
<213> Yarrowia lipolytica
<400> 12
acttcgagct aatccagtag cttacgttac ccaggggcag gtcaactggc tagccacgag 60
tctgtcccag gtcgcaattt agtgtaataa acaatatata tattgagtct aaagggaatt 120
gtagctattg tgattgtgtg attttcgtct tgctggttct tattgtgtcc cattcgtttc 180
atcctgatga ggacccctgg 200
<210> 13
<211> 200
<212> DNA
<213> Yarrowia lipolytica
<400> 13
gctatttaca gcatgtgtaa tgaggaatat aacgttgatt gaattgtttg tgaaaaatgt 60
agaaaatttc agtgaagttg tgttttctat atagtaagca cttttggtac aagtatctgc 120
acatccctgc atgttacaag cctgatcatg cagggcaata ttctgactat aaatatacct 180
cgatatttta gcaagctata 200
<210> 14
<211> 300
<212> DNA
<213> Yarrowia lipolytica
<400> 14
atgtggtgat tgctgttgtg caagcctttg ctcgttttct gctgtatgta atttaaagaa 60
cgattgtatg aatcgaagtc aaggtgagtg tagtttgaga agtgtaaccc cagtgtcata 120
gctgtgtact ccattcattg aagggtgtag tcgtgtttta ttgcatgagc gcctattact 180
cgtataagta actgttttgt aacacttcat gaacggagat ggtatgaaca gaagtaataa 240
tatcctggaa gtcagctgtg cccagaggtg tgtgtgggtg tggcatactt tgggacaaca 300
<210> 15
<211> 1503
<212> DNA
<213> Artificial sequence
<220>
<223> tHMG CpO for Yarrowia lipolitica
<400> 15
atgacccagt ctgtgaaggt ggttgagaag cacgttccta tcgtcattga gaagcccagc 60
gagaaggagg aggacacctc ttctgaagac tccattgagc tgactgtcgg aaagcagccc 120
aagcccgtga ccgagacccg ttctctggac gacttggagg ctatcatgaa ggcaggtaag 180
accaagctcc tggaggacca cgaggttgtc aagctctctc tcgaaggcaa gctccctttg 240
tatgctcttg agaagcagct tggtgacaac acccgagctg ttggcatccg acgatctatc 300
atctcccagc agtctaatac caagactctt gagacctcaa agctccctta cctgcactac 360
gactacgacc gtgtttttgg agcctgttgc gagaacgtta ttggttacat gcctctcccc 420
gttggtgttg ctggccccat gaacattgat ggcaagaact accacattcc tatggccacc 480
actgagggtt gtcttgttgc ctcaaccatg cgaggttgca aggccatcaa cgccggtggc 540
ggtgttacca ctgtgcttac tcaggacggt atgacacgag gtccttgtgt ttccttcccc 600
tctctcaagc gggctggagc cgctaagatc tggcttgatt ccgaggaggg tctcaagtcc 660
atgcgaaagg ccttcaactc cacctctcga tttgctcgtc tccagtctct tcactctacc 720
cttgctggta acctgctgtt tattcgattc cgaaccacca ctggtgatgc catgggcatg 780
aacatgatct ccaagggcgt cgaacactct ctggccgtca tggtcaagga gtacggcttc 840
cctgatatgg acattgtgtc tgtctcgggt aactactgca ctgacaagaa gcccgcagcg 900
atcaactgga tcgaaggccg aggcaagagt gttgttgccg aagccaccat ccctgctcac 960
attgtcaagt ctgttctcaa aagtgaggtt gacgctcttg ttgagctcaa catcagcaag 1020
aatctgatcg gtagtgccat ggctggctct gtgggaggtt tcaatgcaca cgccgcaaac 1080
ctggtgaccg ccatctacct tgccactggc caggatcctg ctcagaatgt cgagtcttcc 1140
aactgcatca cgctgatgag caacgtcgac ggtaacctgc tcatctccgt ttccatgcct 1200
tctatcgagg tcggtaccat tggtggaggt actattttgg agccccaggg tgctatgctg 1260
gagatgcttg gcgtgcgagg tcctcacatc gagacccccg gtgccaacgc ccaacagctt 1320
gctcgcatca ttgcttctgg agttcttgca gcggagcttt cgctgtgttc tgctcttgct 1380
gccggccatc ttgtgcaaag tcatatgacc cacaaccgtt cccaggctcc tactccggcc 1440
aagcagtctc aggccgatct gcagcgtctc caaaacggtt cgaatatctg cattcggtca 1500
tag 1503
<210> 16
<211> 984
<212> DNA
<213> Artificial sequence
<220>
<223> GGS CpO for Yarrowia lipolitica
<400> 16
atggattata acagcgcgga tttcaaggag atctggggca aggccgccga caccgcgctg 60
ctgggaccgt acaactacct cgccaacaac cggggccaca acatcagaga acacttgatc 120
gcagcgttcg gagcggttat caaggtggac aagagcgatc tcgaaaccat ttcgcacatc 180
accaagattt tgcataactc gtcgctgctt gttgatgacg tggaagacaa ctcgatgctc 240
cgacgaggcc tgccggcagc ccattgtctg tttggagtcc cccaaaccat caactccgcc 300
aactacatgt actttgtggc tctgcaggag gtgctcaagc tcaagtctta tgatgccgtc 360
tccattttca ccgaggaaat gatcaacttg catagaggtc agggtatgga tctctactgg 420
agagaaacac tcacttgccc ctcggaagac gagtatctgg agatggtggt gcacaagacc 480
ggaggactgt ttcggctggc tctgagactt atgctgtcgg tggcatcgaa acaggaggac 540
catgaaaaga tcaactttga tctcacacac cttaccgaca cactgggagt catttaccag 600
attctggatg attacctcaa cctgcagtcc acggaattga ccgagaacaa gggattctgc 660
gaagatatca gcgaaggaaa gttttcgttt ccgctgattc acagcatccg gaccaacccg 720
gataaccacg agattctcaa cattctcaaa cagcgaacaa gcgacgcttc actcaaaaag 780
tacgccgtgg actacatgag aacagaaacc aagagtttcg actactgcct caagagaatc 840
caggccatgt cactcaaggc aagttcgtac attgatgatc tcgcagcagc cggccacgat 900
gtctccaagt tgcgagccat tttgcattat tttgtgtcca cctctgactg tgaggagaga 960
aagtactttg aggatgcgca gtga 984
<210> 17
<211> 1446
<212> DNA
<213> Artificial sequence
<220>
<223> UGT1 CpO for Yarrowia lipolitica
<400> 17
atggacgcca tggccaccac cgagaagaag ccccacgtca tcttcatccc cttccccgcc 60
cagtcccaca tcaaggccat gctcaagctc gcccagctcc tccaccacaa gggcctccag 120
atcacctttg tcaacaccga cttcatccac aaccagttcc tcgagtcctc cggcccccac 180
tgtctggacg gtgctcccgg tttccgattt gagactatcc ccgatggtgt ctcccactcc 240
cccgaggcct ccatccccat ccgagagtct ctgctccgat ccattgagac taacttcctc 300
gaccgattca ttgatctcgt caccaagctc cccgatcctc ccacctgtat catctccgac 360
ggtttcctgt ccgttttcac cattgatgct gccaagaagc tcggtatccc cgtcatgatg 420
tactggactc tggctgcctg tggtttcatg ggtttctacc acatccactc tctgatcgag 480
aagggctttg ctcctctcaa ggacgcctcc tacctcacca acggttacct cgacaccgtc 540
attgactggg tccccggtat ggagggtatc cgactcaagg acttccccct cgactggtcc 600
accgacctca acgacaaggt tctcatgttc accaccgagg ctccccagcg atcccacaag 660
gtttcccacc acatcttcca caccttcgac gagctcgagc cctccatcat caagactctg 720
tctctgcgat acaaccacat ctacaccatt ggccccctcc agctcctcct cgaccagatc 780
cccgaggaga agaagcagac cggtatcacc tctctgcacg gctactctct cgtcaaggaa 840
gagcccgagt gcttccagtg gctccagtcc aaggagccca actccgttgt ctacgtcaac 900
tttggctcca ccaccgtcat gtctctcgag gacatgaccg agtttggctg gggtctggcc 960
aactccaacc actacttcct gtggatcatc cgatccaacc tcgtcattgg cgagaacgcc 1020
gttctgcctc ccgagctcga ggagcacatc aagaagcgag gcttcattgc ctcttggtgc 1080
tcccaggaga aggttctcaa gcacccctcc gtcggtggtt tcctgaccca ctgcggctgg 1140
ggctccacca ttgagtctct gtccgctggt gtccccatga tctgctggcc ctactcctgg 1200
gaccagctca ccaactgccg atacatctgc aaggagtggg aggttggtct ggagatgggt 1260
accaaggtca agcgagatga ggtcaagcga ctcgtccagg agctcatggg cgagggtggt 1320
cacaagatgc gaaacaaggc caaggactgg aaggagaagg cccgaattgc cattgccccc 1380
aacggctctt cttctctcaa cattgacaag atggtcaagg agatcactgt tctcgctcga 1440
aactaa 1446
<210> 18
<211> 1383
<212> DNA
<213> Artificial sequence
<220>
<223> UGT3 CpO for Yarrowia lipolitica
<400> 18
atggccgagc agcagaagat caagaagtct ccccacgttc tgctcatccc cttccctctg 60
cagggccaca tcaacccctt catccagttc ggcaagcgac tcatctccaa gggtgtcaag 120
accactctgg tcaccaccat ccacaccctc aactccactc tcaaccactc caacaccacc 180
accacctcca tcgagatcca ggccatctcc gacggctgtg acgagggtgg tttcatgtct 240
gctggtgagt cttacctcga gactttcaag caggtcggtt ccaagtctct ggctgacctc 300
atcaagaagc tccagtccga gggtaccacc attgacgcca tcatctacga ctccatgacc 360
gagtgggttc tcgatgtcgc catcgagttt ggtattgacg gtggctcctt cttcacccag 420
gcctgtgtcg tcaactctct ctactaccac gtccacaagg gtctgatctc tctgcccctc 480
ggcgagactg tctccgtccc cggtttcccc gttctgcagc gatgggagac tcctctcatt 540
ctccagaacc acgagcagat ccagtccccc tggtcccaga tgctcttcgg ccagttcgcc 600
aacattgacc aggcccgatg ggttttcacc aactccttct acaagctcga ggaagaggtc 660
attgagtgga cccgaaagat ctggaacctc aaggtcattg gccccaccct cccctccatg 720
tacctcgaca agcgactcga tgacgacaag gacaacggtt tcaacctcta caaggccaac 780
caccacgagt gcatgaactg gctcgacgac aagcccaagg agtccgttgt ctacgttgcc 840
tttggctctc tggtcaagca cggccccgag caggttgagg agatcacccg agctctgatt 900
gactccgatg tcaacttcct gtgggtcatc aagcacaagg aagagggtaa gctccccgag 960
aacctgtccg aggtcatcaa gaccggcaag ggcctcattg ttgcctggtg caagcagctc 1020
gacgttctcg cccacgagtc cgtcggctgc tttgtcaccc actgcggttt caactccacc 1080
ctcgaggcta tctctctcgg tgtccccgtt gttgccatgc cccagttctc cgaccagacc 1140
accaacgcca agctcctcga tgagattctc ggtgtcggtg tccgagtcaa ggctgacgag 1200
aacggtattg tccgacgagg taacctggct tcttgtatca agatgatcat ggaggaagag 1260
cgaggtgtca tcatccgaaa gaacgccgtc aagtggaagg atctggccaa ggttgctgtc 1320
cacgagggtg gctcttccga caacgacatt gtcgagtttg tctccgagct catcaaggcc 1380
taa 1383
<210> 19
<211> 1377
<212> DNA
<213> Artificial sequence
<220>
<223> UGT4 CpO for Yarrowia lipolitica
<400> 19
atggagaaca agaccgagac taccgtccga cgacgacgac gaatcattct cttccccgtc 60
cccttccagg gccacatcaa ccccattctg cagctcgcca acgttctgta ctccaagggc 120
ttctccatca ccatcttcca caccaacttc aacaagccca agacctccaa ctacccccac 180
ttcactttcc gattcatcct cgacaacgac ccccaggacg agcgaatctc caacctgccc 240
acccacggtc ctctggctgg tatgcgaatc cccatcatca acgagcacgg tgctgacgag 300
ctccgacgag agctcgagct gctcatgctc gcctccgaag aggacgagga agtctcctgt 360
ctgatcaccg atgctctgtg gtactttgcc cagtccgtcg ccgactctct caacctgcga 420
cgactcgttc tcatgacctc ctctctgttc aacttccacg cccacgtttc tctgccccag 480
tttgacgagc tcggttacct cgaccccgat gacaagaccc gactcgagga gcaggcttcc 540
ggtttcccca tgctcaaggt caaggacatc aagtccgcct actccaactg gcagattctc 600
aaggagattc tcggcaagat gatcaagcag accaaggcct cctccggtgt catctggaac 660
tccttcaagg agctcgagga gtccgagctc gagactgtca tccgagagat ccccgctccc 720
tctttcctca tccccctgcc caagcacctc accgcttcct cctcttctct gctcgaccac 780
gaccgaaccg tctttcagtg gctcgaccag cagccccctt cctccgtcct ctacgtttcc 840
ttcggctcca cctccgaggt cgacgagaag gacttcctcg agattgctcg aggcctcgtt 900
gactccaagc agtccttcct gtgggttgtc cgacccggct ttgtcaaggg ctccacctgg 960
gttgagcccc tgcccgatgg tttcctcggt gagcgaggcc gaattgtcaa gtgggtcccc 1020
cagcaggaag ttctggccca cggtgccatt ggtgccttct ggacccactc cggctggaac 1080
tccactctcg agtccgtctg cgagggtgtc cccatgatct tctccgactt tggcctcgac 1140
cagcccctca acgcccgata catgtccgat gttctcaagg tcggtgtcta cctcgagaac 1200
ggctgggagc gaggtgagat tgccaacgcc atccgacgag tcatggtcga cgaggaaggt 1260
gagtacatcc gacagaacgc ccgagtcctc aagcagaagg ccgatgtctc tctcatgaag 1320
ggtggttctt cttacgagtc tctcgagtct ctcgtttcct acatctcttc tttgtaa 1377
<210> 20
<211> 2232
<212> DNA
<213> Artificial sequence
<220>
<223> tCPS_SR CpO for Yarrowia lipolitica
<400> 20
atgtgcaagg ctgtttccaa ggagtactcc gatctgctcc agaaggacga ggcctctttc 60
accaagtggg acgacgacaa ggtcaaggac cacctcgaca ccaacaagaa cctctacccc 120
aacgacgaga tcaaggagtt tgtcgagtcc gtcaaggcca tgttcggctc catgaacgac 180
ggcgagatta atgtctctgc ttacgacacc gcctgggttg ctctggtcca ggatgtcgac 240
ggttccggct ctcctcagtt cccttcctct ctcgagtgga tcgccaacaa ccagctgtcc 300
gacggttctt ggggtgacca cctgctcttc tctgctcacg accgaatcat caacaccctg 360
gcctgtgtca ttgctctgac ctcttggaac gtccacccct ccaagtgcga gaagggtctg 420
aacttcctcc gagagaacat ctgcaagctc gaggacgaga acgccgagca catgcccatt 480
ggcttcgagg tcaccttccc ctctctgatt gacattgcca agaagctcaa cattgaggtc 540
cccgaggaca cccccgctct caaggagatc tacgctcgac gagacatcaa gctcaccaag 600
atccccatgg aggttctcca caaggtcccc accactctcc tccactctct cgagggtatg 660
cccgatctcg agtgggagaa gctgctcaag ctgcagtgca aggacggctc tttcctcttc 720
tccccctctt ccactgcctt cgccctcatg cagaccaagg acgagaagtg tctccagtac 780
ctcaccaaca ttgtcaccaa gttcaacggt ggtgtcccca acgtctaccc cgttgacctc 840
tttgagcaca tctgggttgt tgaccgactc cagcgactcg gtatcgcccg atacttcaag 900
tccgagatca aggactgtgt cgagtacatc aacaagtact ggaccaagaa cggtatctgc 960
tgggcccgaa acacccacgt ccaggacatt gacgacaccg ccatgggctt ccgagttctg 1020
cgagcccacg gctacgatgt cacccccgat gtctttcgac agtttgagaa ggacggcaag 1080
tttgtctgtt tcgccggtca gtccacccag gccgtcaccg gtatgttcaa cgtctaccga 1140
gcttctcaga tgctcttccc cggtgagcga atcctcgagg acgccaagaa gttctcctac 1200
aactacctca aggagaagca gtccaccaac gagctgctcg acaagtggat cattgccaag 1260
gatctgcccg gtgaggttgg ctacgccctc gacatcccct ggtacgcctc tctgccccga 1320
ctggagactc gatactacct cgagcagtac ggtggtgagg acgatgtctg gatcggtaag 1380
accctgtacc gaatgggcta cgtttccaac aacacctacc tcgagatggc caagctcgac 1440
tacaacaact acgttgccgt cctccagctc gagtggtaca ccatccagca gtggtacgtc 1500
gacattggta tcgagaagtt cgagtccgac aacatcaagt ccgtccttgt ctcctactac 1560
ctcgctgctg cctccatctt cgagcccgag cgatccaagg agcgaattgc ctgggccaag 1620
accaccatcc tcgtcgacaa gatcacctcc atcttcgact cctcccagtc ctccaaggaa 1680
gatatcaccg ccttcattga caagttccga aacaagtcct cctccaagaa gcactccatc 1740
aacggcgagc cctggcacga ggtcatggtt gctctcaaga aaactctcca cggctttgcc 1800
ctcgacgctc tgatgaccca ctctcaggac atccaccccc agctccacca ggcctgggag 1860
atgtggctca ccaagctcca ggacggtgtt gatgtcactg ctgagctcat ggtccagatg 1920
atcaacatga ccgccggccg atgggtttcc aaggagctcc tcacccaccc ccagtaccag 1980
cgactctcca ctgtcaccaa ctctgtctgc cacgacatca ccaagctcca caacttcaag 2040
gagaactcca ccaccgtcga ctccaaggtc caggagctgg tccagctcgt tttctccgac 2100
acccccgatg atctcgacca ggacatgaag cagaccttcc tgactgtcat gaaaactttc 2160
tactacaagg cctggtgcga ccccaacacc atcaacgacc acatctccaa ggtctttgag 2220
attgtgattt aa 2232
<210> 21
<211> 2274
<212> DNA
<213> Artificial sequence
<220>
<223> tKS-SR CpO for Yarrowia lipolitica
<400> 21
atgacctccc acggcggcca gaccaacccc accaacctca tcattgacac caccaaggag 60
cgaatccaga agcagttcaa gaacgtcgag atctccgttt cctcctacga caccgcctgg 120
gtcgccatgg tcccctctcc caactccccc aagtctccct gcttccccga gtgtctcaac 180
tggctcatca acaaccagct caacgacggc tcttggggtc tggtcaacca cacccacaac 240
cacaaccacc ccctcctcaa ggactctctc tcttccactc tcgcctgcat tgttgctctc 300
aagcgatgga acgttggcga ggaccagatc aacaagggtc tgtctttcat tgagtccaac 360
ctcgcctccg ccaccgagaa gtcccagccc tcccccattg gctttgatat catcttcccc 420
ggtctgctcg agtacgccaa gaacctcgat atcaacctgc tctccaagca gaccgacttc 480
tctctcatgc tgcacaagcg agagctcgag cagaagcgat gccactccaa cgagatggac 540
ggctacctgg cctacatttc cgagggtctg ggtaacctct acgactggaa catggtcaag 600
aagtaccaga tgaagaacgg ttccgttttc aactccccct ctgccaccgc tgctgccttc 660
atcaaccacc agaaccccgg ctgtctcaac tacctcaact ctctgctcga caagtttggt 720
aacgccgtcc ccactgtcta cccccacgat ctcttcatcc gactctccat ggtcgacacc 780
attgagcgac tcggtatttc ccaccacttc cgagtcgaga tcaagaacgt tctcgatgag 840
acttaccgat gctgggttga gcgagatgag cagatcttca tggacgttgt cacctgtgct 900
ctggccttcc gactcctccg aatcaacggt tacgaggttt cccccgaccc cctcgccgag 960
atcaccaacg agctggctct caaggacgag tacgccgccc tcgagactta ccacgcttct 1020
cacattctgt accaagagga tctgtcctcc ggcaagcaga ttctcaagtc cgccgacttc 1080
ctcaaggaga tcatctccac tgactccaac cgactctcca agctcatcca caaggaagtc 1140
gagaacgctc tcaagttccc catcaacacc ggtctggagc gaatcaacac ccgacgaaac 1200
atccagctct acaacgtcga caacacccga attctcaaga ccacctacca ctcttccaac 1260
atctccaaca ccgactacct gcgactcgcc gtcgaggact tctacacctg ccagtccatc 1320
taccgagagg agctcaaggg tctggagcga tgggttgtcg agaacaagct cgaccagctc 1380
aagtttgccc gacaaaagac tgcctactgc tacttctccg ttgctgccac cctctcttct 1440
cccgagctct ccgacgcccg aatctcttgg gccaagaacg gtatcctgac cactgttgtc 1500
gacgacttct ttgacattgg tggcaccatt gacgagctga ccaacctcat ccagtgcgtc 1560
gagaagtgga acgtcgacgt tgacaaggac tgttgttccg agcacgtccg aatcctcttc 1620
ctggctctca aggacgccat ctgctggatc ggtgacgagg ccttcaagtg gcaggctcga 1680
gatgtcactt cccacgtcat ccagacctgg ctcgagctca tgaactccat gctgcgagag 1740
gccatctgga cccgagatgc ctacgtcccc accctcaacg agtacatgga gaacgcctac 1800
gtcagctttg ctctcggtcc cattgtcaag cccgccatct actttgtcgg tcccaagctg 1860
tccgaggaga ttgtcgagtc ctccgagtac cacaacctct tcaagctcat gtccacccag 1920
ggccgactcc tcaacgatat ccactccttc aagcgagagt tcaaggaagg taagctcaac 1980
gccgttgctc tgcacctgtc caacggtgag tccggcaagg tcgaggaaga ggtcgtcgag 2040
gagatgatga tgatgatcaa gaacaagcga aaggagctca tgaagctcat cttcgaggag 2100
aacggctcca ttgtcccccg agcctgcaag gacgccttct ggaacatgtg ccacgtcctc 2160
aacttcttct acgccaacga cgacggtttc accggcaaca ccattctcga caccgtcaag 2220
gacatcatct acaaccctct ggttctggtc aacgagaacg aggagcagag gtaa 2274
<210> 22
<211> 1578
<212> DNA
<213> Artificial sequence
<220>
<223> KAH_4 CpO for Yarrowia lipolitica
<400> 22
atggagtctc tggttgtcca caccgtcaac gccatctggt gcattgtcat tgtcggtatc 60
ttctccgtcg gctaccacgt ctacggccga gctgttgtcg agcagtggcg aatgcgacga 120
tctctcaagc tccagggtgt caagggtcct cctccctcca tcttcaacgg taacgtttcc 180
gagatgcagc gaatccagtc cgaggccaag cactgctccg gtgacaacat catctcccac 240
gactactctt cttctctgtt cccccacttt gaccactggc gaaagcagta cggccgaatc 300
tacacctact ccactggcct caagcagcac ctctacatca accaccccga gatggtcaag 360
gagctctccc agaccaacac cctcaacctc ggccgaatca cccacatcac caagcgactc 420
aaccccattc tcggtaacgg tatcatcacc tccaacggcc cccactgggc ccaccagcga 480
cgaatcattg cctacgagtt cacccacgac aagatcaagg gtatggtcgg tctgatggtc 540
gagtccgcca tgcccatgct caacaagtgg gaggagatgg tcaagcgagg tggtgagatg 600
ggctgtgaca tccgagtcga cgaggacctc aaggatgtct ccgctgacgt cattgccaag 660
gcctgtttcg gctcttcctt ctccaagggc aaggccatct tctccatgat ccgagatctg 720
ctcaccgcca tcaccaagcg atccgtcctc ttccgattca acggtttcac cgacatggtt 780
ttcggctcca agaagcacgg tgacgttgac attgacgctc tcgagatgga gctcgagtcc 840
tccatctggg agactgtcaa ggagcgagag attgagtgca aggacaccca caagaaggac 900
ctcatgcagc tcattctcga gggtgccatg cgatcttgtg acggtaacct gtgggacaag 960
tctgcttacc gacgattcgt tgtcgacaac tgcaagtcca tctactttgc cggccacgac 1020
tccaccgccg tttccgtttc ttggtgcctc atgctgctcg ctctcaaccc ctcttggcag 1080
gtcaagatcc gagatgagat tctgtcctcc tgcaagaacg gtatccccga cgccgagtcc 1140
atccccaacc tcaagaccgt caccatggtc atccaggaga ctatgcgact ctaccctccc 1200
gctcccattg tcggccgaga ggcctccaag gacattcgac tcggtgatct ggttgtcccc 1260
aagggtgtct gtatctggac cctcatcccc gctctgcacc gagatcccga gatctggggt 1320
cccgacgcca acgacttcaa gcccgagcga ttctccgagg gtatctccaa ggcctgcaag 1380
tacccccagt cctacatccc ctttggcctc ggcccccgaa cctgtgtcgg caagaacttt 1440
ggtatgatgg aggtcaaggt cctcgtttct ctgattgtct ccaagttctc cttcactctg 1500
tctcccacct accagcactc tccctcccac aagctgctcg tcgagcccca gcacggtgtt 1560
gtcatccgag ttgtataa 1578
<210> 23
<211> 1578
<212> DNA
<213> Artificial sequence
<220>
<223> KO_Gib CpO for Yarrowia lipolitica
<400> 23
atgtccaagt ccaactccat gaactccacc tcccacgaga ctctcttcca gcagctcgtt 60
ctcggcctcg accgaatgcc cctcatggac gtccactggc tcatctacgt tgcctttggt 120
gcctggctct gctcctacgt catccacgtt ctgtcctctt cctccactgt caaggtcccc 180
gtcgtcggtt accgatccgt tttcgagccc acctggctcc tccgactgcg attcgtctgg 240
gagggtggtt ccatcattgg ccagggctac aacaagttca aggactccat cttccaggtc 300
cgaaagctcg gtaccgacat tgtcatcatc cctcccaact acattgacga ggtccgaaag 360
ctctcccagg acaagacccg atccgtcgag cccttcatca acgactttgc cggccagtac 420
acccgaggta tggtctttct gcagtccgat ctccagaacc gagtcatcca gcagcgactc 480
acccccaagc ttgtctctct caccaaggtc atgaaggaag agctcgacta cgctctgacc 540
aaggagatgc ccgacatgaa gaacgacgag tgggttgagg tcgacatctc ttccatcatg 600
gtccgactca tctctcgaat ctccgcccga gttttcctcg gccccgagca ctgccgaaac 660
caggagtggc tcaccaccac cgccgagtac tccgagtctc tcttcatcac cggcttcatc 720
ctccgagttg tcccccacat tctccgaccc ttcattgctc ctctgctgcc ctcttaccga 780
accctgctgc gaaacgtttc ttccggccga cgagtcattg gtgatatcat ccgatcccag 840
cagggtgacg gtaacgagga catcctctct tggatgcgag atgctgccac tggtgaggag 900
aagcagatcg acaacattgc ccagcgaatg ctcattctgt ctctcgcctc catccacacc 960
accgccatga ccatgaccca cgccatgtac gatctgtgtg cctgccccga gtacattgag 1020
cccctccgag atgaggtcaa gtccgtcgtt ggtgcttctg gctgggacaa gaccgctctc 1080
aaccgattcc acaagctcga ctctttcctc aaggagtccc agcgattcaa ccccgttttc 1140
ctgctcacct tcaaccgaat ctaccaccag tccatgaccc tctccgatgg taccaacatc 1200
ccctccggta cccgaattgc tgtcccctct cacgccatgc tccaggactc cgcccacgtc 1260
cccggtccca ctcctcccac tgagttcgac ggtttccgat actccaagat ccgatccgac 1320
tccaactacg cccagaagta cctcttctcc atgaccgact cttccaacat ggcctttggc 1380
tacggtaagt acgcctgccc cggccgattc tacgcctcca acgagatgaa gctgactctg 1440
gccattctgc tcctccagtt tgagttcaag ctccccgacg gtaagggccg accccgaaac 1500
atcaccatcg actccgacat gatccccgac ccccgagctc gactctgtgt ccgaaagcga 1560
tctctgcgtg acgagtaa 1578
<210> 24
<211> 2133
<212> DNA
<213> Artificial sequence
<220>
<223> CPR_3 CpO for Yarrowia lipolitica
<400> 24
atgtcctcct cttcttcttc ttccacctcc atgattgatc tcatggctgc catcatcaag 60
ggtgagcccg tcattgtctc cgaccccgcc aacgcctccg cctacgagtc cgttgctgcc 120
gagctgtcct ccatgctcat cgagaaccga cagtttgcca tgatcgtcac cacctccatt 180
gctgttctca ttggctgcat tgtcatgctc gtctggcgac gatctggctc cggtaactcc 240
aagcgagtcg agcccctcaa gcccctggtc atcaagcccc gagaagagga gatcgacgac 300
ggccgaaaga aggtcaccat cttctttggc acccagaccg gtactgctga gggcttcgcc 360
aaggctctcg gtgaggaagc caaggctcga tacgaaaaga cccgattcaa gattgtcgac 420
ctcgatgatt acgctgccga tgacgacgag tacgaggaga agctcaagaa agaggacgtt 480
gccttcttct tcctcgccac ctacggtgac ggtgagccca ccgacaacgc tgcccgattc 540
tacaagtggt tcaccgaggg taacgaccga ggcgagtggc tcaagaacct caagtacggt 600
gttttcggtc tgggcaaccg acagtacgag cacttcaaca aggttgccaa ggttgtcgac 660
gacatcctcg tcgagcaggg tgcccagcga ctcgtccagg tcggcctcgg tgatgatgac 720
cagtgcatcg aggacgactt cactgcctgg cgagaggctc tgtggcccga gctcgacacc 780
attctgcgag aggaaggtga caccgccgtt gccaccccct acaccgccgc cgtcctcgag 840
taccgagtct ccatccacga ctccgaggat gccaagttca acgacatcaa catggccaac 900
ggtaacggct acaccgtctt tgacgcccag cacccctaca aggccaacgt cgccgtcaag 960
cgagagctcc acacccccga gtccgaccga tcttgtatcc acctcgagtt tgacattgct 1020
ggttccggtc tgacctacga gactggtgac cacgttggtg tcctctgtga caacctgtcc 1080
gagactgtcg acgaggctct gcgactcctc gacatgtccc ccgacactta cttctctctg 1140
cacgccgaga aagaggacgg tactcccatc tcttcttctc tgccccctcc cttccctccc 1200
tgcaacctgc gaaccgctct gacccgatac gcctgcctcc tctcttctcc caagaagtct 1260
gctctcgttg ctctggccgc ccacgcctcc gaccccaccg aggctgagcg actcaagcac 1320
ctcgcctctc ccgctggcaa ggacgagtac tccaagtggg ttgtcgagtc ccagcgatct 1380
ctgctcgagg tcatggccga gttcccctcc gccaagcccc ctctcggtgt tttcttcgcc 1440
ggtgttgctc cccgactcca gccccgattc tactccatct cctcttcccc caagatcgcc 1500
gagactcgaa tccacgttac ctgtgctctg gtctacgaga agatgcccac cggccgaatc 1560
cacaagggtg tctgctccac ctggatgaag aacgccgttc cctacgagaa gtccgagaac 1620
tgttcctctg ctcccatctt tgtccgacag tccaacttca agctcccctc cgactccaag 1680
gtccccatca tcatgattgg ccccggtacc ggcctcgccc ccttccgagg cttcctgcag 1740
gagcgactcg ccctcgtcga gtccggtgtc gagctcggcc cctccgtcct cttctttggc 1800
tgccgaaacc gacgaatgga cttcatctac gaagaggagc tccagcgatt cgtcgagtcc 1860
ggtgctctcg ccgagctctc cgttgccttc tcccgagagg gtcccaccaa ggagtacgtc 1920
cagcacaaga tgatggacaa ggcctccgac atctggaaca tgatctccca gggcgcctac 1980
ctctacgtct gcggtgacgc caagggtatg gcccgagatg tccaccgatc tctgcacacc 2040
attgcccagg agcagggctc catggactcc accaaggccg agggtttcgt caagaacctc 2100
cagacctccg gccgatacct ccgagatgtc tgg 2133
<210> 25
<211> 1419
<212> DNA
<213> Artificial sequence
<220>
<223> UGT2_10b CpO for Y. lipolitica
<400> 25
atggccacct ccgactccat tgttgacgac cgaaagaagc tccacattgt catgttcccc 60
tggctcgcct ttggccacat catcccctat ctcgagcttt ccaagctcat tgcccagaag 120
ggccacaagg tttccttcct ctccaccacc aagaacattg accgactctc ctcccacatc 180
tctcccctca tcaactttgt caagctcacc ctcccccgag tccaggagct gcccgaggac 240
gccgaggcca ccactgatgt ccaccccgag gatatcccct acctcaagaa ggcctccgac 300
ggcctccagc ccgaggtcac tgagttcctc gagcagcact ctcccgactg gatcatctac 360
gactacaccc actactggct ccccgagatt gccaagtctc tcggtgtctc tcgagcccac 420
ttctccgtca ccaccccctg ggccattgct tacatgggtc ccactgccga tgccatgatc 480
aacggttccg actaccgaac cgagcttgag gacttcaccg tccctcccaa gtggttcccc 540
ttccccacca ccgtctgctg gcgaaagcac gatctggccc gactcgtccc ctacaaggct 600
cccggtatct ccgacggtta ccgaatgggc ctcgtcatca agggctgcga ctgtctgctc 660
tccaagacct accacgagtt cggtactcag tggctccgac ttctcgagga gctgcaccga 720
gtccccgtca tccccgttgg tctgctccct ccctccatcc ccggctctga caaggacgac 780
tcttgggttt ccatcaagga gtggctcgac ggccaggaga agggctccgt tgtctacgtt 840
gctctcggtt ccgaggttct cgtcacccag gaagaggttg tcgagcttgc tcacggtctg 900
gagctgtccg gtctgccctt cttctgggcc taccgaaagc ccaagggtcc cgccaagtcc 960
gactccgtcg agcttcccga tggtttcgtc gagcgagtcc gagatcgagg tctggtctgg 1020
acctcttggg ctccccagct ccgaatcctc tcccacgagt ccgttgctgg tttcctcacc 1080
cactgcggtt ccggctccat tgtcgagggc ctcatgttcg gccaccctct catcatgctc 1140
cccatcttcg gtgaccagcc cctcaacgcc cgactccttg aggacaagca ggtcggtatc 1200
gagatccccc gaaacgagga agatggttct ttcacccgag actctgttgc cgagtctctg 1260
cgactcgtca tggtcgagga agagggtaag atctaccgag agaaggccaa ggagatgtcc 1320
aagctctttg gcgacaagga cctccaggac cagtacgtcg acgactttgt cgagtacctc 1380
cagaagcacc gacgagctgt tgccattgac cacgaaagc 1419
<210> 26
<211> 1758
<212> DNA
<213> Yarrowia lipolytica
<400> 26
atggaatgga tttcacatct ggagaacgat gacgatgtgc tggaaatcga ggactacaag 60
gtgcgcaagg acgcgctgct gatcgccatt caagtaaccc agaacgccat taacaacgga 120
actcttcata aggccttgga ggcagccttc gatgctgtga ctgacagaat cgtcatatcg 180
ccgcaagatt acaccggcgt tatgctgttc ggtgcctcca tgcagtctga ggacgacggt 240
gacgagttcg atgatgagtc agatacacat ttcattctca agctgggcct tcctaccgct 300
gctcagatca aacgactcaa acgactggca gaggaccctg atctgggtga gaggttcaag 360
gtgcaggaag agcctcacct gatggacgtg tttttcgaca tgaaccgcca ttttatcaac 420
atggcaccca acttcgcgtc cagacgaatc atctatatca cagacgacga tacccccacg 480
acgaatgagg acgatatcaa caagacacga gttcgaattg aggatctaag ccatctcaag 540
gtgaaggtcg agcctctttt gatcaaccct tcggaagaca agacgttcga ctcctccaaa 600
ttctacgctc ttgtgttcaa cgaagacaca tctgtggagc cggttgaggc gatcgatttg 660
aagcagttta tcaacaaaag aaacgtgctc aatcgatcac tgttcaatgt caaaatggaa 720
atcggagaag gtcttgttgt cggagtaaga ggataccttc tttatgcgga acaaaaggct 780
acttcaacaa cccgaaaggc ctgggtttac actggaggtg agaaacccga gattgccaaa 840
ttagaatcgc aggccgtcac tattgaaagt ggcagaagcg tggacaaggc agatctgaga 900
aagactttca agtttggaaa tgactatgtt cctttcacag aagaacagct gacgcaaatc 960
cggtactttg gagagccaat tattcgaatt ctcggcttcc acaattcctc ggacttctcc 1020
gagctcttca tccacagtgt ccgatcgtca atgttcctat atcccactga tgagaagctt 1080
gtgggttcga ttcgagcctt ttcagcactc tatcagagtc tcaagaacaa ggataagatg 1140
gctctggcct gggttattgt ccgcaagggc gccaaaccta ttctggctct tcttattcct 1200
tcaactaagg agatcgaagg tcttcatatg gtcttcttgc cttttacaga tgatattcga 1260
caagaaccaa agactgaact tgtgtctgcc gcccctgagc tcgtggacgc aaccaagaat 1320
attttcactc gtctacgcat gcctggcgga tttgagtcgc aaagataccc caacccccgt 1380
ctacagtggc attaccgagt tgtacgagcc atggcccttc aggaggaggt tcccaaggta 1440
cccgaagaca agacgacacc aaagtatcgg tctattgata ctcgagttgg tgatgccatc 1500
gaggaatgga acaaggtgtt gcagagcagc tccaagcgac ctgcggagga tatctgtaag 1560
gctgagaaga aagtcaagag ttctgacgcg ggccctccgt ccaacgagca aatgcaaaat 1620
atggttgaga atgacattgt cggcaagctg accgtcgcag aactcagggc ttggggtgct 1680
gctaacaatg ttgagcccaa tggtagcaag ttgaagaagg actgggttga ggtggtcaaa 1740
aagtactatg ggaagtga 1758
<210> 27
<211> 4245
<212> DNA
<213> Yarrowia lipolytica
<400> 27
atgggtaaaa ccgaagtgac acaggagagt ctagaatgcg ggtcggtcac gtcctcgctg 60
gggaaaaagc ccttctccat catcacactc ttcaccggca gacgcattcc tccggtacct 120
actgaaaaac cagattcggc cgaagaacgg gccgggattc tgtcaaaatt gacctggcaa 180
tggcttagtc cattgttgaa aactggttac ttacgaaaca ttgaacgtga ggatctgtat 240
aaagtgagag agagaaactc ggcggctgtg atccagcagc gacttgaatc caatctcgaa 300
aaacaatacg ccaagtacca cgccaaactg ctcaagaaag gactctcgga gcaagaggcg 360
catctcaagc tgcaagattc agccaaaccc ctcgtcttgg ctcttaacca gacgtttttt 420
tggaagttct ggctagccgg actgtttgcc ctagtcaagg acctctgtgg aatcgcctca 480
gctatggtgt cacgtgttct gatcgaatac attcaagaca gatatctcta cagggggaca 540
gaccgggaac ctaaggtcgg ccgaggagtc ggcccctcga taggcctatt tctactggcc 600
gtaggagtca ctttcttctt caaccacatg ttctacaatg tcaagatggt tggagctcag 660
gctcgtgcag ctctggtggc cgtcatctac agcaagagta cccgtttgag cgccaagggc 720
cgagctcaat acaccacagg caagatcaca aacttggcag ctattgacgc acatcgagtt 780
gatctcagtt gtgaatcttt ccactacatt actatctttt tgcctgttgt gggttgtgcc 840
attgctgtac tcgtggtcaa cctcaaggtc gcagctctag ttggaattgc gaccatgatt 900
gtcttgatct ttgtcgtcgc aggcatcacc atcttctcta tgaagctgcg agccatcatt 960
gtcaagctca cggataagcg agtcacgtat atccgagaag ctctgcagtc gattagaatc 1020
atcaagtact acggctggga ggttccttac tgtgacaaga tcaagaaggt gcgtcttgac 1080
gagacccgta actacgccaa gatgggctcg attcgaggaa cagccattgg tatgtttcag 1140
gcactcccta ttttggcagg agcgttgtct ttcatcacct acgctgctct aggtcatgga 1200
actgatcctg ctcgaatgtt ctcttctctg acgcttttca atttactcct gcctgctctt 1260
gctgttcttc cccaggccct ccaggctgct ggagacgctc gagtggctct cagacgtatc 1320
cagcggttcc ttggggccga ggagtcgact cccactacag tttttgacgc tactcttgaa 1380
tctactgatg acgctgtgat tgtggaagac gcctctttca tctggccaga agttgtcgat 1440
gataagagcg acaaagagaa ggctaaagat gcaaagaagg aggaaaagga taagaagaag 1500
gccgagaaga aggccaagaa ggcggccaag aaggcggcca aggagatcgc ggtggttgtg 1560
gaagaggagg tggaacacga aaagaccgag ggatccagtg agtctgaaaa gggtactctt 1620
aagtcgactt tcaagggctt caacaacctg tctttcaaaa tcaagcgggg tgaatttgtc 1680
gttgttaccg gtcccattgg ttctggaaag tcgtctcttc ttgctgccat cactggatct 1740
atggttttga caggcggttc cgtgcgagtg tcgtccacag agtggattgg atgtctggag 1800
ccgtggattc aaaacgccac agttcgagat aacattgtgt ttgggcgaaa attcgactct 1860
gaatggtata gaactgtggt tactgcctgt cagctgagcc aggatctcaa aataatgact 1920
cacggagaca ataccatgat tggagagcga ggcatcacag tttcgggcgg tcaaaaagct 1980
cgaatcaacc tcgcacgtgc tatatatgga aaccccgaga ttctcatcat ggacgacgtc 2040
ctgtcggctg tggacgctcg agtaggtgct ggtattgtgg acgattgtct tcgaggctta 2100
gccaagaact ccactcgaat tctggccacc catcagctgt ctgtgctgcc taaggctgat 2160
catgtgattt tcatggatgc cgaaggccag tttcatattg gtacgtacca agagctggag 2220
gctgacaatg agcagttcaa ggctcttttg gcggctggtt ccatgtccaa ggaggaggtg 2280
gttgctgtcg acgagactga ggttgttatt gaaggcgatc ttgaagacga ctgcgataac 2340
aaggaggagt atgaggatgc agctgagacc atttccattt tggcagatgc cactcaagag 2400
ctgcaaaagg tgaccactac agtctcggca tttgaggaga acgataacat gatggaggaa 2460
gaagagcgaa tgagagatgc agttggtttg catgtgtact ggcagtattt tcgtcaggcc 2520
aaccccagta gggtcaaggt aatgatgttc attggcatga tcttcatttc catgattgtg 2580
attgcctttc tgtttgtctt cacatctgta tggctctcgt tctggacagg tgaccgtttc 2640
catgcctcca gaaacttcta caccggaatt tacatcatgc tgggtattct tctgcttctt 2700
gctgtggcag gatacatgat tgtcaatgag atcaactctg ccatggcagc aagaaatcta 2760
cacaatcatg ctttggactc ggtgttcgct gcacgaactt ctttcttcga taccactcct 2820
cagggtcgta tcatcaaccg gttcacccga gacacagact ctctggataa cgagctggct 2880
atgcgattga ctatgttgtt ctttggcgtc tccgcattct tctccaactt cctgcttact 2940
tgtgtctacg ttccttatgt gactcttgtg cttgtccctg tcggttttgt cttctacgtt 3000
tctctaggtt actaccgaaa gtcagctcgt gaagtcaagc gaattgactc cattgaacgg 3060
tcgcacatga tgagtgtctt caacgagtcc atttccggta tgcccgtcat catcatgtac 3120
aaggcccagc atcggctcat gaacaagctt caggctactc tcgatgatat ggacagtgcc 3180
tacttcctca ctgctgcaaa ccagcgatgg ctgtctctcc gtctggatgg tctgggttct 3240
ttggtcgttc tggtggccac tattcttgtt gctgtcggag tctttgatct caccccttcc 3300
aacatgggtc tgatcatttc cgcggcctcc tttatccccg aagtcatgtc tatggttgcc 3360
caggccgttg ctgaactcga aaactgcatg aacgccacag agcgaattct ttactacaag 3420
gacaacattc ctgctgaggc tgctcgagaa gtggacggta cagagctcga ccagcgaccc 3480
aactggcctg agcagggagc catcagcttc aacaatgtgt ccatgaagta ccgagatgga 3540
cttccttacg tgctcaagtc attgtctgtc gactttcagg gaggacacaa ggtgggtatc 3600
tgtggacgaa caggagccgg taagagtacc atcttgcaga ctctgtatcg aattgtggag 3660
cttgctgagg gttctattac tattgatggt gttgacattt cgactattgg actgcatcag 3720
cttcggtctc agttgtccat cattccccag gagccagttt tgttcctggg caccatccgg 3780
tctaatttgg atcctctgga gcaatactct gatgctgagc tatggggttc tctacgacgg 3840
tctggacttc tcgatgaagg agagactgag ggtaagtttc atctggatca aaaggtggag 3900
gctgacggca gcaacttctc tctaggtgag cgacagctgc tgactctagc ccgagcactg 3960
cttagaaaca ccaaaatttt ggtgctggac gaagccacat caaatgtcga ctacaagacg 4020
gacaagctgg ttcaggagac catttcacgg gagtttggcc actgcacgat tctgtgtatc 4080
gcccatcgac tgcgaaccat tgccaagtat gatcgtattt tggtgcttga gtccggcgag 4140
atcaaccagt acgacacgcc ctggaacttg tacaacgaca aggagggtat tttccgaggt 4200
atgtgtgaca cctccgggtt gaacgaggta gacttcaaca agtaa 4245
<210> 28
<211> 4245
<212> DNA
<213> Artificial sequence
<220>
<223> YALI0E25201g CpO for Y. lipolitica
<400> 28
atgggtaaga ccgaggtcac tcaggagtct ctcgagtgcg gttccgtcac ctcctctctc 60
ggcaagaagc ccttctccat catcactctc ttcaccggcc gacggatccc tcccgtcccc 120
actgagaagc ccgactccgc tgaggagcga gccggcatcc tctccaagct gacctggcag 180
tggctctctc ctctgctcaa gaccggttac ctccgaaaca tcgagcgaga ggatctgtac 240
aaggtccgag agcgaaactc cgctgccgtt atccagcagc gacttgagtc caacctggag 300
aagcagtacg ccaagtacca cgccaagctc ctcaagaagg gtctgtctga gcaagaggcc 360
cacctcaagc tgcaggactc tgccaagccc cttgtcctgg ccctcaacca gaccttcttc 420
tggaagttct ggctcgctgg tctgttcgcc ctcgtcaagg acctctgtgg cattgcttcc 480
gccatggttt cccgagttct cattgagtac atccaggacc gatacctcta ccgaggtacc 540
gaccgagagc ccaaggtcgg ccgaggtgtc ggtccctcca tcggactctt cctgctggcc 600
gttggtgtca ctttcttctt caaccacatg ttctacaacg tcaagatggt tggtgcccag 660
gcccgagctg ccctcgtcgc tgtcatctac tccaagtcca cccgactgtc cgccaagggt 720
cgagcccagt acaccaccgg caagatcacc aacctcgccg ccattgatgc ccaccgagtc 780
gatctgtctt gcgagtcttt tcactacatc actatcttcc ttcccgtcgt cggctgcgcc 840
attgccgtcc tcgttgtcaa cctcaaggtt gctgctctcg tcggtattgc cactatgatt 900
gtcctcatct ttgtcgttgc tggtatcacc atcttctcca tgaagctccg agccatcatc 960
gtcaagctca ccgacaagcg agtcacctac atccgagagg ctctccagtc catccgaatc 1020
atcaagtact acggctggga ggttccctac tgcgacaaga ttaagaaggt ccgactcgac 1080
gagactcgaa actacgccaa gatgggctcc attcgaggaa ccgctattgg tatgttccag 1140
gctctcccca tcctcgccgg cgctctgtct tttatcacct acgccgccct cggtcacggc 1200
accgaccccg cccgaatgtt ctcttctctc accctcttca acctgctgct ccccgctctt 1260
gccgttctcc cccaggccct ccaggccgct ggtgacgccc gagtcgccct gcgacgaatc 1320
cagcgattcc tcggtgctga ggagtccacc cccaccactg tcttcgatgc tactcttgag 1380
tctaccgacg acgccgtcat cgtcgaggac gcctccttca tttggcccga ggtcgttgac 1440
gacaagtccg acaaggagaa ggccaaggat gctaagaaag aggagaagga caagaagaag 1500
gctgagaaga aagccaagaa ggccgctaag aaggcagcca aggagatcgc cgttgttgtt 1560
gaggaagagg tcgagcacga gaagaccgaa ggctcctccg agtccgagaa aggtaccctc 1620
aagtccacgt tcaagggttt caacaacctg tctttcaaga tcaagcgagg tgagttcgtt 1680
gtcgtcactg gtcccatcgg ctccggtaag tcctctctgc tcgctgccat taccggttcc 1740
atggttctga ccggtggttc tgtccgagtc tcttccaccg agtggatcgg ttgcctcgag 1800
ccttggatcc agaacgccac cgtccgagac aacattgtct tcggccgtaa gtttgactcc 1860
gagtggtacc gaaccgttgt caccgcctgc cagctctccc aggacctcaa gatcatgacc 1920
cacggcgata acaccatgat tggtgagcga ggtatcactg tctccggtgg tcagaaggcc 1980
cgaatcaacc tggcccgcgc gatctacggt aaccccgaga ttctcatcat ggacgacgtc 2040
ctctccgccg tcgacgccag ggtcggagcc ggtatcgtcg atgactgtct gagaggcctc 2100
gccaagaact ctacccgaat cctcgccacc caccagctct ctgttctccc caaggccgac 2160
cacgtcatct ttatggacgc cgagggtcag ttccacattg gcacctacca agagctcgag 2220
gctgataacg agcagttcaa ggctctcctc gctgccggct ctatgtccaa agaggaagtc 2280
gttgccgttg acgagactga ggttgtcatt gagggtgacc tcgaggacga ctgtgacaac 2340
aaggaagagt acgaggatgc tgccgagact atctccattc tcgccgacgc cacccaggag 2400
ctccagaagg ttaccaccac cgtttctgct tttgaggaga acgacaacat gatggaggaa 2460
gaagaacgaa tgcgagatgc cgtcggtctg cacgtctact ggcagtactt ccgacaggcc 2520
aacccctctc gagtcaaggt catgatgttc attggtatga ttttcatctc catgattgtc 2580
attgccttcc tcttcgtctt cacctccgtc tggctctcct tttggaccgg tgaccgattc 2640
cacgcttccc gaaacttcta caccggcatc tacatcatgc tcggtatcct ccttctgctc 2700
gccgtcgccg gttacatgat cgtcaatgag atcaactctg ccatggccgc ccgaaacctg 2760
cacaaccacg ccctcgactc cgtcttcgcc gctcgaactt ctttcttcga caccactccc 2820
cagggccgaa tcattaaccg attcacccgg gacaccgact ccctcgataa cgaactggcc 2880
atgcgactca ccatgctctt tttcggtgtt tccgcctttt tctccaactt cctcctcacc 2940
tgtgtctacg ttccctacgt caccctggtt cttgtccccg ttggtttcgt cttctacgtt 3000
tccctcggtt actaccgaaa gtccgcccga gaggtcaagc gaatcgactc cattgagcga 3060
tcccacatga tgtccgtctt caacgagtcc atctccggta tgcccgttat catcatgtac 3120
aaggcccagc accgactcat gaacaagctc caggccaccc tcgacgacat ggactccgcc 3180
tacttcctga ccgctgccaa ccagcgatgg ctctccctcc gactggacgg tcttggctct 3240
cttgttgtcc tcgtcgccac cattcttgtc gccgtcggtg tctttgacct caccccctcc 3300
aacatgggcc tcatcatctc tgctgcctct ttcatccccg aggtcatgtc catggtcgcc 3360
caggccgttg ctgagctcga gaactgcatg aacgctaccg agcgaatcct ctactacaag 3420
gacaacatcc ccgccgaggc tgctcgagag gtcgacggta ccgagcttga tcagcgaccc 3480
aactggcccg agcagggcgc catctccttc aacaacgtgt ccatgaagta ccgagatggt 3540
ctgccctacg tcctcaagtc tctctccgtc gacttccagg gcggccacaa ggtcggtatc 3600
tgcggacgaa ccggtgccgg caagtccact atcctccaga ccctgtaccg aatcgtcgag 3660
ctggccgagg gctccatcac cattgatggt gtcgacatct ccaccattgg cctgcaccag 3720
ctccgatccc agctgtccat catcccccag gagcccgttc tgttccttgg caccatccga 3780
tccaacctcg atcccctcga gcagtactcc gacgccgagc tctggggttc tctccgacga 3840
tccggccttc tggacgaggg tgaaaccgag ggtaagttcc acctcgacca gaaggtcgag 3900
gccgatggtt ccaacttctc tctgggtgag cgacagctcc tcaccctcgc ccgagccctt 3960
ctgcgaaaca ccaagattct tgttctcgac gaggctacct ccaacgtcga ctacaagacc 4020
gataagctcg tccaggagac aatctcccga gagttcggtc actgcaccat tctctgtatc 4080
gcccaccgac tgcgaaccat cgctaagtac gaccgaattc tcgttctcga gtccggcgag 4140
atcaaccagt acgacacccc ctggaacctc tacaacgaca aggaaggtat cttccgaggc 4200
atgtgcgaca cctccggcct caacgaggtc gactttaata aataa 4245
<210> 29
<211> 1414
<212> PRT
<213> Yarrowia lipolytica
<400> 29
Met Gly Lys Thr Glu Val Thr Gln Glu Ser Leu Glu Cys Gly Ser Val
1 5 10 15
Thr Ser Ser Leu Gly Lys Lys Pro Phe Ser Ile Ile Thr Leu Phe Thr
20 25 30
Gly Arg Arg Ile Pro Pro Val Pro Thr Glu Lys Pro Asp Ser Ala Glu
35 40 45
Glu Arg Ala Gly Ile Leu Ser Lys Leu Thr Trp Gln Trp Leu Ser Pro
50 55 60
Leu Leu Lys Thr Gly Tyr Leu Arg Asn Ile Glu Arg Glu Asp Leu Tyr
65 70 75 80
Lys Val Arg Glu Arg Asn Ser Ala Ala Val Ile Gln Gln Arg Leu Glu
85 90 95
Ser Asn Leu Glu Lys Gln Tyr Ala Lys Tyr His Ala Lys Leu Leu Lys
100 105 110
Lys Gly Leu Ser Glu Gln Glu Ala His Leu Lys Leu Gln Asp Ser Ala
115 120 125
Lys Pro Leu Val Leu Ala Leu Asn Gln Thr Phe Phe Trp Lys Phe Trp
130 135 140
Leu Ala Gly Leu Phe Ala Leu Val Lys Asp Leu Cys Gly Ile Ala Ser
145 150 155 160
Ala Met Val Ser Arg Val Leu Ile Glu Tyr Ile Gln Asp Arg Tyr Leu
165 170 175
Tyr Arg Gly Thr Asp Arg Glu Pro Lys Val Gly Arg Gly Val Gly Pro
180 185 190
Ser Ile Gly Leu Phe Leu Leu Ala Val Gly Val Thr Phe Phe Phe Asn
195 200 205
His Met Phe Tyr Asn Val Lys Met Val Gly Ala Gln Ala Arg Ala Ala
210 215 220
Leu Val Ala Val Ile Tyr Ser Lys Ser Thr Arg Leu Ser Ala Lys Gly
225 230 235 240
Arg Ala Gln Tyr Thr Thr Gly Lys Ile Thr Asn Leu Ala Ala Ile Asp
245 250 255
Ala His Arg Val Asp Leu Ser Cys Glu Ser Phe His Tyr Ile Thr Ile
260 265 270
Phe Leu Pro Val Val Gly Cys Ala Ile Ala Val Leu Val Val Asn Leu
275 280 285
Lys Val Ala Ala Leu Val Gly Ile Ala Thr Met Ile Val Leu Ile Phe
290 295 300
Val Val Ala Gly Ile Thr Ile Phe Ser Met Lys Leu Arg Ala Ile Ile
305 310 315 320
Val Lys Leu Thr Asp Lys Arg Val Thr Tyr Ile Arg Glu Ala Leu Gln
325 330 335
Ser Ile Arg Ile Ile Lys Tyr Tyr Gly Trp Glu Val Pro Tyr Cys Asp
340 345 350
Lys Ile Lys Lys Val Arg Leu Asp Glu Thr Arg Asn Tyr Ala Lys Met
355 360 365
Gly Ser Ile Arg Gly Thr Ala Ile Gly Met Phe Gln Ala Leu Pro Ile
370 375 380
Leu Ala Gly Ala Leu Ser Phe Ile Thr Tyr Ala Ala Leu Gly His Gly
385 390 395 400
Thr Asp Pro Ala Arg Met Phe Ser Ser Leu Thr Leu Phe Asn Leu Leu
405 410 415
Leu Pro Ala Leu Ala Val Leu Pro Gln Ala Leu Gln Ala Ala Gly Asp
420 425 430
Ala Arg Val Ala Leu Arg Arg Ile Gln Arg Phe Leu Gly Ala Glu Glu
435 440 445
Ser Thr Pro Thr Thr Val Phe Asp Ala Thr Leu Glu Ser Thr Asp Asp
450 455 460
Ala Val Ile Val Glu Asp Ala Ser Phe Ile Trp Pro Glu Val Val Asp
465 470 475 480
Asp Lys Ser Asp Lys Glu Lys Ala Lys Asp Ala Lys Lys Glu Glu Lys
485 490 495
Asp Lys Lys Lys Ala Glu Lys Lys Ala Lys Lys Ala Ala Lys Lys Ala
500 505 510
Ala Lys Glu Ile Ala Val Val Val Glu Glu Glu Val Glu His Glu Lys
515 520 525
Thr Glu Gly Ser Ser Glu Ser Glu Lys Gly Thr Leu Lys Ser Thr Phe
530 535 540
Lys Gly Phe Asn Asn Leu Ser Phe Lys Ile Lys Arg Gly Glu Phe Val
545 550 555 560
Val Val Thr Gly Pro Ile Gly Ser Gly Lys Ser Ser Leu Leu Ala Ala
565 570 575
Ile Thr Gly Ser Met Val Leu Thr Gly Gly Ser Val Arg Val Ser Ser
580 585 590
Thr Glu Trp Ile Gly Cys Leu Glu Pro Trp Ile Gln Asn Ala Thr Val
595 600 605
Arg Asp Asn Ile Val Phe Gly Arg Lys Phe Asp Ser Glu Trp Tyr Arg
610 615 620
Thr Val Val Thr Ala Cys Gln Leu Ser Gln Asp Leu Lys Ile Met Thr
625 630 635 640
His Gly Asp Asn Thr Met Ile Gly Glu Arg Gly Ile Thr Val Ser Gly
645 650 655
Gly Gln Lys Ala Arg Ile Asn Leu Ala Arg Ala Ile Tyr Gly Asn Pro
660 665 670
Glu Ile Leu Ile Met Asp Asp Val Leu Ser Ala Val Asp Ala Arg Val
675 680 685
Gly Ala Gly Ile Val Asp Asp Cys Leu Arg Gly Leu Ala Lys Asn Ser
690 695 700
Thr Arg Ile Leu Ala Thr His Gln Leu Ser Val Leu Pro Lys Ala Asp
705 710 715 720
His Val Ile Phe Met Asp Ala Glu Gly Gln Phe His Ile Gly Thr Tyr
725 730 735
Gln Glu Leu Glu Ala Asp Asn Glu Gln Phe Lys Ala Leu Leu Ala Ala
740 745 750
Gly Ser Met Ser Lys Glu Glu Val Val Ala Val Asp Glu Thr Glu Val
755 760 765
Val Ile Glu Gly Asp Leu Glu Asp Asp Cys Asp Asn Lys Glu Glu Tyr
770 775 780
Glu Asp Ala Ala Glu Thr Ile Ser Ile Leu Ala Asp Ala Thr Gln Glu
785 790 795 800
Leu Gln Lys Val Thr Thr Thr Val Ser Ala Phe Glu Glu Asn Asp Asn
805 810 815
Met Met Glu Glu Glu Glu Arg Met Arg Asp Ala Val Gly Leu His Val
820 825 830
Tyr Trp Gln Tyr Phe Arg Gln Ala Asn Pro Ser Arg Val Lys Val Met
835 840 845
Met Phe Ile Gly Met Ile Phe Ile Ser Met Ile Val Ile Ala Phe Leu
850 855 860
Phe Val Phe Thr Ser Val Trp Leu Ser Phe Trp Thr Gly Asp Arg Phe
865 870 875 880
His Ala Ser Arg Asn Phe Tyr Thr Gly Ile Tyr Ile Met Leu Gly Ile
885 890 895
Leu Leu Leu Leu Ala Val Ala Gly Tyr Met Ile Val Asn Glu Ile Asn
900 905 910
Ser Ala Met Ala Ala Arg Asn Leu His Asn His Ala Leu Asp Ser Val
915 920 925
Phe Ala Ala Arg Thr Ser Phe Phe Asp Thr Thr Pro Gln Gly Arg Ile
930 935 940
Ile Asn Arg Phe Thr Arg Asp Thr Asp Ser Leu Asp Asn Glu Leu Ala
945 950 955 960
Met Arg Leu Thr Met Leu Phe Phe Gly Val Ser Ala Phe Phe Ser Asn
965 970 975
Phe Leu Leu Thr Cys Val Tyr Val Pro Tyr Val Thr Leu Val Leu Val
980 985 990
Pro Val Gly Phe Val Phe Tyr Val Ser Leu Gly Tyr Tyr Arg Lys Ser
995 1000 1005
Ala Arg Glu Val Lys Arg Ile Asp Ser Ile Glu Arg Ser His Met
1010 1015 1020
Met Ser Val Phe Asn Glu Ser Ile Ser Gly Met Pro Val Ile Ile
1025 1030 1035
Met Tyr Lys Ala Gln His Arg Leu Met Asn Lys Leu Gln Ala Thr
1040 1045 1050
Leu Asp Asp Met Asp Ser Ala Tyr Phe Leu Thr Ala Ala Asn Gln
1055 1060 1065
Arg Trp Leu Ser Leu Arg Leu Asp Gly Leu Gly Ser Leu Val Val
1070 1075 1080
Leu Val Ala Thr Ile Leu Val Ala Val Gly Val Phe Asp Leu Thr
1085 1090 1095
Pro Ser Asn Met Gly Leu Ile Ile Ser Ala Ala Ser Phe Ile Pro
1100 1105 1110
Glu Val Met Ser Met Val Ala Gln Ala Val Ala Glu Leu Glu Asn
1115 1120 1125
Cys Met Asn Ala Thr Glu Arg Ile Leu Tyr Tyr Lys Asp Asn Ile
1130 1135 1140
Pro Ala Glu Ala Ala Arg Glu Val Asp Gly Thr Glu Leu Asp Gln
1145 1150 1155
Arg Pro Asn Trp Pro Glu Gln Gly Ala Ile Ser Phe Asn Asn Val
1160 1165 1170
Ser Met Lys Tyr Arg Asp Gly Leu Pro Tyr Val Leu Lys Ser Leu
1175 1180 1185
Ser Val Asp Phe Gln Gly Gly His Lys Val Gly Ile Cys Gly Arg
1190 1195 1200
Thr Gly Ala Gly Lys Ser Thr Ile Leu Gln Thr Leu Tyr Arg Ile
1205 1210 1215
Val Glu Leu Ala Glu Gly Ser Ile Thr Ile Asp Gly Val Asp Ile
1220 1225 1230
Ser Thr Ile Gly Leu His Gln Leu Arg Ser Gln Leu Ser Ile Ile
1235 1240 1245
Pro Gln Glu Pro Val Leu Phe Leu Gly Thr Ile Arg Ser Asn Leu
1250 1255 1260
Asp Pro Leu Glu Gln Tyr Ser Asp Ala Glu Leu Trp Gly Ser Leu
1265 1270 1275
Arg Arg Ser Gly Leu Leu Asp Glu Gly Glu Thr Glu Gly Lys Phe
1280 1285 1290
His Leu Asp Gln Lys Val Glu Ala Asp Gly Ser Asn Phe Ser Leu
1295 1300 1305
Gly Glu Arg Gln Leu Leu Thr Leu Ala Arg Ala Leu Leu Arg Asn
1310 1315 1320
Thr Lys Ile Leu Val Leu Asp Glu Ala Thr Ser Asn Val Asp Tyr
1325 1330 1335
Lys Thr Asp Lys Leu Val Gln Glu Thr Ile Ser Arg Glu Phe Gly
1340 1345 1350
His Cys Thr Ile Leu Cys Ile Ala His Arg Leu Arg Thr Ile Ala
1355 1360 1365
Lys Tyr Asp Arg Ile Leu Val Leu Glu Ser Gly Glu Ile Asn Gln
1370 1375 1380
Tyr Asp Thr Pro Trp Asn Leu Tyr Asn Asp Lys Glu Gly Ile Phe
1385 1390 1395
Arg Gly Met Cys Asp Thr Ser Gly Leu Asn Glu Val Asp Phe Asn
1400 1405 1410
Lys
<210> 30
<211> 1000
<212> DNA
<213> Yarrowia lipolytica
<400> 30
cggttgagag ttcaagaaca cgaccaagta accccgagaa agtgtcgatg gatacagaga 60
aaacaatatc gcagatattg acaacaaact tgcaacgaga gccctctaca tgctccaata 120
ttcttcttcc agacctaccc gttcacacaa ctacaagttg ccgccttaaa caacaacgtg 180
gtcaactccg gagttaacag aagcataata atgtgatgga atttggaggt tggggagaga 240
cagtttggac cggagacacg ccacggggaa atcatcataa acattggtaa aatgccaaaa 300
aaaatttata catggtagca aaagcatcct ggagaactcc taagtatgtc agggtcccaa 360
aaacctcgtt aatggaggcc tgcggacttc ttccgtgaca ttgtgaacca ttaatacaac 420
ctgaaaagac catctgcaaa acaccagtga tagtggttcc aacgcaactt cgtgcacact 480
caacgctacc actgctagac ctaccgccgt tagacctatt gtatcgccgc caccgttctt 540
aaatgcagat gaagtaaaca ctgccgttcg gtccaataat taatgttgct ccgccatgct 600
cagttttttt tcttttcttt cggcaaaata accttcgcag tcatgtgaga tatcgcacga 660
caagatgtga ctaacatgcc aacggcggct gcccccaagg tgtatatgag taccaaatta 720
gggcatgata caagaatacc tttcgaaaag ccggaacaag ataaagcagc ccaaccctta 780
taacggccag ctagcgccaa acttgctcgc cccgagcccc acccgcttct catccgtacg 840
ccatttcgtg ccacgtatcc agaaagttct actcccagca cagggttagg ggtgttgcca 900
ttctgggtca ctccccacca ccacagcatg ttttttcctc tctcccgaca accacaactc 960
tctagtttac actaaccaca cacgacacca attttaaaaa 1000
<210> 31
<211> 300
<212> DNA
<213> Yarrowia lipolytica
<400> 31
atgcaaacca agtaatttat tgtgtagtct aggattgaca tttgattacc gtgtacatta 60
aatgaatgat tgtaaattga aagaggaagt gtagcaatgg ttgaatgggg agtaatgggt 120
tactgtaatt gcatgtccca ccttctttgc accgttcttg ttgtatacag tacaatacat 180
acatacccta tgtatgtttt ttgtgaatat gatgagtcta ctactacagt aaatcagctt 240
tgatccctgc cagaatgtgt gtacacagta tgggactctc atcccctgta caatataata 300
<210> 32
<211> 912
<212> DNA
<213> Artificial sequence
<220>
<223> carG nucleic acid sequence codon optimized for Y. lipolitica
<400> 32
atgctcaact ctcacaaccg aaccgaggag cgatccaccg aggatattat tctcgagcct 60
tacacctacc tcatttctca gcccggaaag gacattcgag ctaagctcat ttctgccttt 120
gacctctggc tgcacgttcc taaggatgtt ctttgcgtca tcaacaagat tatcggtatg 180
ctgcacaacg cctctcttat gattgacgat gttcaggacg actctgatct ccgacgagga 240
gtccccgttg ctcaccacat ttacggtgtc cctcagacta ttaacaccgc taactacgtg 300
attttcctcg cccttcagga ggttatgaag ctgaacatcc cttctatgat gcaggtgtgt 360
accgaggagc ttattaacct ccaccgaggt cagggaattg agctgtactg gcgagattcc 420
ctcacttgtc ccactgagga ggagtacatt gatatggtta acaacaagac ctctggcctc 480
cttcgacttg ccgtccgact gatgcaggct gcttctgagt ccgacatcga ctacacccct 540
ctcgtcaaca ttatcggaat tcacttccag gttcgagatg actacatgaa cctccagtcc 600
acctcttaca ctaacaacaa gggcttttgc gaggacctga ccgagggaaa gttctccttc 660
cctattattc acgctattcg aaaggacccc tctaaccgac agctcctgaa cattatctct 720
cagaagccca cctccattga ggttaagaag tacgctcttg aggtgatccg aaaggctgga 780
tcttttgagt acgttcgaga gttccttcga cagaaggagg ctgagtccct gaaggagatc 840
aagcgacttg gcggcaaccc tctcctcgag aagtacattg agactattcg agtcgaggct 900
actaacgact aa 912
<210> 33
<211> 1419
<212> DNA
<213> Artificial sequence
<220>
<223> UGT2_6b CpO for Y. lipolitica
<400> 33
atggctactt ccgactccat tgtcgacgac cgaaagaagc tccacattgt catgttcccc 60
tggctcgcct ttggccacat cattccctac ctcgagcttt ccaagctcat tgcccagaag 120
ggccacaagg tttctttcct ctccaccacc aagaacattg accgactctc ctcccacatc 180
tctcctctca tcaacgttgt ccagctcacc ctcccccgag tccaggagct gcccgaggac 240
gccgaggcca ccaccgatgt ccaccccgag gatatcccct acctcaagaa ggcctccgac 300
ggtctgcagc ccgaggtcac cgagttcctc gagcagcact ctcccgactg gatcatctac 360
gactacaccc actactggct cccctccatt gccaccaagc acggtgtctc tcgagcccac 420
ttctccgtca ccaccccctg ggccattgcc tacatgggcc ccactgctga cgccatgatc 480
aacggttccg atggccgaac cacccccgag gacttcactg tccctcccaa gtggttcccc 540
ttccccacca aggtctgctg gcgaaagcac gatctggccc gactcgttcc ctacaaggcc 600
cccggtatct ccgacggcta ccgaatgggt ctggtcatca agggctgcga ctgtctgctc 660
tccaagacct accacgagtt tggcacccag tggctccgac tcctcgagac tctccaccga 720
aagcccgtca tccccgtcgg tctgctccct ccctccatcc ccggctccga caaggacgac 780
tcttgggttt ccatcaagga gtggctcgac ggccaggaga agggctctgt tgtctacgtt 840
gctctcggtt ccgaggttct cgtcacccag gacgaggttg ttgagctggc ccacggtctg 900
gagctgtccg gcctcccctt cgtctgggct taccgaaacc ccaagggtcc cgccaagtcc 960
gactccgtcg agcttcccga tggtttcgtc gagcgagtcc gagatcgagg tctggtctgg 1020
acctcttggg ctccccagct ccgaatcctc tcccacgagt ccgtctgtgg tttcctcacc 1080
cactgcggtt ccggctccat cgtcgagggt ctgatgttcg gccaccccct catcatgctc 1140
cccatcttcg gtgaccagcc cctcaacgcc cgactccttg aggacaagca ggtcggtatc 1200
gagatccccc gaaacgaaga ggacggttcc ttcacccgag actctgttgc tgagtctctc 1260
cgactcgtca tggtcgagga agagggtaag atctaccgag agaaggccaa ggagatgtcc 1320
aagctgttcg gtgacaagga tctccaggac cagtacgtcg acgactttgt cgagtacctc 1380
cagaagcacc gacgagctgt tgccattgac cacgagtct 1419
<210> 34
<211> 1341
<212> DNA
<213> Artificial sequence
<220>
<223> RT18 nucleic acid sequence CpO for Y. lipolitica
<400> 34
atgtccacca ccctcaaggt cctcatgttc cccttcctcg cttacggcca catctctccc 60
tacctcaacg ttgccaagaa gctcgccgac cgaggcttcc tcatctacct ctgttccacc 120
cccatcaacc tcaagtccac catcaacaag atccccgaga agtacgccga ctccatccag 180
ctcatcgaac tccatctccc cgagcttccc gagctgcctc cccactacca caccaccaac 240
ggtctgcctc ccaacctcaa ccacatcctc cgacgagccc tcaagatgtc caagcccaac 300
ttctccaaga tcatgcagaa cctgaagccc gatctgctca tctacgacat tctccagcag 360
tgggccgagg atgtcgccac cgagcttaac atccccgccg tcaagctgct cacctctggt 420
gttgctgttt tctcttactt cttcaacctc accaagaagc ccgaggtcga gttcccctac 480
cccgctatct acctccgaaa gatcgagctg gtccgatggt gcgagactct gtccaagcac 540
aacaaggaag gtgaggagca cgacgacggc ctcgcctacg gcaacatgca gatcatgctc 600
atgtccactt ccaagatcct cgaggccaag tacattgact actgcattga gctgaccaac 660
tggaaggtcg tccccgtcgg ctctctcgtc caggactcca tcaccaacga cgccgctgac 720
gacgacatgg aactcattga ctggctcggt actaaggacg agaactccac cgtctttgtc 780
tcttttggct ccgagtactt cctctccaaa gaggacgttg aagaggttgc cttcggtctg 840
gagctgtcca acgtcaactt catctgggtt gtccgattcc ccaagggtga ggagaagaac 900
ctcgaggacg ttctgcccaa gggcttcttc gagcgaatcg gtgagcgagg ccgagtcctc 960
gacaagtttg ctccccagcc ccgaattctc aaccacccct ctaccggtgg tttcatctct 1020
cactgtggct ggaactccgc catggagtcc attgactttg gtgtccccat tgtcgccatg 1080
cccatgcagc tcgaccagcc catgaacgcc cgactcattg tcgagcttgg tgttgccgtc 1140
gagattgtcc gagatgatga tggtaagatc taccgaggtg agattgctga gactctcaag 1200
ggtgtcatca ccggcgagat tggtgagatc ctccgagcca aggtccgaga catctccaag 1260
aacctcaagg ccatcaagga cgaggagatg gacgttgctg cccaggagct gatccagctc 1320
tgccgaaact ccaataaata a 1341

Claims (12)

1.一种能够产生甜菊醇糖苷的重组宿主,所述重组宿主过表达介导甜菊醇糖苷转运的多肽,并且所述多肽的氨基酸序列是如SEQ ID NO:29所示的。
2.一种能够产生甜菊醇糖苷的重组宿主,所述重组宿主已被修饰,优选在其基因组中被修饰,以导致介导甜菊醇糖苷转运的多肽的产生缺陷,并且所述多肽的氨基酸序列是如SEQ ID NO:29所示的。
3.根据权利要求1所述的重组宿主,所述重组宿主包含编码多肽的重组核酸,所述多肽的氨基酸序列是如SEQ ID NO:29所示的。
4.根据权利要求1至3中任一项所述的重组宿主,其包含一种或更多种编码以下多肽的重组核苷酸序列:
具有对映-柯巴基焦磷酸合酶活性的多肽;
具有对映-贝壳杉烯合酶活性的多肽;
具有对映-贝壳杉烯氧化酶活性的多肽;以及
具有贝壳杉烯酸13-羟化酶活性的多肽。
5.根据权利要求1至3中任一项所述的重组宿主,其包含编码具有NADPH-细胞色素p450还原酶活性的多肽的重组核酸序列。
6.根据权利要求1至3中任一项所述的重组宿主,其包含编码以下项中的一种或更多种的重组核酸序列:
(i)具有UGT74G1活性的多肽;
(ii)具有UGT2活性的多肽;
(iii)具有UGT85C2活性的多肽;和
(iv)具有UGT76G1活性的多肽。
7.根据权利要求1至3中任一项所述的重组宿主,其中所述宿主属于Saccharomyces、Aspergillus、Pichia、Kluyveromyces、Candida、Hansenula、Humicola、Issatchenkia、Trichosporon、Brettanomyces、Pachysolen、Yarrowia、Yamadazyma或Escherichia属中的一种。
8.根据权利要求7所述的重组宿主,其中所述重组宿主是Saccharomyces cerevisiae细胞、Yarrowia lipolytica细胞、Candida krusei细胞、Issatchenkia orientalis细胞或Escherichia coli细胞。
9.根据权利要求1至3中任一项所述的重组宿主,其中所述宿主产生香叶基香叶基二磷酸(GGPP)的能力被上调。
10.根据权利要求1至3中任一项所述的重组宿主,其包含编码以下项中的一种或更多种的核酸序列:
具有羟甲基戊二酰基-辅酶A还原酶活性的多肽;或者
具有法尼基-焦磷酸合成酶活性的多肽。
11.一种制备甜菊醇糖苷的方法,所述方法包括在合适的发酵培养基中发酵根据权利要求1至10中任一项所述的重组宿主,以及任选地回收所述甜菊醇糖苷。
12.根据权利要求11所述的制备甜菊醇糖苷的方法,其中所述方法以工业规模进行。
CN201680047030.5A 2015-08-13 2016-08-15 甜菊醇糖苷转运 Active CN107922465B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111486315.8A CN114196559A (zh) 2015-08-13 2016-08-15 甜菊醇糖苷转运

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562204702P 2015-08-13 2015-08-13
US62/204,702 2015-08-13
PCT/EP2016/069356 WO2017025648A1 (en) 2015-08-13 2016-08-15 Steviol glycoside transport

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202111486315.8A Division CN114196559A (zh) 2015-08-13 2016-08-15 甜菊醇糖苷转运

Publications (2)

Publication Number Publication Date
CN107922465A CN107922465A (zh) 2018-04-17
CN107922465B true CN107922465B (zh) 2021-12-24

Family

ID=56896507

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201680047030.5A Active CN107922465B (zh) 2015-08-13 2016-08-15 甜菊醇糖苷转运
CN202111486315.8A Pending CN114196559A (zh) 2015-08-13 2016-08-15 甜菊醇糖苷转运

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202111486315.8A Pending CN114196559A (zh) 2015-08-13 2016-08-15 甜菊醇糖苷转运

Country Status (7)

Country Link
US (2) US11297862B2 (zh)
EP (2) EP3334752B1 (zh)
CN (2) CN107922465B (zh)
BR (1) BR112018002562A2 (zh)
CA (1) CA2994355A1 (zh)
MY (1) MY195726A (zh)
WO (1) WO2017025648A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK3004366T3 (da) * 2013-05-31 2019-05-20 Dsm Ip Assets Bv Mikroorganismer til diterpenproduktion
WO2017025648A1 (en) * 2015-08-13 2017-02-16 Dsm Ip Assets B.V. Steviol glycoside transport
WO2018114995A1 (en) * 2016-12-22 2018-06-28 Dsm Ip Assets B.V. Fermentation process for producing steviol glycosides
US11608364B2 (en) 2018-04-30 2023-03-21 Dsm Ip Assets B.V. Steviol glycoside transport
AU2019391944A1 (en) * 2018-12-07 2021-07-29 Suntory Holdings Limited Composition

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103732753A (zh) * 2011-08-08 2014-04-16 埃沃尔瓦公司 甜菊醇糖苷类的重组生产
WO2014122328A1 (en) * 2013-02-11 2014-08-14 Evolva Sa Efficient production of steviol glycosides in recombinant hosts

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7524519B2 (en) 2002-09-20 2009-04-28 The Procter & Gamble Company Method for reducing acrylamide in foods, foods having reduced levels of acrylamide, and article of commerce
DK1886582T3 (en) 2002-10-11 2015-04-20 Novozymes As Process for preparing a heat treated product
AU2013211605B2 (en) 2012-01-23 2017-04-06 Dsm Ip Assets B.V. Diterpene production
DK3004366T3 (da) * 2013-05-31 2019-05-20 Dsm Ip Assets Bv Mikroorganismer til diterpenproduktion
BR112016000745B1 (pt) 2013-07-15 2021-01-05 Dsm Ip Assets B.V. processo para a preparação de rebaudiosídeo m
WO2015011209A1 (en) * 2013-07-23 2015-01-29 Dsm Ip Assets B.V. Diterpene production in yarrowia
WO2017025648A1 (en) * 2015-08-13 2017-02-16 Dsm Ip Assets B.V. Steviol glycoside transport

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103732753A (zh) * 2011-08-08 2014-04-16 埃沃尔瓦公司 甜菊醇糖苷类的重组生产
WO2014122328A1 (en) * 2013-02-11 2014-08-14 Evolva Sa Efficient production of steviol glycosides in recombinant hosts

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Accession No:XP_504385.1,YALI0E25201p [Yarrowia lipolytica CLIB122];Dujon,B.,et al.;《Genbank database》;20081029;FEATURES和ORIGIN *
重组酿酒酵母全细胞催化合成莱鲍迪苷A;刘欢等;《食品与发酵工业》;20120731;第38卷(第7期);第6-10页 *

Also Published As

Publication number Publication date
EP3334752B1 (en) 2021-07-07
US20220110350A1 (en) 2022-04-14
EP3943504A1 (en) 2022-01-26
BR112018002562A2 (pt) 2018-09-25
EP3334752A1 (en) 2018-06-20
CN114196559A (zh) 2022-03-18
CA2994355A1 (en) 2017-02-16
CN107922465A (zh) 2018-04-17
US11925193B2 (en) 2024-03-12
US20180235263A1 (en) 2018-08-23
WO2017025648A1 (en) 2017-02-16
US11297862B2 (en) 2022-04-12
MY195726A (en) 2023-02-07

Similar Documents

Publication Publication Date Title
US10947515B2 (en) UDP-glycosyltransferases
CN107922465B (zh) 甜菊醇糖苷转运
US11293043B2 (en) Steviol glycoside transport
US11203764B2 (en) Kaurenoic acid hydroxylases
CN110892068B (zh) Udp-糖基转移酶
US11913034B2 (en) Kaurenoic acid hydroxylases
US10760085B2 (en) Kaurenoic acid hydroxylases
CN110072995B (zh) 贝壳杉烯酸羟化酶

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant