CN107567492B - Udp-糖基转移酶 - Google Patents

Udp-糖基转移酶 Download PDF

Info

Publication number
CN107567492B
CN107567492B CN201680016548.2A CN201680016548A CN107567492B CN 107567492 B CN107567492 B CN 107567492B CN 201680016548 A CN201680016548 A CN 201680016548A CN 107567492 B CN107567492 B CN 107567492B
Authority
CN
China
Prior art keywords
leu
val
glu
ser
pro
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201680016548.2A
Other languages
English (en)
Other versions
CN107567492A (zh
Inventor
维克托·马里厄斯·波尔
约翰尼斯·古斯塔夫·恩斯特·范·莱文
普利斯希勒·扎尔特简斯
凯瑟琳娜·佩特罗内拉·安东尼娅·玛丽亚·科伦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DSM IP Assets BV
Original Assignee
DSM IP Assets BV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DSM IP Assets BV filed Critical DSM IP Assets BV
Priority to CN202211152188.2A priority Critical patent/CN115851470A/zh
Publication of CN107567492A publication Critical patent/CN107567492A/zh
Application granted granted Critical
Publication of CN107567492B publication Critical patent/CN107567492B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23LFOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
    • A23L2/00Non-alcoholic beverages; Dry compositions or concentrates therefor; Their preparation
    • A23L2/52Adding ingredients
    • A23L2/60Sweeteners
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23LFOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
    • A23L27/00Spices; Flavouring agents or condiments; Artificial sweetening agents; Table salts; Dietetic salt substitutes; Preparation or treatment thereof
    • A23L27/30Artificial sweetening agents
    • A23L27/33Artificial sweetening agents containing sugars or derivatives
    • A23L27/36Terpene glycosides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/14Fungi; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/14Fungi; Culture media therefor
    • C12N1/16Yeasts; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/44Preparation of O-glycosides, e.g. glucosides
    • C12P19/56Preparation of O-glycosides, e.g. glucosides having an oxygen atom of the saccharide radical directly bound to a condensed ring system having three or more carbocyclic rings, e.g. daunomycin, adriamycin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P5/00Preparation of hydrocarbons or halogenated hydrocarbons
    • C12P5/007Preparation of hydrocarbons or halogenated hydrocarbons containing one or more isoprene units, i.e. terpenes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/01Hexosyltransferases (2.4.1)
    • C12Y204/01017Glucuronosyltransferase (2.4.1.17)

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Polymers & Plastics (AREA)
  • Nutrition Science (AREA)
  • Food Science & Technology (AREA)
  • Virology (AREA)
  • Mycology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Botany (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明涉及具有UDP‑糖基转移酶活性特别地具有UGT2活性并且与在SEQ ID NO:1、3、6、9、11、14、17、20、22、25中的一个中列出的氨基酸序列具有至少85%同一性的多肽。本申请还涉及包含编码所述多肽的重组核酸序列的重组宿主以及用其制备糖基化二萜如甜菊醇糖苷的用途。所述宿主细胞还可包含甜菊醇糖苷生物合成途径的酶。

Description

UDP-糖基转移酶
发明领域
本发明涉及一种重组宿主,其包含编码变体UDP-糖基转移酶(UGT) 多肽的重组核酸序列。本发明还涉及一种使用这种重组宿主制备糖基化二 萜的方法,并且涉及一种可得自这种方法的发酵液。本发明还涉及一种通 过这种方法获得或可从这种发酵液获得的糖基化二萜,并且涉及一种包含 两种或更多种此类糖基化二萜的组合物。此外,本发明涉及一种包含这种 糖基化二萜或这种组合物的食品、饲料或饮料。本发明还涉及一种使用上述重组宿主将第一糖基化二萜转化为第二糖基化二萜的方法。此外,本发 明涉及变体UGT多肽、编码此类多肽的核酸序列、包含这种多核苷酸序列 的核酸构建体以及一种使用上述重组宿主产生变体UGT多肽的方法。
发明背景
多年生草本植物甜叶菊(Stevia rebaudiana Bert.)的叶子积聚大量被称 为甜菊醇糖苷的具有强烈甜味的化合物。虽然这些化合物的生物功能尚不 清楚,但它们作为替代性高效甜味剂具有商业意义。
这些甜的甜菊醇糖苷的功能和感官特性表现为优于许多高效甜味剂的 功能和感官特性。此外,研究表明甜菊苷能够降低II型糖尿病患者的血糖 水平,并且能够降低轻度高血压患者的血压。
甜菊醇糖苷积聚在甜叶菊叶中,其中它们可占叶干重的10%至20%。 甜菊苷和莱鲍迪甙A均是热和pH稳定的,并且适用于碳酸饮料和许多其 他食物。甜菊苷比蔗糖甜110与270倍之间,莱鲍迪甙A比蔗糖甜150与 320倍之间。此外,莱鲍迪甙D也是在甜叶菊叶中积聚的高效二萜糖苷甜 味剂。它可比蔗糖甜约200倍。莱鲍迪甙M是另一种高效二萜糖苷甜味剂。 它在某些甜叶菊品种叶中以痕量存在,但已表明其具有优异的味道特征。
传统上已从甜叶菊植物中提取了甜菊醇糖苷。在甜叶菊中,(-)-贝壳 杉烯酸(赤霉酸(GA)生物合成中的中间体)被转化成四环二萜甜菊醇, 其然后通过多步糖基化途径进行以形成各种甜菊醇糖苷。然而,产率可以 是可变的,并且受到农业和环境条件的影响。此外,甜叶菊种植需要大量 的土地面积、在收获前的很长时间、密集劳动以及用于提取和纯化糖苷的 额外成本。
最近,使用发酵工艺生产甜菊醇糖苷的兴趣日益增长。WO2013/110673 和WO2015/007748中描述了可用于产生至少甜菊醇糖苷莱鲍迪甙A和莱鲍 迪甙D的微生物。
此类微生物的进一步改进是令人希望的,以便可产生更高量的甜菊醇 糖苷和/或另外或新的甜菊醇糖苷和/或更高量的特异性甜菊醇糖苷和/或具 有期望比例的不同甜菊醇糖苷的甜菊醇糖苷的混合物。
发明概述
在甜叶菊中,甜菊醇由GGPP合成,所述GGPP由脱氧木酮糖5-磷酸 途径形成。两种二萜环化酶(-)-柯巴基二磷酸合酶(CPS)和(-)-贝壳 杉烯合酶(KS)的活性导致形成(-)-贝壳杉烯,所述(-)-贝壳杉烯然后 在三步反应中通过(-)-贝壳杉烯氧化酶(KO)氧化以形成(-)-贝壳杉 烯酸。
在甜叶菊叶中,(-)-贝壳杉烯酸然后通过对映-贝壳杉烯酸13-羟化酶 (KAH)羟基化以形成甜菊醇。甜菊醇然后通过一系列UDP-糖基转移酶 (UGT)糖基化,从而形成许多甜菊醇糖苷。具体地说,这些分子可被视 为甜菊醇分子,其羧基氢原子被葡萄糖分子代替以形成酯,并且羟基氢被 葡萄糖和鼠李糖的组合代替以形成缩醛。
这些途径可在重组宿主例如酵母如酵母属(Saccharomyces)和耶氏酵 母属(Yarrowia)中重建。
本发明涉及新的变体UDP-糖基转移酶(UGT)多肽的鉴定,其与当前 已知的那些相比通常具有改进的性质。这些多肽可用于产生重组宿主,所 述重组宿主产生更高量的甜菊醇糖苷和/或另外或新的甜菊醇糖苷和/或更 高量的特异性甜菊醇糖苷和/或具有期望比例的不同甜菊醇糖苷的甜菊醇 糖苷的混合物。
因此,本发明还涉及一种能够产生糖基化二萜(即二萜糖苷如甜菊醇 糖苷)的重组宿主,所述糖基化二萜如甜菊单糖苷、甜菊双糖苷、甜菊苷、 莱鲍迪甙A、莱鲍迪甙B、莱鲍迪甙C、莱鲍迪甙D、莱鲍迪甙E、莱鲍迪 甙F、莱鲍迪甙M、甜茶苷、杜克苷A、甜菊醇-13-单糖苷、甜菊醇-19-单 糖苷或13-[(β-D-吡喃葡萄糖基)氧基)贝壳衫-16-烯-18-酸2-O-β-D-吡喃 葡萄糖基-β-D-吡喃葡萄糖基酯甜菊醇-19-双糖苷,
因此,本发明涉及一种重组宿主,其包含通常具有UDP-糖基转移酶 (UGT)活性如UGT2活性的重组核酸序列,所述重组核酸序列编码多肽, 所述多肽:
a.与SEQ ID NO:1中列出的氨基酸序列具有至少约85%同一性;
b.与SEQ ID NO:3中列出的氨基酸序列具有至少约85%同一性;
c.与SEQ ID NO:6中列出的氨基酸序列具有至少约85%同一性;
d.与SEQ ID NO:9中列出的氨基酸序列具有至少约85%同一性;
e.与SEQ ID NO:11中列出的氨基酸序列具有至少约85%同一性;
f.与SEQ ID NO:14中列出的氨基酸序列具有至少约85%同一性;
g.与SEQ ID NO:17中列出的氨基酸序列具有至少约85%同一性;
h.与SEQ ID NO:20中列出的氨基酸序列具有至少约85%同一性;
i.与SEQ ID NO:22中列出的氨基酸序列具有至少约85%同一性; 或
j.与SEQ ID NO:25中列出的氨基酸序列具有至少约85%同一性。
本发明还涉及:
–一种用于制备糖基化二萜的方法,所述方法包括在合适的发酵培养 基中发酵本发明的重组宿主,并且任选地回收糖基化二萜;
–一种发酵液,其包含能够通过本发明的方法获得的糖基化二萜;
–一种通过这种方法获得或能够从这种发酵液获得的糖基化二萜;
–一种包含两种或更多种此类二萜的组合物;
–一种包含这种糖基化二萜的食品、饲料或饮料;
–一种用于将第一糖基化二萜转化为第二糖基化二萜的方法,所述方 法包括:
–使所述第一糖基化二萜与本发明的重组宿主、源自这种重组宿 主的无细胞提取物或源自其任一者的酶制剂接触;
–从而将所述第一糖基化二萜转化为所述第二糖基化二萜。
–一种具有UGT2活性的多肽,其中所述多肽选自由以下各项组 成的组:
(a)包含在SEQ ID NO:1、3、6、9、11、14、17、20、22或25中 的任一个中列出的氨基酸序列的多肽;或
(b)包含与SEQ ID NO:1、3、6、9、11、14、17、20、22或25中 的任一个的氨基酸序列具有至少约85%序列同一性的氨基酸序列的多肽; 或
(c)由包含在SEQ ID NO:2、4、5、7、8、10、12、13、15、16、 18、19、21、23、24或26中的任一个中列出的多核苷酸序列的多核苷酸编 码的多肽;或
(d)由包含与SEQ ID NO:2、4、5、7、8、10、12、13、15、16、 18、19、21、23、24或26中的任一个中的多肽编码序列具有至少50%序 列同一性的多核苷酸序列的多核苷酸编码的多肽;或
(e)由优选在至少低严格性条件下与SEQ ID NO:2、4、5、7、8、 10、12、13、15、16、18、19、21、23、24或26中的任一个的互补链杂交 的多核苷酸编码的多肽;或
(f)由优选在至少低严格性条件下与同SEQ ID NO:2、4、5、7、8、 10、12、13、15、16、18、19、21、23、24或26中的任一个具有至少50% 序列同一性的多核苷酸的互补链杂交的多核苷酸编码的多肽;或
(g)在(a)、(b)、(c)、(d)、(e)或(f)中定义的多肽的片段。
–一种编码这种多肽的多核苷酸序列;
–一种包含这种多核苷酸序列的核酸构建体;以及
–一种产生本发明的多肽的方法,所述方法包括:
(a)在有利于通过本发明的重组宿主产生所述多肽的条件下培养宿 主细胞,以及任选地
(b)回收所述多肽。
附图说明
图1示出了质粒pUG7-EcoRV的示意性图示。
图2示出了(A)设计ERG20、tHMG1和BTS1过度表达盒并且(B) 整合到酵母基因组中的方法的示意性图示。(C)示出了在通过Cre重组酶 除去KANMX标记后的最终情况。
图3示出了ERG9敲低构建体的示意性图示。所述构建体由ERG9的 500bp长的3'部分、TRP1启动子的98bp、TRP1开放阅读框和终止子、随 后ERG9的400bp长的下游序列组成。由于在ERG9开放阅读框末端处引 入Xbal位点,所以最后一个氨基酸变成Ser,并且终止密码子变成Arg。 新的终止密码子位于TPR1启动子中,从而导致18个氨基酸的延伸。
图4示出了UGT2如何整合到基因组中的示意性图示。A.在转化中使 用的不同片段;B.整合后的情况;C.在Cre重组酶表达后的情况)。
图5示出了从GGPP至甜菊醇的途径如何整合到基因组中的示意性图 示。A.在转化中使用的不同片段;B.在整合后的情况。
图6示出了携带CRE基因的pSH65质粒,其用于除去抗生素标志物。
图7示出了质粒pUG7-NAT的图谱。
图8示出了用Nat选择标记从STV008置换UGT2_1a。
图9示出了从STV008除去NAT标记。
图10示出了将UGT2基因整合在Chr09.01基因座处。
图11示出了携带UGT2的不同变体的酵母属菌株中的莱鲍迪甙A的产 生。
图12示出了表达UGT2的不同变体的酵母属菌株中的莱鲍迪甙M的 产生,作为表达UGT2_1a的酵母属菌株中的莱鲍迪甙M产生的百分比。
图13示出了携带基因tHMG和UGT2_1a的质粒MB6969的图谱。
图14示出了携带基因tHMG的质粒MB6856的图谱。
图15示出了携带基因tHMG的质粒MB6857的图谱。
图16示出了携带基因GGS的质粒MB6948的图谱。
图17示出了携带基因GGS的质粒MB6958的图谱。
图18示出了携带基因UGT1、UGT3和UGT4的质粒MB7015的图谱。
图19示出了携带基因tHMG和GGS的质粒MB6986的图谱。
图20示出了携带基因tCPS_SR、tKS_SR、KAH_4、KO_Gib和CPR_3 的质粒MB7059的图谱。
图21示出了携带基因tCPS_SR、tKS_SR、KAH_4、KO_Gib和CPR_3 的质粒MB7100的图谱。
图22示出了携带基因tHMG和GGS的质粒MB6988的图谱。
图23示出了携带基因tCPS_SR、tKS_SR、KAH_4、KO_Gib和CPR_3 的质粒MB7044的图谱。
图24示出了携带基因tCPS_SR、tKS_SR、KAH_4、KO_Gib和CPR_3 的质粒MB7094的图谱。
图25示出了携带CRE基因的质粒MB6128的图谱,其用于除去抗生 素标志物。
图26示出了在由gsy1整合侧翼侧接的基因UGT2、KanMX、UGT1 和KAH_4的质粒中组装的方法。
图27示出了图26的质粒的扩增和转化至耶氏酵母属的方法。
图28示出了表达UGT2的不同变体的耶氏酵母属菌株中的莱鲍迪甙A 的产生。
图29示出了表达UGT2的不同变体的耶氏酵母属菌株中的莱鲍迪甙M 的产生,作为表达UGT2_1a的耶氏酵母属菌株中的莱鲍迪甙M产生的百 分比。
图30示出了表达UGT2_6b(左图)或UGT2_7b(右图)的菌株中的 RebA(上图)和RebM(下图)的产生。
图31示出了导致甜菊醇糖苷的生物合成的潜在途径的示意性图示。
图32示出了导致甜菊醇糖苷的生物合成的潜在途径的示意性图示。用 星号示出的化合物是13-[(β-D-吡喃葡萄糖基)氧基]贝壳杉-16-烯-18-酸 2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基酯。
序列表的描述
序列的描述在表13中列出。本文描述的序列可参考序列表或参考本文 所列的任何数据库登录号进行定义,例如在表13中。
发明详述
在本说明书和所附权利要求书中,词语“包含”、“包括”和“具有”以及变 化形式应被解释为包含性的。也就是说,这些词语意图表达在上下文允许 的情况下可包含未具体叙述的其他要素或整数。
不使用数量词修饰时在本文中用于指代一个或一个以上(即一个或至 少一个)的语法对象。举例来说,“要素”可意指一个要素或多于一个要素。
在本文,“莱鲍迪甙”可缩写为“reb”。即,例如莱鲍迪甙A和rebA意 图表示同一分子。
在涉及细胞、核酸、蛋白质或载体使用时,术语“重组”指示细胞、核 酸、蛋白质或载体已通过引入异源核酸或蛋白质或改变天然核酸或蛋白质 来进行修饰,或者指示细胞源自如此修饰的细胞。因此,例如,重组细胞 表达在细胞的天然(非重组)形式中未发现的基因或者表达以其他形式异 常表达、低表达或完全未表达的天然基因。术语“重组的”与“遗传修饰的” 同义。
本发明涉及具有UDP-糖基转移酶(UGT)活性的新的变体多肽。出于 本发明的目的,具有UGT活性的多肽是具有糖基转移酶活性(EC 2.4)的 多肽,即可充当单糖单元从活化的核苷酸糖(也称为“糖基供体”)转移至 糖基受体分子(通常为醇)的催化剂的多肽。用于UGT的糖基供体通常是 核苷酸糖尿苷二磷酸葡萄糖(尿嘧啶二磷酸葡萄糖,UDP-葡萄糖)。本发 明的多肽通常具有UGT活性,并且本发明的多核苷酸序列通常编码这种多 肽。通常,本发明的多肽是具有UGT2型活性的变体多肽。
根据本发明,因此提供了多肽,通常为具有UGT活性的多肽,其中所 述多肽选自由以下各项组成的组:
(a)包含在SEQ ID NO:1、3、6、9、11、14、17、20、22或25中的 任一个中列出的氨基酸序列的多肽;或
(b)包含与SEQ ID NO:1、3、6、9、11、14、17、20、22或25中的 任一个的氨基酸序列具有至少约85%序列同一性的氨基酸序列的多肽;或
(c)由包含在SEQ ID NO:2、4、5、7、8、10、12、13、15、16、18、 19、21、23、24或26中的任一个中列出的多核苷酸序列的多核苷酸编码的 多肽;或
(d)由包含与SEQ ID NO:2、4、5、7、8、10、12、13、15、16、18、 19、21、23、24或26中的任一个中的多肽编码序列具有至少50%序列同 一性的多核苷酸序列的多核苷酸编码的多肽;或
(e)由优选在至少低严格性条件下与SEQ ID NO:2、4、5、7、8、10、 12、13、15、16、18、19、21、23、24或26中的任一个的互补链杂交的多 核苷酸编码的多肽;或
(f)由优选在至少低严格性条件下与同SEQ ID NO:2、4、5、7、8、 10、12、13、15、16、18、19、21、23、24或26中的任一个具有至少50% 序列同一性的多核苷酸的互补链杂交的多核苷酸编码的多肽;或
(g)在(a)、(b)、(c)、(d)、(e)或(f)中定义的多肽的片段。
这种多肽可包含与SEQ ID NO:1、3、6、9、11、14、17、20、22或 25中的任一个具有至少约86%序列同一性、至少约87%、至少约88%、至 少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约 94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99% 序列同一性的氨基酸序列。
因此,本发明涉及:
-通常具有UGT活性的多肽,所述多肽包含与SEQ ID NO:1具有至少 约86%序列同一性、至少约87%、至少约88%、至少约89%、至少约90%、 至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少 约96%、至少约97%、至少约98%、至少约99%序列同一性的氨基酸序列;
-通常具有UGT活性的多肽,所述多肽包含与SEQ ID NO 3具有至少 约86%序列同一性、至少约87%、至少约88%、至少约89%、至少约90%、 至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少 约96%、至少约97%、至少约98%、至少约99%序列同一性的氨基酸序列;
-通常具有UGT活性的多肽,所述多肽包含与SEQ ID NO:6具有至少 约86%序列同一性、至少约87%、至少约88%、至少约89%、至少约90%、 至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少 约96%、至少约97%、至少约98%、至少约99%序列同一性的氨基酸序列;
-通常具有UGT活性的多肽,所述多肽包含与SEQ ID NO:9具有至少 约86%序列同一性、至少约87%、至少约88%、至少约89%、至少约90%、 至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少 约96%、至少约97%、至少约98%、至少约99%序列同一性的氨基酸序列;
-通常具有UGT活性的多肽,所述多肽包含与SEQ ID NO:11具有至 少约86%序列同一性、至少约87%、至少约88%、至少约89%、至少约90%、 至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少 约96%、至少约97%、至少约98%、至少约99%序列同一性的氨基酸序列;
-通常具有UGT活性的多肽,所述多肽包含与SEQ ID NO:14具有至 少约86%序列同一性、至少约87%、至少约88%、至少约89%、至少约90%、 至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少 约96%、至少约97%、至少约98%、至少约99%序列同一性的氨基酸序列;
-通常具有UGT活性的多肽,所述多肽包含与SEQ ID NO:17具有至 少约86%序列同一性、至少约87%、至少约88%、至少约89%、至少约90%、 至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少 约96%、至少约97%、至少约98%、至少约99%序列同一性的氨基酸序列;
-通常具有UGT活性的多肽,所述多肽包含与SEQ ID NO:20具有至 少约86%序列同一性、至少约87%、至少约88%、至少约89%、至少约90%、 至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少 约96%、至少约97%、至少约98%、至少约99%序列同一性的氨基酸序列;
-通常具有UGT活性的多肽,所述多肽包含与SEQ ID NO:22具有至 少约86%序列同一性、至少约87%、至少约88%、至少约89%、至少约90%、 至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少 约96%、至少约97%、至少约98%、至少约99%序列同一性的氨基酸序列; 以及
-通常具有UGT活性的多肽,所述多肽包含与SEQ ID NO:25具有至 少约86%序列同一性、至少约87%、至少约88%、至少约89%、至少约90%、 至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少 约96%、至少约97%、至少约98%、至少约99%序列同一性的氨基酸序列。
如本文所用,术语“多肽”是指包含通过肽键连接的氨基酸残基并含有 多于五个氨基酸残基的分子。氨基酸由单字母或三字母名称标识。如本文 所用的术语“蛋白质”与术语“多肽”同义,并且还可指两种或更多种多肽。 因此,术语“蛋白质”、“肽”和“多肽”可互换使用。多肽可任选地进行修饰(例 如,糖基化、磷酸化、酰化、法尼基化、异戊二烯化、磺化等)以增加官 能度。展现活性的多肽可被称为酶。应理解,作为遗传密码简并的结果, 可产生编码给定多肽的许多核苷酸序列。
本发明的多肽可包含信号肽和/或前肽序列。在本发明的多肽包含信号 肽和/或前肽的情况下,可在成熟多肽序列上计算序列同一性。
本发明的多肽通常具有UGT活性,并且更优选地具有UGT2活性。图 31和32示出了可通过具有UGT2的多肽催化的反应的非详尽列表。
具有UGT2活性的多肽是充当尿苷5'-二磷酸葡糖基:甜菊醇-13-O-糖苷 转移酶(也称为甜菊醇-13-单葡糖苷1,2-转葡糖基酶)的多肽,其将葡萄糖 部分转移至受体分子甜菊醇-13-O-糖苷的13-O-葡萄糖的C-2'。通常,合适 的UGT2多肽也充当尿苷5'-二磷酸葡糖基:甜茶苷转移酶,其将葡萄糖部分 转移至受体分子甜茶苷13-O-葡萄糖的C-2'。
具有UGT2活性的多肽也可催化利用除甜菊醇-13-O-糖苷和甜茶苷以 外的甜菊醇糖苷底物的反应,例如,功能性UGT2多肽可利用甜菊苷作为 底物,从而将葡萄糖部分转移至19-O-葡萄糖残基的C-2'以产生莱鲍迪甙E。 功能性UGT2多肽还可利用莱鲍迪甙A作为底物,从而将葡萄糖部分转移 至19-O-葡萄糖残基的C-2'以产生莱鲍迪甙D。
具有UGT2活性的多肽也可催化利用甜菊醇-19-糖苷或甜茶苷作为底 物的反应,例如,功能性UGT2多肽可利用甜菊醇-19-糖苷或甜茶苷作为底 物,从而将葡萄糖部分转移至19位以分别产生甜菊醇-19-双糖苷或 13-[(β-D-吡喃葡萄糖基)氧基)贝壳杉-16-烯-18-酸2-O-β-D-吡喃葡萄糖 基-β-D-吡喃葡萄糖基酯。
然而,功能性UGT2多肽通常不将葡萄糖部分转移至在C-13位具有 1,3-结合的葡萄糖的甜菊醇化合物,即将葡萄糖部分转移至甜菊醇1,3-双糖 苷和1,3-甜菊苷通常不会发生。
具有UGT2活性的多肽也可从除尿苷二磷酸葡萄糖以外的供体转移糖 部分。例如,具有UGT2活性的多肽充当尿苷5'-二磷酸D-木糖基:甜菊醇 -13-O-糖苷转移酶,其将木糖部分转移至受体分子甜菊醇-13-O-糖苷的 13-O-葡萄糖的C-2'。作为另一个实例,具有UGT2活性的多肽可充当尿苷 5'-二磷酸L-鼠李糖基:甜菊醇-13-O-糖苷转移酶,其将鼠李糖部分转移至受 体分子甜菊醇的13-O-葡萄糖的C-2'。
一种或多种上述活性可用于定义具有UGT2活性的多肽。与UGT2_1a 多肽(SEQ IDNO:27)相比,本发明的多肽可在一种或多种上述活性方面 具有改善的UGT2活性。
本发明的多肽可用于将重组细胞中的甜菊醇糖苷的产生导向所需的甜 菊醇糖苷,如莱鲍迪甙A、莱鲍迪甙D或莱鲍迪甙M。例如,优先催化甜 菊醇-13-单糖苷转化为甜菊双糖苷和/或甜茶苷转化为甜菊苷的UGT2多肽 可有助于使产生转向莱鲍迪甙A,而优先催化甜菊苷转化为rebE或甜茶苷 转化为在19位具有另外糖的化合物的UGT2多肽可有助于使产生转向莱鲍 迪甙M。也就是说,在13位添加糖部分的优先可有助于使产生转向莱鲍迪 甙A,而在19位添加糖部分的优先可有助于使产生转向莱鲍迪甙M。
本发明还提供了编码如本文所述的多肽的多核苷酸序列。
这种多核苷酸序列可选自由以下各项组成的组:
(a)包含SEQ ID NO:2、4、5、7、8、10、12、13、15、16、18、19、 21、23、24或26中的任一个或包含与SEQ ID NO:2、4、5、7、8、10、 12、13、15、16、18、19、21、23、24或26中的任一个的多核苷酸序列具 有至少30%序列同一性的多核苷酸序列的多核苷酸序列;或
(b)优选在至少低严格性条件下与SEQ ID NO:2、4、5、7、8、10、 12、13、15、16、18、19、21、23、24或26中的任一个的互补链杂交的多 核苷酸序列;或
(c)优选在至少低严格性条件下与同SEQ ID NO:2、4、5、7、8、10、 12、13、15、16、18、19、21、23、24或26中的任一个具有至少30%序 列同一性的多核苷酸的互补链杂交的多核苷酸序列;
(d)作为在(a)、(b)或(c)中任一项所定义的多核苷酸序列的遗传 密码简并性的结果的简并物的多核苷酸序列;或
(e)为在(a)、(b)、(c)或(d)中定义的核苷酸序列的互补物的多 核苷酸序列。
本发明的多核苷酸序列可与SEQ ID NO:2、4、5、7、8、10、12、13、 15、16、18、19、21、23、24或26中的任一个具有至少40%、至少50%、 至少60%、优选至少70%、更优选至少80%、最优选至少90%、最优选至 少93%、最优选至少约95%、最优选至少约96%、最优选至少约97%、甚 至最优选至少约98%以及甚至更优选至少99%的序列同一性。
如在本发明中使用的术语“核酸”是指包含至少5个核苷酸单元的核苷 酸聚合物。核酸是指核糖核苷酸聚合物(RNA)、脱氧核苷酸聚合物(DNA) 或任一类型的核酸的修饰形式或其合成形式或上述中的任一种的混合聚合 物。核酸可包括通过天然存在和/或非天然存在的核酸键连接在一起的天然 存在的核酸和修饰的核酸中的任一者或两者。核酸分子可被化学或生物化 学修饰或可含有非天然或衍生化的核酸碱基,如本领域的技术人员所容易 了解的。此类修饰包括例如标记、甲基化、以类似物替换一个或多个天然 存在的核酸、核苷酸间修饰如不带电键联(例如,膦酸甲酯、磷酸三酯、 氨基磷酸酯、氨基甲酸酯等)、带电键联(例如,硫代磷酸酯、二硫代磷酸 酯等)、悬垂(pendent)部分(例如,多肽)、嵌入剂(例如,吖啶、补骨 脂素等)、螯合剂、烷基化剂以及修饰的键联(例如,α异头核酸等)。术 语核酸还旨在包括任何拓扑构象,包括单链(有义链和反义链)、双链、部 分双链体、三链体、发夹、环形和挂锁构象。还包括在经由氢键合和其他 化学相互作用在结合至指定序列的能力方面模拟核酸的合成分子。此类分 子在本领域中是已知的并且包括例如其中肽键联取代分子骨架中的磷酸酯 键的那些分子。提及核酸序列涵盖其互补物,除非另有说明。因此,提及 具有特定序列的核酸分子应理解为涵盖其互补链及其互补序列。互补链也 适用于例如反义疗法、杂交探针和PCR引物。术语“核酸”、“多核苷酸”和“多 核苷酸序列”可在本文中互换使用。
如本文所用的,术语“杂交”是指寡聚化合物的基本上互补链的配对。 一种配对机制涉及寡聚化合物链的互补核苷酸碱基(核苷酸)之间的氢键 合,所述氢键合可以是沃森-克里克(Watson-Crick)、霍氏
Figure BDA0001410935660000131
或 反霍氏氢键合。例如,腺嘌呤与胸腺嘧啶是通过形成氢键配对的互补核酸。 杂交可在不同情形下发生。本文使用“严格杂交”或“在低严格条件、中等严 格条件、高严格条件或非常高严格条件下杂交”来描述用于杂交和洗涤的条 件,更具体地说,寡聚化合物将与其靶序列而与最小数量的其他序列杂交 的条件。因此,寡聚化合物将与靶序列杂交至比与其他序列杂交可检测到 的更高程度。对于进行杂交反应的指导可见于Current Protocols in Molecular Biology,John Wiley&Sons,N.Y.(1989),6.3.1-6:3.6中。在所述参考文献 中描述了水性和非水性方法并且可使用任一方法。严格条件是序列依赖性 的并且将在不同情况下有所不同。通常,对于在限定离子强度和pH下的寡 聚化合物而言,严格条件被选择为低于热熔点(Tm)约5℃。Tm是50% 寡聚化合物与完全匹配探针杂交时所处的温度(在确定离子强度和pH下)。 还可通过添加去稳定剂如甲酰胺来实现严格条件。
特异性杂交条件的实例如下所示:1)在约45℃下在6X氯化钠/柠檬酸 钠(SSC)中、随后至少在50℃下在0.2X SSC、0.1%SDS中洗涤2次的低 严格杂交条件(对于低严格条件而言,洗涤的温度可增加至55℃);2)在 约45℃下在6X SSC中、随后在60℃下在0.2X SSC、0.1%SDS中洗涤一 次或多次的中等严格杂交条件;3)在约45℃下在6X SSC中、随后在65℃下在0.2X SSC、0.1%SDS中洗涤一次或多次的高严格杂交条件;以及4) 非常高严格杂交条件是在65℃下0.5M磷酸钠、7%SDS,随后在65℃下在 0.2X SSC、1%SDS中洗涤一次或多次。
通常,高严格条件如高杂交温度和任选的低盐浓度仅允许高度相似的 序列之间的杂交,而低严格条件如低杂交温度和任选的高盐浓度允许在序 列相似性更小时的杂交。
本发明还提供了包含本发明的多核苷酸序列的核酸构建体。
术语“核酸构建体”是指单链或双链的核酸分子,其从天然存在的基因 中分离或已经被修饰以含有以否则将不会在自然中存在的方式组合和并置 的核酸的区段。当核酸构建体含有表达编码序列所需要的所有控制序列时, 术语核酸构建体与术语“表达盒”的含义相同,其中所述控制序列可操作地 连接至所述编码序列。
本发明的核酸可以是表达载体,其中本发明的多核苷酸序列与至少一 个用于在宿主细胞中表达多核苷酸序列的控制序列可操作地连接。
如本文所用的术语“可操作地连接”是指物理地连接并且彼此有功能性 关系的两个或多个核酸序列元件。例如,如果启动子能够起始或调控编码 序列的转录或表达,则启动子可操作地连接至编码序列,在这种情况下, 所述编码序列应被理解为在启动子的“控制下”。通常,当两个核酸序列可 操作地连接时,它们将处于相同的取向并且通常也在同一阅读框中。它们 通常将是基本上连续的,尽管这可能不是必需的。
表达载体包含编码本发明多肽的多核苷酸,其可操作地连接至用于在 体外或在宿主细胞中表达和/或翻译多核苷酸的适当控制序列(如启动子以 及转录和翻译终止信号)。
表达载体可以是能够方便地进行重组DNA程序并能使多核苷酸表达 的任何载体(例如,质粒或病毒)。载体的选择通常将取决于所述载体与待 引入所述载体的细胞的相容性。载体可以是线性或闭合的环状质粒。载体 可以是自主复制型载体,即作为染色体外实体而存在、其复制独立于染色 体复制的载体,例如,质粒、染色体外元件、微型染色体或人工染色体。
或者,载体可以是当被引入宿主细胞时整合至基因组中并与其已整合 至其中的染色体一起复制的载体。整合型克隆载体可随机或在预定靶基因 座处整合在宿主细胞的染色体中。本发明的载体可包含一个或多个选择性 标记,其允许容易地选择转化的细胞。
本发明还提供了一种重组宿主,其包含编码本发明多肽的重组核酸序 列。
也就是说,本发明的重组宿主可包含例如编码以下多肽的重组核酸序 列,所述多肽:
a.与SEQ ID NO:1中列出的氨基酸序列具有至少约85%同一性;
b.与SEQ ID NO:3中列出的氨基酸序列具有至少约85%同一性;
c.与SEQ ID NO:6中列出的氨基酸序列具有至少约85%同一性;
d.与SEQ ID NO:9中列出的氨基酸序列具有至少约85%同一性;
e.与SEQ ID NO:11中列出的氨基酸序列具有至少约85%同一性;
f.与SEQ ID NO:14中列出的氨基酸序列具有至少约85%同一性;
g.与SEQ ID NO:17中列出的氨基酸序列具有至少约85%同一性;
h.与SEQ ID NO:20中列出的氨基酸序列具有至少约85%同一性;
i.与SEQ ID NO:22中列出的氨基酸序列具有至少约85%同一性; 或
j.与SEQ ID NO:25中列出的氨基酸序列具有至少约85%同一性。
本发明的重组宿主可包含编码本文所述的本发明多肽的任何多核苷 酸。本发明的重组宿主通常能够表达本发明的多肽。
通常,本发明的重组宿主能够产生糖基化二萜,如甜菊醇糖苷。例如, 本发明的重组宿主可能够产生例如甜菊醇-13-单糖苷、甜菊醇-19-单糖苷、 13-[(β-D-吡喃葡萄糖基)氧基]贝壳杉-16-烯-18-酸2-O-β-D-吡喃葡萄糖基 -β-D-吡喃葡萄糖基酯、甜茶苷、甜菊苷、甜菊醇-19-双糖苷、甜菊双糖苷、 rebA、rebE、rebD或rebM中的一种或多种。
根据本发明的重组宿主可包含一个或多个编码以下中的一种或多种的 重组核苷酸序列:
具有对映-柯巴基焦磷酸合酶活性的多肽;
具有对映-贝壳杉烯合酶活性的多肽;
具有对映-贝壳杉烯氧化酶活性的多肽;以及
具有贝壳杉烯酸13-羟化酶活性的多肽。
出于本发明的目的,具有对映-柯巴基焦磷酸合酶(EC 5.5.1.13)的多 肽能够催化化学反应:
Figure RE-GDA0001459475990000011
所述酶具有一种底物,香叶基香叶基焦磷酸;以及一种产物,对映-柯 巴基焦磷酸。所述酶参与赤霉素生物的合成。所述酶属于异构酶家族,特 别是分子内裂解酶的类别。所述酶类别的系统名称是对映-柯巴基-二磷酸裂 解酶(脱环)。通常使用的其他名称包括具有对映-柯巴基焦磷酸合酶、对 映-贝壳杉烯合酶A和对映-贝壳杉烯合成酶A。
编码对映-柯巴基焦磷酸合酶的合适核酸序列可例如包含在 WO2015/007748的SEQ ID.NO:1、3、5、7、17、19、59、61、141、142、 151、152、153、154、159、160、182或184中列出的序列。
出于本发明的目的,具有对映-贝壳杉烯合酶活性(EC 4.2.3.19)的多 肽是能够催化以下化学反应的多肽:
Figure BDA0001410935660000161
因此,所述酶具有一种底物,对映-柯巴基二磷酸;以及两种产物,对 映-贝壳杉烯和二磷酸。
所述酶属于裂解酶家族,特别是作用于磷酸盐/酯的碳-氧裂解酶。所述 酶类别的系统名称是对映-柯巴基二磷酸二磷酸-裂解酶(环化,对映-贝壳 杉烯形成)。常用的其它名称包括对映-贝壳杉烯合酶B、对映-贝壳杉烯合 成酶B、对映-柯巴基-二磷酸二磷酸-裂解酶和(环化)。所述酶参与双萜类 生物合成。
编码对映-贝壳杉烯合酶的合适核酸序列可例如包含在 WO2015/007748的SEQID.NO:9、11、13、15、17、19、63、65、143、 144、155、156、157、158、159、160、183或184中列出的序列。
对映-柯巴基二磷酸合酶还可具有与相同蛋白质分子相关联的不同对 映-贝壳杉烯合酶活性。由对映-贝壳杉烯合酶催化的反应是赤霉素的生物合 成途径中的下一步骤。两种类型的酶活性是不同的,并且定点诱变以抑制 蛋白质的对映-贝壳杉烯合酶活性导致对映-柯巴基焦磷酸的积累。
因此,本发明中使用的单个核苷酸序列可编码具有对映-柯巴基焦磷酸 合酶活性和对映-贝壳杉烯合酶活性的多肽。或者,两种活性可被两个不同 的分离的核苷酸序列编码。
出于本发明的目的,具有对映-贝壳杉烯氧化酶活性(EC 1.14.13.78) 的多肽是能够催化对映-贝壳杉烯的4-甲基的三次连续氧化以产生贝壳杉 烯酸的多肽。这种活性通常需要细胞色素P450的存在。
编码对映-贝壳杉烯氧化酶的合适核酸序列可例如包含在 WO2015/007748的SEQID.NO:21、23、25、67、85、145、161、162、163、 180或186中列出的序列。
出于本发明的目的,具有贝壳杉烯酸13-羟化酶活性(EC 1.14.13)的 多肽是能够催化使用NADPH和O2形成甜菊醇(对映-贝壳杉-16-烯-13-醇 -19-酸)的多肽。这种活性也可称为对映-贝壳杉烯酸13-羟化酶活性。
编码贝壳杉烯酸 13-羟化酶的合适核酸序列可例如包含在 WO2015/007748的SEQID.NO:27、29、31、33、69、89、91、93、95、 97、146、164、165、166、167或185中列出的序列。
本发明的重组宿主可包含编码具有NADPH-细胞色素p450还原酶活性 的多肽的重组核酸序列。也就是说,本发明的重组宿主可能够表达编码具 有NADPH-细胞色素p450还原酶活性的多肽的核苷酸序列。出于本发明的 目的,具有NADPH-细胞色素P450还原酶活性(EC 1.6.2.4;也称为NADPH: 高铁血红蛋白氧化还原酶、NADPH:血红素蛋白氧化还原酶、NADPH:P450 氧化还原酶、P450还原酶、POR、CPR、CYPOR)的多肽通常是一种这样 的多肽,其为膜结合酶,从而允许电子从含有FAD和FMN的酶NADPH: 细胞色素P450还原酶(POR;EC1.6.2.4)转移至真核细胞的微粒体中的 细胞色素P450。
根据前述权利要求中任一项所述的重组宿主,其包含一个或多个编码 以下中的一种或多种的重组核酸序列:
(i)具有UGT74G1活性(UGT3活性)的多肽;
(ii)具有UGT85C2活性(UGT1活性)的多肽;以及
(iii)具有UGT76G1活性(UGT4活性)的多肽。
图31和32示出了导致甜菊醇糖苷的生物合成的潜在途径的示意性图 示。
本发明的重组宿主通常将包含至少一种编码具有UGT1活性的多肽的 重组核酸、至少一种编码具有UGT2活性的多肽的重组核酸、至少一种编 码具有UGT3活性的多肽的重组核酸以及至少一种编码具有UGT4活性的 多肽的重组核酸。一种核酸可编码两种或更多种此类多肽。
编码本发明的多肽的核酸可用于将重组细胞中的甜菊醇糖苷的产生导 向期望的甜菊醇糖苷,如莱鲍迪甙A、莱鲍迪甙D或莱鲍迪甙M。例如, 编码优先催化甜菊醇-13-单糖苷转化为甜菊双糖苷和/或甜茶苷转化为甜菊 苷的UGT2多肽的重组核酸可有助于使产生转向莱鲍迪甙A,而编码优先 催化甜菊苷转化为rebE或甜茶苷转化为在19位具有另外糖的化合物的 UGT2多肽的重组核酸可有助于使产生转向莱鲍迪甙M。也就是说,在13 位添加糖部分的优先可有助于使产生转向莱鲍迪甙A,而在19位添加糖部 分的优先可有助于使产生转向莱鲍迪甙M。
本发明的重组宿主可包含编码能够催化向甜菊醇中添加C-13-葡萄糖 的多肽的核苷酸序列。也就是说,本发明的重组宿主可包含能够催化将甜 菊醇转化为甜菊醇单糖苷的反应的UGT。
本发明的这种重组宿主可包含编码具有由UDP-糖基转移酶(UGT) UGT85C2所示的活性的多肽的核苷酸序列,由此宿主转化后的核苷酸序列 赋予所述宿主将甜菊醇转化为甜菊醇单糖苷的能力。
UGT85C2活性是将葡萄糖单元转移至甜菊醇的13-OH。因此,合适的 UGT85C2可充当尿苷5'-二磷酸葡糖基:甜菊醇13-OH转移酶和尿苷5'-二磷 酸葡糖基:甜菊醇-19-O-糖苷13-OH转移酶。功能性UGT85C2多肽还可催 化葡糖基转移酶反应,所述反应利用除甜菊醇和甜菊醇-19-O-糖苷以外的甜 菊醇糖苷底物。此类序列可在本文中称为UGT1序列。
本发明的重组宿主可包含编码具有UGT活性的多肽的核苷酸序列,可 包含编码能够催化向甜菊醇或甜菊醇单糖苷添加C-13-葡萄糖的多肽的核 苷酸序列。也就是说,本发明的重组体可包含能够催化将甜菊醇单糖苷转 化为甜菊双糖苷的反应的UGT。因此,这种重组宿主可能够将甜菊单糖苷 转化为甜菊双糖苷。这种核苷酸序列的表达可赋予宿主产生至少甜菊双糖 苷的能力。
本发明的重组微生物也包含编码具有UGT活性的多肽的核苷酸序列, 可包含编码能够催化向甜菊双糖苷添加C-19-葡萄糖的多肽的核苷酸序列。 也就是说,本发明的微生物可包含能够催化将甜菊双糖苷转化为甜菊苷的 反应的UGT。因此,这种微生物可能够将甜菊双糖苷转化为甜菊苷。这种 核苷酸序列的表达可赋予微生物产生至少甜菊苷的能力。
因此,本发明的微生物还可包含编码具有由UDP-糖基转移酶(UGT) UGT74G1所示活性的多肽的核苷酸序列,由此微生物转化后的核苷酸序列 赋予细胞将甜菊双糖苷转化为甜菊苷的能力。
合适的UGT74G1多肽可能够将葡萄糖单元分别转移至甜菊醇的 13-OH或19-COOH。合适的UGT74G1多肽可充当尿苷5'-二磷酸葡糖基: 甜菊醇19-COOH转移酶和尿苷5'-二磷酸葡糖基:甜菊醇-13-O-糖苷 19-COOH转移酶。功能性UGT74G1多肽还可催化使用除甜菊醇和甜菊醇 -13-O-糖苷以外的甜菊醇糖苷底物或者从除尿苷二磷酸葡萄糖以外的供体 转移糖部分的糖基转移酶反应。此类序列可在本文中称为UGT3序列。
本发明的重组宿主可包含编码能够催化甜菊苷的C-13位置处的葡萄糖 的C-3'的葡糖基化的多肽的核苷酸序列。也就是说,本发明的重组宿主可 包含UGT,所述UGT能够催化甜菊苷至莱鲍迪甙A的反应。因此,这种 重组宿主可能够将甜菊苷转化为莱鲍迪甙A。这种核苷酸序列的表达可赋 予宿主产生至少莱鲍迪甙A的能力。
因此,本发明的重组微生物还可包含编码具有由UDP-糖基转移酶 (UGT)UGT76G1所示的活性的多肽的核苷酸序列,由此微生物转化后 的核苷酸序列赋予细胞将甜菊苷转化为莱鲍迪甙A的能力。
合适的UGT76G1向受体分子甜菊醇1,2糖苷的C-13-O-葡萄糖的C-3' 添加葡萄糖部分。因此,UGT76G1例如充当尿苷5'-二磷酸葡糖基:甜菊醇 13-O-1,2葡糖苷C-3'葡糖基转移酶和尿苷5'-二磷酸葡糖基:甜菊醇-19-O-葡 萄糖、13-O-1,2双糖苷C-3'葡糖基转移酶。功能性UGT76G1多肽还可催化 葡糖基转移酶反应,所述反应使用含有除葡萄糖以外的糖的甜菊醇糖苷底 物,例如甜菊醇鼠李糖苷和甜菊醇木糖苷。此类序列可在本文中称为UGT4 序列。
本发明的重组宿主通常包含编码具有上述所有四种UGT活性的多肽 的核苷酸序列。给定核酸可编码具有一种或多种上述活性的多肽。例如, 核酸编码具有两种、三种或四种上述活性的多肽。优选地,本发明的重组 宿主包含UGT1、UGT2和UGT3以及UGT4活性。合适的UGT1、UGT3 和UGT4序列在WO2015/007748的表1中进行了描述。
本发明的重组宿主可包含编码具有UGT2活性的额外多肽的重组核酸 序列。也就是说,本发明的重组宿主可包含编码本发明的变体UGT2和本 发明的一种或多种另外的不同变体或任何另一不同的UGT2的核酸序列。
使用编码UGT2_1b、UGT2_2b、UGT2_3b、UGT2_4b、UGT2_5b、 UGT2_6b、UGT2_7b、UGT2_8b、UGT2_9b或UGT2_10b多肽(或如本文 所述的相关多肽)的核酸序列可适用于改进rebA产生。
使用编码UGT2_7b多肽(或如本文所述的相关多肽)的核酸序列可适 用于改进rebM的产生。
在本发明的重组宿主中,可上调宿主产生香叶基香叶基二磷酸(GGPP) 的能力。在本发明的上下文中上调意味着重组宿主比等同的非重组宿主产 生更多的GGPP。
因此,本发明的重组宿主可包含编码羟甲基戊二酰基-辅酶A还原酶、 法尼基-焦磷酸合成酶和香叶基香叶基二磷酸合酶的一个或多个核苷酸序 列,由此微生物转化后的所述核苷酸序列赋予微生物产生提高水平的GGPP 的能力。因此,根据本发明的重组宿主可包含编码羟甲基戊二酰基-辅酶A 还原酶、法尼基-焦磷酸合成酶和香叶基香叶基二磷酸合酶中的一种或多种 的一个或多个重组核酸序列。
因此,本发明的重组宿主可包含编码以下中的一种或多种的核酸序列:
具有羟甲基戊二酰基-辅酶A还原酶活性的多肽;
具有法尼基-焦磷酸合成酶活性的多肽;
具有香叶基香叶基二磷酸合酶活性的多肽。
如本文所定义的宿主或宿主细胞是适于遗传操作的生物体,以及可以 适用于目标产物的工业生产的细胞密度培养的生物体。合适的宿主可以是 微生物,例如可维持在发酵装置中的微生物。宿主细胞可以是在自然界中 发现的宿主细胞或源自遗传操作或传统诱变后的亲本宿主细胞的宿主细 胞。
如本文所用的,重组宿主是用如本文定义的一个或多个核苷酸序列进 行遗传修饰或转化/转染的宿主。所述一个或多个此类核苷酸序列的存在改 变微生物产生二萜糖苷、特别是一种或多种甜菊醇糖苷的能力。非重组宿 主,即未转化/转染或遗传修饰的宿主通常不包含一个或多个使得细胞能够 产生二萜糖苷的核苷酸序列。因此,非重组宿主通常是不天然地产生二萜 糖苷的宿主,但是天然产生二萜或二萜糖苷并且已经根据本发明进行了修 饰(且因此具有改变的产生二萜糖苷的能力)的宿主被认为是根据本发明 的重组宿主。
特别地,可行的是选自由对映-柯巴基焦磷酸合酶、对映-贝壳杉烯合酶、 对映-贝壳杉烯氧化酶和贝壳杉烯酸13-羟化酶、UGT、羟甲基戊二酰基-辅 酶A还原酶、法尼基-焦磷酸合成酶、香叶基香叶基二磷酸合酶和NADPH- 细胞色素p450还原酶组成的组的酶对宿主是天然的,并且用一个或多个编 码这些酶的核苷酸序列转化对赋予宿主细胞产生二萜糖苷的能力而言可以 不是必须的。根据本发明的优选宿主可以是能够天然产生GGPP(即以其非重组形式)的重组宿主。
宿主微生物产生二萜糖苷的进一步改进可通过传统菌株改良获得。
宿主细胞可以是原核、古细菌或真核宿主细胞。
原核宿主细胞可以是但不限于细菌宿主细胞。真核宿主细胞可以是但 不限于酵母、真菌、变形虫、藻类、动物、昆虫宿主细胞。
真核宿主细胞可以是真菌宿主细胞。“真菌”包括真菌(Eumycotina)亚 门的所有物种(Alexopoulos,C.J.,1962,在Introductory Mycology,John Wiley&Sons,Inc.(约翰威立出版有限公司),纽约)。因此,术语真菌包 括丝状真菌和酵母等等。
“丝状真菌”在本文中定义为真核微生物,其包括真菌和卵菌亚门的所 有丝状形式(如由Hawksworth等人,1995,同上所定义)。丝状真菌是以 由壳多糖、纤维素、葡聚糖、壳聚糖、甘露聚糖以及其它复合多糖构成的 菌丝壁为特征。营养体生长是通过菌丝延长,并且碳代谢是专性需氧的。 丝状真菌菌株包括但不限于以下各项的菌株:枝顶孢属(Acremonium)、曲 霉属(Aspergillus)、伞菌属(Agaricus)、短梗霉属(Aureobasidium)、隐球 菌属(Cryptococcus)、棒囊壳属(Corynascus)、金孢子菌属(Chrysosporium)、 网孢菌属(Filibasidium)、镰孢菌属(Fusarium)、腐质霉属(Humicola)、 稻瘟病菌属(Magnaporthe)、红曲霉属(Monascus)、毛霉菌属(Mucor)、 毁丝霉属(Myceliophthora)、被孢霉属(Mortierella)、新美鞭菌属 (Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青 霉菌属(Penicillium)、梨囊鞭菌属(Piromyces)、平革菌属(Phanerochaete)、 柄孢壳菌属(Podospora)、密孔菌属(Pycnoporus)、根霉菌属(Rhizopus)、 裂褶菌属(Schizophyllum)、粪壳菌属(Sordaria)、踝节菌属(Talaromyces)、篮状菌属(Rasmsonia)、热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、 弯颈霉属(Tolypocladium)、栓菌属(Trametes)以及木霉属(Trichoderma)。 可充当宿主细胞的优选丝状真菌菌株属于以下物种:黑曲霉(Aspergillus niger)、米曲霉(Aspergillusoryzae)、烟曲霉(Aspergillus fumigatus)、产 黄青霉(Penicillium chrysogenum)、桔青霉(Penicillium citrinum)、枝顶孢 霉(Acremonium chrysogenum)、里氏木霉(Trichoderma reesei)、埃默森篮 状菌(Rasamsonia emersonii)(先前称为埃默森踝节菌(Talaromyces emersonii))、酱油曲霉(Aspergillus sojae)、鲁克文金孢子菌(Chrysosporium lucknowense)、嗜热毁丝霉(Myceliophtora thermophyla)。用于比较转化和 未转化细胞的发酵特征的参考宿主细胞包括例如黑曲霉CBS120.49、CBS 513.88;米曲霉ATCC16868、ATCC 20423、IF0 4177、ATCC 1011、ATCC 9576、ATCC14488-14491、ATCC11601、ATCC12892;烟曲霉AF293 (CBS101355);产黄青霉CBS 455.95;桔青霉ATCC 38065;产黄青霉P2; 枝顶孢霉ATCC 36225、ATCC 48272;里氏木霉ATCC 26921、ATCC 56765、 ATCC26921;酱油曲霉ATCC11906;鲁克文金孢子菌ATCC44006以及所 有这些菌株的衍生株。作为丝状真菌宿主细胞特别优选的是黑曲霉CBS 513.88及其衍生株。
真核宿主细胞可以是酵母细胞。优选的酵母宿主细胞可选自以下属: 酵母属(例如,酿酒酵母(S.cerevisiae)、贝酵母(S.bayanus)、巴斯德酵 母(S.pastorianus)、卡尔斯伯酵母(S.carlsbergensis))、酒香酵母属 (Brettanomyces)、克鲁维酵母属(Kluyveromyces)、假丝酵母属(Candida) (例如,克鲁斯假丝酵母(C.krusei)、拉考夫假丝酵母(C.revkaufi)、铁 红假丝酵母(C.pulcherrima)、热带假丝酵母(C.tropicalis)、产朊假丝酵 母(C.utilis))、伊萨酵母属(Issatchenkia)(例如,东方伊萨酵母(I.orientalis))、毕赤酵母属(Pichia)(例如,巴斯德毕赤酵母(P.pastoris))、 裂殖酵母属(Schizosaccharomyces)、汉逊酵母属(Hansenula)、克勒克酵 母属(Kloeckera)、管囊酵母属(Pachysolen)、许旺酵母属(Schwanniomyces)、 毛孢子菌属(Trichosporon)、耶氏酵母属(例如,解脂耶氏酵母(Y.lipolytica) (先前分类为解脂假丝酵母(Candidalipolytica)))、Yamadazyma。
原核宿主细胞可以是细菌宿主细胞。细菌宿主细胞可以是革兰氏阴性 或革兰氏阳性细菌。细菌的实例包括但不限于,属于以下属的细菌:芽孢 杆菌属(Bacillus)(例如,枯草芽孢杆菌(B.subtilis)、解淀粉芽孢杆菌(B. amyloliquefaciens)、地衣芽孢杆菌(B.licheniformis)、潘蒂芽孢杆菌(B. puntis)、巨大芽孢杆菌(B.megaterium)、嗜碱芽孢杆菌(B.halodurans)、 短小芽孢杆菌(B.pumilus))、不动杆菌(Acinetobacter)、诺卡氏菌属 (Nocardia)、黄杆菌属(Xanthobacter)、埃希氏杆菌属(Escherichia)(例 如,大肠杆菌(例如,菌株DH 1OB、Stbl2、DH5-α、DB3、DB3.1)、DB4、 DB5、JDP682和ccdA-over(例如,美国申请号09/518,188)))、链霉菌属 (Streptomyces)、欧文氏菌属(Erwinia)、克雷白氏杆菌属(Klebsiella)、 沙雷氏菌属(Serratia)(粘质沙雷氏菌(S.marcessans))、假单胞菌属(Pseudomonas)(例如,铜绿假单胞菌(P.aeruginosa))、沙门氏菌属 (Salmonella)(例如,鼠伤寒沙门氏菌(S.typhimurium)、伤寒沙门氏菌(S. typhi))。细菌还包括但不限于光合细菌(例如,绿色非硫细菌(例如,绿 弯菌属(Choroflexus)细菌(例如橙黄绿弯菌(C.aurantiacus))、绿丝菌属 (Chloronema)(例如,巨大绿丝菌(C.gigateum)))、绿色硫细菌(例如, 绿菌属(Chlorobium)细菌(例如,泥生绿菌(C.limicola))、暗网菌属(Pelodictyon)(例如,微黄暗网菌(P.luteolum))、紫色硫细菌(例如, 着色菌属(Chromatium)(例如,奥氏着色菌(C.okenii)))以及紫色非硫 细菌(例如,红螺菌属(Rhodospirillum)(例如,深红红螺菌(R.rubrum))、 红细菌属(Rhodobacter)(例如类球红细菌(R.sphaeroides)、荚膜红细菌(R.capsulatus))和红微菌属(Rhodomicrobium)细菌(例如万尼氏红微 菌(R.vanellii)))。
宿主细胞可以是来自非微生物生物体的宿主细胞。此类细胞的实例包 括但不限于昆虫细胞(例如,果蝇属(Drosophila)(例如,黑腹果蝇(D. melanogaster))、夜蛾属(Spodoptera)(例如,草地贪夜蛾(S.frugiperda) Sf9或Sf21细胞)和粉纹夜蛾属(Trichoplusa)(例如,High-Five细胞)); 线虫细胞(例如,秀丽线虫(C.elegans)细胞);禽类细胞;两栖动物细胞 (例如,非洲爪蟾(Xenopus laevis)细胞);爬行动物细胞;以及哺乳动物 细胞(例如NIH3T3、293、CHO、COS、VERO、C127、BHK、Per-C6、 Bowes黑色素瘤和HeLa细胞)。
本发明还提供了一种用于产生本发明的多肽的方法,所述方法包括:
(a)在有利于通过本发明的重组宿主细胞产生所述多肽的条件下培养 所述重组宿主细胞,以及任选地
(b)回收所述多肽。
根据本发明的重组宿主可能够在本领域中已知的任何合适的碳源上生 长,并且将其转化为糖基化二萜,例如,甜菊醇糖苷。重组宿主可能够直 接转化植物生物质、纤维素、半纤维素、果胶、鼠李糖、半乳糖、岩藻糖、 麦芽糖、麦芽糖糊精、核糖、核酮糖或淀粉、淀粉衍生物、蔗糖、乳糖和 甘油。因此,优选的宿主表达酶如用于将纤维素转化成葡萄糖单体和将半 纤维素转化成木糖和阿拉伯糖单体所需的纤维素酶(内切纤维素酶和外切 纤维素酶)和半纤维素酶(例如内切和外切木聚糖酶、阿拉伯糖酶),能够 将果胶转化成葡萄糖醛酸和半乳糖醛酸的果胶酶或将淀粉转化成葡萄糖单 体的淀粉酶。优选地,宿主能够转化选自由以下各项组成的组的碳源:葡 萄糖、木糖、阿拉伯糖、蔗糖、乳糖和甘油。宿主细胞可例如是WO03/062430、 WO06/009434、EP1499708B1、WO2006096130或WO04/099381中所描述 的真核宿主细胞。
因此,另一方面,本发明还提供了一种用于制备糖基化二萜如甜菊醇 糖苷的方法,所述方法包括发酵本发明的重组宿主,所述重组宿主能够在 合适的发酵培养基中产生至少一种糖基化二萜;以及任选地回收所述糖基 化二萜。
糖基化萜烯(例如甜菊醇糖苷)可以是甜菊醇-19-单糖苷、甜菊醇-19- 双糖苷、甜菊醇-19-三糖苷、甜菊醇-13-单糖苷、甜茶苷、13-[(β-D-吡喃 葡萄糖基)氧基)贝壳杉-16-烯-18-酸2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄 糖基酯、甜菊双糖苷、甜菊苷、莱鲍迪甙E、莱鲍迪甙B、莱鲍迪甙A、莱 鲍迪甙D或莱鲍迪甙M。因此,本发明提供了一种用于产生一种或多种此 类甜菊醇糖苷的方法。
在用于产生糖基化二萜的方法中使用的发酵培养基可以是允许特定真 核宿主细胞生长的任何合适的发酵培养基。发酵培养基的基本要素是本领 域的技术人员已知的,并且可适用于所选择的宿主细胞。
优选地,发酵培养基包含选自由以下各项组成的组的碳源:植物生物 质、纤维素、半纤维素、果胶、鼠李糖、半乳糖、岩藻糖、果糖、麦芽糖、 麦芽糖糊精、核糖、核酮糖或淀粉、淀粉衍生物、蔗糖、乳糖、脂肪酸、 甘油三酯和甘油。优选地,发酵培养基还包含氮源,如尿素;或铵盐,如 硫酸铵、氯化铵、硝酸铵或磷酸铵。
根据本发明的发酵方法可以分批、分批补料或连续模式进行。也可应 用单独的水解和发酵(SHF)方法或同时糖化和发酵(SSF)方法。这些发 酵方法模式的组合对于最佳生产率来说也可以是可行的。如果在发酵方法 中使用淀粉、纤维素、半纤维素或果胶作为碳源,则SSF方法可以是特别 有吸引力的,其中可需要添加水解酶如纤维素酶、半纤维素酶或果胶酶以 水解底物。
在用于制备糖基化二萜的方法中使用的重组宿主可以是如上文所定义 的任何合适的重组宿主。在所述方法中使用根据本发明的重组真核重组宿 主可以是有利的,因为大多数真核细胞不需要用于繁殖的无菌条件并且对 噬菌体感染不敏感。此外,真核宿主细胞可在低pH下生长以防止细菌污染。
根据本发明的重组宿主可以是兼性厌氧微生物。兼性厌氧重组宿主可 以需氧方式繁殖至高细胞浓度。然后可在高细胞密度下进行这种厌氧阶段, 这显著地降低了所需的发酵体积并且可使需氧微生物污染的风险最小化。
用于产生根据本发明的糖基化二萜的发酵方法可以是需氧或厌氧发酵 方法。
厌氧发酵方法可在本文中定义为在不存在氧的情况下运行或者基本上 不消耗氧(优选小于5、2.5或1mmol/L/h),并且其中有机分子充当电子供 体和电子受体两者的发酵方法。根据本发明的发酵方法也可首先在需氧条 件下运行,且随后在厌氧条件下运行。
发酵方法也可在限氧或微需氧条件下进行。或者,发酵方法可首先在 需氧条件下运行,且随后在限氧条件下运行。限氧发酵方法是其中氧消耗 受到从气体到液体的氧传递的限制的过程。氧限制的程度由进入气流的量 和组成以及所用发酵设备的实际混合/传质特性决定。
在根据本发明的方法中产生糖基化二萜可在宿主细胞的生长阶段期 间、固定(稳定状态)阶段期间或在两个阶段期间发生。在不同的温度下 运行发酵方法可以是可行的。
用于产生糖基化二萜的方法可在对于重组宿主来说最佳的温度下进 行。对于每种转化的重组宿主而言,最佳生长温度可不同并且是本领域的 技术人员已知的。最佳温度可高于野生型生物的最适温度以在非无菌条件 下在最低感染敏感性和最低冷却成本的条件下有效生长生物体。或者,所 述方法可在对于重组宿主的生长来说不是最佳的温度下进行。
用于产生根据本发明的糖基化二萜的方法可在任何合适的pH值下进 行。如果重组宿主是酵母,则发酵培养基中的pH优选具有低于6、优选低 于5.5、优选低于5、优选低于4.5、优选低于4、优选低于pH 3.5或低于 pH 3.0或低于pH 2.5、优选高于pH 2的值。在这些低pH值下进行发酵的 优点是可防止发酵培养基中污染细菌的生长。
这种方法可在工业规模上进行。这种方法的产物是一种或多种糖基化 二萜,如一种或多种甜菊醇糖苷,例如13-[(β-D-吡喃葡萄糖基)氧基) 贝壳杉-16-烯-18-酸2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基酯、甜菊双糖 苷、甜菊苷、莱鲍迪甙E、莱鲍迪甙B、莱鲍迪甙A、莱鲍迪甙D或莱鲍 迪甙M中的一种或多种。
从发酵培养基中回收糖基化二萜可通过本领域已知的方法进行,例如 通过蒸馏、真空萃取、溶剂萃取或蒸发。
在用于产生根据本发明的糖基化二萜的方法中,实现高于5mg/l发酵 液、优选高于10mg/l、优选高于20mg/l、优选高于30mg/l发酵液、优选 高于40mg/l、更优选高于50mg/l、优选高于60mg/l、优选高于70、优选 高于80mg/l、优选高于100mg/l、优选高于1g/l、优选高于5g/l、优选高 于10g/l、例如高于20g/l的浓度可以是可行的,但通常达约200g/l、如达约150g/l、如达约100g/l、例如达约70g/l的浓度。此类浓度可以是总发酵 液或上清液的浓度。
本发明还提供了一种包含能够通过本发明的用于制备糖基化二萜的方 法获得的糖基化二萜的发酵液。
在微生物中表达一种或多种糖基化二萜的情况下,可需要处理此类细 胞以释放它们。优选地,在细胞外产生至少一种糖基化二萜,如甜菊醇糖 苷,例如rebA或rebM。
本发明还提供了一种通过根据本发明的用于制备糖基化二萜的方法获 得的或能够从本发明的发酵液获得的糖基化二萜。这种糖基化二萜可以是 非天然存在的糖基化二萜,也就是说不在植物中产生的糖基化二萜。
本发明还提供了一种包含能够通过本发明的用于制备糖基化二萜的方 法获得或能够从本发明的发酵液获得的两种或更多种糖基化二萜的组合 物。在这种组合物中,一种或多种糖基化二萜可以是非天然存在的糖基化 二萜,也就是说不在植物中产生的糖基化二萜。
此外,本发明提供了一种用于将第一糖基化二萜转化为第二糖基化二 萜的方法,所述方法包括:
–使所述第一糖基化二萜与本发明的重组宿主、源自这种重组宿主 的无细胞提取物或源自其任一者的酶制剂接触;
–从而将所述第一糖基化二萜转化为所述第二糖基化二萜。
在这种方法中,第二糖基化二萜可以是甜菊醇-19-双糖苷、甜菊双糖苷、 甜菊苷、RebE、RebD或13-[(β-D-吡喃葡萄糖基)氧基)贝壳杉-16-烯-18- 酸2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基酯。
在这种方法中,第一糖基化二萜可以是甜菊醇-13-单糖苷、甜菊醇-19- 单糖苷、甜茶苷、甜菊苷、莱鲍迪甙A或13-[(β-D-吡喃葡萄糖基)氧基) 贝壳杉-16-烯-18-酸2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基酯,并且第二 糖基化二萜是甜菊醇-19-双糖苷、甜菊双糖苷、甜菊苷、RebE、RebD或 13-[(β-D-吡喃葡萄糖基)氧基)贝壳杉-16-烯-18-酸2-O-β-D-吡喃葡萄糖 基-β-D-吡喃葡萄糖基酯。
这些是与通过本发明的具有UGT2活性的多肽催化的反应相关的第一 和第二甜菊醇糖苷。
也就是说,本发明涉及一种生物转变或生物转化方法。
通过根据本发明的发酵方法产生的甜菊醇糖苷或组合物可用于对于此 类化合物来说已知的任何应用中。特别地,它们可例如用作甜味剂,例如 用于食品或饮料中。因此,根据本发明,提供了一种包含本发明的糖基化 二萜如甜菊醇糖苷或组合物的食品、饲料或饮料。
例如,本发明的糖基化二萜或组合物可被配制成软饮料、配制为桌面 甜味剂、口香糖、乳制品如酸奶(例如原味酸奶)、蛋糕、谷物或基于谷类 的食物、营养食品、药物、食用凝胶、糖果产品、化妆品、牙膏或其它口 腔组合物等。此外,本发明的糖基化二萜或组合物可用作甜味剂,不仅用 于饮料、食品和其它专门用于人消费的产品,而且用于具有改进的特性的 动物饲料和草料中。
因此,本发明尤其提供了一种包含根据本发明的方法制备的二萜或糖 基化二萜的食品、饲料或饮料。
在食品、饮料、药物、化妆品、桌面产品、口香糖的制造过程中,可 使用诸如混合、捏合、溶解、酸洗、渗透、渗滤、喷洒、雾化、灌注和其 它方法的常规方法。
本发明的糖基化二萜例如甜菊醇糖苷或组合物可以干或液体的形式使 用。它可在食品热处理之前或之后加入。甜味剂的量取决于使用目的。它 可单独添加或与其它化合物组合添加。
根据本发明的方法产生的化合物可与一种或多种其它非热量或热量甜 味剂掺混。这种掺混可用于改进风味或时间特征或稳定性。广泛范围的非 热量和热量甜味剂二者可适用于与本发明的糖基化二萜或组合物掺混。例 如,非热量甜味剂如罗汉果苷、莫纳甜、阿斯巴甜、安赛蜜盐、环磺酸盐、 三氯蔗糖、糖精盐或赤藓糖醇。适用于与本发明的糖基化二萜或组合物掺 混的热量甜味剂包括糖醇和碳水化合物如蔗糖、葡萄糖、果糖和HFCS。还可使用甜味氨基酸,如甘氨酸、丙氨酸或丝氨酸。
本发明的糖基化二萜或组合物可与甜味剂抑制剂如天然甜味剂抑制剂 组合使用。它可与鲜味增强剂如氨基酸或其盐组合。
本发明的糖基化二萜或组合物可与多元醇或糖醇、碳水化合物、生理 活性物质或功能成分(例如类胡萝卜素、膳食纤维、脂肪酸、皂苷、抗氧 化剂、营养食品、类黄酮、异硫氰酸酯、苯酚、植物甾醇或甾烷醇(植物 甾醇和植物甾烷醇)、多元醇、益生元、益生菌、植物雌激素、大豆蛋白、 硫化物/硫醇、氨基酸、蛋白质、维生素、矿物质和/或基于健康益处如心血管、降胆固醇或抗炎分类的物质组合。
具有本发明的糖基化二萜或组合物的组合物可包括调味剂、芳香组分、 核苷酸、有机酸、有机酸盐、无机酸、苦味化合物、蛋白质或蛋白质水解 产物、表面活性剂、类黄酮、收敛剂化合物、维生素、膳食纤维、抗氧化 剂、脂肪酸和/或盐。
本发明的糖基化二萜或组合物可作为高强度甜味剂应用,以产生具有 改进的味道特征的零卡路里、低卡路里或糖尿病人用饮料和食品。它也可 用于不能使用糖的饮料、食品、药物和其他产品中。
此外,本发明的糖基化二萜或组合物可用作甜味剂,不仅用于饮料、 食品和其它专门用于人消费的产品,而且用于具有改进的特性的动物饲料 和草料中。
本发明的糖基化二萜或组合物可用作甜味化合物的产品的实例可以是 酒精饮料,如伏特加酒、葡萄酒、啤酒、烈酒、清酒等;天然果汁、提神 饮料、碳酸软饮料、减肥饮料、零卡路里饮料、低卡路里饮料和食物、酸 奶饮料、速溶果汁、速溶咖啡、粉末型速溶饮料、罐装产品、糖浆、发酵 大豆酱、酱油、醋、调味品、蛋黄酱、番茄酱、咖喱、汤、速食肉汤、酱 油粉、醋粉、多种类型的饼干、香米饼、咸饼干、面包、巧克力、焦糖、 糖果、口香糖、果冻、布丁、蜜饯和腌菜、鲜奶油、果酱、橘子酱、糖花 膏、奶粉、冰淇淋、冰糕、包装在瓶中的蔬菜和水果、罐装和煮熟的豆类、 在甜味酱中煮熟的肉和食物、农业蔬菜食品、海鲜、火腿、香肠、鱼火腿、 鱼香肠、鱼酱、油炸鱼制品、干制海产品、冷冻食品、腌渍海带、腊肉、 烟草、医药产品等。原则上它可具有无限应用。
甜味组合物包含饮料,其非限制性实例包括非碳酸化和碳酸饮料,如 可乐、姜汁汽水、根汁汽水、苹果汁、水果味软饮料(例如柑橘味软饮料, 如柠檬莱姆或橙汁)、软饮料粉等;来自水果或蔬菜的果汁、包括榨汁等的 果汁、含有果粒的果汁、水果饮料、果汁饮料、含果汁的饮料、具有水果 调味料的饮料、蔬菜汁、含蔬菜的汁以及含水果和蔬菜的混合果汁;运动 饮料、能量饮料、接近水的饮料等(例如具有天然或合成调味剂的水);茶 类或喜欢型饮料如咖啡、可可、红茶、绿茶、乌龙茶等;含乳成分饮料如 乳饮料、含乳成分咖啡、牛奶咖啡、奶茶、果奶饮料、饮用酸奶、乳酸菌 饮料等;以及乳制品。
通常,甜味组合物中存在的甜味剂的量取决于甜味组合物的具体类型 及其所需的甜度而广泛变化。本领域的普通技术人员可容易确定加入到甜 味组合物中的甜味剂的适当量。
本发明的糖基化二萜或组合物可以干或液体形式使用。它可在食品热 处理之前或之后加入。甜味剂的量取决于使用目的。它可单独添加或与其 它化合物组合添加。
在食品、饮料、药物、化妆品、桌面产品、口香糖的制造过程中,可 使用诸如混合、捏合、溶解、酸洗、渗透、渗滤、喷洒、雾化、灌注和其 它方法的常规方法。
因此,本发明的组合物可通过本领域的技术人员已知的提供成分的均 匀或均质混合物的任何方法来制备。这些方法包括干混、喷雾干燥、团聚、 湿法制粒、压实、共结晶等。
呈固体形式时,本发明的糖基化二萜或组合物可以适于递送到待甜化 的食物中的任何形式提供给消费者,所述形式包括小袋、小包、散装袋或 盒、方块、片剂、喷雾或可溶解的条。所述组合物可以单位剂量或散装形 式递送。
对于液体甜味剂体系和组合物而言,应开发方便范围的流体、半流体、 糊状和膏状形式、使用任何形状或形式的适当包装材料的适当包装,其便 于携带或分配或储存或运输含有任何上述甜味剂产品或上述产品的组合的 任何组合。
所述组合物可包含多种填充剂、功能成分、着色剂、调味剂。
术语“序列同源性”或“序列同一性”在本文中可互换使用。出于本发明 的目的,在此定义为了确定两个氨基酸序列或两个核酸序列的序列同源性 或序列同一性的百分比,出于最佳比较目的比对所述序列。为了优化两个 序列之间的比对,可在比较的两个序列中的任一个中引入空位。这种比对 可在所比较的序列的全长上进行。或者,比对可在更短的长度上进行,例 如在约20、约50、约100或更多个核酸/碱基或氨基酸上进行。序列同一 性是在所报告的比对区域上两个序列之间的相同匹配的百分比。
两个序列之间的序列比较和序列同一性百分比的确定可使用数学算法 来完成。本领域的技术人员将意识到以下事实:若干不同的计算机程序可 用于比对两个序列并确定两个序列之间的同一性(Kruskal,J.B.(1983)An overview of sequence comparisonIn D.Sankoff and J.B.Kruskal,(编辑), Time warps,string edits andmacromolecules:the theory and practice of sequence comparison,第1-44页AddisonWesley)。两个氨基酸序列之间或 两个核苷酸序列之间的序列同一性百分比可使用用于两个序列的比对的 Needleman和Wunsch算法来确定(Needleman,S.B.和Wunsch,C.D.(1970)J.Mol.Biol.48,443-453)。氨基酸序列和核苷酸序列两者均可通过所述算法 进行比对。Needleman-Wunsch算法已在计算机程序NEEDLE中实现。出 于本发明的目的,使用了来自EMBOSS包的NEEDLE程序(2.8.0版或更 高版本,EMBOSS:The European Molecular BiologyOpen Software Suite (2000)Rice,P.Longden,I.和Bleasby,A.Trends in Genetics 16,(6)第 276-277页,http://emboss.bioinformatics.nl/)。对于蛋白质序列而言,EBLOSUM62用于取代矩阵。对于核苷酸序列而言,使用EDNAFULL。所 使用的任选参数是空位开放罚分为10,以及空位延伸罚分为0.5。技术人员 将理解的是,所有这些不同的参数将产生稍微不同的结果,但是当使用不 同的算法时,两个序列的总体同一性百分比没有显著改变。
在通过如上所述的程序NEEDLE进行比对后,查询序列与本发明的序 列之间的序列同一性的百分比计算如下:在两个序列中显示相同氨基酸或 相同核苷酸的比对中的相应位置的数目除以在减去比对中的总空位数后比 对的总长度。如本文定义的同一性可通过使用NOBRIEF选项从NEEDLE 获得,并且在程序的输出中标记为“最长同一性”。
本发明的核酸和蛋白质序列可进一步用作“查询序列”以进行针对公共 数据库的检索,以例如鉴定其它家族成员或相关序列。此类搜索可使用 Altschul等人(1990)J.Mol.Biol.215:403—10的NBLAST和XBLAST 程序(2.0版)进行。BLAST核苷酸搜索可用NBLAST程序(得分=100、 字长=12)来进行,以获得与本发明的核酸分子同源的核苷酸序列。BLAST 蛋白质搜索可用XBLAST程序(得分=50、字长=3)来进行,以获得与本 发明的蛋白分子同源的氨基酸序列。为了获得用于比较目的的空位比对, 可利用如在Altschul等人,(1997)Nucleic Acids Res.25(17):3389-3402 中描述的空位BLAST。当利用BLAST和空位BLAST程序时,可使用相应 程序(例如XBLAST和NBLAST)的默认参数。参见美国国家生物技术信 息中心http://www.ncbi.nlm.nih.gov/的主页。
本发明的一些实施方案:
1.一种重组宿主,其包含编码多肽的重组核酸序列,所述多肽:
a.与SEQ ID NO:1中列出的氨基酸序列具有至少约85%同一性;
b.与SEQ ID NO:3中列出的氨基酸序列具有至少约85%同一性;
c.与SEQ ID NO:6中列出的氨基酸序列具有至少约85%同一性;
d.与SEQ ID NO:9中列出的氨基酸序列具有至少约85%同一性;
e.与SEQ ID NO:11中列出的氨基酸序列具有至少约85%同一性;
f.与SEQ ID NO:14中列出的氨基酸序列具有至少约85%同一性;
g.与SEQ ID NO:17中列出的氨基酸序列具有至少约85%同一性;
h.与SEQ ID NO:20中列出的氨基酸序列具有至少约85%同一性;
i.与SEQ ID NO:22中列出的氨基酸序列具有至少约85%同一性; 或
j.与SEQ ID NO:25中列出的氨基酸序列具有至少约85%同一性。
2.根据实施方案1所述的重组宿主,其能够产生糖基化二萜,如甜菊 醇糖苷。
3.根据实施方案1或2所述的重组宿主,其包含一个或多个重组核苷 酸序列,所述重组核苷酸序列编码:
具有对映-柯巴基焦磷酸合酶活性的多肽;
具有对映-贝壳杉烯合酶活性的多肽;
具有对映-贝壳杉烯氧化酶活性的多肽;以及
具有贝壳杉烯酸13-羟化酶活性的多肽。
4.根据前述实施方案中任一项所述的重组宿主,其包含重组核酸序列, 所述重组核酸序列编码具有NADPH-细胞色素p450还原酶活性的多肽。
5.根据前述实施方案中任一项所述的重组宿主,其包含编码以下中的 一种或多种的重组核酸序列:
(i)具有UGT74G1(UGT3)活性的多肽;
(ii)具有UGT85C2(UGT1)活性的多肽;以及
(iii)具有UGT76G1(UGT4)活性的多肽。
6.根据前述实施方案中任一项所述的重组宿主,其包含重组核酸序列, 所述重组核酸序列编码具有UGT2活性的额外多肽。
7.根据前述实施方案中任一项所述的重组宿主,其中所述宿主属于以 下属中的一种:酵母属、曲霉属、毕赤酵母属、克鲁维酵母属、假丝酵母 属、汉逊酵母属、腐质霉属、伊萨酵母属、毛孢子菌属、酒香酵母属、管 囊酵母属、耶氏酵母属、Yamadazyma或埃希氏杆菌属。
8.根据实施方案7所述的重组宿主,其中所述重组宿主是酿酒酵母细 胞、解脂耶氏酵母细胞、克鲁斯假丝酵母细胞、东方伊萨酵母细胞或大肠 杆菌细胞。
9.根据前述实施方案中任一项所述的重组宿主,其中所述宿主产生香 叶基香叶基二磷酸(GGPP)的能力被上调。
10.根据前述实施方案中任一项所述的重组宿主,其包含一个或多个重 组核酸序列,所述重组核酸序列编码羟甲基戊二酰基-辅酶A还原酶、法尼 基-焦磷酸合成酶和香叶基香叶基二磷酸合酶。
11.根据前述实施方案中任一项所述的重组宿主,其包含核酸序列,所 述核酸序列编码以下中的一种或多种:
具有羟甲基戊二酰基-辅酶A还原酶活性的多肽;
具有法尼基-焦磷酸合成酶活性的多肽;
具有香叶基香叶基二磷酸合酶活性的多肽。
12.一种用于制备糖基化二萜的方法,所述方法包括在合适的发酵培养 基中发酵根据实施方案2至11中任一项所述的重组宿主,并且任选地回收 所述糖基化二萜。
13.根据实施方案12中任一项所述的方法,其用于制备糖基化二萜,其 中所述方法以工业规模进行。
14.一种发酵液,其包含能够通过根据实施方案12或13所述的方法获 得的糖基化二萜。
15.一种糖基化二萜,其通过根据实施方案12或13所述的方法获得或 能够从根据实施方案14所述的发酵液获得。
16.一种组合物,其包含通过根据实施方案12或13所述的方法获得或 能够从根据实施方案14所述的发酵液获得的两种或更多种糖基化二萜。
17.一种食品、饲料或饮料,其包含根据实施方案15的糖基化二萜或根 据实施方案16的组合物。
18.一种用于将第一糖基化二萜转化为第二糖基化二萜的方法,所述方 法包括:
–使所述第一糖基化二萜与根据实施方案1至11中任一项所述的重 组宿主、源自这种重组宿主的无细胞提取物或源自上述任一者的酶制剂接 触;
–从而将所述第一糖基化二萜转化为所述第二糖基化二萜。
19.根据实施方案18所述的方法,其中所述第二糖基化二萜是甜菊醇 -19-双糖苷、甜菊双糖苷、甜菊苷、RebE、RebD或13-[(β-D-吡喃葡萄糖 基)氧基)贝壳杉-16-烯-18-酸2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基酯。 20.根据权利要求19所述的方法,其中所述第一糖基化二萜是甜菊醇 -13-单糖苷、甜菊醇-19-单糖苷、甜茶苷、甜菊苷、莱鲍迪甙A或13-[(β-D- 吡喃葡萄糖基)氧基)贝壳杉-16-烯-18-酸2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基酯,并且所述第二糖基化二萜是甜菊醇-19-双糖苷、甜菊双糖苷、 甜菊苷、RebE、RebD或13-[(β-D-吡喃葡萄糖基)氧基)贝壳杉-16-烯-18- 酸2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基酯。
21.一种具有UGT2活性的多肽,其中所述多肽选自由以下各项组成的 组:
(a)包含在SEQ ID NO:1、3、6、9、11、14、17、20、22或25中 的任一个中列出的氨基酸序列的多肽;或
(b)包含与SEQ ID NO:1、3、6、9、11、14、17、20、22或25中 的任一个的氨基酸序列具有至少约85%序列同一性的氨基酸序列的多肽; 或
(c)由包含在SEQ ID NO:2、4、5、7、8、10、12、13、15、16、18、 19、21、23、24或26中的任一个中列出的多核苷酸序列的多核苷酸编码的 多肽;或
(d)由包含与SEQ ID NO:2、4、5、7、8、10、12、13、15、16、18、 19、21、23、24或26中的任一个中的多肽编码序列具有至少30%序列同 一性的多核苷酸序列的多核苷酸编码的多肽;或
(e)由优选在至少低严格性条件下与SEQ ID NO:2、4、5、7、8、10、 12、13、15、16、18、19、21、23、24或26中的任一个的互补链杂交的多 核苷酸编码的多肽;或
(f)由优选在至少低严格性条件下与同SEQ ID NO:2、4、5、7、8、 10、12、13、15、16、18、19、21、23、24或26中的任一个具有至少30% 序列同一性的多核苷酸的互补链杂交的多核苷酸编码的多肽;或
(g)在(a)、(b)、(c)、(d)、(e)或(f)中定义的多肽的片段。
22.根据实施方案21的多肽,其包含具有与SEQ ID NO:1、3、6、9、 11、14、17、20、22或25中的任一个具有至少约86%序列同一性、至少 约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、 至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少 约98%、至少约99%序列同一性的氨基酸序列的多肽。
23.一种多核苷酸序列,其编码根据实施方案21或22所述的多肽。
24.根据实施方案23所述的多核苷酸序列,其中所述多核苷酸序列选自 由以下各项组成的组:
(a)包含SEQ ID NO:2、4、5、7、8、10、12、13、15、16、18、19、 21、23、24或26中的任一个或包含与SEQ ID NO:2、4、5、7、8、10、 12、13、15、16、18、19、21、23、24或26中的任一个的多核苷酸序列具 有至少30%序列同一性的多核苷酸序列的多核苷酸序列;或
(b)在优选至少低严格性条件下与SEQ ID NO:2、4、5、7、8、10、 12、13、15、16、18、19、21、23、24或26中的任一个的互补链杂交的多 核苷酸序列;或
(c)在优选至少低严格性条件下与同SEQ ID NO:2、4、5、7、8、10、 12、13、15、16、18、19、21、23、24或26中的任一个具有至少30%序 列同一性的多核苷酸的互补链杂交的多核苷酸序列;
(d)作为在(a)、(b)或(c)中任一项所定义的多核苷酸序列的遗 传密码简并性的结果的简并物的多核苷酸序列;或
(e)为在(a)、(b)、(c)或(d)中定义的核苷酸序列的互补物的多 核苷酸序列。
25.根据实施方案5所述的多核苷酸序列,其与SEQ ID NO:2、4、5、7、 8、10、12、13、15、16、18、19、21、23、24或26中的任一个具有至少 60%、优选至少70%、更优选至少80%、最优选至少90%、最优选至少93%、 最优选至少约95%、最优选至少约96%、最优选至少约97%、甚至最优选 至少约98%以及甚至更优选至少99%的序列同一性。
26.一种核酸构建体,其包含如实施方案23至25中任一项所述的多核 苷酸序列。
27.根据实施方案26所述的核酸构建体,其是表达载体,其中根据实施 方案23至25中任一项所述的多核苷酸序列与至少一个用于在宿主细胞中 表达所述多核苷酸序列的控制序列可操作地连接。
28.一种产生如实施方案21或22所述的多肽的方法,所述方法包括:
(a)在有利于通过根据实施方案1的宿主细胞产生所述多肽的条件 下培养所述宿主细胞,并且任选地
(b)回收所述多肽。
本文对作为现有技术给出的专利文件或其他事项的引用不应被视为承 认所述文件或事项是已知的或者其所含的信息是在任何权利要求的优先权 日的公知常识的一部分。
本文列出的每个参考文献的公开内容均以引用的方式整体并入本文。
通过以下实施例进一步说明本发明:
实施例
实施例1:酿酒酵母中ERG20、BTS1和tHMG的过度表达
对于ERG20、BTS1tHMG1的过度表达而言,使用W02013/076280中 描述的技术将表达盒设计为整合在一个基因座中。为了扩增整合基因座的 5'和3'整合侧翼,使用了来自CEN.PK酵母菌株(van Dijken等人.Enzyme and Microbial Technology 26(2000)706-714)的合适的引物和基因组 DNA。不同的基因在DNA2.0作为盒(含有同源序列、启动子、基因、终 止子、同源序列)订购。这些盒中的基因侧接组成型启动子和终止子。参 见表1。将来自DNA2.0的含有ERG20、tHMG1和BTS1盒的质粒DNA 溶解至100ng/μl的浓度。在50μl PCR混合物中,20ng模板与20pmol的 引物一起使用。将材料溶解至0.5μg/μl的浓度。
表1:过度表达构建体的组成
启动子 ORF 终止子
Eno2(SEQ ID NO:30) ERG20(SEQ ID NO:31) Adh1(SEQ ID NO:32)
Fba1(SEQ ID NO:33) tHMG1(SEQ ID NO:34) Adh2(SEQ ID NO:35)
Tef1(SEQ ID NO:36) BTS1(SEQ ID NO:37) Gmp1(SEQ ID NO:38)
为了扩增选择标记,使用了pUG7-EcoRV构建体(图1)和合适的引 物。使用Zymoclean凝胶DNA回收试剂盒(ZymoResearch)从凝胶中纯化 KanMX片段。将酵母菌株Cen.PK113-3C用表2中所列的片段转化。
表2:用于转化ERG20、tHMG1和BTS1的DNA片段
片段
5’YPRcTau3
ERG20盒
tHMG1盒
KanMX盒
BTS1盒
3’YPRcTau3
在30℃下在YEPhD(酵母提取物植物蛋白胨葡萄糖;来自BD的BBL 植物蛋白胨)中转化和恢复2.5小时后,将细胞与200μg/ml G418(Sigma) 一起接种在YEPhD琼脂上。将板在30℃下孵育4天。通过诊断PCR和测 序确定正确的整合。用蛋白质上LC/MS证实过度表达。图2中示出了 ERG20、tHMG1和BTS1的组装示意图。此菌株被命名为STV002。
此菌株中CRE-重组酶的表达导致KanMX标记的外重组。用诊断PCR 确定ERG20、tHMG和BTS1的存在和正确外重组。
实施例2.Erg9的敲低
为了降低Erg9的表达,设计并使用了Erg9敲低构建体,所述构建体 含有修饰的3'端,其继续进入驱动TRP1表达的TRP1启动子。
将含有Erg9-KD片段的构建体转化到到大肠杆菌TOP10细胞中。将转 化体在2PY(2次植物蛋白胨酵母提取物)、sAMP培养基中生长。将质粒 DNA用QIAprep旋转小量制备试剂盒(Qiagen)分离并用SalI-HF(New England Biolabs)消化。为了浓缩,将DNA用乙醇沉淀。将所述片段转化 到酿酒酵母中,并将菌落接种在无色氨酸的无机培养基(Verduyn等人,1992. Yeast 8:501-517)琼脂板上。通过诊断PCR和测序证实Erg9-KD构建体的 正确整合。进行的Erg9-KD构建体的转化的示意图在图3中示出。所述菌 株被命名为STV003。
实施例3.UGT21a的过度表达
对于UGT2_1a的过度表达,使用如专利申请号W02013/076280和 WO2013/144257中所描述的技术。将UGT2_1a在DNA2.0作为盒(含有同 源序列、启动子、基因、终止子、同源序列)订购。关于细节,参见表3。 为了获得含有标记和Cre-重组酶的片段,使用如专利申请号WO2013/135728中所描述的技术。使用赋予对诺尔丝菌素的抗性的NAT标 记用于选择。
表3:过度表达构建体的组成
Figure BDA0001410935660000391
合适的引物用于扩增。为了扩增整合基因座的5'和3'整合侧翼,使用 了来自CEN.PK酵母菌株的合适的引物和基因组DNA。
用表4中列出的片段转化酿酒酵母酵母菌株STV003,并将转化混合物 接种在含有50μg/ml诺尔丝菌素(来自Jena Bioscience的Lexy NTC)的 YEPhD琼脂板上。
表4:用于转化UGT2 1a的DNA片段
片段
5’Chr09.01
UGT2_1a盒
NAT-CR
RE
3’Chr09.01
CRE重组酶的表达通过半乳糖的存在活化。为了诱导CRE重组酶的表 达,将转化体在YEPh半乳糖培养基上重新划线。这导致位于lox位点之间 的标记的外重组。通过诊断PCR证实了UGT2_1a的正确整合和NAT标记 的外重组。所得菌株被命名为STV004。进行的UGT2_1a构建体的转化的 示意图在图4中示出。
实施例4.RebA的产生途径的过度表达:CPS、KS、KO、KAH、CPR、UGT1、UGT3和UGT4。
使用在专利申请号WO2013/076280和WO2013/144257中描述的技术 将导致RebA产生的所有途径基因设计为整合在一个基因座中。为了扩增 整合基因座的5'和3'整合侧翼,使用了来自CEN.PK酵母菌株的合适的引 物和基因组DNA。不同的基因在DNA2.0作为盒(含有同源序列、启动子、 基因、终止子、同源序列)订购(参见表5总述)。将来自DNA2.0的DNA溶解至100ng/μl。将此储备溶液进一步稀释至5ng/μl,其中1μl用于50 μl-PCR混合物中。所述反应物含有25pmol的每种引物。在扩增后,用 NucleoSpin 96PCR清洁试剂盒(Macherey-Nagel)纯化DNA,或者使用乙 醇沉淀浓缩。
表5用于RebA的产生途径的序列
Figure BDA0001410935660000401
将到RebA的途径的所有片段(标记和侧翼)(参见表6总述)转化到 酿酒酵母菌株STV004中。在20℃下在YEPhD中过夜恢复后,将转化混合 物接种在含有200μg/ml G418的YEPhD琼脂上。将这些在25℃下孵育3 天,并在室温下孵育一夜。
表6.用于转化CPS、KS、KO、KanMX、KAH、CPR、UGT1、UGT3和UGT4的DNA片段
片段
5’INT1
CPS盒
KS盒
KO盒
KanMX盒
KAH盒
CPR盒
UGT1盒
UGT3盒
UGT4盒
3’INT1
通过诊断PCR和序列分析(3500基因分析仪,Applied Biosystems)证 实了正确的整合。序列反应用BigDye终止子v3.1循环测序试剂盒(Life Technologies)进行。每个反应(10μl)均含有50ng模板和3.2pmol引物。 将产物通过乙醇/EDTA沉淀纯化,溶解在10μlHiDi甲酰胺中并施加到装 置上。所述菌株被命名为STV006。从GGPP到RebA的途径如何整合到基 因组中的示意图在图5中示出。表7列出了实施例1至5中使用的菌株。
表7.菌株列表
Figure BDA0001410935660000411
Figure BDA0001410935660000421
实施例5.STV006的KanMX选择标记的去除
为了去除菌株中存在的KanMX标记,将含有CRE重组酶的质粒pSH65 (图6)转化到STV006中。首先在含有20μg/ml腐草霉素(Invitrogen) 的YEPD上选择转化体,然后在YEP半乳糖培养基上重新划线以诱导CRE 重组酶表达。通过诊断PCR确定标记的正确外重组。在产生实验中证实了 此无标记物菌株的RebA产生。STV006的无标记形式被称为STV008。
实施例6.通过NAT选择标记去除STV008中的UGT2 1a
为了去除位于STV008的Chr09.01基因座处的UGT2_1a,使用含有与 Chr09.01整合侧翼(图8)同源的额外50nt序列的引物,从质粒pUG7-NAT (图7)扩增了诺尔丝菌素选择(NAT)标记和周围的lox位点。将PCR 产物用NucleoSpin凝胶和PCR清洁试剂盒(Macherey-Nagel)纯化,并转 化到STV008中。在含有50μg/ml诺尔丝菌素(来自Jena Bioscience的Lexy NTC)的YEPD上选择转化体。通过诊断PCR证实了NAT标记的正确整 合和UGT2_1a的不存在。这种新的菌株被命名为STV009。
实施例7.STV009的Nat选择标记的去除
为了能够使用相同的整合基因座来测试UGT2变体,必须从菌株 STV009中去除NAT标记(图9)。因此,将位于质粒pSH65上的CRE重 组酶转化到STV009中,并在含有20μg/ml腐草霉素的YEPD上选择转化 体。将菌落在YEP半乳糖琼脂板上重新划线。将板在30℃下孵育。通过诊 断PCR证实通过CRE重组酶去除NAT标记。在产生实验中,显示STV009 ΔNAT菌株与其亲本STV009积累相同量的甜茶苷。所述新的菌株被称为 STV053。
实施例8.Chr09.01基因座处UGT2基因变体的整合
将编码UGT2活性的不同基因变体(SEQ ID NO:4、7、10、12、15、 18、21、23和28)通过使用用于重组的含有50bp侧翼同源区段的若干单 独的DNA片段单独地整合到Chr09.01基因座中(图10)。
用来自CEN.PK酵母菌株(van Dijken等.Enzyme and Microbial Technology 26(2000)706-714)的基因组DNA的合适引物扩增5'-和 3'-Chr09.01整合侧翼。对于5'-侧翼而言,反向引物含有与待使用的启动子 序列同源的延伸的50bp序列,即ScENO1启动子(SEQID NO:60)。3'- 侧翼的正向引物含有50bp接头延伸。
从pUG7-EcoRV构建体扩增KanMX选择标记。正向引物含有与 KIGAP1(SEQ ID NO:61)终止子同源的另外50bp序列。反向引物也具有 50bp接头延伸。
不同的UGT2基因变体在SGI-DNA订购。它们的开放阅读框的上游侧 接50bp的pScENO1启动子(SEQ ID NO:60),以及下游侧接50bp的 Klgap1T终止子(SEQ ID NO:61)。通过使用与这些启动子和终止子序列退 火的引物,从SGI-DNA构建体扩增了基因。
使用NucleoSpin 96PCR清洁试剂盒(Macherey-Nagel)纯化PCR产物。 对于待测试的每种UGT2变体,组合了等摩尔量的5'-Chr09.01侧翼、ENO1 启动子、UGT2基因、KIGAP1终止子、KanMX选择标记和3'-Chr09.01侧 翼。制备含有UGT2_1a的一种另外的混合物。将这些混合物转化到STV053 中并接种在含有200μg/ml G418的YEPD上。
对于每种UGT2变体而言,在产生实验中测试了若干重复转化体。
实施例9.用酿酒酵母产生莱鲍迪甙A
将预培养物与来自YEPD琼脂的菌落物质一起接种。将预培养物在具 有葡萄糖作为碳源的200μl无机培养基中生长。将预培养物在27℃、750 rpm和80%湿度的Infors孵育箱中孵育72小时。
使用40μl预培养物来接种具有葡萄糖作为碳源的2.5ml无机培养基。 将主要培养物在27℃、550rpm、80%湿度下在Infors孵育箱中孵育120小 时。通过来回移液将培养物良好均化,并将1ml培养物转移到96孔板中。 将96孔板在95℃下在水浴中孵育15分钟并冷却至室温。向每个孔中添加 0.5ml乙腈,并通过来回移液均化。通过在3000xg下离心10分钟来使细 胞碎片沉淀。将上清液在33%乙腈中稀释200倍。
使用LC/MS分析样品的RebA。使用RebA(RV0141-94,DAE Pyung Co. Ltd.)作为标准。发现与含有UGT2_1a的菌株相比,如所描述的具有特定 UGT2基因变体的菌株产生更高的RebA滴度,如表8和图11中所示。
表8:表达UGT2变体酶的酵母属菌株中的莱鲍迪甙A产生
UGT2变体 RebA(mg/L)
UGT2_1b 30,8
UGT2_2b 38,4
UGT2_3b 40,6
UGT2_4b 26,5
UGT2_5b 41,8
UGT2_6b 28,1
UGT2_7b 33,3
UGT2_8b 25,2
UGT2_9b 26,7
UGT2_1a 25,0
实施例10:用酿酒酵母产生莱鲍迪甙M
将预培养物与来自YEPD琼脂的菌落物质一起接种。将预培养物在具 有葡萄糖作为碳源的200μl无机培养基中生长。将预培养物在27℃、750 rpm和80%湿度的Infors孵育箱中孵育72小时。
使用40μl预培养物来接种具有葡萄糖作为碳源的2.5ml无机培养基。 将主要培养物在27℃、550rpm、80%湿度下在Infors孵育箱中孵育120小 时。通过来回移液将培养物良好均化,并将1ml培养物转移到96孔板中。 将96孔板在95℃下在水浴中孵育15分钟并冷却至室温。向每个孔中添加0.5ml乙腈,并通过来回移液均化。通过在3000xg下离心10分钟来使细 胞碎片沉淀。将上清液在33%乙腈中稀释200倍。
通过用配备有Acella LC和Waters Acquity UPLC BEH酰胺1.7μm 2.1*150mm柱的LTQ轨道阱(Thermo)分析的LC和MS来确认RebM的 存在。用于分离的洗脱液是A:10mM于MilliQ水中的乙酸铵,B:乙腈, 并且梯度以65%A开始,并且将此保持1.5分钟,然后在0.5分钟内增加至 95%B,并将此保持0.5分钟,之后在65%A下再生1.5分钟。流速是0.6ml/ 分钟,并且柱温保持在50C。以电喷雾负电离模式进行质谱分析,从m/z 100-1800以7500的分辨率进行扫描。Reb M在tr=0.72分钟时洗脱,刚好 在tr=0.63时的reb D之后。Reb M的特征在于m/z 1289.5286的去质子化分 子。能使用精确的质量分析来估计元素组成。
发现与含有UGT2_1a的菌株相比,如所描述的具有特定UGT2基因变 体的菌株产生更高的RebM滴度,如图12和表9中所示。
表9.相较于UGT2 1a的百分比,表达UGT2变体酶的酵母属菌株中的莱鲍迪甙M产生
UGT2变体 RebM(相对于UGT2_1a)
UGT2_7b 555
UGT2_9b 256
UGT2_1a 100
实施例11:甜菊醇糖苷产生菌株ML14094(MAT-A谱系)的描述
将接合型MATA和MATB的两种解脂耶氏酵母菌株工程化以用于甜菊 醇糖苷的产生。将这些菌株接合,二倍体孢子形成,并选择具有甜菊醇糖 苷产生的孢子。将这些孢子中的一个进一步开发用于产生甜菊醇糖苷,包 括产生莱鲍迪甙A。
步骤1:用5个限定的DNA片段转化菌株ML10371(MAT-A、lys1-、 ura3-、leu2-)。所有转化通过乙酸锂/PEG真菌转化方案方法进行,并在适 当的基本培养基YPD+100μg/ml诺尔丝菌素或YPD+100μg/ml潮霉素上 选择转化体。
1)在质粒MB6969(图13)的HindIII/NotI消化后通过凝胶纯化分离 的7.0kb DNA片段。此构建体编码用于过度表达连接至一起侧接lox位点 (Guldener等人,1996,Lambert等人,2007)的pPGM启动子(SEQ ID NO: 62)和xprT终止子(SEQ ID NO:69)以及HPH潮霉素抗性基因的UGT2_1a (SEQ ID NO:29)的合成构建体,以及用于过度表达缺乏连接至pHSP启动子(SEQ ID NO:63)和cwpT终止子(SEQ ID NO:70)的5'膜锚定序列 (tHMGopt:SEQ IDNO:75)的密码子优化的解脂耶氏酵母羟甲基戊二酰 基-辅酶A还原酶开放阅读框的合成构建体。
2)在MB6856(图14)的HindIII/SspI消化后通过凝胶纯化分离的2.7 kb DNA片段。此构建体编码连接至pHYPO启动子(SEQ ID NO:64)和 gpdT终止子(SEQ ID NO:71)的tHMGopt(SEQ ID NO:75)。
3)在MB6857(图15)的SspI消化后通过凝胶纯化分离的2.5kb DNA 片段。此构建体编码连接至pHSP启动子(SEQ ID NO:63)和cwpT终止 子(SEQ ID NO:70)的tHMGopt(SEQ IDNO:75)。
4)在MB6948(图16)的SspI消化后通过凝胶纯化分离的2.0kb DNA 片段。此构建体编码用于过度表达连接至pHSP启动子(SEQ ID NO:63) 和cwpT终止子(SEQ ID NO:70)的密码子优化的解脂耶氏酵母香叶基- 香叶基-焦磷酸合成酶(GGSopt:SEQ ID NO:76)的合成构建体。
5)在MB6958(图17)的HindIII/SspI消化后通过凝胶纯化分离的2.2 kb DNA片段。此构建体编码连接至pHYPO启动子(SEQ ID NO:64)和 gpdT终止子(SEQ ID NO:71)的GGSopt(SEQ ID NO:76)。所得菌株被 指定为ML13462。
步骤2.用在质粒MB7015(图18)的SfiI消化后通过凝胶纯化分离的 9.7kb片段转化菌株ML13462。此构建体编码用于过度表达连接至pENO (SEQ ID NO:65)启动子和gpdT终止子(SEQ ID NO:71)的UGT1(SEQ ID NO:77),连接至pHSP启动子(SEQ ID NO:63)和pgmT终止子(SEQ ID NO:72)的UGT3(SEQ ID NO:78),连接至pCWP(SEQ NO:66)启 动子和pgkT终止子(SEQ ID NO:73)的UGT4(SEQ ID NO:79),以及 lox-侧接的诺尔丝菌素抗性标记(NAT)的合成构建体。注意,lox位点的 放置允许随后通过CRE重组酶介导的重组去除诺尔丝菌素抗性。诺尔丝菌 素抗性分离株被指定为ML13500。
步骤3.用在质粒MB6986(图19)的PvuI/SapI消化后通过凝胶纯化分 离的9.1kb片段转化菌株ML13500。此构建体编码连接至pHSP启动子 (SEQ ID NO:63)和cwpT终止子(SEQID NO:70)的tHMGopt(SEQ ID NO:75)、lox侧接的URA3冲击(URA3blaster)原养型标记以及连接至 pHYPO启动子(SEQ ID NO:64)和gpdT终止子(SEQ ID NO:71)的GGSopt (SEQ IDNO:76)。在缺乏尿嘧啶的基本培养基上选择转化体。一种选择 的尿嘧啶原养型被指定为ML13723。
步骤4.用在质粒MB7059(图20)的SfiI消化后通过凝胶纯化分离的 18.1kb片段转化菌株ML13723。MB7059编码连接至pCWP启动子(SEQ ID NO:66)和cwpT终止子(SEQ ID NO:70)的tCPS_SR(SEQ ID NO:80), 连接至pHYPO启动子(SEQ ID NO:64)和gpdT终止子(SEQID NO:71) 的tKS_SR(SEQ ID NO:81),连接至pHSP启动子(SEQ ID NO:63)和 pgmT终止子(SEQ ID NO:72)的KAH_4(SEQ ID NO:92),连接至pTPI 启动子(SEQ ID NO:67)和pgkT终止子(SEQ ID NO:73)的KO_Gib(SEQ ID NO:83),连接至pENO启动子(SEQ ID NO:65)和xprT终止子(SEQ ID NO:69)的CPR_3(SEQ ID NO:84),以及天然解脂耶氏酵母LEU2基 因座。一种选择的莱鲍迪甙A产生转化体被指定为ML14032。
步骤5.将菌株ML14032划线至YPD并生长过夜,然后划线至5-FOA 板,以允许在步骤3中引入的URA3标记的重组介导的丧失。一种选择的 5-FOA抗性转化体被指定为ML14093。
步骤6.用在质粒MB7100(图21)的SfiI消化后通过凝胶纯化分离的 19.0kb片段转化菌株ML14093。MB7100编码连接至pHYPO启动子(SEQ ID NO:64)和cwpT终止子(SEQ IDNO:70)的tCPS_SR(SEQ ID NO:80), 连接至pCWP启动子(SEQ ID NO:66)和gpdT终止子(SEQID NO:71) 的tKS_SR(SEQ ID NO:81),连接至pHSP启动子(SEQ ID NO:63)和 pgmT终止子(SEQ ID NO:72)的KAH_4(SEQ ID NO:82),连接至pENO 启动子(SEQ ID NO:65)和pgkT终止子(SEQ ID NO:73)的KO_Gib(SEQ ID NO:83),连接至pTPI启动子(SEQ ID NO:67)和xprT终止子(SEQ ID NO:69)的CPR_3(SEQ ID NO:84),以及URA3冲击原养型标记。在缺 乏尿嘧啶的基本培养基上选择转化体。一种选择的莱鲍迪甙A产生尿嘧啶 原养型被指定为ML14094。
实施例12.甜菊醇糖苷产生菌株ML14087(MAT-B谱系)的描述:
步骤1.用5个限定的DNA片段转化菌株ML13206(MAT-B、ade1-、 ure2-、leu2-)。所有转化通过乙酸锂/PEG真菌转化方案方法进行,并在适 当的基本培养基YPD+100μg/ml诺尔丝菌素或YPD+100μg/ml潮霉素上 选择转化体。
1)在质粒MB6969(图13)的HindIII/NotI消化后通过凝胶纯化分离 的7.0kb DNA片段。此构建体编码用于过度表达连接至一起侧接lox位点 (Guldener等人,1996,Lambert等人,2007)的pPGM(SEQ ID NO:62) 启动子和xprT终止子(SEQ ID NO:69)以及HPH潮霉素抗性基因的 UGT2_1a(SEQ ID NO:29)的密码子对优化的(CpO)ORF的合成构建 体,以及用于过度表达缺乏连接至pHSP启动子(SEQ ID NO:63)和cwpT 终止子(SEQ ID NO:70)的5'膜锚定序列(tHMGopt:SEQ ID NO:75)的 密码子优化的解脂耶氏酵母羟甲基戊二酰基-辅酶A还原酶开放阅读框的 合成构建体。
2)在MB6856(图14)的HindIII/SspI消化后通过凝胶纯化分离的2.7 kb DNA片段。此构建体编码连接至pHYPO启动子(SEQ ID NO:64)和 gpdT终止子(SEQ ID NO:71)的tHMGopt(SEQ ID NO:75)。
3)在MB6857(图15)的SspI消化后通过凝胶纯化分离的2.5kb DNA 片段。此构建体编码连接至pHSP启动子(SEQ ID NO:63)和cwpT终止 子(SEQ ID NO:70)的tHMGopt(SEQ IDNO:75)。
4)在MB6948的SspI消化后通过凝胶纯化分离的2.0kb DNA片段(图 16)。此构建体编码用于过度表达连接至pHSP启动子(SEQ ID NO:63)和 cwpT终止子(SEQ ID NO:70)的密码子优化的解脂耶氏酵母香叶基-香叶 基-焦磷酸合成酶(GGSopt:SEQ ID NO:76)的合成构建体。
5)在MB6958(图17)的HindIII/SspI消化后通过凝胶纯化分离的2.2 kb DNA片段。此构建体编码连接至pHYPO(SEQ ID NO:64)启动子和gpdT终止子(SEQ ID NO:71)的GGSopt(SEQ ID NO:76)。所得菌株被 指定为ML13465。
步骤2.用2个限定的DNA片段转化菌株ML13465:
1).在质粒MB7015(图18)的SfiI消化后通过凝胶纯化分离的9.7kb 片段。此构建体编码用于过度表达连接至pENO启动子(SEQ Id NO:65) 和gpdT(SEQ ID NO:71)终止子的UGT1(SEQ ID NO:77),连接至pHSP 启动子(SEQ ID NO:63)和pgmT终止子(SEQ ID NO:72)的UGT3(SEQ ID NO:78),连接至pCWP启动子(SEQ NO:66)和pgkT终止子(SEQ ID NO:73)的UGT4(SEQ ID NO:79),以及lox-侧接的诺尔丝菌素抗性标记 (NAT)的合成构建体。注意,lox位点的放置允许随后通过CRE重组酶 介导的重组去除诺尔丝菌素抗性。
2).在质粒MB6988(图22)的PvuI/SapI消化后通过凝胶纯化分离的 9.1kb片段。此构建体编码连接至pHSP启动子(SEQ ID NO:63)和cwpT 终止子(SEQ ID NO:70)的tHMGopt(SEQ ID NO:75)、lox侧接的URA2 冲击原养型标记以及连接至pHYPO启动子(SEQ ID NO:64)和gpdT终止 子(SEQ ID NO:71)的GGSopt(SEQ ID NO:76)。在YPD+100μg/ml 诺尔丝菌素上选择菌株,并将复制物接种到缺乏尿嘧啶的基本培养基上。 一种诺尔丝菌素抗性尿嘧啶原养型分离株被指定为ML13490
步骤3.将菌株ML13490划线至YPD并生长过夜,然后划线至5-FOA 板,以允许在以上步骤3中引入的URA2标记的重组介导的丧失。一种选 择的5-FOA抗性转化体被指定为ML13501。
步骤4.用在质粒MB6988(图22)的PvuI/SapI消化后通过凝胶纯化分 离的9.1kb片段转化菌株ML13501。在缺乏尿嘧啶的基本培养基上选择转 化体。一种选择的尿嘧啶原养型微生物被指定为ML13724。
步骤5.用在质粒MB7044(图23)的SfiI消化后通过凝胶纯化分离的 18.1kb片段转化菌株ML13724。MB7044编码连接至pHYPO启动子 (SEQ ID NO:64)和cwpT终止子(SEQ IDNO:70)的tCPS_SR(SEQ ID NO:80),连接至pCWP启动子(SEQ ID NO:66)和gpdT终止子(SEQID NO:70)的tKS_SR(SEQ ID NO:81),连接至pHSP启动子(SEQ ID NO: 63)和pgmT终止子(SEQ ID NO:72)的KAH_4(SEQ ID NO:82),连接 至pENO启动子(SEQ ID NO:65)和pgkT终止子(SEQ ID NO:73)的 KO_Gib(SEQ ID NO:83),连接至pTPI启动子(SEQ ID NO:67)和xprT终止子(SEQ ID NO:69)的CPR_3(SEQ ID NO:84)以及LEU2基因座。 一种选择的莱鲍迪甙A产生转化体被指定为ML14044。
步骤6.将菌株ML14044划线至YPD并生长过夜,且然后划线至5-FOA 板,以允许在以上步骤4中引入的URA2标记的重组介导的损失。一种选 择的5’-FOA抗性转化体被指定为ML14076。
步骤7.用在质粒MB7094(图24)的SfiI消化后通过凝胶纯化分离的 19.0kb片段转化菌株ML14076。MB7094编码连接至pHYPO启动子(SEQ ID NO:64)和cwpT终止子(SEQ IDNO:70)的tCPS_SR(SEQ ID NO:80), 连接至pCWP启动子(SEQ ID NO:66)和gpdT终止子(SEQID NO:71) 的tKS_SR(SEQ ID NO:81),连接至pHSP启动子(SEQ ID NO:63)和 pgmT终止子(SEQ ID NO:72)的KAH_4(SEQ ID NO:82),连接至pENO 启动子(SEQ ID NO:65)和pgkT终止子(SEQ ID NO:73)的KO_Gib(SEQ ID NO:83),连接至pTPI启动子(SEQ ID NO:67)和xprT终止子(SEQ ID NO:69)的CPR_3(SEQ ID NO:84)以及URA2冲击原养型标记。在缺乏 尿嘧啶的基本培养基上选择转化体。一种选择的莱鲍迪甙A产生尿嘧啶原 养型被指定为ML14087。
实施例13.接合MATA和MATB谱系并选择甜菊醇糖苷产生子代
允许具有互补营养缺陷(ADE1+lys1-和ade1-LYS1+)的相对接合型 (ML14094和ML14087)的菌株接合,然后接种在仅允许二倍体生长的选 择性培养基(缺乏腺嘌呤和赖氨酸的基本培养基)上。然后诱导二倍体细 胞(ML14143)通过饥饿进行减数分裂和孢子形成,并将所得的单倍体子 代复制接种以鉴定具有潮霉素和诺尔丝菌素抗性的原养型分离株。一种选 择的莱鲍迪甙A产生菌株被指定为ML14737
实施例14.使菌株不含UGT2 1a
在用MB6128(图25)转化后从菌株ML14737去除潮霉素抗生素标记 和诺尔丝菌素抗生素标记,所述MB6128编码用于组成型过度表达CRE重 组酶的构建体。CRE重组酶通过在Lox66和Lox71位点上的重组而缺失抗 生素标记。非活性Lox72位点留在基因组中(Guldener等人,1996,Lambert 等人,2007)。质粒MB6128是一种CEN质粒,其在解脂耶氏酵母中以附 加体的形式复制并且其含有在天然解脂耶氏酵母pHHF启动子和hhfT终止 子控制下的CRE重组酶编码区以及在天然解脂耶氏酵母pTEF1启动子和 xprT终止子控制下的neoR(编码G418抗性)。在YPD+G418上选择 MB6128转化体并通过成功的Cre-Lox重组筛选丧失潮霉素和诺尔丝菌素 抗性的转化体后,将敏感菌落生长在非选择性培养基上以去除MB6128 CEN质粒(CEN质粒自发丧失)。所得到的不含抗生素标记的变体被指定 为ML14869。由于UGT2_1a连同潮霉素抗性的丧失,此菌株不再产生莱鲍 迪甙A,而是产生中间体甜茶苷。
实施例15.UGT2基因的转化
将UGT2基因变体和作为对照的UGT2_1a放置在解脂耶氏酵母pHSP 启动子(SEQ IDNO:63)后面,并与解脂耶氏酵母终止子gpdT(SEQ ID NO: 71)组合。与UGT1(SEQ ID NO:77)、KAH_4(SEQ ID NO:82)、lox-侧 接的G418抗性标记(KanMX)和解脂耶氏酵母GSY1整合侧翼一起,将 每个UGT2在酿酒酵母中组装到CEN质粒p417[5-3]上的构建体中(参见 图26)。
表10.在构建具有UGT2变体的菌株中使用的启动子、ORF和终止子
Figure BDA0001410935660000511
将这些构建体(对于每个UGT2为一个)用作PCR中的模板以扩增5'- 部分和3'-部分(参见图27)。这个5'部分由3'-GSY1整合侧翼的开始与 KanMX开放阅读框的结束之间的一切组成。3'-部分由KanMX开放阅读框 的第二个密码子与5'-GSY1整合侧翼的结束之间的一切组成。
对于UGT2测试而言,将每个5'-部分和3'-部分组合转化到菌株 ML14869中。在含有G418的YPD培养基上选择转化体。从每个转化中选 择12个菌落用于产生实验。
实施例16.用解脂耶氏酵母产生RebA
将预培养物与来自YEPh-D琼脂的菌落物质一起接种。将预培养物在 具有葡萄糖作为碳源的200μl YEP中生长。将预培养物在27℃、750rpm 和80%湿度的Infors孵育箱中孵育72小时。使用40μl预培养物来接种具 有葡萄糖作为碳源的2.5mlYEP。将主要培养物在27℃、550rpm、80%湿 度下在Infors孵育箱中孵育120小时。在120小时后,将主培养物以2750rpm 离心10分钟。从上清液中取出100μl,并在55%乙腈中稀释2.5倍。在33% 乙腈中进一步稀释。
结果在图28和表11中示出。可以看出,表达变体UGT2的菌株产生 更高的RebA滴度。
表11:表达UGT2变体酶的耶氏酵母属菌株中的莱鲍迪甙A的产生
样品 RebA(mg/L)
UGT2_2b 254
UGT2_3b 396
UGT2_5b 422
UGT2_9b 246
UGT2_10b 249
UGT2_1a 198
实施例17.用解脂耶氏酵母产生RebM
将预培养物与来自YEPh-D琼脂的菌落物质一起接种。将预培养物在 具有葡萄糖作为碳源的200μl YEP中生长。将预培养物在27℃、750rpm 和80%湿度的Infors孵育箱中孵育72小时。使用40μl预培养物来接种具 有葡萄糖作为碳源的2.5mlYEP。将主要培养物在27℃、550rpm、80%湿 度下在Infors孵育箱中孵育120小时。在120小时后,将主培养物以2750rpm 离心10分钟。从上清液中取出100μl,并在55%乙腈中稀释2.5倍。在33% 乙腈中进一步稀释。
结果在图29和表12中示出。可以看出,表达变体UGT2的菌株产生 更高的RebM滴度。
表12:表达UGT2变体酶的耶氏酵母属菌株中的莱鲍迪甙M的产生
样品 RebM(mg/L)
UGT2_7b 37,5
UGT2_1a 23,3
实施例18:
为了评估UGT2的不同变体对生物反应器中甜菊醇糖苷产生的影响, 选择了实施例15中描述的菌株中的两种。一个菌株表达UGT2_6b,另一 菌株表达UGT2_7b。应用的发酵方案是补料分批发酵,并且每日采集全发 酵液样品以用于使用LC/MS分析甜菊醇糖苷。
如可在图30中看出的,与表达UGT2_7b的菌株相比,表达UGT2_6b 的菌株产生更多的RebA。然而,与表达UGT2_6b的菌株相比,表达 UGT2_7b的菌株产生显著更多的RebM。两种菌株均产生比RebM更多的 RebA。在发酵结束时,在表达UGT2_6b的菌株的情况下,RebA浓度为 RebM浓度的20倍,而在表达UGT2_7b的菌株中,RebA浓度为RebM浓 度的4倍。不同的产物比率反映了UGT2性质的内在差异,其中与UGT2_6b 相比,UGT2_7b在19位上具有更高的葡萄糖糖基化活性。将分别来自甜 菊苷和RebA的19位上的糖基化反应的产物如RebE和RebD通过UGT4 的活性进一步转化为RebM,参见图32。
这说明通过使用在此描述的UGT2的不同变体,生产能够被有效地导 向目标产物。
表13:序列表的描述
Figure BDA0001410935660000531
Figure BDA0001410935660000541
Figure BDA0001410935660000551
序列表
<110> 帝斯曼知识产权资产管理有限公司
<120> UDP-糖基转移酶
<130> 30995-WO-PCT
<150> US62/133606
<151> 2015-03-16
<160> 84
<170> SIPOSequenceListing 1.0
<210> 1
<211> 473
<212> PRT
<213> 人工序列()
<220>
<223> UGT2_1b变体
<400> 1
Met Ala Thr Ser Asp Ser Ile Val Asp Asp Arg Lys Lys Leu His Ile
1 5 10 15
Val Met Phe Pro Trp Leu Ala Phe Gly His Ile Ile Pro Tyr Leu Gln
20 25 30
Leu Ala Lys Leu Ile Ala Glu Lys Gly His Lys Val Ser Phe Leu Ser
35 40 45
Thr Thr Arg Asn Ile Gln Arg Leu Ser Ser His Ile Ser Pro Leu Ile
50 55 60
Asn Phe Val Lys Leu Thr Leu Pro Arg Val Gln Glu Leu Pro Glu Asp
65 70 75 80
Ala Glu Ala Thr Thr Asp Val His Pro Glu Asp Ile Pro Tyr Leu Lys
85 90 95
Leu Ala Ser Asp Gly Leu Gln Glu Pro Leu Thr Arg Phe Leu Glu Ser
100 105 110
Ser Ser Pro Asp Trp Ile Ile Tyr Asp Tyr Thr His Tyr Trp Leu Pro
115 120 125
Glu Ile Ala Ala Ser Leu Gly Val Ala Arg Ala His Phe Ser Val Thr
130 135 140
Thr Pro Trp Ala Leu Ala Phe Met Gly Pro Ser Ala Asp Ala Met Ile
145 150 155 160
Asn Gly Ser Asp Gly Arg Thr Glu Val Glu Asp Phe Thr Val Pro Pro
165 170 175
Lys Trp Ile Pro Phe Pro Thr Thr Val Ala Trp Arg Lys His Asp Leu
180 185 190
Ala Arg Leu Val Pro Tyr Lys Ala Pro Gly Ile Ser Asp Gly Tyr Arg
195 200 205
Met Gly Leu Val Leu Lys Gly Cys Asp Cys Leu Leu Ser Arg Thr Tyr
210 215 220
His Glu Phe Gly Thr Gln Trp Leu Pro Leu Leu Glu Glu Leu His Gln
225 230 235 240
Val Pro Val Val Pro Val Gly Leu Leu Pro Pro Ser Ile Pro Gly Asp
245 250 255
Glu Lys Asp Glu Asn Trp Val Ser Ile Lys Asp Trp Leu Asp Lys Gln
260 265 270
Glu Lys Gly Ser Val Val Tyr Val Ala Leu Gly Ser Glu Val Leu Leu
275 280 285
Thr Glu Glu Glu Val Val Glu Leu Ala Leu Gly Leu Glu Leu Ser Gly
290 295 300
Leu Pro Phe Phe Trp Ala Tyr Arg Lys Pro Lys Gly Pro Ala Lys Ser
305 310 315 320
Asp Ser Val Glu Leu Pro Asp Gly Phe Val Glu Arg Thr Arg Asp Arg
325 330 335
Gly Leu Val Trp Thr Ser Trp Ala Pro Gln Leu Arg Ile Leu Ser His
340 345 350
Glu Ser Val Gly Gly Phe Val Thr His Cys Gly Ser Gly Ser Ile Val
355 360 365
Glu Gly Leu Met Phe Gly His Pro Leu Ile Met Leu Pro Ile Phe Gly
370 375 380
Asp Gln Pro Leu Asn Ala Arg Leu Leu Glu Asp Lys Gln Val Gly Ile
385 390 395 400
Glu Ile Pro Arg Asn Glu Glu Asp Gly Cys Leu Thr Lys Glu Ser Val
405 410 415
Ala Glu Ser Leu Arg Leu Val Val Val Glu Lys Glu Gly Glu Ile Tyr
420 425 430
Arg Glu Lys Ala Arg Glu Met Ser Lys Val Tyr Ser Asp Thr Lys Arg
435 440 445
Glu Lys Glu Tyr Val Asp Gln Phe Val Asp Tyr Leu Glu Lys Asn Ala
450 455 460
Arg Ala Val Ala Ile Asp His Glu Ser
465 470
<210> 2
<211> 1419
<212> DNA
<213> 人工序列()
<220>
<223> UGT2_1b CpO用于酿酒酵母
<400> 2
atggccactt ctgactccat cgttgatgac agaaagaagt tgcacatcgt tatgttccca 60
tggttagctt tcggtcacat tatcccatac ttgcaattgg ctaaattgat tgctgaaaag 120
ggtcacaaag tctctttctt gtccaccacc agaaacatcc aaagattatc ttctcacatt 180
tctccattga tcaacttcgt caagttgact ttaccaagag ttcaagaatt gccagaagat 240
gctgaagcta ccaccgatgt ccatccagaa gatatcccat acttgaagtt ggcttctgat 300
ggtttgcaag aaccattgac tagattcttg gaatcttctt ctccagactg gattatctac 360
gactacactc actactggtt accagaaatt gctgcctctt tgggtgttgc tcgtgctcat 420
ttctccgtta ccactccatg ggctttggct ttcatgggtc catctgctga tgctatgatc 480
aacggttctg atggtagaac cgaagtcgaa gacttcaccg ttccaccaaa atggatccca 540
ttcccaacca ctgtcgcttg gagaaagcac gatttggcca gattagttcc atacaaggcc 600
ccaggtatct ctgacggtta cagaatgggt ttagtcttga agggttgtga ctgtttgttg 660
tccagaactt accatgaatt cggtactcaa tggttacctt tgttggaaga attgcaccaa 720
gtcccagttg ttccagttgg tttgttgcct ccttctatcc caggtgacga aaaggacgaa 780
aactgggttt ccatcaagga ctggttagat aagcaagaaa agggttccgt tgtctacgtt 840
gctttgggtt ctgaagtctt gttgactgaa gaagaagttg ttgaattggc tttgggtttg 900
gaattgtccg gtctaccatt tttctgggct tacagaaagc caaagggtcc agctaagtct 960
gactctgttg aattgccaga tggtttcgtc gaaagaacca gagacagagg tttggtctgg 1020
acttcctggg ctccacaatt gagaattttg tcccacgaat ctgttggtgg tttcgttacc 1080
cactgtggtt ctggttccat tgtcgaaggt ttgatgttcg gtcacccatt gatcatgttg 1140
ccaatcttcg gtgaccaacc attgaacgct agattattgg aagacaagca agtcggtatt 1200
gaaatcccaa gaaacgaaga agacggttgt ttgaccaagg aatctgttgc cgaatctcta 1260
agattggttg ttgtcgaaaa ggaaggtgaa atctacagag aaaaggctag agaaatgtcc 1320
aaggtttact ctgataccaa gagagaaaag gaatatgtcg accaatttgt tgactacttg 1380
gaaaagaacg ctcgtgccgt tgccattgac cacgaaagc 1419
<210> 3
<211> 473
<212> PRT
<213> 人工序列()
<220>
<223> UGT2_2b变体
<400> 3
Met Ala Thr Ser Asp Ser Ile Val Asp Asp Arg Lys Lys Leu His Ile
1 5 10 15
Val Met Phe Pro Trp Leu Ala Phe Gly His Ile Ile Pro Tyr Leu Gln
20 25 30
Leu Ala Lys Leu Ile Ala Glu Lys Gly His Lys Val Ser Phe Leu Ser
35 40 45
Thr Thr Arg Asn Ile Gln Arg Leu Ser Ser His Ile Ser Pro Leu Ile
50 55 60
Asn Phe Val Lys Leu Thr Leu Pro Arg Val Gln Glu Leu Pro Glu Asp
65 70 75 80
Ala Glu Ala Thr Thr Asp Val His Pro Glu Asp Ile Pro Tyr Leu Lys
85 90 95
Lys Ala Ser Asp Gly Leu Gln Pro Glu Val Thr Glu Phe Leu Glu Gln
100 105 110
His Ser Pro Asp Trp Ile Ile Tyr Asp Tyr Thr His Tyr Trp Leu Pro
115 120 125
Ser Ile Ala Thr Lys His Gly Val Ser Arg Ala His Phe Ser Val Thr
130 135 140
Thr Pro Trp Ala Ile Ala Tyr Met Gly Pro Thr Ala Asp Ala Met Ile
145 150 155 160
Asn Gly Ser Asp Gly Arg Thr Thr Pro Glu Asp Phe Thr Val Pro Pro
165 170 175
Lys Trp Phe Pro Phe Pro Thr Lys Val Cys Trp Arg Lys His Asp Leu
180 185 190
Ala Arg Leu Val Pro Tyr Lys Ala Pro Gly Ile Ser Asp Gly Tyr Arg
195 200 205
Met Gly Leu Val Leu Lys Gly Cys Asp Cys Leu Leu Ser Arg Thr Tyr
210 215 220
His Glu Phe Gly Thr Gln Trp Leu Pro Leu Leu Glu Glu Leu His Gln
225 230 235 240
Val Pro Val Val Pro Val Gly Leu Leu Pro Pro Ser Ile Pro Gly Asp
245 250 255
Glu Lys Asp Glu Asn Trp Val Ser Ile Lys Asp Trp Leu Asp Lys Gln
260 265 270
Glu Lys Gly Ser Val Val Tyr Val Ala Leu Gly Ser Glu Val Leu Leu
275 280 285
Thr Glu Glu Glu Val Val Glu Leu Ala Leu Gly Leu Glu Leu Ser Gly
290 295 300
Leu Pro Phe Phe Trp Ala Tyr Arg Lys Pro Lys Gly Pro Ala Lys Ser
305 310 315 320
Asp Ser Val Glu Leu Pro Asp Gly Phe Val Glu Arg Thr Arg Asp Arg
325 330 335
Gly Leu Val Trp Thr Ser Trp Ala Pro Gln Leu Arg Ile Leu Ser His
340 345 350
Glu Ser Val Gly Gly Phe Val Thr His Cys Gly Ser Gly Ser Ile Val
355 360 365
Glu Gly Leu Met Phe Gly His Pro Leu Ile Met Leu Pro Ile Phe Gly
370 375 380
Asp Gln Pro Leu Asn Ala Arg Leu Leu Glu Asp Lys Gln Val Gly Ile
385 390 395 400
Glu Ile Gln Arg Asn Glu Glu Asp Gly Cys Leu Thr Lys Glu Ser Val
405 410 415
Ala Glu Ser Leu Arg Leu Val Val Val Glu Lys Glu Gly Glu Ile Tyr
420 425 430
Arg Glu Lys Ala Arg Glu Met Ser Lys Val Tyr Ser Asp Thr Lys Arg
435 440 445
Glu Lys Glu Tyr Val Asp Gln Phe Val Asp Tyr Leu Glu Lys Asn Ala
450 455 460
Arg Ala Val Ala Ile Asp His Glu Ser
465 470
<210> 4
<211> 1419
<212> DNA
<213> 人工序列()
<220>
<223> UGT2_2b CpO用于酿酒酵母
<400> 4
atggccactt ctgactccat cgttgatgac agaaagaagt tgcacatcgt tatgttccca 60
tggttagctt tcggtcacat tatcccatac ttgcaattgg ctaaattgat tgctgaaaag 120
ggtcacaaag tctctttctt gtccaccacc agaaacatcc aaagattatc ttctcacatt 180
tctccattga tcaacttcgt caagttgact ttaccaagag ttcaagaatt gccagaagat 240
gctgaagcta ccaccgatgt ccatccagaa gatatcccat acttgaagaa ggcttctgat 300
ggtttgcaac cagaagtcac tgaattcttg gaacaacact ctccagactg gattatctac 360
gactacactc actactggtt accatccatt gctactaagc acggtgtttc tcgtgctcat 420
ttctccgtta ccactccatg ggctattgct tacatgggtc caactgctga tgctatgatc 480
aacggttctg atggtagaac cactccagaa gacttcaccg ttccaccaaa atggttccca 540
ttcccaacca aggtctgttg gagaaagcac gatttggcca gattagttcc atacaaggcc 600
ccaggtatct ctgacggtta cagaatgggt ttagtcttga agggttgtga ctgtttgttg 660
tccagaactt accatgaatt cggtactcaa tggttacctt tgttggaaga attgcaccaa 720
gtcccagttg ttccagttgg tttgttgcct ccttctatcc caggtgacga aaaggacgaa 780
aactgggttt ccatcaagga ctggttagat aagcaagaaa agggttccgt tgtctacgtt 840
gctttgggtt ctgaagtctt gttgactgaa gaagaagttg ttgaattggc tttgggtttg 900
gaattgtccg gtctaccatt tttctgggct tacagaaagc caaagggtcc agctaagtct 960
gactctgttg aattgccaga tggtttcgtc gaaagaacca gagacagagg tttggtctgg 1020
acttcctggg ctccacaatt gagaattttg tcccacgaat ctgttggtgg tttcgttacc 1080
cactgtggtt ctggttccat tgtcgaaggt ttgatgttcg gtcacccatt gatcatgttg 1140
ccaatcttcg gtgaccaacc attgaacgct agattattgg aagacaagca agtcggtatt 1200
gaaatccaaa gaaacgaaga agacggttgt ttgaccaagg aatctgttgc cgaatctcta 1260
agattggttg ttgtcgaaaa ggaaggtgaa atctacagag aaaaggctag agaaatgtcc 1320
aaggtttact ctgataccaa gagagaaaag gaatatgtcg accaatttgt tgactacttg 1380
gaaaagaacg ctcgtgccgt tgccattgac cacgaaagc 1419
<210> 5
<211> 1419
<212> DNA
<213> 人工序列()
<220>
<223> UGT2_2b CpO用于解脂耶氏酵母
<400> 5
atggccacct ccgactccat tgtcgacgac cgaaagaagc tccacattgt catgttcccc 60
tggctcgcct ttggccacat cattccctac ctccagctcg ccaagctcat tgctgagaag 120
ggccacaagg tttctttcct ctccaccacc cgaaacatcc agcgactctc ttcccacatc 180
tctcccctca tcaactttgt caagctcacc ctcccccgag tccaggagct tcccgaggat 240
gctgaggcca ccactgatgt ccaccccgag gacatcccct acctcaagaa ggcttccgac 300
ggtctgcagc ccgaggtcac tgagtttctc gagcagcact ctcccgactg gatcatctac 360
gactacaccc actactggct cccctccatt gccaccaagc acggtgtctc tcgagcccac 420
ttctccgtca ccaccccctg ggccattgct tacatgggtc ccactgccga tgccatgatc 480
aacggttccg acggccgaac cactcccgag gacttcactg tccctcccaa gtggttcccc 540
ttccccacca aggtctgctg gcgaaagcac gatctcgccc gactcgtccc ctacaaggcc 600
cccggtatct ccgacggtta ccgaatgggt ctggtcctca agggctgtga ctgcctcctc 660
tctcgaacct accacgagtt cggcacccag tggctccccc tccttgagga gctgcaccag 720
gtccccgttg tccccgtcgg tctgctccct ccctccatcc ccggtgacga gaaggacgag 780
aactgggttt ccatcaagga ctggctcgac aagcaggaga agggctctgt tgtctacgtt 840
gctctcggct ccgaggttct gctcaccgag gaagaggttg ttgagctggc tctcggtctg 900
gagctgtccg gcctcccctt cttctgggcc taccgaaagc ccaagggccc cgccaagtcc 960
gactccgtcg agctgcccga cggtttcgtc gagcgaaccc gagatcgagg tctggtctgg 1020
acctcttggg ctccccagct ccgaatcctc tcccacgagt ccgttggtgg tttcgtcacc 1080
cactgcggtt ccggctccat cgtcgagggt ctgatgttcg gccaccctct catcatgctc 1140
cccatcttcg gtgaccagcc cctcaacgcc cgactgctcg aggataagca ggtcggtatc 1200
gagatccagc gaaacgaaga ggacggctgt ctgaccaagg agtccgtcgc cgagtctctc 1260
cgactcgttg ttgtcgagaa agagggtgag atctaccgag agaaggcccg agagatgtcc 1320
aaggtctact ccgacaccaa gcgtgagaag gagtacgtcg accagttcgt cgactacctc 1380
gagaagaacg cccgagctgt tgccattgac cacgagtct 1419
<210> 6
<211> 473
<212> PRT
<213> 人工序列()
<220>
<223> UGT2_3b变体
<400> 6
Met Ala Thr Ser Asp Ser Ile Val Asp Asp Arg Lys Lys Leu His Ile
1 5 10 15
Val Met Phe Pro Trp Leu Ala Phe Gly His Ile Ile Pro Tyr Leu Gln
20 25 30
Leu Ala Lys Leu Ile Ala Glu Lys Gly His Lys Val Ser Phe Leu Ser
35 40 45
Thr Thr Arg Asn Ile Gln Arg Leu Ser Ser His Ile Ser Pro Leu Ile
50 55 60
Asn Phe Val Lys Leu Thr Leu Pro Arg Val Gln Glu Leu Pro Glu Asp
65 70 75 80
Ala Glu Ala Thr Thr Asp Val His Pro Glu Asp Ile Pro Tyr Leu Lys
85 90 95
Lys Ala Ser Asp Gly Leu Gln Pro Glu Val Thr Glu Phe Leu Glu Gln
100 105 110
His Ser Pro Asp Trp Ile Ile Tyr Asp Tyr Thr His Tyr Trp Leu Pro
115 120 125
Ser Ile Ala Thr Lys His Gly Val Ser Arg Ala His Phe Ser Val Thr
130 135 140
Thr Pro Trp Ala Ile Ala Tyr Met Gly Pro Thr Ala Asp Ala Met Ile
145 150 155 160
Asn Gly Ser Asp Gly Arg Thr Thr Pro Glu Asp Phe Thr Val Pro Pro
165 170 175
Lys Trp Phe Pro Phe Pro Thr Lys Val Cys Trp Arg Lys His Asp Leu
180 185 190
Ala Arg Leu Val Pro Tyr Lys Ala Pro Gly Ile Ser Asp Gly Tyr Arg
195 200 205
Met Gly Leu Val Leu Lys Gly Ser Asp Leu Leu Leu Ser Arg Ser Tyr
210 215 220
His Glu Phe Gly Thr Glu Trp Leu Arg Leu Leu Glu Thr Leu His Arg
225 230 235 240
Val Pro Val Val Pro Val Gly Leu Leu Pro Pro Glu Ile Pro Gly Asp
245 250 255
Gly Glu Asp Glu Ser Trp Val Ser Ile Lys Asp Trp Leu Asp Lys Lys
260 265 270
Glu Lys Gly Ser Val Val Tyr Val Ala Leu Gly Ser Glu Val Leu Val
275 280 285
Ser Gln Glu Glu Leu Asn Glu Leu Ala Leu Gly Leu Glu Leu Ser Gly
290 295 300
Leu Pro Phe Val Trp Ala Tyr Arg Lys Pro Lys Gly Pro Ala Lys Ser
305 310 315 320
Asp Ser Val Glu Leu Pro Asp Gly Phe Glu Glu Arg Thr Arg Gly Arg
325 330 335
Gly Val Val Trp Thr Ser Trp Ala Pro Gln Leu Arg Ile Leu Ser His
340 345 350
Glu Ser Val Ala Gly Phe Leu Thr His Cys Gly Ser Gly Ser Ile Val
355 360 365
Glu Gly Leu Met Phe Gly His Pro Leu Ile Met Leu Pro Leu Phe Gly
370 375 380
Asp Gln Pro Leu Asn Ala Arg Leu Leu Glu Asp Lys Gln Val Gly Ile
385 390 395 400
Glu Ile Pro Arg Asp Glu Glu Asp Gly Cys Leu Thr Lys Glu Ser Val
405 410 415
Ala Arg Ser Leu Arg Leu Val Met Val Glu Lys Glu Gly Glu Ile Tyr
420 425 430
Arg Glu Lys Ala Arg Glu Met Ser Lys Ile Tyr Asn Asn Thr Glu Val
435 440 445
Glu Asp Gln Tyr Val Ser Gln Phe Val Glu Tyr Leu Glu Lys Asn Ala
450 455 460
Arg Ala Val Ala Ile Asp His Glu Ser
465 470
<210> 7
<211> 1419
<212> DNA
<213> 人工序列()
<220>
<223> UGT2_3b CpO用于酿酒酵母
<400> 7
atggccactt ctgactccat cgttgatgac agaaagaagt tgcacatcgt tatgttccca 60
tggttagctt tcggtcacat tatcccatac ttgcaattgg ctaaattgat tgctgaaaag 120
ggtcacaaag tctctttctt gtccaccacc agaaacatcc aaagattatc ttctcacatt 180
tctccattga tcaacttcgt caagttgact ttaccaagag ttcaagaatt gccagaagat 240
gctgaagcta ccaccgatgt ccatccagaa gatatcccat acttgaagaa ggcttctgat 300
ggtttgcaac cagaagtcac tgaattcttg gaacaacact ctccagactg gattatctac 360
gactacactc actactggtt accatccatt gctactaagc acggtgtttc tcgtgctcat 420
ttctccgtta ccactccatg ggctattgct tacatgggtc caactgctga tgctatgatc 480
aacggttctg atggtagaac cactccagaa gacttcaccg ttccaccaaa atggttccca 540
ttcccaacca aggtctgttg gagaaagcac gatttggcca gattagttcc atacaaggcc 600
ccaggtatct ctgacggtta cagaatgggt ttagtcttga agggttctga cttgttgttg 660
tccagatctt accatgaatt cggtactgaa tggttaagat tgttggaaac tttgcacaga 720
gtcccagttg ttccagttgg tttgttgcct cctgaaatcc caggtgacgg tgaagacgaa 780
tcttgggttt ccatcaagga ctggttagat aagaaggaaa agggttccgt tgtctacgtt 840
gctttgggtt ctgaagtctt ggtttctcaa gaagaattga acgaattggc tttgggtttg 900
gaattgtccg gtctaccatt tgtctgggct tacagaaagc caaagggtcc agctaagtct 960
gactctgttg aattgccaga tggtttcgaa gaaagaacca gaggtagagg tgttgtctgg 1020
acttcctggg ctccacaatt gagaattttg tcccacgaat ctgttgctgg tttcttgacc 1080
cactgtggtt ctggttccat tgtcgaaggt ttgatgttcg gtcacccatt gatcatgttg 1140
ccattgttcg gtgaccaacc attgaacgct agattattgg aagacaagca agtcggtatt 1200
gaaatcccaa gagatgaaga agacggttgt ttgaccaagg aatctgttgc ccgttctcta 1260
agattggtta tggtcgaaaa ggaaggtgaa atctacagag aaaaggctag agaaatgtcc 1320
aagatctaca acaacaccga agtcgaagac caatatgtct cccaatttgt tgaatacttg 1380
gaaaagaacg ctcgtgccgt tgccattgac cacgaaagc 1419
<210> 8
<211> 1419
<212> DNA
<213> 人工序列()
<220>
<223> UGT2_3b CpO用于解脂耶氏酵母
<400> 8
atggccacct ccgactccat tgtcgacgac cgaaagaagc tccacattgt catgttcccc 60
tggctcgcct ttggccacat catcccttac ctccagctcg ccaagctcat tgctgagaag 120
ggccacaagg tttccttcct ctccaccacc cgaaacatcc agcgactctc ctcccacatc 180
tctcctctca tcaactttgt caagctcacc ctcccccgag tccaggagct gcccgaggat 240
gctgaggcca ccaccgatgt ccaccccgag gacatcccct acctcaagaa ggcctccgat 300
ggcctccagc ccgaggtcac cgagttcctc gagcagcact ctcccgactg gatcatctac 360
gactacaccc actactggct cccctccatt gccaccaagc acggtgtctc tcgagcccac 420
ttctccgtca ccaccccctg ggccattgcc tacatgggtc ccactgctga cgccatgatc 480
aacggttccg acggccgaac cactcccgag gacttcactg tccctcccaa gtggttcccc 540
ttccccacca aggtctgctg gcgaaagcac gacctcgccc gactcgtccc ctacaaggct 600
cccggtatct ccgacggcta ccgaatgggt ctggtcctca agggctctga tctcctcctc 660
tctcgatctt accacgagtt cggcaccgag tggctccgac tgctcgagac tctccaccga 720
gtccccgttg tccccgtcgg tctgctccct cccgagatcc ccggtgacgg tgaggacgag 780
tcttgggttt ccatcaagga ctggctcgac aagaaggaga agggctccgt tgtctacgtt 840
gctctcggtt ccgaggttct tgtctcccaa gaggagctta acgagctggc tctcggtctg 900
gagctgtccg gtctgccctt tgtctgggcc taccgaaagc ccaagggccc cgccaagtcc 960
gactccgtcg agcttcccga cggtttcgag gagcgaaccc gaggccgagg tgttgtctgg 1020
acctcttggg ctccccagct ccgaatcctc tcccacgagt ccgtcgccgg tttcctcacc 1080
cactgcggtt ccggctccat tgttgagggt ctgatgttcg gccaccccct catcatgctc 1140
cccctcttcg gtgaccagcc cctcaacgcc cgacttctcg aggacaagca ggtcggtatt 1200
gagatccccc gagatgaaga ggacggctgt ctgaccaagg agtctgttgc ccgatctctg 1260
cgactcgtca tggtcgagaa ggaaggtgag atctaccgag agaaggcccg agagatgtcc 1320
aagatctaca acaacaccga ggtcgaggac cagtacgttt cccagttcgt cgagtacctt 1380
gagaagaacg cccgagctgt tgccattgac cacgaatca 1419
<210> 9
<211> 473
<212> PRT
<213> 人工序列()
<220>
<223> UGT2_4b变体
<400> 9
Met Ala Thr Ser Asp Ser Ile Val Asp Asp Arg Lys Lys Leu His Ile
1 5 10 15
Val Met Phe Pro Trp Leu Ala Phe Gly His Ile Ile Pro Tyr Leu Glu
20 25 30
Leu Ser Lys Leu Ile Ala Gln Lys Gly His Lys Val Ser Phe Leu Ser
35 40 45
Thr Thr Lys Asn Ile Asp Arg Leu Ser Ser His Ile Ser Pro Leu Ile
50 55 60
Asn Val Val Gln Leu Thr Leu Pro Arg Val Gln Glu Leu Pro Glu Asp
65 70 75 80
Ala Glu Ala Thr Thr Asp Val His Pro Glu Asp Ile Pro Tyr Leu Lys
85 90 95
Leu Ala Ser Asp Gly Leu Gln Glu Pro Leu Thr Arg Phe Leu Glu Ser
100 105 110
Ser Ser Pro Asp Trp Ile Ile Tyr Asp Tyr Thr His Tyr Trp Leu Pro
115 120 125
Glu Ile Ala Ala Ser Leu Gly Val Ala Arg Ala His Phe Ser Val Thr
130 135 140
Thr Pro Trp Ala Leu Ala Phe Met Gly Pro Ser Ala Asp Ala Met Ile
145 150 155 160
Asn Gly Ser Asp Gly Arg Thr Glu Val Glu Asp Phe Thr Val Pro Pro
165 170 175
Lys Trp Ile Pro Phe Pro Thr Thr Val Ala Trp Arg Lys His Asp Leu
180 185 190
Ala Arg Leu Val Pro Tyr Lys Ala Pro Gly Ile Ser Asp Gly Tyr Arg
195 200 205
Met Gly Leu Val Leu Lys Gly Cys Asp Cys Leu Leu Ser Arg Thr Tyr
210 215 220
His Glu Phe Gly Thr Gln Trp Leu Pro Leu Leu Glu Glu Leu His Gln
225 230 235 240
Val Pro Val Val Pro Val Gly Leu Leu Pro Pro Ser Ile Pro Gly Asp
245 250 255
Glu Lys Asp Glu Asn Trp Val Ser Ile Lys Asp Trp Leu Asp Lys Gln
260 265 270
Glu Lys Gly Ser Val Val Tyr Val Ala Leu Gly Ser Glu Val Leu Leu
275 280 285
Thr Glu Glu Glu Val Val Glu Leu Ala Leu Gly Leu Glu Leu Ser Gly
290 295 300
Leu Pro Phe Phe Trp Ala Tyr Arg Lys Pro Lys Gly Pro Ala Lys Ser
305 310 315 320
Asp Ser Val Glu Leu Pro Asp Gly Phe Val Glu Arg Thr Arg Asp Arg
325 330 335
Gly Leu Val Trp Thr Ser Trp Ala Pro Gln Leu Arg Ile Leu Ser His
340 345 350
Glu Ser Val Ala Gly Phe Leu Thr His Cys Gly Ser Gly Ser Ile Val
355 360 365
Glu Gly Leu Met Phe Gly His Pro Leu Ile Met Leu Pro Leu Phe Gly
370 375 380
Asp Gln Pro Leu Asn Ala Arg Leu Leu Glu Asp Lys Gln Val Gly Ile
385 390 395 400
Glu Ile Pro Arg Asp Glu Glu Asp Gly Cys Leu Thr Lys Glu Ser Val
405 410 415
Ala Arg Ser Leu Arg Leu Val Met Val Glu Lys Glu Gly Glu Ile Tyr
420 425 430
Arg Glu Lys Ala Arg Glu Met Ser Lys Ile Tyr Asn Asn Thr Glu Val
435 440 445
Glu Asp Gln Tyr Val Ser Gln Phe Val Glu Tyr Leu Glu Lys Asn Ala
450 455 460
Arg Ala Val Ala Ile Asp His Glu Ser
465 470
<210> 10
<211> 1419
<212> DNA
<213> 人工序列()
<220>
<223> UGT2_4b CpO用于酿酒酵母
<400> 10
atggccactt ctgactccat cgttgatgac agaaagaagt tgcacatcgt tatgttccca 60
tggttagctt tcggtcacat tatcccatac ttggaattgt ccaaattgat tgctcaaaag 120
ggtcacaaag tctctttctt gtccaccacc aagaacatcg acagattatc ttctcacatt 180
tctccattga tcaacgttgt ccaattgact ttaccaagag ttcaagaatt gccagaagat 240
gctgaagcta ccaccgatgt ccatccagaa gatatcccat acttgaagtt ggcttctgat 300
ggtttgcaag aaccattgac tagattcttg gaatcttctt ctccagactg gattatctac 360
gactacactc actactggtt accagaaatt gctgcctctt tgggtgttgc tcgtgctcat 420
ttctccgtta ccactccatg ggctttggct ttcatgggtc catctgctga tgctatgatc 480
aacggttctg atggtagaac cgaagtcgaa gacttcaccg ttccaccaaa atggatccca 540
ttcccaacca ctgtcgcttg gagaaagcac gatttggcca gattagttcc atacaaggcc 600
ccaggtatct ctgacggtta cagaatgggt ttagtcttga agggttgtga ctgtttgttg 660
tccagaactt accatgaatt cggtactcaa tggttacctt tgttggaaga attgcaccaa 720
gtcccagttg ttccagttgg tttgttgcct ccttctatcc caggtgacga aaaggacgaa 780
aactgggttt ccatcaagga ctggttagat aagcaagaaa agggttccgt tgtctacgtt 840
gctttgggtt ctgaagtctt gttgactgaa gaagaagttg ttgaattggc tttgggtttg 900
gaattgtccg gtctaccatt tttctgggct tacagaaagc caaagggtcc agctaagtct 960
gactctgttg aattgccaga tggtttcgtc gaaagaacca gagacagagg tttggtctgg 1020
acttcctggg ctccacaatt gagaattttg tcccacgaat ctgttgctgg tttcttgacc 1080
cactgtggtt ctggttccat tgtcgaaggt ttgatgttcg gtcacccatt gatcatgttg 1140
ccattgttcg gtgaccaacc attgaacgct agattattgg aagacaagca agtcggtatt 1200
gaaatcccaa gagatgaaga agacggttgt ttgaccaagg aatctgttgc ccgttctcta 1260
agattggtta tggtcgaaaa ggaaggtgaa atctacagag aaaaggctag agaaatgtcc 1320
aagatctaca acaacaccga agtcgaagac caatatgtct cccaatttgt tgaatacttg 1380
gaaaagaacg ctcgtgccgt tgccattgac cacgaaagc 1419
<210> 11
<211> 473
<212> PRT
<213> 人工序列()
<220>
<223> UGT2_5b变体
<400> 11
Met Ala Thr Ser Asp Ser Ile Val Asp Asp Arg Lys Lys Leu His Ile
1 5 10 15
Val Met Phe Pro Trp Leu Ala Phe Gly His Ile Ile Pro Tyr Leu Glu
20 25 30
Leu Ser Lys Leu Ile Ala Gln Lys Gly His Lys Val Ser Phe Leu Ser
35 40 45
Thr Thr Lys Asn Ile Asp Arg Leu Ser Ser His Ile Ser Pro Leu Ile
50 55 60
Asn Val Val Gln Leu Thr Leu Pro Arg Val Gln Glu Leu Pro Glu Asp
65 70 75 80
Ala Glu Ala Thr Thr Asp Val His Pro Glu Asp Ile Pro Tyr Leu Lys
85 90 95
Lys Ala Ser Asp Gly Leu Gln Pro Glu Val Thr Glu Phe Leu Glu Gln
100 105 110
His Ser Pro Asp Trp Ile Ile Tyr Asp Tyr Thr His Tyr Trp Leu Pro
115 120 125
Ser Ile Ala Thr Lys His Gly Val Ser Arg Ala His Phe Ser Val Thr
130 135 140
Thr Pro Trp Ala Ile Ala Tyr Met Gly Pro Thr Ala Asp Ala Met Ile
145 150 155 160
Asn Gly Ser Asp Gly Arg Thr Thr Pro Glu Asp Phe Thr Val Pro Pro
165 170 175
Lys Trp Phe Pro Phe Pro Thr Lys Val Cys Trp Arg Lys His Asp Leu
180 185 190
Ala Arg Leu Val Pro Tyr Lys Ala Pro Gly Ile Ser Asp Gly Tyr Arg
195 200 205
Met Gly Leu Val Leu Lys Gly Ser Asp Leu Leu Leu Ser Arg Ser Tyr
210 215 220
His Glu Phe Gly Thr Glu Trp Leu Arg Leu Leu Glu Thr Leu His Arg
225 230 235 240
Val Pro Val Val Pro Val Gly Leu Leu Pro Pro Glu Ile Pro Gly Asp
245 250 255
Gly Glu Asp Glu Ser Trp Val Ser Ile Lys Asp Trp Leu Asp Lys Lys
260 265 270
Glu Lys Gly Ser Val Val Tyr Val Ala Leu Gly Ser Glu Val Leu Val
275 280 285
Ser Gln Glu Glu Leu Asn Glu Leu Ala Leu Gly Leu Glu Leu Ser Gly
290 295 300
Leu Pro Phe Val Trp Ala Tyr Arg Lys Pro Lys Gly Pro Ala Lys Ser
305 310 315 320
Asp Ser Val Glu Leu Pro Asp Gly Phe Glu Glu Arg Thr Arg Gly Arg
325 330 335
Gly Val Val Trp Thr Ser Trp Ala Pro Gln Leu Arg Ile Leu Ser His
340 345 350
Glu Ser Val Gly Gly Phe Val Thr His Cys Gly Ser Gly Ser Ile Val
355 360 365
Glu Gly Leu Met Phe Gly His Pro Leu Ile Met Leu Pro Ile Phe Gly
370 375 380
Asp Gln Pro Leu Asn Ala Arg Leu Leu Glu Asp Lys Gln Val Gly Ile
385 390 395 400
Glu Ile Pro Arg Asn Glu Glu Asp Gly Cys Leu Thr Lys Glu Ser Val
405 410 415
Ala Glu Ser Leu Arg Leu Val Val Val Glu Lys Glu Gly Glu Ile Tyr
420 425 430
Arg Glu Lys Ala Arg Glu Met Ser Lys Val Tyr Ser Asp Thr Lys Arg
435 440 445
Glu Lys Glu Tyr Val Asp Gln Phe Val Asp Tyr Leu Glu Lys Asn Ala
450 455 460
Arg Ala Val Ala Ile Asp His Glu Ser
465 470
<210> 12
<211> 1419
<212> DNA
<213> 人工序列()
<220>
<223> UGT2_5b CpO用于酿酒酵母
<400> 12
atggccactt ctgactccat cgttgatgac agaaagaagt tgcacatcgt tatgttccca 60
tggttagctt tcggtcacat tatcccatac ttggaattgt ccaaattgat tgctcaaaag 120
ggtcacaaag tctctttctt gtccaccacc aagaacatcg acagattatc ttctcacatt 180
tctccattga tcaacgttgt ccaattgact ttaccaagag ttcaagaatt gccagaagat 240
gctgaagcta ccaccgatgt ccatccagaa gatatcccat acttgaagaa ggcttctgat 300
ggtttgcaac cagaagtcac tgaattcttg gaacaacact ctccagactg gattatctac 360
gactacactc actactggtt accatccatt gctactaagc acggtgtttc tcgtgctcat 420
ttctccgtta ccactccatg ggctattgct tacatgggtc caactgctga tgctatgatc 480
aacggttctg atggtagaac cactccagaa gacttcaccg ttccaccaaa atggttccca 540
ttcccaacca aggtctgttg gagaaagcac gatttggcca gattagttcc atacaaggcc 600
ccaggtatct ctgacggtta cagaatgggt ttagtcttga agggttctga cttgttgttg 660
tccagatctt accatgaatt cggtactgaa tggttaagat tgttggaaac tttgcacaga 720
gtcccagttg ttccagttgg tttgttgcct cctgaaatcc caggtgacgg tgaagacgaa 780
tcttgggttt ccatcaagga ctggttagat aagaaggaaa agggttccgt tgtctacgtt 840
gctttgggtt ctgaagtctt ggtttctcaa gaagaattga acgaattggc tttgggtttg 900
gaattgtccg gtctaccatt tgtctgggct tacagaaagc caaagggtcc agctaagtct 960
gactctgttg aattgccaga tggtttcgaa gaaagaacca gaggtagagg tgttgtctgg 1020
acttcctggg ctccacaatt gagaattttg tcccacgaat ctgttggtgg tttcgttacc 1080
cactgtggtt ctggttccat tgtcgaaggt ttgatgttcg gtcacccatt gatcatgttg 1140
ccaatcttcg gtgaccaacc attgaacgct agattattgg aagacaagca agtcggtatt 1200
gaaatcccaa gaaacgaaga agacggttgt ttgaccaagg aatctgttgc cgaatctcta 1260
agattggttg ttgtcgaaaa ggaaggtgaa atctacagag aaaaggctag agaaatgtcc 1320
aaggtttact ctgataccaa gagagaaaag gaatatgtcg accaatttgt tgactacttg 1380
gaaaagaacg ctcgtgccgt tgccattgac cacgaaagc 1419
<210> 13
<211> 1419
<212> DNA
<213> 人工序列()
<220>
<223> UGT2_5b CpO用于解脂耶氏酵母
<400> 13
atggccacct ccgactccat tgtcgacgac cgaaagaagc tccacattgt catgttcccc 60
tggctcgcct tcggccacat catcccttac ctggagctgt ccaagctcat tgcccagaag 120
ggccacaagg tttctttcct ctccaccacc aagaacattg accgactctc ctcccacatc 180
tctcctctca tcaacgttgt ccagctcacc ctcccccgag tccaggagct tcccgaggat 240
gctgaggcca ccaccgacgt ccaccccgag gacatcccct acctcaagaa ggcctccgat 300
ggcctccagc ccgaggtcac cgagttcctc gagcagcact cccccgactg gatcatctac 360
gactacaccc actactggct cccctccatt gccaccaagc acggtgtctc tcgagcccac 420
ttctccgtca ccaccccctg ggccattgcc tacatgggtc ccactgccga cgccatgatc 480
aacggttccg acggccgaac cacccccgag gatttcactg tccctcccaa gtggttcccc 540
ttccccacca aggtctgctg gcgaaagcac gacctcgctc gactcgtccc ctacaaggcc 600
cccggtatct ccgacggtta ccgaatgggt ctggttctca agggctccga tctcctcctc 660
tctcgatctt accacgagtt tggtactgag tggctccgac tgctcgagac tctccaccga 720
gtccccgttg tccccgtcgg cctcctccct cccgagatcc ccggtgatgg tgaggacgag 780
tcttgggttt ccatcaagga ctggctcgac aagaaggaga agggctctgt tgtctacgtt 840
gctctcggtt ccgaggtcct tgtctctcaa gaggagctta acgagcttgc tctgggcctc 900
gagctgtccg gcctcccctt cgtctgggcc taccgaaagc ccaagggtcc cgccaagtcc 960
gactccgtcg agctgcccga cggtttcgag gagcgaaccc gaggccgagg tgttgtctgg 1020
acctcttggg ctccccagct ccgaatcctc tcccacgagt ccgtcggtgg ctttgtcacc 1080
cactgcggtt ccggctccat cgtcgagggt ctgatgtttg gccaccccct catcatgctc 1140
cccatcttcg gtgaccagcc cctcaacgcc cgactccttg aggacaagca ggtcggtatt 1200
gagatccccc gaaacgagga agatggttgt ctgaccaagg agtctgttgc tgagtctctg 1260
cgactcgttg ttgtcgagaa agagggtgag atctaccggg agaaggcccg agagatgtcc 1320
aaggtctact ccgacaccaa gcgagagaag gagtacgtcg accagttcgt cgactacctc 1380
gagaagaacg cccgagctgt tgccattgac cacgaatcc 1419
<210> 14
<211> 473
<212> PRT
<213> 人工序列()
<220>
<223> UGT2_6b变体
<400> 14
Met Ala Thr Ser Asp Ser Ile Val Asp Asp Arg Lys Lys Leu His Ile
1 5 10 15
Val Met Phe Pro Trp Leu Ala Phe Gly His Ile Ile Pro Tyr Leu Glu
20 25 30
Leu Ser Lys Leu Ile Ala Gln Lys Gly His Lys Val Ser Phe Leu Ser
35 40 45
Thr Thr Lys Asn Ile Asp Arg Leu Ser Ser His Ile Ser Pro Leu Ile
50 55 60
Asn Val Val Gln Leu Thr Leu Pro Arg Val Gln Glu Leu Pro Glu Asp
65 70 75 80
Ala Glu Ala Thr Thr Asp Val His Pro Glu Asp Ile Pro Tyr Leu Lys
85 90 95
Lys Ala Ser Asp Gly Leu Gln Pro Glu Val Thr Glu Phe Leu Glu Gln
100 105 110
His Ser Pro Asp Trp Ile Ile Tyr Asp Tyr Thr His Tyr Trp Leu Pro
115 120 125
Ser Ile Ala Thr Lys His Gly Val Ser Arg Ala His Phe Ser Val Thr
130 135 140
Thr Pro Trp Ala Ile Ala Tyr Met Gly Pro Thr Ala Asp Ala Met Ile
145 150 155 160
Asn Gly Ser Asp Gly Arg Thr Thr Pro Glu Asp Phe Thr Val Pro Pro
165 170 175
Lys Trp Phe Pro Phe Pro Thr Lys Val Cys Trp Arg Lys His Asp Leu
180 185 190
Ala Arg Leu Val Pro Tyr Lys Ala Pro Gly Ile Ser Asp Gly Tyr Arg
195 200 205
Met Gly Leu Val Ile Lys Gly Cys Asp Cys Leu Leu Ser Lys Thr Tyr
210 215 220
His Glu Phe Gly Thr Gln Trp Leu Arg Leu Leu Glu Thr Leu His Arg
225 230 235 240
Lys Pro Val Ile Pro Val Gly Leu Leu Pro Pro Ser Ile Pro Gly Ser
245 250 255
Asp Lys Asp Asp Ser Trp Val Ser Ile Lys Glu Trp Leu Asp Gly Gln
260 265 270
Glu Lys Gly Ser Val Val Tyr Val Ala Leu Gly Ser Glu Val Leu Val
275 280 285
Thr Gln Asp Glu Val Val Glu Leu Ala His Gly Leu Glu Leu Ser Gly
290 295 300
Leu Pro Phe Val Trp Ala Tyr Arg Asn Pro Lys Gly Pro Ala Lys Ser
305 310 315 320
Asp Ser Val Glu Leu Pro Asp Gly Phe Val Glu Arg Val Arg Asp Arg
325 330 335
Gly Leu Val Trp Thr Ser Trp Ala Pro Gln Leu Arg Ile Leu Ser His
340 345 350
Glu Ser Val Cys Gly Phe Leu Thr His Cys Gly Ser Gly Ser Ile Val
355 360 365
Glu Gly Leu Met Phe Gly His Pro Leu Ile Met Leu Pro Ile Phe Gly
370 375 380
Asp Gln Pro Leu Asn Ala Arg Leu Leu Glu Asp Lys Gln Val Gly Ile
385 390 395 400
Glu Ile Pro Arg Asn Glu Glu Asp Gly Ser Phe Thr Arg Asp Ser Val
405 410 415
Ala Glu Ser Leu Arg Leu Val Met Val Glu Glu Glu Gly Lys Ile Tyr
420 425 430
Arg Glu Lys Ala Lys Glu Met Ser Lys Leu Phe Gly Asp Lys Asp Leu
435 440 445
Gln Asp Gln Tyr Val Asp Asp Phe Val Glu Tyr Leu Gln Lys His Arg
450 455 460
Arg Ala Val Ala Ile Asp His Glu Ser
465 470
<210> 15
<211> 1419
<212> DNA
<213> 人工序列()
<220>
<223> UGT2_6b CpO用于酿酒酵母
<400> 15
atggccactt ctgactccat cgttgatgac agaaagaagt tgcacatcgt tatgttccca 60
tggttagctt tcggtcacat tatcccatac ttggaattgt ccaaattgat tgctcaaaag 120
ggtcacaaag tctctttctt gtccaccacc aagaacatcg acagattatc ttctcacatt 180
tctccattga tcaacgttgt ccaattgact ttaccaagag ttcaagaatt gccagaagat 240
gctgaagcta ccaccgatgt ccatccagaa gatatcccat acttgaagaa ggcttctgat 300
ggtttgcaac cagaagtcac tgaattcttg gaacaacact ctccagactg gattatctac 360
gactacactc actactggtt accatccatt gctactaagc acggtgtttc tcgtgctcat 420
ttctccgtta ccactccatg ggctattgct tacatgggtc caactgctga tgctatgatc 480
aacggttctg atggtagaac cactccagaa gacttcaccg ttccaccaaa atggttccca 540
ttcccaacca aggtctgttg gagaaagcac gatttggcca gattagttcc atacaaggcc 600
ccaggtatct ctgacggtta cagaatgggt ttagtcatca agggttgtga ctgtttgttg 660
tccaagactt accatgaatt cggtactcaa tggttaagat tgttggaaac tttgcacaga 720
aagccagtta tcccagttgg tttgttgcct ccttctatcc caggttctga caaggacgac 780
tcttgggttt ccatcaagga atggttagat ggtcaagaaa agggttccgt tgtctacgtt 840
gctttgggtt ctgaagtctt ggttactcaa gacgaagttg ttgaattggc tcacggtttg 900
gaattgtccg gtctaccatt tgtctgggct tacagaaacc caaagggtcc agctaagtct 960
gactctgttg aattgccaga tggtttcgtc gaaagagtta gagacagagg tttggtctgg 1020
acttcctggg ctccacaatt gagaattttg tcccacgaat ctgtttgtgg tttcttgact 1080
cactgtggtt ctggttctat cgtcgaaggt ttgatgttcg gtcatccttt gatcatgttg 1140
cctatctttg gtgaccaacc attgaacgct agattgttgg aagacaagca agttggtatt 1200
gaaattccaa gaaacgaaga agatggttct ttcaccagag actctgttgc tgaatctttg 1260
agattagtca tggttgaaga agaaggtaag atctacagag aaaaggccaa ggaaatgtcc 1320
aagttgtttg gtgacaaaga tttgcaagac caatacgtcg atgacttcgt cgaatacttg 1380
caaaagcacc gtcgtgccgt tgccattgac cacgaatca 1419
<210> 16
<211> 1419
<212> DNA
<213> 人工序列()
<220>
<223> UGT2_6b CpO用于解脂耶氏酵母
<400> 16
atggctactt ccgactccat tgtcgacgac cgaaagaagc tccacattgt catgttcccc 60
tggctcgcct ttggccacat cattccctac ctcgagcttt ccaagctcat tgcccagaag 120
ggccacaagg tttctttcct ctccaccacc aagaacattg accgactctc ctcccacatc 180
tctcctctca tcaacgttgt ccagctcacc ctcccccgag tccaggagct gcccgaggac 240
gccgaggcca ccaccgatgt ccaccccgag gatatcccct acctcaagaa ggcctccgac 300
ggtctgcagc ccgaggtcac cgagttcctc gagcagcact ctcccgactg gatcatctac 360
gactacaccc actactggct cccctccatt gccaccaagc acggtgtctc tcgagcccac 420
ttctccgtca ccaccccctg ggccattgcc tacatgggcc ccactgctga cgccatgatc 480
aacggttccg atggccgaac cacccccgag gacttcactg tccctcccaa gtggttcccc 540
ttccccacca aggtctgctg gcgaaagcac gatctggccc gactcgttcc ctacaaggcc 600
cccggtatct ccgacggcta ccgaatgggt ctggtcatca agggctgcga ctgtctgctc 660
tccaagacct accacgagtt tggcacccag tggctccgac tcctcgagac tctccaccga 720
aagcccgtca tccccgtcgg tctgctccct ccctccatcc ccggctccga caaggacgac 780
tcttgggttt ccatcaagga gtggctcgac ggccaggaga agggctctgt tgtctacgtt 840
gctctcggtt ccgaggttct cgtcacccag gacgaggttg ttgagctggc ccacggtctg 900
gagctgtccg gcctcccctt cgtctgggct taccgaaacc ccaagggtcc cgccaagtcc 960
gactccgtcg agcttcccga tggtttcgtc gagcgagtcc gagatcgagg tctggtctgg 1020
acctcttggg ctccccagct ccgaatcctc tcccacgagt ccgtctgtgg tttcctcacc 1080
cactgcggtt ccggctccat cgtcgagggt ctgatgttcg gccaccccct catcatgctc 1140
cccatcttcg gtgaccagcc cctcaacgcc cgactccttg aggacaagca ggtcggtatc 1200
gagatccccc gaaacgaaga ggacggttcc ttcacccgag actctgttgc tgagtctctc 1260
cgactcgtca tggtcgagga agagggtaag atctaccgag agaaggccaa ggagatgtcc 1320
aagctgttcg gtgacaagga tctccaggac cagtacgtcg acgactttgt cgagtacctc 1380
cagaagcacc gacgagctgt tgccattgac cacgagtct 1419
<210> 17
<211> 473
<212> PRT
<213> 人工序列()
<220>
<223> UGT2_7b变体
<400> 17
Met Ala Thr Ser Asp Ser Ile Val Asp Asp Arg Lys Lys Leu His Ile
1 5 10 15
Val Met Phe Pro Trp Leu Ala Phe Gly His Ile Ile Pro Tyr Leu Glu
20 25 30
Leu Ser Lys Leu Ile Ala Gln Lys Gly His Lys Val Ser Phe Leu Ser
35 40 45
Thr Thr Lys Asn Ile Asp Arg Leu Ser Ser His Ile Ser Pro Leu Ile
50 55 60
Asn Val Val Gln Leu Thr Leu Pro Arg Val Gln Glu Leu Pro Glu Asp
65 70 75 80
Ala Glu Ala Thr Thr Asp Val His Pro Glu Asp Ile Pro Tyr Leu Lys
85 90 95
Lys Ala Ser Asp Gly Leu Gln Pro Glu Val Thr Glu Phe Leu Glu Gln
100 105 110
His Ser Pro Asp Trp Ile Ile Tyr Asp Tyr Thr His Tyr Trp Leu Pro
115 120 125
Glu Ile Ala Lys Ser Leu Gly Val Ser Arg Ala His Phe Ser Val Thr
130 135 140
Thr Pro Trp Ala Ile Ala Tyr Ile Gly Pro Thr Ala Asp Ala Met Ile
145 150 155 160
Asn Gly Ser Asp Tyr Arg Thr Glu Leu Glu Asp Phe Thr Val Pro Pro
165 170 175
Lys Trp Phe Pro Phe Pro Thr Thr Val Cys Trp Arg Lys His Asp Leu
180 185 190
Ala Arg Leu Val Pro Tyr Lys Ala Pro Gly Ile Ser Asp Gly Tyr Arg
195 200 205
Met Gly Leu Val Ile Lys Gly Cys Asp Cys Leu Leu Ser Lys Thr Tyr
210 215 220
His Glu Phe Gly Thr Gln Trp Leu Arg Leu Leu Glu Thr Leu His Arg
225 230 235 240
Lys Pro Val Ile Pro Val Gly Leu Leu Pro Pro Ser Ile Pro Gly Ser
245 250 255
Asp Lys Asp Asp Ser Trp Val Ser Ile Lys Glu Trp Leu Asp Gly Gln
260 265 270
Glu Lys Gly Ser Val Val Tyr Val Ala Leu Gly Ser Glu Val Leu Val
275 280 285
Thr Gln Asp Glu Val Val Glu Leu Ala His Gly Leu Glu Leu Ser Gly
290 295 300
Leu Pro Phe Val Trp Ala Tyr Arg Asn Pro Lys Gly Pro Ala Lys Ser
305 310 315 320
Asp Ser Val Glu Leu Pro Asp Gly Phe Val Glu Arg Val Arg Asp Arg
325 330 335
Gly Leu Val Trp Thr Ser Trp Ala Pro Gln Leu Arg Ile Leu Ser His
340 345 350
Glu Ser Val Cys Gly Phe Leu Thr His Cys Gly Ser Gly Ser Ile Val
355 360 365
Glu Gly Leu Met Phe Gly His Pro Leu Ile Met Leu Pro Ile Phe Gly
370 375 380
Asp Gln Pro Leu Asn Ala Arg Leu Leu Glu Asp Lys Gln Val Gly Ile
385 390 395 400
Glu Ile Pro Arg Asn Glu Glu Asp Gly Ser Phe Thr Arg Asp Ser Val
405 410 415
Ala Glu Ser Leu Arg Leu Val Met Val Glu Glu Glu Gly Lys Ile Tyr
420 425 430
Arg Glu Lys Ala Lys Glu Met Ser Lys Leu Phe Gly Asp Lys Asp Leu
435 440 445
Gln Asp Gln Tyr Val Asp Asp Phe Val Glu Tyr Leu Gln Lys His Arg
450 455 460
Arg Ala Val Ala Ile Asp His Glu Ser
465 470
<210> 18
<211> 1419
<212> DNA
<213> 人工序列()
<220>
<223> UGT2_7b CpO用于酿酒酵母
<400> 18
atggccactt ctgactccat cgttgatgac agaaagaagt tgcacatcgt tatgttccca 60
tggttagctt tcggtcacat tatcccatac ttggaattgt ccaaattgat tgctcaaaag 120
ggtcacaaag tctctttctt gtccaccacc aagaacatcg acagattatc ttctcacatt 180
tctccattga tcaacgttgt ccaattgact ttaccaagag ttcaagaatt gccagaagat 240
gctgaagcta ccaccgatgt ccatccagaa gatatcccat acttgaagaa ggcttctgat 300
ggtttgcaac cagaagtcac tgaattcttg gaacaacact ctccagactg gattatctac 360
gactacactc actactggtt accagaaatt gctaagtctt tgggtgtttc tcgtgctcat 420
ttctccgtta ccactccatg ggctattgct tacattggtc caactgctga tgctatgatc 480
aacggttctg attacagaac cgaattggaa gacttcaccg ttccaccaaa atggttccca 540
ttcccaacca ctgtctgttg gagaaagcac gatttggcca gattagttcc atacaaggcc 600
ccaggtatct ctgacggtta cagaatgggt ttagtcatca agggttgtga ctgtttgttg 660
tccaagactt accatgaatt cggtactcaa tggttaagat tgttggaaac tttgcacaga 720
aagccagtta tcccagttgg tttgttgcct ccttctatcc caggttctga caaggacgac 780
tcttgggttt ccatcaagga atggttagat ggtcaagaaa agggttccgt tgtctacgtt 840
gctttgggtt ctgaagtctt ggttactcaa gacgaagttg ttgaattggc tcacggtttg 900
gaattgtccg gtctaccatt tgtctgggct tacagaaacc caaagggtcc agctaagtct 960
gactctgttg aattgccaga tggtttcgtc gaaagagtta gagacagagg tttggtctgg 1020
acttcctggg ctccacaatt gagaattttg tcccacgaat ctgtttgtgg tttcttgact 1080
cactgtggtt ctggttctat cgtcgaaggt ttgatgttcg gtcatccttt gatcatgttg 1140
cctatctttg gtgaccaacc attgaacgct agattgttgg aagacaagca agttggtatt 1200
gaaattccaa gaaacgaaga agatggttct ttcaccagag actctgttgc tgaatctttg 1260
agattagtca tggttgaaga agaaggtaag atctacagag aaaaggccaa ggaaatgtcc 1320
aagttgtttg gtgacaaaga tttgcaagac caatacgtcg atgacttcgt cgaatacttg 1380
caaaagcacc gtcgtgccgt tgccattgac cacgaatca 1419
<210> 19
<211> 1419
<212> DNA
<213> 人工序列()
<220>
<223> UGT2_7b CpO用于解脂耶氏酵母
<400> 19
atggccacct ccgactccat tgttgacgac cgaaagaagc tccacattgt catgttcccc 60
tggctcgcct tcggccacat cattccctac ctcgagcttt ccaagctcat tgcccagaag 120
ggccacaagg tttctttcct ctccaccacc aagaacattg accgactctc ctcccacatc 180
tctcctctca tcaacgttgt ccagctcacc ctcccccgag tccaggagct gcccgaggat 240
gctgaggcca ccaccgacgt ccaccccgag gatatcccct acctcaagaa ggcctccgat 300
ggtctgcagc ccgaggtcac cgagttcctc gagcagcact ctcccgactg gatcatctac 360
gactacaccc actactggct ccccgagatt gccaagtctc tcggtgtctc tcgagcccac 420
ttctccgtca ccaccccctg ggccattgct tacatcggtc ccactgctga cgccatgatc 480
aacggctccg actaccgaac tgaactcgag gacttcactg ttcctcccaa gtggttcccc 540
ttccccacca ccgtctgctg gcgaaagcac gatctcgccc gactggtccc ctacaaggct 600
cccggtatct ccgacggcta ccgaatgggt ctggtcatca agggttgcga ctgtctgctc 660
tccaagacct accacgagtt tggcacccag tggctgcgac tcctcgagac tctccaccga 720
aagcccgtca tccccgtcgg tctgctgccc ccttccatcc ccggttccga caaggacgac 780
tcttgggttt ccatcaagga gtggctcgac ggccaggaga agggctctgt tgtctacgtt 840
gctctcggct ccgaggttct cgtcacccag gacgaggttg tcgagctggc ccacggtctg 900
gagctgtccg gtctgccctt cgtctgggcc taccgaaacc ccaagggccc cgccaagtcc 960
gactccgtcg agcttcccga tggtttcgtc gagcgagtcc gagatcgagg tctggtctgg 1020
acctcttggg ctccccagct ccgaatcctc tcccacgagt ccgtctgcgg tttcctcacc 1080
cactgtggtt ccggctccat tgtcgagggt ctgatgttcg gccaccccct catcatgctc 1140
cccatcttcg gtgaccagcc cctcaacgcc cgactccttg aggacaagca ggtcggtatc 1200
gagatccccc gaaacgaaga ggacggctct ttcacccgag actccgttgc cgagtctctc 1260
cgactcgtca tggtcgagga agagggtaag atctaccgag agaaggccaa ggagatgtcc 1320
aagctctttg gtgacaagga tctccaggac cagtacgtcg acgactttgt cgagtacctc 1380
cagaagcacc gacgagctgt tgccatcgac cacgagtcg 1419
<210> 20
<211> 473
<212> PRT
<213> 人工序列()
<220>
<223> UGT2_8b
<400> 20
Met Ala Thr Ser Asp Ser Ile Val Asp Asp Arg Lys Gln Leu His Ile
1 5 10 15
Val Met Phe Pro Trp Leu Ala Phe Gly His Ile Ile Pro Tyr Leu Glu
20 25 30
Leu Ser Lys Leu Ile Ala Glu Lys Gly His Lys Val Ser Phe Leu Ser
35 40 45
Thr Pro Lys Asn Ile Gln Arg Leu Ser Ser His Leu Ser Pro Leu Ile
50 55 60
Asn Val Val Gln Leu Pro Leu Pro Arg Val Gln Glu Leu Pro Glu Asp
65 70 75 80
Ala Glu Ala Thr Thr Asp Val His Pro Glu Asp Ile Pro Tyr Leu Lys
85 90 95
Lys Ala Ser Asp Gly Leu Gln Pro Glu Val Thr Glu Phe Leu Glu Gln
100 105 110
His Ser Pro Asp Trp Ile Ile Tyr Asp Tyr Thr His Tyr Trp Leu Pro
115 120 125
Ser Ile Ala Thr Lys His Gly Val Ser Arg Ala His Phe Ser Val Thr
130 135 140
Thr Pro Trp Ala Ile Ala Tyr Met Gly Pro Thr Ala Asp Ala Met Ile
145 150 155 160
Asn Gly Ser Asp Gly Arg Thr Thr Pro Glu Asp Phe Thr Val Pro Pro
165 170 175
Lys Trp Phe Pro Phe Pro Thr Lys Val Cys Trp Arg Lys His Asp Leu
180 185 190
Ala Arg Leu Val Pro Tyr Lys Ala Pro Gly Ile Ser Asp Gly Tyr Arg
195 200 205
Met Gly Leu Val Ile Lys Gly Cys Asp Cys Leu Leu Ser Lys Thr Tyr
210 215 220
His Glu Phe Gly Thr Gln Trp Leu Arg Leu Leu Glu Thr Leu His Arg
225 230 235 240
Lys Pro Val Ile Pro Val Gly Leu Leu Pro Pro Ser Ile Pro Gly Ser
245 250 255
Asp Lys Asp Asp Ser Trp Val Ser Ile Lys Glu Trp Leu Asp Gly Gln
260 265 270
Glu Lys Gly Ser Val Val Tyr Val Ala Leu Gly Ser Glu Val Leu Val
275 280 285
Thr Gln Asp Glu Val Val Glu Leu Ala His Gly Leu Glu Leu Ser Gly
290 295 300
Leu Pro Phe Val Trp Ala Tyr Arg Asn Pro Lys Gly Pro Ala Lys Ser
305 310 315 320
Asp Ser Val Glu Leu Pro Asp Gly Phe Val Glu Arg Val Arg Asp Arg
325 330 335
Gly Leu Val Trp Thr Ser Trp Ala Pro Gln Leu Arg Ile Leu Ser His
340 345 350
Glu Ser Val Cys Gly Phe Leu Thr His Cys Gly Ser Gly Ser Ile Val
355 360 365
Glu Gly Leu Met Phe Gly His Pro Leu Ile Met Leu Pro Ile Phe Gly
370 375 380
Asp Gln Pro Leu Asn Ala Arg Leu Leu Glu Asp Lys Gln Val Gly Ile
385 390 395 400
Glu Ile Pro Arg Asn Glu Glu Asp Gly Ser Phe Thr Arg Asp Ser Val
405 410 415
Ala Glu Ser Leu Arg Leu Val Met Val Glu Glu Glu Gly Lys Ile Tyr
420 425 430
Arg Glu Lys Ala Lys Glu Met Ser Lys Leu Phe Gly Asp Lys Asp Leu
435 440 445
Gln Asp Gln Tyr Val Asp Asp Phe Val Glu Tyr Leu Gln Lys His Arg
450 455 460
Arg Ala Val Ala Ile Asp His Glu Ser
465 470
<210> 21
<211> 1419
<212> DNA
<213> 人工序列()
<220>
<223> UGT_8b CpO用于酿酒酵母
<400> 21
atggccactt ctgactccat cgttgatgac agaaagcaat tgcacatcgt tatgttccca 60
tggttagctt tcggtcacat tatcccatac ttggaattgt ccaaattgat tgctgaaaag 120
ggtcacaaag tctctttctt gtccacccca aagaacatcc aaagattatc ttctcacttg 180
tctccattga tcaacgttgt ccaattgcca ttaccaagag ttcaagaatt gccagaagat 240
gctgaagcta ccaccgatgt ccatccagaa gatatcccat acttgaagaa ggcttctgat 300
ggtttgcaac cagaagtcac tgaattcttg gaacaacact ctccagactg gattatctac 360
gactacactc actactggtt accatccatt gctactaagc acggtgtttc tcgtgctcat 420
ttctccgtta ccactccatg ggctattgct tacatgggtc caactgctga tgctatgatc 480
aacggttctg atggtagaac cactccagaa gacttcaccg ttccaccaaa atggttccca 540
ttcccaacca aggtctgttg gagaaagcac gatttggcca gattagttcc atacaaggcc 600
ccaggtatct ctgacggtta cagaatgggt ttagtcatca agggttgtga ctgtttgttg 660
tccaagactt accatgaatt cggtactcaa tggttaagat tgttggaaac tttgcacaga 720
aagccagtta tcccagttgg tttgttgcct ccttctatcc caggttctga caaggacgac 780
tcttgggttt ccatcaagga atggttagat ggtcaagaaa agggttccgt tgtctacgtt 840
gctttgggtt ctgaagtctt ggttactcaa gacgaagttg ttgaattggc tcacggtttg 900
gaattgtccg gtctaccatt tgtctgggct tacagaaacc caaagggtcc agctaagtct 960
gactctgttg aattgccaga tggtttcgtc gaaagagtta gagacagagg tttggtctgg 1020
acttcctggg ctccacaatt gagaattttg tcccacgaat ctgtttgtgg tttcttgact 1080
cactgtggtt ctggttctat cgtcgaaggt ttgatgttcg gtcatccttt gatcatgttg 1140
cctatctttg gtgaccaacc attgaacgct agattgttgg aagacaagca agttggtatt 1200
gaaattccaa gaaacgaaga agatggttct ttcaccagag actctgttgc tgaatctttg 1260
agattagtca tggttgaaga agaaggtaag atctacagag aaaaggccaa ggaaatgtcc 1320
aagttgtttg gtgacaaaga tttgcaagac caatacgtcg atgacttcgt cgaatacttg 1380
caaaagcacc gtcgtgccgt tgccattgac cacgaatca 1419
<210> 22
<211> 473
<212> PRT
<213> 人工序列()
<220>
<223> UGT2_9b变体
<400> 22
Met Ala Thr Ser Asp Ser Ile Val Asp Asp Arg Lys Lys Leu His Ile
1 5 10 15
Val Met Phe Pro Trp Leu Ala Phe Gly His Ile Ile Pro Tyr Leu Gln
20 25 30
Leu Ser Lys Leu Leu Ala Gln Lys Gly His Lys Val Ser Phe Ile Ser
35 40 45
Thr Pro Arg Asn Ile Gln Arg Leu Ser Ser His Ile Ser Pro Leu Ile
50 55 60
Asn Leu Val Gln Leu Pro Leu Pro Arg Val Asp Asn Leu Pro Glu Asp
65 70 75 80
Ala Glu Ala Thr Thr Asp Val His Pro Glu Asp Ile Pro Tyr Leu Lys
85 90 95
Lys Ala Ser Asp Gly Leu Gln Pro Glu Val Thr Glu Phe Leu Glu Gln
100 105 110
His Ser Pro Asp Trp Ile Ile Tyr Asp Tyr Thr His Tyr Trp Leu Pro
115 120 125
Glu Ile Ala Lys Ser Leu Gly Val Ser Arg Ala His Phe Ser Val Thr
130 135 140
Thr Pro Trp Ala Ile Ala Tyr Met Gly Pro Thr Ala Asp Ala Met Ile
145 150 155 160
Asn Gly Ser Asp Tyr Arg Thr Glu Leu Glu Asp Phe Thr Val Pro Pro
165 170 175
Lys Trp Phe Pro Phe Pro Thr Thr Val Cys Trp Arg Lys His Asp Leu
180 185 190
Ala Arg Leu Val Pro Tyr Lys Ala Pro Gly Ile Ser Asp Gly Tyr Arg
195 200 205
Met Gly Leu Val Leu Lys Gly Ser Asp Leu Leu Leu Ser Arg Ser Tyr
210 215 220
His Glu Phe Gly Thr Glu Trp Leu Arg Leu Leu Glu Thr Leu His Arg
225 230 235 240
Val Pro Val Val Pro Val Gly Leu Leu Pro Pro Glu Ile Pro Gly Asp
245 250 255
Gly Glu Asp Glu Ser Trp Val Ser Ile Lys Asp Trp Leu Asp Lys Lys
260 265 270
Glu Lys Gly Ser Val Val Tyr Val Ala Leu Gly Ser Glu Val Leu Val
275 280 285
Ser Gln Glu Glu Leu Asn Glu Leu Ala Leu Gly Leu Glu Leu Ser Gly
290 295 300
Leu Pro Phe Val Trp Ala Tyr Arg Lys Pro Lys Gly Pro Ala Lys Ser
305 310 315 320
Asp Ser Val Glu Leu Pro Asp Gly Phe Glu Glu Arg Thr Arg Gly Arg
325 330 335
Gly Val Val Trp Thr Ser Trp Ala Pro Gln Leu Arg Ile Leu Ser His
340 345 350
Glu Ser Val Cys Gly Phe Leu Thr His Cys Gly Ser Gly Ser Ile Val
355 360 365
Glu Gly Leu Met Phe Gly His Pro Leu Ile Met Leu Pro Ile Phe Gly
370 375 380
Asp Gln Pro Leu Asn Ala Arg Leu Leu Glu Asp Lys Gln Val Gly Ile
385 390 395 400
Glu Ile Pro Arg Asn Glu Glu Asp Gly Ser Leu Thr Lys Glu Ser Val
405 410 415
Ala Arg Ser Leu Arg Ser Val Val Val Glu Glu Glu Gly Lys Ile Tyr
420 425 430
Arg Glu Lys Ala Lys Glu Met Ser Lys Leu Phe Gly Asp Lys Asp Leu
435 440 445
Gln Asp Gln Tyr Val Asp Asp Phe Val Glu Tyr Leu Gln Lys His Arg
450 455 460
Arg Ala Val Ala Ile Asp His Glu Ser
465 470
<210> 23
<211> 1419
<212> DNA
<213> 人工序列()
<220>
<223> UGT2_9b CpO用于酿酒酵母
<400> 23
atggccactt ctgactccat cgttgatgac agaaagaagt tgcacatcgt tatgttccca 60
tggttagctt tcggtcacat tatcccatac ttgcaattgt ccaaattgtt ggctcaaaag 120
ggtcacaaag tctctttcat ctccacccca agaaacatcc aaagattatc ttctcacatt 180
tctccattga tcaacttggt ccaattgcca ttaccaagag ttgacaactt gccagaagat 240
gctgaagcta ccaccgatgt ccatccagaa gatatcccat acttgaagaa ggcttctgat 300
ggtttgcaac cagaagtcac tgaattcttg gaacaacact ctccagactg gattatctac 360
gactacactc actactggtt accagaaatt gctaagtctt tgggtgtttc tcgtgctcat 420
ttctccgtta ccactccatg ggctattgct tacatgggtc caactgctga tgctatgatc 480
aacggttctg attacagaac cgaattggaa gacttcaccg ttccaccaaa atggttccca 540
ttcccaacca ctgtctgttg gagaaagcac gatttggcca gattagttcc atacaaggcc 600
ccaggtatct ctgacggtta cagaatgggt ttagtcttga agggttctga cttgttgttg 660
tccagatctt accatgaatt cggtactgaa tggttaagat tgttggaaac tttgcacaga 720
gtcccagttg ttccagttgg tttgttgcct cctgaaatcc caggtgacgg tgaagacgaa 780
tcttgggttt ccatcaagga ctggttagat aagaaggaaa agggttccgt tgtctacgtt 840
gctttgggtt ctgaagtctt ggtttctcaa gaagaattga acgaattggc tttgggtttg 900
gaattgtccg gtctaccatt tgtctgggct tacagaaagc caaagggtcc agctaagtct 960
gactctgttg aattgccaga tggtttcgaa gaaagaacca gaggtagagg tgttgtctgg 1020
acttcctggg ctccacaatt gagaattttg tcccacgaat ctgtttgtgg tttcttgact 1080
cactgtggtt ctggttccat tgtcgaaggt ttgatgttcg gtcatccatt gatcatgttg 1140
ccaatctttg gtgaccaacc tttgaacgcc agattattgg aagacaagca agttggtatt 1200
gaaattccaa gaaacgaaga agacggttct ttgaccaagg aatctgttgc cagatctttg 1260
agatctgttg ttgtcgaaga agaaggtaag atctacagag aaaaggccaa ggaaatgtcc 1320
aaattgtttg gtgacaagga tttgcaagat caatatgtcg atgacttcgt cgaatactta 1380
caaaagcacc gtcgtgctgt tgccattgac catgaaagc 1419
<210> 24
<211> 1419
<212> DNA
<213> 人工序列()
<220>
<223> UGT2_9b CpO用于解脂耶氏酵母
<400> 24
atggccacct ccgactccat tgtcgacgac cgaaagaagc tccacattgt catgttcccc 60
tggctcgcct ttggccacat cattccctac ctccagctct ccaagctcct cgcccagaag 120
ggccacaagg tttctttcat ctccactccc cgaaacatcc agcgactctc ctcccacatc 180
tctcctctca tcaacctcgt ccagctcccc ctcccccgag tcgacaacct ccccgaggat 240
gctgaggcca ccaccgatgt ccaccccgag gacatcccct acctcaagaa ggcctccgac 300
ggcctccagc ccgaggtcac cgagttcctc gagcagcact cccccgactg gatcatctac 360
gactacaccc actactggct ccccgagatt gccaagtctc tcggtgtctc tcgagcccac 420
ttctccgtca ccaccccctg ggccattgct tacatgggtc ccactgccga tgccatgatc 480
aacggctccg actaccgaac cgagcttgag gacttcaccg tccctcccaa gtggttcccc 540
ttccccacca ccgtctgctg gcgaaagcac gatctcgccc gactcgtccc ctacaaggct 600
cccggtatct ccgacggtta ccgaatgggc ctcgttctca agggttccga tctgctgctc 660
tcccgatctt accacgagtt tggtactgag tggctgcgac tcctcgagac tctgcaccga 720
gtccccgttg tccccgtcgg tctgctccct cccgagatcc ccggtgacgg tgaggacgag 780
tcttgggttt ccatcaagga ctggctcgac aagaaggaga agggctccgt cgtctacgtt 840
gccctcggct ccgaggttct cgtttcccaa gaggagctta acgagcttgc tctcggcctc 900
gagctgtccg gtctgccctt tgtctgggcc taccgaaagc ccaagggccc cgccaagtcc 960
gactccgtcg agctgcccga cggcttcgag gagcgaaccc gaggtcgagg tgttgtctgg 1020
acctcttggg ctccccagct ccgaatcctc tcccacgagt ccgtctgtgg tttcctgacc 1080
cactgcggtt ccggctctat cgtcgagggt ctgatgttcg gccaccccct catcatgctc 1140
cccatcttcg gtgaccagcc cctcaacgcc cgacttctcg aggacaagca ggtcggtatt 1200
gagatccccc gaaacgaaga ggacggctct ctcaccaagg agtctgttgc tcgatctctg 1260
cgatccgtcg ttgtcgagga agagggtaag atctaccgag agaaggccaa ggagatgtcc 1320
aagctgttcg gtgacaagga tctgcaggac cagtacgtcg acgacttcgt cgagtacctc 1380
cagaagcacc gacgagctgt tgccattgac cacgaatcc 1419
<210> 25
<211> 473
<212> PRT
<213> 人工序列()
<220>
<223> UGT2_10b变体
<400> 25
Met Ala Thr Ser Asp Ser Ile Val Asp Asp Arg Lys Lys Leu His Ile
1 5 10 15
Val Met Phe Pro Trp Leu Ala Phe Gly His Ile Ile Pro Tyr Leu Glu
20 25 30
Leu Ser Lys Leu Ile Ala Gln Lys Gly His Lys Val Ser Phe Leu Ser
35 40 45
Thr Thr Lys Asn Ile Asp Arg Leu Ser Ser His Ile Ser Pro Leu Ile
50 55 60
Asn Phe Val Lys Leu Thr Leu Pro Arg Val Gln Glu Leu Pro Glu Asp
65 70 75 80
Ala Glu Ala Thr Thr Asp Val His Pro Glu Asp Ile Pro Tyr Leu Lys
85 90 95
Lys Ala Ser Asp Gly Leu Gln Pro Glu Val Thr Glu Phe Leu Glu Gln
100 105 110
His Ser Pro Asp Trp Ile Ile Tyr Asp Tyr Thr His Tyr Trp Leu Pro
115 120 125
Glu Ile Ala Lys Ser Leu Gly Val Ser Arg Ala His Phe Ser Val Thr
130 135 140
Thr Pro Trp Ala Ile Ala Tyr Met Gly Pro Thr Ala Asp Ala Met Ile
145 150 155 160
Asn Gly Ser Asp Tyr Arg Thr Glu Leu Glu Asp Phe Thr Val Pro Pro
165 170 175
Lys Trp Phe Pro Phe Pro Thr Thr Val Cys Trp Arg Lys His Asp Leu
180 185 190
Ala Arg Leu Val Pro Tyr Lys Ala Pro Gly Ile Ser Asp Gly Tyr Arg
195 200 205
Met Gly Leu Val Ile Lys Gly Cys Asp Cys Leu Leu Ser Lys Thr Tyr
210 215 220
His Glu Phe Gly Thr Gln Trp Leu Arg Leu Leu Glu Glu Leu His Arg
225 230 235 240
Val Pro Val Ile Pro Val Gly Leu Leu Pro Pro Ser Ile Pro Gly Ser
245 250 255
Asp Lys Asp Asp Ser Trp Val Ser Ile Lys Glu Trp Leu Asp Gly Gln
260 265 270
Glu Lys Gly Ser Val Val Tyr Val Ala Leu Gly Ser Glu Val Leu Val
275 280 285
Thr Gln Glu Glu Val Val Glu Leu Ala His Gly Leu Glu Leu Ser Gly
290 295 300
Leu Pro Phe Phe Trp Ala Tyr Arg Lys Pro Lys Gly Pro Ala Lys Ser
305 310 315 320
Asp Ser Val Glu Leu Pro Asp Gly Phe Val Glu Arg Val Arg Asp Arg
325 330 335
Gly Leu Val Trp Thr Ser Trp Ala Pro Gln Leu Arg Ile Leu Ser His
340 345 350
Glu Ser Val Ala Gly Phe Leu Thr His Cys Gly Ser Gly Ser Ile Val
355 360 365
Glu Gly Leu Met Phe Gly His Pro Leu Ile Met Leu Pro Ile Phe Gly
370 375 380
Asp Gln Pro Leu Asn Ala Arg Leu Leu Glu Asp Lys Gln Val Gly Ile
385 390 395 400
Glu Ile Pro Arg Asn Glu Glu Asp Gly Ser Phe Thr Arg Asp Ser Val
405 410 415
Ala Glu Ser Leu Arg Leu Val Met Val Glu Glu Glu Gly Lys Ile Tyr
420 425 430
Arg Glu Lys Ala Lys Glu Met Ser Lys Leu Phe Gly Asp Lys Asp Leu
435 440 445
Gln Asp Gln Tyr Val Asp Asp Phe Val Glu Tyr Leu Gln Lys His Arg
450 455 460
Arg Ala Val Ala Ile Asp His Glu Ser
465 470
<210> 26
<211> 1419
<212> DNA
<213> 人工序列()
<220>
<223> UGT2_10b CpO用于解脂耶氏酵母
<400> 26
atggccacct ccgactccat tgttgacgac cgaaagaagc tccacattgt catgttcccc 60
tggctcgcct ttggccacat catcccctat ctcgagcttt ccaagctcat tgcccagaag 120
ggccacaagg tttccttcct ctccaccacc aagaacattg accgactctc ctcccacatc 180
tctcccctca tcaactttgt caagctcacc ctcccccgag tccaggagct gcccgaggac 240
gccgaggcca ccactgatgt ccaccccgag gatatcccct acctcaagaa ggcctccgac 300
ggcctccagc ccgaggtcac tgagttcctc gagcagcact ctcccgactg gatcatctac 360
gactacaccc actactggct ccccgagatt gccaagtctc tcggtgtctc tcgagcccac 420
ttctccgtca ccaccccctg ggccattgct tacatgggtc ccactgccga tgccatgatc 480
aacggttccg actaccgaac cgagcttgag gacttcaccg tccctcccaa gtggttcccc 540
ttccccacca ccgtctgctg gcgaaagcac gatctggccc gactcgtccc ctacaaggct 600
cccggtatct ccgacggtta ccgaatgggc ctcgtcatca agggctgcga ctgtctgctc 660
tccaagacct accacgagtt cggtactcag tggctccgac ttctcgagga gctgcaccga 720
gtccccgtca tccccgttgg tctgctccct ccctccatcc ccggctctga caaggacgac 780
tcttgggttt ccatcaagga gtggctcgac ggccaggaga agggctccgt tgtctacgtt 840
gctctcggtt ccgaggttct cgtcacccag gaagaggttg tcgagcttgc tcacggtctg 900
gagctgtccg gtctgccctt cttctgggcc taccgaaagc ccaagggtcc cgccaagtcc 960
gactccgtcg agcttcccga tggtttcgtc gagcgagtcc gagatcgagg tctggtctgg 1020
acctcttggg ctccccagct ccgaatcctc tcccacgagt ccgttgctgg tttcctcacc 1080
cactgcggtt ccggctccat tgtcgagggc ctcatgttcg gccaccctct catcatgctc 1140
cccatcttcg gtgaccagcc cctcaacgcc cgactccttg aggacaagca ggtcggtatc 1200
gagatccccc gaaacgagga agatggttct ttcacccgag actctgttgc cgagtctctg 1260
cgactcgtca tggtcgagga agagggtaag atctaccgag agaaggccaa ggagatgtcc 1320
aagctctttg gcgacaagga cctccaggac cagtacgtcg acgactttgt cgagtacctc 1380
cagaagcacc gacgagctgt tgccattgac cacgaaagc 1419
<210> 27
<211> 473
<212> PRT
<213> 甜叶菊()
<400> 27
Met Ala Thr Ser Asp Ser Ile Val Asp Asp Arg Lys Gln Leu His Val
1 5 10 15
Ala Thr Phe Pro Trp Leu Ala Phe Gly His Ile Leu Pro Tyr Leu Gln
20 25 30
Leu Ser Lys Leu Ile Ala Glu Lys Gly His Lys Val Ser Phe Leu Ser
35 40 45
Thr Thr Arg Asn Ile Gln Arg Leu Ser Ser His Ile Ser Pro Leu Ile
50 55 60
Asn Val Val Gln Leu Thr Leu Pro Arg Val Gln Glu Leu Pro Glu Asp
65 70 75 80
Ala Glu Ala Thr Thr Asp Val His Pro Glu Asp Ile Pro Tyr Leu Lys
85 90 95
Lys Ala Ser Asp Gly Leu Gln Pro Glu Val Thr Arg Phe Leu Glu Gln
100 105 110
His Ser Pro Asp Trp Ile Ile Tyr Asp Tyr Thr His Tyr Trp Leu Pro
115 120 125
Ser Ile Ala Ala Ser Leu Gly Ile Ser Arg Ala His Phe Ser Val Thr
130 135 140
Thr Pro Trp Ala Ile Ala Tyr Met Gly Pro Ser Ala Asp Ala Met Ile
145 150 155 160
Asn Gly Ser Asp Gly Arg Thr Thr Val Glu Asp Leu Thr Thr Pro Pro
165 170 175
Lys Trp Phe Pro Phe Pro Thr Lys Val Cys Trp Arg Lys His Asp Leu
180 185 190
Ala Arg Leu Val Pro Tyr Lys Ala Pro Gly Ile Ser Asp Gly Tyr Arg
195 200 205
Met Gly Leu Val Leu Lys Gly Ser Asp Cys Leu Leu Ser Lys Cys Tyr
210 215 220
His Glu Phe Gly Thr Gln Trp Leu Pro Leu Leu Glu Thr Leu His Gln
225 230 235 240
Val Pro Val Val Pro Val Gly Leu Leu Pro Pro Glu Ile Pro Gly Asp
245 250 255
Glu Lys Asp Glu Thr Trp Val Ser Ile Lys Lys Trp Leu Asp Gly Lys
260 265 270
Gln Lys Gly Ser Val Val Tyr Val Ala Leu Gly Ser Glu Val Leu Val
275 280 285
Ser Gln Thr Glu Val Val Glu Leu Ala Leu Gly Leu Glu Leu Ser Gly
290 295 300
Leu Pro Phe Val Trp Ala Tyr Arg Lys Pro Lys Gly Pro Ala Lys Ser
305 310 315 320
Asp Ser Val Glu Leu Pro Asp Gly Phe Val Glu Arg Thr Arg Asp Arg
325 330 335
Gly Leu Val Trp Thr Ser Trp Ala Pro Gln Leu Arg Ile Leu Ser His
340 345 350
Glu Ser Val Cys Gly Phe Leu Thr His Cys Gly Ser Gly Ser Ile Val
355 360 365
Glu Gly Leu Met Phe Gly His Pro Leu Ile Met Leu Pro Ile Phe Gly
370 375 380
Asp Gln Pro Leu Asn Ala Arg Leu Leu Glu Asp Lys Gln Val Gly Ile
385 390 395 400
Glu Ile Pro Arg Asn Glu Glu Asp Gly Cys Leu Thr Lys Glu Ser Val
405 410 415
Ala Arg Ser Leu Arg Ser Val Val Val Glu Lys Glu Gly Glu Ile Tyr
420 425 430
Lys Ala Asn Ala Arg Glu Leu Ser Lys Ile Tyr Asn Asp Thr Lys Val
435 440 445
Glu Lys Glu Tyr Val Ser Gln Phe Val Asp Tyr Leu Glu Lys Asn Ala
450 455 460
Arg Ala Val Ala Ile Asp His Glu Ser
465 470
<210> 28
<211> 1422
<212> DNA
<213> 人工序列()
<220>
<223> UGT2_1a CpO用于酿酒酵母
<400> 28
atggctacat ctgattctat tgttgatgac aggaagcagt tgcatgtggc tactttccct 60
tggcttgctt tcggtcatat actgccttac ctacaactat caaaactgat agctgaaaaa 120
ggacataaag tgtcattcct ttcaacaact agaaacattc aaagattatc ttcccacata 180
tcaccattga ttaacgtcgt tcaattgaca cttccaagag tacaggaatt accagaagat 240
gctgaagcta caacagatgt gcatcctgaa gatatccctt acttgaaaaa ggcatccgat 300
ggattacagc ctgaggtcac tagattcctt gagcaacaca gtccagattg gatcatatac 360
gactacactc actattggtt gccttcaatt gcagcatcac taggcatttc tagggcacat 420
ttcagtgtaa ccacaccttg ggccattgct tacatgggtc catccgctga tgctatgatt 480
aacggcagtg atggtagaac taccgttgaa gatttgacaa ccccaccaaa gtggtttcca 540
tttccaacta aagtctgttg gagaaaacac gacttagcaa gactggttcc atacaaggca 600
ccaggaatct cagacggcta tagaatgggt ttagtcctta aagggtctga ctgcctattg 660
tctaagtgtt accatgagtt tgggacacaa tggctaccac ttttggaaac attacaccaa 720
gttcctgtcg taccagttgg tctattacct ccagaaatcc ctggtgatga gaaggacgag 780
acttgggttt caatcaaaaa gtggttagac gggaagcaaa aaggctcagt ggtatatgtg 840
gcactgggtt ccgaagtttt agtatctcaa acagaagttg tggaacttgc cttaggtttg 900
gaactatctg gattgccatt tgtctgggcc tacagaaaac caaaaggccc tgcaaagtcc 960
gattcagttg aattgccaga cggctttgtc gagagaacta gagatagagg gttggtatgg 1020
acttcatggg ctccacaatt gagaatcctg agtcacgaat ctgtgtgcgg tttcctaaca 1080
cattgtggtt ctggttctat agttgaagga ctgatgtttg gtcatccact tatcatgttg 1140
ccaatctttg gtgaccagcc tttgaatgca cgtctgttag aagataaaca agttggaatt 1200
gaaatcccac gtaatgagga agatggatgt ttaaccaagg agtctgtggc cagatcatta 1260
cgttccgttg tcgttgaaaa ggaaggcgaa atctacaagg ccaatgcccg tgaactttca 1320
aagatctaca atgacacaaa agtagagaag gaatatgttt ctcaatttgt agattaccta 1380
gagaaaaacg ctagagccgt agctattgat catgaatcct aa 1422
<210> 29
<211> 1422
<212> DNA
<213> 人工序列()
<220>
<223> UGT2_1a CpO用于解脂耶氏酵母
<400> 29
atggccacct ccgactccat tgtcgacgac cgaaagcagc tgcacgttgc caccttcccc 60
tggctcgcct ttggccacat tctgccctac ctccagctct ccaagctcat tgctgagaag 120
ggccacaagg tttctttcct gtccaccacc cgaaacatcc agcgactctc ctcccacatc 180
tctcctctca tcaacgttgt ccagctcacc ctcccccgag tccaggagct ccccgaggat 240
gccgaggcca ccactgatgt ccaccccgag gacatcccct acctcaagaa ggcctccgac 300
ggtctgcagc ccgaggtcac ccgattcctc gagcagcact ctcccgactg gatcatctac 360
gactacaccc actactggct cccctccatt gctgcttctc tcggtatctc tcgagcccac 420
ttctccgtca ccaccccctg ggccattgct tacatgggcc cctctgctga cgccatgatc 480
aacggttccg acggccgaac caccgtcgag gatctcacca cccctcccaa gtggttcccc 540
ttccccacca aggtctgctg gcgaaagcac gatctcgccc gactcgtccc ctacaaggcc 600
cccggtatct ccgacggtta ccgaatgggt ctggttctca agggctccga ctgtctgctc 660
tccaagtgct accacgagtt tggtacccag tggctccccc tgctcgagac tctgcaccag 720
gtccccgttg tccccgtcgg tctgctccct cccgagatcc ccggtgacga gaaggacgag 780
acttgggttt ccatcaagaa gtggctcgac ggcaagcaga agggctccgt cgtctacgtt 840
gctctcggct ccgaggttct tgtctcccag actgaggtcg tcgagctcgc cctcggtctg 900
gagctctccg gtctgccctt cgtctgggcc taccgaaagc ccaagggtcc cgccaagtcc 960
gactccgtcg agctccccga cggtttcgtc gagcgaactc gagatcgagg tctggtctgg 1020
acctcttggg ctccccagct ccgaatcctc tcccacgagt ccgtctgcgg tttcctgacc 1080
cactgtggtt ccggctccat tgtcgagggc ctcatgttcg gccaccccct catcatgctg 1140
cccatcttcg gtgaccagcc cctcaacgcc cgactcctcg aggacaagca ggtcggtatc 1200
gagatccccc gaaacgaaga ggacggctgc ctcaccaagg agtctgttgc ccgatctctg 1260
cgatctgttg ttgtcgagaa agagggtgag atctacaagg ccaacgcccg agagctctcc 1320
aagatctaca acgacaccaa ggtcgagaag gagtacgttt cccagtttgt cgactacctc 1380
gagaagaacg cccgagctgt cgccattgac cacgagagtt aa 1422
<210> 30
<211> 600
<212> DNA
<213> 人工序列()
<220>
<223> ScEno2启动子
<400> 30
gtgtcgacgc tgcgggtata gaaagggttc tttactctat agtacctcct cgctcagcat 60
ctgcttcttc ccaaagatga acgcggcgtt atgtcactaa cgacgtgcac caacttgcgg 120
aaagtggaat cccgttccaa aactggcatc cactaattga tacatctaca caccgcacgc 180
cttttttctg aagcccactt tcgtggactt tgccatatgc aaaattcatg aagtgtgata 240
ccaagtcagc atacacctca ctagggtagt ttctttggtt gtattgatca tttggttcat 300
cgtggttcat taattttttt tctccattgc tttctggctt tgatcttact atcatttgga 360
tttttgtcga aggttgtaga attgtatgtg acaagtggca ccaagcatat ataaaaaaaa 420
aaagcattat cttcctacca gagttgattg ttaaaaacgt atttatagca aacgcaattg 480
taattaattc ttattttgta tcttttcttc ccttgtctca atcttttatt tttattttat 540
ttttcttttc ttagtttctt tcataacacc aagcaactaa tactataaca tacaataata 600
<210> 31
<211> 1056
<212> DNA
<213> 酿酒酵母()
<400> 31
atggcttctg aaaaggaaat cagaagagaa cgtttcttga atgttttccc aaaattggtt 60
gaagaattga acgcttctct attagcttac ggtatgccaa aggaagcttg tgactggtac 120
gctcactctt tgaactacaa caccccaggt ggtaagttga acagaggtct atccgttgtt 180
gacacctacg ccattttgtc caacaagacc gtcgaacaat taggtcaaga agaatacgaa 240
aaggttgcca tcttaggttg gtgtatcgaa ttgttgcaag cttacttctt ggttgctgat 300
gacatgatgg acaaatctat caccagaaga ggtcaaccat gttggtacaa ggttccagaa 360
gtcggtgaaa ttgccatcaa cgatgctttc atgttggaag ctgccatcta caagttgttg 420
aagtctcact tcagaaacga aaagtactac attgacatca ctgaattatt ccacgaagtt 480
actttccaaa ccgaattggg tcaattgatg gacttgatta ccgctccaga agataaggtc 540
gatttgtcca aattttcctt gaagaaacac tctttcattg tcactttcaa gactgcttac 600
tactcctttt acttgcctgt tgctttggcc atgtatgtcg ctggtatcac cgatgaaaag 660
gacttgaagc aagctcgtga tgtcttgatt ccattaggtg aatacttcca aatccaagat 720
gactacttgg actgtttcgg tactccagaa caaatcggta agattggtac tgatatccaa 780
gacaacaagt gttcctgggt tatcaacaag gctttggaat tggcttctgc tgaacaaaga 840
aagactttgg acgaaaacta cggtaagaag gactctgttg ctgaagctaa gtgtaagaag 900
atcttcaacg atttgaaaat tgaacaatta taccatgaat acgaagaatc tattgccaag 960
gacttgaaag ccaagatctc tcaagtcgac gaatccagag gtttcaaggc tgatgtcttg 1020
actgctttct tgaacaaggt ctacaagaga tcaaaa 1056
<210> 32
<211> 301
<212> DNA
<213> 人工序列()
<220>
<223> Adh1终止子
<400> 32
agcgaatttc ttatgattta tgatttttat tattaaataa gttataaaaa aaataagtgt 60
atacaaattt taaagtgact cttaggtttt aaaacgaaaa ttcttattct tgagtaactc 120
tttcctgtag gtcaggttgc tttctcaggt atagcatgag gtcgctctta ttgaccacac 180
ctctaccggc atgccgagca aatgcctgca aatcgctccc catttcaccc aattgtagat 240
atgctaactc cagcaatgag ttgatgaatc tcggtgtgta ttttatgtcc tcagaggaca 300
a 301
<210> 33
<211> 600
<212> DNA
<213> 人工序列()
<220>
<223> Sc Fba1启动子
<400> 33
ctacttggct tcacatacgt tgcatacgtc gatatagata ataatgataa tgacagcagg 60
attatcgtaa tacgtaatag ttgaaaatct caaaaatgtg tgggtcatta cgtaaataat 120
gataggaatg ggattcttct atttttcctt tttccattct agcagccgtc gggaaaacgt 180
ggcatcctct ctttcgggct caattggagt cacgctgccg tgagcatcct ctctttccat 240
atctaacaac tgagcacgta accaatggaa aagcatgagc ttagcgttgc tccaaaaaag 300
tattggatgg ttaataccat ttgtctgttc tcttctgact ttgactcctc aaaaaaaaaa 360
aatctacaat caacagatcg cttcaattac gccctcacaa aaactttttt ccttcttctt 420
cgcccacgtt aaattttatc cctcatgttg tctaacggat ttctgcactt gatttattat 480
aaaaagacaa agacataata cttctctatc aatttcagtt attgttcttc cttgcgttat 540
tcttctgttc ttctttttct tttgtcatat ataaccataa ccaagtaata catattcaaa 600
<210> 34
<211> 1575
<212> DNA
<213> 酿酒酵母()
<400> 34
atggaccaat tggtcaagac tgaagtcacc aagaaatctt tcactgctcc agtccaaaag 60
gcttccactc cagttttgac caacaagacc gtcatctccg gttccaaggt taaatctttg 120
tcctctgctc aatcttcctc ctctggtcca tcttcttctt ctgaagaaga tgattccaga 180
gatatcgaat ctttggacaa gaaaatcaga ccattggaag aattggaagc tctattgtcc 240
tctggtaaca ctaagcaatt aaagaacaag gaagttgctg ctttggttat ccacggtaaa 300
ttgccattgt acgctttgga aaagaaatta ggtgacacca ccagagctgt tgctgtcaga 360
agaaaggctt tgtccatttt ggctgaagct ccagtcttgg cttccgacag attaccatac 420
aagaactacg actacgaccg tgtctttggt gcttgttgtg aaaatgtcat tggttacatg 480
ccattaccag ttggtgtcat tggtccattg gttatcgacg gtacttctta ccacatccca 540
atggctacca ctgaaggttg tttggttgct tctgccatga gaggttgtaa ggccatcaac 600
gctggtggtg gtgctaccac cgttttgact aaggatggta tgaccagagg tcctgttgtc 660
agattcccaa ctttgaagag atctggtgct tgtaagatct ggttggattc tgaagaaggt 720
caaaacgcca tcaagaaggc tttcaactcc acttccagat tcgctagatt gcaacacatt 780
caaacttgtt tagctggtga cttgttgttc atgagattca gaaccaccac tggtgacgct 840
atgggtatga acatgatctc caagggtgtt gaatactctt tgaagcaaat ggttgaagaa 900
tacggttggg aagatatgga agttgtctct gtttctggta actactgtac cgacaagaag 960
ccagctgcca tcaactggat cgaaggtcgt ggtaagtccg ttgttgctga agctaccatt 1020
ccaggtgacg ttgtcagaaa ggttttgaaa tctgatgttt ctgctttagt cgaattgaac 1080
attgccaaga acttggtcgg ttctgccatg gctggttccg tcggtggttt caacgctcat 1140
gccgctaact tggtcactgc tgttttcttg gctttaggtc aagatccagc tcaaaatgtc 1200
gaatcctcta actgtatcac tttgatgaag gaagttgacg gtgatttgag aatttctgtt 1260
tccatgccat ccattgaagt cggtactatc ggtggtggta ctgtcttgga accacaaggt 1320
gccatgttgg acttgttggg tgttcgtggt ccacacgcta ccgctccagg tactaacgcc 1380
agacaattgg ccagaattgt tgcctgtgcc gtcttggctg gtgaattgtc tctatgtgcc 1440
gctttggctg ctggtcactt ggttcaatct cacatgaccc acaacagaaa gcctgctgaa 1500
ccaaccaaac caaacaactt ggatgctact gacattaaca gattaaagga cggttctgtc 1560
acctgtatca agtct 1575
<210> 35
<211> 301
<212> DNA
<213> 人工序列()
<220>
<223> Adh2终止子
<400> 35
agcggatctc ttatgtcttt acgatttata gttttcatta tcaagtatgc ctatattagt 60
atatagcatc tttagatgac agtgttcgaa gtttcacgaa taaaagataa tattctactt 120
tttgctccca ccgcgtttgc tagcacgagt gaacaccatc cctcgcctgt gagttgtacc 180
cattcctcta aactgtagac atggtagctt cagcagtgtt cgttatgtac ggcatcctcc 240
aacaaacagt cggttatagt ttgtcctgct cctctgaatc gtgtccctcg atatttctca 300
t 301
<210> 36
<211> 600
<212> DNA
<213> 人工序列()
<220>
<223> Sc Tef1启动子
<400> 36
ttggctgata atagcgtata aacaatgcat actttgtacg ttcaaaatac aatgcagtag 60
atatatttat gcatattaca tataatacat atcacatagg aagcaacagg cgcgttggac 120
ttttaatttt cgaggaccgc gaatccttac atcacaccca atcccccaca agtgatcccc 180
cacacaccat agcttcaaaa tgtttctact ccttttttac tcttccagat tttctcggac 240
tccgcgcatc gccgtaccac ttcaaaacac ccaagcacag catactaaat ttcccctctt 300
tcttcctcta gggtgtcgtt aattacccgt actaaaggtt tggaaaagaa aaaagacacc 360
gcctcgtttc tttttcttcg tcgaaaaagg caataaaaat ttttatcacg tttctttttc 420
ttgaaaattt ttttttttga tttttttctc tttcgatgac ctcccattga tatttaagtt 480
aataaacggt cttcaatttc tcaagtttca gtttcatttt tcttgttcta ttacaacttt 540
ttttacttct tgctcattag aaagaaagca tagcaatcta atctaagttt taattacaaa 600
<210> 37
<211> 1005
<212> DNA
<213> 酿酒酵母()
<400> 37
atggaagcta agattgacga attgatcaac aacgaccctg tctggtcctc tcaaaacgaa 60
tctttgatct ccaagccata caaccacatc ttgttgaagc caggtaagaa cttcagatta 120
aacttgattg ttcaaatcaa cagagttatg aacttgccaa aggaccaatt ggccattgtt 180
tcccaaattg tcgaattgtt gcacaactcc tctctattga tcgatgacat tgaagataat 240
gctccattaa gaagaggtca aaccacttct catttgattt tcggtgtccc atccaccatc 300
aacactgcta actacatgta cttcagagcc atgcaattgg tttctcaatt gaccaccaag 360
gaaccattat accacaactt gatcactatc tttaacgaag aattgattaa cttgcaccgt 420
ggtcaaggtt tggacatcta ctggagagat ttcttgccag aaattattcc aactcaagaa 480
atgtacttga acatggtcat gaacaagact ggtggtttat tcagattgac tttacgtttg 540
atggaagctt tgtctccatc ttcccaccac ggtcactctt tggttccatt catcaatcta 600
ttaggtatca tctaccaaat cagagatgat tacttgaact tgaaggactt ccaaatgtcc 660
tctgaaaagg gtttcgctga agatatcact gaaggtaaat tgtctttccc aattgtccac 720
gccttgaact ttaccaagac caagggtcaa actgaacaac acaacgaaat tttgagaatc 780
ttattgttga gaacttctga caaggacatc aagttgaaat tgatccaaat cttggaattc 840
gataccaact ctttggctta caccaagaac ttcatcaacc aattggttaa catgatcaag 900
aatgacaacg aaaacaaata cttgccagac ttggcttccc actccgatac cgctaccaac 960
ttgcacgacg aattgttgta cattattgac catttgtctg agtta 1005
<210> 38
<211> 301
<212> DNA
<213> 人工序列()
<220>
<223> Sc Gmp1终止子
<400> 38
agtctgaaga atgaatgatt tgatgatttc tttttccctc catttttctt actgaatata 60
tcaatgatat agacttgtat agtttattat ttcaaattaa gtagctatat atagtcaaga 120
taacgtttgt ttgacacgat tacattattc gtcgacatct tttttcagcc tgtcgtggta 180
gcaatttgag gagtattatt aattgaatag gttcattttg cgctcgcata aacagttttc 240
gtcagggaca gtatgttgga atgagtggta attaatggtg acatgacatg ttatagcaat 300
a 301
<210> 39
<211> 600
<212> DNA
<213> 人工序列()
<220>
<223> Sc Pgk1启动子
<400> 39
gggccagaaa aaggaagtgt ttccctcctt cttgaattga tgttaccctc ataaagcacg 60
tggcctctta tcgagaaaga aattaccgtc gctcgtgatt tgtttgcaaa aagaacaaaa 120
ctgaaaaaac ccagacacgc tcgacttcct gtcttcctat tgattgcagc ttccaatttc 180
gtcacacaac aaggtcctag cgacggctca caggttttgt aacaagcaat cgaaggttct 240
ggaatggcgg gaaagggttt agtaccacat gctatgatgc ccactgtgat ctccagagca 300
aagttcgttc gatcgtactg ttactctctc tctttcaaac agaattgtcc gaatcgtgtg 360
acaacaacag cctgttctca cacactcttt tcttctaacc aagggggtgg tttagtttag 420
tagaacctcg tgaaacttac atttacatat atataaactt gcataaattg gtcaatgcaa 480
gaaatacata tttggtcttt tctaattcgt agtttttcaa gttcttagat gctttctttt 540
tctctttttt acagatcatc aaggaagtaa ttatctactt tttacaacaa atataaaaca 600
<210> 40
<211> 1001
<212> DNA
<213> 人工序列()
<220>
<223> Kl prom 12启动子
<400> 40
cgtaaaaact aaaacgagcc cccaccaaag aacaaaaaag aaggtgctgg gcccccactt 60
tcttcccttg cacgtgatag gaagatggct acagaaacaa gaagatggaa atcgaaggaa 120
agagggagac tggaagctgt aaaaactgaa atgaaaaaaa aaaaaaaaaa aaaaaaacaa 180
gaagctgaaa atggaagact gaaatttgaa aaatggtaaa aaaaaaaaag aaacacgaag 240
ctaaaaacct ggattccatt ttgagaagaa gcaagaaagg taagtatggt aacgaccgta 300
caggcaagcg cgaaggcaaa tggaaaagct ggagtccgga agataatcat ttcatcttct 360
tttgttagaa cagaacagtg gatgtccctc atctcggtaa cgtattgtcc atgccctaga 420
actctctgtc cctaaaaaga ggacaaaaac ccaatggttt ccccagcttc cagtggagcc 480
accgatccca ctggaaacca ctggacagga agagaaaatc acggacttcc tctattgaag 540
gataattcaa cactttcacc agatcccaaa tgtcccgccc ctattcccgt gttccatcac 600
gtaccataac ttaccatttc atcacgttct ctatggcaca ctggtactgc ttcgactgct 660
ttgcttcatc ttctctatgg gccaatgagc taatgagcac aatgtgctgc gaaataaagg 720
gatatctaat ttatattatt acattataat atgtactagt gtggttattg gtaattgtac 780
ttaattttga tatataaagg gtggatcttt ttcattttga atcagaattg gaattgcaac 840
ttgtctcttg tcactattac ttaatagtaa ttatatttct tattaacctt ttttttaagt 900
caaaacacca aggacaagaa ctactcttca aaggtatttc aagttatcat acgtgtcaca 960
cacgcttcac agtttcaagt aaaaaaaaag aatattacac a 1001
<210> 41
<211> 2229
<212> DNA
<213> 甜叶菊()
<400> 41
atgtgtaaag ctgtttccaa ggaatactct gacttgttgc aaaaggatga agcctccttc 60
accaaatggg atgatgacaa agttaaggac catttagaca ctaacaagaa cttgtaccca 120
aacgatgaaa tcaaggaatt cgtcgaatct gtcaaagcta tgttcggttc catgaatgat 180
ggtgaaatca acgtttccgc ttacgacacc gcttgggttg ctttggttca agacgttgat 240
ggttccggtt ctccacaatt cccatcttct ttggaatgga ttgccaacaa ccaattgtct 300
gatggttctt ggggtgacca tttgttattc tctgctcacg acagaattat taacacttta 360
gcttgtgtca ttgctttgac ttcctggaat gtccatccat ccaagtgtga aaagggtttg 420
aacttcttga gagaaaacat ctgtaagttg gaagatgaaa atgctgaaca catgccaatt 480
ggtttcgaag ttaccttccc atctttgatt gatatcgcca agaagttgaa catcgaagtc 540
ccagaagaca ccccagcttt gaaggaaatc tacgccagaa gagatatcaa gttgaccaaa 600
atcccaatgg aagttttgca caaggttcca accaccttgt tgcactcttt ggaaggtatg 660
ccagacttgg aatgggaaaa gttgttaaag ttgcaatgta aggacggttc tttcttgttc 720
tctccatctt ctaccgcctt tgctttgatg caaactaagg acgaaaagtg tctacaatac 780
ttaactaata tcgttaccaa attcaacggt ggtgtcccaa acgtttaccc tgttgacttg 840
tttgaacaca tctgggttgt tgacagattg caacgtttgg gtattgctcg ttatttcaag 900
tctgaaatca aggactgtgt tgaatacatc aacaagtact ggactaagaa cggtatctgt 960
tgggctcgta acacccacgt tcaagatatc gacgacactg ctatgggttt cagagtcttg 1020
agagctcatg gttacgatgt caccccagat gtcttcagac aattcgaaaa ggatggtaag 1080
ttcgtttgtt ttgccggtca atccactcaa gccgtcactg gtatgttcaa cgtctacaga 1140
gcttctcaaa tgttgttccc aggtgaaaga atcctagaag acgctaagaa gttctcctac 1200
aactacttga aagaaaagca atctactaac gaattgttgg acaaatggat cattgccaaa 1260
gacttaccag gtgaagtcgg ttacgctttg gatattccat ggtacgcttc tctaccaaga 1320
ttagaaacca gatactactt ggaacaatac ggtggtgaag acgatgtctg gatcggtaag 1380
accttgtaca gaatgggtta cgtttccaac aacacttact tggaaatggc caaattggac 1440
tacaacaact acgtcgccgt cttacaattg gaatggtaca ccattcaaca atggtacgtt 1500
gacattggta ttgaaaagtt tgaatccgac aacatcaagt ccgtcttggt ttcctactac 1560
ttggctgctg cttccatctt tgaaccagaa agatccaagg aaagaattgc ttgggctaag 1620
accaccatct tggttgacaa gatcacttct attttcgact cttcccaatc ttccaaggaa 1680
gatatcaccg ctttcattga caaattcaga aacaagtctt cttccaagaa gcactccatt 1740
aacggtgaac catggcacga agttatggtt gctttgaaga agactttgca cggttttgct 1800
ttggatgctt tgatgactca ctctcaagat attcaccctc aattacacca agcttgggaa 1860
atgtggttaa ccaagttgca agatggtgtc gatgtcactg ctgaattgat ggttcaaatg 1920
atcaacatga ctgccggtag atgggtttct aaggaattgt tgactcaccc tcaataccaa 1980
cgtttgtcca ccgtcaccaa ctctgtctgt cacgacatca ctaagttgca caacttcaaa 2040
gaaaactcca ctactgtcga ttctaaggtt caagaattgg ttcaattagt tttctctgac 2100
accccagatg acttggacca agacatgaag caaactttct tgactgtcat gaagaccttc 2160
tactacaagg cttggtgtga cccaaacacc atcaacgacc atatttctaa ggtcttcgaa 2220
attgttatc 2229
<210> 42
<211> 2271
<212> DNA
<213> 甜叶菊()
<400> 42
atgacttctc acggtggtca aaccaaccca accaacttga ttattgacac caccaaggaa 60
agaatccaaa agcaattcaa gaatgttgaa atctccgttt cctcctacga cactgcttgg 120
gttgccatgg ttccatctcc aaactcccca aagtctccat gtttcccaga atgtttgaac 180
tggttaatca acaaccaatt gaacgatggt tcctggggtt tagtcaatca cacccacaac 240
cacaatcacc cattgttgaa ggactctcta tcctccactt tggcttgtat cgttgctttg 300
aagagatgga acgttggtga agaccaaatc aacaagggtt tgtcctttat tgaatccaac 360
ttggcttctg ctactgaaaa gtcccaacca tctcctatcg gttttgacat cattttccca 420
ggtttattgg aatacgctaa gaacttggac atcaacttat tatctaagca aaccgatttc 480
tccttgatgt tgcacaagag agaattggaa caaaagagat gtcactccaa cgaaatggac 540
ggttacttgg cttacatttc tgaaggtttg ggtaacttgt acgactggaa catggtcaag 600
aaataccaaa tgaagaacgg ttccgttttc aactctccat ctgctaccgc tgctgctttc 660
atcaaccatc aaaacccagg ttgtttgaac tacttgaact ctttgttgga caaattcggt 720
aacgctgttc caactgtcta cccacacgat ttgtttatca gattatccat ggttgacacc 780
attgaacgtt tgggtatttc tcatcacttc agagtcgaaa tcaagaacgt tttggatgaa 840
acttacagat gttgggttga aagagatgaa caaatcttca tggatgtcgt cacttgtgcc 900
ttggccttca gattattgag aattaacggt tacgaagttt ctccagaccc attggctgaa 960
atcactaacg aattggcttt gaaggacgaa tacgccgctt tggaaactta ccatgcctct 1020
cacatcttat accaagaaga cttgtcctct ggtaagcaaa tcttgaagtc tgctgacttc 1080
ttgaaggaaa ttatctctac tgattctaac agattgtcca agttgattca caaggaagtt 1140
gaaaacgcct tgaaattccc aatcaacact ggtttggaaa gaattaacac cagaagaaac 1200
atccaattat acaacgttga caacactaga atcttgaaga ctacttatca ctcttccaac 1260
atctccaaca ctgactactt gagattggct gtcgaagatt tctacacctg tcaatctatt 1320
tacagagaag aattgaaggg tttggaaaga tgggttgtcg aaaacaaatt ggaccaattg 1380
aaatttgcta gacaaaagac cgcctactgt tacttctccg ttgctgccac tttgtcctct 1440
ccagaattat ctgacgccag aatctcctgg gctaagaatg gtatcttgac caccgttgtc 1500
gatgacttct tcgatattgg tggtaccatt gacgaattga ccaacttgat tcaatgtgtt 1560
gaaaagtgga acgtcgatgt cgataaggac tgttgttctg aacacgtcag aatcttattc 1620
ttggctttga aagatgctat ctgttggatc ggtgacgaag ctttcaaatg gcaagctcgt 1680
gacgttacct ctcacgtcat ccaaacctgg ttggaattga tgaactctat gttgagagaa 1740
gccatctgga cccgtgatgc ttacgtccca actttgaacg aatacatgga aaatgcttac 1800
gtttctttcg ctttgggtcc aattgtcaag cctgctattt acttcgttgg tccaaagttg 1860
tccgaagaaa ttgttgaatc ttctgaatac cacaacttgt tcaaattgat gtctactcaa 1920
ggtcgtttgt tgaacgatat ccactctttc aagcgtgaat tcaaggaagg taagttgaat 1980
gctgttgctt tgcatttgtc taacggtgaa tctggtaagg tcgaagaaga agttgtcgaa 2040
gaaatgatga tgatgatcaa gaacaagaga aaggaattga tgaagttgat ctttgaagaa 2100
aacggttcta ttgtcccaag agcttgtaag gatgctttct ggaacatgtg tcacgtcttg 2160
aacttcttct acgctaacga tgacggtttc actggtaaca ccatcttaga caccgtcaag 2220
gacatcattt acaacccatt agtcttggtt aacgaaaacg aagaacaaag a 2271
<210> 43
<211> 301
<212> DNA
<213> 人工序列()
<220>
<223> Sc Tal1终止子
<400> 43
aggaagtatc tcggaaatat taatttaggc catgtcctta tgcacgtttc ttttgatact 60
tacgggtaca tgtacacaag tatatctata tatataaatt aatgaaaatc ccctatttat 120
atatatgact ttaacgagac agaacagttt tttatttttt atcctatttg atgaatgata 180
cagtttctta ttcacgtgtt atacccacac caaatccaat agcaataccg gccatcacaa 240
tcactgtttc ggcagcccct aagatcagac aaaacatccg gaaccacctt aaatcaacgt 300
c 301
<210> 44
<211> 1575
<212> DNA
<213> 藤仓赤霉菌()
<400> 44
atgtccaagt ctaactccat gaactccact tctcacgaaa ctttattcca acaattggtt 60
ttgggtttgg acagaatgcc attgatggat gtccactggt tgatctacgt tgctttcggt 120
gcttggttat gttcctacgt cattcacgtt ttgtcctctt cttctaccgt caaggttcca 180
gttgtcggtt acagatccgt tttcgaacca acctggttat tgagattaag atttgtctgg 240
gaaggtggtt ccattattgg tcaaggttac aacaaattca aggactctat cttccaagtc 300
agaaagttgg gtactgacat tgttatcatc ccaccaaact acatcgatga agtcagaaag 360
ttgtcccaag acaagaccag atctgttgaa ccattcatca acgatttcgc tggtcaatac 420
accagaggta tggtctttct acaatctgat ttgcaaaacc gtgtcatcca acaaagattg 480
actccaaagt tggtttcttt gactaaggtc atgaaggaag aattggacta cgctttgacc 540
aaggaaatgc cagacatgaa gaacgacgaa tgggttgaag ttgacatttc ttccatcatg 600
gtcagattga tctccagaat ctctgcccgt gttttcttgg gtccagaaca ctgtcgtaac 660
caagaatggt tgaccaccac tgctgaatac tctgaatctt tattcatcac tggtttcatc 720
ttgagagttg tcccacacat cttaagacca ttcattgctc cattgttgcc ttcttacaga 780
actttgttga gaaatgtctc ttctggtaga agagttatcg gtgatatcat cagatctcaa 840
caaggtgatg gtaacgaaga tatcttgtcc tggatgagag atgctgctac cggtgaagaa 900
aagcaaattg acaacattgc tcaaagaatg ttgatcttgt ctttggcttc cattcacacc 960
accgccatga ccatgaccca tgccatgtac gacttgtgtg cctgtccaga atacattgaa 1020
ccattacgtg acgaagtcaa atccgttgtt ggtgcttctg gttgggacaa gactgctttg 1080
aacagattcc acaagttgga ctctttcttg aaggaatctc aaagattcaa cccagttttc 1140
ttgttgactt tcaacagaat ctaccatcaa tccatgactt tgtccgatgg taccaacatt 1200
ccatctggta ccagaattgc tgttccatct cacgctatgt tgcaagattc tgctcacgtt 1260
ccaggtccaa ctcctccaac tgaatttgac ggtttcagat actccaagat cagatctgac 1320
tctaactatg ctcaaaagta cttgttctcc atgaccgatt cttccaacat ggctttcggt 1380
tacggtaagt acgcttgtcc aggtcgtttc tacgcctcca acgaaatgaa attgactttg 1440
gccattttgt tgttgcaatt tgaattcaaa ttgccagatg gtaagggtag accaagaaac 1500
atcactatcg actctgacat gattccagac ccaagagcta gattatgtgt cagaaagaga 1560
tctctacgtg acgaa 1575
<210> 45
<211> 301
<212> DNA
<213> 人工序列()
<220>
<223> Sc Tpi1终止子
<400> 45
agattaatat aattatataa aaatattatc ttcttttctt tatatctagt gttatgtaaa 60
ataaattgat gactacggaa agctttttta tattgtttct ttttcattct gagccactta 120
aatttcgtga atgttcttgt aagggacggt agatttacaa gtgatacaac aaaaagcaag 180
gcgctttttc taataaaaag aagaaaagca tttaacaatt gaacacctct atatcaacga 240
agaatattac tttgtctcta aatccttgta aaatgtgtac gatctctata tgggttactc 300
a 301
<210> 46
<211> 403
<212> DNA
<213> 人工序列()
<220>
<223> Ag lox_TEF1启动子
<400> 46
taccgttcgt ataatgtatg ctatacgaag ttatgtcccc gccgggtcac ccggccagcg 60
acatggaggc ccagaatacc ctccttgaca gtcttgacgt gcgcagctca ggggcatgat 120
gtgactgtcg cccgtacatt tagcccatac atccccatgt ataatcattt gcatccatac 180
attttgatgg ccgcacggcg cgaagcaaaa attacggctc ctcgctgcag acctgcgagc 240
agggaaacgc tcccctcaca gacgcgttga attgtcccca cgccgcgccc ctgtagagaa 300
atataaaagg ttaggatttg ccactgaggt tcttctttca tatacttcct tttaaaatct 360
tgctaggata cagttctcac atcacatccg aacataaaca aca 403
<210> 47
<211> 810
<212> DNA
<213> 人工序列()
<220>
<223> KANMX
<400> 47
atgggtaagg aaaagactca cgtttcgagg ccgcgattaa attccaacat ggatgctgat 60
ttatatgggt ataaatgggc tcgcgataat gtcgggcaat caggtgcgac aatctatcga 120
ttgtatggga agcccgatgc gccagagttg tttctgaaac atggcaaagg tagcgttgcc 180
aatgatgtta cagatgagat ggtcagacta aactggctga cggaatttat gcctcttccg 240
accatcaagc attttatccg tactcctgat gatgcatggt tactcaccac tgcgatcccc 300
ggcaaaacag cattccaggt attagaagaa tatcctgatt caggtgaaaa tattgttgat 360
gcgctggcag tgttcctgcg ccggttgcat tcgattcctg tttgtaattg tccttttaac 420
agcgatcgcg tatttcgttt ggctcaggcg caatcacgaa tgaataacgg tttggttgat 480
gcgagtgatt ttgatgacga gcgtaatggc tggcctgttg aacaagtctg gaaagaaatg 540
cataagcttt tgccattctc accggattca gtcgtcactc atggtgattt ctcacttgat 600
aaccttattt ttgacgaggg gaaattaata ggttgtattg atgttggacg agtcggaatc 660
gcagaccgat accaggatct tgccatccta tggaactgcc tcggtgagtt ttctccttca 720
ttacagaaac ggctttttca aaaatatggt attgataatc ctgatatgaa taaattgcag 780
tttcatttga tgctcgatga gtttttctaa 810
<210> 48
<211> 285
<212> DNA
<213> 人工序列()
<220>
<223> Ag Tef1_lox终止子
<400> 48
atcagtactg acaataaaaa gattcttgtt ttcaagaact tgtcatttgt atagtttttt 60
tatattgtag ttgttctatt ttaatcaaat gttagcgtga tttatatttt ttttcgcctc 120
gacatcatct gcccagatgc gaagttaagt gcgcagaaag taatatcatg cgtcaatcgt 180
atgtgaatgc tggtcgctat actgctgtcg attcgatact aacgccgcca tccagtgtcg 240
aaaacgagct cataacttcg tataatgtat gctatacgaa cggta 285
<210> 49
<211> 1575
<212> DNA
<213> 拟南芥()
<400> 49
atggaatctt tagtcgttca caccgtcaat gccatctggt gtattgtcat tgttggtatt 60
ttctctgttg gttaccacgt ttacggtcgt gccgttgttg aacaatggag aatgagaaga 120
tctttgaaat tgcaaggtgt caagggtcca ccaccatcca ttttcaacgg taatgtctct 180
gaaatgcaaa gaatccaatc tgaagctaag cactgttccg gtgacaacat catttctcac 240
gattactcct cctctttgtt ccctcacttt gaccactgga gaaagcaata cggtagaatc 300
tacacctact ccactggttt gaaacaacat ttgtacatca accatccaga aatggtcaag 360
gaattatctc aaaccaacac tttgaactta ggtcgtatca ctcacatcac caagagattg 420
aacccaatct taggtaacgg tatcatcact tccaacggtc cacactgggc tcatcaaaga 480
agaattattg cttacgaatt cacccacgac aaaatcaagg gtatggtcgg tttgatggtc 540
gaatctgcca tgccaatgtt gaacaaatgg gaagaaatgg ttaagagagg tggtgaaatg 600
ggttgtgaca tccgtgttga cgaagatttg aaggatgttt ctgctgatgt cattgctaag 660
gcttgtttcg gttcctcttt ctccaagggt aaggctatct tctccatgat cagagacttg 720
ttgactgcca tcactaagag atctgttttg ttcagattca acggtttcac cgacatggtt 780
ttcggttcca agaagcatgg tgatgtcgat atcgatgctt tggaaatgga attggaatct 840
tctatctggg aaaccgttaa ggaaagagaa attgaatgta aggacactca caagaaggat 900
ttgatgcaat taatcttgga aggtgccatg agatcttgtg acggtaactt gtgggacaag 960
tctgcttaca gaagatttgt tgtcgacaac tgtaaatcca tctactttgc cggtcacgac 1020
tctactgctg tctccgtttc ctggtgtttg atgttgctag ctttgaaccc atcctggcaa 1080
gtcaagatca gagatgaaat cttatcttct tgtaagaacg gtattccaga tgctgaatcc 1140
attccaaact tgaagaccgt taccatggtc attcaagaaa ctatgagatt gtacccacca 1200
gctccaattg tcggtagaga agcttccaag gacatcagat taggtgactt ggttgttcca 1260
aagggtgttt gtatctggac tttgattcca gctttgcacc gtgacccaga aatctggggt 1320
ccagatgcta acgacttcaa gccagaaaga ttctctgaag gtatttccaa ggcttgtaaa 1380
tacccacaat cttacatccc attcggtttg ggtccaagaa cctgtgtcgg taagaacttc 1440
ggtatgatgg aagtcaaagt tttggtttct ttgattgttt ccaagttctc tttcaccttg 1500
tctccaactt accaacactc tccatctcac aagttgttgg ttgaacctca acacggtgtt 1560
gtcattagag tcgtt 1575
<210> 50
<211> 1000
<212> DNA
<213> 人工序列()
<220>
<223> Kl prom 6启动子
<400> 50
caaagggggg gcagggacag ggatacgaca agggctgggg aaaaaaaaaa agatagatac 60
gattggccgg gtaagcctgg ggaaatgtag caagtgcggg taagttaaaa ggtaaccacg 120
tgactccgga agagtcacgt ggttacggac ttttttctct agatctcagc tttttatcgg 180
tcttaccctg ccctcctgcc ccctgcccct tccctttgcc ccaaaaagaa aggaaatctg 240
ttggatttcg ctcaggccat ccctttcgtt aatatcggtt atcgctttac acactgcaca 300
tccttctgtc caaaaggaat ccagaagttt agcttttcct tcctttccca cagacattag 360
cctaggccct ctctcatcat ttgcatgcct cagccaatgt accaagaata acgcaacgag 420
gttgggaaat tttaacccaa caatcgatgc agatgtgaca agagattaga cacgttccag 480
ataccagatt acacagcttg tgctagcaga gtgacatatg gtggtgttgt gtctcgttta 540
gtacctgtaa tcgagagtgt tcaaatcagt cgatttgaac acccttactg ccactgaata 600
ttgattgaat accgtttatt gaaggtttta tgagtgatct tctttcggtc caggacaatt 660
tgttgagctt tttctatgta gagttccgtc cctttttttt ttttttttgc tttctcgcac 720
ttactagcac tatttttttt tcacacacta aaacacttta ttttaatcta tatatatata 780
tatatatata tgtaggaatg gaatcacaga catttgatac tcatcctcat ccttattaat 840
tcttgtttta atttgtttga cttagccaaa ccaccaatct caacccatcg tatttcaggt 900
attgtgtgtc tagtgtgtct ctggtatacg gaaataagtg ccagaagtaa ggaagaaaca 960
aagaacaagt gtctgaatac tactagcctc tcttttcata 1000
<210> 51
<211> 2133
<212> DNA
<213> 拟南芥()
<400> 51
atgtcctctt cttcttcttc ttctacttcc atgattgatt tgatggctgc catcatcaag 60
ggtgaaccag tcattgtctc tgacccagcc aacgcttctg cttacgaatc cgttgctgct 120
gaattgtcct ccatgttgat tgaaaacaga caattcgcta tgattgtcac tacttccatt 180
gctgtcttga ttggttgtat cgtcatgttg gtctggagaa gatccggttc cggtaactcc 240
aagagagttg aaccattgaa gccattagtc atcaagccaa gagaagaaga aattgatgac 300
ggtagaaaga aggtcaccat cttctttggt actcaaaccg gtactgctga aggttttgct 360
aaggctttgg gtgaagaagc caaagctaga tacgaaaaga ccagattcaa gatcgttgac 420
ttggacgact acgctgctga tgacgacgaa tacgaagaaa agttgaagaa ggaagatgtt 480
gccttcttct tcttggctac ttacggtgat ggtgaaccaa ctgacaatgc tgccagattc 540
tacaaatggt tcaccgaagg taacgacaga ggtgaatggt taaagaactt gaaatacggt 600
gttttcggtc taggtaacag acaatacgaa cacttcaaca aggttgccaa ggttgtcgat 660
gacatcttgg ttgaacaagg tgctcaaaga ttagtccaag tcggtttggg tgatgatgac 720
caatgtatcg aagatgactt cactgcttgg agagaagctt tgtggccaga attggacacc 780
atcttaagag aagaaggtga taccgctgtt gccaccccat acactgctgc tgttttggaa 840
tacagagttt ctatccacga ctctgaagat gccaagttca acgacatcaa catggctaac 900
ggtaacggtt acactgtttt cgacgctcaa cacccataca aggccaatgt tgctgtcaag 960
agagaattgc acactccaga atctgatcgt tcttgtatcc acttggaatt tgacattgct 1020
ggttctggtt tgacctacga aaccggtgac cacgtcggtg tcttatgtga caacttgtct 1080
gaaactgtcg atgaagcttt gagattattg gacatgtctc cagacactta tttctccttg 1140
catgctgaaa aggaagatgg tactccaatt tcttcttcct tgcctcctcc attcccacca 1200
tgtaacttga gaaccgcttt aaccagatac gcttgtttgc tatcctctcc aaagaagtcc 1260
gctttggttg ctttggctgc tcacgcttct gacccaactg aagctgaaag attgaaacat 1320
ttggcttccc cagctggtaa ggatgaatac tccaaatggg ttgttgaatc tcaaagatct 1380
ttgttggaag tcatggctga attcccatct gccaagccac cattgggtgt tttcttcgcc 1440
ggtgttgctc caagattgca accaagattt tactccatct cttcttctcc aaagattgct 1500
gaaaccagaa ttcacgttac ctgtgccttg gtctacgaaa agatgccaac cggtagaatt 1560
cacaagggtg tttgttccac ctggatgaag aacgctgttc catacgaaaa gtctgaaaac 1620
tgttcttctg ctccaatctt cgtccgtcaa tccaacttca agttgccatc tgactccaag 1680
gtcccaatca tcatgatcgg tccaggtact ggtttagctc cattcagagg tttcttgcaa 1740
gaaagattgg ccttagttga atctggtgtc gaattgggtc cttctgtttt gttcttcggt 1800
tgtagaaacc gtcgtatgga cttcatctac gaagaagaat tgcaaagatt tgtcgaatct 1860
ggtgctttgg ctgaattgtc cgttgctttc tctcgtgaag gtccaaccaa agaatacgtt 1920
caacacaaga tgatggacaa agcctccgac atctggaaca tgatctccca aggtgcttac 1980
ttgtacgttt gtggtgatgc taaaggtatg gccagagatg tccacagatc tttacatacc 2040
attgcccaag aacaaggttc catggactcc accaaggctg aaggtttcgt taagaacttg 2100
caaacttctg gtcgttactt gagagatgtt tgg 2133
<210> 52
<211> 301
<212> DNA
<213> 人工序列()
<220>
<223> Sc Pdc1终止子
<400> 52
agcgatttaa tctctaatta ttagttaaag ttttataagc atttttatgt aacgaaaaat 60
aaattggttc atattattac tgcactgtca cttaccatgg aaagaccaga caagaagttg 120
ccgacagtct gttgaattgg cctggttagg cttaagtctg ggtccgcttc tttacaaatt 180
tggagaattt ctcttaaacg atatgtatat tcttttcgtt ggaaaagatg tcttccaaaa 240
aaaaaaccga tgaattagtg gaaccaagga aaaaaaaaga ggtatccttg attaaggaac 300
a 301
<210> 53
<211> 1000
<212> DNA
<213> 人工序列()
<220>
<223> Kl prom 3启动子
<400> 53
gagcctgtcc aagcaaatgc cttctcataa atggtgccaa agacccgcaa gcccaaagca 60
attacccccc aaaaagaaat gatatagtgc aagatacgta tatgaccatg acttgactag 120
gtgaaacagt gcagaaacag ccgcacaaaa gcagccctaa ccctcagagt cgattttact 180
ctttcaggta ataaagcctc gacatcaatt ttagacagaa gccaggctgg cctcgagatt 240
atagccatag gcaagcaaga ggagagaagg ggaggccccc catggggggc ctcccccccg 300
ctgtcaaggt ttggcagaac ctagcttcat taggccacta gcccagccta aaacgtcaac 360
gggcaggagg aacactccca caagacggcg tagtattctc gattcataac cattttctca 420
atcgaattac acagaacaca ccgtacaaac ctctctatca taactactta atagtcacac 480
acgtactcgt ctaaatacac atcatcgtcc tacaagttca tcaaagtgtt ggacagacaa 540
ctataccagc atggatctct tgtatcggtt cttttctccc gctctctcgc aataacaatg 600
aacactgggt caatcatagc ctacacaggt gaacagagta gcgtttatac agggtttata 660
cggtgattcc tacggcaaaa atttttcatt tctaaaaaaa aaaagaaaaa tttttctttc 720
caacgctaga aggaaaagaa aaatctaatt aaattgattt ggtgattttc tgagagttcc 780
ctttttcata tatcgaattt tgaatataaa aggagatcga aaaaattttt ctattcaatc 840
tgttttctgg ttttatttga tagttttttt gtgtattatt attatggatt agtactggtt 900
tatatgggtt tttctgtata acttcttttt attttagttt gtttaatctt attttgagtt 960
acattatagt tccctaactg caagagaagt aacattaaaa 1000
<210> 54
<211> 1443
<212> DNA
<213> 甜叶菊()
<400> 54
atggacgcta tggccaccac tgaaaagaag cctcacgtta tctttattcc attcccagct 60
caatctcata tcaaggctat gttgaaattg gctcaattat tgcaccacaa gggtttgcaa 120
atcacttttg tcaacaccga cttcattcac aaccaattct tggaatcttc tggtcctcac 180
tgtttggacg gtgctccagg tttcagattc gaaaccattc cagatggtgt ttcccactct 240
ccagaagcct ccatcccaat cagagaatcc ttgttgagat ctattgaaac caacttcttg 300
gaccgtttca tcgatttggt taccaaattg ccagacccac caacctgtat catttctgac 360
ggtttcttgt ccgttttcac catcgatgct gccaagaaat tgggtattcc agtcatgatg 420
tactggactt tggctgcttg tggtttcatg ggtttctacc atattcactc tttgattgaa 480
aagggtttcg ctccattaaa ggatgcttct tacttgacca acggttactt ggacaccgtc 540
attgactggg ttccaggtat ggaaggtatc agattgaaag atttcccatt ggactggtct 600
actgacttga atgacaaggt cttgatgttc actactgaag ctccacaaag atctcataag 660
gtttctcacc acatcttcca cactttcgat gaattagaac catctatcat caagactcta 720
tccttgagat acaaccatat ctacaccatt ggtccattac aattgttgtt ggaccaaatc 780
ccagaagaaa agaagcaaac cggtatcact tctttgcacg gttactcttt agtcaaggaa 840
gaaccagaat gtttccaatg gttacaatcc aaggaaccaa actctgttgt ctacgttaac 900
tttggttcca ccactgttat gtccttggaa gatatgactg aatttggttg gggtttggct 960
aactctaacc actacttctt atggatcatc agatctaact tggtcattgg tgaaaacgcc 1020
gttttgcctc cagaattgga agaacacatc aagaagagag gtttcattgc ttcctggtgt 1080
tctcaagaaa aggtcttgaa gcacccatct gttggtggtt tcttgaccca ctgtggttgg 1140
ggttccacca ttgaatccct atctgctggt gttccaatga tctgttggcc atactcctgg 1200
gaccaattga ctaactgtcg ttacatctgt aaggaatggg aagttggttt ggaaatgggt 1260
actaaggtca agagagatga agtcaagaga ttagtccaag aattgatggg tgaaggtggt 1320
cacaagatga gaaacaaagc caaggactgg aaggaaaagg ccagaattgc tattgctcca 1380
aacggttctt cctccttgaa catcgataaa atggttaagg aaatcactgt cttggctcga 1440
aac 1443
<210> 55
<211> 301
<212> DNA
<213> 人工序列()
<220>
<223> Sc TDH1终止子
<400> 55
aataaagcaa tcttgatgag gataatgatt tttttttgaa tatacataaa tactaccgtt 60
tttctgctag attttgtgaa gacgtaaata agtacatatt actttttaag ccaagacaag 120
attaagcatt aactttaccc ttttctcttc taagtttcaa tactagttat cactgtttaa 180
aagttatggc gagaacgtcg gcggttaaaa tatattaccc tgaacgtggt gaattgaagt 240
tctaggatgg tttaaagatt tttccttttt gggaaataag taaacaatat attgctgcct 300
t 301
<210> 56
<211> 1000
<212> DNA
<213> 人工序列()
<220>
<223> Kl prom 2启动子
<400> 56
gagcctgtcc aagcaaatgc cttctcataa atggtgccaa agacccgcaa gcccaaagca 60
attacccccc aaaaagaaat gatatagtgc aagatacgta tatgaccatg acttgactag 120
gtgaaacagt gcagaaacag ccgcacaaaa gcagccctaa ccctcagagt cgattttact 180
ctttcaggta ataaagcctc gacatcaatt ttagacagaa gccaggctgg cctcgagatt 240
atagccatag gcaagcaaga ggagagaagg ggaggccccc catggggggc ctcccccccg 300
ctgtcaaggt ttggcagaac ctagcttcat taggccacta gcccagccta aaacgtcaac 360
gggcaggagg aacactccca caagacggcg tagtattctc gattcataac cattttctca 420
atcgaattac acagaacaca ccgtacaaac ctctctatca taactactta atagtcacac 480
acgtactcgt ctaaatacac atcatcgtcc tacaagttca tcaaagtgtt ggacagacaa 540
ctataccagc atggatctct tgtatcggtt cttttctccc gctctctcgc aataacaatg 600
aacactgggt caatcatagc ctacacaggt gaacagagta gcgtttatac agggtttata 660
cggtgattcc tacggcaaaa atttttcatt tctaaaaaaa aaaagaaaaa tttttctttc 720
caacgctaga aggaaaagaa aaatctaatt aaattgattt ggtgattttc tgagagttcc 780
ctttttcata tatcgaattt tgaatataaa aggagatcga aaaaattttt ctattcaatc 840
tgttttctgg ttttatttga tagttttttt gtgtattatt attatggatt agtactggtt 900
tatatgggtt tttctgtata acttcttttt attttagttt gtttaatctt attttgagtt 960
acattatagt tccctaactg caagagaagt aacattaaaa 1000
<210> 57
<211> 1380
<212> DNA
<213> 甜叶菊()
<400> 57
atggctgaac aacaaaagat caagaaatct ccacacgtct tgttgattcc attcccattg 60
caaggtcaca tcaacccatt catccaattc ggtaagagat tgatttccaa gggtgtcaag 120
accactttag tcaccactat tcacacttta aactccactt taaaccactc taacactact 180
accacctcta ttgaaatcca agccatttct gacggttgtg acgaaggtgg tttcatgtct 240
gctggtgaat cttacttgga aactttcaag caagtcggtt ccaagtcttt ggctgatttg 300
atcaagaaat tgcaatccga aggtactacc atcgatgcta tcatctacga ctccatgact 360
gaatgggttt tggatgttgc cattgaattt ggtattgacg gtggttcttt cttcacccaa 420
gcctgtgttg ttaactcttt gtactaccac gtccacaagg gtttgatctc tctaccatta 480
ggtgaaaccg tttccgtccc aggtttccca gtcttgcaaa gatgggaaac tccattgatc 540
ttacaaaacc atgaacaaat ccaatctcca tggtcccaaa tgttgtttgg tcaattcgct 600
aacattgacc aagctagatg ggttttcacc aactctttct acaagttgga agaagaagtc 660
attgaatgga ccagaaagat ctggaacttg aaggttatcg gtccaactct accatccatg 720
tacttggaca agagattgga tgacgacaag gacaacggtt tcaacttgta caaggctaac 780
catcacgaat gtatgaactg gttggatgac aagccaaagg aatctgttgt ttacgttgct 840
ttcggttctt tggtcaagca tggtccagaa caagttgaag aaatcaccag agctttgatt 900
gactccgatg ttaacttctt atgggttatc aagcacaagg aagaaggtaa attgccagaa 960
aacttgtctg aagttatcaa gaccggtaag ggtttgattg ttgcttggtg taagcaattg 1020
gatgttttgg ctcacgaatc cgtcggttgt ttcgtcactc actgtggttt caactctact 1080
ttggaagcta tctccttggg tgttccagtt gttgccatgc ctcaattctc tgaccaaacc 1140
accaacgcca aattgttgga tgaaatcttg ggtgtcggtg tccgtgtcaa ggctgatgaa 1200
aacggtattg ttagaagagg taacttagct tcctgtatca agatgatcat ggaagaagaa 1260
cgtggtgtca ttatcagaaa gaatgctgtc aaatggaagg acttggctaa ggttgctgtc 1320
cacgaaggtg gttcctctga caatgacatt gttgaatttg tctctgaatt gatcaaagcg 1380
<210> 58
<211> 1374
<212> DNA
<213> 甜叶菊()
<400> 58
atggaaaaca agactgaaac cactgttaga agaagaagaa gaatcatctt attcccagtt 60
ccattccaag gtcacattaa cccaatcttg caattggcta acgtcttata ctccaagggt 120
ttctccatca ccatcttcca caccaacttc aacaaaccta aaacttccaa ctacccacac 180
ttcaccttca gatttatctt ggacaacgac ccacaagatg aaagaatttc taacttgcca 240
acccatggtc cattggccgg tatgagaatt ccaatcatca acgaacacgg tgctgacgaa 300
ttgagaagag aattggaatt gttgatgttg gcttctgaag aagatgaaga agtctcttgt 360
ttgatcactg atgctttatg gtactttgct caatctgttg ctgactcttt gaacttgaga 420
agattagtct tgatgacctc ttctttgttc aacttccacg ctcacgtttc tctaccacaa 480
tttgatgaat tgggttactt ggacccagat gacaagacca gattggaaga acaagcctcc 540
ggtttcccaa tgttgaaggt caaggatatc aagtctgcct actccaactg gcaaatcttg 600
aaggaaattt tgggtaagat gatcaagcaa accaaggctt cttctggtgt catctggaac 660
tccttcaagg aattggaaga atctgaattg gaaaccgtca tcagagaaat tccagctcca 720
tctttcttga ttccattacc aaagcatttg actgcttcct cctcttctct attggaccac 780
gacagaactg ttttccaatg gttggaccaa caaccaccat cttccgtctt atacgtttcc 840
tttggttcca cttctgaagt tgacgaaaag gacttcttgg aaattgctcg tggtttggtt 900
gactccaagc aatctttctt atgggttgtc agaccaggtt tcgtcaaggg ttccacctgg 960
gttgaacctt tgccagacgg tttcttgggt gaaagaggta gaattgtcaa atgggttcca 1020
caacaagaag ttttggctca cggtgccatt ggtgctttct ggactcactc tggttggaac 1080
tctactttgg aatccgtttg tgaaggtgtt ccaatgattt tctctgactt cggtttggac 1140
caaccattga atgctcgtta catgtccgat gttttgaagg ttggtgtcta cttggaaaac 1200
ggttgggaac gtggtgaaat tgctaacgcc atcagaagag tcatggtcga tgaagaaggt 1260
gaatacatca gacaaaatgc tcgtgtcttg aaacaaaagg ctgatgtttc tttgatgaag 1320
ggtggttctt cttacgaatc tttggaatct ttggtttcct acatctccag tctc 1374
<210> 59
<211> 602
<212> DNA
<213> 人工序列()
<220>
<223> Sc Eno1终止子
<400> 59
aagcttttga ttaagccttc tagtccaaaa aacacgtttt tttgtcattt atttcatttt 60
cttagaatag tttagtttat tcattttata gtcacgaatg ttttatgatt ctatataggg 120
ttgcaaacaa gcatttttca ttttatgtta aaacaatttc aggtttacct tttattctgc 180
ttgtggtgac gcgtgtatcc gcccgctctt ttggtcaccc atgtatttaa ttgcataaat 240
aattcttaaa agtggagcta gtctatttct atttacatac ctctcatttc tcatttcctc 300
caagcttttg attaagcctt ctagtccaaa aaacacgttt ttttgtcatt tatttcattt 360
tcttagaata gtttagttta ttcattttat agtcacgaat gttttatgat tctatatagg 420
gttgcaaaca agcatttttc attttatgtt aaaacaattt caggtttacc ttttattctg 480
cttgtggtga cgcgtgtatc cgcccgctct tttggtcacc catgtattta attgcataaa 540
taattcttaa aagtggagct agtctatttc tatttacata cctctcattt ctcatttcct 600
cc 602
<210> 60
<211> 600
<212> DNA
<213> 酿酒酵母()
<400> 60
ccgcggaacc gccagatatt cattacttga cgcaaaagcg tttgaaataa tgacgaaaaa 60
gaaggaagaa aaaaaaagaa aaataccgct tctaggcggg ttatctactg atccgagctt 120
ccactaggat agcacccaaa cacctgcata tttggacgac ctttacttac accaccaaaa 180
accactttcg cctctcccgc ccctgataac gtccactaat tgagcgatta cctgagcggt 240
cctcttttgt ttgcagcatg agacttgcat actgcaaatc gtaagtagca acgtgtcaag 300
gtcaaaactg tatggaaacc ttgtcacctc acttaattct agctagccta ccctgcaagt 360
caagaggtgt ccgtgattcc tagccacctc aaggtatgcc tctccccgga aactgtggcc 420
ttttctggca cacatgatct ccacgatttc aacatataaa tagcttttga taatggcaat 480
attaatcaaa tttattttac ttctttcttg taacatctct cttgtaatcc cttattcctt 540
ctagctattt ttcataaaaa accaagcaac tgcttatcaa cacacaaaca ctaaatcaaa 600
<210> 61
<211> 301
<212> DNA
<213> 乳酸克鲁维酵母()
<400> 61
aattactctt ttaagttaac gaacgctttt gatgagacta acgatatttc aagtgattcc 60
attttttact tctaagtttt tatcaccttt atcttaacca ttctatgcca gtctttgctt 120
tatggacttt gattcaaatt atgaagggaa gtttttacgc caaataaaaa ctactacaac 180
aaattattaa aaaaaatgac gaataatatg aagtgtctaa cgactgccaa aattattcat 240
tcctttttta tacacataac catttcactt catttactgg tttgagtggt ttattacgtc 300
g 301
<210> 62
<211> 803
<212> DNA
<213> 解脂耶氏酵母()
<400> 62
taccaaccac agattacgac ccattcgcag tcacagttca ctagggtttg ggttgcatcc 60
gttgagagtg gtttgttttt aaccttctcc atgtgctcac tcaggttttg ggttcagatc 120
aaatcaaggc gtgaaccact gtttgaggac aaatgtgaca caaccaacca gtgtcagggg 180
caagtccgtg acaaagggga agatacaatg caattactga cagttacgga ctgcctcgat 240
gccctaacct tgccccaaaa taagacaact gtcctcgttt aagcgcaacc ctattcagcg 300
tcacgtcata atagcgtttg gatagcacta gtctatgagg agcgttttat gttgcggtga 360
gggcgattgg tgctcatatg ggttcaattg aggtggtgga acgagcttag tcttcaattg 420
aggtgcgagc gacacaattg ggtgtcacgt ggcctaattg acctcggatc gtggagtccc 480
cagttataca gcaaccacga ggtgcatgag taggagacgt caccagacaa tagggttttt 540
ttggactgga gagggtaggg caaaagcgct caacgggctg tttggggagc tatgggggag 600
gaattggcga tatttgtgag gttgacggct ccgatttgcg tgttttgtcg cttctgcatc 660
tccccatacc catatcttcc ctccccacct ctttccacga taattttacg gatcagcaat 720
aaggttcctt ctcctagttt ccacgtccat atatatctat gctgcgtcgt ccttttcgtg 780
acatcaccaa aacacataca aaa 803
<210> 63
<211> 995
<212> DNA
<213> 解脂耶氏酵母()
<400> 63
ctgtacctgc tgtggaccac gcacggcgga acgtaccgta caaatatttt cttgctcaca 60
tgactctctc tcggccgcgc acgccggtgg caaattgctc ttgcattggc tctgtctcta 120
gacgtccaaa ccgtccaaag tggcagggtg acgtgatgcg acgcacgaag gagatggccc 180
ggtggcgagg aaccggacac ggcgagccgg cgggaaaaaa ggcggaaaac gaaaagcgaa 240
gggcacaatc tgacggtgcg gctgccacca acccaaggag gctattttgg gtcgctttcc 300
atttcacatt cgccctcaat ggccactttg cggtggtgaa catggtttct gaaacaaccc 360
cccagaatta gagtatattg atgtgtttaa gattgggttg ctatttggcc attgtggggg 420
agggtagcga cgtggaggac attccagggc gaattgagcc tagaaagtgg taccattcca 480
accgtctcag tcgtccgaat tgatcgctat aactatcacc tctctcacat gtctacttcc 540
ccaaccaaca tccccaacct cccccacact aaagttcacg ccaataatgt aggcactctt 600
tctgggtgtg ggacagcaga gcaatacgga ggggagatta cacaacgagc cacaattggg 660
gagatggtag ccatctcact cgacccgtcg acttttggca acgctcaatt acccaccaaa 720
tttgggctgg agttgagggg accgtgttcc agcgctgtag gaccagcaac acacacggta 780
tcaacagcaa ccaacgcccc cgctaatgca cccagtactg cgcaggtgtg ggccaggtgc 840
gttccagatg cgagttggcg aaccctaagc cgacagtgta ctttttggga cgggcagtag 900
caatcgtggg cggagacccc ggtgtatata aaggggtgga gaggacggat tattagcacc 960
aacacacaca cttatactac atgctagcca caaaa 995
<210> 64
<211> 1004
<212> DNA
<213> 解脂耶氏酵母()
<400> 64
gtcagaaggg gcagctctaa acgaagaact gcggtcaggt gacacaactt tttccatctc 60
agggtgtgtc gcgtgtgctt catccaaact ttagttgggg ttcgggttcg cgcgagatga 120
tcacgtgccc tgatttggtg tcgtcccccg tcgcgctgcg cacgtgattt atttatttcc 180
ggtggctgct gtctacgcgg ggccttctct gcccttctgt ttcaaccttc gggcggttct 240
cgtaaccagc agtagcaatc catttcgaaa ctcaaagagc taaaaacgtt aaacctcagc 300
agtcgctcga cgaatgggct gcggttggga agcccacgag gcctatagcc agagcctcga 360
gttgacagga gcccagacgc cttttccaac ggcaactttt atataaaatg gcaatgtatt 420
catgcaattg cggccgtgtc aggttggaga cactggacca cactctccat tgcttcctga 480
ggagatggat cattgctagt gcatctacgc gcagcaatcc cgcaagctcg acaaccgtag 540
atgggctttg gtgggccaat caattacgca acccgcacgt taaattgtat gaggaaggaa 600
ggccacggta caaagtgggt ggtcttcacc cagtggttgt tggtggcgtc atgcagacca 660
tgcattgggg atagcacagg gttggggtgt cttgtggact caatgggtga aaggagatgg 720
aaaagggcgg tgaaaagtgg tagaatcgaa atccctgacg tcaatttata aagtaaaatg 780
cgtttctgcc attttgctcc cctccttctt tcgcaatcgc ctccccaaaa gttgtcgtgg 840
cagtacacat gcttgcatac aatgaagcta atccggcttg ctcagtagtt gctatatcca 900
ggcatggtgt gaaacccctc aaagtatata taggagcggt gagccccagt ctggggtctt 960
ttctctccat ctcaaaacta ctttctcaca tgctagccac aaaa 1004
<210> 65
<211> 1422
<212> DNA
<213> 解脂耶氏酵母()
<400> 65
atttcttgtg tgtgcggcaa acgtagcaat tgcaactgca taaacgatga ttgtaaaagt 60
atcacacttt gctcagacag gttagattca cctggtacga gggcagtgtc ttaaaggttc 120
catctacctc ggcccttgtt tcttgaagag tggtcaatat gtgttttata cagctgaaat 180
ttcccctgta tgttgagatc gtgtatattg gtcataatct gggctcttta gtcgatccca 240
gttttctcgg gcaagttttt ttctccacaa agtaccgctg gaaaactcta tgtgacttgt 300
tgacagatta cttgggttat ctgcgggata tgtcttggat aggcaaccgg gcatatatca 360
ccgggcggac tgttggttct gtacgtacat acagcacttt gagctcatgt ctcacacgca 420
accatggtgc gtggaggctt tggcatcctt tctacttgta gtggctatag tacttgcagt 480
ccaagcaaac atgagtatgt gcttgtatgt actgaaaccc gtctacggta atattttaga 540
gtgtggaact atgggatgag tgctcattcg atactatgtt gtcacccgat ttgccgtttg 600
cgaggtaaga cacattcggt ggttcaggcg gctacttgta tgtagcatcc acgttcatgt 660
tttgtggatc agattaatgg tatggatatg cacggggcgt ttccccggta acgtgtaggc 720
agtccagtgc aacccagaca gctgagctct ctatagccgt gcgtgtgcgg tcatatcacg 780
ctacacttag ctacagaata aagctcggta gcgccaacag cgttgacaaa tagctcaagg 840
gcgtggagca cagggtttag gaggttttaa tgggcgagaa ggcgcgtaga tgtagtcttc 900
ctcggtccca tcggtaatca cgtgtgtgcc gatttgcaag acgaaaagcc acgagaataa 960
accgggagag gggatggaag tccccgaaca gcaaccagcc cttgccctcg tggacataac 1020
ctttcacttg ccagaactct aagcgtcacc acggtataca agcgcacgta gaagattgtg 1080
gaagtcgtgt tggagactgt tgatttgggc ggtggagggg ggtatttgag agcaagtttg 1140
agatttgtgc cattgagggg gaggttattg tggccatgca gtcggatttg ccgtcacggg 1200
accgcaacat gcttttcatt gcagtccttc aactatccat ctcacctccc ccaatggctt 1260
ttaactttcg aatgacgaaa gcacccccct ttgtacagat gactatttgg gaccaatcca 1320
atagcgcaat tgggtttgca tcatgtataa aaggagcaat cccccactag ttataaagtc 1380
acaagtatct cagtataccc gtctaaccac acatttatca cc 1422
<210> 66
<211> 865
<212> DNA
<213> 解脂耶氏酵母()
<400> 66
atgctcactt ttgttgtcct gatgatctcc cgttatttcg ccgctcctct ggaaaccatc 60
cgcccgcaaa tcccctctgc ccatcttgac aatgcacaat gcatcattct cagcctgcat 120
gaatgcgaaa gatggcaata ttggtggagg aggcgacggc ggtaaacaat ggagatagag 180
accacaaaag agacctggag acccaaaatg gactcacgac aactccccca ctcccccact 240
ccccatctcc ccctgggcat cagttgccca tcggtatctc aactgtcgca ctagttagcg 300
caaccatcac atactttaga cgccaaacaa tgggacaact catcgcgccg aactatgggc 360
agattttaac tcgcacaaca ttaccccaac tctaaaaggt aacctcgacc ggaaaacggg 420
aagacaggat cagcaaccgt gatcgacaga atcttcaggg cactacagtt gatagacata 480
ggttatgttg gtaggtctag acgggcctcg gggaattgac cccaccagtt gcaagtcacg 540
tgcccctgat acagctagtt tagcacatct gcccactacg tctggacgca ccatggtggt 600
gccagtcgcg tgaactcaaa cacccactag cctcgggaag gattcagtta aatccgcacc 660
ttatttccaa cacaaagaag cggttggcgg acaaagaaca tgtcctttct ggggcactgt 720
acattccagg actctgttca aggtcaaata tacaaaacac agatagagaa acatagacag 780
ctgcggcctt ataaatacct gggcgcactt ctctcttttt ccctcctcat cacacattcg 840
ttcaccacta agtcactcgt tcaaa 865
<210> 67
<211> 880
<212> DNA
<213> 解脂耶氏酵母()
<400> 67
aaacaaaaga gctgaaatca tatccttcag tagtagtata gtcctgttat cacagcatca 60
attacccccg tccaagtaag ttgattggga tttttgttta cagatacagt aatatacttg 120
actatttctt tacaggtgac tcagaaagtg catgttggaa atgagccaca gaccaagaca 180
agatatgaca aaattgcact attcgatgca gaattcgacg gtgtttccat tggtgttatg 240
acattcatct gcattcatac aaaaaagtct tggtagtggt acttttgcgt tattacctcc 300
gatatctacg caccccccaa cccccctgct acagtaaaga gtgtgagtct actgtacatg 360
cttactaaac cacctactgt acagcgaaac ccctcagcaa aatcacacaa tcagctcatt 420
acaacacacc caatgacctc accacaaatt ctatacgcct tttgacgcca ttattacagt 480
agcttgcaac gccgttgtct taggttccat ttttagtgct ctattacctc acttaacccg 540
tataggcaga tcaggccatg gcactaagtg tagagctaga ggttgatatc gccacgagtg 600
ctccatcagg gctagggtgg ggttagaaat acagtccgtg cgcactcaaa aggcgtccgg 660
gttagggcat ccgataatat cgcctggact cggcgccata ttctcgactt ctgggcgcgt 720
tgtattcatc tcctccgctt cccaacactt ccacccgttt ctccatccca accaatagaa 780
tagggtaacc ttattcggga cactttcgtc atacatagtc agatatacaa gcaatgtcac 840
tctccttcgt actcgtacat acaacacaac tacattcaaa 880
<210> 68
<211> 1000
<212> DNA
<213> 解脂耶氏酵母()
<400> 68
caattcatgt atcgtgtcaa ttcatgtatc gtgtcaattc atgtatcgtg tcaatactta 60
tatctcaagt ggttgcatcg caaacagcca tcgcatactc cactctactc tcactgagtt 120
cactcttacc cggctccacc ttctagaagc caccaccgat ccaccgacga tgatcagtcc 180
accacttgct ctgaatgtgc gttggagctg caccatgatt gatgacgtca ccgccattca 240
gatagggcaa aagacgagcg ccaatcgcaa caatgggcga gtgtcgacga ctcccccgct 300
ctctgcggtt tcagcgactc caaccgtcgc caaaagaccg tcattttcgt ctaaagcgca 360
gcccagccca tctcttctaa aagattccag aaagataggg ttcaccaact acgcaccaat 420
atgtacagta tcgtagctac tccggcttgg ctgatctgag agatagagat ggctccgaaa 480
cgcggaaaac ggcggggtcg gaccgatcac gtgacacgta ctcatccgtc gcgccccgag 540
cgccatttca acaccaaata ctcccggtca cgtgccaccc cgcccgctct acccacgaga 600
tgtttctaca ctatacactg ccacgccgtc atacctgcag ctaggttaac attcgattaa 660
ttagtggagt caccagtgta caggactatg gcggaaaccg ggttacacaa accggcccgg 720
aatagcagca ttataccgct ggacgagatc accgtcaata aattgcgtcg ttactcggga 780
caaccattgc tcctccggct acacctgctc aaaggacttg ttccacactc ttccccagct 840
ctcccacgca aacaaagaga gcaaccttaa gtggacagct catgagcact cccctcgttt 900
gctgcccacg ctcgattata taaagaccag cggatcccct tctatttgga cttgcatcaa 960
ccaaccacaa cccacaccaa gcacacaaag cacaagaaca 1000
<210> 69
<211> 127
<212> DNA
<213> 解脂耶氏酵母()
<400> 69
aattaacaga tagtttgccg gtgataattc tcttaacctc ccacactcct ttgacataac 60
gatttatgta acgaaactga aatttgacca gatattgttg taaatagaaa atctggcttg 120
taggtgg 127
<210> 70
<211> 200
<212> DNA
<213> 解脂耶氏酵母()
<400> 70
gttttttgat caatgatcca atggctttca catacccccc cacgcctata attaaaacac 60
agagaaatat aatctaactt aataaatatt acggagaatc tttcgagtgt tcagcagaaa 120
tatagccatt gtaacaaaag ccggctatcg accgctttat cgaagaatat ttcccgcccc 180
ccagtggcca aacgatatcg 200
<210> 71
<211> 200
<212> DNA
<213> 解脂耶氏酵母()
<400> 71
ctatccgaag atcaagagcg aagcaagttg taagtccagg acatgtttcc cgcccacgcg 60
agtgatttat aacacctctc ttttttgaca cccgctcgcc ttgaaattca tgtcacataa 120
attatagtca acgacgtttg aataacttgt cttgtagttc gatgatgatc atatgattac 180
attaatagta attactgtat 200
<210> 72
<211> 200
<212> DNA
<213> 解脂耶氏酵母()
<400> 72
acttcgagct aatccagtag cttacgttac ccaggggcag gtcaactggc tagccacgag 60
tctgtcccag gtcgcaattt agtgtaataa acaatatata tattgagtct aaagggaatt 120
gtagctattg tgattgtgtg attttcgtct tgctggttct tattgtgtcc cattcgtttc 180
atcctgatga ggacccctgg 200
<210> 73
<211> 200
<212> DNA
<213> 解脂耶氏酵母()
<400> 73
gctatttaca gcatgtgtaa tgaggaatat aacgttgatt gaattgtttg tgaaaaatgt 60
agaaaatttc agtgaagttg tgttttctat atagtaagca cttttggtac aagtatctgc 120
acatccctgc atgttacaag cctgatcatg cagggcaata ttctgactat aaatatacct 180
cgatatttta gcaagctata 200
<210> 74
<211> 300
<212> DNA
<213> 解脂耶氏酵母()
<400> 74
atgtggtgat tgctgttgtg caagcctttg ctcgttttct gctgtatgta atttaaagaa 60
cgattgtatg aatcgaagtc aaggtgagtg tagtttgaga agtgtaaccc cagtgtcata 120
gctgtgtact ccattcattg aagggtgtag tcgtgtttta ttgcatgagc gcctattact 180
cgtataagta actgttttgt aacacttcat gaacggagat ggtatgaaca gaagtaataa 240
tatcctggaa gtcagctgtg cccagaggtg tgtgtgggtg tggcatactt tgggacaaca 300
<210> 75
<211> 1503
<212> DNA
<213> 人工序列()
<220>
<223> tHMG CpO用于解脂耶氏酵母
<400> 75
atgacccagt ctgtgaaggt ggttgagaag cacgttccta tcgtcattga gaagcccagc 60
gagaaggagg aggacacctc ttctgaagac tccattgagc tgactgtcgg aaagcagccc 120
aagcccgtga ccgagacccg ttctctggac gacttggagg ctatcatgaa ggcaggtaag 180
accaagctcc tggaggacca cgaggttgtc aagctctctc tcgaaggcaa gctccctttg 240
tatgctcttg agaagcagct tggtgacaac acccgagctg ttggcatccg acgatctatc 300
atctcccagc agtctaatac caagactctt gagacctcaa agctccctta cctgcactac 360
gactacgacc gtgtttttgg agcctgttgc gagaacgtta ttggttacat gcctctcccc 420
gttggtgttg ctggccccat gaacattgat ggcaagaact accacattcc tatggccacc 480
actgagggtt gtcttgttgc ctcaaccatg cgaggttgca aggccatcaa cgccggtggc 540
ggtgttacca ctgtgcttac tcaggacggt atgacacgag gtccttgtgt ttccttcccc 600
tctctcaagc gggctggagc cgctaagatc tggcttgatt ccgaggaggg tctcaagtcc 660
atgcgaaagg ccttcaactc cacctctcga tttgctcgtc tccagtctct tcactctacc 720
cttgctggta acctgctgtt tattcgattc cgaaccacca ctggtgatgc catgggcatg 780
aacatgatct ccaagggcgt cgaacactct ctggccgtca tggtcaagga gtacggcttc 840
cctgatatgg acattgtgtc tgtctcgggt aactactgca ctgacaagaa gcccgcagcg 900
atcaactgga tcgaaggccg aggcaagagt gttgttgccg aagccaccat ccctgctcac 960
attgtcaagt ctgttctcaa aagtgaggtt gacgctcttg ttgagctcaa catcagcaag 1020
aatctgatcg gtagtgccat ggctggctct gtgggaggtt tcaatgcaca cgccgcaaac 1080
ctggtgaccg ccatctacct tgccactggc caggatcctg ctcagaatgt cgagtcttcc 1140
aactgcatca cgctgatgag caacgtcgac ggtaacctgc tcatctccgt ttccatgcct 1200
tctatcgagg tcggtaccat tggtggaggt actattttgg agccccaggg tgctatgctg 1260
gagatgcttg gcgtgcgagg tcctcacatc gagacccccg gtgccaacgc ccaacagctt 1320
gctcgcatca ttgcttctgg agttcttgca gcggagcttt cgctgtgttc tgctcttgct 1380
gccggccatc ttgtgcaaag tcatatgacc cacaaccgtt cccaggctcc tactccggcc 1440
aagcagtctc aggccgatct gcagcgtctc caaaacggtt cgaatatctg cattcggtca 1500
tag 1503
<210> 76
<211> 984
<212> DNA
<213> 人工序列()
<220>
<223> GGS CpO用于解脂耶氏酵母
<400> 76
atggattata acagcgcgga tttcaaggag atctggggca aggccgccga caccgcgctg 60
ctgggaccgt acaactacct cgccaacaac cggggccaca acatcagaga acacttgatc 120
gcagcgttcg gagcggttat caaggtggac aagagcgatc tcgaaaccat ttcgcacatc 180
accaagattt tgcataactc gtcgctgctt gttgatgacg tggaagacaa ctcgatgctc 240
cgacgaggcc tgccggcagc ccattgtctg tttggagtcc cccaaaccat caactccgcc 300
aactacatgt actttgtggc tctgcaggag gtgctcaagc tcaagtctta tgatgccgtc 360
tccattttca ccgaggaaat gatcaacttg catagaggtc agggtatgga tctctactgg 420
agagaaacac tcacttgccc ctcggaagac gagtatctgg agatggtggt gcacaagacc 480
ggaggactgt ttcggctggc tctgagactt atgctgtcgg tggcatcgaa acaggaggac 540
catgaaaaga tcaactttga tctcacacac cttaccgaca cactgggagt catttaccag 600
attctggatg attacctcaa cctgcagtcc acggaattga ccgagaacaa gggattctgc 660
gaagatatca gcgaaggaaa gttttcgttt ccgctgattc acagcatccg gaccaacccg 720
gataaccacg agattctcaa cattctcaaa cagcgaacaa gcgacgcttc actcaaaaag 780
tacgccgtgg actacatgag aacagaaacc aagagtttcg actactgcct caagagaatc 840
caggccatgt cactcaaggc aagttcgtac attgatgatc tcgcagcagc cggccacgat 900
gtctccaagt tgcgagccat tttgcattat tttgtgtcca cctctgactg tgaggagaga 960
aagtactttg aggatgcgca gtga 984
<210> 77
<211> 1446
<212> DNA
<213> 人工序列()
<220>
<223> UGT1 CpO用于解脂耶氏酵母
<400> 77
atggacgcca tggccaccac cgagaagaag ccccacgtca tcttcatccc cttccccgcc 60
cagtcccaca tcaaggccat gctcaagctc gcccagctcc tccaccacaa gggcctccag 120
atcacctttg tcaacaccga cttcatccac aaccagttcc tcgagtcctc cggcccccac 180
tgtctggacg gtgctcccgg tttccgattt gagactatcc ccgatggtgt ctcccactcc 240
cccgaggcct ccatccccat ccgagagtct ctgctccgat ccattgagac taacttcctc 300
gaccgattca ttgatctcgt caccaagctc cccgatcctc ccacctgtat catctccgac 360
ggtttcctgt ccgttttcac cattgatgct gccaagaagc tcggtatccc cgtcatgatg 420
tactggactc tggctgcctg tggtttcatg ggtttctacc acatccactc tctgatcgag 480
aagggctttg ctcctctcaa ggacgcctcc tacctcacca acggttacct cgacaccgtc 540
attgactggg tccccggtat ggagggtatc cgactcaagg acttccccct cgactggtcc 600
accgacctca acgacaaggt tctcatgttc accaccgagg ctccccagcg atcccacaag 660
gtttcccacc acatcttcca caccttcgac gagctcgagc cctccatcat caagactctg 720
tctctgcgat acaaccacat ctacaccatt ggccccctcc agctcctcct cgaccagatc 780
cccgaggaga agaagcagac cggtatcacc tctctgcacg gctactctct cgtcaaggaa 840
gagcccgagt gcttccagtg gctccagtcc aaggagccca actccgttgt ctacgtcaac 900
tttggctcca ccaccgtcat gtctctcgag gacatgaccg agtttggctg gggtctggcc 960
aactccaacc actacttcct gtggatcatc cgatccaacc tcgtcattgg cgagaacgcc 1020
gttctgcctc ccgagctcga ggagcacatc aagaagcgag gcttcattgc ctcttggtgc 1080
tcccaggaga aggttctcaa gcacccctcc gtcggtggtt tcctgaccca ctgcggctgg 1140
ggctccacca ttgagtctct gtccgctggt gtccccatga tctgctggcc ctactcctgg 1200
gaccagctca ccaactgccg atacatctgc aaggagtggg aggttggtct ggagatgggt 1260
accaaggtca agcgagatga ggtcaagcga ctcgtccagg agctcatggg cgagggtggt 1320
cacaagatgc gaaacaaggc caaggactgg aaggagaagg cccgaattgc cattgccccc 1380
aacggctctt cttctctcaa cattgacaag atggtcaagg agatcactgt tctcgctcga 1440
aactaa 1446
<210> 78
<211> 1383
<212> DNA
<213> 人工序列()
<220>
<223> UGT3 CpO用于解脂耶氏酵母
<400> 78
atggccgagc agcagaagat caagaagtct ccccacgttc tgctcatccc cttccctctg 60
cagggccaca tcaacccctt catccagttc ggcaagcgac tcatctccaa gggtgtcaag 120
accactctgg tcaccaccat ccacaccctc aactccactc tcaaccactc caacaccacc 180
accacctcca tcgagatcca ggccatctcc gacggctgtg acgagggtgg tttcatgtct 240
gctggtgagt cttacctcga gactttcaag caggtcggtt ccaagtctct ggctgacctc 300
atcaagaagc tccagtccga gggtaccacc attgacgcca tcatctacga ctccatgacc 360
gagtgggttc tcgatgtcgc catcgagttt ggtattgacg gtggctcctt cttcacccag 420
gcctgtgtcg tcaactctct ctactaccac gtccacaagg gtctgatctc tctgcccctc 480
ggcgagactg tctccgtccc cggtttcccc gttctgcagc gatgggagac tcctctcatt 540
ctccagaacc acgagcagat ccagtccccc tggtcccaga tgctcttcgg ccagttcgcc 600
aacattgacc aggcccgatg ggttttcacc aactccttct acaagctcga ggaagaggtc 660
attgagtgga cccgaaagat ctggaacctc aaggtcattg gccccaccct cccctccatg 720
tacctcgaca agcgactcga tgacgacaag gacaacggtt tcaacctcta caaggccaac 780
caccacgagt gcatgaactg gctcgacgac aagcccaagg agtccgttgt ctacgttgcc 840
tttggctctc tggtcaagca cggccccgag caggttgagg agatcacccg agctctgatt 900
gactccgatg tcaacttcct gtgggtcatc aagcacaagg aagagggtaa gctccccgag 960
aacctgtccg aggtcatcaa gaccggcaag ggcctcattg ttgcctggtg caagcagctc 1020
gacgttctcg cccacgagtc cgtcggctgc tttgtcaccc actgcggttt caactccacc 1080
ctcgaggcta tctctctcgg tgtccccgtt gttgccatgc cccagttctc cgaccagacc 1140
accaacgcca agctcctcga tgagattctc ggtgtcggtg tccgagtcaa ggctgacgag 1200
aacggtattg tccgacgagg taacctggct tcttgtatca agatgatcat ggaggaagag 1260
cgaggtgtca tcatccgaaa gaacgccgtc aagtggaagg atctggccaa ggttgctgtc 1320
cacgagggtg gctcttccga caacgacatt gtcgagtttg tctccgagct catcaaggcc 1380
taa 1383
<210> 79
<211> 1377
<212> DNA
<213> 人工序列()
<220>
<223> UGT4 CpO用于解脂耶氏酵母
<400> 79
atggagaaca agaccgagac taccgtccga cgacgacgac gaatcattct cttccccgtc 60
cccttccagg gccacatcaa ccccattctg cagctcgcca acgttctgta ctccaagggc 120
ttctccatca ccatcttcca caccaacttc aacaagccca agacctccaa ctacccccac 180
ttcactttcc gattcatcct cgacaacgac ccccaggacg agcgaatctc caacctgccc 240
acccacggtc ctctggctgg tatgcgaatc cccatcatca acgagcacgg tgctgacgag 300
ctccgacgag agctcgagct gctcatgctc gcctccgaag aggacgagga agtctcctgt 360
ctgatcaccg atgctctgtg gtactttgcc cagtccgtcg ccgactctct caacctgcga 420
cgactcgttc tcatgacctc ctctctgttc aacttccacg cccacgtttc tctgccccag 480
tttgacgagc tcggttacct cgaccccgat gacaagaccc gactcgagga gcaggcttcc 540
ggtttcccca tgctcaaggt caaggacatc aagtccgcct actccaactg gcagattctc 600
aaggagattc tcggcaagat gatcaagcag accaaggcct cctccggtgt catctggaac 660
tccttcaagg agctcgagga gtccgagctc gagactgtca tccgagagat ccccgctccc 720
tctttcctca tccccctgcc caagcacctc accgcttcct cctcttctct gctcgaccac 780
gaccgaaccg tctttcagtg gctcgaccag cagccccctt cctccgtcct ctacgtttcc 840
ttcggctcca cctccgaggt cgacgagaag gacttcctcg agattgctcg aggcctcgtt 900
gactccaagc agtccttcct gtgggttgtc cgacccggct ttgtcaaggg ctccacctgg 960
gttgagcccc tgcccgatgg tttcctcggt gagcgaggcc gaattgtcaa gtgggtcccc 1020
cagcaggaag ttctggccca cggtgccatt ggtgccttct ggacccactc cggctggaac 1080
tccactctcg agtccgtctg cgagggtgtc cccatgatct tctccgactt tggcctcgac 1140
cagcccctca acgcccgata catgtccgat gttctcaagg tcggtgtcta cctcgagaac 1200
ggctgggagc gaggtgagat tgccaacgcc atccgacgag tcatggtcga cgaggaaggt 1260
gagtacatcc gacagaacgc ccgagtcctc aagcagaagg ccgatgtctc tctcatgaag 1320
ggtggttctt cttacgagtc tctcgagtct ctcgtttcct acatctcttc tttgtaa 1377
<210> 80
<211> 2232
<212> DNA
<213> 人工序列()
<220>
<223> tCPS_SR CpO用于解脂耶氏酵母
<400> 80
atgtgcaagg ctgtttccaa ggagtactcc gatctgctcc agaaggacga ggcctctttc 60
accaagtggg acgacgacaa ggtcaaggac cacctcgaca ccaacaagaa cctctacccc 120
aacgacgaga tcaaggagtt tgtcgagtcc gtcaaggcca tgttcggctc catgaacgac 180
ggcgagatta atgtctctgc ttacgacacc gcctgggttg ctctggtcca ggatgtcgac 240
ggttccggct ctcctcagtt cccttcctct ctcgagtgga tcgccaacaa ccagctgtcc 300
gacggttctt ggggtgacca cctgctcttc tctgctcacg accgaatcat caacaccctg 360
gcctgtgtca ttgctctgac ctcttggaac gtccacccct ccaagtgcga gaagggtctg 420
aacttcctcc gagagaacat ctgcaagctc gaggacgaga acgccgagca catgcccatt 480
ggcttcgagg tcaccttccc ctctctgatt gacattgcca agaagctcaa cattgaggtc 540
cccgaggaca cccccgctct caaggagatc tacgctcgac gagacatcaa gctcaccaag 600
atccccatgg aggttctcca caaggtcccc accactctcc tccactctct cgagggtatg 660
cccgatctcg agtgggagaa gctgctcaag ctgcagtgca aggacggctc tttcctcttc 720
tccccctctt ccactgcctt cgccctcatg cagaccaagg acgagaagtg tctccagtac 780
ctcaccaaca ttgtcaccaa gttcaacggt ggtgtcccca acgtctaccc cgttgacctc 840
tttgagcaca tctgggttgt tgaccgactc cagcgactcg gtatcgcccg atacttcaag 900
tccgagatca aggactgtgt cgagtacatc aacaagtact ggaccaagaa cggtatctgc 960
tgggcccgaa acacccacgt ccaggacatt gacgacaccg ccatgggctt ccgagttctg 1020
cgagcccacg gctacgatgt cacccccgat gtctttcgac agtttgagaa ggacggcaag 1080
tttgtctgtt tcgccggtca gtccacccag gccgtcaccg gtatgttcaa cgtctaccga 1140
gcttctcaga tgctcttccc cggtgagcga atcctcgagg acgccaagaa gttctcctac 1200
aactacctca aggagaagca gtccaccaac gagctgctcg acaagtggat cattgccaag 1260
gatctgcccg gtgaggttgg ctacgccctc gacatcccct ggtacgcctc tctgccccga 1320
ctggagactc gatactacct cgagcagtac ggtggtgagg acgatgtctg gatcggtaag 1380
accctgtacc gaatgggcta cgtttccaac aacacctacc tcgagatggc caagctcgac 1440
tacaacaact acgttgccgt cctccagctc gagtggtaca ccatccagca gtggtacgtc 1500
gacattggta tcgagaagtt cgagtccgac aacatcaagt ccgtccttgt ctcctactac 1560
ctcgctgctg cctccatctt cgagcccgag cgatccaagg agcgaattgc ctgggccaag 1620
accaccatcc tcgtcgacaa gatcacctcc atcttcgact cctcccagtc ctccaaggaa 1680
gatatcaccg ccttcattga caagttccga aacaagtcct cctccaagaa gcactccatc 1740
aacggcgagc cctggcacga ggtcatggtt gctctcaaga aaactctcca cggctttgcc 1800
ctcgacgctc tgatgaccca ctctcaggac atccaccccc agctccacca ggcctgggag 1860
atgtggctca ccaagctcca ggacggtgtt gatgtcactg ctgagctcat ggtccagatg 1920
atcaacatga ccgccggccg atgggtttcc aaggagctcc tcacccaccc ccagtaccag 1980
cgactctcca ctgtcaccaa ctctgtctgc cacgacatca ccaagctcca caacttcaag 2040
gagaactcca ccaccgtcga ctccaaggtc caggagctgg tccagctcgt tttctccgac 2100
acccccgatg atctcgacca ggacatgaag cagaccttcc tgactgtcat gaaaactttc 2160
tactacaagg cctggtgcga ccccaacacc atcaacgacc acatctccaa ggtctttgag 2220
attgtgattt aa 2232
<210> 81
<211> 2274
<212> DNA
<213> 人工序列()
<220>
<223> tKS-SR CpO用于解脂耶氏酵母
<400> 81
atgacctccc acggcggcca gaccaacccc accaacctca tcattgacac caccaaggag 60
cgaatccaga agcagttcaa gaacgtcgag atctccgttt cctcctacga caccgcctgg 120
gtcgccatgg tcccctctcc caactccccc aagtctccct gcttccccga gtgtctcaac 180
tggctcatca acaaccagct caacgacggc tcttggggtc tggtcaacca cacccacaac 240
cacaaccacc ccctcctcaa ggactctctc tcttccactc tcgcctgcat tgttgctctc 300
aagcgatgga acgttggcga ggaccagatc aacaagggtc tgtctttcat tgagtccaac 360
ctcgcctccg ccaccgagaa gtcccagccc tcccccattg gctttgatat catcttcccc 420
ggtctgctcg agtacgccaa gaacctcgat atcaacctgc tctccaagca gaccgacttc 480
tctctcatgc tgcacaagcg agagctcgag cagaagcgat gccactccaa cgagatggac 540
ggctacctgg cctacatttc cgagggtctg ggtaacctct acgactggaa catggtcaag 600
aagtaccaga tgaagaacgg ttccgttttc aactccccct ctgccaccgc tgctgccttc 660
atcaaccacc agaaccccgg ctgtctcaac tacctcaact ctctgctcga caagtttggt 720
aacgccgtcc ccactgtcta cccccacgat ctcttcatcc gactctccat ggtcgacacc 780
attgagcgac tcggtatttc ccaccacttc cgagtcgaga tcaagaacgt tctcgatgag 840
acttaccgat gctgggttga gcgagatgag cagatcttca tggacgttgt cacctgtgct 900
ctggccttcc gactcctccg aatcaacggt tacgaggttt cccccgaccc cctcgccgag 960
atcaccaacg agctggctct caaggacgag tacgccgccc tcgagactta ccacgcttct 1020
cacattctgt accaagagga tctgtcctcc ggcaagcaga ttctcaagtc cgccgacttc 1080
ctcaaggaga tcatctccac tgactccaac cgactctcca agctcatcca caaggaagtc 1140
gagaacgctc tcaagttccc catcaacacc ggtctggagc gaatcaacac ccgacgaaac 1200
atccagctct acaacgtcga caacacccga attctcaaga ccacctacca ctcttccaac 1260
atctccaaca ccgactacct gcgactcgcc gtcgaggact tctacacctg ccagtccatc 1320
taccgagagg agctcaaggg tctggagcga tgggttgtcg agaacaagct cgaccagctc 1380
aagtttgccc gacaaaagac tgcctactgc tacttctccg ttgctgccac cctctcttct 1440
cccgagctct ccgacgcccg aatctcttgg gccaagaacg gtatcctgac cactgttgtc 1500
gacgacttct ttgacattgg tggcaccatt gacgagctga ccaacctcat ccagtgcgtc 1560
gagaagtgga acgtcgacgt tgacaaggac tgttgttccg agcacgtccg aatcctcttc 1620
ctggctctca aggacgccat ctgctggatc ggtgacgagg ccttcaagtg gcaggctcga 1680
gatgtcactt cccacgtcat ccagacctgg ctcgagctca tgaactccat gctgcgagag 1740
gccatctgga cccgagatgc ctacgtcccc accctcaacg agtacatgga gaacgcctac 1800
gtcagctttg ctctcggtcc cattgtcaag cccgccatct actttgtcgg tcccaagctg 1860
tccgaggaga ttgtcgagtc ctccgagtac cacaacctct tcaagctcat gtccacccag 1920
ggccgactcc tcaacgatat ccactccttc aagcgagagt tcaaggaagg taagctcaac 1980
gccgttgctc tgcacctgtc caacggtgag tccggcaagg tcgaggaaga ggtcgtcgag 2040
gagatgatga tgatgatcaa gaacaagcga aaggagctca tgaagctcat cttcgaggag 2100
aacggctcca ttgtcccccg agcctgcaag gacgccttct ggaacatgtg ccacgtcctc 2160
aacttcttct acgccaacga cgacggtttc accggcaaca ccattctcga caccgtcaag 2220
gacatcatct acaaccctct ggttctggtc aacgagaacg aggagcagag gtaa 2274
<210> 82
<211> 1578
<212> DNA
<213> 人工序列()
<220>
<223> KAH_4 CpO用于解脂耶氏酵母
<400> 82
atggagtctc tggttgtcca caccgtcaac gccatctggt gcattgtcat tgtcggtatc 60
ttctccgtcg gctaccacgt ctacggccga gctgttgtcg agcagtggcg aatgcgacga 120
tctctcaagc tccagggtgt caagggtcct cctccctcca tcttcaacgg taacgtttcc 180
gagatgcagc gaatccagtc cgaggccaag cactgctccg gtgacaacat catctcccac 240
gactactctt cttctctgtt cccccacttt gaccactggc gaaagcagta cggccgaatc 300
tacacctact ccactggcct caagcagcac ctctacatca accaccccga gatggtcaag 360
gagctctccc agaccaacac cctcaacctc ggccgaatca cccacatcac caagcgactc 420
aaccccattc tcggtaacgg tatcatcacc tccaacggcc cccactgggc ccaccagcga 480
cgaatcattg cctacgagtt cacccacgac aagatcaagg gtatggtcgg tctgatggtc 540
gagtccgcca tgcccatgct caacaagtgg gaggagatgg tcaagcgagg tggtgagatg 600
ggctgtgaca tccgagtcga cgaggacctc aaggatgtct ccgctgacgt cattgccaag 660
gcctgtttcg gctcttcctt ctccaagggc aaggccatct tctccatgat ccgagatctg 720
ctcaccgcca tcaccaagcg atccgtcctc ttccgattca acggtttcac cgacatggtt 780
ttcggctcca agaagcacgg tgacgttgac attgacgctc tcgagatgga gctcgagtcc 840
tccatctggg agactgtcaa ggagcgagag attgagtgca aggacaccca caagaaggac 900
ctcatgcagc tcattctcga gggtgccatg cgatcttgtg acggtaacct gtgggacaag 960
tctgcttacc gacgattcgt tgtcgacaac tgcaagtcca tctactttgc cggccacgac 1020
tccaccgccg tttccgtttc ttggtgcctc atgctgctcg ctctcaaccc ctcttggcag 1080
gtcaagatcc gagatgagat tctgtcctcc tgcaagaacg gtatccccga cgccgagtcc 1140
atccccaacc tcaagaccgt caccatggtc atccaggaga ctatgcgact ctaccctccc 1200
gctcccattg tcggccgaga ggcctccaag gacattcgac tcggtgatct ggttgtcccc 1260
aagggtgtct gtatctggac cctcatcccc gctctgcacc gagatcccga gatctggggt 1320
cccgacgcca acgacttcaa gcccgagcga ttctccgagg gtatctccaa ggcctgcaag 1380
tacccccagt cctacatccc ctttggcctc ggcccccgaa cctgtgtcgg caagaacttt 1440
ggtatgatgg aggtcaaggt cctcgtttct ctgattgtct ccaagttctc cttcactctg 1500
tctcccacct accagcactc tccctcccac aagctgctcg tcgagcccca gcacggtgtt 1560
gtcatccgag ttgtataa 1578
<210> 83
<211> 1578
<212> DNA
<213> 人工序列()
<220>
<223> KO_Gib CpO用于解脂耶氏酵母
<400> 83
atgtccaagt ccaactccat gaactccacc tcccacgaga ctctcttcca gcagctcgtt 60
ctcggcctcg accgaatgcc cctcatggac gtccactggc tcatctacgt tgcctttggt 120
gcctggctct gctcctacgt catccacgtt ctgtcctctt cctccactgt caaggtcccc 180
gtcgtcggtt accgatccgt tttcgagccc acctggctcc tccgactgcg attcgtctgg 240
gagggtggtt ccatcattgg ccagggctac aacaagttca aggactccat cttccaggtc 300
cgaaagctcg gtaccgacat tgtcatcatc cctcccaact acattgacga ggtccgaaag 360
ctctcccagg acaagacccg atccgtcgag cccttcatca acgactttgc cggccagtac 420
acccgaggta tggtctttct gcagtccgat ctccagaacc gagtcatcca gcagcgactc 480
acccccaagc ttgtctctct caccaaggtc atgaaggaag agctcgacta cgctctgacc 540
aaggagatgc ccgacatgaa gaacgacgag tgggttgagg tcgacatctc ttccatcatg 600
gtccgactca tctctcgaat ctccgcccga gttttcctcg gccccgagca ctgccgaaac 660
caggagtggc tcaccaccac cgccgagtac tccgagtctc tcttcatcac cggcttcatc 720
ctccgagttg tcccccacat tctccgaccc ttcattgctc ctctgctgcc ctcttaccga 780
accctgctgc gaaacgtttc ttccggccga cgagtcattg gtgatatcat ccgatcccag 840
cagggtgacg gtaacgagga catcctctct tggatgcgag atgctgccac tggtgaggag 900
aagcagatcg acaacattgc ccagcgaatg ctcattctgt ctctcgcctc catccacacc 960
accgccatga ccatgaccca cgccatgtac gatctgtgtg cctgccccga gtacattgag 1020
cccctccgag atgaggtcaa gtccgtcgtt ggtgcttctg gctgggacaa gaccgctctc 1080
aaccgattcc acaagctcga ctctttcctc aaggagtccc agcgattcaa ccccgttttc 1140
ctgctcacct tcaaccgaat ctaccaccag tccatgaccc tctccgatgg taccaacatc 1200
ccctccggta cccgaattgc tgtcccctct cacgccatgc tccaggactc cgcccacgtc 1260
cccggtccca ctcctcccac tgagttcgac ggtttccgat actccaagat ccgatccgac 1320
tccaactacg cccagaagta cctcttctcc atgaccgact cttccaacat ggcctttggc 1380
tacggtaagt acgcctgccc cggccgattc tacgcctcca acgagatgaa gctgactctg 1440
gccattctgc tcctccagtt tgagttcaag ctccccgacg gtaagggccg accccgaaac 1500
atcaccatcg actccgacat gatccccgac ccccgagctc gactctgtgt ccgaaagcga 1560
tctctgcgtg acgagtaa 1578
<210> 84
<211> 2133
<212> DNA
<213> 人工序列()
<220>
<223> CPR_3 CpO用于解脂耶氏酵母
<400> 84
atgtcctcct cttcttcttc ttccacctcc atgattgatc tcatggctgc catcatcaag 60
ggtgagcccg tcattgtctc cgaccccgcc aacgcctccg cctacgagtc cgttgctgcc 120
gagctgtcct ccatgctcat cgagaaccga cagtttgcca tgatcgtcac cacctccatt 180
gctgttctca ttggctgcat tgtcatgctc gtctggcgac gatctggctc cggtaactcc 240
aagcgagtcg agcccctcaa gcccctggtc atcaagcccc gagaagagga gatcgacgac 300
ggccgaaaga aggtcaccat cttctttggc acccagaccg gtactgctga gggcttcgcc 360
aaggctctcg gtgaggaagc caaggctcga tacgaaaaga cccgattcaa gattgtcgac 420
ctcgatgatt acgctgccga tgacgacgag tacgaggaga agctcaagaa agaggacgtt 480
gccttcttct tcctcgccac ctacggtgac ggtgagccca ccgacaacgc tgcccgattc 540
tacaagtggt tcaccgaggg taacgaccga ggcgagtggc tcaagaacct caagtacggt 600
gttttcggtc tgggcaaccg acagtacgag cacttcaaca aggttgccaa ggttgtcgac 660
gacatcctcg tcgagcaggg tgcccagcga ctcgtccagg tcggcctcgg tgatgatgac 720
cagtgcatcg aggacgactt cactgcctgg cgagaggctc tgtggcccga gctcgacacc 780
attctgcgag aggaaggtga caccgccgtt gccaccccct acaccgccgc cgtcctcgag 840
taccgagtct ccatccacga ctccgaggat gccaagttca acgacatcaa catggccaac 900
ggtaacggct acaccgtctt tgacgcccag cacccctaca aggccaacgt cgccgtcaag 960
cgagagctcc acacccccga gtccgaccga tcttgtatcc acctcgagtt tgacattgct 1020
ggttccggtc tgacctacga gactggtgac cacgttggtg tcctctgtga caacctgtcc 1080
gagactgtcg acgaggctct gcgactcctc gacatgtccc ccgacactta cttctctctg 1140
cacgccgaga aagaggacgg tactcccatc tcttcttctc tgccccctcc cttccctccc 1200
tgcaacctgc gaaccgctct gacccgatac gcctgcctcc tctcttctcc caagaagtct 1260
gctctcgttg ctctggccgc ccacgcctcc gaccccaccg aggctgagcg actcaagcac 1320
ctcgcctctc ccgctggcaa ggacgagtac tccaagtggg ttgtcgagtc ccagcgatct 1380
ctgctcgagg tcatggccga gttcccctcc gccaagcccc ctctcggtgt tttcttcgcc 1440
ggtgttgctc cccgactcca gccccgattc tactccatct cctcttcccc caagatcgcc 1500
gagactcgaa tccacgttac ctgtgctctg gtctacgaga agatgcccac cggccgaatc 1560
cacaagggtg tctgctccac ctggatgaag aacgccgttc cctacgagaa gtccgagaac 1620
tgttcctctg ctcccatctt tgtccgacag tccaacttca agctcccctc cgactccaag 1680
gtccccatca tcatgattgg ccccggtacc ggcctcgccc ccttccgagg cttcctgcag 1740
gagcgactcg ccctcgtcga gtccggtgtc gagctcggcc cctccgtcct cttctttggc 1800
tgccgaaacc gacgaatgga cttcatctac gaagaggagc tccagcgatt cgtcgagtcc 1860
ggtgctctcg ccgagctctc cgttgccttc tcccgagagg gtcccaccaa ggagtacgtc 1920
cagcacaaga tgatggacaa ggcctccgac atctggaaca tgatctccca gggcgcctac 1980
ctctacgtct gcggtgacgc caagggtatg gcccgagatg tccaccgatc tctgcacacc 2040
attgcccagg agcagggctc catggactcc accaaggccg agggtttcgt caagaacctc 2100
cagacctccg gccgatacct ccgagatgtc tgg 2133

Claims (20)

1. 一种能够产生甜菊醇糖苷的重组宿主,其包含编码多肽的重组核酸序列,所述多肽的氨基酸序列为在SEQ ID NO: 25中列出的氨基酸序列,且所述多肽具有与SEQ ID NO: 27中列出的氨基酸序列所示的多肽相比改善的UGT2活性,所述改善的UGT2活性导致产生更高量的甜菊醇糖苷。
2.根据权利要求1所述的重组宿主,其包含一个或更多个重组核苷酸序列,所述重组核苷酸序列编码:
具有对映-柯巴基焦磷酸合酶活性的多肽;
具有对映-贝壳杉烯合酶活性的多肽;
具有对映-贝壳杉烯氧化酶活性的多肽;以及
具有贝壳杉烯酸13-羟化酶活性的多肽。
3.根据权利要求1或2所述的重组宿主,其包含重组核酸序列,所述重组核酸序列编码具有NADPH-细胞色素p450还原酶活性的多肽。
4.根据权利要求1或2所述的重组宿主,其包含编码以下中的一种或更多种的重组核酸序列:
(i)具有UGT74G1(UGT3)活性的多肽;
(ii)具有UGT85C2(UGT1)活性的多肽;以及
(iii)具有UGT76G1(UGT4)活性的多肽。
5.根据权利要求1或2所述的重组宿主,其包含重组核酸序列,所述重组核酸序列编码具有UGT2活性的额外多肽。
6.根据权利要求1或2所述的重组宿主,其中所述宿主属于以下属中的一种:酵母属(Saccharomyces)、曲霉属(Aspergillus)、毕赤酵母属(Pichia)、克鲁维酵母属(Kluyveromyces)、假丝酵母属(Candida)、汉逊酵母属(Hansenula)、腐质霉属(Humicola)、伊萨酵母属(Issatchenkia)、毛孢子菌属(Trichosporon)、酒香酵母属(Brettanomyces)、管囊酵母属(Pachysolen)、耶氏酵母属(Yarrowia)、Yamadazyma或埃希氏杆菌属(Escherichia)。
7. 根据权利要求6所述的重组宿主,其中所述重组宿主是酿酒酵母(Saccharomyces cerevisiae)细胞、解脂耶氏酵母(Yarrowia lipolitica)细胞、克鲁斯假丝酵母(Candida krusei)细胞、东方伊萨酵母(Issatchenkia orientalis)细胞或大肠杆菌(Escherichia coli)细胞。
8.根据权利要求1或2所述的重组宿主,其中所述宿主产生香叶基香叶基二磷酸(GGPP)的能力被上调。
9.根据权利要求1或2所述的重组宿主,其包含一个或更多个重组核酸序列,所述重组核酸序列编码羟甲基戊二酰基-辅酶A还原酶、法尼基-焦磷酸合成酶和香叶基香叶基二磷酸合酶。
10.根据权利要求1或2所述的重组宿主,其包含编码以下中的一种或更多种的核酸序列:
具有羟甲基戊二酰基-辅酶A还原酶活性的多肽;
具有法尼基-焦磷酸合成酶活性的多肽;
具有香叶基香叶基二磷酸合酶活性的多肽。
11.一种用于制备糖基化二萜的方法,所述方法包括在合适的发酵培养基中发酵根据权利要求1至10中任一项所述的重组宿主,并且任选地回收所述糖基化二萜。
12.根据权利要求11所述的方法,其用于制备糖基化二萜,其中所述方法以工业规模进行。
13.一种用于将第一糖基化二萜转化为第二糖基化二萜的方法,所述方法包括:
使所述第一糖基化二萜与根据权利要求1至10中任一项所述的重组宿主、源自这种重组宿主的无细胞提取物接触;
从而将所述第一糖基化二萜转化为所述第二糖基化二萜。
14.根据权利要求13所述的方法,其中所述第二糖基化二萜是甜菊醇-19-双糖苷、甜菊双糖苷、甜菊苷、RebE、RebD或13-((β-D-吡喃葡萄糖基)氧基)贝壳杉-16-烯-18-酸2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基酯。
15.根据权利要求14所述的方法,其中所述第一糖基化二萜是甜菊醇-13-单糖苷、甜菊醇-19-单糖苷、甜茶苷、甜菊苷、莱鲍迪甙A或13-((β-D-吡喃葡萄糖基)氧基)贝壳杉-16-烯-18-酸2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基酯,并且所述第二糖基化二萜是甜菊醇-19-双糖苷、甜菊双糖苷、甜菊苷、RebE、RebD或13-((β-D-吡喃葡萄糖基)氧基)贝壳杉-16-烯-18-酸2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基酯。
16. 一种具有UGT2活性的多肽,其氨基酸序列为在SEQ ID NO: 25中列出的氨基酸序列,且所述多肽具有与SEQ ID NO: 27中列出的氨基酸序列所示的多肽相比改善的UGT2活性,所述改善的UGT2活性导致更高量的甜菊醇糖苷的产生。
17.一种多核苷酸序列,其编码根据权利要求16所述的多肽。
18.一种核酸构建体,其包含权利要求17所述的多核苷酸序列。
19.根据权利要求18所述的核酸构建体,其是表达载体,其中根据权利要求17所述的多核苷酸序列与至少一个用于在宿主细胞中表达所述多核苷酸序列的控制序列可操作地连接。
20. 一种产生权利要求16所述的多肽的方法,所述方法包括:
(a)在有利于通过根据权利要求1所述的宿主细胞产生所述多肽的条件下培养所述宿主细胞,并且任选地
(b)回收所述多肽。
CN201680016548.2A 2015-03-16 2016-03-16 Udp-糖基转移酶 Active CN107567492B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211152188.2A CN115851470A (zh) 2015-03-16 2016-03-16 Udp-糖基转移酶

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562133606P 2015-03-16 2015-03-16
US62/133,606 2015-03-16
PCT/EP2016/055734 WO2016146711A1 (en) 2015-03-16 2016-03-16 Udp-glycosyltransferases

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202211152188.2A Division CN115851470A (zh) 2015-03-16 2016-03-16 Udp-糖基转移酶

Publications (2)

Publication Number Publication Date
CN107567492A CN107567492A (zh) 2018-01-09
CN107567492B true CN107567492B (zh) 2022-10-14

Family

ID=55586296

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202211152188.2A Pending CN115851470A (zh) 2015-03-16 2016-03-16 Udp-糖基转移酶
CN201680016548.2A Active CN107567492B (zh) 2015-03-16 2016-03-16 Udp-糖基转移酶

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202211152188.2A Pending CN115851470A (zh) 2015-03-16 2016-03-16 Udp-糖基转移酶

Country Status (6)

Country Link
US (3) US10604743B2 (zh)
EP (2) EP3271457B1 (zh)
CN (2) CN115851470A (zh)
BR (1) BR112017019625A2 (zh)
CA (1) CA2979931A1 (zh)
WO (1) WO2016146711A1 (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2954058B1 (en) 2013-02-06 2021-03-31 Evolva SA Methods for improved production of rebaudioside d and rebaudioside m
AU2014273055A1 (en) * 2013-05-31 2015-12-17 Dsm Ip Assets B.V. Microorganisms for diterpene production
CN107109358B (zh) 2014-09-09 2022-08-02 埃沃尔瓦公司 在重组宿主中生产甜菊醇糖苷
WO2016120486A1 (en) 2015-01-30 2016-08-04 Evolva Sa Production of steviol glycosides in recombinant hosts
WO2016146711A1 (en) * 2015-03-16 2016-09-22 Dsm Ip Assets B.V. Udp-glycosyltransferases
WO2017178632A1 (en) 2016-04-13 2017-10-19 Evolva Sa Production of steviol glycosides in recombinant hosts
US11299723B2 (en) 2016-06-15 2022-04-12 Codexis, Inc. Engineered beta-glucosidases and glucosylation methods
US11396669B2 (en) 2016-11-07 2022-07-26 Evolva Sa Production of steviol glycosides in recombinant hosts
CN110914445B (zh) 2017-02-03 2024-08-27 泰莱解决方案美国有限责任公司 工程化糖基转移酶和甜菊醇糖苷葡糖基化方法
WO2018224698A1 (en) 2017-08-23 2018-12-13 Dsm Ip Assets B.V. Yoghurt comprising rebaudioside m
WO2019211230A1 (en) 2018-04-30 2019-11-07 Dsm Ip Assets B.V. Steviol glycoside transport
CN109517830A (zh) * 2018-12-06 2019-03-26 江苏师范大学 大戟二萜类化合物合成基因cyp71d452、其编码的蛋白质与应用
AU2021367159A1 (en) 2020-10-22 2023-05-04 Cargill, Incorporated Microorganisms for diterpene production
CN115094074B (zh) * 2022-06-28 2024-02-27 诸城市浩天药业有限公司 双功能udp-糖基转移酶及其应用

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014191580A1 (en) * 2013-05-31 2014-12-04 Dsm Ip Assets B.V. Extracellular diterpene production
CN104203005A (zh) * 2012-01-23 2014-12-10 帝斯曼知识产权资产管理有限公司 二萜的生产
WO2015014969A1 (en) * 2013-07-31 2015-02-05 Dsm Ip Assets B.V. Steviol glycosides

Family Cites Families (158)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58149697A (ja) 1982-02-27 1983-09-06 Dainippon Ink & Chem Inc β−1,3グリコシルステビオシドの製造方法
US5484956A (en) 1990-01-22 1996-01-16 Dekalb Genetics Corporation Fertile transgenic Zea mays plant comprising heterologous DNA encoding Bacillus thuringiensis endotoxin
US6946587B1 (en) 1990-01-22 2005-09-20 Dekalb Genetics Corporation Method for preparing fertile transgenic corn plants
JPH03277275A (ja) 1990-03-28 1991-12-09 Dainippon Ink & Chem Inc 新規酵素及びその酵素を用いた配糖体の製造方法
US5204253A (en) 1990-05-29 1993-04-20 E. I. Du Pont De Nemours And Company Method and apparatus for introducing biological substances into living cells
US5306862A (en) 1990-10-12 1994-04-26 Amoco Corporation Method and composition for increasing sterol accumulation in higher plants
US5460949A (en) 1990-11-15 1995-10-24 Amoco Corporation Method and composition for increasing the accumulation of squalene and specific sterols in yeast
US5712112A (en) 1992-11-04 1998-01-27 National Science Council Of R.O.C. Gene expression system comprising the promoter region of the alpha-amylase genes
CN1129953A (zh) 1993-07-15 1996-08-28 尼奥斯药品公司 糖组分的合成方法
ES2198410T3 (es) 1993-07-23 2004-02-01 Dsm Ip Assets B.V. Cepas recombinantes de hongos filamentosos libres de gen marcador de seleccion: un metodo para obtener dichas cepas y su utilizacion.
US7186891B1 (en) 1996-04-12 2007-03-06 University Of Kentucky, Research Foundation Plant cells and plants expressing chimeric isoprenoid synthases
JPH101408A (ja) 1996-06-14 1998-01-06 Showa Yakuhin Kako Kk 歯科用接着剤
JPH10117776A (ja) 1996-10-22 1998-05-12 Japan Tobacco Inc インディカイネの形質転換方法
PL336345A1 (en) 1997-04-11 2000-06-19 Dsm Nv Genic conversion as a tool for constructing recombined filiform fungi
US6255557B1 (en) 1998-03-31 2001-07-03 Her Majesty The Queen In Right Of Canada As Represented By The Ministerof Agriculture And Agri-Food Canada Stevia rebaudiana with altered steviol glycoside composition
KR100657388B1 (ko) 1998-04-14 2006-12-13 교와 학꼬 고교 가부시키가이샤 미생물에 의한 이소프레노이드 화합물의 제조 방법
TWI250210B (en) 1998-05-06 2006-03-01 Dsm Ip Assets Bv An isolated DNA sequence coding for an enzyme involved in the mevalonate pathway or the pathway from isopentenyl pyrophosphate to farnesyl pyrophosphate
EP0955363A3 (en) 1998-05-06 2004-01-28 F. Hoffmann-La Roche Ag Dna sequences encoding enzymes involved in production of isoprenoids
ID27054A (id) 1998-05-19 2001-02-22 Dsm Nv Perbaikan produksi sepalosporin di dalam organisme yang hidup
DE69943009D1 (de) 1998-07-06 2011-01-13 Dcv Inc Verfahren zur vitaminherstellung
US6531303B1 (en) 1998-07-06 2003-03-11 Arkion Life Sciences Llc Method of producing geranylgeraniol
AR021636A1 (es) 1998-12-17 2002-07-31 Rubicon Forests Holdings Ltd Materiales y metodos para la modificacion del contenido, la composicion y el metabolismo de los isoprenoides
EP1141372A2 (en) 1998-12-22 2001-10-10 Dsm N.V. Improved in vivo production of cephalosporins
WO2000037663A2 (en) 1998-12-23 2000-06-29 The Samuel Roberts Noble Foundation, Inc. Plant transformation process
AU776316B2 (en) 1999-04-15 2004-09-02 Monsanto Company Nucleic acid sequences to proteins involved in tocopherol synthesis
AU4365200A (en) 1999-04-21 2000-11-02 Samuel Roberts Noble Foundation, Inc., The Plant transformation process
AU6280300A (en) 1999-08-04 2001-03-05 Adelbert Bacher Isoprenoid biosynthesis
AU6780700A (en) 1999-08-18 2001-03-13 Paradigm Genetics, Inc. Methods and apparatus for transformation of monocotyledenous plants using agrobacterium in combination with vacuum filtration
WO2001083769A2 (en) 2000-05-03 2001-11-08 The Salk Institute For Biological Studies Crystallization of 4-diphosphocytidyl-2-c-methylerythritol synthesis
DE10027821A1 (de) 2000-06-05 2001-12-06 Adelbert Bacher Der Mevalonat-unabhängige Isoprenoidbiosyntheseweg
EP2292776A1 (en) 2000-07-31 2011-03-09 Danisco US Inc. Manipulation of genes of the mevalonate and isoprenoid pathways to create novel traits in transgenic organisms
AU8681101A (en) 2000-08-24 2002-03-04 Scripps Research Inst Stress-regulated genes of plants, transgenic plants containing same, and methodsof use
US6689601B2 (en) 2000-09-01 2004-02-10 E. I. Du Pont De Nemours And Company High growth methanotropic bacterial strain
US6660507B2 (en) 2000-09-01 2003-12-09 E. I. Du Pont De Nemours And Company Genes involved in isoprenoid compound production
US6818424B2 (en) 2000-09-01 2004-11-16 E. I. Du Pont De Nemours And Company Production of cyclic terpenoids
AU2001291114A1 (en) 2000-09-19 2002-04-02 Microbia, Inc. Modulation of secondary metabolite production by zinc binuclear cluster proteins
AU2001296359B2 (en) 2000-09-29 2006-04-27 Cargill Incorporated Isoprenoid production
US6949362B2 (en) 2000-12-12 2005-09-27 E. I. Du Pont De Nemours And Company Rhodococcus cloning and expression vectors
WO2002059297A2 (en) 2001-01-25 2002-08-01 Evolva Biotech A/S A library of a collection of cells
US20050003474A1 (en) 2001-01-26 2005-01-06 Desouza Mervyn L. Carotenoid biosynthesis
US20040078846A1 (en) 2002-01-25 2004-04-22 Desouza Mervyn L. Carotenoid biosynthesis
DE10201458A1 (de) 2001-04-11 2002-10-17 Adelbert Bacher Intermediate und Enzyme des Mevalonat-unabhängigen Isoprenoidbiosyntheseweg
US7034140B2 (en) 2001-04-24 2006-04-25 E.I. Du Pont De Nemours And Company Genes involved in isoprenoid compound production
DE60228439D1 (de) 2001-06-06 2008-10-02 Dsm Ip Assets Bv Verbesserte isoprenoid herstellung
EP1402042A2 (en) 2001-06-22 2004-03-31 Syngenta Participations AG Abiotic stress responsive polynucleotides and polypeptides
NZ513755A (en) 2001-08-24 2001-09-28 Ann Rachel Holmes Protein expression system in yeast comprising a vector encoding a heterologous membrane protein and its application in screening for drugs
US20040072311A1 (en) 2001-08-28 2004-04-15 Dicosimo Deana J. Production of cyclic terpenoids
US20040010815A1 (en) 2001-09-26 2004-01-15 Lange B. Markus Identification and characterization of plant genes
US7172886B2 (en) 2001-12-06 2007-02-06 The Regents Of The University Of California Biosynthesis of isopentenyl pyrophosphate
DE60325457D1 (de) 2002-01-23 2009-02-05 Royal Nedalco B V Fermentation von pentosezuckern
SE0202090D0 (sv) 2002-05-08 2002-07-04 Forskarpatent I Syd Ab A modifierd yeast consuming L-arabinose
JP4392483B2 (ja) 2002-08-20 2010-01-06 サントリーホールディングス株式会社 新規糖転移酵素遺伝子
DE60320812D1 (en) 2002-09-27 2008-06-19 Dsm Ip Assets Bv Squalene synthase (sqs) gen
EP1626979B1 (en) 2003-05-02 2012-06-06 Cargill, Incorporated Genetically modified yeast species and fermentation processes using genetically modified yeast
US7098000B2 (en) 2003-06-04 2006-08-29 E. I. Du Pont De Nemoure And Company Method for production of C30-aldehyde carotenoids
KR101190897B1 (ko) 2003-06-12 2012-10-12 디에스엠 아이피 어셋츠 비.브이. 피드백 내성 메발로네이트 키나아제
US7569389B2 (en) 2004-09-30 2009-08-04 Ceres, Inc. Nucleotide sequences and polypeptides encoded thereby useful for modifying plant characteristics
US7183089B2 (en) 2004-05-21 2007-02-27 The Regents Of The University Of California Method for enhancing production of isoprenoid compounds
US20060014264A1 (en) 2004-07-13 2006-01-19 Stowers Institute For Medical Research Cre/lox system with lox sites having an extended spacer region
CN101052706B (zh) 2004-07-16 2015-02-18 帝斯曼知识产权资产管理有限公司 发酵木糖的真核细胞的代谢工程
JPWO2006016395A1 (ja) 2004-08-09 2008-05-01 国立大学法人東北大学 Udp−グルクロニル基転移酵素およびその遺伝子
KR101169824B1 (ko) 2004-08-19 2012-07-30 디에스엠 아이피 어셋츠 비.브이. 아이소프레노이드의 제조
US7923552B2 (en) 2004-10-18 2011-04-12 SGF Holdings, LLC High yield method of producing pure rebaudioside A
DE602005026692D1 (de) 2004-12-14 2011-04-14 Dsm Ip Assets Bv Verbesserte mevalonatkinase
CA2598792A1 (en) 2005-03-02 2006-09-08 Metanomics Gmbh Process for the production of fine chemicals
WO2006096392A2 (en) 2005-03-04 2006-09-14 Diversa Corporation Enzymes involved in astaxanthin, carotenoid and isoprenoid biosynthetic pathways, genes encoding them and methods of making and using them
WO2006093289A1 (ja) 2005-03-04 2006-09-08 National Institute Of Advanced Industrial Science And Technology Udp-キシロースの製造方法
EP1863901A1 (en) 2005-03-11 2007-12-12 Forskarpatent i Syd AB Arabinose- and xylose-fermenting saccharomyces cerevisiae strains
WO2007022318A2 (en) 2005-08-17 2007-02-22 Cornell Research Foundation Nucleic acids and proteins associated with sucrose accumulation in coffee
US8293307B2 (en) 2005-10-11 2012-10-23 Purecircle Sdn Bhd Process for manufacturing a sweetener and use thereof
DK2526783T3 (en) 2005-11-23 2017-02-06 Coca Cola Co Natural high-potency sweetener compositions with improved time profile and / or flavor profile
US7927851B2 (en) 2006-03-21 2011-04-19 Vineland Research And Innovation Centre Compositions having ent-kaurenoic acid 13-hydroxylase activity and methods for producing same
AU2007299219A1 (en) 2006-04-05 2008-03-27 Metanomics Gmbh Process for the production of a fine chemical
WO2007136847A2 (en) 2006-05-19 2007-11-29 The Regents Of The University Of California Methods for increasing isoprenoid and isoprenoid precursor production by modulating fatty acid levels
EP2035827B1 (en) 2006-06-19 2012-10-17 Givaudan S.A. Nucleic acid, polypeptide and its use
WO2008008256A2 (en) 2006-07-07 2008-01-17 The Regents Of The University Of California Methods for enhancing production of isoprenoid compounds by host cells
DK3020799T3 (da) 2006-09-26 2020-09-21 Amyris Biotechnologies Inc Fremstilling af isoprenoider og isoprenoid-prækursorer
US7629156B2 (en) 2006-09-28 2009-12-08 E.I. Du Pont De Nemours And Company Ethanol production in fermentation of mixed sugars containing xylose
US7741119B2 (en) 2006-09-28 2010-06-22 E. I. Du Pont De Nemours And Company Xylitol synthesis mutant of xylose-utilizing zymomonas for ethanol production
CN101200480B (zh) 2006-12-15 2011-03-30 成都华高药业有限公司 莱鲍迪甙a的提取方法
JP4915917B2 (ja) 2006-12-22 2012-04-11 独立行政法人農業・食品産業技術総合研究機構 ラクト−n−ビオースi及びガラクト−n−ビオースの製造方法
EP2124633B1 (en) 2007-01-22 2012-03-07 Cargill, Incorporated Method of producing purified rebaudioside a compositions using solvent/antisolvent crystallization
JP2008237110A (ja) 2007-03-27 2008-10-09 Institute Of Physical & Chemical Research ステビオール合成酵素遺伝子及びステビオールの製造方法
WO2008144060A2 (en) 2007-05-17 2008-11-27 Tetravitae Bioscience, Inc. Methods and compositions for producing solvents
US20080292775A1 (en) 2007-05-22 2008-11-27 The Coca-Cola Company Delivery Systems for Natural High-Potency Sweetener Compositions, Methods for Their Formulation, and Uses
WO2009005704A1 (en) 2007-07-03 2009-01-08 The Regents Of The University Of California Methods of increasing isoprenoid or isoprenoid precursor production
JP2009034080A (ja) 2007-08-03 2009-02-19 Sanei Gen Ffi Inc 新規糖転移酵素、及びそれを利用した配糖体の製造
US7964232B2 (en) 2007-09-17 2011-06-21 Pepsico, Inc. Steviol glycoside isomers
BRPI0820009A2 (pt) 2007-12-03 2015-05-19 Dsm Ip Assets Bv Composições nutracêuticas contendo extrato de estévia ou constituintes do extrato de estévia e uso das mesmas
NZ586358A (en) 2007-12-27 2013-04-26 Mcneil Nutritionals Llc Synergistic sweetening compositions comprising sucralose and a purified extract of stevia
EP2250268A4 (en) 2008-02-20 2011-08-24 Ceres Inc IMPROVED NITROGEN USE OF EFFICIENCY PROPERTIES IN PLANT NUCLEOTIDE SEQUENCES AND CORRESPONDING POLYPEPTIDES
TWI475963B (zh) 2008-02-25 2015-03-11 Coca Cola Co 甜菊糖苷a衍生性產物以及製造彼的方法
CN102015995B (zh) 2008-03-03 2014-10-22 焦耳无限科技公司 产生碳基目的产物的二氧化碳固定工程微生物
US9005444B2 (en) 2008-05-13 2015-04-14 Cargill, Incorporated Separation of rebaudioside A from stevia glycosides using chromatography
WO2010021001A2 (en) 2008-08-19 2010-02-25 Kaushik Ramakrishnan S Process for preparing sweetener from stevia rebaudiana
EP3101023B1 (en) 2008-10-03 2023-08-30 Morita Kagaku Kogyo Co., Ltd. New steviol glycosides
CN101720910B (zh) 2008-10-23 2012-07-25 大闽食品(漳州)有限公司 一种甜菊糖甙的制备方法
US8614085B2 (en) 2009-02-27 2013-12-24 Butamax(Tm) Advanced Biofuels Llc Yeast with increased butanol tolerance involving a multidrug efflux pump gene
US20100297722A1 (en) 2009-05-20 2010-11-25 Board Of Trustees Of Southern Illinois University Transgenic moss producing terpenoids
WO2010142305A1 (en) 2009-06-08 2010-12-16 Jennewein Biotechnologie Gmbh Hmo synthesis
EP2482676B1 (en) 2009-06-16 2014-10-22 EPC (Beijing) Natural Products Co., Ltd. Reducing or eliminating aftertaste in a sweetener using rebaudioside d
WO2011028671A1 (en) 2009-09-04 2011-03-10 Redpoint Bio Corporation Sweetness enhancers including rebaudioside a or d
AU2010298437B2 (en) 2009-09-22 2014-06-19 Redpoint Bio Corporation Novel polymorphs of rebaudioside C and methods for making and using the same
EP2708548B1 (en) 2009-10-15 2017-12-06 Purecircle SDN BHD High-Purity Rebaudioside D and Applications
US8299224B2 (en) 2009-10-15 2012-10-30 Purecircle Sdn Bhd High-purity Rebaudioside D
US8703224B2 (en) 2009-11-04 2014-04-22 Pepsico, Inc. Method to improve water solubility of Rebaudioside D
CN102812129B (zh) 2009-11-10 2015-08-26 麻省理工学院 用于从类异戊二烯途径生产化学和医药产品的微生物工程
EP2504441B1 (en) 2009-11-23 2020-07-22 E. I. du Pont de Nemours and Company Sucrose transporter genes for increasing plant seed lipids
US8586363B2 (en) 2009-12-10 2013-11-19 Regents Of The University Of Minnesota TAL effector-mediated DNA modification
RU2572756C2 (ru) 2009-12-28 2016-01-20 Дзе Кока-Кола Компании Усилители сладости, их композиции и способы применения
WO2011140329A1 (en) 2010-05-06 2011-11-10 Ceres, Inc. Transgenic plants having increased biomass
EP2571991A1 (en) 2010-05-20 2013-03-27 Evolva SA Method of producing isoprenoid compounds in yeast
EP2575499A2 (en) 2010-05-31 2013-04-10 Vib Vzw The use of transporters to modulate flavor production by yeast
NZ708078A (en) * 2010-06-02 2017-01-27 Evolva Nutrition Inc Recombinant production of steviol glycosides
US20120021111A1 (en) 2010-07-23 2012-01-26 Aexelon Therapeutics, Inc. Natural Low Caloric Sweetener Compositions for Use in Beverages, Foods and Pharmaceuticals, and Their Methods of Manufacture
US20120083593A1 (en) 2010-10-01 2012-04-05 Shanghai Yongyou Bioscience Inc. Separation and Purification of Stevioside and Rebaudioside A
US9284570B2 (en) 2010-11-30 2016-03-15 Massachusetts Institute Of Technology Microbial production of natural sweeteners, diterpenoid steviol glycosides
DE102011051713B4 (de) 2011-07-08 2015-05-13 Bernd Giesenhagen Knochentransplantate zur Augmentation eines Kieferknochens
KR20130014227A (ko) 2011-07-29 2013-02-07 한국생명공학연구원 신규한 α-글루코실 스테비오사이드 및 이의 제조 방법
BR112014003037B1 (pt) * 2011-08-08 2022-04-05 Evolva Sa Hospedeiro recombinante e método para produzir um glicosídeo de esteviol
EP2742131B1 (en) 2011-08-08 2018-11-28 Evolva SA Methods and materials for recombinant production of saffron compounds
KR101545277B1 (ko) 2011-09-28 2015-08-18 엘에스산전 주식회사 멀티레벨 고압 인버터의 위상천이 변압기
KR101791597B1 (ko) 2011-11-23 2017-10-30 에볼바 에스아 모그로사이드 화합물을 효소에 의해 합성하기 위한 방법 및 재료
US20140303036A1 (en) 2011-11-23 2014-10-09 Dsm Ip Assets B.V. Nucleic Acid Assembly System
CN103159808B (zh) 2011-12-09 2017-03-29 上海泓博智源医药股份有限公司 一种制备天然甜味剂的工艺方法
CN104684414A (zh) 2011-12-19 2015-06-03 可口可乐公司 纯化甜叶菊醇糖苷的方法和其用途
WO2013135728A1 (en) 2012-03-12 2013-09-19 Dsm Ip Assets B.V. Recombination system
CA2867112C (en) * 2012-03-16 2021-04-20 Suntory Holdings Limited Steviol glucosyltransferases and genes encoding the same
US10113154B2 (en) * 2012-03-27 2018-10-30 Suntory Holdings Limited Method for producing steviol glycoside
WO2013144257A1 (en) 2012-03-27 2013-10-03 Dsm Ip Assets B.V. Cloning method
US9752174B2 (en) 2013-05-28 2017-09-05 Purecircle Sdn Bhd High-purity steviol glycosides
MX352678B (es) 2012-05-22 2017-12-04 Purecircle Sdn Bhd Glucosidos de esteviol de alta pureza.
TW201402599A (zh) * 2012-05-30 2014-01-16 Suntory Holdings Ltd 甜菊糖苷糖苷轉化酵素及編碼該酵素之基因
CA2886893C (en) * 2012-09-29 2019-05-07 Yong Wang Method for producing stevioside compounds by microorganism
EP2928321A1 (en) 2012-12-05 2015-10-14 Evolva SA Steviol glycoside compositions sensory properties
EP2954058B1 (en) 2013-02-06 2021-03-31 Evolva SA Methods for improved production of rebaudioside d and rebaudioside m
BR112015019160A2 (pt) * 2013-02-11 2017-08-22 Dalgaard Mikkelsen Michael Produção de glicosídeos de esteviol em hospedeiros recombinantes
KR101404728B1 (ko) * 2013-02-28 2014-06-09 씨제이제일제당 (주) 스테비오사이드로부터 리바우디오사이드 a를 제조하는 방법
AU2014273055A1 (en) * 2013-05-31 2015-12-17 Dsm Ip Assets B.V. Microorganisms for diterpene production
WO2014195944A1 (en) 2013-06-05 2014-12-11 Yeda Research And Development Co. Ltd. Plant with altered content of steroidal glycoalkaloids
KR101559478B1 (ko) 2013-06-24 2015-10-13 한국생명공학연구원 효소전환법을 이용한 천연 고감미료의 제조방법
EP3021689B1 (en) 2013-07-15 2021-03-24 DSM IP Assets B.V. Diterpene production
US10273519B2 (en) 2013-07-23 2019-04-30 Dsm Ip Assets B.V. Diterpene production in Yarrowia
US20160185813A1 (en) * 2013-07-31 2016-06-30 Dsm Ip Assets B.V. Recovery of steviol glycosides
JPWO2015016393A1 (ja) 2013-08-02 2017-03-02 サントリーホールディングス株式会社 ヘキセノール配糖体化酵素の利用方法
CN103397064B (zh) 2013-08-14 2015-04-15 苏州汉酶生物技术有限公司 一种酶法制备瑞鲍迪甙m的方法
EP3039132A2 (en) 2013-08-30 2016-07-06 Evolva SA A method for producing modified resveratrol
WO2015051454A1 (en) 2013-10-07 2015-04-16 Vineland Research And Innovation Centre Compositions and methods for producing steviol and steviol glycosides
CN106103729B (zh) * 2013-11-01 2020-07-07 科纳根公司 甜菊醇糖苷的重组制备
SG11201606673RA (en) 2014-03-07 2016-09-29 Evolva Sa Methods for recombinant production of saffron compounds
SG11201700651RA (en) 2014-08-11 2017-02-27 Evolva Sa Production of steviol glycosides in recombinant hosts
US20170275666A1 (en) * 2014-08-19 2017-09-28 The Coca-Cola Company Methods for Preparing Rebaudioside I and Uses
CN107109358B (zh) 2014-09-09 2022-08-02 埃沃尔瓦公司 在重组宿主中生产甜菊醇糖苷
MY182396A (en) * 2014-11-05 2021-01-23 Manus Biosynthesis Inc Microbial production of steviol glycosides
WO2016120486A1 (en) 2015-01-30 2016-08-04 Evolva Sa Production of steviol glycosides in recombinant hosts
WO2016146711A1 (en) * 2015-03-16 2016-09-22 Dsm Ip Assets B.V. Udp-glycosyltransferases
CN104845990A (zh) 2015-06-11 2015-08-19 山东大学 拟南芥糖基转移酶基因ugt73c7在提高植物抗病性中的应用
AU2016307066A1 (en) 2015-08-07 2018-02-08 Evolva Sa Production of steviol glycosides in recombinant hosts

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104203005A (zh) * 2012-01-23 2014-12-10 帝斯曼知识产权资产管理有限公司 二萜的生产
WO2014191580A1 (en) * 2013-05-31 2014-12-04 Dsm Ip Assets B.V. Extracellular diterpene production
WO2015014969A1 (en) * 2013-07-31 2015-02-05 Dsm Ip Assets B.V. Steviol glycosides

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Agrobacterium mediated transient gene silencing (AMTS) in Stevia rebaudiana: Insights into steviol glycoside biosynthesis pathway;Praveen Guleria et al.;《PLOS ONE》;20130904;第8卷(第9期);e74731 *

Also Published As

Publication number Publication date
BR112017019625A2 (pt) 2018-05-08
EP3271457A1 (en) 2018-01-24
EP3271457B1 (en) 2021-01-20
US20200224180A1 (en) 2020-07-16
US10604743B2 (en) 2020-03-31
EP3862426A3 (en) 2021-11-17
CN107567492A (zh) 2018-01-09
CA2979931A1 (en) 2016-09-22
CN115851470A (zh) 2023-03-28
US20210147815A1 (en) 2021-05-20
WO2016146711A1 (en) 2016-09-22
US10947515B2 (en) 2021-03-16
US20180044645A1 (en) 2018-02-15
US11459548B2 (en) 2022-10-04
EP3862426A2 (en) 2021-08-11

Similar Documents

Publication Publication Date Title
CN107567492B (zh) Udp-糖基转移酶
US11725223B2 (en) Microorganisms for diterpene production
AU2014292150B2 (en) Diterpene production
AU2013211605B2 (en) Diterpene production
CN107922913B (zh) 甜菊醇糖苷转运
BR112016002092B1 (pt) Recuperação de glicosídeos de esteviol
CN107922465B (zh) 甜菊醇糖苷转运
CN108138152B (zh) 贝壳杉烯酸羟化酶
CN110892068B (zh) Udp-糖基转移酶
CN110072995A (zh) 贝壳杉烯酸羟化酶

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant