CN117460835A

CN117460835A - 生产肝素前体的重组细胞

Info

Publication number: CN117460835A
Application number: CN202280038990.0A
Authority: CN
Inventors: 多米尼克·路易斯; 卡琳·杰尔拉尔登; 缪里·梅尔卡姆; 多米尼克·托马斯
Original assignee: Givaudan SA
Current assignee: Givaudan SA
Priority date: 2021-04-01
Filing date: 2022-03-31
Publication date: 2024-01-26
Also published as: BR112023019836A2; KR20240007134A; WO2022207790A1; JP2024511879A; EP4067500A1; EP4314313A1

Abstract

本发明涉及肝素前体的生物生产领域。本领域需要允许肝素前体高效合成和分泌的肝素前体生产方法。本发明提出的技术方案是使用包含如本上下文所述的许多修饰的经遗传修饰的细胞。本发明还提出允许使用本发明的经遗传修饰的细胞生物生产具有受控分子量的肝素前体的方法。

Description

生产肝素前体的重组细胞

技术领域

本发明涉及肝素前体的生物生产领域。

背景技术

肝素前体也称为N-乙酰肝素前体，是肝素和硫酸乙酰肝素的天然真核生物合成前体，存在于从水螅到脊椎动物的动物中。更具体地，它是具有重复二糖单元[→4)β-D-葡萄糖醛酸(GlcA)(1→4)N-乙酰-a-D-葡萄糖胺(GlcNAc)(l→]_n.的多糖。在自然界中，大肠埃希氏菌(Escherichia coli)K5和多杀巴斯德菌(Pasteurella multocida)D型菌株生产肝素前体作为荚膜多糖(Lindahl U.等人(1998)J.Biol.Chem.,273(39):24979-24982)。

来自肝素前体的衍生物结合至多种极其重要的多肽，包括止血因子(例如抗凝血酶III、凝血酶)、生长因子(例如EGF、VEGF)和趋化因子(例如IL-8、血小板因子4)以及病毒病原体(例如疱疹、登革热)的粘附蛋白。在这些衍生物中，肝素是最广泛使用的抗凝血剂或抗血栓药物之一，其可用于例如治疗性治疗血栓栓塞和弥散性血管内凝血(DIC)、体外循环和预防人工透析期间血液凝固。此外，最近的研究表明，肝素可具有显著的抗肿瘤活性，与其抗凝血活性不同并有差异，而其他研究则表明肝素在治疗炎症、不孕症和传染病中发挥作用。

当今已知的肝素主要来源是来自动物组织(例如猪肠粘膜)的提取物，伴随着掺杂和污染的风险。

用于从微生物体制备肝素前体的发酵方法特别令人感兴趣，因为它们有利于通过可能的规模化、以降低的成本生产大量肝素前体。此外，与从提供非常高分子量的肝素前体的动物源中分离肝素前体及其衍生物相反，微生物发酵允许在一定程度上控制起始分子量的大小。这避免了通过机械、物理或化学手段进行进一步分级分离步骤的需要。

为此，重组巨大芽孢杆菌(Bacillus megaterium)宿主细胞已显示出生产10至300KDa范围内肝素前体的能力(A.Williams等人Microb.Cell.Fact.2009年8月12日；18(1):132)。类似地，大肠埃希氏菌K5菌株显示出生产肝素前体的能力(Wang Z.等人(2010)Biotechnol.Bioeng.,107(6):964-973)，但仍有许多问题有待解决，例如底物消耗率提高和发酵罐内氧气供应量增加。

与通常用于生产生物分子的其他微生物相比，酵母通常被认为是安全的。与细菌相比，它们可以快速生长并以更高的密度培养，并且不需要无菌环境。此外，酵母细胞比细菌更容易从培养基中分离，大大简化了产品提取和纯化的工艺。最后，酵母对培养基中pH变化具有更强耐受性的优势，并因此代表了更强的发酵系统。

然而，在酵母中，物种之间的区分特征也可能带来一定的挑战。这主要是由于物种之间新陈代谢的差异造成的。例如，巴斯德毕赤酵母(P.pastoris)中的基因组整合是稳定的，但通常会遇到来自一次转化的克隆的高度变异性，显示出各种生产力特征或生理学变化。这需要一个耗时的筛选过程，以便找到具有所想要应用的最佳特征的克隆。这种克隆变异性是巴斯德毕赤酵母作为用于生产增值化学品平台进一步发展的一个重要缺点。使用巴斯德毕赤酵母的另一个缺点是它是一种嗜甲烷菌生物体。

与之对比，酿酒酵母(Saccharomyces cerevisiae)作为生产目标分子的工具是特别有用的，因为它在被人使用(例如在葡萄酒、啤酒或面包中)方面具有悠久的安全史，并且其遗传信息是本领域众所周知的完善模型。酿酒酵母还具有被普遍认为对人和动物安全的优势。更重要的是，培养这种酵母时发生的培养基酸化降低了生物发酵罐污染的可能性，并因此无需向培养基中添加抗生素。最后，许多遗传工具已被开发出来，允许对其基因组进行稳定修饰(在染色体内整合)。

因此，本领域仍然需要允许肝素前体高效合成和分泌的另外的肝素前体生产方法。具体地，仍然需要提供具有成本效益的生产方法并提供对人应用安全的肝素前体。

在特定情况下，本领域仍然需要能够获得大量特定且受控尺寸的肝素前体的肝素前体生产方法。

发明内容

本发明因此涉及以下各项：

项1：一种生产肝素前体的重组酵母细胞，其中所述重组细胞包含：

(a)编码具有肝素前体合酶(HSS)活性的多肽的一种或多种重组核酸；和

(b)编码具有UDP-葡萄糖脱氢酶(UDP-GlcDH或HASB)活性的多肽的一种或多种重组核酸。

如实例中所示，本发明的重组酵母允许在不能天然生产肝素前体的酵母细胞中生产肝素前体。

所述有利特性可以通过将酵母与下文所述的额外修饰重组结合来进一步增强。

项2：根据项1所述的重组细胞，其中所述重组细胞包含编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的核酸，其中所述具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽包含分泌信号和任选的锚定信号。

项3：一种生产肝素前体的重组宿主细胞，其中所述重组细胞包含：

(a)编码具有肝素前体合酶(HSS)活性的多肽的一种或多种重组核酸；

(B)编码具有UDP-葡萄糖脱氢酶(UDP-GlcDH或HASB)活性的多肽的一种或多种重组核酸；和

(c)编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的一种或多种重组核酸，

其中具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽包含分泌信号和任选的锚定信号，使得肝素前体、特别是所想要分子量的肝素前体由宿主细胞生产。

项4：根据项2或3所述的重组细胞，其中编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的核酸获自或源自解肝磷脂土地杆菌(Pedobacter heparinus)。

项5：根据项2至4中任一项所述的重组细胞，其中编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的核酸在选自由以下组成的组的启动子的控制下：pTEF1、pCCW12、pCCW12.sba、pCCW12.Sar、pPDC1、pTEF3、pTDH3、pNUP57和pCCW10.ago。

项6：根据项2至5中任一项所述的重组细胞，其中所述肝素前体的分子量在小于50kDa的范围内，优选在约20kDa至约50kDa的范围内。

项7：根据项2至5中任一项所述的重组细胞，其中所述肝素前体的分子量在大于50kDa的范围内，优选在约50kDa至约250kD的范围内。

项8：根据项2至5中任一项所述的重组细胞，其中所述肝素前体的分子量在大于100kDa的范围内，优选在约100kDa至约1500kDa的范围内。

项9：根据项1至8中任一项所述的重组细胞，其中编码具有UDP-葡萄糖脱氢酶(UDP-GlcDH或HASB)活性的多肽的核酸获自或源自以下中的至少一者：拟南芥(Arabidopsis thaliana)、小球藻属病毒(Chlorella virus)PBCV1或兽瘟链球菌(Streptococcus zooepidemicus)，并且特别来自拟南芥或小球藻属病毒PBCV1。

项10：根据项1至9中任一项所述的重组细胞，其中编码具有肝素前体合酶(HSS)活性的多肽的核酸获自或源自多杀巴斯德菌。

项11：根据项1至10中任一项所述的重组细胞，其中所述重组细胞还包含至少一种编码以下中的一者或多者的重组核酸：

(i)具有谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)活性的多肽；和/或

(ii)具有UDP-N-乙酰葡萄糖胺焦磷酸化酶(QRI1)活性的多肽。

项12：根据项1至11中任一项所述的重组细胞，其中所述重组细胞还包含至少一种编码以下中的一者或多者的重组核酸：

(i)具有磷酸葡萄糖变位酶-1(PGM1)活性的多肽；和/或

(ii)具有UTP-葡萄糖-1-磷酸尿苷酰转移酶(UGP1)活性的多肽；和/或

(iii)具有葡萄糖胺-6-磷酸N-乙酰转移酶(GNA1)活性的多肽；和/或

(iv)具有磷酸乙酰葡萄糖胺变位酶(PCM1)活性的多肽。

项13：根据项11或12所述的重组细胞，其中：

-编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)活性的多肽的核酸；和/或

-编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶(QRI1)活性的多肽的核酸；和/或

-编码具有磷酸葡萄糖变位酶-1(PGM1)活性的多肽的核酸；和/或

-编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶(UGP1)活性的多肽的核酸；和/或

-编码具有葡萄糖胺-6-磷酸N-乙酰转移酶(GNA1)活性的多肽的核酸；和/或

-编码具有磷酸乙酰葡萄糖胺变位酶(PCM1)的多肽的核酸；

得以获自或源自酿酒酵母。

项14：根据项3至13中任一项所述的重组宿主细胞，其中所述重组宿主细胞是酵母。

项15：根据项1至14中任一项所述的重组宿主细胞，其中所述重组细胞属于酵母属，或属于念珠菌属(Candida)，或属于克鲁维酵母菌属(Kluyveromyces)，或属于汉逊酵母属(Ogataea)，或属于耶氏酵母属(Yarrowia)，或属于德巴利酵母属(Debaryomyces)，或属于阿舒囊霉属(Ashbya)，并且特别是属于酵母属。

项16：根据项15所述的重组细胞，其中重组细胞选自由以下组成的组：酿酒酵母(Saccharomyces cerevisiae)、布拉氏酵母(Saccharomyces boulardii)、贝酵母(Saccharomyces bayanus)、奇异酵母(Saccharomyces paradoxus)、米卡酵母(Saccharomyces mikatae)、卡氏酵母(Saccharomyces castelli)、白念珠菌(Candidaalbicans)、光滑念珠菌(Candida glabrata)、热带念珠菌(Candida tropicalis)、乳酸克鲁维酵母(Kluyveromyces lactis)、马克斯克鲁维酵母(Kluyveromyces marxianus)、多孢克鲁维酵母(Kluyveromyces polysporus)、耐热克鲁维酵母(Kluyveromycesthermotolerens)、多形汉逊酵母(Ogataea polymorpha)、解脂耶氏酵母(Yarrowialypolytica)、汉逊德巴利酵母(Debaryomyces hansenii)和棉阿舒囊霉(Ashbyagossypii)，并且优选酿酒酵母。

项17：一种生产肝素前体的方法，其包括：

(a)在培养基中培养如项1至16中任一项所定义的重组细胞持续足以生产肝素前体的时间；和

(b)任选地从所述重组细胞和/或从所述培养基分离或回收所述肝素前体。

项18：根据项17所述的方法，其中肝素前体的分子量为约20kDa至约50kDa。

项19：根据项17所述的方法，其中肝素前体的分子量为约50kDa至约150kDa。

项20：根据项17所述的方法，其中肝素前体的分子量为约150kDa至约1500kDa。

项21：根据项17至20中任一项所述的方法，其中所述重组细胞是属于酵母属的酵母，并且特别是酿酒酵母。

项22：根据项17至21中任一项所述的方法，其中所述足以生产肝素前体的时间是约35至约50小时、优选约40至约50小时、优选约48小时的时间段。

项23：根据项17至22中任一项所述的方法，其中所生产的肝素前体的分子量由步骤(a)期间调节培养基的pH来控制。

项24：根据项17至23中任一项所述的方法，其中所述方法以工业规模进行，优选地其中所述培养基是至少约100L，更优选地在约1000L至约3000L的范围内，甚至更优选约10,000L或甚至更优选约100,000L，或甚至约250,000L。

项25：可从根据项1至15中任一项所述的重组细胞获得或可从根据项17至24中任一项所述的方法获得的肝素前体。

项26：一种培养基，其包含根据项25所述的肝素前体。

项27：一种组合物，其包含根据项25所述的肝素前体。

项28：一种工业产品或消费产品或消费品，其包含(i)具有如项6至8中任一项所定义的分子量的根据项25所述的肝素前体，(ii)如项26所述的培养基或(iii)如项27所述的组合物。

项29：如项28所述的工业产品或消费产品或消费品，其中所述工业产品或消费产品或消费品是美容品、调味品、香料产品、食品、食物、饮料、食品定形剂、药物组合物、膳食补充剂、营养制品、清洁产品、牙科和/或口腔卫生组合物。

项30：如项1至116中任一项所定义的重组细胞用于生产具有约20kDa至约50kDa或约50kDa至约1000kDa范围内的分子量的肝素前体的用途。

本发明的某些实施方式可以提供以下优点中的一者或多者：

·一种用于生产受控分子量的肝素前体的方法；

·一种在酿酒酵母细胞中生产受控分子量的肝素前体的方法；和

·一种用于通过改变遗传参数(例如调控序列)和/或方法参数(pH或发酵时间)来生产受控分子量的肝素前体的方法。

附图说明

图1显示了用于生产肝素前体的示意性途径。

具体实施方式

序列概述

SEQ ID NO:1是源自多杀巴斯德菌的肝素前体合酶(HSS1)的重编码核酸序列。

SEQ ID NO:2是源自多杀巴斯德菌的肝素前体合酶(HSS2)的重编码核酸序列。

SEQ ID NO:3是源自多杀巴斯德菌的肝素前体合酶(HSS1)的氨基酸序列。

SEQ ID NO:4是源自多杀巴斯德菌的肝素前体合酶(HSS2)的氨基酸序列。

SEQ ID NO:5是源自拟南芥的UDP-葡萄糖脱氢酶(HASB)的核酸序列。

SEQ ID NO:6是源自小球藻属病毒PBCV-1的UDP-葡萄糖脱氢酶(HASB)的重编码核酸序列。

SEQ ID NO:7是源自小球藻属病毒PBCV-1的UDP-葡萄糖脱氢酶(HASB-A)的重编码核酸序列。

SEQ ID NO:8是源自拟南芥的UDP-葡萄糖脱氢酶(HASB)的氨基酸序列。

SEQ ID NO:9是源自小球藻属病毒PBCV1的UDP-葡萄糖脱氢酶(HASB)的氨基酸序列。

SEQ ID NO:10是具有N-末端分泌信号的源自解肝磷脂土地杆菌的葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶的重编码核酸序列。

SEQ ID NO:11是具有N-末端分泌信号和C-末端锚定信号的源自解肝磷脂土地杆菌的葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶的重编码核酸序列。

SEQ ID NO:12是具有N-末端分泌信号的源自解肝磷脂土地杆菌的葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶的重编码核酸序列。

SEQ ID NO:13是具有N-末端分泌信号和C-末端锚定信号的源自解肝磷脂土地杆菌的葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶的重编码核酸序列。

SEQ ID NO:14是具有N-末端分泌信号的源自解肝磷脂土地杆菌的葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶的氨基酸序列。

SEQ ID NO:15是具有N-末端分泌信号和C-末端锚定信号的源自解肝磷脂土地杆菌的葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶的氨基酸序列。

SEQ ID NO:16是源自酿酒酵母的谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)的核酸序列。

SEQ ID NO:17是源自小球藻属病毒1(PBCV-1)的谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)的重编码核酸序列。

SEQ ID NO:18是源自小球藻属病毒1(PBCV-1)的谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)的重编码核酸序列。

SEQ ID NO:19是源自酿酒酵母的谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)的氨基酸序列。

SEQ ID NO:20是源自小球藻属病毒1(PBCV-1)的谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)的氨基酸序列。

SEQ ID NO:21是源自酿酒酵母的UDP-N-乙酰葡萄糖胺焦磷酸化酶(QRI1)的核酸序列。

SEQ ID NO:22是源自酿酒酵母的UDP-N-乙酰葡萄糖胺焦磷酸化酶(QRI1)的氨基酸序列。

SEQ ID NO:23是源自酿酒酵母的磷酸葡萄糖变位酶-1(PGM1)的核酸序列。

SEQ ID NO:24是源自酿酒酵母的磷酸葡萄糖变位酶-1(PGM1)的氨基酸序列。

SEQ ID NO:25是源自酿酒酵母的UTP--葡萄糖-1-磷酸尿苷酰转移酶(UGP1)的核酸序列。

SEQ ID NO:26是源自酿酒酵母的UTP--葡萄糖-1-磷酸尿苷酰转移酶(UGP1)的氨基酸序列。

SEQ ID NO:27是源自酿酒酵母的葡萄糖胺6-磷酸N-乙酰转移酶(GNA1)的核酸序列。

SEQ ID NO:28是源自酿酒酵母的葡萄糖胺6-磷酸N-乙酰转移酶(GNA1)的氨基酸序列。

SEQ ID NO：29是源自酿酒酵母的磷酸乙酰葡萄糖胺变位酶(PCM1)的核酸序列。

SEQ ID NO:30是源自酿酒酵母的磷酸乙酰葡萄糖胺变位酶(PCM1)的氨基酸序列。

SEQ ID NO:31是启动子pTDH3的核酸序列。

SEQ ID NO:32是启动子pTDH3.Sk的核酸序列。

SEQ ID NO:33是启动子pTDH3-1.sba的核酸序列。

SEQ ID NO:34是启动子pTDH3.Sar的核酸序列。

SEQ ID NO:35是启动子pENO2的核酸序列。

SEQ ID NO:36是启动子pTEF3的核酸序列。

SEQ ID NO:37是启动子pTEF1的核酸序列。

SEQ ID NO:38是启动子pTEF1.ago的核酸序列。

SEQ ID NO:39是启动子pTEF1.Sba的核酸序列。

SEQ ID NO:40是启动子pPDC1的核酸序列。

SEQ ID NO:41是启动子pCCW12的核酸序列。

SEQ ID NO:42是启动子pCCW12.Sm的核酸序列。

SEQ ID NO:43是启动子pCCW12.Sk的核酸序列。

SEQ ID NO:44是启动子pCCW12.Sba的核酸序列。

SEQ ID NO:45是启动子pCCW12.Sar的核酸序列。

SEQ ID NO:46是启动子pNUP57的核酸序列。

SEQ ID NO:47是启动子pCCW10.ago的核酸序列。

SEQ ID NO:48是启动子pCWP2的核酸序列。

SEQ ID NO:49是启动子pCCW120.Sca的核酸序列。

SEQ ID NO:50是启动子pRPLA1的核酸序列。

SEQ ID NO:51是启动子pCUP1的核酸序列。

SEQ ID NO:52是启动子pMET6的核酸序列。

SEQ ID NO:53是启动子pMET25的核酸序列。

SEQ ID NO:54是启动子pSAM1的核酸序列。

SEQ ID NO:55是终止子tTPI1的核酸序列。

SEQ ID NO:56是终止子tMET25的核酸序列。

SEQ ID NO:57是终止子tDIT1的核酸序列。

SEQ ID NO:58是终止子tRPL3的核酸序列。

SEQ ID NO:59是终止子tRPL3.sm的核酸序列。

SEQ ID NO:60是终止子tRPL3.sba的核酸序列。

SEQ ID NO:61是终止子tRPL41B的核酸序列。

SEQ ID NO:62是终止子tRPL15A的核酸序列。

SEQ ID NO:63是终止子tRPL15A.sba的核酸序列。

SEQ ID NO:64是终止子tIDP1的核酸序列。

SEQ ID NO:65是终止子tTEF1.sba的核酸序列。

SEQ ID NO:66是在5’添加的分泌序列的核酸序列。

SEQ ID NO:67是在N末端添加的分泌序列的氨基酸序列。

SEQ ID NO:68是在3’添加的锚定序列的核酸序列。

SEQ ID NO:69是C末端添加的锚定序列的氨基酸序列。

本发明的详细描述

发明人设想了遗传修饰的细胞，并且尤其是遗传修饰的酵母，与亲本细胞相比并且尤其是与天然不能生产肝素前体的亲本酵母相比，其具有生产肝素前体的能力。

这些经遗传修饰的细胞在本说明书全文中进行了描述。

定义

术语“肝素前体(heparosan)”是一种多糖，即一种由[-4-N-乙酰葡萄糖胺-α1,4-葡萄糖醛酸-β1-]重复序列([→4)β-D-葡萄糖醛酸(GlcA)(1→4)N-乙酰-a-D-葡萄糖胺(GlcNAc)(l→]n)组成的聚合物。

肝素前体可以在重组细胞中生产。

如本文所用，术语“重组”当用于指代细胞时，表示该细胞已通过将内源和/或异源核酸或蛋白质引入细胞中或改变天然细胞，或该细胞源自如此修饰的细胞。因此，例如，重组细胞表达在细胞的天然(非重组)形式中未发现的基因或核酸，或以与其天然水平不同的水平表达天然(如内源)基因，或以与其天然水平不同的水平表达天然(如内源的)的额外或补充拷贝。

如本文所用，术语“重组”当用于指核酸或载体时，是通过本领域技术人员熟知的遗传工程化技术形成/获得的序列。美国国家卫生研究院(NIH)的指南相应指出：

“重组[…]核酸如下定义：

i.(a)由连接核酸分子构建，和(b)可以在活细胞中复制的分子，即重组核酸；”，

这反映了附加到核酸序列的词语“重组”的常规使用，意指在插入另一核酸或与另一核酸连接在一起之后重组。

由重组DNA或重组载体在活细胞内表达而生产的蛋白质也称为重组蛋白。

因此，术语“重组”与术语“遗传修饰”同义。术语“基因”与术语“核酸”或“核苷酸序列”同义。

用于本发明的重组细胞并且特别是重组酵母的重组核酸序列可以以核酸构建体的形式提供。术语“核酸构建体”是指单链或双链的核酸分子，其经分离或源自天然(例如内源)天然存在的基因或是异源核酸，或者已被修饰为含有以自然界中不以其他方式存在的方式组合和并置的核酸片段。当核酸构建体含有表达编码序列所需的一个或多个调控元件时，术语“核酸构建体”与术语“表达盒”或“异源核酸表达盒”同义，其中所述控制序列可操作地连接至所述编码序列。调控元件的非限制性实例包括启动子、增强子、沉默子、终止子和聚-A信号。

用于本发明的重组细胞的重组核酸序列可以以表达载体的形式提供，其中多核苷酸序列可操作地连接至至少一个用于在重组细胞中表达多核苷酸序列的控制序列。

术语“获自”或“源自(originate from)”或“源自(originating from)”微生物或动物一般意指源自微生物体或动物的物质(例如，核酸分子或多肽)是该微生物或动物天然的。

术语“源自”微生物体或动物一般意指源自微生物体或动物的物质(例如，核酸分子或多肽)是对该微生物体或动物中天然的(即本身存在的)物质进行修饰的结果。例如，关于源自微生物或动物的核酸序列，所述核酸序列可以对应于来自该微生物体或动物的天然核酸序列的重编码和/或截短版本。可以对微生物或动物的天然物质进行本领域技术人员熟知的其他修饰，从而导致所使用的物质“源自”所述微生物体或动物。

如本文所用，术语“多肽”是指包含通过肽键连接的氨基酸残基并且含有多于五个氨基酸残基的分子。氨基酸通过单字母或三字母名称来识别。如本文所用的术语“蛋白质”与术语“多肽”同义，并且也可以指两种或更多种多肽。因此，术语“蛋白质”、“肽”和“多肽”可以互换使用。多肽可以任选地被修饰(例如，糖基化、磷酸化、酰化、法呢基化、异戊二烯化、磺化等)以添加功能性。表现出活性的多肽可称为酶。应理解，由于遗传密码的简并性，可以生产编码给定多肽的大量核苷酸序列。

由用于本发明的重组细胞并且特别是重组酵母的重组核酸编码的多肽可以包含信号肽和/或前肽序列。在由本发明的重组细胞、特别是重组酵母表达的多肽包含信号肽和/或前肽的情况下，可以在成熟多肽序列上计算序列同一性。

如本文使用的术语“可操作地连接”是指两个或更多个核酸序列元件物理连接并且彼此处于功能关系。例如，如果启动子能够启动或调控编码序列的转录或表达，则启动子可操作地连接至编码序列，在这种情况下，编码序列应理解为“在启动子的控制下”。一般而言，当两条核酸序列可操作地连接时，它们将处于相同的方向并且通常也在相同的阅读框中。它们通常基本上是连续的，尽管这可能不是必需的。

如本文所用的术语“天然”或“内源”就分子而言并且特别是酶和核酸，表示在它们起源或在自然界中发现的生物体中表达的分子。

术语“内源基因”意指在任何遗传修饰之前，该基因存在于野生型菌株的细胞中。内源基因可以通过引入异源序列以补充内源调控元件或替代内源调控元件，或者通过将基因的一个或多个额外或补充拷贝引入染色体或质粒中来过表达(所述额外或补充拷贝被指定为如本文所定义的“外源或异源基因”或“异源核苷酸序列”或“异源核酸”)。还可以修饰内源基因以调节它们的表达和/或活性。例如，可将突变引入编码序列以修饰基因产物，或者可引入异源序列补充内源调控元件，或替代内源性调控元件。内源基因的调节可以导致基因产物活性的上调和/或增强，或者替选地，导致内源基因产物活性的下调和/或减弱。增强内源基因表达的另一种方法是将基因的一个或多个附加或补充拷贝引入染色体或质粒上(所述补充拷贝被指定为如本文所定义的“外源或异源基因”或“异源核苷酸序列”或异源核酸)。

对于根据本发明的“基因的一个或多个附加或补充拷贝”，其在本发明中被理解为例如1至50个拷贝，特别是1至30个拷贝，更特别是1至20个拷贝，并且优选1至10个拷贝。所述拷贝可以插入到本发明的重组细胞的相同基因座或不同基因座中。

术语“外源性基因”意指通过本领域技术人员熟知的方式将基因引入细胞中，而该基因天然存在于或不天然存在于野生型细胞中。如果将外源基因连同允许其在细胞中表达的所有元件一起引入细胞，则细胞可以表达这些基因。用外源DNA转化细胞是本领域技术人员的常规任务。外源基因可以整合到宿主染色体中，或者从质粒或载体在染色体外表达。多种质粒在其复制起点和其在细胞中的拷贝数方面有所不同，都是本领域已知的。外源基因的序列可以适应其在细胞中的表达。事实上，本领域技术人员知道密码子使用偏倚的概念以及如何在不修改推导的蛋白质的情况下使核酸序列适应特定的密码子使用偏倚。在具体的实施方式中，密码子优化的基因表达天然酶。

术语“异源基因”或“异源核酸序列”是指自然界中给定细胞中通常不存在的基因或核酸序列。因此，异源核酸序列可以是：(a)对于其宿主细胞是外源的(即对于细胞来说是“外源的”)；(b)天然存在于宿主细胞(即“内源的”)中但在细胞中以非天然量存在(即，比宿主细胞中天然存在更多或更少的量)；或(c)天然存在于宿主细胞中，但位于其天然基因座之外。

在本申请中，所有基因都以它们的通用名称和它们的核苷酸序列以及在出现的情况下它们的氨基酸序列来提及。使用已知基因的登录号中给出的参考文献，本领域技术人员能够确定其他生物体、细菌菌株、酵母、真菌、哺乳动物、植物等中的等效基因。该常规工作有利地使用共有序列来完成，其可以通过与来源于其他细胞的基因进行序列比对并设计简并探针以在另一个生物体中克隆相应基因来确定。

本领域技术人员知道调节并且特别是上调或下调内源基因表达的不同方法。例如，增强内源基因表达或过表达的一种方法是将基因的一个或多个附加或补充拷贝引入染色体或质粒上。

另一种方法是用更强的启动子替换基因的内源启动子。这些启动子可以是同源的或异源的。本发明中具体的目标启动子在本说明书的其他地方进行了更详细的描述。

核酸表达构建体还可包含5'和/或3’识别序列和/或选择标记。

术语“诱导型启动子”用于限定其活性被诱导(即增加)的启动子：

-在一种或多种特定代谢物的存在下。培养基中代谢物浓度越高，启动子活性越强；或

-在存在低浓度或不存在一种或多种代谢物的情况下。这些代谢物不同于那些其增加的存在诱导启动子活性的代谢物。培养基中代谢物浓度越低，启动子活性越强。

术语“阻遏型启动子”用于限定其活性被阻遏(即减少)的启动子：

-在一种或多种特定代谢物的存在下。培养基中代谢物浓度越高，启动子活性越弱；或

-在存在低浓度或不存在一种或多种代谢物的情况下。这些代谢物不同于那些其增加的存在阻遏子活性的代谢物。培养基中代谢物浓度越低，启动子活性越弱。

如本文所用，术语“锚定信号”当与蛋白质或多肽例如酶(例如具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽)结合使用时，意指例如可操作地连接至编码蛋白质或多肽的第二核酸的编码蛋白质的第一核酸，或可操作地连接至第二蛋白或多肽的第一蛋白或多肽、例如酶(例如具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽以形成例如融合蛋白)，并且使得细胞(特别是酿酒酵母细胞)的细胞转运机制能够将可操作地连接至第一蛋白的第二蛋白正确锚定和/或定位在细胞的膜内。

如本文所用，术语“分泌信号”当与蛋白质或多肽例如酶(例如具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽)联合使用时，意指例如可操作地连接至编码蛋白质的第二核酸的编码肽或蛋白质的第一核酸，或连接至第二蛋白的第一蛋白、例如酶(例如具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽以形成例如融合蛋白)，并且使得细胞(特别是酿酒酵母细胞)的细胞转运机制能够将至少第二蛋白质定位至细胞膜，并且在例如第一蛋白质已从第二蛋白质裂解之后将第二蛋白质分泌到细胞外。

如本文所用，术语“分泌信号”和“锚定信号”当与蛋白质或多肽例如酶(例如具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽)结合使用时，意指例如可操作地连接至编码蛋白质的第二核酸的编码肽或蛋白质的第一核酸，或可操作地连接至第二蛋白的第一蛋白、例如酶(例如具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽)，并且使得细胞(特别是酿酒酵母细胞)的细胞转运机制能够将至少第二蛋白定位至细胞膜，其中如果第二蛋白还可操作地连接至“锚定信号”，则第二蛋白不分泌但保留附着至细胞膜。在一些情况下，分泌-锚定信号可以提供双重分泌信号和锚定信号功能。

分泌和锚定信号的序列，用于异源蛋白的表达、锚定和/或分泌的方法，例如细胞(例如酵母细胞)表面上的酶(例如葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶)是本领域众所周知的(参见例如，Ast等人(2013)Cell 152:1134-1145，Ast和Schuldiner(2013)CritRev Biochem Mol Biol 48(3)273-288，Van der Vaart等人(1997)AppliedEnvironmental Microbiology 63(2)615-620以及这些出版物中每一篇的全部内容通过引用并入本文)。

酶的“活性”与术语“功能”可互换使用，并且在本发明的上下文中指酶催化所想要反应的能力。宿主细胞中酶的量可以通过修饰编码酶的基因的转录来改变。这可以例如通过修饰编码酶的核苷酸序列的拷贝数来实现(例如，通过使用包含核苷酸序列的更高或更低拷贝数的表达载体，或通过将核苷酸序列的附加拷贝引入宿主细胞的基因组中，或通过缺失或破坏宿主细胞的基因组中的核苷酸序列)，通过改变操纵子的多顺反子mRNA上的编码序列的顺序或将操纵子分解成单独的基因(每个基因具有其自己的控制元件)，或通过增加与核苷酸序列可操作地连接的启动子或操纵子的强度。

替选地或另外，可以通过改变编码酶的mRNA的翻译水平来改变宿主细胞中酶的拷贝数。这可以通过例如修饰mRNA的稳定性、修饰核糖体结合位点的序列、修饰核糖体结合位点与酶编码序列的起始密码子之间的距离或序列、修饰位于酶编码区的起始密码子的5’侧上游或附近的整个顺反子间区域、使用发夹和特殊序列来稳定mRNA转录本的3’-端、修改酶的密码子使用、改变酶的生物合成中所用稀有密码子tRNA的表达，和/或增加酶的稳定性(例如经由其编码序列的突变)来实现。

宿主细胞中酶的活性可以通过多种方式改变，包括但不限于表达在宿主细胞中表现出增加或降低的溶解度的修饰形式的酶、表达缺乏结构域(通过其酶活性得以抑制)的改变形式的酶，表达对底物具有更高或更低的Kcat或更低或更高的Km的修饰形式的酶，或者表达受途径中另一个分子的反馈或前馈调节的影响较多或较少的改变形式的酶。

术语“编码”或“编码”是指多核苷酸通过转录和翻译机制生产氨基酸序列的过程。

编码本发明所考虑的一种或多种酶的一种或多种基因可以是外源的或内源的。

本发明中实施的方法优选需要使用一种或多种染色体整合构建体，用于将异源核苷酸序列稳定引入染色体上的特定位置，或用于功能性破坏遗传修饰细胞中的一种或多种靶基因。在一些实施方式中，靶基因的破坏阻止相关功能蛋白的表达。在一些实施方式中，靶基因的破坏导致被破坏的基因表达无功能的蛋白质。

可以在本发明的实践中改变的染色体整合构建体的参数包括但不限于同源序列的长度；同源序列的核苷酸序列；整合序列的长度；整合序列的核苷酸序列；以及靶基因座的核苷酸序列。在一些实施方式中，每条同源序列的长度的有效范围为20至5,000个碱基对，优选地50至100个碱基对。在具体实施方式中，每个同源序列的长度为约50个碱基对。有关基因靶标所需同源长度的更多信息，请参见D.Burke等人，Methods in yeastGeneticsAcold spring harbor laboratory course Manual(2000)。

在一些实施方式中，(a)其中意欲插入一种或多种上述DNA构建体的一种或多种破坏的基因可以有利地包含可用于选择转化细胞的一种或多种可选择标记。优选地，所述一种或多种可选标记包含在根据本发明的一种或多种DNA构建体中。

在一些实施方式中，可选择标记是抗生素抗性标记。抗生素抗性标记的说明性实例包括但不限于NAT1、AURl-C、HPH、DSDA、KAN<R>和SH BLE基因产物。来自诺尔斯链霉菌的NAT 1基因产物赋予对诺尔丝菌素的抗性；来自酿酒酵母的AURl-C基因产物赋予对金担子素A(AbA)的抗性；肺炎克雷伯菌的HPH基因产物赋予对潮霉素B的抗性；大肠埃希菌的DSDA基因产物允许细胞在以D-丝氨酸为唯一氮源的板上生长；Tn903转座子的KAN<R>基因赋予对G418的抗性；和来自印度斯坦链异壁菌(Streptoalloteichus hindustanus)的SH BLE基因产物赋予对吉欧霉素(博莱霉素)的抗性。

在一些实施方式中，在分离本发明的经遗传修饰细胞后缺失抗生素抗性标记。本领域技术人员能够在特定的遗传背景下选择合适的标记。

在具体实施方式中，根据本发明的重组细胞缺乏任何抗生素抗性标记。这有利地避免了在选择培养基中添加抗生素的必要性。

在一些实施方式中，可选择标记拯救遗传修饰细胞中的营养缺陷(例如，营养性营养缺陷)。在此类实施方式中，亲本细胞并且特别是亲本酵母包含在氨基酸或核苷酸生物合成途径中起作用的一种或多种基因产物的功能破坏，例如酵母中的HIS3、LEU2、LYS1、LYS2、MET15、TRP1、ADE2和URA3基因产物，这使得亲本细胞无法在不补充一种或多种营养素的情况下在培养基中生长(营养缺陷型表型)。然后可以通过转化具有编码被破坏的基因产物的功能性拷贝的染色体整合的亲本细胞来拯救营养缺陷型表型(在一些实施方式中，基因的功能性拷贝可以源自相近的物种，例如克鲁维酵母属、念珠菌属等)，并且可以根据亲本微生物细胞的营养缺陷型表型的丧失来选择所生产的遗传修饰细胞。

对于包含启动子序列、编码序列(例如编码序列的酶)或终止子序列的核酸序列中的每一个，参考序列在本文中描述。本说明书还涵盖与参考核酸序列具有特定百分比的核酸同一性的核酸序列。

对于每个目标氨基酸序列，本文描述了参考序列。本说明书还涵盖了与参考氨基酸序列具有特定百分比的氨基酸同一性的氨基酸序列(例如酶氨基酸序列)。

由于明显的原因，在所有本说明书中，分别符合所考虑的核苷酸或氨基酸同一性的特定核酸序列或特定氨基酸序列应当进一步导致获得显示出所想要生物活性的蛋白质(或酶)。如本文所用，两条核酸序列之间或两条氨基酸序列之间的“同一性百分比”通过通过比较窗口比较两个最佳比对的序列来确定。

因此，与参考序列(其不包括这些添加或这些缺失)相比，比较窗口中的核苷酸或氨基酸序列的部分可以包括添加或删除(例如“空位”)，以获得两条序列之间的最佳比对。

术语“序列同源性”或“序列同一性”或“同源性”或“同一性”在本文中可互换使用。为了本发明的目的，这里定义为了确定两条氨基酸序列或两条核酸序列的序列同源性或序列同一性的百分比，为了最佳比较的目的而对序列进行比对。为了优化两条序列之间的比对，可以在所比较的两条序列中的任一个中引入空位。这种比对可以在被比较的序列的全长上进行。替选地，比对可以在较短的长度上进行，例如在约20、约50、约100或更多个核酸/碱基或氨基酸上进行。序列同一性是两条序列在报告的比对区域中相同匹配的百分比。

序列的比较和两条序列之间序列同一性百分比的确定可以使用数学算法来完成。技术人员将意识到以下事实：可使用几种不同的计算机程序来比对两条序列并确定两条序列之间的同一性(Kruskal,J.B.(1983)An overview of sequence comparison InD.Sankoff和J.B.Kruskal,(编辑),Time warps,string edits and macromolecules:thetheory and practice of sequence comparison,第1-44页Addison Wesley)。

两条氨基酸序列之间或两条核苷酸序列之间的序列同一性百分比可以使用用于两条序列比对的Needleman和Wunsch算法来确定。(Needleman,S.B.和Wunsch,C.D.(1970)J.Mol.Biol.48,443-453)。氨基酸序列和核苷酸序列都可以通过该算法进行比对。Needleman-Wunsch算法已在计算机程序NEEDLE中实现。

对于本发明的目的，使用来自EMBOSS包的NEEDLE程序(2.8.0版本或更高版本，EMBOSS:The European Molecular Biology Open Software Suite(2000)Rice,P.LongdenJ.和Bleasby,A.Trends in Genetics 16,(6)pp276—277,http://emboss.bioinformatics.nl/)。对于蛋白质序列，EBLOSUM62用于替换矩阵。对于核苷酸序列，使用EDNAFULL。使用的任选参数是空位开放罚分10和空位延伸罚分0.5。不添加末端空位罚分。在输出部分中，响应于指示为输出比对格式的问题“简要同一性和相似性”和“SRS成对”被指示“是”。

在通过如上所述的程序NEEDLE比对之后，查询序列和本发明的序列之间的序列同一性百分比计算如下：比对中显示两条序列中相同氨基酸或相同核苷酸的相应位置的数量除以比对总长度(减去比对中的总空位数后)。如本文定义的同一性可以通过使用NOBRIEF选项从NEEDLE获得，并在程序的输出中标记为“最长-同一性”。

核苷酸和氨基酸序列的相似性，即序列同一性的百分比，可以经由使用几种其他本领域已知的算法的序列比对来确定，优选地用Karlin和Altschul的数学算法(Karlin&Altschul(1993)Proc.Natl.Acad.Sci.USA90:5873-5877)、用hmmalign(HMMER包，http://hmmer.wustl.edu/)或用CLUSTAL算法(Thompson,J.D.,Higgins,D.G.&Gibson,T.J.(1994)Nucleic Acids Res.22,4673-80)(例如可在https://www.ebi.ac.uk/Tools/msa/clustalo/上获得)，或GAP程序(爱荷华大学的数学算法)，或Myers和Miller的数学算法(1989-Cabios 4:11-17)或Clone Manager 9。所用的优选参数是如在https://www.ebi.ac.uk/Tools/msa/clustalo/上设置的默认参数。

序列同一性(序列匹配)的级别可使用如BLAST、BLAT或BlastZ(或BlastX)来计算。将类似算法并入Altschul等人(1990)J.Mol.Biol.215,403-410的BLASTN和BLASTP程序。使用BLASTN程序，评分＝100，字长＝12进行BLAST多核苷酸搜索，以获得与编码相关蛋白质的那些核酸同源的多核苷酸序列。

使用BLASTP程序，评分＝50，字长＝3进行BLAST蛋白搜索，以获得与SHC多肽同源的氨基酸序列。为了获得用于比较目的的缺口比对，如Altschul等人(1997)Nucleic AcidsRes.25,3389-3402中所述，使用Gapped BLAST。当使用BLAST和Gapped BLAST程序时，使用各个程序的默认参数。序列匹配分析可以通过已建立的同源作图技术来补充，如Shuffle-LAGAN(Brudno M.,Bioinformatics 2003b,19Suppl 1:154-162)或马尔可夫随机场。当在本申请中提及序列同一性的百分比时，如果没有另外具体说明，则这些百分比是相对于较长序列的全长来计算的。

在具体的实施方式中，使用CLUSTAL O(1.2.4版)确定两条序列之间的同一性％。

“发酵”或“培养”通常在具有适合于培养细胞的含至少一种简单碳源并且如果必需则共底物的适当培养基的发酵罐中进行。

术语“发酵组合物”是指包含遗传修饰的宿主细胞和由遗传修饰的宿主细胞生产的产物或代谢物的组合物。发酵组合物的实例是全细胞培养液，其可以是容器(例如烧瓶、板或发酵罐)的全部内容物，包括细胞、水相和由遗传修饰的宿主细胞生产的化合物。

术语“培养基”是指培养基(culture medium)或培养基(cultivation medium)或发酵培养基。

为了最大限度地生产肝素前体，用作生产宿主的重组细胞优选具有高碳水化合物利用率。这些特征可以通过诱变和选择、遗传工程化赋予的，或可以是天然的。本发明细胞的发酵培养基或“培养基”或“培养基”可含有至少约10g/L的葡萄糖和/或蔗糖。另外的碳底物可以包括但不限于单糖，例如果糖、甘露糖、木糖和阿拉伯糖；寡聚糖，例如乳糖、麦芽糖、半乳糖或蔗糖；多糖，例如淀粉或纤维素或其混合物，以及来自可再生原料的未纯化混合物，例如奶酪乳清渗透玉米浆、甜菜糖蜜和大麦麦芽。其他碳底物可以包括甘油、乙酸酯和/或乙醇。

因此，预期本发明中使用的碳源可以涵盖多种含碳底物并且仅受细胞并且特别是酵母的选择的限制。

尽管预期所有上述碳底物及其混合物都适用于本发明，但对于细胞而言，优选的碳底物是葡萄糖、果糖和蔗糖，或这些与C5糖例如木糖和/或阿拉伯糖的混合物，并且特别是酵母，被修饰以使用C5糖，并且更特别是葡萄糖。

优选的碳底物是葡萄糖或蔗糖。

除了适当的碳源之外，发酵培养基还可含有本领域技术人员已知的合适的矿物质、盐、辅因子、缓冲剂和其他组分，其适用于培养物的生长和促进生产所想要产品所必需的酶促途径。

除此之外，可以考虑适合于根据本发明的重组细胞生长的额外遗传修饰。

术语“需氧条件”是指培养基中的氧浓度足以使需氧或兼性厌氧细胞并且特别是酵母使用双氧作为末端电子受体。

“微好氧条件”是指氧气浓度低于空气中的浓度(即氧气浓度至多6％ O₂)的培养基。

“适当的培养基”表示包含对细胞的维持和/或生长必需的或有益的营养物的培养基(如无菌液体培养基)，所述营养物例如碳源或碳底物、氮源，例如蛋白胨、酵母提取物、肉类提取物、麦芽提取物、脲、硫酸铵、氯化铵、硝酸铵和磷酸铵；磷源，例如磷酸二氢钾或磷酸氢二钾；微量元素(如金属盐)，例如镁盐、钴盐和/或锰盐；以及生长因子例如氨基酸、维生素、生长促进剂等。根据本发明的术语“碳源”或“碳底物”或“碳来源”表示本领域技术人员可以使用以支持细胞正常生长的任何碳源，包括己糖(例如葡萄糖、半乳糖或乳糖)、戊糖、单糖、寡糖、二糖(例如蔗糖、纤维二糖或麦芽糖)、糖蜜、淀粉或其衍生物、纤维素、半纤维素及其组合。

具体适合生产本发明的重组细胞并且特别是本发明的重组酵母的培养基在下文中进一步更详细地描述。

本发明的肝素前体的“受控”分子量意在指代至少80％、特别是至少85％的通过本发明的方法生产的肝素前体具有通过调节本发明的方法和/或重组细胞的至少一个参数而包含在预定分子量范围内的分子量，例如：

-重组细胞的编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的核酸的性质和来源，

-控制重组细胞的编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的核酸的表达的启动子的性质和来源，

-重组细胞的与具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的编码多肽相关的锚定和/或分泌信号的存在，

-培养重组细胞的步骤期间的培养基的pH，和/或

-培养重组细胞的持续时间。

如本文所用，术语“约”是指如有技术人员所确定的围绕值的合理范围。在某些实施方式中，术语约是指±一个、两个或三个标准偏差。在某些实施方式中，术语约是指±5％、10％、20％或25％。在某些实施方式中，术语约是指±0.1、0.2或0.3对数单位，例如pH单位。

根据本发明引入的遗传修饰的一般特征

-根据已知的遗传工程化技术，将所有基因组修饰插入重组细胞，并且特别是重组酵母中：

-引入到根据本发明的重组细胞基因组中的基因构建体中包含的连续核酸序列具有以下结构：

Prom₁-ORF₁-term₁-ORF₂-gene₂-term₂-…/…-Prom_n-ORF_n-term_n，其中：

-Prom1是调控编码序列ORF1的表达的序列，

-ORF1是编码所需蛋白质PROT1且尤其是所需酶PROT1的核酸序列，

-Term1是转录终止子序列，通过在新合成的mRNA中提供信号来介导转录终止，该信号触发从转录复合物中释放mRNA的过程，并且

-“1”、“2”、…/…“n”可能描述或可能不描述相同的ORF(开放阅读框)、启动子或终止子。核酸序列的顺序并不重要。“n”是一个整数，通常在5到20之间。这些构建体被插入重组细胞染色体之一的受控位置中。在一些实施方式中，插入位点对于所插入的构建体的功能性和所得到的遗传修饰细胞的存活力都不是必需的。

如本领域技术人员将理解的，修饰编码序列以增强其在特定宿主中的表达可能是有利的。遗传密码冗余64个可能密码子，但大多数生物体通常使用这些密码子的子集。在一个物种中最常使用的密码子称为最佳密码子，而那些不经常使用的密码子被归类为稀有或低使用密码子。密码子可以在有时称为“密码子优化”或“控制物种密码子偏倚”的过程中，被替换以反映宿主的优选密码子使用。其他宿主细胞的密码子优化可以使用密码子使用表轻松确定，或可以使用可商够获得的软件进行，例如来自Integrated DNA Technologies的CodonOp(www.idtdna.com/CodonOptfrom)。可以制备含有特定原核或真核宿主优选的密码子的优化编码序列(Murray等人，1989,Nucl Acids Res.17:477-508)，以例如增加翻译速率或生产具有所想要特征的重组RNA转录物，例如与非优化序列生产的转录本相比更长的半衰期。翻译终止密码子也可以被修饰以反映宿主偏好。例如，酿酒酵母和哺乳动物的典型终止密码子分别是UAA和UGA。单子叶植物的典型终止密码子是UGA，而昆虫和大肠埃希菌通常使用UAA作为终止密码子(Dalphin等人，1996,Nucl Acids Res.24:216-8)。

-当重组细胞是酵母细胞并且特别是酿酒酵母酵母细胞时，引入酵母基因组中并且源自除酿酒酵母之外的其他生物体的核酸序列通常是“转码的”(通常是“密码子优化的”)，这意味着这些核酸序列是用在酿酒酵母中表达的最佳密码子使用合成的。来自酿酒酵母的一些核酸序列的核苷酸序列(而非蛋白质序列)也已被修饰(“转码”)以最小化与所述基因的内源拷贝的重组。

-可以通过细胞遗传工程化中使用的标准程序缺失基因。在一些实施方式中，可以通过插入上述基因构建体中的一者来中断靶向缺失的基因，或者替选地，靶向缺失的基因被短核苷酸片段替代。

-通过缺失核酸序列的内源拷贝(如果必需)并将ORF的新拷贝置于诱导型或抑制型启动子的控制下，可以使核酸序列成为“诱导型或抑制型”。诱导型或阻遏型启动子是其活性根据环境条件或外部刺激的变化而被调节或控制(即增加或减少)的启动子。诱导或阻遏可以是人工控制的，其涵盖非生物因素的诱导或阻遏，例如目标细胞并且特别是酵母中天然未存在的化学化合物、光、氧水平、热或冷。诱导型或阻遏型启动子的列表和序列在本说明书的其他地方描述。

根据本发明的重组细胞

发明人设想了具有生产肝素前体的能力的重组细胞，并且尤其是重组酵母。

本发明涉及具有生产肝素前体的能力的重组细胞并且尤其是重组酵母，并且其中这种生产肝素前体的能力是通过通过经由遗传工程化方法已引入其基因组中的多个改变而获得的。

本发明涉及生产肝素前体的重组酵母细胞，其中重组细胞包含：

本发明还涉及一种生产肝素前体的重组宿主细胞，其中所述重组细胞包含：

其中具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽包含分泌信号和任选的锚定信号，使得肝素前体、尤其是具有所想要分子量的肝素前体由宿主细胞生产。

发明人已经发现，通过在这些细胞的基因组中引入多个遗传改变，可以达到由细胞并且尤其是酵母细胞生产肝素前体的能力。

本发明的细胞并且尤其是本发明的酵母细胞生产肝素前体，通过优化UDP-葡萄糖和任选的UDP-N-乙酰-葡萄糖胺的内源代谢来实现，并且指导随后的人工修饰的代谢途径主要朝向肝素前体生产，同时保持所得遗传修饰的细胞的最佳存活力。

已经确定，由根据本发明的重组细胞的肝素前体生产可以通过增加葡萄糖-6-磷酸转化为以下连续中间代谢物来增加：(i)葡萄糖-1-磷酸、UDP-葡萄糖、UDP-葡萄糖醛酸/盐(UDP-Glucuronate)和肝素前体，和(ii)果糖-6-磷酸、葡萄糖胺-6-磷酸、N-乙酰-葡萄糖胺-6-磷酸、N-乙酰-葡萄糖胺-1-磷酸、UDP-N-乙酰-葡萄糖胺和肝素前体，同时保持平衡使所得重组细胞具有良好的存活力。

事实上，为了获得本发明的活的重组细胞，测试了许多不同的构建体以获得活的且有效的重组细胞，并且特别是活的重组酵母。特别地，此类重组酵母难以获得，因为一些中间体的暂时积累显示出对酵母有毒。

在建立适用于制备能够生产肝素前体并且特别是生产具有受控分子量的肝素前体的重组细胞的条件时遇到了意想不到的技术困难。

本发明的肝素前体的“受控”分子量意在指代至少80％、特别是至少85％的通过本发明的方法生产的肝素前体具有通过调节本发明的方法和/或重组细胞的至少一个参数来包含在某些分子量范围内的分子量，例如：

-重组细胞的与具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽相关的锚定和/或分泌信号的存在。

-培养重组细胞的步骤期间的培养基的pH，和/或

-培养重组细胞的持续时间。

事实上，经过大量研究和实验试验，本发明人发现可以培养重组细胞并且特别是重组酵母细胞，更特别是重组酿酒酵母酵母细胞，其能够生产具有受控分子量(使用以下参数控制)的肝素前体：

-本发明的重组细胞、特别是重组酵母的编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的核酸序列的性质和来源的选择；和/或

-本发明的重组细胞、特别是重组酵母的控制编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的核酸序列的表达的启动子的性质和来源；和/或

-除了分泌信号之外，根据本发明的重组细胞、特别是重组酵母的与具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的编码多肽相关的任选存在的锚定信号；和/或

-根据本发明的重组细胞、特别是重组酵母的培养步骤期间培养基的pH；和/或

-培养根据本发明的重组细胞、特别是重组酵母细胞的持续时间。

据发明人所知，这是以前从未实现过的。

编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的核酸获自或源自解肝磷脂土地杆菌。

编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的核酸可以在选自由以下组成的组的启动子的控制下：pTEF1、pCCW12、pCCW12.sba、pCCW12.Sar、pPDC1、pTEF3、pTDH3、pNUP57和pCCW10.ago。

肝素前体的分子量可以在小于50kDa的范围内，优选在约20kDa至约50kDa的范围内。

替选地，肝素前体的分子量可以在大于50kDa的范围内，优选在约50kDa至约250kD的范围内。

在另一个替选方案中，肝素前体的分子量可以在大于100kDa的范围内，优选在约100kDa至约1500kDa的范围内。

编码具有UDP-葡萄糖脱氢酶(UDP-GlcDH或HASB)活性的多肽的核酸可获自或源自以下中的至少一者：拟南芥、小球藻属病毒PBCV1或兽瘟链球菌，并且可以特别源自拟南芥或小球藻属病毒PBCV1。

编码具有肝素前体合酶(HSS)活性的多肽的核酸可获自或源自多杀巴斯德菌。

根据本发明的重组细胞还可以包含编码以下中的一者或多者的至少一种重组核酸：

(ii)具有UDP-N-乙酰葡萄糖胺焦磷酸化酶(QRI1)活性的多肽。

根据本发明的重组细胞还可以包含至少一种编码以下中的一者或多者的重组核酸：

(i)具有磷酸葡萄糖变位酶-1(PGM1)活性的多肽；和/或

(iv)具有磷酸乙酰葡萄糖胺变位酶(PCM1)活性的多肽。

根据本发明的重组细胞还可以使得：

-编码具有磷酸葡萄糖变位酶-1(PGM1)活性的多肽的核酸；和/或

-编码具有磷酸乙酰葡萄糖胺变位酶(PCM1)的多肽的核酸；

获自或源自酿酒酵母。

本发明的重组宿主细胞可特别是酵母。

本发明的重组细胞可以是属于酵母属、或属于念珠菌属、或属于克鲁维酵母属、或属于汉逊酵母属、或属于耶氏酵母属、或属于阿舒囊霉属的酵母细胞，并且特别地可属于酵母属，并且更特别选自由以下组成的组：酿酒酵母、布拉氏酵母、贝酵母、奇异酵母、米卡酵母、卡氏酵母、白念珠菌、光滑念珠菌、热带念珠菌、乳酸克鲁维酵母、马克斯克鲁维酵母、多孢克鲁维酵母、耐热克鲁维酵母、多形汉逊酵母、解脂耶氏酵母、汉逊德巴利酵母和棉阿舒囊霉，并且可优选是酿酒酵母。

本发明的另一目标涉及生产具有所想要分子量的肝素前体的方法，其包括：

(a)在培养基中培养本发明的重组细胞，即本发明的重组酵母细胞或重组宿主细胞，持续足以生产具有所想要分子量的肝素前体的时间；和

在本发明的方法中，肝素前体可具有的分子量为约20kDa至约50kDa并且优选20kDa至30kDa。

在本发明的方法中，肝素前体可替选地具有的分子量为30kDa至50kDa。

在本发明的方法中，肝素前体可替选地具有的分子量为约50kDa至约150kDa。

在本发明的方法中，肝素前体可替选地具有的分子量为约150kDa至约1500kDa。

在本发明的方法中，重组细胞可以是酵母，特别是酵母属的成员，并且可特别是酿酒酵母。

在本发明的方法中，足以生产肝素前体、特别是具有所想要分子量的肝素前体的时间可以是约35小时至约50小时、优选约40小时至约50小时、优选约48小时的时间段。

在本发明的方法中，所生产的肝素前体的分子量可由培养基的pH控制。

在本发明的方法中，肝素前体的分子量可以通过在本发明的方法的培养步骤(a)期间调节培养基的pH来控制。

在本发明的方法中，肝素前体的分子量可通过从培养基中去除生物质来控制。

本发明的方法可以以工业规模进行，优选地其中所述培养基是至少约100L，更优选地在约1000L至约3000L的范围内，甚至更优选约10,000L或甚至更优选约100,000L，或甚至约250,000L。

本发明的另一目的涉及从本发明的重组细胞或从本发明的方法获得的或可获得的肝素前体。

本发明还涉及包含根据本发明的肝素前体的培养基。

本发明还涉及包含根据本发明的肝素前体的组合物。

本发明还涉及工业产品或消费产品或消费品，其包含(i)具有小于50kDa、优选在约20kDa至约50kDa范围内；或大于50kDa，优选在约50kDa至约250kD的范围内；或大于100kDa、优选在约100kDa至约1500kDa的范围内的分子量的肝素前体；(ii)本发明的培养基或(iii)本发明的组合物。

本发明的工业产品或消费产品或消费品可以是美容品、调味品、香料产品、食品、食物、饮料、食品定形剂、药物组合物、膳食补充剂、营养制品、清洁产品、牙科和/或口腔卫生组合物。

本发明的另一个目的涉及本发明的重组细胞用于生产分子量在约20kDa至约50kDa或约50kDa至约1000kDa范围内的肝素前体的用途。

编码具有肝素前体合酶活性的多肽的重组核酸

根据本发明的重组细胞并且特别是本发明的重组酵母包含编码具有肝素前体合酶活性的多肽的一种或多种重组核酸。

根据本发明的具有肝素前体合酶活性的多肽意指将中间代谢物UDP-葡萄糖醛酸/盐和UDP-N-乙酰葡萄糖胺(UDP-GlcNAc)转化为肝素前体[→4)β-D-葡萄糖醛酸(GlcA)(1→4)N-乙酰-a-D-葡萄糖胺(GlcNAc)(l→]_n的多肽。

在一个实施方式中，编码具有肝素前体合酶活性的多肽的重组核酸中的一种或多种在本发明的重组细胞中有功能的诱导型或阻遏型启动子的控制下。

编码具有肝素前体合酶活性的多肽的重组核酸中的一种或多种可以在选自由以下组成的组的启动子的控制下：pCCW12.Sar、pCCW120.sca、pTDH3-1.Sba和pTDH3.Sar。

所述编码具有肝素前体合酶活性的多肽的一种或多种重组核酸可来源于或源自兽瘟链球菌(sz)、小球藻属病毒PBCV1(Vir)、非洲爪蟾(Xenopus laevis，xl)或多杀巴斯德菌(pm)，并且特别是多杀巴斯德菌，如本文实例所示。

根据本发明的重组细胞，并且特别是根据本发明的重组酵母，可包含1至5、特别是1至3个编码具有肝素前体合酶活性的多肽的重组核酸。根据本发明的重组细胞并且特别是根据本发明的重组酵母可例如包含1、2或3个编码具有肝素前体合酶活性的多肽的重组核酸。

说明性地，可将编码具有肝素前体合酶活性的多肽的一种或多种重组核酸插入重组细胞并且特别是重组酵母的JLP1基因内和/或LEU2基因内和/或SAM3基因内，如其在本文的实例中所示。

在本发明的一个实施方式中，本发明的重组细胞并且特别是重组酵母包含：

-1至5个、特别是1至3个编码具有肝素前体合酶活性的多肽的重组核酸；

-所述编码具有肝素前体合酶活性的多肽的一种或多种重组核酸，其来源于或源自兽瘟链球菌(sz)、小球藻属病毒PBCV1(Vir)、非洲爪蟾(xl)或多杀巴斯德菌(pm)，并且特别来源于或源自多杀巴斯德菌；和

-所述编码具有肝素前体合酶活性的多肽的一种或多种重组核酸在本发明的重组细胞中有功能的诱导型或阻遏型启动子的控制下，和/或在选自由pCCW12.Sar、pCCW120.sca、pTDH3-1.Sba和pTDH3.Sar组成的组的启动子的控制下。

编码具有UDP-葡萄糖脱氢酶活性的多肽的重组核酸

根据本发明的重组细胞并且特别是本发明的重组酵母包含编码具有UDP-葡萄糖脱氢酶(UDP-GlcDH或HASB)活性的多肽的一种或多种重组核酸。

根据本发明的具有UDP-葡萄糖脱氢酶(UDP-GlcDH或HASB)活性的多肽意指将中间代谢物尿苷-二磷酸-葡萄糖(Uridine-Diphosphate-Glucose)(UDP-葡萄糖)转化为UDP-葡萄糖醛酸/盐的多肽。

在一个实施方式中，编码具有UDP-葡萄糖脱氢酶(UDP-GlcDH或HASB)活性的多肽的重组核酸中的一者或多者在本发明的重组细胞中有功能的诱导型或阻遏型启动子的控制下。

编码具有UDP-葡萄糖脱氢酶活性的多肽的重组核酸中的一者或多者可以在pCCW12启动子的控制下，并且特别地可以在选自由pCCW12.sk和pCCW12.sba组成的组的启动子的控制下。

编码具有UDP-葡萄糖脱氢酶活性的多肽的一种或多种重组核酸可来源于或源自拟南芥、小球藻属病毒PBCV1或兽瘟链球菌，并且特别是来源于或源自拟南芥或小球藻属病毒PBCV1。

根据本发明的重组细胞、并且特别是根据本发明的重组酵母，可包含1至7个、特别是2至7个编码具有UDP-葡萄糖脱氢酶活性的多肽的重组核酸。根据本发明的重组细胞并且特别是根据本发明的重组酵母可例如包含2或5个编码具有UDP-葡萄糖脱氢酶活性的多肽的重组核酸。

说明性地，可将编码具有UDP-葡萄糖脱氢酶活性的多肽的一种或多种重组核酸插入重组细胞并且特别是重组酵母的JLP1基因内和/或LEU2基因内和/或SAM3基因内，如其在本文的实例中所示。

-1至7个并且特别是2至7个编码具有UDP-葡萄糖脱氢酶活性的多肽的重组核酸；

-所述编码具有UDP-葡萄糖脱氢酶活性的多肽的一种或多种重组核酸来源于或源自拟南芥、小球藻属病毒PBCV1或兽瘟链球菌，并且特别来源于或源自拟南芥或小球藻属病毒PBCV1；和

-所述编码具有UDP-葡萄糖脱氢酶活性的多肽的一种或多种重组核酸在本发明的重组细胞中有功能的诱导型或阻遏型启动子的控制下，和/或在pCCW12启动子的控制下，并且特别地可以在选自由pCCW12.sk和pCCW12.sba组成的组的启动子的控制下。

编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的重组核酸

根据本发明的重组细胞并且特别是根据本发明的重组酵母包含编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的一种或多种重组核酸。

根据本发明的具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽意指降解肝素前体的多肽，即其将给定分子量的肝素前体转化为较低分子量的肝素前体。

如前文所述，本发明的具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽包含分泌信号。

在一个实施方式中，具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽包含分泌信号但不包含锚定信号。

在一个实施方式中，具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽包含分泌信号和锚定信号两者。

在一个实施方式中，所述编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的一种或多种重组核酸在本发明的重组细胞中有功能的诱导型或阻遏型启动子的控制下。

编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的重组核酸中的一者或多者可以在选自由以下组成的组的启动子的控制下：pTEF1、pCCW12、pCCW12.sba、pCCW12.Sar、pPDC1、pTEF3、pTDH3、pNUP57和pCCW10.ago。

在具体的实施方式中，编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的核酸在选自由以下组成的组的启动子的控制下：pTEF1、pCCW12、pCCW12.sba、pCCW12.Sar、pPDC1、pTEF3、pTDH3、pNUP57和pCCW10.ago。

所述编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的一种或多种重组核酸可来源于或源自解肝磷脂土地杆菌(Ph)、萨氏九杯蛛(Cupiennius salei(Csa))、居中平甲蛛(Loxosceles intermedia)(Li)、日本医蛭(Hirudo nipponia)(Hn)、普通矛头蝮(Bothrops atrox)(Ba)或巴西钳蝎(Tityus serrulatus)(Ts)，如本文实施例所示。在具体的实施方式中，所述编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的一种或多种重组核酸来源于或源自解肝磷脂土地杆菌(Ph)。

根据本发明的重组细胞并且特别是根据本发明的重组酵母可仅包含一个编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的重组核酸。根据本发明的重组细胞，并且特别是根据本发明的重组酵母，可以替选地包含1至8个、特别是1至5个编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的重组核酸。

说明性地，可将编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的一种或多种重组核酸插入JLP1基因内和/或LYP1基因内和/或SAM3基因内和/或HIS3基因内，如其在本文的实例中所示。

编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的重组核酸

根据本发明的重组细胞并且特别是根据本发明的重组酵母细胞，可包含编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)活性的多肽的一种或多种重组核酸。

根据本发明的具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽意指将果糖-6-磷酸转化为葡萄糖胺-6-磷酸的多肽。

在一个实施方式中，编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的重组核酸中的一者或多者在本发明的重组细胞中有功能的诱导型或阻遏型启动子的控制下。

编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶合酶活性的多肽的重组核酸中的一者或多者可在pTEF1启动子并且特别是pTEF1.Ago的控制下。

所述编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的一种或多种重组核酸可来源于或源自由酿酒酵母和小球藻属病毒PBCV1组成的组。

根据本发明的重组细胞并且特别是根据本发明的重组酵母可包含1至5个并且特别是1至3个编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的重组核酸。

说明性地，可将编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的一种或多种重组核酸插入重组细胞和特别是重组酵母的SAM3基因内和/或JLP1基因内，如其在本文的实例中所示。

-编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的1至5个并且特别是1至3个重组核酸；

-所述编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的重组核酸来源于或源自由酿酒酵母合小球藻属病毒PBCV1组成的组；和

-所述编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的重组核酸在pTEF1启动子并且特别是pTEF1.Ago的控制下。

编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的重组核酸

根据本发明的重组细胞，并且特别是根据本发明的重组酵母细胞，可包含编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的一种或多种重组核酸。

根据本发明的具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽意指将N-乙酰-葡萄糖胺转化为UDP-N-乙酰-葡萄糖胺的多肽。

在一个实施方式中，编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的重组核酸中的一种或多种在本发明的重组细胞中有功能的诱导型或阻遏型启动子的控制下，例如诱导型或阻遏型启动子pMET6或pCUP1。

编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的重组核酸中的一种或多种可以在启动子pTDH3的控制下。

所述编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的一种或多种重组核酸可来源于或源自酿酒酵母，如本文实例所示。

根据本发明的重组细胞，并且特别是根据本发明的重组酵母，可包含5至15个、特别是5至12个编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的重组核酸。根据本发明的重组细胞并且特别是根据本发明的重组酵母可例如包含8或10个编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的重组核酸。

说明性地，可将编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的一种或多种重组核酸插入重组细胞并且特别是重组酵母的HIS3基因内和/或JLP1基因内和/或SAM3基因内，如其在本文的实例中所示。

-5至15个、特别是5至12个编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的重组核酸；

-所述编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的一种或多种重组核酸来源于或源自酿酒酵母；和

-所述编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的一种或多种重组核酸在本发明的重组细胞中有功能的诱导型或阻遏型启动子的控制下，例如诱导型或阻遏型启动子pMET6或pCUP1和/或在启动子pTDH3的控制下。

编码具有磷酸葡萄糖变位酶-1活性的多肽的重组核酸

根据本发明的重组细胞并且特别是根据本发明的重组酵母可包含编码具有磷酸葡萄糖变位酶-1(PGM1)活性的多肽的一种或多种重组核酸。

根据本发明的具有磷酸葡萄糖变位酶-1(PGM1)活性的多肽意指将葡萄糖-6-磷酸转化为中间代谢物葡萄糖-1-磷酸的多肽。

在一个实施方式中，编码具有磷酸葡萄糖变位酶-1(PGM1)活性的多肽的重组核酸中的一者或多者在本发明的重组细胞中有功能的诱导型或阻遏型启动子的控制下，例如诱导型或阻遏型启动子。

编码具有磷酸葡萄糖变位酶-1(PGM1)活性的多肽的重组核酸中的一者或多者可以在启动子pPDC1的控制下。

编码具有磷酸葡萄糖变位酶-1(PGM1)活性的多肽的一种或多种重组核酸可来源于或源自酿酒酵母，如本文实例所示。

根据本发明的重组细胞并且特别是根据本发明的重组酵母可仅包含一个编码具有磷酸葡萄糖变位酶-1(PGM1)活性的多肽的重组核酸。

说明性地，可将编码具有磷酸葡萄糖变位酶-1活性的多肽的一种或多种重组核酸插入重组细胞并且特别是重组酵母内的SAM3基因，如在本文的实例中所示。

-仅一种编码具有磷酸葡萄糖变位酶-1活性的多肽的重组核酸；

-所述编码具有磷酸葡萄糖变位酶-1活性的多肽的重组核酸来源于或源自酿酒酵母；和

-所述编码具有磷酸葡萄糖变位酶-1活性的多肽的重组核酸在启动子pPDC1的控制下。

编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的重组核酸

根据本发明的重组细胞并且特别是根据本发明的重组酵母，可包含编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶(UGP1)活性的多肽的一种或多种重组核酸。

根据本发明的具有UTP-葡萄糖-1-磷酸尿苷酰转移酶(UGP1)活性的多肽意指将中间代谢物葡萄糖-1-磷酸转化为中间代谢物UDP-葡萄糖的多肽。

在一个实施方式中，编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的重组核酸中的一者或多者在本发明的重组细胞中有功能的诱导型或阻遏型启动子的控制下，例如诱导型或阻遏型启动子pSAM1或pCUP1。

编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的重组核酸中的一者或多者可以在选自由pPDC1和pENO2组成的组的启动子的控制下。

编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的一种或多种重组核酸可来源于或源自酿酒酵母，如本文实例所示。

根据本发明的重组细胞，并且特别是根据本发明的重组酵母，可包含5至15个、特别是5至12个编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的重组核酸。根据本发明的重组细胞并且特别是根据本发明的重组酵母可例如包含8或11个编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的重组核酸。

说明性地，可将编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性基因的多肽的一种或多种重组核酸插入重组细胞并且特别是重组酵母的HIS3基因内和/或JLP1基因内和/或SAM3基因内，如在本文的实例中所示。

-5至15个、特别是5至12个编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的重组核酸；

-所述编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的一种或多种重组核酸来源于或源自酿酒酵母；和

-所述编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的一种或多种重组核酸在本发明的重组细胞中有功能的诱导型或阻遏型启动子的控制下，例如诱导型或阻遏型启动子pSAM1或pCUP1和/或在选自由pPDC1和pENO2组成的组的启动子的控制下。

编码具有葡萄糖胺-6-磷酸N-乙酰转移酶活性的多肽的重组核酸

根据本发明的重组细胞并且特别是根据本发明的重组酵母细胞，可包含编码具有葡萄糖胺-6-磷酸N-乙酰转移酶(GNA1)活性的多肽的一种或多种重组核酸。

根据本发明的具有葡萄糖胺-6-磷酸N-乙酰转移酶(GNA1)活性的多肽意指将葡萄糖胺-6-磷酸转化为N-乙酰-葡萄糖胺-6-磷酸的多肽。

在一个实施方式中，编码具有葡萄糖胺-6-磷酸N-乙酰转移酶活性的多肽的重组核酸中的一者或多者在本发明的重组细胞中有功能的诱导型或阻遏型启动子的控制下。

编码具有葡萄糖胺-6-磷酸N-乙酰转移酶活性的多肽的重组核酸中的一者或多者在启动子pCWP2的控制下。

所述编码具有葡萄糖胺-6-磷酸N-乙酰转移酶活性的多肽的一种或多种重组核酸可来源于或源自酿酒酵母，如在本文的实例中所示。

根据本发明的重组细胞并且特别是根据本发明的重组酵母可仅包含一个编码具有葡萄糖胺-6-磷酸N-乙酰转移酶活性的多肽的重组核酸。

说明性地，可将编码具有葡萄糖胺-6-磷酸N-乙酰转移酶活性的多肽的一种或多种重组核酸插入重组细胞并且特别是重组酵母内的SAM3基因，如在本文的实例中所示。

-仅一个编码具有葡萄糖胺-6-磷酸N-乙酰转移酶活性的多肽的重组核酸；

-所述编码具有葡萄糖胺-6-磷酸N-乙酰转移酶活性的多肽的重组核酸来源于或源自酿酒酵母；和

-所述编码具有葡萄糖胺-6-磷酸N-乙酰转移酶活性的多肽的重组核酸在启动子pCWP2的控制下。

编码具有磷酸乙酰葡萄糖胺变位酶活性的多肽的重组核酸

根据本发明的重组细胞并且特别是根据本发明的重组酵母细胞可包含编码具有磷酸乙酰葡萄糖胺变位酶(PCM1)活性的多肽的一种或多种重组核酸。

根据本发明的具有磷酸乙酰葡萄糖胺变位酶(PCM1)活性的多肽意指将N-乙酰-葡萄糖胺-6-磷酸转化为N-乙酰-葡萄糖胺-1-磷酸的多肽。

在一个实施方式中，编码具有磷酸乙酰葡萄糖胺变位酶活性的多肽的重组核酸中的一者或多者在本发明的重组细胞中有功能的诱导型或阻遏型启动子的控制下。

编码具有磷酸乙酰葡萄糖胺变位酶活性的多肽的重组核酸中的一者或多者可以在pTEF1启动子的控制下。

所述编码具有磷酸乙酰葡萄糖胺变位酶活性的多肽的一种或多种重组核酸可来源于或源自酿酒酵母，如在本文的实例中所示。

根据本发明的重组细胞并且特别是根据本发明的重组酵母可以仅包含一种编码具有磷酸乙酰葡萄糖胺变位酶活性的多肽的重组核酸。

说明性地，可将编码具有磷酸乙酰葡萄糖胺变位酶活性的多肽的一种或多种重组核酸插入重组细胞并且特别是重组酵母内的SAM3基因，如在本文的实例中所示。

-仅一种编码具有磷酸乙酰葡萄糖胺变位酶活性的多肽的重组核酸；

-所述编码具有磷酸乙酰葡萄糖胺变位酶活性的多肽的重组核酸来源于或源自酿酒酵母；和

-所述编码具有磷酸乙酰葡萄糖胺变位酶活性的多肽的重组核酸在pTEF1启动子的控制下。

肝素前体合酶(HSS)

肝素前体合酶是本领域中描述的用于催化UDP-葡萄糖醛酸/盐或UDP-N-乙酰-葡萄糖转化为肝素前体的蛋白质。源自兽瘟链球菌、小球藻属病毒PBCV1、非洲爪蟾或多杀巴斯德菌的肝素前体合酶可称为HSS。

实施测量具有肝素前体合酶活性的多肽的活性水平的方法属于本领域技术人员的常识。

在这方面，本领域技术人员可以有利地参考Bitter和Muir描述的用浓硫酸和咔唑处理后的比色测定方法(Analytical Biochemistry,4,330-334,1962)。

本说明书中具有肝素前体合酶活性的优选多肽是具有选自由SEQ ID NO:1(HSS1)和SEQ ID NO:2(HSS2)组成的组的核酸序列的酶。

根据优选的实施方式，编码具有肝素前体合酶活性的多肽的一种或多种重组核酸可来源于或源自生物体，优选选自由原核生物和真核生物组成的组。在一些实施方式中，编码具有肝素前体合酶活性的多肽的一种或多种重组核酸可来源于或源自古细菌。在一些实施方式中，编码具有肝素前体合酶活性的多肽的一种或多种重组核酸可来源于或源自细菌，并且尤其是兽瘟链球菌(Sz)、小球藻属病毒PBCV1(Vir)、非洲爪蟾(Xl)或多杀巴斯德菌(Pm)，并且特别是多杀巴斯德菌。

根据又一个优选的实施方式，编码具有肝素前体合酶活性的多肽的一种或多种重组核酸可选自由以下组成的组：具有(i)与如序列SEQ ID NO:1(HSS1-Pm)或SEQ ID NO:2(HSS2-Pm)所示的核酸序列的至少65％、有利地至少70％、优选至少80％核酸同一性，和(ii)与分别具有如序列SEQ ID NO:1(HSS1-Pm)或SEQ ID NO:2(HSS2-Pm)所示的核酸序列相同性质的生物活性的核酸序列。

如前所解释，关于该序列的相同性质的生物活性是编码将UDP-葡萄糖醛酸/盐或UDP-N-乙酰-葡萄糖转化成肝素前体的酶的能力。

如本文所述，与参考核酸序列具有至少65％核苷酸同一性的核酸序列涵盖与所述参考核酸序列具有至少66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％和99％核苷酸同一性并且还具有与所述参考核酸序列相同性质的生物活性的核酸序列。

如本文所述，与参考核酸序列具有至少70％核苷酸同一性的核酸序列涵盖与所述参考核酸序列具有至少71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％和99％核苷酸同一性并且还具有与所述参考核酸序列相同性质的生物活性的核酸序列。

如本文所述，与参考核酸序列具有至少80％核苷酸同一性的核酸序列涵盖与所述参考核酸序列具有至少81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％和99％核苷酸同一性并且还具有与所述参考核酸序列相同性质的生物活性的核酸序列。

对于具有源自多杀巴斯德菌的肝素前体合酶活性的多肽的氨基酸序列，本领域的技术人员可分别参考UniProt数据库中的登录号Q8RP78和Q5SGE1，或本文所述的SEQ IDNO:3(HSS1-Pm)或SEQ ID NO:4(HSS2-Pm)。

根据另一个特定的实施方式，编码具有肝素前体合酶活性的多肽的一种或多种重组核酸可以是编码具有选自由以下组成的组的氨基酸序列的多肽的一种或多种核酸：具有与SEQ ID NO:3(Pm HSS1)或SEQ ID NO:4(Pm HSS2)所示的氨基酸序列的至少50％、有利地至少65％、优选至少80％氨基酸同一性，并且还具有与如SEQ ID NO:3(Pm HSS1)或SEQ IDNO:4(Pm HSS2)所示的氨基酸序列相同性质的生物活性的序列。

关于该序列的相同性质的生物活性如前所述，即催化UDP-葡萄糖醛酸/盐或UDP-N-乙酰-葡萄糖转化为肝素前体的能力。

如本文所述，与参考氨基酸序列具有至少50％氨基酸同一性的氨基酸序列涵盖与所述参考氨基酸序列具有至少51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％和99％氨基酸同一性并且还具有与所述参考氨基酸序列相同性质的生物活性的氨基酸序列。

如本文所述，与参考氨基酸序列具有至少65％氨基酸同一性的氨基酸序列涵盖与所述参考氨基酸序列具有至少66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％和99％氨基酸同一性并且还具有与所述参考氨基酸序列相同性质的生物活性的氨基酸序列。

如本文所述，与参考氨基酸序列具有至少80％氨基酸同一性的氨基酸序列涵盖与所述参考氨基酸序列具有至少81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％和99％氨基酸同一性并且还具有与所述参考氨基酸序列相同性质的生物活性的氨基酸序列。

如上所提及，在本发明中编码具有肝素前体合酶活性的多肽的一种或多种重组核酸的表达水平由至少一种启动子和至少一种终止子调控，例如在后文中更详细地定义，其分别存在于编码具有肝素前体合酶活性的多肽的一种或多种重组核酸的5’和3’位置。

UDP-葡萄糖脱氢酶(UDP-GlcDH或HASB)

UDP-葡萄糖脱氢酶是一种本领域已知的催化UDP-葡萄糖转化为UDP-葡萄糖醛酸/盐的蛋白质。来源于拟南芥、小球藻属病毒PBCV1或兽瘟链球菌的基因组的UDP-葡萄糖脱氢酶可称为HASB。

实施测量具有UDP-葡萄糖脱氢酶活性的多肽的活性水平的方法属于本领域技术人员的常识。

在这方面，本领域技术人员可以有利地参考Oka和Jigami所述的方法(FEBSJournal 273,2645-2657,2006)。

在本说明书中具有UDP-葡萄糖脱氢酶活性的优选多肽是EC号为1.1.1.22的酶。

根据优选的实施方式，编码具有UDP-葡萄糖脱氢酶活性的多肽的一种或多种重组核酸可来源于或源自生物体，优选选自包括原核生物和真核生物的组。在一些实施方式中，编码具有UDP-葡萄糖脱氢酶活性的多肽的一种或多种重组核酸可来源于或源自古细菌。在一些优选的实施方式中，编码具有UDP-葡萄糖脱氢酶活性的多肽的一种或多种重组核酸可来源于或源自酵母，并且尤其是拟南芥、小球藻属病毒PBCV1或兽瘟链球菌，并且更特别是拟南芥或小球藻属病毒PBCV1。

根据又一个优选的实施方式，编码具有UDP-葡萄糖脱氢酶活性的多肽的一种或多种重组核酸可选自由以下组成的组：具有(i)与如序列SEQ ID NO:5(At)、SEQ ID NO.6(Vir)或SEQ ID NO.7(Vir)所示的核酸的至少65％、有利地至少70％、优选至少80％核酸同一性，和(ii)与如序列SEQ ID NO:5(At)、SEQ ID NO.6(Vir)或SEQ ID NO.7(Vir)所示的核酸相同性质的生物活性的核酸序列。如序列SEQ ID NO:5(At)、SEQ ID NO:6(Vir)和SEQ IDNO.7(Vir)所示的核酸编码分别源自在本文中还可统称为HASB的拟南芥(At)或小球藻属病毒PBCV1(Vir)的具有UDP-葡萄糖脱氢酶活性的多肽。

关于该序列的相同性质的生物活性如前所解释，即编码将UDP-磷酸转化为UDP-葡萄糖醛酸/盐的多肽的能力。

对于来自拟南芥、小球藻属病毒PBCV1或兽瘟链球菌的具有UDP-葡萄糖脱氢酶活性的多肽的氨基酸序列，本领域技术人员可以分别参考UniProt数据库中的登录号NP_173979.1、NP_048965或KIS19289，或者参考本文所述的SEQ ID NO:8(At)和SEQ ID NO.9(Vir)所示的序列。

根据另一个具体的实施方式，编码具有UDP-葡萄糖脱氢酶活性的多肽的一种或多种重组核酸可以是编码具有选自由以下组成的组的氨基酸序列的多肽的一种或多种核酸：具有与SEQ ID NO:8(At)和SEQ ID NO.9(Vir)的氨基酸序列的至少55％、有利地至少65％、优选至少80％氨基酸同一性，并且还具有与SEQ ID NO:8(At)和SEQ ID NO.9(Vir)的氨基酸序列相同性质的生物活性的序列。

关于该序列的相同性质的生物活性如前所述，即催化UDP-葡萄糖转化为UDP-葡萄糖醛酸/盐的能力。

如本文所述，与参考氨基酸序列具有至少55％氨基酸同一性的氨基酸序列涵盖与所述参考氨基酸序列具有至少56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％和99％氨基酸同一性并且还具有与所述参考氨基酸序列相同性质的生物活性的氨基酸序列。

如上所提及，在本发明中编码具有UDP-葡萄糖脱氢酶活性的多肽的一种或多种重组核酸的表达水平由至少一种启动子和至少一种终止子调控，例如在后文中更详细地定义，其分别存在于编码具有UDP-葡萄糖脱氢酶活性的多肽的一种或多种重组核酸的5’和3’位置。

葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶

葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶(glucuronosyl-disulfoglucosamine glucuronidase)是一种本领域中描述的用于催化肝素前体分子降解成更小的肝素前体分子的蛋白质。由解肝磷脂土地杆菌的基因组编码的葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶可称为HEPC。

本发明的具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽可具有分泌信号和锚定信号两者，或具有分泌信号并且不具有锚定信号，或具有双重分泌和锚定功能的分泌-锚定信号。

实施测量具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的活性水平的方法属于本领域技术人员的常识。

在这方面，本领域技术人员可以有利地在琼脂糖凝胶上监测所获得的肝素前体的分子量。

在本说明书中具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的优选多肽是EC号是3.2.1.56的酶。

根据优选的实施方式，编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的一种或多种重组核酸可来源于或源自生物体，优选选自包括原核生物和真核生物的组。在一些实施方式中，编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的一种或多种重组核酸可来源于或源自古细菌。在一些实施方式中，编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的一种或多种重组核酸可来源于或源自生物体，优选选自酵母。在一些其他优选的实施方式中，编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的一种或多种重组核酸可来源于或源自解肝磷脂土地杆菌。

根据又一个优选的实施方式，编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的一种或多种重组核酸可选自由以下组成的组：具有与SEQ ID NO:10(Ph)或SEQ ID NO:12(Ph)的核酸的至少65％、有利地至少70％、优选至少80％核酸同一性，并且还具有与SEQ ID NO:10(Ph)或SEQ ID NO:12(Ph)的核酸相同性质的生物活性的核酸序列。SEQ ID NO:10(Ph)和SEQ ID NO:12(Ph)的核酸编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽，包含分泌信号和不包含锚定信号，并且来源于或源自解肝磷脂土地杆菌。

根据另一个优选的实施方式，编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的一种或多种重组核酸可选自由以下组成的组：具有与SEQ ID NO:11(Ph)或SEQ ID NO:13(Ph)的核酸的至少65％、有利地至少70％、优选至少80％核酸同一性，并且还具有与SEQ ID NO:11(Ph)或SEQ ID NO:13(Ph)的核酸相同性质的生物活性的核酸序列。SEQ ID NO:11(Ph)和SEQ ID NO:13(Ph)的核酸编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽，包含分泌信号和锚定信号，并且来源于或源自解肝磷脂土地杆菌。

关于该序列的相同性质的生物活性如前所解释，即编码催化肝素前体分子降解为较小肝素前体分子的多肽的能力。

对于来自解肝磷脂土地杆菌的编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的一种或多种重组核酸的氨基酸序列，本领域中的技术人员可参考UniProt数据库中的登录号Q59289，对应于本文所述的SEQ ID NO:10(Ph)和SEQ ID NO:12(Ph)两者。

根据另一个具体的实施方式，编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的一种或多种重组核酸可以是编码具有选自由以下组成的组的氨基酸序列的多肽的一种或多种核酸：具有与包含分泌信号并且不包含锚定信号的SEQ ID NO:14(Ph)的氨基酸序列的至少50％、有利地至少65％、优选至少80％的氨基酸同一性，并且还具有与氨基酸序列SEQ ID NO:14(Ph)相同性质的生物活性的序列。

根据另一个具体的实施方式，编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的一种或多种重组核酸可以是编码具有选自由以下组成的组的氨基酸序列的多肽的一种或多种核酸：具有与包含分泌信号和锚定信号的SEQ ID NO:15(Ph)的氨基酸序列的至少55％、有利地至少65％、优选至少80％氨基酸同一性，并且还具有与SEQ IDNO:15(Ph)的氨基酸序列相同性质的生物活性的序列。

关于该序列的相同性质的生物活性如前所述，即催化肝素前体分子降解为较小肝素前体分子的能力。

如上所提及，在本发明中编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的一种或多种重组核酸的表达水平受至少一种启动子和至少一种终止子调节，例如下文更详细定义的，其分别存在于编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的一种或多种重组核酸的5’和3’位置。

谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)

谷氨酰胺-果糖-6-磷酸酰胺转移酶(glutamine-fructose-6-phosphateamidotransferase)是一种蛋白质，其在本领域中被描述用于催化果糖-6-磷酸(fructose-6-phosphate)转化为葡萄糖胺-6-磷酸(glucosamine-6-phosphate)。源自酿酒酵母和小球藻属病毒PBCV1的谷氨酰胺-果糖-6-磷酸酰胺转移酶可称为GFA1。

实施测量具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的活性水平的方法属于本领域技术人员的常识。

在这方面，本领域技术人员可以有利地参考Shiga Shibatan和Hiroaki Kitazawa(Plant Biotechnology 26,149-152,2009)所述的方法。

本发明中具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的优选多肽是EC号为No.EC2.6.1.16的酶。

根据优选的实施方式，编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的一种或多种重组核酸可来源于或源自生物体，优选选自包括原核生物和真核生物的组。在一些实施方式中，编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的一种或多种重组核酸可来源于或源自古细菌。在一些实施方式中，编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的一种或多种重组核酸可来源于或源自生物体，优选选自枯草芽孢杆菌和酵母。在一些其他优选的实施方式中，编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的一种或多种重组核酸可来源于或源自酿酒酵母或小球藻属病毒PBCV1。

根据又一个优选实施方式，编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的一种或多种重组核酸可选自由以下组成的组：具有(i)与如序列SEQ ID NO:16(Sc)或EQ所示的核酸序列的至少65％、有利地至少70％、优选至少80％核酸同一性，和(ii)与如序列SEQ ID NO:16(Sc)所示的核酸序列相同性质的生物活性的核酸序列。如序列SEQ ID NO:16所示的核酸编码具有来源于酿酒酵母的谷氨酰胺-果糖-6-磷酸酰胺转移酶(其还可称为GFA1)活性的多肽。

根据又一个实施方式，编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的一种或多种重组核酸可选自由以下组成的组：具有(i)与如序列SEQ ID NO:15或SEQ IDNO:16所示的核酸序列的至少65％、有利地至少70％、优选至少80％核酸同一性，和(ii)与如序列SEQ ID NO:17或SEQ ID NO:18所示的核酸序列相同性质的生物活性的核酸序列。如序列SEQ ID NO:17或SEQ ID NO:18所示的核酸序列编码具有来源于小球藻属病毒PBCV1的谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽。

关于该序列的相同性质的生物活性如前所解释，即编码将果糖-6-磷酸转化为葡萄糖胺-6-磷酸的多肽的能力。

对于具有源自酿酒酵母的谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的氨基酸序列，本领域的技术人员可参考UniProt数据库中的登录号NP8012818，或参考本文所述的序列SEQ ID NO.19。

对于具有源自小球藻属病毒PBCV1的谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的氨基酸序列，本领域的技术人员可参考UniProt数据库中的登录号NP_048448，或参考本文所述的序列SEQ ID NO.20。

根据另一个具体的实施方式，编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的一种或多种重组核酸可以是编码具有选自由以下组成的组的氨基酸序列的多肽的一种或多种核酸：具有与SEQ ID NO:19和SEQ ID NO.20的氨基酸序列的至少35％、有利地至少65％、优选至少80％的氨基酸同一性，并且还具有与SEQ ID NO:19或SEQ ID NO:20的氨基酸序列相同性质的生物活性的序列。

关于该序列的相同性质的生物活性如前所述，即催化果糖-6-磷酸转化为葡萄糖胺-6-磷酸的能力。

如本文所述，与参考氨基酸序列具有至少35％氨基酸同一性的氨基酸序列涵盖与所述参考氨基酸序列具有至少36％、37％、38％、39％、40％41％、42％、43％、44％、45％、46％、47％、48％、49％、50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％和99％氨基酸同一性并且还具有与所述参考氨基酸序列相同性质的生物活性的氨基酸序列。

如上所提及，本发明中具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的表达水平由至少一种启动子和至少一种终止子调控，例如在后文中更详细地定义，其分别存在于编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的一种或多种重组核酸的5’和3’位置。

UDP-N-乙酰葡萄糖胺焦磷酸化酶(QRI1)

UDP-N-乙酰葡萄糖胺焦磷酸化酶是一种在本领域中被描述用于催化N-乙酰-葡萄糖胺-6-磷酸(N-acetyl-glucosmine-6-phosphate)转化为UDP-N-乙酰-葡萄糖的蛋白质。源自酿酒酵母的UDP-N-乙酰葡萄糖胺焦磷酸化酶可称为QRI1。

实施测量具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的活性水平的方法属于本领域技术人员的常识。

在这方面，本领域技术人员可以有利地参考Mio等人描述的方法(The Journal ofBiological Chemistry,第273卷,No 23,1998年6月5日,14392-14397)，不同之处在于UDP-N-乙酰-葡萄糖胺是使用Synergi RP Fusion柱通过LC MS/MS检测的。

本发明中具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的优选多肽是EC号为No.EC2.7.7.23的酶。

根据优选的实施方式，编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的一种或多种重组核酸可来源于或源自生物体，优选选自由原核生物和真核生物组成的组。在一些实施方式中，具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的一种或多种重组核酸可来源于或源自古细菌。在一些实施方式中，编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的一种或多种重组核酸可来源于或源自生物体，优选选自枯草芽孢杆菌和酵母。在一些其他优选的实施方式中，编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的一种或多种重组核酸可来源于或源自酵母，并且尤其是酿酒酵母。

根据又一个优选的实施方式，编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的一种或多种重组核酸可选自由以下组成的组：具有(i)与如序列SEQ ID NO:21所示的核酸序列的至少65％、有利地至少70％、优选至少80％核酸同一性，和(ii)与如SEQ ID NO:21所示的核酸序列相同性质的生物活性的核酸序列。如SEQ ID NO:21所示的核酸序列编码具有源自酿酒酵母的UDP-N-乙酰葡萄糖胺焦磷酸化酶(其还可称为QRI1)活性的多肽。

关于该序列的相同性质的生物活性如前所解释，即编码将N-乙酰-葡萄糖胺-6-磷酸转化为UDP-N-乙酰-葡萄糖的多肽的能力。

对于具有源自酿酒酵母的UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的氨基酸序列，本领域的技术人员可参考UniProt数据库中的登录号NP_010180，或参考本文所述的SEQ ID NO.22。

根据另一个具体的实施方式，编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的一种或多种重组核酸可为编码具有选自由以下组成的组的氨基酸序列的多肽的一种或多种核酸：与序列SEQ ID NO.22所示的氨基酸序列具有至少35％、有利地至少45％、优选至少80％氨基酸同一性并且还具有与序列SEQ ID NO.22所示的氨基酸序列相同性质的生物活性的序列。

关于该序列的相同性质的生物活性如前所述，即催化N-乙酰-葡萄糖胺-6-磷酸转化为UDP-N-乙酰-葡萄糖的能力。

如本文所述，与参考氨基酸序列具有至少45％氨基酸同一性的氨基酸序列涵盖与所述参考氨基酸序列具有至少46％、47％、48％、49％、50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％和99％氨基酸同一性并且还具有与所述参考氨基酸序列相同性质的生物活性的氨基酸序列。

如上所提及，在本发明中编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的一种或多种重组核酸的表达水平由至少一种启动子和至少一种终止子调控，例如在后文中更详细地定义，其分别存在于编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的一种或多种重组核酸的5’和3’位置。

磷酸葡萄糖变位酶-1(PGM1)

磷酸葡萄糖变位酶-1酶是一种蛋白质，其在本领域中被描述用于催化葡萄糖-6-磷酸转化为葡萄糖-1-磷酸(Glucose-1-phosphate)。来源于酿酒酵母的磷酸葡萄糖变位酶-1可称为PGM1。

实施测量面对磷酸葡萄糖变位酶-1活性的多肽的活性水平的方法属于本领域技术人员的常识。

就此而言，本领域技术人员可以有利地参考Tiwari和Bhat描述的方法(Biochemical and Biophysical Research Communications 366,340-345,2008)。

本发明中的具有磷酸葡萄糖变位酶-1活性的优选多肽是EC号为No.5.4.2.2的酶。

根据优选的实施方式，编码具有磷酸葡萄糖变位酶-1活性的多肽的一种或多种重组核酸可来源于生物体，优选选自由原核生物和真核生物组成的组。在一些实施方式中，编码具有磷酸葡萄糖变位酶-1活性的多肽的一种或多种重组核酸可来源于或源自古细菌。在一些实施方式中，编码具有磷酸葡萄糖变位酶-1活性的多肽的一种或多种重组核酸可来源于或源自生物体，优选选自细菌。在优选的实施方式中，编码具有磷酸葡萄糖变位酶-1活性的多肽的一种或多种重组核酸可来源于或源自酿酒酵母。

根据一个实施方式，编码具有磷酸葡萄糖变位酶-1活性的多肽的一种或多种重组核酸可选自由以下组成的组：具有(i)与来源于酿酒酵母的、如序列SEQ ID NO:23所示的核酸序列的至少80％核酸同一性，和(ii)与如序列SEQ ID NO:23所示的核酸序列相同性质的生物活性的核酸序列。

关于该序列的相同性质的生物活性如前所解释，即编码将果糖-6-磷酸转化为葡萄糖-1-磷酸的多肽的能力。

对于具有来自酿酒酵母的磷酸葡萄糖变位酶-1活性的多肽的氨基酸序列，本领域的技术人员可参考UniProt数据库中的登录号NP33401，或参考本文所述的SEQ ID NO.24。

根据另一个具体的实施方式，编码具有磷酸葡萄糖变位酶-1活性的多肽的一种或多种重组核酸可以是编码具有选自由以下组成的组的氨基酸序列的多肽的一种或多种核酸：具有与如序列SEQ ID NO:24所示的氨基酸序列的至少80％氨基酸同一性，并且还具有与如序列SEQ ID NO:24所示的氨基酸序列的相同性质的生物活性的序列。

关于该序列的相同性质的生物活性如前所述，即催化葡萄糖-6-磷酸转化为葡萄糖-1-磷酸的能力。

如上所提及，在本发明中编码具有磷酸葡萄糖变位酶-1活性的多肽的一种或多种重组核酸的表达水平由至少一种启动子和至少一种终止子调控，例如在后文中更详细地定义，其分别存在于编码具有磷酸葡萄糖变位酶-1活性的多肽的一种或多种重组核酸的5’和3’位置。

UTP-葡萄糖-1-磷酸尿苷酰转移酶(UGP1)

UTP-葡萄糖-1-磷酸尿苷酰转移酶(UTP-glucose-1-phosphateuridylyltransferase)是一种蛋白质，其在本领域中被描述用于催化葡萄糖-1-磷酸转化为UDP-葡萄糖。源自酿酒酵母的UTP-葡萄糖-1-磷酸尿苷酰转移酶可称为UGP1。

实施测量具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的活性水平的方法属于本领域技术人员的常识。

在这方面，本领域技术人员可以有利地参考Roeben所述的方法(J.Mol.Biol 364,551-560,2006)。

本发明中的具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的优选多肽是EC号为No.2.7.7.9的酶。

根据优选的实施方式，编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的一种或多种重组核酸可来源于或源自生物体，优选选自由原核生物和真核生物组成的组。在一些实施方式中，编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的一种或多种重组核酸可来源于或源自古细菌。在一些实施方式中，编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的一种或多种重组核酸可来源于或源自生物体，优选选自细菌。在优选的实施方式，编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的一种或多种重组核酸可来源于或源自酿酒酵母。

根据具体的实施方式，编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的一种或多种重组核酸可选自由以下组成的组：具有(i)与来源于酿酒酵母的，如序列SEQ IDNO:25所示的核酸的至少80％核酸同一性，和(ii)与如序列SEQ ID NO:25所示的核酸相同性质的生物活性的核酸序列。

关于该序列的相同性质的生物活性如前所解释，即编码将葡萄糖-1-磷酸转化为UDP-葡萄糖的多肽的能力。

对于具有源自酿酒酵母的UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的氨基酸序列，本领域的技术人员可参考UniProt数据库中的登录号NP_32861，或参考本文所述的序列SEQ ID NO.26所示的序列。

根据另一个具体的实施方式，编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的一种或多种重组核酸可以是编码具有选自由以下组成的组的氨基酸序列的多肽的一种或多种核酸：具有与SEQ ID NO:26所示的氨基酸序列的至少80％氨基酸同一性，和还有与如SEQ ID NO:26所示的氨基酸序列相同性质的生物活性的序列。

关于该序列的相同性质的生物活性如前所述，即催化葡萄糖-1-磷酸转化为UDP-葡萄糖的能力。

如上所提及，在本发明中编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的一种或多种重组核酸的表达水平由至少一种启动子和至少一种终止子调控，例如在后文中更详细地定义，其分别存在于编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的一种或多种重组核酸的5’和3’位置。

葡萄糖胺-6-磷酸N-乙酰转移酶(GNA1)

葡萄糖胺-6-磷酸N-乙酰转移酶(Glucosamine-6-phosphate N-acetyltransferase)是一种蛋白质，其在本领域中被描述用于催化葡萄糖胺-6-磷酸转化为N-乙酰-葡萄糖胺-6-磷酸(N-acetyl-glucosamine-6-phosphate)。源自酿酒酵母的葡萄糖胺-6-磷酸N-乙酰转移酶可称为GNA1。

实施测量具有葡萄糖胺-6-磷酸N-乙酰转移酶活性的多肽的活性水平的方法属于本领域技术人员的常识。

在这方面，本领域技术人员可以有利地参考Li等人所述的方法(Anal.Biochem.370,142-146,2007)。

本发明中具有葡萄糖胺-6-磷酸N-乙酰转移酶活性的优选多肽是EC号为No.2.3.1.4的酶。

根据优选的实施方式，编码具有葡萄糖胺-6-磷酸N-乙酰转移酶活性的多肽的一种或多种重组核酸可来源于或源自生物体，优选选自由原核生物和真核生物组成的组。在一些优选的实施方式中，编码具有葡萄糖胺-6-磷酸N-乙酰转移酶活性的多肽的一种或多种重组核酸可来源于或源自酵母并且尤其是酿酒酵母。

根据具体的实施方式，编码具有葡萄糖胺-6-磷酸N-乙酰转移酶活性的多肽的一种或多种重组核酸可选自由以下组成的组：具有(i)与如序列SEQ ID NO:27所示的核酸序列的至少80％核酸同一性，和(ii)与如序列SEQ ID NO:27所示的核酸序列相同性质的生物活性的核酸序列。如序列SEQ ID NO:27所示的核酸序列编码具有源自酿酒酵母的葡萄糖胺-6-磷酸N-乙酰转移酶(其还可称为GNA1)活性的多肽。

关于该序列的相同性质的生物活性如前所解释，即将葡萄糖胺-6-磷酸转化为N-乙酰-葡萄糖胺-6-磷酸的多肽的能力。

对于具有源自酿酒酵母的葡萄糖胺-6-磷酸N-乙酰转移酶活性的多肽的氨基酸序列，本领域的技术人员可参考UniProt数据库中的登录号NP_116637，或参考本文所述的SEQID NO.28。

根据另一个具体的实施方式，编码具有葡萄糖胺-6-磷酸N-乙酰转移酶活性的多肽的一种或多种重组核酸可以是编码具有选自由以下组成的组的氨基酸序列的多肽的一种或多种核酸：具有与SEQ ID NO:28所示的氨基酸序列的至少80％氨基酸同一性，和还有与如SEQ ID NO:28所示的氨基酸序列相同性质的生物活性的序列。

关于该序列的相同性质的生物活性如前所述，即催化葡萄糖胺-6-磷酸转化为N-乙酰-葡萄糖胺-6-磷酸的能力。

如上所提及，在本发明中编码具有葡萄糖胺-6-磷酸N-乙酰转移酶活性的多肽的一种或多种重组核酸的表达水平由至少一种启动子和至少一种终止子调控，例如在后文中更详细地定义，其分别存在于编码具有葡萄糖胺-6-磷酸N-乙酰转移酶活性的多肽的一种或多种重组核酸的5’和3’位置。

磷酸乙酰葡萄糖胺变位酶(PCM1)

磷酸乙酰葡萄糖胺变位酶(phosphoacetylglucosamine mutase)是一种蛋白质，其在本领域中被描述用于催化N-乙酰-葡萄糖胺-6-磷酸转化为N-乙酰-葡萄糖胺-1-磷酸。源自酿酒酵母的磷酸乙酰葡萄糖胺变位酶可称为PCM1。

实施测量具有磷酸乙酰葡萄糖胺变位酶活性的多肽的活性水平的方法属于本领域技术人员的常识。

在这方面，本领域技术人员可以有利地参考Bandini等人所述的方法(MolecularMicrobiology 85(3),513-534,2012)。

本发明中具有磷酸乙酰葡萄糖胺变位酶活性的优选多肽是EC号为NO.5.4.2.3的酶。

根据优选的实施方式，编码具有磷酸乙酰葡萄糖胺变位酶活性的多肽的一种或多种重组核酸可来源于或源自生物体，优选选自由原核生物和真核生物组成的组。在一些优选的实施方式中，编码具有磷酸乙酰葡萄糖胺变位酶活性的多肽的一种或多种重组核酸可来源于或源自酵母，并且尤其是酿酒酵母。

根据具体的实施方式，编码具有磷酸乙酰葡萄糖胺变位酶活性的多肽的一种或多种重组核酸可选自由以下组成的组：具有(i)与如序列SEQ ID NO:29所示的核酸序列的至少80％核酸同一性，和(ii)与如SEQ ID NO:29所示的核酸序列相同性质的生物活性的核酸序列。如SEQ ID NO:29所示的核酸编码具有源自酵母的磷酸乙酰葡萄糖胺变位酶(其还可称为PCM1)活性的多肽。

关于该序列的相同性质的生物活性如前所解释，即将N-乙酰-葡萄糖胺-6-磷酸转化为N-乙酰-葡萄糖胺-1-磷酸的多肽的能力。

对于具有源自酿酒酵母的磷酸乙酰葡萄糖胺变位酶活性的多肽的氨基酸序列，本领域的技术人员可参考UniProt数据库中的登录号NP_010856，或参考本文所述的SEQ IDNO.30。

根据另一个具体的实施方式，编码具有磷酸乙酰葡萄糖胺变位酶活性的多肽的一种或多种重组核酸可以是编码具有选自由以下组成的组的氨基酸序列的多肽的一种或多种核酸：具有与SEQ ID NO:30所示的氨基酸序列的至少80％氨基酸同一性，和还有与如SEQID NO:30所示的氨基酸序列相同性质的生物活性的序列。

关于该序列的相同性质的生物活性如前所述，即催化N-乙酰-葡萄糖胺-6-磷酸转化为N-乙酰-葡萄糖胺-1-磷酸的能力。

如上所提及，在本发明中编码具有磷酸乙酰葡萄糖胺变位酶活性的多肽的一种或多种重组核酸的表达水平由至少一种启动子和至少一种终止子调控，例如在后文中更详细地定义，其分别存在于编码具有磷酸乙酰葡萄糖胺变位酶活性的多肽的一种或多种重组核酸的5’和3’位置。

启动子

如本文所公开，已被遗传工程化以获得根据本发明的重组细胞的目标基因的表达包含在本发明的重组细胞中并且特别是在本发明的重组酵母细胞(特别包括酿酒酵母)中具有功能的适当调控序列。

多种启动子可用于目标编码序列的所想要表达。

根据本发明的启动子可以选自由下列启动子组成的组：

·pTDH3(SEQ ID NO:31)、

·pTDH3.sk(SEQ ID NO:32)、

·pTDH3-1.Sba(SEQ ID NO:33)、

·pTDH3.Sar(SEQ ID NO:34)、

·pENO2(SEQ ID NO:35)、

·pTEF3(SEQ ID NO:36)、

·pTEF1(SEQ ID NO:37)、

·pTEF1.ago(SEQ ID NO:38)、

·pTEF1.sba(SEQ ID NO:39)、

·pPDC1(SEQ ID NO:40)、

·pCCW12(SEQ ID NO:41)、

·pCCW12.Sm(SEQ ID NO:42)、

·pCCW12.sk(SEQ ID NO:43)、

·pCCW12.sba(SEQ ID NO:44)、

·pCCW12.sar(SEQ ID NO:45)、

·pNUP57(SEQ ID NO:46)、

·pCCW10.ago(SEQ ID NO:47)、

·pCWP2(SEQ ID NO:48)、

·pCCW120.Sca(SEQ ID NO:49)和

·pRPLA1(SEQ ID NO:50)。

在本发明中更特别的目标启动子可以选自由以下组成的组：

·pTDH3(SEQ ID NO:31)、

·pTDH3.sk(SEQ ID NO:32)、

·pTDH3-1.Sba(SEQ ID NO:33)、

·pTDH3.Sar(SEQ ID NO:34)、

·pENO2(SEQ ID NO:35)、

·pTEF3(SEQ ID NO:36)、

·pTEF1(SEQ ID NO:37)、

·pTEF1.ago(SEQ ID NO:38)、

·pTEF1.sba(SEQ ID NO:39)、

·pPDC1(SEQ ID NO:40)、

·pCCW12(SEQ ID NO:41)、

·pCCW12.Sm(SEQ ID NO:42)、

·pCCW12.sk(SEQ ID NO:43)、

·pCCW12.sba(SEQ ID NO:44)和

·pCCW12.sar(SEQ ID NO:45)。

所述启动子可以特别选自由以下组成的组：pTDH3、pTDH3-1.Sba、pTDH3.Sar、pENO2、pTEF3、pTEF1、pPDC1、pCCW12、pCCW12.Sm、pCCW12.sk、pCCW12.sba和pCCW12.sar。

替选地，在本发明中的目标启动子可选自由以下组成的组：

·pNUP57(SEQ ID NO:46)和

·pCCW10.ago(SEQ ID NO:47)。

本发明中的其他目标启动子可为：

·pCWP2(SEQ ID NO:48)；

·pCCW120.Sca(SEQ ID NO:49)；和

·pRPLA1(SEQ ID NO:50)。

如前所提及，诱导型或阻遏型启动子是其活性受生物或非生物因子的存在或不存在以及还有所述因子的量控制的启动子。因此，对于一些启动子，当给定因子的量增加或被增加时，它们的活性将尤其被诱导并因此增加，并且相应地，当所述因子的量减少或被减少时，这些相同启动子的活性可以被阻遏并因此降低。包含诱导型或阻遏型启动子的本发明的重组酵母细胞的培养基中的所述一种或多种因子的量可以由本领域技术人员决定并因此控制。

例如，增加包含pCUP-1启动子的根据本发明的重组酵母细胞的培养基中铜的量将诱导并因此增加该启动子控制下的基因的转录。相反，减少所述培养基中铜的量将导致阻遏，并因此导致该启动子控制下的基因转录减少。

在另一个实例中，增加包含pMET6启动子的根据本发明的重组酵母细胞的培养基中甲硫氨酸的量将阻遏并因此减少该启动子控制下的基因的转录。相反，减少所述培养基中甲硫氨酸的量将导致在该启动子控制下的基因转录诱导，并因此导致该启动子控制下的基因转录增加。

由于这个原因，以下启动子在本上下文中称为“诱导型或阻遏型启动子”。

根据第一实施方式，根据本发明的诱导型或阻遏型启动子可以选自包括以下的组：铜诱导型或阻遏型的启动子、甲硫氨酸诱导型或阻遏型启动子以及苏氨酸诱导型或阻遏型启动子，并且特别是pCUP1-铜诱导型或阻遏型。

根据该实施方式，根据本发明的诱导型或阻遏型启动子可以特别是pCUP1(SEQ IDNO:51)。

因此，如上所指定，这些启动子的活性是通过增加甲硫氨酸、铜或苏氨酸的存在来诱导的，并且当甲硫氨酸、铜或苏氨酸的量减少时，它们的活性减弱，即受阻遏。

根据第二实施方式，根据本发明的诱导型或阻遏型启动子可以选自包括以下的组：铜诱导型或阻遏型启动子、赖氨酸诱导型或阻遏型启动子以及甲硫氨酸诱导型或阻遏型启动子，并且特别选自由以下组成的组：

·pMET6-甲硫氨酸诱导型或阻遏型(SEQ ID NO:52)、

·pMET25-甲硫氨酸诱导型或阻遏型(SEQ ID NO:53)和

·pSAM1-甲硫氨酸诱导型或阻遏型(SEQ ID NO:54)。

根据该具体的实施方式，根据本发明的诱导型或阻遏型启动子可以选自由pMET6、pMET25和pSAM1组成的组。

因此，这些启动子的活性被如上所指定的甲硫氨酸、铜、赖氨酸或葡萄糖的存在增加所抑制，并且当甲硫氨酸、铜、赖氨酸或葡萄糖的量减少时，它们的活性增加，即被诱导。

在具体的实施方式中，根据本发明的诱导型或阻遏型启动子可以选自包括以下的组：铜诱导型或阻遏型启动子、葡萄糖诱导型或阻遏型启动子、赖氨酸诱导型或阻遏型启动子、甲硫氨酸诱导型或阻遏型启动子，和苏氨酸诱导型或阻遏型启动子。

在更具体的实施方式中，根据本发明的诱导型或阻遏型启动子可以选自由pCUP1、pMET6、pSAM1和pMET25组成的组。

在本发明的具体的实施方式中，本发明中的目标启动子可以选自由以下组成的组：

·pTDH3(SEQ ID NO:31)，

·pTEF1(SEQ ID NO:37)，

·pTEF1.ago(SEQ ID NO:38)，

·pPDC1(SEQ ID NO:40)，

·pCCW12(SEQ ID NO:41)，

·pCCW12.sk(SEQ ID NO:43)，

·pCCW12.sba(SEQ ID NO:44)，

·pCCW12.sar(SEQ ID NO:45)，

·pCWP2(SEQ ID NO:48)，

·pCCW120.Sca(SEQ ID NO:49)，

·pCUP1(SEQ ID NO:51)，

·pMET6(SEQ ID NO:52)，和

·pSAM1(SEQ ID NO:54)。

还可以使用如Blazeck&Alper(2013)Biotechnol.J.8 46-58所述的合成启动子。

本发明的启动子可来源于来自酵母菌纲的任何生物体，并且可以特别来源于选自由以下中至少一者组成的组的生物体：酿酒酵母、布拉氏酵母、卡氏酵母、贝酵母、树生酵母(Saccharomyces arboricola)、库德里阿兹威酵母(Saccharomyces kudriavzevii)、米卡酵母、棉阿舒囊霉、乳酸克鲁维酵母(Kluveromyces lactis)、巴斯德毕赤酵母(Pichiapastoris)、光滑念珠菌、热带念珠菌、卡氏德巴利酵母(Debaryomyces castelii)、解脂耶氏酵母(Yarrowia lipolitica)和杰丁塞伯林德纳氏酵母(Cyberlindnera jadinii)。

本发明的启动子可以优选来源于选自由以下组成的组的生物体：酿酒酵母(sc)、米卡酵母(Sm)、库德里阿兹威酵母(sk)、贝酵母(sba)和树生酵母(Sar)。

终止子

如其在本文中所公开，已被遗传工程化以获得根据本发明的重组细胞并且特别是根据本发明的重组酵母的目标基因的表达包含在本发明的重组细胞中并且特别是在本发明的重组酵母细胞中(特别是酿酒酵母中)具有功能的适当转录终止子序列。

相同或不同的所述转录终止子可见于文献Yamanishi等人，(2013)ACS syntheticbiology2,337-347。

本发明中更特别的目标终止子可以选自包括以下的组：

·来自编码磷酸丙糖异构酶的基因的tTPI1(SEQ ID NO:55)，

·来自编码O-乙酰高丝氨酸-O-乙酰丝氨酸硫化氢解酶的基因的tMET25(SEQ IDNO:56)、

·tDIT1(SEQ ID NO:57)、

·tRPL3(SEQ ID NO:58)、

·tRPL3.sm(SEQ ID NO:59)、

·tRPL3.sba(SEQ ID NO:60)、

·tRPL41B(SEQ ID NO:61)、

·tRPL15A(SEQ ID NO:62)、

·tRPL15A.sba(SEQ ID NO:63)、

·tIDP1(SEQ ID NO:64)和

·tTEF1.sba(SEQ ID NO:65)。

特别地，所述终止子可以选自由tTPI1、tMET25、tDIT1、tRPL3、tRPL3.sm、tRPL3.sba、tRPL41B、tRPL15A、tRPL15A.sba、tIDP1和tTEF1.sba组成的组。

本发明的终止子可以来源于来自酵母菌纲的任何生物体，并且具体可以来源于选自由酿酒酵母和贝酵母组成的组的生物体。

重组酵母

本发明的重组细胞可以选自由酵母和细菌组成的组。

本发明的重组细胞、例如本发明的重组宿主细胞优选是重组酵母细胞。

通常，与细菌相比，酵母可以快速生长并且可以以更高的密度培养，并且不需要工业环境中的无菌环境。此外，酵母细胞与细菌细胞相比可以更容易从培养基中分离，大大简化了产品提取和纯化的工艺。

本发明的重组细胞、特别是本发明的重组酵母细胞优选是酵母目(Saccharomycetales)细胞。

本发明的重组细胞并且特别是本发明的重组酵母可以尤其属于酵母属，或属于念珠菌属，或属于克鲁维酵母菌属，或属于汉逊酵母属，或属于耶氏酵母属，或属于德巴利酵母属，或属于阿舒囊霉属。

属于酵母属的本发明的重组细胞可以选自由以下组成的组：酿酒酵母、布拉氏酵母、贝酵母、奇异酵母、米卡酵母、卡氏酵母、里约酵母(Saccharomyces cariocanus)、库德里阿兹威酵母(Saccharomyces kudriavzevii)、树生酵母(Saccharomyces arboricolus)、巴斯德酵母(Saccharomyces pastorianus)、葡萄汁酵母(Saccharomyces uvarum)和德尔布酵母(Saccharomyces delbrueckii)。

属于念珠菌属的本发明的重组细胞可以选自由以下组成的组：白念珠菌、光滑念珠菌(Candida glabrata)、热带念珠菌(Candida tropicalis)、都柏林念珠菌(Candidadubliniensis)、近平滑念珠菌(Candida parapsilosis)、葡萄牙念珠菌(Candidalusitaniae)和吉利蒙念珠菌(Candida guilliermondii)。

属于克鲁维酵母属的本发明的重组细胞可以选自由以下组成的组：乳酸克鲁维酵母、马克斯克鲁维酵母、多孢克鲁维酵母、耐热克鲁维酵母、多布克鲁维酵母(Kluyveromyces dobzhanskii)和柳叶克鲁维酵母(Kluyveromyces wickerhamii)。

属于汉逊酵母属的本发明的重组细胞可以选自由以下组成的组：多形汉逊酵母、Ogataea histrianica、Ogataea deakii、Ogataea kolombanensis、Ogataea philodendra、暹罗汉逊酵母(Ogataea siamensis)、狭窄汉逊酵母(Ogataea angusta)、副多形汉逊酵母(Ogataea parapolymorpha)、Ogataea minuta、非发酵汉逊酵母(Ogataea nonfermentans)和Ogataea kodamae。

属于耶氏酵母属的本发明的重组细胞可以选自由以下组成的组：解脂耶氏酵母、Yarrowia parophonii、Yarrowia galli、奥斯陆耶氏酵母(Yarrowia oslonensis)、营养耶氏酵母(Yarrowia alimentaria)、荷兰耶氏酵母(Yarrowia hollandica)和Yarrowiayakushimensis。

属于德巴利酵母属的本发明的重组细胞可以选自由以下组成的组：汉逊德巴利酵母、卡森德巴利酵母(Debaryomyces carsonii)、卡氏德巴利酵母(Debaryomycescastellii)、Debaryomyces marama、西方德巴利酵母(Debaryomyces occidentalis)、卵形德巴利酵母(Debaryomyces oviformis)、尼泊尔德巴利酵母(Debaryomyces nepalensis)、Debaryomyces coudertii、乌德尼德巴利酵母(Debaryomyces udenii)、Debaryomycespsychrosporus和山田德巴利酵母(Debaryomyces yamadae)。

属于阿舒囊霉属的本发明的重组细胞可以选自由棉阿舒囊霉和Ashbya aceri组成的组。

本发明的重组细胞、特别是本发明的重组酵母细胞可以特别选自由以下组成的组：酿酒酵母、布拉氏酵母、贝酵母、奇异酵母、米卡酵母、卡氏酵母、白念珠菌、光滑念珠菌、热带念珠菌、乳酸克鲁维酵母、马克斯克鲁维酵母、多孢克鲁维酵母、耐热克鲁维酵母、多形汉逊酵母、解脂耶氏酵母、汉逊德巴利酵母和棉阿舒囊霉，并且优选酿酒酵母。

在具体的实施方式中，根据本发明的重组酵母细胞属于酵母属、克鲁维酵母属或假囊酵母属(Eremothecium)，更特别地属于选自由以下组成的组的物种：酿酒酵母、马克斯克鲁维酵母、多形汉逊酵母和棉阿舒囊霉。

在一个实施方式中，本发明的重组宿主细胞是所选的酵母，其属于酵母菌目，特别是酵母菌科，并且尤其选自由以下组成的组：解脂耶氏酵母、马克斯克鲁维酵母、多形汉逊酵母、棉阿舒囊霉和酿酒酵母。

本发明的重组细胞可以最优选为酿酒酵母细胞。

如上所提及，根据本发明的重组细胞具有通过插入根据本发明的一种或多种重组核酸生产肝素前体的能力。在某些实施方式中，根据本发明的重组酵母具有通过插入根据本发明的一种或多种重组核酸生产具有受控尺寸的肝素前体的能力。

实施以将特定DNA构建体插入基因内的方法属于本领域技术人员的常识。在后文实施例中更详细地描述相关方法。

然而，遇到了意想不到的技术困难，因为将DNA构建体插入细胞基因组内并且特别是酵母基因组内、例如酿酒酵母基因组内的后果是不可预测的。具体地，细胞、特别是酵母的存活率、以及它们生长和生产所想要肝素前体的能力也是不可预测的。

为了获得本发明的重组细胞、特别是重组酵母，发明人测试了许多不同的构建体，以获得可行且有效的重组细胞、特别是酵母细胞。

培养条件

本发明还涉及本发明的重组细胞用于生产肝素前体、特别是具有受控分子量的肝素前体的用途。

本发明还涉及一种生产肝素前体、特别是具有所想要分子量的肝素前体的方法，其包括：

(a)在培养基中培养根据本发明的重组细胞持续足以生产肝素前体的时间；和

通常，将本发明的细胞并且特别是本发明的酵母在适当的培养基中在约20℃至约37℃范围内的温度下、优选在27至34℃范围内的温度下生长。

适用于本发明的细胞并且特别是本发明的酵母的生长培养基是常见的商业制备的培养基，例如包含酵母氮源、硫酸铵和右旋糖作为碳/能源的液体培养基，或YPD培养基，一种最适合生长的最佳比例的蛋白胨、酵母提取物和右旋糖的掺混物。也可以使用其他限定的或合成的生长培养基，并且用于特定细胞并且特别是酵母生长的适当培养基是微生物学或发酵科学领域的技术人员已知的。

适用于本文的具体培养基是SY培养基，其包含以下成分：

KH₂PO4：100mM；MgSO₄ 7H2O：2,8mM；K₂SO₄：11,5mM；Na₂SO₄：1,1mM；NaCl：2,6mM；CaCl₂ 2H₂O：0,7mM；CuSO₄ 5H₂O：15μM；KI：6μM；FeCl₃：30μM；ZnSO₄ 7H2O：61μM；MnSO₄ H2O：25μM；H₂SO₄：110μM；泛酸半钙盐：42μM；硫胺盐酸盐：59μM；吡哆醇盐酸盐：49μM；肌醇(C₆H₁₂O₆)：555μM；烟酸(C₆H₅NO₂)：29μM；D-生物素：0,82μM；柠檬酸三铵：33mM；和葡萄糖或蔗糖2-30％。

可用于培养基中的碳源包括果糖、甘露糖、木糖和阿拉伯糖；寡聚糖，例如乳糖、麦芽糖、半乳糖或蔗糖；多糖，例如淀粉或纤维素或其混合物，以及来自可再生原料的未纯化混合物，例如奶酪乳清渗透玉米浆、甜菜糖蜜和大麦麦芽。

培养基中可包含的氮源包括蛋白胨、酵母提取物、肉提取物、麦芽提取物、尿素、硫酸铵、氯化铵、硝酸铵、磷酸铵、柠檬酸铵及其组合。

培养基还可包含微量元素(例如金属盐)，例如镁盐、钴盐和/或锰盐；以及生长因子例如氨基酸、维生素、生长促进剂等。

可以包含的维生素的实例是泛酸半钙、硫胺盐酸盐；吡哆醇盐酸盐；肌醇；烟酸；D-生物素、叶酸、对氨基苯甲酸、核黄素。

本发明的培养基还可包含稀有元素，例如CuSO₄·5H₂O、KI、FeCl₃、ZnSO₄·7H₂O、MnSO₄·H₂O或H₂SO₄、MgCl₂、CaCl₂、NaCl、K₂HPO4、KH₂PO4、ZnCl、H₃BO₃、MnSO₄、Na₂MoO₄。

术语“适当的培养基”如上所定义。

用于根据本发明的重组细胞的已知培养基的实例是本领域技术人员已知的，并且呈现于以下出版物D.Burke等人，Methods in yeast Genetics-Acold spring harborlaboratory course Manual(2000)中。

适合发酵的pH范围可以是pH 3.0至pH 7.5，其中优选pH 4至pH 6作为初始条件。

如本说明书其他地方提到的，可以在本发明方法的培养步骤期间调节培养基的pH值，以调节具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的活性，这将影响由本发明的重组细胞并且特别是由本发明的重组酵母生产的肝素前体分子的分子量。

具体地，可以根据意在由重组酵母生产的肝素前体来改变培养基的pH。例如，在培养时间期间，培养基的pH可以保持在4、5.5或6的pH。

在具体的实施方式中，培养基的pH可以在本发明的重组细胞、特别是本发明的重组酵母的培养时间长度期间改变或被改变。如前所提及，酿酒酵母酸化培养其的培养基，从而降低其培养基的pH。例如，培养基的pH可以从6开始，可以降至4，然后回到6。在另一个实例中，培养基的pH可以开始于6，保持或维持在6，然后可以降低至4。

在具体的实施方式中，可以在本发明方法的培养步骤(a)期间调节培养基的pH，使得在本发明方法的培养步骤结束时，培养基的pH与所述培养步骤(a)开始时的pH相同。

在另一个实施方式中，培养基的pH可以在本发明的重组细胞并且特别是本发明的重组酵母细胞的培养时间长度期间保持相同。

根据本发明的重组细胞并且特别是本发明的重组酵母细胞的所述培养时间长度可以根据目标肝素前体的分子量而变化。所述时间长度越长，本发明的重组细胞并且特别是本发明的重组酵母细胞的给定培养基中的肝素前体的分子量越低。

本发明的重组细胞并且特别是本发明中的重组酵母的培养时间的时间长度可以是约35小时至约50小时，优选约40小时至约50小时，并且特别是约48小时的时间段。

发酵可以在需氧条件或微需氧条件下进行。

发酵培养基中肝素前体产物的量可以使用本领域已知的多种方法测定，例如高效液相色谱(HPLC)或气相色谱(GC)。

本方法可以采用分批发酵方法。经典的分批发酵是一个封闭系统，其中培养基的组成在发酵开始时就设定好，并且在发酵过程中不受到人工改变。因此，在发酵开始时，用所想要的一种或多种生物体接种培养基，并且允许发酵发生而不向系统添加任何东西。然而，典型地，“分批”发酵方法或系统在碳源的添加方面是分批的，并且经常尝试控制例如温度、pH和氧浓度的因素。在分批系统中，系统的代谢物和生物质组成不断变化，直到发酵停止。在分批培养中，细胞通过静态滞后期进入高生长对数期，并且最后进入其中生长速率降低或停止的稳定期。如果不处理，处于稳定期的细胞最终会死亡。对数期的细胞通常负责最终产品或中间体的大部分生产。

补料分批系统也可用于本发明。补料分批系统与典型的分批系统相似，不同之处在于碳源底物随着发酵的进行而增量添加。当分解代谢物阻遏(例如葡萄糖阻遏)容易抑制细胞的代谢时并且当想要培养基中的底物量有限时，分批补料系统非常有用。分批补料系统中实际底物浓度的测量很困难，因此需要根据例如pH、溶解氧和废气(例如CO₂)分压的可测量因素的变化进行估计。

分批和补料分批培养方法是本领域常见且众所周知的，并且实例可见于Biotechnology:A Textbook of Industrial Microbiology,Crueger、Crueger和Brock，第二版(1989)Sinauer Associates,Inc.,麻萨诸塞州桑德兰，或Deshpande,Mukund V.,Appl.Biochem.Biotechnol.,36,227,(1992)。尽管本发明以分批模式进行，但预期该方法将适用于连续发酵。

连续发酵是一个开放系统，其中将确定的发酵培养基连续添加到生物反应器，并同时取出等量的条件培养基进行处理。连续发酵通常将培养物维持在恒定的高密度，其中细胞主要处于对数生长期。

连续发酵可以调节影响细胞生长或最终产物浓度的一种因素或任何数量的因素。例如，一种方法将限制性营养物(例如碳源或氮水平)维持在固定速率，并允许所有其他参数变化。在其他系统中，影响生长的多种因素可以连续改变，而通过培养基浊度测量的细胞浓度保持恒定。连续系统努力维持稳态生长条件，并因此由于排出培养基而导致的细胞损失必须与发酵中的细胞生长速率相平衡。调节连续发酵过程的营养物和生长因子的方法以及用于最大化产物形成速率的技术是工业微生物学领域众所周知的。

预期本发明可以使用分批、补料分批或连续方法来实施，并且任何已知的发酵模式都是合适的。另外，预期细胞可作为全细胞催化剂固定在基质上并经受发酵条件以进行生产。

为了仍然提高肝素前体产量，特定的实施方式可以包括在适当的培养基，例如上述培养基中培养本发明的重组细胞，特别是本发明的重组酵母细胞，其中所述培养基包含最佳量的碳源，尤其是葡萄糖或蔗糖。

在优选的实施方式中，所述最佳培养基中所包含的碳源由葡萄糖和/或蔗糖组成。在优选的实施方式中，所述最佳培养基包含1％w/w或更多的葡萄糖和/或蔗糖，具体地包含5％w/w或更多的葡萄糖和/或蔗糖，具体地包含10％w/w或更多的葡萄糖和/或蔗糖，具体地包含15％w/w或更多的葡萄糖和/或蔗糖。在优选的实施方式中，所述最佳培养基包含最多40％w/w葡萄糖，其包括最多35％w/w葡萄糖。

在优选的实施方式，本发明的方法在工业规模上进行。

更具体地，根据本发明的方法的培养基可以是至少约100L，更优选地在约1000L至约3000L的范围内，甚至更优选约10,000L、甚至更优选100,000L，或甚至约250,000L。

本发明还涉及一种用于生产如前所述的肝素前体并且包括以下步骤的方法：

(a)在培养基中培养本发明的重组细胞；和

(b)从所述培养基回收肝素前体，

其中步骤(b)中回收的肝素前体具有通过选择以下控制的分子量：

-本发明的重组细胞并且特别是本发明的重组酵母的编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的一种或多种重组核酸的性质和来源，

-控制本发明的重组细胞并且特别是本发明的重组酵母的编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的一种或多种重组核酸的表达的启动子的性质和来源，

-与本发明的重组细胞并且特别是本发明的重组酵母的编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的一种或多种重组核酸相关的锚定信号的存在或不存在，

-在培养本发明的重组细胞并且特别是本发明的重组酵母的步骤期间培养基的pH，和/或

-本发明的重组细胞并且特别是本发明的重组酵母的培养持续时间。

肝素前体的分子量可以是具体分子量，或更优选特定范围的分子量，例如小于50kDa，范围为约20kDa至约50kDa、大于或等于50kDa，范围为约50kDa至约150kDa，范围为约50kDa至约250kDa，大于或等于100kDa，范围为约100kDa至约1500kDa，范围为约150kDa至约1500kDa、大于1000kDa或大于1500kDa。

本发明还涉及根据本发明的重组细胞并且特别是本发明的重组酵母细胞用于生产分子量在约20kDa至约50kDa或约50kDa至约1000kDa的范围内的肝素前体的用途。

例如，本发明的分泌信号可具有：

-如SEQ ID NO:66所示的核酸序列；和/或

-如SEQ ID NO:67所示的氨基酸序列。

例如，本发明的锚定信号可具有：

-如SEQ ID NO:68所示的核酸序列；和/或

-SEQ ID NO:69所示的氨基酸序列。

分泌信号可通过生产嵌合核酸来融合至具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽，所述嵌合核酸由编码信号肽的核酸序列开始，然后是如前所述的编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的重组核酸。

分泌信号和锚定信号可通过生产嵌合核酸来融合至具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽，所述嵌合核酸由编码信号肽的核酸序列开始，然后是如前所述的编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的重组核酸，然后是编码锚定信号的核酸序列。

此类嵌合核酸序列可以通过本领域技术人员已知的技术获得，例如核酸的化学合成或任何重组技术例如克隆或PCR。

肝素前体的纯化

根据本发明的一个具体方面，肝素前体的发酵生产包括从培养基中分离肝素前体的步骤。从培养基中回收肝素前体是本领域技术人员的常规任务。这可以通过本领域熟知的多种技术来实现，包括但不限于全蒸发、选择性沉淀、过滤、离心、喷雾干燥、冻干或液体提取。本领域技术人员知道如何根据待分离材料的特性来调整每种技术的参数。

优选使用酵母作为本发明的细胞模型，因为合成的肝素前体完全输出到细胞外，从而简化了纯化过程。

气提是用选自氦气、氩气、二氧化碳、氢气、氮气或其混合物的汽提气体实现的。

液体萃取是用有机溶剂作为疏水相实现的，例如戊烷、己烷、庚烷或十二烷。也可以使用再生溶剂。

衍生物

如本文所用的术语“肝素前体”还意在涵盖肝素前体的衍生物，例如但不限于可用于美容品、调味品、香料产品、食品、食物、饮料、食品定形剂、药物组合物、膳食补充剂、营养制品、清洁产品和/或牙科和/或口腔卫生组合物或其组合的应用的肝素(硫酸化肝素前体)。

如本文所用，“肝素前体的衍生物”是已经用化学或酶促方法修饰的肝素前体化合物，并因此包含与肝素前体类似的结构。这些衍生物可表现出与肝素前体相同或不同的生物活性。

合适的肝素前体衍生物包括但不限于肝素、依诺肝素、达肝素和亭扎肝素。

肝素可用作抗凝剂(血液稀释剂)，并可用于减轻心脏病发作和不稳定心绞痛的风险、预防和/或治疗心脏病发作和不稳定心绞痛。

具体地，肝素通常用于抗凝目的，以减轻疾患风险、减少、预防和/或治疗疾患，所述疾患例如但不限于：

·急性冠状综合征，例如NSTEMI；

·心房颤动；

·深静脉血栓和肺栓塞；

·用于心脏手术的心肺转流术；

·用于体外生命支持的ECMO回路；

·血液滤过；和/或

·留置中心或外周静脉导管。

肝素及其低分子量衍生物(例如依诺肝素、达肝素、亭扎肝素)可有效预防处于风险中的人的深静脉血栓和肺栓塞。

肝素通过注射至静脉或皮下来给药。

其他用途包括试管和肾透析机内部的应用。

肝素前体、特别是肝素可以制备为组合物。

制剂和产品

本发明的组合物可掺入制剂/产品，例如营养、药用、兽用、酿酒或美容制剂/产品。

因此，本发明提供了包含本发明的组合物的制剂。例如，本发明可以提供包含本发明的组合物的美容制剂。

本发明还提供了包含本发明的组合物的产品。例如，本发明可以提供包含本发明的组合物的美容品。

“美容品”意在表示意在与人体外部(表皮、毛发系统、指甲、嘴唇和外生殖器官)或牙齿和口腔黏膜接触放置的任何物质或混合物，其目的专门或主要是清洁它们、给它们加香、改变它们外观、保护它们、使它们保持良好状态、纠正体臭和/或其组合。

“物质”意在表示自然状态下或通过任何制造过程获得的化学元素和其化合物，包括保持其稳定性所必需的任何添加剂以及源自所用过程的任何杂质，但不包括可以在不影响物质的稳定性或改变其组成的情况下分离的任何溶剂。

“混合物”旨在表示由两种或更多种物质组成的混合物或溶液。

本发明还提供了本发明的组合物在营养、药用、兽用、酿酒或美容制剂/产品中的用途。

此类制剂或产品在下文中称为“本发明的制剂或产品”。

营养、药用、兽用、酿酒或美容制剂/产品还可任选地包含药用/兽用/美容(包括美容活性)成分，例如赋形剂、载体及其混合物(如果存在)。

“美容”或“美容活性成分”意指任何和所有天然的、天然存在的、性质相同的、人造合成生产的、生物合成生产的、可持续的、可再生的和/或可生物降解的化合物、成分、中间体、分子、物质、原材料或产品，单独地或作为以下的混合物的一部分：化合物、成分、中间体、分子、物质、原材料或产物、共混物、组合物、制剂(包括但不限于皮肤保湿剂、面霜、香膏、精华液、油、眼部、面部彩妆、水洗型洗发产品、免洗发产品、染发剂(包括但不限于天然染发剂)和/或其组合)、成品和相关技术，包括但不限于掺入例如美容制剂中的组分(例如但不限于天然着色剂、防腐剂、乳化剂、抗氧化剂等，其例如对皮肤、头发、头皮等不具有活性，但在成品的配方中发挥作用)、递送系统、营销助剂(例如，应用于半透明制剂的彩色单球体)以及制造与之相关的任何东西的方法，其可用于/用于/旨在用于：

-通过摩擦、倾倒、喷洒、喷雾或以其他方式直接在人体或动物体上或至人体或动物体，和/或通过与人体或动物体的各种外部和/或表面部分(包括但不限于皮肤、头发、体毛、毛发系统、头皮、指甲、嘴唇、外生殖器、牙齿、口腔和/或鼻粘膜等)接触来施加；和/或间接施加在人体或动物体上或至人体或动物体，例如作为纺织品的一部分施加或作为施加至纺织品的递送设备(例如胶囊)或递送系统(例如共混物或制剂)的一部分施加至纺织品；和/或

-清洁、护理、冷却、美化、调理、处理、舒缓、纹理化、增强吸引力、保护、维持、改善、增强、改变和/或变化人体或动物体的外部部分和/或表面(例如但不限于头皮)或人体或动物体的美观外观；和/或主要目的是清洁或加香，或保护或保持良好状态，或对抗体臭，或改变皮肤、口腔粘膜、头皮或头发的外观，或纠正或修复皮肤、口腔粘膜、头皮或头发的不平衡状态(通过提供皮肤的舒缓、愈合、修复或再生、水合)，或以便提供干燥、刺激、损伤或疲劳状态的缓解、润滑、润湿、调理、治愈、消毒、缓解、纠正和/或补救，和/或目的是纠正色素沉着障碍或提供头皮屑、痤疮、刺激和/或炎症等的非药物预防和/或治疗和/或重新平衡皮肤表面上的细菌菌群(例如微生物组)(例如通过提供皮肤表面上的有益细菌菌群的水平)，和/或目的是保持人体或动物体处于良好状态以实现健康和/或福祉目的，和/或通过例如改善施加至人体或身体的产品的外观来改善人体或动物体的外观；和/或

-提供美容和/或皮肤病学功能和/或具有生物活性益处的益处(但不影响身体的结构或功能。为避免疑义，美容品或美容品活性成分(Cosmetic or Cosmetic ActiveIngredient)或其任何部分也可能有资格作为功能性成分和/或营养制品。

“功能性成分”意指提供药用或健康益处的食物成分或食物部分，包括以下中的任一者：类胡萝卜素、膳食纤维、脂肪酸、皂苷、抗氧化剂、类黄酮、异硫氰酸酯、苯酚、多酚(例如白藜芦醇)、植物甾醇或甾烷醇(植物甾醇和植物甾烷醇)、多元醇、益生元、植物雌激素、大豆蛋白、硫化物/硫醇、维生素、葡萄糖胺、防腐剂、水合剂、可食用胶凝成分、可食用凝胶混合物和凝胶组合物、长链脂族饱和伯醇、着色剂、调质剂、乳化剂及其组合。

“营养制品”意指任何和所有天然、天然存在、可持续、合成生产和生物合成生产的化合物、化合物混合物、功能成分、分子、组合物、原材料和中间体(包括与其相关的组分和递送设备(例如胶囊)、其递送系统(例如掺混物或制剂)，及制备前述物质的方法)，它们与健康和/或美容益处以及改善或维持人体外观相关。为避免疑义，营养制品包括可用作食品或饮料补充剂的化合物，无论是固体制剂、胶囊剂、片剂、液体制剂、溶液还是混悬剂。

替选地，营养、药用、兽用、酿酒或美容制剂/产品可以由本发明的组合物组成或基本上由本发明的组合物组成。

美容制剂/产品可以是抗老化制剂。

如本文所用，提及药学、兽用或美容上可接受的赋形剂可以指本领域技术人员已知的药学、兽用或美容上可接受的佐剂、稀释剂和/或载体。

“药学上/兽用/美容上可接受的”意指组合物的附加组分通常是安全的、无毒的，并且在生物学上或其他方面都不是不期望的。例如，附加组分通常可以是无菌且无热原的。此类组分在与本发明的组合物相容且对其接受者无害的意义上必须是“可接受的”。因此，“药学上可接受的赋形剂”包括用于形成制剂的一部分的任何一种或多种化合物，其旨在仅充当赋形剂，即本身不意在不具有生物活性。

营养、药用、兽用、酿酒或美容制剂/产品可以是液体或固体的形式。

用于口服施用的液体剂量制剂/产品包括溶液、乳剂、水性或油性混悬剂、糖浆剂和酏剂。

本文所述的制剂和产品(例如药用、兽用或美容制剂/产品)，例如意在用于经口施用的那些，可以根据本领域技术人员已知的方法来制备，例如通过混合制剂/产品的组分在一起。

制剂或产品(如药用、兽用或美容制剂/产品)可以含有一种或多种附加的成分，例如药物成分和赋形剂，例如甜味剂、调味剂、着色剂和防腐剂。

制剂或产品(例如药用、兽用或美容制剂/产品)还可以含有一种或多种附加的活性成分，例如美容或药物活性成分，例如透明质酸、积雪草提取物、肽例如和及其混合物。

本发明的制剂或产品可以含有与无毒的药学上可接受的赋形剂(或成分)混合的一种或多种活性成分。这些赋形剂(或成分)可以例如是：惰性稀释剂，例如碳酸钙、碳酸钠、乳糖、磷酸钙或磷酸钠；造粒剂和崩解剂，例如玉米淀粉、麦芽糖糊精或海藻酸；粘合剂，例如淀粉、明胶或阿拉伯胶；或润滑剂，例如硬脂酸镁、硬脂酸、滑石及其混合物。

液体制剂或产品(例如药用、兽用或美容制剂/产品)可以包含在胶囊内，胶囊可以是未包衣的或如上所定义包衣的。

合适的药用或兽用载体包括惰性固体稀释剂或填充剂、无菌水溶液和各种有机溶剂。液体载体的实例是糖浆、花生油、橄榄油、磷脂、脂肪酸、脂肪酸胺、聚氧乙烯和水。

此外，载体或稀释剂可包括单独或与蜡混合的本领域已知的任何持续释放材料，例如甘油单硬脂酸酯或甘油二硬脂酸酯。

合适的药物载体包括惰性无菌水溶液和各种有机溶剂。液体载体的实例是糖浆、植物油、磷脂、脂肪酸、脂肪酸胺、聚氧乙烯和水。此外，载体或稀释剂可包括单独或与蜡混合的本领域已知的任何持续释放材料，例如甘油单硬脂酸酯或甘油二硬脂酸酯。

合适的美容载体通常是适用于局部施用至人体外表面例如皮肤和/或头发和/或头皮的那些。

通常，此类载体是皮肤病学可接受的。

短语“皮肤病学上可接受的载体”意指该载体适合于局部施加至角质组织，具有良好的美观特性，与组合物中的活性物质相容，并且不会引起任何不合理的安全性或毒性问题。

载体可以具有多种形式。在一些情况下，组分(例如提取物、防晒活性物质、附加组分)的溶解度或分散性可决定载体的形式和特性。非限制性实例包括简单溶液(如水性或无水)、分散体、乳液和固体形式(例如凝胶、棒、可流动固体或无定形材料)。

皮肤病学上可接受的载体可以是乳液的形式。乳液通常可分为具有连续水相(例如水包油和水包油包水)或连续油相(例如油包水或水包油)。本发明的油相可包含硅油、非硅油例如烃油、酯、醚等及其混合物。水相通常包含水和水溶性成分(例如水溶性保湿剂、调理剂、抗微生物剂、保湿剂和/或其他皮肤护理活性物质)。然而，在一些情况下，水相可包含除水之外的组分，包括但不限于水溶性保湿剂、调理剂、抗微生物剂、保湿剂和/或其他水溶性护肤活性物质。在一些情况下，组合物的非水组分包含湿润剂，例如甘油和/或一种或多种其他多元醇。乳液还可以含有乳化剂。乳化剂可以是非离子型、阴离子型或阳离子型。

载体可含有一种或多种皮肤病学上可接受的亲水性稀释剂。如本文所用，“稀释剂”包括可以将本发明的组合物分散、溶解或以其他方式掺入其中的材料。亲水性稀释剂包括水、有机亲水性稀释剂例如低级一元醇(例如C1-C4)以及低分子量二醇和多元醇，包括丙二醇、聚乙二醇、聚丙二醇、甘油、丁二醇、1,2,4-丁三醇、山梨糖醇酯、1,2,6-己三醇、乙醇、异丙醇、山梨糖醇酯、丁二醇、醚丙醇、乙氧基化醚、丙氧基化醚及其组合。

美容制剂/产品可以任选地包含一种或多种通常用于美容组合物的附加成分(例如，着色剂、肤色剂、皮肤抗老化剂、抗炎剂、防晒剂、这些的组合等)，条件是附加成分不会不利地改变组合物提供的抗糖化益处。

在一些情况下，可能想要选择经由不同生物途径发挥其作用的肤色剂，以便活性剂不会相互干扰，否则会降低两种剂的功效。当掺入组合物中时，附加成分应当适合与人体皮肤组织接触而没有不适当的毒性、不相容性、不稳定性、过敏响应等。

如本文所用的术语“载体”还可以指天然产物或源自自然界的产物，其已被转化或修饰以使其不同于其源自的天然产物，例如麦芽糖糊精。

存在于营养、药用、兽用、酿酒或美容制剂或产品中的本发明组合物的量将根据应用而变化。

典型地，可以存在于营养、药用、兽用、酿酒或美容制剂或产品中的本发明的组合物的量将为约0.001至约50重量％，例如约0.01％至约30％或约1％至约20％的营养、药用、兽用、酿酒或美容制剂或产品，例如约0.01重量％至约20重量％、或约0.1重量％至10重量％、或约1重量％至约5重量％的制剂或产品。

本领域技术人员将认识到，由于遗传密码的简并性质，核苷酸序列不同的多种DNA分子可以用于编码本发明的给定酶。本文引用编码上述生物合成酶的天然DNA序列仅是为了说明本发明的实施方式，并且本发明包括编码在本发明的方法中使用的酶的多肽和蛋白质的氨基酸序列的任何序列的DNA分子。以类似的方式，多肽通常可以耐受其氨基酸序列中的一个或多个氨基酸取代、缺失和插入，而不损失或显著损失所想要的活性。本发明包括具有与本文描述的特定蛋白质不同的氨基酸序列的此类多肽，只要修饰或变体多肽具有参考多肽的酶促合成代谢或分解代谢活性。此外，由本文所示的DNA序列编码的氨基酸序列仅说明本发明的实施方式。

本文描述了可用于本发明的方法、组合物和生物体中的特定基因和蛋白质；然而，应当认识到，此类基因的绝对同一性是不必要的。例如，可以对包含编码多肽或酶的序列的特定基因或多核苷酸进行改变并筛选活性。通常，此类变化包括保守突变和沉默突变。可以使用本领域已知的方法筛选此类修饰或突变的多核苷酸和多肽的功能性酶的表达。

由于遗传密码的固有简并性，编码基本上相同或功能等同的多肽的其他多核苷酸也可以用于克隆和表达编码此类酶的多核苷酸。

本领域技术人员已知的技术可适合于鉴定另外的同源基因和同源酶。一般来说，类似的基因和/或类似的酶可以通过功能分析来鉴定并且具有功能相似性。

本领域技术人员已知的技术可适合于鉴定类似基因和类似酶或任何生物合成途径基因、蛋白质或酶，技术可包括但不限于使用基于目标基因/酶的已公开序列的PCR或者通过简并PCR使用设计用于扩增目标基因中的保守区域的简并引物来克隆基因。此外，本领域技术人员可以使用技术来鉴定具有功能同源性或相似性的同源或类似基因、蛋白质或酶。技术包括检查细胞或细胞培养物的酶催化活性，通过对所述活性的体外酶测定(例如，如本文或Kiritani,K.,Branched-Chain Amino Acids Methods Enzymology,1970中所述)，然后通过纯化来分离具有所述活性的酶，通过例如Edman降解的技术测定酶的蛋白质序列，针对可能的核酸序列设计PCR引物、通过PCR扩增所述DNA序列以及克隆所述核酸序列。为了鉴定同源或相似的基因和/或同源或相似的酶、类似的基因和/或类似的酶或蛋白质，技术还包括将关于候选基因或酶的数据与例如BRENDA、KEGG或MetaCYC的数据库进行比较。可以根据本文教导在上述数据库内鉴定候选基因或酶。

术语“在...和...之间”和“范围从...到...”应被理解为包括端值，除非另有说明。在本说明书和所附权利要求书中，除非上下文另有要求，否则词语“包括/包含(comprise)”以及例如“包括/包含(comprises)”、“包括/包含(comprising)”和“具有”的变体将被理解为暗示包括所规定的整数或步骤、或整数组或步骤组，但不排除任何其他整数或步骤、或整数组或步骤组。术语“包括/包含(comprising)”还意指“包括”以及“由……组成”，例如“包括/包含”X的组合物可以仅由X组成，或者可以包括额外的东西，如X+Y。还必须注意的是，如本说明书和所附权利要求中所使用的，单数形式“一”、“一个”和“该”包括复数指示物，除非内容另外明确指出。举例来说，提及“基因”或“酶”是提及“一种或多种基因”或“一种或多种酶”。

应当理解，本发明不限于本文描述的特定方法、方案和试剂，因为这些可以变化。还应当理解，本文中使用的术语仅是为了描述具体实施方式的目的，并且不旨在限制本发明的范围，本发明的范围仅由所附权利要求书限制。除非另有定义，否则本文中使用的所有技术和科学术语具有与本领域技术人员通常理解的相同含义。根据本发明，可以使用本领域技术范围内的常规分子生物学、微生物学和重组DNA技术。

本发明在其应用中不限于在以下描述中阐述或在附图中示出的组分的构造和布置的细节。本发明能够具有其他实施方式并且能够以各种方式被实践或执行。此外，本文中使用的措辞和术语是为了描述的目的并且不应被视为限制。优选地，本文所用的术语如“Amultilingual glossary of biotechnological terms:(IUPAC Recommendations)”,Leuenberger,H.G.W,Nagel,B.和Kolbl,H.编辑(1995),Helvetica Chimica Acta,CH-4010瑞士巴塞尔)中所述定义。

本说明书全文中引用了多个文献。本文引用的每个文件(包括所有专利、专利申请、科学出版物、制造商说明书、说明书、GenBank登录号序列提交等)，无论上文还是下文，均通过引用整体并入本文。

以下实施例和附图以说明的方式给出，并不暗示对本发明的限制。

实施例

实施例1：用于制备根据本发明的重组酿酒酵母菌株的方案

所有下文实施的重组酿酒酵母菌株均使用标准酵母分子遗传学程序从标准菌株构建(Methods in yeast Genetics-A cold spring harbor laboratory course Manual(2000)by D.Burke,D.Dawson,T.Stearns CSHL Press)。

利用酵母有效重组具有序列同源性的游离DNA末端的能力，将以下提及的基因簇一次性整合到重组酵母中。

此外，为了更好地理解以下基因型：

-jlp1、lyp1、sam3、his3、leu2、trp1和ura3是插入位点。

-小写字母意指所考虑的基因是不活跃的，大写字母反映了活跃基因。

-“::”：基因名称后面意指该基因被后面的内容中断(如果插入多于一个基因，则在括号[]中注明)。基因的中断伴随着编码序列的完全缺失，但保留了启动子。因此，后面跟着“::”的基因是不活跃的，并以小写字母表示。如果没有指定，则插入基因的转录是由被破坏基因的启动子控制的。

-“基因.Kl”意指基因来源于乳酸克鲁维酵母。当本实施例中的基因后面没有任何指示时，这意味着该基因来自酿酒酵母。

更具体地，待克隆的编码序列是人工合成的。对于异源序列(非酵母)，使用酵母密码子使用修饰核酸序列以便获得同义编码序列。使用限制性酶和经典克隆技术，将每条合成序列克隆到转录启动子和转录终止子之间。每条启动子序列之前有与上游基因终止子序列同源的50至200个核苷酸序列。类似地，每个基因的终止子(包含启动子编码序列-终止子的基因)后面是与紧随其后的基因同源的序列。以便每个待整合的单元与上游单元和下游单元都有50-200个核苷酸重叠。对于第一单元，启动子前面有50-200个与它将在其中整合的基因座的酵母染色体核苷酸同源的核苷酸。类似地，对于最后一个单元，终止子后面跟着与它将在其中整合的基因座的酵母染色体核苷酸同源的50-200个核苷酸。

然后从质粒构建体中对每个单元进行PCR扩增，产生具有重叠序列的线性DNA的X单元。该基因中至少一者是营养缺陷型标记，以便选择重组事件。将所有线性片段一次性转化到酵母中，并针对与所用标记相关的营养缺陷型选择重组酵母细胞。序列的完整性然后通过PCR和测序来验证。

实施例2：用于生产肝素前体的对比例

七种重组菌株源自野生型菌株CC788-2D(Cherest等人(2000)J Biol.Chem.275:14056-14063)，其不生产任何肝素前体：YA5398-3、YA5402-1、YA5400-1、YA5401-1、YA5437-18、YA5435-2和DA2531-12。

这七种菌株如下：

YA5398-3：MAT-α,can1-100,his3::[tRPL3-UGP1-pSAM1,pMET6-QRI1-tIDP1,HIS3]x8,leu2::[URA3.Sba-loxP,pCCW12.Sba-HASB.Vir-tRPL3.Sm,pCCW12.Sk-HASB-A.Vir-tTEF1.Sba,pCCW12.Sar-HSS2.Pm-tRPL3.Sba,pCCW120.Sca-HSS2.Pm-tRPL15A.Sm],leu2,trp1,ura3

YA5402-1：MAT-α,can1-100,his3::[tRPL3-UGP1-pSAM1,pMET6-QRI1-tIDP1,HIS3]x8,jlp1::[LEU2.Sba-loxP,pCCW12.Sba-HASB.Vir-tRPL3.Sm,pCCW12.Sk-HASB-A.Vir-tTEF1.Sba,pCCW12.Sar-HSS2.Pm-tRPL3.Sba,pCCW120.Sca-HSS2.Pm-tRPL15A.Sm],leu2,trp1,ura3

YA5400-1：MAT-α,can1-100,his3::[tRPL3-UGP1-pSAM1,pMET6-QRI1-tIDP1,HIS3]x8,jlp1::[LEU2.Sba-loxP,pCCW12.Sba-HASB.Vir-tRPL3.Sm,pCCW12.Sk-HASB-A.Vir-tTEF1.Sba,pCCW12.Sar-HSS2.Pm-tRPL3.Sba,pCCW120.Sca-HSS2.Pm-tRPL15A.Sm,pTEF1.Ago-GFA1-tRPL15A],leu2,trp1,ura3

YA5401-1：MAT-α,can1-100,his3::[tRPL3-UGP1-pSAM1,pMET6-QRI1-tIDP1,HIS3]x8,jlp1::[LEU2.Sba-loxP,pCCW12.Sba-HASB.Vir-tRPL3.Sm,pCCW12.Sk-HASB-A.Vir-tTEF1.Sba,pCCW12.Sar-HSS2.Pm-tRPL3.Sba,pCCW120.Sca-HSS2.Pm-tRPL15A.Sm,pTEF1.Ago-GFA1.Vir-tRPL15A],leu2,trp1,ura3

YA5437-18：MAT-α,can1-100,his3::[tRPL3-UGP1-pSAM1,pMET6-QRI1-tIDP1,HIS3]x8,jlp1::[LEU2.Sba-loxP,pCCW12.Sba-HASB.Vir-tRPL3.Sm,pCCW12.Sk-HASB-A.Vir-tTEF1.Sba,pCCW12.Sar-HSS1.Pm-tRPL15A.Sm],leu2,trp1,ura3

YA5435-2：MAT-α,can1-100,his3::[tRPL3-UGP1-pSAM1,pMET6-QRI1-tIDP1,HIS3]x8,jlp1::[LEU2.Sba-loxP,pCCW12.Sba-HASB.Vir-tRPL3.Sm,pCCW12.Sk-HASB-A.Vir-tTEF1.Sba,pCCW12.Sar-HSS1.Pm-tRPL15A.Sm,pTEF1.Ago-GFA1.Vir-tRPL15A],leu2,trp1,ura3

DA2531-12：MAT-a/MAT-α,CAN1/can1-100,his3/his3::[tRPL3-UGP1-pSAM1,pMET6-QRI1-tIDP1,HIS3]x8,jlp1::[LEU2.Kl-RS,pCUP1-UGP1-tRPL3,pCUP1-QRI1-tIDP1,pPDC1-UGP1-tTPI1,pTDH3-QRI1-tMET25,pCCW12-HASB.At-tRPL15A]/jlp1::[LEU2.Sba-loxP,pCCW12.Sba-HASB.Vir-tRPL3.Sm,pCCW12.Sk-HASB-A.Vir-tTEF1.Sba,pCCW12.Sar-HSS1.Pm-tRPL15A.Sm,pTEF1.Ago-GFA1.Vir-tRPL15A],leu2/leu2,SAM3/sam3::[LEU2.Kl-RS,pPDC1-PGM1-tIDP1,pTEF1.Ago-GFA1-tRPL15A,pENO2-UGP1-tRPL3,pCWP2-GNA1-tTPI1,pTEF1-PCM1-tRPL41B,pCCW12.Sba-HASB.vir-tRPL3.Sm,pCCW12.Sk-HASB-A.Vir-tTEF1.Sba,pCCW12.Sar-HSS2.Pm-tRPL3.Sba,pCCW120.Sca-HSS2.Pm-tRPL15A.Sm,pTDH3-1.Sba-QRI1-tIDP1.Sba,HIS3.Sba-loxP],trp1/trp1,ura3

HSS1.Pm表示编码来自多杀巴斯德菌的肝素前体合酶A的序列(UniProt参考Q8RP78)。HSS2.Pm表示编码来自多杀巴斯德菌的肝素前体合酶B的序列(UniProt参考Q5SGE1)。

所有这些菌株均在用MES 0,1M ph 5.5带挡板的锥形瓶缓冲的25ml SY培养基中在锥形烧瓶中于28℃剧烈搅拌下孵育48小时。

SY培养基包含以下成分：

KH₂PO₄：100mM；MgSO₄7H₂O：2,8mM；K₂SO₄：11,5mM；Na₂SO₄：1,1mM；NaCl：2,6mM；CaCl₂2H₂O：0,7mM；CuSO₄5H₂O：15μM；KI：6μM；FeCl₃：30μM；ZnSO₄7H₂O：61μM；MnSO₄ H₂O：25μM；H₂SO₄：110μM；泛酸半钙盐：42μM；硫胺盐酸盐：59μM；吡哆醇盐酸盐：49μM；肌醇(C₆H₁₂O₆)：555μM；烟酸(C₆H₅NO₂)：29μM；D-生物素：0,82μM；柠檬酸三铵：33mM；和葡萄糖2％

在48小时回收生长培养基并测定其肝素前体含量和质量。加载培养基的等分试样并在0,5％琼脂糖凝胶上电泳，随后用溴酚蓝染色。在用浓硫酸和咔唑处理后，通过比色测定评价培养基中存在的肝素前体的量(Bitter和Muir(1962)analytical biochemistry 4,330-334)。

用这些不同菌株获得的肝素前体的量分别为：

-YA5398-3：170mg.L^-1。

-YA5402-1：170mg.L^-1。

-YA5400-1：110mg.L^-1。

-YA5401-1：180mg.L^-1。

-YA5437-18：200mg.L^-1。

-YA5435-2：190mg.L^-1。

-DA2531-12：235mg.L^-1。

相比之下，如上所指定，天然菌株不生产肝素前体。

该实验结果表明，与不包含根据本发明的所有遗传修饰的其他重组菌株相比，包含根据本发明的修饰的重组菌株在相同条件下培养时生产更大量的肝素前体。

序列

SEQ ID NO:1是源自多杀巴斯德菌的肝素前体合酶(HSS1)的重编码核酸序列

ATGAGTTTGTTCAAAAGGGCGACTGAGCTGTTCAAATCGGGTAACTATAAGGATGCACTGACATTGTACGAGAACATAGCCAAAATTTATGGCTCAGAATCCCTAGTGAAGTATAACATAGATATCTGCAAGAAGAACATAACCCAATCAAAATCGAACAAGATAGAAGAGGACAATATTTCCGGAGAGAATAAGTTCTCCGTCTCTATCAAAGACTTATACAACGAAATTAGTAATTCTGAGCTAGGGATAACAAAGGAGAGATTAGGAGCACCACCCTTGGTAAGCATAATTATGACGAGTCATAATACAGAGAAATTCATCGAAGCTTCCATCAACAGTTTATTATTGCAAACTTATAACAATCTTGAGGTCATTGTGGTAGACGACTACTCCACAGACAAGACCTTCCAAATCGCGTCCAGGATTGCAAACTCGACGTCAAAAGTTAAGACTTTCAGATTGAATTCCAACCTTGGAACGTACTTCGCAAAGAATACGGGAATCCTAAAATCAAAAGGGGACATTATATTCTTTCAAGATTCTGATGATGTCTGCCATCATGAACGTATTGAGAGATGTGTAAATGCACTTTTGTCTAACAAAGATAACATTGCCGTTAGGTGCGCTTATTCTCGTATTAATCTGGAGACCCAGAACATCATAAAGGTCAACGACAACAAGTACAAGTTAGGTCTTATTACCCTAGGAGTATACCGTAAAGTATTTAATGAAATAGGATTCTTCAACTGTACCACTAAGGCAAGTGACGACGAATTTTATCACAGGATCATCAAATACTATGGCAAGAATAGGATAAACAATTTGTTCCTACCTCTATACTACAATACCATGCGTGAAGATAGTTTGTTTAGCGATATGGTCGAGTGGGTAGACGAAAACAACATTAAACAGAAAACAAGTGATGCACGTCAGAATTATCTGCATGAATTCCAAAAGATCCACAACGAAAGGAAATTGAATGAGTTAAAGGAGATTTTCAGCTTCCCCAGGATTCACGATGCCCTACCGATAAGTAAAGAGATGAGCAAGTTGTCTAACCCAAAGATCCCTGTCTACATTAACATTTGCAGTATACCATCTAGGATAAAGCAATTACAGTATACGATCGGAGTGCTGAAGAATCAGTGTGACCATTTCCACATTTACTTAGATGGTTATCCAGAGGTTCCAGATTTCATAAAGAAGCTAGGCAACAAGGCTACCGTAATCAATTGCCAAAACAAGAACGAGTCTATCAGGGACAACGGCAAGTTTATCCTTTTAGAAAAGCTGATCAAAGAGAATAAGGACGGCTATTATATTACCTGTGATGATGACATAAGGTATCCTGCTGACTACACGAATACCATGATAAAGAAGATTAACAAGTACAATGACAAAGCGGCAATAGGTCTACACGGCGTCATCTTTCCGTCCAGAGTGAATAAATACTTCTCATCTGACAGGATTGTTTATAACTTTCAGAAGCCCTTGGAAAACGACACAGCCGTCAACATTTTGGGTACTGGGACCGTTGCATTTAGAGTCTCCATCTTCAACAAGTTTTCCCTGAGCGACTTCGAGCACCCTGGTATGGTGGATATTTATTTCTCAATACTATGCAAGAAGAACAACATATTGCAAGTTTGTATAAGCAGGCCCTCAAACTGGTTAACCGAGGACAACAAGAATACCGAAACCCTGTTCCACGAGTTCCAAAACCGTGACGAGATCCAGAGTAAGTTGATCATCTCTAATAATCCGTGGGGCTACAGTAGCATCTACCCCTTACTTAACAACAATGCCAACTATAGCGAGTTGATACCATGCTTATCATTCTATAATGAGTAA

SEQ ID NO:2是源自多杀巴斯德菌的肝素前体合酶(HSS2)的重编码核酸序列

ATGAAGGGCAAGAAAGAGATGACCCAAATACAGATTGCTAAGAACCCGCCCCAACACGAGAAGGAAAACGAGCTGAATACTTTCCAAAACAAGATCGACTCCCTTAAAACGACATTAAACAAGGACATTATATCACAACAGACATTGTTGGCTAAACAGGACTCAAAGCACCCATTATCTGCAAGTCTTGAGAACGAGAACAAACTTCTTCTTAAACAGTTGCAGCTTGTTTTGCAGGAATTTGAAAAGATATACACTTACAACCAAGCACTAGAGGCTAAGCTTGAGAAAGACAAACAGACCACCTCAATAACCGATTTATATAACGAAGTTGCAAAGTCTGATCTAGGGCTAGTTAAGGAAACTAACAGTGCTAACCCTCTAGTCTCCATTATTATGACTTCGCACAATACCGCTCAATTTATCGAGGCATCGATTAACTCCTTGTTGCTACAGACATATAAGAACATTGAGATAATTATAGTCGATGATGACAGTTCCGACAACACTTTTGAAATCGCCTCAAGGATCGCAAACACAACGTCTAAGGTCCGTGTGTTTCGTTTGAACTCCAATCTGGGCACGTACTTTGCTAAGAATACAGGAATCCTTAAGAGTAAAGGCGACATAATATTCTTCCAGGACTCCGACGACGTTTGTCATCATGAGAGAATCGAAAGGTGCGTGAACATTTTGTTGGCTAACAAAGAGACGATTGCTGTGAGGTGCGCATACAGTAGGCTGGCTCCTGAAACGCAGCATATAATTAAAGTCAACAACATGGATTATAGGCTTGGTTTCATCACACTGGGAATGCATAGGAAGGTTTTCCAAGAGATTGGGTTCTTCAACTGTACAACAAAAGGCAGTGACGACGAGTTCTTCCACCGTATAGCTAAATACTACGGTAAAGAAAAGATTAAGAACCTTTTATTGCCGCTTTATTATAACACGATGCGTGAAAACTCACTTTTCACTGACATGGTCGAGTGGATCGACAACCATAATATCATACAGAAGATGTCTGACACACGTCAACACTATGCTACTCTGTTTCAGGCGATGCATAATGAGACTGCATCACACGACTTCAAGAACTTGTTCCAGTTCCCACGTATATACGACGCCTTGCCTGTTCCACAGGAGATGTCTAAGTTATCTAACCCTAAAATACCGGTGTACATAAATATATGCAGTATACCATCTAGGATTGCACAGTTACGTAGGATTATTGGGATCTTAAAGAACCAGTGCGACCACTTTCACATATACCTAGACGGATACGTGGAGATCCCTGATTTTATTAAGAATCTTGGTAATAAAGCAACGGTCGTCCACTGCAAAGACAAGGACAACTCTATTAGGGACAACGGCAAGTTTATTCTACTGGAAGAGTTAATAGAAAAGAATCAAGACGGGTACTACATAACGTGCGACGACGACATTATCTATCCATCGGACTATATAAACACAATGATTAAGAAGCTGAACGAGTATGATGACAAGGCGGTCATAGGGCTTCACGGAATATTATTTCCGTCAAGGATGACGAAATACTTTTCCGCCGATAGGCTTGTTTATTCGTTTTACAAACCCCTAGAGAAAGACAAAGCAGTAAATGTTCTTGGGACCGGAACTGTCTCATTCAGAGTTAGTCTGTTCAACCAATTCTCCCTTTCAGACTTCACCCATTCGGGAATGGCCGACATCTACTTCTCTCTATTGTGCAAGAAGAACAACATTTTACAAATCTGTATCTCCAGACCGGCAAATTGGTTGACGGAAGATAACAGAGATTCTGAGACCTTATACCACCAGTATAGAGATAATGACGAGCAGCAGACTCAGTTGATCATGGAAAATGGGCCCTGGGGTTACTCAAGTATCTATCCACTTGTCAAGAATCACCCGAAGTTTACGGACTTAATACCATGTTTGCCTTTCTACTTCCTATAA

SEQ ID NO:3是源自多杀巴斯德菌的肝素前体合酶(HSS1)的氨基酸序列

MSLFKRATELFKSGNYKDALTLYENIAKIYGSESLVKYNIDICKKNITQSKSNKIEEDNISGENKFSVSIKDLYNEISNSELGITKERLGAPPLVSIIMTSHNTEKFIEASINSLLLQTYNNLEVIVVDDYSTDKTFQIASRIANSTSKVKTFRLNSNLGTYFAKNTGILKSKGDIIFFQDSDDVCHHERIERCVNALLSNKDNIAVRCAYSRINLETQNIIKVNDNKYKLGLITLGVYRKVFNEIGFFNCTTKASDDEFYHRIIKYYGKNRINNLFLPLYYNTMREDSLFSDMVEWVDENNIKQKTSDARQNYLHEFQKIHNERKLNELKEIFSFPRIHDALPISKEMSKLSNPKIPVYINICSIPSRIKQLQYTIGVLKNQCDHFHIYLDGYPEVPDFIKKLGNKATVINCQNKNESIRDNGKFILLEKLIKENKDGYYITCDDDIRYPADYTNTMIKKINKYNDKAAIGLHGVIFPSRVNKYFSSDRIVYNFQKPLENDTAVNILGTGTVAFRVSIFNKFSLSDFEHPGMVDIYFSILCKKNNILQVCISRPSNWLTEDNKNTETLFHEFQNRDEIQSKLIISNNPWGYSSIYPLLNNNANYSELIPCLSFYNE

SEQ ID NO:4是源自多杀巴斯德菌的肝素前体合酶(HSS2)的氨基酸序列

MAKGKKEMTQIQIAKNPPQHEKENELNTFQNKIDSLKTTLNKDIISQQTLLAKQDSKHPLSASLENENKLLLKQLQLVLQEFEKIYTYNQALEAKLEKDKQTTSITDLYNEVAKSDLGLVKETNSANPLVSIIMTSHNTAQFIEASINSLLLQTYKNIEIIIVDDDSSDNTFEIASRIANTTSKVRVFRLNSNLGTYFAKNTGILKSKGDIIFFQDSDDVCHHERIERCVNILLANKETIAVRCAYSRLAPETQHIIKVNNMDYRLGFITLGMHRKVFQEIGFFNCTTKGSDDEFFHRIAKYYGKEKIKNLLLPLYYNTMRENSLFTDMVEWIDNHNIIQKMSDTRQHYATLFQAMHNETASHDFKNLFQFPRIYDALPVPQEMSKLSNPKIPVYINICSIPSRIAQLRRIIGILKNQCDHFHIYLDGYVEIPDFIKNLGNKATVVHCKDKDNSIRDNGKFILLEELIEKNQDGYYITCDDDIIYPSDYINTMIKKLNEYDDKAVIGLHGILFPSRMTKYFSADRLVYSFYKPLEKDKAVNVLGTGTVSFRVSLFNQFSLSDFTHSGMADIYFSLLCKKNNILQICISRPANWLTEDNRDSETLYHQYRDNDEQQTQLIMENGPWGYSSIYPLVKNHPKFTDLIPCLPFYFL

SEQ ID NO:5是源自拟南芥的UDP-葡萄糖脱氢酶(HASB)的核酸序列

ATGGTCAAAATATGCTGTATCGGGGCTGGATATGTCGGTGGGCCTACAATGGCCGTTATGGCCCTAAAGTGTCCAGAGATTGAAGTCGTGGTAGTTGATATATCGGAGCCACGAATTAACGCATGGAACTCAGACCGTCTACCAATTTATGAGCCAGGGTTAGAGGATGTCGTCAAACAGTGTAGAGGGAAGAATTTGTTCTTCTCTACAGATGTAGAGAAGCATGTATTTGAGTCAGATATAGTGTTTGTTTCGGTAAACACTCCTACGAAAACGCAGGGTCTGGGTGCAGGTAAAGCAGCAGATTTGACATATTGGGAGTCCGCTGCTCGCATGATAGCTGATGTGAGCAAATCGTCGAAAATCGTCGTTGAAAAGAGTACAGTACCAGTTCGTACAGCCGAGGCTATAGAAAAGATTTTAACGCACAATTCGAAGGGTATCGAATTCCAGATCTTATCAAATCCAGAATTCTTGGCCGAAGGGACGGCGATTAAAGACTTATATAACCCTGATAGAGTTCTAATCGGTGGCAGGGACACCGCTGCGGGACAAAAGGCCATTAAGGCGTTGCGTGACGTGTATGCCCACTGGGTTCCTGTTGAGCAAATAATCTGTACTAATTTATGGAGTGCCGAGCTATCAAAGTTGGCTGCGAACGCATTTCTAGCTCAAAGGATAAGTTCAGTAAACGCAATGTCAGCGCTTTGTGAGGCAACTGGTGCTGACGTAACCCAAGTCGCTCACGCCGTTGGAACCGACACTAGAATTGGACCGAAGTTTCTTAACGCATCCGTAGGCTTCGGCGGATCTTGCTTTCAGAAAGACATCCTGAATCTTATTTACATCTGCGAATGCAATGGTCTTCCAGAAGCAGCCAATTATTGGAAACAGGTAGTCAAGGTAAATGACTACCAAAAGATTAGGTTTGCTAATCGAGTCGTATCTTCTATGTTCAACACCGTCTCCGGTAAGAAAATTGCTATTTTGGGATTTGCGTTCAAGAAGGACACCGGCGACACGCGTGAAACTCCTGCCATAGATGTGTGTAATCGCCTCGTGGCTGATAAAGCAAAGCTGTCGATCTATGATCCGCAAGTATTAGAAGAGCAGATCCGCCGTGATCTGTCCATGGCCCGATTCGATTGGGACCATCCAGTCCCACTCCAGCAGATCAAAGCTGAAGGTATCTCCGAACAGGTTAACGTTGTGTCCGACGCCTACGAGGCTACGAAGGATGCTCATGGTTTATGTGTTTTAACCGAATGGGACGAATTCAAGTCACTTGATTTTAAGAAGATCTTTGATAATATGCAGAAACCCGCTTTCGTTTTCGACGGAAGAAACGTGGTCGACGCTGTGAAATTGAGAGAAATTGGATTCATAGTATATTCCATAGGTAAACCTCTGGATAGTTGGCTCAAGGATATGCCGGCTGTTGCATAA

SEQ ID NO:6是源自小球藻属病毒PBCV-1的UDP-葡萄糖脱氢酶(HASB)的重编码核酸序列

ATGAGTAGAATTGCTGTCGTTGGATGCGGTTACGTGGGTACGGCCTGCGCCGTACTTTTGGCGCAGAAGAACGAAGTTATCGTTTTGGATATCTCGGAGGACCGGGTACAACTGATTAAGAATAAGAAGTCACCTATAGAAGATAAGGAAATCGAAGAATTCCTGGAGACGAAAGATTTGAATCTAACAGCGACGACGGATAAGGTGCTCGCCTATGAGAATGCTGAATTCGTTATAATAGCTACACCGACCGATTACGATGTCGTCACTAGATATTTCAACACTAAGTCTGTTGAAAATGTGATAGGCGATGTCATTAAGAACACTCAGACACACCCTACTATAGTGATCAAGAGTACTATTCCAATCGGTTTCGTGGATAAAGTTAGAGAACAGTTCGATTATCAAAATATTATCTTCTCGCCGGAATTCTTGAGAGAAGGACGAGCATTATATGATAATCTTTACCCCTCCCGTATCATCGTCGGTGATGACTCCCCAATTGCCTTAAAATTCGCGAATCTCTTGGTCGAGGGTAGCAAAACTCCACTAGCTCCCGTATTAACTATGGGTACGCGAGAGGCCGAAGCTGTAAAACTATTTTCAAATACATATTTGGCTATGAGAGTAGCATACTTCAATGAGCTAGACACATTTGCAATGTCCCATGGTATGAACGCAAAAGAGATTATCGACGGAGTCACACTAGAACCAAGGATAGGGCAGGGTTATTCGAATCCTTCATTTGGGTATGGAGCCTATTGTTTCCCAAAAGATACAAAGCAATTGTTGGCTAATTTTGAAGGGGTTCCACAAGATATTATTGGCGCAATCGTAGAGTCTAACGAAACTAGAAAGGAGGTTATTGTTTCTGAGGTCGAGAACAGATTTCCGACCACAGTTGGCGTATATAAGTTGGCTGCTAAAGCTGGTTCGGATAATTTCAGGTCTAGTGCGATAGTCGATATCATGGAAAGGTTGGCTAATAAGGGCTACCACATCAAAATATTTGAACCTACCGTTGAACAATTTGAGAATTTTGAGGTAGATAATAATCTCACAACTTTTGCAACCGAGTCTGATGTAATAATTGCGAACAGAGTTCCAGTCGAACATCGCATTCTGTTTGGGAAGAAGTTAATAACACGGGATGTCTATGGGGATAA

SEQ ID NO:7是源自小球藻属病毒PBCV-1的UDP-葡萄糖脱氢酶(HASB-A)的重编码核酸序列

ATGTCACGAATCGCAGTAGTTGGCTGTGGGTACGTGGGAACCGCATGCGCTGTACTGCTGGCGCAAAAGAATGAGGTAATCGTTCTTGATATTAGTGAGGATAGGGTCCAACTAATCAAGAACAAGAAATCCCCGATCGAAGATAAGGAGATTGAAGAATTCTTGGAAACAAAAGACCTAAACTTAACTGCAACAACTGACAAAGTTTTAGCCTACGAAAACGCTGAGTTTGTGATTATAGCGACACCCACAGATTATGACGTAGTTACCAGATACTTTAACACGAAGTCCGTAGAGAACGTCATTGGAGATGTTATAAAGAATACTCAGACTCATCCTACGATAGTAATAAAGTCAACCATTCCCATAGGTTTCGTAGATAAGGTTAGGGAGCAATTCGATTACCAGAACATTATATTTTCGCCAGAATTTCTGAGAGAGGGTCGCGCCCTGTATGATAATCTATATCCATCACGGATTATAGTGGGCGATGACTCTCCGATTGCACTTAAGTTTGCTAATCTTTTAGTTGAGGGCTCCAAAACTCCGCTCGCCCCAGTACTTACGATGGGTACACGTGAGGCTGAAGCTGTCAAGCTGTTTTCAAACACATACCTTGCTATGCGAGTCGCATACTTTAACGAACTAGATACCTTTGCTATGTCGCACGGTATGAATGCTAAAGAAATCATAGATGGCGTAACGTTGGAGCCTCGGATAGGTCAAGGATATTCCAATCCATCTTTTGGCTACGGTGCGTATTGTTTCCCAAAGGACACGAAGCAATTATTAGCTAACTTTGAGGGTGTTCCGCAAGATATAATTGGGGCGATAGTAGAAAGCAATGAAACACGGAAGGAGGTAATCGTGAGTGAAGTGGAAAACCGATTCCCCACTACGGTCGGCGTTTACAAATTAGCCGCCAAGGCTGGTTCCGACAATTTCCGATCCAGCGCAATAGTAGATATTATGGAAAGATTAGCTAATAAGGGATACCACATTAAAATCTTTGAACCTACTGTCGAACAGTTCGAGAACTTCGAGGTTGATAATAACTTGACGACTTTCGCAACGGAGAGCGATGTAATTATTGCAAACCGCGTACCTGTGGAACATCGAATTTTGTTCGGAAAGAAGCTGATTACACGCGATGTATATGGCGATAACTAA

SEQ ID NO:8是源自拟南芥的UDP-葡萄糖脱氢酶(HASB)的氨基酸序列

MVKICCIGAGYVGGPTMAVMALKCPEIEVVVVDISEPRINAWNSDRLPIYEPGLEDVVKQCRGKNLFFSTDVEKHVFESDIVFVSVNTPTKTQGLGAGKAADLTYWESAARMIADVSKSSKIVVEKSTVPVRTAEAIEKILTHNSKGIEFQILSNPEFLAEGTAIKDLYNPDRVLIGGRDTAAGQKAIKALRDVYAHWVPVEQIICTNLWSAELSKLAANAFLAQRISSVNAMSALCEATGADVTQVAHAVGTDTRIGPKFLNASVGFGGSCFQKDILNLIYICECNGLPEAANYWKQVVKVNDYQKIRFANRVVSSMFNTVSGKKIAILGFAFKKDTGDTRETPAIDVCNRLVADKAKLSIYDPQVLEEQIRRDLSMARFDWDHPVPLQQIKAEGISEQVNVVSDAYEATKDAHGLCVLTEWDEFKSLDFKKIFDNMQKPAFVFDGRNVVDAVKLREIGFIVYSIGKPLDSWLKDMPAVA

SEQ ID NO:9是源自小球藻属病毒PBCV1的UDP-葡萄糖脱氢酶(HASB)的氨基酸序列

MSRIAVVGCGYVGTACAVLLAQKNEVIVLDISEDRVQLIKNKKSPIEDKEIEEFLETKDLNLTATTDKVLAYENAEFVIIATPTDYDVVTRYFNTKSVENVIGDVIKNTQTHPTIVIKSTIPIGFVDKVREQFDYQNIIFSPEFLREGRALYDNLYPSRIIVGDDSPIALKFANLLVEGSKTPLAPVLTMGTREAEAVKLFSNTYLAMRVAYFNELDTFAMSHGMNAKEIIDGVTLEPRIGQGYSNPSFGYGAYCFPKDTKQLLANFEGVPQDIIGAIVESNETRKEVIVSEVENRFPTTVGVYKLAAKAGSDNFRSSAIVDIMERLANKGYHIKIFEPTVEQFENFEVDNNLTTFATESDVIIANRVPVEHRILFGKKLITRDVYGDN

SEQ ID NO:10是具有N-末端分泌信号的源自解肝磷脂土地杆菌的葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶的重编码核酸序列

ATGCAATTCTCGACGGTCGCAAGTGTTGCCTTTGTTGCTTTGGCTAACTTCGTTGCCGCACAGTCCTCGTCAATCACCAGGAAGGACTTCGATCATATCAACTTGGAATACTCCGGTTTGGAGAAGGTGAACAAGGCGGTAGCAGCAGGCAATTACGACGACGCGGCAAAAGCCCTACTAGCTTACTACCGTGAAAAGAGCAAAGCAAGAGAGCCTGACTTTAGTAATGCCGAGAAGCCTGCCGACATACGTCAGCCTATTGACAAGGTAACACGTGAGATGGCGGATAAAGCATTAGTACATCAGTTTCAACCTCACAAAGGATACGGATATTTTGATTATGGGAAGGATATTAATTGGCAGATGTGGCCAGTTAAAGACAACGAGGTCAGATGGCAGTTGCATAGGGTAAAATGGTGGCAGGCAATGGCCTTGGTTTACCATGCCACGGGCGACGAGAAGTACGCCAGGGAGTGGGTGTACCAATACTCGGACTGGGCGAGGAAGAACCCGTTAGGCTTATCGCAAGACAATGATAAGTTTGTCTGGAGACCTTTGGAAGTCTCAGATAGAGTCCAGTCATTGCCACCTACCTTTTCTCTTTTCGTCAACAGTCCCGCCTTCACACCAGCATTCCTAATGGAGTTCTTAAACTCGTACCACCAACAGGCAGACTACTTGTCAACACACTACGCCGAGCAGGGGAACCATAGGCTGTTCGAAGCTCAGAGGAACTTGTTCGCCGGCGTATCCTTCCCCGAATTCAAGGACTCACCCAGGTGGAGACAGACTGGAATATCTGTTCTGAATACAGAGATAAAGAAGCAGGTGTACGCCGATGGCATGCAATTCGAGTTAAGTCCGATATACCACGTTGCTGCCATAGATATCTTTCTTAAAGCATACGGAAGCGCCAAGAGAGTTAATTTGGAGAAAGAGTTCCCTCAATCCTATGTGCAAACCGTCGAGAATATGATTATGGCGTTAATTTCAATAAGTCTACCGGACTATAATACGCCCATGTTCGGCGACTCTTGGATCACTGATAAGAATTTCAGAATGGCTCAATTTGCCTCATGGGCGCGTGTCTTCCCCGCTAACCAGGCAATTAAGTACTTTGCAACCGACGGAAAACAGGGTAAAGCTCCCAACTTCTTGAGTAAGGCATTGTCCAATGCAGGATTCTACACGTTTAGAAGTGGATGGGATAAGAACGCGACAGTGATGGTACTGAAGGCAAGTCCGCCTGGTGAGTTTCACGCTCAGCCTGATAACGGAACTTTTGAACTGTTCATCAAGGGTAGGAACTTCACACCCGACGCCGGTGTATTCGTCTATTCCGGTGACGAGGCGATTATGAAATTGAGGAACTGGTACAGGCAGACAAGGATTCACTCTACTCTAACTCTTGATAATCAGAATATGGTCATAACGAAAGCACGTCAGAATAAATGGGAGACAGGCAATAACTTGGATGTCTTAACTTACACTAACCCGTCATACCCCAACTTAGATCACCAACGTTCAGTTCTATTCATTAACAAGAAGTATTTCTTAGTCATAGATAGGGCTATCGGCGAGGCCACGGGCAACCTTGGCGTGCACTGGCAGCTAAAGGAAGACAGTAACCCTGTCTTCGATAAAACCAAGAATAGAGTCTATACTACCTATAGGGACGGGAACAATCTAATGATACAGAGTCTAAACGCAGACAGGACATCACTGAACGAGGAAGAAGGGAAGGTATCTTATGTCTATAACAAGGAGCTGAAGCGTCCAGCTTTCGTATTTGAGAAGCCTAAGAAGAACGCAGGGACCCAAAACTTTGTGTCAATTGTCTATCCATACGACGGTCAGAAGGCGCCGGAAATTTCTATTAGAGAAAATAAGGGAAATGACTTCGAAAAGGGAAAATTGAACCTAACACTGACTATAAACGGTAAGCAACAGCTTGTGTTGGTTCCTTAA

SEQ ID NO:11是具有N-末端分泌信号和C-末端锚定信号的源自解肝磷脂土地杆菌的葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶的重编码核酸序列

ATGCAATTCTCGACGGTCGCAAGTGTTGCCTTTGTTGCTTTGGCTAACTTCGTTGCCGCACAGTCCTCGTCAATCACCAGGAAGGACTTCGATCATATCAACTTGGAATACTCCGGTTTGGAGAAGGTGAACAAGGCGGTAGCAGCAGGCAATTACGACGACGCGGCAAAAGCCCTACTAGCTTACTACCGTGAAAAGAGCAAAGCAAGAGAGCCTGACTTTAGTAATGCCGAGAAGCCTGCCGACATACGTCAGCCTATTGACAAGGTAACACGTGAGATGGCGGATAAAGCATTAGTACATCAGTTTCAACCTCACAAAGGATACGGATATTTTGATTATGGGAAGGATATTAATTGGCAGATGTGGCCAGTTAAAGACAACGAGGTCAGATGGCAGTTGCATAGGGTAAAATGGTGGCAGGCAATGGCCTTGGTTTACCATGCCACGGGCGACGAGAAGTACGCCAGGGAGTGGGTGTACCAATACTCGGACTGGGCGAGGAAGAACCCGTTAGGCTTATCGCAAGACAATGATAAGTTTGTCTGGAGACCTTTGGAAGTCTCAGATAGAGTCCAGTCATTGCCACCTACCTTTTCTCTTTTCGTCAACAGTCCCGCCTTCACACCAGCATTCCTAATGGAGTTCTTAAACTCGTACCACCAACAGGCAGACTACTTGTCAACACACTACGCCGAGCAGGGGAACCATAGGCTGTTCGAAGCTCAGAGGAACTTGTTCGCCGGCGTATCCTTCCCCGAATTCAAGGACTCACCCAGGTGGAGACAGACTGGAATATCTGTTCTGAATACAGAGATAAAGAAGCAGGTGTACGCCGATGGCATGCAATTCGAGTTAAGTCCGATATACCACGTTGCTGCCATAGATATCTTTCTTAAAGCATACGGAAGCGCCAAGAGAGTTAATTTGGAGAAAGAGTTCCCTCAATCCTATGTGCAAACCGTCGAGAATATGATTATGGCGTTAATTTCAATAAGTCTACCGGACTATAATACGCCCATGTTCGGCGACTCTTGGATCACTGATAAGAATTTCAGAATGGCTCAATTTGCCTCATGGGCGCGTGTCTTCCCCGCTAACCAGGCAATTAAGTACTTTGCAACCGACGGAAAACAGGGTAAAGCTCCCAACTTCTTGAGTAAGGCATTGTCCAATGCAGGATTCTACACGTTTAGAAGTGGATGGGATAAGAACGCGACAGTGATGGTACTGAAGGCAAGTCCGCCTGGTGAGTTTCACGCTCAGCCTGATAACGGAACTTTTGAACTGTTCATCAAGGGTAGGAACTTCACACCCGACGCCGGTGTATTCGTCTATTCCGGTGACGAGGCGATTATGAAATTGAGGAACTGGTACAGGCAGACAAGGATTCACTCTACTCTAACTCTTGATAATCAGAATATGGTCATAACGAAAGCACGTCAGAATAAATGGGAGACAGGCAATAACTTGGATGTCTTAACTTACACTAACCCGTCATACCCCAACTTAGATCACCAACGTTCAGTTCTATTCATTAACAAGAAGTATTTCTTAGTCATAGATAGGGCTATCGGCGAGGCCACGGGCAACCTTGGCGTGCACTGGCAGCTAAAGGAAGACAGTAACCCTGTCTTCGATAAAACCAAGAATAGAGTCTATACTACCTATAGGGACGGGAACAATCTAATGATACAGAGTCTAAACGCAGACAGGACATCACTGAACGAGGAAGAAGGGAAGGTATCTTATGTCTATAACAAGGAGCTGAAGCGTCCAGCTTTCGTATTTGAGAAGCCTAAGAAGAACGCAGGGACCCAAAACTTTGTGTCAATTGTCTATCCATACGACGGTCAGAAGGCGCCGGAAATTTCTATTAGAGAAAATAAGGGAAATGACTTCGAAAAGGGAAAATTGAACCTAACACTGACTATAAACGGTAAGCAACAGCTTGTGTTGGTTCCTGGATCCGCCATTTCTCAAATCACTGACGGTCAAATCCAAGCTACTACCACTGCTACCACCGAAGCTACCACCACTGCTGCCCCATCTTCCACCGTTGAAACTGTTTCTCCATCCAGCACCGAAACTATCTCTCAACAAACTGAAAATGGTGCTGCTAAGGCCGCTGTCGGTATGGGTGCCGGTGCTCTAGCTGCTGCTGCTATGTTGTTATAA

SEQ ID NO:12是具有N-末端分泌信号的源自解肝磷脂土地杆菌的葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶的重编码核酸序列

ATGCAGTTTTCAACCGTGGCATCTGTGGCATTCGTGGCATTGGCAAATTTTGTCGCTGCTCAATCTTCCAGTATTACGCGTAAAGATTTTGACCACATAAATCTTGAGTATAGTGGCCTAGAGAAAGTCAATAAAGCTGTCGCCGCTGGTAACTATGATGATGCAGCCAAGGCTTTGTTAGCCTATTATAGAGAGAAATCTAAGGCTCGTGAACCGGATTTCTCTAACGCTGAAAAGCCAGCGGATATCAGACAACCAATCGATAAAGTCACCAGGGAAATGGCAGACAAGGCTTTGGTTCACCAATTCCAGCCCCATAAGGGCTATGGTTACTTCGACTACGGTAAAGACATAAACTGGCAAATGTGGCCCGTAAAGGATAATGAAGTAAGGTGGCAACTTCACAGAGTGAAGTGGTGGCAAGCTATGGCTCTGGTGTATCACGCAACCGGTGATGAAAAGTATGCTAGAGAATGGGTATATCAGTATTCTGATTGGGCTAGGAAGAATCCACTAGGACTTTCTCAGGATAACGACAAATTCGTTTGGCGTCCACTAGAGGTATCTGACAGGGTACAATCTTTACCCCCGACGTTCAGTCTGTTTGTTAATTCTCCAGCATTTACCCCGGCTTTCTTGATGGAATTCTTGAATTCTTATCATCAGCAAGCGGATTATTTAAGCACCCATTATGCAGAACAAGGAAATCACAGATTATTTGAGGCCCAACGTAATTTATTTGCGGGTGTTAGTTTTCCAGAGTTTAAAGATTCGCCAAGATGGAGACAAACCGGTATCAGCGTGTTAAACACTGAAATCAAGAAACAAGTATATGCTGACGGTATGCAGTTTGAACTATCTCCAATTTATCATGTCGCAGCAATTGACATATTCTTGAAGGCTTATGGCAGTGCTAAACGTGTCAACTTAGAAAAGGAATTTCCACAGTCATACGTCCAGACTGTAGAAAACATGATCATGGCCCTTATCAGCATCTCATTGCCTGATTACAACACTCCAATGTTTGGTGATAGTTGGATAACGGACAAGAACTTTAGGATGGCACAGTTCGCAAGCTGGGCTAGAGTATTTCCAGCAAATCAAGCTATAAAATATTTCGCGACTGATGGTAAGCAAGGGAAGGCCCCTAATTTTCTATCTAAAGCTTTAAGCAACGCCGGCTTTTATACTTTCAGGTCCGGTTGGGACAAGAATGCAACTGTCATGGTGTTAAAAGCGTCTCCACCCGGAGAATTCCATGCGCAACCAGACAATGGGACATTCGAGTTGTTTATTAAAGGGAGAAATTTTACCCCAGATGCTGGAGTGTTTGTGTACTCAGGGGATGAAGCGATAATGAAGTTAAGAAATTGGTATCGTCAAACCAGAATACATTCCACACTTACACTGGACAACCAAAACATGGTGATTACTAAGGCTAGACAAAACAAGTGGGAAACTGGTAACAATCTGGACGTTTTGACATATACGAACCCTTCCTATCCAAATCTTGACCATCAGAGGTCGGTCTTATTTATAAATAAGAAATACTTCTTGGTTATCGACAGAGCCATTGGTGAAGCAACAGGTAATCTGGGTGTTCATTGGCAATTGAAAGAGGATTCTAATCCAGTGTTTGACAAGACGAAGAACAGGGTATACACAACATACCGTGATGGTAATAACTTAATGATCCAGTCCTTAAATGCTGATCGTACTTCTCTTAATGAAGAGGAAGGTAAGGTTTCCTACGTGTACAATAAAGAACTAAAGAGACCCGCCTTTGTCTTCGAAAAGCCCAAGAAGAATGCCGGAACGCAGAATTTCGTATCTATCGTTTACCCTTATGATGGCCAGAAAGCTCCAGAGATAAGCATCCGTGAGAACAAAGGTAACGATTTTGAGAAAGGTAAGCTTAATTTGACGCTAACGATTAATGGGAAACAGCAATTAGTCTTAGTACCATAA

SEQ ID NO:13是具有N-末端分泌信号和C-末端锚定信号的源自解肝磷脂土地杆菌的葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶的重编码核酸序列

SEQ ID NO:14是具有N-末端分泌信号的源自解肝磷脂土地杆菌的葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶的氨基酸序列

MQFSTVASVAFVALANFVAAQSSSITRKDFDHINLEYSGLEKVNKAVAAGNYDDAAKALLAYYREKSKAREPDFSNAEKPADIRQPIDKVTREMADKALVHQFQPHKGYGYFDYGKDINWQMWPVKDNEVRWQLHRVKWWQAMALVYHATGDEKYAREWVYQYSDWARKNPLGLSQDNDKFVWRPLEVSDRVQSLPPTFSLFVNSPAFTPAFLMEFLNSYHQQADYLSTHYAEQGNHRLFEAQRNLFAGVSFPEFKDSPRWRQTGISVLNTEIKKQVYADGMQFELSPIYHVAAIDIFLKAYGSAKRVNLEKEFPQSYVQTVENMIMALISISLPDYNTPMFGDSWITDKNFRMAQFASWARVFPANQAIKYFATDGKQGKAPNFLSKALSNAGFYTFRSGWDKNATVMVLKASPPGEFHAQPDNGTFELFIKGRNFTPDAGVFVYSGDEAIMKLRNWYRQTRIHSTLTLDNQNMVITKARQNKWETGNNLDVLTYTNPSYPNLDHQRSVLFINKKYFLVIDRAIGEATGNLGVHWQLKEDSNPVFDKTKNRVYTTYRDGNNLMIQSLNADRTSLNEEEGKVSYVYNKELKRPAFVFEKPKKNAGTQNFVSIVYPYDGQKAPEISIRENKGNDFEKGKLNLTLTINGKQQLVLVP

SEQ ID NO:15是具有N-末端分泌信号和C-末端锚定信号的源自解肝磷脂土地杆菌的葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶的氨基酸序列

MQFSTVASVAFVALANFVAAQSSSITRKDFDHINLEYSGLEKVNKAVAAGNYDDAAKALLAYYREKSKAREPDFSNAEKPADIRQPIDKVTREMADKALVHQFQPHKGYGYFDYGKDINWQMWPVKDNEVRWQLHRVKWWQAMALVYHATGDEKYAREWVYQYSDWARKNPLGLSQDNDKFVWRPLEVSDRVQSLPPTFSLFVNSPAFTPAFLMEFLNSYHQQADYLSTHYAEQGNHRLFEAQRNLFAGVSFPEFKDSPRWRQTGISVLNTEIKKQVYADGMQFELSPIYHVAAIDIFLKAYGSAKRVNLEKEFPQSYVQTVENMIMALISISLPDYNTPMFGDSWITDKNFRMAQFASWARVFPANQAIKYFATDGKQGKAPNFLSKALSNAGFYTFRSGWDKNATVMVLKASPPGEFHAQPDNGTFELFIKGRNFTPDAGVFVYSGDEAIMKLRNWYRQTRIHSTLTLDNQNMVITKARQNKWETGNNLDVLTYTNPSYPNLDHQRSVLFINKKYFLVIDRAIGEATGNLGVHWQLKEDSNPVFDKTKNRVYTTYRDGNNLMIQSLNADRTSLNEEEGKVSYVYNKELKRPAFVFEKPKKNAGTQNFVSIVYPYDGQKAPEISIRENKGNDFEKGKLNLTLTINGKQQLVLVPGSAISQITDGQIQATTTATTEATTTAAPSSTVETVSPSSTETISQQTENGAAKAAVGMGAGALAAAAMLL

SEQ ID NO:16是源自酿酒酵母的谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)的核酸序列

ATGTGTGGTATCTTTGGTTACTGCAATTATCTAGTGGAAAGATCCAGAGGAGAAATTATCGACACCTTAGTGGATGGTTTACAAAGATTAGAATATAGAGGCTATGATTCCACCGGTATTGCTATCGATGGTGACGAAGCTGATTCTACTTTCATCTATAAGCAAATCGGTAAAGTGAGTGCTTTGAAAGAGGAGATTACTAAGCAAAATCCGAACAGAGACGTTACTTTTGTCTCTCATTGTGGTATTGCGCATACTAGATGGGCTACTCACGGTCGACCAGAACAAGTTAACTGTCACCCTCAAAGATCTGACCCAGAAGACCAATTTGTGGTCGTTCATAATGGTATCATCACAAATTTTAGAGAACTGAAGACTCTTTTAATTAACAAAGGTTATAAATTCGAAAGTGATACCGATACCGAGTGTATTGCTAAACTATATTTGCATTTATACAATACAAATTTACAAAATGGGCATGACTTAGATTTCCACGAATTAACCAAGCTAGTTCTTTTAGAACTAGAAGGTTCATACGGGTTATTATGTAAATCTTGTCACTATCCTAATGAGGTTATCGCCACTAGAAAAGGGTCCCCTTTACTGATTGGTGTCAAATCTGAAAAAAAACTAAAAGTCGACTTCGTGGATGTGGAATTTCCCGAAGAAAACGCTGGTCAACCGGAAATTCCATTGAAATCTAACAACAAATCATTTGGCTTGGGCCCAAAGAAAGCTCGTGAATTTGAAGCTGGTTCCCAAAATGCCAATTTACTACCAATTGCCGCCAATGAATTTAACTTGAGACATTCTCAATCCAGGGCTTTCCTATCAGAAGATGGATCTCCAACACCGGTGGAATTTTTTGTTTCTTCGGATGCGGCATCTGTTGTTAAACATACCAAGAAGGTGCTATTTTTAGAAGATGACGATTTGGCTCATATTTACGATGGTGAGTTACATATTCATAGATCTAGAAGAGAAGTAGGCGCATCAATGACAAGGTCCATTCAAACTTTAGAGATGGAGTTAGCTCAGATCATGAAGGGCCCTTACGACCATTTTATGCAAAAGGAAATCTATGAGCAACCAGAATCTACTTTCAATACTATGAGAGGTAGAATCGACTATGAAAATAATAAAGTGATATTGGGTGGTTTAAAGGCATGGTTACCAGTTGTCAGAAGAGCACGGAGACTGATCATGATCGCATGCGGTACTTCTTATCATTCATGTTTGGCTACTCGTGCTATCTTCGAAGAATTATCAGATATCCCAGTTAGTGTGGAATTAGCGTCTGACTTTCTGGACAGAAAATGCCCTGTCTTCAGAGACGATGTATGCGTGTTTGTTTCACAAAGTGGTGAAACTGCGGATACCATGCTGGCTCTAAATTATTGTTTAGAAAGAGGAGCCTTAACTGTCGGAATTGTTAACAGTGTTGGTTCTTCTATCTCTCGTGTCACCCACTGTGGTGTTCATATTAACGCTGGTCCTGAAATTGGTGTTGCCTCTACAAAAGCTTATACTTCCCAGTATATTGCCTTAGTGATGTTTGCTCTATCGCTGTCAGATGACCGTGTATCGAAAATAGACAGAAGAATTGAAATCATTCAAGGCTTGAAGTTAATCCCGGGCCAAATTAAGCAGGTATTAAAGCTGGAACCAAGAATAAAAAAGCTCTGTGCGACTGAATTAAAGGATCAAAAATCTCTATTGTTATTGGGTAGAGGTTACCAATTTGCTGCTGCTCTGGAAGGTGCTTTGAAGATCAAAGAAATTTCTTATATGCATTCTGAAGGTGTTTTGGCAGGTGAGTTGAAGCACGGTGTCTTGGCCTTGGTGGACGAAAACTTGCCAATCATTGCTTTTGGTACCAGAGACTCTCTATTCCCTAAAGTAGTTTCCTCTATTGAGCAAGTTACTGTAAGAAAGGGCCATCCAATTATTATTTGTAACGAAAATGATGAAGTGTGGGCGCAAAAATCTAAATCAATCGACCTGCAAACCTTAGAAGTTCCACAAACTGTTGATTGTTTACAAGGTCTAATTAATATTATTCCATTACAACTAATGTCATATTGGTTGGCTGTTAATAAAGGGATTGATGTTGATTTTCCAAGAAACTTGGCTAAATCTGTTACCGTCGAATAA

SEQ ID NO:17是源自小球藻属病毒1(PBCV-1)的谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)的重编码核酸序列

ATGTGCGGGATCTTCGGTGCTGTGTCGAACAATAATAGCATAGAAGTTTCCATCAAGGGTATACAGAAGCTAGAGTACCGCGGGTACGATTCGTGTGGAATAGCCTATACAGACGGAGGCGCCATTGAACGGATCAGGTCAATAGATGGGATCGACGACTTAAGGAAGAAAACAATAACAGAGTCTTCCCCGGTAGCTATCGCTCATTCAAGGTGGAGTACCACTGGGATTCCAAGTGTTGTGAACGCCCACCCGCACATCTCTCGGGGCACGTCTGGATGCGAGTCGCGCATTGCAGTCGTACACAATGGCATTATTGAAAATTACCAGCAGATCCGCAAGTACTTGATAAATCTTGGGTATACTTTCGATTCACAGACCGACACGGAAGTCATTGCTCATCTAATAGACTCGCAGTATAACGGGAACATCCTGCACACCGTCCAAATGGCAGTTAAGCACCTCAAAGGAAGCTACGCCATAGCAGTCATGTGCCATAAGGAGTCCGGGAAGATCGTGGTGGCAAAACAGAAGAGTCCGTTGGTATTGGGTATAGGAAGCGACGGAGCTTATTATATCGCATCGGACGTATTGGCTCTTCCCACTAACAAAGTGGTCTACATAAGTGACGGATTCTCTGCTGAGTTAAGTCCTGGATCGATGACTATCTATGATCTGGATGGCAATAAGGTAGAATACGAGGTGGAAGACGTTGAAATGGAGCAGACGTCGATGTCTTTAGATAACTTTGATCACTACATGATCAAAGAGATCAATGAACAGCCGATATCAATTCTCAATACTATTAAGAACAAAGGATTCTATGCAGAGATATTTGGTGATCTAGCACATGAAATATTTCAGAAGATCGACAATATATTGATTCTAGCCTGCGGAACTTCGTATCATGCAGGTCTCGTCGGGAAGCAATGGATAGAGACCATCTCACGCATCCCGGTGGATGTTCATATTGCAAGCGAGTATGAGCCGACAATTCCACGAGCCAATACACTTGTGATAACGATTAGTCAAAGCGGCGAGACTGCGGATACAATCGCAGCCCTTCAACGAGCGCAAAACGCAGGAATGATATACACTTTGTGTATCTGCAACAGCCCCAAGTCAACTCTAGTGCGCGAGTCGATAATGAAATACATAACCAAATGCGGTTCAGAAGTTTCTGTTGCCAGTACTAAAGCATTTACGTCGCAACTTGTGGTGTTGTATATGCTTGCGAACGTTCTTGCGAACAAAACTGATGATCTGCTAGGGGATCTTCCTCAAGCTATCGAGAGAGTAATCTGTCTTACTAATGACGAAATGAAGCGTTGGGCGGATGAAATTTGTACTGCCAAAAGTGCCATCTTCTTAGGGAGAGGACTGAACGCACCTGTAGCATTTGAGGGCGCGCTAAAGTTGAAGGAAATCTCATATATCCATGCCGAGGGTTTCCTCGGTGGAGAGTTGAAGCATGGGCCGCTGGCTTTGTTGGACGATAAGATCCCTGTAATCGTGACTGTTGCTGACCACGCTTATTTGGATCACATTAAGGCTAACATCGACGAGGTATTGGCACGAAACGTTACCGTATACGCGATCGTCGATCAGTATGTTAATATTGAACCACAGGAGCGACTGCATGTAGTAAAAGTGCCGTTTGTGAGTAAAGAGTTTTCTCCCATCATCCACACAATTCCGATGCAATTGTTATCGTATTATGTCGCGATCAAGCTGGGCAAGAACGTTGACAAGCCACGTAACCTGGCGAAAAGTGTTACAACATTCtaa

SEQ ID NO:18是源自小球藻属病毒1(PBCV-1)的谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)的重编码核酸序列

ATGTGTGGCATCTTTGGAGCAGTGTCAAACAACAACTCTATCGAGGTGTCAATCAAGGGTATTCAGAAGCTAGAATATCGTGGGTATGATTCGTGCGGTATTGCGTATACAGATGGGGGTGCGATTGAGCGTATACGTTCTATTGACGGCATTGACGATCTGCGTAAGAAAACAATCACAGAATCATCACCAGTGGCCATTGCTCACTCGCGGTGGAGCACCACTGGAATTCCATCAGTGGTGAACGCACATCCTCATATTTCTCGCGGAACCAGTGGGTGTGAGTCTCGTATCGCGGTAGTCCACAACGGTATCATTGAAAACTATCAGCAGATCCGAAAATATCTCATCAATCTTGGTTATACGTTTGATAGTCAAACGGACACAGAGGTCATTGCGCATTTGATTGATTCTCAGTACAATGGGAATATCTTGCACACCGTCCAAATGGCTGTCAAGCACCTGAAGGGCTCTTATGCCATTGCAGTTATGTGTCATAAAGAGTCTGGTAAAATAGTCGTGGCGAAACAGAAGTCACCCCTCGTACTTGGAATCGGCTCAGATGGTGCTTACTACATCGCTTCGGACGTGCTGGCGCTGCCGACAAATAAAGTTGTTTATATTTCAGACGGTTTCTCCGCAGAACTATCTCCAGGGAGTATGACCATTTACGATCTTGATGGAAATAAAGTAGAATATGAAGTAGAGGACGTTGAAATGGAACAAACTAGTATGTCTCTCGATAACTTTGATCATTACATGATTAAGGAAATTAATGAGCAACCAATCAGTATTCTAAACACTATAAAAAATAAAGGGTTCTATGCAGAAATATTCGGTGATTTGGCTCATGAAATCTTCCAAAAAATAGACAACATCCTGATACTGGCTTGTGGTACAAGTTATCACGCCGGTCTTGTAGGAAAACAGTGGATAGAGACCATCTCtAGAATCCCCGTGGATGTTCACATCGCGAGTGAATACGAACCTACTATTCCGAGAGCGAACACATTGGTAATCACTATTTCACAGTCGGGTGAAACTGCGGACACGATAGCGGCTTTGCAACGGGCCCAAAACGCCGGGATGATTTATACATTGTGTATTTGCAATTCACCAAAGAGCACTCTTGTTCGTGAGAGCATTATGAAGTACATCACGAAATGTGGTTCTGAGGTGTCAGTGGCATCAACGAAGGCGTTTACTTCTCAGCTCGTAGTACTGTACATGCTGGCAAACGTATTGGCAAATAAAACCGATGATTTGCTGGGAGACCTCCCACAGGCAATAGAACGGGTAATTTGTTTGACAAATGACGAAATGAAACGATGGGCCGACGAAATTTGCACTGCGAAATCCGCGATCTTCCTGGGAAGAGGACTAAACGCACCAGTTGCCTTTGAGGGAGCGTTGAAGCTCAAAGAAATCTCTTACATTCATGCAGAGGGCTTCCTGGGAGGTGAGTTGAAACACGGCCCCCTCGCACTCCTTGATGACAAGATTCCTGTTATCGTAACCGTAGCAGATCATGCTTATTTGGACCATATCAAAGCAAATATCGACGAAGTGCTTGCGAGGAACGTTACGGTATACGCCATAGTAGACCAGTATGTGAACATCGAGCCCCAGGAACGCCTTCACGTCGTCAAGGTTCCGTTTGTATCCAAAGAATTTTCTCCGATAATTCACACTATCCCGATGCAACTGCTTTCGTATTACGTGGCAATTAAGCTTGGAAAGAACGTTGACAAACCAAGGAATCTTGCAAAATCCGTGACTACCTTTTAA

SEQ ID NO:19是源自酿酒酵母的谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)的氨基酸序列

MCGIFGYCNYLVERSRGEIIDTLVDGLQRLEYRGYDSTGIAIDGDEADSTFIYKQIGKVSALKEEITKQNPNRDVTFVSHCGIAHTRWATHGRPEQVNCHPQRSDPEDQFVVVHNGIITNFRELKTLLINKGYKFESDTDTECIAKLYLHLYNTNLQNGHDLDFHELTKLVLLELEGSYGLLCKSCHYPNEVIATRKGSPLLIGVKSEKKLKVDFVDVEFPEENAGQPEIPLKSNNKSFGLGPKKAREFEAGSQNANLLPIAANEFNLRHSQSRAFLSEDGSPTPVEFFVSSDAASVVKHTKKVLFLEDDDLAHIYDGELHIHRSRREVGASMTRSIQTLEMELAQIMKGPYDHFMQKEIYEQPESTFNTMRGRIDYENNKVILGGLKAWLPVVRRARRLIMIACGTSYHSCLATRAIFEELSDIPVSVELASDFLDRKCPVFRDDVCVFVSQSGETADTMLALNYCLERGALTVGIVNSVGSSISRVTHCGVHINAGPEIGVASTKAYTSQYIALVMFALSLSDDRVSKIDRRIEIIQGLKLIPGQIKQVLKLEPRIKKLCATELKDQKSLLLLGRGYQFAAALEGALKIKEISYMHSEGVLAGELKHGVLALVDENLPIIAFGTRDSLFPKVVSSIEQVTARKGHPIIICNENDEVWAQKSKSIDLQTLEVPQTVDCLQGLINIIPLQLMSYWLAVNKGIDVDFPRNLAKSVTVE

SEQ ID NO:20是源自小球藻属病毒1(PBCV-1)的谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)的氨基酸序列

MCGIFGAVSNNNSIEVSIKGIQKLEYRGYDSCGIAYTDGGAIERIRSIDGIDDLRKKTITESSPVAIAHSRWSTTGIPSVVNAHPHISRGTSGCESRIAVVHNGIIENYQQIRKYLINLGYTFDSQTDTEVIAHLIDSQYNGNILHTVQMAVKHLKGSYAIAVMCHKESGKIVVAKQKSPLVLGIGSDGAYYIASDVLALPTNKVVYISDGFSAELSPGSMTIYDLDGNKVEYEVEDVEMEQTSMSLDNFDHYMIKEINEQPISILNTIKNKGFYAEIFGDLAHEIFQKIDNILILACGTSYHAGLVGKQWIETISRIPVDVHIASEYEPTIPRANTLVITISQSGETADTIAALQRAQNAGMIYTLCICNSPKSTLVRESIMKYITKCGSEVSVASTKAFTSQLVVLYMLANVLANKTDDLLGDLPQAIERVICLTNDEMKRWADEICTAKSAIFLGRGLNAPVAFEGALKLKEISYIHAEGFLGGELKHGPLALLDDKIPVIVTVADHAYLDHIKANIDEVLARNVTVYAIVDQYVNIEPQERLHVVKVPFVSKEFSPIIHTIPMQLLSYYVAIKLGKNVDKPRNLAKSVTTF

SEQ ID NO:21是源自酿酒酵母的UDP-N-乙酰葡萄糖胺焦磷酸化酶(QRI1)的核酸序列

ATGACTGACACAAAACAGCTATTCATTGAAGCCGGACAAAGTCAACTTTTCCACAATTGGGAAAGCTTGTCTCGCAAAGACCAAGAAGAATTGCTTTCAAACCTGGAGCAAATATCTTCCAAGAGGTCCCCTGCAAAACTACTGGAAGACTGTCAAAATGCTATTAAATTCTCACTAGCTAACTCTTCTAAGGATACTGGCGTCGAAATTTCACCATTGCCCCCTACTTCGTACGAGTCGCTTATTGGCAACAGTAAGAAAGAAAATGAATACTGGCGTTTAGGCCTTGAAGCTATTGGCAAGGGTGAAGTCGCAGTGATTTTAATGGCTGGCGGACAAGGTACGCGGTTAGGATCCTCTCAACCAAAGGGCTGTTACGACATTGGATTGCCTTCTAAGAAATCTCTTTTTCAAATTCAAGCTGAAAAGTTGATCAGGTTGCAAGATATGGTAAAGGACAAAAAGGTAGAAATTCCTTGGTATATTATGACATCAGGCCCCACTAGAGCGGCTACTGAGGCATACTTTCAAGAACACAATTATTTTGGCTTGAATAAAGAACAAATTACGTTCTTCAACCAGGGAACCCTGCCTGCCTTTGATTTAACCGGGAAGCATTTCCTAATGAAAGACCCAGTAAACCTATCTCAATCACCAGATGGAAATGGTGGACTCTACCGTGCCATCAAGGAAAACAAGTTGAACGAAGACTTTGATAGGAGAGGAATCAAGCATGTTTACATGTACTGTGTCGATAATGTCCTATCTAAAATCGCAGACCCTGTATTTATTGGTTTTGCCATCAAGCATGGCTTCGAACTGGCCACCAAAGCCGTTAGAAAGAGAGATGCGCATGAATCAGTTGGGTTAATTGCTACTAAAAACGAGAAACCATGTGTCATAGAATATTCTGAAATTTCCAATGAATTGGCTGAAGCAAAGGATAAAGATGGCTTATTAAAACTACGCGCAGGCAACATTGTAAATCATTATTACCTAGTGGATTTACTAAAACGTGATTTGGATCAGTGGTGTGAGAATATGCCATATCACATTGCGAAGAAGAAAATTCCAGCTTATGATAGTGTTACCGGCAAGTACACTAAGCCTACCGAACCAAACGGTATAAAATTAGAGCAATTCATATTTGATGTCTTTGACACTGTACCACTGAACAAGTTTGGGTGCTTAGAAGTAGATAGATGCAAAGAATTTTCACCTTTAAAAAACGGTCCTGGTTCTAAGAACGATAATCCTGAGACCAGCAGACTAGCATATTTGAAACTAGGAACCTCGTGGTTGGAAGATGCAGGCGCTATTGTAAAAGATGGGGTACTAGTCGAAGTTTCCAGCAAATTGAGTTATGCAGGTGAAAATCTATCCCAGTTCAAAGGTAAAGTCTTTGACAGAAGTGGTATAGTATTAGAAAAATAA

SEQ ID NO:22是源自酿酒酵母的UDP-N-乙酰葡萄糖胺焦磷酸化酶(QRI1)的氨基酸序列

MTDTKQLFIEAGQSQLFHNWESLSRKDQEELLSNLEQISSKRSPAKLLEDCQNAIKFSLANSSKDTGVEISPLPPTSYESLIGNSKKENEYWRLGLEAIGKGEVAVILMAGGQGTRLGSSQPKGCYDIGLPSKKSLFQIQAEKLIRLQDMVKDKKVEIPWYIMTSGPTRAATEAYFQEHNYFGLNKEQITFFNQGTLPAFDLTGKHFLMKDPVNLSQSPDGNGGLYRAIKENKLNEDFDRRGIKHVYMYCVDNVLSKIADPVFIGFAIKHGFELATKAVRKRDAHESVGLIATKNEKPCVIEYSEISNELAEAKDKDGLLKLRAGNIVNHYYLVDLLKRDLDQWCENMPYHIAKKKIPAYDSVTGKYTKPTEPNGIKLEQFIFDVFDTVPLNKFGCLEVDRCKEFSPLKNGPGSKNDNPETSRLAYLKLGTSWLEDAGAIVKDGVLVEVSSKLSYAGENLSQFKGKVFDRSGIVLEK

SEQ ID NO:23是源自酿酒酵母的磷酸葡萄糖变位酶-1(PGM1)的核酸序列

ATGTCACTTCTAATAGATTCTGTACCAACAGTTGCTTATAAGGACCAAAAACCGGGTACTTCAGGTTTACGTAAGAAGACCAAGGTTTTCATGGATGAGCCTCATTATACTGAGAACTTCATTCAAGCAACAATGCAATCTATCCCTAATGGCTCAGAGGGAACCACTTTAGTTGTTGGAGGAGATGGTCGTTTCTACAACGATGTTATCATGAACAAGATTGCCGCAGTAGGTGCTGCAAACGGTGTCAGAAAGTTAGTCATTGGTCAAGGCGGTTTACTTTCAACACCAGCTGCTTCTCATATAATTAGAACATACGAGGAAAAGTGTACCGGTGGTGGTATCATATTAACTGCCTCACACAACCCAGGCGGTCCAGAGAATGATTTAGGTATCAAGTATAATTTACCTAATGGTGGGCCAGCTCCAGAGAGTGTCACTAACGCTATCTGGGAAGCGTCTAAAAAATTAACTCACTATAAAATTATAAAGAACTTCCCCAAGTTGAATTTGAACAAGCTTGGTAAAAACCAAAAATATGGCCCATTGTTAGTGGACATAATTGATCCTGCCAAAGCATACGTTCAATTTCTGAAGGAAATTTTTGATTTTGACTTAATTAAAAGCTTCTTAGCGAAACAGCGCAAAGACAAAGGGTGGAAGTTGTTGTTTGACTCCTTAAATGGTATTACAGGACCATATGGTAAGGCTATATTTGTTGATGAATTTGGTTTACCGGCAGAGGAAGTTCTTCAAAATTGGCACCCTTTACCTGATTTCGGCGGTTTACATCCCGATCCGAATCTAACCTATGCACGAACTCTTGTTGACAGGGTTGACCGCGAAAAAATTGCCTTTGGAGCAGCCTCCGATGGTGATGGTGATAGGAATATGATTTACGGTTATGGCCCTGCTTTCGTTTCGCCAGGTGATTCTGTTGCCATTATTGCCGAATATGCACCCGAAATTCCATACTTCGCCAAACAAGGTATTTATGGCTTGGCACGTTCATTTCCTACATCCTCAGCCATTGATCGTGTTGCAGCAAAAAAGGGATTAAGATGTTACGAAGTTCCAACCGGCTGGAAATTCTTCTGTGCCTTATTTGATGCTAAAAAGCTATCAATCTGTGGTGAAGAATCCTTCGGTACAGGTTCCAATCATATCAGAGAAAAGGACGGTCTATGGGCCATTATTGCTTGGTTAAATATCTTGGCTATCTACCATAGGCGTAACCCTGAAAAGGAAGCTTCGATCAAAACTATTCAGGACGAATTTTGGAACGAGTATGGCCGTACTTTCTTCACAAGATACGATTACGAACATATCGAATGCGAGCAGGCCGAAAAAGTTGTAGCTCTTTTGAGTGAATTTGTATCAAGGCCAAACGTTTGTGGCTCCCACTTCCCAGCTGATGAGTCTTTAACCGTTATCGATTGTGGTGATTTTTCGTATAGAGATCTAGATGGCTCCATCTCTGAAAATCAAGGCCTTTTCGTAAAGTTTTCGAATGGGACTAAATTTGTTTTGAGGTTATCCGGCACAGGCAGTTCTGGTGCAACAATAAGATTATACGTAGAAAAGTATACTGATAAAAAGGAGAACTATGGCCAAACAGCTGACGTCTTCTTGAAACCCGTCATCAACTCCATTGTAAAATTCTTAAGATTTAAAGAAATTTTAGGAACAGACGAACCAACAGTCCGCACATAG

SEQ ID NO:24是源自酿酒酵母的磷酸葡萄糖变位酶-1(PGM1)的氨基酸序列

MSLLIDSVPTVAYKDQKPGTSGLRKKTKVFMDEPHYTENFIQATMQSIPNGSEGTTLVVGGDGRFYNDVIMNKIAAVGAANGVRKLVIGQGGLLSTPAASHIIRTYEEKCTGGGIILTASHNPGGPENDLGIKYNLPNGGPAPESVTNAIWEASKKLTHYKIIKNFPKLNLNKLGKNQKYGPLLVDIIDPAKAYVQFLKEIFDFDLIKSFLAKQRKDKGWKLLFDSLNGITGPYGKAIFVDEFGLPAEEVLQNWHPLPDFGGLHPDPNLTYARTLVDRVDREKIAFGAASDGDGDRNMIYGYGPAFVSPGDSVAIIAEYAPEIPYFAKQGIYGLARSFPTSSAIDRVAAKKGLRCYEVPTGWKFFCALFDAKKLSICGEESFGTGSNHIREKDGLWAIIAWLNILAIYHRRNPEKEASIKTIQDEFWNEYGRTFFTRYDYEHIECEQAEKVVALLSEFVSRPNVCGSHFPADESLTVIDCGDFSYRDLDGSISENQGLFVKFSNGTKFVLRLSGTGSSGATIRLYVEKYTDKKENYGQTADVFLKPVINSIVKFLRFKEILGTDEPTVRT

SEQ ID NO:25是源自酿酒酵母的UTP-葡萄糖-1-磷酸尿苷酰转移酶(UGP1)的核酸序列

ATGTCCACTAAGAAGCACACCAAAACACATTCCACTTATGCATTCGAGAGCAACACAAACAGCGTTGCTGCCTCACAAATGAGAAACGCCTTAAACAAGTTGGCGGACTCTAGTAAACTTGACGATGCTGCTCGCGCTAAGTTTGAGAACGAACTGGATTCGTTTTTCACGCTTTTCAGGAGATATTTGGTAGAGAAGTCTTCTAGAACCACCTTGGAATGGGACAAGATCAAGTCTCCCAACCCGGATGAAGTGGTTAAGTATGAAATTATTTCTCAGCAGCCCGAGAATGTCTCAAACCTTTCCAAATTGGCTGTTTTGAAGTTGAACGGTGGGCTGGGTACCTCCATGGGCTGCGTTGGCCCTAAATCTGTTATTGAAGTGAGAGAGGGAAACACCTTTTTGGATTTGTCTGTTCGTCAAATTGAATACTTGAACAGACAGTACGATAGCGACGTGCCATTGTTATTGATGAATTCTTTCAACACTGACAAGGATACGGAACACTTGATTAAGAAGTATTCCGCTAACAGAATCAGAATCAGATCTTTCAATCAATCCAGGTTCCCAAGAGTCTACAAGGATTCTTTATTGCCTGTCCCCACCGAATACGATTCTCCACTGGATGCTTGGTATCCACCAGGTCACGGTGATTTGTTTGAATCTTTACACGTATCTGGTGAACTGGATGCCTTAATTGCCCAAGGAAGAGAAATATTATTTGTTTCTAACGGTGACAACTTGGGTGCTACCGTCGACTTAAAAATTTTAAACCACATGATCGAGACTGGTGCCGAATATATAATGGAATTGACTGATAAGACCAGAGCCGATGTTAAAGGTGGTACTTTGATTTCTTACGATGGTCAAGTCCGTTTATTGGAAGTCGCCCAAGTTCCAAAAGAACACATTGACGAATTCAAAAATATCAGAAAGTTTACCAACTTCAACACGAATAACTTATGGATCAATCTGAAAGCAGTAAAGAGGTTGATCGAATCGAGCAATTTGGAGATGGAAATCATTCCAAACCAAAAAACTATAACAAGAGACGGTCATGAAATTAATGTCTTACAATTAGAAACCGCTTGTGGTGCTGCTATCAGGCATTTTGATGGTGCTCACGGTGTTGTCGTTCCAAGATCAAGATTCTTGCCTGTCAAGACCTGTTCCGATTTGTTGCTGGTTAAATCAGATCTATTCCGTCTGGAACACGGTTCTTTGAAGTTAGACCCATCCCGTTTTGGTCCAAACCCATTAATCAAGTTGGGCTCGCATTTCAAAAAGGTTTCTGGTTTTAACGCAAGAATCCCTCACATCCCAAAAATCGTCGAGCTAGATCATTTGACCATCACTGGTAACGTCTTTTTAGGTAAAGATGTCACTTTGAGGGGTACTGTCATCATCGTTTGCTCCGACGGTCATAAAATCGATATTCCAAACGGCTCCATATTGGAAAATGTTGTCGTTACTGGTAATTTGCAAATCTTGGAACATTGA

SEQ ID NO:26是源自酿酒酵母的UTP--葡萄糖-1-磷酸尿苷酰转移酶(UGP1)的氨基酸序列

MSTKKHTKTHSTYAFESNTNSVAASQMRNALNKLADSSKLDDAARAKFENELDSFFTLFRRYLVEKSSRTTLEWDKIKSPNPDEVVKYEIISQQPENVSNLSKLAVLKLNGGLGTSMGCVGPKSVIEVREGNTFLDLSVRQIEYLNRQYDSDVPLLLMNSFNTDKDTEHLIKKYSANRIRIRSFNQSRFPRVYKDSLLPVPTEYDSPLDAWYPPGHGDLFESLHVSGELDALIAQGREILFVSNGDNLGATVDLKILNHMIETGAEYIMELTDKTRADVKGGTLISYDGQVRLLEVAQVPKEHIDEFKNIRKFTNFNTNNLWINLKAVKRLIESSNLEMEIIPNQKTITRDGHEINVLQLETACGAAIRHFDGAHGVVVPRSRFLPVKTCSDLLLVKSDLFRLEHGSLKLDPSRFGPNPLIKLGSHFKKVSGFNARIPHIPKIVELDHLTITGNVFLGKDVTLRGTVIIVCSDGHKIDIPNGSILENVVVTGNLQILEH

SEQ ID NO:27是源自酿酒酵母的葡萄糖胺6-磷酸N-乙酰转移酶(GNA1)的核酸序列

ATGAGCTTACCCGATGGATTTTATATAAGGCGAATGGAAGAGGGGGATTTGGAACAGGTCACTGAGACGCTAAAGGTTTTGACCACCGTGGGCACTATTACCCCCGAATCCTTCAGCAAACTCATAAAATACTGGAATGAAGCCACAGTATGGAATGATAACGAAGATAAAAAAATAATGCAATATAACCCCATGGTGATTGTGGACAAGCGCACCGAGACGGTTGCCGCTACGGGGAATATCATCATCGAAAGAAAGATCATTCATGAACTGGGGCTATGTGGCCACATCGAGGACATTGCAGTAAACTCCAAGTATCAGGGCCAAGGTTTGGGCAAGCTCTTGATTGATCAATTGGTAACTATCGGCTTTGACTACGGTTGTTATAAGATTATTTTAGATTGCGATGAGAAAAATGTCAAATTCTATGAAAAATGTGGGTTTAGCAACGCAGGCGTGGAAATGCAAATTAGAAAATAG

SEQ ID NO:28是源自酿酒酵母的葡萄糖胺6-磷酸N-乙酰转移酶(GNA1)的氨基酸序列

MSLPDGFYIRRMEEGDLEQVTETLKVLTTVGTITPESFSKLIKYWNEATVWNDNEDKKIMQYNPMVIVDKRTETVAATGNIIIERKIIHELGLCGHIEDIAVNSKYQGQGLGKLLIDQLVTIGFDYGCYKIILDCDEKNVKFYEKCGFSNAGVEMQIRK

SEQ ID NO:29是源自酿酒酵母的磷酸乙酰葡萄糖胺变位酶(PCM1)的核酸序列

ATGAAGGTTGATTACGAGCAATTGTGCAAACTCTACGATGACACGTGCCGCACAAAGAATGTGCAGTTCAGTTACGGTACGGCCGGATTCAGAACGCTGGCCAAGAATTTGGATACGGTGATGTTCAGTACTGGTATACTGGCGGTTCTCAGGTCGCTGAAGCTTCAGGGTCAGTATGTGGGGGTGATGATCACGGCGTCGCACAACCCATACCAGGACAACGGGGTCAAGATCGTGGAACCAGACGGATCGATGCTTTTGGCCACATGGGAGCCATATGCCATGCAGTTGGCCAATGCGGCCTCTTTTGCCACTAATTTTGAAGAATTTCGTGTTGAGTTGGCCAAGCTGATTGAACACGAAAAGATTGATTTGAATACAACCGTCGTGCCTCACATCGTGGTTGGGAGAGACTCTAGGGAAAGTAGTCCATACTTGCTGCGCTGCTTGACTTCCTCCATGGCCAGCGTCTTCCACGCGCAAGTTTTGGACCTAGGCTGTGTCACTACGCCTCAATTGCATTACATTACTGATTTGTCCAACAGGCGGAAACTGGAAGGAGACACAGCGCCAGTTGCCACAGAACAGGACTACTATTCGTTCTTTATAGGAGCCTTCAACGAGCTCTTCGCCACGTATCAGCTGGAGAAGAGGCTGTCTGTCCCAAAATTGTTCATAGACACAGCCAATGGTATCGGTGGTCCACAGTTGAAAAAACTACTGGCCTCCGAAGATTGGGACGTGCCAGCGGAGCAAGTTGAGGTAATCAACGACAGGTCCGATGTTCCAGAACTGTTGAATTTTGAATGCGGTGCGGATTATGTGAAGACTAACCAGAGATTACCCAAGGGTCTTTCTCCATCCTCGTTTGATTCGCTATATTGCTCCTTTGATGGTGACGCAGACAGGGTTGTGTTCTACTATGTCGACTCAGGATCAAAATTTCATTTGTTGGATGGTGACAAAATTTCCACTTTGTTTGCAAAGTTCTTGTCTAAACAACTAGAATTGGCACACCTAGAACATTCTTTGAAGATTGGTGTTGTGCAAACTGCCTATGCAAACGGCAGTTCCACCGCTTACATAAAAAATACGTTGCACTGTCCCGTGTCTTGCACTAAGACAGGTGTTAAACACTTGCATCATGAAGCTGCCACTCAGTACGATATTGGCATTTATTTCGAAGCAAATGGACATGGTACGATTATATTCAGCGAAAAATTTCATCGAACTATCAAATCTGAATTATCCAAGTCCAAGTTAAATGGTGATACGTTAGCTTTGAGAACTTTGAAGTGTTTCTCTGAATTGATTAATCAGACCGTGGGAGATGCTATTTCAGACATGCTTGCTGTCCTTGCTACTTTGGCGATTTTGAAAATGTCGCCAATGGATTGGGATGAAGAGTATACTGATTTGCCCAACAAGCTGGTTAAGTGCATCGTTCCTGATAGGTCAATTTTCCAAACCACGGACCAGGAAAGAAAATTGCTCAATCCAGTGGGGTTGCAAGACAAGATAGATCTTGTGGTAGCCAAGTATCCCATGGGAAGAAGCTTTGTCAGAGCCAGTGGTACGGAGGATGCGGTGAGGGTTTATGCGGAATGTAAGGACTCCTCTAAGTTAGGTCAATTTTGTGACGAAGTGGTGGAGCACGTTAAGGCATCTGCTTGA

SEQ ID NO:30是源自酿酒酵母的磷酸乙酰葡萄糖胺变位酶(PCM1)的氨基酸序列

MKVDYEQLCKLYDDTCRTKNVQFSYGTAGFRTLAKNLDTVMFSTGILAVLRSLKLQGQYVGVMITASHNPYQDNGVKIVEPDGSMLLATWEPYAMQLANAASFATNFEEFRVELAKLIEHEKIDLNTTVVPHIVVGRDSRESSPYLLRCLTSSMASVFHAQVLDLGCVTTPQLHYITDLSNRRKLEGDTAPVATEQDYYSFFIGAFNELFATYQLEKRLSVPKLFIDTANGIGGPQLKKLLASEDWDVPAEQVEVINDRSDVPELLNFECGADYVKTNQRLPKGLSPSSFDSLYCSFDGDADRVVFYYVDSGSKFHLLDGDKISTLFAKFLSKQLELAHLEHSLKIGVVQTAYANGSSTAYIKNTLHCPVSCTKTGVKHLHHEAATQYDIGIYFEANGHGTIIFSEKFHRTIKSELSKSKLNGDTLALRTLKCFSELINQTVGDAISDMLAVLATLAILKMSPMDWDEEYTDLPNKLVKCIVPDRSIFQTTDQERKLLNPVGLQDKIDLVVAKYPMGRSFVRASGTEDAVRVYAECKDSSKLGQFCDEVVEHVKASA

SEQ ID NO:31是启动子pTDH3的核酸序列

CTGCTGTAACCCGTACATGCCCAAAATAGGGGGCGGGTTACACAGAATATATAACATCGTAGGTGTCTGGGTGAACAGTTTATTCCTGGCATCCACTAAATATAATGGAGCCCGCTTTTTAAGCTGGCATCCAGAAAAAAAAAGAATCCCAGCACCAAAATATTGTTTTCTTCACCAACCATCAGTTCATAGGTCCATTCTCTTAGCGCAACTACAGAGAACAGGGGCACAAACAGGCAAAAAACGGGCACAACCTCAATGGAGTGATGCAACCTGCCTGGAGTAAATGATGACACAAGGCAATTGACCCACGCATGTATCTATCTCATTTTCTTACACCTTCTATTACCTTCTGCTCTCTCTGATTTGGAAAAAGCTGAAAAAAAAGGTTGAAACCAGTTCCCTGAAATTATTCCCCTACTTGACTAATAAGTATATAAAGACGGTAGGTATTGATTGTAATTCTGTAAATCTATTTCTTAAACTTCTTAAATTCTACTTTTATAGTTAGTCTTTTTTTTAGTTTTAAAACACCAAGAACTTAGTTTCGAATAAACACACATAAACAAACAAA

SEQ ID NO:32是启动子pTDH3.Sk的核酸序列

CAATTCATCGGCCCTTTTAGCGGCTACCCGCGCCATCTAAATGATAGGGCGGGTGACACTATGGTAAATCCCATAATTAGGTGTCTGGGTGAGTGGTTCTGATGCCGGCATCCACTAAATATATTGGAGCCCATTTTTTACGCGGGCTTCCAGAAAAAAAGAGAATCCCAGCACCAAAAGGTGGTTCTCTTCACCAACCATCAGATCATAGGTCCACAACCACACATAACAGGGGCACAAAAAGGCAAAAAACGGACATAACCTCAATGGAGTGATGCAAATTGACTGGAGCAAAAGCTGACACAAGGCATTGATTGACCTACGCATGTATCTGTATTCTTTTCTTACACCTTCTATTACCTTCTAACTCTTTGGGTTGGAAAAAACTGAAAAAAAAGGTTGGGACCTGGTTCCCCCAAGTTGTCCCCCTACTTGGTTATTAAATATATAAAGACAGCAAGTGTTGATTATAATCTTGTAAATCTATAGTTCTTAATCTATACTTCTATTTATATTTTAAATTAGTCTTTTTATTTCCAAGTCCCCAAGAACTTAGTTTCGAATAAACACACACAAATAAACACA

SEQ ID NO:33是启动子pTDH3-1.sba的核酸序列

GCAGCGCTTCTTCCGCTCTAGTTTTTATAGTTATTATTACTACCACCTTAAAAATACGTAAATACTCAAAATAGTAGTGATATTCCCAACCTTATTCATCCAAGGCACATCATCATCATCAGCCATTCATCTTTCACCTGCCATTAGTAACCCGTCTTCTCATTGAGCGGGTTACGGCAGCCACAGGCCACATTCCGAATGTCTGGGTGAGCGGTCCCTTTTCCAGCATCCACTAAATATCTCCGATCCCGCTTTTTAATCTGGCTTCCTGAAAAAAAGAGAATCCCAGCACCAAAAAATGGCTCTCTTCACCAACCATCAGATCATAGGTCCCATTCTCTTACCGCAACCGTACAGAACAGGGGAAAACGGGTACAACCTCAATGGAGTGATGCAAACTGACTGGAGCAAAAAGCTGACACAAGGCAATCGACCTACGTGTCTGTCTATTTTCTCACACCTTCTATTACCTTCTAACTCTCTGGGTTGGAAAAAACTGAAAAAAAGGTTGAGACCAGTTTCCACAAATCATCCCCCTGTTTGATTAATAAATATATAAAGACGACAACTATCGATCATAAACTCATAAAACTATAACTCCTTTACACTTCTTATTTTATAGTTATTCTATTTTAATTCTTATTGATTTTAAAACCCCAAGAACTTAGTTTCGAAAACACACACACACAAACAATTAAAA

SEQ ID NO:34是启动子pTDH3.Sar的核酸序列

GAGCTAAATATCAGCCCTTCGGGTCCTGCCTGCTACCCGGTCCTGTTCGAATAAAAACGCGGGTAACACGACCCAGTAACACCTGTCGTTGGGTGTCTGGGTCAGAAGTTCTGATACCGGCTTCCACTAAATAGATTGGGTTCCGCTCTTTACGCTGGCTTCCTGAAAAAAGAGATTCCGGGCACCAAAAAATTGGTCTCTTTGCCAACCATCAGATCATAGGTCCATTCTCTTACCATAACCACACAGGATAGGGGCACCACAGGCGAAAATGGGCACAAAATCTCAATGGAGTGATGCAAATTAGCTGGAACAAAAGCTGACACAAGGCAATTAACCTGCGCATGTATCCATCTCCTTTTCTTACACCTTCTCTTACGTTCTAACTGTTTGGGTTGGAAAAATTAAAAAAAAAAGGTTGAGACCAGTTTCCCCAAATCGTCCCCCTACTTGATTCATAAATATATAAAGACGACAACTATTGATTATAATCTTGTAAATCTATAACTCTTTACTTTCTCCTATTTATAATTTAACTTAATCTTTTTAGATTTAAAACCCCAAGAACTTAGTTTCGAACAAACACACACAAATAAACAAAA

SEQ ID NO:35是启动子pENO2的核酸序列

CGCTCAGCATCTGCTTCTTCCCAAAGATGAACGCGGCGTTATGTCACTAACGACGTGCACCAACTTGCGGAAAGTGGAATCCCGTTCCAAAACTGGCATCCACTAATTGATACATCTACACACCGCACGCCTTTTTTCTGAAGCCCACTTTCGTGGACTTTGCCATATGCAAAATTCATGAAGTGTGATACCAAGTCAGCATACACCTCACTAGGGTAGTTTCTTTGGTTGTATTGATCATTTGGTTCATCGTGGTTCATTAATTTTTTTTCTCCATTGCTTTCTGGCTTTGATCTTACTATCATTTGGATTTTTGTCGAAGGTTGTAGAATTGTATGTGACAAGTGGCACCAAGCATATATAAAAAAAAAAAGCATTATCTTCCTACCAGAGTTGATTGTTAAAAACGTATTTATAGCAAACGCAATTGTAATTAATTCTTATTTTGTATCTTTTCTTCCCTTGTCTCAATCTTTTATTTTTATTTTATTTTTCTTTTCTTAGTTTCTTTCATAACACCAAGCAACTAATACTATAACATACAATAATA

SEQ ID NO:36是启动子pTEF3的核酸序列

GGCTGATAATAGCGTATAAACAATGCATACTTTGTACGTTCAAAATACAATGCAGTAGATATATTTATGCATATTACATATAATACATATCACATAGGAAGCAACAGGCGCGTTGGACTTTTAATTTTCGAGGACCGCGAATCCTTACATCACACCCAATCCCCCACAAGTGATCCCCCACACACCATAGCTTCAAAATGTTTCTACTCCTTTTTTACTCTTCCAGATTTTCTCGGACTCCGCGCATCGCCGTACCACTTCAAAACACCCAAGCACAGCATACTAAATTTCCCCTCTTTCTTCCTCTAGGGTGTCGTTAATTACCCGTACTAAAGGTTTGGAAAAGAAAAAAGAGACCGCCTCGTTTCTTTTTCTTCGTCGAAAAAGGCAATAAAAATTTTTATCACGTTTCTTTTTCTTGAAAATTTTTTTTTTTGATTTTTTTCTCTTTCGATGACCTCCCATTGATATTTAAGTTAATAAACGGTCTTCAATTTCTCAAGTTTCAGTTTCATTTTTCTTGTTCTATTACAACTTTTTTTACTTCTTGCTCATTAGAAAGAAAGCATAGCAATCTAATCTAAGTTTTAATTACAAA

SEQ ID NO:37是启动子pTEF1的核酸序列

GTTTAGCTTGCCTCGTCCCCGCCGGGTCACCCGGCCAGCGACATGGAGGCCCAGAATACCCTCCTTGACAGTCTTGACGTGCGCAGCTCAGGGGCATGATGTGACTGTCGCCCGTACATTTAGCCCATACATCCCCATGTATAATCATTTGCATCCATACATTTTGATGGCCGCACGGCGCGAAGCAAAAATTACGGCTCCTCGCTGCAGACCTGCGAGCAGGGAAACGCTCCCCTCACAGACGCGTTGAATTGTCCCCACGCCGCGCCCCTGTAGAGAAATATAAAAGGTTAGGATTTGCCACTGAGGTTCTTCTTTCATATACTTCCTTTTAAAATCTTGCTACGATACAGTTCTCACATCACATCCGAACATAAACAACC

SEQ ID NO:38是启动子pTEF1.ago的核酸序列

SEQ ID NO:39是启动子pTEF1.Sba的核酸序列

CGCCAACAAACCTTCGAACACTTTAATTTTCGAGGACCGCAGATCCTCACATCACACCCACACCCAAGACTGCTTCCCCCACACACCCTGCATCTGTACACTTTCTTCTGCTCTGTTTTTCTCTCCGGCGTTCTCTCGGGTCGCCCGCATCGCCGCGCCGGCTGGAACCGCCCACGCACCGCATATTGCAAATCGCCTGCCCCCTCTTGCTCCTTTTTGAGGGCGCGCCGTTACCCGCGCCCAGGGTCCGGAAAAAGAAACAAGGCTCTACCGCGTTTCTTTTTCCTTGTCGAAAAAGGCAAAAATGAAAATTTTTATCACGTTTCTTTTTTTTTGAAAAATTTTTTTTTTGGTTTTTTTTCTTTCGATGGCCTCCCATTGATATTTAAGTTAATAAATGGTTTTCAGTTTTCAAGTTTCAGTTTGTGTTCTTCTTTGCTAACTTTCACTTACACCTCGAAAGAAAGTATAGCAATCTAATCTTAGTTTTAATTACAA

SEQ ID NO:40是启动子pPDC1的核酸序列

TTATTTACCTATCTCTAAACTTCAACACCTTATATCATAACTAATATTTCTTGAGATAAGCACACTGCACCCATACCTTCCTTAAAAACGTAGCTTCCAGTTTTTGGTGGTTCCGGCTTCCTTCCCGATTCCGCCCGCTAAACGCATATTTTTGTTGCCTGGTGGCATTTGCAAAATGCATAACCTATGCATTTAAAAGATTATGTATGCTCTTCTGACTTTTCGTGTGATGAGGCTCGTGGAAAAAATGAATAATTTATGAATTTGAGAACAATTTTGTGTTGTTACGGTATTTTACTATGGAATAATCAATCAATTGAGGATTTTATGCAAATATCGTTTGAATATTTTTCCGACCCTTTGAGTACTTTTCTTCATAATTGCATAATATTGTCCGCTGCCCCTTTTTCTGTTAGACGGTGTCTTGATCTACTTGCTATCGTTCAACACCACCTTATTTTCTAACTATTTTTTTTTTAGCTCATTTGAATCAGCTTATGGTGATGGCACATTTTTGCATAAACCTAGCTGTCCTCGTTGAACATAGGAAAAAAAAATATATAAACAAGGCTCTTTCACTCTCCTTGCAATCAGATTTGGGTTTGTTCCCTTTATTTTCATATTTCTTGTCATATTCCTTTCTCAATTATTATTTTCTACTCATAACCTCACGCAAAATAACACAGTCAAATCAATCAAA

SEQ ID NO:41是启动子pCCW12的核酸序列

AACCAGGGCAAAGCAAAATAAAAGAAACTTAATACGTTATGCCGTAATGAAGGGCTACCAAAAACGATAATCTCAACTGTAAACAGGTACAATGCGGACCCTTTTGCCACAAAACATACATCATTCATTGCCGGAAAAAGAAAGAAGTGAAGACAGCAGTGCAGCCAGCCATGTTGCGCCAATCTAATTATAGATGCTGGTGCCCTGAGGATGTATCTGGAGCCAGCCATGGCATCATGCGCTACCGCCGGATGTAAAATCCGACACGCAAAAGAAAACCTTCGAGGTTGCGCACTTCGCCCACCCATGAACCACACGGTTAGTCCAAAAGGGGCAGTTCAGATTCCAGATGCGGGAATTAGCTTGCTGCCACCCTCACCTCACTAACGCTGCGGTGTGCGGATACTTCATGCTATTTATAGACGCGCGTGTCGGAATCAGCACGCGCAAGAACCAAATGGGAAAATCGGAATGGGTCCAGAACTGCTTTGAGTGCTGGCTATTGGCGTCTGATTTCCGTTTTGGGAATCCTTTGCCGCGCGCCCCTCTCAAAACTCCGCACAAGTCCCAGAAAGCGGGAAAGAAATAAAACGCCACCAAAAAAAAAAATAAAAGCCAATCCTCGAAGCGTGGGTGGTAGGCCCTGGATTATCCCGTACAAGTATTTCTCAGGAGTAAAAAAACCGTTTGTTTTGGAATTCCCCATTTCGCGGCCACCTACGCCGCTATCTTTGCAACAACTATCTGCGATAACTCAGCAAATTTTGCATATTCGTGTTGCAGTATTGCGATAATGGGAGTCTTACTTCCAACATAACGGCAGAAAGAAATGTGAGAAAATTTTGCATCCTTTGCCTCCGTTCAAGTATATAAAGTCGGCATGCTTGATAATCTTTCTTTCCATCCTACATTGTTCTAATTATTCTTATTCTCCTTTATTCTTTCCTAACATACCAAGAAATTAATCTTCTGTCATTCGCTTAAACACTATATCAATA

SEQ ID NO:42是启动子pCCW12.Sm的核酸序列

CGTTGTGCTGTAGTGAAGGAAGACTAAAAAGGATAATCACAGTTGTAAAGAGGTATAATGCGGACCCTTTTGCCACAAAACACACATCTTTCGTTTCCAAAATAAGAAAGAAGAAAGCAAAAAGATTAGCAGCCACGTTGCTGCGATCTAATTATAGACGGTGGCGTCATCATTCTCACCCAAGATTGTGTCTTGAACCTGCCACGGGTCCTGCGTTATCGCCGGATGTAAAACTAGACATGCAAAAAAAGGACCTTCCAGGTAGCGTGCTCCACACCACCCATGACCACCACAGTTAGTCCAAAAGAGGCAGCACCACTTCCCGATGGGGGAATTAGATTGCTGCCACCCTCACCTCACTAATGCTGCGGTGTGCGGATATGCCCTGCTATATATAGCTCCGCGTTTTTGAACCAGCACAGCGCGAGCACCAAAAAGGAAAATCGCATAGGCCCAGAACTGATTTCAGCACGGGCTATTGGCGTTGGGTTTCCGTTCTGGGAAACCTTCGCCGCGTCCCCCTCACAAACCTCCGCACAAGTTCGAGCAAGCGGGAAAAAACGAAAAACGCCATTAATACTAAATAAAGCAAATCCTCGAAGCGTGGGTGGCAAGCCCCTGGATTTTTCCGCACAAGTACTCTTCTCAGGAGTAAAAAAACCCGTTTGTTTTGGAATTCCCCATTTCGCGGCCATCTACGCCGGTATCTTCGCAATATCTATCAGCGATAACTCAGCAATTTTAATATTCGTGTTGCAGTGCTGCGATAGCGGGAGTCTTGTTTGTAACATAACGGCAGAAAGGAATGAGAGAAAATTTTCCATTCTTTGGCCTCCGTTCAAGTATATAAAGCCGGCATGCTTGGTAATCTTTCTCTCTCTTCTGTATTGTTTCTATAATACTTTTATCTTCTAATTATTTTCTGAAAAAACCAAGAAATTAATCTTCTGTCATTCGCTTAAACACTATATCAATA

SEQ ID NO:43是启动子pCCW12.Sk的核酸序列

TGTAAAATCCTACACGCAAAAAACCTCTTGGGTTGCGCGTTTTCCACCACCCACGACCCGCACAATCAATCCAAAAGGGGCAACGCCAGTTCCCAATGCGGGAATTAGCTCCTCACCCCCCTCACCCGCTAACGCTGCGGTGTGCGGACACGCAGCAGTATTTATAGATCCTCGTGTTGGAACCAGCCCGCGTGAGCACCAAATTGGAAAGTCGCAATGGGCCCAGAACCGCTTTCAGTACTGGGCCATTGGCGTCTAGTTTCCGTTTTGAGCGTCCTTCGCCGCGTCTCTCTGTGAAATCCCCGCACAAGTCTGAGCAGGCAAAAAAAAAAAACGCCACCAAAAATAAATAAAGCCAATCCTCGAAGGATGAGTAGGAAAGGAAGCCCCTGGTTTTTTCCCGCACGAATATTTTTCAGGAGTGAAAAAATCCGTTTGTTTTGGAATTCCCCATTTCGCGCTCACCTACGCCGGTATCTTTGGAACAACTATCAGCGATAACTCAGCAAAATTTGCATATCCGTGCTGCAATAGTGCGATAGTGGGATTGGGAGTCTTGTTGCATCATAACGGCAGAAAGGAATGAATAAAAATTTTCCGTTCTTTGTCTCCGTTCAAGTATATAAAGTCGGCATGCTTGATTATCTTTTCTTCTCTTCTACTACATTTCTATTTCACTTTCTACTCTATTCTTCCCTGAAAAACCCAAGAAAATAATCTTCTGTCATTCGCTTAAACAATATATCAAAA

SEQ ID NO:44是启动子pCCW12.Sba的核酸序列

ACCATGCCACGGTGCTGGCCCCACTTCCACCCACGACCCGCACGGTTGGCCCGAAAGGGGCAACACCAGTTCCCAATACGGAAATTAGTCCGCCACCACCCTCACCTCGCTAGAGCTGCGGTGTGCGGGCGTGCATCGCTATTTATAGACATGCCTGCTGGCGTCACCGCGCGCGAGCACCAAACAGGAAAATCGCACTGGGCCCAGAACCACGCTATGCGCTGGGCCGATGGCGTCCGGTTTCCCTTTGGGAGCCCCCTGCCACGTTCGCCTAACAAATCCCCGCACCGGCTTGAGAAAAAAGCGAAAAGCGAAAAAAAAAAATCAACGCCACCAAAATTAAAAAAAAAGAGCCATCCTCGAAGGGTGAATAGTAGCCCCTGACTTTTCCCGCACAGACAGACACCTTTCAGGAGTGAACAAAAAAGCAGTTTGTTTTGGAATTCCCCCATTTCGCGGTGGCCTGCGCAGGTATCTCTGCGTCAACTATCAGCGATAACTCAGCAAATTTTGCATATTCGTGTTGCGATACTACGATAATGGGAGTCTGTCGCCTAATAACGGCAACAAGGAATGAGAGAGAAAAATTTTCTTCATTCTCCAGCTCCCGTTCAAGTATATAAGGTCGGCATGGTCGATTGTCTTTCCTTCTCTTCAGTTACGTCTCTCTATTTACATTATTCTTATTTTTATTTAATAAAAACCCCAAGAAATTAATCTTCTGTCATTCGCTTAAACACTATATCAAAA

SEQ ID NO:45是启动子pCCW12.Sar的核酸序列

AAAAAACAACCTTCTGCCAACCTGCGTGCTTCTCACCACCCATGACCCACACAATTGACCCGAATGGGGCAACTCCAGTTCCCAATACGGGAATTAACTCGCCACCATATTTACCGCGTTGAAGCTGTGGTGTGCGGACACTCCGTACTATTTATAGACCCACGCGGTGGAACCAGCACGCGCGCGCACTAAACAGGAAAATCGCATTGAGTCCAGAACCGCCACCAGCACTTGGCCATTGGCGTCTAATTTCCGTTTTCGGCGCCCCTCACCGCGTCCTTCTAACAAAGCGCGCACAAGCTTGAGCAAGTGAAAAGAAAATTAAAAATAAAAAACCGCCACCAAAACAAATAAAGCAATCTTCGAAGTGTGGGTTGGTGGGAAGCCCCTGGCTTTTCCCGCACCAGTCGTTTTCAGGAGTAAAAAAATACCCGTTTGTTTTGGAATTCCCCATTTCGCGGCGACCTGCGCCGGTATCTTTGCAACAACTATTTGCGATAACTCAGCAAAATTTGCATATTCGTGTTGGGATATTGCGATAGTGGGAGTCTTGTTGCATAATAACGGTAAAAAGAAGTGAAGGAAAAAAATTTGCATCCTTTAGTCTCAGTTCAAGTATATAAAGTCGGGATATTCAATTATCTTTCTTTCTCTTGCTCAAAGGTTTCTATATTTTTTTTATAGTATTTCTTTTGTTATAAAATACCAAGAAATTAATCTTCTGTCATTCGCTTAAATACTACATCAATA

SEQ ID NO:46是启动子pNUP57的核酸序列

TCATCTGCGCAATGACTATCAAGACCTTCTGCAAGAATTTCAAATCTCACTGAAAATCTTGACCGAAAAGTGTCTTGAAAACCCATCAAGCCTGCAAAACCTATCTTTGACATTAGTCTCCATTATAAAAACGGCATAGTTGGGAGAAAACTTTCCATACTTCAATTGTGGACTGATATAAGTATTTTAGTTTTGCCCGCATGATCATCCCACATGGCTACAGCAGTTCTCTCATAGGAAAATAGTACAATAGCTACGTGATATAATCTAAATAATTGTTGCCAATGTGTAATTATATCATTTTGAACGTACGCGAAATGGATTATTTTCAAAAATTTTGTTTCTTGAAATGAGTAAAAGCAAAAGTCCAACTCTCCAAGTCGATGTAAACAACTTTTTGCCAAAGGGACTGAAAGACTAAATCGAGGATTATCCCGTTCAAACTATTCCAGAAACGCTCGTTAGTAACAAAAGACATACCTTGTTGACCAATTGATCAC

SEQ ID NO:47是启动子pCCW10.ago的核酸序列

GGTACCACGGCAACCTCGTTCGCTGTTCATCCCCTTCGTCACACAGGACGTTGGATGCCGTAAGCAGCGTTGCTTTTGATCCTCagGATCGGCCGGGTAACCCGCGGCtGCTTCTATTTTAGTATTCATATCTCAAGCACATCCATTCCGGCCGTTTGGGGGCGCCGCCGCACTCGTGTCCATTCCTACCGTGGCACTTAGGGCTATCCTGTCGGAGCGCCCCGCCGACCGCCTTATCGGCACCAAAAGTAGAAGCCCCGGCCCCGCGTGGCTCAGACTCACCATCGGTGCTATTTACTTTTCGATCAGATCGCGGCGCGCGGTGGCCGGCATTTCCGGAAGCGGCCACGGAGCAGAGGTGGCGCATTCGAATCGCATACGTCTTCGCCACGCCGGAAAAAAAATTTTCGGCTATATAAGGAGAGGCGGCCGTCTTGCTGCAGGCAGTTTCACTTTCTCTAAAACCAAAGAACATCGATTTCTTTAGTCACTCGCTTCCTTACACCGAACTCGAGGCGGCCGC

SEQ ID NO:48是启动子pCWP2的核酸序列

CTAGCCTCCCCTTTTTATTTTGTGCGGTCACCGCAAGGGACAAAGCTTTTCTTAGAAAACCGTCTGAGAAGCATAACGTACGCCATCCCCTAGACATATTAATAATGCTACAGATACTATGCTGCTCGTCTTTTTTTGACGACCCTTTTATTGCAATGTGCAACTAATGGCAAACAACCACATAGTATCACAGTATTACATTGCCTCCACCGATGCGGATGTTAGGGCGCCAAGTCTGTCATGAAGCATGTTCCTGTCATAATCTTGTATGCAAAATACCGCGTTCTGCGCCACTGATATGCTAGGCAGCAGCAACCTATGCAGAAGATTGCTTTTCCCACGCCTGTTTTACGTCTCCAGGGCACTTGAAACAATGCAGCGATCGCCGCCACAACACGCCAAAGAGAAGCGAAAGTGGGCCTGGGCGGCCTCAGTTTCGGCAGAGGTAAACAACACGAACTGAACTGCCTTAGCTCCGAAGGGCAATTCCACAGGCACTCCGCGGGGCCCGGCCAAGGCCCAAAAGGCGTGGAATATGCGCGTTTTGGGGCCATAACACCCAGTACCACGGCCGGAACGGGCCATATAATAAGTTTTTCACTCTCAAGAATGGTAAACGTAAATAGGAACATCCCACTACCCTAGAAATTGCGGAAATTTCGCGCTTATCATTAGAAAATCTGGAACCGTCCTTTTTCCTCTTTCTTGCATTTCCCTTTCCGTATTATTGCCATTCTTTAACTGCATTTGGGGAACCGTAGACCAAAAGCCAAACAGAGAAATGTAACGTTCTAAAAAAAAAACAACGAAAAAATTGAAAAATAAGATACAATAATCGTATATAAATCAGGCTTCTTGTTCATCATTTTCAATTCTCTTCTTGCCATCCCTTTTCCTATCTTTGTTCTTTTCTTCTCATAATCAAGAATAAATAACTTCATCA

SEQ ID NO:49是启动子pCCW120.Sca的核酸序列

TATTTTTTTTAAATTAAAGATGCTGTGCAATTAATTGTCCGGAGGGACCCTTGCATACTGGCCAGTTTGTACGGGCGTTACATAGCGCCGATCGACGAACAGCTTATTAATAGCAAGATTTGTTTCTCCCATGAGCAATTAACCAGTAATTTTCACAGAAACTAGCACAAAACCAACCAAACAGTTAAAGGCAGTTTCGGAGAATAAACAACGCGCTCACTGAGCTTGCTGTTGCCAAAAATAACAGTCGCGTGCGATGGCGGGCTTGGCATTTTCCTCGAAGGGGAAACGCCGCCAGGGTTCGCTGCGGTGTGTGGGTGGGGCAGCCCCCGGGCGCCCAGACGGTGCCGCAGGGCCTTGAGACAGCCCAAAATGCCGCGAAAACGCAAGGGCGCGGTGACCTCTTTCCTAATGCGGAAAGCCCCACCGCCAGCGACGTGACGCGTTGTGCGGGCTCTTCTCGGGACCCGGAAAAAGAAATACGTACACAAACACCAGCAAATTTTTTCGCTTGAGAGGCTGCCCGTGTTTCTGCGCAACGTGAAACACGGTGGACAAGACAAGAGAGATTGACAAGCGTCGTTATCGTCCCAGTGAGGTTTCCCAATTATATAAATACATCCCTGTTGGTGGATTCTTAATTACAACTTCCATCTCTCTCTCTCTCACTTCTTTTGTTCCCTTACATATCCCCAAGAAATCAATCTTCTGCCATTCGCTTTAACAACAAACAAACTTTTAACTTTTAAA

SEQ ID NO:50是启动子pRPLA1的核酸序列

TCAAGTTGGATACTGATCTGATCTCTCCGCCCTACTACCAGGGACCCTCATGATTACCGCTCGAATGCGACGTTTCCTGCCTCATAAAACTGGCTTGAAAATATTTATTCGCTGAACAGTAGCCTAGCTTATAAAAATTTCATTTAATTAATGTAATATGAAAACTCACATGCCTTCTGTTTCTAAAATTGTCACAGCAAGAAATAACATTACCATACGTGATCTTATTAAACTCTAGTATCTTGTCTAATACTTCATTTAAAAGAAGCCTTAACCCTGTAGCCTCATCTATGTCTGCTACATATCGTGAGGTACGAATATCGTAAGATGATACCACGCAACTTTGTAATGATTTTTTTTTTTTCATTTTTTAAAGAATGCCTTTACATGGTATTTGAAAAAAATATCTTTATAAAGTTTGCGATCTCTTCTGTTCTGAATAATTTTTAGTAAAAGAAATCAAAAGAATAAAGAAATAGTCCGCTTTGTCCAATACAACAGCTTAAACCGATTATCTCTAAAATAACAAGAAGAA

SEQ ID NO:51是启动子pCUP1的核酸序列

CGGCAAACTTCAACGATTTCTATGATGCATTTTATAATTAGTAAGCCGATCCCATTACCGACATTTGGGCGCTATACGTGCATATGTTCATGTATGTATCTGTATTTAAAACACTTTTGTATTATTTTTCCTCATATATGTGTATAGGTTTATACGGATGATTTAATTATTACTTCACCACCCTTTATTTCAGGCTGATATCTTAGCCTTGTTACTAGTTAGAAAAAGACATTTTTGCTGTCAGTCACTGTCAAGAGATTCTTTTGCTGGCATTTCTTCTAGAAGCAAAAAGAGCGATGCGTCTTTTCCGCTGAACCGTTCCAGCAAAAAAGACTACCAACGCAATATGGATTGTCAGAATCATATAAAAGAGAAGCAAATAACTCCTTGTCTTGTATCAATTGCATTATAATATCTTCTTGTTAGTGCAATATCATATAGAAGTCATCGAAATAGATATTAAGAAAAACAAACTGTACAATCAATCAATCAATCATCACATAAA

SEQ ID NO:52是启动子pMET6的核酸序列

CCACAGGAAATATTTCACGTGACTTACAAACAGAGTCGTACGTCAGGACCGGAGTCAGGTGAAAAAATGTGGGCCGGTAAAGGGAAAAAACCAGAAACGGGACTACTATCGAACTCGTTTAGTCGCGAACGTGCAAAAGGCCAATATTTTTCGCTAGAGTCATCGCAGTCATGGCAGCTCTTTCGCTCTATCTCCCGGTCGCAAAACTGTGGTAGTCATAGCTCGTTCTGCTCAATTGAGAACTGTGAATGTGAATATGGAACAAATGCGATAGATGCACTAATTTAAGGGAAGCTAGCTAGTTTTCCCAACTGCGAAAGAAAAAAAGGAAAGAAAAAAAAATTCTATATAAGTGATAGATATTTCCATCTTTACTAGCATTAGTTTCTCTTTTACGTATTCAATATTTTTGTTAAACTCTTCCTTTATCATAAAAAAGCAAGCATCTAAGAGCATTGACAACACTCTAAGAAACAAAATACCAATATAATTTCAAAGTACATATCAAAA

SEQ ID NO:53是启动子pMET25的核酸序列

TTACATTATCAATCCTTGCGTTTCAGCTTCCACTAATTTAGATGACTATTTCTCATCATTTGCGTCATCTTCTAACACCGTATATGATAATATACTAGTAACGTAAATACTAGTTAGTAGATGATAGTTGATTTTTATTCCAACACTAAGAAATAATTTCGCCATTTCTTGAATGTATTTAAAGATATTTAATGCTATAATAGACATTTAAATCCAATTCTTCCAACATACAATGGGAGTTTGGCCGAGTGGTTTAAGGCGTCAGATTTAGGTGGATTTAACCTCTAAAATCTCTGATATCTTCGGATGCAAGGGTTCGAATCCCTTAGCTCTCATTATTTTTTGCTTTTTCTCTTGAGGTCACATGATCGCAAAATGGCAAATGGCACGTGAAGCTGTCGATATTGGGGAACTGTGGTGGTTGGCAAATGACTAATTAAGTTAGTCAAGGCGCCATCCTCATGAAAACTGTGTAACATAATAACCGAAGTGTCGAAAAGGTGGCACCTTGTCCAATTGAACACGCTCGATGAAAAAAATAAGATATATATAAGGTTAAGTAAAGCGTCTGTTAGAAAGGAAGTTTTTCCTTTTTCTTGCTCTCTTGTCTTTTCATCTACTATTTCCTTCGTGTAATACAGGGTCGTCAGATACATAGATACAATTCTATTACCCCCATCCATACA

SEQ ID NO:54是启动子pSAM1的核酸序列

GAAACGGACGTAAGACGGAAATAGAATTTGAAGATAAAGTTATATATCACTACACACGAATACTTTCTTTTTTTTTTTTCACAGGAAAACTGTGGTGGCGCCCTTGCCTACTAGTGCATTTCTTTTTTCGGGTTCTTGTCTCGAcGAAATTTTAGCCTCATCGTAGTTTTTCACTCTGGTATCGATGAAAAAGGGAAGAGTAAAAAGTTTTCCGTTTAGTACTTAATGGGATTGGTTTGGGACGTATATATCGACTGGTGTTGTCTGTTATTCATCGTTGTTTTTCGGTTAGCTTCGAAAAAAAAATAGAGTAAAAACCAGGAATTTACCCTAAAAACAAGAAAAAATAAGATAAACGAAAAT

SEQ ID NO:55是终止子tTPI1的核酸序列

GATTAATATAATTATATAAAAATATTATCTTCTTTTCTTTATATCTAGTGTTATGTAAAATAAATTGATGACTACGGAAAGCTTTTTTATATTGTTTCTTTTTCATTCTGAGCCACTTAAATTTCGTGAATGTTCTTGTAAGGGACGGTAGATTTACAAGTGATACAACAAAAAGCAAGGCGCTTTTTCTAATAAAAAGAAGAAAAGCATTTAACAATTGAACACCTCTATATCAACGAAGAATATTACTTTGTCTCTAAATCCTTGTAAAATGTGTACGATCTCTATATGGGTTACTCA

SEQ ID NO:56是终止子tMET25的核酸序列

GTGTGCGTAATGAGTTGTAAAATTATGTATAAACCTACTTTCTCTCACAAGTACTATACTTTTATAAAACGAACTTTATTGAAATGAATATCCTTTTTTTCCCTTGTTACATGTCGTGACTCGTACTTTGAACCTAAATTGTTCTAACATCAAAGAACAGTGTTAATTCGCAGTCGAGAAGAAAAATATGGTGAACAAGACTCATCTACTTCATGAGACTACTTTACGCCTCCTATAAAGCTGTCACACTGGATAAATTTATTGTAGGACCAAGTTACAAAAGAGGATGATGGAGGTTT

SEQ ID NO:57是终止子tDIT1的核酸序列

TAAAGTAAGAGCGCTACATTGGTCTACCTTTTTGTTCTTTTACTTAAACATTAGTTAGTTCGTTTTCTTTTTCTCATTTTTTTATGTTTCCCCCCCAAAGTTCTGATTTTATAATATTTTATTTCACACAATTCCATTTAACAGAGGGGGAATAGATTCTTTAGCTTAGAAAATTAGTGATCAATATATATTTGCCTTTCTTTTCATCTTTTCAGTGATATTAATGGTTTCGAGACACTGCAATGGCCCTAGTTGTCTAAGAGGATAGATGTTACTGTCAAAGATGATATTTTGAATTTC

SEQ ID NO:58是终止子tRPL3的核酸序列

GAAGTTTTGTTAGAAAATAAATCATTTTTTAATTGAGCATTCTTATTCCTATTTTATTTAAATAGTTTTATGTATTGTTAGCTACATACAACAGTTTAAATCAAATTTTCTTTTTCCCAAGTCCAAAATGGAGGTTTATTTTGATGACCCGCATGCGATTATGTTTTGAAAGTATAAGACTACATACATGTACATATATTTAAACATGTAAACCCGTCCATTATATTGCTTACTTTCTTCTTTTTTGCCGTTTTGACTTGGACCTCTGGTTTGCTATTTCCTTACAATCTTTGCTACAAT

SEQ ID NO:59是终止子tRPL3.sm的核酸序列

GAAGTTTTTAAAGCATTTTTTAGACACTTCTCATTTTTCTAAGTTTTTTTAAAATAGTTTTATGTATTTACTACGTATCACAATTTGAAATAATTCATCTTCCCAAAAAACTAAGATTTTTATCCTTGTCACGATCCGTAACCAGTTTATAATATTTTAGAGCTTATACACGTACGTATACACACGTGTCGGTACATGAGAATTACGTTCAAAATTATTCACTTTTTTTTTCTCTGCCGTTTTACTTTTGAACTCTGTCTCGCTATTTCCTTACAATCTTCGCTACAATACCACTTGCCCTTGG

SEQ ID NO:60是终止子tRPL3.sba的核酸序列

GAAGTTTTCTGACAAAAACATAACGTTTTTTCCAATCATTTCTTATTTTTCCGGTTTATTTAAATAGTTTTTATGTACTATTATACGTATGACTATTTAACTTAAATTCTTCCTCCCAAGAAATCTCCCAAGTTTTTCATTATCATGGCATACACCACTATCAGTTACAAAATGGTAGCTCAACCATATATATATCTCTATATACACATATAAATGCAAACAGGTCCAAGTCACCGCTCACTGCAGTTTCTTTTGCCGTTTTGACTTCGATCTCTGCTTGGCTATTTTCTCACAATCCT

SEQ ID NO:61是终止子tRPL41B的核酸序列

GCGGATTGAGAGCAAATCGTTAAGTTCAGGTCAAGTAAAAATTGATTTCGAAAACTAATTTCTCTTATACAATCCTTTGATTGGACCGTCATCCTTTCGAATATAAGATTTTGTTAAGAATATTTTAGACAGAGATCTACTTTATATTTAATATCTAGATATTACATAATTTCCTCTCTAATAAAATATCATTAATAAAATAAAAATGAAGCGATTTGATTTTGTGTTGTCAACTTAGTTTGCCGCTATGCCTCTTGGGTAATGCTATTATTGAATCGAAGGGCTTTATTATATTACCCT

SEQ ID NO:62是终止子tRPL15A的核酸序列

GCTGGTTGATGGAAAATATAATTTTATTGGGCAAACTTTTGTTTATCTGATGTGTTTTATACTATTATCTTTTTAATTAATGATTCTATATACAAACCTGTATATTTTTTCTTTAACCAATTTTTTTTTTTATAGACCTAGAGCTGTACTTTTATTCTGCTATCAAGCAAACCCCTACCCCCTCTTCTCAATCCTCCCCTCAGGCAGAACTTATCTACCTGTATCAAGGAGCGGACGAGGGAGTCCTAATTGTTCTACGTATACCAATGCTAGCAGCTTACATAGGTGGTGGCACTACCA

SEQ ID NO:63是终止子tRPL15A.sba的核酸序列

GCTGGCTGATGAAAAATATAGTTCTGTTGGGCAAGCATTTGTTTACCTAGCATCTCTTTTATACTATTATTATCTTTATATTTGATGATTTTATATACAAGTTGTATACCTTTTCTTTAACCAATTTTTTTTTTTCTAATGGTGCACCTAGAAGTACATTTTTTCTCACCAATAGATAGTCAAGATACTCCCAGCCTCTATGGCGTTACCACGGAGCCGACAAGGGAAAGCTGCTTATCTTACATATGCAGATGCCAAGGCCCGTTACAGGCCGCCTTATTGATGTTTAGAAATAGCTTC

SEQ ID NO:64是终止子tIDP1的核酸序列

TCGAATTTACGTAGCCCAATCTACCACTTTTTTTTTTCATTTTTTAAAGTGTTATACTTAGTTATGCTCTAGGATAATGAACTACTTTTTTTTTTTTTTTTTTACTGTTATCATAAATATATATACCTTATTGTTGTTTGCAACCGTCGGTTAATTCCTTATCAAGGTTCCCCAAGTTCGGATCATTACCATCAATTTCCAACATTTTCATGAGTTCTTCTTCTTCATTACCGTGTTTTAGGGGGCTGTTCGCACTTCTAATAGGGCTATCACCAAGCTGTTCTAATTCGTCCAAAAGTT

SEQ ID NO:65是终止子tTEF1.sba的核酸序列

GGAGATTGATAGGACTTTTCTAGTTGCATATCTTTTATTTTTAAATCTTATCTATTAGTTAATTTTTTGTAATTTATCCTTATATATATAGTTTGGTTATTCTAAAACATCATTTCAGTATCTAAAACCTCTCTTATTCATTACCTTTTTATTTAATGGTTTTTGCTACAGGCAAAAATTTAATGGTTTTTGCTACAGGCAAAAATCCCGCCGTGGACTTATTCCACGTTAACTCGGTTACAGGGTCATGAACCATTTTGTCAATTATCGAAATAACTTCTTCAAAAGTCCCTCTTACTT

SEQ ID NO:66是在5’添加的分泌序列的核酸序列

ATGCAATTTAGCACAGTCGCATCAGTAGCCTTCGTTGCCTTGGCCAACTTCGTGGCAGCA

SEQ ID NO:67是N末端添加的分泌序列的氨基酸序列

MQFSTVASVAFVALANFVAA

SEQ ID NO:68是在3’添加的锚定序列的核酸序列

GGATCCGCCATTTCTCAAATCACTGACGGTCAAATCCAAGCTACTACCACTGCTACCACCGAAGCTACCACCACTGCTGCCCCATCTTCCACCGTTGAAACTGTTTCTCCATCCAGCACCGAAACTATCTCTCAACAAACTGAAAATGGTGCTGCTAAGGCCGCTGTCGGTATGGGTGCCGGTGCTCTAGCTGCTGCTGCTATGTTGTTATAA

SEQ ID NO:69是C末端添加的锚定序列的氨基酸序列

AISQITDGQIQATTTATTEATTTAAPSSTVETVSPSSTETISQQTENGAAKAAVGMGAGALAAAAMLL

序列表

<110> 奇华顿股份有限公司

<120> 生产肝素前体的重组细胞

<130> PR92312/MGG

<150> EP21166744.9

<151> 2021-04-01

<160> 69

<170> BiSSAP 1.3.6

<210> 1

<211> 1854

<212> DNA

<213> 多杀巴斯德菌

<220>

<223> 源自多杀巴斯德菌的肝素前体合酶(HSS1)的重编码核酸序列

<400> 1

atgagtttgt tcaaaagggc gactgagctg ttcaaatcgg gtaactataa ggatgcactg 60

acattgtacg agaacatagc caaaatttat ggctcagaat ccctagtgaa gtataacata 120

gatatctgca agaagaacat aacccaatca aaatcgaaca agatagaaga ggacaatatt 180

tccggagaga ataagttctc cgtctctatc aaagacttat acaacgaaat tagtaattct 240

gagctaggga taacaaagga gagattagga gcaccaccct tggtaagcat aattatgacg 300

agtcataata cagagaaatt catcgaagct tccatcaaca gtttattatt gcaaacttat 360

aacaatcttg aggtcattgt ggtagacgac tactccacag acaagacctt ccaaatcgcg 420

tccaggattg caaactcgac gtcaaaagtt aagactttca gattgaattc caaccttgga 480

acgtacttcg caaagaatac gggaatccta aaatcaaaag gggacattat attctttcaa 540

gattctgatg atgtctgcca tcatgaacgt attgagagat gtgtaaatgc acttttgtct 600

aacaaagata acattgccgt taggtgcgct tattctcgta ttaatctgga gacccagaac 660

atcataaagg tcaacgacaa caagtacaag ttaggtctta ttaccctagg agtataccgt 720

aaagtattta atgaaatagg attcttcaac tgtaccacta aggcaagtga cgacgaattt 780

tatcacagga tcatcaaata ctatggcaag aataggataa acaatttgtt cctacctcta 840

tactacaata ccatgcgtga agatagtttg tttagcgata tggtcgagtg ggtagacgaa 900

aacaacatta aacagaaaac aagtgatgca cgtcagaatt atctgcatga attccaaaag 960

atccacaacg aaaggaaatt gaatgagtta aaggagattt tcagcttccc caggattcac 1020

gatgccctac cgataagtaa agagatgagc aagttgtcta acccaaagat ccctgtctac 1080

attaacattt gcagtatacc atctaggata aagcaattac agtatacgat cggagtgctg 1140

aagaatcagt gtgaccattt ccacatttac ttagatggtt atccagaggt tccagatttc 1200

ataaagaagc taggcaacaa ggctaccgta atcaattgcc aaaacaagaa cgagtctatc 1260

agggacaacg gcaagtttat ccttttagaa aagctgatca aagagaataa ggacggctat 1320

tatattacct gtgatgatga cataaggtat cctgctgact acacgaatac catgataaag 1380

aagattaaca agtacaatga caaagcggca ataggtctac acggcgtcat ctttccgtcc 1440

agagtgaata aatacttctc atctgacagg attgtttata actttcagaa gcccttggaa 1500

aacgacacag ccgtcaacat tttgggtact gggaccgttg catttagagt ctccatcttc 1560

aacaagtttt ccctgagcga cttcgagcac cctggtatgg tggatattta tttctcaata 1620

ctatgcaaga agaacaacat attgcaagtt tgtataagca ggccctcaaa ctggttaacc 1680

gaggacaaca agaataccga aaccctgttc cacgagttcc aaaaccgtga cgagatccag 1740

agtaagttga tcatctctaa taatccgtgg ggctacagta gcatctaccc cttacttaac 1800

aacaatgcca actatagcga gttgatacca tgcttatcat tctataatga gtaa 1854

<210> 2

<211> 1956

<212> DNA

<213> 多杀巴斯德菌

<220>

<223> 源自多杀巴斯德菌的肝素前体合酶(HSS2)的重编码核酸序列

<400> 2

atgaagggca agaaagagat gacccaaata cagattgcta agaacccgcc ccaacacgag 60

aaggaaaacg agctgaatac tttccaaaac aagatcgact cccttaaaac gacattaaac 120

aaggacatta tatcacaaca gacattgttg gctaaacagg actcaaagca cccattatct 180

gcaagtcttg agaacgagaa caaacttctt cttaaacagt tgcagcttgt tttgcaggaa 240

tttgaaaaga tatacactta caaccaagca ctagaggcta agcttgagaa agacaaacag 300

accacctcaa taaccgattt atataacgaa gttgcaaagt ctgatctagg gctagttaag 360

gaaactaaca gtgctaaccc tctagtctcc attattatga cttcgcacaa taccgctcaa 420

tttatcgagg catcgattaa ctccttgttg ctacagacat ataagaacat tgagataatt 480

atagtcgatg atgacagttc cgacaacact tttgaaatcg cctcaaggat cgcaaacaca 540

acgtctaagg tccgtgtgtt tcgtttgaac tccaatctgg gcacgtactt tgctaagaat 600

acaggaatcc ttaagagtaa aggcgacata atattcttcc aggactccga cgacgtttgt 660

catcatgaga gaatcgaaag gtgcgtgaac attttgttgg ctaacaaaga gacgattgct 720

gtgaggtgcg catacagtag gctggctcct gaaacgcagc atataattaa agtcaacaac 780

atggattata ggcttggttt catcacactg ggaatgcata ggaaggtttt ccaagagatt 840

gggttcttca actgtacaac aaaaggcagt gacgacgagt tcttccaccg tatagctaaa 900

tactacggta aagaaaagat taagaacctt ttattgccgc tttattataa cacgatgcgt 960

gaaaactcac ttttcactga catggtcgag tggatcgaca accataatat catacagaag 1020

atgtctgaca cacgtcaaca ctatgctact ctgtttcagg cgatgcataa tgagactgca 1080

tcacacgact tcaagaactt gttccagttc ccacgtatat acgacgcctt gcctgttcca 1140

caggagatgt ctaagttatc taaccctaaa ataccggtgt acataaatat atgcagtata 1200

ccatctagga ttgcacagtt acgtaggatt attgggatct taaagaacca gtgcgaccac 1260

tttcacatat acctagacgg atacgtggag atccctgatt ttattaagaa tcttggtaat 1320

aaagcaacgg tcgtccactg caaagacaag gacaactcta ttagggacaa cggcaagttt 1380

attctactgg aagagttaat agaaaagaat caagacgggt actacataac gtgcgacgac 1440

gacattatct atccatcgga ctatataaac acaatgatta agaagctgaa cgagtatgat 1500

gacaaggcgg tcatagggct tcacggaata ttatttccgt caaggatgac gaaatacttt 1560

tccgccgata ggcttgttta ttcgttttac aaacccctag agaaagacaa agcagtaaat 1620

gttcttggga ccggaactgt ctcattcaga gttagtctgt tcaaccaatt ctccctttca 1680

gacttcaccc attcgggaat ggccgacatc tacttctctc tattgtgcaa gaagaacaac 1740

attttacaaa tctgtatctc cagaccggca aattggttga cggaagataa cagagattct 1800

gagaccttat accaccagta tagagataat gacgagcagc agactcagtt gatcatggaa 1860

aatgggccct ggggttactc aagtatctat ccacttgtca agaatcaccc gaagtttacg 1920

gacttaatac catgtttgcc tttctacttc ctataa 1956

<210> 3

<211> 617

<212> PRT

<213> 多杀巴斯德菌

<220>

<223> 源自多杀巴斯德菌的肝素前体合酶(HSS1)的氨基酸序列

<400> 3

Met Ser Leu Phe Lys Arg Ala Thr Glu Leu Phe Lys Ser Gly Asn Tyr

1 5 10 15

Lys Asp Ala Leu Thr Leu Tyr Glu Asn Ile Ala Lys Ile Tyr Gly Ser

20 25 30

Glu Ser Leu Val Lys Tyr Asn Ile Asp Ile Cys Lys Lys Asn Ile Thr

35 40 45

Gln Ser Lys Ser Asn Lys Ile Glu Glu Asp Asn Ile Ser Gly Glu Asn

50 55 60

Lys Phe Ser Val Ser Ile Lys Asp Leu Tyr Asn Glu Ile Ser Asn Ser

65 70 75 80

Glu Leu Gly Ile Thr Lys Glu Arg Leu Gly Ala Pro Pro Leu Val Ser

85 90 95

Ile Ile Met Thr Ser His Asn Thr Glu Lys Phe Ile Glu Ala Ser Ile

100 105 110

Asn Ser Leu Leu Leu Gln Thr Tyr Asn Asn Leu Glu Val Ile Val Val

115 120 125

Asp Asp Tyr Ser Thr Asp Lys Thr Phe Gln Ile Ala Ser Arg Ile Ala

130 135 140

Asn Ser Thr Ser Lys Val Lys Thr Phe Arg Leu Asn Ser Asn Leu Gly

145 150 155 160

Thr Tyr Phe Ala Lys Asn Thr Gly Ile Leu Lys Ser Lys Gly Asp Ile

165 170 175

Ile Phe Phe Gln Asp Ser Asp Asp Val Cys His His Glu Arg Ile Glu

180 185 190

Arg Cys Val Asn Ala Leu Leu Ser Asn Lys Asp Asn Ile Ala Val Arg

195 200 205

Cys Ala Tyr Ser Arg Ile Asn Leu Glu Thr Gln Asn Ile Ile Lys Val

210 215 220

Asn Asp Asn Lys Tyr Lys Leu Gly Leu Ile Thr Leu Gly Val Tyr Arg

225 230 235 240

Lys Val Phe Asn Glu Ile Gly Phe Phe Asn Cys Thr Thr Lys Ala Ser

245 250 255

Asp Asp Glu Phe Tyr His Arg Ile Ile Lys Tyr Tyr Gly Lys Asn Arg

260 265 270

Ile Asn Asn Leu Phe Leu Pro Leu Tyr Tyr Asn Thr Met Arg Glu Asp

275 280 285

Ser Leu Phe Ser Asp Met Val Glu Trp Val Asp Glu Asn Asn Ile Lys

290 295 300

Gln Lys Thr Ser Asp Ala Arg Gln Asn Tyr Leu His Glu Phe Gln Lys

305 310 315 320

Ile His Asn Glu Arg Lys Leu Asn Glu Leu Lys Glu Ile Phe Ser Phe

325 330 335

Pro Arg Ile His Asp Ala Leu Pro Ile Ser Lys Glu Met Ser Lys Leu

340 345 350

Ser Asn Pro Lys Ile Pro Val Tyr Ile Asn Ile Cys Ser Ile Pro Ser

355 360 365

Arg Ile Lys Gln Leu Gln Tyr Thr Ile Gly Val Leu Lys Asn Gln Cys

370 375 380

Asp His Phe His Ile Tyr Leu Asp Gly Tyr Pro Glu Val Pro Asp Phe

385 390 395 400

Ile Lys Lys Leu Gly Asn Lys Ala Thr Val Ile Asn Cys Gln Asn Lys

405 410 415

Asn Glu Ser Ile Arg Asp Asn Gly Lys Phe Ile Leu Leu Glu Lys Leu

420 425 430

Ile Lys Glu Asn Lys Asp Gly Tyr Tyr Ile Thr Cys Asp Asp Asp Ile

435 440 445

Arg Tyr Pro Ala Asp Tyr Thr Asn Thr Met Ile Lys Lys Ile Asn Lys

450 455 460

Tyr Asn Asp Lys Ala Ala Ile Gly Leu His Gly Val Ile Phe Pro Ser

465 470 475 480

Arg Val Asn Lys Tyr Phe Ser Ser Asp Arg Ile Val Tyr Asn Phe Gln

485 490 495

Lys Pro Leu Glu Asn Asp Thr Ala Val Asn Ile Leu Gly Thr Gly Thr

500 505 510

Val Ala Phe Arg Val Ser Ile Phe Asn Lys Phe Ser Leu Ser Asp Phe

515 520 525

Glu His Pro Gly Met Val Asp Ile Tyr Phe Ser Ile Leu Cys Lys Lys

530 535 540

Asn Asn Ile Leu Gln Val Cys Ile Ser Arg Pro Ser Asn Trp Leu Thr

545 550 555 560

Glu Asp Asn Lys Asn Thr Glu Thr Leu Phe His Glu Phe Gln Asn Arg

565 570 575

Asp Glu Ile Gln Ser Lys Leu Ile Ile Ser Asn Asn Pro Trp Gly Tyr

580 585 590

Ser Ser Ile Tyr Pro Leu Leu Asn Asn Asn Ala Asn Tyr Ser Glu Leu

595 600 605

Ile Pro Cys Leu Ser Phe Tyr Asn Glu

610 615

<210> 4

<211> 652

<212> PRT

<213> 多杀巴斯德菌

<220>

<223> 源自多杀巴斯德菌的肝素前体合酶(HSS2)的氨基酸序列

<400> 4

Met Ala Lys Gly Lys Lys Glu Met Thr Gln Ile Gln Ile Ala Lys Asn

1 5 10 15

Pro Pro Gln His Glu Lys Glu Asn Glu Leu Asn Thr Phe Gln Asn Lys

20 25 30

Ile Asp Ser Leu Lys Thr Thr Leu Asn Lys Asp Ile Ile Ser Gln Gln

35 40 45

Thr Leu Leu Ala Lys Gln Asp Ser Lys His Pro Leu Ser Ala Ser Leu

50 55 60

Glu Asn Glu Asn Lys Leu Leu Leu Lys Gln Leu Gln Leu Val Leu Gln

65 70 75 80

Glu Phe Glu Lys Ile Tyr Thr Tyr Asn Gln Ala Leu Glu Ala Lys Leu

85 90 95

Glu Lys Asp Lys Gln Thr Thr Ser Ile Thr Asp Leu Tyr Asn Glu Val

100 105 110

Ala Lys Ser Asp Leu Gly Leu Val Lys Glu Thr Asn Ser Ala Asn Pro

115 120 125

Leu Val Ser Ile Ile Met Thr Ser His Asn Thr Ala Gln Phe Ile Glu

130 135 140

Ala Ser Ile Asn Ser Leu Leu Leu Gln Thr Tyr Lys Asn Ile Glu Ile

145 150 155 160

Ile Ile Val Asp Asp Asp Ser Ser Asp Asn Thr Phe Glu Ile Ala Ser

165 170 175

Arg Ile Ala Asn Thr Thr Ser Lys Val Arg Val Phe Arg Leu Asn Ser

180 185 190

Asn Leu Gly Thr Tyr Phe Ala Lys Asn Thr Gly Ile Leu Lys Ser Lys

195 200 205

Gly Asp Ile Ile Phe Phe Gln Asp Ser Asp Asp Val Cys His His Glu

210 215 220

Arg Ile Glu Arg Cys Val Asn Ile Leu Leu Ala Asn Lys Glu Thr Ile

225 230 235 240

Ala Val Arg Cys Ala Tyr Ser Arg Leu Ala Pro Glu Thr Gln His Ile

245 250 255

Ile Lys Val Asn Asn Met Asp Tyr Arg Leu Gly Phe Ile Thr Leu Gly

260 265 270

Met His Arg Lys Val Phe Gln Glu Ile Gly Phe Phe Asn Cys Thr Thr

275 280 285

Lys Gly Ser Asp Asp Glu Phe Phe His Arg Ile Ala Lys Tyr Tyr Gly

290 295 300

Lys Glu Lys Ile Lys Asn Leu Leu Leu Pro Leu Tyr Tyr Asn Thr Met

305 310 315 320

Arg Glu Asn Ser Leu Phe Thr Asp Met Val Glu Trp Ile Asp Asn His

325 330 335

Asn Ile Ile Gln Lys Met Ser Asp Thr Arg Gln His Tyr Ala Thr Leu

340 345 350

Phe Gln Ala Met His Asn Glu Thr Ala Ser His Asp Phe Lys Asn Leu

355 360 365

Phe Gln Phe Pro Arg Ile Tyr Asp Ala Leu Pro Val Pro Gln Glu Met

370 375 380

Ser Lys Leu Ser Asn Pro Lys Ile Pro Val Tyr Ile Asn Ile Cys Ser

385 390 395 400

Ile Pro Ser Arg Ile Ala Gln Leu Arg Arg Ile Ile Gly Ile Leu Lys

405 410 415

Asn Gln Cys Asp His Phe His Ile Tyr Leu Asp Gly Tyr Val Glu Ile

420 425 430

Pro Asp Phe Ile Lys Asn Leu Gly Asn Lys Ala Thr Val Val His Cys

435 440 445

Lys Asp Lys Asp Asn Ser Ile Arg Asp Asn Gly Lys Phe Ile Leu Leu

450 455 460

Glu Glu Leu Ile Glu Lys Asn Gln Asp Gly Tyr Tyr Ile Thr Cys Asp

465 470 475 480

Asp Asp Ile Ile Tyr Pro Ser Asp Tyr Ile Asn Thr Met Ile Lys Lys

485 490 495

Leu Asn Glu Tyr Asp Asp Lys Ala Val Ile Gly Leu His Gly Ile Leu

500 505 510

Phe Pro Ser Arg Met Thr Lys Tyr Phe Ser Ala Asp Arg Leu Val Tyr

515 520 525

Ser Phe Tyr Lys Pro Leu Glu Lys Asp Lys Ala Val Asn Val Leu Gly

530 535 540

Thr Gly Thr Val Ser Phe Arg Val Ser Leu Phe Asn Gln Phe Ser Leu

545 550 555 560

Ser Asp Phe Thr His Ser Gly Met Ala Asp Ile Tyr Phe Ser Leu Leu

565 570 575

Cys Lys Lys Asn Asn Ile Leu Gln Ile Cys Ile Ser Arg Pro Ala Asn

580 585 590

Trp Leu Thr Glu Asp Asn Arg Asp Ser Glu Thr Leu Tyr His Gln Tyr

595 600 605

Arg Asp Asn Asp Glu Gln Gln Thr Gln Leu Ile Met Glu Asn Gly Pro

610 615 620

Trp Gly Tyr Ser Ser Ile Tyr Pro Leu Val Lys Asn His Pro Lys Phe

625 630 635 640

Thr Asp Leu Ile Pro Cys Leu Pro Phe Tyr Phe Leu

645 650

<210> 5

<211> 1446

<212> DNA

<213> 拟南芥

<220>

<223> 源自拟南芥的UDP-葡萄糖脱氢酶(HASB)的核酸序列

<400> 5

atggtcaaaa tatgctgtat cggggctgga tatgtcggtg ggcctacaat ggccgttatg 60

gccctaaagt gtccagagat tgaagtcgtg gtagttgata tatcggagcc acgaattaac 120

gcatggaact cagaccgtct accaatttat gagccagggt tagaggatgt cgtcaaacag 180

tgtagaggga agaatttgtt cttctctaca gatgtagaga agcatgtatt tgagtcagat 240

atagtgtttg tttcggtaaa cactcctacg aaaacgcagg gtctgggtgc aggtaaagca 300

gcagatttga catattggga gtccgctgct cgcatgatag ctgatgtgag caaatcgtcg 360

aaaatcgtcg ttgaaaagag tacagtacca gttcgtacag ccgaggctat agaaaagatt 420

ttaacgcaca attcgaaggg tatcgaattc cagatcttat caaatccaga attcttggcc 480

gaagggacgg cgattaaaga cttatataac cctgatagag ttctaatcgg tggcagggac 540

accgctgcgg gacaaaaggc cattaaggcg ttgcgtgacg tgtatgccca ctgggttcct 600

gttgagcaaa taatctgtac taatttatgg agtgccgagc tatcaaagtt ggctgcgaac 660

gcatttctag ctcaaaggat aagttcagta aacgcaatgt cagcgctttg tgaggcaact 720

ggtgctgacg taacccaagt cgctcacgcc gttggaaccg acactagaat tggaccgaag 780

tttcttaacg catccgtagg cttcggcgga tcttgctttc agaaagacat cctgaatctt 840

atttacatct gcgaatgcaa tggtcttcca gaagcagcca attattggaa acaggtagtc 900

aaggtaaatg actaccaaaa gattaggttt gctaatcgag tcgtatcttc tatgttcaac 960

accgtctccg gtaagaaaat tgctattttg ggatttgcgt tcaagaagga caccggcgac 1020

acgcgtgaaa ctcctgccat agatgtgtgt aatcgcctcg tggctgataa agcaaagctg 1080

tcgatctatg atccgcaagt attagaagag cagatccgcc gtgatctgtc catggcccga 1140

ttcgattggg accatccagt cccactccag cagatcaaag ctgaaggtat ctccgaacag 1200

gttaacgttg tgtccgacgc ctacgaggct acgaaggatg ctcatggttt atgtgtttta 1260

accgaatggg acgaattcaa gtcacttgat tttaagaaga tctttgataa tatgcagaaa 1320

cccgctttcg ttttcgacgg aagaaacgtg gtcgacgctg tgaaattgag agaaattgga 1380

ttcatagtat attccatagg taaacctctg gatagttggc tcaaggatat gccggctgtt 1440

gcataa 1446

<210> 6

<211> 1166

<212> DNA

<213> 小球藻属病毒

<220>

<223> 源自小球藻属病毒PBCV-1的UDP-葡萄糖脱氢酶(HASB)的重编码核酸序列

<400> 6

atgagtagaa ttgctgtcgt tggatgcggt tacgtgggta cggcctgcgc cgtacttttg 60

gcgcagaaga acgaagttat cgttttggat atctcggagg accgggtaca actgattaag 120

aataagaagt cacctataga agataaggaa atcgaagaat tcctggagac gaaagatttg 180

aatctaacag cgacgacgga taaggtgctc gcctatgaga atgctgaatt cgttataata 240

gctacaccga ccgattacga tgtcgtcact agatatttca acactaagtc tgttgaaaat 300

gtgataggcg atgtcattaa gaacactcag acacacccta ctatagtgat caagagtact 360

attccaatcg gtttcgtgga taaagttaga gaacagttcg attatcaaaa tattatcttc 420

tcgccggaat tcttgagaga aggacgagca ttatatgata atctttaccc ctcccgtatc 480

atcgtcggtg atgactcccc aattgcctta aaattcgcga atctcttggt cgagggtagc 540

aaaactccac tagctcccgt attaactatg ggtacgcgag aggccgaagc tgtaaaacta 600

ttttcaaata catatttggc tatgagagta gcatacttca atgagctaga cacatttgca 660

atgtcccatg gtatgaacgc aaaagagatt atcgacggag tcacactaga accaaggata 720

gggcagggtt attcgaatcc ttcatttggg tatggagcct attgtttccc aaaagataca 780

aagcaattgt tggctaattt tgaaggggtt ccacaagata ttattggcgc aatcgtagag 840

tctaacgaaa ctagaaagga ggttattgtt tctgaggtcg agaacagatt tccgaccaca 900

gttggcgtat ataagttggc tgctaaagct ggttcggata atttcaggtc tagtgcgata 960

gtcgatatca tggaaaggtt ggctaataag ggctaccaca tcaaaatatt tgaacctacc 1020

gttgaacaat ttgagaattt tgaggtagat aataatctca caacttttgc aaccgagtct 1080

gatgtaataa ttgcgaacag agttccagtc gaacatcgca ttctgtttgg gaagaagtta 1140

ataacacggg atgtctatgg ggataa 1166

<210> 7

<211> 1170

<212> DNA

<213> 小球藻属病毒

<220>

<223> 源自小球藻属病毒PBCV-1的UDP-葡萄糖脱氢酶(HASB-A)的重编码核酸序列

<400> 7

atgtcacgaa tcgcagtagt tggctgtggg tacgtgggaa ccgcatgcgc tgtactgctg 60

gcgcaaaaga atgaggtaat cgttcttgat attagtgagg atagggtcca actaatcaag 120

aacaagaaat ccccgatcga agataaggag attgaagaat tcttggaaac aaaagaccta 180

aacttaactg caacaactga caaagtttta gcctacgaaa acgctgagtt tgtgattata 240

gcgacaccca cagattatga cgtagttacc agatacttta acacgaagtc cgtagagaac 300

gtcattggag atgttataaa gaatactcag actcatccta cgatagtaat aaagtcaacc 360

attcccatag gtttcgtaga taaggttagg gagcaattcg attaccagaa cattatattt 420

tcgccagaat ttctgagaga gggtcgcgcc ctgtatgata atctatatcc atcacggatt 480

atagtgggcg atgactctcc gattgcactt aagtttgcta atcttttagt tgagggctcc 540

aaaactccgc tcgccccagt acttacgatg ggtacacgtg aggctgaagc tgtcaagctg 600

ttttcaaaca cataccttgc tatgcgagtc gcatacttta acgaactaga tacctttgct 660

atgtcgcacg gtatgaatgc taaagaaatc atagatggcg taacgttgga gcctcggata 720

ggtcaaggat attccaatcc atcttttggc tacggtgcgt attgtttccc aaaggacacg 780

aagcaattat tagctaactt tgagggtgtt ccgcaagata taattggggc gatagtagaa 840

agcaatgaaa cacggaagga ggtaatcgtg agtgaagtgg aaaaccgatt ccccactacg 900

gtcggcgttt acaaattagc cgccaaggct ggttccgaca atttccgatc cagcgcaata 960

gtagatatta tggaaagatt agctaataag ggataccaca ttaaaatctt tgaacctact 1020

gtcgaacagt tcgagaactt cgaggttgat aataacttga cgactttcgc aacggagagc 1080

gatgtaatta ttgcaaaccg cgtacctgtg gaacatcgaa ttttgttcgg aaagaagctg 1140

attacacgcg atgtatatgg cgataactaa 1170

<210> 8

<211> 481

<212> PRT

<213> 拟南芥

<220>

<223> 源自拟南芥的UDP-葡萄糖脱氢酶(HASB)的氨基酸序列

<400> 8

Met Val Lys Ile Cys Cys Ile Gly Ala Gly Tyr Val Gly Gly Pro Thr

1 5 10 15

Met Ala Val Met Ala Leu Lys Cys Pro Glu Ile Glu Val Val Val Val

20 25 30

Asp Ile Ser Glu Pro Arg Ile Asn Ala Trp Asn Ser Asp Arg Leu Pro

35 40 45

Ile Tyr Glu Pro Gly Leu Glu Asp Val Val Lys Gln Cys Arg Gly Lys

50 55 60

Asn Leu Phe Phe Ser Thr Asp Val Glu Lys His Val Phe Glu Ser Asp

65 70 75 80

Ile Val Phe Val Ser Val Asn Thr Pro Thr Lys Thr Gln Gly Leu Gly

85 90 95

Ala Gly Lys Ala Ala Asp Leu Thr Tyr Trp Glu Ser Ala Ala Arg Met

100 105 110

Ile Ala Asp Val Ser Lys Ser Ser Lys Ile Val Val Glu Lys Ser Thr

115 120 125

Val Pro Val Arg Thr Ala Glu Ala Ile Glu Lys Ile Leu Thr His Asn

130 135 140

Ser Lys Gly Ile Glu Phe Gln Ile Leu Ser Asn Pro Glu Phe Leu Ala

145 150 155 160

Glu Gly Thr Ala Ile Lys Asp Leu Tyr Asn Pro Asp Arg Val Leu Ile

165 170 175

Gly Gly Arg Asp Thr Ala Ala Gly Gln Lys Ala Ile Lys Ala Leu Arg

180 185 190

Asp Val Tyr Ala His Trp Val Pro Val Glu Gln Ile Ile Cys Thr Asn

195 200 205

Leu Trp Ser Ala Glu Leu Ser Lys Leu Ala Ala Asn Ala Phe Leu Ala

210 215 220

Gln Arg Ile Ser Ser Val Asn Ala Met Ser Ala Leu Cys Glu Ala Thr

225 230 235 240

Gly Ala Asp Val Thr Gln Val Ala His Ala Val Gly Thr Asp Thr Arg

245 250 255

Ile Gly Pro Lys Phe Leu Asn Ala Ser Val Gly Phe Gly Gly Ser Cys

260 265 270

Phe Gln Lys Asp Ile Leu Asn Leu Ile Tyr Ile Cys Glu Cys Asn Gly

275 280 285

Leu Pro Glu Ala Ala Asn Tyr Trp Lys Gln Val Val Lys Val Asn Asp

290 295 300

Tyr Gln Lys Ile Arg Phe Ala Asn Arg Val Val Ser Ser Met Phe Asn

305 310 315 320

Thr Val Ser Gly Lys Lys Ile Ala Ile Leu Gly Phe Ala Phe Lys Lys

325 330 335

Asp Thr Gly Asp Thr Arg Glu Thr Pro Ala Ile Asp Val Cys Asn Arg

340 345 350

Leu Val Ala Asp Lys Ala Lys Leu Ser Ile Tyr Asp Pro Gln Val Leu

355 360 365

Glu Glu Gln Ile Arg Arg Asp Leu Ser Met Ala Arg Phe Asp Trp Asp

370 375 380

His Pro Val Pro Leu Gln Gln Ile Lys Ala Glu Gly Ile Ser Glu Gln

385 390 395 400

Val Asn Val Val Ser Asp Ala Tyr Glu Ala Thr Lys Asp Ala His Gly

405 410 415

Leu Cys Val Leu Thr Glu Trp Asp Glu Phe Lys Ser Leu Asp Phe Lys

420 425 430

Lys Ile Phe Asp Asn Met Gln Lys Pro Ala Phe Val Phe Asp Gly Arg

435 440 445

Asn Val Val Asp Ala Val Lys Leu Arg Glu Ile Gly Phe Ile Val Tyr

450 455 460

Ser Ile Gly Lys Pro Leu Asp Ser Trp Leu Lys Asp Met Pro Ala Val

465 470 475 480

Ala

<210> 9

<211> 389

<212> PRT

<213> 小球藻属病毒

<220>

<223> 源自小球藻属病毒PBCV1的UDP-葡萄糖脱氢酶(HASB)的氨基酸序列

<400> 9

Met Ser Arg Ile Ala Val Val Gly Cys Gly Tyr Val Gly Thr Ala Cys

1 5 10 15

Ala Val Leu Leu Ala Gln Lys Asn Glu Val Ile Val Leu Asp Ile Ser

20 25 30

Glu Asp Arg Val Gln Leu Ile Lys Asn Lys Lys Ser Pro Ile Glu Asp

35 40 45

Lys Glu Ile Glu Glu Phe Leu Glu Thr Lys Asp Leu Asn Leu Thr Ala

50 55 60

Thr Thr Asp Lys Val Leu Ala Tyr Glu Asn Ala Glu Phe Val Ile Ile

65 70 75 80

Ala Thr Pro Thr Asp Tyr Asp Val Val Thr Arg Tyr Phe Asn Thr Lys

85 90 95

Ser Val Glu Asn Val Ile Gly Asp Val Ile Lys Asn Thr Gln Thr His

100 105 110

Pro Thr Ile Val Ile Lys Ser Thr Ile Pro Ile Gly Phe Val Asp Lys

115 120 125

Val Arg Glu Gln Phe Asp Tyr Gln Asn Ile Ile Phe Ser Pro Glu Phe

130 135 140

Leu Arg Glu Gly Arg Ala Leu Tyr Asp Asn Leu Tyr Pro Ser Arg Ile

145 150 155 160

Ile Val Gly Asp Asp Ser Pro Ile Ala Leu Lys Phe Ala Asn Leu Leu

165 170 175

Val Glu Gly Ser Lys Thr Pro Leu Ala Pro Val Leu Thr Met Gly Thr

180 185 190

Arg Glu Ala Glu Ala Val Lys Leu Phe Ser Asn Thr Tyr Leu Ala Met

195 200 205

Arg Val Ala Tyr Phe Asn Glu Leu Asp Thr Phe Ala Met Ser His Gly

210 215 220

Met Asn Ala Lys Glu Ile Ile Asp Gly Val Thr Leu Glu Pro Arg Ile

225 230 235 240

Gly Gln Gly Tyr Ser Asn Pro Ser Phe Gly Tyr Gly Ala Tyr Cys Phe

245 250 255

Pro Lys Asp Thr Lys Gln Leu Leu Ala Asn Phe Glu Gly Val Pro Gln

260 265 270

Asp Ile Ile Gly Ala Ile Val Glu Ser Asn Glu Thr Arg Lys Glu Val

275 280 285

Ile Val Ser Glu Val Glu Asn Arg Phe Pro Thr Thr Val Gly Val Tyr

290 295 300

Lys Leu Ala Ala Lys Ala Gly Ser Asp Asn Phe Arg Ser Ser Ala Ile

305 310 315 320

Val Asp Ile Met Glu Arg Leu Ala Asn Lys Gly Tyr His Ile Lys Ile

325 330 335

Phe Glu Pro Thr Val Glu Gln Phe Glu Asn Phe Glu Val Asp Asn Asn

340 345 350

Leu Thr Thr Phe Ala Thr Glu Ser Asp Val Ile Ile Ala Asn Arg Val

355 360 365

Pro Val Glu His Arg Ile Leu Phe Gly Lys Lys Leu Ile Thr Arg Asp

370 375 380

Val Tyr Gly Asp Asn

385

<210> 10

<211> 1968

<212> DNA

<213> 解肝磷脂土地杆菌

<220>

<223> 具有N-末端分泌信号的源自解肝磷脂土地杆菌的葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶的重编码核酸序列

<400> 10

atgcaattct cgacggtcgc aagtgttgcc tttgttgctt tggctaactt cgttgccgca 60

cagtcctcgt caatcaccag gaaggacttc gatcatatca acttggaata ctccggtttg 120

gagaaggtga acaaggcggt agcagcaggc aattacgacg acgcggcaaa agccctacta 180

gcttactacc gtgaaaagag caaagcaaga gagcctgact ttagtaatgc cgagaagcct 240

gccgacatac gtcagcctat tgacaaggta acacgtgaga tggcggataa agcattagta 300

catcagtttc aacctcacaa aggatacgga tattttgatt atgggaagga tattaattgg 360

cagatgtggc cagttaaaga caacgaggtc agatggcagt tgcatagggt aaaatggtgg 420

caggcaatgg ccttggttta ccatgccacg ggcgacgaga agtacgccag ggagtgggtg 480

taccaatact cggactgggc gaggaagaac ccgttaggct tatcgcaaga caatgataag 540

tttgtctgga gacctttgga agtctcagat agagtccagt cattgccacc taccttttct 600

cttttcgtca acagtcccgc cttcacacca gcattcctaa tggagttctt aaactcgtac 660

caccaacagg cagactactt gtcaacacac tacgccgagc aggggaacca taggctgttc 720

gaagctcaga ggaacttgtt cgccggcgta tccttccccg aattcaagga ctcacccagg 780

tggagacaga ctggaatatc tgttctgaat acagagataa agaagcaggt gtacgccgat 840

ggcatgcaat tcgagttaag tccgatatac cacgttgctg ccatagatat ctttcttaaa 900

gcatacggaa gcgccaagag agttaatttg gagaaagagt tccctcaatc ctatgtgcaa 960

accgtcgaga atatgattat ggcgttaatt tcaataagtc taccggacta taatacgccc 1020

atgttcggcg actcttggat cactgataag aatttcagaa tggctcaatt tgcctcatgg 1080

gcgcgtgtct tccccgctaa ccaggcaatt aagtactttg caaccgacgg aaaacagggt 1140

aaagctccca acttcttgag taaggcattg tccaatgcag gattctacac gtttagaagt 1200

ggatgggata agaacgcgac agtgatggta ctgaaggcaa gtccgcctgg tgagtttcac 1260

gctcagcctg ataacggaac ttttgaactg ttcatcaagg gtaggaactt cacacccgac 1320

gccggtgtat tcgtctattc cggtgacgag gcgattatga aattgaggaa ctggtacagg 1380

cagacaagga ttcactctac tctaactctt gataatcaga atatggtcat aacgaaagca 1440

cgtcagaata aatgggagac aggcaataac ttggatgtct taacttacac taacccgtca 1500

taccccaact tagatcacca acgttcagtt ctattcatta acaagaagta tttcttagtc 1560

atagataggg ctatcggcga ggccacgggc aaccttggcg tgcactggca gctaaaggaa 1620

gacagtaacc ctgtcttcga taaaaccaag aatagagtct atactaccta tagggacggg 1680

aacaatctaa tgatacagag tctaaacgca gacaggacat cactgaacga ggaagaaggg 1740

aaggtatctt atgtctataa caaggagctg aagcgtccag ctttcgtatt tgagaagcct 1800

aagaagaacg cagggaccca aaactttgtg tcaattgtct atccatacga cggtcagaag 1860

gcgccggaaa tttctattag agaaaataag ggaaatgact tcgaaaaggg aaaattgaac 1920

ctaacactga ctataaacgg taagcaacag cttgtgttgg ttccttaa 1968

<210> 11

<211> 2178

<212> DNA

<213> 解肝磷脂土地杆菌

<220>

<223> 具有N-末端分泌信号和C-末端锚定信号的源自解肝磷脂土地杆菌的葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶的重编码核酸序列

<400> 11

atgcaattct cgacggtcgc aagtgttgcc tttgttgctt tggctaactt cgttgccgca 60

cagtcctcgt caatcaccag gaaggacttc gatcatatca acttggaata ctccggtttg 120

gagaaggtga acaaggcggt agcagcaggc aattacgacg acgcggcaaa agccctacta 180

gcttactacc gtgaaaagag caaagcaaga gagcctgact ttagtaatgc cgagaagcct 240

gccgacatac gtcagcctat tgacaaggta acacgtgaga tggcggataa agcattagta 300

catcagtttc aacctcacaa aggatacgga tattttgatt atgggaagga tattaattgg 360

cagatgtggc cagttaaaga caacgaggtc agatggcagt tgcatagggt aaaatggtgg 420

caggcaatgg ccttggttta ccatgccacg ggcgacgaga agtacgccag ggagtgggtg 480

taccaatact cggactgggc gaggaagaac ccgttaggct tatcgcaaga caatgataag 540

tttgtctgga gacctttgga agtctcagat agagtccagt cattgccacc taccttttct 600

cttttcgtca acagtcccgc cttcacacca gcattcctaa tggagttctt aaactcgtac 660

caccaacagg cagactactt gtcaacacac tacgccgagc aggggaacca taggctgttc 720

gaagctcaga ggaacttgtt cgccggcgta tccttccccg aattcaagga ctcacccagg 780

tggagacaga ctggaatatc tgttctgaat acagagataa agaagcaggt gtacgccgat 840

ggcatgcaat tcgagttaag tccgatatac cacgttgctg ccatagatat ctttcttaaa 900

gcatacggaa gcgccaagag agttaatttg gagaaagagt tccctcaatc ctatgtgcaa 960

accgtcgaga atatgattat ggcgttaatt tcaataagtc taccggacta taatacgccc 1020

atgttcggcg actcttggat cactgataag aatttcagaa tggctcaatt tgcctcatgg 1080

gcgcgtgtct tccccgctaa ccaggcaatt aagtactttg caaccgacgg aaaacagggt 1140

aaagctccca acttcttgag taaggcattg tccaatgcag gattctacac gtttagaagt 1200

ggatgggata agaacgcgac agtgatggta ctgaaggcaa gtccgcctgg tgagtttcac 1260

gctcagcctg ataacggaac ttttgaactg ttcatcaagg gtaggaactt cacacccgac 1320

gccggtgtat tcgtctattc cggtgacgag gcgattatga aattgaggaa ctggtacagg 1380

cagacaagga ttcactctac tctaactctt gataatcaga atatggtcat aacgaaagca 1440

cgtcagaata aatgggagac aggcaataac ttggatgtct taacttacac taacccgtca 1500

taccccaact tagatcacca acgttcagtt ctattcatta acaagaagta tttcttagtc 1560

atagataggg ctatcggcga ggccacgggc aaccttggcg tgcactggca gctaaaggaa 1620

gacagtaacc ctgtcttcga taaaaccaag aatagagtct atactaccta tagggacggg 1680

aacaatctaa tgatacagag tctaaacgca gacaggacat cactgaacga ggaagaaggg 1740

aaggtatctt atgtctataa caaggagctg aagcgtccag ctttcgtatt tgagaagcct 1800

aagaagaacg cagggaccca aaactttgtg tcaattgtct atccatacga cggtcagaag 1860

gcgccggaaa tttctattag agaaaataag ggaaatgact tcgaaaaggg aaaattgaac 1920

ctaacactga ctataaacgg taagcaacag cttgtgttgg ttcctggatc cgccatttct 1980

caaatcactg acggtcaaat ccaagctact accactgcta ccaccgaagc taccaccact 2040

gctgccccat cttccaccgt tgaaactgtt tctccatcca gcaccgaaac tatctctcaa 2100

caaactgaaa atggtgctgc taaggccgct gtcggtatgg gtgccggtgc tctagctgct 2160

gctgctatgt tgttataa 2178

<210> 12

<211> 1968

<212> DNA

<213> 解肝磷脂土地杆菌

<220>

<400> 12

atgcagtttt caaccgtggc atctgtggca ttcgtggcat tggcaaattt tgtcgctgct 60

caatcttcca gtattacgcg taaagatttt gaccacataa atcttgagta tagtggccta 120

gagaaagtca ataaagctgt cgccgctggt aactatgatg atgcagccaa ggctttgtta 180

gcctattata gagagaaatc taaggctcgt gaaccggatt tctctaacgc tgaaaagcca 240

gcggatatca gacaaccaat cgataaagtc accagggaaa tggcagacaa ggctttggtt 300

caccaattcc agccccataa gggctatggt tacttcgact acggtaaaga cataaactgg 360

caaatgtggc ccgtaaagga taatgaagta aggtggcaac ttcacagagt gaagtggtgg 420

caagctatgg ctctggtgta tcacgcaacc ggtgatgaaa agtatgctag agaatgggta 480

tatcagtatt ctgattgggc taggaagaat ccactaggac tttctcagga taacgacaaa 540

ttcgtttggc gtccactaga ggtatctgac agggtacaat ctttaccccc gacgttcagt 600

ctgtttgtta attctccagc atttaccccg gctttcttga tggaattctt gaattcttat 660

catcagcaag cggattattt aagcacccat tatgcagaac aaggaaatca cagattattt 720

gaggcccaac gtaatttatt tgcgggtgtt agttttccag agtttaaaga ttcgccaaga 780

tggagacaaa ccggtatcag cgtgttaaac actgaaatca agaaacaagt atatgctgac 840

ggtatgcagt ttgaactatc tccaatttat catgtcgcag caattgacat attcttgaag 900

gcttatggca gtgctaaacg tgtcaactta gaaaaggaat ttccacagtc atacgtccag 960

actgtagaaa acatgatcat ggcccttatc agcatctcat tgcctgatta caacactcca 1020

atgtttggtg atagttggat aacggacaag aactttagga tggcacagtt cgcaagctgg 1080

gctagagtat ttccagcaaa tcaagctata aaatatttcg cgactgatgg taagcaaggg 1140

aaggccccta attttctatc taaagcttta agcaacgccg gcttttatac tttcaggtcc 1200

ggttgggaca agaatgcaac tgtcatggtg ttaaaagcgt ctccacccgg agaattccat 1260

gcgcaaccag acaatgggac attcgagttg tttattaaag ggagaaattt taccccagat 1320

gctggagtgt ttgtgtactc aggggatgaa gcgataatga agttaagaaa ttggtatcgt 1380

caaaccagaa tacattccac acttacactg gacaaccaaa acatggtgat tactaaggct 1440

agacaaaaca agtgggaaac tggtaacaat ctggacgttt tgacatatac gaacccttcc 1500

tatccaaatc ttgaccatca gaggtcggtc ttatttataa ataagaaata cttcttggtt 1560

atcgacagag ccattggtga agcaacaggt aatctgggtg ttcattggca attgaaagag 1620

gattctaatc cagtgtttga caagacgaag aacagggtat acacaacata ccgtgatggt 1680

aataacttaa tgatccagtc cttaaatgct gatcgtactt ctcttaatga agaggaaggt 1740

aaggtttcct acgtgtacaa taaagaacta aagagacccg cctttgtctt cgaaaagccc 1800

aagaagaatg ccggaacgca gaatttcgta tctatcgttt acccttatga tggccagaaa 1860

gctccagaga taagcatccg tgagaacaaa ggtaacgatt ttgagaaagg taagcttaat 1920

ttgacgctaa cgattaatgg gaaacagcaa ttagtcttag taccataa 1968

<210> 13

<211> 1968

<212> DNA

<213> 解肝磷脂土地杆菌

<220>

<400> 13

atgcagtttt caaccgtggc atctgtggca ttcgtggcat tggcaaattt tgtcgctgct 60

caatcttcca gtattacgcg taaagatttt gaccacataa atcttgagta tagtggccta 120

gagaaagtca ataaagctgt cgccgctggt aactatgatg atgcagccaa ggctttgtta 180

gcctattata gagagaaatc taaggctcgt gaaccggatt tctctaacgc tgaaaagcca 240

gcggatatca gacaaccaat cgataaagtc accagggaaa tggcagacaa ggctttggtt 300

caccaattcc agccccataa gggctatggt tacttcgact acggtaaaga cataaactgg 360

caaatgtggc ccgtaaagga taatgaagta aggtggcaac ttcacagagt gaagtggtgg 420

caagctatgg ctctggtgta tcacgcaacc ggtgatgaaa agtatgctag agaatgggta 480

tatcagtatt ctgattgggc taggaagaat ccactaggac tttctcagga taacgacaaa 540

ttcgtttggc gtccactaga ggtatctgac agggtacaat ctttaccccc gacgttcagt 600

ctgtttgtta attctccagc atttaccccg gctttcttga tggaattctt gaattcttat 660

catcagcaag cggattattt aagcacccat tatgcagaac aaggaaatca cagattattt 720

gaggcccaac gtaatttatt tgcgggtgtt agttttccag agtttaaaga ttcgccaaga 780

tggagacaaa ccggtatcag cgtgttaaac actgaaatca agaaacaagt atatgctgac 840

ggtatgcagt ttgaactatc tccaatttat catgtcgcag caattgacat attcttgaag 900

gcttatggca gtgctaaacg tgtcaactta gaaaaggaat ttccacagtc atacgtccag 960

actgtagaaa acatgatcat ggcccttatc agcatctcat tgcctgatta caacactcca 1020

atgtttggtg atagttggat aacggacaag aactttagga tggcacagtt cgcaagctgg 1080

gctagagtat ttccagcaaa tcaagctata aaatatttcg cgactgatgg taagcaaggg 1140

aaggccccta attttctatc taaagcttta agcaacgccg gcttttatac tttcaggtcc 1200

ggttgggaca agaatgcaac tgtcatggtg ttaaaagcgt ctccacccgg agaattccat 1260

gcgcaaccag acaatgggac attcgagttg tttattaaag ggagaaattt taccccagat 1320

gctggagtgt ttgtgtactc aggggatgaa gcgataatga agttaagaaa ttggtatcgt 1380

caaaccagaa tacattccac acttacactg gacaaccaaa acatggtgat tactaaggct 1440

agacaaaaca agtgggaaac tggtaacaat ctggacgttt tgacatatac gaacccttcc 1500

tatccaaatc ttgaccatca gaggtcggtc ttatttataa ataagaaata cttcttggtt 1560

atcgacagag ccattggtga agcaacaggt aatctgggtg ttcattggca attgaaagag 1620

gattctaatc cagtgtttga caagacgaag aacagggtat acacaacata ccgtgatggt 1680

aataacttaa tgatccagtc cttaaatgct gatcgtactt ctcttaatga agaggaaggt 1740

aaggtttcct acgtgtacaa taaagaacta aagagacccg cctttgtctt cgaaaagccc 1800

aagaagaatg ccggaacgca gaatttcgta tctatcgttt acccttatga tggccagaaa 1860

gctccagaga taagcatccg tgagaacaaa ggtaacgatt ttgagaaagg taagcttaat 1920

ttgacgctaa cgattaatgg gaaacagcaa ttagtcttag taccataa 1968

<210> 14

<211> 655

<212> PRT

<213> 解肝磷脂土地杆菌

<220>

<223> 具有N-末端分泌信号的源自解肝磷脂土地杆菌的葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶的氨基酸序列

<400> 14

Met Gln Phe Ser Thr Val Ala Ser Val Ala Phe Val Ala Leu Ala Asn

1 5 10 15

Phe Val Ala Ala Gln Ser Ser Ser Ile Thr Arg Lys Asp Phe Asp His

20 25 30

Ile Asn Leu Glu Tyr Ser Gly Leu Glu Lys Val Asn Lys Ala Val Ala

35 40 45

Ala Gly Asn Tyr Asp Asp Ala Ala Lys Ala Leu Leu Ala Tyr Tyr Arg

50 55 60

Glu Lys Ser Lys Ala Arg Glu Pro Asp Phe Ser Asn Ala Glu Lys Pro

65 70 75 80

Ala Asp Ile Arg Gln Pro Ile Asp Lys Val Thr Arg Glu Met Ala Asp

85 90 95

Lys Ala Leu Val His Gln Phe Gln Pro His Lys Gly Tyr Gly Tyr Phe

100 105 110

Asp Tyr Gly Lys Asp Ile Asn Trp Gln Met Trp Pro Val Lys Asp Asn

115 120 125

Glu Val Arg Trp Gln Leu His Arg Val Lys Trp Trp Gln Ala Met Ala

130 135 140

Leu Val Tyr His Ala Thr Gly Asp Glu Lys Tyr Ala Arg Glu Trp Val

145 150 155 160

Tyr Gln Tyr Ser Asp Trp Ala Arg Lys Asn Pro Leu Gly Leu Ser Gln

165 170 175

Asp Asn Asp Lys Phe Val Trp Arg Pro Leu Glu Val Ser Asp Arg Val

180 185 190

Gln Ser Leu Pro Pro Thr Phe Ser Leu Phe Val Asn Ser Pro Ala Phe

195 200 205

Thr Pro Ala Phe Leu Met Glu Phe Leu Asn Ser Tyr His Gln Gln Ala

210 215 220

Asp Tyr Leu Ser Thr His Tyr Ala Glu Gln Gly Asn His Arg Leu Phe

225 230 235 240

Glu Ala Gln Arg Asn Leu Phe Ala Gly Val Ser Phe Pro Glu Phe Lys

245 250 255

Asp Ser Pro Arg Trp Arg Gln Thr Gly Ile Ser Val Leu Asn Thr Glu

260 265 270

Ile Lys Lys Gln Val Tyr Ala Asp Gly Met Gln Phe Glu Leu Ser Pro

275 280 285

Ile Tyr His Val Ala Ala Ile Asp Ile Phe Leu Lys Ala Tyr Gly Ser

290 295 300

Ala Lys Arg Val Asn Leu Glu Lys Glu Phe Pro Gln Ser Tyr Val Gln

305 310 315 320

Thr Val Glu Asn Met Ile Met Ala Leu Ile Ser Ile Ser Leu Pro Asp

325 330 335

Tyr Asn Thr Pro Met Phe Gly Asp Ser Trp Ile Thr Asp Lys Asn Phe

340 345 350

Arg Met Ala Gln Phe Ala Ser Trp Ala Arg Val Phe Pro Ala Asn Gln

355 360 365

Ala Ile Lys Tyr Phe Ala Thr Asp Gly Lys Gln Gly Lys Ala Pro Asn

370 375 380

Phe Leu Ser Lys Ala Leu Ser Asn Ala Gly Phe Tyr Thr Phe Arg Ser

385 390 395 400

Gly Trp Asp Lys Asn Ala Thr Val Met Val Leu Lys Ala Ser Pro Pro

405 410 415

Gly Glu Phe His Ala Gln Pro Asp Asn Gly Thr Phe Glu Leu Phe Ile

420 425 430

Lys Gly Arg Asn Phe Thr Pro Asp Ala Gly Val Phe Val Tyr Ser Gly

435 440 445

Asp Glu Ala Ile Met Lys Leu Arg Asn Trp Tyr Arg Gln Thr Arg Ile

450 455 460

His Ser Thr Leu Thr Leu Asp Asn Gln Asn Met Val Ile Thr Lys Ala

465 470 475 480

Arg Gln Asn Lys Trp Glu Thr Gly Asn Asn Leu Asp Val Leu Thr Tyr

485 490 495

Thr Asn Pro Ser Tyr Pro Asn Leu Asp His Gln Arg Ser Val Leu Phe

500 505 510

Ile Asn Lys Lys Tyr Phe Leu Val Ile Asp Arg Ala Ile Gly Glu Ala

515 520 525

Thr Gly Asn Leu Gly Val His Trp Gln Leu Lys Glu Asp Ser Asn Pro

530 535 540

Val Phe Asp Lys Thr Lys Asn Arg Val Tyr Thr Thr Tyr Arg Asp Gly

545 550 555 560

Asn Asn Leu Met Ile Gln Ser Leu Asn Ala Asp Arg Thr Ser Leu Asn

565 570 575

Glu Glu Glu Gly Lys Val Ser Tyr Val Tyr Asn Lys Glu Leu Lys Arg

580 585 590

Pro Ala Phe Val Phe Glu Lys Pro Lys Lys Asn Ala Gly Thr Gln Asn

595 600 605

Phe Val Ser Ile Val Tyr Pro Tyr Asp Gly Gln Lys Ala Pro Glu Ile

610 615 620

Ser Ile Arg Glu Asn Lys Gly Asn Asp Phe Glu Lys Gly Lys Leu Asn

625 630 635 640

Leu Thr Leu Thr Ile Asn Gly Lys Gln Gln Leu Val Leu Val Pro

645 650 655

<210> 15

<211> 725

<212> PRT

<213> 解肝磷脂土地杆菌

<220>

<223> 具有N-末端分泌信号和C-末端锚定信号的源自解肝磷脂土地杆菌的葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶的氨基酸序列

<400> 15

Met Gln Phe Ser Thr Val Ala Ser Val Ala Phe Val Ala Leu Ala Asn

1 5 10 15

Phe Val Ala Ala Gln Ser Ser Ser Ile Thr Arg Lys Asp Phe Asp His

20 25 30

Ile Asn Leu Glu Tyr Ser Gly Leu Glu Lys Val Asn Lys Ala Val Ala

35 40 45

Ala Gly Asn Tyr Asp Asp Ala Ala Lys Ala Leu Leu Ala Tyr Tyr Arg

50 55 60

Glu Lys Ser Lys Ala Arg Glu Pro Asp Phe Ser Asn Ala Glu Lys Pro

65 70 75 80

Ala Asp Ile Arg Gln Pro Ile Asp Lys Val Thr Arg Glu Met Ala Asp

85 90 95

Lys Ala Leu Val His Gln Phe Gln Pro His Lys Gly Tyr Gly Tyr Phe

100 105 110

Asp Tyr Gly Lys Asp Ile Asn Trp Gln Met Trp Pro Val Lys Asp Asn

115 120 125

Glu Val Arg Trp Gln Leu His Arg Val Lys Trp Trp Gln Ala Met Ala

130 135 140

Leu Val Tyr His Ala Thr Gly Asp Glu Lys Tyr Ala Arg Glu Trp Val

145 150 155 160

Tyr Gln Tyr Ser Asp Trp Ala Arg Lys Asn Pro Leu Gly Leu Ser Gln

165 170 175

Asp Asn Asp Lys Phe Val Trp Arg Pro Leu Glu Val Ser Asp Arg Val

180 185 190

Gln Ser Leu Pro Pro Thr Phe Ser Leu Phe Val Asn Ser Pro Ala Phe

195 200 205

Thr Pro Ala Phe Leu Met Glu Phe Leu Asn Ser Tyr His Gln Gln Ala

210 215 220

Asp Tyr Leu Ser Thr His Tyr Ala Glu Gln Gly Asn His Arg Leu Phe

225 230 235 240

Glu Ala Gln Arg Asn Leu Phe Ala Gly Val Ser Phe Pro Glu Phe Lys

245 250 255

Asp Ser Pro Arg Trp Arg Gln Thr Gly Ile Ser Val Leu Asn Thr Glu

260 265 270

Ile Lys Lys Gln Val Tyr Ala Asp Gly Met Gln Phe Glu Leu Ser Pro

275 280 285

Ile Tyr His Val Ala Ala Ile Asp Ile Phe Leu Lys Ala Tyr Gly Ser

290 295 300

Ala Lys Arg Val Asn Leu Glu Lys Glu Phe Pro Gln Ser Tyr Val Gln

305 310 315 320

Thr Val Glu Asn Met Ile Met Ala Leu Ile Ser Ile Ser Leu Pro Asp

325 330 335

Tyr Asn Thr Pro Met Phe Gly Asp Ser Trp Ile Thr Asp Lys Asn Phe

340 345 350

Arg Met Ala Gln Phe Ala Ser Trp Ala Arg Val Phe Pro Ala Asn Gln

355 360 365

Ala Ile Lys Tyr Phe Ala Thr Asp Gly Lys Gln Gly Lys Ala Pro Asn

370 375 380

Phe Leu Ser Lys Ala Leu Ser Asn Ala Gly Phe Tyr Thr Phe Arg Ser

385 390 395 400

Gly Trp Asp Lys Asn Ala Thr Val Met Val Leu Lys Ala Ser Pro Pro

405 410 415

Gly Glu Phe His Ala Gln Pro Asp Asn Gly Thr Phe Glu Leu Phe Ile

420 425 430

Lys Gly Arg Asn Phe Thr Pro Asp Ala Gly Val Phe Val Tyr Ser Gly

435 440 445

Asp Glu Ala Ile Met Lys Leu Arg Asn Trp Tyr Arg Gln Thr Arg Ile

450 455 460

His Ser Thr Leu Thr Leu Asp Asn Gln Asn Met Val Ile Thr Lys Ala

465 470 475 480

Arg Gln Asn Lys Trp Glu Thr Gly Asn Asn Leu Asp Val Leu Thr Tyr

485 490 495

Thr Asn Pro Ser Tyr Pro Asn Leu Asp His Gln Arg Ser Val Leu Phe

500 505 510

Ile Asn Lys Lys Tyr Phe Leu Val Ile Asp Arg Ala Ile Gly Glu Ala

515 520 525

Thr Gly Asn Leu Gly Val His Trp Gln Leu Lys Glu Asp Ser Asn Pro

530 535 540

Val Phe Asp Lys Thr Lys Asn Arg Val Tyr Thr Thr Tyr Arg Asp Gly

545 550 555 560

Asn Asn Leu Met Ile Gln Ser Leu Asn Ala Asp Arg Thr Ser Leu Asn

565 570 575

Glu Glu Glu Gly Lys Val Ser Tyr Val Tyr Asn Lys Glu Leu Lys Arg

580 585 590

Pro Ala Phe Val Phe Glu Lys Pro Lys Lys Asn Ala Gly Thr Gln Asn

595 600 605

Phe Val Ser Ile Val Tyr Pro Tyr Asp Gly Gln Lys Ala Pro Glu Ile

610 615 620

Ser Ile Arg Glu Asn Lys Gly Asn Asp Phe Glu Lys Gly Lys Leu Asn

625 630 635 640

Leu Thr Leu Thr Ile Asn Gly Lys Gln Gln Leu Val Leu Val Pro Gly

645 650 655

Ser Ala Ile Ser Gln Ile Thr Asp Gly Gln Ile Gln Ala Thr Thr Thr

660 665 670

Ala Thr Thr Glu Ala Thr Thr Thr Ala Ala Pro Ser Ser Thr Val Glu

675 680 685

Thr Val Ser Pro Ser Ser Thr Glu Thr Ile Ser Gln Gln Thr Glu Asn

690 695 700

Gly Ala Ala Lys Ala Ala Val Gly Met Gly Ala Gly Ala Leu Ala Ala

705 710 715 720

Ala Ala Met Leu Leu

725

<210> 16

<211> 2154

<212> DNA

<213> 酿酒酵母

<220>

<223> 源自酿酒酵母的谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)的核酸序列

<400> 16

atgtgtggta tctttggtta ctgcaattat ctagtggaaa gatccagagg agaaattatc 60

gacaccttag tggatggttt acaaagatta gaatatagag gctatgattc caccggtatt 120

gctatcgatg gtgacgaagc tgattctact ttcatctata agcaaatcgg taaagtgagt 180

gctttgaaag aggagattac taagcaaaat ccgaacagag acgttacttt tgtctctcat 240

tgtggtattg cgcatactag atgggctact cacggtcgac cagaacaagt taactgtcac 300

cctcaaagat ctgacccaga agaccaattt gtggtcgttc ataatggtat catcacaaat 360

tttagagaac tgaagactct tttaattaac aaaggttata aattcgaaag tgataccgat 420

accgagtgta ttgctaaact atatttgcat ttatacaata caaatttaca aaatgggcat 480

gacttagatt tccacgaatt aaccaagcta gttcttttag aactagaagg ttcatacggg 540

ttattatgta aatcttgtca ctatcctaat gaggttatcg ccactagaaa agggtcccct 600

ttactgattg gtgtcaaatc tgaaaaaaaa ctaaaagtcg acttcgtgga tgtggaattt 660

cccgaagaaa acgctggtca accggaaatt ccattgaaat ctaacaacaa atcatttggc 720

ttgggcccaa agaaagctcg tgaatttgaa gctggttccc aaaatgccaa tttactacca 780

attgccgcca atgaatttaa cttgagacat tctcaatcca gggctttcct atcagaagat 840

ggatctccaa caccggtgga attttttgtt tcttcggatg cggcatctgt tgttaaacat 900

accaagaagg tgctattttt agaagatgac gatttggctc atatttacga tggtgagtta 960

catattcata gatctagaag agaagtaggc gcatcaatga caaggtccat tcaaacttta 1020

gagatggagt tagctcagat catgaagggc ccttacgacc attttatgca aaaggaaatc 1080

tatgagcaac cagaatctac tttcaatact atgagaggta gaatcgacta tgaaaataat 1140

aaagtgatat tgggtggttt aaaggcatgg ttaccagttg tcagaagagc acggagactg 1200

atcatgatcg catgcggtac ttcttatcat tcatgtttgg ctactcgtgc tatcttcgaa 1260

gaattatcag atatcccagt tagtgtggaa ttagcgtctg actttctgga cagaaaatgc 1320

cctgtcttca gagacgatgt atgcgtgttt gtttcacaaa gtggtgaaac tgcggatacc 1380

atgctggctc taaattattg tttagaaaga ggagccttaa ctgtcggaat tgttaacagt 1440

gttggttctt ctatctctcg tgtcacccac tgtggtgttc atattaacgc tggtcctgaa 1500

attggtgttg cctctacaaa agcttatact tcccagtata ttgccttagt gatgtttgct 1560

ctatcgctgt cagatgaccg tgtatcgaaa atagacagaa gaattgaaat cattcaaggc 1620

ttgaagttaa tcccgggcca aattaagcag gtattaaagc tggaaccaag aataaaaaag 1680

ctctgtgcga ctgaattaaa ggatcaaaaa tctctattgt tattgggtag aggttaccaa 1740

tttgctgctg ctctggaagg tgctttgaag atcaaagaaa tttcttatat gcattctgaa 1800

ggtgttttgg caggtgagtt gaagcacggt gtcttggcct tggtggacga aaacttgcca 1860

atcattgctt ttggtaccag agactctcta ttccctaaag tagtttcctc tattgagcaa 1920

gttactgtaa gaaagggcca tccaattatt atttgtaacg aaaatgatga agtgtgggcg 1980

caaaaatcta aatcaatcga cctgcaaacc ttagaagttc cacaaactgt tgattgttta 2040

caaggtctaa ttaatattat tccattacaa ctaatgtcat attggttggc tgttaataaa 2100

gggattgatg ttgattttcc aagaaacttg gctaaatctg ttaccgtcga ataa 2154

<210> 17

<211> 1788

<212> DNA

<213> 小球藻属病毒

<220>

<223> 源自小球藻属病毒1(PBCV-1)的谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)的重编码核酸序列

<400> 17

atgtgcggga tcttcggtgc tgtgtcgaac aataatagca tagaagtttc catcaagggt 60

atacagaagc tagagtaccg cgggtacgat tcgtgtggaa tagcctatac agacggaggc 120

gccattgaac ggatcaggtc aatagatggg atcgacgact taaggaagaa aacaataaca 180

gagtcttccc cggtagctat cgctcattca aggtggagta ccactgggat tccaagtgtt 240

gtgaacgccc acccgcacat ctctcggggc acgtctggat gcgagtcgcg cattgcagtc 300

gtacacaatg gcattattga aaattaccag cagatccgca agtacttgat aaatcttggg 360

tatactttcg attcacagac cgacacggaa gtcattgctc atctaataga ctcgcagtat 420

aacgggaaca tcctgcacac cgtccaaatg gcagttaagc acctcaaagg aagctacgcc 480

atagcagtca tgtgccataa ggagtccggg aagatcgtgg tggcaaaaca gaagagtccg 540

ttggtattgg gtataggaag cgacggagct tattatatcg catcggacgt attggctctt 600

cccactaaca aagtggtcta cataagtgac ggattctctg ctgagttaag tcctggatcg 660

atgactatct atgatctgga tggcaataag gtagaatacg aggtggaaga cgttgaaatg 720

gagcagacgt cgatgtcttt agataacttt gatcactaca tgatcaaaga gatcaatgaa 780

cagccgatat caattctcaa tactattaag aacaaaggat tctatgcaga gatatttggt 840

gatctagcac atgaaatatt tcagaagatc gacaatatat tgattctagc ctgcggaact 900

tcgtatcatg caggtctcgt cgggaagcaa tggatagaga ccatctcacg catcccggtg 960

gatgttcata ttgcaagcga gtatgagccg acaattccac gagccaatac acttgtgata 1020

acgattagtc aaagcggcga gactgcggat acaatcgcag cccttcaacg agcgcaaaac 1080

gcaggaatga tatacacttt gtgtatctgc aacagcccca agtcaactct agtgcgcgag 1140

tcgataatga aatacataac caaatgcggt tcagaagttt ctgttgccag tactaaagca 1200

tttacgtcgc aacttgtggt gttgtatatg cttgcgaacg ttcttgcgaa caaaactgat 1260

gatctgctag gggatcttcc tcaagctatc gagagagtaa tctgtcttac taatgacgaa 1320

atgaagcgtt gggcggatga aatttgtact gccaaaagtg ccatcttctt agggagagga 1380

ctgaacgcac ctgtagcatt tgagggcgcg ctaaagttga aggaaatctc atatatccat 1440

gccgagggtt tcctcggtgg agagttgaag catgggccgc tggctttgtt ggacgataag 1500

atccctgtaa tcgtgactgt tgctgaccac gcttatttgg atcacattaa ggctaacatc 1560

gacgaggtat tggcacgaaa cgttaccgta tacgcgatcg tcgatcagta tgttaatatt 1620

gaaccacagg agcgactgca tgtagtaaaa gtgccgtttg tgagtaaaga gttttctccc 1680

atcatccaca caattccgat gcaattgtta tcgtattatg tcgcgatcaa gctgggcaag 1740

aacgttgaca agccacgtaa cctggcgaaa agtgttacaa cattctaa 1788

<210> 18

<211> 1788

<212> DNA

<213> 小球藻属病毒

<220>

<400> 18

atgtgtggca tctttggagc agtgtcaaac aacaactcta tcgaggtgtc aatcaagggt 60

attcagaagc tagaatatcg tgggtatgat tcgtgcggta ttgcgtatac agatgggggt 120

gcgattgagc gtatacgttc tattgacggc attgacgatc tgcgtaagaa aacaatcaca 180

gaatcatcac cagtggccat tgctcactcg cggtggagca ccactggaat tccatcagtg 240

gtgaacgcac atcctcatat ttctcgcgga accagtgggt gtgagtctcg tatcgcggta 300

gtccacaacg gtatcattga aaactatcag cagatccgaa aatatctcat caatcttggt 360

tatacgtttg atagtcaaac ggacacagag gtcattgcgc atttgattga ttctcagtac 420

aatgggaata tcttgcacac cgtccaaatg gctgtcaagc acctgaaggg ctcttatgcc 480

attgcagtta tgtgtcataa agagtctggt aaaatagtcg tggcgaaaca gaagtcaccc 540

ctcgtacttg gaatcggctc agatggtgct tactacatcg cttcggacgt gctggcgctg 600

ccgacaaata aagttgttta tatttcagac ggtttctccg cagaactatc tccagggagt 660

atgaccattt acgatcttga tggaaataaa gtagaatatg aagtagagga cgttgaaatg 720

gaacaaacta gtatgtctct cgataacttt gatcattaca tgattaagga aattaatgag 780

caaccaatca gtattctaaa cactataaaa aataaagggt tctatgcaga aatattcggt 840

gatttggctc atgaaatctt ccaaaaaata gacaacatcc tgatactggc ttgtggtaca 900

agttatcacg ccggtcttgt aggaaaacag tggatagaga ccatctctag aatccccgtg 960

gatgttcaca tcgcgagtga atacgaacct actattccga gagcgaacac attggtaatc 1020

actatttcac agtcgggtga aactgcggac acgatagcgg ctttgcaacg ggcccaaaac 1080

gccgggatga tttatacatt gtgtatttgc aattcaccaa agagcactct tgttcgtgag 1140

agcattatga agtacatcac gaaatgtggt tctgaggtgt cagtggcatc aacgaaggcg 1200

tttacttctc agctcgtagt actgtacatg ctggcaaacg tattggcaaa taaaaccgat 1260

gatttgctgg gagacctccc acaggcaata gaacgggtaa tttgtttgac aaatgacgaa 1320

atgaaacgat gggccgacga aatttgcact gcgaaatccg cgatcttcct gggaagagga 1380

ctaaacgcac cagttgcctt tgagggagcg ttgaagctca aagaaatctc ttacattcat 1440

gcagagggct tcctgggagg tgagttgaaa cacggccccc tcgcactcct tgatgacaag 1500

attcctgtta tcgtaaccgt agcagatcat gcttatttgg accatatcaa agcaaatatc 1560

gacgaagtgc ttgcgaggaa cgttacggta tacgccatag tagaccagta tgtgaacatc 1620

gagccccagg aacgccttca cgtcgtcaag gttccgtttg tatccaaaga attttctccg 1680

ataattcaca ctatcccgat gcaactgctt tcgtattacg tggcaattaa gcttggaaag 1740

aacgttgaca aaccaaggaa tcttgcaaaa tccgtgacta ccttttaa 1788

<210> 19

<211> 717

<212> PRT

<213> 酿酒酵母

<220>

<223> 源自酿酒酵母的谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)的氨基酸序列

<400> 19

Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg

1 5 10 15

Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr

20 25 30

Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp

35 40 45

Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu

50 55 60

Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His

65 70 75 80

Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu Gln

85 90 95

Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val

100 105 110

Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu

115 120 125

Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile

130 135 140

Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Gln Asn Gly His

145 150 155 160

Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu

165 170 175

Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val

180 185 190

Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu

195 200 205

Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn

210 215 220

Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly

225 230 235 240

Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala

245 250 255

Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln

260 265 270

Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe

275 280 285

Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val

290 295 300

Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu

305 310 315 320

His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser

325 330 335

Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr

340 345 350

Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe

355 360 365

Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu

370 375 380

Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu

385 390 395 400

Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg

405 410 415

Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala

420 425 430

Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys

435 440 445

Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu

450 455 460

Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser

465 470 475 480

Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn

485 490 495

Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln

500 505 510

Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val

515 520 525

Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile

530 535 540

Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys

545 550 555 560

Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly

565 570 575

Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys

580 585 590

Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys

595 600 605

His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe

610 615 620

Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln

625 630 635 640

Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp

645 650 655

Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu

660 665 670

Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro

675 680 685

Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val

690 695 700

Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu

705 710 715

<210> 20

<211> 595

<212> PRT

<213> 小球藻属病毒

<220>

<223> 源自小球藻属病毒1(PBCV-1)的谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)的氨基酸序列

<400> 20

Met Cys Gly Ile Phe Gly Ala Val Ser Asn Asn Asn Ser Ile Glu Val

1 5 10 15

Ser Ile Lys Gly Ile Gln Lys Leu Glu Tyr Arg Gly Tyr Asp Ser Cys

20 25 30

Gly Ile Ala Tyr Thr Asp Gly Gly Ala Ile Glu Arg Ile Arg Ser Ile

35 40 45

Asp Gly Ile Asp Asp Leu Arg Lys Lys Thr Ile Thr Glu Ser Ser Pro

50 55 60

Val Ala Ile Ala His Ser Arg Trp Ser Thr Thr Gly Ile Pro Ser Val

65 70 75 80

Val Asn Ala His Pro His Ile Ser Arg Gly Thr Ser Gly Cys Glu Ser

85 90 95

Arg Ile Ala Val Val His Asn Gly Ile Ile Glu Asn Tyr Gln Gln Ile

100 105 110

Arg Lys Tyr Leu Ile Asn Leu Gly Tyr Thr Phe Asp Ser Gln Thr Asp

115 120 125

Thr Glu Val Ile Ala His Leu Ile Asp Ser Gln Tyr Asn Gly Asn Ile

130 135 140

Leu His Thr Val Gln Met Ala Val Lys His Leu Lys Gly Ser Tyr Ala

145 150 155 160

Ile Ala Val Met Cys His Lys Glu Ser Gly Lys Ile Val Val Ala Lys

165 170 175

Gln Lys Ser Pro Leu Val Leu Gly Ile Gly Ser Asp Gly Ala Tyr Tyr

180 185 190

Ile Ala Ser Asp Val Leu Ala Leu Pro Thr Asn Lys Val Val Tyr Ile

195 200 205

Ser Asp Gly Phe Ser Ala Glu Leu Ser Pro Gly Ser Met Thr Ile Tyr

210 215 220

Asp Leu Asp Gly Asn Lys Val Glu Tyr Glu Val Glu Asp Val Glu Met

225 230 235 240

Glu Gln Thr Ser Met Ser Leu Asp Asn Phe Asp His Tyr Met Ile Lys

245 250 255

Glu Ile Asn Glu Gln Pro Ile Ser Ile Leu Asn Thr Ile Lys Asn Lys

260 265 270

Gly Phe Tyr Ala Glu Ile Phe Gly Asp Leu Ala His Glu Ile Phe Gln

275 280 285

Lys Ile Asp Asn Ile Leu Ile Leu Ala Cys Gly Thr Ser Tyr His Ala

290 295 300

Gly Leu Val Gly Lys Gln Trp Ile Glu Thr Ile Ser Arg Ile Pro Val

305 310 315 320

Asp Val His Ile Ala Ser Glu Tyr Glu Pro Thr Ile Pro Arg Ala Asn

325 330 335

Thr Leu Val Ile Thr Ile Ser Gln Ser Gly Glu Thr Ala Asp Thr Ile

340 345 350

Ala Ala Leu Gln Arg Ala Gln Asn Ala Gly Met Ile Tyr Thr Leu Cys

355 360 365

Ile Cys Asn Ser Pro Lys Ser Thr Leu Val Arg Glu Ser Ile Met Lys

370 375 380

Tyr Ile Thr Lys Cys Gly Ser Glu Val Ser Val Ala Ser Thr Lys Ala

385 390 395 400

Phe Thr Ser Gln Leu Val Val Leu Tyr Met Leu Ala Asn Val Leu Ala

405 410 415

Asn Lys Thr Asp Asp Leu Leu Gly Asp Leu Pro Gln Ala Ile Glu Arg

420 425 430

Val Ile Cys Leu Thr Asn Asp Glu Met Lys Arg Trp Ala Asp Glu Ile

435 440 445

Cys Thr Ala Lys Ser Ala Ile Phe Leu Gly Arg Gly Leu Asn Ala Pro

450 455 460

Val Ala Phe Glu Gly Ala Leu Lys Leu Lys Glu Ile Ser Tyr Ile His

465 470 475 480

Ala Glu Gly Phe Leu Gly Gly Glu Leu Lys His Gly Pro Leu Ala Leu

485 490 495

Leu Asp Asp Lys Ile Pro Val Ile Val Thr Val Ala Asp His Ala Tyr

500 505 510

Leu Asp His Ile Lys Ala Asn Ile Asp Glu Val Leu Ala Arg Asn Val

515 520 525

Thr Val Tyr Ala Ile Val Asp Gln Tyr Val Asn Ile Glu Pro Gln Glu

530 535 540

Arg Leu His Val Val Lys Val Pro Phe Val Ser Lys Glu Phe Ser Pro

545 550 555 560

Ile Ile His Thr Ile Pro Met Gln Leu Leu Ser Tyr Tyr Val Ala Ile

565 570 575

Lys Leu Gly Lys Asn Val Asp Lys Pro Arg Asn Leu Ala Lys Ser Val

580 585 590

Thr Thr Phe

595

<210> 21

<211> 1434

<212> DNA

<213> 酿酒酵母

<220>

<223> 源自酿酒酵母的UDP-N-乙酰葡萄糖胺焦磷酸化酶(QRI1)的核酸序列

<400> 21

atgactgaca caaaacagct attcattgaa gccggacaaa gtcaactttt ccacaattgg 60

gaaagcttgt ctcgcaaaga ccaagaagaa ttgctttcaa acctggagca aatatcttcc 120

aagaggtccc ctgcaaaact actggaagac tgtcaaaatg ctattaaatt ctcactagct 180

aactcttcta aggatactgg cgtcgaaatt tcaccattgc cccctacttc gtacgagtcg 240

cttattggca acagtaagaa agaaaatgaa tactggcgtt taggccttga agctattggc 300

aagggtgaag tcgcagtgat tttaatggct ggcggacaag gtacgcggtt aggatcctct 360

caaccaaagg gctgttacga cattggattg ccttctaaga aatctctttt tcaaattcaa 420

gctgaaaagt tgatcaggtt gcaagatatg gtaaaggaca aaaaggtaga aattccttgg 480

tatattatga catcaggccc cactagagcg gctactgagg catactttca agaacacaat 540

tattttggct tgaataaaga acaaattacg ttcttcaacc agggaaccct gcctgccttt 600

gatttaaccg ggaagcattt cctaatgaaa gacccagtaa acctatctca atcaccagat 660

ggaaatggtg gactctaccg tgccatcaag gaaaacaagt tgaacgaaga ctttgatagg 720

agaggaatca agcatgttta catgtactgt gtcgataatg tcctatctaa aatcgcagac 780

cctgtattta ttggttttgc catcaagcat ggcttcgaac tggccaccaa agccgttaga 840

aagagagatg cgcatgaatc agttgggtta attgctacta aaaacgagaa accatgtgtc 900

atagaatatt ctgaaatttc caatgaattg gctgaagcaa aggataaaga tggcttatta 960

aaactacgcg caggcaacat tgtaaatcat tattacctag tggatttact aaaacgtgat 1020

ttggatcagt ggtgtgagaa tatgccatat cacattgcga agaagaaaat tccagcttat 1080

gatagtgtta ccggcaagta cactaagcct accgaaccaa acggtataaa attagagcaa 1140

ttcatatttg atgtctttga cactgtacca ctgaacaagt ttgggtgctt agaagtagat 1200

agatgcaaag aattttcacc tttaaaaaac ggtcctggtt ctaagaacga taatcctgag 1260

accagcagac tagcatattt gaaactagga acctcgtggt tggaagatgc aggcgctatt 1320

gtaaaagatg gggtactagt cgaagtttcc agcaaattga gttatgcagg tgaaaatcta 1380

tcccagttca aaggtaaagt ctttgacaga agtggtatag tattagaaaa ataa 1434

<210> 22

<211> 477

<212> PRT

<213> 酿酒酵母

<220>

<223> 源自酿酒酵母的UDP-N-乙酰葡萄糖胺焦磷酸化酶(QRI1)的氨基酸序列

<400> 22

Met Thr Asp Thr Lys Gln Leu Phe Ile Glu Ala Gly Gln Ser Gln Leu

1 5 10 15

Phe His Asn Trp Glu Ser Leu Ser Arg Lys Asp Gln Glu Glu Leu Leu

20 25 30

Ser Asn Leu Glu Gln Ile Ser Ser Lys Arg Ser Pro Ala Lys Leu Leu

35 40 45

Glu Asp Cys Gln Asn Ala Ile Lys Phe Ser Leu Ala Asn Ser Ser Lys

50 55 60

Asp Thr Gly Val Glu Ile Ser Pro Leu Pro Pro Thr Ser Tyr Glu Ser

65 70 75 80

Leu Ile Gly Asn Ser Lys Lys Glu Asn Glu Tyr Trp Arg Leu Gly Leu

85 90 95

Glu Ala Ile Gly Lys Gly Glu Val Ala Val Ile Leu Met Ala Gly Gly

100 105 110

Gln Gly Thr Arg Leu Gly Ser Ser Gln Pro Lys Gly Cys Tyr Asp Ile

115 120 125

Gly Leu Pro Ser Lys Lys Ser Leu Phe Gln Ile Gln Ala Glu Lys Leu

130 135 140

Ile Arg Leu Gln Asp Met Val Lys Asp Lys Lys Val Glu Ile Pro Trp

145 150 155 160

Tyr Ile Met Thr Ser Gly Pro Thr Arg Ala Ala Thr Glu Ala Tyr Phe

165 170 175

Gln Glu His Asn Tyr Phe Gly Leu Asn Lys Glu Gln Ile Thr Phe Phe

180 185 190

Asn Gln Gly Thr Leu Pro Ala Phe Asp Leu Thr Gly Lys His Phe Leu

195 200 205

Met Lys Asp Pro Val Asn Leu Ser Gln Ser Pro Asp Gly Asn Gly Gly

210 215 220

Leu Tyr Arg Ala Ile Lys Glu Asn Lys Leu Asn Glu Asp Phe Asp Arg

225 230 235 240

Arg Gly Ile Lys His Val Tyr Met Tyr Cys Val Asp Asn Val Leu Ser

245 250 255

Lys Ile Ala Asp Pro Val Phe Ile Gly Phe Ala Ile Lys His Gly Phe

260 265 270

Glu Leu Ala Thr Lys Ala Val Arg Lys Arg Asp Ala His Glu Ser Val

275 280 285

Gly Leu Ile Ala Thr Lys Asn Glu Lys Pro Cys Val Ile Glu Tyr Ser

290 295 300

Glu Ile Ser Asn Glu Leu Ala Glu Ala Lys Asp Lys Asp Gly Leu Leu

305 310 315 320

Lys Leu Arg Ala Gly Asn Ile Val Asn His Tyr Tyr Leu Val Asp Leu

325 330 335

Leu Lys Arg Asp Leu Asp Gln Trp Cys Glu Asn Met Pro Tyr His Ile

340 345 350

Ala Lys Lys Lys Ile Pro Ala Tyr Asp Ser Val Thr Gly Lys Tyr Thr

355 360 365

Lys Pro Thr Glu Pro Asn Gly Ile Lys Leu Glu Gln Phe Ile Phe Asp

370 375 380

Val Phe Asp Thr Val Pro Leu Asn Lys Phe Gly Cys Leu Glu Val Asp

385 390 395 400

Arg Cys Lys Glu Phe Ser Pro Leu Lys Asn Gly Pro Gly Ser Lys Asn

405 410 415

Asp Asn Pro Glu Thr Ser Arg Leu Ala Tyr Leu Lys Leu Gly Thr Ser

420 425 430

Trp Leu Glu Asp Ala Gly Ala Ile Val Lys Asp Gly Val Leu Val Glu

435 440 445

Val Ser Ser Lys Leu Ser Tyr Ala Gly Glu Asn Leu Ser Gln Phe Lys

450 455 460

Gly Lys Val Phe Asp Arg Ser Gly Ile Val Leu Glu Lys

465 470 475

<210> 23

<211> 1713

<212> DNA

<213> 酿酒酵母

<220>

<223> 源自酿酒酵母的磷酸葡萄糖变位酶-1(PGM1)的核酸序列

<400> 23

atgtcacttc taatagattc tgtaccaaca gttgcttata aggaccaaaa accgggtact 60

tcaggtttac gtaagaagac caaggttttc atggatgagc ctcattatac tgagaacttc 120

attcaagcaa caatgcaatc tatccctaat ggctcagagg gaaccacttt agttgttgga 180

ggagatggtc gtttctacaa cgatgttatc atgaacaaga ttgccgcagt aggtgctgca 240

aacggtgtca gaaagttagt cattggtcaa ggcggtttac tttcaacacc agctgcttct 300

catataatta gaacatacga ggaaaagtgt accggtggtg gtatcatatt aactgcctca 360

cacaacccag gcggtccaga gaatgattta ggtatcaagt ataatttacc taatggtggg 420

ccagctccag agagtgtcac taacgctatc tgggaagcgt ctaaaaaatt aactcactat 480

aaaattataa agaacttccc caagttgaat ttgaacaagc ttggtaaaaa ccaaaaatat 540

ggcccattgt tagtggacat aattgatcct gccaaagcat acgttcaatt tctgaaggaa 600

atttttgatt ttgacttaat taaaagcttc ttagcgaaac agcgcaaaga caaagggtgg 660

aagttgttgt ttgactcctt aaatggtatt acaggaccat atggtaaggc tatatttgtt 720

gatgaatttg gtttaccggc agaggaagtt cttcaaaatt ggcacccttt acctgatttc 780

ggcggtttac atcccgatcc gaatctaacc tatgcacgaa ctcttgttga cagggttgac 840

cgcgaaaaaa ttgcctttgg agcagcctcc gatggtgatg gtgataggaa tatgatttac 900

ggttatggcc ctgctttcgt ttcgccaggt gattctgttg ccattattgc cgaatatgca 960

cccgaaattc catacttcgc caaacaaggt atttatggct tggcacgttc atttcctaca 1020

tcctcagcca ttgatcgtgt tgcagcaaaa aagggattaa gatgttacga agttccaacc 1080

ggctggaaat tcttctgtgc cttatttgat gctaaaaagc tatcaatctg tggtgaagaa 1140

tccttcggta caggttccaa tcatatcaga gaaaaggacg gtctatgggc cattattgct 1200

tggttaaata tcttggctat ctaccatagg cgtaaccctg aaaaggaagc ttcgatcaaa 1260

actattcagg acgaattttg gaacgagtat ggccgtactt tcttcacaag atacgattac 1320

gaacatatcg aatgcgagca ggccgaaaaa gttgtagctc ttttgagtga atttgtatca 1380

aggccaaacg tttgtggctc ccacttccca gctgatgagt ctttaaccgt tatcgattgt 1440

ggtgattttt cgtatagaga tctagatggc tccatctctg aaaatcaagg ccttttcgta 1500

aagttttcga atgggactaa atttgttttg aggttatccg gcacaggcag ttctggtgca 1560

acaataagat tatacgtaga aaagtatact gataaaaagg agaactatgg ccaaacagct 1620

gacgtcttct tgaaacccgt catcaactcc attgtaaaat tcttaagatt taaagaaatt 1680

ttaggaacag acgaaccaac agtccgcaca tag 1713

<210> 24

<211> 570

<212> PRT

<213> 酿酒酵母

<220>

<223> 源自酿酒酵母的磷酸葡萄糖变位酶-1(PGM1)的氨基酸序列

<400> 24

Met Ser Leu Leu Ile Asp Ser Val Pro Thr Val Ala Tyr Lys Asp Gln

1 5 10 15

Lys Pro Gly Thr Ser Gly Leu Arg Lys Lys Thr Lys Val Phe Met Asp

20 25 30

Glu Pro His Tyr Thr Glu Asn Phe Ile Gln Ala Thr Met Gln Ser Ile

35 40 45

Pro Asn Gly Ser Glu Gly Thr Thr Leu Val Val Gly Gly Asp Gly Arg

50 55 60

Phe Tyr Asn Asp Val Ile Met Asn Lys Ile Ala Ala Val Gly Ala Ala

65 70 75 80

Asn Gly Val Arg Lys Leu Val Ile Gly Gln Gly Gly Leu Leu Ser Thr

85 90 95

Pro Ala Ala Ser His Ile Ile Arg Thr Tyr Glu Glu Lys Cys Thr Gly

100 105 110

Gly Gly Ile Ile Leu Thr Ala Ser His Asn Pro Gly Gly Pro Glu Asn

115 120 125

Asp Leu Gly Ile Lys Tyr Asn Leu Pro Asn Gly Gly Pro Ala Pro Glu

130 135 140

Ser Val Thr Asn Ala Ile Trp Glu Ala Ser Lys Lys Leu Thr His Tyr

145 150 155 160

Lys Ile Ile Lys Asn Phe Pro Lys Leu Asn Leu Asn Lys Leu Gly Lys

165 170 175

Asn Gln Lys Tyr Gly Pro Leu Leu Val Asp Ile Ile Asp Pro Ala Lys

180 185 190

Ala Tyr Val Gln Phe Leu Lys Glu Ile Phe Asp Phe Asp Leu Ile Lys

195 200 205

Ser Phe Leu Ala Lys Gln Arg Lys Asp Lys Gly Trp Lys Leu Leu Phe

210 215 220

Asp Ser Leu Asn Gly Ile Thr Gly Pro Tyr Gly Lys Ala Ile Phe Val

225 230 235 240

Asp Glu Phe Gly Leu Pro Ala Glu Glu Val Leu Gln Asn Trp His Pro

245 250 255

Leu Pro Asp Phe Gly Gly Leu His Pro Asp Pro Asn Leu Thr Tyr Ala

260 265 270

Arg Thr Leu Val Asp Arg Val Asp Arg Glu Lys Ile Ala Phe Gly Ala

275 280 285

Ala Ser Asp Gly Asp Gly Asp Arg Asn Met Ile Tyr Gly Tyr Gly Pro

290 295 300

Ala Phe Val Ser Pro Gly Asp Ser Val Ala Ile Ile Ala Glu Tyr Ala

305 310 315 320

Pro Glu Ile Pro Tyr Phe Ala Lys Gln Gly Ile Tyr Gly Leu Ala Arg

325 330 335

Ser Phe Pro Thr Ser Ser Ala Ile Asp Arg Val Ala Ala Lys Lys Gly

340 345 350

Leu Arg Cys Tyr Glu Val Pro Thr Gly Trp Lys Phe Phe Cys Ala Leu

355 360 365

Phe Asp Ala Lys Lys Leu Ser Ile Cys Gly Glu Glu Ser Phe Gly Thr

370 375 380

Gly Ser Asn His Ile Arg Glu Lys Asp Gly Leu Trp Ala Ile Ile Ala

385 390 395 400

Trp Leu Asn Ile Leu Ala Ile Tyr His Arg Arg Asn Pro Glu Lys Glu

405 410 415

Ala Ser Ile Lys Thr Ile Gln Asp Glu Phe Trp Asn Glu Tyr Gly Arg

420 425 430

Thr Phe Phe Thr Arg Tyr Asp Tyr Glu His Ile Glu Cys Glu Gln Ala

435 440 445

Glu Lys Val Val Ala Leu Leu Ser Glu Phe Val Ser Arg Pro Asn Val

450 455 460

Cys Gly Ser His Phe Pro Ala Asp Glu Ser Leu Thr Val Ile Asp Cys

465 470 475 480

Gly Asp Phe Ser Tyr Arg Asp Leu Asp Gly Ser Ile Ser Glu Asn Gln

485 490 495

Gly Leu Phe Val Lys Phe Ser Asn Gly Thr Lys Phe Val Leu Arg Leu

500 505 510

Ser Gly Thr Gly Ser Ser Gly Ala Thr Ile Arg Leu Tyr Val Glu Lys

515 520 525

Tyr Thr Asp Lys Lys Glu Asn Tyr Gly Gln Thr Ala Asp Val Phe Leu

530 535 540

Lys Pro Val Ile Asn Ser Ile Val Lys Phe Leu Arg Phe Lys Glu Ile

545 550 555 560

Leu Gly Thr Asp Glu Pro Thr Val Arg Thr

565 570

<210> 25

<211> 1500

<212> DNA

<213> 酿酒酵母

<220>

<223> 源自酿酒酵母的UTP-葡萄糖-1-磷酸尿苷酰转移酶(UGP1)的核酸序列

<400> 25

atgtccacta agaagcacac caaaacacat tccacttatg cattcgagag caacacaaac 60

agcgttgctg cctcacaaat gagaaacgcc ttaaacaagt tggcggactc tagtaaactt 120

gacgatgctg ctcgcgctaa gtttgagaac gaactggatt cgtttttcac gcttttcagg 180

agatatttgg tagagaagtc ttctagaacc accttggaat gggacaagat caagtctccc 240

aacccggatg aagtggttaa gtatgaaatt atttctcagc agcccgagaa tgtctcaaac 300

ctttccaaat tggctgtttt gaagttgaac ggtgggctgg gtacctccat gggctgcgtt 360

ggccctaaat ctgttattga agtgagagag ggaaacacct ttttggattt gtctgttcgt 420

caaattgaat acttgaacag acagtacgat agcgacgtgc cattgttatt gatgaattct 480

ttcaacactg acaaggatac ggaacacttg attaagaagt attccgctaa cagaatcaga 540

atcagatctt tcaatcaatc caggttccca agagtctaca aggattcttt attgcctgtc 600

cccaccgaat acgattctcc actggatgct tggtatccac caggtcacgg tgatttgttt 660

gaatctttac acgtatctgg tgaactggat gccttaattg cccaaggaag agaaatatta 720

tttgtttcta acggtgacaa cttgggtgct accgtcgact taaaaatttt aaaccacatg 780

atcgagactg gtgccgaata tataatggaa ttgactgata agaccagagc cgatgttaaa 840

ggtggtactt tgatttctta cgatggtcaa gtccgtttat tggaagtcgc ccaagttcca 900

aaagaacaca ttgacgaatt caaaaatatc agaaagttta ccaacttcaa cacgaataac 960

ttatggatca atctgaaagc agtaaagagg ttgatcgaat cgagcaattt ggagatggaa 1020

atcattccaa accaaaaaac tataacaaga gacggtcatg aaattaatgt cttacaatta 1080

gaaaccgctt gtggtgctgc tatcaggcat tttgatggtg ctcacggtgt tgtcgttcca 1140

agatcaagat tcttgcctgt caagacctgt tccgatttgt tgctggttaa atcagatcta 1200

ttccgtctgg aacacggttc tttgaagtta gacccatccc gttttggtcc aaacccatta 1260

atcaagttgg gctcgcattt caaaaaggtt tctggtttta acgcaagaat ccctcacatc 1320

ccaaaaatcg tcgagctaga tcatttgacc atcactggta acgtcttttt aggtaaagat 1380

gtcactttga ggggtactgt catcatcgtt tgctccgacg gtcataaaat cgatattcca 1440

aacggctcca tattggaaaa tgttgtcgtt actggtaatt tgcaaatctt ggaacattga 1500

<210> 26

<211> 499

<212> PRT

<213> 酿酒酵母

<220>

<223> 源自酿酒酵母的UTP--葡萄糖-1-磷酸尿苷酰转移酶(UGP1)的氨基酸序列

<400> 26

Met Ser Thr Lys Lys His Thr Lys Thr His Ser Thr Tyr Ala Phe Glu

1 5 10 15

Ser Asn Thr Asn Ser Val Ala Ala Ser Gln Met Arg Asn Ala Leu Asn

20 25 30

Lys Leu Ala Asp Ser Ser Lys Leu Asp Asp Ala Ala Arg Ala Lys Phe

35 40 45

Glu Asn Glu Leu Asp Ser Phe Phe Thr Leu Phe Arg Arg Tyr Leu Val

50 55 60

Glu Lys Ser Ser Arg Thr Thr Leu Glu Trp Asp Lys Ile Lys Ser Pro

65 70 75 80

Asn Pro Asp Glu Val Val Lys Tyr Glu Ile Ile Ser Gln Gln Pro Glu

85 90 95

Asn Val Ser Asn Leu Ser Lys Leu Ala Val Leu Lys Leu Asn Gly Gly

100 105 110

Leu Gly Thr Ser Met Gly Cys Val Gly Pro Lys Ser Val Ile Glu Val

115 120 125

Arg Glu Gly Asn Thr Phe Leu Asp Leu Ser Val Arg Gln Ile Glu Tyr

130 135 140

Leu Asn Arg Gln Tyr Asp Ser Asp Val Pro Leu Leu Leu Met Asn Ser

145 150 155 160

Phe Asn Thr Asp Lys Asp Thr Glu His Leu Ile Lys Lys Tyr Ser Ala

165 170 175

Asn Arg Ile Arg Ile Arg Ser Phe Asn Gln Ser Arg Phe Pro Arg Val

180 185 190

Tyr Lys Asp Ser Leu Leu Pro Val Pro Thr Glu Tyr Asp Ser Pro Leu

195 200 205

Asp Ala Trp Tyr Pro Pro Gly His Gly Asp Leu Phe Glu Ser Leu His

210 215 220

Val Ser Gly Glu Leu Asp Ala Leu Ile Ala Gln Gly Arg Glu Ile Leu

225 230 235 240

Phe Val Ser Asn Gly Asp Asn Leu Gly Ala Thr Val Asp Leu Lys Ile

245 250 255

Leu Asn His Met Ile Glu Thr Gly Ala Glu Tyr Ile Met Glu Leu Thr

260 265 270

Asp Lys Thr Arg Ala Asp Val Lys Gly Gly Thr Leu Ile Ser Tyr Asp

275 280 285

Gly Gln Val Arg Leu Leu Glu Val Ala Gln Val Pro Lys Glu His Ile

290 295 300

Asp Glu Phe Lys Asn Ile Arg Lys Phe Thr Asn Phe Asn Thr Asn Asn

305 310 315 320

Leu Trp Ile Asn Leu Lys Ala Val Lys Arg Leu Ile Glu Ser Ser Asn

325 330 335

Leu Glu Met Glu Ile Ile Pro Asn Gln Lys Thr Ile Thr Arg Asp Gly

340 345 350

His Glu Ile Asn Val Leu Gln Leu Glu Thr Ala Cys Gly Ala Ala Ile

355 360 365

Arg His Phe Asp Gly Ala His Gly Val Val Val Pro Arg Ser Arg Phe

370 375 380

Leu Pro Val Lys Thr Cys Ser Asp Leu Leu Leu Val Lys Ser Asp Leu

385 390 395 400

Phe Arg Leu Glu His Gly Ser Leu Lys Leu Asp Pro Ser Arg Phe Gly

405 410 415

Pro Asn Pro Leu Ile Lys Leu Gly Ser His Phe Lys Lys Val Ser Gly

420 425 430

Phe Asn Ala Arg Ile Pro His Ile Pro Lys Ile Val Glu Leu Asp His

435 440 445

Leu Thr Ile Thr Gly Asn Val Phe Leu Gly Lys Asp Val Thr Leu Arg

450 455 460

Gly Thr Val Ile Ile Val Cys Ser Asp Gly His Lys Ile Asp Ile Pro

465 470 475 480

Asn Gly Ser Ile Leu Glu Asn Val Val Val Thr Gly Asn Leu Gln Ile

485 490 495

Leu Glu His

<210> 27

<211> 480

<212> DNA

<213> 酿酒酵母

<220>

<223> 源自酿酒酵母的葡萄糖胺6-磷酸N-乙酰转移酶(GNA1)的核酸序列

<400> 27

atgagcttac ccgatggatt ttatataagg cgaatggaag agggggattt ggaacaggtc 60

actgagacgc taaaggtttt gaccaccgtg ggcactatta cccccgaatc cttcagcaaa 120

ctcataaaat actggaatga agccacagta tggaatgata acgaagataa aaaaataatg 180

caatataacc ccatggtgat tgtggacaag cgcaccgaga cggttgccgc tacggggaat 240

atcatcatcg aaagaaagat cattcatgaa ctggggctat gtggccacat cgaggacatt 300

gcagtaaact ccaagtatca gggccaaggt ttgggcaagc tcttgattga tcaattggta 360

actatcggct ttgactacgg ttgttataag attattttag attgcgatga gaaaaatgtc 420

aaattctatg aaaaatgtgg gtttagcaac gcaggcgtgg aaatgcaaat tagaaaatag 480

<210> 28

<211> 159

<212> PRT

<213> 酿酒酵母

<220>

<223> 源自酿酒酵母的葡萄糖胺6-磷酸N-乙酰转移酶(GNA1)的氨基酸序列

<400> 28

Met Ser Leu Pro Asp Gly Phe Tyr Ile Arg Arg Met Glu Glu Gly Asp

1 5 10 15

Leu Glu Gln Val Thr Glu Thr Leu Lys Val Leu Thr Thr Val Gly Thr

20 25 30

Ile Thr Pro Glu Ser Phe Ser Lys Leu Ile Lys Tyr Trp Asn Glu Ala

35 40 45

Thr Val Trp Asn Asp Asn Glu Asp Lys Lys Ile Met Gln Tyr Asn Pro

50 55 60

Met Val Ile Val Asp Lys Arg Thr Glu Thr Val Ala Ala Thr Gly Asn

65 70 75 80

Ile Ile Ile Glu Arg Lys Ile Ile His Glu Leu Gly Leu Cys Gly His

85 90 95

Ile Glu Asp Ile Ala Val Asn Ser Lys Tyr Gln Gly Gln Gly Leu Gly

100 105 110

Lys Leu Leu Ile Asp Gln Leu Val Thr Ile Gly Phe Asp Tyr Gly Cys

115 120 125

Tyr Lys Ile Ile Leu Asp Cys Asp Glu Lys Asn Val Lys Phe Tyr Glu

130 135 140

Lys Cys Gly Phe Ser Asn Ala Gly Val Glu Met Gln Ile Arg Lys

145 150 155

<210> 29

<211> 1674

<212> DNA

<213> 酿酒酵母

<220>

<223> 源自酿酒酵母的磷酸乙酰葡萄糖胺变位酶(PCM1)的核酸序列

<400> 29

atgaaggttg attacgagca attgtgcaaa ctctacgatg acacgtgccg cacaaagaat 60

gtgcagttca gttacggtac ggccggattc agaacgctgg ccaagaattt ggatacggtg 120

atgttcagta ctggtatact ggcggttctc aggtcgctga agcttcaggg tcagtatgtg 180

ggggtgatga tcacggcgtc gcacaaccca taccaggaca acggggtcaa gatcgtggaa 240

ccagacggat cgatgctttt ggccacatgg gagccatatg ccatgcagtt ggccaatgcg 300

gcctcttttg ccactaattt tgaagaattt cgtgttgagt tggccaagct gattgaacac 360

gaaaagattg atttgaatac aaccgtcgtg cctcacatcg tggttgggag agactctagg 420

gaaagtagtc catacttgct gcgctgcttg acttcctcca tggccagcgt cttccacgcg 480

caagttttgg acctaggctg tgtcactacg cctcaattgc attacattac tgatttgtcc 540

aacaggcgga aactggaagg agacacagcg ccagttgcca cagaacagga ctactattcg 600

ttctttatag gagccttcaa cgagctcttc gccacgtatc agctggagaa gaggctgtct 660

gtcccaaaat tgttcataga cacagccaat ggtatcggtg gtccacagtt gaaaaaacta 720

ctggcctccg aagattggga cgtgccagcg gagcaagttg aggtaatcaa cgacaggtcc 780

gatgttccag aactgttgaa ttttgaatgc ggtgcggatt atgtgaagac taaccagaga 840

ttacccaagg gtctttctcc atcctcgttt gattcgctat attgctcctt tgatggtgac 900

gcagacaggg ttgtgttcta ctatgtcgac tcaggatcaa aatttcattt gttggatggt 960

gacaaaattt ccactttgtt tgcaaagttc ttgtctaaac aactagaatt ggcacaccta 1020

gaacattctt tgaagattgg tgttgtgcaa actgcctatg caaacggcag ttccaccgct 1080

tacataaaaa atacgttgca ctgtcccgtg tcttgcacta agacaggtgt taaacacttg 1140

catcatgaag ctgccactca gtacgatatt ggcatttatt tcgaagcaaa tggacatggt 1200

acgattatat tcagcgaaaa atttcatcga actatcaaat ctgaattatc caagtccaag 1260

ttaaatggtg atacgttagc tttgagaact ttgaagtgtt tctctgaatt gattaatcag 1320

accgtgggag atgctatttc agacatgctt gctgtccttg ctactttggc gattttgaaa 1380

atgtcgccaa tggattggga tgaagagtat actgatttgc ccaacaagct ggttaagtgc 1440

atcgttcctg ataggtcaat tttccaaacc acggaccagg aaagaaaatt gctcaatcca 1500

gtggggttgc aagacaagat agatcttgtg gtagccaagt atcccatggg aagaagcttt 1560

gtcagagcca gtggtacgga ggatgcggtg agggtttatg cggaatgtaa ggactcctct 1620

aagttaggtc aattttgtga cgaagtggtg gagcacgtta aggcatctgc ttga 1674

<210> 30

<211> 557

<212> PRT

<213> 酿酒酵母

<220>

<223> 源自酿酒酵母的磷酸乙酰葡萄糖胺变位酶(PCM1)的氨基酸序列

<400> 30

Met Lys Val Asp Tyr Glu Gln Leu Cys Lys Leu Tyr Asp Asp Thr Cys

1 5 10 15

Arg Thr Lys Asn Val Gln Phe Ser Tyr Gly Thr Ala Gly Phe Arg Thr

20 25 30

Leu Ala Lys Asn Leu Asp Thr Val Met Phe Ser Thr Gly Ile Leu Ala

35 40 45

Val Leu Arg Ser Leu Lys Leu Gln Gly Gln Tyr Val Gly Val Met Ile

50 55 60

Thr Ala Ser His Asn Pro Tyr Gln Asp Asn Gly Val Lys Ile Val Glu

65 70 75 80

Pro Asp Gly Ser Met Leu Leu Ala Thr Trp Glu Pro Tyr Ala Met Gln

85 90 95

Leu Ala Asn Ala Ala Ser Phe Ala Thr Asn Phe Glu Glu Phe Arg Val

100 105 110

Glu Leu Ala Lys Leu Ile Glu His Glu Lys Ile Asp Leu Asn Thr Thr

115 120 125

Val Val Pro His Ile Val Val Gly Arg Asp Ser Arg Glu Ser Ser Pro

130 135 140

Tyr Leu Leu Arg Cys Leu Thr Ser Ser Met Ala Ser Val Phe His Ala

145 150 155 160

Gln Val Leu Asp Leu Gly Cys Val Thr Thr Pro Gln Leu His Tyr Ile

165 170 175

Thr Asp Leu Ser Asn Arg Arg Lys Leu Glu Gly Asp Thr Ala Pro Val

180 185 190

Ala Thr Glu Gln Asp Tyr Tyr Ser Phe Phe Ile Gly Ala Phe Asn Glu

195 200 205

Leu Phe Ala Thr Tyr Gln Leu Glu Lys Arg Leu Ser Val Pro Lys Leu

210 215 220

Phe Ile Asp Thr Ala Asn Gly Ile Gly Gly Pro Gln Leu Lys Lys Leu

225 230 235 240

Leu Ala Ser Glu Asp Trp Asp Val Pro Ala Glu Gln Val Glu Val Ile

245 250 255

Asn Asp Arg Ser Asp Val Pro Glu Leu Leu Asn Phe Glu Cys Gly Ala

260 265 270

Asp Tyr Val Lys Thr Asn Gln Arg Leu Pro Lys Gly Leu Ser Pro Ser

275 280 285

Ser Phe Asp Ser Leu Tyr Cys Ser Phe Asp Gly Asp Ala Asp Arg Val

290 295 300

Val Phe Tyr Tyr Val Asp Ser Gly Ser Lys Phe His Leu Leu Asp Gly

305 310 315 320

Asp Lys Ile Ser Thr Leu Phe Ala Lys Phe Leu Ser Lys Gln Leu Glu

325 330 335

Leu Ala His Leu Glu His Ser Leu Lys Ile Gly Val Val Gln Thr Ala

340 345 350

Tyr Ala Asn Gly Ser Ser Thr Ala Tyr Ile Lys Asn Thr Leu His Cys

355 360 365

Pro Val Ser Cys Thr Lys Thr Gly Val Lys His Leu His His Glu Ala

370 375 380

Ala Thr Gln Tyr Asp Ile Gly Ile Tyr Phe Glu Ala Asn Gly His Gly

385 390 395 400

Thr Ile Ile Phe Ser Glu Lys Phe His Arg Thr Ile Lys Ser Glu Leu

405 410 415

Ser Lys Ser Lys Leu Asn Gly Asp Thr Leu Ala Leu Arg Thr Leu Lys

420 425 430

Cys Phe Ser Glu Leu Ile Asn Gln Thr Val Gly Asp Ala Ile Ser Asp

435 440 445

Met Leu Ala Val Leu Ala Thr Leu Ala Ile Leu Lys Met Ser Pro Met

450 455 460

Asp Trp Asp Glu Glu Tyr Thr Asp Leu Pro Asn Lys Leu Val Lys Cys

465 470 475 480

Ile Val Pro Asp Arg Ser Ile Phe Gln Thr Thr Asp Gln Glu Arg Lys

485 490 495

Leu Leu Asn Pro Val Gly Leu Gln Asp Lys Ile Asp Leu Val Val Ala

500 505 510

Lys Tyr Pro Met Gly Arg Ser Phe Val Arg Ala Ser Gly Thr Glu Asp

515 520 525

Ala Val Arg Val Tyr Ala Glu Cys Lys Asp Ser Ser Lys Leu Gly Gln

530 535 540

Phe Cys Asp Glu Val Val Glu His Val Lys Ala Ser Ala

545 550 555

<210> 31

<211> 574

<212> DNA

<213> 其他序列

<220>

<223> 启动子pTDH3的核酸序列

<400> 31

ctgctgtaac ccgtacatgc ccaaaatagg gggcgggtta cacagaatat ataacatcgt 60

aggtgtctgg gtgaacagtt tattcctggc atccactaaa tataatggag cccgcttttt 120

aagctggcat ccagaaaaaa aaagaatccc agcaccaaaa tattgttttc ttcaccaacc 180

atcagttcat aggtccattc tcttagcgca actacagaga acaggggcac aaacaggcaa 240

aaaacgggca caacctcaat ggagtgatgc aacctgcctg gagtaaatga tgacacaagg 300

caattgaccc acgcatgtat ctatctcatt ttcttacacc ttctattacc ttctgctctc 360

tctgatttgg aaaaagctga aaaaaaaggt tgaaaccagt tccctgaaat tattccccta 420

cttgactaat aagtatataa agacggtagg tattgattgt aattctgtaa atctatttct 480

taaacttctt aaattctact tttatagtta gtcttttttt tagttttaaa acaccaagaa 540

cttagtttcg aataaacaca cataaacaaa caaa 574

<210> 32

<211> 585

<212> DNA

<213> 其他序列

<220>

<223> 启动子pTDH3.Sk的核酸序列

<400> 32

caattcatcg gcccttttag cggctacccg cgccatctaa atgatagggc gggtgacact 60

atggtaaatc ccataattag gtgtctgggt gagtggttct gatgccggca tccactaaat 120

atattggagc ccatttttta cgcgggcttc cagaaaaaaa gagaatccca gcaccaaaag 180

gtggttctct tcaccaacca tcagatcata ggtccacaac cacacataac aggggcacaa 240

aaaggcaaaa aacggacata acctcaatgg agtgatgcaa attgactgga gcaaaagctg 300

acacaaggca ttgattgacc tacgcatgta tctgtattct tttcttacac cttctattac 360

cttctaactc tttgggttgg aaaaaactga aaaaaaaggt tgggacctgg ttcccccaag 420

ttgtccccct acttggttat taaatatata aagacagcaa gtgttgatta taatcttgta 480

aatctatagt tcttaatcta tacttctatt tatattttaa attagtcttt ttatttccaa 540

gtccccaaga acttagtttc gaataaacac acacaaataa acaca 585

<210> 33

<211> 700

<212> DNA

<213> 其他序列

<220>

<223> 启动子pTDH3-1.sba的核酸序列

<400> 33

gcagcgcttc ttccgctcta gtttttatag ttattattac taccacctta aaaatacgta 60

aatactcaaa atagtagtga tattcccaac cttattcatc caaggcacat catcatcatc 120

agccattcat ctttcacctg ccattagtaa cccgtcttct cattgagcgg gttacggcag 180

ccacaggcca cattccgaat gtctgggtga gcggtccctt ttccagcatc cactaaatat 240

ctccgatccc gctttttaat ctggcttcct gaaaaaaaga gaatcccagc accaaaaaat 300

ggctctcttc accaaccatc agatcatagg tcccattctc ttaccgcaac cgtacagaac 360

aggggaaaac gggtacaacc tcaatggagt gatgcaaact gactggagca aaaagctgac 420

acaaggcaat cgacctacgt gtctgtctat tttctcacac cttctattac cttctaactc 480

tctgggttgg aaaaaactga aaaaaaggtt gagaccagtt tccacaaatc atccccctgt 540

ttgattaata aatatataaa gacgacaact atcgatcata aactcataaa actataactc 600

ctttacactt cttattttat agttattcta ttttaattct tattgatttt aaaaccccaa 660

gaacttagtt tcgaaaacac acacacacaa acaattaaaa 700

<210> 34

<211> 602

<212> DNA

<213> 其他序列

<220>

<223> 启动子pTDH3.Sar的核酸序列

<400> 34

gagctaaata tcagcccttc gggtcctgcc tgctacccgg tcctgttcga ataaaaacgc 60

gggtaacacg acccagtaac acctgtcgtt gggtgtctgg gtcagaagtt ctgataccgg 120

cttccactaa atagattggg ttccgctctt tacgctggct tcctgaaaaa agagattccg 180

ggcaccaaaa aattggtctc tttgccaacc atcagatcat aggtccattc tcttaccata 240

accacacagg ataggggcac cacaggcgaa aatgggcaca aaatctcaat ggagtgatgc 300

aaattagctg gaacaaaagc tgacacaagg caattaacct gcgcatgtat ccatctcctt 360

ttcttacacc ttctcttacg ttctaactgt ttgggttgga aaaattaaaa aaaaaaggtt 420

gagaccagtt tccccaaatc gtccccctac ttgattcata aatatataaa gacgacaact 480

attgattata atcttgtaaa tctataactc tttactttct cctatttata atttaactta 540

atctttttag atttaaaacc ccaagaactt agtttcgaac aaacacacac aaataaacaa 600

aa 602

<210> 35

<211> 550

<212> DNA

<213> 其他序列

<220>

<223> 启动子pENO2的核酸序列

<400> 35

cgctcagcat ctgcttcttc ccaaagatga acgcggcgtt atgtcactaa cgacgtgcac 60

caacttgcgg aaagtggaat cccgttccaa aactggcatc cactaattga tacatctaca 120

caccgcacgc cttttttctg aagcccactt tcgtggactt tgccatatgc aaaattcatg 180

aagtgtgata ccaagtcagc atacacctca ctagggtagt ttctttggtt gtattgatca 240

tttggttcat cgtggttcat taattttttt tctccattgc tttctggctt tgatcttact 300

atcatttgga tttttgtcga aggttgtaga attgtatgtg acaagtggca ccaagcatat 360

ataaaaaaaa aaagcattat cttcctacca gagttgattg ttaaaaacgt atttatagca 420

aacgcaattg taattaattc ttattttgta tcttttcttc ccttgtctca atcttttatt 480

tttattttat ttttcttttc ttagtttctt tcataacacc aagcaactaa tactataaca 540

tacaataata 550

<210> 36

<211> 598

<212> DNA

<213> 其他序列

<220>

<223> 启动子pTEF3的核酸序列

<400> 36

ggctgataat agcgtataaa caatgcatac tttgtacgtt caaaatacaa tgcagtagat 60

atatttatgc atattacata taatacatat cacataggaa gcaacaggcg cgttggactt 120

ttaattttcg aggaccgcga atccttacat cacacccaat cccccacaag tgatccccca 180

cacaccatag cttcaaaatg tttctactcc ttttttactc ttccagattt tctcggactc 240

cgcgcatcgc cgtaccactt caaaacaccc aagcacagca tactaaattt cccctctttc 300

ttcctctagg gtgtcgttaa ttacccgtac taaaggtttg gaaaagaaaa aagagaccgc 360

ctcgtttctt tttcttcgtc gaaaaaggca ataaaaattt ttatcacgtt tctttttctt 420

gaaaattttt ttttttgatt tttttctctt tcgatgacct cccattgata tttaagttaa 480

taaacggtct tcaatttctc aagtttcagt ttcatttttc ttgttctatt acaacttttt 540

ttacttcttg ctcattagaa agaaagcata gcaatctaat ctaagtttta attacaaa 598

<210> 37

<211> 383

<212> DNA

<213> 其他序列

<220>

<223> 启动子pTEF1的核酸序列

<400> 37

gtttagcttg cctcgtcccc gccgggtcac ccggccagcg acatggaggc ccagaatacc 60

ctccttgaca gtcttgacgt gcgcagctca ggggcatgat gtgactgtcg cccgtacatt 120

tagcccatac atccccatgt ataatcattt gcatccatac attttgatgg ccgcacggcg 180

cgaagcaaaa attacggctc ctcgctgcag acctgcgagc agggaaacgc tcccctcaca 240

gacgcgttga attgtcccca cgccgcgccc ctgtagagaa atataaaagg ttaggatttg 300

ccactgaggt tcttctttca tatacttcct tttaaaatct tgctacgata cagttctcac 360

atcacatccg aacataaaca acc 383

<210> 38

<211> 383

<212> DNA

<213> 其他序列

<220>

<223> 启动子pTEF1.ago的核酸序列

<400> 38

gtttagcttg cctcgtcccc gccgggtcac ccggccagcg acatggaggc ccagaatacc 60

ctccttgaca gtcttgacgt gcgcagctca ggggcatgat gtgactgtcg cccgtacatt 120

tagcccatac atccccatgt ataatcattt gcatccatac attttgatgg ccgcacggcg 180

cgaagcaaaa attacggctc ctcgctgcag acctgcgagc agggaaacgc tcccctcaca 240

gacgcgttga attgtcccca cgccgcgccc ctgtagagaa atataaaagg ttaggatttg 300

ccactgaggt tcttctttca tatacttcct tttaaaatct tgctacgata cagttctcac 360

atcacatccg aacataaaca acc 383

<210> 39

<211> 498

<212> DNA

<213> 其他序列

<220>

<223> 启动子pTEF1.Sba的核酸序列

<400> 39

cgccaacaaa ccttcgaaca ctttaatttt cgaggaccgc agatcctcac atcacaccca 60

cacccaagac tgcttccccc acacaccctg catctgtaca ctttcttctg ctctgttttt 120

ctctccggcg ttctctcggg tcgcccgcat cgccgcgccg gctggaaccg cccacgcacc 180

gcatattgca aatcgcctgc cccctcttgc tcctttttga gggcgcgccg ttacccgcgc 240

ccagggtccg gaaaaagaaa caaggctcta ccgcgtttct ttttccttgt cgaaaaaggc 300

aaaaatgaaa atttttatca cgtttctttt tttttgaaaa attttttttt tggttttttt 360

tctttcgatg gcctcccatt gatatttaag ttaataaatg gttttcagtt ttcaagtttc 420

agtttgtgtt cttctttgct aactttcact tacacctcga aagaaagtat agcaatctaa 480

tcttagtttt aattacaa 498

<210> 40

<211> 700

<212> DNA

<213> 其他序列

<220>

<223> 启动子pPDC1的核酸序列

<400> 40

ttatttacct atctctaaac ttcaacacct tatatcataa ctaatatttc ttgagataag 60

cacactgcac ccataccttc cttaaaaacg tagcttccag tttttggtgg ttccggcttc 120

cttcccgatt ccgcccgcta aacgcatatt tttgttgcct ggtggcattt gcaaaatgca 180

taacctatgc atttaaaaga ttatgtatgc tcttctgact tttcgtgtga tgaggctcgt 240

ggaaaaaatg aataatttat gaatttgaga acaattttgt gttgttacgg tattttacta 300

tggaataatc aatcaattga ggattttatg caaatatcgt ttgaatattt ttccgaccct 360

ttgagtactt ttcttcataa ttgcataata ttgtccgctg cccctttttc tgttagacgg 420

tgtcttgatc tacttgctat cgttcaacac caccttattt tctaactatt ttttttttag 480

ctcatttgaa tcagcttatg gtgatggcac atttttgcat aaacctagct gtcctcgttg 540

aacataggaa aaaaaaatat ataaacaagg ctctttcact ctccttgcaa tcagatttgg 600

gtttgttccc tttattttca tatttcttgt catattcctt tctcaattat tattttctac 660

tcataacctc acgcaaaata acacagtcaa atcaatcaaa 700

<210> 41

<211> 998

<212> DNA

<213> 其他序列

<220>

<223> 启动子pCCW12的核酸序列

<400> 41

aaccagggca aagcaaaata aaagaaactt aatacgttat gccgtaatga agggctacca 60

aaaacgataa tctcaactgt aaacaggtac aatgcggacc cttttgccac aaaacataca 120

tcattcattg ccggaaaaag aaagaagtga agacagcagt gcagccagcc atgttgcgcc 180

aatctaatta tagatgctgg tgccctgagg atgtatctgg agccagccat ggcatcatgc 240

gctaccgccg gatgtaaaat ccgacacgca aaagaaaacc ttcgaggttg cgcacttcgc 300

ccacccatga accacacggt tagtccaaaa ggggcagttc agattccaga tgcgggaatt 360

agcttgctgc caccctcacc tcactaacgc tgcggtgtgc ggatacttca tgctatttat 420

agacgcgcgt gtcggaatca gcacgcgcaa gaaccaaatg ggaaaatcgg aatgggtcca 480

gaactgcttt gagtgctggc tattggcgtc tgatttccgt tttgggaatc ctttgccgcg 540

cgcccctctc aaaactccgc acaagtccca gaaagcggga aagaaataaa acgccaccaa 600

aaaaaaaaat aaaagccaat cctcgaagcg tgggtggtag gccctggatt atcccgtaca 660

agtatttctc aggagtaaaa aaaccgtttg ttttggaatt ccccatttcg cggccaccta 720

cgccgctatc tttgcaacaa ctatctgcga taactcagca aattttgcat attcgtgttg 780

cagtattgcg ataatgggag tcttacttcc aacataacgg cagaaagaaa tgtgagaaaa 840

ttttgcatcc tttgcctccg ttcaagtata taaagtcggc atgcttgata atctttcttt 900

ccatcctaca ttgttctaat tattcttatt ctcctttatt ctttcctaac ataccaagaa 960

attaatcttc tgtcattcgc ttaaacacta tatcaata 998

<210> 42

<211> 976

<212> DNA

<213> 其他序列

<220>

<223> 启动子pCCW12.Sm的核酸序列

<400> 42

cgttgtgctg tagtgaagga agactaaaaa ggataatcac agttgtaaag aggtataatg 60

cggacccttt tgccacaaaa cacacatctt tcgtttccaa aataagaaag aagaaagcaa 120

aaagattagc agccacgttg ctgcgatcta attatagacg gtggcgtcat cattctcacc 180

caagattgtg tcttgaacct gccacgggtc ctgcgttatc gccggatgta aaactagaca 240

tgcaaaaaaa ggaccttcca ggtagcgtgc tccacaccac ccatgaccac cacagttagt 300

ccaaaagagg cagcaccact tcccgatggg ggaattagat tgctgccacc ctcacctcac 360

taatgctgcg gtgtgcggat atgccctgct atatatagct ccgcgttttt gaaccagcac 420

agcgcgagca ccaaaaagga aaatcgcata ggcccagaac tgatttcagc acgggctatt 480

ggcgttgggt ttccgttctg ggaaaccttc gccgcgtccc cctcacaaac ctccgcacaa 540

gttcgagcaa gcgggaaaaa acgaaaaacg ccattaatac taaataaagc aaatcctcga 600

agcgtgggtg gcaagcccct ggatttttcc gcacaagtac tcttctcagg agtaaaaaaa 660

cccgtttgtt ttggaattcc ccatttcgcg gccatctacg ccggtatctt cgcaatatct 720

atcagcgata actcagcaat tttaatattc gtgttgcagt gctgcgatag cgggagtctt 780

gtttgtaaca taacggcaga aaggaatgag agaaaatttt ccattctttg gcctccgttc 840

aagtatataa agccggcatg cttggtaatc tttctctctc ttctgtattg tttctataat 900

acttttatct tctaattatt ttctgaaaaa accaagaaat taatcttctg tcattcgctt 960

aaacactata tcaata 976

<210> 43

<211> 750

<212> DNA

<213> 其他序列

<220>

<223> 启动子pCCW12.Sk的核酸序列

<400> 43

tgtaaaatcc tacacgcaaa aaacctcttg ggttgcgcgt tttccaccac ccacgacccg 60

cacaatcaat ccaaaagggg caacgccagt tcccaatgcg ggaattagct cctcaccccc 120

ctcacccgct aacgctgcgg tgtgcggaca cgcagcagta tttatagatc ctcgtgttgg 180

aaccagcccg cgtgagcacc aaattggaaa gtcgcaatgg gcccagaacc gctttcagta 240

ctgggccatt ggcgtctagt ttccgttttg agcgtccttc gccgcgtctc tctgtgaaat 300

ccccgcacaa gtctgagcag gcaaaaaaaa aaaacgccac caaaaataaa taaagccaat 360

cctcgaagga tgagtaggaa aggaagcccc tggttttttc ccgcacgaat atttttcagg 420

agtgaaaaaa tccgtttgtt ttggaattcc ccatttcgcg ctcacctacg ccggtatctt 480

tggaacaact atcagcgata actcagcaaa atttgcatat ccgtgctgca atagtgcgat 540

agtgggattg ggagtcttgt tgcatcataa cggcagaaag gaatgaataa aaattttccg 600

ttctttgtct ccgttcaagt atataaagtc ggcatgcttg attatctttt cttctcttct 660

actacatttc tatttcactt tctactctat tcttccctga aaaacccaag aaaataatct 720

tctgtcattc gcttaaacaa tatatcaaaa 750

<210> 44

<211> 750

<212> DNA

<213> 其他序列

<220>

<223> 启动子pCCW12.Sba的核酸序列

<400> 44

accatgccac ggtgctggcc ccacttccac ccacgacccg cacggttggc ccgaaagggg 60

caacaccagt tcccaatacg gaaattagtc cgccaccacc ctcacctcgc tagagctgcg 120

gtgtgcgggc gtgcatcgct atttatagac atgcctgctg gcgtcaccgc gcgcgagcac 180

caaacaggaa aatcgcactg ggcccagaac cacgctatgc gctgggccga tggcgtccgg 240

tttccctttg ggagccccct gccacgttcg cctaacaaat ccccgcaccg gcttgagaaa 300

aaagcgaaaa gcgaaaaaaa aaaatcaacg ccaccaaaat taaaaaaaaa gagccatcct 360

cgaagggtga atagtagccc ctgacttttc ccgcacagac agacaccttt caggagtgaa 420

caaaaaagca gtttgttttg gaattccccc atttcgcggt ggcctgcgca ggtatctctg 480

cgtcaactat cagcgataac tcagcaaatt ttgcatattc gtgttgcgat actacgataa 540

tgggagtctg tcgcctaata acggcaacaa ggaatgagag agaaaaattt tcttcattct 600

ccagctcccg ttcaagtata taaggtcggc atggtcgatt gtctttcctt ctcttcagtt 660

acgtctctct atttacatta ttcttatttt tatttaataa aaaccccaag aaattaatct 720

tctgtcattc gcttaaacac tatatcaaaa 750

<210> 45

<211> 750

<212> DNA

<213> 其他序列

<220>

<223> 启动子pCCW12.Sar的核酸序列

<400> 45

aaaaaacaac cttctgccaa cctgcgtgct tctcaccacc catgacccac acaattgacc 60

cgaatggggc aactccagtt cccaatacgg gaattaactc gccaccatat ttaccgcgtt 120

gaagctgtgg tgtgcggaca ctccgtacta tttatagacc cacgcggtgg aaccagcacg 180

cgcgcgcact aaacaggaaa atcgcattga gtccagaacc gccaccagca cttggccatt 240

ggcgtctaat ttccgttttc ggcgcccctc accgcgtcct tctaacaaag cgcgcacaag 300

cttgagcaag tgaaaagaaa attaaaaata aaaaaccgcc accaaaacaa ataaagcaat 360

cttcgaagtg tgggttggtg ggaagcccct ggcttttccc gcaccagtcg ttttcaggag 420

taaaaaaata cccgtttgtt ttggaattcc ccatttcgcg gcgacctgcg ccggtatctt 480

tgcaacaact atttgcgata actcagcaaa atttgcatat tcgtgttggg atattgcgat 540

agtgggagtc ttgttgcata ataacggtaa aaagaagtga aggaaaaaaa tttgcatcct 600

ttagtctcag ttcaagtata taaagtcggg atattcaatt atctttcttt ctcttgctca 660

aaggtttcta tatttttttt atagtatttc ttttgttata aaataccaag aaattaatct 720

tctgtcattc gcttaaatac tacatcaata 750

<210> 46

<211> 500

<212> DNA

<213> 其他序列

<220>

<223> 启动子pNUP57的核酸序列

<400> 46

tcatctgcgc aatgactatc aagaccttct gcaagaattt caaatctcac tgaaaatctt 60

gaccgaaaag tgtcttgaaa acccatcaag cctgcaaaac ctatctttga cattagtctc 120

cattataaaa acggcatagt tgggagaaaa ctttccatac ttcaattgtg gactgatata 180

agtattttag ttttgcccgc atgatcatcc cacatggcta cagcagttct ctcataggaa 240

aatagtacaa tagctacgtg atataatcta aataattgtt gccaatgtgt aattatatca 300

ttttgaacgt acgcgaaatg gattattttc aaaaattttg tttcttgaaa tgagtaaaag 360

caaaagtcca actctccaag tcgatgtaaa caactttttg ccaaagggac tgaaagacta 420

aatcgaggat tatcccgttc aaactattcc agaaacgctc gttagtaaca aaagacatac 480

cttgttgacc aattgatcac 500

<210> 47

<211> 523

<212> DNA

<213> 其他序列

<220>

<223> 启动子pCCW10.ago的核酸序列

<400> 47

ggtaccacgg caacctcgtt cgctgttcat ccccttcgtc acacaggacg ttggatgccg 60

taagcagcgt tgcttttgat cctcaggatc ggccgggtaa cccgcggctg cttctatttt 120

agtattcata tctcaagcac atccattccg gccgtttggg ggcgccgccg cactcgtgtc 180

cattcctacc gtggcactta gggctatcct gtcggagcgc cccgccgacc gccttatcgg 240

caccaaaagt agaagccccg gccccgcgtg gctcagactc accatcggtg ctatttactt 300

ttcgatcaga tcgcggcgcg cggtggccgg catttccgga agcggccacg gagcagaggt 360

ggcgcattcg aatcgcatac gtcttcgcca cgccggaaaa aaaattttcg gctatataag 420

gagaggcggc cgtcttgctg caggcagttt cactttctct aaaaccaaag aacatcgatt 480

tctttagtca ctcgcttcct tacaccgaac tcgaggcggc cgc 523

<210> 48

<211> 943

<212> DNA

<213> 其他序列

<220>

<223> 启动子pCWP2的核酸序列

<400> 48

ctagcctccc ctttttattt tgtgcggtca ccgcaaggga caaagctttt cttagaaaac 60

cgtctgagaa gcataacgta cgccatcccc tagacatatt aataatgcta cagatactat 120

gctgctcgtc tttttttgac gaccctttta ttgcaatgtg caactaatgg caaacaacca 180

catagtatca cagtattaca ttgcctccac cgatgcggat gttagggcgc caagtctgtc 240

atgaagcatg ttcctgtcat aatcttgtat gcaaaatacc gcgttctgcg ccactgatat 300

gctaggcagc agcaacctat gcagaagatt gcttttccca cgcctgtttt acgtctccag 360

ggcacttgaa acaatgcagc gatcgccgcc acaacacgcc aaagagaagc gaaagtgggc 420

ctgggcggcc tcagtttcgg cagaggtaaa caacacgaac tgaactgcct tagctccgaa 480

gggcaattcc acaggcactc cgcggggccc ggccaaggcc caaaaggcgt ggaatatgcg 540

cgttttgggg ccataacacc cagtaccacg gccggaacgg gccatataat aagtttttca 600

ctctcaagaa tggtaaacgt aaataggaac atcccactac cctagaaatt gcggaaattt 660

cgcgcttatc attagaaaat ctggaaccgt cctttttcct ctttcttgca tttccctttc 720

cgtattattg ccattcttta actgcatttg gggaaccgta gaccaaaagc caaacagaga 780

aatgtaacgt tctaaaaaaa aaacaacgaa aaaattgaaa aataagatac aataatcgta 840

tataaatcag gcttcttgtt catcattttc aattctcttc ttgccatccc ttttcctatc 900

tttgttcttt tcttctcata atcaagaata aataacttca tca 943

<210> 49

<211> 750

<212> DNA

<213> 其他序列

<220>

<223> 启动子pCCW120.Sca的核酸序列

<400> 49

tatttttttt aaattaaaga tgctgtgcaa ttaattgtcc ggagggaccc ttgcatactg 60

gccagtttgt acgggcgtta catagcgccg atcgacgaac agcttattaa tagcaagatt 120

tgtttctccc atgagcaatt aaccagtaat tttcacagaa actagcacaa aaccaaccaa 180

acagttaaag gcagtttcgg agaataaaca acgcgctcac tgagcttgct gttgccaaaa 240

ataacagtcg cgtgcgatgg cgggcttggc attttcctcg aaggggaaac gccgccaggg 300

ttcgctgcgg tgtgtgggtg gggcagcccc cgggcgccca gacggtgccg cagggccttg 360

agacagccca aaatgccgcg aaaacgcaag ggcgcggtga cctctttcct aatgcggaaa 420

gccccaccgc cagcgacgtg acgcgttgtg cgggctcttc tcgggacccg gaaaaagaaa 480

tacgtacaca aacaccagca aattttttcg cttgagaggc tgcccgtgtt tctgcgcaac 540

gtgaaacacg gtggacaaga caagagagat tgacaagcgt cgttatcgtc ccagtgaggt 600

ttcccaatta tataaataca tccctgttgg tggattctta attacaactt ccatctctct 660

ctctctcact tcttttgttc ccttacatat ccccaagaaa tcaatcttct gccattcgct 720

ttaacaacaa acaaactttt aacttttaaa 750

<210> 50

<211> 535

<212> DNA

<213> 其他序列

<220>

<223> 启动子pRPLA1的核酸序列

<400> 50

tcaagttgga tactgatctg atctctccgc cctactacca gggaccctca tgattaccgc 60

tcgaatgcga cgtttcctgc ctcataaaac tggcttgaaa atatttattc gctgaacagt 120

agcctagctt ataaaaattt catttaatta atgtaatatg aaaactcaca tgccttctgt 180

ttctaaaatt gtcacagcaa gaaataacat taccatacgt gatcttatta aactctagta 240

tcttgtctaa tacttcattt aaaagaagcc ttaaccctgt agcctcatct atgtctgcta 300

catatcgtga ggtacgaata tcgtaagatg ataccacgca actttgtaat gatttttttt 360

ttttcatttt ttaaagaatg cctttacatg gtatttgaaa aaaatatctt tataaagttt 420

gcgatctctt ctgttctgaa taatttttag taaaagaaat caaaagaata aagaaatagt 480

ccgctttgtc caatacaaca gcttaaaccg attatctcta aaataacaag aagaa 535

<210> 51

<211> 505

<212> DNA

<213> 其他序列

<220>

<223> 启动子pCUP1的核酸序列

<400> 51

cggcaaactt caacgatttc tatgatgcat tttataatta gtaagccgat cccattaccg 60

acatttgggc gctatacgtg catatgttca tgtatgtatc tgtatttaaa acacttttgt 120

attatttttc ctcatatatg tgtataggtt tatacggatg atttaattat tacttcacca 180

ccctttattt caggctgata tcttagcctt gttactagtt agaaaaagac atttttgctg 240

tcagtcactg tcaagagatt cttttgctgg catttcttct agaagcaaaa agagcgatgc 300

gtcttttccg ctgaaccgtt ccagcaaaaa agactaccaa cgcaatatgg attgtcagaa 360

tcatataaaa gagaagcaaa taactccttg tcttgtatca attgcattat aatatcttct 420

tgttagtgca atatcatata gaagtcatcg aaatagatat taagaaaaac aaactgtaca 480

atcaatcaat caatcatcac ataaa 505

<210> 52

<211> 510

<212> DNA

<213> 其他序列

<220>

<223> 启动子pMET6的核酸序列

<400> 52

ccacaggaaa tatttcacgt gacttacaaa cagagtcgta cgtcaggacc ggagtcaggt 60

gaaaaaatgt gggccggtaa agggaaaaaa ccagaaacgg gactactatc gaactcgttt 120

agtcgcgaac gtgcaaaagg ccaatatttt tcgctagagt catcgcagtc atggcagctc 180

tttcgctcta tctcccggtc gcaaaactgt ggtagtcata gctcgttctg ctcaattgag 240

aactgtgaat gtgaatatgg aacaaatgcg atagatgcac taatttaagg gaagctagct 300

agttttccca actgcgaaag aaaaaaagga aagaaaaaaa aattctatat aagtgataga 360

tatttccatc tttactagca ttagtttctc ttttacgtat tcaatatttt tgttaaactc 420

ttcctttatc ataaaaaagc aagcatctaa gagcattgac aacactctaa gaaacaaaat 480

accaatataa tttcaaagta catatcaaaa 510

<210> 53

<211> 686

<212> DNA

<213> 其他序列

<220>

<223> 启动子pMET25的核酸序列

<400> 53

ttacattatc aatccttgcg tttcagcttc cactaattta gatgactatt tctcatcatt 60

tgcgtcatct tctaacaccg tatatgataa tatactagta acgtaaatac tagttagtag 120

atgatagttg atttttattc caacactaag aaataatttc gccatttctt gaatgtattt 180

aaagatattt aatgctataa tagacattta aatccaattc ttccaacata caatgggagt 240

ttggccgagt ggtttaaggc gtcagattta ggtggattta acctctaaaa tctctgatat 300

cttcggatgc aagggttcga atcccttagc tctcattatt ttttgctttt tctcttgagg 360

tcacatgatc gcaaaatggc aaatggcacg tgaagctgtc gatattgggg aactgtggtg 420

gttggcaaat gactaattaa gttagtcaag gcgccatcct catgaaaact gtgtaacata 480

ataaccgaag tgtcgaaaag gtggcacctt gtccaattga acacgctcga tgaaaaaaat 540

aagatatata taaggttaag taaagcgtct gttagaaagg aagtttttcc tttttcttgc 600

tctcttgtct tttcatctac tatttccttc gtgtaataca gggtcgtcag atacatagat 660

acaattctat tacccccatc cataca 686

<210> 54

<211> 363

<212> DNA

<213> 其他序列

<220>

<223> 启动子pSAM1的核酸序列

<400> 54

gaaacggacg taagacggaa atagaatttg aagataaagt tatatatcac tacacacgaa 60

tactttcttt tttttttttc acaggaaaac tgtggtggcg cccttgccta ctagtgcatt 120

tcttttttcg ggttcttgtc tcgacgaaat tttagcctca tcgtagtttt tcactctggt 180

atcgatgaaa aagggaagag taaaaagttt tccgtttagt acttaatggg attggtttgg 240

gacgtatata tcgactggtg ttgtctgtta ttcatcgttg tttttcggtt agcttcgaaa 300

aaaaaataga gtaaaaacca ggaatttacc ctaaaaacaa gaaaaaataa gataaacgaa 360

aat 363

<210> 55

<211> 300

<212> DNA

<213> 其他序列

<220>

<223> 终止子tTPI1的核酸序列

<400> 55

gattaatata attatataaa aatattatct tcttttcttt atatctagtg ttatgtaaaa 60

taaattgatg actacggaaa gcttttttat attgtttctt tttcattctg agccacttaa 120

atttcgtgaa tgttcttgta agggacggta gatttacaag tgatacaaca aaaagcaagg 180

cgctttttct aataaaaaga agaaaagcat ttaacaattg aacacctcta tatcaacgaa 240

gaatattact ttgtctctaa atccttgtaa aatgtgtacg atctctatat gggttactca 300

<210> 56

<211> 299

<212> DNA

<213> 其他序列

<220>

<223> 终止子tMET25的核酸序列

<400> 56

gtgtgcgtaa tgagttgtaa aattatgtat aaacctactt tctctcacaa gtactatact 60

tttataaaac gaactttatt gaaatgaata tccttttttt cccttgttac atgtcgtgac 120

tcgtactttg aacctaaatt gttctaacat caaagaacag tgttaattcg cagtcgagaa 180

gaaaaatatg gtgaacaaga ctcatctact tcatgagact actttacgcc tcctataaag 240

ctgtcacact ggataaattt attgtaggac caagttacaa aagaggatga tggaggttt 299

<210> 57

<211> 300

<212> DNA

<213> 其他序列

<220>

<223> 终止子tDIT1的核酸序列

<400> 57

taaagtaaga gcgctacatt ggtctacctt tttgttcttt tacttaaaca ttagttagtt 60

cgttttcttt ttctcatttt tttatgtttc ccccccaaag ttctgatttt ataatatttt 120

atttcacaca attccattta acagaggggg aatagattct ttagcttaga aaattagtga 180

tcaatatata tttgcctttc ttttcatctt ttcagtgata ttaatggttt cgagacactg 240

caatggccct agttgtctaa gaggatagat gttactgtca aagatgatat tttgaatttc 300

<210> 58

<211> 300

<212> DNA

<213> 其他序列

<220>

<223> 终止子tRPL3的核酸序列

<400> 58

gaagttttgt tagaaaataa atcatttttt aattgagcat tcttattcct attttattta 60

aatagtttta tgtattgtta gctacataca acagtttaaa tcaaattttc tttttcccaa 120

gtccaaaatg gaggtttatt ttgatgaccc gcatgcgatt atgttttgaa agtataagac 180

tacatacatg tacatatatt taaacatgta aacccgtcca ttatattgct tactttcttc 240

ttttttgccg ttttgacttg gacctctggt ttgctatttc cttacaatct ttgctacaat 300

<210> 59

<211> 304

<212> DNA

<213> 其他序列

<220>

<223> 终止子tRPL3.sm的核酸序列

<400> 59

gaagttttta aagcattttt tagacacttc tcatttttct aagttttttt aaaatagttt 60

tatgtattta ctacgtatca caatttgaaa taattcatct tcccaaaaaa ctaagatttt 120

tatccttgtc acgatccgta accagtttat aatattttag agcttataca cgtacgtata 180

cacacgtgtc ggtacatgag aattacgttc aaaattattc actttttttt tctctgccgt 240

tttacttttg aactctgtct cgctatttcc ttacaatctt cgctacaata ccacttgccc 300

ttgg 304

<210> 60

<211> 299

<212> DNA

<213> 其他序列

<220>

<223> 终止子tRPL3.sba的核酸序列

<400> 60

gaagttttct gacaaaaaca taacgttttt tccaatcatt tcttattttt ccggtttatt 60

taaatagttt ttatgtacta ttatacgtat gactatttaa cttaaattct tcctcccaag 120

aaatctccca agtttttcat tatcatggca tacaccacta tcagttacaa aatggtagct 180

caaccatata tatatctcta tatacacata taaatgcaaa caggtccaag tcaccgctca 240

ctgcagtttc ttttgccgtt ttgacttcga tctctgcttg gctattttct cacaatcct 299

<210> 61

<211> 300

<212> DNA

<213> 其他序列

<220>

<223> 终止子tRPL41B的核酸序列

<400> 61

gcggattgag agcaaatcgt taagttcagg tcaagtaaaa attgatttcg aaaactaatt 60

tctcttatac aatcctttga ttggaccgtc atcctttcga atataagatt ttgttaagaa 120

tattttagac agagatctac tttatattta atatctagat attacataat ttcctctcta 180

ataaaatatc attaataaaa taaaaatgaa gcgatttgat tttgtgttgt caacttagtt 240

tgccgctatg cctcttgggt aatgctatta ttgaatcgaa gggctttatt atattaccct 300

<210> 62

<211> 300

<212> DNA

<213> 其他序列

<220>

<223> 终止子tRPL15A的核酸序列

<400> 62

gctggttgat ggaaaatata attttattgg gcaaactttt gtttatctga tgtgttttat 60

actattatct ttttaattaa tgattctata tacaaacctg tatatttttt ctttaaccaa 120

tttttttttt tatagaccta gagctgtact tttattctgc tatcaagcaa acccctaccc 180

cctcttctca atcctcccct caggcagaac ttatctacct gtatcaagga gcggacgagg 240

gagtcctaat tgttctacgt ataccaatgc tagcagctta cataggtggt ggcactacca 300

<210> 63

<211> 300

<212> DNA

<213> 其他序列

<220>

<223> 终止子tRPL15A.sba的核酸序列

<400> 63

gctggctgat gaaaaatata gttctgttgg gcaagcattt gtttacctag catctctttt 60

atactattat tatctttata tttgatgatt ttatatacaa gttgtatacc ttttctttaa 120

ccaatttttt tttttctaat ggtgcaccta gaagtacatt ttttctcacc aatagatagt 180

caagatactc ccagcctcta tggcgttacc acggagccga caagggaaag ctgcttatct 240

tacatatgca gatgccaagg cccgttacag gccgccttat tgatgtttag aaatagcttc 300

<210> 64

<211> 300

<212> DNA

<213> 其他序列

<220>

<223> 终止子tIDP1的核酸序列

<400> 64

tcgaatttac gtagcccaat ctaccacttt tttttttcat tttttaaagt gttatactta 60

gttatgctct aggataatga actacttttt tttttttttt tttactgtta tcataaatat 120

atatacctta ttgttgtttg caaccgtcgg ttaattcctt atcaaggttc cccaagttcg 180

gatcattacc atcaatttcc aacattttca tgagttcttc ttcttcatta ccgtgtttta 240

gggggctgtt cgcacttcta atagggctat caccaagctg ttctaattcg tccaaaagtt 300

<210> 65

<211> 300

<212> DNA

<213> 其他序列

<220>

<223> 终止子tTEF1.sba的核酸序列

<400> 65

ggagattgat aggacttttc tagttgcata tcttttattt ttaaatctta tctattagtt 60

aattttttgt aatttatcct tatatatata gtttggttat tctaaaacat catttcagta 120

tctaaaacct ctcttattca ttaccttttt atttaatggt ttttgctaca ggcaaaaatt 180

taatggtttt tgctacaggc aaaaatcccg ccgtggactt attccacgtt aactcggtta 240

cagggtcatg aaccattttg tcaattatcg aaataacttc ttcaaaagtc cctcttactt 300

<210> 66

<211> 60

<212> DNA

<213> 其他序列

<220>

<223> 在5’添加的分泌序列的核酸序列

<400> 66

atgcaattta gcacagtcgc atcagtagcc ttcgttgcct tggccaactt cgtggcagca 60

<210> 67

<211> 20

<212> PRT

<213> 其他序列

<220>

<223> N末端添加的分泌序列的氨基酸序列

<400> 67

Met Gln Phe Ser Thr Val Ala Ser Val Ala Phe Val Ala Leu Ala Asn

1 5 10 15

Phe Val Ala Ala

20

<210> 68

<211> 213

<212> DNA

<213> 其他序列

<220>

<223> 在3’添加的锚定序列的核酸序列

<400> 68

ggatccgcca tttctcaaat cactgacggt caaatccaag ctactaccac tgctaccacc 60

gaagctacca ccactgctgc cccatcttcc accgttgaaa ctgtttctcc atccagcacc 120

gaaactatct ctcaacaaac tgaaaatggt gctgctaagg ccgctgtcgg tatgggtgcc 180

ggtgctctag ctgctgctgc tatgttgtta taa 213

<210> 69

<211> 68

<212> PRT

<213> 其他序列

<220>

<223> C末端添加的锚定序列的氨基酸序列

<400> 69

Ala Ile Ser Gln Ile Thr Asp Gly Gln Ile Gln Ala Thr Thr Thr Ala

1 5 10 15

Thr Thr Glu Ala Thr Thr Thr Ala Ala Pro Ser Ser Thr Val Glu Thr

20 25 30

Val Ser Pro Ser Ser Thr Glu Thr Ile Ser Gln Gln Thr Glu Asn Gly

35 40 45

Ala Ala Lys Ala Ala Val Gly Met Gly Ala Gly Ala Leu Ala Ala Ala

50 55 60

Ala Met Leu Leu

65

Claims

1.一种生产肝素前体的重组酵母细胞，其中，所述重组细胞包含：

2.根据权利要求1所述的重组细胞，其中，所述重组细胞包含编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的核酸，其中，所述具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽包含分泌信号和任选的锚定信号。

3.一种生产肝素前体的重组宿主细胞，其中，所述重组细胞包含：

其中，具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽包含分泌信号和任选的锚定信号，使得肝素前体、特别是具有所想要分子量的肝素前体由宿主细胞生产。

4.根据权利要求2或3所述的重组细胞，其中，编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的核酸获自或源自解肝磷脂土地杆菌。

5.根据权利要求2至4中任一项所述的重组细胞，其中，编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的核酸在选自由以下组成的组的启动子的控制下：pTEF1、pCCW12、pCCW12.sba、pCCW12.Sar、pPDC1、pTEF3、pTDH3、pNUP57和pCCW10.ago。

6.根据权利要求2至5中任一项所述的重组细胞，其中，所述肝素前体的分子量在小于50kDa的范围内，优选在约20kDa至约50kDa的范围内。

7.根据权利要求2至5中任一项所述的重组细胞，其中，所述肝素前体的分子量在大于50kDa的范围内，优选在约50kDa至约250kD的范围内。

8.根据权利要求2至5中任一项所述的重组细胞，其中，所述肝素前体的分子量在大于100kDa的范围内，优选在约100kDa至约1500kDa的范围内。

9.根据权利要求1至8中任一项所述的重组细胞，其中，编码具有UDP-葡萄糖脱氢酶(UDP-GlcDH或HASB)活性的多肽的核酸获自并且源自以下中的至少一者：拟南芥、小球藻属病毒PBCV1或兽瘟链球菌，并且特别是来自拟南芥或小球藻属病毒PBCV1。

10.根据权利要求1至9中任一项所述的重组细胞，其中，编码具有肝素前体合酶(HSS)活性的多肽的核酸获自或源自多杀巴斯德菌。

11.根据权利要求1至10中任一项所述的重组细胞，其中，所述重组细胞还包含至少一种编码以下中的一者或多者的重组核酸：

(ii)具有UDP-N-乙酰葡萄糖胺焦磷酸化酶(QRI1)活性的多肽。

12.根据权利要求1至11中任一项所述的重组细胞，其中，所述重组细胞还包含至少一种编码以下中的一者或多者的重组核酸：

(i)具有磷酸葡萄糖变位酶-1(PGM1)活性的多肽；和/或

(iv)具有磷酸乙酰葡萄糖胺变位酶(PCM1)活性的多肽。

13.根据权利要求11或12所述的重组细胞，其中：

-编码具有磷酸葡萄糖变位酶-1(PGM1)活性的多肽的核酸；和/或

-编码具有磷酸乙酰葡萄糖胺变位酶(PCM1)的多肽的核酸；

获自或源自酿酒酵母。

14.根据权利要求3至13中任一项所述的重组宿主细胞，其中，所述重组宿主细胞是酵母。

15.根据权利要求1至14中任一项所述的重组宿主细胞，其中，所述重组细胞属于酵母属，或属于念珠菌属，或属于克鲁维酵母菌属，或属于汉逊酵母属，或属于耶氏酵母属，或属于德巴利酵母属，或属于阿舒囊霉属，并且特别是属于酵母属。

16.根据权利要求15所述的重组细胞，其中，所述重组细胞选自由以下组成的组：酿酒酵母、布拉氏酵母、贝酵母、奇异酵母、米卡酵母、卡氏酵母、白念珠菌、光滑念珠菌、热带念珠菌、乳酸克鲁维酵母、马克斯克鲁维酵母、多孢克鲁维酵母、耐热克鲁维酵母、多形汉逊酵母、解脂耶氏酵母、汉逊德巴利酵母和棉阿舒囊霉，并且优选酿酒酵母。

17.一种生产肝素前体的方法，其包括：

(a)在培养基中培养如权利要求1至16中任一项所定义的重组细胞持续足以生产肝素前体的时间；和

18.根据权利要求17所述的方法，其中，所述肝素前体的分子量为约20kDa至约50kDa。

19.根据权利要求17所述的方法，其中，所述肝素前体的分子量为约50kDa至约150kDa。

20.根据权利要求17所述的方法，其中，所述肝素前体的分子量为约150kDa至约1500kDa。

21.根据权利要求17至20中任一项所述的方法，其中，所述重组细胞是属于酵母属的酵母，并且特别是酿酒酵母。

22.根据权利要求17至21中任一项所述的方法，其中，所述足以生产肝素前体的时间是约35至约50小时、优选约40至约50小时、优选约48小时的时间段。

23.根据权利要求17至22中任一项所述的方法，其中，所生产的肝素前体的分子量由步骤(a)期间调节所述培养基的pH来控制。

24.根据权利要求17至23中任一项所述的方法，其中，所述方法以工业规模进行，优选地其中所述培养基是至少约100L，更优选地在约1000L至约3000L的范围内，甚至更优选约10,000L或甚至更优选约100,000L，或甚至约250,000L。

25.一种肝素前体，其是从根据权利要求1至16中任一项所述的重组细胞可获得的或从根据权利要求17至24中任一项所述的方法可获得的。

26.一种培养基，其包含根据权利要求25所述的肝素前体。

27.一种组合物，其包含根据权利要求25所述的肝素前体。

28.一种工业产品或消费产品或消费品，其包含(i)具有如权利要求6至8中任一项所定义的分子量的根据权利要求25所述的肝素前体，(ii)如权利要求26所述的培养基或(iii)如权利要求27所述的组合物。

29.根据权利要求28所述的工业产品或消费产品或消费品，其中，所述工业产品或消费产品或消费品是美容品、调味品、香料产品、食品、食物、饮料、食品定形剂、药物组合物、膳食补充剂、营养制品、清洁产品、牙科和/或口腔卫生组合物。

30.根据权利要求1至16中任一项所定义的重组细胞用于生产具有约20kDa至约50kDa或约50kDa至约1000kDa范围内的分子量的肝素前体的用途。