CN117460835A - 生产肝素前体的重组细胞 - Google Patents

生产肝素前体的重组细胞 Download PDF

Info

Publication number
CN117460835A
CN117460835A CN202280038990.0A CN202280038990A CN117460835A CN 117460835 A CN117460835 A CN 117460835A CN 202280038990 A CN202280038990 A CN 202280038990A CN 117460835 A CN117460835 A CN 117460835A
Authority
CN
China
Prior art keywords
polypeptide
recombinant
activity
nucleic acid
acid sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280038990.0A
Other languages
English (en)
Inventor
多米尼克·路易斯
卡琳·杰尔拉尔登
缪里·梅尔卡姆
多米尼克·托马斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Givaudan SA
Original Assignee
Givaudan SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Givaudan SA filed Critical Givaudan SA
Publication of CN117460835A publication Critical patent/CN117460835A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C08ORGANIC MACROMOLECULAR COMPOUNDS; THEIR PREPARATION OR CHEMICAL WORKING-UP; COMPOSITIONS BASED THEREON
    • C08BPOLYSACCHARIDES; DERIVATIVES THEREOF
    • C08B37/00Preparation of polysaccharides not provided for in groups C08B1/00 - C08B35/00; Derivatives thereof
    • C08B37/006Heteroglycans, i.e. polysaccharides having more than one sugar residue in the main chain in either alternating or less regular sequence; Gellans; Succinoglycans; Arabinogalactans; Tragacanth or gum tragacanth or traganth from Astragalus; Gum Karaya from Sterculia urens; Gum Ghatti from Anogeissus latifolia; Derivatives thereof
    • C08B37/0063Glycosaminoglycans or mucopolysaccharides, e.g. keratan sulfate; Derivatives thereof, e.g. fucoidan
    • C08B37/0075Heparin; Heparan sulfate; Derivatives thereof, e.g. heparosan; Purification or extraction methods thereof
    • CCHEMISTRY; METALLURGY
    • C08ORGANIC MACROMOLECULAR COMPOUNDS; THEIR PREPARATION OR CHEMICAL WORKING-UP; COMPOSITIONS BASED THEREON
    • C08LCOMPOSITIONS OF MACROMOLECULAR COMPOUNDS
    • C08L5/00Compositions of polysaccharides or of their derivatives not provided for in groups C08L1/00 or C08L3/00
    • C08L5/10Heparin; Derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/14Fungi; Culture media therefor
    • C12N1/16Yeasts; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/14Fungi; Culture media therefor
    • C12N1/16Yeasts; Culture media therefor
    • C12N1/18Baker's yeast; Brewer's yeast
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0006Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/04Polysaccharides, i.e. compounds containing more than five saccharide radicals attached to each other by glycosidic bonds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/01Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
    • C12Y101/01022UDP-glucose 6-dehydrogenase (1.1.1.22)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/645Fungi ; Processes using fungi
    • C12R2001/85Saccharomyces
    • C12R2001/865Saccharomyces cerevisiae

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Mycology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • General Chemical & Material Sciences (AREA)
  • Virology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Botany (AREA)
  • Polymers & Plastics (AREA)
  • Materials Engineering (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明涉及肝素前体的生物生产领域。本领域需要允许肝素前体高效合成和分泌的肝素前体生产方法。本发明提出的技术方案是使用包含如本上下文所述的许多修饰的经遗传修饰的细胞。本发明还提出允许使用本发明的经遗传修饰的细胞生物生产具有受控分子量的肝素前体的方法。

Description

生产肝素前体的重组细胞
技术领域
本发明涉及肝素前体的生物生产领域。
背景技术
肝素前体也称为N-乙酰肝素前体,是肝素和硫酸乙酰肝素的天然真核生物合成前体,存在于从水螅到脊椎动物的动物中。更具体地,它是具有重复二糖单元[→4)β-D-葡萄糖醛酸(GlcA)(1→4)N-乙酰-a-D-葡萄糖胺(GlcNAc)(l→]n.的多糖。在自然界中,大肠埃希氏菌(Escherichia coli)K5和多杀巴斯德菌(Pasteurella multocida)D型菌株生产肝素前体作为荚膜多糖(Lindahl U.等人(1998)J.Biol.Chem.,273(39):24979-24982)。
来自肝素前体的衍生物结合至多种极其重要的多肽,包括止血因子(例如抗凝血酶III、凝血酶)、生长因子(例如EGF、VEGF)和趋化因子(例如IL-8、血小板因子4)以及病毒病原体(例如疱疹、登革热)的粘附蛋白。在这些衍生物中,肝素是最广泛使用的抗凝血剂或抗血栓药物之一,其可用于例如治疗性治疗血栓栓塞和弥散性血管内凝血(DIC)、体外循环和预防人工透析期间血液凝固。此外,最近的研究表明,肝素可具有显著的抗肿瘤活性,与其抗凝血活性不同并有差异,而其他研究则表明肝素在治疗炎症、不孕症和传染病中发挥作用。
当今已知的肝素主要来源是来自动物组织(例如猪肠粘膜)的提取物,伴随着掺杂和污染的风险。
用于从微生物体制备肝素前体的发酵方法特别令人感兴趣,因为它们有利于通过可能的规模化、以降低的成本生产大量肝素前体。此外,与从提供非常高分子量的肝素前体的动物源中分离肝素前体及其衍生物相反,微生物发酵允许在一定程度上控制起始分子量的大小。这避免了通过机械、物理或化学手段进行进一步分级分离步骤的需要。
为此,重组巨大芽孢杆菌(Bacillus megaterium)宿主细胞已显示出生产10至300KDa范围内肝素前体的能力(A.Williams等人Microb.Cell.Fact.2009年8月12日;18(1):132)。类似地,大肠埃希氏菌K5菌株显示出生产肝素前体的能力(Wang Z.等人(2010)Biotechnol.Bioeng.,107(6):964-973),但仍有许多问题有待解决,例如底物消耗率提高和发酵罐内氧气供应量增加。
与通常用于生产生物分子的其他微生物相比,酵母通常被认为是安全的。与细菌相比,它们可以快速生长并以更高的密度培养,并且不需要无菌环境。此外,酵母细胞比细菌更容易从培养基中分离,大大简化了产品提取和纯化的工艺。最后,酵母对培养基中pH变化具有更强耐受性的优势,并因此代表了更强的发酵系统。
然而,在酵母中,物种之间的区分特征也可能带来一定的挑战。这主要是由于物种之间新陈代谢的差异造成的。例如,巴斯德毕赤酵母(P.pastoris)中的基因组整合是稳定的,但通常会遇到来自一次转化的克隆的高度变异性,显示出各种生产力特征或生理学变化。这需要一个耗时的筛选过程,以便找到具有所想要应用的最佳特征的克隆。这种克隆变异性是巴斯德毕赤酵母作为用于生产增值化学品平台进一步发展的一个重要缺点。使用巴斯德毕赤酵母的另一个缺点是它是一种嗜甲烷菌生物体。
与之对比,酿酒酵母(Saccharomyces cerevisiae)作为生产目标分子的工具是特别有用的,因为它在被人使用(例如在葡萄酒、啤酒或面包中)方面具有悠久的安全史,并且其遗传信息是本领域众所周知的完善模型。酿酒酵母还具有被普遍认为对人和动物安全的优势。更重要的是,培养这种酵母时发生的培养基酸化降低了生物发酵罐污染的可能性,并因此无需向培养基中添加抗生素。最后,许多遗传工具已被开发出来,允许对其基因组进行稳定修饰(在染色体内整合)。
因此,本领域仍然需要允许肝素前体高效合成和分泌的另外的肝素前体生产方法。具体地,仍然需要提供具有成本效益的生产方法并提供对人应用安全的肝素前体。
在特定情况下,本领域仍然需要能够获得大量特定且受控尺寸的肝素前体的肝素前体生产方法。
发明内容
本发明因此涉及以下各项:
项1:一种生产肝素前体的重组酵母细胞,其中所述重组细胞包含:
(a)编码具有肝素前体合酶(HSS)活性的多肽的一种或多种重组核酸;和
(b)编码具有UDP-葡萄糖脱氢酶(UDP-GlcDH或HASB)活性的多肽的一种或多种重组核酸。
如实例中所示,本发明的重组酵母允许在不能天然生产肝素前体的酵母细胞中生产肝素前体。
所述有利特性可以通过将酵母与下文所述的额外修饰重组结合来进一步增强。
项2:根据项1所述的重组细胞,其中所述重组细胞包含编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的核酸,其中所述具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽包含分泌信号和任选的锚定信号。
项3:一种生产肝素前体的重组宿主细胞,其中所述重组细胞包含:
(a)编码具有肝素前体合酶(HSS)活性的多肽的一种或多种重组核酸;
(B)编码具有UDP-葡萄糖脱氢酶(UDP-GlcDH或HASB)活性的多肽的一种或多种重组核酸;和
(c)编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的一种或多种重组核酸,
其中具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽包含分泌信号和任选的锚定信号,使得肝素前体、特别是所想要分子量的肝素前体由宿主细胞生产。
项4:根据项2或3所述的重组细胞,其中编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的核酸获自或源自解肝磷脂土地杆菌(Pedobacter heparinus)。
项5:根据项2至4中任一项所述的重组细胞,其中编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的核酸在选自由以下组成的组的启动子的控制下:pTEF1、pCCW12、pCCW12.sba、pCCW12.Sar、pPDC1、pTEF3、pTDH3、pNUP57和pCCW10.ago。
项6:根据项2至5中任一项所述的重组细胞,其中所述肝素前体的分子量在小于50kDa的范围内,优选在约20kDa至约50kDa的范围内。
项7:根据项2至5中任一项所述的重组细胞,其中所述肝素前体的分子量在大于50kDa的范围内,优选在约50kDa至约250kD的范围内。
项8:根据项2至5中任一项所述的重组细胞,其中所述肝素前体的分子量在大于100kDa的范围内,优选在约100kDa至约1500kDa的范围内。
项9:根据项1至8中任一项所述的重组细胞,其中编码具有UDP-葡萄糖脱氢酶(UDP-GlcDH或HASB)活性的多肽的核酸获自或源自以下中的至少一者:拟南芥(Arabidopsis thaliana)、小球藻属病毒(Chlorella virus)PBCV1或兽瘟链球菌(Streptococcus zooepidemicus),并且特别来自拟南芥或小球藻属病毒PBCV1。
项10:根据项1至9中任一项所述的重组细胞,其中编码具有肝素前体合酶(HSS)活性的多肽的核酸获自或源自多杀巴斯德菌。
项11:根据项1至10中任一项所述的重组细胞,其中所述重组细胞还包含至少一种编码以下中的一者或多者的重组核酸:
(i)具有谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)活性的多肽;和/或
(ii)具有UDP-N-乙酰葡萄糖胺焦磷酸化酶(QRI1)活性的多肽。
项12:根据项1至11中任一项所述的重组细胞,其中所述重组细胞还包含至少一种编码以下中的一者或多者的重组核酸:
(i)具有磷酸葡萄糖变位酶-1(PGM1)活性的多肽;和/或
(ii)具有UTP-葡萄糖-1-磷酸尿苷酰转移酶(UGP1)活性的多肽;和/或
(iii)具有葡萄糖胺-6-磷酸N-乙酰转移酶(GNA1)活性的多肽;和/或
(iv)具有磷酸乙酰葡萄糖胺变位酶(PCM1)活性的多肽。
项13:根据项11或12所述的重组细胞,其中:
-编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)活性的多肽的核酸;和/或
-编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶(QRI1)活性的多肽的核酸;和/或
-编码具有磷酸葡萄糖变位酶-1(PGM1)活性的多肽的核酸;和/或
-编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶(UGP1)活性的多肽的核酸;和/或
-编码具有葡萄糖胺-6-磷酸N-乙酰转移酶(GNA1)活性的多肽的核酸;和/或
-编码具有磷酸乙酰葡萄糖胺变位酶(PCM1)的多肽的核酸;
得以获自或源自酿酒酵母。
项14:根据项3至13中任一项所述的重组宿主细胞,其中所述重组宿主细胞是酵母。
项15:根据项1至14中任一项所述的重组宿主细胞,其中所述重组细胞属于酵母属,或属于念珠菌属(Candida),或属于克鲁维酵母菌属(Kluyveromyces),或属于汉逊酵母属(Ogataea),或属于耶氏酵母属(Yarrowia),或属于德巴利酵母属(Debaryomyces),或属于阿舒囊霉属(Ashbya),并且特别是属于酵母属。
项16:根据项15所述的重组细胞,其中重组细胞选自由以下组成的组:酿酒酵母(Saccharomyces cerevisiae)、布拉氏酵母(Saccharomyces boulardii)、贝酵母(Saccharomyces bayanus)、奇异酵母(Saccharomyces paradoxus)、米卡酵母(Saccharomyces mikatae)、卡氏酵母(Saccharomyces castelli)、白念珠菌(Candidaalbicans)、光滑念珠菌(Candida glabrata)、热带念珠菌(Candida tropicalis)、乳酸克鲁维酵母(Kluyveromyces lactis)、马克斯克鲁维酵母(Kluyveromyces marxianus)、多孢克鲁维酵母(Kluyveromyces polysporus)、耐热克鲁维酵母(Kluyveromycesthermotolerens)、多形汉逊酵母(Ogataea polymorpha)、解脂耶氏酵母(Yarrowialypolytica)、汉逊德巴利酵母(Debaryomyces hansenii)和棉阿舒囊霉(Ashbyagossypii),并且优选酿酒酵母。
项17:一种生产肝素前体的方法,其包括:
(a)在培养基中培养如项1至16中任一项所定义的重组细胞持续足以生产肝素前体的时间;和
(b)任选地从所述重组细胞和/或从所述培养基分离或回收所述肝素前体。
项18:根据项17所述的方法,其中肝素前体的分子量为约20kDa至约50kDa。
项19:根据项17所述的方法,其中肝素前体的分子量为约50kDa至约150kDa。
项20:根据项17所述的方法,其中肝素前体的分子量为约150kDa至约1500kDa。
项21:根据项17至20中任一项所述的方法,其中所述重组细胞是属于酵母属的酵母,并且特别是酿酒酵母。
项22:根据项17至21中任一项所述的方法,其中所述足以生产肝素前体的时间是约35至约50小时、优选约40至约50小时、优选约48小时的时间段。
项23:根据项17至22中任一项所述的方法,其中所生产的肝素前体的分子量由步骤(a)期间调节培养基的pH来控制。
项24:根据项17至23中任一项所述的方法,其中所述方法以工业规模进行,优选地其中所述培养基是至少约100L,更优选地在约1000L至约3000L的范围内,甚至更优选约10,000L或甚至更优选约100,000L,或甚至约250,000L。
项25:可从根据项1至15中任一项所述的重组细胞获得或可从根据项17至24中任一项所述的方法获得的肝素前体。
项26:一种培养基,其包含根据项25所述的肝素前体。
项27:一种组合物,其包含根据项25所述的肝素前体。
项28:一种工业产品或消费产品或消费品,其包含(i)具有如项6至8中任一项所定义的分子量的根据项25所述的肝素前体,(ii)如项26所述的培养基或(iii)如项27所述的组合物。
项29:如项28所述的工业产品或消费产品或消费品,其中所述工业产品或消费产品或消费品是美容品、调味品、香料产品、食品、食物、饮料、食品定形剂、药物组合物、膳食补充剂、营养制品、清洁产品、牙科和/或口腔卫生组合物。
项30:如项1至116中任一项所定义的重组细胞用于生产具有约20kDa至约50kDa或约50kDa至约1000kDa范围内的分子量的肝素前体的用途。
本发明的某些实施方式可以提供以下优点中的一者或多者:
·一种用于生产受控分子量的肝素前体的方法;
·一种在酿酒酵母细胞中生产受控分子量的肝素前体的方法;和
·一种用于通过改变遗传参数(例如调控序列)和/或方法参数(pH或发酵时间)来生产受控分子量的肝素前体的方法。
附图说明
图1显示了用于生产肝素前体的示意性途径。
具体实施方式
序列概述
SEQ ID NO:1是源自多杀巴斯德菌的肝素前体合酶(HSS1)的重编码核酸序列。
SEQ ID NO:2是源自多杀巴斯德菌的肝素前体合酶(HSS2)的重编码核酸序列。
SEQ ID NO:3是源自多杀巴斯德菌的肝素前体合酶(HSS1)的氨基酸序列。
SEQ ID NO:4是源自多杀巴斯德菌的肝素前体合酶(HSS2)的氨基酸序列。
SEQ ID NO:5是源自拟南芥的UDP-葡萄糖脱氢酶(HASB)的核酸序列。
SEQ ID NO:6是源自小球藻属病毒PBCV-1的UDP-葡萄糖脱氢酶(HASB)的重编码核酸序列。
SEQ ID NO:7是源自小球藻属病毒PBCV-1的UDP-葡萄糖脱氢酶(HASB-A)的重编码核酸序列。
SEQ ID NO:8是源自拟南芥的UDP-葡萄糖脱氢酶(HASB)的氨基酸序列。
SEQ ID NO:9是源自小球藻属病毒PBCV1的UDP-葡萄糖脱氢酶(HASB)的氨基酸序列。
SEQ ID NO:10是具有N-末端分泌信号的源自解肝磷脂土地杆菌的葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶的重编码核酸序列。
SEQ ID NO:11是具有N-末端分泌信号和C-末端锚定信号的源自解肝磷脂土地杆菌的葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶的重编码核酸序列。
SEQ ID NO:12是具有N-末端分泌信号的源自解肝磷脂土地杆菌的葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶的重编码核酸序列。
SEQ ID NO:13是具有N-末端分泌信号和C-末端锚定信号的源自解肝磷脂土地杆菌的葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶的重编码核酸序列。
SEQ ID NO:14是具有N-末端分泌信号的源自解肝磷脂土地杆菌的葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶的氨基酸序列。
SEQ ID NO:15是具有N-末端分泌信号和C-末端锚定信号的源自解肝磷脂土地杆菌的葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶的氨基酸序列。
SEQ ID NO:16是源自酿酒酵母的谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)的核酸序列。
SEQ ID NO:17是源自小球藻属病毒1(PBCV-1)的谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)的重编码核酸序列。
SEQ ID NO:18是源自小球藻属病毒1(PBCV-1)的谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)的重编码核酸序列。
SEQ ID NO:19是源自酿酒酵母的谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)的氨基酸序列。
SEQ ID NO:20是源自小球藻属病毒1(PBCV-1)的谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)的氨基酸序列。
SEQ ID NO:21是源自酿酒酵母的UDP-N-乙酰葡萄糖胺焦磷酸化酶(QRI1)的核酸序列。
SEQ ID NO:22是源自酿酒酵母的UDP-N-乙酰葡萄糖胺焦磷酸化酶(QRI1)的氨基酸序列。
SEQ ID NO:23是源自酿酒酵母的磷酸葡萄糖变位酶-1(PGM1)的核酸序列。
SEQ ID NO:24是源自酿酒酵母的磷酸葡萄糖变位酶-1(PGM1)的氨基酸序列。
SEQ ID NO:25是源自酿酒酵母的UTP--葡萄糖-1-磷酸尿苷酰转移酶(UGP1)的核酸序列。
SEQ ID NO:26是源自酿酒酵母的UTP--葡萄糖-1-磷酸尿苷酰转移酶(UGP1)的氨基酸序列。
SEQ ID NO:27是源自酿酒酵母的葡萄糖胺6-磷酸N-乙酰转移酶(GNA1)的核酸序列。
SEQ ID NO:28是源自酿酒酵母的葡萄糖胺6-磷酸N-乙酰转移酶(GNA1)的氨基酸序列。
SEQ ID NO:29是源自酿酒酵母的磷酸乙酰葡萄糖胺变位酶(PCM1)的核酸序列。
SEQ ID NO:30是源自酿酒酵母的磷酸乙酰葡萄糖胺变位酶(PCM1)的氨基酸序列。
SEQ ID NO:31是启动子pTDH3的核酸序列。
SEQ ID NO:32是启动子pTDH3.Sk的核酸序列。
SEQ ID NO:33是启动子pTDH3-1.sba的核酸序列。
SEQ ID NO:34是启动子pTDH3.Sar的核酸序列。
SEQ ID NO:35是启动子pENO2的核酸序列。
SEQ ID NO:36是启动子pTEF3的核酸序列。
SEQ ID NO:37是启动子pTEF1的核酸序列。
SEQ ID NO:38是启动子pTEF1.ago的核酸序列。
SEQ ID NO:39是启动子pTEF1.Sba的核酸序列。
SEQ ID NO:40是启动子pPDC1的核酸序列。
SEQ ID NO:41是启动子pCCW12的核酸序列。
SEQ ID NO:42是启动子pCCW12.Sm的核酸序列。
SEQ ID NO:43是启动子pCCW12.Sk的核酸序列。
SEQ ID NO:44是启动子pCCW12.Sba的核酸序列。
SEQ ID NO:45是启动子pCCW12.Sar的核酸序列。
SEQ ID NO:46是启动子pNUP57的核酸序列。
SEQ ID NO:47是启动子pCCW10.ago的核酸序列。
SEQ ID NO:48是启动子pCWP2的核酸序列。
SEQ ID NO:49是启动子pCCW120.Sca的核酸序列。
SEQ ID NO:50是启动子pRPLA1的核酸序列。
SEQ ID NO:51是启动子pCUP1的核酸序列。
SEQ ID NO:52是启动子pMET6的核酸序列。
SEQ ID NO:53是启动子pMET25的核酸序列。
SEQ ID NO:54是启动子pSAM1的核酸序列。
SEQ ID NO:55是终止子tTPI1的核酸序列。
SEQ ID NO:56是终止子tMET25的核酸序列。
SEQ ID NO:57是终止子tDIT1的核酸序列。
SEQ ID NO:58是终止子tRPL3的核酸序列。
SEQ ID NO:59是终止子tRPL3.sm的核酸序列。
SEQ ID NO:60是终止子tRPL3.sba的核酸序列。
SEQ ID NO:61是终止子tRPL41B的核酸序列。
SEQ ID NO:62是终止子tRPL15A的核酸序列。
SEQ ID NO:63是终止子tRPL15A.sba的核酸序列。
SEQ ID NO:64是终止子tIDP1的核酸序列。
SEQ ID NO:65是终止子tTEF1.sba的核酸序列。
SEQ ID NO:66是在5’添加的分泌序列的核酸序列。
SEQ ID NO:67是在N末端添加的分泌序列的氨基酸序列。
SEQ ID NO:68是在3’添加的锚定序列的核酸序列。
SEQ ID NO:69是C末端添加的锚定序列的氨基酸序列。
本发明的详细描述
发明人设想了遗传修饰的细胞,并且尤其是遗传修饰的酵母,与亲本细胞相比并且尤其是与天然不能生产肝素前体的亲本酵母相比,其具有生产肝素前体的能力。
这些经遗传修饰的细胞在本说明书全文中进行了描述。
定义
术语“肝素前体(heparosan)”是一种多糖,即一种由[-4-N-乙酰葡萄糖胺-α1,4-葡萄糖醛酸-β1-]重复序列([→4)β-D-葡萄糖醛酸(GlcA)(1→4)N-乙酰-a-D-葡萄糖胺(GlcNAc)(l→]n)组成的聚合物。
肝素前体可以在重组细胞中生产。
如本文所用,术语“重组”当用于指代细胞时,表示该细胞已通过将内源和/或异源核酸或蛋白质引入细胞中或改变天然细胞,或该细胞源自如此修饰的细胞。因此,例如,重组细胞表达在细胞的天然(非重组)形式中未发现的基因或核酸,或以与其天然水平不同的水平表达天然(如内源)基因,或以与其天然水平不同的水平表达天然(如内源的)的额外或补充拷贝。
如本文所用,术语“重组”当用于指核酸或载体时,是通过本领域技术人员熟知的遗传工程化技术形成/获得的序列。美国国家卫生研究院(NIH)的指南相应指出:
“重组[…]核酸如下定义:
i.(a)由连接核酸分子构建,和(b)可以在活细胞中复制的分子,即重组核酸;”,
这反映了附加到核酸序列的词语“重组”的常规使用,意指在插入另一核酸或与另一核酸连接在一起之后重组。
由重组DNA或重组载体在活细胞内表达而生产的蛋白质也称为重组蛋白。
因此,术语“重组”与术语“遗传修饰”同义。术语“基因”与术语“核酸”或“核苷酸序列”同义。
用于本发明的重组细胞并且特别是重组酵母的重组核酸序列可以以核酸构建体的形式提供。术语“核酸构建体”是指单链或双链的核酸分子,其经分离或源自天然(例如内源)天然存在的基因或是异源核酸,或者已被修饰为含有以自然界中不以其他方式存在的方式组合和并置的核酸片段。当核酸构建体含有表达编码序列所需的一个或多个调控元件时,术语“核酸构建体”与术语“表达盒”或“异源核酸表达盒”同义,其中所述控制序列可操作地连接至所述编码序列。调控元件的非限制性实例包括启动子、增强子、沉默子、终止子和聚-A信号。
用于本发明的重组细胞的重组核酸序列可以以表达载体的形式提供,其中多核苷酸序列可操作地连接至至少一个用于在重组细胞中表达多核苷酸序列的控制序列。
术语“获自”或“源自(originate from)”或“源自(originating from)”微生物或动物一般意指源自微生物体或动物的物质(例如,核酸分子或多肽)是该微生物或动物天然的。
术语“源自”微生物体或动物一般意指源自微生物体或动物的物质(例如,核酸分子或多肽)是对该微生物体或动物中天然的(即本身存在的)物质进行修饰的结果。例如,关于源自微生物或动物的核酸序列,所述核酸序列可以对应于来自该微生物体或动物的天然核酸序列的重编码和/或截短版本。可以对微生物或动物的天然物质进行本领域技术人员熟知的其他修饰,从而导致所使用的物质“源自”所述微生物体或动物。
如本文所用,术语“多肽”是指包含通过肽键连接的氨基酸残基并且含有多于五个氨基酸残基的分子。氨基酸通过单字母或三字母名称来识别。如本文所用的术语“蛋白质”与术语“多肽”同义,并且也可以指两种或更多种多肽。因此,术语“蛋白质”、“肽”和“多肽”可以互换使用。多肽可以任选地被修饰(例如,糖基化、磷酸化、酰化、法呢基化、异戊二烯化、磺化等)以添加功能性。表现出活性的多肽可称为酶。应理解,由于遗传密码的简并性,可以生产编码给定多肽的大量核苷酸序列。
由用于本发明的重组细胞并且特别是重组酵母的重组核酸编码的多肽可以包含信号肽和/或前肽序列。在由本发明的重组细胞、特别是重组酵母表达的多肽包含信号肽和/或前肽的情况下,可以在成熟多肽序列上计算序列同一性。
如本文使用的术语“可操作地连接”是指两个或更多个核酸序列元件物理连接并且彼此处于功能关系。例如,如果启动子能够启动或调控编码序列的转录或表达,则启动子可操作地连接至编码序列,在这种情况下,编码序列应理解为“在启动子的控制下”。一般而言,当两条核酸序列可操作地连接时,它们将处于相同的方向并且通常也在相同的阅读框中。它们通常基本上是连续的,尽管这可能不是必需的。
如本文所用的术语“天然”或“内源”就分子而言并且特别是酶和核酸,表示在它们起源或在自然界中发现的生物体中表达的分子。
术语“内源基因”意指在任何遗传修饰之前,该基因存在于野生型菌株的细胞中。内源基因可以通过引入异源序列以补充内源调控元件或替代内源调控元件,或者通过将基因的一个或多个额外或补充拷贝引入染色体或质粒中来过表达(所述额外或补充拷贝被指定为如本文所定义的“外源或异源基因”或“异源核苷酸序列”或“异源核酸”)。还可以修饰内源基因以调节它们的表达和/或活性。例如,可将突变引入编码序列以修饰基因产物,或者可引入异源序列补充内源调控元件,或替代内源性调控元件。内源基因的调节可以导致基因产物活性的上调和/或增强,或者替选地,导致内源基因产物活性的下调和/或减弱。增强内源基因表达的另一种方法是将基因的一个或多个附加或补充拷贝引入染色体或质粒上(所述补充拷贝被指定为如本文所定义的“外源或异源基因”或“异源核苷酸序列”或异源核酸)。
对于根据本发明的“基因的一个或多个附加或补充拷贝”,其在本发明中被理解为例如1至50个拷贝,特别是1至30个拷贝,更特别是1至20个拷贝,并且优选1至10个拷贝。所述拷贝可以插入到本发明的重组细胞的相同基因座或不同基因座中。
术语“外源性基因”意指通过本领域技术人员熟知的方式将基因引入细胞中,而该基因天然存在于或不天然存在于野生型细胞中。如果将外源基因连同允许其在细胞中表达的所有元件一起引入细胞,则细胞可以表达这些基因。用外源DNA转化细胞是本领域技术人员的常规任务。外源基因可以整合到宿主染色体中,或者从质粒或载体在染色体外表达。多种质粒在其复制起点和其在细胞中的拷贝数方面有所不同,都是本领域已知的。外源基因的序列可以适应其在细胞中的表达。事实上,本领域技术人员知道密码子使用偏倚的概念以及如何在不修改推导的蛋白质的情况下使核酸序列适应特定的密码子使用偏倚。在具体的实施方式中,密码子优化的基因表达天然酶。
术语“异源基因”或“异源核酸序列”是指自然界中给定细胞中通常不存在的基因或核酸序列。因此,异源核酸序列可以是:(a)对于其宿主细胞是外源的(即对于细胞来说是“外源的”);(b)天然存在于宿主细胞(即“内源的”)中但在细胞中以非天然量存在(即,比宿主细胞中天然存在更多或更少的量);或(c)天然存在于宿主细胞中,但位于其天然基因座之外。
在本申请中,所有基因都以它们的通用名称和它们的核苷酸序列以及在出现的情况下它们的氨基酸序列来提及。使用已知基因的登录号中给出的参考文献,本领域技术人员能够确定其他生物体、细菌菌株、酵母、真菌、哺乳动物、植物等中的等效基因。该常规工作有利地使用共有序列来完成,其可以通过与来源于其他细胞的基因进行序列比对并设计简并探针以在另一个生物体中克隆相应基因来确定。
本领域技术人员知道调节并且特别是上调或下调内源基因表达的不同方法。例如,增强内源基因表达或过表达的一种方法是将基因的一个或多个附加或补充拷贝引入染色体或质粒上。
另一种方法是用更强的启动子替换基因的内源启动子。这些启动子可以是同源的或异源的。本发明中具体的目标启动子在本说明书的其他地方进行了更详细的描述。
核酸表达构建体还可包含5'和/或3’识别序列和/或选择标记。
术语“诱导型启动子”用于限定其活性被诱导(即增加)的启动子:
-在一种或多种特定代谢物的存在下。培养基中代谢物浓度越高,启动子活性越强;或
-在存在低浓度或不存在一种或多种代谢物的情况下。这些代谢物不同于那些其增加的存在诱导启动子活性的代谢物。培养基中代谢物浓度越低,启动子活性越强。
术语“阻遏型启动子”用于限定其活性被阻遏(即减少)的启动子:
-在一种或多种特定代谢物的存在下。培养基中代谢物浓度越高,启动子活性越弱;或
-在存在低浓度或不存在一种或多种代谢物的情况下。这些代谢物不同于那些其增加的存在阻遏子活性的代谢物。培养基中代谢物浓度越低,启动子活性越弱。
如本文所用,术语“锚定信号”当与蛋白质或多肽例如酶(例如具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽)结合使用时,意指例如可操作地连接至编码蛋白质或多肽的第二核酸的编码蛋白质的第一核酸,或可操作地连接至第二蛋白或多肽的第一蛋白或多肽、例如酶(例如具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽以形成例如融合蛋白),并且使得细胞(特别是酿酒酵母细胞)的细胞转运机制能够将可操作地连接至第一蛋白的第二蛋白正确锚定和/或定位在细胞的膜内。
如本文所用,术语“分泌信号”当与蛋白质或多肽例如酶(例如具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽)联合使用时,意指例如可操作地连接至编码蛋白质的第二核酸的编码肽或蛋白质的第一核酸,或连接至第二蛋白的第一蛋白、例如酶(例如具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽以形成例如融合蛋白),并且使得细胞(特别是酿酒酵母细胞)的细胞转运机制能够将至少第二蛋白质定位至细胞膜,并且在例如第一蛋白质已从第二蛋白质裂解之后将第二蛋白质分泌到细胞外。
如本文所用,术语“分泌信号”和“锚定信号”当与蛋白质或多肽例如酶(例如具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽)结合使用时,意指例如可操作地连接至编码蛋白质的第二核酸的编码肽或蛋白质的第一核酸,或可操作地连接至第二蛋白的第一蛋白、例如酶(例如具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽),并且使得细胞(特别是酿酒酵母细胞)的细胞转运机制能够将至少第二蛋白定位至细胞膜,其中如果第二蛋白还可操作地连接至“锚定信号”,则第二蛋白不分泌但保留附着至细胞膜。在一些情况下,分泌-锚定信号可以提供双重分泌信号和锚定信号功能。
分泌和锚定信号的序列,用于异源蛋白的表达、锚定和/或分泌的方法,例如细胞(例如酵母细胞)表面上的酶(例如葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶)是本领域众所周知的(参见例如,Ast等人(2013)Cell 152:1134-1145,Ast和Schuldiner(2013)CritRev Biochem Mol Biol 48(3)273-288,Van der Vaart等人(1997)AppliedEnvironmental Microbiology 63(2)615-620以及这些出版物中每一篇的全部内容通过引用并入本文)。
酶的“活性”与术语“功能”可互换使用,并且在本发明的上下文中指酶催化所想要反应的能力。宿主细胞中酶的量可以通过修饰编码酶的基因的转录来改变。这可以例如通过修饰编码酶的核苷酸序列的拷贝数来实现(例如,通过使用包含核苷酸序列的更高或更低拷贝数的表达载体,或通过将核苷酸序列的附加拷贝引入宿主细胞的基因组中,或通过缺失或破坏宿主细胞的基因组中的核苷酸序列),通过改变操纵子的多顺反子mRNA上的编码序列的顺序或将操纵子分解成单独的基因(每个基因具有其自己的控制元件),或通过增加与核苷酸序列可操作地连接的启动子或操纵子的强度。
替选地或另外,可以通过改变编码酶的mRNA的翻译水平来改变宿主细胞中酶的拷贝数。这可以通过例如修饰mRNA的稳定性、修饰核糖体结合位点的序列、修饰核糖体结合位点与酶编码序列的起始密码子之间的距离或序列、修饰位于酶编码区的起始密码子的5’侧上游或附近的整个顺反子间区域、使用发夹和特殊序列来稳定mRNA转录本的3’-端、修改酶的密码子使用、改变酶的生物合成中所用稀有密码子tRNA的表达,和/或增加酶的稳定性(例如经由其编码序列的突变)来实现。
宿主细胞中酶的活性可以通过多种方式改变,包括但不限于表达在宿主细胞中表现出增加或降低的溶解度的修饰形式的酶、表达缺乏结构域(通过其酶活性得以抑制)的改变形式的酶,表达对底物具有更高或更低的Kcat或更低或更高的Km的修饰形式的酶,或者表达受途径中另一个分子的反馈或前馈调节的影响较多或较少的改变形式的酶。
术语“编码”或“编码”是指多核苷酸通过转录和翻译机制生产氨基酸序列的过程。
编码本发明所考虑的一种或多种酶的一种或多种基因可以是外源的或内源的。
本发明中实施的方法优选需要使用一种或多种染色体整合构建体,用于将异源核苷酸序列稳定引入染色体上的特定位置,或用于功能性破坏遗传修饰细胞中的一种或多种靶基因。在一些实施方式中,靶基因的破坏阻止相关功能蛋白的表达。在一些实施方式中,靶基因的破坏导致被破坏的基因表达无功能的蛋白质。
可以在本发明的实践中改变的染色体整合构建体的参数包括但不限于同源序列的长度;同源序列的核苷酸序列;整合序列的长度;整合序列的核苷酸序列;以及靶基因座的核苷酸序列。在一些实施方式中,每条同源序列的长度的有效范围为20至5,000个碱基对,优选地50至100个碱基对。在具体实施方式中,每个同源序列的长度为约50个碱基对。有关基因靶标所需同源长度的更多信息,请参见D.Burke等人,Methods in yeastGeneticsAcold spring harbor laboratory course Manual(2000)。
在一些实施方式中,(a)其中意欲插入一种或多种上述DNA构建体的一种或多种破坏的基因可以有利地包含可用于选择转化细胞的一种或多种可选择标记。优选地,所述一种或多种可选标记包含在根据本发明的一种或多种DNA构建体中。
在一些实施方式中,可选择标记是抗生素抗性标记。抗生素抗性标记的说明性实例包括但不限于NAT1、AURl-C、HPH、DSDA、KAN<R>和SH BLE基因产物。来自诺尔斯链霉菌的NAT 1基因产物赋予对诺尔丝菌素的抗性;来自酿酒酵母的AURl-C基因产物赋予对金担子素A(AbA)的抗性;肺炎克雷伯菌的HPH基因产物赋予对潮霉素B的抗性;大肠埃希菌的DSDA基因产物允许细胞在以D-丝氨酸为唯一氮源的板上生长;Tn903转座子的KAN<R>基因赋予对G418的抗性;和来自印度斯坦链异壁菌(Streptoalloteichus hindustanus)的SH BLE基因产物赋予对吉欧霉素(博莱霉素)的抗性。
在一些实施方式中,在分离本发明的经遗传修饰细胞后缺失抗生素抗性标记。本领域技术人员能够在特定的遗传背景下选择合适的标记。
在具体实施方式中,根据本发明的重组细胞缺乏任何抗生素抗性标记。这有利地避免了在选择培养基中添加抗生素的必要性。
在一些实施方式中,可选择标记拯救遗传修饰细胞中的营养缺陷(例如,营养性营养缺陷)。在此类实施方式中,亲本细胞并且特别是亲本酵母包含在氨基酸或核苷酸生物合成途径中起作用的一种或多种基因产物的功能破坏,例如酵母中的HIS3、LEU2、LYS1、LYS2、MET15、TRP1、ADE2和URA3基因产物,这使得亲本细胞无法在不补充一种或多种营养素的情况下在培养基中生长(营养缺陷型表型)。然后可以通过转化具有编码被破坏的基因产物的功能性拷贝的染色体整合的亲本细胞来拯救营养缺陷型表型(在一些实施方式中,基因的功能性拷贝可以源自相近的物种,例如克鲁维酵母属、念珠菌属等),并且可以根据亲本微生物细胞的营养缺陷型表型的丧失来选择所生产的遗传修饰细胞。
对于包含启动子序列、编码序列(例如编码序列的酶)或终止子序列的核酸序列中的每一个,参考序列在本文中描述。本说明书还涵盖与参考核酸序列具有特定百分比的核酸同一性的核酸序列。
对于每个目标氨基酸序列,本文描述了参考序列。本说明书还涵盖了与参考氨基酸序列具有特定百分比的氨基酸同一性的氨基酸序列(例如酶氨基酸序列)。
由于明显的原因,在所有本说明书中,分别符合所考虑的核苷酸或氨基酸同一性的特定核酸序列或特定氨基酸序列应当进一步导致获得显示出所想要生物活性的蛋白质(或酶)。如本文所用,两条核酸序列之间或两条氨基酸序列之间的“同一性百分比”通过通过比较窗口比较两个最佳比对的序列来确定。
因此,与参考序列(其不包括这些添加或这些缺失)相比,比较窗口中的核苷酸或氨基酸序列的部分可以包括添加或删除(例如“空位”),以获得两条序列之间的最佳比对。
术语“序列同源性”或“序列同一性”或“同源性”或“同一性”在本文中可互换使用。为了本发明的目的,这里定义为了确定两条氨基酸序列或两条核酸序列的序列同源性或序列同一性的百分比,为了最佳比较的目的而对序列进行比对。为了优化两条序列之间的比对,可以在所比较的两条序列中的任一个中引入空位。这种比对可以在被比较的序列的全长上进行。替选地,比对可以在较短的长度上进行,例如在约20、约50、约100或更多个核酸/碱基或氨基酸上进行。序列同一性是两条序列在报告的比对区域中相同匹配的百分比。
序列的比较和两条序列之间序列同一性百分比的确定可以使用数学算法来完成。技术人员将意识到以下事实:可使用几种不同的计算机程序来比对两条序列并确定两条序列之间的同一性(Kruskal,J.B.(1983)An overview of sequence comparison InD.Sankoff和J.B.Kruskal,(编辑),Time warps,string edits and macromolecules:thetheory and practice of sequence comparison,第1-44页Addison Wesley)。
两条氨基酸序列之间或两条核苷酸序列之间的序列同一性百分比可以使用用于两条序列比对的Needleman和Wunsch算法来确定。(Needleman,S.B.和Wunsch,C.D.(1970)J.Mol.Biol.48,443-453)。氨基酸序列和核苷酸序列都可以通过该算法进行比对。Needleman-Wunsch算法已在计算机程序NEEDLE中实现。
对于本发明的目的,使用来自EMBOSS包的NEEDLE程序(2.8.0版本或更高版本,EMBOSS:The European Molecular Biology Open Software Suite(2000)Rice,P.LongdenJ.和Bleasby,A.Trends in Genetics 16,(6)pp276—277,http://emboss.bioinformatics.nl/)。对于蛋白质序列,EBLOSUM62用于替换矩阵。对于核苷酸序列,使用EDNAFULL。使用的任选参数是空位开放罚分10和空位延伸罚分0.5。不添加末端空位罚分。在输出部分中,响应于指示为输出比对格式的问题“简要同一性和相似性”和“SRS成对”被指示“是”。
在通过如上所述的程序NEEDLE比对之后,查询序列和本发明的序列之间的序列同一性百分比计算如下:比对中显示两条序列中相同氨基酸或相同核苷酸的相应位置的数量除以比对总长度(减去比对中的总空位数后)。如本文定义的同一性可以通过使用NOBRIEF选项从NEEDLE获得,并在程序的输出中标记为“最长-同一性”。
核苷酸和氨基酸序列的相似性,即序列同一性的百分比,可以经由使用几种其他本领域已知的算法的序列比对来确定,优选地用Karlin和Altschul的数学算法(Karlin&Altschul(1993)Proc.Natl.Acad.Sci.USA90:5873-5877)、用hmmalign(HMMER包,http://hmmer.wustl.edu/)或用CLUSTAL算法(Thompson,J.D.,Higgins,D.G.&Gibson,T.J.(1994)Nucleic Acids Res.22,4673-80)(例如可在https://www.ebi.ac.uk/Tools/msa/clustalo/上获得),或GAP程序(爱荷华大学的数学算法),或Myers和Miller的数学算法(1989-Cabios 4:11-17)或Clone Manager 9。所用的优选参数是如在https://www.ebi.ac.uk/Tools/msa/clustalo/上设置的默认参数。
序列同一性(序列匹配)的级别可使用如BLAST、BLAT或BlastZ(或BlastX)来计算。将类似算法并入Altschul等人(1990)J.Mol.Biol.215,403-410的BLASTN和BLASTP程序。使用BLASTN程序,评分=100,字长=12进行BLAST多核苷酸搜索,以获得与编码相关蛋白质的那些核酸同源的多核苷酸序列。
使用BLASTP程序,评分=50,字长=3进行BLAST蛋白搜索,以获得与SHC多肽同源的氨基酸序列。为了获得用于比较目的的缺口比对,如Altschul等人(1997)Nucleic AcidsRes.25,3389-3402中所述,使用Gapped BLAST。当使用BLAST和Gapped BLAST程序时,使用各个程序的默认参数。序列匹配分析可以通过已建立的同源作图技术来补充,如Shuffle-LAGAN(Brudno M.,Bioinformatics 2003b,19Suppl 1:154-162)或马尔可夫随机场。当在本申请中提及序列同一性的百分比时,如果没有另外具体说明,则这些百分比是相对于较长序列的全长来计算的。
在具体的实施方式中,使用CLUSTAL O(1.2.4版)确定两条序列之间的同一性%。
“发酵”或“培养”通常在具有适合于培养细胞的含至少一种简单碳源并且如果必需则共底物的适当培养基的发酵罐中进行。
术语“发酵组合物”是指包含遗传修饰的宿主细胞和由遗传修饰的宿主细胞生产的产物或代谢物的组合物。发酵组合物的实例是全细胞培养液,其可以是容器(例如烧瓶、板或发酵罐)的全部内容物,包括细胞、水相和由遗传修饰的宿主细胞生产的化合物。
术语“培养基”是指培养基(culture medium)或培养基(cultivation medium)或发酵培养基。
为了最大限度地生产肝素前体,用作生产宿主的重组细胞优选具有高碳水化合物利用率。这些特征可以通过诱变和选择、遗传工程化赋予的,或可以是天然的。本发明细胞的发酵培养基或“培养基”或“培养基”可含有至少约10g/L的葡萄糖和/或蔗糖。另外的碳底物可以包括但不限于单糖,例如果糖、甘露糖、木糖和阿拉伯糖;寡聚糖,例如乳糖、麦芽糖、半乳糖或蔗糖;多糖,例如淀粉或纤维素或其混合物,以及来自可再生原料的未纯化混合物,例如奶酪乳清渗透玉米浆、甜菜糖蜜和大麦麦芽。其他碳底物可以包括甘油、乙酸酯和/或乙醇。
因此,预期本发明中使用的碳源可以涵盖多种含碳底物并且仅受细胞并且特别是酵母的选择的限制。
尽管预期所有上述碳底物及其混合物都适用于本发明,但对于细胞而言,优选的碳底物是葡萄糖、果糖和蔗糖,或这些与C5糖例如木糖和/或阿拉伯糖的混合物,并且特别是酵母,被修饰以使用C5糖,并且更特别是葡萄糖。
优选的碳底物是葡萄糖或蔗糖。
除了适当的碳源之外,发酵培养基还可含有本领域技术人员已知的合适的矿物质、盐、辅因子、缓冲剂和其他组分,其适用于培养物的生长和促进生产所想要产品所必需的酶促途径。
除此之外,可以考虑适合于根据本发明的重组细胞生长的额外遗传修饰。
术语“需氧条件”是指培养基中的氧浓度足以使需氧或兼性厌氧细胞并且特别是酵母使用双氧作为末端电子受体。
“微好氧条件”是指氧气浓度低于空气中的浓度(即氧气浓度至多6% O2)的培养基。
“适当的培养基”表示包含对细胞的维持和/或生长必需的或有益的营养物的培养基(如无菌液体培养基),所述营养物例如碳源或碳底物、氮源,例如蛋白胨、酵母提取物、肉类提取物、麦芽提取物、脲、硫酸铵、氯化铵、硝酸铵和磷酸铵;磷源,例如磷酸二氢钾或磷酸氢二钾;微量元素(如金属盐),例如镁盐、钴盐和/或锰盐;以及生长因子例如氨基酸、维生素、生长促进剂等。根据本发明的术语“碳源”或“碳底物”或“碳来源”表示本领域技术人员可以使用以支持细胞正常生长的任何碳源,包括己糖(例如葡萄糖、半乳糖或乳糖)、戊糖、单糖、寡糖、二糖(例如蔗糖、纤维二糖或麦芽糖)、糖蜜、淀粉或其衍生物、纤维素、半纤维素及其组合。
具体适合生产本发明的重组细胞并且特别是本发明的重组酵母的培养基在下文中进一步更详细地描述。
本发明的肝素前体的“受控”分子量意在指代至少80%、特别是至少85%的通过本发明的方法生产的肝素前体具有通过调节本发明的方法和/或重组细胞的至少一个参数而包含在预定分子量范围内的分子量,例如:
-重组细胞的编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的核酸的性质和来源,
-控制重组细胞的编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的核酸的表达的启动子的性质和来源,
-重组细胞的与具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的编码多肽相关的锚定和/或分泌信号的存在,
-培养重组细胞的步骤期间的培养基的pH,和/或
-培养重组细胞的持续时间。
如本文所用,术语“约”是指如有技术人员所确定的围绕值的合理范围。在某些实施方式中,术语约是指±一个、两个或三个标准偏差。在某些实施方式中,术语约是指±5%、10%、20%或25%。在某些实施方式中,术语约是指±0.1、0.2或0.3对数单位,例如pH单位。
根据本发明引入的遗传修饰的一般特征
-根据已知的遗传工程化技术,将所有基因组修饰插入重组细胞,并且特别是重组酵母中:
-引入到根据本发明的重组细胞基因组中的基因构建体中包含的连续核酸序列具有以下结构:
Prom1-ORF1-term1-ORF2-gene2-term2-…/…-Promn-ORFn-termn,其中:
-Prom1是调控编码序列ORF1的表达的序列,
-ORF1是编码所需蛋白质PROT1且尤其是所需酶PROT1的核酸序列,
-Term1是转录终止子序列,通过在新合成的mRNA中提供信号来介导转录终止,该信号触发从转录复合物中释放mRNA的过程,并且
-“1”、“2”、…/…“n”可能描述或可能不描述相同的ORF(开放阅读框)、启动子或终止子。核酸序列的顺序并不重要。“n”是一个整数,通常在5到20之间。这些构建体被插入重组细胞染色体之一的受控位置中。在一些实施方式中,插入位点对于所插入的构建体的功能性和所得到的遗传修饰细胞的存活力都不是必需的。
如本领域技术人员将理解的,修饰编码序列以增强其在特定宿主中的表达可能是有利的。遗传密码冗余64个可能密码子,但大多数生物体通常使用这些密码子的子集。在一个物种中最常使用的密码子称为最佳密码子,而那些不经常使用的密码子被归类为稀有或低使用密码子。密码子可以在有时称为“密码子优化”或“控制物种密码子偏倚”的过程中,被替换以反映宿主的优选密码子使用。其他宿主细胞的密码子优化可以使用密码子使用表轻松确定,或可以使用可商够获得的软件进行,例如来自Integrated DNA Technologies的CodonOp(www.idtdna.com/CodonOptfrom)。可以制备含有特定原核或真核宿主优选的密码子的优化编码序列(Murray等人,1989,Nucl Acids Res.17:477-508),以例如增加翻译速率或生产具有所想要特征的重组RNA转录物,例如与非优化序列生产的转录本相比更长的半衰期。翻译终止密码子也可以被修饰以反映宿主偏好。例如,酿酒酵母和哺乳动物的典型终止密码子分别是UAA和UGA。单子叶植物的典型终止密码子是UGA,而昆虫和大肠埃希菌通常使用UAA作为终止密码子(Dalphin等人,1996,Nucl Acids Res.24:216-8)。
-当重组细胞是酵母细胞并且特别是酿酒酵母酵母细胞时,引入酵母基因组中并且源自除酿酒酵母之外的其他生物体的核酸序列通常是“转码的”(通常是“密码子优化的”),这意味着这些核酸序列是用在酿酒酵母中表达的最佳密码子使用合成的。来自酿酒酵母的一些核酸序列的核苷酸序列(而非蛋白质序列)也已被修饰(“转码”)以最小化与所述基因的内源拷贝的重组。
-可以通过细胞遗传工程化中使用的标准程序缺失基因。在一些实施方式中,可以通过插入上述基因构建体中的一者来中断靶向缺失的基因,或者替选地,靶向缺失的基因被短核苷酸片段替代。
-通过缺失核酸序列的内源拷贝(如果必需)并将ORF的新拷贝置于诱导型或抑制型启动子的控制下,可以使核酸序列成为“诱导型或抑制型”。诱导型或阻遏型启动子是其活性根据环境条件或外部刺激的变化而被调节或控制(即增加或减少)的启动子。诱导或阻遏可以是人工控制的,其涵盖非生物因素的诱导或阻遏,例如目标细胞并且特别是酵母中天然未存在的化学化合物、光、氧水平、热或冷。诱导型或阻遏型启动子的列表和序列在本说明书的其他地方描述。
根据本发明的重组细胞
发明人设想了具有生产肝素前体的能力的重组细胞,并且尤其是重组酵母。
本发明涉及具有生产肝素前体的能力的重组细胞并且尤其是重组酵母,并且其中这种生产肝素前体的能力是通过通过经由遗传工程化方法已引入其基因组中的多个改变而获得的。
本发明涉及生产肝素前体的重组酵母细胞,其中重组细胞包含:
(a)编码具有肝素前体合酶(HSS)活性的多肽的一种或多种重组核酸;和
(b)编码具有UDP-葡萄糖脱氢酶(UDP-GlcDH或HASB)活性的多肽的一种或多种重组核酸。
本发明还涉及一种生产肝素前体的重组宿主细胞,其中所述重组细胞包含:
(a)编码具有肝素前体合酶(HSS)活性的多肽的一种或多种重组核酸;
(b)编码具有UDP-葡萄糖脱氢酶(UDP-GlcDH或HASB)活性的多肽的一种或多种重组核酸;和
(c)编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的一种或多种重组核酸,
其中具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽包含分泌信号和任选的锚定信号,使得肝素前体、尤其是具有所想要分子量的肝素前体由宿主细胞生产。
发明人已经发现,通过在这些细胞的基因组中引入多个遗传改变,可以达到由细胞并且尤其是酵母细胞生产肝素前体的能力。
本发明的细胞并且尤其是本发明的酵母细胞生产肝素前体,通过优化UDP-葡萄糖和任选的UDP-N-乙酰-葡萄糖胺的内源代谢来实现,并且指导随后的人工修饰的代谢途径主要朝向肝素前体生产,同时保持所得遗传修饰的细胞的最佳存活力。
已经确定,由根据本发明的重组细胞的肝素前体生产可以通过增加葡萄糖-6-磷酸转化为以下连续中间代谢物来增加:(i)葡萄糖-1-磷酸、UDP-葡萄糖、UDP-葡萄糖醛酸/盐(UDP-Glucuronate)和肝素前体,和(ii)果糖-6-磷酸、葡萄糖胺-6-磷酸、N-乙酰-葡萄糖胺-6-磷酸、N-乙酰-葡萄糖胺-1-磷酸、UDP-N-乙酰-葡萄糖胺和肝素前体,同时保持平衡使所得重组细胞具有良好的存活力。
事实上,为了获得本发明的活的重组细胞,测试了许多不同的构建体以获得活的且有效的重组细胞,并且特别是活的重组酵母。特别地,此类重组酵母难以获得,因为一些中间体的暂时积累显示出对酵母有毒。
在建立适用于制备能够生产肝素前体并且特别是生产具有受控分子量的肝素前体的重组细胞的条件时遇到了意想不到的技术困难。
本发明的肝素前体的“受控”分子量意在指代至少80%、特别是至少85%的通过本发明的方法生产的肝素前体具有通过调节本发明的方法和/或重组细胞的至少一个参数来包含在某些分子量范围内的分子量,例如:
-重组细胞的编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的核酸的性质和来源,
-控制重组细胞的编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的核酸的表达的启动子的性质和来源,
-重组细胞的与具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽相关的锚定和/或分泌信号的存在。
-培养重组细胞的步骤期间的培养基的pH,和/或
-培养重组细胞的持续时间。
事实上,经过大量研究和实验试验,本发明人发现可以培养重组细胞并且特别是重组酵母细胞,更特别是重组酿酒酵母酵母细胞,其能够生产具有受控分子量(使用以下参数控制)的肝素前体:
-本发明的重组细胞、特别是重组酵母的编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的核酸序列的性质和来源的选择;和/或
-本发明的重组细胞、特别是重组酵母的控制编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的核酸序列的表达的启动子的性质和来源;和/或
-除了分泌信号之外,根据本发明的重组细胞、特别是重组酵母的与具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的编码多肽相关的任选存在的锚定信号;和/或
-根据本发明的重组细胞、特别是重组酵母的培养步骤期间培养基的pH;和/或
-培养根据本发明的重组细胞、特别是重组酵母细胞的持续时间。
据发明人所知,这是以前从未实现过的。
编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的核酸获自或源自解肝磷脂土地杆菌。
编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的核酸可以在选自由以下组成的组的启动子的控制下:pTEF1、pCCW12、pCCW12.sba、pCCW12.Sar、pPDC1、pTEF3、pTDH3、pNUP57和pCCW10.ago。
肝素前体的分子量可以在小于50kDa的范围内,优选在约20kDa至约50kDa的范围内。
替选地,肝素前体的分子量可以在大于50kDa的范围内,优选在约50kDa至约250kD的范围内。
在另一个替选方案中,肝素前体的分子量可以在大于100kDa的范围内,优选在约100kDa至约1500kDa的范围内。
编码具有UDP-葡萄糖脱氢酶(UDP-GlcDH或HASB)活性的多肽的核酸可获自或源自以下中的至少一者:拟南芥、小球藻属病毒PBCV1或兽瘟链球菌,并且可以特别源自拟南芥或小球藻属病毒PBCV1。
编码具有肝素前体合酶(HSS)活性的多肽的核酸可获自或源自多杀巴斯德菌。
根据本发明的重组细胞还可以包含编码以下中的一者或多者的至少一种重组核酸:
(i)具有谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)活性的多肽;和/或
(ii)具有UDP-N-乙酰葡萄糖胺焦磷酸化酶(QRI1)活性的多肽。
根据本发明的重组细胞还可以包含至少一种编码以下中的一者或多者的重组核酸:
(i)具有磷酸葡萄糖变位酶-1(PGM1)活性的多肽;和/或
(ii)具有UTP-葡萄糖-1-磷酸尿苷酰转移酶(UGP1)活性的多肽;和/或
(iii)具有葡萄糖胺-6-磷酸N-乙酰转移酶(GNA1)活性的多肽;和/或
(iv)具有磷酸乙酰葡萄糖胺变位酶(PCM1)活性的多肽。
根据本发明的重组细胞还可以使得:
-编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)活性的多肽的核酸;和/或
-编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶(QRI1)活性的多肽的核酸;和/或
-编码具有磷酸葡萄糖变位酶-1(PGM1)活性的多肽的核酸;和/或
-编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶(UGP1)活性的多肽的核酸;和/或
-编码具有葡萄糖胺-6-磷酸N-乙酰转移酶(GNA1)活性的多肽的核酸;和/或
-编码具有磷酸乙酰葡萄糖胺变位酶(PCM1)的多肽的核酸;
获自或源自酿酒酵母。
本发明的重组宿主细胞可特别是酵母。
本发明的重组细胞可以是属于酵母属、或属于念珠菌属、或属于克鲁维酵母属、或属于汉逊酵母属、或属于耶氏酵母属、或属于阿舒囊霉属的酵母细胞,并且特别地可属于酵母属,并且更特别选自由以下组成的组:酿酒酵母、布拉氏酵母、贝酵母、奇异酵母、米卡酵母、卡氏酵母、白念珠菌、光滑念珠菌、热带念珠菌、乳酸克鲁维酵母、马克斯克鲁维酵母、多孢克鲁维酵母、耐热克鲁维酵母、多形汉逊酵母、解脂耶氏酵母、汉逊德巴利酵母和棉阿舒囊霉,并且可优选是酿酒酵母。
本发明的另一目标涉及生产具有所想要分子量的肝素前体的方法,其包括:
(a)在培养基中培养本发明的重组细胞,即本发明的重组酵母细胞或重组宿主细胞,持续足以生产具有所想要分子量的肝素前体的时间;和
(b)任选地从所述重组细胞和/或从所述培养基分离或回收所述肝素前体。
在本发明的方法中,肝素前体可具有的分子量为约20kDa至约50kDa并且优选20kDa至30kDa。
在本发明的方法中,肝素前体可替选地具有的分子量为30kDa至50kDa。
在本发明的方法中,肝素前体可替选地具有的分子量为约50kDa至约150kDa。
在本发明的方法中,肝素前体可替选地具有的分子量为约150kDa至约1500kDa。
在本发明的方法中,重组细胞可以是酵母,特别是酵母属的成员,并且可特别是酿酒酵母。
在本发明的方法中,足以生产肝素前体、特别是具有所想要分子量的肝素前体的时间可以是约35小时至约50小时、优选约40小时至约50小时、优选约48小时的时间段。
在本发明的方法中,所生产的肝素前体的分子量可由培养基的pH控制。
在本发明的方法中,肝素前体的分子量可以通过在本发明的方法的培养步骤(a)期间调节培养基的pH来控制。
在本发明的方法中,肝素前体的分子量可通过从培养基中去除生物质来控制。
本发明的方法可以以工业规模进行,优选地其中所述培养基是至少约100L,更优选地在约1000L至约3000L的范围内,甚至更优选约10,000L或甚至更优选约100,000L,或甚至约250,000L。
本发明的另一目的涉及从本发明的重组细胞或从本发明的方法获得的或可获得的肝素前体。
本发明还涉及包含根据本发明的肝素前体的培养基。
本发明还涉及包含根据本发明的肝素前体的组合物。
本发明还涉及工业产品或消费产品或消费品,其包含(i)具有小于50kDa、优选在约20kDa至约50kDa范围内;或大于50kDa,优选在约50kDa至约250kD的范围内;或大于100kDa、优选在约100kDa至约1500kDa的范围内的分子量的肝素前体;(ii)本发明的培养基或(iii)本发明的组合物。
本发明的工业产品或消费产品或消费品可以是美容品、调味品、香料产品、食品、食物、饮料、食品定形剂、药物组合物、膳食补充剂、营养制品、清洁产品、牙科和/或口腔卫生组合物。
本发明的另一个目的涉及本发明的重组细胞用于生产分子量在约20kDa至约50kDa或约50kDa至约1000kDa范围内的肝素前体的用途。
编码具有肝素前体合酶活性的多肽的重组核酸
根据本发明的重组细胞并且特别是本发明的重组酵母包含编码具有肝素前体合酶活性的多肽的一种或多种重组核酸。
根据本发明的具有肝素前体合酶活性的多肽意指将中间代谢物UDP-葡萄糖醛酸/盐和UDP-N-乙酰葡萄糖胺(UDP-GlcNAc)转化为肝素前体[→4)β-D-葡萄糖醛酸(GlcA)(1→4)N-乙酰-a-D-葡萄糖胺(GlcNAc)(l→]n的多肽。
在一个实施方式中,编码具有肝素前体合酶活性的多肽的重组核酸中的一种或多种在本发明的重组细胞中有功能的诱导型或阻遏型启动子的控制下。
编码具有肝素前体合酶活性的多肽的重组核酸中的一种或多种可以在选自由以下组成的组的启动子的控制下:pCCW12.Sar、pCCW120.sca、pTDH3-1.Sba和pTDH3.Sar。
所述编码具有肝素前体合酶活性的多肽的一种或多种重组核酸可来源于或源自兽瘟链球菌(sz)、小球藻属病毒PBCV1(Vir)、非洲爪蟾(Xenopus laevis,xl)或多杀巴斯德菌(pm),并且特别是多杀巴斯德菌,如本文实例所示。
根据本发明的重组细胞,并且特别是根据本发明的重组酵母,可包含1至5、特别是1至3个编码具有肝素前体合酶活性的多肽的重组核酸。根据本发明的重组细胞并且特别是根据本发明的重组酵母可例如包含1、2或3个编码具有肝素前体合酶活性的多肽的重组核酸。
说明性地,可将编码具有肝素前体合酶活性的多肽的一种或多种重组核酸插入重组细胞并且特别是重组酵母的JLP1基因内和/或LEU2基因内和/或SAM3基因内,如其在本文的实例中所示。
在本发明的一个实施方式中,本发明的重组细胞并且特别是重组酵母包含:
-1至5个、特别是1至3个编码具有肝素前体合酶活性的多肽的重组核酸;
-所述编码具有肝素前体合酶活性的多肽的一种或多种重组核酸,其来源于或源自兽瘟链球菌(sz)、小球藻属病毒PBCV1(Vir)、非洲爪蟾(xl)或多杀巴斯德菌(pm),并且特别来源于或源自多杀巴斯德菌;和
-所述编码具有肝素前体合酶活性的多肽的一种或多种重组核酸在本发明的重组细胞中有功能的诱导型或阻遏型启动子的控制下,和/或在选自由pCCW12.Sar、pCCW120.sca、pTDH3-1.Sba和pTDH3.Sar组成的组的启动子的控制下。
编码具有UDP-葡萄糖脱氢酶活性的多肽的重组核酸
根据本发明的重组细胞并且特别是本发明的重组酵母包含编码具有UDP-葡萄糖脱氢酶(UDP-GlcDH或HASB)活性的多肽的一种或多种重组核酸。
根据本发明的具有UDP-葡萄糖脱氢酶(UDP-GlcDH或HASB)活性的多肽意指将中间代谢物尿苷-二磷酸-葡萄糖(Uridine-Diphosphate-Glucose)(UDP-葡萄糖)转化为UDP-葡萄糖醛酸/盐的多肽。
在一个实施方式中,编码具有UDP-葡萄糖脱氢酶(UDP-GlcDH或HASB)活性的多肽的重组核酸中的一者或多者在本发明的重组细胞中有功能的诱导型或阻遏型启动子的控制下。
编码具有UDP-葡萄糖脱氢酶活性的多肽的重组核酸中的一者或多者可以在pCCW12启动子的控制下,并且特别地可以在选自由pCCW12.sk和pCCW12.sba组成的组的启动子的控制下。
编码具有UDP-葡萄糖脱氢酶活性的多肽的一种或多种重组核酸可来源于或源自拟南芥、小球藻属病毒PBCV1或兽瘟链球菌,并且特别是来源于或源自拟南芥或小球藻属病毒PBCV1。
根据本发明的重组细胞、并且特别是根据本发明的重组酵母,可包含1至7个、特别是2至7个编码具有UDP-葡萄糖脱氢酶活性的多肽的重组核酸。根据本发明的重组细胞并且特别是根据本发明的重组酵母可例如包含2或5个编码具有UDP-葡萄糖脱氢酶活性的多肽的重组核酸。
说明性地,可将编码具有UDP-葡萄糖脱氢酶活性的多肽的一种或多种重组核酸插入重组细胞并且特别是重组酵母的JLP1基因内和/或LEU2基因内和/或SAM3基因内,如其在本文的实例中所示。
在本发明的一个实施方式中,本发明的重组细胞并且特别是重组酵母包含:
-1至7个并且特别是2至7个编码具有UDP-葡萄糖脱氢酶活性的多肽的重组核酸;
-所述编码具有UDP-葡萄糖脱氢酶活性的多肽的一种或多种重组核酸来源于或源自拟南芥、小球藻属病毒PBCV1或兽瘟链球菌,并且特别来源于或源自拟南芥或小球藻属病毒PBCV1;和
-所述编码具有UDP-葡萄糖脱氢酶活性的多肽的一种或多种重组核酸在本发明的重组细胞中有功能的诱导型或阻遏型启动子的控制下,和/或在pCCW12启动子的控制下,并且特别地可以在选自由pCCW12.sk和pCCW12.sba组成的组的启动子的控制下。
编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的重组核酸
根据本发明的重组细胞并且特别是根据本发明的重组酵母包含编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的一种或多种重组核酸。
根据本发明的具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽意指降解肝素前体的多肽,即其将给定分子量的肝素前体转化为较低分子量的肝素前体。
如前文所述,本发明的具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽包含分泌信号。
在一个实施方式中,具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽包含分泌信号但不包含锚定信号。
在一个实施方式中,具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽包含分泌信号和锚定信号两者。
在一个实施方式中,所述编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的一种或多种重组核酸在本发明的重组细胞中有功能的诱导型或阻遏型启动子的控制下。
编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的重组核酸中的一者或多者可以在选自由以下组成的组的启动子的控制下:pTEF1、pCCW12、pCCW12.sba、pCCW12.Sar、pPDC1、pTEF3、pTDH3、pNUP57和pCCW10.ago。
在具体的实施方式中,编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的核酸在选自由以下组成的组的启动子的控制下:pTEF1、pCCW12、pCCW12.sba、pCCW12.Sar、pPDC1、pTEF3、pTDH3、pNUP57和pCCW10.ago。
所述编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的一种或多种重组核酸可来源于或源自解肝磷脂土地杆菌(Ph)、萨氏九杯蛛(Cupiennius salei(Csa))、居中平甲蛛(Loxosceles intermedia)(Li)、日本医蛭(Hirudo nipponia)(Hn)、普通矛头蝮(Bothrops atrox)(Ba)或巴西钳蝎(Tityus serrulatus)(Ts),如本文实施例所示。在具体的实施方式中,所述编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的一种或多种重组核酸来源于或源自解肝磷脂土地杆菌(Ph)。
根据本发明的重组细胞并且特别是根据本发明的重组酵母可仅包含一个编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的重组核酸。根据本发明的重组细胞,并且特别是根据本发明的重组酵母,可以替选地包含1至8个、特别是1至5个编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的重组核酸。
说明性地,可将编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的一种或多种重组核酸插入JLP1基因内和/或LYP1基因内和/或SAM3基因内和/或HIS3基因内,如其在本文的实例中所示。
编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的重组核酸
根据本发明的重组细胞并且特别是根据本发明的重组酵母细胞,可包含编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)活性的多肽的一种或多种重组核酸。
根据本发明的具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽意指将果糖-6-磷酸转化为葡萄糖胺-6-磷酸的多肽。
在一个实施方式中,编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的重组核酸中的一者或多者在本发明的重组细胞中有功能的诱导型或阻遏型启动子的控制下。
编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶合酶活性的多肽的重组核酸中的一者或多者可在pTEF1启动子并且特别是pTEF1.Ago的控制下。
所述编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的一种或多种重组核酸可来源于或源自由酿酒酵母和小球藻属病毒PBCV1组成的组。
根据本发明的重组细胞并且特别是根据本发明的重组酵母可包含1至5个并且特别是1至3个编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的重组核酸。
说明性地,可将编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的一种或多种重组核酸插入重组细胞和特别是重组酵母的SAM3基因内和/或JLP1基因内,如其在本文的实例中所示。
在本发明的一个实施方式中,本发明的重组细胞并且特别是重组酵母包含:
-编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的1至5个并且特别是1至3个重组核酸;
-所述编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的重组核酸来源于或源自由酿酒酵母合小球藻属病毒PBCV1组成的组;和
-所述编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的重组核酸在pTEF1启动子并且特别是pTEF1.Ago的控制下。
编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的重组核酸
根据本发明的重组细胞,并且特别是根据本发明的重组酵母细胞,可包含编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的一种或多种重组核酸。
根据本发明的具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽意指将N-乙酰-葡萄糖胺转化为UDP-N-乙酰-葡萄糖胺的多肽。
在一个实施方式中,编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的重组核酸中的一种或多种在本发明的重组细胞中有功能的诱导型或阻遏型启动子的控制下,例如诱导型或阻遏型启动子pMET6或pCUP1。
编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的重组核酸中的一种或多种可以在启动子pTDH3的控制下。
所述编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的一种或多种重组核酸可来源于或源自酿酒酵母,如本文实例所示。
根据本发明的重组细胞,并且特别是根据本发明的重组酵母,可包含5至15个、特别是5至12个编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的重组核酸。根据本发明的重组细胞并且特别是根据本发明的重组酵母可例如包含8或10个编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的重组核酸。
说明性地,可将编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的一种或多种重组核酸插入重组细胞并且特别是重组酵母的HIS3基因内和/或JLP1基因内和/或SAM3基因内,如其在本文的实例中所示。
在本发明的一个实施方式中,本发明的重组细胞并且特别是重组酵母包含:
-5至15个、特别是5至12个编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的重组核酸;
-所述编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的一种或多种重组核酸来源于或源自酿酒酵母;和
-所述编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的一种或多种重组核酸在本发明的重组细胞中有功能的诱导型或阻遏型启动子的控制下,例如诱导型或阻遏型启动子pMET6或pCUP1和/或在启动子pTDH3的控制下。
编码具有磷酸葡萄糖变位酶-1活性的多肽的重组核酸
根据本发明的重组细胞并且特别是根据本发明的重组酵母可包含编码具有磷酸葡萄糖变位酶-1(PGM1)活性的多肽的一种或多种重组核酸。
根据本发明的具有磷酸葡萄糖变位酶-1(PGM1)活性的多肽意指将葡萄糖-6-磷酸转化为中间代谢物葡萄糖-1-磷酸的多肽。
在一个实施方式中,编码具有磷酸葡萄糖变位酶-1(PGM1)活性的多肽的重组核酸中的一者或多者在本发明的重组细胞中有功能的诱导型或阻遏型启动子的控制下,例如诱导型或阻遏型启动子。
编码具有磷酸葡萄糖变位酶-1(PGM1)活性的多肽的重组核酸中的一者或多者可以在启动子pPDC1的控制下。
编码具有磷酸葡萄糖变位酶-1(PGM1)活性的多肽的一种或多种重组核酸可来源于或源自酿酒酵母,如本文实例所示。
根据本发明的重组细胞并且特别是根据本发明的重组酵母可仅包含一个编码具有磷酸葡萄糖变位酶-1(PGM1)活性的多肽的重组核酸。
说明性地,可将编码具有磷酸葡萄糖变位酶-1活性的多肽的一种或多种重组核酸插入重组细胞并且特别是重组酵母内的SAM3基因,如在本文的实例中所示。
在本发明的一个实施方式中,本发明的重组细胞并且特别是重组酵母包含:
-仅一种编码具有磷酸葡萄糖变位酶-1活性的多肽的重组核酸;
-所述编码具有磷酸葡萄糖变位酶-1活性的多肽的重组核酸来源于或源自酿酒酵母;和
-所述编码具有磷酸葡萄糖变位酶-1活性的多肽的重组核酸在启动子pPDC1的控制下。
编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的重组核酸
根据本发明的重组细胞并且特别是根据本发明的重组酵母,可包含编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶(UGP1)活性的多肽的一种或多种重组核酸。
根据本发明的具有UTP-葡萄糖-1-磷酸尿苷酰转移酶(UGP1)活性的多肽意指将中间代谢物葡萄糖-1-磷酸转化为中间代谢物UDP-葡萄糖的多肽。
在一个实施方式中,编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的重组核酸中的一者或多者在本发明的重组细胞中有功能的诱导型或阻遏型启动子的控制下,例如诱导型或阻遏型启动子pSAM1或pCUP1。
编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的重组核酸中的一者或多者可以在选自由pPDC1和pENO2组成的组的启动子的控制下。
编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的一种或多种重组核酸可来源于或源自酿酒酵母,如本文实例所示。
根据本发明的重组细胞,并且特别是根据本发明的重组酵母,可包含5至15个、特别是5至12个编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的重组核酸。根据本发明的重组细胞并且特别是根据本发明的重组酵母可例如包含8或11个编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的重组核酸。
说明性地,可将编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性基因的多肽的一种或多种重组核酸插入重组细胞并且特别是重组酵母的HIS3基因内和/或JLP1基因内和/或SAM3基因内,如在本文的实例中所示。
在本发明的一个实施方式中,本发明的重组细胞并且特别是重组酵母包含:
-5至15个、特别是5至12个编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的重组核酸;
-所述编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的一种或多种重组核酸来源于或源自酿酒酵母;和
-所述编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的一种或多种重组核酸在本发明的重组细胞中有功能的诱导型或阻遏型启动子的控制下,例如诱导型或阻遏型启动子pSAM1或pCUP1和/或在选自由pPDC1和pENO2组成的组的启动子的控制下。
编码具有葡萄糖胺-6-磷酸N-乙酰转移酶活性的多肽的重组核酸
根据本发明的重组细胞并且特别是根据本发明的重组酵母细胞,可包含编码具有葡萄糖胺-6-磷酸N-乙酰转移酶(GNA1)活性的多肽的一种或多种重组核酸。
根据本发明的具有葡萄糖胺-6-磷酸N-乙酰转移酶(GNA1)活性的多肽意指将葡萄糖胺-6-磷酸转化为N-乙酰-葡萄糖胺-6-磷酸的多肽。
在一个实施方式中,编码具有葡萄糖胺-6-磷酸N-乙酰转移酶活性的多肽的重组核酸中的一者或多者在本发明的重组细胞中有功能的诱导型或阻遏型启动子的控制下。
编码具有葡萄糖胺-6-磷酸N-乙酰转移酶活性的多肽的重组核酸中的一者或多者在启动子pCWP2的控制下。
所述编码具有葡萄糖胺-6-磷酸N-乙酰转移酶活性的多肽的一种或多种重组核酸可来源于或源自酿酒酵母,如在本文的实例中所示。
根据本发明的重组细胞并且特别是根据本发明的重组酵母可仅包含一个编码具有葡萄糖胺-6-磷酸N-乙酰转移酶活性的多肽的重组核酸。
说明性地,可将编码具有葡萄糖胺-6-磷酸N-乙酰转移酶活性的多肽的一种或多种重组核酸插入重组细胞并且特别是重组酵母内的SAM3基因,如在本文的实例中所示。
在本发明的一个实施方式中,本发明的重组细胞并且特别是重组酵母包含:
-仅一个编码具有葡萄糖胺-6-磷酸N-乙酰转移酶活性的多肽的重组核酸;
-所述编码具有葡萄糖胺-6-磷酸N-乙酰转移酶活性的多肽的重组核酸来源于或源自酿酒酵母;和
-所述编码具有葡萄糖胺-6-磷酸N-乙酰转移酶活性的多肽的重组核酸在启动子pCWP2的控制下。
编码具有磷酸乙酰葡萄糖胺变位酶活性的多肽的重组核酸
根据本发明的重组细胞并且特别是根据本发明的重组酵母细胞可包含编码具有磷酸乙酰葡萄糖胺变位酶(PCM1)活性的多肽的一种或多种重组核酸。
根据本发明的具有磷酸乙酰葡萄糖胺变位酶(PCM1)活性的多肽意指将N-乙酰-葡萄糖胺-6-磷酸转化为N-乙酰-葡萄糖胺-1-磷酸的多肽。
在一个实施方式中,编码具有磷酸乙酰葡萄糖胺变位酶活性的多肽的重组核酸中的一者或多者在本发明的重组细胞中有功能的诱导型或阻遏型启动子的控制下。
编码具有磷酸乙酰葡萄糖胺变位酶活性的多肽的重组核酸中的一者或多者可以在pTEF1启动子的控制下。
所述编码具有磷酸乙酰葡萄糖胺变位酶活性的多肽的一种或多种重组核酸可来源于或源自酿酒酵母,如在本文的实例中所示。
根据本发明的重组细胞并且特别是根据本发明的重组酵母可以仅包含一种编码具有磷酸乙酰葡萄糖胺变位酶活性的多肽的重组核酸。
说明性地,可将编码具有磷酸乙酰葡萄糖胺变位酶活性的多肽的一种或多种重组核酸插入重组细胞并且特别是重组酵母内的SAM3基因,如在本文的实例中所示。
在本发明的一个实施方式中,本发明的重组细胞并且特别是重组酵母包含:
-仅一种编码具有磷酸乙酰葡萄糖胺变位酶活性的多肽的重组核酸;
-所述编码具有磷酸乙酰葡萄糖胺变位酶活性的多肽的重组核酸来源于或源自酿酒酵母;和
-所述编码具有磷酸乙酰葡萄糖胺变位酶活性的多肽的重组核酸在pTEF1启动子的控制下。
肝素前体合酶(HSS)
肝素前体合酶是本领域中描述的用于催化UDP-葡萄糖醛酸/盐或UDP-N-乙酰-葡萄糖转化为肝素前体的蛋白质。源自兽瘟链球菌、小球藻属病毒PBCV1、非洲爪蟾或多杀巴斯德菌的肝素前体合酶可称为HSS。
实施测量具有肝素前体合酶活性的多肽的活性水平的方法属于本领域技术人员的常识。
在这方面,本领域技术人员可以有利地参考Bitter和Muir描述的用浓硫酸和咔唑处理后的比色测定方法(Analytical Biochemistry,4,330-334,1962)。
本说明书中具有肝素前体合酶活性的优选多肽是具有选自由SEQ ID NO:1(HSS1)和SEQ ID NO:2(HSS2)组成的组的核酸序列的酶。
根据优选的实施方式,编码具有肝素前体合酶活性的多肽的一种或多种重组核酸可来源于或源自生物体,优选选自由原核生物和真核生物组成的组。在一些实施方式中,编码具有肝素前体合酶活性的多肽的一种或多种重组核酸可来源于或源自古细菌。在一些实施方式中,编码具有肝素前体合酶活性的多肽的一种或多种重组核酸可来源于或源自细菌,并且尤其是兽瘟链球菌(Sz)、小球藻属病毒PBCV1(Vir)、非洲爪蟾(Xl)或多杀巴斯德菌(Pm),并且特别是多杀巴斯德菌。
根据又一个优选的实施方式,编码具有肝素前体合酶活性的多肽的一种或多种重组核酸可选自由以下组成的组:具有(i)与如序列SEQ ID NO:1(HSS1-Pm)或SEQ ID NO:2(HSS2-Pm)所示的核酸序列的至少65%、有利地至少70%、优选至少80%核酸同一性,和(ii)与分别具有如序列SEQ ID NO:1(HSS1-Pm)或SEQ ID NO:2(HSS2-Pm)所示的核酸序列相同性质的生物活性的核酸序列。
如前所解释,关于该序列的相同性质的生物活性是编码将UDP-葡萄糖醛酸/盐或UDP-N-乙酰-葡萄糖转化成肝素前体的酶的能力。
如本文所述,与参考核酸序列具有至少65%核苷酸同一性的核酸序列涵盖与所述参考核酸序列具有至少66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%核苷酸同一性并且还具有与所述参考核酸序列相同性质的生物活性的核酸序列。
如本文所述,与参考核酸序列具有至少70%核苷酸同一性的核酸序列涵盖与所述参考核酸序列具有至少71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%核苷酸同一性并且还具有与所述参考核酸序列相同性质的生物活性的核酸序列。
如本文所述,与参考核酸序列具有至少80%核苷酸同一性的核酸序列涵盖与所述参考核酸序列具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%核苷酸同一性并且还具有与所述参考核酸序列相同性质的生物活性的核酸序列。
对于具有源自多杀巴斯德菌的肝素前体合酶活性的多肽的氨基酸序列,本领域的技术人员可分别参考UniProt数据库中的登录号Q8RP78和Q5SGE1,或本文所述的SEQ IDNO:3(HSS1-Pm)或SEQ ID NO:4(HSS2-Pm)。
根据另一个特定的实施方式,编码具有肝素前体合酶活性的多肽的一种或多种重组核酸可以是编码具有选自由以下组成的组的氨基酸序列的多肽的一种或多种核酸:具有与SEQ ID NO:3(Pm HSS1)或SEQ ID NO:4(Pm HSS2)所示的氨基酸序列的至少50%、有利地至少65%、优选至少80%氨基酸同一性,并且还具有与如SEQ ID NO:3(Pm HSS1)或SEQ IDNO:4(Pm HSS2)所示的氨基酸序列相同性质的生物活性的序列。
关于该序列的相同性质的生物活性如前所述,即催化UDP-葡萄糖醛酸/盐或UDP-N-乙酰-葡萄糖转化为肝素前体的能力。
如本文所述,与参考氨基酸序列具有至少50%氨基酸同一性的氨基酸序列涵盖与所述参考氨基酸序列具有至少51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%氨基酸同一性并且还具有与所述参考氨基酸序列相同性质的生物活性的氨基酸序列。
如本文所述,与参考氨基酸序列具有至少65%氨基酸同一性的氨基酸序列涵盖与所述参考氨基酸序列具有至少66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%氨基酸同一性并且还具有与所述参考氨基酸序列相同性质的生物活性的氨基酸序列。
如本文所述,与参考氨基酸序列具有至少80%氨基酸同一性的氨基酸序列涵盖与所述参考氨基酸序列具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%氨基酸同一性并且还具有与所述参考氨基酸序列相同性质的生物活性的氨基酸序列。
如上所提及,在本发明中编码具有肝素前体合酶活性的多肽的一种或多种重组核酸的表达水平由至少一种启动子和至少一种终止子调控,例如在后文中更详细地定义,其分别存在于编码具有肝素前体合酶活性的多肽的一种或多种重组核酸的5’和3’位置。
UDP-葡萄糖脱氢酶(UDP-GlcDH或HASB)
UDP-葡萄糖脱氢酶是一种本领域已知的催化UDP-葡萄糖转化为UDP-葡萄糖醛酸/盐的蛋白质。来源于拟南芥、小球藻属病毒PBCV1或兽瘟链球菌的基因组的UDP-葡萄糖脱氢酶可称为HASB。
实施测量具有UDP-葡萄糖脱氢酶活性的多肽的活性水平的方法属于本领域技术人员的常识。
在这方面,本领域技术人员可以有利地参考Oka和Jigami所述的方法(FEBSJournal 273,2645-2657,2006)。
在本说明书中具有UDP-葡萄糖脱氢酶活性的优选多肽是EC号为1.1.1.22的酶。
根据优选的实施方式,编码具有UDP-葡萄糖脱氢酶活性的多肽的一种或多种重组核酸可来源于或源自生物体,优选选自包括原核生物和真核生物的组。在一些实施方式中,编码具有UDP-葡萄糖脱氢酶活性的多肽的一种或多种重组核酸可来源于或源自古细菌。在一些优选的实施方式中,编码具有UDP-葡萄糖脱氢酶活性的多肽的一种或多种重组核酸可来源于或源自酵母,并且尤其是拟南芥、小球藻属病毒PBCV1或兽瘟链球菌,并且更特别是拟南芥或小球藻属病毒PBCV1。
根据又一个优选的实施方式,编码具有UDP-葡萄糖脱氢酶活性的多肽的一种或多种重组核酸可选自由以下组成的组:具有(i)与如序列SEQ ID NO:5(At)、SEQ ID NO.6(Vir)或SEQ ID NO.7(Vir)所示的核酸的至少65%、有利地至少70%、优选至少80%核酸同一性,和(ii)与如序列SEQ ID NO:5(At)、SEQ ID NO.6(Vir)或SEQ ID NO.7(Vir)所示的核酸相同性质的生物活性的核酸序列。如序列SEQ ID NO:5(At)、SEQ ID NO:6(Vir)和SEQ IDNO.7(Vir)所示的核酸编码分别源自在本文中还可统称为HASB的拟南芥(At)或小球藻属病毒PBCV1(Vir)的具有UDP-葡萄糖脱氢酶活性的多肽。
关于该序列的相同性质的生物活性如前所解释,即编码将UDP-磷酸转化为UDP-葡萄糖醛酸/盐的多肽的能力。
如本文所述,与参考核酸序列具有至少65%核苷酸同一性的核酸序列涵盖与所述参考核酸序列具有至少66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%核苷酸同一性并且还具有与所述参考核酸序列相同性质的生物活性的核酸序列。
如本文所述,与参考核酸序列具有至少70%核苷酸同一性的核酸序列涵盖与所述参考核酸序列具有至少71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%核苷酸同一性并且还具有与所述参考核酸序列相同性质的生物活性的核酸序列。
如本文所述,与参考核酸序列具有至少80%核苷酸同一性的核酸序列涵盖与所述参考核酸序列具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%核苷酸同一性并且还具有与所述参考核酸序列相同性质的生物活性的核酸序列。
对于来自拟南芥、小球藻属病毒PBCV1或兽瘟链球菌的具有UDP-葡萄糖脱氢酶活性的多肽的氨基酸序列,本领域技术人员可以分别参考UniProt数据库中的登录号NP_173979.1、NP_048965或KIS19289,或者参考本文所述的SEQ ID NO:8(At)和SEQ ID NO.9(Vir)所示的序列。
根据另一个具体的实施方式,编码具有UDP-葡萄糖脱氢酶活性的多肽的一种或多种重组核酸可以是编码具有选自由以下组成的组的氨基酸序列的多肽的一种或多种核酸:具有与SEQ ID NO:8(At)和SEQ ID NO.9(Vir)的氨基酸序列的至少55%、有利地至少65%、优选至少80%氨基酸同一性,并且还具有与SEQ ID NO:8(At)和SEQ ID NO.9(Vir)的氨基酸序列相同性质的生物活性的序列。
关于该序列的相同性质的生物活性如前所述,即催化UDP-葡萄糖转化为UDP-葡萄糖醛酸/盐的能力。
如本文所述,与参考氨基酸序列具有至少55%氨基酸同一性的氨基酸序列涵盖与所述参考氨基酸序列具有至少56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%氨基酸同一性并且还具有与所述参考氨基酸序列相同性质的生物活性的氨基酸序列。
如本文所述,与参考氨基酸序列具有至少65%氨基酸同一性的氨基酸序列涵盖与所述参考氨基酸序列具有至少66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%氨基酸同一性并且还具有与所述参考氨基酸序列相同性质的生物活性的氨基酸序列。
如本文所述,与参考氨基酸序列具有至少80%氨基酸同一性的氨基酸序列涵盖与所述参考氨基酸序列具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%氨基酸同一性并且还具有与所述参考氨基酸序列相同性质的生物活性的氨基酸序列。
如上所提及,在本发明中编码具有UDP-葡萄糖脱氢酶活性的多肽的一种或多种重组核酸的表达水平由至少一种启动子和至少一种终止子调控,例如在后文中更详细地定义,其分别存在于编码具有UDP-葡萄糖脱氢酶活性的多肽的一种或多种重组核酸的5’和3’位置。
葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶
葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶(glucuronosyl-disulfoglucosamine glucuronidase)是一种本领域中描述的用于催化肝素前体分子降解成更小的肝素前体分子的蛋白质。由解肝磷脂土地杆菌的基因组编码的葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶可称为HEPC。
本发明的具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽可具有分泌信号和锚定信号两者,或具有分泌信号并且不具有锚定信号,或具有双重分泌和锚定功能的分泌-锚定信号。
实施测量具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的活性水平的方法属于本领域技术人员的常识。
在这方面,本领域技术人员可以有利地在琼脂糖凝胶上监测所获得的肝素前体的分子量。
在本说明书中具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的优选多肽是EC号是3.2.1.56的酶。
根据优选的实施方式,编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的一种或多种重组核酸可来源于或源自生物体,优选选自包括原核生物和真核生物的组。在一些实施方式中,编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的一种或多种重组核酸可来源于或源自古细菌。在一些实施方式中,编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的一种或多种重组核酸可来源于或源自生物体,优选选自酵母。在一些其他优选的实施方式中,编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的一种或多种重组核酸可来源于或源自解肝磷脂土地杆菌。
根据又一个优选的实施方式,编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的一种或多种重组核酸可选自由以下组成的组:具有与SEQ ID NO:10(Ph)或SEQ ID NO:12(Ph)的核酸的至少65%、有利地至少70%、优选至少80%核酸同一性,并且还具有与SEQ ID NO:10(Ph)或SEQ ID NO:12(Ph)的核酸相同性质的生物活性的核酸序列。SEQ ID NO:10(Ph)和SEQ ID NO:12(Ph)的核酸编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽,包含分泌信号和不包含锚定信号,并且来源于或源自解肝磷脂土地杆菌。
根据另一个优选的实施方式,编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的一种或多种重组核酸可选自由以下组成的组:具有与SEQ ID NO:11(Ph)或SEQ ID NO:13(Ph)的核酸的至少65%、有利地至少70%、优选至少80%核酸同一性,并且还具有与SEQ ID NO:11(Ph)或SEQ ID NO:13(Ph)的核酸相同性质的生物活性的核酸序列。SEQ ID NO:11(Ph)和SEQ ID NO:13(Ph)的核酸编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽,包含分泌信号和锚定信号,并且来源于或源自解肝磷脂土地杆菌。
关于该序列的相同性质的生物活性如前所解释,即编码催化肝素前体分子降解为较小肝素前体分子的多肽的能力。
如本文所述,与参考核酸序列具有至少65%核苷酸同一性的核酸序列涵盖与所述参考核酸序列具有至少66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%核苷酸同一性并且还具有与所述参考核酸序列相同性质的生物活性的核酸序列。
如本文所述,与参考核酸序列具有至少70%核苷酸同一性的核酸序列涵盖与所述参考核酸序列具有至少71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%核苷酸同一性并且还具有与所述参考核酸序列相同性质的生物活性的核酸序列。
如本文所述,与参考核酸序列具有至少80%核苷酸同一性的核酸序列涵盖与所述参考核酸序列具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%核苷酸同一性并且还具有与所述参考核酸序列相同性质的生物活性的核酸序列。
对于来自解肝磷脂土地杆菌的编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的一种或多种重组核酸的氨基酸序列,本领域中的技术人员可参考UniProt数据库中的登录号Q59289,对应于本文所述的SEQ ID NO:10(Ph)和SEQ ID NO:12(Ph)两者。
根据另一个具体的实施方式,编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的一种或多种重组核酸可以是编码具有选自由以下组成的组的氨基酸序列的多肽的一种或多种核酸:具有与包含分泌信号并且不包含锚定信号的SEQ ID NO:14(Ph)的氨基酸序列的至少50%、有利地至少65%、优选至少80%的氨基酸同一性,并且还具有与氨基酸序列SEQ ID NO:14(Ph)相同性质的生物活性的序列。
根据另一个具体的实施方式,编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的一种或多种重组核酸可以是编码具有选自由以下组成的组的氨基酸序列的多肽的一种或多种核酸:具有与包含分泌信号和锚定信号的SEQ ID NO:15(Ph)的氨基酸序列的至少55%、有利地至少65%、优选至少80%氨基酸同一性,并且还具有与SEQ IDNO:15(Ph)的氨基酸序列相同性质的生物活性的序列。
关于该序列的相同性质的生物活性如前所述,即催化肝素前体分子降解为较小肝素前体分子的能力。
如本文所述,与参考氨基酸序列具有至少55%氨基酸同一性的氨基酸序列涵盖与所述参考氨基酸序列具有至少56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%氨基酸同一性并且还具有与所述参考氨基酸序列相同性质的生物活性的氨基酸序列。
如本文所述,与参考氨基酸序列具有至少65%氨基酸同一性的氨基酸序列涵盖与所述参考氨基酸序列具有至少66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%氨基酸同一性并且还具有与所述参考氨基酸序列相同性质的生物活性的氨基酸序列。
如本文所述,与参考氨基酸序列具有至少80%氨基酸同一性的氨基酸序列涵盖与所述参考氨基酸序列具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%氨基酸同一性并且还具有与所述参考氨基酸序列相同性质的生物活性的氨基酸序列。
如上所提及,在本发明中编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的一种或多种重组核酸的表达水平受至少一种启动子和至少一种终止子调节,例如下文更详细定义的,其分别存在于编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的一种或多种重组核酸的5’和3’位置。
谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)
谷氨酰胺-果糖-6-磷酸酰胺转移酶(glutamine-fructose-6-phosphateamidotransferase)是一种蛋白质,其在本领域中被描述用于催化果糖-6-磷酸(fructose-6-phosphate)转化为葡萄糖胺-6-磷酸(glucosamine-6-phosphate)。源自酿酒酵母和小球藻属病毒PBCV1的谷氨酰胺-果糖-6-磷酸酰胺转移酶可称为GFA1。
实施测量具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的活性水平的方法属于本领域技术人员的常识。
在这方面,本领域技术人员可以有利地参考Shiga Shibatan和Hiroaki Kitazawa(Plant Biotechnology 26,149-152,2009)所述的方法。
本发明中具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的优选多肽是EC号为No.EC2.6.1.16的酶。
根据优选的实施方式,编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的一种或多种重组核酸可来源于或源自生物体,优选选自包括原核生物和真核生物的组。在一些实施方式中,编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的一种或多种重组核酸可来源于或源自古细菌。在一些实施方式中,编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的一种或多种重组核酸可来源于或源自生物体,优选选自枯草芽孢杆菌和酵母。在一些其他优选的实施方式中,编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的一种或多种重组核酸可来源于或源自酿酒酵母或小球藻属病毒PBCV1。
根据又一个优选实施方式,编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的一种或多种重组核酸可选自由以下组成的组:具有(i)与如序列SEQ ID NO:16(Sc)或EQ所示的核酸序列的至少65%、有利地至少70%、优选至少80%核酸同一性,和(ii)与如序列SEQ ID NO:16(Sc)所示的核酸序列相同性质的生物活性的核酸序列。如序列SEQ ID NO:16所示的核酸编码具有来源于酿酒酵母的谷氨酰胺-果糖-6-磷酸酰胺转移酶(其还可称为GFA1)活性的多肽。
根据又一个实施方式,编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的一种或多种重组核酸可选自由以下组成的组:具有(i)与如序列SEQ ID NO:15或SEQ IDNO:16所示的核酸序列的至少65%、有利地至少70%、优选至少80%核酸同一性,和(ii)与如序列SEQ ID NO:17或SEQ ID NO:18所示的核酸序列相同性质的生物活性的核酸序列。如序列SEQ ID NO:17或SEQ ID NO:18所示的核酸序列编码具有来源于小球藻属病毒PBCV1的谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽。
关于该序列的相同性质的生物活性如前所解释,即编码将果糖-6-磷酸转化为葡萄糖胺-6-磷酸的多肽的能力。
如本文所述,与参考核酸序列具有至少65%核苷酸同一性的核酸序列涵盖与所述参考核酸序列具有至少66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%核苷酸同一性并且还具有与所述参考核酸序列相同性质的生物活性的核酸序列。
如本文所述,与参考核酸序列具有至少70%核苷酸同一性的核酸序列涵盖与所述参考核酸序列具有至少71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%核苷酸同一性并且还具有与所述参考核酸序列相同性质的生物活性的核酸序列。
如本文所述,与参考核酸序列具有至少80%核苷酸同一性的核酸序列涵盖与所述参考核酸序列具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%核苷酸同一性并且还具有与所述参考核酸序列相同性质的生物活性的核酸序列。
对于具有源自酿酒酵母的谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的氨基酸序列,本领域的技术人员可参考UniProt数据库中的登录号NP8012818,或参考本文所述的序列SEQ ID NO.19。
对于具有源自小球藻属病毒PBCV1的谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的氨基酸序列,本领域的技术人员可参考UniProt数据库中的登录号NP_048448,或参考本文所述的序列SEQ ID NO.20。
根据另一个具体的实施方式,编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的一种或多种重组核酸可以是编码具有选自由以下组成的组的氨基酸序列的多肽的一种或多种核酸:具有与SEQ ID NO:19和SEQ ID NO.20的氨基酸序列的至少35%、有利地至少65%、优选至少80%的氨基酸同一性,并且还具有与SEQ ID NO:19或SEQ ID NO:20的氨基酸序列相同性质的生物活性的序列。
关于该序列的相同性质的生物活性如前所述,即催化果糖-6-磷酸转化为葡萄糖胺-6-磷酸的能力。
如本文所述,与参考氨基酸序列具有至少35%氨基酸同一性的氨基酸序列涵盖与所述参考氨基酸序列具有至少36%、37%、38%、39%、40%41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%氨基酸同一性并且还具有与所述参考氨基酸序列相同性质的生物活性的氨基酸序列。
如本文所述,与参考氨基酸序列具有至少65%氨基酸同一性的氨基酸序列涵盖与所述参考氨基酸序列具有至少66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%氨基酸同一性并且还具有与所述参考氨基酸序列相同性质的生物活性的氨基酸序列。
如本文所述,与参考氨基酸序列具有至少80%氨基酸同一性的氨基酸序列涵盖与所述参考氨基酸序列具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%氨基酸同一性并且还具有与所述参考氨基酸序列相同性质的生物活性的氨基酸序列。
如上所提及,本发明中具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的表达水平由至少一种启动子和至少一种终止子调控,例如在后文中更详细地定义,其分别存在于编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的一种或多种重组核酸的5’和3’位置。
UDP-N-乙酰葡萄糖胺焦磷酸化酶(QRI1)
UDP-N-乙酰葡萄糖胺焦磷酸化酶是一种在本领域中被描述用于催化N-乙酰-葡萄糖胺-6-磷酸(N-acetyl-glucosmine-6-phosphate)转化为UDP-N-乙酰-葡萄糖的蛋白质。源自酿酒酵母的UDP-N-乙酰葡萄糖胺焦磷酸化酶可称为QRI1。
实施测量具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的活性水平的方法属于本领域技术人员的常识。
在这方面,本领域技术人员可以有利地参考Mio等人描述的方法(The Journal ofBiological Chemistry,第273卷,No 23,1998年6月5日,14392-14397),不同之处在于UDP-N-乙酰-葡萄糖胺是使用Synergi RP Fusion柱通过LC MS/MS检测的。
本发明中具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的优选多肽是EC号为No.EC2.7.7.23的酶。
根据优选的实施方式,编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的一种或多种重组核酸可来源于或源自生物体,优选选自由原核生物和真核生物组成的组。在一些实施方式中,具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的一种或多种重组核酸可来源于或源自古细菌。在一些实施方式中,编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的一种或多种重组核酸可来源于或源自生物体,优选选自枯草芽孢杆菌和酵母。在一些其他优选的实施方式中,编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的一种或多种重组核酸可来源于或源自酵母,并且尤其是酿酒酵母。
根据又一个优选的实施方式,编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的一种或多种重组核酸可选自由以下组成的组:具有(i)与如序列SEQ ID NO:21所示的核酸序列的至少65%、有利地至少70%、优选至少80%核酸同一性,和(ii)与如SEQ ID NO:21所示的核酸序列相同性质的生物活性的核酸序列。如SEQ ID NO:21所示的核酸序列编码具有源自酿酒酵母的UDP-N-乙酰葡萄糖胺焦磷酸化酶(其还可称为QRI1)活性的多肽。
关于该序列的相同性质的生物活性如前所解释,即编码将N-乙酰-葡萄糖胺-6-磷酸转化为UDP-N-乙酰-葡萄糖的多肽的能力。
如本文所述,与参考核酸序列具有至少65%核苷酸同一性的核酸序列涵盖与所述参考核酸序列具有至少66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%核苷酸同一性并且还具有与所述参考核酸序列相同性质的生物活性的核酸序列。
如本文所述,与参考核酸序列具有至少70%核苷酸同一性的核酸序列涵盖与所述参考核酸序列具有至少71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%核苷酸同一性并且还具有与所述参考核酸序列相同性质的生物活性的核酸序列。
如本文所述,与参考核酸序列具有至少80%核苷酸同一性的核酸序列涵盖与所述参考核酸序列具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%核苷酸同一性并且还具有与所述参考核酸序列相同性质的生物活性的核酸序列。
对于具有源自酿酒酵母的UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的氨基酸序列,本领域的技术人员可参考UniProt数据库中的登录号NP_010180,或参考本文所述的SEQ ID NO.22。
根据另一个具体的实施方式,编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的一种或多种重组核酸可为编码具有选自由以下组成的组的氨基酸序列的多肽的一种或多种核酸:与序列SEQ ID NO.22所示的氨基酸序列具有至少35%、有利地至少45%、优选至少80%氨基酸同一性并且还具有与序列SEQ ID NO.22所示的氨基酸序列相同性质的生物活性的序列。
关于该序列的相同性质的生物活性如前所述,即催化N-乙酰-葡萄糖胺-6-磷酸转化为UDP-N-乙酰-葡萄糖的能力。
如本文所述,与参考氨基酸序列具有至少35%氨基酸同一性的氨基酸序列涵盖与所述参考氨基酸序列具有至少36%、37%、38%、39%、40%41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%氨基酸同一性并且还具有与所述参考氨基酸序列相同性质的生物活性的氨基酸序列。
如本文所述,与参考氨基酸序列具有至少45%氨基酸同一性的氨基酸序列涵盖与所述参考氨基酸序列具有至少46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%氨基酸同一性并且还具有与所述参考氨基酸序列相同性质的生物活性的氨基酸序列。
如本文所述,与参考氨基酸序列具有至少80%氨基酸同一性的氨基酸序列涵盖与所述参考氨基酸序列具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%氨基酸同一性并且还具有与所述参考氨基酸序列相同性质的生物活性的氨基酸序列。
如上所提及,在本发明中编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的一种或多种重组核酸的表达水平由至少一种启动子和至少一种终止子调控,例如在后文中更详细地定义,其分别存在于编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的一种或多种重组核酸的5’和3’位置。
磷酸葡萄糖变位酶-1(PGM1)
磷酸葡萄糖变位酶-1酶是一种蛋白质,其在本领域中被描述用于催化葡萄糖-6-磷酸转化为葡萄糖-1-磷酸(Glucose-1-phosphate)。来源于酿酒酵母的磷酸葡萄糖变位酶-1可称为PGM1。
实施测量面对磷酸葡萄糖变位酶-1活性的多肽的活性水平的方法属于本领域技术人员的常识。
就此而言,本领域技术人员可以有利地参考Tiwari和Bhat描述的方法(Biochemical and Biophysical Research Communications 366,340-345,2008)。
本发明中的具有磷酸葡萄糖变位酶-1活性的优选多肽是EC号为No.5.4.2.2的酶。
根据优选的实施方式,编码具有磷酸葡萄糖变位酶-1活性的多肽的一种或多种重组核酸可来源于生物体,优选选自由原核生物和真核生物组成的组。在一些实施方式中,编码具有磷酸葡萄糖变位酶-1活性的多肽的一种或多种重组核酸可来源于或源自古细菌。在一些实施方式中,编码具有磷酸葡萄糖变位酶-1活性的多肽的一种或多种重组核酸可来源于或源自生物体,优选选自细菌。在优选的实施方式中,编码具有磷酸葡萄糖变位酶-1活性的多肽的一种或多种重组核酸可来源于或源自酿酒酵母。
根据一个实施方式,编码具有磷酸葡萄糖变位酶-1活性的多肽的一种或多种重组核酸可选自由以下组成的组:具有(i)与来源于酿酒酵母的、如序列SEQ ID NO:23所示的核酸序列的至少80%核酸同一性,和(ii)与如序列SEQ ID NO:23所示的核酸序列相同性质的生物活性的核酸序列。
关于该序列的相同性质的生物活性如前所解释,即编码将果糖-6-磷酸转化为葡萄糖-1-磷酸的多肽的能力。
如本文所述,与参考核酸序列具有至少80%核苷酸同一性的核酸序列涵盖与所述参考核酸序列具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%核苷酸同一性并且还具有与所述参考核酸序列相同性质的生物活性的核酸序列。
对于具有来自酿酒酵母的磷酸葡萄糖变位酶-1活性的多肽的氨基酸序列,本领域的技术人员可参考UniProt数据库中的登录号NP33401,或参考本文所述的SEQ ID NO.24。
根据另一个具体的实施方式,编码具有磷酸葡萄糖变位酶-1活性的多肽的一种或多种重组核酸可以是编码具有选自由以下组成的组的氨基酸序列的多肽的一种或多种核酸:具有与如序列SEQ ID NO:24所示的氨基酸序列的至少80%氨基酸同一性,并且还具有与如序列SEQ ID NO:24所示的氨基酸序列的相同性质的生物活性的序列。
关于该序列的相同性质的生物活性如前所述,即催化葡萄糖-6-磷酸转化为葡萄糖-1-磷酸的能力。
如本文所述,与参考氨基酸序列具有至少80%氨基酸同一性的氨基酸序列涵盖与所述参考氨基酸序列具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%氨基酸同一性并且还具有与所述参考氨基酸序列相同性质的生物活性的氨基酸序列。
如上所提及,在本发明中编码具有磷酸葡萄糖变位酶-1活性的多肽的一种或多种重组核酸的表达水平由至少一种启动子和至少一种终止子调控,例如在后文中更详细地定义,其分别存在于编码具有磷酸葡萄糖变位酶-1活性的多肽的一种或多种重组核酸的5’和3’位置。
UTP-葡萄糖-1-磷酸尿苷酰转移酶(UGP1)
UTP-葡萄糖-1-磷酸尿苷酰转移酶(UTP-glucose-1-phosphateuridylyltransferase)是一种蛋白质,其在本领域中被描述用于催化葡萄糖-1-磷酸转化为UDP-葡萄糖。源自酿酒酵母的UTP-葡萄糖-1-磷酸尿苷酰转移酶可称为UGP1。
实施测量具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的活性水平的方法属于本领域技术人员的常识。
在这方面,本领域技术人员可以有利地参考Roeben所述的方法(J.Mol.Biol 364,551-560,2006)。
本发明中的具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的优选多肽是EC号为No.2.7.7.9的酶。
根据优选的实施方式,编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的一种或多种重组核酸可来源于或源自生物体,优选选自由原核生物和真核生物组成的组。在一些实施方式中,编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的一种或多种重组核酸可来源于或源自古细菌。在一些实施方式中,编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的一种或多种重组核酸可来源于或源自生物体,优选选自细菌。在优选的实施方式,编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的一种或多种重组核酸可来源于或源自酿酒酵母。
根据具体的实施方式,编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的一种或多种重组核酸可选自由以下组成的组:具有(i)与来源于酿酒酵母的,如序列SEQ IDNO:25所示的核酸的至少80%核酸同一性,和(ii)与如序列SEQ ID NO:25所示的核酸相同性质的生物活性的核酸序列。
关于该序列的相同性质的生物活性如前所解释,即编码将葡萄糖-1-磷酸转化为UDP-葡萄糖的多肽的能力。
如本文所述,与参考核酸序列具有至少80%核苷酸同一性的核酸序列涵盖与所述参考核酸序列具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%核苷酸同一性并且还具有与所述参考核酸序列相同性质的生物活性的核酸序列。
对于具有源自酿酒酵母的UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的氨基酸序列,本领域的技术人员可参考UniProt数据库中的登录号NP_32861,或参考本文所述的序列SEQ ID NO.26所示的序列。
根据另一个具体的实施方式,编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的一种或多种重组核酸可以是编码具有选自由以下组成的组的氨基酸序列的多肽的一种或多种核酸:具有与SEQ ID NO:26所示的氨基酸序列的至少80%氨基酸同一性,和还有与如SEQ ID NO:26所示的氨基酸序列相同性质的生物活性的序列。
关于该序列的相同性质的生物活性如前所述,即催化葡萄糖-1-磷酸转化为UDP-葡萄糖的能力。
如本文所述,与参考氨基酸序列具有至少80%氨基酸同一性的氨基酸序列涵盖与所述参考氨基酸序列具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%氨基酸同一性并且还具有与所述参考氨基酸序列相同性质的生物活性的氨基酸序列。
如上所提及,在本发明中编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的一种或多种重组核酸的表达水平由至少一种启动子和至少一种终止子调控,例如在后文中更详细地定义,其分别存在于编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的一种或多种重组核酸的5’和3’位置。
葡萄糖胺-6-磷酸N-乙酰转移酶(GNA1)
葡萄糖胺-6-磷酸N-乙酰转移酶(Glucosamine-6-phosphate N-acetyltransferase)是一种蛋白质,其在本领域中被描述用于催化葡萄糖胺-6-磷酸转化为N-乙酰-葡萄糖胺-6-磷酸(N-acetyl-glucosamine-6-phosphate)。源自酿酒酵母的葡萄糖胺-6-磷酸N-乙酰转移酶可称为GNA1。
实施测量具有葡萄糖胺-6-磷酸N-乙酰转移酶活性的多肽的活性水平的方法属于本领域技术人员的常识。
在这方面,本领域技术人员可以有利地参考Li等人所述的方法(Anal.Biochem.370,142-146,2007)。
本发明中具有葡萄糖胺-6-磷酸N-乙酰转移酶活性的优选多肽是EC号为No.2.3.1.4的酶。
根据优选的实施方式,编码具有葡萄糖胺-6-磷酸N-乙酰转移酶活性的多肽的一种或多种重组核酸可来源于或源自生物体,优选选自由原核生物和真核生物组成的组。在一些优选的实施方式中,编码具有葡萄糖胺-6-磷酸N-乙酰转移酶活性的多肽的一种或多种重组核酸可来源于或源自酵母并且尤其是酿酒酵母。
根据具体的实施方式,编码具有葡萄糖胺-6-磷酸N-乙酰转移酶活性的多肽的一种或多种重组核酸可选自由以下组成的组:具有(i)与如序列SEQ ID NO:27所示的核酸序列的至少80%核酸同一性,和(ii)与如序列SEQ ID NO:27所示的核酸序列相同性质的生物活性的核酸序列。如序列SEQ ID NO:27所示的核酸序列编码具有源自酿酒酵母的葡萄糖胺-6-磷酸N-乙酰转移酶(其还可称为GNA1)活性的多肽。
关于该序列的相同性质的生物活性如前所解释,即将葡萄糖胺-6-磷酸转化为N-乙酰-葡萄糖胺-6-磷酸的多肽的能力。
如本文所述,与参考核酸序列具有至少80%核苷酸同一性的核酸序列涵盖与所述参考核酸序列具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%核苷酸同一性并且还具有与所述参考核酸序列相同性质的生物活性的核酸序列。
对于具有源自酿酒酵母的葡萄糖胺-6-磷酸N-乙酰转移酶活性的多肽的氨基酸序列,本领域的技术人员可参考UniProt数据库中的登录号NP_116637,或参考本文所述的SEQID NO.28。
根据另一个具体的实施方式,编码具有葡萄糖胺-6-磷酸N-乙酰转移酶活性的多肽的一种或多种重组核酸可以是编码具有选自由以下组成的组的氨基酸序列的多肽的一种或多种核酸:具有与SEQ ID NO:28所示的氨基酸序列的至少80%氨基酸同一性,和还有与如SEQ ID NO:28所示的氨基酸序列相同性质的生物活性的序列。
关于该序列的相同性质的生物活性如前所述,即催化葡萄糖胺-6-磷酸转化为N-乙酰-葡萄糖胺-6-磷酸的能力。
如本文所述,与参考氨基酸序列具有至少80%氨基酸同一性的氨基酸序列涵盖与所述参考氨基酸序列具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%氨基酸同一性并且还具有与所述参考氨基酸序列相同性质的生物活性的氨基酸序列。
如上所提及,在本发明中编码具有葡萄糖胺-6-磷酸N-乙酰转移酶活性的多肽的一种或多种重组核酸的表达水平由至少一种启动子和至少一种终止子调控,例如在后文中更详细地定义,其分别存在于编码具有葡萄糖胺-6-磷酸N-乙酰转移酶活性的多肽的一种或多种重组核酸的5’和3’位置。
磷酸乙酰葡萄糖胺变位酶(PCM1)
磷酸乙酰葡萄糖胺变位酶(phosphoacetylglucosamine mutase)是一种蛋白质,其在本领域中被描述用于催化N-乙酰-葡萄糖胺-6-磷酸转化为N-乙酰-葡萄糖胺-1-磷酸。源自酿酒酵母的磷酸乙酰葡萄糖胺变位酶可称为PCM1。
实施测量具有磷酸乙酰葡萄糖胺变位酶活性的多肽的活性水平的方法属于本领域技术人员的常识。
在这方面,本领域技术人员可以有利地参考Bandini等人所述的方法(MolecularMicrobiology 85(3),513-534,2012)。
本发明中具有磷酸乙酰葡萄糖胺变位酶活性的优选多肽是EC号为NO.5.4.2.3的酶。
根据优选的实施方式,编码具有磷酸乙酰葡萄糖胺变位酶活性的多肽的一种或多种重组核酸可来源于或源自生物体,优选选自由原核生物和真核生物组成的组。在一些优选的实施方式中,编码具有磷酸乙酰葡萄糖胺变位酶活性的多肽的一种或多种重组核酸可来源于或源自酵母,并且尤其是酿酒酵母。
根据具体的实施方式,编码具有磷酸乙酰葡萄糖胺变位酶活性的多肽的一种或多种重组核酸可选自由以下组成的组:具有(i)与如序列SEQ ID NO:29所示的核酸序列的至少80%核酸同一性,和(ii)与如SEQ ID NO:29所示的核酸序列相同性质的生物活性的核酸序列。如SEQ ID NO:29所示的核酸编码具有源自酵母的磷酸乙酰葡萄糖胺变位酶(其还可称为PCM1)活性的多肽。
关于该序列的相同性质的生物活性如前所解释,即将N-乙酰-葡萄糖胺-6-磷酸转化为N-乙酰-葡萄糖胺-1-磷酸的多肽的能力。
如本文所述,与参考核酸序列具有至少80%核苷酸同一性的核酸序列涵盖与所述参考核酸序列具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%核苷酸同一性并且还具有与所述参考核酸序列相同性质的生物活性的核酸序列。
对于具有源自酿酒酵母的磷酸乙酰葡萄糖胺变位酶活性的多肽的氨基酸序列,本领域的技术人员可参考UniProt数据库中的登录号NP_010856,或参考本文所述的SEQ IDNO.30。
根据另一个具体的实施方式,编码具有磷酸乙酰葡萄糖胺变位酶活性的多肽的一种或多种重组核酸可以是编码具有选自由以下组成的组的氨基酸序列的多肽的一种或多种核酸:具有与SEQ ID NO:30所示的氨基酸序列的至少80%氨基酸同一性,和还有与如SEQID NO:30所示的氨基酸序列相同性质的生物活性的序列。
关于该序列的相同性质的生物活性如前所述,即催化N-乙酰-葡萄糖胺-6-磷酸转化为N-乙酰-葡萄糖胺-1-磷酸的能力。
如本文所述,与参考氨基酸序列具有至少80%氨基酸同一性的氨基酸序列涵盖与所述参考氨基酸序列具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%氨基酸同一性并且还具有与所述参考氨基酸序列相同性质的生物活性的氨基酸序列。
如上所提及,在本发明中编码具有磷酸乙酰葡萄糖胺变位酶活性的多肽的一种或多种重组核酸的表达水平由至少一种启动子和至少一种终止子调控,例如在后文中更详细地定义,其分别存在于编码具有磷酸乙酰葡萄糖胺变位酶活性的多肽的一种或多种重组核酸的5’和3’位置。
启动子
如本文所公开,已被遗传工程化以获得根据本发明的重组细胞的目标基因的表达包含在本发明的重组细胞中并且特别是在本发明的重组酵母细胞(特别包括酿酒酵母)中具有功能的适当调控序列。
多种启动子可用于目标编码序列的所想要表达。
根据本发明的启动子可以选自由下列启动子组成的组:
·pTDH3(SEQ ID NO:31)、
·pTDH3.sk(SEQ ID NO:32)、
·pTDH3-1.Sba(SEQ ID NO:33)、
·pTDH3.Sar(SEQ ID NO:34)、
·pENO2(SEQ ID NO:35)、
·pTEF3(SEQ ID NO:36)、
·pTEF1(SEQ ID NO:37)、
·pTEF1.ago(SEQ ID NO:38)、
·pTEF1.sba(SEQ ID NO:39)、
·pPDC1(SEQ ID NO:40)、
·pCCW12(SEQ ID NO:41)、
·pCCW12.Sm(SEQ ID NO:42)、
·pCCW12.sk(SEQ ID NO:43)、
·pCCW12.sba(SEQ ID NO:44)、
·pCCW12.sar(SEQ ID NO:45)、
·pNUP57(SEQ ID NO:46)、
·pCCW10.ago(SEQ ID NO:47)、
·pCWP2(SEQ ID NO:48)、
·pCCW120.Sca(SEQ ID NO:49)和
·pRPLA1(SEQ ID NO:50)。
在本发明中更特别的目标启动子可以选自由以下组成的组:
·pTDH3(SEQ ID NO:31)、
·pTDH3.sk(SEQ ID NO:32)、
·pTDH3-1.Sba(SEQ ID NO:33)、
·pTDH3.Sar(SEQ ID NO:34)、
·pENO2(SEQ ID NO:35)、
·pTEF3(SEQ ID NO:36)、
·pTEF1(SEQ ID NO:37)、
·pTEF1.ago(SEQ ID NO:38)、
·pTEF1.sba(SEQ ID NO:39)、
·pPDC1(SEQ ID NO:40)、
·pCCW12(SEQ ID NO:41)、
·pCCW12.Sm(SEQ ID NO:42)、
·pCCW12.sk(SEQ ID NO:43)、
·pCCW12.sba(SEQ ID NO:44)和
·pCCW12.sar(SEQ ID NO:45)。
所述启动子可以特别选自由以下组成的组:pTDH3、pTDH3-1.Sba、pTDH3.Sar、pENO2、pTEF3、pTEF1、pPDC1、pCCW12、pCCW12.Sm、pCCW12.sk、pCCW12.sba和pCCW12.sar。
替选地,在本发明中的目标启动子可选自由以下组成的组:
·pNUP57(SEQ ID NO:46)和
·pCCW10.ago(SEQ ID NO:47)。
本发明中的其他目标启动子可为:
·pCWP2(SEQ ID NO:48);
·pCCW120.Sca(SEQ ID NO:49);和
·pRPLA1(SEQ ID NO:50)。
如前所提及,诱导型或阻遏型启动子是其活性受生物或非生物因子的存在或不存在以及还有所述因子的量控制的启动子。因此,对于一些启动子,当给定因子的量增加或被增加时,它们的活性将尤其被诱导并因此增加,并且相应地,当所述因子的量减少或被减少时,这些相同启动子的活性可以被阻遏并因此降低。包含诱导型或阻遏型启动子的本发明的重组酵母细胞的培养基中的所述一种或多种因子的量可以由本领域技术人员决定并因此控制。
例如,增加包含pCUP-1启动子的根据本发明的重组酵母细胞的培养基中铜的量将诱导并因此增加该启动子控制下的基因的转录。相反,减少所述培养基中铜的量将导致阻遏,并因此导致该启动子控制下的基因转录减少。
在另一个实例中,增加包含pMET6启动子的根据本发明的重组酵母细胞的培养基中甲硫氨酸的量将阻遏并因此减少该启动子控制下的基因的转录。相反,减少所述培养基中甲硫氨酸的量将导致在该启动子控制下的基因转录诱导,并因此导致该启动子控制下的基因转录增加。
由于这个原因,以下启动子在本上下文中称为“诱导型或阻遏型启动子”。
根据第一实施方式,根据本发明的诱导型或阻遏型启动子可以选自包括以下的组:铜诱导型或阻遏型的启动子、甲硫氨酸诱导型或阻遏型启动子以及苏氨酸诱导型或阻遏型启动子,并且特别是pCUP1-铜诱导型或阻遏型。
根据该实施方式,根据本发明的诱导型或阻遏型启动子可以特别是pCUP1(SEQ IDNO:51)。
因此,如上所指定,这些启动子的活性是通过增加甲硫氨酸、铜或苏氨酸的存在来诱导的,并且当甲硫氨酸、铜或苏氨酸的量减少时,它们的活性减弱,即受阻遏。
根据第二实施方式,根据本发明的诱导型或阻遏型启动子可以选自包括以下的组:铜诱导型或阻遏型启动子、赖氨酸诱导型或阻遏型启动子以及甲硫氨酸诱导型或阻遏型启动子,并且特别选自由以下组成的组:
·pMET6-甲硫氨酸诱导型或阻遏型(SEQ ID NO:52)、
·pMET25-甲硫氨酸诱导型或阻遏型(SEQ ID NO:53)和
·pSAM1-甲硫氨酸诱导型或阻遏型(SEQ ID NO:54)。
根据该具体的实施方式,根据本发明的诱导型或阻遏型启动子可以选自由pMET6、pMET25和pSAM1组成的组。
因此,这些启动子的活性被如上所指定的甲硫氨酸、铜、赖氨酸或葡萄糖的存在增加所抑制,并且当甲硫氨酸、铜、赖氨酸或葡萄糖的量减少时,它们的活性增加,即被诱导。
在具体的实施方式中,根据本发明的诱导型或阻遏型启动子可以选自包括以下的组:铜诱导型或阻遏型启动子、葡萄糖诱导型或阻遏型启动子、赖氨酸诱导型或阻遏型启动子、甲硫氨酸诱导型或阻遏型启动子,和苏氨酸诱导型或阻遏型启动子。
在更具体的实施方式中,根据本发明的诱导型或阻遏型启动子可以选自由pCUP1、pMET6、pSAM1和pMET25组成的组。
在本发明的具体的实施方式中,本发明中的目标启动子可以选自由以下组成的组:
·pTDH3(SEQ ID NO:31),
·pTEF1(SEQ ID NO:37),
·pTEF1.ago(SEQ ID NO:38),
·pPDC1(SEQ ID NO:40),
·pCCW12(SEQ ID NO:41),
·pCCW12.sk(SEQ ID NO:43),
·pCCW12.sba(SEQ ID NO:44),
·pCCW12.sar(SEQ ID NO:45),
·pCWP2(SEQ ID NO:48),
·pCCW120.Sca(SEQ ID NO:49),
·pCUP1(SEQ ID NO:51),
·pMET6(SEQ ID NO:52),和
·pSAM1(SEQ ID NO:54)。
还可以使用如Blazeck&Alper(2013)Biotechnol.J.8 46-58所述的合成启动子。
本发明的启动子可来源于来自酵母菌纲的任何生物体,并且可以特别来源于选自由以下中至少一者组成的组的生物体:酿酒酵母、布拉氏酵母、卡氏酵母、贝酵母、树生酵母(Saccharomyces arboricola)、库德里阿兹威酵母(Saccharomyces kudriavzevii)、米卡酵母、棉阿舒囊霉、乳酸克鲁维酵母(Kluveromyces lactis)、巴斯德毕赤酵母(Pichiapastoris)、光滑念珠菌、热带念珠菌、卡氏德巴利酵母(Debaryomyces castelii)、解脂耶氏酵母(Yarrowia lipolitica)和杰丁塞伯林德纳氏酵母(Cyberlindnera jadinii)。
本发明的启动子可以优选来源于选自由以下组成的组的生物体:酿酒酵母(sc)、米卡酵母(Sm)、库德里阿兹威酵母(sk)、贝酵母(sba)和树生酵母(Sar)。
终止子
如其在本文中所公开,已被遗传工程化以获得根据本发明的重组细胞并且特别是根据本发明的重组酵母的目标基因的表达包含在本发明的重组细胞中并且特别是在本发明的重组酵母细胞中(特别是酿酒酵母中)具有功能的适当转录终止子序列。
相同或不同的所述转录终止子可见于文献Yamanishi等人,(2013)ACS syntheticbiology2,337-347。
本发明中更特别的目标终止子可以选自包括以下的组:
·来自编码磷酸丙糖异构酶的基因的tTPI1(SEQ ID NO:55),
·来自编码O-乙酰高丝氨酸-O-乙酰丝氨酸硫化氢解酶的基因的tMET25(SEQ IDNO:56)、
·tDIT1(SEQ ID NO:57)、
·tRPL3(SEQ ID NO:58)、
·tRPL3.sm(SEQ ID NO:59)、
·tRPL3.sba(SEQ ID NO:60)、
·tRPL41B(SEQ ID NO:61)、
·tRPL15A(SEQ ID NO:62)、
·tRPL15A.sba(SEQ ID NO:63)、
·tIDP1(SEQ ID NO:64)和
·tTEF1.sba(SEQ ID NO:65)。
特别地,所述终止子可以选自由tTPI1、tMET25、tDIT1、tRPL3、tRPL3.sm、tRPL3.sba、tRPL41B、tRPL15A、tRPL15A.sba、tIDP1和tTEF1.sba组成的组。
本发明的终止子可以来源于来自酵母菌纲的任何生物体,并且具体可以来源于选自由酿酒酵母和贝酵母组成的组的生物体。
重组酵母
本发明的重组细胞可以选自由酵母和细菌组成的组。
本发明的重组细胞、例如本发明的重组宿主细胞优选是重组酵母细胞。
通常,与细菌相比,酵母可以快速生长并且可以以更高的密度培养,并且不需要工业环境中的无菌环境。此外,酵母细胞与细菌细胞相比可以更容易从培养基中分离,大大简化了产品提取和纯化的工艺。
本发明的重组细胞、特别是本发明的重组酵母细胞优选是酵母目(Saccharomycetales)细胞。
本发明的重组细胞并且特别是本发明的重组酵母可以尤其属于酵母属,或属于念珠菌属,或属于克鲁维酵母菌属,或属于汉逊酵母属,或属于耶氏酵母属,或属于德巴利酵母属,或属于阿舒囊霉属。
属于酵母属的本发明的重组细胞可以选自由以下组成的组:酿酒酵母、布拉氏酵母、贝酵母、奇异酵母、米卡酵母、卡氏酵母、里约酵母(Saccharomyces cariocanus)、库德里阿兹威酵母(Saccharomyces kudriavzevii)、树生酵母(Saccharomyces arboricolus)、巴斯德酵母(Saccharomyces pastorianus)、葡萄汁酵母(Saccharomyces uvarum)和德尔布酵母(Saccharomyces delbrueckii)。
属于念珠菌属的本发明的重组细胞可以选自由以下组成的组:白念珠菌、光滑念珠菌(Candida glabrata)、热带念珠菌(Candida tropicalis)、都柏林念珠菌(Candidadubliniensis)、近平滑念珠菌(Candida parapsilosis)、葡萄牙念珠菌(Candidalusitaniae)和吉利蒙念珠菌(Candida guilliermondii)。
属于克鲁维酵母属的本发明的重组细胞可以选自由以下组成的组:乳酸克鲁维酵母、马克斯克鲁维酵母、多孢克鲁维酵母、耐热克鲁维酵母、多布克鲁维酵母(Kluyveromyces dobzhanskii)和柳叶克鲁维酵母(Kluyveromyces wickerhamii)。
属于汉逊酵母属的本发明的重组细胞可以选自由以下组成的组:多形汉逊酵母、Ogataea histrianica、Ogataea deakii、Ogataea kolombanensis、Ogataea philodendra、暹罗汉逊酵母(Ogataea siamensis)、狭窄汉逊酵母(Ogataea angusta)、副多形汉逊酵母(Ogataea parapolymorpha)、Ogataea minuta、非发酵汉逊酵母(Ogataea nonfermentans)和Ogataea kodamae。
属于耶氏酵母属的本发明的重组细胞可以选自由以下组成的组:解脂耶氏酵母、Yarrowia parophonii、Yarrowia galli、奥斯陆耶氏酵母(Yarrowia oslonensis)、营养耶氏酵母(Yarrowia alimentaria)、荷兰耶氏酵母(Yarrowia hollandica)和Yarrowiayakushimensis。
属于德巴利酵母属的本发明的重组细胞可以选自由以下组成的组:汉逊德巴利酵母、卡森德巴利酵母(Debaryomyces carsonii)、卡氏德巴利酵母(Debaryomycescastellii)、Debaryomyces marama、西方德巴利酵母(Debaryomyces occidentalis)、卵形德巴利酵母(Debaryomyces oviformis)、尼泊尔德巴利酵母(Debaryomyces nepalensis)、Debaryomyces coudertii、乌德尼德巴利酵母(Debaryomyces udenii)、Debaryomycespsychrosporus和山田德巴利酵母(Debaryomyces yamadae)。
属于阿舒囊霉属的本发明的重组细胞可以选自由棉阿舒囊霉和Ashbya aceri组成的组。
本发明的重组细胞、特别是本发明的重组酵母细胞可以特别选自由以下组成的组:酿酒酵母、布拉氏酵母、贝酵母、奇异酵母、米卡酵母、卡氏酵母、白念珠菌、光滑念珠菌、热带念珠菌、乳酸克鲁维酵母、马克斯克鲁维酵母、多孢克鲁维酵母、耐热克鲁维酵母、多形汉逊酵母、解脂耶氏酵母、汉逊德巴利酵母和棉阿舒囊霉,并且优选酿酒酵母。
在具体的实施方式中,根据本发明的重组酵母细胞属于酵母属、克鲁维酵母属或假囊酵母属(Eremothecium),更特别地属于选自由以下组成的组的物种:酿酒酵母、马克斯克鲁维酵母、多形汉逊酵母和棉阿舒囊霉。
在一个实施方式中,本发明的重组宿主细胞是所选的酵母,其属于酵母菌目,特别是酵母菌科,并且尤其选自由以下组成的组:解脂耶氏酵母、马克斯克鲁维酵母、多形汉逊酵母、棉阿舒囊霉和酿酒酵母。
本发明的重组细胞可以最优选为酿酒酵母细胞。
如上所提及,根据本发明的重组细胞具有通过插入根据本发明的一种或多种重组核酸生产肝素前体的能力。在某些实施方式中,根据本发明的重组酵母具有通过插入根据本发明的一种或多种重组核酸生产具有受控尺寸的肝素前体的能力。
实施以将特定DNA构建体插入基因内的方法属于本领域技术人员的常识。在后文实施例中更详细地描述相关方法。
然而,遇到了意想不到的技术困难,因为将DNA构建体插入细胞基因组内并且特别是酵母基因组内、例如酿酒酵母基因组内的后果是不可预测的。具体地,细胞、特别是酵母的存活率、以及它们生长和生产所想要肝素前体的能力也是不可预测的。
为了获得本发明的重组细胞、特别是重组酵母,发明人测试了许多不同的构建体,以获得可行且有效的重组细胞、特别是酵母细胞。
培养条件
本发明还涉及本发明的重组细胞用于生产肝素前体、特别是具有受控分子量的肝素前体的用途。
本发明还涉及一种生产肝素前体、特别是具有所想要分子量的肝素前体的方法,其包括:
(a)在培养基中培养根据本发明的重组细胞持续足以生产肝素前体的时间;和
(b)任选地从所述重组细胞和/或从所述培养基分离或回收所述肝素前体。
通常,将本发明的细胞并且特别是本发明的酵母在适当的培养基中在约20℃至约37℃范围内的温度下、优选在27至34℃范围内的温度下生长。
适用于本发明的细胞并且特别是本发明的酵母的生长培养基是常见的商业制备的培养基,例如包含酵母氮源、硫酸铵和右旋糖作为碳/能源的液体培养基,或YPD培养基,一种最适合生长的最佳比例的蛋白胨、酵母提取物和右旋糖的掺混物。也可以使用其他限定的或合成的生长培养基,并且用于特定细胞并且特别是酵母生长的适当培养基是微生物学或发酵科学领域的技术人员已知的。
适用于本文的具体培养基是SY培养基,其包含以下成分:
KH2PO4:100mM;MgSO4 7H2O:2,8mM;K2SO4:11,5mM;Na2SO4:1,1mM;NaCl:2,6mM;CaCl2 2H2O:0,7mM;CuSO4 5H2O:15μM;KI:6μM;FeCl3:30μM;ZnSO4 7H2O:61μM;MnSO4 H2O:25μM;H2SO4:110μM;泛酸半钙盐:42μM;硫胺盐酸盐:59μM;吡哆醇盐酸盐:49μM;肌醇(C6H12O6):555μM;烟酸(C6H5NO2):29μM;D-生物素:0,82μM;柠檬酸三铵:33mM;和葡萄糖或蔗糖2-30%。
可用于培养基中的碳源包括果糖、甘露糖、木糖和阿拉伯糖;寡聚糖,例如乳糖、麦芽糖、半乳糖或蔗糖;多糖,例如淀粉或纤维素或其混合物,以及来自可再生原料的未纯化混合物,例如奶酪乳清渗透玉米浆、甜菜糖蜜和大麦麦芽。
培养基中可包含的氮源包括蛋白胨、酵母提取物、肉提取物、麦芽提取物、尿素、硫酸铵、氯化铵、硝酸铵、磷酸铵、柠檬酸铵及其组合。
培养基还可包含微量元素(例如金属盐),例如镁盐、钴盐和/或锰盐;以及生长因子例如氨基酸、维生素、生长促进剂等。
可以包含的维生素的实例是泛酸半钙、硫胺盐酸盐;吡哆醇盐酸盐;肌醇;烟酸;D-生物素、叶酸、对氨基苯甲酸、核黄素。
本发明的培养基还可包含稀有元素,例如CuSO4·5H2O、KI、FeCl3、ZnSO4·7H2O、MnSO4·H2O或H2SO4、MgCl2、CaCl2、NaCl、K2HPO4、KH2PO4、ZnCl、H3BO3、MnSO4、Na2MoO4
术语“适当的培养基”如上所定义。
用于根据本发明的重组细胞的已知培养基的实例是本领域技术人员已知的,并且呈现于以下出版物D.Burke等人,Methods in yeast Genetics-Acold spring harborlaboratory course Manual(2000)中。
适合发酵的pH范围可以是pH 3.0至pH 7.5,其中优选pH 4至pH 6作为初始条件。
如本说明书其他地方提到的,可以在本发明方法的培养步骤期间调节培养基的pH值,以调节具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的活性,这将影响由本发明的重组细胞并且特别是由本发明的重组酵母生产的肝素前体分子的分子量。
具体地,可以根据意在由重组酵母生产的肝素前体来改变培养基的pH。例如,在培养时间期间,培养基的pH可以保持在4、5.5或6的pH。
在具体的实施方式中,培养基的pH可以在本发明的重组细胞、特别是本发明的重组酵母的培养时间长度期间改变或被改变。如前所提及,酿酒酵母酸化培养其的培养基,从而降低其培养基的pH。例如,培养基的pH可以从6开始,可以降至4,然后回到6。在另一个实例中,培养基的pH可以开始于6,保持或维持在6,然后可以降低至4。
在具体的实施方式中,可以在本发明方法的培养步骤(a)期间调节培养基的pH,使得在本发明方法的培养步骤结束时,培养基的pH与所述培养步骤(a)开始时的pH相同。
在另一个实施方式中,培养基的pH可以在本发明的重组细胞并且特别是本发明的重组酵母细胞的培养时间长度期间保持相同。
根据本发明的重组细胞并且特别是本发明的重组酵母细胞的所述培养时间长度可以根据目标肝素前体的分子量而变化。所述时间长度越长,本发明的重组细胞并且特别是本发明的重组酵母细胞的给定培养基中的肝素前体的分子量越低。
本发明的重组细胞并且特别是本发明中的重组酵母的培养时间的时间长度可以是约35小时至约50小时,优选约40小时至约50小时,并且特别是约48小时的时间段。
发酵可以在需氧条件或微需氧条件下进行。
发酵培养基中肝素前体产物的量可以使用本领域已知的多种方法测定,例如高效液相色谱(HPLC)或气相色谱(GC)。
本方法可以采用分批发酵方法。经典的分批发酵是一个封闭系统,其中培养基的组成在发酵开始时就设定好,并且在发酵过程中不受到人工改变。因此,在发酵开始时,用所想要的一种或多种生物体接种培养基,并且允许发酵发生而不向系统添加任何东西。然而,典型地,“分批”发酵方法或系统在碳源的添加方面是分批的,并且经常尝试控制例如温度、pH和氧浓度的因素。在分批系统中,系统的代谢物和生物质组成不断变化,直到发酵停止。在分批培养中,细胞通过静态滞后期进入高生长对数期,并且最后进入其中生长速率降低或停止的稳定期。如果不处理,处于稳定期的细胞最终会死亡。对数期的细胞通常负责最终产品或中间体的大部分生产。
补料分批系统也可用于本发明。补料分批系统与典型的分批系统相似,不同之处在于碳源底物随着发酵的进行而增量添加。当分解代谢物阻遏(例如葡萄糖阻遏)容易抑制细胞的代谢时并且当想要培养基中的底物量有限时,分批补料系统非常有用。分批补料系统中实际底物浓度的测量很困难,因此需要根据例如pH、溶解氧和废气(例如CO2)分压的可测量因素的变化进行估计。
分批和补料分批培养方法是本领域常见且众所周知的,并且实例可见于Biotechnology:A Textbook of Industrial Microbiology,Crueger、Crueger和Brock,第二版(1989)Sinauer Associates,Inc.,麻萨诸塞州桑德兰,或Deshpande,Mukund V.,Appl.Biochem.Biotechnol.,36,227,(1992)。尽管本发明以分批模式进行,但预期该方法将适用于连续发酵。
连续发酵是一个开放系统,其中将确定的发酵培养基连续添加到生物反应器,并同时取出等量的条件培养基进行处理。连续发酵通常将培养物维持在恒定的高密度,其中细胞主要处于对数生长期。
连续发酵可以调节影响细胞生长或最终产物浓度的一种因素或任何数量的因素。例如,一种方法将限制性营养物(例如碳源或氮水平)维持在固定速率,并允许所有其他参数变化。在其他系统中,影响生长的多种因素可以连续改变,而通过培养基浊度测量的细胞浓度保持恒定。连续系统努力维持稳态生长条件,并因此由于排出培养基而导致的细胞损失必须与发酵中的细胞生长速率相平衡。调节连续发酵过程的营养物和生长因子的方法以及用于最大化产物形成速率的技术是工业微生物学领域众所周知的。
预期本发明可以使用分批、补料分批或连续方法来实施,并且任何已知的发酵模式都是合适的。另外,预期细胞可作为全细胞催化剂固定在基质上并经受发酵条件以进行生产。
为了仍然提高肝素前体产量,特定的实施方式可以包括在适当的培养基,例如上述培养基中培养本发明的重组细胞,特别是本发明的重组酵母细胞,其中所述培养基包含最佳量的碳源,尤其是葡萄糖或蔗糖。
在优选的实施方式中,所述最佳培养基中所包含的碳源由葡萄糖和/或蔗糖组成。在优选的实施方式中,所述最佳培养基包含1%w/w或更多的葡萄糖和/或蔗糖,具体地包含5%w/w或更多的葡萄糖和/或蔗糖,具体地包含10%w/w或更多的葡萄糖和/或蔗糖,具体地包含15%w/w或更多的葡萄糖和/或蔗糖。在优选的实施方式中,所述最佳培养基包含最多40%w/w葡萄糖,其包括最多35%w/w葡萄糖。
在优选的实施方式,本发明的方法在工业规模上进行。
更具体地,根据本发明的方法的培养基可以是至少约100L,更优选地在约1000L至约3000L的范围内,甚至更优选约10,000L、甚至更优选100,000L,或甚至约250,000L。
本发明还涉及一种用于生产如前所述的肝素前体并且包括以下步骤的方法:
(a)在培养基中培养本发明的重组细胞;和
(b)从所述培养基回收肝素前体,
其中步骤(b)中回收的肝素前体具有通过选择以下控制的分子量:
-本发明的重组细胞并且特别是本发明的重组酵母的编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的一种或多种重组核酸的性质和来源,
-控制本发明的重组细胞并且特别是本发明的重组酵母的编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的一种或多种重组核酸的表达的启动子的性质和来源,
-与本发明的重组细胞并且特别是本发明的重组酵母的编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的一种或多种重组核酸相关的锚定信号的存在或不存在,
-在培养本发明的重组细胞并且特别是本发明的重组酵母的步骤期间培养基的pH,和/或
-本发明的重组细胞并且特别是本发明的重组酵母的培养持续时间。
肝素前体的分子量可以是具体分子量,或更优选特定范围的分子量,例如小于50kDa,范围为约20kDa至约50kDa、大于或等于50kDa,范围为约50kDa至约150kDa,范围为约50kDa至约250kDa,大于或等于100kDa,范围为约100kDa至约1500kDa,范围为约150kDa至约1500kDa、大于1000kDa或大于1500kDa。
本发明还涉及根据本发明的重组细胞并且特别是本发明的重组酵母细胞用于生产分子量在约20kDa至约50kDa或约50kDa至约1000kDa的范围内的肝素前体的用途。
例如,本发明的分泌信号可具有:
-如SEQ ID NO:66所示的核酸序列;和/或
-如SEQ ID NO:67所示的氨基酸序列。
例如,本发明的锚定信号可具有:
-如SEQ ID NO:68所示的核酸序列;和/或
-SEQ ID NO:69所示的氨基酸序列。
分泌信号可通过生产嵌合核酸来融合至具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽,所述嵌合核酸由编码信号肽的核酸序列开始,然后是如前所述的编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的重组核酸。
分泌信号和锚定信号可通过生产嵌合核酸来融合至具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽,所述嵌合核酸由编码信号肽的核酸序列开始,然后是如前所述的编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的重组核酸,然后是编码锚定信号的核酸序列。
此类嵌合核酸序列可以通过本领域技术人员已知的技术获得,例如核酸的化学合成或任何重组技术例如克隆或PCR。
肝素前体的纯化
根据本发明的一个具体方面,肝素前体的发酵生产包括从培养基中分离肝素前体的步骤。从培养基中回收肝素前体是本领域技术人员的常规任务。这可以通过本领域熟知的多种技术来实现,包括但不限于全蒸发、选择性沉淀、过滤、离心、喷雾干燥、冻干或液体提取。本领域技术人员知道如何根据待分离材料的特性来调整每种技术的参数。
优选使用酵母作为本发明的细胞模型,因为合成的肝素前体完全输出到细胞外,从而简化了纯化过程。
气提是用选自氦气、氩气、二氧化碳、氢气、氮气或其混合物的汽提气体实现的。
液体萃取是用有机溶剂作为疏水相实现的,例如戊烷、己烷、庚烷或十二烷。也可以使用再生溶剂。
衍生物
如本文所用的术语“肝素前体”还意在涵盖肝素前体的衍生物,例如但不限于可用于美容品、调味品、香料产品、食品、食物、饮料、食品定形剂、药物组合物、膳食补充剂、营养制品、清洁产品和/或牙科和/或口腔卫生组合物或其组合的应用的肝素(硫酸化肝素前体)。
如本文所用,“肝素前体的衍生物”是已经用化学或酶促方法修饰的肝素前体化合物,并因此包含与肝素前体类似的结构。这些衍生物可表现出与肝素前体相同或不同的生物活性。
合适的肝素前体衍生物包括但不限于肝素、依诺肝素、达肝素和亭扎肝素。
肝素可用作抗凝剂(血液稀释剂),并可用于减轻心脏病发作和不稳定心绞痛的风险、预防和/或治疗心脏病发作和不稳定心绞痛。
具体地,肝素通常用于抗凝目的,以减轻疾患风险、减少、预防和/或治疗疾患,所述疾患例如但不限于:
·急性冠状综合征,例如NSTEMI;
·心房颤动;
·深静脉血栓和肺栓塞;
·用于心脏手术的心肺转流术;
·用于体外生命支持的ECMO回路;
·血液滤过;和/或
·留置中心或外周静脉导管。
肝素及其低分子量衍生物(例如依诺肝素、达肝素、亭扎肝素)可有效预防处于风险中的人的深静脉血栓和肺栓塞。
肝素通过注射至静脉或皮下来给药。
其他用途包括试管和肾透析机内部的应用。
肝素前体、特别是肝素可以制备为组合物。
制剂和产品
本发明的组合物可掺入制剂/产品,例如营养、药用、兽用、酿酒或美容制剂/产品。
因此,本发明提供了包含本发明的组合物的制剂。例如,本发明可以提供包含本发明的组合物的美容制剂。
本发明还提供了包含本发明的组合物的产品。例如,本发明可以提供包含本发明的组合物的美容品。
“美容品”意在表示意在与人体外部(表皮、毛发系统、指甲、嘴唇和外生殖器官)或牙齿和口腔黏膜接触放置的任何物质或混合物,其目的专门或主要是清洁它们、给它们加香、改变它们外观、保护它们、使它们保持良好状态、纠正体臭和/或其组合。
“物质”意在表示自然状态下或通过任何制造过程获得的化学元素和其化合物,包括保持其稳定性所必需的任何添加剂以及源自所用过程的任何杂质,但不包括可以在不影响物质的稳定性或改变其组成的情况下分离的任何溶剂。
“混合物”旨在表示由两种或更多种物质组成的混合物或溶液。
本发明还提供了本发明的组合物在营养、药用、兽用、酿酒或美容制剂/产品中的用途。
此类制剂或产品在下文中称为“本发明的制剂或产品”。
营养、药用、兽用、酿酒或美容制剂/产品还可任选地包含药用/兽用/美容(包括美容活性)成分,例如赋形剂、载体及其混合物(如果存在)。
“美容”或“美容活性成分”意指任何和所有天然的、天然存在的、性质相同的、人造合成生产的、生物合成生产的、可持续的、可再生的和/或可生物降解的化合物、成分、中间体、分子、物质、原材料或产品,单独地或作为以下的混合物的一部分:化合物、成分、中间体、分子、物质、原材料或产物、共混物、组合物、制剂(包括但不限于皮肤保湿剂、面霜、香膏、精华液、油、眼部、面部彩妆、水洗型洗发产品、免洗发产品、染发剂(包括但不限于天然染发剂)和/或其组合)、成品和相关技术,包括但不限于掺入例如美容制剂中的组分(例如但不限于天然着色剂、防腐剂、乳化剂、抗氧化剂等,其例如对皮肤、头发、头皮等不具有活性,但在成品的配方中发挥作用)、递送系统、营销助剂(例如,应用于半透明制剂的彩色单球体)以及制造与之相关的任何东西的方法,其可用于/用于/旨在用于:
-通过摩擦、倾倒、喷洒、喷雾或以其他方式直接在人体或动物体上或至人体或动物体,和/或通过与人体或动物体的各种外部和/或表面部分(包括但不限于皮肤、头发、体毛、毛发系统、头皮、指甲、嘴唇、外生殖器、牙齿、口腔和/或鼻粘膜等)接触来施加;和/或间接施加在人体或动物体上或至人体或动物体,例如作为纺织品的一部分施加或作为施加至纺织品的递送设备(例如胶囊)或递送系统(例如共混物或制剂)的一部分施加至纺织品;和/或
-清洁、护理、冷却、美化、调理、处理、舒缓、纹理化、增强吸引力、保护、维持、改善、增强、改变和/或变化人体或动物体的外部部分和/或表面(例如但不限于头皮)或人体或动物体的美观外观;和/或主要目的是清洁或加香,或保护或保持良好状态,或对抗体臭,或改变皮肤、口腔粘膜、头皮或头发的外观,或纠正或修复皮肤、口腔粘膜、头皮或头发的不平衡状态(通过提供皮肤的舒缓、愈合、修复或再生、水合),或以便提供干燥、刺激、损伤或疲劳状态的缓解、润滑、润湿、调理、治愈、消毒、缓解、纠正和/或补救,和/或目的是纠正色素沉着障碍或提供头皮屑、痤疮、刺激和/或炎症等的非药物预防和/或治疗和/或重新平衡皮肤表面上的细菌菌群(例如微生物组)(例如通过提供皮肤表面上的有益细菌菌群的水平),和/或目的是保持人体或动物体处于良好状态以实现健康和/或福祉目的,和/或通过例如改善施加至人体或身体的产品的外观来改善人体或动物体的外观;和/或
-提供美容和/或皮肤病学功能和/或具有生物活性益处的益处(但不影响身体的结构或功能。为避免疑义,美容品或美容品活性成分(Cosmetic or Cosmetic ActiveIngredient)或其任何部分也可能有资格作为功能性成分和/或营养制品。
“功能性成分”意指提供药用或健康益处的食物成分或食物部分,包括以下中的任一者:类胡萝卜素、膳食纤维、脂肪酸、皂苷、抗氧化剂、类黄酮、异硫氰酸酯、苯酚、多酚(例如白藜芦醇)、植物甾醇或甾烷醇(植物甾醇和植物甾烷醇)、多元醇、益生元、植物雌激素、大豆蛋白、硫化物/硫醇、维生素、葡萄糖胺、防腐剂、水合剂、可食用胶凝成分、可食用凝胶混合物和凝胶组合物、长链脂族饱和伯醇、着色剂、调质剂、乳化剂及其组合。
“营养制品”意指任何和所有天然、天然存在、可持续、合成生产和生物合成生产的化合物、化合物混合物、功能成分、分子、组合物、原材料和中间体(包括与其相关的组分和递送设备(例如胶囊)、其递送系统(例如掺混物或制剂),及制备前述物质的方法),它们与健康和/或美容益处以及改善或维持人体外观相关。为避免疑义,营养制品包括可用作食品或饮料补充剂的化合物,无论是固体制剂、胶囊剂、片剂、液体制剂、溶液还是混悬剂。
替选地,营养、药用、兽用、酿酒或美容制剂/产品可以由本发明的组合物组成或基本上由本发明的组合物组成。
美容制剂/产品可以是抗老化制剂。
如本文所用,提及药学、兽用或美容上可接受的赋形剂可以指本领域技术人员已知的药学、兽用或美容上可接受的佐剂、稀释剂和/或载体。
“药学上/兽用/美容上可接受的”意指组合物的附加组分通常是安全的、无毒的,并且在生物学上或其他方面都不是不期望的。例如,附加组分通常可以是无菌且无热原的。此类组分在与本发明的组合物相容且对其接受者无害的意义上必须是“可接受的”。因此,“药学上可接受的赋形剂”包括用于形成制剂的一部分的任何一种或多种化合物,其旨在仅充当赋形剂,即本身不意在不具有生物活性。
营养、药用、兽用、酿酒或美容制剂/产品可以是液体或固体的形式。
用于口服施用的液体剂量制剂/产品包括溶液、乳剂、水性或油性混悬剂、糖浆剂和酏剂。
本文所述的制剂和产品(例如药用、兽用或美容制剂/产品),例如意在用于经口施用的那些,可以根据本领域技术人员已知的方法来制备,例如通过混合制剂/产品的组分在一起。
制剂或产品(如药用、兽用或美容制剂/产品)可以含有一种或多种附加的成分,例如药物成分和赋形剂,例如甜味剂、调味剂、着色剂和防腐剂。
制剂或产品(例如药用、兽用或美容制剂/产品)还可以含有一种或多种附加的活性成分,例如美容或药物活性成分,例如透明质酸、积雪草提取物、肽例如及其混合物。
本发明的制剂或产品可以含有与无毒的药学上可接受的赋形剂(或成分)混合的一种或多种活性成分。这些赋形剂(或成分)可以例如是:惰性稀释剂,例如碳酸钙、碳酸钠、乳糖、磷酸钙或磷酸钠;造粒剂和崩解剂,例如玉米淀粉、麦芽糖糊精或海藻酸;粘合剂,例如淀粉、明胶或阿拉伯胶;或润滑剂,例如硬脂酸镁、硬脂酸、滑石及其混合物。
液体制剂或产品(例如药用、兽用或美容制剂/产品)可以包含在胶囊内,胶囊可以是未包衣的或如上所定义包衣的。
合适的药用或兽用载体包括惰性固体稀释剂或填充剂、无菌水溶液和各种有机溶剂。液体载体的实例是糖浆、花生油、橄榄油、磷脂、脂肪酸、脂肪酸胺、聚氧乙烯和水。
此外,载体或稀释剂可包括单独或与蜡混合的本领域已知的任何持续释放材料,例如甘油单硬脂酸酯或甘油二硬脂酸酯。
合适的药物载体包括惰性无菌水溶液和各种有机溶剂。液体载体的实例是糖浆、植物油、磷脂、脂肪酸、脂肪酸胺、聚氧乙烯和水。此外,载体或稀释剂可包括单独或与蜡混合的本领域已知的任何持续释放材料,例如甘油单硬脂酸酯或甘油二硬脂酸酯。
合适的美容载体通常是适用于局部施用至人体外表面例如皮肤和/或头发和/或头皮的那些。
通常,此类载体是皮肤病学可接受的。
短语“皮肤病学上可接受的载体”意指该载体适合于局部施加至角质组织,具有良好的美观特性,与组合物中的活性物质相容,并且不会引起任何不合理的安全性或毒性问题。
载体可以具有多种形式。在一些情况下,组分(例如提取物、防晒活性物质、附加组分)的溶解度或分散性可决定载体的形式和特性。非限制性实例包括简单溶液(如水性或无水)、分散体、乳液和固体形式(例如凝胶、棒、可流动固体或无定形材料)。
皮肤病学上可接受的载体可以是乳液的形式。乳液通常可分为具有连续水相(例如水包油和水包油包水)或连续油相(例如油包水或水包油)。本发明的油相可包含硅油、非硅油例如烃油、酯、醚等及其混合物。水相通常包含水和水溶性成分(例如水溶性保湿剂、调理剂、抗微生物剂、保湿剂和/或其他皮肤护理活性物质)。然而,在一些情况下,水相可包含除水之外的组分,包括但不限于水溶性保湿剂、调理剂、抗微生物剂、保湿剂和/或其他水溶性护肤活性物质。在一些情况下,组合物的非水组分包含湿润剂,例如甘油和/或一种或多种其他多元醇。乳液还可以含有乳化剂。乳化剂可以是非离子型、阴离子型或阳离子型。
载体可含有一种或多种皮肤病学上可接受的亲水性稀释剂。如本文所用,“稀释剂”包括可以将本发明的组合物分散、溶解或以其他方式掺入其中的材料。亲水性稀释剂包括水、有机亲水性稀释剂例如低级一元醇(例如C1-C4)以及低分子量二醇和多元醇,包括丙二醇、聚乙二醇、聚丙二醇、甘油、丁二醇、1,2,4-丁三醇、山梨糖醇酯、1,2,6-己三醇、乙醇、异丙醇、山梨糖醇酯、丁二醇、醚丙醇、乙氧基化醚、丙氧基化醚及其组合。
美容制剂/产品可以任选地包含一种或多种通常用于美容组合物的附加成分(例如,着色剂、肤色剂、皮肤抗老化剂、抗炎剂、防晒剂、这些的组合等),条件是附加成分不会不利地改变组合物提供的抗糖化益处。
在一些情况下,可能想要选择经由不同生物途径发挥其作用的肤色剂,以便活性剂不会相互干扰,否则会降低两种剂的功效。当掺入组合物中时,附加成分应当适合与人体皮肤组织接触而没有不适当的毒性、不相容性、不稳定性、过敏响应等。
如本文所用的术语“载体”还可以指天然产物或源自自然界的产物,其已被转化或修饰以使其不同于其源自的天然产物,例如麦芽糖糊精。
存在于营养、药用、兽用、酿酒或美容制剂或产品中的本发明组合物的量将根据应用而变化。
典型地,可以存在于营养、药用、兽用、酿酒或美容制剂或产品中的本发明的组合物的量将为约0.001至约50重量%,例如约0.01%至约30%或约1%至约20%的营养、药用、兽用、酿酒或美容制剂或产品,例如约0.01重量%至约20重量%、或约0.1重量%至10重量%、或约1重量%至约5重量%的制剂或产品。
本领域技术人员将认识到,由于遗传密码的简并性质,核苷酸序列不同的多种DNA分子可以用于编码本发明的给定酶。本文引用编码上述生物合成酶的天然DNA序列仅是为了说明本发明的实施方式,并且本发明包括编码在本发明的方法中使用的酶的多肽和蛋白质的氨基酸序列的任何序列的DNA分子。以类似的方式,多肽通常可以耐受其氨基酸序列中的一个或多个氨基酸取代、缺失和插入,而不损失或显著损失所想要的活性。本发明包括具有与本文描述的特定蛋白质不同的氨基酸序列的此类多肽,只要修饰或变体多肽具有参考多肽的酶促合成代谢或分解代谢活性。此外,由本文所示的DNA序列编码的氨基酸序列仅说明本发明的实施方式。
本文描述了可用于本发明的方法、组合物和生物体中的特定基因和蛋白质;然而,应当认识到,此类基因的绝对同一性是不必要的。例如,可以对包含编码多肽或酶的序列的特定基因或多核苷酸进行改变并筛选活性。通常,此类变化包括保守突变和沉默突变。可以使用本领域已知的方法筛选此类修饰或突变的多核苷酸和多肽的功能性酶的表达。
由于遗传密码的固有简并性,编码基本上相同或功能等同的多肽的其他多核苷酸也可以用于克隆和表达编码此类酶的多核苷酸。
本领域技术人员已知的技术可适合于鉴定另外的同源基因和同源酶。一般来说,类似的基因和/或类似的酶可以通过功能分析来鉴定并且具有功能相似性。
本领域技术人员已知的技术可适合于鉴定类似基因和类似酶或任何生物合成途径基因、蛋白质或酶,技术可包括但不限于使用基于目标基因/酶的已公开序列的PCR或者通过简并PCR使用设计用于扩增目标基因中的保守区域的简并引物来克隆基因。此外,本领域技术人员可以使用技术来鉴定具有功能同源性或相似性的同源或类似基因、蛋白质或酶。技术包括检查细胞或细胞培养物的酶催化活性,通过对所述活性的体外酶测定(例如,如本文或Kiritani,K.,Branched-Chain Amino Acids Methods Enzymology,1970中所述),然后通过纯化来分离具有所述活性的酶,通过例如Edman降解的技术测定酶的蛋白质序列,针对可能的核酸序列设计PCR引物、通过PCR扩增所述DNA序列以及克隆所述核酸序列。为了鉴定同源或相似的基因和/或同源或相似的酶、类似的基因和/或类似的酶或蛋白质,技术还包括将关于候选基因或酶的数据与例如BRENDA、KEGG或MetaCYC的数据库进行比较。可以根据本文教导在上述数据库内鉴定候选基因或酶。
术语“在...和...之间”和“范围从...到...”应被理解为包括端值,除非另有说明。在本说明书和所附权利要求书中,除非上下文另有要求,否则词语“包括/包含(comprise)”以及例如“包括/包含(comprises)”、“包括/包含(comprising)”和“具有”的变体将被理解为暗示包括所规定的整数或步骤、或整数组或步骤组,但不排除任何其他整数或步骤、或整数组或步骤组。术语“包括/包含(comprising)”还意指“包括”以及“由……组成”,例如“包括/包含”X的组合物可以仅由X组成,或者可以包括额外的东西,如X+Y。还必须注意的是,如本说明书和所附权利要求中所使用的,单数形式“一”、“一个”和“该”包括复数指示物,除非内容另外明确指出。举例来说,提及“基因”或“酶”是提及“一种或多种基因”或“一种或多种酶”。
应当理解,本发明不限于本文描述的特定方法、方案和试剂,因为这些可以变化。还应当理解,本文中使用的术语仅是为了描述具体实施方式的目的,并且不旨在限制本发明的范围,本发明的范围仅由所附权利要求书限制。除非另有定义,否则本文中使用的所有技术和科学术语具有与本领域技术人员通常理解的相同含义。根据本发明,可以使用本领域技术范围内的常规分子生物学、微生物学和重组DNA技术。
本发明在其应用中不限于在以下描述中阐述或在附图中示出的组分的构造和布置的细节。本发明能够具有其他实施方式并且能够以各种方式被实践或执行。此外,本文中使用的措辞和术语是为了描述的目的并且不应被视为限制。优选地,本文所用的术语如“Amultilingual glossary of biotechnological terms:(IUPAC Recommendations)”,Leuenberger,H.G.W,Nagel,B.和Kolbl,H.编辑(1995),Helvetica Chimica Acta,CH-4010瑞士巴塞尔)中所述定义。
本说明书全文中引用了多个文献。本文引用的每个文件(包括所有专利、专利申请、科学出版物、制造商说明书、说明书、GenBank登录号序列提交等),无论上文还是下文,均通过引用整体并入本文。
以下实施例和附图以说明的方式给出,并不暗示对本发明的限制。
实施例
实施例1:用于制备根据本发明的重组酿酒酵母菌株的方案
所有下文实施的重组酿酒酵母菌株均使用标准酵母分子遗传学程序从标准菌株构建(Methods in yeast Genetics-A cold spring harbor laboratory course Manual(2000)by D.Burke,D.Dawson,T.Stearns CSHL Press)。
利用酵母有效重组具有序列同源性的游离DNA末端的能力,将以下提及的基因簇一次性整合到重组酵母中。
此外,为了更好地理解以下基因型:
-jlp1、lyp1、sam3、his3、leu2、trp1和ura3是插入位点。
-小写字母意指所考虑的基因是不活跃的,大写字母反映了活跃基因。
-“::”:基因名称后面意指该基因被后面的内容中断(如果插入多于一个基因,则在括号[]中注明)。基因的中断伴随着编码序列的完全缺失,但保留了启动子。因此,后面跟着“::”的基因是不活跃的,并以小写字母表示。如果没有指定,则插入基因的转录是由被破坏基因的启动子控制的。
-“基因.Kl”意指基因来源于乳酸克鲁维酵母。当本实施例中的基因后面没有任何指示时,这意味着该基因来自酿酒酵母。
更具体地,待克隆的编码序列是人工合成的。对于异源序列(非酵母),使用酵母密码子使用修饰核酸序列以便获得同义编码序列。使用限制性酶和经典克隆技术,将每条合成序列克隆到转录启动子和转录终止子之间。每条启动子序列之前有与上游基因终止子序列同源的50至200个核苷酸序列。类似地,每个基因的终止子(包含启动子编码序列-终止子的基因)后面是与紧随其后的基因同源的序列。以便每个待整合的单元与上游单元和下游单元都有50-200个核苷酸重叠。对于第一单元,启动子前面有50-200个与它将在其中整合的基因座的酵母染色体核苷酸同源的核苷酸。类似地,对于最后一个单元,终止子后面跟着与它将在其中整合的基因座的酵母染色体核苷酸同源的50-200个核苷酸。
然后从质粒构建体中对每个单元进行PCR扩增,产生具有重叠序列的线性DNA的X单元。该基因中至少一者是营养缺陷型标记,以便选择重组事件。将所有线性片段一次性转化到酵母中,并针对与所用标记相关的营养缺陷型选择重组酵母细胞。序列的完整性然后通过PCR和测序来验证。
实施例2:用于生产肝素前体的对比例
七种重组菌株源自野生型菌株CC788-2D(Cherest等人(2000)J Biol.Chem.275:14056-14063),其不生产任何肝素前体:YA5398-3、YA5402-1、YA5400-1、YA5401-1、YA5437-18、YA5435-2和DA2531-12。
这七种菌株如下:
YA5398-3:MAT-α,can1-100,his3::[tRPL3-UGP1-pSAM1,pMET6-QRI1-tIDP1,HIS3]x8,leu2::[URA3.Sba-loxP,pCCW12.Sba-HASB.Vir-tRPL3.Sm,pCCW12.Sk-HASB-A.Vir-tTEF1.Sba,pCCW12.Sar-HSS2.Pm-tRPL3.Sba,pCCW120.Sca-HSS2.Pm-tRPL15A.Sm],leu2,trp1,ura3
YA5402-1:MAT-α,can1-100,his3::[tRPL3-UGP1-pSAM1,pMET6-QRI1-tIDP1,HIS3]x8,jlp1::[LEU2.Sba-loxP,pCCW12.Sba-HASB.Vir-tRPL3.Sm,pCCW12.Sk-HASB-A.Vir-tTEF1.Sba,pCCW12.Sar-HSS2.Pm-tRPL3.Sba,pCCW120.Sca-HSS2.Pm-tRPL15A.Sm],leu2,trp1,ura3
YA5400-1:MAT-α,can1-100,his3::[tRPL3-UGP1-pSAM1,pMET6-QRI1-tIDP1,HIS3]x8,jlp1::[LEU2.Sba-loxP,pCCW12.Sba-HASB.Vir-tRPL3.Sm,pCCW12.Sk-HASB-A.Vir-tTEF1.Sba,pCCW12.Sar-HSS2.Pm-tRPL3.Sba,pCCW120.Sca-HSS2.Pm-tRPL15A.Sm,pTEF1.Ago-GFA1-tRPL15A],leu2,trp1,ura3
YA5401-1:MAT-α,can1-100,his3::[tRPL3-UGP1-pSAM1,pMET6-QRI1-tIDP1,HIS3]x8,jlp1::[LEU2.Sba-loxP,pCCW12.Sba-HASB.Vir-tRPL3.Sm,pCCW12.Sk-HASB-A.Vir-tTEF1.Sba,pCCW12.Sar-HSS2.Pm-tRPL3.Sba,pCCW120.Sca-HSS2.Pm-tRPL15A.Sm,pTEF1.Ago-GFA1.Vir-tRPL15A],leu2,trp1,ura3
YA5437-18:MAT-α,can1-100,his3::[tRPL3-UGP1-pSAM1,pMET6-QRI1-tIDP1,HIS3]x8,jlp1::[LEU2.Sba-loxP,pCCW12.Sba-HASB.Vir-tRPL3.Sm,pCCW12.Sk-HASB-A.Vir-tTEF1.Sba,pCCW12.Sar-HSS1.Pm-tRPL15A.Sm],leu2,trp1,ura3
YA5435-2:MAT-α,can1-100,his3::[tRPL3-UGP1-pSAM1,pMET6-QRI1-tIDP1,HIS3]x8,jlp1::[LEU2.Sba-loxP,pCCW12.Sba-HASB.Vir-tRPL3.Sm,pCCW12.Sk-HASB-A.Vir-tTEF1.Sba,pCCW12.Sar-HSS1.Pm-tRPL15A.Sm,pTEF1.Ago-GFA1.Vir-tRPL15A],leu2,trp1,ura3
DA2531-12:MAT-a/MAT-α,CAN1/can1-100,his3/his3::[tRPL3-UGP1-pSAM1,pMET6-QRI1-tIDP1,HIS3]x8,jlp1::[LEU2.Kl-RS,pCUP1-UGP1-tRPL3,pCUP1-QRI1-tIDP1,pPDC1-UGP1-tTPI1,pTDH3-QRI1-tMET25,pCCW12-HASB.At-tRPL15A]/jlp1::[LEU2.Sba-loxP,pCCW12.Sba-HASB.Vir-tRPL3.Sm,pCCW12.Sk-HASB-A.Vir-tTEF1.Sba,pCCW12.Sar-HSS1.Pm-tRPL15A.Sm,pTEF1.Ago-GFA1.Vir-tRPL15A],leu2/leu2,SAM3/sam3::[LEU2.Kl-RS,pPDC1-PGM1-tIDP1,pTEF1.Ago-GFA1-tRPL15A,pENO2-UGP1-tRPL3,pCWP2-GNA1-tTPI1,pTEF1-PCM1-tRPL41B,pCCW12.Sba-HASB.vir-tRPL3.Sm,pCCW12.Sk-HASB-A.Vir-tTEF1.Sba,pCCW12.Sar-HSS2.Pm-tRPL3.Sba,pCCW120.Sca-HSS2.Pm-tRPL15A.Sm,pTDH3-1.Sba-QRI1-tIDP1.Sba,HIS3.Sba-loxP],trp1/trp1,ura3
HSS1.Pm表示编码来自多杀巴斯德菌的肝素前体合酶A的序列(UniProt参考Q8RP78)。HSS2.Pm表示编码来自多杀巴斯德菌的肝素前体合酶B的序列(UniProt参考Q5SGE1)。
所有这些菌株均在用MES 0,1M ph 5.5带挡板的锥形瓶缓冲的25ml SY培养基中在锥形烧瓶中于28℃剧烈搅拌下孵育48小时。
SY培养基包含以下成分:
KH2PO4:100mM;MgSO47H2O:2,8mM;K2SO4:11,5mM;Na2SO4:1,1mM;NaCl:2,6mM;CaCl22H2O:0,7mM;CuSO45H2O:15μM;KI:6μM;FeCl3:30μM;ZnSO47H2O:61μM;MnSO4 H2O:25μM;H2SO4:110μM;泛酸半钙盐:42μM;硫胺盐酸盐:59μM;吡哆醇盐酸盐:49μM;肌醇(C6H12O6):555μM;烟酸(C6H5NO2):29μM;D-生物素:0,82μM;柠檬酸三铵:33mM;和葡萄糖2%
在48小时回收生长培养基并测定其肝素前体含量和质量。加载培养基的等分试样并在0,5%琼脂糖凝胶上电泳,随后用溴酚蓝染色。在用浓硫酸和咔唑处理后,通过比色测定评价培养基中存在的肝素前体的量(Bitter和Muir(1962)analytical biochemistry 4,330-334)。
用这些不同菌株获得的肝素前体的量分别为:
-YA5398-3:170mg.L-1
-YA5402-1:170mg.L-1
-YA5400-1:110mg.L-1
-YA5401-1:180mg.L-1
-YA5437-18:200mg.L-1
-YA5435-2:190mg.L-1
-DA2531-12:235mg.L-1
相比之下,如上所指定,天然菌株不生产肝素前体。
该实验结果表明,与不包含根据本发明的所有遗传修饰的其他重组菌株相比,包含根据本发明的修饰的重组菌株在相同条件下培养时生产更大量的肝素前体。
序列
SEQ ID NO:1是源自多杀巴斯德菌的肝素前体合酶(HSS1)的重编码核酸序列
ATGAGTTTGTTCAAAAGGGCGACTGAGCTGTTCAAATCGGGTAACTATAAGGATGCACTGACATTGTACGAGAACATAGCCAAAATTTATGGCTCAGAATCCCTAGTGAAGTATAACATAGATATCTGCAAGAAGAACATAACCCAATCAAAATCGAACAAGATAGAAGAGGACAATATTTCCGGAGAGAATAAGTTCTCCGTCTCTATCAAAGACTTATACAACGAAATTAGTAATTCTGAGCTAGGGATAACAAAGGAGAGATTAGGAGCACCACCCTTGGTAAGCATAATTATGACGAGTCATAATACAGAGAAATTCATCGAAGCTTCCATCAACAGTTTATTATTGCAAACTTATAACAATCTTGAGGTCATTGTGGTAGACGACTACTCCACAGACAAGACCTTCCAAATCGCGTCCAGGATTGCAAACTCGACGTCAAAAGTTAAGACTTTCAGATTGAATTCCAACCTTGGAACGTACTTCGCAAAGAATACGGGAATCCTAAAATCAAAAGGGGACATTATATTCTTTCAAGATTCTGATGATGTCTGCCATCATGAACGTATTGAGAGATGTGTAAATGCACTTTTGTCTAACAAAGATAACATTGCCGTTAGGTGCGCTTATTCTCGTATTAATCTGGAGACCCAGAACATCATAAAGGTCAACGACAACAAGTACAAGTTAGGTCTTATTACCCTAGGAGTATACCGTAAAGTATTTAATGAAATAGGATTCTTCAACTGTACCACTAAGGCAAGTGACGACGAATTTTATCACAGGATCATCAAATACTATGGCAAGAATAGGATAAACAATTTGTTCCTACCTCTATACTACAATACCATGCGTGAAGATAGTTTGTTTAGCGATATGGTCGAGTGGGTAGACGAAAACAACATTAAACAGAAAACAAGTGATGCACGTCAGAATTATCTGCATGAATTCCAAAAGATCCACAACGAAAGGAAATTGAATGAGTTAAAGGAGATTTTCAGCTTCCCCAGGATTCACGATGCCCTACCGATAAGTAAAGAGATGAGCAAGTTGTCTAACCCAAAGATCCCTGTCTACATTAACATTTGCAGTATACCATCTAGGATAAAGCAATTACAGTATACGATCGGAGTGCTGAAGAATCAGTGTGACCATTTCCACATTTACTTAGATGGTTATCCAGAGGTTCCAGATTTCATAAAGAAGCTAGGCAACAAGGCTACCGTAATCAATTGCCAAAACAAGAACGAGTCTATCAGGGACAACGGCAAGTTTATCCTTTTAGAAAAGCTGATCAAAGAGAATAAGGACGGCTATTATATTACCTGTGATGATGACATAAGGTATCCTGCTGACTACACGAATACCATGATAAAGAAGATTAACAAGTACAATGACAAAGCGGCAATAGGTCTACACGGCGTCATCTTTCCGTCCAGAGTGAATAAATACTTCTCATCTGACAGGATTGTTTATAACTTTCAGAAGCCCTTGGAAAACGACACAGCCGTCAACATTTTGGGTACTGGGACCGTTGCATTTAGAGTCTCCATCTTCAACAAGTTTTCCCTGAGCGACTTCGAGCACCCTGGTATGGTGGATATTTATTTCTCAATACTATGCAAGAAGAACAACATATTGCAAGTTTGTATAAGCAGGCCCTCAAACTGGTTAACCGAGGACAACAAGAATACCGAAACCCTGTTCCACGAGTTCCAAAACCGTGACGAGATCCAGAGTAAGTTGATCATCTCTAATAATCCGTGGGGCTACAGTAGCATCTACCCCTTACTTAACAACAATGCCAACTATAGCGAGTTGATACCATGCTTATCATTCTATAATGAGTAA
SEQ ID NO:2是源自多杀巴斯德菌的肝素前体合酶(HSS2)的重编码核酸序列
ATGAAGGGCAAGAAAGAGATGACCCAAATACAGATTGCTAAGAACCCGCCCCAACACGAGAAGGAAAACGAGCTGAATACTTTCCAAAACAAGATCGACTCCCTTAAAACGACATTAAACAAGGACATTATATCACAACAGACATTGTTGGCTAAACAGGACTCAAAGCACCCATTATCTGCAAGTCTTGAGAACGAGAACAAACTTCTTCTTAAACAGTTGCAGCTTGTTTTGCAGGAATTTGAAAAGATATACACTTACAACCAAGCACTAGAGGCTAAGCTTGAGAAAGACAAACAGACCACCTCAATAACCGATTTATATAACGAAGTTGCAAAGTCTGATCTAGGGCTAGTTAAGGAAACTAACAGTGCTAACCCTCTAGTCTCCATTATTATGACTTCGCACAATACCGCTCAATTTATCGAGGCATCGATTAACTCCTTGTTGCTACAGACATATAAGAACATTGAGATAATTATAGTCGATGATGACAGTTCCGACAACACTTTTGAAATCGCCTCAAGGATCGCAAACACAACGTCTAAGGTCCGTGTGTTTCGTTTGAACTCCAATCTGGGCACGTACTTTGCTAAGAATACAGGAATCCTTAAGAGTAAAGGCGACATAATATTCTTCCAGGACTCCGACGACGTTTGTCATCATGAGAGAATCGAAAGGTGCGTGAACATTTTGTTGGCTAACAAAGAGACGATTGCTGTGAGGTGCGCATACAGTAGGCTGGCTCCTGAAACGCAGCATATAATTAAAGTCAACAACATGGATTATAGGCTTGGTTTCATCACACTGGGAATGCATAGGAAGGTTTTCCAAGAGATTGGGTTCTTCAACTGTACAACAAAAGGCAGTGACGACGAGTTCTTCCACCGTATAGCTAAATACTACGGTAAAGAAAAGATTAAGAACCTTTTATTGCCGCTTTATTATAACACGATGCGTGAAAACTCACTTTTCACTGACATGGTCGAGTGGATCGACAACCATAATATCATACAGAAGATGTCTGACACACGTCAACACTATGCTACTCTGTTTCAGGCGATGCATAATGAGACTGCATCACACGACTTCAAGAACTTGTTCCAGTTCCCACGTATATACGACGCCTTGCCTGTTCCACAGGAGATGTCTAAGTTATCTAACCCTAAAATACCGGTGTACATAAATATATGCAGTATACCATCTAGGATTGCACAGTTACGTAGGATTATTGGGATCTTAAAGAACCAGTGCGACCACTTTCACATATACCTAGACGGATACGTGGAGATCCCTGATTTTATTAAGAATCTTGGTAATAAAGCAACGGTCGTCCACTGCAAAGACAAGGACAACTCTATTAGGGACAACGGCAAGTTTATTCTACTGGAAGAGTTAATAGAAAAGAATCAAGACGGGTACTACATAACGTGCGACGACGACATTATCTATCCATCGGACTATATAAACACAATGATTAAGAAGCTGAACGAGTATGATGACAAGGCGGTCATAGGGCTTCACGGAATATTATTTCCGTCAAGGATGACGAAATACTTTTCCGCCGATAGGCTTGTTTATTCGTTTTACAAACCCCTAGAGAAAGACAAAGCAGTAAATGTTCTTGGGACCGGAACTGTCTCATTCAGAGTTAGTCTGTTCAACCAATTCTCCCTTTCAGACTTCACCCATTCGGGAATGGCCGACATCTACTTCTCTCTATTGTGCAAGAAGAACAACATTTTACAAATCTGTATCTCCAGACCGGCAAATTGGTTGACGGAAGATAACAGAGATTCTGAGACCTTATACCACCAGTATAGAGATAATGACGAGCAGCAGACTCAGTTGATCATGGAAAATGGGCCCTGGGGTTACTCAAGTATCTATCCACTTGTCAAGAATCACCCGAAGTTTACGGACTTAATACCATGTTTGCCTTTCTACTTCCTATAA
SEQ ID NO:3是源自多杀巴斯德菌的肝素前体合酶(HSS1)的氨基酸序列
MSLFKRATELFKSGNYKDALTLYENIAKIYGSESLVKYNIDICKKNITQSKSNKIEEDNISGENKFSVSIKDLYNEISNSELGITKERLGAPPLVSIIMTSHNTEKFIEASINSLLLQTYNNLEVIVVDDYSTDKTFQIASRIANSTSKVKTFRLNSNLGTYFAKNTGILKSKGDIIFFQDSDDVCHHERIERCVNALLSNKDNIAVRCAYSRINLETQNIIKVNDNKYKLGLITLGVYRKVFNEIGFFNCTTKASDDEFYHRIIKYYGKNRINNLFLPLYYNTMREDSLFSDMVEWVDENNIKQKTSDARQNYLHEFQKIHNERKLNELKEIFSFPRIHDALPISKEMSKLSNPKIPVYINICSIPSRIKQLQYTIGVLKNQCDHFHIYLDGYPEVPDFIKKLGNKATVINCQNKNESIRDNGKFILLEKLIKENKDGYYITCDDDIRYPADYTNTMIKKINKYNDKAAIGLHGVIFPSRVNKYFSSDRIVYNFQKPLENDTAVNILGTGTVAFRVSIFNKFSLSDFEHPGMVDIYFSILCKKNNILQVCISRPSNWLTEDNKNTETLFHEFQNRDEIQSKLIISNNPWGYSSIYPLLNNNANYSELIPCLSFYNE
SEQ ID NO:4是源自多杀巴斯德菌的肝素前体合酶(HSS2)的氨基酸序列
MAKGKKEMTQIQIAKNPPQHEKENELNTFQNKIDSLKTTLNKDIISQQTLLAKQDSKHPLSASLENENKLLLKQLQLVLQEFEKIYTYNQALEAKLEKDKQTTSITDLYNEVAKSDLGLVKETNSANPLVSIIMTSHNTAQFIEASINSLLLQTYKNIEIIIVDDDSSDNTFEIASRIANTTSKVRVFRLNSNLGTYFAKNTGILKSKGDIIFFQDSDDVCHHERIERCVNILLANKETIAVRCAYSRLAPETQHIIKVNNMDYRLGFITLGMHRKVFQEIGFFNCTTKGSDDEFFHRIAKYYGKEKIKNLLLPLYYNTMRENSLFTDMVEWIDNHNIIQKMSDTRQHYATLFQAMHNETASHDFKNLFQFPRIYDALPVPQEMSKLSNPKIPVYINICSIPSRIAQLRRIIGILKNQCDHFHIYLDGYVEIPDFIKNLGNKATVVHCKDKDNSIRDNGKFILLEELIEKNQDGYYITCDDDIIYPSDYINTMIKKLNEYDDKAVIGLHGILFPSRMTKYFSADRLVYSFYKPLEKDKAVNVLGTGTVSFRVSLFNQFSLSDFTHSGMADIYFSLLCKKNNILQICISRPANWLTEDNRDSETLYHQYRDNDEQQTQLIMENGPWGYSSIYPLVKNHPKFTDLIPCLPFYFL
SEQ ID NO:5是源自拟南芥的UDP-葡萄糖脱氢酶(HASB)的核酸序列
ATGGTCAAAATATGCTGTATCGGGGCTGGATATGTCGGTGGGCCTACAATGGCCGTTATGGCCCTAAAGTGTCCAGAGATTGAAGTCGTGGTAGTTGATATATCGGAGCCACGAATTAACGCATGGAACTCAGACCGTCTACCAATTTATGAGCCAGGGTTAGAGGATGTCGTCAAACAGTGTAGAGGGAAGAATTTGTTCTTCTCTACAGATGTAGAGAAGCATGTATTTGAGTCAGATATAGTGTTTGTTTCGGTAAACACTCCTACGAAAACGCAGGGTCTGGGTGCAGGTAAAGCAGCAGATTTGACATATTGGGAGTCCGCTGCTCGCATGATAGCTGATGTGAGCAAATCGTCGAAAATCGTCGTTGAAAAGAGTACAGTACCAGTTCGTACAGCCGAGGCTATAGAAAAGATTTTAACGCACAATTCGAAGGGTATCGAATTCCAGATCTTATCAAATCCAGAATTCTTGGCCGAAGGGACGGCGATTAAAGACTTATATAACCCTGATAGAGTTCTAATCGGTGGCAGGGACACCGCTGCGGGACAAAAGGCCATTAAGGCGTTGCGTGACGTGTATGCCCACTGGGTTCCTGTTGAGCAAATAATCTGTACTAATTTATGGAGTGCCGAGCTATCAAAGTTGGCTGCGAACGCATTTCTAGCTCAAAGGATAAGTTCAGTAAACGCAATGTCAGCGCTTTGTGAGGCAACTGGTGCTGACGTAACCCAAGTCGCTCACGCCGTTGGAACCGACACTAGAATTGGACCGAAGTTTCTTAACGCATCCGTAGGCTTCGGCGGATCTTGCTTTCAGAAAGACATCCTGAATCTTATTTACATCTGCGAATGCAATGGTCTTCCAGAAGCAGCCAATTATTGGAAACAGGTAGTCAAGGTAAATGACTACCAAAAGATTAGGTTTGCTAATCGAGTCGTATCTTCTATGTTCAACACCGTCTCCGGTAAGAAAATTGCTATTTTGGGATTTGCGTTCAAGAAGGACACCGGCGACACGCGTGAAACTCCTGCCATAGATGTGTGTAATCGCCTCGTGGCTGATAAAGCAAAGCTGTCGATCTATGATCCGCAAGTATTAGAAGAGCAGATCCGCCGTGATCTGTCCATGGCCCGATTCGATTGGGACCATCCAGTCCCACTCCAGCAGATCAAAGCTGAAGGTATCTCCGAACAGGTTAACGTTGTGTCCGACGCCTACGAGGCTACGAAGGATGCTCATGGTTTATGTGTTTTAACCGAATGGGACGAATTCAAGTCACTTGATTTTAAGAAGATCTTTGATAATATGCAGAAACCCGCTTTCGTTTTCGACGGAAGAAACGTGGTCGACGCTGTGAAATTGAGAGAAATTGGATTCATAGTATATTCCATAGGTAAACCTCTGGATAGTTGGCTCAAGGATATGCCGGCTGTTGCATAA
SEQ ID NO:6是源自小球藻属病毒PBCV-1的UDP-葡萄糖脱氢酶(HASB)的重编码核酸序列
ATGAGTAGAATTGCTGTCGTTGGATGCGGTTACGTGGGTACGGCCTGCGCCGTACTTTTGGCGCAGAAGAACGAAGTTATCGTTTTGGATATCTCGGAGGACCGGGTACAACTGATTAAGAATAAGAAGTCACCTATAGAAGATAAGGAAATCGAAGAATTCCTGGAGACGAAAGATTTGAATCTAACAGCGACGACGGATAAGGTGCTCGCCTATGAGAATGCTGAATTCGTTATAATAGCTACACCGACCGATTACGATGTCGTCACTAGATATTTCAACACTAAGTCTGTTGAAAATGTGATAGGCGATGTCATTAAGAACACTCAGACACACCCTACTATAGTGATCAAGAGTACTATTCCAATCGGTTTCGTGGATAAAGTTAGAGAACAGTTCGATTATCAAAATATTATCTTCTCGCCGGAATTCTTGAGAGAAGGACGAGCATTATATGATAATCTTTACCCCTCCCGTATCATCGTCGGTGATGACTCCCCAATTGCCTTAAAATTCGCGAATCTCTTGGTCGAGGGTAGCAAAACTCCACTAGCTCCCGTATTAACTATGGGTACGCGAGAGGCCGAAGCTGTAAAACTATTTTCAAATACATATTTGGCTATGAGAGTAGCATACTTCAATGAGCTAGACACATTTGCAATGTCCCATGGTATGAACGCAAAAGAGATTATCGACGGAGTCACACTAGAACCAAGGATAGGGCAGGGTTATTCGAATCCTTCATTTGGGTATGGAGCCTATTGTTTCCCAAAAGATACAAAGCAATTGTTGGCTAATTTTGAAGGGGTTCCACAAGATATTATTGGCGCAATCGTAGAGTCTAACGAAACTAGAAAGGAGGTTATTGTTTCTGAGGTCGAGAACAGATTTCCGACCACAGTTGGCGTATATAAGTTGGCTGCTAAAGCTGGTTCGGATAATTTCAGGTCTAGTGCGATAGTCGATATCATGGAAAGGTTGGCTAATAAGGGCTACCACATCAAAATATTTGAACCTACCGTTGAACAATTTGAGAATTTTGAGGTAGATAATAATCTCACAACTTTTGCAACCGAGTCTGATGTAATAATTGCGAACAGAGTTCCAGTCGAACATCGCATTCTGTTTGGGAAGAAGTTAATAACACGGGATGTCTATGGGGATAA
SEQ ID NO:7是源自小球藻属病毒PBCV-1的UDP-葡萄糖脱氢酶(HASB-A)的重编码核酸序列
ATGTCACGAATCGCAGTAGTTGGCTGTGGGTACGTGGGAACCGCATGCGCTGTACTGCTGGCGCAAAAGAATGAGGTAATCGTTCTTGATATTAGTGAGGATAGGGTCCAACTAATCAAGAACAAGAAATCCCCGATCGAAGATAAGGAGATTGAAGAATTCTTGGAAACAAAAGACCTAAACTTAACTGCAACAACTGACAAAGTTTTAGCCTACGAAAACGCTGAGTTTGTGATTATAGCGACACCCACAGATTATGACGTAGTTACCAGATACTTTAACACGAAGTCCGTAGAGAACGTCATTGGAGATGTTATAAAGAATACTCAGACTCATCCTACGATAGTAATAAAGTCAACCATTCCCATAGGTTTCGTAGATAAGGTTAGGGAGCAATTCGATTACCAGAACATTATATTTTCGCCAGAATTTCTGAGAGAGGGTCGCGCCCTGTATGATAATCTATATCCATCACGGATTATAGTGGGCGATGACTCTCCGATTGCACTTAAGTTTGCTAATCTTTTAGTTGAGGGCTCCAAAACTCCGCTCGCCCCAGTACTTACGATGGGTACACGTGAGGCTGAAGCTGTCAAGCTGTTTTCAAACACATACCTTGCTATGCGAGTCGCATACTTTAACGAACTAGATACCTTTGCTATGTCGCACGGTATGAATGCTAAAGAAATCATAGATGGCGTAACGTTGGAGCCTCGGATAGGTCAAGGATATTCCAATCCATCTTTTGGCTACGGTGCGTATTGTTTCCCAAAGGACACGAAGCAATTATTAGCTAACTTTGAGGGTGTTCCGCAAGATATAATTGGGGCGATAGTAGAAAGCAATGAAACACGGAAGGAGGTAATCGTGAGTGAAGTGGAAAACCGATTCCCCACTACGGTCGGCGTTTACAAATTAGCCGCCAAGGCTGGTTCCGACAATTTCCGATCCAGCGCAATAGTAGATATTATGGAAAGATTAGCTAATAAGGGATACCACATTAAAATCTTTGAACCTACTGTCGAACAGTTCGAGAACTTCGAGGTTGATAATAACTTGACGACTTTCGCAACGGAGAGCGATGTAATTATTGCAAACCGCGTACCTGTGGAACATCGAATTTTGTTCGGAAAGAAGCTGATTACACGCGATGTATATGGCGATAACTAA
SEQ ID NO:8是源自拟南芥的UDP-葡萄糖脱氢酶(HASB)的氨基酸序列
MVKICCIGAGYVGGPTMAVMALKCPEIEVVVVDISEPRINAWNSDRLPIYEPGLEDVVKQCRGKNLFFSTDVEKHVFESDIVFVSVNTPTKTQGLGAGKAADLTYWESAARMIADVSKSSKIVVEKSTVPVRTAEAIEKILTHNSKGIEFQILSNPEFLAEGTAIKDLYNPDRVLIGGRDTAAGQKAIKALRDVYAHWVPVEQIICTNLWSAELSKLAANAFLAQRISSVNAMSALCEATGADVTQVAHAVGTDTRIGPKFLNASVGFGGSCFQKDILNLIYICECNGLPEAANYWKQVVKVNDYQKIRFANRVVSSMFNTVSGKKIAILGFAFKKDTGDTRETPAIDVCNRLVADKAKLSIYDPQVLEEQIRRDLSMARFDWDHPVPLQQIKAEGISEQVNVVSDAYEATKDAHGLCVLTEWDEFKSLDFKKIFDNMQKPAFVFDGRNVVDAVKLREIGFIVYSIGKPLDSWLKDMPAVA
SEQ ID NO:9是源自小球藻属病毒PBCV1的UDP-葡萄糖脱氢酶(HASB)的氨基酸序列
MSRIAVVGCGYVGTACAVLLAQKNEVIVLDISEDRVQLIKNKKSPIEDKEIEEFLETKDLNLTATTDKVLAYENAEFVIIATPTDYDVVTRYFNTKSVENVIGDVIKNTQTHPTIVIKSTIPIGFVDKVREQFDYQNIIFSPEFLREGRALYDNLYPSRIIVGDDSPIALKFANLLVEGSKTPLAPVLTMGTREAEAVKLFSNTYLAMRVAYFNELDTFAMSHGMNAKEIIDGVTLEPRIGQGYSNPSFGYGAYCFPKDTKQLLANFEGVPQDIIGAIVESNETRKEVIVSEVENRFPTTVGVYKLAAKAGSDNFRSSAIVDIMERLANKGYHIKIFEPTVEQFENFEVDNNLTTFATESDVIIANRVPVEHRILFGKKLITRDVYGDN
SEQ ID NO:10是具有N-末端分泌信号的源自解肝磷脂土地杆菌的葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶的重编码核酸序列
ATGCAATTCTCGACGGTCGCAAGTGTTGCCTTTGTTGCTTTGGCTAACTTCGTTGCCGCACAGTCCTCGTCAATCACCAGGAAGGACTTCGATCATATCAACTTGGAATACTCCGGTTTGGAGAAGGTGAACAAGGCGGTAGCAGCAGGCAATTACGACGACGCGGCAAAAGCCCTACTAGCTTACTACCGTGAAAAGAGCAAAGCAAGAGAGCCTGACTTTAGTAATGCCGAGAAGCCTGCCGACATACGTCAGCCTATTGACAAGGTAACACGTGAGATGGCGGATAAAGCATTAGTACATCAGTTTCAACCTCACAAAGGATACGGATATTTTGATTATGGGAAGGATATTAATTGGCAGATGTGGCCAGTTAAAGACAACGAGGTCAGATGGCAGTTGCATAGGGTAAAATGGTGGCAGGCAATGGCCTTGGTTTACCATGCCACGGGCGACGAGAAGTACGCCAGGGAGTGGGTGTACCAATACTCGGACTGGGCGAGGAAGAACCCGTTAGGCTTATCGCAAGACAATGATAAGTTTGTCTGGAGACCTTTGGAAGTCTCAGATAGAGTCCAGTCATTGCCACCTACCTTTTCTCTTTTCGTCAACAGTCCCGCCTTCACACCAGCATTCCTAATGGAGTTCTTAAACTCGTACCACCAACAGGCAGACTACTTGTCAACACACTACGCCGAGCAGGGGAACCATAGGCTGTTCGAAGCTCAGAGGAACTTGTTCGCCGGCGTATCCTTCCCCGAATTCAAGGACTCACCCAGGTGGAGACAGACTGGAATATCTGTTCTGAATACAGAGATAAAGAAGCAGGTGTACGCCGATGGCATGCAATTCGAGTTAAGTCCGATATACCACGTTGCTGCCATAGATATCTTTCTTAAAGCATACGGAAGCGCCAAGAGAGTTAATTTGGAGAAAGAGTTCCCTCAATCCTATGTGCAAACCGTCGAGAATATGATTATGGCGTTAATTTCAATAAGTCTACCGGACTATAATACGCCCATGTTCGGCGACTCTTGGATCACTGATAAGAATTTCAGAATGGCTCAATTTGCCTCATGGGCGCGTGTCTTCCCCGCTAACCAGGCAATTAAGTACTTTGCAACCGACGGAAAACAGGGTAAAGCTCCCAACTTCTTGAGTAAGGCATTGTCCAATGCAGGATTCTACACGTTTAGAAGTGGATGGGATAAGAACGCGACAGTGATGGTACTGAAGGCAAGTCCGCCTGGTGAGTTTCACGCTCAGCCTGATAACGGAACTTTTGAACTGTTCATCAAGGGTAGGAACTTCACACCCGACGCCGGTGTATTCGTCTATTCCGGTGACGAGGCGATTATGAAATTGAGGAACTGGTACAGGCAGACAAGGATTCACTCTACTCTAACTCTTGATAATCAGAATATGGTCATAACGAAAGCACGTCAGAATAAATGGGAGACAGGCAATAACTTGGATGTCTTAACTTACACTAACCCGTCATACCCCAACTTAGATCACCAACGTTCAGTTCTATTCATTAACAAGAAGTATTTCTTAGTCATAGATAGGGCTATCGGCGAGGCCACGGGCAACCTTGGCGTGCACTGGCAGCTAAAGGAAGACAGTAACCCTGTCTTCGATAAAACCAAGAATAGAGTCTATACTACCTATAGGGACGGGAACAATCTAATGATACAGAGTCTAAACGCAGACAGGACATCACTGAACGAGGAAGAAGGGAAGGTATCTTATGTCTATAACAAGGAGCTGAAGCGTCCAGCTTTCGTATTTGAGAAGCCTAAGAAGAACGCAGGGACCCAAAACTTTGTGTCAATTGTCTATCCATACGACGGTCAGAAGGCGCCGGAAATTTCTATTAGAGAAAATAAGGGAAATGACTTCGAAAAGGGAAAATTGAACCTAACACTGACTATAAACGGTAAGCAACAGCTTGTGTTGGTTCCTTAA
SEQ ID NO:11是具有N-末端分泌信号和C-末端锚定信号的源自解肝磷脂土地杆菌的葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶的重编码核酸序列
ATGCAATTCTCGACGGTCGCAAGTGTTGCCTTTGTTGCTTTGGCTAACTTCGTTGCCGCACAGTCCTCGTCAATCACCAGGAAGGACTTCGATCATATCAACTTGGAATACTCCGGTTTGGAGAAGGTGAACAAGGCGGTAGCAGCAGGCAATTACGACGACGCGGCAAAAGCCCTACTAGCTTACTACCGTGAAAAGAGCAAAGCAAGAGAGCCTGACTTTAGTAATGCCGAGAAGCCTGCCGACATACGTCAGCCTATTGACAAGGTAACACGTGAGATGGCGGATAAAGCATTAGTACATCAGTTTCAACCTCACAAAGGATACGGATATTTTGATTATGGGAAGGATATTAATTGGCAGATGTGGCCAGTTAAAGACAACGAGGTCAGATGGCAGTTGCATAGGGTAAAATGGTGGCAGGCAATGGCCTTGGTTTACCATGCCACGGGCGACGAGAAGTACGCCAGGGAGTGGGTGTACCAATACTCGGACTGGGCGAGGAAGAACCCGTTAGGCTTATCGCAAGACAATGATAAGTTTGTCTGGAGACCTTTGGAAGTCTCAGATAGAGTCCAGTCATTGCCACCTACCTTTTCTCTTTTCGTCAACAGTCCCGCCTTCACACCAGCATTCCTAATGGAGTTCTTAAACTCGTACCACCAACAGGCAGACTACTTGTCAACACACTACGCCGAGCAGGGGAACCATAGGCTGTTCGAAGCTCAGAGGAACTTGTTCGCCGGCGTATCCTTCCCCGAATTCAAGGACTCACCCAGGTGGAGACAGACTGGAATATCTGTTCTGAATACAGAGATAAAGAAGCAGGTGTACGCCGATGGCATGCAATTCGAGTTAAGTCCGATATACCACGTTGCTGCCATAGATATCTTTCTTAAAGCATACGGAAGCGCCAAGAGAGTTAATTTGGAGAAAGAGTTCCCTCAATCCTATGTGCAAACCGTCGAGAATATGATTATGGCGTTAATTTCAATAAGTCTACCGGACTATAATACGCCCATGTTCGGCGACTCTTGGATCACTGATAAGAATTTCAGAATGGCTCAATTTGCCTCATGGGCGCGTGTCTTCCCCGCTAACCAGGCAATTAAGTACTTTGCAACCGACGGAAAACAGGGTAAAGCTCCCAACTTCTTGAGTAAGGCATTGTCCAATGCAGGATTCTACACGTTTAGAAGTGGATGGGATAAGAACGCGACAGTGATGGTACTGAAGGCAAGTCCGCCTGGTGAGTTTCACGCTCAGCCTGATAACGGAACTTTTGAACTGTTCATCAAGGGTAGGAACTTCACACCCGACGCCGGTGTATTCGTCTATTCCGGTGACGAGGCGATTATGAAATTGAGGAACTGGTACAGGCAGACAAGGATTCACTCTACTCTAACTCTTGATAATCAGAATATGGTCATAACGAAAGCACGTCAGAATAAATGGGAGACAGGCAATAACTTGGATGTCTTAACTTACACTAACCCGTCATACCCCAACTTAGATCACCAACGTTCAGTTCTATTCATTAACAAGAAGTATTTCTTAGTCATAGATAGGGCTATCGGCGAGGCCACGGGCAACCTTGGCGTGCACTGGCAGCTAAAGGAAGACAGTAACCCTGTCTTCGATAAAACCAAGAATAGAGTCTATACTACCTATAGGGACGGGAACAATCTAATGATACAGAGTCTAAACGCAGACAGGACATCACTGAACGAGGAAGAAGGGAAGGTATCTTATGTCTATAACAAGGAGCTGAAGCGTCCAGCTTTCGTATTTGAGAAGCCTAAGAAGAACGCAGGGACCCAAAACTTTGTGTCAATTGTCTATCCATACGACGGTCAGAAGGCGCCGGAAATTTCTATTAGAGAAAATAAGGGAAATGACTTCGAAAAGGGAAAATTGAACCTAACACTGACTATAAACGGTAAGCAACAGCTTGTGTTGGTTCCTGGATCCGCCATTTCTCAAATCACTGACGGTCAAATCCAAGCTACTACCACTGCTACCACCGAAGCTACCACCACTGCTGCCCCATCTTCCACCGTTGAAACTGTTTCTCCATCCAGCACCGAAACTATCTCTCAACAAACTGAAAATGGTGCTGCTAAGGCCGCTGTCGGTATGGGTGCCGGTGCTCTAGCTGCTGCTGCTATGTTGTTATAA
SEQ ID NO:12是具有N-末端分泌信号的源自解肝磷脂土地杆菌的葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶的重编码核酸序列
ATGCAGTTTTCAACCGTGGCATCTGTGGCATTCGTGGCATTGGCAAATTTTGTCGCTGCTCAATCTTCCAGTATTACGCGTAAAGATTTTGACCACATAAATCTTGAGTATAGTGGCCTAGAGAAAGTCAATAAAGCTGTCGCCGCTGGTAACTATGATGATGCAGCCAAGGCTTTGTTAGCCTATTATAGAGAGAAATCTAAGGCTCGTGAACCGGATTTCTCTAACGCTGAAAAGCCAGCGGATATCAGACAACCAATCGATAAAGTCACCAGGGAAATGGCAGACAAGGCTTTGGTTCACCAATTCCAGCCCCATAAGGGCTATGGTTACTTCGACTACGGTAAAGACATAAACTGGCAAATGTGGCCCGTAAAGGATAATGAAGTAAGGTGGCAACTTCACAGAGTGAAGTGGTGGCAAGCTATGGCTCTGGTGTATCACGCAACCGGTGATGAAAAGTATGCTAGAGAATGGGTATATCAGTATTCTGATTGGGCTAGGAAGAATCCACTAGGACTTTCTCAGGATAACGACAAATTCGTTTGGCGTCCACTAGAGGTATCTGACAGGGTACAATCTTTACCCCCGACGTTCAGTCTGTTTGTTAATTCTCCAGCATTTACCCCGGCTTTCTTGATGGAATTCTTGAATTCTTATCATCAGCAAGCGGATTATTTAAGCACCCATTATGCAGAACAAGGAAATCACAGATTATTTGAGGCCCAACGTAATTTATTTGCGGGTGTTAGTTTTCCAGAGTTTAAAGATTCGCCAAGATGGAGACAAACCGGTATCAGCGTGTTAAACACTGAAATCAAGAAACAAGTATATGCTGACGGTATGCAGTTTGAACTATCTCCAATTTATCATGTCGCAGCAATTGACATATTCTTGAAGGCTTATGGCAGTGCTAAACGTGTCAACTTAGAAAAGGAATTTCCACAGTCATACGTCCAGACTGTAGAAAACATGATCATGGCCCTTATCAGCATCTCATTGCCTGATTACAACACTCCAATGTTTGGTGATAGTTGGATAACGGACAAGAACTTTAGGATGGCACAGTTCGCAAGCTGGGCTAGAGTATTTCCAGCAAATCAAGCTATAAAATATTTCGCGACTGATGGTAAGCAAGGGAAGGCCCCTAATTTTCTATCTAAAGCTTTAAGCAACGCCGGCTTTTATACTTTCAGGTCCGGTTGGGACAAGAATGCAACTGTCATGGTGTTAAAAGCGTCTCCACCCGGAGAATTCCATGCGCAACCAGACAATGGGACATTCGAGTTGTTTATTAAAGGGAGAAATTTTACCCCAGATGCTGGAGTGTTTGTGTACTCAGGGGATGAAGCGATAATGAAGTTAAGAAATTGGTATCGTCAAACCAGAATACATTCCACACTTACACTGGACAACCAAAACATGGTGATTACTAAGGCTAGACAAAACAAGTGGGAAACTGGTAACAATCTGGACGTTTTGACATATACGAACCCTTCCTATCCAAATCTTGACCATCAGAGGTCGGTCTTATTTATAAATAAGAAATACTTCTTGGTTATCGACAGAGCCATTGGTGAAGCAACAGGTAATCTGGGTGTTCATTGGCAATTGAAAGAGGATTCTAATCCAGTGTTTGACAAGACGAAGAACAGGGTATACACAACATACCGTGATGGTAATAACTTAATGATCCAGTCCTTAAATGCTGATCGTACTTCTCTTAATGAAGAGGAAGGTAAGGTTTCCTACGTGTACAATAAAGAACTAAAGAGACCCGCCTTTGTCTTCGAAAAGCCCAAGAAGAATGCCGGAACGCAGAATTTCGTATCTATCGTTTACCCTTATGATGGCCAGAAAGCTCCAGAGATAAGCATCCGTGAGAACAAAGGTAACGATTTTGAGAAAGGTAAGCTTAATTTGACGCTAACGATTAATGGGAAACAGCAATTAGTCTTAGTACCATAA
SEQ ID NO:13是具有N-末端分泌信号和C-末端锚定信号的源自解肝磷脂土地杆菌的葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶的重编码核酸序列
ATGCAGTTTTCAACCGTGGCATCTGTGGCATTCGTGGCATTGGCAAATTTTGTCGCTGCTCAATCTTCCAGTATTACGCGTAAAGATTTTGACCACATAAATCTTGAGTATAGTGGCCTAGAGAAAGTCAATAAAGCTGTCGCCGCTGGTAACTATGATGATGCAGCCAAGGCTTTGTTAGCCTATTATAGAGAGAAATCTAAGGCTCGTGAACCGGATTTCTCTAACGCTGAAAAGCCAGCGGATATCAGACAACCAATCGATAAAGTCACCAGGGAAATGGCAGACAAGGCTTTGGTTCACCAATTCCAGCCCCATAAGGGCTATGGTTACTTCGACTACGGTAAAGACATAAACTGGCAAATGTGGCCCGTAAAGGATAATGAAGTAAGGTGGCAACTTCACAGAGTGAAGTGGTGGCAAGCTATGGCTCTGGTGTATCACGCAACCGGTGATGAAAAGTATGCTAGAGAATGGGTATATCAGTATTCTGATTGGGCTAGGAAGAATCCACTAGGACTTTCTCAGGATAACGACAAATTCGTTTGGCGTCCACTAGAGGTATCTGACAGGGTACAATCTTTACCCCCGACGTTCAGTCTGTTTGTTAATTCTCCAGCATTTACCCCGGCTTTCTTGATGGAATTCTTGAATTCTTATCATCAGCAAGCGGATTATTTAAGCACCCATTATGCAGAACAAGGAAATCACAGATTATTTGAGGCCCAACGTAATTTATTTGCGGGTGTTAGTTTTCCAGAGTTTAAAGATTCGCCAAGATGGAGACAAACCGGTATCAGCGTGTTAAACACTGAAATCAAGAAACAAGTATATGCTGACGGTATGCAGTTTGAACTATCTCCAATTTATCATGTCGCAGCAATTGACATATTCTTGAAGGCTTATGGCAGTGCTAAACGTGTCAACTTAGAAAAGGAATTTCCACAGTCATACGTCCAGACTGTAGAAAACATGATCATGGCCCTTATCAGCATCTCATTGCCTGATTACAACACTCCAATGTTTGGTGATAGTTGGATAACGGACAAGAACTTTAGGATGGCACAGTTCGCAAGCTGGGCTAGAGTATTTCCAGCAAATCAAGCTATAAAATATTTCGCGACTGATGGTAAGCAAGGGAAGGCCCCTAATTTTCTATCTAAAGCTTTAAGCAACGCCGGCTTTTATACTTTCAGGTCCGGTTGGGACAAGAATGCAACTGTCATGGTGTTAAAAGCGTCTCCACCCGGAGAATTCCATGCGCAACCAGACAATGGGACATTCGAGTTGTTTATTAAAGGGAGAAATTTTACCCCAGATGCTGGAGTGTTTGTGTACTCAGGGGATGAAGCGATAATGAAGTTAAGAAATTGGTATCGTCAAACCAGAATACATTCCACACTTACACTGGACAACCAAAACATGGTGATTACTAAGGCTAGACAAAACAAGTGGGAAACTGGTAACAATCTGGACGTTTTGACATATACGAACCCTTCCTATCCAAATCTTGACCATCAGAGGTCGGTCTTATTTATAAATAAGAAATACTTCTTGGTTATCGACAGAGCCATTGGTGAAGCAACAGGTAATCTGGGTGTTCATTGGCAATTGAAAGAGGATTCTAATCCAGTGTTTGACAAGACGAAGAACAGGGTATACACAACATACCGTGATGGTAATAACTTAATGATCCAGTCCTTAAATGCTGATCGTACTTCTCTTAATGAAGAGGAAGGTAAGGTTTCCTACGTGTACAATAAAGAACTAAAGAGACCCGCCTTTGTCTTCGAAAAGCCCAAGAAGAATGCCGGAACGCAGAATTTCGTATCTATCGTTTACCCTTATGATGGCCAGAAAGCTCCAGAGATAAGCATCCGTGAGAACAAAGGTAACGATTTTGAGAAAGGTAAGCTTAATTTGACGCTAACGATTAATGGGAAACAGCAATTAGTCTTAGTACCATAA
SEQ ID NO:14是具有N-末端分泌信号的源自解肝磷脂土地杆菌的葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶的氨基酸序列
MQFSTVASVAFVALANFVAAQSSSITRKDFDHINLEYSGLEKVNKAVAAGNYDDAAKALLAYYREKSKAREPDFSNAEKPADIRQPIDKVTREMADKALVHQFQPHKGYGYFDYGKDINWQMWPVKDNEVRWQLHRVKWWQAMALVYHATGDEKYAREWVYQYSDWARKNPLGLSQDNDKFVWRPLEVSDRVQSLPPTFSLFVNSPAFTPAFLMEFLNSYHQQADYLSTHYAEQGNHRLFEAQRNLFAGVSFPEFKDSPRWRQTGISVLNTEIKKQVYADGMQFELSPIYHVAAIDIFLKAYGSAKRVNLEKEFPQSYVQTVENMIMALISISLPDYNTPMFGDSWITDKNFRMAQFASWARVFPANQAIKYFATDGKQGKAPNFLSKALSNAGFYTFRSGWDKNATVMVLKASPPGEFHAQPDNGTFELFIKGRNFTPDAGVFVYSGDEAIMKLRNWYRQTRIHSTLTLDNQNMVITKARQNKWETGNNLDVLTYTNPSYPNLDHQRSVLFINKKYFLVIDRAIGEATGNLGVHWQLKEDSNPVFDKTKNRVYTTYRDGNNLMIQSLNADRTSLNEEEGKVSYVYNKELKRPAFVFEKPKKNAGTQNFVSIVYPYDGQKAPEISIRENKGNDFEKGKLNLTLTINGKQQLVLVP
SEQ ID NO:15是具有N-末端分泌信号和C-末端锚定信号的源自解肝磷脂土地杆菌的葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶的氨基酸序列
MQFSTVASVAFVALANFVAAQSSSITRKDFDHINLEYSGLEKVNKAVAAGNYDDAAKALLAYYREKSKAREPDFSNAEKPADIRQPIDKVTREMADKALVHQFQPHKGYGYFDYGKDINWQMWPVKDNEVRWQLHRVKWWQAMALVYHATGDEKYAREWVYQYSDWARKNPLGLSQDNDKFVWRPLEVSDRVQSLPPTFSLFVNSPAFTPAFLMEFLNSYHQQADYLSTHYAEQGNHRLFEAQRNLFAGVSFPEFKDSPRWRQTGISVLNTEIKKQVYADGMQFELSPIYHVAAIDIFLKAYGSAKRVNLEKEFPQSYVQTVENMIMALISISLPDYNTPMFGDSWITDKNFRMAQFASWARVFPANQAIKYFATDGKQGKAPNFLSKALSNAGFYTFRSGWDKNATVMVLKASPPGEFHAQPDNGTFELFIKGRNFTPDAGVFVYSGDEAIMKLRNWYRQTRIHSTLTLDNQNMVITKARQNKWETGNNLDVLTYTNPSYPNLDHQRSVLFINKKYFLVIDRAIGEATGNLGVHWQLKEDSNPVFDKTKNRVYTTYRDGNNLMIQSLNADRTSLNEEEGKVSYVYNKELKRPAFVFEKPKKNAGTQNFVSIVYPYDGQKAPEISIRENKGNDFEKGKLNLTLTINGKQQLVLVPGSAISQITDGQIQATTTATTEATTTAAPSSTVETVSPSSTETISQQTENGAAKAAVGMGAGALAAAAMLL
SEQ ID NO:16是源自酿酒酵母的谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)的核酸序列
ATGTGTGGTATCTTTGGTTACTGCAATTATCTAGTGGAAAGATCCAGAGGAGAAATTATCGACACCTTAGTGGATGGTTTACAAAGATTAGAATATAGAGGCTATGATTCCACCGGTATTGCTATCGATGGTGACGAAGCTGATTCTACTTTCATCTATAAGCAAATCGGTAAAGTGAGTGCTTTGAAAGAGGAGATTACTAAGCAAAATCCGAACAGAGACGTTACTTTTGTCTCTCATTGTGGTATTGCGCATACTAGATGGGCTACTCACGGTCGACCAGAACAAGTTAACTGTCACCCTCAAAGATCTGACCCAGAAGACCAATTTGTGGTCGTTCATAATGGTATCATCACAAATTTTAGAGAACTGAAGACTCTTTTAATTAACAAAGGTTATAAATTCGAAAGTGATACCGATACCGAGTGTATTGCTAAACTATATTTGCATTTATACAATACAAATTTACAAAATGGGCATGACTTAGATTTCCACGAATTAACCAAGCTAGTTCTTTTAGAACTAGAAGGTTCATACGGGTTATTATGTAAATCTTGTCACTATCCTAATGAGGTTATCGCCACTAGAAAAGGGTCCCCTTTACTGATTGGTGTCAAATCTGAAAAAAAACTAAAAGTCGACTTCGTGGATGTGGAATTTCCCGAAGAAAACGCTGGTCAACCGGAAATTCCATTGAAATCTAACAACAAATCATTTGGCTTGGGCCCAAAGAAAGCTCGTGAATTTGAAGCTGGTTCCCAAAATGCCAATTTACTACCAATTGCCGCCAATGAATTTAACTTGAGACATTCTCAATCCAGGGCTTTCCTATCAGAAGATGGATCTCCAACACCGGTGGAATTTTTTGTTTCTTCGGATGCGGCATCTGTTGTTAAACATACCAAGAAGGTGCTATTTTTAGAAGATGACGATTTGGCTCATATTTACGATGGTGAGTTACATATTCATAGATCTAGAAGAGAAGTAGGCGCATCAATGACAAGGTCCATTCAAACTTTAGAGATGGAGTTAGCTCAGATCATGAAGGGCCCTTACGACCATTTTATGCAAAAGGAAATCTATGAGCAACCAGAATCTACTTTCAATACTATGAGAGGTAGAATCGACTATGAAAATAATAAAGTGATATTGGGTGGTTTAAAGGCATGGTTACCAGTTGTCAGAAGAGCACGGAGACTGATCATGATCGCATGCGGTACTTCTTATCATTCATGTTTGGCTACTCGTGCTATCTTCGAAGAATTATCAGATATCCCAGTTAGTGTGGAATTAGCGTCTGACTTTCTGGACAGAAAATGCCCTGTCTTCAGAGACGATGTATGCGTGTTTGTTTCACAAAGTGGTGAAACTGCGGATACCATGCTGGCTCTAAATTATTGTTTAGAAAGAGGAGCCTTAACTGTCGGAATTGTTAACAGTGTTGGTTCTTCTATCTCTCGTGTCACCCACTGTGGTGTTCATATTAACGCTGGTCCTGAAATTGGTGTTGCCTCTACAAAAGCTTATACTTCCCAGTATATTGCCTTAGTGATGTTTGCTCTATCGCTGTCAGATGACCGTGTATCGAAAATAGACAGAAGAATTGAAATCATTCAAGGCTTGAAGTTAATCCCGGGCCAAATTAAGCAGGTATTAAAGCTGGAACCAAGAATAAAAAAGCTCTGTGCGACTGAATTAAAGGATCAAAAATCTCTATTGTTATTGGGTAGAGGTTACCAATTTGCTGCTGCTCTGGAAGGTGCTTTGAAGATCAAAGAAATTTCTTATATGCATTCTGAAGGTGTTTTGGCAGGTGAGTTGAAGCACGGTGTCTTGGCCTTGGTGGACGAAAACTTGCCAATCATTGCTTTTGGTACCAGAGACTCTCTATTCCCTAAAGTAGTTTCCTCTATTGAGCAAGTTACTGTAAGAAAGGGCCATCCAATTATTATTTGTAACGAAAATGATGAAGTGTGGGCGCAAAAATCTAAATCAATCGACCTGCAAACCTTAGAAGTTCCACAAACTGTTGATTGTTTACAAGGTCTAATTAATATTATTCCATTACAACTAATGTCATATTGGTTGGCTGTTAATAAAGGGATTGATGTTGATTTTCCAAGAAACTTGGCTAAATCTGTTACCGTCGAATAA
SEQ ID NO:17是源自小球藻属病毒1(PBCV-1)的谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)的重编码核酸序列
ATGTGCGGGATCTTCGGTGCTGTGTCGAACAATAATAGCATAGAAGTTTCCATCAAGGGTATACAGAAGCTAGAGTACCGCGGGTACGATTCGTGTGGAATAGCCTATACAGACGGAGGCGCCATTGAACGGATCAGGTCAATAGATGGGATCGACGACTTAAGGAAGAAAACAATAACAGAGTCTTCCCCGGTAGCTATCGCTCATTCAAGGTGGAGTACCACTGGGATTCCAAGTGTTGTGAACGCCCACCCGCACATCTCTCGGGGCACGTCTGGATGCGAGTCGCGCATTGCAGTCGTACACAATGGCATTATTGAAAATTACCAGCAGATCCGCAAGTACTTGATAAATCTTGGGTATACTTTCGATTCACAGACCGACACGGAAGTCATTGCTCATCTAATAGACTCGCAGTATAACGGGAACATCCTGCACACCGTCCAAATGGCAGTTAAGCACCTCAAAGGAAGCTACGCCATAGCAGTCATGTGCCATAAGGAGTCCGGGAAGATCGTGGTGGCAAAACAGAAGAGTCCGTTGGTATTGGGTATAGGAAGCGACGGAGCTTATTATATCGCATCGGACGTATTGGCTCTTCCCACTAACAAAGTGGTCTACATAAGTGACGGATTCTCTGCTGAGTTAAGTCCTGGATCGATGACTATCTATGATCTGGATGGCAATAAGGTAGAATACGAGGTGGAAGACGTTGAAATGGAGCAGACGTCGATGTCTTTAGATAACTTTGATCACTACATGATCAAAGAGATCAATGAACAGCCGATATCAATTCTCAATACTATTAAGAACAAAGGATTCTATGCAGAGATATTTGGTGATCTAGCACATGAAATATTTCAGAAGATCGACAATATATTGATTCTAGCCTGCGGAACTTCGTATCATGCAGGTCTCGTCGGGAAGCAATGGATAGAGACCATCTCACGCATCCCGGTGGATGTTCATATTGCAAGCGAGTATGAGCCGACAATTCCACGAGCCAATACACTTGTGATAACGATTAGTCAAAGCGGCGAGACTGCGGATACAATCGCAGCCCTTCAACGAGCGCAAAACGCAGGAATGATATACACTTTGTGTATCTGCAACAGCCCCAAGTCAACTCTAGTGCGCGAGTCGATAATGAAATACATAACCAAATGCGGTTCAGAAGTTTCTGTTGCCAGTACTAAAGCATTTACGTCGCAACTTGTGGTGTTGTATATGCTTGCGAACGTTCTTGCGAACAAAACTGATGATCTGCTAGGGGATCTTCCTCAAGCTATCGAGAGAGTAATCTGTCTTACTAATGACGAAATGAAGCGTTGGGCGGATGAAATTTGTACTGCCAAAAGTGCCATCTTCTTAGGGAGAGGACTGAACGCACCTGTAGCATTTGAGGGCGCGCTAAAGTTGAAGGAAATCTCATATATCCATGCCGAGGGTTTCCTCGGTGGAGAGTTGAAGCATGGGCCGCTGGCTTTGTTGGACGATAAGATCCCTGTAATCGTGACTGTTGCTGACCACGCTTATTTGGATCACATTAAGGCTAACATCGACGAGGTATTGGCACGAAACGTTACCGTATACGCGATCGTCGATCAGTATGTTAATATTGAACCACAGGAGCGACTGCATGTAGTAAAAGTGCCGTTTGTGAGTAAAGAGTTTTCTCCCATCATCCACACAATTCCGATGCAATTGTTATCGTATTATGTCGCGATCAAGCTGGGCAAGAACGTTGACAAGCCACGTAACCTGGCGAAAAGTGTTACAACATTCtaa
SEQ ID NO:18是源自小球藻属病毒1(PBCV-1)的谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)的重编码核酸序列
ATGTGTGGCATCTTTGGAGCAGTGTCAAACAACAACTCTATCGAGGTGTCAATCAAGGGTATTCAGAAGCTAGAATATCGTGGGTATGATTCGTGCGGTATTGCGTATACAGATGGGGGTGCGATTGAGCGTATACGTTCTATTGACGGCATTGACGATCTGCGTAAGAAAACAATCACAGAATCATCACCAGTGGCCATTGCTCACTCGCGGTGGAGCACCACTGGAATTCCATCAGTGGTGAACGCACATCCTCATATTTCTCGCGGAACCAGTGGGTGTGAGTCTCGTATCGCGGTAGTCCACAACGGTATCATTGAAAACTATCAGCAGATCCGAAAATATCTCATCAATCTTGGTTATACGTTTGATAGTCAAACGGACACAGAGGTCATTGCGCATTTGATTGATTCTCAGTACAATGGGAATATCTTGCACACCGTCCAAATGGCTGTCAAGCACCTGAAGGGCTCTTATGCCATTGCAGTTATGTGTCATAAAGAGTCTGGTAAAATAGTCGTGGCGAAACAGAAGTCACCCCTCGTACTTGGAATCGGCTCAGATGGTGCTTACTACATCGCTTCGGACGTGCTGGCGCTGCCGACAAATAAAGTTGTTTATATTTCAGACGGTTTCTCCGCAGAACTATCTCCAGGGAGTATGACCATTTACGATCTTGATGGAAATAAAGTAGAATATGAAGTAGAGGACGTTGAAATGGAACAAACTAGTATGTCTCTCGATAACTTTGATCATTACATGATTAAGGAAATTAATGAGCAACCAATCAGTATTCTAAACACTATAAAAAATAAAGGGTTCTATGCAGAAATATTCGGTGATTTGGCTCATGAAATCTTCCAAAAAATAGACAACATCCTGATACTGGCTTGTGGTACAAGTTATCACGCCGGTCTTGTAGGAAAACAGTGGATAGAGACCATCTCtAGAATCCCCGTGGATGTTCACATCGCGAGTGAATACGAACCTACTATTCCGAGAGCGAACACATTGGTAATCACTATTTCACAGTCGGGTGAAACTGCGGACACGATAGCGGCTTTGCAACGGGCCCAAAACGCCGGGATGATTTATACATTGTGTATTTGCAATTCACCAAAGAGCACTCTTGTTCGTGAGAGCATTATGAAGTACATCACGAAATGTGGTTCTGAGGTGTCAGTGGCATCAACGAAGGCGTTTACTTCTCAGCTCGTAGTACTGTACATGCTGGCAAACGTATTGGCAAATAAAACCGATGATTTGCTGGGAGACCTCCCACAGGCAATAGAACGGGTAATTTGTTTGACAAATGACGAAATGAAACGATGGGCCGACGAAATTTGCACTGCGAAATCCGCGATCTTCCTGGGAAGAGGACTAAACGCACCAGTTGCCTTTGAGGGAGCGTTGAAGCTCAAAGAAATCTCTTACATTCATGCAGAGGGCTTCCTGGGAGGTGAGTTGAAACACGGCCCCCTCGCACTCCTTGATGACAAGATTCCTGTTATCGTAACCGTAGCAGATCATGCTTATTTGGACCATATCAAAGCAAATATCGACGAAGTGCTTGCGAGGAACGTTACGGTATACGCCATAGTAGACCAGTATGTGAACATCGAGCCCCAGGAACGCCTTCACGTCGTCAAGGTTCCGTTTGTATCCAAAGAATTTTCTCCGATAATTCACACTATCCCGATGCAACTGCTTTCGTATTACGTGGCAATTAAGCTTGGAAAGAACGTTGACAAACCAAGGAATCTTGCAAAATCCGTGACTACCTTTTAA
SEQ ID NO:19是源自酿酒酵母的谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)的氨基酸序列
MCGIFGYCNYLVERSRGEIIDTLVDGLQRLEYRGYDSTGIAIDGDEADSTFIYKQIGKVSALKEEITKQNPNRDVTFVSHCGIAHTRWATHGRPEQVNCHPQRSDPEDQFVVVHNGIITNFRELKTLLINKGYKFESDTDTECIAKLYLHLYNTNLQNGHDLDFHELTKLVLLELEGSYGLLCKSCHYPNEVIATRKGSPLLIGVKSEKKLKVDFVDVEFPEENAGQPEIPLKSNNKSFGLGPKKAREFEAGSQNANLLPIAANEFNLRHSQSRAFLSEDGSPTPVEFFVSSDAASVVKHTKKVLFLEDDDLAHIYDGELHIHRSRREVGASMTRSIQTLEMELAQIMKGPYDHFMQKEIYEQPESTFNTMRGRIDYENNKVILGGLKAWLPVVRRARRLIMIACGTSYHSCLATRAIFEELSDIPVSVELASDFLDRKCPVFRDDVCVFVSQSGETADTMLALNYCLERGALTVGIVNSVGSSISRVTHCGVHINAGPEIGVASTKAYTSQYIALVMFALSLSDDRVSKIDRRIEIIQGLKLIPGQIKQVLKLEPRIKKLCATELKDQKSLLLLGRGYQFAAALEGALKIKEISYMHSEGVLAGELKHGVLALVDENLPIIAFGTRDSLFPKVVSSIEQVTARKGHPIIICNENDEVWAQKSKSIDLQTLEVPQTVDCLQGLINIIPLQLMSYWLAVNKGIDVDFPRNLAKSVTVE
SEQ ID NO:20是源自小球藻属病毒1(PBCV-1)的谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)的氨基酸序列
MCGIFGAVSNNNSIEVSIKGIQKLEYRGYDSCGIAYTDGGAIERIRSIDGIDDLRKKTITESSPVAIAHSRWSTTGIPSVVNAHPHISRGTSGCESRIAVVHNGIIENYQQIRKYLINLGYTFDSQTDTEVIAHLIDSQYNGNILHTVQMAVKHLKGSYAIAVMCHKESGKIVVAKQKSPLVLGIGSDGAYYIASDVLALPTNKVVYISDGFSAELSPGSMTIYDLDGNKVEYEVEDVEMEQTSMSLDNFDHYMIKEINEQPISILNTIKNKGFYAEIFGDLAHEIFQKIDNILILACGTSYHAGLVGKQWIETISRIPVDVHIASEYEPTIPRANTLVITISQSGETADTIAALQRAQNAGMIYTLCICNSPKSTLVRESIMKYITKCGSEVSVASTKAFTSQLVVLYMLANVLANKTDDLLGDLPQAIERVICLTNDEMKRWADEICTAKSAIFLGRGLNAPVAFEGALKLKEISYIHAEGFLGGELKHGPLALLDDKIPVIVTVADHAYLDHIKANIDEVLARNVTVYAIVDQYVNIEPQERLHVVKVPFVSKEFSPIIHTIPMQLLSYYVAIKLGKNVDKPRNLAKSVTTF
SEQ ID NO:21是源自酿酒酵母的UDP-N-乙酰葡萄糖胺焦磷酸化酶(QRI1)的核酸序列
ATGACTGACACAAAACAGCTATTCATTGAAGCCGGACAAAGTCAACTTTTCCACAATTGGGAAAGCTTGTCTCGCAAAGACCAAGAAGAATTGCTTTCAAACCTGGAGCAAATATCTTCCAAGAGGTCCCCTGCAAAACTACTGGAAGACTGTCAAAATGCTATTAAATTCTCACTAGCTAACTCTTCTAAGGATACTGGCGTCGAAATTTCACCATTGCCCCCTACTTCGTACGAGTCGCTTATTGGCAACAGTAAGAAAGAAAATGAATACTGGCGTTTAGGCCTTGAAGCTATTGGCAAGGGTGAAGTCGCAGTGATTTTAATGGCTGGCGGACAAGGTACGCGGTTAGGATCCTCTCAACCAAAGGGCTGTTACGACATTGGATTGCCTTCTAAGAAATCTCTTTTTCAAATTCAAGCTGAAAAGTTGATCAGGTTGCAAGATATGGTAAAGGACAAAAAGGTAGAAATTCCTTGGTATATTATGACATCAGGCCCCACTAGAGCGGCTACTGAGGCATACTTTCAAGAACACAATTATTTTGGCTTGAATAAAGAACAAATTACGTTCTTCAACCAGGGAACCCTGCCTGCCTTTGATTTAACCGGGAAGCATTTCCTAATGAAAGACCCAGTAAACCTATCTCAATCACCAGATGGAAATGGTGGACTCTACCGTGCCATCAAGGAAAACAAGTTGAACGAAGACTTTGATAGGAGAGGAATCAAGCATGTTTACATGTACTGTGTCGATAATGTCCTATCTAAAATCGCAGACCCTGTATTTATTGGTTTTGCCATCAAGCATGGCTTCGAACTGGCCACCAAAGCCGTTAGAAAGAGAGATGCGCATGAATCAGTTGGGTTAATTGCTACTAAAAACGAGAAACCATGTGTCATAGAATATTCTGAAATTTCCAATGAATTGGCTGAAGCAAAGGATAAAGATGGCTTATTAAAACTACGCGCAGGCAACATTGTAAATCATTATTACCTAGTGGATTTACTAAAACGTGATTTGGATCAGTGGTGTGAGAATATGCCATATCACATTGCGAAGAAGAAAATTCCAGCTTATGATAGTGTTACCGGCAAGTACACTAAGCCTACCGAACCAAACGGTATAAAATTAGAGCAATTCATATTTGATGTCTTTGACACTGTACCACTGAACAAGTTTGGGTGCTTAGAAGTAGATAGATGCAAAGAATTTTCACCTTTAAAAAACGGTCCTGGTTCTAAGAACGATAATCCTGAGACCAGCAGACTAGCATATTTGAAACTAGGAACCTCGTGGTTGGAAGATGCAGGCGCTATTGTAAAAGATGGGGTACTAGTCGAAGTTTCCAGCAAATTGAGTTATGCAGGTGAAAATCTATCCCAGTTCAAAGGTAAAGTCTTTGACAGAAGTGGTATAGTATTAGAAAAATAA
SEQ ID NO:22是源自酿酒酵母的UDP-N-乙酰葡萄糖胺焦磷酸化酶(QRI1)的氨基酸序列
MTDTKQLFIEAGQSQLFHNWESLSRKDQEELLSNLEQISSKRSPAKLLEDCQNAIKFSLANSSKDTGVEISPLPPTSYESLIGNSKKENEYWRLGLEAIGKGEVAVILMAGGQGTRLGSSQPKGCYDIGLPSKKSLFQIQAEKLIRLQDMVKDKKVEIPWYIMTSGPTRAATEAYFQEHNYFGLNKEQITFFNQGTLPAFDLTGKHFLMKDPVNLSQSPDGNGGLYRAIKENKLNEDFDRRGIKHVYMYCVDNVLSKIADPVFIGFAIKHGFELATKAVRKRDAHESVGLIATKNEKPCVIEYSEISNELAEAKDKDGLLKLRAGNIVNHYYLVDLLKRDLDQWCENMPYHIAKKKIPAYDSVTGKYTKPTEPNGIKLEQFIFDVFDTVPLNKFGCLEVDRCKEFSPLKNGPGSKNDNPETSRLAYLKLGTSWLEDAGAIVKDGVLVEVSSKLSYAGENLSQFKGKVFDRSGIVLEK
SEQ ID NO:23是源自酿酒酵母的磷酸葡萄糖变位酶-1(PGM1)的核酸序列
ATGTCACTTCTAATAGATTCTGTACCAACAGTTGCTTATAAGGACCAAAAACCGGGTACTTCAGGTTTACGTAAGAAGACCAAGGTTTTCATGGATGAGCCTCATTATACTGAGAACTTCATTCAAGCAACAATGCAATCTATCCCTAATGGCTCAGAGGGAACCACTTTAGTTGTTGGAGGAGATGGTCGTTTCTACAACGATGTTATCATGAACAAGATTGCCGCAGTAGGTGCTGCAAACGGTGTCAGAAAGTTAGTCATTGGTCAAGGCGGTTTACTTTCAACACCAGCTGCTTCTCATATAATTAGAACATACGAGGAAAAGTGTACCGGTGGTGGTATCATATTAACTGCCTCACACAACCCAGGCGGTCCAGAGAATGATTTAGGTATCAAGTATAATTTACCTAATGGTGGGCCAGCTCCAGAGAGTGTCACTAACGCTATCTGGGAAGCGTCTAAAAAATTAACTCACTATAAAATTATAAAGAACTTCCCCAAGTTGAATTTGAACAAGCTTGGTAAAAACCAAAAATATGGCCCATTGTTAGTGGACATAATTGATCCTGCCAAAGCATACGTTCAATTTCTGAAGGAAATTTTTGATTTTGACTTAATTAAAAGCTTCTTAGCGAAACAGCGCAAAGACAAAGGGTGGAAGTTGTTGTTTGACTCCTTAAATGGTATTACAGGACCATATGGTAAGGCTATATTTGTTGATGAATTTGGTTTACCGGCAGAGGAAGTTCTTCAAAATTGGCACCCTTTACCTGATTTCGGCGGTTTACATCCCGATCCGAATCTAACCTATGCACGAACTCTTGTTGACAGGGTTGACCGCGAAAAAATTGCCTTTGGAGCAGCCTCCGATGGTGATGGTGATAGGAATATGATTTACGGTTATGGCCCTGCTTTCGTTTCGCCAGGTGATTCTGTTGCCATTATTGCCGAATATGCACCCGAAATTCCATACTTCGCCAAACAAGGTATTTATGGCTTGGCACGTTCATTTCCTACATCCTCAGCCATTGATCGTGTTGCAGCAAAAAAGGGATTAAGATGTTACGAAGTTCCAACCGGCTGGAAATTCTTCTGTGCCTTATTTGATGCTAAAAAGCTATCAATCTGTGGTGAAGAATCCTTCGGTACAGGTTCCAATCATATCAGAGAAAAGGACGGTCTATGGGCCATTATTGCTTGGTTAAATATCTTGGCTATCTACCATAGGCGTAACCCTGAAAAGGAAGCTTCGATCAAAACTATTCAGGACGAATTTTGGAACGAGTATGGCCGTACTTTCTTCACAAGATACGATTACGAACATATCGAATGCGAGCAGGCCGAAAAAGTTGTAGCTCTTTTGAGTGAATTTGTATCAAGGCCAAACGTTTGTGGCTCCCACTTCCCAGCTGATGAGTCTTTAACCGTTATCGATTGTGGTGATTTTTCGTATAGAGATCTAGATGGCTCCATCTCTGAAAATCAAGGCCTTTTCGTAAAGTTTTCGAATGGGACTAAATTTGTTTTGAGGTTATCCGGCACAGGCAGTTCTGGTGCAACAATAAGATTATACGTAGAAAAGTATACTGATAAAAAGGAGAACTATGGCCAAACAGCTGACGTCTTCTTGAAACCCGTCATCAACTCCATTGTAAAATTCTTAAGATTTAAAGAAATTTTAGGAACAGACGAACCAACAGTCCGCACATAG
SEQ ID NO:24是源自酿酒酵母的磷酸葡萄糖变位酶-1(PGM1)的氨基酸序列
MSLLIDSVPTVAYKDQKPGTSGLRKKTKVFMDEPHYTENFIQATMQSIPNGSEGTTLVVGGDGRFYNDVIMNKIAAVGAANGVRKLVIGQGGLLSTPAASHIIRTYEEKCTGGGIILTASHNPGGPENDLGIKYNLPNGGPAPESVTNAIWEASKKLTHYKIIKNFPKLNLNKLGKNQKYGPLLVDIIDPAKAYVQFLKEIFDFDLIKSFLAKQRKDKGWKLLFDSLNGITGPYGKAIFVDEFGLPAEEVLQNWHPLPDFGGLHPDPNLTYARTLVDRVDREKIAFGAASDGDGDRNMIYGYGPAFVSPGDSVAIIAEYAPEIPYFAKQGIYGLARSFPTSSAIDRVAAKKGLRCYEVPTGWKFFCALFDAKKLSICGEESFGTGSNHIREKDGLWAIIAWLNILAIYHRRNPEKEASIKTIQDEFWNEYGRTFFTRYDYEHIECEQAEKVVALLSEFVSRPNVCGSHFPADESLTVIDCGDFSYRDLDGSISENQGLFVKFSNGTKFVLRLSGTGSSGATIRLYVEKYTDKKENYGQTADVFLKPVINSIVKFLRFKEILGTDEPTVRT
SEQ ID NO:25是源自酿酒酵母的UTP-葡萄糖-1-磷酸尿苷酰转移酶(UGP1)的核酸序列
ATGTCCACTAAGAAGCACACCAAAACACATTCCACTTATGCATTCGAGAGCAACACAAACAGCGTTGCTGCCTCACAAATGAGAAACGCCTTAAACAAGTTGGCGGACTCTAGTAAACTTGACGATGCTGCTCGCGCTAAGTTTGAGAACGAACTGGATTCGTTTTTCACGCTTTTCAGGAGATATTTGGTAGAGAAGTCTTCTAGAACCACCTTGGAATGGGACAAGATCAAGTCTCCCAACCCGGATGAAGTGGTTAAGTATGAAATTATTTCTCAGCAGCCCGAGAATGTCTCAAACCTTTCCAAATTGGCTGTTTTGAAGTTGAACGGTGGGCTGGGTACCTCCATGGGCTGCGTTGGCCCTAAATCTGTTATTGAAGTGAGAGAGGGAAACACCTTTTTGGATTTGTCTGTTCGTCAAATTGAATACTTGAACAGACAGTACGATAGCGACGTGCCATTGTTATTGATGAATTCTTTCAACACTGACAAGGATACGGAACACTTGATTAAGAAGTATTCCGCTAACAGAATCAGAATCAGATCTTTCAATCAATCCAGGTTCCCAAGAGTCTACAAGGATTCTTTATTGCCTGTCCCCACCGAATACGATTCTCCACTGGATGCTTGGTATCCACCAGGTCACGGTGATTTGTTTGAATCTTTACACGTATCTGGTGAACTGGATGCCTTAATTGCCCAAGGAAGAGAAATATTATTTGTTTCTAACGGTGACAACTTGGGTGCTACCGTCGACTTAAAAATTTTAAACCACATGATCGAGACTGGTGCCGAATATATAATGGAATTGACTGATAAGACCAGAGCCGATGTTAAAGGTGGTACTTTGATTTCTTACGATGGTCAAGTCCGTTTATTGGAAGTCGCCCAAGTTCCAAAAGAACACATTGACGAATTCAAAAATATCAGAAAGTTTACCAACTTCAACACGAATAACTTATGGATCAATCTGAAAGCAGTAAAGAGGTTGATCGAATCGAGCAATTTGGAGATGGAAATCATTCCAAACCAAAAAACTATAACAAGAGACGGTCATGAAATTAATGTCTTACAATTAGAAACCGCTTGTGGTGCTGCTATCAGGCATTTTGATGGTGCTCACGGTGTTGTCGTTCCAAGATCAAGATTCTTGCCTGTCAAGACCTGTTCCGATTTGTTGCTGGTTAAATCAGATCTATTCCGTCTGGAACACGGTTCTTTGAAGTTAGACCCATCCCGTTTTGGTCCAAACCCATTAATCAAGTTGGGCTCGCATTTCAAAAAGGTTTCTGGTTTTAACGCAAGAATCCCTCACATCCCAAAAATCGTCGAGCTAGATCATTTGACCATCACTGGTAACGTCTTTTTAGGTAAAGATGTCACTTTGAGGGGTACTGTCATCATCGTTTGCTCCGACGGTCATAAAATCGATATTCCAAACGGCTCCATATTGGAAAATGTTGTCGTTACTGGTAATTTGCAAATCTTGGAACATTGA
SEQ ID NO:26是源自酿酒酵母的UTP--葡萄糖-1-磷酸尿苷酰转移酶(UGP1)的氨基酸序列
MSTKKHTKTHSTYAFESNTNSVAASQMRNALNKLADSSKLDDAARAKFENELDSFFTLFRRYLVEKSSRTTLEWDKIKSPNPDEVVKYEIISQQPENVSNLSKLAVLKLNGGLGTSMGCVGPKSVIEVREGNTFLDLSVRQIEYLNRQYDSDVPLLLMNSFNTDKDTEHLIKKYSANRIRIRSFNQSRFPRVYKDSLLPVPTEYDSPLDAWYPPGHGDLFESLHVSGELDALIAQGREILFVSNGDNLGATVDLKILNHMIETGAEYIMELTDKTRADVKGGTLISYDGQVRLLEVAQVPKEHIDEFKNIRKFTNFNTNNLWINLKAVKRLIESSNLEMEIIPNQKTITRDGHEINVLQLETACGAAIRHFDGAHGVVVPRSRFLPVKTCSDLLLVKSDLFRLEHGSLKLDPSRFGPNPLIKLGSHFKKVSGFNARIPHIPKIVELDHLTITGNVFLGKDVTLRGTVIIVCSDGHKIDIPNGSILENVVVTGNLQILEH
SEQ ID NO:27是源自酿酒酵母的葡萄糖胺6-磷酸N-乙酰转移酶(GNA1)的核酸序列
ATGAGCTTACCCGATGGATTTTATATAAGGCGAATGGAAGAGGGGGATTTGGAACAGGTCACTGAGACGCTAAAGGTTTTGACCACCGTGGGCACTATTACCCCCGAATCCTTCAGCAAACTCATAAAATACTGGAATGAAGCCACAGTATGGAATGATAACGAAGATAAAAAAATAATGCAATATAACCCCATGGTGATTGTGGACAAGCGCACCGAGACGGTTGCCGCTACGGGGAATATCATCATCGAAAGAAAGATCATTCATGAACTGGGGCTATGTGGCCACATCGAGGACATTGCAGTAAACTCCAAGTATCAGGGCCAAGGTTTGGGCAAGCTCTTGATTGATCAATTGGTAACTATCGGCTTTGACTACGGTTGTTATAAGATTATTTTAGATTGCGATGAGAAAAATGTCAAATTCTATGAAAAATGTGGGTTTAGCAACGCAGGCGTGGAAATGCAAATTAGAAAATAG
SEQ ID NO:28是源自酿酒酵母的葡萄糖胺6-磷酸N-乙酰转移酶(GNA1)的氨基酸序列
MSLPDGFYIRRMEEGDLEQVTETLKVLTTVGTITPESFSKLIKYWNEATVWNDNEDKKIMQYNPMVIVDKRTETVAATGNIIIERKIIHELGLCGHIEDIAVNSKYQGQGLGKLLIDQLVTIGFDYGCYKIILDCDEKNVKFYEKCGFSNAGVEMQIRK
SEQ ID NO:29是源自酿酒酵母的磷酸乙酰葡萄糖胺变位酶(PCM1)的核酸序列
ATGAAGGTTGATTACGAGCAATTGTGCAAACTCTACGATGACACGTGCCGCACAAAGAATGTGCAGTTCAGTTACGGTACGGCCGGATTCAGAACGCTGGCCAAGAATTTGGATACGGTGATGTTCAGTACTGGTATACTGGCGGTTCTCAGGTCGCTGAAGCTTCAGGGTCAGTATGTGGGGGTGATGATCACGGCGTCGCACAACCCATACCAGGACAACGGGGTCAAGATCGTGGAACCAGACGGATCGATGCTTTTGGCCACATGGGAGCCATATGCCATGCAGTTGGCCAATGCGGCCTCTTTTGCCACTAATTTTGAAGAATTTCGTGTTGAGTTGGCCAAGCTGATTGAACACGAAAAGATTGATTTGAATACAACCGTCGTGCCTCACATCGTGGTTGGGAGAGACTCTAGGGAAAGTAGTCCATACTTGCTGCGCTGCTTGACTTCCTCCATGGCCAGCGTCTTCCACGCGCAAGTTTTGGACCTAGGCTGTGTCACTACGCCTCAATTGCATTACATTACTGATTTGTCCAACAGGCGGAAACTGGAAGGAGACACAGCGCCAGTTGCCACAGAACAGGACTACTATTCGTTCTTTATAGGAGCCTTCAACGAGCTCTTCGCCACGTATCAGCTGGAGAAGAGGCTGTCTGTCCCAAAATTGTTCATAGACACAGCCAATGGTATCGGTGGTCCACAGTTGAAAAAACTACTGGCCTCCGAAGATTGGGACGTGCCAGCGGAGCAAGTTGAGGTAATCAACGACAGGTCCGATGTTCCAGAACTGTTGAATTTTGAATGCGGTGCGGATTATGTGAAGACTAACCAGAGATTACCCAAGGGTCTTTCTCCATCCTCGTTTGATTCGCTATATTGCTCCTTTGATGGTGACGCAGACAGGGTTGTGTTCTACTATGTCGACTCAGGATCAAAATTTCATTTGTTGGATGGTGACAAAATTTCCACTTTGTTTGCAAAGTTCTTGTCTAAACAACTAGAATTGGCACACCTAGAACATTCTTTGAAGATTGGTGTTGTGCAAACTGCCTATGCAAACGGCAGTTCCACCGCTTACATAAAAAATACGTTGCACTGTCCCGTGTCTTGCACTAAGACAGGTGTTAAACACTTGCATCATGAAGCTGCCACTCAGTACGATATTGGCATTTATTTCGAAGCAAATGGACATGGTACGATTATATTCAGCGAAAAATTTCATCGAACTATCAAATCTGAATTATCCAAGTCCAAGTTAAATGGTGATACGTTAGCTTTGAGAACTTTGAAGTGTTTCTCTGAATTGATTAATCAGACCGTGGGAGATGCTATTTCAGACATGCTTGCTGTCCTTGCTACTTTGGCGATTTTGAAAATGTCGCCAATGGATTGGGATGAAGAGTATACTGATTTGCCCAACAAGCTGGTTAAGTGCATCGTTCCTGATAGGTCAATTTTCCAAACCACGGACCAGGAAAGAAAATTGCTCAATCCAGTGGGGTTGCAAGACAAGATAGATCTTGTGGTAGCCAAGTATCCCATGGGAAGAAGCTTTGTCAGAGCCAGTGGTACGGAGGATGCGGTGAGGGTTTATGCGGAATGTAAGGACTCCTCTAAGTTAGGTCAATTTTGTGACGAAGTGGTGGAGCACGTTAAGGCATCTGCTTGA
SEQ ID NO:30是源自酿酒酵母的磷酸乙酰葡萄糖胺变位酶(PCM1)的氨基酸序列
MKVDYEQLCKLYDDTCRTKNVQFSYGTAGFRTLAKNLDTVMFSTGILAVLRSLKLQGQYVGVMITASHNPYQDNGVKIVEPDGSMLLATWEPYAMQLANAASFATNFEEFRVELAKLIEHEKIDLNTTVVPHIVVGRDSRESSPYLLRCLTSSMASVFHAQVLDLGCVTTPQLHYITDLSNRRKLEGDTAPVATEQDYYSFFIGAFNELFATYQLEKRLSVPKLFIDTANGIGGPQLKKLLASEDWDVPAEQVEVINDRSDVPELLNFECGADYVKTNQRLPKGLSPSSFDSLYCSFDGDADRVVFYYVDSGSKFHLLDGDKISTLFAKFLSKQLELAHLEHSLKIGVVQTAYANGSSTAYIKNTLHCPVSCTKTGVKHLHHEAATQYDIGIYFEANGHGTIIFSEKFHRTIKSELSKSKLNGDTLALRTLKCFSELINQTVGDAISDMLAVLATLAILKMSPMDWDEEYTDLPNKLVKCIVPDRSIFQTTDQERKLLNPVGLQDKIDLVVAKYPMGRSFVRASGTEDAVRVYAECKDSSKLGQFCDEVVEHVKASA
SEQ ID NO:31是启动子pTDH3的核酸序列
CTGCTGTAACCCGTACATGCCCAAAATAGGGGGCGGGTTACACAGAATATATAACATCGTAGGTGTCTGGGTGAACAGTTTATTCCTGGCATCCACTAAATATAATGGAGCCCGCTTTTTAAGCTGGCATCCAGAAAAAAAAAGAATCCCAGCACCAAAATATTGTTTTCTTCACCAACCATCAGTTCATAGGTCCATTCTCTTAGCGCAACTACAGAGAACAGGGGCACAAACAGGCAAAAAACGGGCACAACCTCAATGGAGTGATGCAACCTGCCTGGAGTAAATGATGACACAAGGCAATTGACCCACGCATGTATCTATCTCATTTTCTTACACCTTCTATTACCTTCTGCTCTCTCTGATTTGGAAAAAGCTGAAAAAAAAGGTTGAAACCAGTTCCCTGAAATTATTCCCCTACTTGACTAATAAGTATATAAAGACGGTAGGTATTGATTGTAATTCTGTAAATCTATTTCTTAAACTTCTTAAATTCTACTTTTATAGTTAGTCTTTTTTTTAGTTTTAAAACACCAAGAACTTAGTTTCGAATAAACACACATAAACAAACAAA
SEQ ID NO:32是启动子pTDH3.Sk的核酸序列
CAATTCATCGGCCCTTTTAGCGGCTACCCGCGCCATCTAAATGATAGGGCGGGTGACACTATGGTAAATCCCATAATTAGGTGTCTGGGTGAGTGGTTCTGATGCCGGCATCCACTAAATATATTGGAGCCCATTTTTTACGCGGGCTTCCAGAAAAAAAGAGAATCCCAGCACCAAAAGGTGGTTCTCTTCACCAACCATCAGATCATAGGTCCACAACCACACATAACAGGGGCACAAAAAGGCAAAAAACGGACATAACCTCAATGGAGTGATGCAAATTGACTGGAGCAAAAGCTGACACAAGGCATTGATTGACCTACGCATGTATCTGTATTCTTTTCTTACACCTTCTATTACCTTCTAACTCTTTGGGTTGGAAAAAACTGAAAAAAAAGGTTGGGACCTGGTTCCCCCAAGTTGTCCCCCTACTTGGTTATTAAATATATAAAGACAGCAAGTGTTGATTATAATCTTGTAAATCTATAGTTCTTAATCTATACTTCTATTTATATTTTAAATTAGTCTTTTTATTTCCAAGTCCCCAAGAACTTAGTTTCGAATAAACACACACAAATAAACACA
SEQ ID NO:33是启动子pTDH3-1.sba的核酸序列
GCAGCGCTTCTTCCGCTCTAGTTTTTATAGTTATTATTACTACCACCTTAAAAATACGTAAATACTCAAAATAGTAGTGATATTCCCAACCTTATTCATCCAAGGCACATCATCATCATCAGCCATTCATCTTTCACCTGCCATTAGTAACCCGTCTTCTCATTGAGCGGGTTACGGCAGCCACAGGCCACATTCCGAATGTCTGGGTGAGCGGTCCCTTTTCCAGCATCCACTAAATATCTCCGATCCCGCTTTTTAATCTGGCTTCCTGAAAAAAAGAGAATCCCAGCACCAAAAAATGGCTCTCTTCACCAACCATCAGATCATAGGTCCCATTCTCTTACCGCAACCGTACAGAACAGGGGAAAACGGGTACAACCTCAATGGAGTGATGCAAACTGACTGGAGCAAAAAGCTGACACAAGGCAATCGACCTACGTGTCTGTCTATTTTCTCACACCTTCTATTACCTTCTAACTCTCTGGGTTGGAAAAAACTGAAAAAAAGGTTGAGACCAGTTTCCACAAATCATCCCCCTGTTTGATTAATAAATATATAAAGACGACAACTATCGATCATAAACTCATAAAACTATAACTCCTTTACACTTCTTATTTTATAGTTATTCTATTTTAATTCTTATTGATTTTAAAACCCCAAGAACTTAGTTTCGAAAACACACACACACAAACAATTAAAA
SEQ ID NO:34是启动子pTDH3.Sar的核酸序列
GAGCTAAATATCAGCCCTTCGGGTCCTGCCTGCTACCCGGTCCTGTTCGAATAAAAACGCGGGTAACACGACCCAGTAACACCTGTCGTTGGGTGTCTGGGTCAGAAGTTCTGATACCGGCTTCCACTAAATAGATTGGGTTCCGCTCTTTACGCTGGCTTCCTGAAAAAAGAGATTCCGGGCACCAAAAAATTGGTCTCTTTGCCAACCATCAGATCATAGGTCCATTCTCTTACCATAACCACACAGGATAGGGGCACCACAGGCGAAAATGGGCACAAAATCTCAATGGAGTGATGCAAATTAGCTGGAACAAAAGCTGACACAAGGCAATTAACCTGCGCATGTATCCATCTCCTTTTCTTACACCTTCTCTTACGTTCTAACTGTTTGGGTTGGAAAAATTAAAAAAAAAAGGTTGAGACCAGTTTCCCCAAATCGTCCCCCTACTTGATTCATAAATATATAAAGACGACAACTATTGATTATAATCTTGTAAATCTATAACTCTTTACTTTCTCCTATTTATAATTTAACTTAATCTTTTTAGATTTAAAACCCCAAGAACTTAGTTTCGAACAAACACACACAAATAAACAAAA
SEQ ID NO:35是启动子pENO2的核酸序列
CGCTCAGCATCTGCTTCTTCCCAAAGATGAACGCGGCGTTATGTCACTAACGACGTGCACCAACTTGCGGAAAGTGGAATCCCGTTCCAAAACTGGCATCCACTAATTGATACATCTACACACCGCACGCCTTTTTTCTGAAGCCCACTTTCGTGGACTTTGCCATATGCAAAATTCATGAAGTGTGATACCAAGTCAGCATACACCTCACTAGGGTAGTTTCTTTGGTTGTATTGATCATTTGGTTCATCGTGGTTCATTAATTTTTTTTCTCCATTGCTTTCTGGCTTTGATCTTACTATCATTTGGATTTTTGTCGAAGGTTGTAGAATTGTATGTGACAAGTGGCACCAAGCATATATAAAAAAAAAAAGCATTATCTTCCTACCAGAGTTGATTGTTAAAAACGTATTTATAGCAAACGCAATTGTAATTAATTCTTATTTTGTATCTTTTCTTCCCTTGTCTCAATCTTTTATTTTTATTTTATTTTTCTTTTCTTAGTTTCTTTCATAACACCAAGCAACTAATACTATAACATACAATAATA
SEQ ID NO:36是启动子pTEF3的核酸序列
GGCTGATAATAGCGTATAAACAATGCATACTTTGTACGTTCAAAATACAATGCAGTAGATATATTTATGCATATTACATATAATACATATCACATAGGAAGCAACAGGCGCGTTGGACTTTTAATTTTCGAGGACCGCGAATCCTTACATCACACCCAATCCCCCACAAGTGATCCCCCACACACCATAGCTTCAAAATGTTTCTACTCCTTTTTTACTCTTCCAGATTTTCTCGGACTCCGCGCATCGCCGTACCACTTCAAAACACCCAAGCACAGCATACTAAATTTCCCCTCTTTCTTCCTCTAGGGTGTCGTTAATTACCCGTACTAAAGGTTTGGAAAAGAAAAAAGAGACCGCCTCGTTTCTTTTTCTTCGTCGAAAAAGGCAATAAAAATTTTTATCACGTTTCTTTTTCTTGAAAATTTTTTTTTTTGATTTTTTTCTCTTTCGATGACCTCCCATTGATATTTAAGTTAATAAACGGTCTTCAATTTCTCAAGTTTCAGTTTCATTTTTCTTGTTCTATTACAACTTTTTTTACTTCTTGCTCATTAGAAAGAAAGCATAGCAATCTAATCTAAGTTTTAATTACAAA
SEQ ID NO:37是启动子pTEF1的核酸序列
GTTTAGCTTGCCTCGTCCCCGCCGGGTCACCCGGCCAGCGACATGGAGGCCCAGAATACCCTCCTTGACAGTCTTGACGTGCGCAGCTCAGGGGCATGATGTGACTGTCGCCCGTACATTTAGCCCATACATCCCCATGTATAATCATTTGCATCCATACATTTTGATGGCCGCACGGCGCGAAGCAAAAATTACGGCTCCTCGCTGCAGACCTGCGAGCAGGGAAACGCTCCCCTCACAGACGCGTTGAATTGTCCCCACGCCGCGCCCCTGTAGAGAAATATAAAAGGTTAGGATTTGCCACTGAGGTTCTTCTTTCATATACTTCCTTTTAAAATCTTGCTACGATACAGTTCTCACATCACATCCGAACATAAACAACC
SEQ ID NO:38是启动子pTEF1.ago的核酸序列
GTTTAGCTTGCCTCGTCCCCGCCGGGTCACCCGGCCAGCGACATGGAGGCCCAGAATACCCTCCTTGACAGTCTTGACGTGCGCAGCTCAGGGGCATGATGTGACTGTCGCCCGTACATTTAGCCCATACATCCCCATGTATAATCATTTGCATCCATACATTTTGATGGCCGCACGGCGCGAAGCAAAAATTACGGCTCCTCGCTGCAGACCTGCGAGCAGGGAAACGCTCCCCTCACAGACGCGTTGAATTGTCCCCACGCCGCGCCCCTGTAGAGAAATATAAAAGGTTAGGATTTGCCACTGAGGTTCTTCTTTCATATACTTCCTTTTAAAATCTTGCTACGATACAGTTCTCACATCACATCCGAACATAAACAACC
SEQ ID NO:39是启动子pTEF1.Sba的核酸序列
CGCCAACAAACCTTCGAACACTTTAATTTTCGAGGACCGCAGATCCTCACATCACACCCACACCCAAGACTGCTTCCCCCACACACCCTGCATCTGTACACTTTCTTCTGCTCTGTTTTTCTCTCCGGCGTTCTCTCGGGTCGCCCGCATCGCCGCGCCGGCTGGAACCGCCCACGCACCGCATATTGCAAATCGCCTGCCCCCTCTTGCTCCTTTTTGAGGGCGCGCCGTTACCCGCGCCCAGGGTCCGGAAAAAGAAACAAGGCTCTACCGCGTTTCTTTTTCCTTGTCGAAAAAGGCAAAAATGAAAATTTTTATCACGTTTCTTTTTTTTTGAAAAATTTTTTTTTTGGTTTTTTTTCTTTCGATGGCCTCCCATTGATATTTAAGTTAATAAATGGTTTTCAGTTTTCAAGTTTCAGTTTGTGTTCTTCTTTGCTAACTTTCACTTACACCTCGAAAGAAAGTATAGCAATCTAATCTTAGTTTTAATTACAA
SEQ ID NO:40是启动子pPDC1的核酸序列
TTATTTACCTATCTCTAAACTTCAACACCTTATATCATAACTAATATTTCTTGAGATAAGCACACTGCACCCATACCTTCCTTAAAAACGTAGCTTCCAGTTTTTGGTGGTTCCGGCTTCCTTCCCGATTCCGCCCGCTAAACGCATATTTTTGTTGCCTGGTGGCATTTGCAAAATGCATAACCTATGCATTTAAAAGATTATGTATGCTCTTCTGACTTTTCGTGTGATGAGGCTCGTGGAAAAAATGAATAATTTATGAATTTGAGAACAATTTTGTGTTGTTACGGTATTTTACTATGGAATAATCAATCAATTGAGGATTTTATGCAAATATCGTTTGAATATTTTTCCGACCCTTTGAGTACTTTTCTTCATAATTGCATAATATTGTCCGCTGCCCCTTTTTCTGTTAGACGGTGTCTTGATCTACTTGCTATCGTTCAACACCACCTTATTTTCTAACTATTTTTTTTTTAGCTCATTTGAATCAGCTTATGGTGATGGCACATTTTTGCATAAACCTAGCTGTCCTCGTTGAACATAGGAAAAAAAAATATATAAACAAGGCTCTTTCACTCTCCTTGCAATCAGATTTGGGTTTGTTCCCTTTATTTTCATATTTCTTGTCATATTCCTTTCTCAATTATTATTTTCTACTCATAACCTCACGCAAAATAACACAGTCAAATCAATCAAA
SEQ ID NO:41是启动子pCCW12的核酸序列
AACCAGGGCAAAGCAAAATAAAAGAAACTTAATACGTTATGCCGTAATGAAGGGCTACCAAAAACGATAATCTCAACTGTAAACAGGTACAATGCGGACCCTTTTGCCACAAAACATACATCATTCATTGCCGGAAAAAGAAAGAAGTGAAGACAGCAGTGCAGCCAGCCATGTTGCGCCAATCTAATTATAGATGCTGGTGCCCTGAGGATGTATCTGGAGCCAGCCATGGCATCATGCGCTACCGCCGGATGTAAAATCCGACACGCAAAAGAAAACCTTCGAGGTTGCGCACTTCGCCCACCCATGAACCACACGGTTAGTCCAAAAGGGGCAGTTCAGATTCCAGATGCGGGAATTAGCTTGCTGCCACCCTCACCTCACTAACGCTGCGGTGTGCGGATACTTCATGCTATTTATAGACGCGCGTGTCGGAATCAGCACGCGCAAGAACCAAATGGGAAAATCGGAATGGGTCCAGAACTGCTTTGAGTGCTGGCTATTGGCGTCTGATTTCCGTTTTGGGAATCCTTTGCCGCGCGCCCCTCTCAAAACTCCGCACAAGTCCCAGAAAGCGGGAAAGAAATAAAACGCCACCAAAAAAAAAAATAAAAGCCAATCCTCGAAGCGTGGGTGGTAGGCCCTGGATTATCCCGTACAAGTATTTCTCAGGAGTAAAAAAACCGTTTGTTTTGGAATTCCCCATTTCGCGGCCACCTACGCCGCTATCTTTGCAACAACTATCTGCGATAACTCAGCAAATTTTGCATATTCGTGTTGCAGTATTGCGATAATGGGAGTCTTACTTCCAACATAACGGCAGAAAGAAATGTGAGAAAATTTTGCATCCTTTGCCTCCGTTCAAGTATATAAAGTCGGCATGCTTGATAATCTTTCTTTCCATCCTACATTGTTCTAATTATTCTTATTCTCCTTTATTCTTTCCTAACATACCAAGAAATTAATCTTCTGTCATTCGCTTAAACACTATATCAATA
SEQ ID NO:42是启动子pCCW12.Sm的核酸序列
CGTTGTGCTGTAGTGAAGGAAGACTAAAAAGGATAATCACAGTTGTAAAGAGGTATAATGCGGACCCTTTTGCCACAAAACACACATCTTTCGTTTCCAAAATAAGAAAGAAGAAAGCAAAAAGATTAGCAGCCACGTTGCTGCGATCTAATTATAGACGGTGGCGTCATCATTCTCACCCAAGATTGTGTCTTGAACCTGCCACGGGTCCTGCGTTATCGCCGGATGTAAAACTAGACATGCAAAAAAAGGACCTTCCAGGTAGCGTGCTCCACACCACCCATGACCACCACAGTTAGTCCAAAAGAGGCAGCACCACTTCCCGATGGGGGAATTAGATTGCTGCCACCCTCACCTCACTAATGCTGCGGTGTGCGGATATGCCCTGCTATATATAGCTCCGCGTTTTTGAACCAGCACAGCGCGAGCACCAAAAAGGAAAATCGCATAGGCCCAGAACTGATTTCAGCACGGGCTATTGGCGTTGGGTTTCCGTTCTGGGAAACCTTCGCCGCGTCCCCCTCACAAACCTCCGCACAAGTTCGAGCAAGCGGGAAAAAACGAAAAACGCCATTAATACTAAATAAAGCAAATCCTCGAAGCGTGGGTGGCAAGCCCCTGGATTTTTCCGCACAAGTACTCTTCTCAGGAGTAAAAAAACCCGTTTGTTTTGGAATTCCCCATTTCGCGGCCATCTACGCCGGTATCTTCGCAATATCTATCAGCGATAACTCAGCAATTTTAATATTCGTGTTGCAGTGCTGCGATAGCGGGAGTCTTGTTTGTAACATAACGGCAGAAAGGAATGAGAGAAAATTTTCCATTCTTTGGCCTCCGTTCAAGTATATAAAGCCGGCATGCTTGGTAATCTTTCTCTCTCTTCTGTATTGTTTCTATAATACTTTTATCTTCTAATTATTTTCTGAAAAAACCAAGAAATTAATCTTCTGTCATTCGCTTAAACACTATATCAATA
SEQ ID NO:43是启动子pCCW12.Sk的核酸序列
TGTAAAATCCTACACGCAAAAAACCTCTTGGGTTGCGCGTTTTCCACCACCCACGACCCGCACAATCAATCCAAAAGGGGCAACGCCAGTTCCCAATGCGGGAATTAGCTCCTCACCCCCCTCACCCGCTAACGCTGCGGTGTGCGGACACGCAGCAGTATTTATAGATCCTCGTGTTGGAACCAGCCCGCGTGAGCACCAAATTGGAAAGTCGCAATGGGCCCAGAACCGCTTTCAGTACTGGGCCATTGGCGTCTAGTTTCCGTTTTGAGCGTCCTTCGCCGCGTCTCTCTGTGAAATCCCCGCACAAGTCTGAGCAGGCAAAAAAAAAAAACGCCACCAAAAATAAATAAAGCCAATCCTCGAAGGATGAGTAGGAAAGGAAGCCCCTGGTTTTTTCCCGCACGAATATTTTTCAGGAGTGAAAAAATCCGTTTGTTTTGGAATTCCCCATTTCGCGCTCACCTACGCCGGTATCTTTGGAACAACTATCAGCGATAACTCAGCAAAATTTGCATATCCGTGCTGCAATAGTGCGATAGTGGGATTGGGAGTCTTGTTGCATCATAACGGCAGAAAGGAATGAATAAAAATTTTCCGTTCTTTGTCTCCGTTCAAGTATATAAAGTCGGCATGCTTGATTATCTTTTCTTCTCTTCTACTACATTTCTATTTCACTTTCTACTCTATTCTTCCCTGAAAAACCCAAGAAAATAATCTTCTGTCATTCGCTTAAACAATATATCAAAA
SEQ ID NO:44是启动子pCCW12.Sba的核酸序列
ACCATGCCACGGTGCTGGCCCCACTTCCACCCACGACCCGCACGGTTGGCCCGAAAGGGGCAACACCAGTTCCCAATACGGAAATTAGTCCGCCACCACCCTCACCTCGCTAGAGCTGCGGTGTGCGGGCGTGCATCGCTATTTATAGACATGCCTGCTGGCGTCACCGCGCGCGAGCACCAAACAGGAAAATCGCACTGGGCCCAGAACCACGCTATGCGCTGGGCCGATGGCGTCCGGTTTCCCTTTGGGAGCCCCCTGCCACGTTCGCCTAACAAATCCCCGCACCGGCTTGAGAAAAAAGCGAAAAGCGAAAAAAAAAAATCAACGCCACCAAAATTAAAAAAAAAGAGCCATCCTCGAAGGGTGAATAGTAGCCCCTGACTTTTCCCGCACAGACAGACACCTTTCAGGAGTGAACAAAAAAGCAGTTTGTTTTGGAATTCCCCCATTTCGCGGTGGCCTGCGCAGGTATCTCTGCGTCAACTATCAGCGATAACTCAGCAAATTTTGCATATTCGTGTTGCGATACTACGATAATGGGAGTCTGTCGCCTAATAACGGCAACAAGGAATGAGAGAGAAAAATTTTCTTCATTCTCCAGCTCCCGTTCAAGTATATAAGGTCGGCATGGTCGATTGTCTTTCCTTCTCTTCAGTTACGTCTCTCTATTTACATTATTCTTATTTTTATTTAATAAAAACCCCAAGAAATTAATCTTCTGTCATTCGCTTAAACACTATATCAAAA
SEQ ID NO:45是启动子pCCW12.Sar的核酸序列
AAAAAACAACCTTCTGCCAACCTGCGTGCTTCTCACCACCCATGACCCACACAATTGACCCGAATGGGGCAACTCCAGTTCCCAATACGGGAATTAACTCGCCACCATATTTACCGCGTTGAAGCTGTGGTGTGCGGACACTCCGTACTATTTATAGACCCACGCGGTGGAACCAGCACGCGCGCGCACTAAACAGGAAAATCGCATTGAGTCCAGAACCGCCACCAGCACTTGGCCATTGGCGTCTAATTTCCGTTTTCGGCGCCCCTCACCGCGTCCTTCTAACAAAGCGCGCACAAGCTTGAGCAAGTGAAAAGAAAATTAAAAATAAAAAACCGCCACCAAAACAAATAAAGCAATCTTCGAAGTGTGGGTTGGTGGGAAGCCCCTGGCTTTTCCCGCACCAGTCGTTTTCAGGAGTAAAAAAATACCCGTTTGTTTTGGAATTCCCCATTTCGCGGCGACCTGCGCCGGTATCTTTGCAACAACTATTTGCGATAACTCAGCAAAATTTGCATATTCGTGTTGGGATATTGCGATAGTGGGAGTCTTGTTGCATAATAACGGTAAAAAGAAGTGAAGGAAAAAAATTTGCATCCTTTAGTCTCAGTTCAAGTATATAAAGTCGGGATATTCAATTATCTTTCTTTCTCTTGCTCAAAGGTTTCTATATTTTTTTTATAGTATTTCTTTTGTTATAAAATACCAAGAAATTAATCTTCTGTCATTCGCTTAAATACTACATCAATA
SEQ ID NO:46是启动子pNUP57的核酸序列
TCATCTGCGCAATGACTATCAAGACCTTCTGCAAGAATTTCAAATCTCACTGAAAATCTTGACCGAAAAGTGTCTTGAAAACCCATCAAGCCTGCAAAACCTATCTTTGACATTAGTCTCCATTATAAAAACGGCATAGTTGGGAGAAAACTTTCCATACTTCAATTGTGGACTGATATAAGTATTTTAGTTTTGCCCGCATGATCATCCCACATGGCTACAGCAGTTCTCTCATAGGAAAATAGTACAATAGCTACGTGATATAATCTAAATAATTGTTGCCAATGTGTAATTATATCATTTTGAACGTACGCGAAATGGATTATTTTCAAAAATTTTGTTTCTTGAAATGAGTAAAAGCAAAAGTCCAACTCTCCAAGTCGATGTAAACAACTTTTTGCCAAAGGGACTGAAAGACTAAATCGAGGATTATCCCGTTCAAACTATTCCAGAAACGCTCGTTAGTAACAAAAGACATACCTTGTTGACCAATTGATCAC
SEQ ID NO:47是启动子pCCW10.ago的核酸序列
GGTACCACGGCAACCTCGTTCGCTGTTCATCCCCTTCGTCACACAGGACGTTGGATGCCGTAAGCAGCGTTGCTTTTGATCCTCagGATCGGCCGGGTAACCCGCGGCtGCTTCTATTTTAGTATTCATATCTCAAGCACATCCATTCCGGCCGTTTGGGGGCGCCGCCGCACTCGTGTCCATTCCTACCGTGGCACTTAGGGCTATCCTGTCGGAGCGCCCCGCCGACCGCCTTATCGGCACCAAAAGTAGAAGCCCCGGCCCCGCGTGGCTCAGACTCACCATCGGTGCTATTTACTTTTCGATCAGATCGCGGCGCGCGGTGGCCGGCATTTCCGGAAGCGGCCACGGAGCAGAGGTGGCGCATTCGAATCGCATACGTCTTCGCCACGCCGGAAAAAAAATTTTCGGCTATATAAGGAGAGGCGGCCGTCTTGCTGCAGGCAGTTTCACTTTCTCTAAAACCAAAGAACATCGATTTCTTTAGTCACTCGCTTCCTTACACCGAACTCGAGGCGGCCGC
SEQ ID NO:48是启动子pCWP2的核酸序列
CTAGCCTCCCCTTTTTATTTTGTGCGGTCACCGCAAGGGACAAAGCTTTTCTTAGAAAACCGTCTGAGAAGCATAACGTACGCCATCCCCTAGACATATTAATAATGCTACAGATACTATGCTGCTCGTCTTTTTTTGACGACCCTTTTATTGCAATGTGCAACTAATGGCAAACAACCACATAGTATCACAGTATTACATTGCCTCCACCGATGCGGATGTTAGGGCGCCAAGTCTGTCATGAAGCATGTTCCTGTCATAATCTTGTATGCAAAATACCGCGTTCTGCGCCACTGATATGCTAGGCAGCAGCAACCTATGCAGAAGATTGCTTTTCCCACGCCTGTTTTACGTCTCCAGGGCACTTGAAACAATGCAGCGATCGCCGCCACAACACGCCAAAGAGAAGCGAAAGTGGGCCTGGGCGGCCTCAGTTTCGGCAGAGGTAAACAACACGAACTGAACTGCCTTAGCTCCGAAGGGCAATTCCACAGGCACTCCGCGGGGCCCGGCCAAGGCCCAAAAGGCGTGGAATATGCGCGTTTTGGGGCCATAACACCCAGTACCACGGCCGGAACGGGCCATATAATAAGTTTTTCACTCTCAAGAATGGTAAACGTAAATAGGAACATCCCACTACCCTAGAAATTGCGGAAATTTCGCGCTTATCATTAGAAAATCTGGAACCGTCCTTTTTCCTCTTTCTTGCATTTCCCTTTCCGTATTATTGCCATTCTTTAACTGCATTTGGGGAACCGTAGACCAAAAGCCAAACAGAGAAATGTAACGTTCTAAAAAAAAAACAACGAAAAAATTGAAAAATAAGATACAATAATCGTATATAAATCAGGCTTCTTGTTCATCATTTTCAATTCTCTTCTTGCCATCCCTTTTCCTATCTTTGTTCTTTTCTTCTCATAATCAAGAATAAATAACTTCATCA
SEQ ID NO:49是启动子pCCW120.Sca的核酸序列
TATTTTTTTTAAATTAAAGATGCTGTGCAATTAATTGTCCGGAGGGACCCTTGCATACTGGCCAGTTTGTACGGGCGTTACATAGCGCCGATCGACGAACAGCTTATTAATAGCAAGATTTGTTTCTCCCATGAGCAATTAACCAGTAATTTTCACAGAAACTAGCACAAAACCAACCAAACAGTTAAAGGCAGTTTCGGAGAATAAACAACGCGCTCACTGAGCTTGCTGTTGCCAAAAATAACAGTCGCGTGCGATGGCGGGCTTGGCATTTTCCTCGAAGGGGAAACGCCGCCAGGGTTCGCTGCGGTGTGTGGGTGGGGCAGCCCCCGGGCGCCCAGACGGTGCCGCAGGGCCTTGAGACAGCCCAAAATGCCGCGAAAACGCAAGGGCGCGGTGACCTCTTTCCTAATGCGGAAAGCCCCACCGCCAGCGACGTGACGCGTTGTGCGGGCTCTTCTCGGGACCCGGAAAAAGAAATACGTACACAAACACCAGCAAATTTTTTCGCTTGAGAGGCTGCCCGTGTTTCTGCGCAACGTGAAACACGGTGGACAAGACAAGAGAGATTGACAAGCGTCGTTATCGTCCCAGTGAGGTTTCCCAATTATATAAATACATCCCTGTTGGTGGATTCTTAATTACAACTTCCATCTCTCTCTCTCTCACTTCTTTTGTTCCCTTACATATCCCCAAGAAATCAATCTTCTGCCATTCGCTTTAACAACAAACAAACTTTTAACTTTTAAA
SEQ ID NO:50是启动子pRPLA1的核酸序列
TCAAGTTGGATACTGATCTGATCTCTCCGCCCTACTACCAGGGACCCTCATGATTACCGCTCGAATGCGACGTTTCCTGCCTCATAAAACTGGCTTGAAAATATTTATTCGCTGAACAGTAGCCTAGCTTATAAAAATTTCATTTAATTAATGTAATATGAAAACTCACATGCCTTCTGTTTCTAAAATTGTCACAGCAAGAAATAACATTACCATACGTGATCTTATTAAACTCTAGTATCTTGTCTAATACTTCATTTAAAAGAAGCCTTAACCCTGTAGCCTCATCTATGTCTGCTACATATCGTGAGGTACGAATATCGTAAGATGATACCACGCAACTTTGTAATGATTTTTTTTTTTTCATTTTTTAAAGAATGCCTTTACATGGTATTTGAAAAAAATATCTTTATAAAGTTTGCGATCTCTTCTGTTCTGAATAATTTTTAGTAAAAGAAATCAAAAGAATAAAGAAATAGTCCGCTTTGTCCAATACAACAGCTTAAACCGATTATCTCTAAAATAACAAGAAGAA
SEQ ID NO:51是启动子pCUP1的核酸序列
CGGCAAACTTCAACGATTTCTATGATGCATTTTATAATTAGTAAGCCGATCCCATTACCGACATTTGGGCGCTATACGTGCATATGTTCATGTATGTATCTGTATTTAAAACACTTTTGTATTATTTTTCCTCATATATGTGTATAGGTTTATACGGATGATTTAATTATTACTTCACCACCCTTTATTTCAGGCTGATATCTTAGCCTTGTTACTAGTTAGAAAAAGACATTTTTGCTGTCAGTCACTGTCAAGAGATTCTTTTGCTGGCATTTCTTCTAGAAGCAAAAAGAGCGATGCGTCTTTTCCGCTGAACCGTTCCAGCAAAAAAGACTACCAACGCAATATGGATTGTCAGAATCATATAAAAGAGAAGCAAATAACTCCTTGTCTTGTATCAATTGCATTATAATATCTTCTTGTTAGTGCAATATCATATAGAAGTCATCGAAATAGATATTAAGAAAAACAAACTGTACAATCAATCAATCAATCATCACATAAA
SEQ ID NO:52是启动子pMET6的核酸序列
CCACAGGAAATATTTCACGTGACTTACAAACAGAGTCGTACGTCAGGACCGGAGTCAGGTGAAAAAATGTGGGCCGGTAAAGGGAAAAAACCAGAAACGGGACTACTATCGAACTCGTTTAGTCGCGAACGTGCAAAAGGCCAATATTTTTCGCTAGAGTCATCGCAGTCATGGCAGCTCTTTCGCTCTATCTCCCGGTCGCAAAACTGTGGTAGTCATAGCTCGTTCTGCTCAATTGAGAACTGTGAATGTGAATATGGAACAAATGCGATAGATGCACTAATTTAAGGGAAGCTAGCTAGTTTTCCCAACTGCGAAAGAAAAAAAGGAAAGAAAAAAAAATTCTATATAAGTGATAGATATTTCCATCTTTACTAGCATTAGTTTCTCTTTTACGTATTCAATATTTTTGTTAAACTCTTCCTTTATCATAAAAAAGCAAGCATCTAAGAGCATTGACAACACTCTAAGAAACAAAATACCAATATAATTTCAAAGTACATATCAAAA
SEQ ID NO:53是启动子pMET25的核酸序列
TTACATTATCAATCCTTGCGTTTCAGCTTCCACTAATTTAGATGACTATTTCTCATCATTTGCGTCATCTTCTAACACCGTATATGATAATATACTAGTAACGTAAATACTAGTTAGTAGATGATAGTTGATTTTTATTCCAACACTAAGAAATAATTTCGCCATTTCTTGAATGTATTTAAAGATATTTAATGCTATAATAGACATTTAAATCCAATTCTTCCAACATACAATGGGAGTTTGGCCGAGTGGTTTAAGGCGTCAGATTTAGGTGGATTTAACCTCTAAAATCTCTGATATCTTCGGATGCAAGGGTTCGAATCCCTTAGCTCTCATTATTTTTTGCTTTTTCTCTTGAGGTCACATGATCGCAAAATGGCAAATGGCACGTGAAGCTGTCGATATTGGGGAACTGTGGTGGTTGGCAAATGACTAATTAAGTTAGTCAAGGCGCCATCCTCATGAAAACTGTGTAACATAATAACCGAAGTGTCGAAAAGGTGGCACCTTGTCCAATTGAACACGCTCGATGAAAAAAATAAGATATATATAAGGTTAAGTAAAGCGTCTGTTAGAAAGGAAGTTTTTCCTTTTTCTTGCTCTCTTGTCTTTTCATCTACTATTTCCTTCGTGTAATACAGGGTCGTCAGATACATAGATACAATTCTATTACCCCCATCCATACA
SEQ ID NO:54是启动子pSAM1的核酸序列
GAAACGGACGTAAGACGGAAATAGAATTTGAAGATAAAGTTATATATCACTACACACGAATACTTTCTTTTTTTTTTTTCACAGGAAAACTGTGGTGGCGCCCTTGCCTACTAGTGCATTTCTTTTTTCGGGTTCTTGTCTCGAcGAAATTTTAGCCTCATCGTAGTTTTTCACTCTGGTATCGATGAAAAAGGGAAGAGTAAAAAGTTTTCCGTTTAGTACTTAATGGGATTGGTTTGGGACGTATATATCGACTGGTGTTGTCTGTTATTCATCGTTGTTTTTCGGTTAGCTTCGAAAAAAAAATAGAGTAAAAACCAGGAATTTACCCTAAAAACAAGAAAAAATAAGATAAACGAAAAT
SEQ ID NO:55是终止子tTPI1的核酸序列
GATTAATATAATTATATAAAAATATTATCTTCTTTTCTTTATATCTAGTGTTATGTAAAATAAATTGATGACTACGGAAAGCTTTTTTATATTGTTTCTTTTTCATTCTGAGCCACTTAAATTTCGTGAATGTTCTTGTAAGGGACGGTAGATTTACAAGTGATACAACAAAAAGCAAGGCGCTTTTTCTAATAAAAAGAAGAAAAGCATTTAACAATTGAACACCTCTATATCAACGAAGAATATTACTTTGTCTCTAAATCCTTGTAAAATGTGTACGATCTCTATATGGGTTACTCA
SEQ ID NO:56是终止子tMET25的核酸序列
GTGTGCGTAATGAGTTGTAAAATTATGTATAAACCTACTTTCTCTCACAAGTACTATACTTTTATAAAACGAACTTTATTGAAATGAATATCCTTTTTTTCCCTTGTTACATGTCGTGACTCGTACTTTGAACCTAAATTGTTCTAACATCAAAGAACAGTGTTAATTCGCAGTCGAGAAGAAAAATATGGTGAACAAGACTCATCTACTTCATGAGACTACTTTACGCCTCCTATAAAGCTGTCACACTGGATAAATTTATTGTAGGACCAAGTTACAAAAGAGGATGATGGAGGTTT
SEQ ID NO:57是终止子tDIT1的核酸序列
TAAAGTAAGAGCGCTACATTGGTCTACCTTTTTGTTCTTTTACTTAAACATTAGTTAGTTCGTTTTCTTTTTCTCATTTTTTTATGTTTCCCCCCCAAAGTTCTGATTTTATAATATTTTATTTCACACAATTCCATTTAACAGAGGGGGAATAGATTCTTTAGCTTAGAAAATTAGTGATCAATATATATTTGCCTTTCTTTTCATCTTTTCAGTGATATTAATGGTTTCGAGACACTGCAATGGCCCTAGTTGTCTAAGAGGATAGATGTTACTGTCAAAGATGATATTTTGAATTTC
SEQ ID NO:58是终止子tRPL3的核酸序列
GAAGTTTTGTTAGAAAATAAATCATTTTTTAATTGAGCATTCTTATTCCTATTTTATTTAAATAGTTTTATGTATTGTTAGCTACATACAACAGTTTAAATCAAATTTTCTTTTTCCCAAGTCCAAAATGGAGGTTTATTTTGATGACCCGCATGCGATTATGTTTTGAAAGTATAAGACTACATACATGTACATATATTTAAACATGTAAACCCGTCCATTATATTGCTTACTTTCTTCTTTTTTGCCGTTTTGACTTGGACCTCTGGTTTGCTATTTCCTTACAATCTTTGCTACAAT
SEQ ID NO:59是终止子tRPL3.sm的核酸序列
GAAGTTTTTAAAGCATTTTTTAGACACTTCTCATTTTTCTAAGTTTTTTTAAAATAGTTTTATGTATTTACTACGTATCACAATTTGAAATAATTCATCTTCCCAAAAAACTAAGATTTTTATCCTTGTCACGATCCGTAACCAGTTTATAATATTTTAGAGCTTATACACGTACGTATACACACGTGTCGGTACATGAGAATTACGTTCAAAATTATTCACTTTTTTTTTCTCTGCCGTTTTACTTTTGAACTCTGTCTCGCTATTTCCTTACAATCTTCGCTACAATACCACTTGCCCTTGG
SEQ ID NO:60是终止子tRPL3.sba的核酸序列
GAAGTTTTCTGACAAAAACATAACGTTTTTTCCAATCATTTCTTATTTTTCCGGTTTATTTAAATAGTTTTTATGTACTATTATACGTATGACTATTTAACTTAAATTCTTCCTCCCAAGAAATCTCCCAAGTTTTTCATTATCATGGCATACACCACTATCAGTTACAAAATGGTAGCTCAACCATATATATATCTCTATATACACATATAAATGCAAACAGGTCCAAGTCACCGCTCACTGCAGTTTCTTTTGCCGTTTTGACTTCGATCTCTGCTTGGCTATTTTCTCACAATCCT
SEQ ID NO:61是终止子tRPL41B的核酸序列
GCGGATTGAGAGCAAATCGTTAAGTTCAGGTCAAGTAAAAATTGATTTCGAAAACTAATTTCTCTTATACAATCCTTTGATTGGACCGTCATCCTTTCGAATATAAGATTTTGTTAAGAATATTTTAGACAGAGATCTACTTTATATTTAATATCTAGATATTACATAATTTCCTCTCTAATAAAATATCATTAATAAAATAAAAATGAAGCGATTTGATTTTGTGTTGTCAACTTAGTTTGCCGCTATGCCTCTTGGGTAATGCTATTATTGAATCGAAGGGCTTTATTATATTACCCT
SEQ ID NO:62是终止子tRPL15A的核酸序列
GCTGGTTGATGGAAAATATAATTTTATTGGGCAAACTTTTGTTTATCTGATGTGTTTTATACTATTATCTTTTTAATTAATGATTCTATATACAAACCTGTATATTTTTTCTTTAACCAATTTTTTTTTTTATAGACCTAGAGCTGTACTTTTATTCTGCTATCAAGCAAACCCCTACCCCCTCTTCTCAATCCTCCCCTCAGGCAGAACTTATCTACCTGTATCAAGGAGCGGACGAGGGAGTCCTAATTGTTCTACGTATACCAATGCTAGCAGCTTACATAGGTGGTGGCACTACCA
SEQ ID NO:63是终止子tRPL15A.sba的核酸序列
GCTGGCTGATGAAAAATATAGTTCTGTTGGGCAAGCATTTGTTTACCTAGCATCTCTTTTATACTATTATTATCTTTATATTTGATGATTTTATATACAAGTTGTATACCTTTTCTTTAACCAATTTTTTTTTTTCTAATGGTGCACCTAGAAGTACATTTTTTCTCACCAATAGATAGTCAAGATACTCCCAGCCTCTATGGCGTTACCACGGAGCCGACAAGGGAAAGCTGCTTATCTTACATATGCAGATGCCAAGGCCCGTTACAGGCCGCCTTATTGATGTTTAGAAATAGCTTC
SEQ ID NO:64是终止子tIDP1的核酸序列
TCGAATTTACGTAGCCCAATCTACCACTTTTTTTTTTCATTTTTTAAAGTGTTATACTTAGTTATGCTCTAGGATAATGAACTACTTTTTTTTTTTTTTTTTTACTGTTATCATAAATATATATACCTTATTGTTGTTTGCAACCGTCGGTTAATTCCTTATCAAGGTTCCCCAAGTTCGGATCATTACCATCAATTTCCAACATTTTCATGAGTTCTTCTTCTTCATTACCGTGTTTTAGGGGGCTGTTCGCACTTCTAATAGGGCTATCACCAAGCTGTTCTAATTCGTCCAAAAGTT
SEQ ID NO:65是终止子tTEF1.sba的核酸序列
GGAGATTGATAGGACTTTTCTAGTTGCATATCTTTTATTTTTAAATCTTATCTATTAGTTAATTTTTTGTAATTTATCCTTATATATATAGTTTGGTTATTCTAAAACATCATTTCAGTATCTAAAACCTCTCTTATTCATTACCTTTTTATTTAATGGTTTTTGCTACAGGCAAAAATTTAATGGTTTTTGCTACAGGCAAAAATCCCGCCGTGGACTTATTCCACGTTAACTCGGTTACAGGGTCATGAACCATTTTGTCAATTATCGAAATAACTTCTTCAAAAGTCCCTCTTACTT
SEQ ID NO:66是在5’添加的分泌序列的核酸序列
ATGCAATTTAGCACAGTCGCATCAGTAGCCTTCGTTGCCTTGGCCAACTTCGTGGCAGCA
SEQ ID NO:67是N末端添加的分泌序列的氨基酸序列
MQFSTVASVAFVALANFVAA
SEQ ID NO:68是在3’添加的锚定序列的核酸序列
GGATCCGCCATTTCTCAAATCACTGACGGTCAAATCCAAGCTACTACCACTGCTACCACCGAAGCTACCACCACTGCTGCCCCATCTTCCACCGTTGAAACTGTTTCTCCATCCAGCACCGAAACTATCTCTCAACAAACTGAAAATGGTGCTGCTAAGGCCGCTGTCGGTATGGGTGCCGGTGCTCTAGCTGCTGCTGCTATGTTGTTATAA
SEQ ID NO:69是C末端添加的锚定序列的氨基酸序列
AISQITDGQIQATTTATTEATTTAAPSSTVETVSPSSTETISQQTENGAAKAAVGMGAGALAAAAMLL
序列表
<110> 奇华顿股份有限公司
<120> 生产肝素前体的重组细胞
<130> PR92312/MGG
<150> EP21166744.9
<151> 2021-04-01
<160> 69
<170> BiSSAP 1.3.6
<210> 1
<211> 1854
<212> DNA
<213> 多杀巴斯德菌
<220>
<223> 源自多杀巴斯德菌的肝素前体合酶(HSS1)的重编码核酸序列
<400> 1
atgagtttgt tcaaaagggc gactgagctg ttcaaatcgg gtaactataa ggatgcactg 60
acattgtacg agaacatagc caaaatttat ggctcagaat ccctagtgaa gtataacata 120
gatatctgca agaagaacat aacccaatca aaatcgaaca agatagaaga ggacaatatt 180
tccggagaga ataagttctc cgtctctatc aaagacttat acaacgaaat tagtaattct 240
gagctaggga taacaaagga gagattagga gcaccaccct tggtaagcat aattatgacg 300
agtcataata cagagaaatt catcgaagct tccatcaaca gtttattatt gcaaacttat 360
aacaatcttg aggtcattgt ggtagacgac tactccacag acaagacctt ccaaatcgcg 420
tccaggattg caaactcgac gtcaaaagtt aagactttca gattgaattc caaccttgga 480
acgtacttcg caaagaatac gggaatccta aaatcaaaag gggacattat attctttcaa 540
gattctgatg atgtctgcca tcatgaacgt attgagagat gtgtaaatgc acttttgtct 600
aacaaagata acattgccgt taggtgcgct tattctcgta ttaatctgga gacccagaac 660
atcataaagg tcaacgacaa caagtacaag ttaggtctta ttaccctagg agtataccgt 720
aaagtattta atgaaatagg attcttcaac tgtaccacta aggcaagtga cgacgaattt 780
tatcacagga tcatcaaata ctatggcaag aataggataa acaatttgtt cctacctcta 840
tactacaata ccatgcgtga agatagtttg tttagcgata tggtcgagtg ggtagacgaa 900
aacaacatta aacagaaaac aagtgatgca cgtcagaatt atctgcatga attccaaaag 960
atccacaacg aaaggaaatt gaatgagtta aaggagattt tcagcttccc caggattcac 1020
gatgccctac cgataagtaa agagatgagc aagttgtcta acccaaagat ccctgtctac 1080
attaacattt gcagtatacc atctaggata aagcaattac agtatacgat cggagtgctg 1140
aagaatcagt gtgaccattt ccacatttac ttagatggtt atccagaggt tccagatttc 1200
ataaagaagc taggcaacaa ggctaccgta atcaattgcc aaaacaagaa cgagtctatc 1260
agggacaacg gcaagtttat ccttttagaa aagctgatca aagagaataa ggacggctat 1320
tatattacct gtgatgatga cataaggtat cctgctgact acacgaatac catgataaag 1380
aagattaaca agtacaatga caaagcggca ataggtctac acggcgtcat ctttccgtcc 1440
agagtgaata aatacttctc atctgacagg attgtttata actttcagaa gcccttggaa 1500
aacgacacag ccgtcaacat tttgggtact gggaccgttg catttagagt ctccatcttc 1560
aacaagtttt ccctgagcga cttcgagcac cctggtatgg tggatattta tttctcaata 1620
ctatgcaaga agaacaacat attgcaagtt tgtataagca ggccctcaaa ctggttaacc 1680
gaggacaaca agaataccga aaccctgttc cacgagttcc aaaaccgtga cgagatccag 1740
agtaagttga tcatctctaa taatccgtgg ggctacagta gcatctaccc cttacttaac 1800
aacaatgcca actatagcga gttgatacca tgcttatcat tctataatga gtaa 1854
<210> 2
<211> 1956
<212> DNA
<213> 多杀巴斯德菌
<220>
<223> 源自多杀巴斯德菌的肝素前体合酶(HSS2)的重编码核酸序列
<400> 2
atgaagggca agaaagagat gacccaaata cagattgcta agaacccgcc ccaacacgag 60
aaggaaaacg agctgaatac tttccaaaac aagatcgact cccttaaaac gacattaaac 120
aaggacatta tatcacaaca gacattgttg gctaaacagg actcaaagca cccattatct 180
gcaagtcttg agaacgagaa caaacttctt cttaaacagt tgcagcttgt tttgcaggaa 240
tttgaaaaga tatacactta caaccaagca ctagaggcta agcttgagaa agacaaacag 300
accacctcaa taaccgattt atataacgaa gttgcaaagt ctgatctagg gctagttaag 360
gaaactaaca gtgctaaccc tctagtctcc attattatga cttcgcacaa taccgctcaa 420
tttatcgagg catcgattaa ctccttgttg ctacagacat ataagaacat tgagataatt 480
atagtcgatg atgacagttc cgacaacact tttgaaatcg cctcaaggat cgcaaacaca 540
acgtctaagg tccgtgtgtt tcgtttgaac tccaatctgg gcacgtactt tgctaagaat 600
acaggaatcc ttaagagtaa aggcgacata atattcttcc aggactccga cgacgtttgt 660
catcatgaga gaatcgaaag gtgcgtgaac attttgttgg ctaacaaaga gacgattgct 720
gtgaggtgcg catacagtag gctggctcct gaaacgcagc atataattaa agtcaacaac 780
atggattata ggcttggttt catcacactg ggaatgcata ggaaggtttt ccaagagatt 840
gggttcttca actgtacaac aaaaggcagt gacgacgagt tcttccaccg tatagctaaa 900
tactacggta aagaaaagat taagaacctt ttattgccgc tttattataa cacgatgcgt 960
gaaaactcac ttttcactga catggtcgag tggatcgaca accataatat catacagaag 1020
atgtctgaca cacgtcaaca ctatgctact ctgtttcagg cgatgcataa tgagactgca 1080
tcacacgact tcaagaactt gttccagttc ccacgtatat acgacgcctt gcctgttcca 1140
caggagatgt ctaagttatc taaccctaaa ataccggtgt acataaatat atgcagtata 1200
ccatctagga ttgcacagtt acgtaggatt attgggatct taaagaacca gtgcgaccac 1260
tttcacatat acctagacgg atacgtggag atccctgatt ttattaagaa tcttggtaat 1320
aaagcaacgg tcgtccactg caaagacaag gacaactcta ttagggacaa cggcaagttt 1380
attctactgg aagagttaat agaaaagaat caagacgggt actacataac gtgcgacgac 1440
gacattatct atccatcgga ctatataaac acaatgatta agaagctgaa cgagtatgat 1500
gacaaggcgg tcatagggct tcacggaata ttatttccgt caaggatgac gaaatacttt 1560
tccgccgata ggcttgttta ttcgttttac aaacccctag agaaagacaa agcagtaaat 1620
gttcttggga ccggaactgt ctcattcaga gttagtctgt tcaaccaatt ctccctttca 1680
gacttcaccc attcgggaat ggccgacatc tacttctctc tattgtgcaa gaagaacaac 1740
attttacaaa tctgtatctc cagaccggca aattggttga cggaagataa cagagattct 1800
gagaccttat accaccagta tagagataat gacgagcagc agactcagtt gatcatggaa 1860
aatgggccct ggggttactc aagtatctat ccacttgtca agaatcaccc gaagtttacg 1920
gacttaatac catgtttgcc tttctacttc ctataa 1956
<210> 3
<211> 617
<212> PRT
<213> 多杀巴斯德菌
<220>
<223> 源自多杀巴斯德菌的肝素前体合酶(HSS1)的氨基酸序列
<400> 3
Met Ser Leu Phe Lys Arg Ala Thr Glu Leu Phe Lys Ser Gly Asn Tyr
1 5 10 15
Lys Asp Ala Leu Thr Leu Tyr Glu Asn Ile Ala Lys Ile Tyr Gly Ser
20 25 30
Glu Ser Leu Val Lys Tyr Asn Ile Asp Ile Cys Lys Lys Asn Ile Thr
35 40 45
Gln Ser Lys Ser Asn Lys Ile Glu Glu Asp Asn Ile Ser Gly Glu Asn
50 55 60
Lys Phe Ser Val Ser Ile Lys Asp Leu Tyr Asn Glu Ile Ser Asn Ser
65 70 75 80
Glu Leu Gly Ile Thr Lys Glu Arg Leu Gly Ala Pro Pro Leu Val Ser
85 90 95
Ile Ile Met Thr Ser His Asn Thr Glu Lys Phe Ile Glu Ala Ser Ile
100 105 110
Asn Ser Leu Leu Leu Gln Thr Tyr Asn Asn Leu Glu Val Ile Val Val
115 120 125
Asp Asp Tyr Ser Thr Asp Lys Thr Phe Gln Ile Ala Ser Arg Ile Ala
130 135 140
Asn Ser Thr Ser Lys Val Lys Thr Phe Arg Leu Asn Ser Asn Leu Gly
145 150 155 160
Thr Tyr Phe Ala Lys Asn Thr Gly Ile Leu Lys Ser Lys Gly Asp Ile
165 170 175
Ile Phe Phe Gln Asp Ser Asp Asp Val Cys His His Glu Arg Ile Glu
180 185 190
Arg Cys Val Asn Ala Leu Leu Ser Asn Lys Asp Asn Ile Ala Val Arg
195 200 205
Cys Ala Tyr Ser Arg Ile Asn Leu Glu Thr Gln Asn Ile Ile Lys Val
210 215 220
Asn Asp Asn Lys Tyr Lys Leu Gly Leu Ile Thr Leu Gly Val Tyr Arg
225 230 235 240
Lys Val Phe Asn Glu Ile Gly Phe Phe Asn Cys Thr Thr Lys Ala Ser
245 250 255
Asp Asp Glu Phe Tyr His Arg Ile Ile Lys Tyr Tyr Gly Lys Asn Arg
260 265 270
Ile Asn Asn Leu Phe Leu Pro Leu Tyr Tyr Asn Thr Met Arg Glu Asp
275 280 285
Ser Leu Phe Ser Asp Met Val Glu Trp Val Asp Glu Asn Asn Ile Lys
290 295 300
Gln Lys Thr Ser Asp Ala Arg Gln Asn Tyr Leu His Glu Phe Gln Lys
305 310 315 320
Ile His Asn Glu Arg Lys Leu Asn Glu Leu Lys Glu Ile Phe Ser Phe
325 330 335
Pro Arg Ile His Asp Ala Leu Pro Ile Ser Lys Glu Met Ser Lys Leu
340 345 350
Ser Asn Pro Lys Ile Pro Val Tyr Ile Asn Ile Cys Ser Ile Pro Ser
355 360 365
Arg Ile Lys Gln Leu Gln Tyr Thr Ile Gly Val Leu Lys Asn Gln Cys
370 375 380
Asp His Phe His Ile Tyr Leu Asp Gly Tyr Pro Glu Val Pro Asp Phe
385 390 395 400
Ile Lys Lys Leu Gly Asn Lys Ala Thr Val Ile Asn Cys Gln Asn Lys
405 410 415
Asn Glu Ser Ile Arg Asp Asn Gly Lys Phe Ile Leu Leu Glu Lys Leu
420 425 430
Ile Lys Glu Asn Lys Asp Gly Tyr Tyr Ile Thr Cys Asp Asp Asp Ile
435 440 445
Arg Tyr Pro Ala Asp Tyr Thr Asn Thr Met Ile Lys Lys Ile Asn Lys
450 455 460
Tyr Asn Asp Lys Ala Ala Ile Gly Leu His Gly Val Ile Phe Pro Ser
465 470 475 480
Arg Val Asn Lys Tyr Phe Ser Ser Asp Arg Ile Val Tyr Asn Phe Gln
485 490 495
Lys Pro Leu Glu Asn Asp Thr Ala Val Asn Ile Leu Gly Thr Gly Thr
500 505 510
Val Ala Phe Arg Val Ser Ile Phe Asn Lys Phe Ser Leu Ser Asp Phe
515 520 525
Glu His Pro Gly Met Val Asp Ile Tyr Phe Ser Ile Leu Cys Lys Lys
530 535 540
Asn Asn Ile Leu Gln Val Cys Ile Ser Arg Pro Ser Asn Trp Leu Thr
545 550 555 560
Glu Asp Asn Lys Asn Thr Glu Thr Leu Phe His Glu Phe Gln Asn Arg
565 570 575
Asp Glu Ile Gln Ser Lys Leu Ile Ile Ser Asn Asn Pro Trp Gly Tyr
580 585 590
Ser Ser Ile Tyr Pro Leu Leu Asn Asn Asn Ala Asn Tyr Ser Glu Leu
595 600 605
Ile Pro Cys Leu Ser Phe Tyr Asn Glu
610 615
<210> 4
<211> 652
<212> PRT
<213> 多杀巴斯德菌
<220>
<223> 源自多杀巴斯德菌的肝素前体合酶(HSS2)的氨基酸序列
<400> 4
Met Ala Lys Gly Lys Lys Glu Met Thr Gln Ile Gln Ile Ala Lys Asn
1 5 10 15
Pro Pro Gln His Glu Lys Glu Asn Glu Leu Asn Thr Phe Gln Asn Lys
20 25 30
Ile Asp Ser Leu Lys Thr Thr Leu Asn Lys Asp Ile Ile Ser Gln Gln
35 40 45
Thr Leu Leu Ala Lys Gln Asp Ser Lys His Pro Leu Ser Ala Ser Leu
50 55 60
Glu Asn Glu Asn Lys Leu Leu Leu Lys Gln Leu Gln Leu Val Leu Gln
65 70 75 80
Glu Phe Glu Lys Ile Tyr Thr Tyr Asn Gln Ala Leu Glu Ala Lys Leu
85 90 95
Glu Lys Asp Lys Gln Thr Thr Ser Ile Thr Asp Leu Tyr Asn Glu Val
100 105 110
Ala Lys Ser Asp Leu Gly Leu Val Lys Glu Thr Asn Ser Ala Asn Pro
115 120 125
Leu Val Ser Ile Ile Met Thr Ser His Asn Thr Ala Gln Phe Ile Glu
130 135 140
Ala Ser Ile Asn Ser Leu Leu Leu Gln Thr Tyr Lys Asn Ile Glu Ile
145 150 155 160
Ile Ile Val Asp Asp Asp Ser Ser Asp Asn Thr Phe Glu Ile Ala Ser
165 170 175
Arg Ile Ala Asn Thr Thr Ser Lys Val Arg Val Phe Arg Leu Asn Ser
180 185 190
Asn Leu Gly Thr Tyr Phe Ala Lys Asn Thr Gly Ile Leu Lys Ser Lys
195 200 205
Gly Asp Ile Ile Phe Phe Gln Asp Ser Asp Asp Val Cys His His Glu
210 215 220
Arg Ile Glu Arg Cys Val Asn Ile Leu Leu Ala Asn Lys Glu Thr Ile
225 230 235 240
Ala Val Arg Cys Ala Tyr Ser Arg Leu Ala Pro Glu Thr Gln His Ile
245 250 255
Ile Lys Val Asn Asn Met Asp Tyr Arg Leu Gly Phe Ile Thr Leu Gly
260 265 270
Met His Arg Lys Val Phe Gln Glu Ile Gly Phe Phe Asn Cys Thr Thr
275 280 285
Lys Gly Ser Asp Asp Glu Phe Phe His Arg Ile Ala Lys Tyr Tyr Gly
290 295 300
Lys Glu Lys Ile Lys Asn Leu Leu Leu Pro Leu Tyr Tyr Asn Thr Met
305 310 315 320
Arg Glu Asn Ser Leu Phe Thr Asp Met Val Glu Trp Ile Asp Asn His
325 330 335
Asn Ile Ile Gln Lys Met Ser Asp Thr Arg Gln His Tyr Ala Thr Leu
340 345 350
Phe Gln Ala Met His Asn Glu Thr Ala Ser His Asp Phe Lys Asn Leu
355 360 365
Phe Gln Phe Pro Arg Ile Tyr Asp Ala Leu Pro Val Pro Gln Glu Met
370 375 380
Ser Lys Leu Ser Asn Pro Lys Ile Pro Val Tyr Ile Asn Ile Cys Ser
385 390 395 400
Ile Pro Ser Arg Ile Ala Gln Leu Arg Arg Ile Ile Gly Ile Leu Lys
405 410 415
Asn Gln Cys Asp His Phe His Ile Tyr Leu Asp Gly Tyr Val Glu Ile
420 425 430
Pro Asp Phe Ile Lys Asn Leu Gly Asn Lys Ala Thr Val Val His Cys
435 440 445
Lys Asp Lys Asp Asn Ser Ile Arg Asp Asn Gly Lys Phe Ile Leu Leu
450 455 460
Glu Glu Leu Ile Glu Lys Asn Gln Asp Gly Tyr Tyr Ile Thr Cys Asp
465 470 475 480
Asp Asp Ile Ile Tyr Pro Ser Asp Tyr Ile Asn Thr Met Ile Lys Lys
485 490 495
Leu Asn Glu Tyr Asp Asp Lys Ala Val Ile Gly Leu His Gly Ile Leu
500 505 510
Phe Pro Ser Arg Met Thr Lys Tyr Phe Ser Ala Asp Arg Leu Val Tyr
515 520 525
Ser Phe Tyr Lys Pro Leu Glu Lys Asp Lys Ala Val Asn Val Leu Gly
530 535 540
Thr Gly Thr Val Ser Phe Arg Val Ser Leu Phe Asn Gln Phe Ser Leu
545 550 555 560
Ser Asp Phe Thr His Ser Gly Met Ala Asp Ile Tyr Phe Ser Leu Leu
565 570 575
Cys Lys Lys Asn Asn Ile Leu Gln Ile Cys Ile Ser Arg Pro Ala Asn
580 585 590
Trp Leu Thr Glu Asp Asn Arg Asp Ser Glu Thr Leu Tyr His Gln Tyr
595 600 605
Arg Asp Asn Asp Glu Gln Gln Thr Gln Leu Ile Met Glu Asn Gly Pro
610 615 620
Trp Gly Tyr Ser Ser Ile Tyr Pro Leu Val Lys Asn His Pro Lys Phe
625 630 635 640
Thr Asp Leu Ile Pro Cys Leu Pro Phe Tyr Phe Leu
645 650
<210> 5
<211> 1446
<212> DNA
<213> 拟南芥
<220>
<223> 源自拟南芥的UDP-葡萄糖脱氢酶(HASB)的核酸序列
<400> 5
atggtcaaaa tatgctgtat cggggctgga tatgtcggtg ggcctacaat ggccgttatg 60
gccctaaagt gtccagagat tgaagtcgtg gtagttgata tatcggagcc acgaattaac 120
gcatggaact cagaccgtct accaatttat gagccagggt tagaggatgt cgtcaaacag 180
tgtagaggga agaatttgtt cttctctaca gatgtagaga agcatgtatt tgagtcagat 240
atagtgtttg tttcggtaaa cactcctacg aaaacgcagg gtctgggtgc aggtaaagca 300
gcagatttga catattggga gtccgctgct cgcatgatag ctgatgtgag caaatcgtcg 360
aaaatcgtcg ttgaaaagag tacagtacca gttcgtacag ccgaggctat agaaaagatt 420
ttaacgcaca attcgaaggg tatcgaattc cagatcttat caaatccaga attcttggcc 480
gaagggacgg cgattaaaga cttatataac cctgatagag ttctaatcgg tggcagggac 540
accgctgcgg gacaaaaggc cattaaggcg ttgcgtgacg tgtatgccca ctgggttcct 600
gttgagcaaa taatctgtac taatttatgg agtgccgagc tatcaaagtt ggctgcgaac 660
gcatttctag ctcaaaggat aagttcagta aacgcaatgt cagcgctttg tgaggcaact 720
ggtgctgacg taacccaagt cgctcacgcc gttggaaccg acactagaat tggaccgaag 780
tttcttaacg catccgtagg cttcggcgga tcttgctttc agaaagacat cctgaatctt 840
atttacatct gcgaatgcaa tggtcttcca gaagcagcca attattggaa acaggtagtc 900
aaggtaaatg actaccaaaa gattaggttt gctaatcgag tcgtatcttc tatgttcaac 960
accgtctccg gtaagaaaat tgctattttg ggatttgcgt tcaagaagga caccggcgac 1020
acgcgtgaaa ctcctgccat agatgtgtgt aatcgcctcg tggctgataa agcaaagctg 1080
tcgatctatg atccgcaagt attagaagag cagatccgcc gtgatctgtc catggcccga 1140
ttcgattggg accatccagt cccactccag cagatcaaag ctgaaggtat ctccgaacag 1200
gttaacgttg tgtccgacgc ctacgaggct acgaaggatg ctcatggttt atgtgtttta 1260
accgaatggg acgaattcaa gtcacttgat tttaagaaga tctttgataa tatgcagaaa 1320
cccgctttcg ttttcgacgg aagaaacgtg gtcgacgctg tgaaattgag agaaattgga 1380
ttcatagtat attccatagg taaacctctg gatagttggc tcaaggatat gccggctgtt 1440
gcataa 1446
<210> 6
<211> 1166
<212> DNA
<213> 小球藻属病毒
<220>
<223> 源自小球藻属病毒PBCV-1的UDP-葡萄糖脱氢酶(HASB)的重编码核酸序列
<400> 6
atgagtagaa ttgctgtcgt tggatgcggt tacgtgggta cggcctgcgc cgtacttttg 60
gcgcagaaga acgaagttat cgttttggat atctcggagg accgggtaca actgattaag 120
aataagaagt cacctataga agataaggaa atcgaagaat tcctggagac gaaagatttg 180
aatctaacag cgacgacgga taaggtgctc gcctatgaga atgctgaatt cgttataata 240
gctacaccga ccgattacga tgtcgtcact agatatttca acactaagtc tgttgaaaat 300
gtgataggcg atgtcattaa gaacactcag acacacccta ctatagtgat caagagtact 360
attccaatcg gtttcgtgga taaagttaga gaacagttcg attatcaaaa tattatcttc 420
tcgccggaat tcttgagaga aggacgagca ttatatgata atctttaccc ctcccgtatc 480
atcgtcggtg atgactcccc aattgcctta aaattcgcga atctcttggt cgagggtagc 540
aaaactccac tagctcccgt attaactatg ggtacgcgag aggccgaagc tgtaaaacta 600
ttttcaaata catatttggc tatgagagta gcatacttca atgagctaga cacatttgca 660
atgtcccatg gtatgaacgc aaaagagatt atcgacggag tcacactaga accaaggata 720
gggcagggtt attcgaatcc ttcatttggg tatggagcct attgtttccc aaaagataca 780
aagcaattgt tggctaattt tgaaggggtt ccacaagata ttattggcgc aatcgtagag 840
tctaacgaaa ctagaaagga ggttattgtt tctgaggtcg agaacagatt tccgaccaca 900
gttggcgtat ataagttggc tgctaaagct ggttcggata atttcaggtc tagtgcgata 960
gtcgatatca tggaaaggtt ggctaataag ggctaccaca tcaaaatatt tgaacctacc 1020
gttgaacaat ttgagaattt tgaggtagat aataatctca caacttttgc aaccgagtct 1080
gatgtaataa ttgcgaacag agttccagtc gaacatcgca ttctgtttgg gaagaagtta 1140
ataacacggg atgtctatgg ggataa 1166
<210> 7
<211> 1170
<212> DNA
<213> 小球藻属病毒
<220>
<223> 源自小球藻属病毒PBCV-1的UDP-葡萄糖脱氢酶(HASB-A)的重编码核酸序列
<400> 7
atgtcacgaa tcgcagtagt tggctgtggg tacgtgggaa ccgcatgcgc tgtactgctg 60
gcgcaaaaga atgaggtaat cgttcttgat attagtgagg atagggtcca actaatcaag 120
aacaagaaat ccccgatcga agataaggag attgaagaat tcttggaaac aaaagaccta 180
aacttaactg caacaactga caaagtttta gcctacgaaa acgctgagtt tgtgattata 240
gcgacaccca cagattatga cgtagttacc agatacttta acacgaagtc cgtagagaac 300
gtcattggag atgttataaa gaatactcag actcatccta cgatagtaat aaagtcaacc 360
attcccatag gtttcgtaga taaggttagg gagcaattcg attaccagaa cattatattt 420
tcgccagaat ttctgagaga gggtcgcgcc ctgtatgata atctatatcc atcacggatt 480
atagtgggcg atgactctcc gattgcactt aagtttgcta atcttttagt tgagggctcc 540
aaaactccgc tcgccccagt acttacgatg ggtacacgtg aggctgaagc tgtcaagctg 600
ttttcaaaca cataccttgc tatgcgagtc gcatacttta acgaactaga tacctttgct 660
atgtcgcacg gtatgaatgc taaagaaatc atagatggcg taacgttgga gcctcggata 720
ggtcaaggat attccaatcc atcttttggc tacggtgcgt attgtttccc aaaggacacg 780
aagcaattat tagctaactt tgagggtgtt ccgcaagata taattggggc gatagtagaa 840
agcaatgaaa cacggaagga ggtaatcgtg agtgaagtgg aaaaccgatt ccccactacg 900
gtcggcgttt acaaattagc cgccaaggct ggttccgaca atttccgatc cagcgcaata 960
gtagatatta tggaaagatt agctaataag ggataccaca ttaaaatctt tgaacctact 1020
gtcgaacagt tcgagaactt cgaggttgat aataacttga cgactttcgc aacggagagc 1080
gatgtaatta ttgcaaaccg cgtacctgtg gaacatcgaa ttttgttcgg aaagaagctg 1140
attacacgcg atgtatatgg cgataactaa 1170
<210> 8
<211> 481
<212> PRT
<213> 拟南芥
<220>
<223> 源自拟南芥的UDP-葡萄糖脱氢酶(HASB)的氨基酸序列
<400> 8
Met Val Lys Ile Cys Cys Ile Gly Ala Gly Tyr Val Gly Gly Pro Thr
1 5 10 15
Met Ala Val Met Ala Leu Lys Cys Pro Glu Ile Glu Val Val Val Val
20 25 30
Asp Ile Ser Glu Pro Arg Ile Asn Ala Trp Asn Ser Asp Arg Leu Pro
35 40 45
Ile Tyr Glu Pro Gly Leu Glu Asp Val Val Lys Gln Cys Arg Gly Lys
50 55 60
Asn Leu Phe Phe Ser Thr Asp Val Glu Lys His Val Phe Glu Ser Asp
65 70 75 80
Ile Val Phe Val Ser Val Asn Thr Pro Thr Lys Thr Gln Gly Leu Gly
85 90 95
Ala Gly Lys Ala Ala Asp Leu Thr Tyr Trp Glu Ser Ala Ala Arg Met
100 105 110
Ile Ala Asp Val Ser Lys Ser Ser Lys Ile Val Val Glu Lys Ser Thr
115 120 125
Val Pro Val Arg Thr Ala Glu Ala Ile Glu Lys Ile Leu Thr His Asn
130 135 140
Ser Lys Gly Ile Glu Phe Gln Ile Leu Ser Asn Pro Glu Phe Leu Ala
145 150 155 160
Glu Gly Thr Ala Ile Lys Asp Leu Tyr Asn Pro Asp Arg Val Leu Ile
165 170 175
Gly Gly Arg Asp Thr Ala Ala Gly Gln Lys Ala Ile Lys Ala Leu Arg
180 185 190
Asp Val Tyr Ala His Trp Val Pro Val Glu Gln Ile Ile Cys Thr Asn
195 200 205
Leu Trp Ser Ala Glu Leu Ser Lys Leu Ala Ala Asn Ala Phe Leu Ala
210 215 220
Gln Arg Ile Ser Ser Val Asn Ala Met Ser Ala Leu Cys Glu Ala Thr
225 230 235 240
Gly Ala Asp Val Thr Gln Val Ala His Ala Val Gly Thr Asp Thr Arg
245 250 255
Ile Gly Pro Lys Phe Leu Asn Ala Ser Val Gly Phe Gly Gly Ser Cys
260 265 270
Phe Gln Lys Asp Ile Leu Asn Leu Ile Tyr Ile Cys Glu Cys Asn Gly
275 280 285
Leu Pro Glu Ala Ala Asn Tyr Trp Lys Gln Val Val Lys Val Asn Asp
290 295 300
Tyr Gln Lys Ile Arg Phe Ala Asn Arg Val Val Ser Ser Met Phe Asn
305 310 315 320
Thr Val Ser Gly Lys Lys Ile Ala Ile Leu Gly Phe Ala Phe Lys Lys
325 330 335
Asp Thr Gly Asp Thr Arg Glu Thr Pro Ala Ile Asp Val Cys Asn Arg
340 345 350
Leu Val Ala Asp Lys Ala Lys Leu Ser Ile Tyr Asp Pro Gln Val Leu
355 360 365
Glu Glu Gln Ile Arg Arg Asp Leu Ser Met Ala Arg Phe Asp Trp Asp
370 375 380
His Pro Val Pro Leu Gln Gln Ile Lys Ala Glu Gly Ile Ser Glu Gln
385 390 395 400
Val Asn Val Val Ser Asp Ala Tyr Glu Ala Thr Lys Asp Ala His Gly
405 410 415
Leu Cys Val Leu Thr Glu Trp Asp Glu Phe Lys Ser Leu Asp Phe Lys
420 425 430
Lys Ile Phe Asp Asn Met Gln Lys Pro Ala Phe Val Phe Asp Gly Arg
435 440 445
Asn Val Val Asp Ala Val Lys Leu Arg Glu Ile Gly Phe Ile Val Tyr
450 455 460
Ser Ile Gly Lys Pro Leu Asp Ser Trp Leu Lys Asp Met Pro Ala Val
465 470 475 480
Ala
<210> 9
<211> 389
<212> PRT
<213> 小球藻属病毒
<220>
<223> 源自小球藻属病毒PBCV1的UDP-葡萄糖脱氢酶(HASB)的氨基酸序列
<400> 9
Met Ser Arg Ile Ala Val Val Gly Cys Gly Tyr Val Gly Thr Ala Cys
1 5 10 15
Ala Val Leu Leu Ala Gln Lys Asn Glu Val Ile Val Leu Asp Ile Ser
20 25 30
Glu Asp Arg Val Gln Leu Ile Lys Asn Lys Lys Ser Pro Ile Glu Asp
35 40 45
Lys Glu Ile Glu Glu Phe Leu Glu Thr Lys Asp Leu Asn Leu Thr Ala
50 55 60
Thr Thr Asp Lys Val Leu Ala Tyr Glu Asn Ala Glu Phe Val Ile Ile
65 70 75 80
Ala Thr Pro Thr Asp Tyr Asp Val Val Thr Arg Tyr Phe Asn Thr Lys
85 90 95
Ser Val Glu Asn Val Ile Gly Asp Val Ile Lys Asn Thr Gln Thr His
100 105 110
Pro Thr Ile Val Ile Lys Ser Thr Ile Pro Ile Gly Phe Val Asp Lys
115 120 125
Val Arg Glu Gln Phe Asp Tyr Gln Asn Ile Ile Phe Ser Pro Glu Phe
130 135 140
Leu Arg Glu Gly Arg Ala Leu Tyr Asp Asn Leu Tyr Pro Ser Arg Ile
145 150 155 160
Ile Val Gly Asp Asp Ser Pro Ile Ala Leu Lys Phe Ala Asn Leu Leu
165 170 175
Val Glu Gly Ser Lys Thr Pro Leu Ala Pro Val Leu Thr Met Gly Thr
180 185 190
Arg Glu Ala Glu Ala Val Lys Leu Phe Ser Asn Thr Tyr Leu Ala Met
195 200 205
Arg Val Ala Tyr Phe Asn Glu Leu Asp Thr Phe Ala Met Ser His Gly
210 215 220
Met Asn Ala Lys Glu Ile Ile Asp Gly Val Thr Leu Glu Pro Arg Ile
225 230 235 240
Gly Gln Gly Tyr Ser Asn Pro Ser Phe Gly Tyr Gly Ala Tyr Cys Phe
245 250 255
Pro Lys Asp Thr Lys Gln Leu Leu Ala Asn Phe Glu Gly Val Pro Gln
260 265 270
Asp Ile Ile Gly Ala Ile Val Glu Ser Asn Glu Thr Arg Lys Glu Val
275 280 285
Ile Val Ser Glu Val Glu Asn Arg Phe Pro Thr Thr Val Gly Val Tyr
290 295 300
Lys Leu Ala Ala Lys Ala Gly Ser Asp Asn Phe Arg Ser Ser Ala Ile
305 310 315 320
Val Asp Ile Met Glu Arg Leu Ala Asn Lys Gly Tyr His Ile Lys Ile
325 330 335
Phe Glu Pro Thr Val Glu Gln Phe Glu Asn Phe Glu Val Asp Asn Asn
340 345 350
Leu Thr Thr Phe Ala Thr Glu Ser Asp Val Ile Ile Ala Asn Arg Val
355 360 365
Pro Val Glu His Arg Ile Leu Phe Gly Lys Lys Leu Ile Thr Arg Asp
370 375 380
Val Tyr Gly Asp Asn
385
<210> 10
<211> 1968
<212> DNA
<213> 解肝磷脂土地杆菌
<220>
<223> 具有N-末端分泌信号的源自解肝磷脂土地杆菌的葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶的重编码核酸序列
<400> 10
atgcaattct cgacggtcgc aagtgttgcc tttgttgctt tggctaactt cgttgccgca 60
cagtcctcgt caatcaccag gaaggacttc gatcatatca acttggaata ctccggtttg 120
gagaaggtga acaaggcggt agcagcaggc aattacgacg acgcggcaaa agccctacta 180
gcttactacc gtgaaaagag caaagcaaga gagcctgact ttagtaatgc cgagaagcct 240
gccgacatac gtcagcctat tgacaaggta acacgtgaga tggcggataa agcattagta 300
catcagtttc aacctcacaa aggatacgga tattttgatt atgggaagga tattaattgg 360
cagatgtggc cagttaaaga caacgaggtc agatggcagt tgcatagggt aaaatggtgg 420
caggcaatgg ccttggttta ccatgccacg ggcgacgaga agtacgccag ggagtgggtg 480
taccaatact cggactgggc gaggaagaac ccgttaggct tatcgcaaga caatgataag 540
tttgtctgga gacctttgga agtctcagat agagtccagt cattgccacc taccttttct 600
cttttcgtca acagtcccgc cttcacacca gcattcctaa tggagttctt aaactcgtac 660
caccaacagg cagactactt gtcaacacac tacgccgagc aggggaacca taggctgttc 720
gaagctcaga ggaacttgtt cgccggcgta tccttccccg aattcaagga ctcacccagg 780
tggagacaga ctggaatatc tgttctgaat acagagataa agaagcaggt gtacgccgat 840
ggcatgcaat tcgagttaag tccgatatac cacgttgctg ccatagatat ctttcttaaa 900
gcatacggaa gcgccaagag agttaatttg gagaaagagt tccctcaatc ctatgtgcaa 960
accgtcgaga atatgattat ggcgttaatt tcaataagtc taccggacta taatacgccc 1020
atgttcggcg actcttggat cactgataag aatttcagaa tggctcaatt tgcctcatgg 1080
gcgcgtgtct tccccgctaa ccaggcaatt aagtactttg caaccgacgg aaaacagggt 1140
aaagctccca acttcttgag taaggcattg tccaatgcag gattctacac gtttagaagt 1200
ggatgggata agaacgcgac agtgatggta ctgaaggcaa gtccgcctgg tgagtttcac 1260
gctcagcctg ataacggaac ttttgaactg ttcatcaagg gtaggaactt cacacccgac 1320
gccggtgtat tcgtctattc cggtgacgag gcgattatga aattgaggaa ctggtacagg 1380
cagacaagga ttcactctac tctaactctt gataatcaga atatggtcat aacgaaagca 1440
cgtcagaata aatgggagac aggcaataac ttggatgtct taacttacac taacccgtca 1500
taccccaact tagatcacca acgttcagtt ctattcatta acaagaagta tttcttagtc 1560
atagataggg ctatcggcga ggccacgggc aaccttggcg tgcactggca gctaaaggaa 1620
gacagtaacc ctgtcttcga taaaaccaag aatagagtct atactaccta tagggacggg 1680
aacaatctaa tgatacagag tctaaacgca gacaggacat cactgaacga ggaagaaggg 1740
aaggtatctt atgtctataa caaggagctg aagcgtccag ctttcgtatt tgagaagcct 1800
aagaagaacg cagggaccca aaactttgtg tcaattgtct atccatacga cggtcagaag 1860
gcgccggaaa tttctattag agaaaataag ggaaatgact tcgaaaaggg aaaattgaac 1920
ctaacactga ctataaacgg taagcaacag cttgtgttgg ttccttaa 1968
<210> 11
<211> 2178
<212> DNA
<213> 解肝磷脂土地杆菌
<220>
<223> 具有N-末端分泌信号和C-末端锚定信号的源自解肝磷脂土地杆菌的葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶的重编码核酸序列
<400> 11
atgcaattct cgacggtcgc aagtgttgcc tttgttgctt tggctaactt cgttgccgca 60
cagtcctcgt caatcaccag gaaggacttc gatcatatca acttggaata ctccggtttg 120
gagaaggtga acaaggcggt agcagcaggc aattacgacg acgcggcaaa agccctacta 180
gcttactacc gtgaaaagag caaagcaaga gagcctgact ttagtaatgc cgagaagcct 240
gccgacatac gtcagcctat tgacaaggta acacgtgaga tggcggataa agcattagta 300
catcagtttc aacctcacaa aggatacgga tattttgatt atgggaagga tattaattgg 360
cagatgtggc cagttaaaga caacgaggtc agatggcagt tgcatagggt aaaatggtgg 420
caggcaatgg ccttggttta ccatgccacg ggcgacgaga agtacgccag ggagtgggtg 480
taccaatact cggactgggc gaggaagaac ccgttaggct tatcgcaaga caatgataag 540
tttgtctgga gacctttgga agtctcagat agagtccagt cattgccacc taccttttct 600
cttttcgtca acagtcccgc cttcacacca gcattcctaa tggagttctt aaactcgtac 660
caccaacagg cagactactt gtcaacacac tacgccgagc aggggaacca taggctgttc 720
gaagctcaga ggaacttgtt cgccggcgta tccttccccg aattcaagga ctcacccagg 780
tggagacaga ctggaatatc tgttctgaat acagagataa agaagcaggt gtacgccgat 840
ggcatgcaat tcgagttaag tccgatatac cacgttgctg ccatagatat ctttcttaaa 900
gcatacggaa gcgccaagag agttaatttg gagaaagagt tccctcaatc ctatgtgcaa 960
accgtcgaga atatgattat ggcgttaatt tcaataagtc taccggacta taatacgccc 1020
atgttcggcg actcttggat cactgataag aatttcagaa tggctcaatt tgcctcatgg 1080
gcgcgtgtct tccccgctaa ccaggcaatt aagtactttg caaccgacgg aaaacagggt 1140
aaagctccca acttcttgag taaggcattg tccaatgcag gattctacac gtttagaagt 1200
ggatgggata agaacgcgac agtgatggta ctgaaggcaa gtccgcctgg tgagtttcac 1260
gctcagcctg ataacggaac ttttgaactg ttcatcaagg gtaggaactt cacacccgac 1320
gccggtgtat tcgtctattc cggtgacgag gcgattatga aattgaggaa ctggtacagg 1380
cagacaagga ttcactctac tctaactctt gataatcaga atatggtcat aacgaaagca 1440
cgtcagaata aatgggagac aggcaataac ttggatgtct taacttacac taacccgtca 1500
taccccaact tagatcacca acgttcagtt ctattcatta acaagaagta tttcttagtc 1560
atagataggg ctatcggcga ggccacgggc aaccttggcg tgcactggca gctaaaggaa 1620
gacagtaacc ctgtcttcga taaaaccaag aatagagtct atactaccta tagggacggg 1680
aacaatctaa tgatacagag tctaaacgca gacaggacat cactgaacga ggaagaaggg 1740
aaggtatctt atgtctataa caaggagctg aagcgtccag ctttcgtatt tgagaagcct 1800
aagaagaacg cagggaccca aaactttgtg tcaattgtct atccatacga cggtcagaag 1860
gcgccggaaa tttctattag agaaaataag ggaaatgact tcgaaaaggg aaaattgaac 1920
ctaacactga ctataaacgg taagcaacag cttgtgttgg ttcctggatc cgccatttct 1980
caaatcactg acggtcaaat ccaagctact accactgcta ccaccgaagc taccaccact 2040
gctgccccat cttccaccgt tgaaactgtt tctccatcca gcaccgaaac tatctctcaa 2100
caaactgaaa atggtgctgc taaggccgct gtcggtatgg gtgccggtgc tctagctgct 2160
gctgctatgt tgttataa 2178
<210> 12
<211> 1968
<212> DNA
<213> 解肝磷脂土地杆菌
<220>
<223> 具有N-末端分泌信号的源自解肝磷脂土地杆菌的葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶的重编码核酸序列
<400> 12
atgcagtttt caaccgtggc atctgtggca ttcgtggcat tggcaaattt tgtcgctgct 60
caatcttcca gtattacgcg taaagatttt gaccacataa atcttgagta tagtggccta 120
gagaaagtca ataaagctgt cgccgctggt aactatgatg atgcagccaa ggctttgtta 180
gcctattata gagagaaatc taaggctcgt gaaccggatt tctctaacgc tgaaaagcca 240
gcggatatca gacaaccaat cgataaagtc accagggaaa tggcagacaa ggctttggtt 300
caccaattcc agccccataa gggctatggt tacttcgact acggtaaaga cataaactgg 360
caaatgtggc ccgtaaagga taatgaagta aggtggcaac ttcacagagt gaagtggtgg 420
caagctatgg ctctggtgta tcacgcaacc ggtgatgaaa agtatgctag agaatgggta 480
tatcagtatt ctgattgggc taggaagaat ccactaggac tttctcagga taacgacaaa 540
ttcgtttggc gtccactaga ggtatctgac agggtacaat ctttaccccc gacgttcagt 600
ctgtttgtta attctccagc atttaccccg gctttcttga tggaattctt gaattcttat 660
catcagcaag cggattattt aagcacccat tatgcagaac aaggaaatca cagattattt 720
gaggcccaac gtaatttatt tgcgggtgtt agttttccag agtttaaaga ttcgccaaga 780
tggagacaaa ccggtatcag cgtgttaaac actgaaatca agaaacaagt atatgctgac 840
ggtatgcagt ttgaactatc tccaatttat catgtcgcag caattgacat attcttgaag 900
gcttatggca gtgctaaacg tgtcaactta gaaaaggaat ttccacagtc atacgtccag 960
actgtagaaa acatgatcat ggcccttatc agcatctcat tgcctgatta caacactcca 1020
atgtttggtg atagttggat aacggacaag aactttagga tggcacagtt cgcaagctgg 1080
gctagagtat ttccagcaaa tcaagctata aaatatttcg cgactgatgg taagcaaggg 1140
aaggccccta attttctatc taaagcttta agcaacgccg gcttttatac tttcaggtcc 1200
ggttgggaca agaatgcaac tgtcatggtg ttaaaagcgt ctccacccgg agaattccat 1260
gcgcaaccag acaatgggac attcgagttg tttattaaag ggagaaattt taccccagat 1320
gctggagtgt ttgtgtactc aggggatgaa gcgataatga agttaagaaa ttggtatcgt 1380
caaaccagaa tacattccac acttacactg gacaaccaaa acatggtgat tactaaggct 1440
agacaaaaca agtgggaaac tggtaacaat ctggacgttt tgacatatac gaacccttcc 1500
tatccaaatc ttgaccatca gaggtcggtc ttatttataa ataagaaata cttcttggtt 1560
atcgacagag ccattggtga agcaacaggt aatctgggtg ttcattggca attgaaagag 1620
gattctaatc cagtgtttga caagacgaag aacagggtat acacaacata ccgtgatggt 1680
aataacttaa tgatccagtc cttaaatgct gatcgtactt ctcttaatga agaggaaggt 1740
aaggtttcct acgtgtacaa taaagaacta aagagacccg cctttgtctt cgaaaagccc 1800
aagaagaatg ccggaacgca gaatttcgta tctatcgttt acccttatga tggccagaaa 1860
gctccagaga taagcatccg tgagaacaaa ggtaacgatt ttgagaaagg taagcttaat 1920
ttgacgctaa cgattaatgg gaaacagcaa ttagtcttag taccataa 1968
<210> 13
<211> 1968
<212> DNA
<213> 解肝磷脂土地杆菌
<220>
<223> 具有N-末端分泌信号和C-末端锚定信号的源自解肝磷脂土地杆菌的葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶的重编码核酸序列
<400> 13
atgcagtttt caaccgtggc atctgtggca ttcgtggcat tggcaaattt tgtcgctgct 60
caatcttcca gtattacgcg taaagatttt gaccacataa atcttgagta tagtggccta 120
gagaaagtca ataaagctgt cgccgctggt aactatgatg atgcagccaa ggctttgtta 180
gcctattata gagagaaatc taaggctcgt gaaccggatt tctctaacgc tgaaaagcca 240
gcggatatca gacaaccaat cgataaagtc accagggaaa tggcagacaa ggctttggtt 300
caccaattcc agccccataa gggctatggt tacttcgact acggtaaaga cataaactgg 360
caaatgtggc ccgtaaagga taatgaagta aggtggcaac ttcacagagt gaagtggtgg 420
caagctatgg ctctggtgta tcacgcaacc ggtgatgaaa agtatgctag agaatgggta 480
tatcagtatt ctgattgggc taggaagaat ccactaggac tttctcagga taacgacaaa 540
ttcgtttggc gtccactaga ggtatctgac agggtacaat ctttaccccc gacgttcagt 600
ctgtttgtta attctccagc atttaccccg gctttcttga tggaattctt gaattcttat 660
catcagcaag cggattattt aagcacccat tatgcagaac aaggaaatca cagattattt 720
gaggcccaac gtaatttatt tgcgggtgtt agttttccag agtttaaaga ttcgccaaga 780
tggagacaaa ccggtatcag cgtgttaaac actgaaatca agaaacaagt atatgctgac 840
ggtatgcagt ttgaactatc tccaatttat catgtcgcag caattgacat attcttgaag 900
gcttatggca gtgctaaacg tgtcaactta gaaaaggaat ttccacagtc atacgtccag 960
actgtagaaa acatgatcat ggcccttatc agcatctcat tgcctgatta caacactcca 1020
atgtttggtg atagttggat aacggacaag aactttagga tggcacagtt cgcaagctgg 1080
gctagagtat ttccagcaaa tcaagctata aaatatttcg cgactgatgg taagcaaggg 1140
aaggccccta attttctatc taaagcttta agcaacgccg gcttttatac tttcaggtcc 1200
ggttgggaca agaatgcaac tgtcatggtg ttaaaagcgt ctccacccgg agaattccat 1260
gcgcaaccag acaatgggac attcgagttg tttattaaag ggagaaattt taccccagat 1320
gctggagtgt ttgtgtactc aggggatgaa gcgataatga agttaagaaa ttggtatcgt 1380
caaaccagaa tacattccac acttacactg gacaaccaaa acatggtgat tactaaggct 1440
agacaaaaca agtgggaaac tggtaacaat ctggacgttt tgacatatac gaacccttcc 1500
tatccaaatc ttgaccatca gaggtcggtc ttatttataa ataagaaata cttcttggtt 1560
atcgacagag ccattggtga agcaacaggt aatctgggtg ttcattggca attgaaagag 1620
gattctaatc cagtgtttga caagacgaag aacagggtat acacaacata ccgtgatggt 1680
aataacttaa tgatccagtc cttaaatgct gatcgtactt ctcttaatga agaggaaggt 1740
aaggtttcct acgtgtacaa taaagaacta aagagacccg cctttgtctt cgaaaagccc 1800
aagaagaatg ccggaacgca gaatttcgta tctatcgttt acccttatga tggccagaaa 1860
gctccagaga taagcatccg tgagaacaaa ggtaacgatt ttgagaaagg taagcttaat 1920
ttgacgctaa cgattaatgg gaaacagcaa ttagtcttag taccataa 1968
<210> 14
<211> 655
<212> PRT
<213> 解肝磷脂土地杆菌
<220>
<223> 具有N-末端分泌信号的源自解肝磷脂土地杆菌的葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶的氨基酸序列
<400> 14
Met Gln Phe Ser Thr Val Ala Ser Val Ala Phe Val Ala Leu Ala Asn
1 5 10 15
Phe Val Ala Ala Gln Ser Ser Ser Ile Thr Arg Lys Asp Phe Asp His
20 25 30
Ile Asn Leu Glu Tyr Ser Gly Leu Glu Lys Val Asn Lys Ala Val Ala
35 40 45
Ala Gly Asn Tyr Asp Asp Ala Ala Lys Ala Leu Leu Ala Tyr Tyr Arg
50 55 60
Glu Lys Ser Lys Ala Arg Glu Pro Asp Phe Ser Asn Ala Glu Lys Pro
65 70 75 80
Ala Asp Ile Arg Gln Pro Ile Asp Lys Val Thr Arg Glu Met Ala Asp
85 90 95
Lys Ala Leu Val His Gln Phe Gln Pro His Lys Gly Tyr Gly Tyr Phe
100 105 110
Asp Tyr Gly Lys Asp Ile Asn Trp Gln Met Trp Pro Val Lys Asp Asn
115 120 125
Glu Val Arg Trp Gln Leu His Arg Val Lys Trp Trp Gln Ala Met Ala
130 135 140
Leu Val Tyr His Ala Thr Gly Asp Glu Lys Tyr Ala Arg Glu Trp Val
145 150 155 160
Tyr Gln Tyr Ser Asp Trp Ala Arg Lys Asn Pro Leu Gly Leu Ser Gln
165 170 175
Asp Asn Asp Lys Phe Val Trp Arg Pro Leu Glu Val Ser Asp Arg Val
180 185 190
Gln Ser Leu Pro Pro Thr Phe Ser Leu Phe Val Asn Ser Pro Ala Phe
195 200 205
Thr Pro Ala Phe Leu Met Glu Phe Leu Asn Ser Tyr His Gln Gln Ala
210 215 220
Asp Tyr Leu Ser Thr His Tyr Ala Glu Gln Gly Asn His Arg Leu Phe
225 230 235 240
Glu Ala Gln Arg Asn Leu Phe Ala Gly Val Ser Phe Pro Glu Phe Lys
245 250 255
Asp Ser Pro Arg Trp Arg Gln Thr Gly Ile Ser Val Leu Asn Thr Glu
260 265 270
Ile Lys Lys Gln Val Tyr Ala Asp Gly Met Gln Phe Glu Leu Ser Pro
275 280 285
Ile Tyr His Val Ala Ala Ile Asp Ile Phe Leu Lys Ala Tyr Gly Ser
290 295 300
Ala Lys Arg Val Asn Leu Glu Lys Glu Phe Pro Gln Ser Tyr Val Gln
305 310 315 320
Thr Val Glu Asn Met Ile Met Ala Leu Ile Ser Ile Ser Leu Pro Asp
325 330 335
Tyr Asn Thr Pro Met Phe Gly Asp Ser Trp Ile Thr Asp Lys Asn Phe
340 345 350
Arg Met Ala Gln Phe Ala Ser Trp Ala Arg Val Phe Pro Ala Asn Gln
355 360 365
Ala Ile Lys Tyr Phe Ala Thr Asp Gly Lys Gln Gly Lys Ala Pro Asn
370 375 380
Phe Leu Ser Lys Ala Leu Ser Asn Ala Gly Phe Tyr Thr Phe Arg Ser
385 390 395 400
Gly Trp Asp Lys Asn Ala Thr Val Met Val Leu Lys Ala Ser Pro Pro
405 410 415
Gly Glu Phe His Ala Gln Pro Asp Asn Gly Thr Phe Glu Leu Phe Ile
420 425 430
Lys Gly Arg Asn Phe Thr Pro Asp Ala Gly Val Phe Val Tyr Ser Gly
435 440 445
Asp Glu Ala Ile Met Lys Leu Arg Asn Trp Tyr Arg Gln Thr Arg Ile
450 455 460
His Ser Thr Leu Thr Leu Asp Asn Gln Asn Met Val Ile Thr Lys Ala
465 470 475 480
Arg Gln Asn Lys Trp Glu Thr Gly Asn Asn Leu Asp Val Leu Thr Tyr
485 490 495
Thr Asn Pro Ser Tyr Pro Asn Leu Asp His Gln Arg Ser Val Leu Phe
500 505 510
Ile Asn Lys Lys Tyr Phe Leu Val Ile Asp Arg Ala Ile Gly Glu Ala
515 520 525
Thr Gly Asn Leu Gly Val His Trp Gln Leu Lys Glu Asp Ser Asn Pro
530 535 540
Val Phe Asp Lys Thr Lys Asn Arg Val Tyr Thr Thr Tyr Arg Asp Gly
545 550 555 560
Asn Asn Leu Met Ile Gln Ser Leu Asn Ala Asp Arg Thr Ser Leu Asn
565 570 575
Glu Glu Glu Gly Lys Val Ser Tyr Val Tyr Asn Lys Glu Leu Lys Arg
580 585 590
Pro Ala Phe Val Phe Glu Lys Pro Lys Lys Asn Ala Gly Thr Gln Asn
595 600 605
Phe Val Ser Ile Val Tyr Pro Tyr Asp Gly Gln Lys Ala Pro Glu Ile
610 615 620
Ser Ile Arg Glu Asn Lys Gly Asn Asp Phe Glu Lys Gly Lys Leu Asn
625 630 635 640
Leu Thr Leu Thr Ile Asn Gly Lys Gln Gln Leu Val Leu Val Pro
645 650 655
<210> 15
<211> 725
<212> PRT
<213> 解肝磷脂土地杆菌
<220>
<223> 具有N-末端分泌信号和C-末端锚定信号的源自解肝磷脂土地杆菌的葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶的氨基酸序列
<400> 15
Met Gln Phe Ser Thr Val Ala Ser Val Ala Phe Val Ala Leu Ala Asn
1 5 10 15
Phe Val Ala Ala Gln Ser Ser Ser Ile Thr Arg Lys Asp Phe Asp His
20 25 30
Ile Asn Leu Glu Tyr Ser Gly Leu Glu Lys Val Asn Lys Ala Val Ala
35 40 45
Ala Gly Asn Tyr Asp Asp Ala Ala Lys Ala Leu Leu Ala Tyr Tyr Arg
50 55 60
Glu Lys Ser Lys Ala Arg Glu Pro Asp Phe Ser Asn Ala Glu Lys Pro
65 70 75 80
Ala Asp Ile Arg Gln Pro Ile Asp Lys Val Thr Arg Glu Met Ala Asp
85 90 95
Lys Ala Leu Val His Gln Phe Gln Pro His Lys Gly Tyr Gly Tyr Phe
100 105 110
Asp Tyr Gly Lys Asp Ile Asn Trp Gln Met Trp Pro Val Lys Asp Asn
115 120 125
Glu Val Arg Trp Gln Leu His Arg Val Lys Trp Trp Gln Ala Met Ala
130 135 140
Leu Val Tyr His Ala Thr Gly Asp Glu Lys Tyr Ala Arg Glu Trp Val
145 150 155 160
Tyr Gln Tyr Ser Asp Trp Ala Arg Lys Asn Pro Leu Gly Leu Ser Gln
165 170 175
Asp Asn Asp Lys Phe Val Trp Arg Pro Leu Glu Val Ser Asp Arg Val
180 185 190
Gln Ser Leu Pro Pro Thr Phe Ser Leu Phe Val Asn Ser Pro Ala Phe
195 200 205
Thr Pro Ala Phe Leu Met Glu Phe Leu Asn Ser Tyr His Gln Gln Ala
210 215 220
Asp Tyr Leu Ser Thr His Tyr Ala Glu Gln Gly Asn His Arg Leu Phe
225 230 235 240
Glu Ala Gln Arg Asn Leu Phe Ala Gly Val Ser Phe Pro Glu Phe Lys
245 250 255
Asp Ser Pro Arg Trp Arg Gln Thr Gly Ile Ser Val Leu Asn Thr Glu
260 265 270
Ile Lys Lys Gln Val Tyr Ala Asp Gly Met Gln Phe Glu Leu Ser Pro
275 280 285
Ile Tyr His Val Ala Ala Ile Asp Ile Phe Leu Lys Ala Tyr Gly Ser
290 295 300
Ala Lys Arg Val Asn Leu Glu Lys Glu Phe Pro Gln Ser Tyr Val Gln
305 310 315 320
Thr Val Glu Asn Met Ile Met Ala Leu Ile Ser Ile Ser Leu Pro Asp
325 330 335
Tyr Asn Thr Pro Met Phe Gly Asp Ser Trp Ile Thr Asp Lys Asn Phe
340 345 350
Arg Met Ala Gln Phe Ala Ser Trp Ala Arg Val Phe Pro Ala Asn Gln
355 360 365
Ala Ile Lys Tyr Phe Ala Thr Asp Gly Lys Gln Gly Lys Ala Pro Asn
370 375 380
Phe Leu Ser Lys Ala Leu Ser Asn Ala Gly Phe Tyr Thr Phe Arg Ser
385 390 395 400
Gly Trp Asp Lys Asn Ala Thr Val Met Val Leu Lys Ala Ser Pro Pro
405 410 415
Gly Glu Phe His Ala Gln Pro Asp Asn Gly Thr Phe Glu Leu Phe Ile
420 425 430
Lys Gly Arg Asn Phe Thr Pro Asp Ala Gly Val Phe Val Tyr Ser Gly
435 440 445
Asp Glu Ala Ile Met Lys Leu Arg Asn Trp Tyr Arg Gln Thr Arg Ile
450 455 460
His Ser Thr Leu Thr Leu Asp Asn Gln Asn Met Val Ile Thr Lys Ala
465 470 475 480
Arg Gln Asn Lys Trp Glu Thr Gly Asn Asn Leu Asp Val Leu Thr Tyr
485 490 495
Thr Asn Pro Ser Tyr Pro Asn Leu Asp His Gln Arg Ser Val Leu Phe
500 505 510
Ile Asn Lys Lys Tyr Phe Leu Val Ile Asp Arg Ala Ile Gly Glu Ala
515 520 525
Thr Gly Asn Leu Gly Val His Trp Gln Leu Lys Glu Asp Ser Asn Pro
530 535 540
Val Phe Asp Lys Thr Lys Asn Arg Val Tyr Thr Thr Tyr Arg Asp Gly
545 550 555 560
Asn Asn Leu Met Ile Gln Ser Leu Asn Ala Asp Arg Thr Ser Leu Asn
565 570 575
Glu Glu Glu Gly Lys Val Ser Tyr Val Tyr Asn Lys Glu Leu Lys Arg
580 585 590
Pro Ala Phe Val Phe Glu Lys Pro Lys Lys Asn Ala Gly Thr Gln Asn
595 600 605
Phe Val Ser Ile Val Tyr Pro Tyr Asp Gly Gln Lys Ala Pro Glu Ile
610 615 620
Ser Ile Arg Glu Asn Lys Gly Asn Asp Phe Glu Lys Gly Lys Leu Asn
625 630 635 640
Leu Thr Leu Thr Ile Asn Gly Lys Gln Gln Leu Val Leu Val Pro Gly
645 650 655
Ser Ala Ile Ser Gln Ile Thr Asp Gly Gln Ile Gln Ala Thr Thr Thr
660 665 670
Ala Thr Thr Glu Ala Thr Thr Thr Ala Ala Pro Ser Ser Thr Val Glu
675 680 685
Thr Val Ser Pro Ser Ser Thr Glu Thr Ile Ser Gln Gln Thr Glu Asn
690 695 700
Gly Ala Ala Lys Ala Ala Val Gly Met Gly Ala Gly Ala Leu Ala Ala
705 710 715 720
Ala Ala Met Leu Leu
725
<210> 16
<211> 2154
<212> DNA
<213> 酿酒酵母
<220>
<223> 源自酿酒酵母的谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)的核酸序列
<400> 16
atgtgtggta tctttggtta ctgcaattat ctagtggaaa gatccagagg agaaattatc 60
gacaccttag tggatggttt acaaagatta gaatatagag gctatgattc caccggtatt 120
gctatcgatg gtgacgaagc tgattctact ttcatctata agcaaatcgg taaagtgagt 180
gctttgaaag aggagattac taagcaaaat ccgaacagag acgttacttt tgtctctcat 240
tgtggtattg cgcatactag atgggctact cacggtcgac cagaacaagt taactgtcac 300
cctcaaagat ctgacccaga agaccaattt gtggtcgttc ataatggtat catcacaaat 360
tttagagaac tgaagactct tttaattaac aaaggttata aattcgaaag tgataccgat 420
accgagtgta ttgctaaact atatttgcat ttatacaata caaatttaca aaatgggcat 480
gacttagatt tccacgaatt aaccaagcta gttcttttag aactagaagg ttcatacggg 540
ttattatgta aatcttgtca ctatcctaat gaggttatcg ccactagaaa agggtcccct 600
ttactgattg gtgtcaaatc tgaaaaaaaa ctaaaagtcg acttcgtgga tgtggaattt 660
cccgaagaaa acgctggtca accggaaatt ccattgaaat ctaacaacaa atcatttggc 720
ttgggcccaa agaaagctcg tgaatttgaa gctggttccc aaaatgccaa tttactacca 780
attgccgcca atgaatttaa cttgagacat tctcaatcca gggctttcct atcagaagat 840
ggatctccaa caccggtgga attttttgtt tcttcggatg cggcatctgt tgttaaacat 900
accaagaagg tgctattttt agaagatgac gatttggctc atatttacga tggtgagtta 960
catattcata gatctagaag agaagtaggc gcatcaatga caaggtccat tcaaacttta 1020
gagatggagt tagctcagat catgaagggc ccttacgacc attttatgca aaaggaaatc 1080
tatgagcaac cagaatctac tttcaatact atgagaggta gaatcgacta tgaaaataat 1140
aaagtgatat tgggtggttt aaaggcatgg ttaccagttg tcagaagagc acggagactg 1200
atcatgatcg catgcggtac ttcttatcat tcatgtttgg ctactcgtgc tatcttcgaa 1260
gaattatcag atatcccagt tagtgtggaa ttagcgtctg actttctgga cagaaaatgc 1320
cctgtcttca gagacgatgt atgcgtgttt gtttcacaaa gtggtgaaac tgcggatacc 1380
atgctggctc taaattattg tttagaaaga ggagccttaa ctgtcggaat tgttaacagt 1440
gttggttctt ctatctctcg tgtcacccac tgtggtgttc atattaacgc tggtcctgaa 1500
attggtgttg cctctacaaa agcttatact tcccagtata ttgccttagt gatgtttgct 1560
ctatcgctgt cagatgaccg tgtatcgaaa atagacagaa gaattgaaat cattcaaggc 1620
ttgaagttaa tcccgggcca aattaagcag gtattaaagc tggaaccaag aataaaaaag 1680
ctctgtgcga ctgaattaaa ggatcaaaaa tctctattgt tattgggtag aggttaccaa 1740
tttgctgctg ctctggaagg tgctttgaag atcaaagaaa tttcttatat gcattctgaa 1800
ggtgttttgg caggtgagtt gaagcacggt gtcttggcct tggtggacga aaacttgcca 1860
atcattgctt ttggtaccag agactctcta ttccctaaag tagtttcctc tattgagcaa 1920
gttactgtaa gaaagggcca tccaattatt atttgtaacg aaaatgatga agtgtgggcg 1980
caaaaatcta aatcaatcga cctgcaaacc ttagaagttc cacaaactgt tgattgttta 2040
caaggtctaa ttaatattat tccattacaa ctaatgtcat attggttggc tgttaataaa 2100
gggattgatg ttgattttcc aagaaacttg gctaaatctg ttaccgtcga ataa 2154
<210> 17
<211> 1788
<212> DNA
<213> 小球藻属病毒
<220>
<223> 源自小球藻属病毒1(PBCV-1)的谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)的重编码核酸序列
<400> 17
atgtgcggga tcttcggtgc tgtgtcgaac aataatagca tagaagtttc catcaagggt 60
atacagaagc tagagtaccg cgggtacgat tcgtgtggaa tagcctatac agacggaggc 120
gccattgaac ggatcaggtc aatagatggg atcgacgact taaggaagaa aacaataaca 180
gagtcttccc cggtagctat cgctcattca aggtggagta ccactgggat tccaagtgtt 240
gtgaacgccc acccgcacat ctctcggggc acgtctggat gcgagtcgcg cattgcagtc 300
gtacacaatg gcattattga aaattaccag cagatccgca agtacttgat aaatcttggg 360
tatactttcg attcacagac cgacacggaa gtcattgctc atctaataga ctcgcagtat 420
aacgggaaca tcctgcacac cgtccaaatg gcagttaagc acctcaaagg aagctacgcc 480
atagcagtca tgtgccataa ggagtccggg aagatcgtgg tggcaaaaca gaagagtccg 540
ttggtattgg gtataggaag cgacggagct tattatatcg catcggacgt attggctctt 600
cccactaaca aagtggtcta cataagtgac ggattctctg ctgagttaag tcctggatcg 660
atgactatct atgatctgga tggcaataag gtagaatacg aggtggaaga cgttgaaatg 720
gagcagacgt cgatgtcttt agataacttt gatcactaca tgatcaaaga gatcaatgaa 780
cagccgatat caattctcaa tactattaag aacaaaggat tctatgcaga gatatttggt 840
gatctagcac atgaaatatt tcagaagatc gacaatatat tgattctagc ctgcggaact 900
tcgtatcatg caggtctcgt cgggaagcaa tggatagaga ccatctcacg catcccggtg 960
gatgttcata ttgcaagcga gtatgagccg acaattccac gagccaatac acttgtgata 1020
acgattagtc aaagcggcga gactgcggat acaatcgcag cccttcaacg agcgcaaaac 1080
gcaggaatga tatacacttt gtgtatctgc aacagcccca agtcaactct agtgcgcgag 1140
tcgataatga aatacataac caaatgcggt tcagaagttt ctgttgccag tactaaagca 1200
tttacgtcgc aacttgtggt gttgtatatg cttgcgaacg ttcttgcgaa caaaactgat 1260
gatctgctag gggatcttcc tcaagctatc gagagagtaa tctgtcttac taatgacgaa 1320
atgaagcgtt gggcggatga aatttgtact gccaaaagtg ccatcttctt agggagagga 1380
ctgaacgcac ctgtagcatt tgagggcgcg ctaaagttga aggaaatctc atatatccat 1440
gccgagggtt tcctcggtgg agagttgaag catgggccgc tggctttgtt ggacgataag 1500
atccctgtaa tcgtgactgt tgctgaccac gcttatttgg atcacattaa ggctaacatc 1560
gacgaggtat tggcacgaaa cgttaccgta tacgcgatcg tcgatcagta tgttaatatt 1620
gaaccacagg agcgactgca tgtagtaaaa gtgccgtttg tgagtaaaga gttttctccc 1680
atcatccaca caattccgat gcaattgtta tcgtattatg tcgcgatcaa gctgggcaag 1740
aacgttgaca agccacgtaa cctggcgaaa agtgttacaa cattctaa 1788
<210> 18
<211> 1788
<212> DNA
<213> 小球藻属病毒
<220>
<223> 源自小球藻属病毒1(PBCV-1)的谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)的重编码核酸序列
<400> 18
atgtgtggca tctttggagc agtgtcaaac aacaactcta tcgaggtgtc aatcaagggt 60
attcagaagc tagaatatcg tgggtatgat tcgtgcggta ttgcgtatac agatgggggt 120
gcgattgagc gtatacgttc tattgacggc attgacgatc tgcgtaagaa aacaatcaca 180
gaatcatcac cagtggccat tgctcactcg cggtggagca ccactggaat tccatcagtg 240
gtgaacgcac atcctcatat ttctcgcgga accagtgggt gtgagtctcg tatcgcggta 300
gtccacaacg gtatcattga aaactatcag cagatccgaa aatatctcat caatcttggt 360
tatacgtttg atagtcaaac ggacacagag gtcattgcgc atttgattga ttctcagtac 420
aatgggaata tcttgcacac cgtccaaatg gctgtcaagc acctgaaggg ctcttatgcc 480
attgcagtta tgtgtcataa agagtctggt aaaatagtcg tggcgaaaca gaagtcaccc 540
ctcgtacttg gaatcggctc agatggtgct tactacatcg cttcggacgt gctggcgctg 600
ccgacaaata aagttgttta tatttcagac ggtttctccg cagaactatc tccagggagt 660
atgaccattt acgatcttga tggaaataaa gtagaatatg aagtagagga cgttgaaatg 720
gaacaaacta gtatgtctct cgataacttt gatcattaca tgattaagga aattaatgag 780
caaccaatca gtattctaaa cactataaaa aataaagggt tctatgcaga aatattcggt 840
gatttggctc atgaaatctt ccaaaaaata gacaacatcc tgatactggc ttgtggtaca 900
agttatcacg ccggtcttgt aggaaaacag tggatagaga ccatctctag aatccccgtg 960
gatgttcaca tcgcgagtga atacgaacct actattccga gagcgaacac attggtaatc 1020
actatttcac agtcgggtga aactgcggac acgatagcgg ctttgcaacg ggcccaaaac 1080
gccgggatga tttatacatt gtgtatttgc aattcaccaa agagcactct tgttcgtgag 1140
agcattatga agtacatcac gaaatgtggt tctgaggtgt cagtggcatc aacgaaggcg 1200
tttacttctc agctcgtagt actgtacatg ctggcaaacg tattggcaaa taaaaccgat 1260
gatttgctgg gagacctccc acaggcaata gaacgggtaa tttgtttgac aaatgacgaa 1320
atgaaacgat gggccgacga aatttgcact gcgaaatccg cgatcttcct gggaagagga 1380
ctaaacgcac cagttgcctt tgagggagcg ttgaagctca aagaaatctc ttacattcat 1440
gcagagggct tcctgggagg tgagttgaaa cacggccccc tcgcactcct tgatgacaag 1500
attcctgtta tcgtaaccgt agcagatcat gcttatttgg accatatcaa agcaaatatc 1560
gacgaagtgc ttgcgaggaa cgttacggta tacgccatag tagaccagta tgtgaacatc 1620
gagccccagg aacgccttca cgtcgtcaag gttccgtttg tatccaaaga attttctccg 1680
ataattcaca ctatcccgat gcaactgctt tcgtattacg tggcaattaa gcttggaaag 1740
aacgttgaca aaccaaggaa tcttgcaaaa tccgtgacta ccttttaa 1788
<210> 19
<211> 717
<212> PRT
<213> 酿酒酵母
<220>
<223> 源自酿酒酵母的谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)的氨基酸序列
<400> 19
Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg
1 5 10 15
Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp
35 40 45
Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu
50 55 60
Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His
65 70 75 80
Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu Gln
85 90 95
Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val
100 105 110
Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu
115 120 125
Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile
130 135 140
Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Gln Asn Gly His
145 150 155 160
Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu
195 200 205
Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn
210 215 220
Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly
225 230 235 240
Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala
245 250 255
Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln
260 265 270
Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe
275 280 285
Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val
290 295 300
Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu
305 310 315 320
His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser
325 330 335
Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr
340 345 350
Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe
355 360 365
Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu
370 375 380
Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu
385 390 395 400
Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg
405 410 415
Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala
420 425 430
Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys
435 440 445
Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu
450 455 460
Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser
465 470 475 480
Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn
485 490 495
Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln
500 505 510
Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val
515 520 525
Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile
530 535 540
Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys
545 550 555 560
Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly
565 570 575
Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys
580 585 590
Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys
595 600 605
His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe
610 615 620
Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln
625 630 635 640
Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp
645 650 655
Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu
660 665 670
Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro
675 680 685
Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val
690 695 700
Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu
705 710 715
<210> 20
<211> 595
<212> PRT
<213> 小球藻属病毒
<220>
<223> 源自小球藻属病毒1(PBCV-1)的谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)的氨基酸序列
<400> 20
Met Cys Gly Ile Phe Gly Ala Val Ser Asn Asn Asn Ser Ile Glu Val
1 5 10 15
Ser Ile Lys Gly Ile Gln Lys Leu Glu Tyr Arg Gly Tyr Asp Ser Cys
20 25 30
Gly Ile Ala Tyr Thr Asp Gly Gly Ala Ile Glu Arg Ile Arg Ser Ile
35 40 45
Asp Gly Ile Asp Asp Leu Arg Lys Lys Thr Ile Thr Glu Ser Ser Pro
50 55 60
Val Ala Ile Ala His Ser Arg Trp Ser Thr Thr Gly Ile Pro Ser Val
65 70 75 80
Val Asn Ala His Pro His Ile Ser Arg Gly Thr Ser Gly Cys Glu Ser
85 90 95
Arg Ile Ala Val Val His Asn Gly Ile Ile Glu Asn Tyr Gln Gln Ile
100 105 110
Arg Lys Tyr Leu Ile Asn Leu Gly Tyr Thr Phe Asp Ser Gln Thr Asp
115 120 125
Thr Glu Val Ile Ala His Leu Ile Asp Ser Gln Tyr Asn Gly Asn Ile
130 135 140
Leu His Thr Val Gln Met Ala Val Lys His Leu Lys Gly Ser Tyr Ala
145 150 155 160
Ile Ala Val Met Cys His Lys Glu Ser Gly Lys Ile Val Val Ala Lys
165 170 175
Gln Lys Ser Pro Leu Val Leu Gly Ile Gly Ser Asp Gly Ala Tyr Tyr
180 185 190
Ile Ala Ser Asp Val Leu Ala Leu Pro Thr Asn Lys Val Val Tyr Ile
195 200 205
Ser Asp Gly Phe Ser Ala Glu Leu Ser Pro Gly Ser Met Thr Ile Tyr
210 215 220
Asp Leu Asp Gly Asn Lys Val Glu Tyr Glu Val Glu Asp Val Glu Met
225 230 235 240
Glu Gln Thr Ser Met Ser Leu Asp Asn Phe Asp His Tyr Met Ile Lys
245 250 255
Glu Ile Asn Glu Gln Pro Ile Ser Ile Leu Asn Thr Ile Lys Asn Lys
260 265 270
Gly Phe Tyr Ala Glu Ile Phe Gly Asp Leu Ala His Glu Ile Phe Gln
275 280 285
Lys Ile Asp Asn Ile Leu Ile Leu Ala Cys Gly Thr Ser Tyr His Ala
290 295 300
Gly Leu Val Gly Lys Gln Trp Ile Glu Thr Ile Ser Arg Ile Pro Val
305 310 315 320
Asp Val His Ile Ala Ser Glu Tyr Glu Pro Thr Ile Pro Arg Ala Asn
325 330 335
Thr Leu Val Ile Thr Ile Ser Gln Ser Gly Glu Thr Ala Asp Thr Ile
340 345 350
Ala Ala Leu Gln Arg Ala Gln Asn Ala Gly Met Ile Tyr Thr Leu Cys
355 360 365
Ile Cys Asn Ser Pro Lys Ser Thr Leu Val Arg Glu Ser Ile Met Lys
370 375 380
Tyr Ile Thr Lys Cys Gly Ser Glu Val Ser Val Ala Ser Thr Lys Ala
385 390 395 400
Phe Thr Ser Gln Leu Val Val Leu Tyr Met Leu Ala Asn Val Leu Ala
405 410 415
Asn Lys Thr Asp Asp Leu Leu Gly Asp Leu Pro Gln Ala Ile Glu Arg
420 425 430
Val Ile Cys Leu Thr Asn Asp Glu Met Lys Arg Trp Ala Asp Glu Ile
435 440 445
Cys Thr Ala Lys Ser Ala Ile Phe Leu Gly Arg Gly Leu Asn Ala Pro
450 455 460
Val Ala Phe Glu Gly Ala Leu Lys Leu Lys Glu Ile Ser Tyr Ile His
465 470 475 480
Ala Glu Gly Phe Leu Gly Gly Glu Leu Lys His Gly Pro Leu Ala Leu
485 490 495
Leu Asp Asp Lys Ile Pro Val Ile Val Thr Val Ala Asp His Ala Tyr
500 505 510
Leu Asp His Ile Lys Ala Asn Ile Asp Glu Val Leu Ala Arg Asn Val
515 520 525
Thr Val Tyr Ala Ile Val Asp Gln Tyr Val Asn Ile Glu Pro Gln Glu
530 535 540
Arg Leu His Val Val Lys Val Pro Phe Val Ser Lys Glu Phe Ser Pro
545 550 555 560
Ile Ile His Thr Ile Pro Met Gln Leu Leu Ser Tyr Tyr Val Ala Ile
565 570 575
Lys Leu Gly Lys Asn Val Asp Lys Pro Arg Asn Leu Ala Lys Ser Val
580 585 590
Thr Thr Phe
595
<210> 21
<211> 1434
<212> DNA
<213> 酿酒酵母
<220>
<223> 源自酿酒酵母的UDP-N-乙酰葡萄糖胺焦磷酸化酶(QRI1)的核酸序列
<400> 21
atgactgaca caaaacagct attcattgaa gccggacaaa gtcaactttt ccacaattgg 60
gaaagcttgt ctcgcaaaga ccaagaagaa ttgctttcaa acctggagca aatatcttcc 120
aagaggtccc ctgcaaaact actggaagac tgtcaaaatg ctattaaatt ctcactagct 180
aactcttcta aggatactgg cgtcgaaatt tcaccattgc cccctacttc gtacgagtcg 240
cttattggca acagtaagaa agaaaatgaa tactggcgtt taggccttga agctattggc 300
aagggtgaag tcgcagtgat tttaatggct ggcggacaag gtacgcggtt aggatcctct 360
caaccaaagg gctgttacga cattggattg ccttctaaga aatctctttt tcaaattcaa 420
gctgaaaagt tgatcaggtt gcaagatatg gtaaaggaca aaaaggtaga aattccttgg 480
tatattatga catcaggccc cactagagcg gctactgagg catactttca agaacacaat 540
tattttggct tgaataaaga acaaattacg ttcttcaacc agggaaccct gcctgccttt 600
gatttaaccg ggaagcattt cctaatgaaa gacccagtaa acctatctca atcaccagat 660
ggaaatggtg gactctaccg tgccatcaag gaaaacaagt tgaacgaaga ctttgatagg 720
agaggaatca agcatgttta catgtactgt gtcgataatg tcctatctaa aatcgcagac 780
cctgtattta ttggttttgc catcaagcat ggcttcgaac tggccaccaa agccgttaga 840
aagagagatg cgcatgaatc agttgggtta attgctacta aaaacgagaa accatgtgtc 900
atagaatatt ctgaaatttc caatgaattg gctgaagcaa aggataaaga tggcttatta 960
aaactacgcg caggcaacat tgtaaatcat tattacctag tggatttact aaaacgtgat 1020
ttggatcagt ggtgtgagaa tatgccatat cacattgcga agaagaaaat tccagcttat 1080
gatagtgtta ccggcaagta cactaagcct accgaaccaa acggtataaa attagagcaa 1140
ttcatatttg atgtctttga cactgtacca ctgaacaagt ttgggtgctt agaagtagat 1200
agatgcaaag aattttcacc tttaaaaaac ggtcctggtt ctaagaacga taatcctgag 1260
accagcagac tagcatattt gaaactagga acctcgtggt tggaagatgc aggcgctatt 1320
gtaaaagatg gggtactagt cgaagtttcc agcaaattga gttatgcagg tgaaaatcta 1380
tcccagttca aaggtaaagt ctttgacaga agtggtatag tattagaaaa ataa 1434
<210> 22
<211> 477
<212> PRT
<213> 酿酒酵母
<220>
<223> 源自酿酒酵母的UDP-N-乙酰葡萄糖胺焦磷酸化酶(QRI1)的氨基酸序列
<400> 22
Met Thr Asp Thr Lys Gln Leu Phe Ile Glu Ala Gly Gln Ser Gln Leu
1 5 10 15
Phe His Asn Trp Glu Ser Leu Ser Arg Lys Asp Gln Glu Glu Leu Leu
20 25 30
Ser Asn Leu Glu Gln Ile Ser Ser Lys Arg Ser Pro Ala Lys Leu Leu
35 40 45
Glu Asp Cys Gln Asn Ala Ile Lys Phe Ser Leu Ala Asn Ser Ser Lys
50 55 60
Asp Thr Gly Val Glu Ile Ser Pro Leu Pro Pro Thr Ser Tyr Glu Ser
65 70 75 80
Leu Ile Gly Asn Ser Lys Lys Glu Asn Glu Tyr Trp Arg Leu Gly Leu
85 90 95
Glu Ala Ile Gly Lys Gly Glu Val Ala Val Ile Leu Met Ala Gly Gly
100 105 110
Gln Gly Thr Arg Leu Gly Ser Ser Gln Pro Lys Gly Cys Tyr Asp Ile
115 120 125
Gly Leu Pro Ser Lys Lys Ser Leu Phe Gln Ile Gln Ala Glu Lys Leu
130 135 140
Ile Arg Leu Gln Asp Met Val Lys Asp Lys Lys Val Glu Ile Pro Trp
145 150 155 160
Tyr Ile Met Thr Ser Gly Pro Thr Arg Ala Ala Thr Glu Ala Tyr Phe
165 170 175
Gln Glu His Asn Tyr Phe Gly Leu Asn Lys Glu Gln Ile Thr Phe Phe
180 185 190
Asn Gln Gly Thr Leu Pro Ala Phe Asp Leu Thr Gly Lys His Phe Leu
195 200 205
Met Lys Asp Pro Val Asn Leu Ser Gln Ser Pro Asp Gly Asn Gly Gly
210 215 220
Leu Tyr Arg Ala Ile Lys Glu Asn Lys Leu Asn Glu Asp Phe Asp Arg
225 230 235 240
Arg Gly Ile Lys His Val Tyr Met Tyr Cys Val Asp Asn Val Leu Ser
245 250 255
Lys Ile Ala Asp Pro Val Phe Ile Gly Phe Ala Ile Lys His Gly Phe
260 265 270
Glu Leu Ala Thr Lys Ala Val Arg Lys Arg Asp Ala His Glu Ser Val
275 280 285
Gly Leu Ile Ala Thr Lys Asn Glu Lys Pro Cys Val Ile Glu Tyr Ser
290 295 300
Glu Ile Ser Asn Glu Leu Ala Glu Ala Lys Asp Lys Asp Gly Leu Leu
305 310 315 320
Lys Leu Arg Ala Gly Asn Ile Val Asn His Tyr Tyr Leu Val Asp Leu
325 330 335
Leu Lys Arg Asp Leu Asp Gln Trp Cys Glu Asn Met Pro Tyr His Ile
340 345 350
Ala Lys Lys Lys Ile Pro Ala Tyr Asp Ser Val Thr Gly Lys Tyr Thr
355 360 365
Lys Pro Thr Glu Pro Asn Gly Ile Lys Leu Glu Gln Phe Ile Phe Asp
370 375 380
Val Phe Asp Thr Val Pro Leu Asn Lys Phe Gly Cys Leu Glu Val Asp
385 390 395 400
Arg Cys Lys Glu Phe Ser Pro Leu Lys Asn Gly Pro Gly Ser Lys Asn
405 410 415
Asp Asn Pro Glu Thr Ser Arg Leu Ala Tyr Leu Lys Leu Gly Thr Ser
420 425 430
Trp Leu Glu Asp Ala Gly Ala Ile Val Lys Asp Gly Val Leu Val Glu
435 440 445
Val Ser Ser Lys Leu Ser Tyr Ala Gly Glu Asn Leu Ser Gln Phe Lys
450 455 460
Gly Lys Val Phe Asp Arg Ser Gly Ile Val Leu Glu Lys
465 470 475
<210> 23
<211> 1713
<212> DNA
<213> 酿酒酵母
<220>
<223> 源自酿酒酵母的磷酸葡萄糖变位酶-1(PGM1)的核酸序列
<400> 23
atgtcacttc taatagattc tgtaccaaca gttgcttata aggaccaaaa accgggtact 60
tcaggtttac gtaagaagac caaggttttc atggatgagc ctcattatac tgagaacttc 120
attcaagcaa caatgcaatc tatccctaat ggctcagagg gaaccacttt agttgttgga 180
ggagatggtc gtttctacaa cgatgttatc atgaacaaga ttgccgcagt aggtgctgca 240
aacggtgtca gaaagttagt cattggtcaa ggcggtttac tttcaacacc agctgcttct 300
catataatta gaacatacga ggaaaagtgt accggtggtg gtatcatatt aactgcctca 360
cacaacccag gcggtccaga gaatgattta ggtatcaagt ataatttacc taatggtggg 420
ccagctccag agagtgtcac taacgctatc tgggaagcgt ctaaaaaatt aactcactat 480
aaaattataa agaacttccc caagttgaat ttgaacaagc ttggtaaaaa ccaaaaatat 540
ggcccattgt tagtggacat aattgatcct gccaaagcat acgttcaatt tctgaaggaa 600
atttttgatt ttgacttaat taaaagcttc ttagcgaaac agcgcaaaga caaagggtgg 660
aagttgttgt ttgactcctt aaatggtatt acaggaccat atggtaaggc tatatttgtt 720
gatgaatttg gtttaccggc agaggaagtt cttcaaaatt ggcacccttt acctgatttc 780
ggcggtttac atcccgatcc gaatctaacc tatgcacgaa ctcttgttga cagggttgac 840
cgcgaaaaaa ttgcctttgg agcagcctcc gatggtgatg gtgataggaa tatgatttac 900
ggttatggcc ctgctttcgt ttcgccaggt gattctgttg ccattattgc cgaatatgca 960
cccgaaattc catacttcgc caaacaaggt atttatggct tggcacgttc atttcctaca 1020
tcctcagcca ttgatcgtgt tgcagcaaaa aagggattaa gatgttacga agttccaacc 1080
ggctggaaat tcttctgtgc cttatttgat gctaaaaagc tatcaatctg tggtgaagaa 1140
tccttcggta caggttccaa tcatatcaga gaaaaggacg gtctatgggc cattattgct 1200
tggttaaata tcttggctat ctaccatagg cgtaaccctg aaaaggaagc ttcgatcaaa 1260
actattcagg acgaattttg gaacgagtat ggccgtactt tcttcacaag atacgattac 1320
gaacatatcg aatgcgagca ggccgaaaaa gttgtagctc ttttgagtga atttgtatca 1380
aggccaaacg tttgtggctc ccacttccca gctgatgagt ctttaaccgt tatcgattgt 1440
ggtgattttt cgtatagaga tctagatggc tccatctctg aaaatcaagg ccttttcgta 1500
aagttttcga atgggactaa atttgttttg aggttatccg gcacaggcag ttctggtgca 1560
acaataagat tatacgtaga aaagtatact gataaaaagg agaactatgg ccaaacagct 1620
gacgtcttct tgaaacccgt catcaactcc attgtaaaat tcttaagatt taaagaaatt 1680
ttaggaacag acgaaccaac agtccgcaca tag 1713
<210> 24
<211> 570
<212> PRT
<213> 酿酒酵母
<220>
<223> 源自酿酒酵母的磷酸葡萄糖变位酶-1(PGM1)的氨基酸序列
<400> 24
Met Ser Leu Leu Ile Asp Ser Val Pro Thr Val Ala Tyr Lys Asp Gln
1 5 10 15
Lys Pro Gly Thr Ser Gly Leu Arg Lys Lys Thr Lys Val Phe Met Asp
20 25 30
Glu Pro His Tyr Thr Glu Asn Phe Ile Gln Ala Thr Met Gln Ser Ile
35 40 45
Pro Asn Gly Ser Glu Gly Thr Thr Leu Val Val Gly Gly Asp Gly Arg
50 55 60
Phe Tyr Asn Asp Val Ile Met Asn Lys Ile Ala Ala Val Gly Ala Ala
65 70 75 80
Asn Gly Val Arg Lys Leu Val Ile Gly Gln Gly Gly Leu Leu Ser Thr
85 90 95
Pro Ala Ala Ser His Ile Ile Arg Thr Tyr Glu Glu Lys Cys Thr Gly
100 105 110
Gly Gly Ile Ile Leu Thr Ala Ser His Asn Pro Gly Gly Pro Glu Asn
115 120 125
Asp Leu Gly Ile Lys Tyr Asn Leu Pro Asn Gly Gly Pro Ala Pro Glu
130 135 140
Ser Val Thr Asn Ala Ile Trp Glu Ala Ser Lys Lys Leu Thr His Tyr
145 150 155 160
Lys Ile Ile Lys Asn Phe Pro Lys Leu Asn Leu Asn Lys Leu Gly Lys
165 170 175
Asn Gln Lys Tyr Gly Pro Leu Leu Val Asp Ile Ile Asp Pro Ala Lys
180 185 190
Ala Tyr Val Gln Phe Leu Lys Glu Ile Phe Asp Phe Asp Leu Ile Lys
195 200 205
Ser Phe Leu Ala Lys Gln Arg Lys Asp Lys Gly Trp Lys Leu Leu Phe
210 215 220
Asp Ser Leu Asn Gly Ile Thr Gly Pro Tyr Gly Lys Ala Ile Phe Val
225 230 235 240
Asp Glu Phe Gly Leu Pro Ala Glu Glu Val Leu Gln Asn Trp His Pro
245 250 255
Leu Pro Asp Phe Gly Gly Leu His Pro Asp Pro Asn Leu Thr Tyr Ala
260 265 270
Arg Thr Leu Val Asp Arg Val Asp Arg Glu Lys Ile Ala Phe Gly Ala
275 280 285
Ala Ser Asp Gly Asp Gly Asp Arg Asn Met Ile Tyr Gly Tyr Gly Pro
290 295 300
Ala Phe Val Ser Pro Gly Asp Ser Val Ala Ile Ile Ala Glu Tyr Ala
305 310 315 320
Pro Glu Ile Pro Tyr Phe Ala Lys Gln Gly Ile Tyr Gly Leu Ala Arg
325 330 335
Ser Phe Pro Thr Ser Ser Ala Ile Asp Arg Val Ala Ala Lys Lys Gly
340 345 350
Leu Arg Cys Tyr Glu Val Pro Thr Gly Trp Lys Phe Phe Cys Ala Leu
355 360 365
Phe Asp Ala Lys Lys Leu Ser Ile Cys Gly Glu Glu Ser Phe Gly Thr
370 375 380
Gly Ser Asn His Ile Arg Glu Lys Asp Gly Leu Trp Ala Ile Ile Ala
385 390 395 400
Trp Leu Asn Ile Leu Ala Ile Tyr His Arg Arg Asn Pro Glu Lys Glu
405 410 415
Ala Ser Ile Lys Thr Ile Gln Asp Glu Phe Trp Asn Glu Tyr Gly Arg
420 425 430
Thr Phe Phe Thr Arg Tyr Asp Tyr Glu His Ile Glu Cys Glu Gln Ala
435 440 445
Glu Lys Val Val Ala Leu Leu Ser Glu Phe Val Ser Arg Pro Asn Val
450 455 460
Cys Gly Ser His Phe Pro Ala Asp Glu Ser Leu Thr Val Ile Asp Cys
465 470 475 480
Gly Asp Phe Ser Tyr Arg Asp Leu Asp Gly Ser Ile Ser Glu Asn Gln
485 490 495
Gly Leu Phe Val Lys Phe Ser Asn Gly Thr Lys Phe Val Leu Arg Leu
500 505 510
Ser Gly Thr Gly Ser Ser Gly Ala Thr Ile Arg Leu Tyr Val Glu Lys
515 520 525
Tyr Thr Asp Lys Lys Glu Asn Tyr Gly Gln Thr Ala Asp Val Phe Leu
530 535 540
Lys Pro Val Ile Asn Ser Ile Val Lys Phe Leu Arg Phe Lys Glu Ile
545 550 555 560
Leu Gly Thr Asp Glu Pro Thr Val Arg Thr
565 570
<210> 25
<211> 1500
<212> DNA
<213> 酿酒酵母
<220>
<223> 源自酿酒酵母的UTP-葡萄糖-1-磷酸尿苷酰转移酶(UGP1)的核酸序列
<400> 25
atgtccacta agaagcacac caaaacacat tccacttatg cattcgagag caacacaaac 60
agcgttgctg cctcacaaat gagaaacgcc ttaaacaagt tggcggactc tagtaaactt 120
gacgatgctg ctcgcgctaa gtttgagaac gaactggatt cgtttttcac gcttttcagg 180
agatatttgg tagagaagtc ttctagaacc accttggaat gggacaagat caagtctccc 240
aacccggatg aagtggttaa gtatgaaatt atttctcagc agcccgagaa tgtctcaaac 300
ctttccaaat tggctgtttt gaagttgaac ggtgggctgg gtacctccat gggctgcgtt 360
ggccctaaat ctgttattga agtgagagag ggaaacacct ttttggattt gtctgttcgt 420
caaattgaat acttgaacag acagtacgat agcgacgtgc cattgttatt gatgaattct 480
ttcaacactg acaaggatac ggaacacttg attaagaagt attccgctaa cagaatcaga 540
atcagatctt tcaatcaatc caggttccca agagtctaca aggattcttt attgcctgtc 600
cccaccgaat acgattctcc actggatgct tggtatccac caggtcacgg tgatttgttt 660
gaatctttac acgtatctgg tgaactggat gccttaattg cccaaggaag agaaatatta 720
tttgtttcta acggtgacaa cttgggtgct accgtcgact taaaaatttt aaaccacatg 780
atcgagactg gtgccgaata tataatggaa ttgactgata agaccagagc cgatgttaaa 840
ggtggtactt tgatttctta cgatggtcaa gtccgtttat tggaagtcgc ccaagttcca 900
aaagaacaca ttgacgaatt caaaaatatc agaaagttta ccaacttcaa cacgaataac 960
ttatggatca atctgaaagc agtaaagagg ttgatcgaat cgagcaattt ggagatggaa 1020
atcattccaa accaaaaaac tataacaaga gacggtcatg aaattaatgt cttacaatta 1080
gaaaccgctt gtggtgctgc tatcaggcat tttgatggtg ctcacggtgt tgtcgttcca 1140
agatcaagat tcttgcctgt caagacctgt tccgatttgt tgctggttaa atcagatcta 1200
ttccgtctgg aacacggttc tttgaagtta gacccatccc gttttggtcc aaacccatta 1260
atcaagttgg gctcgcattt caaaaaggtt tctggtttta acgcaagaat ccctcacatc 1320
ccaaaaatcg tcgagctaga tcatttgacc atcactggta acgtcttttt aggtaaagat 1380
gtcactttga ggggtactgt catcatcgtt tgctccgacg gtcataaaat cgatattcca 1440
aacggctcca tattggaaaa tgttgtcgtt actggtaatt tgcaaatctt ggaacattga 1500
<210> 26
<211> 499
<212> PRT
<213> 酿酒酵母
<220>
<223> 源自酿酒酵母的UTP--葡萄糖-1-磷酸尿苷酰转移酶(UGP1)的氨基酸序列
<400> 26
Met Ser Thr Lys Lys His Thr Lys Thr His Ser Thr Tyr Ala Phe Glu
1 5 10 15
Ser Asn Thr Asn Ser Val Ala Ala Ser Gln Met Arg Asn Ala Leu Asn
20 25 30
Lys Leu Ala Asp Ser Ser Lys Leu Asp Asp Ala Ala Arg Ala Lys Phe
35 40 45
Glu Asn Glu Leu Asp Ser Phe Phe Thr Leu Phe Arg Arg Tyr Leu Val
50 55 60
Glu Lys Ser Ser Arg Thr Thr Leu Glu Trp Asp Lys Ile Lys Ser Pro
65 70 75 80
Asn Pro Asp Glu Val Val Lys Tyr Glu Ile Ile Ser Gln Gln Pro Glu
85 90 95
Asn Val Ser Asn Leu Ser Lys Leu Ala Val Leu Lys Leu Asn Gly Gly
100 105 110
Leu Gly Thr Ser Met Gly Cys Val Gly Pro Lys Ser Val Ile Glu Val
115 120 125
Arg Glu Gly Asn Thr Phe Leu Asp Leu Ser Val Arg Gln Ile Glu Tyr
130 135 140
Leu Asn Arg Gln Tyr Asp Ser Asp Val Pro Leu Leu Leu Met Asn Ser
145 150 155 160
Phe Asn Thr Asp Lys Asp Thr Glu His Leu Ile Lys Lys Tyr Ser Ala
165 170 175
Asn Arg Ile Arg Ile Arg Ser Phe Asn Gln Ser Arg Phe Pro Arg Val
180 185 190
Tyr Lys Asp Ser Leu Leu Pro Val Pro Thr Glu Tyr Asp Ser Pro Leu
195 200 205
Asp Ala Trp Tyr Pro Pro Gly His Gly Asp Leu Phe Glu Ser Leu His
210 215 220
Val Ser Gly Glu Leu Asp Ala Leu Ile Ala Gln Gly Arg Glu Ile Leu
225 230 235 240
Phe Val Ser Asn Gly Asp Asn Leu Gly Ala Thr Val Asp Leu Lys Ile
245 250 255
Leu Asn His Met Ile Glu Thr Gly Ala Glu Tyr Ile Met Glu Leu Thr
260 265 270
Asp Lys Thr Arg Ala Asp Val Lys Gly Gly Thr Leu Ile Ser Tyr Asp
275 280 285
Gly Gln Val Arg Leu Leu Glu Val Ala Gln Val Pro Lys Glu His Ile
290 295 300
Asp Glu Phe Lys Asn Ile Arg Lys Phe Thr Asn Phe Asn Thr Asn Asn
305 310 315 320
Leu Trp Ile Asn Leu Lys Ala Val Lys Arg Leu Ile Glu Ser Ser Asn
325 330 335
Leu Glu Met Glu Ile Ile Pro Asn Gln Lys Thr Ile Thr Arg Asp Gly
340 345 350
His Glu Ile Asn Val Leu Gln Leu Glu Thr Ala Cys Gly Ala Ala Ile
355 360 365
Arg His Phe Asp Gly Ala His Gly Val Val Val Pro Arg Ser Arg Phe
370 375 380
Leu Pro Val Lys Thr Cys Ser Asp Leu Leu Leu Val Lys Ser Asp Leu
385 390 395 400
Phe Arg Leu Glu His Gly Ser Leu Lys Leu Asp Pro Ser Arg Phe Gly
405 410 415
Pro Asn Pro Leu Ile Lys Leu Gly Ser His Phe Lys Lys Val Ser Gly
420 425 430
Phe Asn Ala Arg Ile Pro His Ile Pro Lys Ile Val Glu Leu Asp His
435 440 445
Leu Thr Ile Thr Gly Asn Val Phe Leu Gly Lys Asp Val Thr Leu Arg
450 455 460
Gly Thr Val Ile Ile Val Cys Ser Asp Gly His Lys Ile Asp Ile Pro
465 470 475 480
Asn Gly Ser Ile Leu Glu Asn Val Val Val Thr Gly Asn Leu Gln Ile
485 490 495
Leu Glu His
<210> 27
<211> 480
<212> DNA
<213> 酿酒酵母
<220>
<223> 源自酿酒酵母的葡萄糖胺6-磷酸N-乙酰转移酶(GNA1)的核酸序列
<400> 27
atgagcttac ccgatggatt ttatataagg cgaatggaag agggggattt ggaacaggtc 60
actgagacgc taaaggtttt gaccaccgtg ggcactatta cccccgaatc cttcagcaaa 120
ctcataaaat actggaatga agccacagta tggaatgata acgaagataa aaaaataatg 180
caatataacc ccatggtgat tgtggacaag cgcaccgaga cggttgccgc tacggggaat 240
atcatcatcg aaagaaagat cattcatgaa ctggggctat gtggccacat cgaggacatt 300
gcagtaaact ccaagtatca gggccaaggt ttgggcaagc tcttgattga tcaattggta 360
actatcggct ttgactacgg ttgttataag attattttag attgcgatga gaaaaatgtc 420
aaattctatg aaaaatgtgg gtttagcaac gcaggcgtgg aaatgcaaat tagaaaatag 480
<210> 28
<211> 159
<212> PRT
<213> 酿酒酵母
<220>
<223> 源自酿酒酵母的葡萄糖胺6-磷酸N-乙酰转移酶(GNA1)的氨基酸序列
<400> 28
Met Ser Leu Pro Asp Gly Phe Tyr Ile Arg Arg Met Glu Glu Gly Asp
1 5 10 15
Leu Glu Gln Val Thr Glu Thr Leu Lys Val Leu Thr Thr Val Gly Thr
20 25 30
Ile Thr Pro Glu Ser Phe Ser Lys Leu Ile Lys Tyr Trp Asn Glu Ala
35 40 45
Thr Val Trp Asn Asp Asn Glu Asp Lys Lys Ile Met Gln Tyr Asn Pro
50 55 60
Met Val Ile Val Asp Lys Arg Thr Glu Thr Val Ala Ala Thr Gly Asn
65 70 75 80
Ile Ile Ile Glu Arg Lys Ile Ile His Glu Leu Gly Leu Cys Gly His
85 90 95
Ile Glu Asp Ile Ala Val Asn Ser Lys Tyr Gln Gly Gln Gly Leu Gly
100 105 110
Lys Leu Leu Ile Asp Gln Leu Val Thr Ile Gly Phe Asp Tyr Gly Cys
115 120 125
Tyr Lys Ile Ile Leu Asp Cys Asp Glu Lys Asn Val Lys Phe Tyr Glu
130 135 140
Lys Cys Gly Phe Ser Asn Ala Gly Val Glu Met Gln Ile Arg Lys
145 150 155
<210> 29
<211> 1674
<212> DNA
<213> 酿酒酵母
<220>
<223> 源自酿酒酵母的磷酸乙酰葡萄糖胺变位酶(PCM1)的核酸序列
<400> 29
atgaaggttg attacgagca attgtgcaaa ctctacgatg acacgtgccg cacaaagaat 60
gtgcagttca gttacggtac ggccggattc agaacgctgg ccaagaattt ggatacggtg 120
atgttcagta ctggtatact ggcggttctc aggtcgctga agcttcaggg tcagtatgtg 180
ggggtgatga tcacggcgtc gcacaaccca taccaggaca acggggtcaa gatcgtggaa 240
ccagacggat cgatgctttt ggccacatgg gagccatatg ccatgcagtt ggccaatgcg 300
gcctcttttg ccactaattt tgaagaattt cgtgttgagt tggccaagct gattgaacac 360
gaaaagattg atttgaatac aaccgtcgtg cctcacatcg tggttgggag agactctagg 420
gaaagtagtc catacttgct gcgctgcttg acttcctcca tggccagcgt cttccacgcg 480
caagttttgg acctaggctg tgtcactacg cctcaattgc attacattac tgatttgtcc 540
aacaggcgga aactggaagg agacacagcg ccagttgcca cagaacagga ctactattcg 600
ttctttatag gagccttcaa cgagctcttc gccacgtatc agctggagaa gaggctgtct 660
gtcccaaaat tgttcataga cacagccaat ggtatcggtg gtccacagtt gaaaaaacta 720
ctggcctccg aagattggga cgtgccagcg gagcaagttg aggtaatcaa cgacaggtcc 780
gatgttccag aactgttgaa ttttgaatgc ggtgcggatt atgtgaagac taaccagaga 840
ttacccaagg gtctttctcc atcctcgttt gattcgctat attgctcctt tgatggtgac 900
gcagacaggg ttgtgttcta ctatgtcgac tcaggatcaa aatttcattt gttggatggt 960
gacaaaattt ccactttgtt tgcaaagttc ttgtctaaac aactagaatt ggcacaccta 1020
gaacattctt tgaagattgg tgttgtgcaa actgcctatg caaacggcag ttccaccgct 1080
tacataaaaa atacgttgca ctgtcccgtg tcttgcacta agacaggtgt taaacacttg 1140
catcatgaag ctgccactca gtacgatatt ggcatttatt tcgaagcaaa tggacatggt 1200
acgattatat tcagcgaaaa atttcatcga actatcaaat ctgaattatc caagtccaag 1260
ttaaatggtg atacgttagc tttgagaact ttgaagtgtt tctctgaatt gattaatcag 1320
accgtgggag atgctatttc agacatgctt gctgtccttg ctactttggc gattttgaaa 1380
atgtcgccaa tggattggga tgaagagtat actgatttgc ccaacaagct ggttaagtgc 1440
atcgttcctg ataggtcaat tttccaaacc acggaccagg aaagaaaatt gctcaatcca 1500
gtggggttgc aagacaagat agatcttgtg gtagccaagt atcccatggg aagaagcttt 1560
gtcagagcca gtggtacgga ggatgcggtg agggtttatg cggaatgtaa ggactcctct 1620
aagttaggtc aattttgtga cgaagtggtg gagcacgtta aggcatctgc ttga 1674
<210> 30
<211> 557
<212> PRT
<213> 酿酒酵母
<220>
<223> 源自酿酒酵母的磷酸乙酰葡萄糖胺变位酶(PCM1)的氨基酸序列
<400> 30
Met Lys Val Asp Tyr Glu Gln Leu Cys Lys Leu Tyr Asp Asp Thr Cys
1 5 10 15
Arg Thr Lys Asn Val Gln Phe Ser Tyr Gly Thr Ala Gly Phe Arg Thr
20 25 30
Leu Ala Lys Asn Leu Asp Thr Val Met Phe Ser Thr Gly Ile Leu Ala
35 40 45
Val Leu Arg Ser Leu Lys Leu Gln Gly Gln Tyr Val Gly Val Met Ile
50 55 60
Thr Ala Ser His Asn Pro Tyr Gln Asp Asn Gly Val Lys Ile Val Glu
65 70 75 80
Pro Asp Gly Ser Met Leu Leu Ala Thr Trp Glu Pro Tyr Ala Met Gln
85 90 95
Leu Ala Asn Ala Ala Ser Phe Ala Thr Asn Phe Glu Glu Phe Arg Val
100 105 110
Glu Leu Ala Lys Leu Ile Glu His Glu Lys Ile Asp Leu Asn Thr Thr
115 120 125
Val Val Pro His Ile Val Val Gly Arg Asp Ser Arg Glu Ser Ser Pro
130 135 140
Tyr Leu Leu Arg Cys Leu Thr Ser Ser Met Ala Ser Val Phe His Ala
145 150 155 160
Gln Val Leu Asp Leu Gly Cys Val Thr Thr Pro Gln Leu His Tyr Ile
165 170 175
Thr Asp Leu Ser Asn Arg Arg Lys Leu Glu Gly Asp Thr Ala Pro Val
180 185 190
Ala Thr Glu Gln Asp Tyr Tyr Ser Phe Phe Ile Gly Ala Phe Asn Glu
195 200 205
Leu Phe Ala Thr Tyr Gln Leu Glu Lys Arg Leu Ser Val Pro Lys Leu
210 215 220
Phe Ile Asp Thr Ala Asn Gly Ile Gly Gly Pro Gln Leu Lys Lys Leu
225 230 235 240
Leu Ala Ser Glu Asp Trp Asp Val Pro Ala Glu Gln Val Glu Val Ile
245 250 255
Asn Asp Arg Ser Asp Val Pro Glu Leu Leu Asn Phe Glu Cys Gly Ala
260 265 270
Asp Tyr Val Lys Thr Asn Gln Arg Leu Pro Lys Gly Leu Ser Pro Ser
275 280 285
Ser Phe Asp Ser Leu Tyr Cys Ser Phe Asp Gly Asp Ala Asp Arg Val
290 295 300
Val Phe Tyr Tyr Val Asp Ser Gly Ser Lys Phe His Leu Leu Asp Gly
305 310 315 320
Asp Lys Ile Ser Thr Leu Phe Ala Lys Phe Leu Ser Lys Gln Leu Glu
325 330 335
Leu Ala His Leu Glu His Ser Leu Lys Ile Gly Val Val Gln Thr Ala
340 345 350
Tyr Ala Asn Gly Ser Ser Thr Ala Tyr Ile Lys Asn Thr Leu His Cys
355 360 365
Pro Val Ser Cys Thr Lys Thr Gly Val Lys His Leu His His Glu Ala
370 375 380
Ala Thr Gln Tyr Asp Ile Gly Ile Tyr Phe Glu Ala Asn Gly His Gly
385 390 395 400
Thr Ile Ile Phe Ser Glu Lys Phe His Arg Thr Ile Lys Ser Glu Leu
405 410 415
Ser Lys Ser Lys Leu Asn Gly Asp Thr Leu Ala Leu Arg Thr Leu Lys
420 425 430
Cys Phe Ser Glu Leu Ile Asn Gln Thr Val Gly Asp Ala Ile Ser Asp
435 440 445
Met Leu Ala Val Leu Ala Thr Leu Ala Ile Leu Lys Met Ser Pro Met
450 455 460
Asp Trp Asp Glu Glu Tyr Thr Asp Leu Pro Asn Lys Leu Val Lys Cys
465 470 475 480
Ile Val Pro Asp Arg Ser Ile Phe Gln Thr Thr Asp Gln Glu Arg Lys
485 490 495
Leu Leu Asn Pro Val Gly Leu Gln Asp Lys Ile Asp Leu Val Val Ala
500 505 510
Lys Tyr Pro Met Gly Arg Ser Phe Val Arg Ala Ser Gly Thr Glu Asp
515 520 525
Ala Val Arg Val Tyr Ala Glu Cys Lys Asp Ser Ser Lys Leu Gly Gln
530 535 540
Phe Cys Asp Glu Val Val Glu His Val Lys Ala Ser Ala
545 550 555
<210> 31
<211> 574
<212> DNA
<213> 其他序列
<220>
<223> 启动子pTDH3的核酸序列
<400> 31
ctgctgtaac ccgtacatgc ccaaaatagg gggcgggtta cacagaatat ataacatcgt 60
aggtgtctgg gtgaacagtt tattcctggc atccactaaa tataatggag cccgcttttt 120
aagctggcat ccagaaaaaa aaagaatccc agcaccaaaa tattgttttc ttcaccaacc 180
atcagttcat aggtccattc tcttagcgca actacagaga acaggggcac aaacaggcaa 240
aaaacgggca caacctcaat ggagtgatgc aacctgcctg gagtaaatga tgacacaagg 300
caattgaccc acgcatgtat ctatctcatt ttcttacacc ttctattacc ttctgctctc 360
tctgatttgg aaaaagctga aaaaaaaggt tgaaaccagt tccctgaaat tattccccta 420
cttgactaat aagtatataa agacggtagg tattgattgt aattctgtaa atctatttct 480
taaacttctt aaattctact tttatagtta gtcttttttt tagttttaaa acaccaagaa 540
cttagtttcg aataaacaca cataaacaaa caaa 574
<210> 32
<211> 585
<212> DNA
<213> 其他序列
<220>
<223> 启动子pTDH3.Sk的核酸序列
<400> 32
caattcatcg gcccttttag cggctacccg cgccatctaa atgatagggc gggtgacact 60
atggtaaatc ccataattag gtgtctgggt gagtggttct gatgccggca tccactaaat 120
atattggagc ccatttttta cgcgggcttc cagaaaaaaa gagaatccca gcaccaaaag 180
gtggttctct tcaccaacca tcagatcata ggtccacaac cacacataac aggggcacaa 240
aaaggcaaaa aacggacata acctcaatgg agtgatgcaa attgactgga gcaaaagctg 300
acacaaggca ttgattgacc tacgcatgta tctgtattct tttcttacac cttctattac 360
cttctaactc tttgggttgg aaaaaactga aaaaaaaggt tgggacctgg ttcccccaag 420
ttgtccccct acttggttat taaatatata aagacagcaa gtgttgatta taatcttgta 480
aatctatagt tcttaatcta tacttctatt tatattttaa attagtcttt ttatttccaa 540
gtccccaaga acttagtttc gaataaacac acacaaataa acaca 585
<210> 33
<211> 700
<212> DNA
<213> 其他序列
<220>
<223> 启动子pTDH3-1.sba的核酸序列
<400> 33
gcagcgcttc ttccgctcta gtttttatag ttattattac taccacctta aaaatacgta 60
aatactcaaa atagtagtga tattcccaac cttattcatc caaggcacat catcatcatc 120
agccattcat ctttcacctg ccattagtaa cccgtcttct cattgagcgg gttacggcag 180
ccacaggcca cattccgaat gtctgggtga gcggtccctt ttccagcatc cactaaatat 240
ctccgatccc gctttttaat ctggcttcct gaaaaaaaga gaatcccagc accaaaaaat 300
ggctctcttc accaaccatc agatcatagg tcccattctc ttaccgcaac cgtacagaac 360
aggggaaaac gggtacaacc tcaatggagt gatgcaaact gactggagca aaaagctgac 420
acaaggcaat cgacctacgt gtctgtctat tttctcacac cttctattac cttctaactc 480
tctgggttgg aaaaaactga aaaaaaggtt gagaccagtt tccacaaatc atccccctgt 540
ttgattaata aatatataaa gacgacaact atcgatcata aactcataaa actataactc 600
ctttacactt cttattttat agttattcta ttttaattct tattgatttt aaaaccccaa 660
gaacttagtt tcgaaaacac acacacacaa acaattaaaa 700
<210> 34
<211> 602
<212> DNA
<213> 其他序列
<220>
<223> 启动子pTDH3.Sar的核酸序列
<400> 34
gagctaaata tcagcccttc gggtcctgcc tgctacccgg tcctgttcga ataaaaacgc 60
gggtaacacg acccagtaac acctgtcgtt gggtgtctgg gtcagaagtt ctgataccgg 120
cttccactaa atagattggg ttccgctctt tacgctggct tcctgaaaaa agagattccg 180
ggcaccaaaa aattggtctc tttgccaacc atcagatcat aggtccattc tcttaccata 240
accacacagg ataggggcac cacaggcgaa aatgggcaca aaatctcaat ggagtgatgc 300
aaattagctg gaacaaaagc tgacacaagg caattaacct gcgcatgtat ccatctcctt 360
ttcttacacc ttctcttacg ttctaactgt ttgggttgga aaaattaaaa aaaaaaggtt 420
gagaccagtt tccccaaatc gtccccctac ttgattcata aatatataaa gacgacaact 480
attgattata atcttgtaaa tctataactc tttactttct cctatttata atttaactta 540
atctttttag atttaaaacc ccaagaactt agtttcgaac aaacacacac aaataaacaa 600
aa 602
<210> 35
<211> 550
<212> DNA
<213> 其他序列
<220>
<223> 启动子pENO2的核酸序列
<400> 35
cgctcagcat ctgcttcttc ccaaagatga acgcggcgtt atgtcactaa cgacgtgcac 60
caacttgcgg aaagtggaat cccgttccaa aactggcatc cactaattga tacatctaca 120
caccgcacgc cttttttctg aagcccactt tcgtggactt tgccatatgc aaaattcatg 180
aagtgtgata ccaagtcagc atacacctca ctagggtagt ttctttggtt gtattgatca 240
tttggttcat cgtggttcat taattttttt tctccattgc tttctggctt tgatcttact 300
atcatttgga tttttgtcga aggttgtaga attgtatgtg acaagtggca ccaagcatat 360
ataaaaaaaa aaagcattat cttcctacca gagttgattg ttaaaaacgt atttatagca 420
aacgcaattg taattaattc ttattttgta tcttttcttc ccttgtctca atcttttatt 480
tttattttat ttttcttttc ttagtttctt tcataacacc aagcaactaa tactataaca 540
tacaataata 550
<210> 36
<211> 598
<212> DNA
<213> 其他序列
<220>
<223> 启动子pTEF3的核酸序列
<400> 36
ggctgataat agcgtataaa caatgcatac tttgtacgtt caaaatacaa tgcagtagat 60
atatttatgc atattacata taatacatat cacataggaa gcaacaggcg cgttggactt 120
ttaattttcg aggaccgcga atccttacat cacacccaat cccccacaag tgatccccca 180
cacaccatag cttcaaaatg tttctactcc ttttttactc ttccagattt tctcggactc 240
cgcgcatcgc cgtaccactt caaaacaccc aagcacagca tactaaattt cccctctttc 300
ttcctctagg gtgtcgttaa ttacccgtac taaaggtttg gaaaagaaaa aagagaccgc 360
ctcgtttctt tttcttcgtc gaaaaaggca ataaaaattt ttatcacgtt tctttttctt 420
gaaaattttt ttttttgatt tttttctctt tcgatgacct cccattgata tttaagttaa 480
taaacggtct tcaatttctc aagtttcagt ttcatttttc ttgttctatt acaacttttt 540
ttacttcttg ctcattagaa agaaagcata gcaatctaat ctaagtttta attacaaa 598
<210> 37
<211> 383
<212> DNA
<213> 其他序列
<220>
<223> 启动子pTEF1的核酸序列
<400> 37
gtttagcttg cctcgtcccc gccgggtcac ccggccagcg acatggaggc ccagaatacc 60
ctccttgaca gtcttgacgt gcgcagctca ggggcatgat gtgactgtcg cccgtacatt 120
tagcccatac atccccatgt ataatcattt gcatccatac attttgatgg ccgcacggcg 180
cgaagcaaaa attacggctc ctcgctgcag acctgcgagc agggaaacgc tcccctcaca 240
gacgcgttga attgtcccca cgccgcgccc ctgtagagaa atataaaagg ttaggatttg 300
ccactgaggt tcttctttca tatacttcct tttaaaatct tgctacgata cagttctcac 360
atcacatccg aacataaaca acc 383
<210> 38
<211> 383
<212> DNA
<213> 其他序列
<220>
<223> 启动子pTEF1.ago的核酸序列
<400> 38
gtttagcttg cctcgtcccc gccgggtcac ccggccagcg acatggaggc ccagaatacc 60
ctccttgaca gtcttgacgt gcgcagctca ggggcatgat gtgactgtcg cccgtacatt 120
tagcccatac atccccatgt ataatcattt gcatccatac attttgatgg ccgcacggcg 180
cgaagcaaaa attacggctc ctcgctgcag acctgcgagc agggaaacgc tcccctcaca 240
gacgcgttga attgtcccca cgccgcgccc ctgtagagaa atataaaagg ttaggatttg 300
ccactgaggt tcttctttca tatacttcct tttaaaatct tgctacgata cagttctcac 360
atcacatccg aacataaaca acc 383
<210> 39
<211> 498
<212> DNA
<213> 其他序列
<220>
<223> 启动子pTEF1.Sba的核酸序列
<400> 39
cgccaacaaa ccttcgaaca ctttaatttt cgaggaccgc agatcctcac atcacaccca 60
cacccaagac tgcttccccc acacaccctg catctgtaca ctttcttctg ctctgttttt 120
ctctccggcg ttctctcggg tcgcccgcat cgccgcgccg gctggaaccg cccacgcacc 180
gcatattgca aatcgcctgc cccctcttgc tcctttttga gggcgcgccg ttacccgcgc 240
ccagggtccg gaaaaagaaa caaggctcta ccgcgtttct ttttccttgt cgaaaaaggc 300
aaaaatgaaa atttttatca cgtttctttt tttttgaaaa attttttttt tggttttttt 360
tctttcgatg gcctcccatt gatatttaag ttaataaatg gttttcagtt ttcaagtttc 420
agtttgtgtt cttctttgct aactttcact tacacctcga aagaaagtat agcaatctaa 480
tcttagtttt aattacaa 498
<210> 40
<211> 700
<212> DNA
<213> 其他序列
<220>
<223> 启动子pPDC1的核酸序列
<400> 40
ttatttacct atctctaaac ttcaacacct tatatcataa ctaatatttc ttgagataag 60
cacactgcac ccataccttc cttaaaaacg tagcttccag tttttggtgg ttccggcttc 120
cttcccgatt ccgcccgcta aacgcatatt tttgttgcct ggtggcattt gcaaaatgca 180
taacctatgc atttaaaaga ttatgtatgc tcttctgact tttcgtgtga tgaggctcgt 240
ggaaaaaatg aataatttat gaatttgaga acaattttgt gttgttacgg tattttacta 300
tggaataatc aatcaattga ggattttatg caaatatcgt ttgaatattt ttccgaccct 360
ttgagtactt ttcttcataa ttgcataata ttgtccgctg cccctttttc tgttagacgg 420
tgtcttgatc tacttgctat cgttcaacac caccttattt tctaactatt ttttttttag 480
ctcatttgaa tcagcttatg gtgatggcac atttttgcat aaacctagct gtcctcgttg 540
aacataggaa aaaaaaatat ataaacaagg ctctttcact ctccttgcaa tcagatttgg 600
gtttgttccc tttattttca tatttcttgt catattcctt tctcaattat tattttctac 660
tcataacctc acgcaaaata acacagtcaa atcaatcaaa 700
<210> 41
<211> 998
<212> DNA
<213> 其他序列
<220>
<223> 启动子pCCW12的核酸序列
<400> 41
aaccagggca aagcaaaata aaagaaactt aatacgttat gccgtaatga agggctacca 60
aaaacgataa tctcaactgt aaacaggtac aatgcggacc cttttgccac aaaacataca 120
tcattcattg ccggaaaaag aaagaagtga agacagcagt gcagccagcc atgttgcgcc 180
aatctaatta tagatgctgg tgccctgagg atgtatctgg agccagccat ggcatcatgc 240
gctaccgccg gatgtaaaat ccgacacgca aaagaaaacc ttcgaggttg cgcacttcgc 300
ccacccatga accacacggt tagtccaaaa ggggcagttc agattccaga tgcgggaatt 360
agcttgctgc caccctcacc tcactaacgc tgcggtgtgc ggatacttca tgctatttat 420
agacgcgcgt gtcggaatca gcacgcgcaa gaaccaaatg ggaaaatcgg aatgggtcca 480
gaactgcttt gagtgctggc tattggcgtc tgatttccgt tttgggaatc ctttgccgcg 540
cgcccctctc aaaactccgc acaagtccca gaaagcggga aagaaataaa acgccaccaa 600
aaaaaaaaat aaaagccaat cctcgaagcg tgggtggtag gccctggatt atcccgtaca 660
agtatttctc aggagtaaaa aaaccgtttg ttttggaatt ccccatttcg cggccaccta 720
cgccgctatc tttgcaacaa ctatctgcga taactcagca aattttgcat attcgtgttg 780
cagtattgcg ataatgggag tcttacttcc aacataacgg cagaaagaaa tgtgagaaaa 840
ttttgcatcc tttgcctccg ttcaagtata taaagtcggc atgcttgata atctttcttt 900
ccatcctaca ttgttctaat tattcttatt ctcctttatt ctttcctaac ataccaagaa 960
attaatcttc tgtcattcgc ttaaacacta tatcaata 998
<210> 42
<211> 976
<212> DNA
<213> 其他序列
<220>
<223> 启动子pCCW12.Sm的核酸序列
<400> 42
cgttgtgctg tagtgaagga agactaaaaa ggataatcac agttgtaaag aggtataatg 60
cggacccttt tgccacaaaa cacacatctt tcgtttccaa aataagaaag aagaaagcaa 120
aaagattagc agccacgttg ctgcgatcta attatagacg gtggcgtcat cattctcacc 180
caagattgtg tcttgaacct gccacgggtc ctgcgttatc gccggatgta aaactagaca 240
tgcaaaaaaa ggaccttcca ggtagcgtgc tccacaccac ccatgaccac cacagttagt 300
ccaaaagagg cagcaccact tcccgatggg ggaattagat tgctgccacc ctcacctcac 360
taatgctgcg gtgtgcggat atgccctgct atatatagct ccgcgttttt gaaccagcac 420
agcgcgagca ccaaaaagga aaatcgcata ggcccagaac tgatttcagc acgggctatt 480
ggcgttgggt ttccgttctg ggaaaccttc gccgcgtccc cctcacaaac ctccgcacaa 540
gttcgagcaa gcgggaaaaa acgaaaaacg ccattaatac taaataaagc aaatcctcga 600
agcgtgggtg gcaagcccct ggatttttcc gcacaagtac tcttctcagg agtaaaaaaa 660
cccgtttgtt ttggaattcc ccatttcgcg gccatctacg ccggtatctt cgcaatatct 720
atcagcgata actcagcaat tttaatattc gtgttgcagt gctgcgatag cgggagtctt 780
gtttgtaaca taacggcaga aaggaatgag agaaaatttt ccattctttg gcctccgttc 840
aagtatataa agccggcatg cttggtaatc tttctctctc ttctgtattg tttctataat 900
acttttatct tctaattatt ttctgaaaaa accaagaaat taatcttctg tcattcgctt 960
aaacactata tcaata 976
<210> 43
<211> 750
<212> DNA
<213> 其他序列
<220>
<223> 启动子pCCW12.Sk的核酸序列
<400> 43
tgtaaaatcc tacacgcaaa aaacctcttg ggttgcgcgt tttccaccac ccacgacccg 60
cacaatcaat ccaaaagggg caacgccagt tcccaatgcg ggaattagct cctcaccccc 120
ctcacccgct aacgctgcgg tgtgcggaca cgcagcagta tttatagatc ctcgtgttgg 180
aaccagcccg cgtgagcacc aaattggaaa gtcgcaatgg gcccagaacc gctttcagta 240
ctgggccatt ggcgtctagt ttccgttttg agcgtccttc gccgcgtctc tctgtgaaat 300
ccccgcacaa gtctgagcag gcaaaaaaaa aaaacgccac caaaaataaa taaagccaat 360
cctcgaagga tgagtaggaa aggaagcccc tggttttttc ccgcacgaat atttttcagg 420
agtgaaaaaa tccgtttgtt ttggaattcc ccatttcgcg ctcacctacg ccggtatctt 480
tggaacaact atcagcgata actcagcaaa atttgcatat ccgtgctgca atagtgcgat 540
agtgggattg ggagtcttgt tgcatcataa cggcagaaag gaatgaataa aaattttccg 600
ttctttgtct ccgttcaagt atataaagtc ggcatgcttg attatctttt cttctcttct 660
actacatttc tatttcactt tctactctat tcttccctga aaaacccaag aaaataatct 720
tctgtcattc gcttaaacaa tatatcaaaa 750
<210> 44
<211> 750
<212> DNA
<213> 其他序列
<220>
<223> 启动子pCCW12.Sba的核酸序列
<400> 44
accatgccac ggtgctggcc ccacttccac ccacgacccg cacggttggc ccgaaagggg 60
caacaccagt tcccaatacg gaaattagtc cgccaccacc ctcacctcgc tagagctgcg 120
gtgtgcgggc gtgcatcgct atttatagac atgcctgctg gcgtcaccgc gcgcgagcac 180
caaacaggaa aatcgcactg ggcccagaac cacgctatgc gctgggccga tggcgtccgg 240
tttccctttg ggagccccct gccacgttcg cctaacaaat ccccgcaccg gcttgagaaa 300
aaagcgaaaa gcgaaaaaaa aaaatcaacg ccaccaaaat taaaaaaaaa gagccatcct 360
cgaagggtga atagtagccc ctgacttttc ccgcacagac agacaccttt caggagtgaa 420
caaaaaagca gtttgttttg gaattccccc atttcgcggt ggcctgcgca ggtatctctg 480
cgtcaactat cagcgataac tcagcaaatt ttgcatattc gtgttgcgat actacgataa 540
tgggagtctg tcgcctaata acggcaacaa ggaatgagag agaaaaattt tcttcattct 600
ccagctcccg ttcaagtata taaggtcggc atggtcgatt gtctttcctt ctcttcagtt 660
acgtctctct atttacatta ttcttatttt tatttaataa aaaccccaag aaattaatct 720
tctgtcattc gcttaaacac tatatcaaaa 750
<210> 45
<211> 750
<212> DNA
<213> 其他序列
<220>
<223> 启动子pCCW12.Sar的核酸序列
<400> 45
aaaaaacaac cttctgccaa cctgcgtgct tctcaccacc catgacccac acaattgacc 60
cgaatggggc aactccagtt cccaatacgg gaattaactc gccaccatat ttaccgcgtt 120
gaagctgtgg tgtgcggaca ctccgtacta tttatagacc cacgcggtgg aaccagcacg 180
cgcgcgcact aaacaggaaa atcgcattga gtccagaacc gccaccagca cttggccatt 240
ggcgtctaat ttccgttttc ggcgcccctc accgcgtcct tctaacaaag cgcgcacaag 300
cttgagcaag tgaaaagaaa attaaaaata aaaaaccgcc accaaaacaa ataaagcaat 360
cttcgaagtg tgggttggtg ggaagcccct ggcttttccc gcaccagtcg ttttcaggag 420
taaaaaaata cccgtttgtt ttggaattcc ccatttcgcg gcgacctgcg ccggtatctt 480
tgcaacaact atttgcgata actcagcaaa atttgcatat tcgtgttggg atattgcgat 540
agtgggagtc ttgttgcata ataacggtaa aaagaagtga aggaaaaaaa tttgcatcct 600
ttagtctcag ttcaagtata taaagtcggg atattcaatt atctttcttt ctcttgctca 660
aaggtttcta tatttttttt atagtatttc ttttgttata aaataccaag aaattaatct 720
tctgtcattc gcttaaatac tacatcaata 750
<210> 46
<211> 500
<212> DNA
<213> 其他序列
<220>
<223> 启动子pNUP57的核酸序列
<400> 46
tcatctgcgc aatgactatc aagaccttct gcaagaattt caaatctcac tgaaaatctt 60
gaccgaaaag tgtcttgaaa acccatcaag cctgcaaaac ctatctttga cattagtctc 120
cattataaaa acggcatagt tgggagaaaa ctttccatac ttcaattgtg gactgatata 180
agtattttag ttttgcccgc atgatcatcc cacatggcta cagcagttct ctcataggaa 240
aatagtacaa tagctacgtg atataatcta aataattgtt gccaatgtgt aattatatca 300
ttttgaacgt acgcgaaatg gattattttc aaaaattttg tttcttgaaa tgagtaaaag 360
caaaagtcca actctccaag tcgatgtaaa caactttttg ccaaagggac tgaaagacta 420
aatcgaggat tatcccgttc aaactattcc agaaacgctc gttagtaaca aaagacatac 480
cttgttgacc aattgatcac 500
<210> 47
<211> 523
<212> DNA
<213> 其他序列
<220>
<223> 启动子pCCW10.ago的核酸序列
<400> 47
ggtaccacgg caacctcgtt cgctgttcat ccccttcgtc acacaggacg ttggatgccg 60
taagcagcgt tgcttttgat cctcaggatc ggccgggtaa cccgcggctg cttctatttt 120
agtattcata tctcaagcac atccattccg gccgtttggg ggcgccgccg cactcgtgtc 180
cattcctacc gtggcactta gggctatcct gtcggagcgc cccgccgacc gccttatcgg 240
caccaaaagt agaagccccg gccccgcgtg gctcagactc accatcggtg ctatttactt 300
ttcgatcaga tcgcggcgcg cggtggccgg catttccgga agcggccacg gagcagaggt 360
ggcgcattcg aatcgcatac gtcttcgcca cgccggaaaa aaaattttcg gctatataag 420
gagaggcggc cgtcttgctg caggcagttt cactttctct aaaaccaaag aacatcgatt 480
tctttagtca ctcgcttcct tacaccgaac tcgaggcggc cgc 523
<210> 48
<211> 943
<212> DNA
<213> 其他序列
<220>
<223> 启动子pCWP2的核酸序列
<400> 48
ctagcctccc ctttttattt tgtgcggtca ccgcaaggga caaagctttt cttagaaaac 60
cgtctgagaa gcataacgta cgccatcccc tagacatatt aataatgcta cagatactat 120
gctgctcgtc tttttttgac gaccctttta ttgcaatgtg caactaatgg caaacaacca 180
catagtatca cagtattaca ttgcctccac cgatgcggat gttagggcgc caagtctgtc 240
atgaagcatg ttcctgtcat aatcttgtat gcaaaatacc gcgttctgcg ccactgatat 300
gctaggcagc agcaacctat gcagaagatt gcttttccca cgcctgtttt acgtctccag 360
ggcacttgaa acaatgcagc gatcgccgcc acaacacgcc aaagagaagc gaaagtgggc 420
ctgggcggcc tcagtttcgg cagaggtaaa caacacgaac tgaactgcct tagctccgaa 480
gggcaattcc acaggcactc cgcggggccc ggccaaggcc caaaaggcgt ggaatatgcg 540
cgttttgggg ccataacacc cagtaccacg gccggaacgg gccatataat aagtttttca 600
ctctcaagaa tggtaaacgt aaataggaac atcccactac cctagaaatt gcggaaattt 660
cgcgcttatc attagaaaat ctggaaccgt cctttttcct ctttcttgca tttccctttc 720
cgtattattg ccattcttta actgcatttg gggaaccgta gaccaaaagc caaacagaga 780
aatgtaacgt tctaaaaaaa aaacaacgaa aaaattgaaa aataagatac aataatcgta 840
tataaatcag gcttcttgtt catcattttc aattctcttc ttgccatccc ttttcctatc 900
tttgttcttt tcttctcata atcaagaata aataacttca tca 943
<210> 49
<211> 750
<212> DNA
<213> 其他序列
<220>
<223> 启动子pCCW120.Sca的核酸序列
<400> 49
tatttttttt aaattaaaga tgctgtgcaa ttaattgtcc ggagggaccc ttgcatactg 60
gccagtttgt acgggcgtta catagcgccg atcgacgaac agcttattaa tagcaagatt 120
tgtttctccc atgagcaatt aaccagtaat tttcacagaa actagcacaa aaccaaccaa 180
acagttaaag gcagtttcgg agaataaaca acgcgctcac tgagcttgct gttgccaaaa 240
ataacagtcg cgtgcgatgg cgggcttggc attttcctcg aaggggaaac gccgccaggg 300
ttcgctgcgg tgtgtgggtg gggcagcccc cgggcgccca gacggtgccg cagggccttg 360
agacagccca aaatgccgcg aaaacgcaag ggcgcggtga cctctttcct aatgcggaaa 420
gccccaccgc cagcgacgtg acgcgttgtg cgggctcttc tcgggacccg gaaaaagaaa 480
tacgtacaca aacaccagca aattttttcg cttgagaggc tgcccgtgtt tctgcgcaac 540
gtgaaacacg gtggacaaga caagagagat tgacaagcgt cgttatcgtc ccagtgaggt 600
ttcccaatta tataaataca tccctgttgg tggattctta attacaactt ccatctctct 660
ctctctcact tcttttgttc ccttacatat ccccaagaaa tcaatcttct gccattcgct 720
ttaacaacaa acaaactttt aacttttaaa 750
<210> 50
<211> 535
<212> DNA
<213> 其他序列
<220>
<223> 启动子pRPLA1的核酸序列
<400> 50
tcaagttgga tactgatctg atctctccgc cctactacca gggaccctca tgattaccgc 60
tcgaatgcga cgtttcctgc ctcataaaac tggcttgaaa atatttattc gctgaacagt 120
agcctagctt ataaaaattt catttaatta atgtaatatg aaaactcaca tgccttctgt 180
ttctaaaatt gtcacagcaa gaaataacat taccatacgt gatcttatta aactctagta 240
tcttgtctaa tacttcattt aaaagaagcc ttaaccctgt agcctcatct atgtctgcta 300
catatcgtga ggtacgaata tcgtaagatg ataccacgca actttgtaat gatttttttt 360
ttttcatttt ttaaagaatg cctttacatg gtatttgaaa aaaatatctt tataaagttt 420
gcgatctctt ctgttctgaa taatttttag taaaagaaat caaaagaata aagaaatagt 480
ccgctttgtc caatacaaca gcttaaaccg attatctcta aaataacaag aagaa 535
<210> 51
<211> 505
<212> DNA
<213> 其他序列
<220>
<223> 启动子pCUP1的核酸序列
<400> 51
cggcaaactt caacgatttc tatgatgcat tttataatta gtaagccgat cccattaccg 60
acatttgggc gctatacgtg catatgttca tgtatgtatc tgtatttaaa acacttttgt 120
attatttttc ctcatatatg tgtataggtt tatacggatg atttaattat tacttcacca 180
ccctttattt caggctgata tcttagcctt gttactagtt agaaaaagac atttttgctg 240
tcagtcactg tcaagagatt cttttgctgg catttcttct agaagcaaaa agagcgatgc 300
gtcttttccg ctgaaccgtt ccagcaaaaa agactaccaa cgcaatatgg attgtcagaa 360
tcatataaaa gagaagcaaa taactccttg tcttgtatca attgcattat aatatcttct 420
tgttagtgca atatcatata gaagtcatcg aaatagatat taagaaaaac aaactgtaca 480
atcaatcaat caatcatcac ataaa 505
<210> 52
<211> 510
<212> DNA
<213> 其他序列
<220>
<223> 启动子pMET6的核酸序列
<400> 52
ccacaggaaa tatttcacgt gacttacaaa cagagtcgta cgtcaggacc ggagtcaggt 60
gaaaaaatgt gggccggtaa agggaaaaaa ccagaaacgg gactactatc gaactcgttt 120
agtcgcgaac gtgcaaaagg ccaatatttt tcgctagagt catcgcagtc atggcagctc 180
tttcgctcta tctcccggtc gcaaaactgt ggtagtcata gctcgttctg ctcaattgag 240
aactgtgaat gtgaatatgg aacaaatgcg atagatgcac taatttaagg gaagctagct 300
agttttccca actgcgaaag aaaaaaagga aagaaaaaaa aattctatat aagtgataga 360
tatttccatc tttactagca ttagtttctc ttttacgtat tcaatatttt tgttaaactc 420
ttcctttatc ataaaaaagc aagcatctaa gagcattgac aacactctaa gaaacaaaat 480
accaatataa tttcaaagta catatcaaaa 510
<210> 53
<211> 686
<212> DNA
<213> 其他序列
<220>
<223> 启动子pMET25的核酸序列
<400> 53
ttacattatc aatccttgcg tttcagcttc cactaattta gatgactatt tctcatcatt 60
tgcgtcatct tctaacaccg tatatgataa tatactagta acgtaaatac tagttagtag 120
atgatagttg atttttattc caacactaag aaataatttc gccatttctt gaatgtattt 180
aaagatattt aatgctataa tagacattta aatccaattc ttccaacata caatgggagt 240
ttggccgagt ggtttaaggc gtcagattta ggtggattta acctctaaaa tctctgatat 300
cttcggatgc aagggttcga atcccttagc tctcattatt ttttgctttt tctcttgagg 360
tcacatgatc gcaaaatggc aaatggcacg tgaagctgtc gatattgggg aactgtggtg 420
gttggcaaat gactaattaa gttagtcaag gcgccatcct catgaaaact gtgtaacata 480
ataaccgaag tgtcgaaaag gtggcacctt gtccaattga acacgctcga tgaaaaaaat 540
aagatatata taaggttaag taaagcgtct gttagaaagg aagtttttcc tttttcttgc 600
tctcttgtct tttcatctac tatttccttc gtgtaataca gggtcgtcag atacatagat 660
acaattctat tacccccatc cataca 686
<210> 54
<211> 363
<212> DNA
<213> 其他序列
<220>
<223> 启动子pSAM1的核酸序列
<400> 54
gaaacggacg taagacggaa atagaatttg aagataaagt tatatatcac tacacacgaa 60
tactttcttt tttttttttc acaggaaaac tgtggtggcg cccttgccta ctagtgcatt 120
tcttttttcg ggttcttgtc tcgacgaaat tttagcctca tcgtagtttt tcactctggt 180
atcgatgaaa aagggaagag taaaaagttt tccgtttagt acttaatggg attggtttgg 240
gacgtatata tcgactggtg ttgtctgtta ttcatcgttg tttttcggtt agcttcgaaa 300
aaaaaataga gtaaaaacca ggaatttacc ctaaaaacaa gaaaaaataa gataaacgaa 360
aat 363
<210> 55
<211> 300
<212> DNA
<213> 其他序列
<220>
<223> 终止子tTPI1的核酸序列
<400> 55
gattaatata attatataaa aatattatct tcttttcttt atatctagtg ttatgtaaaa 60
taaattgatg actacggaaa gcttttttat attgtttctt tttcattctg agccacttaa 120
atttcgtgaa tgttcttgta agggacggta gatttacaag tgatacaaca aaaagcaagg 180
cgctttttct aataaaaaga agaaaagcat ttaacaattg aacacctcta tatcaacgaa 240
gaatattact ttgtctctaa atccttgtaa aatgtgtacg atctctatat gggttactca 300
<210> 56
<211> 299
<212> DNA
<213> 其他序列
<220>
<223> 终止子tMET25的核酸序列
<400> 56
gtgtgcgtaa tgagttgtaa aattatgtat aaacctactt tctctcacaa gtactatact 60
tttataaaac gaactttatt gaaatgaata tccttttttt cccttgttac atgtcgtgac 120
tcgtactttg aacctaaatt gttctaacat caaagaacag tgttaattcg cagtcgagaa 180
gaaaaatatg gtgaacaaga ctcatctact tcatgagact actttacgcc tcctataaag 240
ctgtcacact ggataaattt attgtaggac caagttacaa aagaggatga tggaggttt 299
<210> 57
<211> 300
<212> DNA
<213> 其他序列
<220>
<223> 终止子tDIT1的核酸序列
<400> 57
taaagtaaga gcgctacatt ggtctacctt tttgttcttt tacttaaaca ttagttagtt 60
cgttttcttt ttctcatttt tttatgtttc ccccccaaag ttctgatttt ataatatttt 120
atttcacaca attccattta acagaggggg aatagattct ttagcttaga aaattagtga 180
tcaatatata tttgcctttc ttttcatctt ttcagtgata ttaatggttt cgagacactg 240
caatggccct agttgtctaa gaggatagat gttactgtca aagatgatat tttgaatttc 300
<210> 58
<211> 300
<212> DNA
<213> 其他序列
<220>
<223> 终止子tRPL3的核酸序列
<400> 58
gaagttttgt tagaaaataa atcatttttt aattgagcat tcttattcct attttattta 60
aatagtttta tgtattgtta gctacataca acagtttaaa tcaaattttc tttttcccaa 120
gtccaaaatg gaggtttatt ttgatgaccc gcatgcgatt atgttttgaa agtataagac 180
tacatacatg tacatatatt taaacatgta aacccgtcca ttatattgct tactttcttc 240
ttttttgccg ttttgacttg gacctctggt ttgctatttc cttacaatct ttgctacaat 300
<210> 59
<211> 304
<212> DNA
<213> 其他序列
<220>
<223> 终止子tRPL3.sm的核酸序列
<400> 59
gaagttttta aagcattttt tagacacttc tcatttttct aagttttttt aaaatagttt 60
tatgtattta ctacgtatca caatttgaaa taattcatct tcccaaaaaa ctaagatttt 120
tatccttgtc acgatccgta accagtttat aatattttag agcttataca cgtacgtata 180
cacacgtgtc ggtacatgag aattacgttc aaaattattc actttttttt tctctgccgt 240
tttacttttg aactctgtct cgctatttcc ttacaatctt cgctacaata ccacttgccc 300
ttgg 304
<210> 60
<211> 299
<212> DNA
<213> 其他序列
<220>
<223> 终止子tRPL3.sba的核酸序列
<400> 60
gaagttttct gacaaaaaca taacgttttt tccaatcatt tcttattttt ccggtttatt 60
taaatagttt ttatgtacta ttatacgtat gactatttaa cttaaattct tcctcccaag 120
aaatctccca agtttttcat tatcatggca tacaccacta tcagttacaa aatggtagct 180
caaccatata tatatctcta tatacacata taaatgcaaa caggtccaag tcaccgctca 240
ctgcagtttc ttttgccgtt ttgacttcga tctctgcttg gctattttct cacaatcct 299
<210> 61
<211> 300
<212> DNA
<213> 其他序列
<220>
<223> 终止子tRPL41B的核酸序列
<400> 61
gcggattgag agcaaatcgt taagttcagg tcaagtaaaa attgatttcg aaaactaatt 60
tctcttatac aatcctttga ttggaccgtc atcctttcga atataagatt ttgttaagaa 120
tattttagac agagatctac tttatattta atatctagat attacataat ttcctctcta 180
ataaaatatc attaataaaa taaaaatgaa gcgatttgat tttgtgttgt caacttagtt 240
tgccgctatg cctcttgggt aatgctatta ttgaatcgaa gggctttatt atattaccct 300
<210> 62
<211> 300
<212> DNA
<213> 其他序列
<220>
<223> 终止子tRPL15A的核酸序列
<400> 62
gctggttgat ggaaaatata attttattgg gcaaactttt gtttatctga tgtgttttat 60
actattatct ttttaattaa tgattctata tacaaacctg tatatttttt ctttaaccaa 120
tttttttttt tatagaccta gagctgtact tttattctgc tatcaagcaa acccctaccc 180
cctcttctca atcctcccct caggcagaac ttatctacct gtatcaagga gcggacgagg 240
gagtcctaat tgttctacgt ataccaatgc tagcagctta cataggtggt ggcactacca 300
<210> 63
<211> 300
<212> DNA
<213> 其他序列
<220>
<223> 终止子tRPL15A.sba的核酸序列
<400> 63
gctggctgat gaaaaatata gttctgttgg gcaagcattt gtttacctag catctctttt 60
atactattat tatctttata tttgatgatt ttatatacaa gttgtatacc ttttctttaa 120
ccaatttttt tttttctaat ggtgcaccta gaagtacatt ttttctcacc aatagatagt 180
caagatactc ccagcctcta tggcgttacc acggagccga caagggaaag ctgcttatct 240
tacatatgca gatgccaagg cccgttacag gccgccttat tgatgtttag aaatagcttc 300
<210> 64
<211> 300
<212> DNA
<213> 其他序列
<220>
<223> 终止子tIDP1的核酸序列
<400> 64
tcgaatttac gtagcccaat ctaccacttt tttttttcat tttttaaagt gttatactta 60
gttatgctct aggataatga actacttttt tttttttttt tttactgtta tcataaatat 120
atatacctta ttgttgtttg caaccgtcgg ttaattcctt atcaaggttc cccaagttcg 180
gatcattacc atcaatttcc aacattttca tgagttcttc ttcttcatta ccgtgtttta 240
gggggctgtt cgcacttcta atagggctat caccaagctg ttctaattcg tccaaaagtt 300
<210> 65
<211> 300
<212> DNA
<213> 其他序列
<220>
<223> 终止子tTEF1.sba的核酸序列
<400> 65
ggagattgat aggacttttc tagttgcata tcttttattt ttaaatctta tctattagtt 60
aattttttgt aatttatcct tatatatata gtttggttat tctaaaacat catttcagta 120
tctaaaacct ctcttattca ttaccttttt atttaatggt ttttgctaca ggcaaaaatt 180
taatggtttt tgctacaggc aaaaatcccg ccgtggactt attccacgtt aactcggtta 240
cagggtcatg aaccattttg tcaattatcg aaataacttc ttcaaaagtc cctcttactt 300
<210> 66
<211> 60
<212> DNA
<213> 其他序列
<220>
<223> 在5’添加的分泌序列的核酸序列
<400> 66
atgcaattta gcacagtcgc atcagtagcc ttcgttgcct tggccaactt cgtggcagca 60
<210> 67
<211> 20
<212> PRT
<213> 其他序列
<220>
<223> N末端添加的分泌序列的氨基酸序列
<400> 67
Met Gln Phe Ser Thr Val Ala Ser Val Ala Phe Val Ala Leu Ala Asn
1 5 10 15
Phe Val Ala Ala
20
<210> 68
<211> 213
<212> DNA
<213> 其他序列
<220>
<223> 在3’添加的锚定序列的核酸序列
<400> 68
ggatccgcca tttctcaaat cactgacggt caaatccaag ctactaccac tgctaccacc 60
gaagctacca ccactgctgc cccatcttcc accgttgaaa ctgtttctcc atccagcacc 120
gaaactatct ctcaacaaac tgaaaatggt gctgctaagg ccgctgtcgg tatgggtgcc 180
ggtgctctag ctgctgctgc tatgttgtta taa 213
<210> 69
<211> 68
<212> PRT
<213> 其他序列
<220>
<223> C末端添加的锚定序列的氨基酸序列
<400> 69
Ala Ile Ser Gln Ile Thr Asp Gly Gln Ile Gln Ala Thr Thr Thr Ala
1 5 10 15
Thr Thr Glu Ala Thr Thr Thr Ala Ala Pro Ser Ser Thr Val Glu Thr
20 25 30
Val Ser Pro Ser Ser Thr Glu Thr Ile Ser Gln Gln Thr Glu Asn Gly
35 40 45
Ala Ala Lys Ala Ala Val Gly Met Gly Ala Gly Ala Leu Ala Ala Ala
50 55 60
Ala Met Leu Leu
65

Claims (30)

1.一种生产肝素前体的重组酵母细胞,其中,所述重组细胞包含:
(a)编码具有肝素前体合酶(HSS)活性的多肽的一种或多种重组核酸;和
(b)编码具有UDP-葡萄糖脱氢酶(UDP-GlcDH或HASB)活性的多肽的一种或多种重组核酸。
2.根据权利要求1所述的重组细胞,其中,所述重组细胞包含编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的核酸,其中,所述具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽包含分泌信号和任选的锚定信号。
3.一种生产肝素前体的重组宿主细胞,其中,所述重组细胞包含:
(a)编码具有肝素前体合酶(HSS)活性的多肽的一种或多种重组核酸;
(b)编码具有UDP-葡萄糖脱氢酶(UDP-GlcDH或HASB)活性的多肽的一种或多种重组核酸;和
(c)编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的一种或多种重组核酸,
其中,具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽包含分泌信号和任选的锚定信号,使得肝素前体、特别是具有所想要分子量的肝素前体由宿主细胞生产。
4.根据权利要求2或3所述的重组细胞,其中,编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的核酸获自或源自解肝磷脂土地杆菌。
5.根据权利要求2至4中任一项所述的重组细胞,其中,编码具有葡萄糖醛酰基-二磺基葡萄糖胺葡萄糖醛酸酶活性的多肽的核酸在选自由以下组成的组的启动子的控制下:pTEF1、pCCW12、pCCW12.sba、pCCW12.Sar、pPDC1、pTEF3、pTDH3、pNUP57和pCCW10.ago。
6.根据权利要求2至5中任一项所述的重组细胞,其中,所述肝素前体的分子量在小于50kDa的范围内,优选在约20kDa至约50kDa的范围内。
7.根据权利要求2至5中任一项所述的重组细胞,其中,所述肝素前体的分子量在大于50kDa的范围内,优选在约50kDa至约250kD的范围内。
8.根据权利要求2至5中任一项所述的重组细胞,其中,所述肝素前体的分子量在大于100kDa的范围内,优选在约100kDa至约1500kDa的范围内。
9.根据权利要求1至8中任一项所述的重组细胞,其中,编码具有UDP-葡萄糖脱氢酶(UDP-GlcDH或HASB)活性的多肽的核酸获自并且源自以下中的至少一者:拟南芥、小球藻属病毒PBCV1或兽瘟链球菌,并且特别是来自拟南芥或小球藻属病毒PBCV1。
10.根据权利要求1至9中任一项所述的重组细胞,其中,编码具有肝素前体合酶(HSS)活性的多肽的核酸获自或源自多杀巴斯德菌。
11.根据权利要求1至10中任一项所述的重组细胞,其中,所述重组细胞还包含至少一种编码以下中的一者或多者的重组核酸:
(i)具有谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)活性的多肽;和/或
(ii)具有UDP-N-乙酰葡萄糖胺焦磷酸化酶(QRI1)活性的多肽。
12.根据权利要求1至11中任一项所述的重组细胞,其中,所述重组细胞还包含至少一种编码以下中的一者或多者的重组核酸:
(i)具有磷酸葡萄糖变位酶-1(PGM1)活性的多肽;和/或
(ii)具有UTP-葡萄糖-1-磷酸尿苷酰转移酶(UGP1)活性的多肽;和/或
(iii)具有葡萄糖胺-6-磷酸N-乙酰转移酶(GNA1)活性的多肽;和/或
(iv)具有磷酸乙酰葡萄糖胺变位酶(PCM1)活性的多肽。
13.根据权利要求11或12所述的重组细胞,其中:
-编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)活性的多肽的核酸;和/或
-编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶(QRI1)活性的多肽的核酸;和/或
-编码具有磷酸葡萄糖变位酶-1(PGM1)活性的多肽的核酸;和/或
-编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶(UGP1)活性的多肽的核酸;和/或
-编码具有葡萄糖胺-6-磷酸N-乙酰转移酶(GNA1)活性的多肽的核酸;和/或
-编码具有磷酸乙酰葡萄糖胺变位酶(PCM1)的多肽的核酸;
获自或源自酿酒酵母。
14.根据权利要求3至13中任一项所述的重组宿主细胞,其中,所述重组宿主细胞是酵母。
15.根据权利要求1至14中任一项所述的重组宿主细胞,其中,所述重组细胞属于酵母属,或属于念珠菌属,或属于克鲁维酵母菌属,或属于汉逊酵母属,或属于耶氏酵母属,或属于德巴利酵母属,或属于阿舒囊霉属,并且特别是属于酵母属。
16.根据权利要求15所述的重组细胞,其中,所述重组细胞选自由以下组成的组:酿酒酵母、布拉氏酵母、贝酵母、奇异酵母、米卡酵母、卡氏酵母、白念珠菌、光滑念珠菌、热带念珠菌、乳酸克鲁维酵母、马克斯克鲁维酵母、多孢克鲁维酵母、耐热克鲁维酵母、多形汉逊酵母、解脂耶氏酵母、汉逊德巴利酵母和棉阿舒囊霉,并且优选酿酒酵母。
17.一种生产肝素前体的方法,其包括:
(a)在培养基中培养如权利要求1至16中任一项所定义的重组细胞持续足以生产肝素前体的时间;和
(b)任选地从所述重组细胞和/或从所述培养基分离或回收所述肝素前体。
18.根据权利要求17所述的方法,其中,所述肝素前体的分子量为约20kDa至约50kDa。
19.根据权利要求17所述的方法,其中,所述肝素前体的分子量为约50kDa至约150kDa。
20.根据权利要求17所述的方法,其中,所述肝素前体的分子量为约150kDa至约1500kDa。
21.根据权利要求17至20中任一项所述的方法,其中,所述重组细胞是属于酵母属的酵母,并且特别是酿酒酵母。
22.根据权利要求17至21中任一项所述的方法,其中,所述足以生产肝素前体的时间是约35至约50小时、优选约40至约50小时、优选约48小时的时间段。
23.根据权利要求17至22中任一项所述的方法,其中,所生产的肝素前体的分子量由步骤(a)期间调节所述培养基的pH来控制。
24.根据权利要求17至23中任一项所述的方法,其中,所述方法以工业规模进行,优选地其中所述培养基是至少约100L,更优选地在约1000L至约3000L的范围内,甚至更优选约10,000L或甚至更优选约100,000L,或甚至约250,000L。
25.一种肝素前体,其是从根据权利要求1至16中任一项所述的重组细胞可获得的或从根据权利要求17至24中任一项所述的方法可获得的。
26.一种培养基,其包含根据权利要求25所述的肝素前体。
27.一种组合物,其包含根据权利要求25所述的肝素前体。
28.一种工业产品或消费产品或消费品,其包含(i)具有如权利要求6至8中任一项所定义的分子量的根据权利要求25所述的肝素前体,(ii)如权利要求26所述的培养基或(iii)如权利要求27所述的组合物。
29.根据权利要求28所述的工业产品或消费产品或消费品,其中,所述工业产品或消费产品或消费品是美容品、调味品、香料产品、食品、食物、饮料、食品定形剂、药物组合物、膳食补充剂、营养制品、清洁产品、牙科和/或口腔卫生组合物。
30.根据权利要求1至16中任一项所定义的重组细胞用于生产具有约20kDa至约50kDa或约50kDa至约1000kDa范围内的分子量的肝素前体的用途。
CN202280038990.0A 2021-04-01 2022-03-31 生产肝素前体的重组细胞 Pending CN117460835A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP21166744.9A EP4067500A1 (en) 2021-04-01 2021-04-01 Heparosan-producing recombinant cells
EP21166744.9 2021-04-01
PCT/EP2022/058568 WO2022207790A1 (en) 2021-04-01 2022-03-31 Heparosan-producing recombinant cells

Publications (1)

Publication Number Publication Date
CN117460835A true CN117460835A (zh) 2024-01-26

Family

ID=75362523

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280038990.0A Pending CN117460835A (zh) 2021-04-01 2022-03-31 生产肝素前体的重组细胞

Country Status (6)

Country Link
EP (2) EP4067500A1 (zh)
JP (1) JP2024511879A (zh)
KR (1) KR20240007134A (zh)
CN (1) CN117460835A (zh)
BR (1) BR112023019836A2 (zh)
WO (1) WO2022207790A1 (zh)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9687559B2 (en) * 2008-03-19 2017-06-27 The Board Of Regents Of The University Of Oklahoma Heparosan polymers and methods of making and using same for the enhancement of therapeutics
CN102712942B (zh) * 2009-09-01 2014-05-14 伦斯勒理工学院 K5肝素前体的发酵和纯化
FR3016637B1 (fr) * 2014-01-23 2020-11-27 Centre Nat Rech Scient Procede de production in vivo de glycosaminoglycane
CN109321508B (zh) * 2018-10-12 2022-12-27 北京化工大学 产heparosan的基因工程菌及其应用

Also Published As

Publication number Publication date
BR112023019836A2 (pt) 2024-01-16
KR20240007134A (ko) 2024-01-16
WO2022207790A1 (en) 2022-10-06
JP2024511879A (ja) 2024-03-15
EP4067500A1 (en) 2022-10-05
EP4314313A1 (en) 2024-02-07

Similar Documents

Publication Publication Date Title
US10907137B2 (en) Biosynthesis of oligosaccharides
CN110914435B (zh) 产依克多因酵母
CN111527211B (zh) 生产霉孢菌素样氨基酸的微生物及利用其生产霉孢菌素样氨基酸的方法
KR20170041768A (ko) 아세토인을 제조하는 방법
US20240150742A1 (en) Gene for efficiently expressing hyaluronic acid hydrolase and expression method thereof
CN117460821A (zh) 生产透明质酸的重组细胞
CN110892073A (zh) 增强型代谢物生产酵母
KR101779890B1 (ko) 레반 과당전이효소 생산능이 향상된 균주 및 이를 이용한 디프럭토스 언하이드리드 iv 생산방법
CN1894404B (zh) 有机酸存在下的启动子及其用途
EP1215281B1 (en) Cyclic depsipeptide synthases, genes thereof and mass production system of cyclic depsipeptide
CN117460835A (zh) 生产肝素前体的重组细胞
CN117460824A (zh) 生产软骨素的重组细胞
KR102237465B1 (ko) 이눌로수크라제 활성이 도입된 효모 및 이를 이용한 프럭토올리고사카라이드 생산방법
EP4067499A1 (en) Hyaluronic acid-producing recombinant cells
KR20240007906A (ko) 히알루론산-생산 재조합 세포
KR102605543B1 (ko) 메티오닌-생산 효모
KR20160093492A (ko) 2,3-부탄다이올 생산능을 갖는 유전적으로 조작된 효모 세포 및 그를 사용하여 2,3-부탄다이올을 생산하는 방법
CN112639117A (zh) 谷胱甘肽的制造方法
KR102306725B1 (ko) 아세토인 생산능을 갖는 유전적으로 조작된 효모 및 이를 이용한 아세토인 생산방법
KR101625898B1 (ko) 메발로네이트 또는 메발로노락톤 생성능을 가지는 재조합 미생물, 및 이를 이용한 메발로네이트 또는 메발로노락톤의 제조방법
CN109536430A (zh) 一种积累l-5-甲基四氢叶酸乳酸乳球菌及其构建方法
KR102016050B1 (ko) 신규한 프로모터 및 이의 용도
CN110106222B (zh) 一种糖基转移酶在合成甘草酸中的应用
KR102171224B1 (ko) 이눌린 과당전이효소 활성이 도입된 효모 및 이를 이용한 디프럭토스 언하이드리드 iii 및 프럭토올리고당의 생산방법
CN116601300A (zh) 阿魏酸生物转化为香草醛

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination