CN117460824A - 生产软骨素的重组细胞 - Google Patents

生产软骨素的重组细胞 Download PDF

Info

Publication number
CN117460824A
CN117460824A CN202280039395.9A CN202280039395A CN117460824A CN 117460824 A CN117460824 A CN 117460824A CN 202280039395 A CN202280039395 A CN 202280039395A CN 117460824 A CN117460824 A CN 117460824A
Authority
CN
China
Prior art keywords
recombinant
polypeptide
activity
nucleic acid
chondroitin
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280039395.9A
Other languages
English (en)
Inventor
多米尼克·路易斯
卡琳·杰尔拉尔登
缪里·梅尔卡姆
多米尼克·托马斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Givaudan SA
Original Assignee
Givaudan SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Givaudan SA filed Critical Givaudan SA
Publication of CN117460824A publication Critical patent/CN117460824A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0006Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/001Oxidoreductases (1.) acting on the CH-CH group of donors (1.3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/90Isomerases (5.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Mycology (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Cosmetics (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)

Abstract

本发明涉及软骨素的生物生产领域。本领域需要允许软骨素高效合成和分泌的软骨素生产方法。本发明提出的技术方案是使用包含如本文所述的许多修饰的重组细胞、特别是重组酵母。本发明还提出允许使用本发明的重组细胞、特别是重组酵母生物生产软骨素的方法。

Description

生产软骨素的重组细胞
技术领域
本发明涉及软骨素的生物生产领域。
背景技术
软骨素是一种高分子量多糖,天然存在于人和动物的结缔组织中。软骨素属于称为糖胺聚糖的杂多糖家族。
糖胺聚糖(GAG)或粘多糖是由重复的二糖单元组成的无支链、带负电荷的多糖链,包括酸性糖和氨基糖(N-乙酰葡萄糖胺或N-乙酰半乳糖胺)。由于GAG的刚性特性和高负电荷,GAG在体内用作润滑剂或减震物。例如,膝关节内衬的软骨基质富含GAG,可以通过这种机制支撑数百个大气压的压力。
由D-葡萄糖醛酸和N-乙酰-D-半乳糖胺形成的软骨素可以被硫酸化。硫酸软骨素对于维持软骨强度和弹性非常重要,并作为营养补充剂销售,以减轻关节疼痛并促进健康的软骨和关节功能。临床研究支持使用软骨素和硫酸软骨素治疗骨关节炎。
硫酸软骨素或软骨素天然存在于皮肤结缔组织的胞外基质中,也用于美容应用,特别是保湿、愈合和舒缓皮肤或作为护发素的组分。
目前,软骨素主要通过以下生产:从动物软骨中提取,使用化学和酶促处理将多糖从蛋白质中解离出来并产生不同质量的多糖产物。然而,这些方法可以是既费力又昂贵的。
因此,建议微生物生产软骨素。事实上,某些细菌产生软骨素和软骨素样多糖聚合物作为其荚膜的组分。然而,这些已知的细菌,例如多杀巴斯德菌(Pasteurellamultocida)或大肠埃希氏菌(Escherichia coli),是许多哺乳动物的病原体并且产生少量的多糖。
因此,研究转向重组微生物并且特别是重组细菌,用于生产软骨素。例如可提及WO2011109438、EP2142643或US20090263867。
与通常用于生产生物分子的其他微生物相反,酵母通常被认为是安全的。与细菌相比,它们可以快速生长并以更高的密度培养,并且不需要无菌环境。此外,酵母细胞比细菌更容易从培养基中分离,大大简化了产品提取和纯化的工艺。最后,酵母具有对培养基中pH变化具有更强耐受性的优势,因此代表了更强的发酵系统。
然而,在酵母中,物种之间的区分特征也可带来一定的挑战。这主要是由于物种和其培养条件之间新陈代谢的差异造成的。
然而,本发明人发现,酿酒酵母作为生产目标分子的工具特别有用,因为它在被人类使用(例如在葡萄酒、啤酒或面包中)方面具有悠久的安全史,因此是一种完善建立的模型,其遗传信息是本领域众所周知的。酿酒酵母还具有被普遍认为对人和动物安全的优势。更重要的是,培养这种酵母时发生的培养基酸化降低了生物发酵罐污染的可能性,因此减少向培养基中添加抗生素的需求。最后,许多遗传工具已被开发出来,允许对其基因组进行稳定修饰(在染色体内整合)。
因此,本领域仍然需要允许软骨素高效合成和分泌的另外的软骨素生产方法。特别地,仍然需要提供具有成本效益的生产方法并提供对人应用安全的软骨素。
在特别情况下,本领域仍然需要能够获得大量的具有具体且受控尺寸的软骨素的软骨素生产方法。
发明内容
本发明因此涉及以下各项:
项1:一种生产软骨素的重组酵母细胞,其中所述重组酵母细胞包含:
(a)编码具有软骨素合酶(HCOS)活性的多肽的一种或多种重组核酸;和
(b)编码具有UDP-葡萄糖脱氢酶(UDP-GlcDH或HASB)活性的多肽的一种或多种重组核酸;和
(c)编码具有UDP-葡萄糖-4-差向异构酶(kfoA或GNE1)活性的多肽的一种或多种重组核酸。
如实例中所示,本发明的重组酵母允许在天然不能产生该糖胺聚糖的酵母细胞中生产软骨素。实例进一步证明,重组酵母生产的软骨素的大小是可控制的。
所述有利特性可以通过将酵母与下文所述的额外修饰重组来进一步增强。
项2:根据项1所述的重组,其中所述重组细胞包含编码具有软骨素酶活性的多肽的一种或多种重组核酸,其中所述具有软骨素酶活性的多肽包含分泌信号和任选的锚定信号。
项3:一种生产软骨素的重组宿主细胞,其中所述重组宿主细胞包含:
(a)编码具有软骨素合酶(HCOS)活性的多肽的一种或多种重组核酸;和
(b)编码具有UDP-葡萄糖脱氢酶(UDP-GlcDH或HASB)活性的多肽的一种或多种重组核酸;
(c)编码具有UDP-葡萄糖-4-差向异构酶(kfoA或GNE1)活性的多肽的一种或多种重组核酸;和
(d)编码具有软骨素酶活性的多肽的一种或多种重组核酸,其中具有软骨素酶活性的多肽包含分泌信号或包含分泌信号和任选的锚定信号,使得软骨素、特别是具有所想要分子量的软骨素由宿主细胞生产。
项4:根据项2或3所述的重组宿主细胞,其中所述编码具有软骨素酶活性的多肽的重组核酸获自或源自以下中的至少一者:萨氏九杯蛛(Cupiennius salei)、巴西钳蝎(Tityus serrulatus)、家牛(Bos taurus)、大胡蜂(Vespa magnifica)、野捕恒河猴(Macaca mulata)或西方蜜蜂(Apis mellifera),并且优选来自巴西钳蝎。
项5:根据项2至4中任一项所述的重组细胞,其中所述软骨素的分子量在小于50kDa的范围内,优选在约20kDa至约50kDa的范围内。
项6:根据项1至4中任一项所述的重组细胞,其中所述软骨素的分子量在大于50kDa的范围内,优选在约50kDa至约250kDa的范围内。
项7:根据项1至4中任一项所述的重组细胞,其中所述软骨素的分子量在大于100kDa的范围内,优选在约100kDa至约1500kDa的范围内。
项8:根据项1至7中任一项所述的重组细胞,其中编码具有UDP-葡萄糖脱氢酶(UDP-GlcDH或HASB)活性的多肽的核酸获自或源自以下中的至少一者:拟南芥、小球藻属病毒PBCV1或兽瘟链球菌,并且特别来自拟南芥或小球藻属病毒PBCV1中的至少一者。
项9:根据项1至8中任一项所述的重组细胞,其中编码具有软骨素合酶(HCOS)活性的多肽的核酸是
(i)编码软骨素合酶的核酸;或
(ii)编码具有软骨素合酶活性的嵌合多肽的核酸。
项10:根据项9所述的重组细胞,其中所述核酸获自或源自多杀巴斯德菌、小球藻属病毒PBCV1、结核分枝杆菌、智人、大肠埃希氏菌、酿酒酵母或草酸青霉(Penicilliumoxalicum)中的至少一者。
项11:根据项1至10中任一项所述的重组细胞,其中所述编码具有UDP-葡萄糖-4-差向异构酶(kfoA或GNE1)活性的多肽的核酸获自或源自细菌,并且特别是来自选自由以下组成的组的细菌:铜绿假单胞菌(Pseudomonas aeruginosa)、多杀巴斯德菌和大肠埃希氏菌。
项12:根据项1至11中任一项所述的重组细胞,其中所述重组细胞还包含至少一种编码以下中的一者或多者的重组核酸:
(i)具有谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)活性的多肽;和/或
(ii)具有UDP-N-乙酰葡萄糖胺焦磷酸化酶(QRI1)活性的多肽。
项13:根据项1至12中任一项所述的重组细胞,其中所述重组细胞还包含至少一种编码以下中的一者或多者的重组核酸:
(i)具有磷酸葡萄糖变位酶-1(PGM1)活性的多肽;和/或
(ii)具有UTP-葡萄糖-1-磷酸尿苷酰转移酶(UGP1)活性的多肽;和/或
(iii)具有葡萄糖胺-6-磷酸N-乙酰转移酶(GNA1)活性的多肽;和/或
(iv)具有磷酸乙酰葡萄糖胺变位酶(PCM1)活性的多肽。
项14:根据项12或13所述的重组细胞,其中:
-编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)活性的多肽的核酸;
-编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶(QRI1)活性的多肽的核酸;
-编码具有磷酸葡萄糖变位酶-1(PGM1)活性的多肽的核酸;
-编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶(UGP1)活性的多肽的核酸;
-编码具有葡萄糖胺-6-磷酸N-乙酰转移酶(GNA1)活性的多肽的核酸;和/或
-编码具有磷酸乙酰葡萄糖胺变位酶(PCM1)的多肽的核酸;
获自或源自酿酒酵母。
项15:根据项3至14中任一项所述的重组宿主细胞,其中所述重组宿主细胞是酵母。
项16:根据项1至15中任一项所述的重组宿主细胞,其中所述重组细胞属于酵母属,或属于念珠菌属(Candida),或属于克鲁维酵母菌属(Kluyveromyces),或属于汉逊酵母属(Ogataea),或属于耶氏酵母属(Yarrowia),或属于德巴利酵母属(Debaryomyces),或属于阿舒囊霉属(Ashbya),并且特别是属于酵母属。
项17:根据项16所述的重组细胞,其中重组细胞选自由以下组成的组:酿酒酵母(Saccharomyces cerevisiae)、布拉氏酵母(Saccharomyces boulardii)、贝酵母(Saccharomyces bayanus)、奇异酵母(Saccharomyces paradoxus)、米卡酵母(Saccharomyces mikatae)、卡氏酵母(Saccharomyces castelli)、白念珠菌(Candidaalbicans)、光滑念珠菌(Candida glabrata)、热带念珠菌(Candida tropicalis)、乳酸克鲁维酵母(Kluyveromyces lactis)、马克斯克鲁维酵母(Kluyveromyces marxianus)、多孢克鲁维酵母(Kluyveromyces polysporus)、耐热克鲁维酵母(Kluyveromycesthermotolerens)、多形汉逊酵母(Ogataea polymorpha)、解脂耶氏酵母(Yarrowialypolytica)、汉逊德巴利酵母(Debaryomyces hansenii)和棉阿舒囊霉(Ashbyagossypii),并且优选酿酒酵母。
项18:一种生产具有所想要分子量的软骨素的方法,其包括:
(a)在培养基中培养如项1至17中任一项所定义的重组细胞持续足以生产具有所想要分子量的软骨素的时间;和
(b)任选地从所述重组细胞和/或从所述培养基分离或回收所述软骨素。
项19:如项18所述的方法,其中软骨素的分子量为约20kDa至约50kDa。
项20:如项18所述的方法,其中软骨素的分子量为约50kDa至约150kDa。
项21:如项18所述的方法,其中软骨素的分子量为约150kDa至约1500kDa。
项22:根据项18至21中任一项所述的方法,其中所述重组细胞是属于酵母属的酵母,并且特别是酿酒酵母。
项23:根据项18至22中任一项所述的方法,其中所述足以生产具有所想要分子量的软骨素的时间是约35小时至约50小时、优选约40小时至约50小时、优选约48小时的时间段。
项24:根据项18至23中任一项所述的方法,其中所生产的软骨素的分子量由步骤(a)期间调节培养基的pH来控制。
项25:根据项18至24中任一项所述的方法,其中所述方法以工业规模进行,优选地其中所述培养基是至少约100L,更优选地在约1,000L至约3,000L的范围内,甚至更优选约10,000L或甚至更优选约100,000L,或甚至约250,000L。
项26:一种软骨素,其是从根据项1至17中任一项所述的重组细胞可获得的或从根据项18至25中任一项所述的方法可获得的。
项27:一种培养基,其包含根据项26所述的软骨素。
项28:一种组合物,其包含根据项26所述的软骨素。
项29:一种工业产品或消费产品或消费品,其包含(i)具有如项5至7中任一项所定义的分子量的软骨素,(ii)如项27所述的培养基或(iii)如项28所述的组合物。
项30:如项29所述的工业产品或消费产品或消费品,其中所述工业产品或消费产品或消费品是美容品、调味品、香料产品、食品、食物、饮料、食品定形剂、药物组合物、膳食补充剂、营养制品、清洁产品、牙科和/或口腔卫生组合物。
项31:如项2至17中任一项所定义的重组细胞用于生产具有约20kDa至约50kDa或约50kDa至约1000kDa范围内的分子量的软骨素的用途。
项32:一种用于生产软骨素的方法,其包括以下步骤:
(a)在培养基中培养如项1至17中任一项所定义的重组酵母;和
(b)从所述培养基回收软骨素,
其中步骤(b)中回收的软骨素具有通过选择以下而控制的分子量:
-重组酵母的编码具有软骨素酶活性的多肽的核酸的性质和来源,
-控制重组酵母的编码具有软骨素酶活性的多肽的重组核酸的表达的启动子的性质和来源,
-重组酵母的与具有软骨素酶活性的多肽相关的锚定信号和/或分泌信号的存在。
-培养重组酵母的步骤期间的培养基的pH,和/或
-培养重组酵母的持续时间。
本发明的某些实施方式可以提供以下优点中的一者或多者:
·一种用于生产具有受控分子量的软骨素的方法;
·一种在酿酒酵母细胞中生产具有受控分子量的软骨素的方法;和
·一种用于通过改变遗传参数(例如调控序列)和/或方法参数(pH或发酵时间)来生产具有受控分子量的软骨素的方法
与本发明的任一特别的一个或多个所述方面相关的细节、实施例和优选项将在本文中进一步描述,并且同样适用于本发明的所有方面。本文所描述的实施方式、实施例和优选项的任何组合以其所有可能的变化形式均由本发明涵盖,除非本文另外指出,或者与上下文明显矛盾。
附图说明
图1显示了用于生产软骨素的示意性途径。
具体实施方式
序列概述
SEQ ID NO:1是具有软骨素合酶活性的多肽的重编码核酸序列:嵌合核酸,其包含来自编码源自多杀巴斯德菌的透明质酸合酶的核酸的片段和来自编码源自多杀巴斯德菌的软骨素合酶的核酸的片段(HCOS1-1)。
SEQ ID NO:2是具有软骨素合酶活性的多肽的重编码核酸序列:嵌合核酸,其包含来自编码源自多杀巴斯德菌的透明质酸合酶的核酸的片段和来自编码源自多杀巴斯德菌的软骨素合酶的核酸的片段(HCOS1-2)。
SEQ ID NO:3是具有软骨素合酶活性的多肽的重编码核酸序列:嵌合核酸,其包含来自编码源自多杀巴斯德菌的透明质酸合酶的核酸的片段和来自编码源自多杀巴斯德菌的软骨素合酶的核酸的片段(HCOS1-3)。
SEQ ID NO:4:是具有软骨素合酶活性的多肽的核酸序列:嵌合核酸,其包含来自编码源自多杀巴斯德菌的透明质酸合酶的核酸的片段、来自编码源自多杀巴斯德菌的软骨素合酶的核酸的片段和编码来自酿酒酵母的几丁质合酶2的核酸的片段(HCOS.Sc)。
SEQ ID NO:5:是具有软骨素合酶活性的多肽的核酸序列:嵌合核酸,其包含来自编码源自多杀巴斯德菌的透明质酸合酶的核酸的片段和来自编码源自酿酒酵母的几丁质合酶2的核酸的片段(HHASA.Sc)。
SEQ ID NO:6:是具有软骨素合酶活性的多肽的核酸序列:嵌合核酸,其包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的核酸的片段和来自编码源自大肠埃希氏菌的软骨素合酶的核酸的片段(HCOS1-Vir)。
SEQ ID NO:7:是具有软骨素合酶活性的多肽的重编码核酸序列:嵌合核酸,其包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的核酸的片段和来自编码源自大肠埃希氏菌的软骨素合酶的核酸的片段(HCOS2-Vir)。
SEQ ID NO:8:是具有软骨素合酶活性的多肽的重编码核酸序列:嵌合核酸,其包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的核酸的片段和来自编码源自结核分枝杆菌的呋喃半乳糖基转移酶的核酸的片段(HCOS3-Vir)。
SEQ ID NO:9:是具有软骨素合酶活性的多肽的重编码核酸序列:嵌合核酸,其包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的核酸的片段和来自编码源自大肠埃希氏菌的软骨素合酶的核酸的片段(HCOS4-Vir)。
SEQ ID NO:10:是具有软骨素合酶活性的多肽的核酸序列:嵌合核酸,其包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的核酸的片段和来自编码源自草酸青霉的软骨素合酶的核酸的片段(HCOS5-Vir)。
SEQ ID NO:11:是具有软骨素合酶活性的多肽的核酸序列:嵌合核酸,其包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的核酸的片段和来自编码源自多杀巴斯德菌的软骨素合酶的核酸的片段(HCOS6-Vir)。
SEQ ID NO:12:是具有软骨素合酶活性的多肽的重编码核酸序列:嵌合核酸,其包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的核酸的片段和来自编码源自多杀巴斯德菌的软骨素合酶的核酸的片段(HCOS7-Vir)。
SEQ ID NO:13:是具有软骨素合酶活性的多肽的重编码核酸序列:嵌合核酸,其包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的核酸的片段和来自编码源自多杀巴斯德菌的软骨素合酶的核酸的片段(HCOS8-Vir)。
SEQ ID NO:14:是具有软骨素合酶活性的多肽的核酸序列:嵌合核酸,其包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的核酸的片段和来自编码源自智人的硫酸软骨素合酶的核酸的片段(HCOS9-Vir)。
SEQ ID NO:15:是具有软骨素合酶活性的多肽的重编码核酸序列:嵌合核酸,其包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的核酸的片段和来自编码源自智人的硫酸软骨素合酶的核酸的片段(HCOS10-Vir)。
SEQ ID NO:16:是具有软骨素合酶活性的多肽的重编码核酸序列:嵌合核酸,其包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的核酸的片段和来自编码源自智人的硫酸软骨素合酶的核酸的片段(HCOS11-Vir)。
SEQ ID NO:17:是具有软骨素合酶活性的多肽的重编码核酸序列:嵌合核酸,其包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的核酸的片段和来自编码源自智人的硫酸软骨素合酶的核酸的片段(HCOS12-Vir)。
SEQ ID NO:18是具有软骨素合酶活性的多肽的氨基酸序列:嵌合氨基酸,其包含来自编码源自多杀巴斯德菌的透明质酸合酶的氨基酸的片段和来自编码源自多杀巴斯德菌的软骨素合酶的氨基酸的片段(HCOS1-1)。
SEQ ID NO:19是具有软骨素合酶活性的多肽的氨基酸序列:嵌合氨基酸,其包含来自编码源自多杀巴斯德菌的透明质酸合酶的氨基酸的片段和来自编码源自多杀巴斯德菌的软骨素合酶的氨基酸的片段(HCOS1-2)。
SEQ ID NO:20是具有软骨素合酶活性的多肽的氨基酸序列:嵌合氨基酸,其包含来自编码源自多杀巴斯德菌的透明质酸合酶的氨基酸的片段和来自编码源自多杀巴斯德菌的软骨素合酶的氨基酸的片段(HCOS1-3)。
SEQ ID NO:21:是具有软骨素合酶活性的多肽的氨基酸序列:嵌合氨基酸,其包含来自编码源自多杀巴斯德菌的透明质酸合酶的氨基酸的片段、来自编码源自多杀巴斯德菌的软骨素合酶的氨基酸的片段和编码来自酿酒酵母的几丁质合酶2的氨基酸的片段(HCOS.Sc)。
SEQ ID NO:22:是具有软骨素合酶活性的多肽的核酸序列:嵌合氨基酸,其包含来自编码源自多杀巴斯德菌的透明质酸合酶的氨基酸的片段和来自编码源自酿酒酵母的几丁质合酶2的氨基酸的片段(HHASA.Sc)。
SEQ ID NO:23:是具有软骨素合酶活性的多肽的氨基酸序列:嵌合氨基酸,其包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的氨基酸的片段和来自编码源自大肠埃希氏菌的软骨素合酶的氨基酸的片段(HCOS1-Vir)。
SEQ ID NO:24:是具有软骨素合酶活性的多肽的重编码氨基酸序列:嵌合氨基酸,其包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的氨基酸的片段和来自编码源自大肠埃希氏菌的软骨素合酶的氨基酸的片段(HCOS2-Vir)。
SEQ ID NO:25:是具有软骨素合酶活性的多肽的重编码氨基酸序列:嵌合氨基酸,其包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的氨基酸的片段和来自编码源自大肠埃希氏菌的软骨素合酶的氨基酸的片段(HCOS3-Vir)。
SEQ ID NO:26:是具有软骨素合酶活性的多肽的重编码氨基酸序列:嵌合氨基酸,其包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的氨基酸的片段和来自编码源自大肠埃希氏菌的软骨素合酶的氨基酸的片段(HCOS4-Vir)。
SEQ ID NO:27:是具有软骨素合酶活性的多肽的氨基酸序列:嵌合氨基酸,其包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的氨基酸的片段和来自编码源自草酸青霉的软骨素合酶的氨基酸的片段(HCOS5-Vir)。
SEQ ID NO:28:是具有软骨素合酶活性的多肽的氨基酸序列:嵌合氨基酸,其包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的氨基酸的片段和来自编码源自多杀巴斯德菌的软骨素合酶的氨基酸的片段(HCOS6-Vir)。
SEQ ID NO:29:是具有软骨素合酶活性的多肽的重编码氨基酸序列:嵌合氨基酸,其包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的氨基酸的片段和来自编码源自多杀巴斯德菌的软骨素合酶的氨基酸的片段(HCOS7-Vir)。
SEQ ID NO:30:是具有软骨素合酶活性的多肽的重编码氨基酸序列:嵌合氨基酸,其包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的氨基酸的片段和来自编码源自多杀巴斯德菌的软骨素合酶的氨基酸的片段(HCOS8-Vir)。
SEQ ID NO:31:是具有软骨素合酶活性的多肽的氨基酸序列:嵌合氨基酸,其包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的氨基酸的片段和来自编码源自智人的硫酸软骨素合酶的氨基酸的片段(HCOS9-Vir)。
SEQ ID NO:32:是具有软骨素合酶活性的多肽的重编码氨基酸序列:嵌合氨基酸,其包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的氨基酸的片段和来自编码源自智人的硫酸软骨素合酶的氨基酸的片段(HCOS10-Vir)。
SEQ ID NO:33:是具有软骨素合酶活性的多肽的重编码氨基酸序列:嵌合氨基酸,其包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的氨基酸的片段和来自编码源自智人的硫酸软骨素合酶的氨基酸的片段(HCOS11-Vir)。
SEQ ID NO:34:是具有软骨素合酶活性的多肽的重编码氨基酸序列:嵌合氨基酸,其包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的氨基酸的片段和来自编码源自智人的硫酸软骨素合酶的氨基酸的片段(HCOS12-Vir)。
SEQ ID NO:35是源自拟南芥的UDP-葡萄糖脱氢酶(HASB)的核酸序列。
SEQ ID NO:36是源自小球藻属病毒PBCV-1的UDP-葡萄糖脱氢酶(HASB)的重编码核酸序列。
SEQ ID NO:37是源自小球藻属病毒PBCV-1的UDP-葡萄糖脱氢酶(HASB-A)的重编码核酸序列。
SEQ ID NO:38是源自兽瘟链球菌(Streptococcus zooepidemicus)的UDP-葡萄糖脱氢酶(HASB)的核酸序列。
SEQ ID NO:39是源自拟南芥的UDP-葡萄糖脱氢酶(HASB)的氨基酸序列。
SEQ ID NO:40是源自小球藻属病毒PBCV-1的UDP-葡萄糖脱氢酶(HASB)的氨基酸序列。
SEQ ID NO:41是源自兽瘟链球菌的UDP-葡萄糖脱氢酶(HASB)的氨基酸序列。
SEQ ID NO:42是源自铜绿假单胞菌的UDP-葡萄糖-4-差向异构酶(GNE1)的核酸序列。
SEQ ID NO:43是源自多杀巴斯德菌的UDP-葡萄糖-4-差向异构酶(KFOA)的核酸序列。
SEQ ID NO:44是源自大肠埃希氏菌的UDP-葡萄糖-4-差向异构酶(KFOA)的核酸序列。
SEQ ID NO:45是源自铜绿假单胞菌的UDP-葡萄糖-4-差向异构酶(GNE1)的氨基酸序列。
SEQ ID NO:46是源自多杀巴斯德菌的UDP-葡萄糖-4-差向异构酶(KFOA)的氨基酸序列。
SEQ ID NO:47是源自大肠埃希氏菌的UDP-葡萄糖-4-差向异构酶(KFOA)的氨基酸序列。
SEQ ID NO:48是具有N-末端分泌信号的源自萨氏九杯蛛的透明质酸酶(HYAL)的重编码核酸序列。
SEQ ID NO:49是具有N-末端分泌信号的源自巴西钳蝎的透明质酸酶(HYAL)的重编码核酸序列。
SEQ ID NO:50是具有N-末端分泌信号的源自家牛的透明质酸酶(HYAL)的重编码核酸序列。
SEQ ID NO:51是具有N-末端分泌信号的源自西方蜜蜂的透明质酸酶(HYAL)的重编码核酸序列。
SEQ ID NO:52是具有N-末端分泌信号的源自野捕恒河猴的透明质酸酶(HYAL)的重编码核酸序列。
SEQ ID NO:53是具有N-末端分泌信号的源自大胡蜂的透明质酸酶(HYAL)的重编码核酸序列。
SEQ ID NO:54是具有N-末端分泌信号和C-末端锚定信号的源自萨氏九杯蛛的透明质酸酶(HYAL)的重编码核酸序列。
SEQ ID NO:55是具有N-末端分泌信号和C-末端锚定信号的源自巴西钳蝎的透明质酸酶(HYAL)的重编码核酸序列。
SEQ ID NO:56是具有N-末端分泌信号和C-末端锚定信号的源自家牛的透明质酸酶(HYAL)的重编码核酸序列。
SEQ ID NO:57是具有N-末端分泌信号和C-末端锚定信号的源自西方蜜蜂的透明质酸酶(HYAL)的重编码核酸序列。
SEQ ID NO:58是具有N-末端分泌信号和C-末端锚定信号的源自野捕恒河猴的透明质酸酶(HYAL)的重编码核酸序列。
SEQ ID NO:59是具有N-末端分泌信号和C-末端锚定信号的源自大胡蜂的透明质酸酶(HYAL)的重编码核酸序列。
SEQ ID NO:60是具有N-末端分泌信号的源自萨氏九杯蛛的透明质酸酶(HYAL)的氨基酸序列。
SEQ ID NO:61是具有N-末端分泌信号的源自巴西钳蝎的透明质酸酶(HYAL)的氨基酸序列。
SEQ ID NO:62是具有N-末端分泌信号的源自家牛的透明质酸酶(HYAL)的氨基酸序列。
SEQ ID NO:63是具有N-末端分泌信号的源自西方蜜蜂的透明质酸酶(HYAL)的氨基酸序列。
SEQ ID NO:64是具有N-末端分泌信号的源自野捕恒河猴的透明质酸酶(HYAL)的氨基酸序列。
SEQ ID NO:65是具有N-末端分泌信号的源自大胡蜂的透明质酸酶(HYAL)的氨基酸序列。
SEQ ID NO:66是具有N-末端分泌信号和C-末端锚定信号的源自萨氏九杯蛛的透明质酸酶(HYAL)的氨基酸序列。
SEQ ID NO:67是具有N-末端分泌信号和C-末端锚定信号的源自巴西钳蝎的透明质酸酶(HYAL)的氨基酸序列。
SEQ ID NO:68是具有N-末端分泌信号和C-末端锚定信号的源自家牛的透明质酸酶(HYAL)的氨基酸序列。
SEQ ID NO:69是具有N-末端分泌信号和C-末端锚定信号的源自西方蜜蜂的透明质酸酶(HYAL)的氨基酸序列。
SEQ ID NO:70是具有N-末端分泌信号和C-末端锚定信号的源自野捕恒河猴的透明质酸酶(HYAL)的氨基酸序列。
SEQ ID NO:71是具有N-末端分泌信号和C-末端锚定信号的源自大胡蜂的透明质酸酶(HYAL)的氨基酸序列。
SEQ ID NO:72是源自酿酒酵母的谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)的核酸序列。
SEQ ID NO:73是源自小球藻属病毒1(PBCV-1)的谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)的重编码核酸序列。
SEQ ID NO:74是源自小球藻属病毒1(PBCV-1)的谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)的重编码核酸序列。
SEQ ID NO:75是源自酿酒酵母的谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)的氨基酸序列。
SEQ ID NO:76是源自小球藻属病毒1(PBCV-1)的谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)的氨基酸序列。
SEQ ID NO:77是源自酿酒酵母的UDP-N-乙酰葡萄糖胺焦磷酸化酶(QRI1)的核酸序列。
SEQ ID NO:78是源自酿酒酵母的UDP-N-乙酰葡萄糖胺焦磷酸化酶(QRI1)的氨基酸序列。
SEQ ID NO:79是源自酿酒酵母的磷酸葡萄糖变位酶-1(PGM1)的核酸序列。
SEQ ID NO:80是源自酿酒酵母的磷酸葡萄糖变位酶-1(PGM1)的氨基酸序列。
SEQ ID NO:81是源自酿酒酵母的UTP-葡萄糖-1-磷酸尿苷酰转移酶(UGP1)的核酸序列。
SEQ ID NO:82是源自酿酒酵母的UTP-葡萄糖-1-磷酸尿苷酰转移酶(UGP1)的氨基酸序列。
SEQ ID NO:83是源自酿酒酵母的葡萄糖胺6-磷酸N-乙酰转移酶(GNA1)的核酸序列。
SEQ ID NO:84是源自酿酒酵母的葡萄糖胺6-磷酸N-乙酰转移酶(GNA1)的氨基酸序列。
SEQ ID NO:85是源自酿酒酵母的磷酸乙酰葡萄糖胺变位酶(PCM1)的核酸序列。
SEQ ID NO:86是源自酿酒酵母的磷酸乙酰葡萄糖胺变位酶(PCM1)的氨基酸序列。
SEQ ID NO:87是启动子pTDH3的核酸序列。
SEQ ID NO:88是启动子pTDH3.Sk的核酸序列。
SEQ ID NO:89是启动子pTDH3-1.sba的核酸序列-1。
SEQ ID NO:90是启动子pTDH3-1.Sar的核酸序列-1。
SEQ ID NO:91是启动子pENO2的核酸序列。
SEQ ID NO:92是启动子pTEF3的核酸序列。
SEQ ID NO:93是启动子pTEF1的核酸序列。
SEQ ID NO:94是启动子pTEF1.Ago的核酸序列。
SEQ ID NO:95是启动子pTEF1.Sba的核酸序列。
SEQ ID NO:96是启动子pPDC1的核酸序列。
SEQ ID NO:97是启动子pCCW12的核酸序列。
SEQ ID NO:98是启动子pCCW12.Sm的核酸序列。
SEQ ID NO:99是启动子pCCW12.Sk的核酸序列。
SEQ ID NO:100是启动子pCCW12.Sba的核酸序列。
SEQ ID NO:101是启动子pCCW12.Sar的核酸序列。
SEQ ID NO:102是启动子pNUP57的核酸序列。
SEQ ID NO:103是启动子pCCW10.Ago的核酸序列。
SEQ ID NO:104是启动子pCWP2的核酸序列。
SEQ ID NO:105是启动子pFBA1的核酸序列。
SEQ ID NO:106是启动子pCCW120.Sm的核酸序列。
SEQ ID NO:107是启动子pCUP1的核酸序列。
SEQ ID NO:108是启动子pMET6的核酸序列。
SEQ ID NO:109是启动子pMET25的核酸序列。
SEQ ID NO:110是启动子pSAM1的核酸序列。
SEQ ID NO:111是终止子tTPI1的核酸序列。
SEQ ID NO:112是终止子tMET25的核酸序列。
SEQ ID NO:113是终止子tDIT1的核酸序列。
SEQ ID NO:114是终止子tRPL3的核酸序列。
SEQ ID NO:115是终止子tRPL3.Sm的核酸序列。
SEQ ID NO:116是终止子tRPL3.sba的核酸序列。
SEQ ID NO:117是终止子tRPL41B的核酸序列。
SEQ ID NO:118是终止子tRPL41B.Sba的核酸序列。
SEQ ID NO:1119是终止子tRPL15A的核酸序列。
SEQ ID NO:120是终止子tRPL15A.Sm的核酸序列。
SEQ ID NO:121是终止子tRPL15A.sba的核酸序列。
SEQ ID NO:122是终止子tIDP1的核酸序列。
SEQ ID NO:123是终止子tIDP1.Sba的核酸序列。
SEQ ID NO:124是终止子tTEF1.sba的核酸序列。
SEQ ID NO:125是在5’添加的分泌序列的核酸序列。
SEQ ID NO:126是在N末端添加的分泌序列的氨基酸序列。
SEQ ID NO:127是在3’添加的锚定序列的核酸序列。
SEQ ID NO:128是C末端添加的锚定序列的氨基酸序列。
本发明的详细描述
本发明人设想了经遗传修饰的细胞、并且尤其是经遗传修饰的酵母,与亲本细胞相比并且尤其是与天然不能产生软骨素的亲本酵母相比,其具有生产软骨素的能力。
这些经遗传修饰的细胞在本说明书全文中进行了描述。
定义
术语“软骨素”是一种经由交替的β-(1→4)和β-(1→3)糖苷键(β-葡萄糖醛酸-(1→3)-N-乙酰-β-半乳糖胺-4-硫酸盐-(1→4)的交替聚合物)连接并具有化学式(C14H21NO11)n的N-乙酰半乳糖胺和葡萄糖醛酸的多糖。
如本文所用的术语“软骨素”意在涵盖软骨素及其衍生物,其包括但不限于硫酸软骨素,可用于美容品、调产品、香料产品、食品、食物、饮料、食品定形剂、药物组合物、膳食补充剂、营养制品、清洁产品和/或牙科和/或口腔卫生组合物或其组合的应用。
硫酸软骨素包括但不限于软骨素-4-硫酸盐(Chondroitin-4-sulfate)、软骨素-6-硫酸盐、软骨素-2,6-硫酸盐、软骨素-4,6-硫酸盐和/或其混合物。
软骨素-4-硫酸盐的硫酸化位点是N-乙酰半乳糖胺(GalNAc)糖的碳4。
软骨素-6-硫酸盐的硫酸化位点是GalNAc糖的碳6。
软骨素-2,6-硫酸盐的硫酸化位点是葡萄糖醛酸的碳2和GalNAc糖的碳6。
软骨素-4,6-硫酸盐的硫酸化位点是GalNAc糖的碳4和6。
软骨素衍生物、例如硫酸软骨素可用于减轻以下的风险,减少、预防和/或治疗以下:骨关节炎、软骨退化和骨关节炎相关的关节疼痛、压痛和/或肿胀。
特别地,软骨素衍生物、例如硫酸软骨素可用于减轻以下的风险,减少、预防和/或治疗以下:骨关节炎、骨关节炎相关的关节疼痛、关节压痛和关节肿胀;关节退行性变;和/或软骨退化。
软骨素、特别是硫酸软骨素可以单独使用或与葡萄糖胺一起作为膳食补充剂用于治疗骨关节炎;骨关节炎相关的关节疼痛、关节压痛和关节肿胀;关节退行性变;和/或软骨退化。
软骨素、特别是硫酸软骨素可以制备为组合物。
软骨素衍生物可以通过适当的化学或酶促步骤由软骨素制备。
软骨素可以在重组细胞中生产。
如本文所用,术语“重组”,当用于指代细胞时,表示该细胞已通过将内源和/或异源核酸或蛋白质引入细胞中或改变天然细胞,或该细胞源自如此修饰的细胞。因此,例如,重组细胞表达在细胞的天然(非重组)形式中未发现的基因或核酸,或以与其天然水平不同的水平表达天然(例如内源)基因,或以与其天然水平不同的水平表达天然(例如内源的)的额外或补充拷贝。
如本文所用,术语“重组”当用于指核酸或载体时,是通过本领域技术人员熟知的遗传工程化技术形成/获得的序列。美国国家卫生研究院(NIH)的指南相应指出:
“重组[…]核酸如下定义:
i.(a)由连接核酸分子构建,和(b)可以在活细胞中复制的分子,即重组核酸;”,
这反映了附加到核酸序列的词语“重组”的常规使用,意指在插入另一核酸或与另一核酸连接在一起之后重组。
由重组DNA或重组载体在活细胞内表达而产生的蛋白质也称为重组蛋白。
因此,术语“重组”与术语“遗传修饰”同义。术语“基因”与术语“核酸”或“核苷酸序列”同义。
用于本发明的重组细胞并且特别是重组酵母的重组核酸序列可以以核酸构建体的形式提供。术语“核酸构建体”是指单链或双链的核酸分子,其经分离或源自天然(例如内源)天然存在的基因或是异源核酸,或者已被修饰为含有以自然界中不以其他方式存在的方式组合和并置的核酸片段。当核酸构建体含有表达编码序列所需的一个或多个调控元件时,术语“核酸构建体”与术语“表达盒”或“异源核酸表达盒”同义,其中所述控制序列可操作地连接至所述编码序列。调控元件的非限制性实例包括启动子、增强子、沉默子、终止子和聚-A信号。
用于本发明的重组细胞的重组核酸序列可以以表达载体的形式提供,其中多核苷酸序列可操作地连接至至少一个用于在重组细胞中表达多核苷酸序列的控制序列。
术语“获自”或“源自(originate from)”或“源自(originating from)”微生物或动物一般意指源自微生物体或动物的物质(例如,核酸分子或多肽)是该微生物或动物天然的。
术语“源自”微生物体或动物一般意指源自微生物体或动物的物质(例如,核酸分子或多肽)是对该微生物体或动物中天然的(即本身存在的)物质进行修饰的结果。例如,关于源自微生物或动物的核酸序列,所述核酸序列可以对应于来自该微生物体或动物的天然核酸序列的重编码和/或截短版本。可以对微生物或动物的天然物质进行本领域技术人员熟知的其他修饰,从而导致所使用的物质“源自”所述微生物体或动物。
如本文所用,术语“多肽”是指包含通过肽键连接的氨基酸残基并且含有多于五个氨基酸残基的分子。氨基酸通过单字母或三字母名称来识别。如本文所用的术语“蛋白质”与术语“多肽”同义,并且也可以指两种或多种多肽。因此,术语“蛋白质”、“肽”和“多肽”可以互换使用。多肽可以任选地被修饰(例如,糖基化、磷酸化、酰化、法呢基化、异戊二烯化、磺化等)以添加功能性。表现出活性的多肽可称为酶。应理解,由于遗传密码的简并性,可以产生编码给定多肽的大量核苷酸序列。
由用于本发明的重组细胞并且特别是重组酵母的重组核酸编码的多肽可以包含信号肽和/或前肽序列。在由本发明的重组细胞、特别是重组酵母表达的多肽包含信号肽和/或前肽的情况下,可以在成熟多肽序列上计算序列同一性。
如本文使用的术语“可操作地连接”是指两个或更多个核酸序列元件物理连接并且彼此处于功能关系。例如,如果启动子能够启动或调控编码序列的转录或表达,则启动子可操作地连接至编码序列,在这种情况下,编码序列应理解为“在启动子的控制下”。一般而言,当两条核酸序列可操作地连接时,它们将处于相同的取向并且通常也在相同的阅读框中。它们通常基本上是连续的,尽管这可能不是必需的。
如本文所用的术语“天然”或“内源”就分子而言并且特别是酶和核酸,表示在它们起源或在自然界中发现的生物体中表达的分子。
术语“内源基因”意指在任何遗传修饰之前,该基因存在于野生型菌株的细胞中。内源基因可以通过引入异源序列以补充内源调控元件或替代内源调控元件,或者通过将基因的一个或多个额外或补充拷贝引入染色体或质粒中来过表达(所述额外或补充拷贝被指定为如本文所定义的“外源或异源基因”或“异源核苷酸序列”或“异源核酸”)。还可以修饰内源基因以调节它们的表达和/或活性。例如,可将突变引入编码序列以修饰基因产物,或者可引入异源序列补充内源调控元件,或替代内源性调控元件。内源基因的调节可以导致基因产物活性的上调和/或增强,或者替选地,导致内源基因产物活性的下调和/或减弱。增强内源基因表达的另一种方法是将基因的一个或多个附加或补充拷贝引入染色体或质粒上(所述补充拷贝为如下文所定义的“外源或异源基因”或“异源核苷酸序列”或异源核酸)。
对于根据本发明的“基因的一个或多个附加或补充拷贝”,在本发明中被理解为例如1至50个拷贝,特别是1至30个拷贝,更特别是1至20个拷贝,并且优选1至10个拷贝。所述拷贝可以插入到本发明的重组细胞的相同基因座或不同基因座中。
术语“外源性基因”意指通过本领域技术人员熟知的方式将基因引入细胞中,而该基因天然存在于或不天然存在于野生型细胞中。如果将外源基因连同允许其在细胞中表达的所有元件一起引入细胞,则细胞可以表达这些基因。用外源DNA转化细胞是本领域技术人员的常规任务。外源基因可以整合到宿主染色体中,或者从质粒或载体在染色体外表达。多种质粒在其复制起点和其在细胞中的拷贝数方面有所不同,都是本领域已知的。外源基因的序列可以适应其在细胞中的表达。事实上,本领域技术人员知道密码子使用偏倚的概念以及如何在不修改推导的蛋白质的情况下使核酸序列适应特别的密码子使用偏倚。在特别的实施方式中,密码子优化的基因表达天然酶。
术语“异源基因”或“异源核酸序列”是指自然界中给定细胞中通常不存在的基因或核酸序列。因此,异源核酸序列可以是:(a)对于其宿主细胞是外源的(即对于细胞来说是“外源的”);(b)天然存在于宿主细胞(即“内源的”)中但在细胞中以非天然量存在(即,比宿主细胞中天然存在更多或更少的量);或(c)天然存在于宿主细胞中,但位于其天然基因座之外。
在本申请中,所有基因都以它们的通用名称和它们的核苷酸序列以及在出现的情况下它们的氨基酸序列来提及。使用已知基因的登录号中给出的参考文献,本领域技术人员能够确定其他生物体、细菌菌株、酵母、真菌、哺乳动物、植物等中的等效基因。该常规工作有利地使用共有序列来完成,其可以通过与来源于其他细胞的基因进行序列比对并设计简并探针以在另一个生物体中克隆相应基因来确定。
本领域技术人员知道调节并且特别是上调或下调内源基因表达的不同方法。例如,增强内源基因表达或过表达的一种方法是将基因的一个或多个附加或补充拷贝引入染色体或质粒上。
另一种方法是用更强的启动子替换基因的内源启动子。这些启动子可以是同源的或异源的。本发明中特别感兴趣的启动子在本说明书的其他地方进行了更详细的描述。
核酸表达构建体还可包含5’和/或3’识别序列和/或选择标记。
术语“诱导型启动子”用于限定其活性被诱导(即增加)的启动子:
-在一种或多种特别的代谢物的存在下。培养基中代谢物浓度越高,启动子活性越强;或
-在存在低浓度或不存在一种或多种代谢物的情况下。这些代谢物不同于那些其增加的存在诱导启动子活性的代谢物。培养基中代谢物浓度越低,启动子活性越强。
术语“阻遏型启动子”用于限定其活性被阻遏(即减少)的启动子:
-在一种或多种特别的代谢物的存在下。培养基中代谢物浓度越高,启动子活性越弱;或
-在存在低浓度或不存在一种或多种代谢物的情况下。这些代谢物不同于那些其增加的存在阻遏子活性的代谢物。培养基中代谢物浓度越低,启动子活性越弱。
如本文所用,术语“锚定信号”当与蛋白质或多肽例如酶(例如透明质酸酶)结合使用时,意指例如可操作地连接至编码蛋白质或多肽的第二核酸的编码蛋白质的第一核酸,或可操作地连接至第二蛋白或多肽的第一蛋白或多肽、例如酶(例如透明质酸酶以形成例如融合蛋白),并且使得细胞(特别是酿酒酵母细胞)的细胞转运机制能够将可操作地连接至第一蛋白的第二蛋白正确锚定和/或定位在细胞的膜内。
如本文所用,术语“分泌信号”当与蛋白质或多肽、例如酶(例如透明质酸酶)联合使用时,意指例如可操作地连接至编码蛋白质的第二核酸的编码肽或蛋白质的第一核酸,或连接至第二蛋白的第一蛋白、例如酶(例如透明质酸酶以形成例如融合蛋白),并且使得细胞(特别是酿酒酵母细胞)的细胞转运机制能够将至少第二蛋白质定位至细胞膜,并且在例如第一蛋白质已从第二蛋白质裂解之后将第二蛋白质分泌到细胞外。
如本文所用,术语“分泌信号”和“锚定信号”当与蛋白质或多肽、例如酶(例如透明质酸酶)结合使用时,意指例如可操作地连接至编码蛋白质的第二核酸的编码肽或蛋白质的第一核酸,或可操作地连接至第二蛋白的第一蛋白、例如酶(例如透明质酸酶),并且使得细胞(特别是酿酒酵母细胞)的细胞转运机制能够将至少第二蛋白定位至细胞膜,其中如果第二蛋白还可操作地连接至“锚定信号”,则第二蛋白不分泌但保留附着至细胞膜。在一些情况下,分泌-锚定信号可以提供双重分泌信号和锚定信号功能。
分泌信号和锚定信号的序列,用于异源蛋白、例如细胞(例如酵母细胞)表面上的酶(例如透明质酸酶)的表达、锚定和/或分泌的方法是本领域众所周知的(参见例如,Ast等人(2013)Cell 152:1134-1145,Ast和Schuldiner(2013)Crit Rev Biochem Mol Biol 48(3)273-288,Van der Vaart等人(1997)Applied Environmental Microbiology 63(2)615-620并且这些出版物中每一篇的全部内容通过引用并入本文)。酶的“活性”与术语“功能”可互换使用,并且在本发明的上下文中,表示酶催化所想要反应的能力。宿主细胞中酶的量可以通过修饰编码酶的基因的转录来改变。这可以例如通过修饰编码酶的核苷酸序列的拷贝数来实现(例如,通过使用包含核苷酸序列的更高或更低拷贝数的表达载体,或通过将核苷酸序列的附加拷贝引入宿主细胞的基因组中,或通过缺失或破坏宿主细胞的基因组中的核苷酸序列),通过改变操纵子的多顺反子mRNA上的编码序列的顺序或将操纵子分解成单独的基因(每个基因具有其自己的控制元件),或通过增加与核苷酸序列可操作地连接的启动子或操纵子的强度。
替选地或另外,可以通过改变编码酶的mRNA的翻译水平来改变宿主细胞中酶的拷贝数。这可以通过例如修饰mRNA的稳定性、修饰核糖体结合位点的序列、修饰核糖体结合位点与酶编码序列的起始密码子之间的距离或序列、修饰位于酶编码区的起始密码子的5’侧上游或附近的整个顺反子间区域、使用发夹和特殊序列来稳定mRNA转录本的3’-端、修改酶的密码子使用、改变酶的生物合成中所用稀有密码子tRNA的表达,和/或增加酶的稳定性(例如经由其编码序列的突变)来实现。
宿主细胞中酶的活性可以通过多种方式改变,包括但不限于表达在宿主细胞中表现出增加或降低的溶解度的修饰形式的酶,表达缺乏结构域(通过其酶活性得以抑制)的改变形式的酶,表达对底物具有更高或更低的Kcat或更低或更高的Km的修饰形式的酶,或者表达受到途径中另一个分子的反馈或前馈调节的或多或少影响的改变形式的酶。术语“编码(encoding)”或“编码(coding for)”是指多核苷酸通过转录和翻译机制产生氨基酸序列的过程。
编码本发明所考虑的一种或多种酶的一种或多种基因可以是外源的或内源的。
本发明中实施的方法优选需要使用一种或多种染色体整合构建体,用于将异源核苷酸序列稳定引入染色体上的特定位置,或用于功能性破坏遗传修饰细胞中的一种或多种靶基因。在一些实施方式中,靶基因的破坏阻止相关功能蛋白的表达。在一些实施方式中,靶基因的破坏导致被破坏的基因表达无功能的蛋白质。
可以在本发明的实践中改变的染色体整合构建体的参数包括但不限于:同源序列的长度;同源序列的核苷酸序列;整合序列的长度;整合序列的核苷酸序列;以及靶基因座的核苷酸序列。在一些实施方式中,每条同源序列的长度的有效范围为20至5,000个碱基对,优选地50至100个碱基对。在具体的实施方式中,每个同源序列的长度为约50个碱基对。有关基因靶标所需同源长度的更多信息,请参见D.Burke等人,Methods in yeastGenetics-A cold spring harbor laboratory course Manual(2000)。
在一些实施方式中,(a)其中意欲插入一种或多种上述DNA构建体的一种或多种破坏的基因可以有利地包含可用于选择转化细胞的一种或多种可选择标记。优选地,所述一种或多种可选标记包含在根据本发明的一种或多种DNA构建体中。
在一些实施方式中,可选择标记是抗生素抗性标记。抗生素抗性标记的说明性实例包括但不限于NAT1、AURl-C、HPH、DSDA、KAN<R>和SH BLE基因产物。来自诺尔斯链霉菌(S.noursei)的NAT 1基因产物赋予对诺尔丝菌素的抗性;来自酿酒酵母的AURl-C基因产物赋予对金担子素A(AbA)的抗性;肺炎克雷伯菌(Klebsiella pneumoniae)的HPH基因产物赋予对潮霉素B的抗性;大肠埃希菌的DSDA基因产物允许在以D-丝氨酸为唯一氮源的板上生长;Tn903转座子的KAN<R>基因赋予对G418的抗性;和来自印度斯坦链异壁菌(Streptoalloteichus hindustanus)的SH BLE基因产物赋予对吉欧霉素(博莱霉素)的抗性。
在一些实施方式中,在分离本发明的经遗传修饰细胞后缺失抗生素抗性标记。本领域技术人员能够在特定的遗传背景下选择合适的标记。
在具体的实施方式中,根据本发明的重组细胞缺乏任何抗生素抗性标记。这有利地避免了在选择培养基中添加抗生素的必要性。
在一些实施方式中,可选择标记拯救遗传修饰细胞中的营养缺陷(例如,营养性营养缺陷)。在此类实施方式中,亲本细胞并且特别是亲本酵母,包含在氨基酸或核苷酸生物合成途径中起作用的一种或多种基因产物的功能破坏,例如酵母中的HIS3、LEU2、LYS1、LYS2、MET15、TRP1、ADE2和URA3基因产物,这使得亲本细胞无法在不补充一种或多种营养素的情况下在培养基中生长(营养缺陷型表型)。然后可以通过用编码被破坏的基因产物的功能性拷贝的染色体整合转化亲本细胞来拯救营养缺陷型表型(在一些实施方式中,基因的功能性拷贝可以源自相近的物种,例如克鲁维酵母属、念珠菌属等),并且可以根据亲本细胞的营养缺陷型表型的丧失来选择所产生的遗传修饰细胞。
对于包含启动子序列、编码序列(例如编码序列的酶)或终止子序列的核酸序列中的每一个,参考序列在本文中描述。本说明书还涵盖与参考核酸序列具有特定百分比的核酸同一性的核酸序列。
对于每个或目标氨基酸序列,本文描述了参考序列。本说明书还涵盖了与参考氨基酸序列具有特定百分比的氨基酸同一性的氨基酸序列(例如酶氨基酸序列)。
由于明显的原因,在本说明书全文中,分别符合所考虑的核苷酸或氨基酸同一性的特定核酸序列或特定的氨基酸序列应当进一步导致获得显示出所想要生物活性的蛋白质(或酶)。如本文所用,两条核酸序列之间或两条氨基酸序列之间的“同一性百分比”通过通过比较窗口比较两个最佳比对的序列来确定。
因此,与参考序列(其不包括这些添加或这些缺失)相比,比较窗口中的核苷酸或氨基酸序列的部分可以包括添加或缺失(例如“空位”),以获得两条序列之间的最佳比对。
术语“序列同源性”或“序列同一性”或“同源性”或“同一性”在本文中可互换使用。为了本发明的目的,这里定义为了确定两条氨基酸序列或两条核酸序列的序列同源性或序列同一性的百分比,为了最佳比较的目的而对序列进行比对。为了优化两条序列之间的比对,可以在所比较的两条序列中的任一个中引入空位。这种比对可以在被比较的序列的全长上进行。替选地,比对可以在较短的长度上进行,例如在约20、约50、约100或更多个核酸/碱基或氨基酸上进行。序列同一性是两条序列在报告的比对区域中相同匹配的百分比。序列的比较和两条序列之间序列同一性百分比的确定可以使用数学算法来完成。技术人员将意识到以下事实:可使用几种不同的计算机程序来比对两条序列并确定两条序列之间的同一性(Kruskal,J.B.(1983)An overview of sequence comparison In D.Sankoff和J.B.Kruskal,(编辑),Time warps,string edits and macromolecules:the theory andpractice of sequence comparison,第1-44页Addison Wesley)。
两条氨基酸序列之间或两条核苷酸序列之间的序列同一性百分比可以使用用于两条序列比对的Needleman和Wunsch算法来确定。(Needleman,S.B.和Wunsch,C.D.(1970)J.Mol.Biol.48,443-453)。氨基酸序列和核苷酸序列都可以通过该算法进行比对。Needleman-Wunsch算法已在计算机程序NEEDLE中实现。
对于本发明的目的,使用来自EMBOSS包的NEEDLE程序(2.8.0版本或更高版本,EMBOSS:The European Molecular Biology Open Software Suite(2000)Rice,P.LongdenJ.和Bleasby,A.Trends in Genetics 16,(6)第276—277页,http://emboss.bioinformatics.nl/)。对于蛋白序列,EBLOSUM62用于替换矩阵。对于核苷酸序列,使用EDNAFULL。使用的任选参数是空位开放罚分10和空位延伸罚分0.5。不添加末端空位罚分。在输出部分中,响应于指示为输出比对格式的问题“简要同一性和相似性”和“SRS成对”被指示“是”。
在通过如上所述的程序NEEDLE比对之后,查询序列和本发明的序列之间的序列同一性百分比计算如下:比对中显示两条序列中相同氨基酸或相同核苷酸的相应位置的数量除以比对总长度(减去比对中的总空位数后)。如本文定义的同一性可以通过使用NOBRIEF选项从NEEDLE获得,并在程序的输出中标记为“最长-同一性”。
核苷酸和氨基酸序列的相似性,即序列同一性的百分比,可以经由使用几种其他本领域已知的算法的序列比对来确定,优选地用Karlin和Altschul的数学算法(Karlin&Altschul(1993)Proc.Natl.Acad.Sci.USA90:5873-5877)、用hmmalign(HMMER包,http://hmmer.wustl.edu/)或用CLUSTAL算法(Thompson,J.D.,Higgins,D.G.&Gibson,T.J.(1994)Nucleic Acids Res.22,4673-80)(可在例如在https://www.ebi.ac.uk/Tools/msa/clustalo/上获得),或GAP程序(爱荷华大学的数学算法),或Myers和Miller的数学算法(1989-Cabios 4:11-17)或Clone Manager 9。所用的优选参数是如在https://www.ebi.ac.uk/Tools/msa/clustalo/上设置的默认参数。
序列同一性(序列匹配)的级别可使用例如BLAST、BLAT或BlastZ(或BlastX)来计算。将类似算法并入Altschul等人(1990)J.Mol.Biol.215,403-410的BLASTN和BLASTP程序。使用BLASTN程序,评分=100,字长=12进行BLAST多核苷酸搜索,以获得与编码相关蛋白质的那些核酸同源的多核苷酸序列。
使用BLASTP程序,评分=50,字长=3进行BLAST蛋白搜索,以获得与SHC多肽同源的氨基酸序列。为了获得用于比较目的的缺口比对,如Altschul等人(1997)Nucleic AcidsRes中所述,使用Gapped BLAST。当使用BLAST和Gapped BLAST程序时,使用各个程序的默认参数。序列匹配分析可以通过已建立的同源作图技术来补充,如Shuffle-LAGAN(BrudnoM.,Bioinformatics 2003b,19Suppl 1:154-162)或马尔可夫随机场。当在本申请中提及序列同一性的百分比时,如果没有另外特别说明,则这些百分比是相对于较长序列的全长来计算的。
在具体的实施方式中,使用CLUSTAL O(1.2.4版)确定两条序列之间的同一性%。
“发酵”或“培养”通常在具有适合于培养细胞的含至少一种简单碳源并且如果必需则共底物的适当培养基的发酵罐中进行。
术语“发酵组合物”是指包含遗传修饰的宿主细胞和由遗传修饰的宿主细胞产生的产物或代谢物的组合物。发酵组合物的实例是全细胞培养液,其可以是容器(例如烧瓶、板或发酵罐)的全部内容物,包括细胞、水相和由遗传修饰的宿主细胞产生的化合物。
术语“培养基”是指培养基(culture medium)或培养基(cultivation medium)或发酵培养基。
为了最大限度地生产软骨素,用作生产宿主的重组细胞优选具有高碳水化合物利用率。这些特征可以通过诱变和选择、遗传工程化赋予的,或可以是天然的。本发明细胞的发酵培养基或“培养基”或“培养基”可含有至少约10g/L的葡萄糖和/或蔗糖。另外的碳底物可以包括但不限于单糖,例如果糖、甘露糖、木糖和阿拉伯糖;寡聚糖,例如乳糖、麦芽糖、半乳糖或蔗糖;多糖,例如淀粉或纤维素或其混合物,以及来自可再生原料的未纯化混合物,例如奶酪乳清渗透玉米浆、甜菜糖蜜和大麦麦芽。其他碳底物可以包括甘油、乙酸盐和/或乙醇。
因此,预期本发明中使用的碳源可以涵盖多种含碳底物并且仅受细胞并且特别是酵母的选择限制。
尽管预期所有上述碳底物及其混合物都适用于本发明,但对于细胞而言,优选的碳底物是葡萄糖、果糖和蔗糖,或这些与C5糖例如木糖和/或阿拉伯糖的混合物,并且特别是酵母,被修饰以使用C5糖,并且更特别是葡萄糖。
优选的碳底物是葡萄糖或蔗糖。
除了适当的碳源之外,发酵培养基还可含有本领域技术人员已知的合适的矿物质、盐、辅因子、缓冲剂和其他组分,其适用于培养物的生长和促进生产所想要产品所必需的酶促途径。
除此之外,可以考虑适合于根据本发明的重组细胞生长的额外遗传修饰。
术语“需氧条件”是指培养基中的氧浓度足以使需氧或兼性厌氧细胞并且特别是酵母使用双氧作为末端电子受体。
“微好氧条件”是指氧气浓度低于空气中的浓度(即氧气浓度至多6% O2)的培养基。
“适当的培养基”表示包含对细胞的维持和/或生长必需的或有益的营养物的培养基(例如无菌液体培养基),所述营养物例如碳源或碳底物、氮源例如蛋白胨、酵母提取物、肉类提取物、麦芽提取物、尿素、硫酸铵、氯化铵、硝酸铵和磷酸铵;磷源,例如磷酸二氢钾或磷酸氢二钾;微量元素(例如金属盐),例如镁盐、钴盐和/或锰盐;以及生长因子例如氨基酸、维生素、生长促进剂等。根据本发明的术语“碳源”或“碳底物”或“碳来源”表示本领域技术人员可以使用以支持细胞正常生长的任何碳源,包括己糖(例如葡萄糖、半乳糖或乳糖)、戊糖、单糖、寡糖、二糖(例如蔗糖、纤维二糖或麦芽糖)、糖蜜、淀粉或其衍生物、纤维素、半纤维素及其组合。
特别适合生产本发明的重组细胞并且特别是本发明的重组酵母的培养基在下文中进一步描述。本发明的软骨素的“受控”分子量意在指代至少80%、特别是至少85%的通过本发明的方法生产的软骨素具有通过调节本发明的方法和/或重组细胞的至少一个参数来包含在某个预定分子量范围内的分子量,所述参数例如:
-重组细胞的编码具有软骨素酶活性的多肽的核酸的性质和来源,
-控制重组细胞的编码具有软骨素酶活性的多肽的核酸的表达的启动子的性质和来源,
-重组细胞的与具有软骨素酶活性的多肽相关的锚定信号和/或分泌信号的存在,
-培养重组细胞的步骤期间的培养基的pH,和/或
-培养重组细胞的持续时间。
如本文所用,术语“约”是指如有技术人员所确定的围绕值的合理范围。在某些实施方式中,术语约是指±一个、两个或三个标准偏差。在某些实施方式中,术语约是指±5%、10%、20%或25%。在某些实施方式中,术语约是指±0.1、0.2或0.3对数单位,例如pH单位。
根据本发明引入的遗传修饰的一般特征
-根据已知的遗传工程化技术,将所有基因组修饰插入重组细胞,并且特别是重组酵母中:
-引入到根据本发明的重组细胞基因组中的基因构建体中包含的连续核酸序列具有以下结构:
Prom1-ORF1-term1-ORF2-gene2-term2-…/…-Promn-ORFn-termn,其中:
-Prom1是调控编码序列ORF1的表达的序列,
-ORF1是编码所想要蛋白质PROT1且尤其是所想要酶PROT1的核酸序列,
-Term1是转录终止子序列,它通过在新合成的mRNA中提供信号来介导转录终止,该信号触发从转录复合物中释放mRNA的过程,并且
-“1”、“2”、…/…“n”可描述或可不描述相同的ORF(开放阅读框)、启动子或终止子。核酸序列的顺序并不重要。“n”是一个整数,通常在5到20之间。这些构建体被插入重组细胞染色体之一的受控位置中。在一些实施方式中,插入位点对于所插入的构建体的功能性和所得到的遗传修饰细胞的存活力都不是必需的。
如本领域技术人员将理解的,修饰编码序列以增强其在具体宿主中的表达可能是有利的。遗传密码冗余64个可能密码子,但大多数生物体通常使用这些密码子的子集。在一个物种中最常使用的密码子称为最佳密码子,而那些不经常使用的密码子被归类为稀有或低使用密码子。密码子可以在有时称为“密码子优化”或“控制物种密码子偏倚”的过程中,被替换以反映宿主的优选密码子使用。其他宿主细胞的密码子优化可以使用密码子使用表轻松确定,或可以使用可商够获得的软件进行,例如来自Integrated DNA Technologies的CodonOp(www.idtdna.com/CodonOptfrom)。可以制备含有特别的原核或真核宿主优选的密码子的优化编码序列(Murray等人,1989,Nucl Acids Res.17:477-508),以例如增加翻译速率或产生具有所需特征的重组RNA转录物,例如与非优化序列产生的转录本相比更长的半衰期。翻译终止密码子也可以被修饰以反映宿主偏好。例如,酿酒酵母和哺乳动物的典型终止密码子分别是UAA和UGA。单子叶植物的典型终止密码子是UGA,而昆虫和大肠埃希菌通常使用UAA作为终止密码子(Dalphin等人,1996,Nucl Acids Res.24:216-8)。
-当重组细胞是酵母细胞并且特别是酿酒酵母酵母细胞时,引入酵母基因组中并且源自除酿酒酵母之外的其他生物体的核酸序列通常是“转码的”(通常是“密码子优化的”),这意味着这些核酸序列是用在酿酒酵母中表达的最佳密码子使用合成的。来自酿酒酵母的一些核酸序列的核苷酸序列(而非蛋白质序列)也已被修饰(“转码”)以最小化与所述基因的内源拷贝的重组。
-可以通过细胞遗传工程化中使用的标准程序缺失基因。在一些实施方式中,可以通过插入上述基因构建体之一来中断靶向缺失的基因,或者替选地,靶向缺失的基因被短核苷酸片段替代。
-通过缺失核酸序列的内源拷贝(如果必需)并将ORF的新拷贝置于诱导型或抑制型启动子的控制下,可以使核酸序列成为“诱导型或抑制型”。诱导型或阻遏型启动子是其活性根据环境条件或外部刺激的变化而被调节或控制(即增加或减少)的启动子。诱导或阻遏可以是人工控制的,其涵盖非生物因素的诱导或阻遏,例如目标细胞并且特别是酵母中天然未存在的化学化合物、光、氧水平、热或冷。诱导型或阻遏型启动子的列表和序列在本说明书的其他地方描述。
根据本发明的重组细胞
发明人设想了具有生产软骨素的能力的重组细胞,特别是重组酵母。
本发明涉及具有生产软骨素的能力的重组细胞并且特别是重组酵母,并且其中这种生产软骨素的能力是通过经由遗传工程化方法已引入其基因组中的多个改变而获得的。
本发明涉及一种生产软骨素的重组酵母细胞,其中重组细胞包含:
(a)编码具有软骨素合酶(HCOS)活性的多肽的一种或多种重组核酸;
(b)编码具有UDP-葡萄糖脱氢酶(UDP-GlcDH或HASB)活性的多肽的一种或多种重组核酸;和
(c)编码具有UDP-葡萄糖-4-差向异构酶(kfoA或GNE1)活性的多肽的一种或多种重组核酸。
本发明还涉及一种生产软骨素的重组宿主细胞,其中所述重组宿主细胞包含:
(a)编码具有软骨素合酶(HCOS)活性的多肽的一种或多种重组核酸;
(b)编码具有UDP-葡萄糖脱氢酶(UDP-GlcDH或HASB)活性的多肽的一种或多种重组核酸;
(c)编码具有UDP-葡萄糖-4-差向异构酶(kfoA或GNE1)活性的多肽的一种或多种重组核酸;和
(d)编码具有软骨素酶活性的多肽的一种或多种重组核酸,其中具有软骨素酶活性的多肽包含分泌信号和任选的锚定信号,使得软骨素、特别是具有所想要分子量的软骨素由宿主细胞生产。
本发明人已经发现,通过在这些细胞的基因组中引入多个遗传改变,可以达到由细胞并且特别是酵母细胞生产软骨素的能力。
本发明的细胞并且特别是本发明的酵母细胞生产软骨素,通过优化UDP-葡萄糖和UDP-N-乙酰-葡萄糖胺的内源代谢来实现,并且主要指导随后的人工修饰的代谢途径朝向软骨素生产,同时保持所得遗传修饰的细胞的最佳存活力。
已经确定,由根据本发明的重组细胞进行的软骨素生产可以通过增加葡萄糖-6-磷酸转化为以下相继中间代谢物来增加:(i)葡萄糖-1-磷酸、UDP-葡萄糖、UDP-葡萄糖醛酸/盐(UDP-glucuronate)和软骨素,或(ii)果糖-6-磷酸、葡萄糖胺-6-磷酸、N-乙酰-葡萄糖胺-6-磷酸、N-乙酰-葡萄糖胺-1-磷酸、UDP-N-乙酰-葡萄糖胺、UDP-N-乙酰-半乳糖胺和软骨素,同时保持平衡使所得重组细胞具有良好的存活力。
事实上,为了获得本发明的有存活力的重组细胞,测试了许多不同的构建体以获得有存活力且有效的重组细胞,并且特别是有存活力的重组酵母。特别地,此类重组酵母是难以获得的,因为一些中间体的暂时积累似乎对酵母有毒。
在建立适用于制备能够生产软骨素并且特别是生产具有受控分子量的软骨素的重组细胞的条件时遇到了意想不到的技术困难。
事实上,经过大量研究和实验试验,发明人发现可以培养重组细胞并且特别是重组酵母细胞,更特别是重组酿酒酵母酵母细胞,其能够生产具有受控分子量(使用以下参数控制)的软骨素:
-本发明的重组细胞、特别是重组酵母的具有软骨素酶活性的多肽的核酸序列的性质和来源的选择;和/或
-控制本发明的重组细胞的编码具有软骨素酶活性的多肽的核酸序列的表达的启动子的性质和来源;和/或
-除了分泌信号之外,与根据本发明的重组细胞、特别是重组酵母的具有软骨素酶活性的编码多肽相关的任选存在的锚定信号;和/或
-在培养根据本发明的重组细胞、特别是重组酵母的步骤期间培养基的pH;和/或
-培养根据本发明的重组细胞、特别是重组酵母的持续时间。
据发明人所知,这是以前从未实现过的。
本发明的重组细胞中编码具有软骨素酶活性的多肽的核酸可获自或源自萨氏九杯蛛、巴西钳蝎、家牛、大胡蜂、野捕恒河猴或西方蜜蜂中的至少一者,并优选来自巴西钳蝎。
软骨素的分子量可以在小于50kDa的范围内,优选在约20kDa至约50kDa的范围内。
替选地,软骨素的分子量可以在大于50kDa的范围内,优选在约50kDa至约250kDa的范围内。
在另一个替选方案中,软骨素的分子量可以在大于100kDa的范围内,优选在约100kDa至约1500kDa的范围内。
编码具有UDP-葡萄糖脱氢酶(UDP-GlcDH或HASB)活性的多肽的核酸可获自或源自以下中的至少一者:拟南芥、小球藻属病毒PBCV1或兽瘟链球菌,并且可以特别获自或源自拟南芥或小球藻属病毒PBCV1。
编码具有软骨素合酶(HCOS)活性的多肽的核酸可以是
(i)编码软骨素合酶的核酸;或
(ii)编码具有软骨素合酶活性的嵌合多肽的核酸。
这些核酸可获自或源自以下中的至少一者:多杀巴斯德菌、小球藻属病毒PBCV1、结核分枝杆菌、智人、大肠埃希氏菌、酿酒酵母或草酸青霉。
所述编码具有UDP-葡萄糖-4-差向异构酶(kfoA或GNE1)活性的多肽的核酸可获自或源自细菌,并且特别是来自选自由以下组成的组的细菌:铜绿假单胞菌、多杀巴斯德菌和大肠埃希氏菌。
重组细胞还可包含编码以下中的一者或多者的至少一种重组核酸:
(i)具有谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)活性的多肽;和/或
(ii)具有UDP-N-乙酰葡萄糖胺焦磷酸化酶(QRI1)活性的多肽。
重组细胞还可包含编码以下中的一者或多者的至少一种重组核酸:
(i)具有磷酸葡萄糖变位酶-1(PGM1)活性的多肽;和/或
(ii)具有UTP-葡萄糖-1-磷酸尿苷酰转移酶(UGP1)活性的多肽;和/或
(iii)具有葡萄糖胺-6-磷酸N-乙酰转移酶(GNA1)活性的多肽;和/或
(iv)具有磷酸乙酰葡萄糖胺变位酶(PCM1)活性的多肽。
在重组细胞的具体的实施方式中,
-编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)活性的多肽的核酸;
-编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶(QRI1)活性的多肽的核酸;
-编码具有磷酸葡萄糖变位酶-1(PGM1)活性的多肽的核酸;
-编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶(UGP1)活性的多肽的核酸;
-编码具有葡萄糖胺-6-磷酸N-乙酰转移酶(GNA1)活性的多肽的核酸;和/或
-编码具有磷酸乙酰葡萄糖胺变位酶(PCM1)的多肽的核酸;
获自或源自酿酒酵母。
在具体的实施方式中,重组宿主细胞是酵母。
特别地,所述重组细胞属于酵母属,或属于念珠菌属(Candida),或属于克鲁维酵母菌属(Kluyveromyces),或属于汉逊酵母属(Ogataea),或属于耶氏酵母属(Yarrowia),或属于德巴利酵母属(Debaryomyces),或属于阿舒囊霉属(Ashbya),并且特别是属于酵母属。
特别地,所述重组细胞选自由以下组成的组:酿酒酵母、布拉氏酵母、贝酵母、奇异酵母、米卡酵母、卡氏酵母、白念珠菌、光滑念珠菌、热带念珠菌、乳酸克鲁维酵母、马克斯克鲁维酵母、多孢克鲁维酵母、耐热克鲁维酵母、多形汉逊酵母、解脂耶氏酵母、汉逊德巴利酵母和棉阿舒囊霉,并且优选酿酒酵母。
本发明的另一目标涉及一种生产具有所想要分子量的软骨素的方法,其包括:
(a)在培养基中培养如本文所定义的重组细胞持续足以生产具有所想要分子量的软骨素的时间;和
(b)任选地从所述重组细胞和/或从所述培养基分离或回收所述软骨素。
在该方法中,软骨素的分子量可为约20kDa至约50kDa。
在另一个实施方式中,软骨素的分子量可为约50kDa至约150kDa。
在另一个实施方式中,软骨素的分子量可为约150kDa至约1500kDa。
在本发明的方法中,重组细胞可以是属于酵母属的酵母,并且可以特别是酿酒酵母。
足以生产具有所想要分子量的软骨素的时间可以是约35小时至约50小时、优选约40小时至约50小时的时间段,优选可以是约48小时。
在具体的实施方式中,所生产的软骨素的分子量可以通过在步骤(a)期间调节培养基的pH来控制。
在一个实施方式中,所述方法以工业规模进行,优选地其中所述培养基是至少约100L,更优选地在约1,000L至约3,000L的范围内,甚至更优选约10,000L或甚至更优选约100,000L,或甚至约250,000L。
本发明的另一目的涉及从根据本发明的重组细胞或从根据本发明的方法获得的软骨素。
本发明还涉及包含本发明的软骨素的培养基。
本发明的另一个目的是包含本发明的软骨素的组合物。
本发明还涉及工业产品或消费产品或消费品,其包含(i)具有根据本发明的分子量的软骨素,(ii)根据本发明的培养基或(iii)根据本发明的组合物。
特别地,工业产品或消费产品或消费品可以是美容品、调味品、香料产品、食品、食物、饮料、食品定形剂、药物组合物、膳食补充剂、营养制品、清洁产品、牙科和/或口腔卫生组合物
本发明还涉及本发明的重组细胞用于生产分子量在约20kDa至约50kDa或约50kDa至约1000kDa范围内的软骨素的用途。
本发明的另一目标涉及一种用于生产软骨素的方法,其包括以下步骤:
(a)在培养基中培养如本文所定义的重组酵母;和
(b)从所述培养基回收软骨素,
其中步骤(b)中回收的软骨素具有通过选择以下而控制的分子量:
-重组酵母的编码具有软骨素酶活性的多肽的重组核酸的性质和来源,
-控制重组酵母的编码具有软骨素酶活性的多肽的重组核酸的表达的启动子的性质和来源,
-重组酵母的与具有软骨素酶活性的多肽相关的锚定和/或分泌信号的存在。
-培养重组酵母的步骤期间的培养基的pH,和/或
-培养重组酵母的持续时间。
此外,本发明涉及一种生产软骨素的重组酵母,其中重组酵母包含:
-(a)编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)活性的多肽的一种或多种重组核酸;
-(b)编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶(QRI1)活性的多肽的一种或多种重组核酸,
-(c)编码具有UDP-葡萄糖脱氢酶(UDP-GlcDH或HASB)活性的多肽的一种或多种重组核酸,
-(d)编码具有软骨素合酶(HCOS)活性的多肽的一种或多种重组核酸;和
-(e)编码具有UDP-葡萄糖-4-差向异构酶(kfoA或GNE1)活性的多肽的一种或多种重组核酸,所述重组酵母是酿酒酵母。
在具体的实施方式中,根据本发明的重组细胞并且特别是根据本发明的重组酵母还包含(F)一种编码具有软骨素酶活性的多肽的核酸,其中编码具有软骨素酶活性的多肽的核酸包含锚定信号和/或分泌信号,使得软骨素、特别是具有所想要分子量的软骨素由宿主细胞生产。
在具体的实施方式中,根据本发明的重组细胞并且特别是重组酵母包含仅一种编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)活性的多肽的重组核酸。
在具体的实施方式中,根据本发明的重组细胞并且特别是重组酵母包含1至10种、优选2至8种编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶(QRI1)活性的多肽的重组核酸。
在具体的实施方式中,根据本发明的重组细胞并且特别是重组酵母包含1至5种编码具有UDP-葡萄糖脱氢酶(UDP-GlcDH或HASB)活性的多肽的重组核酸。
在另一个实施方式中,编码具有UDP-葡萄糖脱氢酶(UDP-GlcDH或HASB)的多肽的一种或多种重组核酸获自或源自以下中的至少一者:拟南芥、小球藻属病毒PBCV1或兽瘟链球菌,并且特别获自或源自小球藻属病毒PBCV1或拟南芥。
在另一个实施方式中,根据本发明的重组细胞并且特别是重组酵母包含1至5种编码具有软骨素合酶(HCOS)活性的多肽的重组核酸。
在具体的实施方式,编码具有软骨素合酶(HCOS)活性的多肽的一种或多种核酸获自或源自以下中的至少一者:多杀巴斯德菌、小球藻属病毒PBCV1、结核分枝杆菌、智人、大肠埃希氏菌、酿酒酵母或草酸青霉。
在另一个实施方式,根据本发明的重组细胞并且特别是重组酵母包含1至5种编码具有UDP-葡萄糖-4-差向异构酶(kfoA或GNE1)活性的多肽的重组核酸。
在具体的实施方式,编码具有UDP-葡萄糖-4-差向异构酶(kfoA或GNE1)活性的多肽的一种或多种核酸获自或源自铜绿假单胞菌、多杀巴斯德菌和大肠埃希氏菌中的至少一者。
在具体的实施方式,根据本发明的重组细胞并且特别是重组酵母包含仅一种编码具有软骨素酶活性的多肽的重组核酸。
在另一个实施方式,编码具有软骨素酶活性的多肽的一种或多种重组核酸获自或源自萨氏九杯蛛、巴西钳蝎、家牛、西方蜜蜂、野捕恒河猴或大胡蜂中的至少一者。
在另一个实施方式,根据本发明的重组细胞并且特别是重组酵母细胞可包含编码以下中的一者或多者的至少一种重组核酸:
(a)具有磷酸葡萄糖变位酶-1(PGM1)活性的多肽,和/或
(b)具有UTP-葡萄糖-1-磷酸尿苷酰转移酶(UGP1)活性的多肽,和/或
(c)具有葡萄糖胺-6-磷酸N-乙酰转移酶(GNA1)活性的多肽,和/或
(d)具有磷酸乙酰葡萄糖胺变位酶(PCM1)活性的多肽。
特别地,根据本发明的重组细胞并且特别是本发明的重组酵母细胞包含至少两种、特别是至少三种并且更特别是所有上述修饰。
在具体的实施方式,编码具有磷酸葡萄糖变位酶-1(PGM1)活性的多肽的重组核酸、编码具有UTP--葡萄糖-1-磷酸尿苷酰转移酶(UGP1)活性的多肽的重组核酸、编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)活性的多肽的重组核酸、编码具有葡萄糖胺-6-磷酸N-乙酰转化酶(GNA1)活性的多肽的重组核酸、编码具有磷酸乙酰葡萄糖胺变位酶(PCM1)活性的多肽的重组核酸和编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶(QRI1)活性的多肽的重组核酸是获自或源自酵母、优选来自酿酒酵母。
在具体的实施方式,编码如上定义的多肽并包含在根据本发明的重组细胞并且特别是本发明的重组酵母中的一种或多种重组核酸处于选自由以下组成的组的启动子的控制下:pPDC1、pTDH3、pTDH3.Sk、pTDH3-1.Sba、pCCW12、pCCW120.Sm、pTEF1、pENO2pTEF1.Ago和pTEF1.Sba。
在具体的实施方式,本说明书中提及的诱导型或阻遏型启动子选自由铜诱导型或阻遏型启动子或甲硫氨酸诱导型或阻遏型启动子组成的组,特别是pCUP1。
在具体的实施方式,重组核酸在启动子pCWP2的控制下。
本发明的另一目标涉及一种用于生产软骨素的方法,所述方法包括以下步骤:
(a)在培养基中培养如本文所定义的根据本发明的重组细胞并且特别是重组酵母;和
(b)从所述培养基回收软骨素。
在具体的实施方式,步骤(b)中回收的软骨素具有通过选择以下而控制的预定分子量:
-重组细胞并且特别是重组酵母的编码具有软骨素酶活性的多肽的重组核酸的性质和来源,
-控制重组细胞并且特别是重组酵母的编码具有软骨素酶活性的多肽的重组核酸的表达的启动子的性质和来源,
-重组细胞并且特别是重组酵母的与编码具有软骨素酶活性的多肽的重组核酸相关的锚定信号或分泌信号的存在,
-在培养重组细胞并且特别是重组酵母的步骤期间培养基的pH,和/或
-培养重组细胞并且特别是重组酵母的持续时间。
在具体的实施方式,本发明的方法用于生产分子量严格低于50kDa并且特别是严格低于50kDa且高于或等于20kDa的软骨素,其中(c)从培养基回收软骨素的步骤是在重组细胞并且特别是重组酵母培养开始后48小时进行的。
在另一个实施方式,本发明的方法用于生产分子量高于或等于50kDa并且低于或等于1000kDa的软骨素,其中(c)从培养基回收软骨素的步骤是在重组酵母培养开始后48小时进行的。
在另一个实施方式,本发明的方法用于生产分子量严格高于1000kDa并且特别是分子量包含在严格高于1000kDa至1500,000kDa的软骨素,其中(c)从培养基回收软骨素的步骤是在重组细胞并且特别是重组酵母培养开始后48小时进行的。
特别地,培养基包含至少碳源,优选选自由葡萄糖和蔗糖组成的组的碳源。
本发明的另一个目的涉及如本文所定义的本发明的重组细胞并且特别是重组酵母用于生产软骨素、特别是具有受控分子量的软骨素的用途。
编码具有软骨素合酶活性(HCOS)的多肽的重组核酸
根据本发明的重组细胞并且特别是本发明的重组酵母包含编码具有软骨素合酶活性的多肽的一种或多种重组核酸。
根据本发明的具有软骨素合酶活性的多肽意指将中间代谢物UDP-葡萄糖醛酸/盐和UDP-N-乙酰-半乳糖胺转化为软骨素((β-D-1,3-GalNAc-β-D-1,4-GlcA)n)的多肽。
在一些实施方式中,编码具有软骨素合酶活性的多肽的核酸可在诱导型或阻遏型启动子的控制下。
编码具有软骨素合酶活性的多肽的重组核酸中的一者或多者可在pTDH3-1.Sba或pTDH3.Sar启动子的控制下。
所述编码具有软骨素合酶(HCOS)活性的多肽的一种或多种重组核酸可以是:
(i)编码软骨素合酶的核酸;或
(ii)编码具有软骨素合酶活性的嵌合多肽的核酸。
编码具有软骨素合酶活性的多肽的核酸可获自或源自以下中的至少一者:多杀巴斯德菌、小球藻属病毒PBCV1、结核分枝杆菌、智人、大肠埃希氏菌、酿酒酵母或草酸青霉;
根据本发明的重组细胞并且特别是根据本发明的重组酵母可包含一种编码具有软骨素合酶活性的多肽的重组核酸。
说明性地,可将软骨素合酶基因插入JLP1基因内和/或SAM3基因内,如其在本文的实例中所示。
在本发明的一个实施方式中,本发明的重组细胞并且特别是重组酵母包含:
-编码具有软骨素合酶活性的多肽的一种重组核酸;
-所述编码具有软骨素合酶活性的多肽的一种重组核酸获自或源自以下中的至少一者:多杀巴斯德菌、小球藻属病毒PBCV1、结核分枝杆菌、智人、大肠埃希氏菌、酿酒酵母或草酸青霉;
-所述一种编码具有软骨素合酶活性的多肽的重组核酸在诱导型或阻遏型启动子的控制下和/或在pTDH3-1.Sba或pTDH3.Sar启动子的控制下。
编码具有UDP-葡萄糖脱氢酶活性(HASB)的多肽的重组核酸
根据本发明的重组细胞并且特别是本发明的重组酵母包含编码具有UDP-葡萄糖脱氢酶(UDP-GlcDH或HASB)活性的多肽的一种或多种重组核酸。
根据本发明的具有UDP-葡萄糖脱氢酶(UDP-GlcDH或HASB)活性的多肽意指将中间代谢物尿苷-二磷酸-葡萄糖(UDP-葡萄糖)转化为UDP-葡萄糖醛酸/盐的多肽。
编码具有UDP-葡萄糖脱氢酶活性的多肽的一种或多种重组核酸可以在选自由pTEF1.sba、pCCW12和pTDH3.Sk组成的组的启动子的控制下。
编码具有UDP-葡萄糖脱氢酶活性的多肽的一种或多种重组核酸可获自或源自以下中的至少一者:拟南芥、小球藻属病毒PBCV1或兽瘟链球菌,并且特别是选自拟南芥或小球藻属病毒PBCV1中的至少一者。
根据本发明的重组细胞并且特别是根据本发明的重组酵母可包含1至5种编码具有UDP-葡萄糖脱氢酶活性的多肽的重组核酸。
说明性地,可将编码具有UDP-葡萄糖脱氢酶活性的多肽的一种或多种重组核酸插入重组细胞并且特别是重组酵母的JLP1基因内和/或SAM3基因内,如其在本文的实例中所示。
在本发明的一个实施方式中,本发明的重组细胞并且特别是重组酵母包含:
-1至5种编码具有UDP-葡萄糖脱氢酶活性的多肽的重组核酸;
-编码具有UDP-葡萄糖脱氢酶活性的多肽的所述重组核酸获自或源自以下中的至少一者:拟南芥、小球藻属病毒PBCV1或兽瘟链球菌,并且特别是来自拟南芥或小球藻属病毒PBCV1中的至少一者;
-所述编码具有UDP-葡萄糖脱氢酶活性的多肽的重组核酸在本发明的重组细胞中有功能的诱导型或阻遏型启动子的控制下,和/或在选自由pTEF1.sba、pCCW12和pTDH3.Sk组成的组的启动子的控制下。
编码具有UDP-葡萄糖-4-差向异构酶活性(kfoA或GNE1)的多肽的重组核酸
根据本发明的重组细胞并且特别是根据本发明的重组酵母包含编码具有UDP-葡萄糖-4-差向异构酶活性的多肽的一种或多种重组核酸。
根据本发明的具有UDP-葡萄糖-4-差向异构酶活性的多肽意指将中间代谢物UDP-N-乙酰-葡萄糖胺转化为UDP-N-乙酰-半乳糖胺的多肽。
在一个实施方式中,编码具有UDP-葡萄糖-4-差向异构酶活性的多肽的重组核酸中的一者或多者可以在选自由pCCW12或pCCW120.Sm组成的组的启动子的控制下。
编码具有UDP-葡萄糖-4-差向异构酶活性的多肽的一种或多种重组核酸可获自或源自细菌,并且特别是来自选自由以下组成的组的细菌:铜绿假单胞菌、多杀巴斯德菌和大肠埃希氏菌。
根据本发明的重组细胞并且特别是根据本发明的重组酵母可包含1至5种编码具有UDP-葡萄糖-4-差向异构酶活性的多肽的重组核酸。
说明性地,可将编码具有UDP-葡萄糖-4-差向异构酶活性的多肽的一种或多种重组核酸插入重组细胞和特别是重组酵母的JLP1基因内和/或SAM3基因内,如其在本文的实例中所示。
在本发明的一个实施方式中,本发明的重组细胞并且特别是重组酵母细胞包含:
-1至5种编码具有UDP-葡萄糖-4-差向异构酶活性的多肽的重组核酸;
-所述编码具有UDP-葡萄糖-4-差向异构酶活性的多肽的重组核酸源自或获自由以下组成的组:铜绿假单胞菌、多杀巴斯德菌和大肠埃希氏菌;
-所述编码具有UDP-葡萄糖-4-差向异构酶活性的多肽的重组核酸在本发明的重组细胞中有功能的诱导型或阻遏型启动子的控制下,和/或在选自由pCCW12或pCCW120.Sm组成的组的启动子的控制下。
编码具有软骨素酶活性的多肽的重组核酸
根据本发明的重组细胞并且特别是根据本发明的重组酵母包含编码具有软骨素酶活性的多肽的一种或多种重组核酸。
根据本发明的具有软骨素酶活性的多肽意指降解软骨素的多肽,即其将具有给定分子量的软骨素转化为具有较低分子量的软骨素。
根据本发明的具有软骨素酶活性的多肽可包括透明质酸氨基葡萄糖苷酶,例如软骨素酶或透明质酸酶。
如前所指定,本发明的具有软骨素酶活性的多肽包含分泌信号。
在一个实施方式中,具有软骨素酶活性的多肽包含分泌信号和锚定信号两者。
在一个实施方式中,所述编码具有软骨素酶活性的多肽的一种或多种重组核酸在本发明的重组细胞中有功能的诱导型或阻遏型启动子的控制下。
编码具有软骨素酶活性的多肽的重组核酸中的一者或多者可以在选自由以下组成的组的启动子的控制下:pTEF1、pCCW12、pCCW12.sba、pCCW12.Sar、pPDC1、pTEF3、pTDH3、pNUP57和pCCW10.ago,并且特别是pCCW12.Sba启动子。
所述编码具有软骨素酶活性的多肽的一种或多种重组核酸可以获自或源自萨氏九杯蛛(Csa)、巴西钳蝎(Ts)、家牛(Bt)、西方蜜蜂(Am)、野捕恒河猴(Mm)或大胡蜂(Vm)中的至少一者,并且特别是来自巴西钳蝎(Ts)。
根据本发明的重组细胞并且特别是根据本发明的重组酵母可包含仅一种编码具有软骨素酶活性的多肽的重组核酸。
说明性地,可将编码具有软骨素酶活性的多肽的一种或多种重组核酸插入JLP1基因内和/或LYP1基因内和/或LEU2基因内,并且特别是LEU2基因内。
在优选的实施方式中,编码具有软骨素酶活性的多肽的重组核酸是编码透明质酸酶的重组核酸。特别地,具有软骨素酶活性的多肽是透明质酸酶。
以上关于编码具有软骨素酶活性的多肽的重组核酸的所有特征适用于编码透明质酸酶的重组核酸。
在本发明的一个实施方式中,本发明的重组细胞并且特别是重组酵母包含:
-仅一种编码具有软骨素酶活性的多肽的重组核酸;
-所述编码具有软骨素酶活性的多肽的重组核酸获自或源自萨氏九杯蛛(Csa)、巴西钳蝎(Ts)、家牛(Bt)、西方蜜蜂(Am)、野捕恒河猴(Mm)或大胡蜂(Vm)中的至少一者,并且特别是来自巴西钳蝎(Ts);
-所述编码具有软骨素酶活性的多肽的重组核酸包含(i)分泌信号且没有锚定信号或(ii)分泌信号和锚定信号;
-所述具有软骨素酶的多肽是透明质酸酶,
-所述编码具有软骨素酶活性的多肽的重组核酸在本发明的重组细胞中有功能的诱导型或阻遏型启动子的控制下,和/或在选自由pTEF1、pCCW12、pCCW12.sba、pCCW12.Sar、pPDC1、pTEF3、pTDH3、pNUP57和pCCW10.ago组成的组的启动子并且特别是pCCW12.Sba启动子的控制下。
编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性(GFA1)的多肽的重组核酸
根据本发明的重组细胞并且特别是根据本发明的重组酵母细胞,可包含编码仅一种具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的重组核酸。
根据本发明的具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽意指将果糖-6-磷酸(fructose-6-phosphate)转化为葡萄糖胺-6-磷酸(glucosamine-6-phosphate)的多肽。
在一个实施方式中,编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的重组核酸中的一者或多者在本发明的重组细胞中有功能的诱导型或阻遏型启动子的控制下。
编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的重组核酸中的一者或多者可pTEF1.Ago启动子的控制下。
所述编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的一种或多种重组核酸可获自或源自酿酒酵母,如本文实例所示。
根据本发明的重组细胞并且特别是根据本发明的重组酵母细胞,可包含仅一种编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的重组核酸。
说明性地,可将编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的一种或多种重组核酸插入重组细胞并且特别是重组酵母细胞的JLP1基因内,如其在本文的实例中所示。
在本发明的一个实施方式中,本发明的重组细胞并且特别是重组酵母细胞包含:
-仅一种编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的重组核酸;
-所述编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的重组核酸来源于或源自酿酒酵母;和
-所述编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的重组核酸在pTEF1.Ago启动子的控制下。
编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性(QRI1)的多肽的重组核酸
根据本发明的重组细胞,并且特别是根据本发明的重组酵母细胞,可包含编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的一种或多种重组核酸。
根据本发明的具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽意指将N-乙酰-葡萄糖胺转化为UDP-N-乙酰-葡萄糖胺的多肽。
在一个实施方式中,编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的重组核酸中的一者或多者在本发明的重组细胞中有功能的诱导型或阻遏型启动子的控制下,例如诱导型或阻遏型启动子pMET6或pCUP1。
编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的重组核酸中的一者或多者可以在启动子pTDH3-1.Sba或pTDH3的控制下。
所述编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的一种或多种重组核酸可获自或源自酿酒酵母,如本文实例所示。
根据本发明的重组细胞并且特别是根据本发明的重组酵母,可包含1至10种编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的重组核酸,特别是可包含2至8种编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的重组核酸,并且例如可以包含编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的2、6或7种重组核酸。
说明性地,可将编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的一种或多种重组核酸插入重组细胞并且特别是重组酵母的HIS3基因内和/或MET14基因内和/或JLP1基因内,如其在本文的实例中所示。
在本发明的一个实施方式中,本发明的重组细胞并且特别是重组酵母细胞包含:
-2至8种编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的重组核酸;
-所述编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的一种或多种重组核酸来源于或源自酿酒酵母;
-所述编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的一种或多种重组核酸在本发明的重组细胞中有功能的诱导型或阻遏型启动子的控制下,例如诱导型或阻遏型启动子pMET6或pCUP1和/或在启动子pTDH3-1.Sba或pTDH3的控制下。
编码具有磷酸葡萄糖变位酶-1活性(PGM1)的多肽的重组核酸
根据本发明的重组细胞并且特别是根据本发明的重组酵母细胞可包含编码具有磷酸葡萄糖变位酶-1(PGM1)活性的多肽的一种或多种重组核酸。
根据本发明的具有磷酸葡萄糖变位酶-1(PGM1)活性的多肽意指将葡萄糖-6-磷酸转化为中间代谢物葡萄糖-1-磷酸的多肽。
在一个实施方式中,编码具有磷酸葡萄糖变位酶-1(PGM1)活性的多肽的重组核酸中的一者或多者在本发明的重组细胞中有功能的诱导型或阻遏型启动子的控制下。
编码具有磷酸葡萄糖变位酶-1(PGM1)活性的多肽的重组核酸中的一者或多者可以在启动子pTDH3的控制下。
编码具有磷酸葡萄糖变位酶-1(PGM1)活性的多肽的一种或多种重组核酸可获自或源自酿酒酵母,如本文实例所示。
根据本发明的重组细胞并且特别是根据本发明的重组酵母细胞可包含仅一种编码具有磷酸葡萄糖变位酶-1(PGM1)活性的多肽的重组核酸。
说明性地,可将编码具有磷酸葡萄糖变位酶-1活性的多肽的一种或多种重组核酸插入重组细胞并且特别是重组酵母的MET14基因内。
在本发明的一个实施方式中,本发明的重组细胞并且特别是重组酵母包含:
-仅一种编码具有磷酸葡萄糖变位酶-1活性的多肽的重组核酸;
-所述编码具有磷酸葡萄糖变位酶-1活性的多肽的重组核酸来源于或源自酿酒酵母;和
-所述编码具有磷酸葡萄糖变位酶-1活性的多肽的重组核酸在本发明的重组细胞中有功能的诱导型或阻遏型启动子的控制下,和/或在启动子pTDH3的控制下。
编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性(UGP1)的多肽的重组核酸
根据本发明的重组细胞并且特别是根据本发明的重组酵母,包含编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶(UGP1)活性的多肽的一种或多种重组核酸。
根据本发明的具有UTP-葡萄糖-1-磷酸尿苷酰转移酶(UGP1)活性的多肽意指将中间代谢物葡萄糖-1-磷酸转化为中间代谢物UDP-葡萄糖的多肽。
在一个实施方式中,编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的重组核酸中的一者或多者在本发明的重组细胞中有功能的诱导型或阻遏型启动子的控制下,例如诱导型或阻遏型启动子pSAM1或pCUP1。
编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的重组核酸中的一者或多者可在pFBA1、pENO2或pPDC1启动子的控制下。
编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的一种或多种重组核酸可获自或源自酿酒酵母,如本文实例所示。
根据本发明的重组细胞,并且特别是根据本发明的重组酵母细胞,可包含1至10种编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的重组核酸,特别是可包含2至8种编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的重组核酸,并且例如可以包含2、6或8种编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的重组核酸。
说明性地,可将编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性基因的多肽的一种或多种重组核酸插入重组细胞并且特别是重组酵母的HIS3基因内、和/或MET14基因内、和/或JLP1基因内和/或SAM3基因内,如其在本文的实例中所示。
在本发明的一个实施方式中,本发明的重组细胞并且特别是重组酵母细胞包含:
-2至8种编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的重组核酸;
-所述编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的一种或多种重组核酸来源于或源自酿酒酵母;和
-所述编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的一种或多种重组核酸在本发明的重组细胞中有功能的诱导型或阻遏型启动子的控制下,例如诱导型或阻遏型启动子pSAM1或pCUP1和/或在选自由pFBA1、pENO2和pPDC1组成的组的启动子的控制下。
编码具有葡萄糖胺-6-磷酸N-乙酰转移酶(GNA1)活性的多肽的重组核酸
根据本发明的重组细胞并且特别是根据本发明的重组酵母细胞可包含仅一种编码具有葡萄糖胺-6-磷酸N-乙酰转移酶(GNA1)活性的多肽的重组核酸。
根据本发明的具有葡萄糖胺-6-磷酸N-乙酰转移酶(GNA1)活性的多肽意指将葡萄糖胺-6-磷酸转化为N-乙酰-葡萄糖胺-6-磷酸的多肽。
在一个实施方式中,编码具有葡萄糖胺-6-磷酸N-乙酰转移酶活性的多肽的重组核酸中的一者或多者在本发明的重组细胞中有功能的诱导型或阻遏型启动子的控制下。
编码具有葡萄糖胺-6-磷酸N-乙酰转移酶活性的多肽的重组核酸中的一者或多者在启动子pCWP2的控制下。
所述编码具有葡萄糖胺-6-磷酸N-乙酰转移酶活性的多肽的一种或多种重组核酸可获自或源自酿酒酵母,如其在本文的实例中所示。
根据本发明的重组细胞并且特别是根据本发明的重组酵母细胞可包含仅一种编码具有葡萄糖胺-6-磷酸N-乙酰转移酶活性的多肽的重组核酸。
说明性地,可将编码具有葡萄糖胺-6-磷酸N-乙酰转化酶活性的多肽的一种或多种重组核酸插入重组细胞和特别是重组酵母的MET14基因内和/或SAM3基因内,如其在本文的实例中所示。
在本发明的一个实施方式中,本发明的重组细胞并且特别是重组酵母包含:
-仅一种编码具有葡萄糖胺-6-磷酸N-乙酰转移酶活性的多肽的重组核酸;
-所述编码具有葡萄糖胺-6-磷酸N-乙酰转移酶活性的多肽的重组核酸来源于或源自酿酒酵母;和
-所述编码具有葡萄糖胺-6-磷酸N-乙酰转化酶活性的多肽的重组核酸在本发明的重组细胞中有功能的诱导型或阻遏型启动子的控制下,和/或在启动子pCWP2的控制下。
编码具有磷酸乙酰葡萄糖胺变位酶活性(PCM1)的多肽的重组核酸
根据本发明的重组细胞并且特别是根据本发明的重组酵母细胞可包含编码具有磷酸乙酰葡萄糖胺变位酶(PCM1)活性的多肽的一种或多种重组核酸。
根据本发明的具有磷酸乙酰葡萄糖胺变位酶活性的多肽意指将N-乙酰-葡萄糖胺-6-磷酸转化为N-乙酰-葡萄糖胺-1-磷酸的多肽。
在一个实施方式中,编码具有磷酸乙酰葡萄糖胺变位酶活性的多肽的重组核酸中的一者或多者在本发明的重组细胞中有功能的诱导型或阻遏型启动子的控制下。
编码具有磷酸乙酰葡萄糖胺变位酶活性的多肽的重组核酸中的一者或多者可以在pTEF1启动子的控制下。
所述编码具有磷酸乙酰葡萄糖胺变位酶活性的多肽的一种或多种重组核酸可获自或源自酿酒酵母,如其在本文的实例中所示。
根据本发明的重组细胞并且特别是根据本发明的重组酵母可包含仅一种编码具有磷酸乙酰葡萄糖胺变位酶活性的多肽的重组核酸。
说明性地,可将编码具有磷酸乙酰葡萄糖胺变位酶活性的多肽的一种或多种重组核酸插入重组细胞和特别是重组酵母的MET14基因内和/或SAM3基因内,如其在本文的实例中所示。
在本发明的一个实施方式中,本发明的重组细胞并且特别是重组酵母细胞包含:
-仅一种编码具有磷酸乙酰葡萄糖胺变位酶活性的多肽的重组核酸;
-所述编码具有磷酸乙酰葡萄糖胺变位酶活性的多肽的重组核酸来源于或源自酿酒酵母;和
-所述编码具有磷酸乙酰葡萄糖胺变位酶活性的多肽的重组核酸在本发明的重组细胞中有功能的诱导型或阻遏型启动子的控制下,和/或在pTEF1启动子的控制下。
软骨素合酶(HCOS)
软骨素合酶是一种本领域中描述的用于催化UDP-葡萄糖醛酸/盐或UDP-N-乙酰-半乳糖胺转化为软骨素的蛋白质。
在具体的实施方式中,编码具有软骨素合酶(HCOS)活性的多肽的核酸是:
(i)编码软骨素合酶的核酸;或
(ii)编码具有软骨素合酶活性的嵌合多肽的核酸。
嵌合多肽也称为融合多肽,是由至少两个结构域或片段组成的多肽,优选地来自两种不同的多肽,它们由已连接的单独核酸编码,使得它们作为单个单元被转录和翻译,从而产生单一多肽。嵌合多肽可以在体内产生,或者使用重组DNA技术在体外产生。本领域已知的此类技术可以尤其包括但不仅限于DNA固相合成,重组PCR,涉及使用限制酶、连接酶、重组酶的常规分子技术,使用例如吉布森组装(Gibson DG,Young L,Chuang RY,VenterJC,Hutchison CA 3rd,Smith HO(2009).Nature Methods.6(5):343-345)的技术,或利用体内线性DNA重组(优选在酵母中)。
根据本发明适合的具有软骨素合酶活性的嵌合多肽可以是本领域已知的杂合蛋白(嵌合软骨素合酶的概念描述于Tracy等人(2006)Journal of biological chemistry,282,337-344和Jing和DeAngelis(2003)Glycobiology 13,661-71),其由包含编码具有透明质酸合酶活性的多肽的核酸和编码具有软骨素合酶活性的多肽的核酸的核酸编码。所得多肽是透明质酸合酶和软骨素合酶之间的嵌合多肽。
根据本发明适合的另一种具有软骨素合酶活性的嵌合多肽由包含编码具有透明质酸合酶活性的多肽的核酸和编码具有呋喃半乳糖基转移酶活性的多肽的核酸的核酸编码。所得多肽是透明质酸合酶和呋喃半乳糖基转移酶之间的融合蛋白(呋喃半乳糖基转移酶GlfT2结核分枝杆菌UNIPROT O53585 EC 2.1.4.288)。
根据本发明适合的另一种具有软骨素合酶活性的嵌合多肽由包含编码具有透明质酸合酶活性的多肽的核酸和编码具有几丁质合酶活性的多肽的核酸的核酸编码。所得多肽是透明质酸合酶(hyaluronan synthase)和几丁质合酶之间的融合蛋白(几丁质合酶CHS2酿酒酵母UNIPROT P14180 EC 2.1.4.16)。
根据本发明适合的具有软骨素合酶活性的嵌合多肽的实例可以由包含以下的核酸序列编码:
-来自编码源自多杀巴斯德菌的透明质酸合酶的核酸的片段,和来自编码源自多杀巴斯德菌的软骨素合酶的核酸的片段(例如HCOS1-1、HCOS1-2或HCOS1-3);
-来自编码源自多杀巴斯德菌的透明质酸合酶的核酸的片段,来自编码源自多杀巴斯德菌的软骨素合酶的核酸的片段,和来自编码源自酿酒酵母的几丁质合酶2的核酸的片段(例如HCOS.Sc);
-来自编码源自多杀巴斯德菌的透明质酸合酶的核酸的片段,和来自编码源自酿酒酵母的几丁质合酶2的核酸的片段(例如HHASA.Sc);
-来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的核酸的片段,和来自编码源自大肠埃希氏菌的软骨素合酶的核酸的片段(例如HCOS1-Vir、HCOS2-Vir或HCOS4-Vir);
-来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的核酸的片段,和来自编码源自结核分枝杆菌的呋喃半乳糖基转移酶的核酸的片段(例如HCOS3-Vir);
-来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的核酸的片段,和来自编码源自草酸青霉的软骨素合酶的核酸的片段(例如HCOS5-Vir、HCOS6-Vir、HCOS7-Vir或HCOS8-Vir);
-来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的核酸的片段,和来自编码源自智人的硫酸软骨素合酶的核酸的片段(例如HCOS9-Vir、HCOS10-Vir、HCOS11-Vir或HCOS12-Vir)。
实施测量具有软骨素合酶活性的多肽的活性水平的方法属于本领域技术人员的常识。
在这方面,本领域技术人员可以有利地参考其中通过使用咔唑方法测定的上清液中软骨素的存在来评价酶生产软骨素的能力的方法(Bitter和Muir(1962)analyticalbiochemistry 4,330-334)。
本说明书中优选的具有软骨素合酶活性的多肽是具有两种活性EC 2.4.1.175和2.4.1.226的酶。
根据优选的实施方式,编码具有软骨素合酶活性的多肽的一种或多种重组核酸可获自或源自生物体,优选选自由原核生物和真核生物组成的组。在一些实施方式中,编码具有软骨素合酶活性的多肽的一种或多种重组核酸可获自或源自古细菌。在一些优选的实施方式中,编码具有软骨素合酶活性的多肽的一种或多种重组核酸可获自或源自由以下组成的组:多杀巴斯德菌(Pm)、小球藻属病毒PBCV1(Vir)、结核分枝杆菌(Mt)、智人(Hs)、大肠埃希氏菌(Ec)、酿酒酵母(Sc)或草酸青霉(Po)。
根据又一个优选的实施方式,编码具有软骨素合酶活性的多肽的一种或多种重组核酸可选自由以下组成的组:核酸序列,其具有(i)与如序列SEQ ID NO:1(HCOS1-1)、SEQID NO:2(HCOS1-2)、SEQ ID NO:3(HCOS-1-3)、SEQ ID NO:4(HCOS.Sc)、SEQ ID NO:5(HHASA.Sc)、SEQ ID NO:6(HCOS1-Vir)、SEQ ID NO:7(HCOS2-Vir)、SEQ ID NO:8(HCOS3-Vir)、SEQ ID NO:9(HCOS4-Vir)、SEQ ID NO:10(HCOS5-Vir)、SEQ ID NO:11(HCOS6-Vir)、SEQ ID NO:12(HCOS7-Vir)、SEQ ID NO:13(HCOS8-Vir)、SEQ ID NO:14(HCOS9-Vir)、SEQID NO:15(HCOS10-Vir)、SEQ ID NO:16(HCOS11-Vir)或SEQ ID NO:17(HCOS12-Vir)所示的核酸序列的至少65%、有利地至少70%、优选至少80%核酸同一性,和(ii)与分别具有如序列SEQ ID NO:1(HCOS1-1)、SEQ ID NO:2(HCOS1-2)、SEQ ID NO:3(HCOS-1-3)、SEQ ID NO:4(HCOS.Sc)、SEQ ID NO:5(HHASA.Sc)、SEQ ID NO:6(HCOS1-Vir)、SEQ ID NO:7(HCOS2-Vir)、SEQ ID NO:8(HCOS3-Vir)、SEQ ID NO:9(HCOS4-Vir)、SEQ ID NO:10(HCOS5-Vir)、SEQ ID NO:11(HCOS6-Vir)、SEQ ID NO:12(HCOS7-Vir)、SEQ ID NO:13(HCOS8-Vir)、SEQID NO:14(HCOS9-Vir)、SEQ ID NO:15(HCOS10-Vir)、SEQ ID NO:16(HCOS11-Vir)或SEQ IDNO:17(HCOS12-Vir)所示的核酸序列的核酸序列的相同性质的生物活性。
如前所解释,关于该序列的相同性质的生物活性是编码将UDP-葡萄糖醛酸/盐和UDP-N-乙酰-半乳糖胺转化成软骨素的多肽的能力。
如本文所述,与参考核酸序列具有至少65%核苷酸同一性的核酸序列涵盖与所述参考核酸序列具有至少66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%核苷酸同一性并且还具有与所述参考核酸序列相同性质的生物活性的核酸序列。
如本文所述,与参考核酸序列具有至少70%核苷酸同一性的核酸序列涵盖与所述参考核酸序列具有至少71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%核苷酸同一性并且还具有与所述参考核酸序列相同性质的生物活性的核酸序列。
如本文所述,与参考核酸序列具有至少80%核苷酸同一性的核酸序列涵盖与所述参考核酸序列具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%核苷酸同一性并且还具有与所述参考核酸序列相同性质的生物活性的核酸序列。
对于包含来自编码源自多杀巴斯德菌的透明质酸合酶的氨基酸的片段和来自编码源自多杀巴斯德菌的软骨素合酶的氨基酸的片段的具有软骨素合酶活性的嵌合多肽的氨基酸序列,本领域技术人员可分别参考UniProt数据库中的登录号Q7BLV3和Q9CMP0,或参考如本文所述的SEQ ID NO:18(HCOS1-1)、SEQ ID NO:19(HCOS1-2)和SEQ ID NO:20(HCOS-1-3)所示的序列。
对于包含来自编码源自多杀巴斯德菌的透明质酸合酶的氨基酸的片段、来自编码源自多杀巴斯德菌的软骨素合酶的氨基酸的片段和来自编码源自酿酒酵母的几丁质合酶2的氨基酸的片段的具有软骨素合酶活性的嵌合多肽的氨基酸序列,本领域技术人员可分别参考UniProt数据库中的登录号Q7BLV3、Q9CMP0和P14180,或参考如如本文所述的SEQ IDNO:21(HCOS.Sc)所示的序列。
对于包含来自编码源自多杀巴斯德菌的透明质酸合酶的氨基酸的片段和来自编码源自酿酒酵母的几丁质合酶2的氨基酸的片段的具有软骨素合酶活性的嵌合多肽的氨基酸序列,本领域技术人员可分别参考UniProt数据库中的登录号Q7BLV3和P14180,或参考如如本文所述的SEQ ID NO:22(HHASA.Sc)所示的序列。
对于包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的氨基酸的片段和来自编码源自大肠埃希氏菌的软骨素合酶的氨基酸的片段的具有软骨素合酶活性的嵌合多肽的氨基酸序列,本领域技术人员可分别参考UniProt数据库中的登录号Q84419和Q8L0V4,或参考如如本文所述的SEQ ID NO:23(HCOS1-Vir)、SEQ ID NO:24(HCOS2-Vir)或SEQ ID NO:26(HCOS4-Vir)所示的序列。
对于包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的氨基酸的片段和来自编码源自结核分枝杆菌的呋喃半乳糖基转移酶的氨基酸的片段的具有软骨素合酶活性的嵌合多肽的氨基酸序列,本领域技术人员可分别参考UniProt数据库中的登录号Q84419和O53585,或参考如如本文所述的SEQ ID NO:25(HCOS3-Vir)所示的序列。
对于包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的氨基酸的片段和来自编码源自草酸青霉的软骨素合酶的氨基酸的片段的具有软骨素合酶活性的嵌合多肽的氨基酸序列,本领域技术人员可分别参考UniProt数据库中的登录号Q84419和S7Z8F8,或参考如SEQ ID NO:27(HCOS5-Vir)所示的序列。
对于包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的氨基酸的片段和来自编码源自多杀巴斯德菌的软骨素合酶的氨基酸的片段的具有软骨素合酶活性的嵌合多肽的氨基酸序列,本领域技术人员可分别参考UniProt数据库中的登录号Q84419和Q9CMP0,或参考如如本文所述的SEQ ID NO:28(HCOS6-Vir)、SEQ ID NO:29(HCOS7-Vir)或SEQ ID NO:30(HCOS8-Vir)所示的序列。
对于包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的氨基酸的片段和来自编码源自智人的硫酸软骨素合酶的氨基酸的片段的具有软骨素合酶活性的嵌合多肽的氨基酸序列,本领域技术人员可分别参考UniProt数据库中的登录号Q84419和Q86X52,或参考如如本文所述的SEQ ID NO:31(HCOS9-Vir)、SEQ ID NO:32(HCOS10-Vir)、SEQ ID NO:33(HCOS11-Vir)或SEQ ID NO:34(HCOS12-Vir)所示的序列。
根据另一个具体的实施方式,编码具有软骨素合酶活性的多肽的一种或多种重组核酸可以是编码具有选自由以下序列组成的组的氨基酸序列的多肽的一种或多种核酸:具有与SEQ ID NO:18(HCOS1-1)、SEQ ID NO:19(HCOS1-2)、SEQ ID NO:20(HCOS-1-3)、SEQ IDNO:21(HCOS.Sc)、SEQ ID NO:22(HHASA.Sc)、SEQ ID NO:23(HCOS1-Vir)、SEQ ID NO:24(HCOS2-Vir)、SEQ ID NO:25(HCOS3-Vir)、SEQ ID NO:26(HCOS4-Vir)、SEQ ID NO:27(HCOS5-Vir)、SEQ ID NO:28(HCOS6-Vir)、SEQ ID NO:29(HCOS7-Vir)、SEQ ID NO:30(HCOS8-Vir)、SEQ ID NO:31(HCOS9-Vir)、SEQ ID NO:32(HCOS10-Vir)、SEQ ID NO:33(HCOS11-Vir)和SEQ ID NO:34(HCOS12-Vir)的氨基酸序列的至少55%、有利地至少65%、优选至少80%氨基酸同一性并还具有相同性质的生物活性的序列。
关于该序列的相同性质的生物活性如前所述,即催化UDP-葡萄糖醛酸/盐和UDP-N-乙酰-半乳糖胺转化为UDP-N-乙酰-半乳糖胺的能力。
如本文所述,与参考氨基酸序列具有至少55%氨基酸同一性的氨基酸序列涵盖与所述参考氨基酸序列具有至少56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%氨基酸同一性并且还具有与所述参考氨基酸序列相同性质的生物活性的氨基酸序列。
如本文所述,与参考氨基酸序列具有至少65%氨基酸同一性的氨基酸序列涵盖与所述参考氨基酸序列具有至少66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%氨基酸同一性并且还具有与所述参考氨基酸序列相同性质的生物活性的氨基酸序列。
如本文所述,与参考氨基酸序列具有至少80%氨基酸同一性的氨基酸序列涵盖与所述参考氨基酸序列具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%氨基酸同一性并且还具有与所述参考氨基酸序列相同性质的生物活性的氨基酸序列。
如上所提及,在本发明中编码具有软骨素合酶活性的多肽的一种或多种重组核酸的表达水平由至少一种启动子和至少一种终止子调控,例如在下文中更详细地定义,其分别存在于编码具有软骨素合酶活性的多肽的一种或多种重组核酸的5’和3’位置。
UDP-葡萄糖脱氢酶(UDP-GlcDH或HASB)
UDP-葡萄糖脱氢酶是一种本领域已知的催化UDP-葡萄糖转化为UDP-葡萄糖醛酸/盐的蛋白质。来源于拟南芥、小球藻属病毒PBCV1或兽瘟链球菌的基因组的UDP-葡萄糖脱氢酶可称为HASB。
实施测量具有UDP-葡萄糖脱氢酶活性的多肽的活性水平的方法属于本领域技术人员的常识。
在这方面,本领域技术人员可以有利地参考Oka和Jigami所述的方法(FEBSJournal 273,2645-2657,2006)。
在本说明书中具有UDP-葡萄糖脱氢酶活性的优选多肽是EC号为1.1.1.22的酶。
根据优选的实施方式,编码具有UDP-葡萄糖脱氢酶活性的多肽的一种或多种重组核酸可获自或源自生物体,优选选自包括原核生物和真核生物的组。在一些实施方式中,编码具有UDP-葡萄糖脱氢酶活性的多肽的一种或多种重组核酸获自或源自古细菌。在一些优选的实施方式中,编码具有UDP-葡萄糖脱氢酶活性的多肽的一种或多种重组核酸可获自或源自酵母,并且尤其是拟南芥、小球藻属病毒PBCV1或兽瘟链球菌,优选拟南芥或小球藻属病毒PBCV1。
根据又一个优选的实施方式,编码具有UDP-葡萄糖脱氢酶活性的多肽的一种或多种重组核酸可选自由以下核酸序列组成的组:具有(i)与如序列SEQ ID NO:35(At)、SEQ IDNO:36(Vir)、SEQ ID NO:37(Vir)和SEQ ID NO:38(Sz)所示的核酸序列的至少65%、有利地至少70%、优选至少80%核酸同一性,和(ii)与如序列SEQ ID NO:35(At)、SEQ ID NO:36(Vir)、SEQ ID NO:37(Vir)和SEQ ID NO:38(Sz)所示的相同性质的生物活性的核酸序列。如SEQ ID NO:35(At)、SEQ ID NO:36(Vir)、SEQ ID NO:37(Vir)和SEQ ID NO:38(Sz)所示的核酸编码分别获自或源自拟南芥(At)、小球藻属病毒PBCV1(Vir)或兽瘟链球菌(Sz)的具有UDP-葡萄糖脱氢酶活性的多肽,其在本文中还可统称为HASB。
关于该序列的相同性质的生物活性如前所解释,即编码将UDP-葡萄糖转化为UDP-葡萄糖醛酸/盐的多肽的能力。
如本文所述,与参考核酸序列具有至少65%核苷酸同一性的核酸序列涵盖与所述参考核酸序列具有至少66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%核苷酸同一性并且还具有与所述参考核酸序列相同性质的生物活性的核酸序列。
如本文所述,与参考核酸序列具有至少70%核苷酸同一性的核酸序列涵盖与所述参考核酸序列具有至少71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%核苷酸同一性并且还具有与所述参考核酸序列相同性质的生物活性的核酸序列。
如本文所述,与参考核酸序列具有至少80%核苷酸同一性的核酸序列涵盖与所述参考核酸序列具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%核苷酸同一性并且还具有与所述参考核酸序列相同性质的生物活性的核酸序列。
对于来自拟南芥、小球藻属病毒PBCV1或兽瘟链球菌的具有UDP-葡萄糖脱氢酶活性的多肽的氨基酸序列,本领域技术人员可以分别参考UniProt数据库中的登录号NP_173979.1、NP_048965或KIS19289,或者参考本文所述的SEQ ID NO:39(At)、SEQ ID NO:40(Vir)和SEQ ID NO:41(Sz)所示的序列。
根据另一个具体的实施方式,编码UDP-葡萄糖脱氢酶的一种或多种核酸可以是编码选自由以下序列组成的组的氨基酸序列的一种或多种核酸:具有与SEQ ID NO:39(At)、SEQ ID NO:40(Cv)和SEQ ID NO:41(Sz)的氨基酸序列的至少55%、有利地至少65%、优选至少80%氨基酸同一性,并且还具有与SEQ ID NO:39(At)、SEQ ID NO:40(Cv)和SEQ IDNO:41(Sz)的氨基酸序列相同性质的生物活性,并且还具有相同性质的生物活性的序列。
关于该序列的相同性质的生物活性如前所述,即催化UDP-葡萄糖转化为UDP-葡萄糖醛酸/盐的能力。
如本文所述,与参考氨基酸序列具有至少55%氨基酸同一性的氨基酸序列涵盖与所述参考氨基酸序列具有至少56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%氨基酸同一性并且还具有与所述参考氨基酸序列相同性质的生物活性的氨基酸序列。
如本文所述,与参考氨基酸序列具有至少65%氨基酸同一性的氨基酸序列涵盖与所述参考氨基酸序列具有至少66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%氨基酸同一性并且还具有与所述参考氨基酸序列相同性质的生物活性的氨基酸序列。
如本文所述,与参考氨基酸序列具有至少80%氨基酸同一性的氨基酸序列涵盖与所述参考氨基酸序列具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%氨基酸同一性并且还具有与所述参考氨基酸序列相同性质的生物活性的氨基酸序列。
如上所提及,在本发明中具有UDP-葡萄糖脱氢酶活性的多肽的表达水平由至少一种启动子和至少一种终止子调控,例如在下文中更详细地定义,其分别存在于编码具有UDP-葡萄糖脱氢酶活性的所述多肽的核酸的5’和3’位置。
UDP-葡萄糖-4-差向异构酶(kfoA或GNE1)
UDP-葡萄糖-4-差向异构酶是一种本领域已知将UDP-N-乙酰-葡萄糖胺催化为UDP-N-乙酰-半乳糖胺的蛋白质。获自或源自铜绿假单胞菌、多杀巴斯德菌或大肠埃希氏菌的UDP-葡萄糖-4-差向异构酶可称为kfoA或GNE1。
实施测量具有UDP-葡萄糖-4-差向异构酶活性的多肽的活性水平的方法属于本领域技术人员的常识。
在这方面,本领域技术人员可以有利地参考Creuzenet等人所述的方法(2000,Journal of Biological Chemistry 275,19060-67)。
在本说明书中具有UDP-葡萄糖-4-差向异构酶活性的优选多肽是EC号为5.1.3.7的酶。
根据优选的实施方式,编码具有UDP-葡萄糖-4-差向异构酶活性的多肽的一种或多种重组核酸可获自或源自生物体,优选选自由原核生物和真核生物组成的组。在一些实施方式中,编码具有UDP-葡萄糖-4-差向异构酶活性的多肽的一种或多种重组核酸可获自或源自古细菌。在一些优选的实施方式中,编码具有UDP-葡萄糖-4-差向异构酶活性的多肽的一种或多种重组核酸可获自或源自铜绿假单胞菌、多杀巴斯德菌(Pm)或大肠埃希氏菌(Ec)。
根据又一个优选的实施方式,编码具有UDP-葡萄糖-4-差向异构酶活性的多肽的一种或多种重组核酸可选自由以下组成的组:具有(i)与如序列SEQ ID NO:42(Pa)、SEQ IDNO:43(Pm)和SEQ ID NO:44(Ec)所示的核酸序列的至少65%、有利地至少70%、优选至少80%核酸同一性,和(ii)与如序列SEQ ID NO:42(Pa)、SEQ ID NO:43(Pm)和SEQ ID NO:44(Ec)所示的相同性质的生物活性的核酸序列。
关于该序列的相同性质的生物活性如前所解释,即编码将UDP-N-乙酰-葡萄糖胺转化为UDP-N-乙酰-半乳糖胺的多肽的能力。
如本文所述,与参考核酸序列具有至少65%核苷酸同一性的核酸序列涵盖与所述参考核酸序列具有至少66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%核苷酸同一性并且还具有与所述参考核酸序列相同性质的生物活性的核酸序列。
如本文所述,与参考核酸序列具有至少70%核苷酸同一性的核酸序列涵盖与所述参考核酸序列具有至少71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%核苷酸同一性并且还具有与所述参考核酸序列相同性质的生物活性的核酸序列。
如本文所述,与参考核酸序列具有至少80%核苷酸同一性的核酸序列涵盖与所述参考核酸序列具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%核苷酸同一性并且还具有与所述参考核酸序列相同性质的生物活性的核酸序列。
对于来自铜绿假单胞菌、多杀巴斯德菌和大肠埃希氏菌的具有UDP-葡萄糖-4-差向异构酶活性的多肽的氨基酸序列,本领域技术人员可分别参考UniProt数据库中的登录号Q8KN66、AAK02370和Q8L0V2,或者参考本文所述的SEQ ID NO:45(Pa)、SEQ ID NO:46(Pm)和SEQ ID NO:47(Ec)所示的序列。
根据另一个具体的实施方式,编码具有UDP-葡萄糖-4-差向异构酶活性的多肽的一种或多种重组核酸可以是编码具有选自由以下组成的组的氨基酸序列的多肽的一种或多种核酸:具有与如SEQ ID NO:45(Pa)、SEQ ID NO:46(Pm)或SEQ ID NO:47(Ec)所示的氨基酸序列的至少55%、有利地至少65%、优选至少80%氨基酸同一性,并且还具有与SEQ IDNO:45(Pa)、SEQ ID NO:46(Pm)或SEQ ID NO:47(Ec)的氨基酸序列相同性质的生物活性的序列。
关于该序列的相同性质的生物活性如前所述,即将UDP-N-乙酰-葡萄糖胺转化为UDP-N-乙酰-半乳糖胺的能力。
如本文所述,与参考氨基酸序列具有至少55%氨基酸同一性的氨基酸序列涵盖与所述参考氨基酸序列具有至少56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%氨基酸同一性并且还具有与所述参考氨基酸序列相同性质的生物活性的氨基酸序列。
如本文所述,与参考氨基酸序列具有至少65%氨基酸同一性的氨基酸序列涵盖与所述参考氨基酸序列具有至少66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%氨基酸同一性并且还具有与所述参考氨基酸序列相同性质的生物活性的氨基酸序列。
如本文所述,与参考氨基酸序列具有至少80%氨基酸同一性的氨基酸序列涵盖与所述参考氨基酸序列具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%氨基酸同一性并且还具有与所述参考氨基酸序列相同性质的生物活性的氨基酸序列。
如上所提及,在本发明中编码具有UDP-葡萄糖-4-差向异构酶活性的多肽的一种或多种重组核酸的表达水平由至少一种启动子和至少一种终止子调控,例如在下文中更详细地定义,其分别存在于编码具有UDP-葡萄糖-4-差向异构酶活性的多肽的一种或多种重组核酸的5’和3’位置。
软骨素酶(HYAL)
软骨素酶是一种本领域中描述的用于催化软骨素分子降解成更小的软骨素分子的蛋白质。如上文所提及,具有软骨素酶活性的多肽可以是透明质酸氨基葡萄糖苷酶,例如软骨素酶或透明质酸酶。
在具体的实施方式中,具有软骨素酶活性的多肽是透明质酸酶。
具有软骨素酶活性的多肽可由萨氏九杯蛛、巴西钳蝎、家牛、西方蜜蜂、野捕恒河猴或大胡蜂的基因组编码,并且可称为HYAL。
具有软骨素酶活性的多肽可具有分泌信号和锚定信号两者,或具有分泌信号并且不具有锚定信号,或具有双重分泌和锚定功能的分泌-锚定信号。当所编码的具有软骨素酶活性的多肽具有分泌信号和锚定信号两者时,它可以被称为HYAL-31。
当所编码的具有软骨素酶活性的多肽具有分泌信号而没有锚定信号时,它可以被称为HYAL-3。
实施测量具有软骨素酶活性的多肽的活性水平的方法属于本领域技术人员的常识。
在这方面,本领域技术人员可以有利地在琼脂糖凝胶上监测所获得的软骨素的分子量。
本说明书中的具有软骨素酶活性的优选多肽是EC号为n°EC 3.2.1.35的酶。
根据优选的实施方式,编码具有软骨素酶活性的多肽的一种或多种重组核酸可获自或源自生物体,优选选自包括原核生物和真核生物的组。在一些实施方式中,编码具有软骨素酶活性的多肽的一种或多种重组核酸可获自或源自古细菌。在一些实施方式中,编码具有软骨素酶活性的多肽的一种或多种重组核酸可获自或源自生物体,优选选自酵母。在一些其他优选的实施方式中,编码具有软骨素酶活性的多肽的一种或多种重组核酸可以获自或源自萨氏九杯蛛(Csa)、巴西钳蝎(Ts)、家牛(Bt)、西方蜜蜂(Am)、野捕恒河猴(Mm)或大胡蜂(Vm),并且特别是来自巴西钳蝎(Ts)。
根据又一个优选的实施方式,编码具有软骨素酶活性的多肽的一种或多种重组核酸可选自由以下组成的组:核酸序列,其具有(i)与SEQ ID NO:48(Csa)、SEQ ID NO:49(Ts)、SEQ ID NO:50(Bt)、SEQ ID NO:51(Am)、SEQ ID NO:52(Mm)或SEQ ID NO:53(Vm)的核酸的至少65%、有利地至少70%、优选至少80%的核酸同一性,(ii)编码具有软骨素酶活性的多肽,其包含分泌信号并且无锚定信号,分别获自或源自萨氏九杯蛛、巴西钳蝎、家牛、西方蜜蜂、野捕恒河猴或大胡蜂,并且(iii)还具有与SEQ ID NO:48(Csa)、SEQ ID NO:49(Ts)、SEQ ID NO:50(Bt)、SEQ ID NO:51(Am)、SEQ ID NO:52(Mm)或SEQ ID NO:53(Vm)的序列相同性质的生物活性。
根据另一个优选的实施方式,编码具有软骨素酶活性的多肽的一种或多种重组核酸可选自由以下组成的组:核酸序列,其具有与SEQ ID NO:54(Csa)、SEQ ID NO:55(Ts)、SEQ ID NO:56(Bt)、SEQ ID NO:57(Am)、SEQ ID NO:58(Mm)或SEQ ID NO:59(Vm)的核酸的至少65%、有利地至少70%、优选至少80%的核酸同一性,(ii)编码具有软骨素酶活性的多肽,其包含分泌信号和锚定信号,分别获自或源自萨氏九杯蛛、巴西钳蝎、家牛、西方蜜蜂、野捕恒河猴或大胡蜂,并且(iii)还具有与SEQ ID NO:54(Csa)、SEQ ID NO:55(Ts)、SEQ IDNO:56(Bt)、SEQ ID NO:57(Am)、SEQ ID NO:58(Mm)或SEQ ID NO:59(Vm)的序列相同性质的生物活性。
关于该序列的相同性质的生物活性如前所解释,即编码催化软骨素分子降解为较小软骨素分子的多肽的能力。
如本文所述,与参考核酸序列具有至少65%核苷酸同一性的核酸序列涵盖与所述参考核酸序列具有至少66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%核苷酸同一性并且还具有与所述参考核酸序列相同性质的生物活性的核酸序列。
如本文所述,与参考核酸序列具有至少70%核苷酸同一性的核酸序列涵盖与所述参考核酸序列具有至少71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%核苷酸同一性并且还具有与所述参考核酸序列相同性质的生物活性的核酸序列。
如本文所述,与参考核酸序列具有至少80%核苷酸同一性的核酸序列涵盖与所述参考核酸序列具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%核苷酸同一性并且还具有与所述参考核酸序列相同性质的生物活性的核酸序列。
对于来自萨氏九杯蛛、巴西钳蝎、家牛、西方蜜蜂、野捕恒河猴或大胡蜂的透明质酸酶的氨基酸序列,本领域技术人员可分别参考UniProt数据库中的登录号A0A0S4JYH2、P85841、Q7YS45、Q08169、G7ML68或P86875,或参考本文所述的SEQ ID NO:60(Csa)、SEQ IDNO:61(Ts)、SEQ ID NO:62(Bt)、SEQ ID NO:63(Am)、SEQ ID NO:64(Mm)或SEQ ID NO:65(Vm)。
根据另一个具体的实施方式,编码具有软骨素酶活性的多肽的一种或多种重组核酸可为编码具有选自由以下序列组成的组的氨基酸序列的多肽的一种或多种核酸:与包含分泌信号且无锚定信号的SEQ ID NO:60(Csa)、SEQ ID NO:61(Ts)、SEQ ID NO:62(Bt)、SEQID NO:63(Am)、SEQ ID NO:64(Mm)或SEQ ID NO:65(Vm)的氨基酸序列具有至少55%、有利地至少65%、优选至少80%氨基酸同一性,并且还具有与序列SEQ ID NO:60(Csa)、SEQ IDNO:61(Ts)、SEQ ID NO:62(Bt)、SEQ ID NO:63(Am)、SEQ ID NO:64(Mm)或SEQ ID NO:65(Vm)相同性质的生物活性的序列。
根据另一个具体的实施方式,编码具有软骨素酶活性的多肽的一种或多种重组核酸可为编码具有选自由以下序列组成的组的氨基酸序列的多肽的一种或多种核酸:与包含分泌信号和锚定信号的SEQ ID NO:66(Csa)、SEQ ID NO:67(Ts)、SEQ ID NO:68(Bt)、SEQID NO:69(Am)、SEQ ID NO:70(Mm)或SEQ ID NO:71(Vm)的氨基酸序列具有至少55%、有利地至少65%、优选至少80%氨基酸同一性,并且还具有与SEQ ID NO:66(Csa)、SEQ ID NO:67(Ts)、SEQ ID NO:68(Bt)、SEQ ID NO:69(Am)、SEQ ID NO:70(Mm)或SEQ ID NO:71(Vm)的氨基酸序列相同性质的生物活性的序列。
关于该序列的相同性质的生物活性如前所述,即催化软骨素分子降解为较小软骨素分子的能力。
如本文所述,与参考氨基酸序列具有至少55%氨基酸同一性的氨基酸序列涵盖与所述参考氨基酸序列具有至少56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%氨基酸同一性并且还具有与所述参考氨基酸序列相同性质的生物活性的氨基酸序列。
如本文所述,与参考氨基酸序列具有至少65%氨基酸同一性的氨基酸序列涵盖与所述参考氨基酸序列具有至少66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%氨基酸同一性并且还具有与所述参考氨基酸序列相同性质的生物活性的氨基酸序列。
如本文所述,与参考氨基酸序列具有至少80%氨基酸同一性的氨基酸序列涵盖与所述参考氨基酸序列具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%氨基酸同一性并且还具有与所述参考氨基酸序列相同性质的生物活性的氨基酸序列。
如上所提及,在本发明中编码具有软骨素酶活性的多肽的一种或多种重组核酸的表达水平由至少一种启动子和至少一种终止子调控,例如在下文中更详细地定义,其分别存在于编码具有软骨素酶活性的多肽的一种或多种重组核酸的5’和3’位置。
谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)
谷氨酰胺-果糖-6-磷酸酰胺转移酶是一种蛋白质,其在本领域中被描述用于催化果糖-6-磷酸转化为葡萄糖胺-6-磷酸。来源于酿酒酵母的谷氨酰胺-果糖-6-磷酸酰胺转移酶可称为GFA1。
实施测量具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的活性水平的方法属于本领域技术人员的常识。
在这方面,本领域技术人员可以有利地参考Shiga Shibatan和Hiroaki Kitazawa(Plant Biotechnology 26,149-152,2009)所述的方法。
本发明中具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的优选多肽是EC号为n°EC2.6.1.16的酶。
根据优选的实施方式,编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的一种或多种重组核酸可来源于或源自生物体,优选选自包括原核生物和真核生物的组。在一些实施方式中,编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的一种或多种重组核酸可来源于或源自古细菌。在一些实施方式中,编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的一种或多种重组核酸可来源于或源自生物体,优选选自枯草芽孢杆菌和酵母。在一些其他优选的实施方式中,编码具有葡萄糖胺-果糖-6-磷酸酰胺转移酶活性的多肽的一种或多种重组核酸可来源于或源自酵母并且尤其是酿酒酵母。
根据又一个优选实施方式,编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的一种或多种重组核酸可选自由以下组成的组:具有(i)与如序列SEQ ID NO:72(Sc)所示的核酸序列的至少65%、有利地至少70%、优选至少80%核酸同一性,和(ii)与如序列SEQ ID NO:72所示的核酸序列相同性质的生物活性的核酸序列。如序列SEQ ID NO:72所示的核酸编码具有获自或来源于酿酒酵母的谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽,其还可称为GFA1。
根据又一个实施方式,编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的一种或多种重组核酸可选自由以下组成的组:具有(i)与如序列SEQ ID NO:73或SEQ IDNO:74所示的核酸序列的至少65%、有利地至少70%、优选至少80%核酸同一性,和(ii)与如序列SEQ ID NO:73或SEQ ID NO:74所示的核酸序列相同性质的生物活性的核酸序列。如序列SEQ ID NO:73或SEQ ID NO:74所示的核酸序列编码具有来源于小球藻属病毒PBCV1的谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽。
关于该序列的相同性质的生物活性如前所解释,即编码将果糖-6-磷酸转化为葡萄糖胺-6-磷酸的多肽的能力。
如本文所述,与参考核酸序列具有至少65%核苷酸同一性的核酸序列涵盖与所述参考核酸序列具有至少66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%核苷酸同一性并且还具有与所述参考核酸序列相同性质的生物活性的核酸序列。
如本文所述,与参考核酸序列具有至少70%核苷酸同一性的核酸序列涵盖与所述参考核酸序列具有至少71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%核苷酸同一性并且还具有与所述参考核酸序列相同性质的生物活性的核酸序列。
如本文所述,与参考核酸序列具有至少80%核苷酸同一性的核酸序列涵盖与所述参考核酸序列具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%核苷酸同一性并且还具有与所述参考核酸序列相同性质的生物活性的核酸序列。
对于源自酿酒酵母的具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的氨基酸序列,本领域技术人员可参考UniProt数据库中的登录号NP8012818,或参考本文所述的序列SEQ ID NO:75。
对于源自小球藻属病毒PBCV1的具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的氨基酸序列,本领域技术人员可参考UniProt数据库中的登录号NP_048448,或参考本文所述的序列SEQ ID NO.76。
根据另一个具体的实施方式,编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的一种或多种重组核酸可以是编码具有选自由以下组成的组的氨基酸序列的多肽的一种或多种核酸:具有与SEQ ID NO:75和SEQ ID NO.76的氨基酸序列的至少35%、有利地至少65%、优选至少80%的氨基酸同一性,并且还具有与SEQ ID NO:75或SEQ ID NO:76的氨基酸序列相同性质的生物活性的序列。
关于该序列的相同性质的生物活性如前所述,即催化果糖-6-磷酸转化为葡萄糖胺-6-磷酸的能力。
如本文所述,与参考氨基酸序列具有至少35%氨基酸同一性的氨基酸序列涵盖与所述参考氨基酸序列具有至少36%、37%、38%、39%、40%41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%氨基酸同一性并且还具有与所述参考氨基酸序列相同性质的生物活性的氨基酸序列。
如本文所述,与参考氨基酸序列具有至少65%氨基酸同一性的氨基酸序列涵盖与所述参考氨基酸序列具有至少66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%氨基酸同一性并且还具有与所述参考氨基酸序列相同性质的生物活性的氨基酸序列。
如本文所述,与参考氨基酸序列具有至少80%氨基酸同一性的氨基酸序列涵盖与所述参考氨基酸序列具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%氨基酸同一性并且还具有与所述参考氨基酸序列相同性质的生物活性的氨基酸序列。
如上所提及,本发明中具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的表达水平由至少一种启动子和至少一种终止子调控,例如在下文中更详细地定义,其分别存在于编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶活性的多肽的一种或多种重组核酸的5’和3’位置。
UDP-N-乙酰葡萄糖胺焦磷酸化酶(QRI1)
UDP-N-乙酰葡萄糖胺焦磷酸化酶是一种在本领域中被描述用于催化N-乙酰-葡萄糖胺-6-磷酸转化为UDP-N-乙酰-葡萄糖的蛋白质。源自酿酒酵母的UDP-N-乙酰葡萄糖胺焦磷酸化酶可称为QRI1。
实施测量具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的活性水平的方法属于本领域技术人员的常识。
在这方面,本领域技术人员可以有利地参考Mio等人所述的方法(The Journal ofBiological Chemistry,Col.273,No 23,1998年6月5日,14392-14397),不同之处在于UDP-N-乙酰-葡萄糖胺是使用Synergi RP Fusion柱通过LC MS/MS检测的。
本发明中具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的优选多肽是EC号为n°EC2.7.7.23的酶。
根据优选的实施方式,编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的一种或多种重组核酸可来源于或源自生物体,优选选自由原核生物和真核生物组成的组。在一些实施方式中,编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的一种或多种重组核酸可来源于或源自古细菌。在一些实施方式中,编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的一种或多种重组核酸可来源于或源自生物体,优选选自枯草芽孢杆菌和酵母。在一些其他优选的实施方式中,编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的一种或多种重组核酸可来源于或源自酵母,并且尤其是酿酒酵母。
根据又一个优选的实施方式,编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的一种或多种重组核酸可选自由以下组成的组:具有(i)与如序列SEQ ID NO:77所示的核酸序列的至少65%、有利地至少70%、优选至少80%核酸同一性,和(ii)与如SEQ ID NO:77所示的核酸序列相同性质的生物活性的核酸序列。如SEQ ID NO:77所示的核酸序列编码源自酿酒酵母的具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽,其还可称为QRI1。
关于该序列的相同性质的生物活性如前所解释,即编码将N-乙酰-葡萄糖胺-6-磷酸转化为UDP-N-乙酰-葡萄糖的多肽的能力。
如本文所述,与参考核酸序列具有至少65%核苷酸同一性的核酸序列涵盖与所述参考核酸序列具有至少66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%核苷酸同一性并且还具有与所述参考核酸序列相同性质的生物活性的核酸序列。
如本文所述,与参考核酸序列具有至少70%核苷酸同一性的核酸序列涵盖与所述参考核酸序列具有至少71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%核苷酸同一性并且还具有与所述参考核酸序列相同性质的生物活性的核酸序列。
如本文所述,与参考核酸序列具有至少80%核苷酸同一性的核酸序列涵盖与所述参考核酸序列具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%核苷酸同一性并且还具有与所述参考核酸序列相同性质的生物活性的核酸序列。
对于源自酿酒酵母的具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的氨基酸序列,本领域技术人员可参考UniProt数据库中的登录号NP_010180,或参考本文所述的SEQID NO.78。
根据另一个具体的实施方式,编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的一种或多种重组核酸可为编码具有选自由以下组成的组的氨基酸序列的多肽的一种或多种核酸:与序列SEQ ID NO.78所示的氨基酸序列具有至少35%、有利地至少45%、优选至少80%氨基酸同一性并且还具有与序列SEQ ID NO.78所示的氨基酸序列相同性质的生物活性的序列。
关于该序列的相同性质的生物活性如前所述,即催化N-乙酰-葡萄糖胺-6-磷酸转化为UDP-N-乙酰-葡萄糖的能力。
如本文所述,与参考氨基酸序列具有至少35%氨基酸同一性的氨基酸序列涵盖与所述参考氨基酸序列具有至少36%、37%、38%、39%、40%41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%氨基酸同一性并且还具有与所述参考氨基酸序列相同性质的生物活性的氨基酸序列。
如本文所述,与参考氨基酸序列具有至少45%氨基酸同一性的氨基酸序列涵盖与所述参考氨基酸序列具有至少46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%氨基酸同一性并且还具有与所述参考氨基酸序列相同性质的生物活性的氨基酸序列。
如本文所述,与参考氨基酸序列具有至少80%氨基酸同一性的氨基酸序列涵盖与所述参考氨基酸序列具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%氨基酸同一性并且还具有与所述参考氨基酸序列相同性质的生物活性的氨基酸序列。
如上所提及,在本发明中编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的一种或多种重组核酸的表达水平由至少一种启动子和至少一种终止子调控,例如在下文中更详细地定义,其分别存在于编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶活性的多肽的一种或多种重组核酸的5’和3’位置。
磷酸葡萄糖变位酶-1(PGM1)
磷酸葡萄糖变位酶-1酶是一种蛋白质,其在本领域中被描述用于催化葡萄糖-6-磷酸转化为葡萄糖-1-磷酸。来源于酿酒酵母的磷酸葡萄糖变位酶-1可称为PGM1。
实施测量具有磷酸葡萄糖变位酶-1活性的多肽的活性水平的方法属于本领域技术人员的常识。
就此而言,本领域技术人员可以有利地参考Tiwari和Bhat描述的方法(Biochemical and Biophysical Research Communications 366,340-345,2008)。
本发明中的具有磷酸葡萄糖变位酶-1活性的优选多肽是EC号为n°5.4.2.2的酶。
根据优选的实施方式,编码具有磷酸葡萄糖变位酶-1活性的多肽的一种或多种重组核酸可来源于生物体,优选选自由原核生物和真核生物组成的组。在一些实施方式中,编码具有磷酸葡萄糖变位酶-1活性的多肽的一种或多种重组核酸可来源于或源自古细菌。在一些实施方式中,编码具有磷酸葡萄糖变位酶-1活性的多肽的一种或多种重组核酸可来源于或源自生物体,优选选自细菌。在优选的实施方式中,编码具有磷酸葡萄糖变位酶-1活性的多肽的一种或多种重组核酸可来源于或源自酿酒酵母。
根据一个实施方式,编码具有磷酸葡萄糖变位酶-1活性的多肽的一种或多种重组核酸可选自由以下组成的组:具有(i)与如序列SEQ ID NO:79所示的核酸序列的至少80%核酸同一性,和(ii)与如序列SEQ ID NO:79所示的核酸序列相同性质的生物活性的核酸序列。
关于该序列的相同性质的生物活性如前所解释,即编码将葡萄糖-6-磷酸转化为葡萄糖-1-磷酸的多肽的能力。
如本文所述,与参考核酸序列具有至少80%核苷酸同一性的核酸序列涵盖与所述参考核酸序列具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%核苷酸同一性并且还具有与所述参考核酸序列相同性质的生物活性的核酸序列。
对于来自酿酒酵母的具有磷酸葡萄糖变位酶-1活性的多肽的氨基酸序列,本领域技术人员可参考UniProt数据库中的登录号NP33401,或参考本文所述的SEQ ID NO.80。
根据另一个具体的实施方式,编码具有磷酸葡萄糖变位酶-1活性的多肽的一种或多种重组核酸可以是编码具有选自由以下组成的组的氨基酸序列的多肽的一种或多种核酸:具有与如序列SEQ ID NO:80所示的氨基酸序列的至少80%氨基酸同一性,并且还具有与如序列SEQ ID NO:80所示的氨基酸序列的相同性质的生物活性的序列。
关于该序列的相同性质的生物活性如前所述,即催化葡萄糖-6-磷酸转化为葡萄糖-1-磷酸的能力。
如本文所述,与参考氨基酸序列具有至少80%氨基酸同一性的氨基酸序列涵盖与所述参考氨基酸序列具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%氨基酸同一性并且还具有与所述参考氨基酸序列相同性质的生物活性的氨基酸序列。
如上所提及,在本发明中编码具有磷酸葡萄糖变位酶-1活性的多肽的一种或多种重组核酸的表达水平由至少一种启动子和至少一种终止子调控,例如在下文中更详细地定义,其分别存在于编码具有磷酸葡萄糖变位酶-1活性的多肽的一种或多种重组核酸的5’和3’位置。
UTP-葡萄糖-1-磷酸尿苷酰转移酶(UGP1)
UTP-葡萄糖-1-磷酸尿苷酰转移酶是一种蛋白质,其在本领域中被描述用于催化葡萄糖-1-磷酸转化为UDP-葡萄糖。源自酿酒酵母的UTP-葡萄糖-1-磷酸尿苷酰转移酶可称为UGP1。
实施测量具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的活性水平的方法属于本领域技术人员的常识。
在这方面,本领域技术人员可以有利地参考Roeben等人所述的方法(J.Mol.Biol364,551-560,2006)。
本发明中的具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的优选多肽是EC号为n°2.7.7.9的酶。
根据优选的实施方式,编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的一种或多种重组核酸可来源于或源自生物体,优选选自由原核生物和真核生物组成的组。在一些实施方式中,编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的一种或多种重组核酸可来源于或源自古细菌。在一些实施方式中,编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的一种或多种重组核酸可来源于或源自生物体,优选选自细菌。在优选的实施方式,编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的一种或多种重组核酸可来源于或源自酿酒酵母。
根据具体的实施方式,编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的一种或多种重组核酸可选自由以下组成的组:具有(i)与如SEQ ID NO:81所示的核酸的至少80%核酸同一性,和(ii)与如SEQ ID NO:81所示的核酸相同性质的生物活性的核酸序列。
关于该序列的相同性质的生物活性如前所解释,即编码将葡萄糖-1-磷酸转化为UDP-葡萄糖的多肽的能力。
如本文所述,与参考核酸序列具有至少80%核苷酸同一性的核酸序列涵盖与所述参考核酸序列具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%核苷酸同一性并且还具有与所述参考核酸序列相同性质的生物活性的核酸序列。
对于源自酿酒酵母的具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的氨基酸序列,本领域技术人员可参考UniProt数据库中的登录号NP_32861,或参考本文所述的序列SEQ ID NO.82所示的序列。
根据另一个具体的实施方式,编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的一种或多种重组核酸可以是编码具有选自由以下组成的组的氨基酸序列的多肽的一种或多种核酸:具有与SEQ ID NO:82所示的氨基酸序列的至少80%氨基酸同一性,和还有与如SEQ ID NO:82所示的氨基酸序列相同性质的生物活性的序列。
关于该序列的相同性质的生物活性如前所述,即催化葡萄糖-1-磷酸转化为UDP-葡萄糖的能力。
如本文所述,与参考氨基酸序列具有至少80%氨基酸同一性的氨基酸序列涵盖与所述参考氨基酸序列具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%氨基酸同一性并且还具有与所述参考氨基酸序列相同性质的生物活性的氨基酸序列。
如上所提及,在本发明中编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的一种或多种重组核酸的表达水平由至少一种启动子和至少一种终止子调控,例如在下文中更详细地定义,其分别存在于编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶活性的多肽的一种或多种重组核酸的5’和3’位置。
葡萄糖胺-6-磷酸N-乙酰转移酶(GNA1)
葡萄糖胺-6-磷酸N-乙酰转移酶是一种蛋白质,其在本领域中被描述用于催化葡萄糖胺-6-磷酸转化为N-乙酰-葡萄糖胺-6-磷酸。源自酿酒酵母的葡萄糖胺-6-磷酸N-乙酰转移酶可被称为GNA1。
实施测量具有葡萄糖胺-6-磷酸N-乙酰转移酶活性的多肽的活性水平的方法属于本领域技术人员的常识。
在这方面,本领域技术人员可以有利地参考Li等人所述的方法(Anal.Biochem.370,142-146,2007)。
本发明中具有葡萄糖胺-6-磷酸N-乙酰转移酶活性的优选多肽是一种EC号为n°2.3.1.4的酶。
根据优选的实施方式,编码具有葡萄糖胺-6-磷酸N-乙酰转移酶活性的多肽的一种或多种重组核酸可来源于或源自生物体,优选选自由原核生物和真核生物组成的组。在一些优选的实施方式中,编码具有葡萄糖胺-6-磷酸N-乙酰转移酶活性的多肽的一种或多种重组核酸可来源于或源自酵母并且尤其是酿酒酵母。
根据具体的实施方式,编码具有葡萄糖胺-6-磷酸N-乙酰转移酶活性的多肽的一种或多种重组核酸可选自由以下组成的组:具有(i)与如序列SEQ ID NO:83所示的核酸序列的至少80%核酸同一性,和(ii)与如序列SEQ ID NO:83所示的核酸序列相同性质的生物活性的核酸序列。如序列SEQ ID NO:83所示的核酸序列编码源自酿酒酵母的具有葡萄糖胺-6-磷酸N-乙酰转移酶活性的多肽,其还可称为GNA1。
关于该序列的相同性质的生物活性如前所解释,即将葡萄糖胺-6-磷酸转化为N-乙酰-葡萄糖胺-6-磷酸的多肽的能力。
如本文所述,与参考核酸序列具有至少80%核苷酸同一性的核酸序列涵盖与所述参考核酸序列具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%核苷酸同一性并且还具有与所述参考核酸序列相同性质的生物活性的核酸序列。
对于获自或源自酿酒酵母的具有葡萄糖胺-6-磷酸N-乙酰转移酶活性的多肽的氨基酸序列,本领域技术人员可参考UniProt数据库中的登录号NP_116637,或参考本文所述的SEQ ID NO.84。
根据另一个具体的实施方式,编码具有葡萄糖胺-6-磷酸N-乙酰转移酶活性的多肽的一种或多种重组核酸可以是编码具有选自由以下组成的组的氨基酸序列的多肽的一种或多种核酸:具有与SEQ ID NO:84所示的氨基酸序列的至少80%氨基酸同一性,和还有与如SEQ ID NO:84所示的氨基酸序列相同性质的生物活性的序列。
关于该序列的相同性质的生物活性如前所述,即催化葡萄糖胺-6-磷酸转化为N-乙酰-葡萄糖胺-6-磷酸的能力。
如本文所述,与参考氨基酸序列具有至少80%氨基酸同一性的氨基酸序列涵盖与所述参考氨基酸序列具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%氨基酸同一性并且还具有与所述参考氨基酸序列相同性质的生物活性的氨基酸序列。
如上所提及,在本发明中编码具有葡萄糖胺-6-磷酸N-乙酰转移酶活性的多肽的一种或多种重组核酸的表达水平由至少一种启动子和至少一种终止子调控,例如在下文中更详细地定义,其分别存在于编码具有葡萄糖胺-6-磷酸N-乙酰转移酶活性的多肽的一种或多种重组核酸的5’和3’位置。
磷酸乙酰葡萄糖胺变位酶(PCM1)
磷酸乙酰葡萄糖胺变位酶一种蛋白质,其在本领域中被描述用于催化N-乙酰-葡萄糖胺-6-磷酸转化为N-乙酰-葡萄糖胺-1-磷酸。源自酿酒酵母的磷酸乙酰葡萄糖胺变位酶可称为PCM1。
实施测量具有磷酸乙酰葡萄糖胺变位酶活性的多肽的活性水平的方法属于本领域技术人员的常识。
在这方面,本领域技术人员可以有利地参考Bandini等人所述的方法(MolecularMicrobiology 85(3),513-534,2012)。
本发明中具有磷酸乙酰葡萄糖胺变位酶活性的优选多肽是EC号为n°5.4.2.3的酶。
根据优选的实施方式,编码具有磷酸乙酰葡萄糖胺变位酶活性的多肽的一种或多种重组核酸可来源于或源自生物体,优选选自由原核生物和真核生物组成的组。在一些优选的实施方式中,编码具有磷酸乙酰葡萄糖胺变位酶活性的多肽的一种或多种重组核酸可来源于或源自酵母,并且尤其是酿酒酵母。
根据具体的实施方式,编码具有磷酸乙酰葡萄糖胺变位酶活性的多肽的一种或多种重组核酸可选自由以下组成的组:具有(i)与如序列SEQ ID NO:85所示的核酸序列的至少80%核酸同一性,和(ii)与如SEQ ID NO:85所示的核酸序列相同性质的生物活性的核酸序列。如SEQ ID NO:85所示的核酸编码具有源自酵母的磷酸乙酰葡萄糖胺变位酶活性的多肽,其还可称为PCM1。
关于该序列的相同性质的生物活性如前所解释,即将N-乙酰-葡萄糖胺-6-磷酸转化为N-乙酰-葡萄糖胺-1-磷酸的多肽的能力。
如本文所述,与参考核酸序列具有至少80%核苷酸同一性的核酸序列涵盖与所述参考核酸序列具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%核苷酸同一性并且还具有与所述参考核酸序列相同性质的生物活性的核酸序列。
对于源自酿酒酵母的具有磷酸乙酰葡萄糖胺变位酶活性的多肽的氨基酸序列,本领域技术人员可参考UniProt数据库中的登录号NP_010856,或参考本文所述的SEQ IDNO.86。
根据另一个具体的实施方式,编码具有磷酸乙酰葡萄糖胺变位酶活性的多肽的一种或多种重组核酸可以是编码具有选自由以下组成的组的氨基酸序列的多肽的一种或多种核酸:具有与SEQ ID NO:86所示的氨基酸序列的至少80%氨基酸同一性,和还有与如SEQID NO:86所示的氨基酸序列相同性质的生物活性的序列。
关于该序列的相同性质的生物活性如前所述,即催化N-乙酰-葡萄糖胺-6-磷酸转化为N-乙酰-葡萄糖胺-1-磷酸的能力。
如本文所述,与参考氨基酸序列具有至少80%氨基酸同一性的氨基酸序列涵盖与所述参考氨基酸序列具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%氨基酸同一性并且还具有与所述参考氨基酸序列相同性质的生物活性的氨基酸序列。
如上所提及,在本发明中编码具有磷酸乙酰葡萄糖胺变位酶活性的多肽的一种或多种重组核酸的表达水平由至少一种启动子和至少一种终止子调控,例如在下文中更详细地定义,其分别存在于编码具有磷酸乙酰葡萄糖胺变位酶活性的多肽的一种或多种重组核酸的5’和3’位置。
启动子
如本文所公开,已被遗传工程化以获得根据本发明的重组细胞的目标基因的表达包含在本发明的重组细胞中并且特别是在本发明的重组酵母细胞(特别包括酿酒酵母)中具有功能的适当调控序列。
多种启动子可用于目标编码序列的所想要表达。
根据本发明的启动子可以选自由下列启动子组成的组:
·pTDH3(SEQ ID NO:87)、
·pTDH3.Sk(SEQ ID NO:88)、
·pTDH3-1.Sba(SEQ ID NO:89)、
·pTDH3.Sar(SEQ ID NO:90)、
·pENO2(SEQ ID NO:91)、
·pTEF3(SEQ ID NO:92)、
·pTEF1(SEQ ID NO:93)、
·pTEF1.Ago(SEQ ID NO:94)、
·pTEF1.sba(SEQ ID NO:95)、
·pPDC1(SEQ ID NO:96)、
·pCCW12(SEQ ID NO:97)、
·pCCW12.Sm(SEQ ID NO:98)、
·pCCW12.sk(SEQ ID NO:99)、
·pCCW12.sba(SEQ ID NO:100)、
·pCCW12.sar(SEQ ID NO:101)、
·pNUP57(SEQ ID NO:102)、
·pCCW10.ago(SEQ ID NO:103)、
·pCWP2(SEQ ID NO:104)、
·pFBA1(SEQ ID NO:105)、
·pCCW120.Sm(SEQ ID NO:106)。
在本发明中更特别的明白启动子可以选自由以下组成的组:
·pTDH3(SEQ ID NO:87)、
·pTDH3.Sk(SEQ ID NO:88)、
·pTDH3-1.Sba(SEQ ID NO:89)、
·pTDH3.Sar(SEQ ID NO:90)、
·pENO2(SEQ ID NO:91)、
·pTEF3(SEQ ID NO:92)、
·pTEF1(SEQ ID NO:93)、
·pTEF1.Ago(SEQ ID NO:94)、
·pTEF1.sba(SEQ ID NO:95)、
·pPDC1(SEQ ID NO:96)、
·pCCW12(SEQ ID NO:97)、
·pCCW12.sba(SEQ ID NO:100)、
·pCCW120.Sm(SEQ ID NO:106)、
·pNUP57(SEQ ID NO:102)、
·pCCW10.ago(SEQ ID NO:103)、
·pCWP2(SEQ ID NO:104)和
·pFBA1(SEQ ID NO:105)。
特别地,所述终止子可以选自由pTDH3、pTDH3.Sk、pTDH3-1.Sba、pTEF1、pTEF1.Ago、pTEF1.sba、pCCW12、pCCW120.Sm、pCWP2和pFBA1组成的组。
替选地,在本发明中的目标启动子可选自由以下组成的组:
·pNUP57(SEQ ID NO:102)和
·pCCW10.ago(SEQ ID NO:103)。
本发明中的另一目标启动子可为:
·pCWP2(SEQ ID NO:104)。
如前所提及,诱导型或阻遏型启动子是其活性受生物或非生物因子的存在或不存在以及还有所述因子的量控制的启动子。因此,对于一些启动子,当给定因子的量增加或被增加时,它们的活性将特别被诱导并因此增加,并且相应地,当所述因子的量减少或被减少时,这些相同启动子的活性可以被阻遏并因此降低。包含诱导型或阻遏型启动子的本发明的重组酵母细胞的培养基中的所述一种或多种因子的量可以由本领域技术人员决定并因此控制。
例如,增加包含pCUP1启动子的根据本发明的重组酵母细胞的培养基中铜的量将诱导并因此增加该启动子控制下的基因的转录。相反,减少所述培养基中铜的量将导致阻遏,并因此导致该启动子控制下的基因转录减少。
在另一个实例中,增加包含pMET6启动子的根据本发明的重组酵母细胞的培养基中甲硫氨酸的量将阻遏并因此减少该启动子控制下的基因的转录。相反,减少所述培养基中甲硫氨酸的量将导致该启动子控制下的基因转录诱导,并因此导致该启动子控制下的基因转录增加。
为此,以下启动子在本上下文中被称为诱导型或阻遏型启动子。
根据第一实施方式,根据本发明的诱导型或阻遏型启动子可以选自包括以下的组:铜诱导型或阻遏型的启动子、甲硫氨酸诱导型或阻遏型启动子以及苏氨酸诱导型或阻遏型启动子,并且特别是CUP-1-铜诱导型或阻遏型。
根据该实施方式,根据本发明的诱导型或阻遏型启动子可以特别是pCUP1(SEQ IDNO:107)。
因此,如上所指定,这些启动子的活性是通过增加甲硫氨酸、铜或苏氨酸的存在来诱导的,并且当甲硫氨酸、铜或苏氨酸的量减少时,它们的活性减弱,即受阻遏。
根据第二实施方式,根据本发明的诱导型或阻遏型启动子可以选自包括以下的组:铜诱导型或阻遏型启动子、赖氨酸诱导型或阻遏型启动子以及甲硫氨酸诱导型或阻遏型启动子,并且特别选自由以下组成的组:
·pMET6-甲硫氨酸诱导型或阻遏型(SEQ ID NO:108)、
·pMET25-甲硫氨酸诱导型或阻遏型(SEQ ID NO:109)和
·pSAM1-甲硫氨酸诱导型或阻遏型(SEQ ID NO:110)。
根据该具体的实施方式,根据本发明的诱导型或阻遏型启动子可以选自由pMET6和pSAM1组成的组。
因此,这些启动子的活性被如上所指定的甲硫氨酸、铜、赖氨酸或葡萄糖的存在增加所抑制,并且当甲硫氨酸、铜、赖氨酸或葡萄糖的量减少时,它们的活性增加,即被诱导。
在具体的实施方式中,根据本发明的诱导型或阻遏型启动子可以选自包括以下的组:铜诱导型或阻遏型启动子、葡萄糖诱导型或阻遏型启动子、赖氨酸诱导型或阻遏型启动子、甲硫氨酸诱导型或阻遏型启动子,和苏氨酸诱导型或阻遏型启动子。
还可以使用如Blazeck&Alper(2013)Biotechnol.J.8 46-58所述的合成启动子。
本发明的启动子可来源于来自酵母菌纲的任何生物体,并且可以特别来源于选自由以下中至少一者组成的组的生物体:酿酒酵母、布拉氏酵母、卡氏酵母、贝酵母、树生酵母(Saccharomyces arboricola)、库德里阿兹威酵母、米卡酵母、棉阿舒囊霉、乳酸克鲁维酵母(Kluveromyces lactis)、巴斯德毕赤酵母(Pichia pastoris)、光滑念珠菌、热带念珠菌、卡氏德巴利酵母(Debaryomyces castelii)、解脂耶氏酵母(Yarrowia lipolitica)和杰丁塞伯林德纳氏酵母(Cyberlindnera jadinii)。
本发明的启动子可以优选来源于选自由以下组成的组的生物体:酿酒酵母(sc)、米卡酵母(Sm)、库德里阿兹威酵母(sk)、贝酵母(sba)、树生酵母(Sar)和棉阿舒囊霉(Ago)。
终止子
如其在本文中所公开,已被遗传工程化以获得根据本发明的重组细胞并且特别是根据本发明的重组酵母的目标基因的表达包含在本发明的重组细胞中并且特别是在本发明的重组酵母细胞中(特别酿酒酵母中)具有功能的适当转录终止子序列。
相同或不同的所述转录终止子可见于文献Yamanishi等人,(2013)ACS syntheticbiology2,337-347。
本发明中更特别的目标终止子可以选自包括以下的组:
·来自编码磷酸丙糖异构酶的基因的tTPI1(SEQ ID NO:111),
·来自编码O-乙酰高丝氨酸-O-乙酰丝氨酸硫化氢解酶的基因的tMET25(SEQ IDNO:112)、
·tDIT1(SEQ ID NO:113)、
·tRPL3(SEQ ID NO:114)、
·tRPL3.sm(SEQ ID NO:115)、
·tRPL3.sba(SEQ ID NO:116)、
·tRPL41B(SEQ ID NO:117)、
·tRPL41B.Sba(SEQ ID NO:118)、
·tRPL15A(SEQ ID NO:119)、
·tRPL15A.Sm(SEQ ID NO:120)、
·tRPL15A.sba(SEQ ID NO:121)、
·tIDP1(SEQ ID NO:122)、
·tIDP1.Sba(SEQ ID NO:123)和
·tTEF1.sba(SEQ ID NO:124)。
本发明中更特别的目标终止子可以选自包括以下的组:
·来自编码磷酸丙糖异构酶的基因的tTPI1(SEQ ID NO:111)、
·来自编码O-乙酰高丝氨酸-O-乙酰丝氨酸硫化氢解酶的基因的tMET25(SEQ IDNO:112)、
·tDIT1(SEQ ID NO:113)、
·tRPL3(SEQ ID NO:114)、
·tRPL3.Sm(SEQ ID NO:115)、
·tRPL3.sba(SEQ ID NO:116)、
·tRPL41B(SEQ ID NO:117)、
tRPL41B.Sba(SEQ ID NO:118)、
·tRPL15A(SEQ ID NO:119)、
·tRPL15A.Sm(SEQ ID NO:120)、
·tIDP1(SEQ ID NO:122)、
·tIDP1.Sba(SEQ ID NO:123)和
·tTEF1.sba(SEQ ID NO:124)。
特别地,所述终止子可以选自由tTPI1、tDIT11、tRPL3、tRPL3.Sm、tRPL41B、tRPL41B.Sba、tRPL15A、tRPL15A.Sm、tIDP1、tIDP1.Sba和tTEF1.sba组成的组。
本发明的终止子可以来源于来自酵母菌纲的任何生物体,并且特别可以来源于选自由酿酒酵母(sc)、米卡酵母(Sm)和贝酵母(sba)组成的组的生物体。
重组细胞
本发明的重组细胞可以选自由酵母和细菌组成的组。
本发明的重组细胞、例如本发明的重组宿主细胞优选是重组酵母细胞。
通常,与细菌相比,酵母可以快速生长并且可以以更高的密度培养,并且不需要工业环境中的无菌环境。此外,酵母细胞可以与细菌细胞相比更容易从培养基中分离,大大简化了产品提取和纯化的工艺。
本发明的重组细胞、并且特别是本发明的重组酵母细胞优选是酵母目细胞。
根据本发明的重组细胞并且特别是本发明的重组酵母可以特别属于酵母属,或属于念珠菌属,或属于克鲁维酵母菌属,或属于汉逊酵母属,或属于耶氏酵母属,或属于德巴利酵母属,或属于阿舒囊霉属。
属于酵母属的本发明的重组细胞可以选自由以下组成的组:酿酒酵母、布拉氏酵母、贝酵母、奇异酵母、米卡酵母、卡氏酵母、里约酵母(Saccharomyces cariocanus)、库德里阿兹威酵母、树生酵母(Saccharomyces arboricolus)、巴斯德酵母(Saccharomycespastorianus)、葡萄汁酵母(Saccharomyces uvarum)和德尔布酵母(Saccharomycesdelbrueckii)。
属于念珠菌属的本发明的重组细胞可以选自由以下组成的组:白念珠菌、光滑念珠菌(Candida glabrata)、热带念珠菌(Candida tropicalis)、都柏林念珠菌(Candidadubliniensis)、近平滑念珠菌(Candida parapsilosis)、葡萄牙念珠菌(Candidalusitaniae)和吉利蒙念珠菌(Candida guilliermondii)。
属于克鲁维酵母属的本发明的重组细胞可以选自由以下组成的组:乳酸克鲁维酵母、马克斯克鲁维酵母、多孢克鲁维酵母、耐热克鲁维酵母、多布克鲁维酵母(Kluyveromyces dobzhanskii)和柳叶克鲁维酵母(Kluyveromyces wickerhamii)。
属于汉逊酵母属的本发明的重组细胞可以选自由以下组成的组:多形汉逊酵母、Ogataea histrianica、Ogataea deakii、Ogataea kolombanensis、Ogataea philodendra、暹罗汉逊酵母(Ogataea siamensis)、狭窄汉逊酵母(Ogataea angusta)、副多形汉逊酵母(Ogataea parapolymorpha)、Ogataea minuta、非发酵汉逊酵母(Ogataea nonfermentans)和Ogataea kodamae。
属于耶氏酵母属的本发明的重组细胞可以选自由以下组成的组:解脂耶氏酵母、Yarrowia parophonii、Yarrowia galli、奥斯陆耶氏酵母(Yarrowia oslonensis)、营养耶氏酵母(Yarrowia alimentaria)、荷兰耶氏酵母(Yarrowia hollandica)和Yarrowiayakushimensis。
属于德巴利酵母属的本发明的重组细胞可以选自由以下组成的组:汉逊德巴利酵母、卡森德巴利酵母(Debaryomyces carsonii)、卡氏德巴利酵母(Debaryomycescastellii)、Debaryomyces marama、西方德巴利酵母(Debaryomyces occidentalis)、卵形德巴利酵母(Debaryomyces oviformis)、尼泊尔德巴利酵母(Debaryomyces nepalensis)、Debaryomyces coudertii、乌德尼德巴利酵母(Debaryomyces udenii)、Debaryomycespsychrosporus和山田德巴利酵母(Debaryomyces yamadae)。
属于阿舒囊霉属的本发明的重组细胞可以选自由棉阿舒囊霉和Ashbya aceri组成的组。
本发明的重组细胞,并且特别是本发明的重组酵母细胞可以特别选自由以下组成的组:酿酒酵母、布拉氏酵母、贝酵母、奇异酵母、米卡酵母、卡氏酵母、白念珠菌、光滑念珠菌、热带念珠菌、乳酸克鲁维酵母、马克斯克鲁维酵母、多孢克鲁维酵母、耐热克鲁维酵母、多形汉逊酵母、解脂耶氏酵母、汉逊德巴利酵母和棉阿舒囊霉,并且优选酿酒酵母。
在具体的实施方式中,根据本发明的重组酵母细胞属于酵母属、克鲁维酵母属或假囊酵母属(Eremothecium),更特别地属于选自由以下组成的组的物种:酿酒酵母、马克斯克鲁维酵母、多形汉逊酵母和棉阿舒囊霉。
在一个实施方式中,本发明的重组宿主细胞是所选的酵母,其属于酵母菌目,特别是酵母菌科,并且特别选自由以下各项组成的组:解脂耶氏酵母、马克斯克鲁维酵母、多形汉逊酵母、棉阿舒囊霉和酿酒酵母。
本发明的重组细胞可最优选为酿酒酵母细胞。
如上所提及,根据本发明的重组细胞具有通过插入根据本发明的一种或多种重组核酸而生产软骨素的能力。在某些实施方式中,根据本发明的重组酵母具有通过插入根据本发明的一种或多种重组核酸而生产具有受控尺寸的软骨素的能力。
经实施以将特定DNA构建体插入基因内的方法属于本领域技术人员的常识。在实施例之后本文中更详细地描述相关方法。
然而,遇到了意想不到的技术困难,因为将DNA构建体插入细胞基因组内并且特别是酵母基因组内,例如酿酒酵母基因组内的后果是不可预测的。特别地,细胞并且特别是酵母的存活率、以及它们生长和生产所想要软骨素的能力也是不可预测的。
为了获得本发明的重组细胞并且特别是重组酵母,发明人测试了许多不同的构建体,以获得可行且有效的重组细胞,并且特别是酵母。
培养条件
本发明还涉及本发明的重组细胞用于生产软骨素、特别是具有受控分子量的软骨素的用途。
本发明还涉及一种生产具有所想要分子量的软骨素的方法,其包括:
(a)在培养基中培养如本文所定义的重组细胞持续足以生产具有所想要分子量的软骨素的时间;和
(b)任选地从所述重组细胞和/或从所述培养基分离或回收所述软骨素。通常,将本发明的细胞并且特别是本发明的酵母在适当的培养基中在约20℃至约37℃范围内的温度下、优选在27至34℃范围内的温度下生长。
适用于本发明的细胞并且特别是本发明的酵母的生长培养基是常见的商业制备的培养基,例如包含酵母氮基、硫酸铵和葡萄糖作为碳/能源的液体培养基,或YPD培养基,一种最适合生长的最佳比例的蛋白胨、酵母提取物和葡萄糖的掺混物。也可以使用其他限定的或合成的生长培养基,并且用于特别细胞并且特别是酵母生长的适当培养基是微生物学或发酵科学领域的技术人员已知的。
适用于本文的特别培养基是SY培养基,其包含以下组分:
KH2PO4:100mM;MgSO4 7H2O:2,8mM;K2SO4:11,5mM;Na2SO4:1,1mM;NaCl:2,6mM;CaCl22H2O:0,7mM;CuSO4 5H2O:15μM;KI:6μM;FeCl3:30μM;ZnSO4 7H2O:61μM;MnSO4 H2O:25μM;H2SO4:110μM;泛酸半钙盐:42μM;硫胺盐酸盐:59μM;吡哆醇盐酸盐:49μM;肌醇(C6H12O6):555μM;烟酸(C6H5NO2):29μM;D-生物素:0,82μM;柠檬酸三铵:33mM;和葡萄糖或蔗糖2-30%。
可用于培养基中的碳源包括但不限于单糖,例如果糖、甘露糖、木糖和阿拉伯糖;寡聚糖,例如乳糖、麦芽糖、半乳糖或蔗糖;多糖,例如淀粉或纤维素或其混合物,以及来自可再生原料的未纯化混合物,例如奶酪乳清渗透玉米浆、甜菜糖蜜和大麦麦芽。
培养基中可包含的氮源包括蛋白胨、酵母提取物、肉提取物、麦芽提取物、尿素、硫酸铵、氯化铵、硝酸铵、磷酸铵、柠檬酸铵及其组合。
培养基还可包含微量元素(例如金属盐),例如镁盐、钴盐和/或锰盐;以及生长因子例如氨基酸、维生素、生长促进剂等。
可以包含的维生素的实例是泛酸半钙、硫胺盐酸盐;吡哆醇盐酸盐;肌醇;烟酸;D-生物素、叶酸、对氨基苯甲酸、核黄素。
本发明的培养基还可包含稀有元素,例如CuSO4·5H2O、KI、FeCl3、ZnSO4·7H2O、MnSO4·H2O或H2SO4、MgCl2、CaCl2、NaCl、K2HPO4、KH2PO4、ZnCl、H3BO3、MnSO4、Na2MoO4
术语“适当的培养基”如上所定义。
用于根据本发明的重组细胞的已知培养基的实例是本领域技术人员已知的,并且呈现于以下出版物D.Burke等人,Methods in yeast Genetics-A cold spring harborlaboratory course Manual(2000)中。
适合发酵的pH范围可以是pH 3.0至pH 7.5,其中优选pH 4至pH 6作为初始条件。
如本说明书其他地方提到的,可以在本发明方法的培养步骤期间调节培养基的pH值,以调节具有软骨素活性的多肽的活性,这将影响由本发明的重组细胞并且特别是由本发明的重组酵母生产的软骨素分子的分子量。
特别地,可以根据意在由重组酵母生产的软骨素来改变培养基的pH。例如,在培养时间期间,培养基的pH可以保持在4、5,5或6的pH。
在具体的实施方式中,培养基的pH可以在本发明的重组细胞、特别是本发明的重组酵母的培养时间长度期间改变或被改变。如前所提及,酿酒酵母酸化在其中培养其的培养基,并从而降低其培养基的pH。例如,培养基的pH可以从6开始,可以降至4,然后回到6。在另一个实例中,培养基的pH可以开始于6,保持或维持在6,然后可以降低至4。
在具体的实施方式中,可以在本发明方法的培养步骤(a)期间调节培养基的pH,使得在本发明方法的培养步骤结束时,培养基的pH与所述培养步骤(a)开始时的pH相同。
在另一个实施方式中,培养基的pH可以在本发明的重组细胞并且特别是本发明的重组酵母细胞的培养时间长度期间保持相同。
根据本发明的重组细胞并且特别是本发明的重组酵母的所述培养时间长度可以根据目标软骨素的分子量而变化。所述时间长度越长,本发明的重组细胞并且特别是本发明的重组酵母细胞的给定培养基中的软骨素的分子量越低。
本发明的重组细胞并且特别是本发明中的重组酵母的培养时间的时间长度可以是约35小时至约50小时,优选约40小时至约50小时,并且特别是约48小时的时段。
发酵可以在需氧条件或微需氧条件下进行。
发酵培养基中软骨素产物的量可以使用本领域已知的多种方法测定,例如高效液相色谱(HPLC)或气相色谱(GC)。
本方法可以采用分批发酵方法。经典的分批发酵是一个封闭系统,其中培养基的组成在发酵开始时就设定好,并且在发酵过程中不会受到人工改变。因此,在发酵开始时,用所想要的一种或多种生物体接种培养基,并且允许发酵发生而不向系统添加任何东西。然而,典型地,“分批”发酵方法或系统在碳源的添加方面是分批的,并且经常尝试控制例如温度、pH和氧浓度的因素。在分批系统中,系统的代谢物和生物质组成不断变化,直到发酵停止。在分批培养中,细胞通过静态滞后期进入高生长对数期,并且最后进入其中生长速率降低或停止的稳定期。如果不处理,处于稳定期的细胞最终会死亡。对数期的细胞通常负责最终产品或中间体的大部分生产。
补料分批系统也可用于本发明。补料分批系统与典型的分批系统相似,不同之处在于碳源底物随着发酵的进行而增量添加。当分解代谢物阻遏(例如葡萄糖阻遏)容易抑制细胞的代谢时并且需要培养基中的底物量有限时,分批补料系统非常有用。分批补料系统中实际底物浓度的测量很困难,并因此需要根据例如pH、溶解氧和废气(例如CO2)分压的可测量因素的变化进行估计。
分批和补料分批培养方法是本领域常见且众所周知的,并且实例可见于Biotechnology:A Textbook of Industrial Microbiology,Crueger、Crueger和Brock,第二版(1989)Sinauer Associates,Inc.,Sunderland,MA,或Deshpande,Mukund V.,Appl.Biochem.Biotechnol.,36,227,(1992)。尽管本发明以分批模式进行,但预期该方法将适用于连续发酵。
连续发酵是一个开放系统,其中将确定的发酵培养基连续添加到生物反应器,并同时取出等量的条件培养基进行处理。连续发酵通常将培养物维持在恒定的高密度,其中细胞主要处于对数生长期。
连续发酵可以调节影响细胞生长或最终产物浓度的一种因素或任何数量的因素。例如,一种方法将限制性营养物(例如碳源或氮水平)维持在固定速率,并允许所有其他参数变化。在其他系统中,影响生长的多种因素可以连续改变,而通过培养基浊度测量的细胞浓度保持恒定。连续系统努力维持稳态生长条件,并因此由于排出培养基而导致的细胞损失必须与发酵中的细胞生长速率相平衡。调节连续发酵过程的营养物和生长因子的方法以及用于最大化产物形成速率的技术是工业微生物学领域众所周知的。
预期本发明可以使用分批、补料分批或连续方法来实施,并且任何已知的发酵模式都是合适的。另外,预期细胞可作为全细胞催化剂固定在基质上并经受发酵条件以进行生产。
为了仍然提高软骨素产量,具体的实施方式可以包括在适当的培养基,例如上述培养基中培养本发明的重组细胞,特别是本发明的重组酵母细胞,其中所述培养基包含最佳量的碳源,尤其是葡萄糖或蔗糖。
在优选的实施方式中,所述最佳培养基中所包含的碳源由葡萄糖和/或蔗糖组成。在优选的实施方式中,所述最佳培养基包含1%w/w或更多的葡萄糖和/或蔗糖,特别地包含5%w/w或更多的葡萄糖和/或蔗糖,特别地包含10%w/w或更多的葡萄糖和/或蔗糖,特别地包含15%w/w或更多的葡萄糖和/或蔗糖。在优选的实施方式中,所述最佳培养基包含至多40%w/w葡萄糖,其包括至多35%w/w葡萄糖。
在优选的实施方式,本发明的方法在工业规模上进行。
更特别地,根据本发明的方法的培养基可以是至少约100L,更优选地在约1,000L至约3,000L的范围内,甚至更优选约10,000L、甚至更优选100,000L,或甚至约250,000L。
本发明还涉及一种用于生产如前所述的软骨素并且包括以下步骤的方法:
(a)在培养基中培养本发明的重组细胞;和
(b)从所述培养基回收软骨素,
其中步骤(b)中回收的软骨素具有通过选择以下而控制的分子量:
-本发明的重组细胞并且特别是本发明的重组酵母的编码具有软骨素酶活性的多肽的一种或多种重组核酸的性质和来源,
-控制本发明的重组细胞并且特别是本发明的重组酵母的编码具有软骨素活性的多肽的一种或多种重组核酸的表达的启动子的性质和来源,
-本发明的重组细胞并且特别是本发明的重组酵母的与编码具有软骨素活性的多肽的一种或多种重组核酸相关的锚定信号的存在或不存在,
-在培养本发明的重组细胞并且特别是本发明的重组酵母的步骤期间培养基的pH,和/或
-培养本发明的重组细胞并且特别是本发明的重组酵母的持续时间。
软骨素的分子量可以是特别的分子量,或更优选特定范围的分子量,例如小于50kDa,范围为约20kDa至约50kDa、大于或等于50kDa,范围为约50kDa至约150kDa,范围为约50kDa至约250kDa,大于或等于100kDa,范围为约100kDa至约1500kDa,范围为约150kDa至约1500kDa、大于1000kDa或大于1500kDa。
本发明还涉及根据本发明的重组细胞并且特别是本发明的重组酵母用于生产分子量在约20kDa至约50kDa或约50kDa至约1000kDa的范围内的软骨素的用途。
本发明的重组细胞的编码具有软骨素酶活性的多肽的一种或多种重组核酸可以例如当它们被分泌时(即,在存在分泌信号且不存在锚定信号的情况下),选自获自或源自萨氏九杯蛛、巴西钳蝎、家牛、西方蜜蜂、野捕恒河猴或大胡蜂中的至少一者的那些,特别是来自序列SEQ ID NO:48(Csa)、SEQ ID NO:49(Ts)、SEQ ID NO:50(Bt)、SEQ ID NO:51(Am)、SEQ ID NO:52(Mm)或SEQ ID NO:53(Vm)所示序列的那些。
本发明的重组细胞的编码具有软骨素酶活性的多肽的一种或多种重组核酸可以例如当它们被锚定时(即,在存在分泌信号和锚定信号两者的情况下),选自获自或源自萨氏九杯蛛、巴西钳蝎、家牛、西方蜜蜂、野捕恒河猴或大胡蜂中的至少一者的那些,特别是来自序列SEQ ID NO:54(Csa)、SEQ ID NO:55(Ts)、SEQ ID NO:56(Bt)、SEQ ID NO:57(Am)、SEQ ID NO:58(Mm)或SEQ ID NO:59(Vm)所示序列的那些。
本发明的重组细胞的编码具有软骨素酶活性的多肽的一种或多种重组核酸可以例如置于选自由pTDH3、pTDH3.Sk、pTDH3-1.Sba、pTEF1、pTEF1.Ago、pTEF1.sba、pCCW12、pCCW12.Sba、pCCW120.Sm、pCWP2、pCW10.Ago、pNUP57和pFBA1组成的组,并且特别是选自由pCCW12.Sba、pCW10.Ago和pNUP57组成的组的启动子的控制下。
特别地,本发明的重组细胞并且特别是本发明的重组酵母的编码具有软骨素酶活性的多肽的一种或多种重组核酸的启动子可以获自或源自贝酵母、库德里阿兹威酵母、米卡酵母、树生酵母或其他酵母菌目或棉阿舒囊霉(Abishia gossypii)。
例如,本发明的分泌信号可具有:
-如SEQ ID NO:125所示的核酸序列;和/或
-如SEQ ID NO:126所示的氨基酸序列。
例如,本发明的锚定信号可具有:
-如SEQ ID NO:127所示的核酸序列;和/或
-如SEQ ID NO:128所示的氨基酸序列。
分泌信号可通过产生嵌合核酸来融合至具有软骨素酶活性的多肽,所述嵌合核酸由编码信号肽的核酸序列开始,然后是如前所述的编码具有软骨素酶活性的多肽的重组核酸。
分泌信号和锚定信号可通过产生嵌合核酸来融合至具有软骨素酶活性的多肽,所述嵌合核酸由编码信号肽的核酸序列开始,然后是如前所述的编码具有软骨素酶活性的多肽的重组核酸,然后是编码锚定信号的核酸序列。
此类嵌合核酸序列可以通过本领域技术人员已知的技术获得,例如核酸的化学合成或任何重组技术例如克隆或PCR。
本发明还涉及一种如前所述的用于生产分子量小于约10kDa的软骨素的方法,其中:
(a)培养基的pH高于4,并且特别是在约5至约7的范围内;
(b)整合到本发明的重组细胞的基因组中的编码具有软骨素酶活性的多肽的一种或多种重组核酸来源于或源自巴西钳蝎,具有分泌信号但缺乏锚定信号,并且在pCCW12.sba启动子的控制下;
(c)具有软骨素酶活性的多肽是透明质酸酶;
(d)从培养基中回收软骨素的步骤在开始培养本发明的重组细胞、特别是本发明的重组酵母细胞后约48小时进行;
重组细胞特别是重组酵母细胞,并且更特别是酿酒酵母细胞。
本发明还涉及如前所述的用于生产具有约10kDa至约50kDa分子的软骨素的方法,其中:
(a)培养基的pH高于4,并且特别是在约5至约7的范围内;
(b)整合到本发明的重组细胞的基因组中的编码具有软骨素酶活性的多肽的一种或多种重组核酸来源于或源自巴西钳蝎,具有分泌信号但缺乏锚定信号,并且在pCCW10.Ago启动子的控制下;
(c)具有软骨素酶活性的多肽是透明质酸酶;
(d)从培养基中回收软骨素的步骤在开始培养本发明的重组细胞、特别是本发明的重组酵母细胞后约48小时进行;
重组细胞特别是重组酵母细胞,并且更特别是酿酒酵母细胞。
本发明还涉及如前所述的用于生产具有约50kDa至约500kDa分子的软骨素的方法,其中:
(a)培养基的pH高于4,并且特别是在约5至约7的范围内;
(b)整合到本发明的重组细胞的基因组中的编码具有软骨素酶活性的多肽的一种或多种重组核酸来源于或源自巴西钳蝎,具有分泌信号但缺乏锚定信号,并且在pNUP57启动子的控制下;
(c)具有软骨素酶活性的多肽是透明质酸酶;
(d)从培养基中回收软骨素的步骤在开始培养本发明的重组细胞、特别是本发明的重组酵母细胞后约48小时进行;
重组细胞特别是重组酵母细胞,并且更特别是酿酒酵母细胞。
本发明的另一方面涉及从本发明的重组细胞或从根据本发明的方法获得的或可获得的软骨素。
本发明的另一方面是包含本发明的软骨素的培养基。
本发明还涉及包含根据本发明的软骨素的组合物。
本发明还涉及工业产品或消费产品或消费品,其包含(i)本发明的软骨素,(ii)包含本发明的软骨素的培养基,或(iii)包含本发明的软骨素的组合物。
特别地,根据本发明的所述工业产品或消费产品或消费品可以是美容品、调味品、香料产品、食品、食物、饮料、食品定形剂、药物组合物、膳食补充剂、营养制品、清洁产品、和/或牙科和/或口腔卫生组合物。
软骨素的纯化
根据本发明的一个特定方面,软骨素的发酵生产优选包括从培养基中生产软骨素的步骤。从培养基中回收软骨素是本领域技术人员的常规任务。其可以通过本领域熟知的多种技术来实现,包括但不限于全蒸发、选择性沉淀、过滤、离心、喷雾干燥、冻干或液体提取。本领域技术人员知道如何根据待分离材料的特性来调整每种技术的参数。
优选使用酵母作为本发明的细胞模型,因为合成的软骨素完全输出到细胞外,从而简化了纯化过程。
气提是用选自氦气、氩气、二氧化碳、氢气、氮气或其混合物的汽提气体实现的。
液体萃取是用有机溶剂作为疏水相实现的,例如戊烷、己烷、庚烷或十二烷。也可以使用再生溶剂。
制剂和产品
本发明的组合物可掺入制剂/产品,例如营养、药用、兽用、酿酒或美容制剂/产品。
因此,本发明提供了包含本发明的组合物的制剂。例如,本发明可以提供包含本发明的组合物的美容制剂。
本发明还提供了包含本发明的组合物的产品。例如,本发明可以提供包含本发明的组合物的美容品。
“美容品”意在表示意在与人体外部(表皮、毛发系统、指甲、嘴唇和外生殖器官)或牙齿和口腔黏膜接触放置的任何物质或混合物,其目的专门或主要是清洁它们、给它们加香、改变它们外观、保护它们、使它们保持良好状态、纠正体臭和/或其组合。
“物质”意在表示自然状态下或通过任何制造过程获得的化学元素和其化合物,包括保持其稳定性所必需的任何添加剂以及源自所用过程的任何杂质,但不包括可以在不影响物质的稳定性或改变其组成的情况下分离的任何溶剂。
“混合物”旨在表示由两种或更多种物质组成的混合物或溶液。
本发明还提供了本发明的组合物在营养、药用、兽用、酿酒或美容制剂/产品中的用途。
此类制剂或产品在下文中被称为“本发明的制剂或产品”。
营养、药用、兽用、酿酒或美容制剂/产品还可任选地包含药用/兽用/美容(包括美容活性)成分,例如赋形剂、载体及其混合物(如果存在)。
“美容”或“美容活性成分”意指任何和所有天然的、天然存在的、性质相同的、合成人工生产的、生物合成生产的、可持续的、可再生的和/或可生物降解的化合物、成分、中间体、分子、物质、原材料或产品,单独地或作为以下各项的混合物的一部分:化合物、成分、中间体、分子、物质、原材料或产物、共混物、组合物、制剂(包括但不限于皮肤保湿剂、面霜、香膏、精华液、油、眼部、面部彩妆、水洗型洗发产品、免洗发产品、染发剂(包括但不限于天然染发剂)和/或其组合)、成品和相关技术,包括但不限于掺入例如美容制剂中的组分(例如但不限于天然着色剂、防腐剂、乳化剂、抗氧化剂等,其例如对皮肤、头发、头皮等不具有活性,但在成品的配方中发挥作用)、递送系统、营销助剂(例如,应用于半透明制剂的彩色单球体)以及制造与之相关的任何东西的方法,其可用于/用于/旨在用于:
-通过摩擦、倾倒、喷洒、喷雾或以其他方式直接在人体或动物体上或至人体或动物体,和/或通过与人体或动物体的各种外部和/或表面部分(包括但不限于皮肤、头发、体毛、毛发系统、头皮、指甲、嘴唇、外生殖器、牙齿、口腔和/或鼻粘膜等)接触来施加;和/或间接施加在人体或动物体上或至人体或动物体,例如作为纺织品的一部分施加或作为施加至纺织品的递送设备(例如胶囊)或递送系统(例如共混物或制剂)的一部分施加至纺织品;和/或
-清洁、护理、冷却、美化、调理、处理、舒缓、纹理化、增强吸引力、保护、维持、改善、增强、改变和/或变化人体或动物体的外部部分和/或表面(例如但不限于头皮)或人体或动物体的美观外观;和/或主要目的是清洁或加香,或保护或保持良好状态,或对抗体臭,或改变皮肤、口腔粘膜、头皮或头发的外观,或纠正或修复皮肤、口腔粘膜、头皮或头发的不平衡状态(通过提供皮肤的舒缓、愈合、修复或再生、水合),或以便提供干燥、刺激、损伤或疲劳状态的缓解、润滑、润湿、调理、治愈、消毒、缓解、纠正和/或补救,和/或目的是纠正色素沉着障碍或提供头皮屑、痤疮、刺激和/或炎症等的非药物预防和/或治疗和/或重新平衡皮肤表面上的细菌菌群(例如微生物组)(例如通过提供皮肤表面上的有益细菌菌群的水平),和/或目的是保持人体或动物体处于良好状态以实现健康和/或福祉目的,和/或通过例如改善施加至人体或身体的产品的外观来改善人体或动物体的外观;和/或
-提供美容和/或皮肤病学功能和/或具有生物活性益处的益处(但不影响身体的结构或功能。为避免疑义,美容品或美容品活性成分(Cosmetic or Cosmetic ActiveIngredient)或其任何部分也可能有资格作为功能性成分和/或营养制品。
“功能性成分”意指提供药用或健康益处的食物成分或食物部分,包括以下中的任一种:类胡萝卜素、膳食纤维、脂肪酸、皂苷、抗氧化剂、类黄酮、异硫氰酸酯、苯酚、多酚(例如白藜芦醇)、植物甾醇或甾烷醇(植物甾醇和植物甾烷醇)、多元醇、益生元、植物雌激素、大豆蛋白、硫化物/硫醇、维生素、葡萄糖胺、防腐剂、水合剂、可食用胶凝成分、可食用凝胶混合物和凝胶组合物、长链脂族饱和伯醇、着色剂、调质剂、乳化剂及其组合。
“营养制品”意指任何和所有天然、天然存在、可持续、合成生产和生物合成生产的化合物、化合物混合物、功能成分、分子、组合物、原材料和中间体(包括与其相关的组分和递送设备(例如胶囊)、其递送系统(例如掺混物或制剂),及制备前述物质的方法),它们与健康和/或美容益处以及改善或维持人体外观相关。为避免疑义,营养制品包括可用作食品或饮料补充剂的化合物,无论是固体制剂、胶囊剂、片剂、液体制剂、溶液还是混悬剂。
替选地,营养、药用、兽用、酿酒或美容制剂/产品可以由本发明的组合物组成或基本上由本发明的组合物组成。
美容制剂/产品可以是抗老化制剂。
如本文所用,提及药学、兽用或美容上可接受的赋形剂可以指本领域技术人员已知的药学、兽用或美容上可接受的佐剂、稀释剂和/或载体。
“药学上/兽用/美容上可接受的”意指组合物的附加组分通常是安全的、无毒的,并且在生物学上或其他方面都不是不期望的。例如,附加组分通常可以是无菌且无热原的。此类组分在与本发明的组合物相容且对其接受者无害的意义上必须是“可接受的”。因此,“药学上可接受的赋形剂”包括用于形成制剂的一部分的任何一种或多种化合物,其旨在仅充当赋形剂,即本身不意在不具有生物活性。
营养、药用、兽用、酿酒或美容制剂/产品可以是液体或固体的形式。
用于口服施用的液体剂量制剂/产品包括溶液、乳剂、水性或油性混悬剂、糖浆剂和酏剂。
本文所述的制剂和产品(如药用、兽用或美容制剂/产品),例如意在用于经口施用的那些,可以根据本领域技术人员已知的方法来制备,例如通过混合制剂/产品的组分在一起。
制剂或产品(如药用、兽用或美容制剂/产品)可以含有一种或多种附加的成分,例如药物成分和赋形剂,例如甜味剂、调味剂、着色剂和防腐剂。
制剂或产品(如药用、兽用或美容制剂/产品)还可以含有一种或多种附加的活性成分,例如美容或药物活性成分,例如透明质酸、积雪草提取物、肽例如及其混合物。
本发明的制剂或产品可以含有与无毒的药学上可接受的赋形剂(或成分)混合的一种或多种活性成分。这些赋形剂(或成分)可以例如是:惰性稀释剂,例如碳酸钙、碳酸钠、乳糖、磷酸钙或磷酸钠;造粒剂和崩解剂,例如玉米淀粉、麦芽糖糊精或海藻酸;粘合剂,例如淀粉、明胶或阿拉伯胶;或润滑剂,例如硬脂酸镁、硬脂酸、滑石及其混合物。
液体制剂或产品(如药用、兽用或美容制剂/产品)可以包含在胶囊内,胶囊可以是未包衣的或如上所定义包衣的。
合适的药用或兽用载体包括惰性固体稀释剂或填充剂、无菌水溶液和各种有机溶剂。液体载体的实例是糖浆、花生油、橄榄油、磷脂、脂肪酸、脂肪酸胺、聚氧乙烯和水。
此外,载体或稀释剂可包括单独或与蜡混合的本领域已知的任何持续释放材料,例如甘油单硬脂酸酯或甘油二硬脂酸酯。
合适的药物载体包括惰性无菌水溶液和各种有机溶剂。液体载体的实例是糖浆、植物油、磷脂、脂肪酸、脂肪酸胺、聚氧乙烯和水。此外,载体或稀释剂可包括单独或与蜡混合的本领域已知的任何持续释放材料,例如甘油单硬脂酸酯或甘油二硬脂酸酯。
合适的美容载体通常是适用于局部施用至人体外表面例如皮肤和/或头发和/或头皮的那些。
通常,此类载体是皮肤病学可接受的。
短语“皮肤病学上可接受的载体”意指该载体适合于局部施加至角质组织,具有良好的美观特性,与组合物中的活性物质相容,并且不会引起任何不合理的安全性或毒性问题。
载体可以具有多种形式。在一些情况下,组分(例如提取物、防晒活性物质、附加组分)的溶解度或分散性可能决定载体的形式和特性。非限制性实例包括简单溶液(如水性或无水)、分散体、乳液和固体形式(例如凝胶、棒、可流动固体或无定形材料)。
皮肤病学上可接受的载体可以是乳液的形式。乳液通常可分为具有连续水相(例如水包油和水包油包水)或连续油相(例如油包水或水包油)。本发明的油相可包含硅油、非硅油例如烃油、酯、醚等及其混合物。水相通常包含水和水溶性成分(例如水溶性保湿剂、调理剂、抗微生物剂、保湿剂和/或其他皮肤护理活性物质)。然而,在一些情况下,水相可包含除水之外的组分,包括但不限于水溶性保湿剂、调理剂、抗微生物剂、保湿剂和/或其他水溶性护肤活性物质。在一些情况下,组合物的非水组分包含湿润剂,例如甘油和/或一种或多种其他多元醇。乳液还可以含有乳化剂。乳化剂可以是非离子型、阴离子型或阳离子型。
载体可含有一种或多种皮肤病学上可接受的亲水性稀释剂。如本文所用,“稀释剂”包括可以将本发明的组合物分散、溶解或以其他方式掺入其中的材料。亲水性稀释剂包括水、有机亲水性稀释剂例如低级一元醇(例如C1-C4)以及低分子量二醇和多元醇,包括丙二醇、聚乙二醇、聚丙二醇、甘油、丁二醇、1,2,4-丁三醇、山梨糖醇酯、1,2,6-己三醇、乙醇、异丙醇、山梨糖醇酯、丁二醇、醚丙醇、乙氧基化醚、丙氧基化醚及其组合。
美容制剂/产品可以任选地包含一种或多种通常用于美容组合物的附加成分(例如,着色剂、肤色剂、皮肤抗老化剂、抗炎剂、防晒剂、这些的组合等),条件是附加成分不会不利地改变组合物提供的抗糖化益处。
在一些情况下,可能想要选择经由不同生物途径发挥其作用的肤色剂,以便活性剂不会相互干扰,否则会降低两种剂的功效。当掺入组合物中时,附加成分应当适合与人体皮肤组织接触而没有不适当的毒性、不相容性、不稳定性、过敏响应等。
如本文所用的术语“载体”还可以指天然产物或源自自然界的产物,其已被转化或修饰以使其不同于其源自的天然产物,例如麦芽糖糊精。
存在于营养、药用、兽用、酿酒或美容制剂或产品中的本发明组合物的量将根据应用而变化。
典型地,可以存在于营养、药用、兽用、酿酒或美容制剂或产品中的本发明的组合物的量将为约0.001至约50重量%,例如约0.01%至约30%或约1%至约20%的营养、药用、兽用、酿酒或美容制剂或产品,例如约0.01重量%至约20重量%、或约0.1重量%至10重量%、或约1重量%至约5重量%的制剂或产品。
本领域技术人员将认识到,由于遗传密码的简并性质,其核苷酸序列不同的多种DNA分子可用于编码本发明的给定酶。本文引用编码上述生物合成酶的天然DNA序列仅是为了说明本发明的实施方式,并且本发明包括编码在本发明的方法中使用的酶的多肽和蛋白质的氨基酸序列的任何序列的DNA分子。以类似的方式,多肽通常可以耐受其氨基酸序列中的一个或多个氨基酸取代、缺失和插入,而不损失或显著损失所想要的活性。本发明包括具有与本文描述的特定蛋白质不同的氨基酸序列的此类多肽,只要修饰或变体多肽具有参考多肽的酶促合成代谢或分解代谢活性。此外,由本文所示的DNA序列编码的氨基酸序列仅说明本发明的实施方式。
本文描述了可用于本发明的方法、组合物和生物体中的特定基因和蛋白质;然而,应当认识到,此类基因的绝对同一性是不必要的。例如,可以对包含编码多肽或酶的序列的特别基因或多核苷酸进行改变并筛选活性。通常,此类变化包括保守突变和沉默突变。可以使用本领域已知的方法筛选此类修饰或突变的多核苷酸和多肽的功能性酶的表达。
由于遗传密码的固有简并性,编码基本上相同或功能等同的多肽的其他多核苷酸也可用于克隆和表达编码此类酶的多核苷酸
本领域技术人员已知的技术可能适合于鉴定另外的同源基因和同源酶。一般来说,类似的基因和/或类似的酶可以通过功能分析来鉴定并且具有功能相似性。
本领域技术人员已知的技术可适合于鉴定类似基因和类似酶或任何生物合成途径基因、蛋白质或酶,技术可包括但不限于使用基于目标基因/酶的已公开序列的PCR或者通过简并PCR使用设计用于扩增目标基因中的保守区域的简并引物,来克隆基因。此外,本领域技术人员可以使用技术来鉴定具有功能同源性或相似性的同源或类似基因、蛋白质或酶。技术包括通过对所述活性的体外酶测定来检查细胞或细胞培养物的酶催化活性(例如,如本文或Kiritani,K.,Branched-Chain Amino Acids Methods Enzymology,1970中所述),然后通过纯化来分离具有所述活性的酶,通过例如Edman降解的技术测定酶的蛋白质序列,针对可能的核酸序列设计PCR引物、通过PCR扩增所述DNA序列以及克隆所述核酸序列。为了鉴定同源或相似的基因和/或同源或相似的酶、类似的基因和/或类似的酶或蛋白质,技术还包括将关于候选基因或酶的数据与例如BRENDA、KEGG或MetaCYC的数据库进行比较。可以根据本文教导在上述数据库内鉴定候选基因或酶。
术语“在...和...之间”和“范围从...到...”应被理解为包括端值,除非另有说明。在本说明书和所附权利要求书中,除非上下文另有要求,否则词语“包括/包含(comprise)”以及例如“包括/包含(comprises)”、“包括/包含(comprising)”和“具有”的变体将被理解为暗示包括所规定的整数或步骤、或整数组或步骤组,但不排除任何其他整数或步骤、或整数组或步骤组。术语“包括/包含(comprising)”还意指“包括”以及“由……组成”,如“包括/包含”X的组合物可以仅由X组成,或者可以包括额外的东西,例如X+Y。还必须注意的是,如本说明书和所附权利要求中所使用的,单数形式“一”、“一个”和“该”包括复数指示物,除非内容另外明确指出。举例来说,提及“基因”或“酶”是提及“一种或多种基因”或“一种或多种酶”。
应当理解,本发明不限于本文描述的特别方法、方案和试剂,因为这些可以变化。还应当理解,本文中使用的术语仅是为了描述特别实施方式的目的,并且不旨在限制本发明的范围,本发明的范围仅由所附权利要求书限制。除非另有定义,否则本文中使用的所有技术和科学术语具有与本领域技术人员通常理解的相同含义。根据本发明,可以使用本领域技术范围内的常规分子生物学、微生物学和重组DNA技术。
本发明在其应用中不限于在以下描述中阐述或在附图中示出的组分的构造和布置的细节。本发明能够具有其他实施方式并且能够以各种方式被实践或执行。此外,本文中使用的措辞和术语是为了描述的目的并且不应被视为限制。优选地,本文所用的术语如"Amultilingual glossary of biotechnological terms:(IUPAC Recommendations)",Leuenberger,H.G.W,Nagel,B.和Kolbl,H.eds.(1995),Helvetica Chimica Acta,CH-4010Basel,Switzerland)中所述定义。
本说明书全文中引用了多个文献。本文引用的每个文件(包括所有专利、专利申请、科学出版物、制造商说明书、说明书、GenBank登录号序列提交等),无论上文还是下文,均通过引用整体并入本文。
以下实施例和附图以说明的方式给出,并不暗示对本发明的限制。
实施例
实施例1:用于制备根据本发明的重组酿酒酵母菌株的方案
所有下文实施的重组酿酒酵母菌株均使用标准酵母分子遗传学程序从标准菌株构建(Methods in yeast Genetics-A cold spring harbor laboratory course Manual(2000)by D.Burke,D.Dawson,T.Stearns CSHL Press)。
利用酵母有效重组具有序列同源性的游离DNA末端的能力,将以下提及的基因簇一次性整合到重组酵母中。
此外,为了更好地理解以下基因型:
-jlp1、his 3、leu2、sam3和met14是插入位点。
-小写字母意指所考虑的基因是不活跃的,大写字母反映了活跃基因。
-“::”:基因名称后面意指该基因被后面的内容中断(如果插入多于一个基因,则在括号[]中注明)。基因的中断伴随着编码序列的完全缺失,但保留了启动子。因此,后面跟着“::”的基因是不活跃的,并以小写字母表示。如果没有指定则插入基因的转录是由被破坏基因的启动子控制的。
-“基因.Kl”意指基因来源于乳酸克鲁维酵母。当本实施例中的基因后面没有任何指示时,这意味着该基因来自酿酒酵母。
更特别地,待克隆的编码序列是人工合成的。对于异源序列(非酵母),使用酵母密码子使用修饰核酸序列以便获得同义编码序列。使用限制性酶和经典克隆技术,将每条合成序列克隆到转录启动子和转录终止子之间。每条启动子序列之前有与上游基因终止子序列同源的50至200个核苷酸序列。类似地,每个基因的终止子(包含启动子编码序列-终止子的基因)后面是与紧随其后的基因同源的序列。以便每个待整合的单元与上游单元和下游单元都有50-200个核苷酸重叠。对于第一单元,启动子前面有50-200个与其中待整合其的基因座的酵母染色体核苷酸同源的核苷酸。类似地,对于最后一个单元,终止子后面跟着与其中待整合其的基因座的酵母染色体核苷酸同源的50-200个核苷酸。
然后从质粒构建体中对每个单位进行PCR扩增,产生具有重叠序列的线性DNA的X单位。该基因中至少一个是营养缺陷型标记,以便选择重组事件。将所有线性片段一次性转化到酵母中,并针对与所用标记相关的营养缺陷型选择重组酵母细胞。序列的完整性然后通过PCR和测序来验证。
实施例2:用于生产软骨素的对比例
首先,获得三种重组菌株:YA5809、YA5810和YA5571。
因此,这三个菌株如下:
YA5809:MAT-α,his3::[tRPL3-UGP1-pSAM1,pMET6-QRI1-tIDP1,HIS3]x5,jlp1::[LEU2.Sba-loxP,pTEF1.Sba-HASB.Vir-tRPL3.Sm,pTDH3.Sk-HASB-A.Vir-tTEF1.Sba,pTDH3-1.Sba-HCOS1-3.Pm-tRPL15A.Sm,pCCW12-KFOA.Pm-tRPL41B.Sba,pCCW120.Sm-KFOA.Pm-tRPL15A.Sba,pTEF1.Ago-GFA1.Vir-tRPL15A],leu2,met14::[TRP1.Sba-RS,pTDH3-PGM1-tIDP1,pCWP2-GNA1-tTPI1,pTEF1-PCM1-tRPL41B,pFBA1-UGP1-tRPL3,pTDH3-1.Sba-QRI1-tIDP1.Sba,pTEF1.Ago-GFA1-tRPL15A],trp1,ura3
YA5810:MAT-α,his3::[tRPL3-UGP1-pSAM1,pMET6-QRI1-tIDP1,HIS3]x5,jlp1::[LEU2.Sba-loxP,pTEF1.Sba-HASB.Vir-tRPL3.Sm,pTDH3.Sk-HASB-A.Vir-tTEF1.Sba,pTDH3-1.Sba-HCOS1-3.Pm-tRPL15A.Sm,pCCW12-KFOA.Pm-tRPL41B.Sba,pCCW120.Sm-KFOA.Pm-tRPL15A.Sba,pTEF1.Ago-GFA1.Vir-tRPL15A],leu2,met14::[TRP1.Sba-RS,pTDH3-PGM1-tIDP1,pCWP2-GNA1-tTPI1,pTEF1-PCM1-tRPL41B,pFBA1-UGP1-tRPL3,pTDH3-1.Sba-QRI1-tIDP1.Sba],trp1,ura3
YA5571:MAT-α,his3::[tRPL3-UGP1-pSAM1,pMET6-QRI1-tIDP1,HIS3]x5,jlp1::[LEU2.Sba-loxP,pTEF1.Sba-HASB.Vir-tRPL3.Sm,pTDH3.Sk-HASB-A.Vir-tTEF1.Sba,pTDH3-1.Sba-HCOS1-3.Pm-tRPL15A.Sm,pCCW12-KFOA.Pm-tRPL41B.Sba,pCCW120.Sm-KFOA.Pm-tRPL15A.Sba,pTEF1.Ago-GFA1.Vir-tRPL15A],leu2,trp1,ura3
HASB和HASB-A表示编码具有UDP-葡萄糖6-脱氢酶活性的多肽的核酸序列。它们彼此不同,因为它们是编码酶的核酸序列的不同重编码版本。HASB具有序列SEQ ID NO:36并且HASB-A具有序列SEQ ID NO:37。HCOS1-3.Pm表示编码具有软骨素合酶活性的多肽的核酸序列,其是包含编码具有透明质酸合酶活性的多肽的核酸和编码具有软骨素合酶活性的多肽的核酸片段的核酸。HCOS1-3.Pm具有序列SEQ ID NO:3。
将这些菌株在锥形烧瓶内的25ml补充有2%葡萄糖的SY培养基中于28℃下孵育48小时。
SY培养基包含以下组分:
KH2PO4:100mM;MgSO47H2O:2,8mM;K2SO4:11,5mM;Na2SO4:1,1mM;NaCl:2,6mM;CaCl22H2O:0,7mM;CuSO45H2O:15μM;KI:6μM;FeCl3:30μM;ZnSO47H2O:61μM;MnSO4 H2O:25μM;H2SO4:110μM;泛酸半钙盐:42μM;硫胺盐酸盐:59μM;吡哆醇盐酸盐:49μM;肌醇(C6H12O6):555μM;烟酸(C6H5NO2):29μM;D-生物素:0,82μM;柠檬酸三铵:33mM;和葡萄糖或蔗糖2-30%
48小时后回收生长培养基并测定其软骨素含量。
加载上清液的等分试样并在0,5%琼脂糖凝胶上电泳,随后用溴酚蓝染色。
在用浓硫酸和咔唑处理后,通过比色测定评价培养基中存在的软骨素的量(Bitter和Muir(1962)analytical biochemistry 4,330-334)。
用这些不同菌株获得的量分别为:
-YA5809:200mg.L-1
-YA5810:200mg.L-1
-YA5571:200mg.L-1
相比之下,其他三种菌株所源自的天然菌株(Chérest等人(2000)JBiol.Chem.275:14056-14063)不产生软骨素。
该实验结果表明,与不包含根据本发明的所有遗传修饰的其他菌株相比,包含根据本发明的修饰的重组菌株在相同条件下培养时生产更大量的软骨素。
实施例3:用于生产具有受控分子量的软骨素的实施例
1.分子量小于10kDa的软骨素的生产
接下来,获得两种重组菌株:YA5887和5902。
因此,这两个菌株如下:
YA5887:MAT-a,his3,jlp1::[LEU2.Kl,pCUP1-UGP1-tRPL3,pCUP1-QRI1-tIDP1,pPDC1-UGP1-tTPI1,pTDH3-QRI1-tMET25,pCCW12-HASB.At-tRPL15A],leu2::[TRP1.Sba,pCCW12.Sba-HYAL-3.Ts-tRPL15A],sam3::[HASB.Vir-tTEF1.Sba,pTDH3-1.Sba-HCOS1-3.Pm-tRPL3.Sba,pTDH3.Sar-HCOS1-3.Pm-tRPL15A.Sm,pCCW12-KFOA.Pm-tRPL41B.Sba,pCCW120.Sm-KFOA.Pm-tRPL15A.Sba,HIS3.Sba],trp1
YA5902:MAT-α,his3::[pSAM1-UGP1-tRPL3,pMET6-QRI1-tIDP1,HIS3]x5,jlp1::[LEU2.Kl,pCUP1-UGP1-tRPL3,pCUP1-QRI1-tIDP1,pPDC1-UGP1-tTPI1,pTDH3-QRI1-tMET25,pCCW12-HASB.At-tRPL15A],leu2::[TRP1.Sba,pCCW12.Sba-HYAL-3.Ts-tRPL15A],sam3::[LEU2.Kl,pENO2-UGP1-tRPL3,pCWP2-GNA1-tTPI1,pTEF1-PCM1-tRPL41B,pTEF1.Sba-HASB.vir-tRPL3.Sm,pTDH3.Sk-HASB-A.Vir-tTEF1.Sba,pTDH3-1.Sba-HCOS1-3.Pm-tRPL15A.Sm,pCCW12-KFOA.Pm-tRPL15A.Sba,HIS3.Sba-loxP],trp1
HYAL-3.Ts表示编码具有与分泌信号但无锚定信号相关的软骨素酶活性的多肽的核酸序列。HYAL-3.Ts具有氨基酸序列SEQ ID NO:23。
HASB、HASB-A和HCOS-1.Pm如上所定义。
将这些菌株在锥形烧瓶内的25ml补充有2%葡萄糖的SY培养基中于28℃下孵育48小时。
48小时后回收生长培养基并测定其软骨素含量。
加载上清液的等分试样并在0,5%琼脂糖凝胶上电泳,随后用溴酚蓝染色。
在用浓硫酸和咔唑处理后,通过比色测定评价培养基中存在的软骨素的量(Bitter和Muir(1962)analytical biochemistry 4,330-334)。
用这些不同菌株获得的量分别为:
-YA5887:600mg.L-1
-YA5902:600mg.L-1
相比之下,其他两种菌株所源自的天然菌株(Chérest等人(2000)JBiol.Chem.275:14056-14063)不产生软骨素。
该实验结果表明,与不包含根据本发明的所有遗传修饰的其他菌株相比,包含根据本发明的修饰的重组菌株在相同条件下培养时生产更大量的软骨素。
此外,这两种菌株在48小时后生产了分子量小于10kDa的软骨素。
2.分子量包含在约10kDa至约50kDa之间的软骨素的生产
接下来,获得另外两个重组菌株:YA5888和5903。
因此,这两个菌株如下:
YA5888:MAT-a,his3,jlp1::[LEU2.Kl,pCUP1-UGP1-tRPL3,pCUP1-QRI1-tIDP1,pPDC1-UGP1-tTPI1,pTDH3-QRI1-tMET25,pCCW12-HASB.At-tRPL15A],leu2::[TRP1.Sba,pCCW10.Ago-HYAL-3.Ts-tRPL15A],sam3::[HASB.Vir-tTEF1.Sba,pTDH3-1.Sba-HCOS1-3.Pm-tRPL3.Sba,pTDH3.Sar-HCOS1-3.Pm-tRPL15A.Sm,pCCW12-KFOA.Pm-tRPL41B.Sba,pCCW120.Sm-KFOA.Pm-tRPL15A.Sba,HIS3.Sba],trp1
YA5903:MAT-α,his3::[pSAM1-UGP1-tRPL3,pMET6-QRI1-tIDP1,HIS3]x5,jlp1::[LEU2.Kl,pCUP1-UGP1-tRPL3,pCUP1-QRI1-tIDP1,pPDC1-UGP1-tTPI1,pTDH3-QRI1-tMET25,pCCW12-HASB.At-tRPL15A],leu2::[TRP1.Sba,pCCW10.Ago-HYAL-3.Ts-tRPL15A],sam3::[LEU2.Kl,pENO2-UGP1-tRPL3,pCWP2-GNA1-tTPI1,pTEF1-PCM1-tRPL41B,pTEF1.Sba-HASB.vir-tRPL3.Sm,pTDH3.Sk-HASB-A.Vir-tTEF1.Sba,pTDH3-1.Sba-HCOS1-3.Pm-tRPL15A.Sm,pCCW12-KFOA.Pm-tRPL15A.Sba,HIS3.Sba-loxP],trp1
HYAL-3.Ts、HASB、HASB-A和HCOS-1.Pm如上所定义。
将这些菌株在锥形烧瓶内的25ml补充有2%葡萄糖的SY培养基中于28℃下孵育48小时。
48小时后回收生长培养基并测定其软骨素含量。
加载上清液的等分试样并在0,5%琼脂糖凝胶上电泳,随后用溴酚蓝染色。
在用浓硫酸和咔唑处理后,通过比色测定评价培养基中存在的软骨素的量(Bitter和Muir(1962)analytical biochemistry 4,330-334)。
用这些不同菌株获得的量分别为:
-YA5888:600mg.L-1
-YA5903:600mg.L-1
相比之下,其他两种菌株所源自的天然菌株(Chérest等人(2000)JBiol.Chem.275:14056-14063)不产生软骨素。
该实验结果表明,与不包含根据本发明的所有遗传修饰的其他菌株相比,包含根据本发明的修饰的重组菌株在相同条件下培养时生产更大量的软骨素。
此外,这两种菌株在48小时后生产了分子量范围为约10kDa至约50kDa的软骨素。
3.分子量包含在约50kDa至约500kDa之间的软骨素的生产
接下来,获得另外两个重组菌株:YA5889和5904。
因此,这两个菌株如下:
YA5889:MAT-a,his3,jlp1::[LEU2.Kl,pCUP1-UGP1-tRPL3,pCUP1-QRI1-tIDP1,pPDC1-UGP1-tTPI1,pTDH3-QRI1-tMET25,pCCW12-HASB.At-tRPL15A],leu2::[TRP1.Sba,pNUP57-HYAL-3.Ts-tRPL15A],sam3::[HASB.Vir-tTEF1.Sba,pTDH3-1.Sba-HCOS1-3.Pm-tRPL3.Sba,pTDH3.Sar-HCOS1-3.Pm-tRPL15A.Sm,pCCW12-KFOA.Pm-tRPL41B.Sba,pCCW120.Sm-KFOA.Pm-tRPL15A.Sba,HIS3.Sba],trp1
YA5904:MAT-α,his3::[pSAM1-UGP1-tRPL3,pMET6-QRI1-tIDP1,HIS3]x5,jlp1::[LEU2.Kl,pCUP1-UGP1-tRPL3,pCUP1-QRI1-tIDP1,pPDC1-UGP1-tTPI1,pTDH3-QRI1-tMET25,pCCW12-HASB.At-tRPL15A],leu2::[TRP1.Sba,pNUP57-HYAL-3.Ts-tRPL15A],sam3::[LEU2.Kl,pENO2-UGP1-tRPL3,pCWP2-GNA1-tTPI1,pTEF1-PCM1-tRPL41B,pTEF1.Sba-HASB.vir-tRPL3.Sm,pTDH3.Sk-HASB-A.Vir-tTEF1.Sba,pTDH3-1.Sba-HCOS1-3.Pm-tRPL15A.Sm,pCCW12-KFOA.Pm-tRPL15A.Sba,HIS3.Sba-loxP],trp1
HYAL-3.Ts、HASB、HASB-A和HCOS-1.Pm如上所定义。
将这些菌株在锥形烧瓶内的25ml补充有2%葡萄糖的SY培养基中于28℃下孵育48小时。
48小时后回收生长培养基并测定其软骨素含量。
加载上清液的等分试样并在0,5%琼脂糖凝胶上电泳,随后用溴酚蓝染色。
在用浓硫酸和咔唑处理后,通过比色测定评价培养基中存在的软骨素的量(Bitter和Muir(1962)analytical biochemistry 4,330-334)。
用这些不同菌株获得的量分别为:
-YA5889:600mg.L-1
-YA5904:600mg.L-1
相比之下,其他两种菌株所源自的天然菌株(Chérest等人(2000)JBiol.Chem.275:14056-14063)不产生软骨素。
该实验结果表明,与不包含根据本发明的所有遗传修饰的其他菌株相比,包含根据本发明的修饰的重组菌株在相同条件下培养时生产更大量的软骨素。
此外,这两种菌株在48小时后生产了分子量范围为约10kDa至约50kDa的软骨素。
序列
SEQ ID NO:1是具有软骨素合酶活性的多肽的重编码核酸序列:嵌合核酸,其包含来自编码源自多杀巴斯德菌的透明质酸合酶的核酸的片段,和来自编码源自多杀巴斯德菌的软骨素合酶的核酸的片段(HCOS1-1):
ATGAACACCCTTTCCCAGGCAATTAAGGCTTATAATAGTAATGATTATCAACTAGCCCTCAAGCTGTTCGAAAAGTCGGCAGAAATCTACGGCAGAAAGATAGTTGAgTTCCAAATTACGAAGTGCAAGGAGAAACTTTCTGCGCACCCATCCGTTAACAGTGCGCATCTCTCGGTTAACAAAGAAGAGAAGGTGAATGTTTGCGACAGTCCATTAGACATAGCCACTCAATTATTGTTATCGAATGTGAAAAAACTCGTCCTTAGTGATAGCGAGAAAAATACACTAAAGAATAAATGGAAGTTGTTGACTGAAAAGAAGTCTGAGAACGCAGAGGTCCGGGCCGTAGCTTTAGTTCCCAAGGACTTTCCGAAAGATTTAGTGCTTGCGCCGTTACCAGACCATGTGAACGATTTTACGTGGTATAAGAAGCGGAAGAAACGCCTAGGAATCAAACCAGAACACCAACACGTTGGCCTCTCCATTATTGTGACAACGTTCAACCGTCCTGCCATCCTCAGCATCACCCTGGCTTGCCTCGTCAATCAAAAGACCCATTATCCTTTTGAGGTGATCGTGACCGACGATGGTTCTCAAGAGGATTTATCGCCTATAATCCGTCAATATGAGAACAAGCTAGACATCCGTTATGTTCGGCAAAAGGACTATGGGTATCAGCTGTGCGCCGTTAGAAACCTTGGTCTAAGGACAGCGAAGTATGACTTTGTCTCTATCTTGGATTGCGACATGGCCCCGCAGCAGCTATGGGTTCACTCTTACCTTACAGAACTATTAGAGGACGATGATTTGACCATAATAGGCCCCAGGAAGTACATTGACACGCAACACATAGATCCCAAGGATTTCCTTAATAACGCCTCTCTGTTAGAGTCGTTGCCAGAGGTTAAGACCAATAATTCCGTCGCGGCTAAGGGCGAGGGGACCGTATCTTTAGACTGGCGTTTGGAACAATTTGAGAAGACCGAGAACTTGAGGCTATCCGATAGCCCTTTCCGATTCTTCGCAGCTGGGAATGTGGCTTTCGCCAAGAAGTGGCTTAACAAGTCAGGATTCTTCGACGAGGAATTCAATCACTGGGGAGGTGAAGATGTAGAGTTCGGTTATCGTCTGTTTCGGTACGGTTCGTTCTTCAAAACTATAGACGGCATCATGGCCTATCATCAGGAACCGCCAGGTAAAGAAAACGAAACTGACAGAGAAGCGGGCAAGAACATTACCCTCGATATAATGAGGGAGAAGGTGCCTTACATCTACCGTAAACTCCTGCCTATAGAAGACAGTCATATCAACCGAGTACCATTGGTATCAATTTACATCCCGGCCTACAACTGTGCTAACTATATTCAAAGATGTGTTGATTCAGCTTTGAATCAAACGGTAGTTGATCTCGAAGTGTGCATTTGCAACGACGGTAGTACTGACAACACGCTGGAAGTTATTAACAAGCTGTATGGTAATAATCCGCGTGTGCGTATAATGTCTAAACCCAATGGCGGCATTGCGAGTGCATCCAACGCAGCGGTCAGCTTCGCAAAGGGTTATTACATAGGACAGTTGGACAGCGACGATTACTTAGAACCCGACGCAGTGGAGTTATGTCTCAAGGAATTTCTTAAGGATAAGACCCTTGCGTGCGTTTACACCACTAATCGTAACGTCAACCCAGATGGCTCTTTAATAGCCAATGGCTATAACTGGCCAGAGTTCAGTCGTGAGAAGTTGACTACGGCCATGATTGCTCATCACTTCCGGATGTTTACCATTCGTGCTTGGCATCTGACGGATGGGTTCAATGAGAAGATTGAGAACGCTGTTGACTACGACATGTTTCTCAAGCTCAGTGAAGTTGGTAAATTTAAGCATCTGAACAAAATATGTTATAATCGGGTGTTACACGGCGATAACACCTCAATCAAGAAgCTTGGCATACAAAAGAAGAATCATTTCGTAGTTGTCAATCAGTCTCTAAACCGCCAAGGTATAACTTATTATAACTACGATGAATTTGATGATCTCGATGAGAGTCGGAAATACATTTTCAACAAGACTGCAGAGTATCAAGAAGAGATAGATATTCTTAAAGATATTAAGATCATTCAGAACAAAGACGCCAAAATAGCTGTCTCCATTTTCTATCCGAACACTCTAAACGGGTTGGTGAAGAAGCTAAATAATATTATAGAGTATAATAAGAATATCTTCGTTATTGTACTTCATGTCGATAAGAATCACTTAACCCCAGACATCAAGAAGGAGATATTAGCCTTCTACCATAAGCATCAGGTGAACATCTTATTGAACAATGACATCTCCTACTATACATCAAATCGTCTGATTAAGACAGAAGCCCATTTGAGTAACATTAACAAGCTaAGTCAATTAAATCTTAACTGCGAATACATTATATTCGACAATCACGATTCCTTATTTGTGAAGAACGATTCCTATGCATACATGAAGAAGTATGATGTTGGAATGAACTTCTCTGCATTGACTCATGATTGGATTGAAAAGATAAACGCTCACCCGCCATTTAAGAAGCTgATCAAAACTTACTTCAATGACAATGATCTTAAGTCGATGAATGTAAAGGGTGCCTCCCAGGGAATGTTTATGACATACGCATTAGCCCACGAGTTATTGACGATCATCAAGGAGGTGATAACCTCTTGTCAATCCATTGACTCCGTCCCCGAATACAACACAGAAGATATTTGGTTTCAGTTTGCACTTTTAATTCTGGAAAAGAAGACCGGCCACGTATTCAACAAGACAAGCACTCTCACGTATATGCCATGGGAACGTAAACTGCAGTGGACGAATGAACAAATAGAGTCCGCAAAGAGGGGCGAAAACATTCCGGTAAACAAGTTCATCATTAACAGCATTACCCTTTAA
SEQ ID NO:2是具有软骨素合酶活性的多肽的重编码核酸序列:嵌合核酸,其包含来自编码源自多杀巴斯德菌的透明质酸合酶的核酸的片段,和来自编码源自多杀巴斯德菌的软骨素合酶的核酸的片段(HCOS1-2):
ATGAACACCCTTTCCCAGGCAATTAAGGCTTATAATAGTAATGATTATCAACTAGCCCTCAAGCTGTTCGAAAAGTCGGCAGAAATCTACGGCAGAAAGATAGTTGAgTTCCAAATTACGAAGTGCAAGGAGAAACTTTCTGCGCACCCATCCGTTAACAGTGCGCATCTCTCGGTTAACAAAGAAGAGAAGGTGAATGTTTGCGACAGTCCATTAGACATAGCCACTCAATTATTGTTATCGAATGTGAAAAAACTCGTCCTTAGTGATAGCGAGAAAAATACACTAAAGAATAAATGGAAGTTGTTGACTGAAAAGAAGTCTGAGAACGCAGAGGTCCGGGCCGTAGCTTTAGTTCCCAAGGACTTTCCGAAAGATTTAGTGCTTGCGCCGTTACCAGACCATGTGAACGATTTTACGTGGTATAAGAAGCGGAAGAAACGCCTAGGAATCAAACCAGTGAACAAGAACATCGGGTTGTCAATCATAATCCCAACTTTCAATCGTAGTAGGATATTAGACATCACCCTGGCTTGCCTCGTCAATCAAAAGACCCATTATCCTTTTGAGGTGATCGTGACCGACGATGGTTCTCAAGAGGATTTATCGCCTATAATCCGTCAATATGAGAACAAGCTAGACATCCGTTATGTTCGGCAAAAGGACTATGGGTATCAGCTGTGCGCCGTTAGAAACCTTGGTCTAAGGACAGCGAAGTATGACTTTGTCTCTATCTTGGATTGCGACATGGCCCCGCAGCAGCTATGGGTTCACTCTTACCTTACAGAACTATTAGAGGACGATGATTTGACCATAATAGGCCCCAGGAAGTACATTGACACGCAACACATAGATCCCAAGGATTTCCTTAATAACGCCTCTCTGTTAGAGTCGTTGCCAGAGGTTAAGACCAATAATTCCGTCGCGGCTAAGGGCGAGGGGACCGTATCTTTAGACTGGCGTTTGGAACAATTTGAGAAGACCGAGAACTTGAGGCTATCCGATAGCCCTTTCCGATTCTTCTCATGCGGAAATGTGGCCTTCTCCAAAGAGTGGCTGAACAAAGTTGGCTGGTTCGACGAGGAATTCAATCACTGGGGAGGTGAAGATGTAGAGTTCGGTTATCGTCTGTTTCGGTACGGTTCGTTCTTCAAAACTATAGACGGCATCATGGCCTATCATCAGGAACCGCCAGGTAAAGAAAACGAAACTGACAGAGAAGCGGGCAAGAACATTACCCTCGATATAATGAGGGAGAAGGTGCCTTACATCTACCGTAAACTCCTGCCTATAGAAGACAGTCATATCAACCGAGTACCATTGGTATCAATTTACATCCCGGCCTACAACTGTGCTAACTATATTCAAAGATGTGTTGATTCAGCTTTGAATCAAACGGTAGTTGATCTCGAAGTGTGCATTTGCAACGACGGTAGTACTGACAACACGCTGGAAGTTATTAACAAGCTGTATGGTAATAATCCGCGTGTGCGTATAATGTCTAAACCCAATGGCGGCATTGCGAGTGCATCCAACGCAGCGGTCAGCTTCGCAAAGGGTTATTACATAGGACAGTTGGACAGCGACGATTACTTAGAACCCGACGCAGTGGAGTTATGTCTCAAGGAATTTCTTAAGGATAAGACCCTTGCGTGCGTTTACACCACTAATCGTAACGTCAACCCAGATGGCTCTTTAATAGCCAATGGCTATAACTGGCCAGAGTTCAGTCGTGAGAAGTTGACTACGGCCATGATTGCTCATCACTTCCGGATGTTTACCATTCGTGCTTGGCATCTGACGGATGGGTTCAATGAGAAGATTGAGAACGCTGTTGACTACGACATGTTTCTCAAGCTCAGTGAAGTTGGTAAATTTAAGCATCTGAACAAAATATGTTATAATCGGGTGTTACACGGCGATAACACCTCAATCAAGAAgCTTGGCATACAAAAGAAGAATCATTTCGTAGTTGTCAATCAGTCTCTAAACCGCCAAGGTATAACTTATTATAACTACGATGAATTTGATGATCTCGATGAGAGTCGGAAATACATTTTCAACAAGACTGCAGAGTATCAAGAAGAGATAGATATTCTTAAAGATATTAAGATCATTCAGAACAAAGACGCCAAAATAGCTGTCTCCATTTTCTATCCGAACACTCTAAACGGGTTGGTGAAGAAGCTAAATAATATTATAGAGTATAATAAGAATATCTTCGTTATTGTACTTCATGTCGATAAGAATCACTTAACCCCAGACATCAAGAAGGAGATATTAGCCTTCTACCATAAGCATCAGGTGAACATCTTATTGAACAATGACATCTCCTACTATACATCAAATCGTCTGATTAAGACAGAAGCCCATTTGAGTAACATTAACAAGCTaAGTCAATTAAATCTTAACTGCGAATACATTATATTCGACAATCACGATTCCTTATTTGTGAAGAACGATTCCTATGCATACATGAAGAAGTATGATGTTGGAATGAACTTCTCTGCATTGACTCATGATTGGATTGAAAAGATAAACGCTCACCCGCCATTTAAGAAGCTgATCAAAACTTACTTCAATGACAATGATCTTAAGTCGATGAATGTAAAGGGTGCCTCCCAGGGAATGTTTATGACATACGCATTAGCCCACGAGTTATTGACGATCATCAAGGAGGTGATAACCTCTTGTCAATCCATTGACTCCGTCCCCGAATACAACACAGAAGATATTTGGTTTCAGTTTGCACTTTTAATTCTGGAAAAGAAGACCGGCCACGTATTCAACAAGACAAGCACTCTCACGTATATGCCATGGGAACGTAAACTGCAGTGGACGAATGAACAAATAGAGTCCGCAAAGAGGGGCGAAAACATTCCGGTAAACAAGTTCATCATTAACAGCATTACCCTTTAA
SEQ ID NO:3是具有软骨素合酶活性的多肽的重编码核酸序列:嵌合核酸,其包含来自编码源自多杀巴斯德菌的透明质酸合酶的核酸的片段,和来自编码源自多杀巴斯德菌的软骨素合酶的核酸的片段(HCOS1-3):
ATGAACACCCTTTCCCAGGCAATTAAGGCTTATAATAGTAATGATTATCAACTAGCCCTCAAGCTGTTCGAAAAGTCGGCAGAAATCTACGGCAGAAAGATAGTTGAGTTCCAAATTACGAAGTGCAAGGAGAAACTTTCTGCGCACCCATCCGTTAACAGTGCGCATCTCTCGGTTAACAAAGAAGAGAAGGTGAATGTTTGCGACAGTCCATTAGACATAGCCACTCAATTATTGTTATCGAATGTGAAAAAACTCGTCCTTAGTGATAGCGAGAAAAATACACTAAAGAATAAATGGAAGTTGTTGACTGAAAAGAAGTCTGAGAACGCAGAGGTCCGGGCCGTAGCTTTAGTCCCAAAGGATTTTCCCAAAGACTTAGTTTTAGCGCCACTACCAGACCATGTGAACGATTTTACCTGGTACAAGAATAGAAAGAAGAGCCTGGGCATAAAGCCTGTGAACAAGAACATCGGGTTGTCAATCATAATCCCAACTTTCAATCGTAGTAGGATATTAGACATTACCCTGGCGTGTCTAGTTAATCAGAAAACTAACTATCCGTTTGAGGTGGTTGTTGCAGATGATGGGTCGAAGGAAAATCTATTGACTATAGTTCAGAAATACGAGCAGAAACTAGACATTAAGTATGTGAGACAGAAGGACTATGGGTATCAGCTGTGCGCCGTTAGAAACCTTGGTCTAAGGACAGCGAAGTATGACTTTGTCTCTATCTTGGATTGCGACATGGCCCCGCAGCAGCTATGGGTTCACTCTTACCTTACAGAGTTACTGGAAGACAACGACATCGTCTTGATCGGGCCAAGGAAATACGTTGATACCCACAACATCACGGCTGAGCAGTTTCTGAACGACCCATATTTAATTGAGAGTTTACCGGAAACCGCCACAAACAATAATCCATCGATTACCAGTAAGGGTAACATCTCATTAGATTGGAGATTAGAACATTTTAAGAAGACAGACAACCTAAGACTATGCGACTCCCCGTTCAGGTATTTCTCATGCGGAAATGTGGCCTTCTCCAAAGAGTGGCTGAACAAAGTTGGCTGGTTCGACGAAGAATTTAATCACTGGGGCGGCGAAGACGTCGAATTCGGCTACAGGTTATTTGCAAAAGGGTGCTTCTTTAGGGTTATCGACGGTGGTATGGCCTACCATCAAGAGCCACCAGGAAAGGAGAACGAAACGGATCGTGAGGCCGGTAAGTCTATCACTCTTAAAATAGTAAAGGAGAAAGTGCCCTACATCTACAGGAAGTTGTTGCCGATTGAGGACTCCCACATAAACCGAGTACCATTGGTATCAATTTACATCCCGGCCTACAACTGTGCTAACTATATTCAAAGATGTGTTGATTCAGCTTTGAATCAAACGGTAGTTGATCTCGAAGTGTGCATTTGCAACGACGGTAGTACTGACAACACGCTGGAAGTTATTAACAAGCTGTATGGTAATAATCCGCGTGTGCGTATAATGTCTAAACCCAATGGCGGCATTGCGAGTGCATCCAACGCAGCGGTCAGCTTCGCAAAGGGTTATTACATAGGACAGTTGGACAGCGACGATTACTTAGAACCCGACGCAGTGGAGTTATGTCTCAAGGAATTTCTTAAGGATAAGACCCTTGCGTGCGTTTACACCACTAATCGTAACGTCAACCCAGATGGCTCTTTAATAGCCAATGGCTATAACTGGCCAGAGTTCAGTCGTGAGAAGTTGACTACGGCCATGATTGCTCATCACTTCCGGATGTTTACCATTCGTGCTTGGCATCTGACGGATGGGTTCAATGAGAAGATTGAGAACGCTGTTGACTACGACATGTTTCTCAAGCTCAGTGAAGTTGGTAAATTTAAGCATCTGAACAAAATATGTTATAATCGGGTGTTACACGGCGATAACACCTCAATCAAGAAGCTTGGCATACAAAAGAAGAATCATTTCGTAGTTGTCAATCAGTCTCTAAACCGCCAAGGTATAACTTATTATAACTACGATGAATTTGATGATCTCGATGAGAGTCGGAAATACATTTTCAACAAGACTGCAGAGTATCAAGAAGAGATAGATATTCTTAAAGATATTAAGATCATTCAGAACAAAGACGCCAAAATAGCTGTCTCCATTTTCTATCCGAACACTCTAAACGGGTTGGTGAAGAAGCTAAATAATATTATAGAGTATAATAAGAATATCTTCGTTATTGTACTTCATGTCGATAAGAATCACTTAACCCCAGACATCAAGAAGGAGATATTAGCCTTCTACCATAAGCATCAGGTGAACATCTTATTGAACAATGACATCTCCTACTATACATCAAATCGTCTGATTAAGACAGAAGCCCATTTGAGTAACATTAACAAGCTAAGTCAATTAAATCTTAACTGCGAATACATTATATTCGACAATCACGATTCCTTATTTGTGAAGAACGATTCCTATGCATACATGAAGAAGTATGATGTTGGAATGAACTTCTCTGCATTGACTCATGATTGGATTGAAAAGATAAACGCTCACCCGCCATTTAAGAAGCTGATCAAAACTTACTTCAATGACAATGATCTTAAGTCGATGAATGTAAAGGGTGCCTCCCAGGGAATGTTTATGACATACGCATTAGCCCACGAGTTATTGACGATCATCAAGGAGGTGATAACCTCTTGTCAATCCATTGACTCCGTCCCCGAATACAACACAGAAGATATTTGGTTTCAGTTTGCACTTTTAATTCTGGAAAAGAAGACCGGCCACGTATTCAACAAGACAAGCACTCTCACGTATATGCCATGGGAACGTAAACTGCAGTGGACGAATGAACAAATAGAGTCCGCAAAGAGGGGCGAAAACATTCCGGTAAACAAGTTCATCATTAACAGCATTACCCTTTAA
SEQ ID NO:4是具有软骨素合酶活性的多肽的核酸序列:嵌合核酸,其包含来自编码源自多杀巴斯德菌的透明质酸合酶的核酸的片段,来自编码源自多杀巴斯德菌的软骨素合酶的核酸的片段,和lz编码来自酿酒酵母的几丁质合酶2的核酸的片段(HCOS.Sc)
ATGAACACCCTTTCCCAGGCAATTAAGGCTTATAATAGTAATGATTATCAACTAGCCCTCAAGCTGTTCGAAAAGTCGGCAGAAATCTACGGCAGAAAGATAGTTGAGTTCCAAATTACGAAGTGCAAGGAGAAACTTTCTGCGCACCCATCCGTTAACAGTGCGCATCTCTCGGTTAACAAAGAAGAGAAGGTGAATGTTTGCGACAGTCCATTAGACATAGCCACTCAATTATTGTTATCGAATGTGAAAAAACTCGTCCTTAGTGATAGCGAGAAAAATACACTAAAGAATAAATGGAAGTTGTTGACTGAAAAGAAGTCTGAGAACGCAGAGGTCCGGGCCGTAGCTTTAGTCCCAAAGGATTTTCCCAAAGACTTAGTTTTAGCGCCACTACCAGACCATGTGAACGATTTTACCTGGTACAAGAATAGAAAGAAGAGCCTGGGCATAAAGCCTGTGAACAAGAACATCGGGTTGTCAATCATAATCCCAACTTTCAATCGTAGTAGGATATTAGACATTACCCTGGCGTGTCTAGTTAATCAGAAAACTAACTATCCGTTTGAGGTGGTTGTTGCAGATGATGGGTCGAAGGAAAATCTATTGACTATAGTTCAGAAATACGAGCAGAAACTAGACATTAAGTATGTGAGACAGAAGGACTATGGGTATCAGCTGTGCGCCGTTAGAAACCTTGGTCTAAGGACAGCGAAGTATGACTTTGTCTCTATCTTGGATTGCGACATGGCCCCGCAGCAGCTATGGGTTCACTCTTACCTTACAGAGTTACTGGAAGACAACGACATCGTCTTGATCGGGCCAAGGAAATACGTTGATACCCACAACATCACGGCTGAGCAGTTTCTGAACGACCCATATTTAATTGAGAGTTTACCGGAAACCGCCACAAACAATAATCCATCGATTACCAGTAAGGGTAACATCTCATTAGATTGGAGATTAGAACATTTTAAGAAGACAGACAACCTAAGACTATGCGACTCCCCGTTCAGGTATTTCTCATGCGGAAATGTGGCCTTCTCCAAAGAGTGGCTGAACAAAGTTGGCTGGTTCGACGAAGAATTTAATCACTGGGGCGGCGAAGACGTCGAATTCGGCTACAGGTTATTTGCAAAAGGGTGCTTCTTTAGGGTTATCGACGGTGGTATGGCCTACCATCAAGAGCCACCAGGAAAGGAGAACGAAACGGATCGTGAGGCCGGTAAGTCTATCACTCTTAAAATAGTAAAGGAGAAAGTGCCCTACATCTACAGGAAGTTGTTGCCGATTGAGGACTCCCACATAAACCGAGTACCATTGGTATCAATTTACATCCCGGCCTACAACTGTGCTAACTATATTCAAAGATGTGTTGATTCAGCTTTGAATCAAACGGTAGTTGATCTCGAAGTGTGCATTTGCAACGACGGTAGTACTGACAACACGCTGGAAGTTATTAACAAGCTGTATGGTAATAATCCGCGTGTGCGTATAATGTCTAAACCCAATGGCGGCATTGCGAGTGCATCCAACGCAGCGGTCAGCTTCGCAAAGGGTTATTACATAGGACAGTTGGACAGCGACGATTACTTAGAACCCGACGCAGTGGAGTTATGTCTCAAGGAATTTCTTAAGGATAAGACCCTTGCGTGCGTTTACACCACTAATCGTAACGTCAACCCAGATGGCTCTTTAATAGCCAATGGCTATAACTGGCCAGAGTTCAGTCGTGAGAAGTTGACTACGGCCATGATTGCTCATCACTTCCGGATGTTTACCATTCGTGCTTGGCATCTGACGGATGGGTTCAATGAGAAGATTGAGAACGCTGTTGACTACGACATGTTTCTCAAGCTCAGTGAAGTTGGTAAATTTAAGCATCTGAACAAAATATGTTATAATCGGGTGTTACACGGCGATAACACCTCAATCAAGAAGCTTGGCATACAAAAGAAGAATCATTTCGTAGTTGTCAATCAGTCTCTAAACCGCCAAGGTATAACTTATTATAACTACGATGAATTTGATGATCTCGATGAGAGTCGGAAATACATTTTCAACAAGACTGCAGAGTATCAAGAAGAGATAGATATTCTTAAAGATATTTTTATTCAGATGCTTTTTTCCTGGTTTTCTATTGCAAATTTCGTTCTTACCTTTTATTATTTAGCAGGATCAATGAATTTAGTTATTAAACATGGTGAGGCCTTATTCATTTTTTTTAAATACCTGATCTTTTGTGACTTGGCAAGTTTATTCATTATTTCCATGGGTAATAGACCCCAGGGCGCGAAACATTTATTCATTACCTCCATGGTTATACTGTCTATATGTGCCACATATTCTCTAATTTGTGGGTTTGTTTTTGCTTTCAAGTCGTTAGCTTCTGGAACGGAATCCCACAAAATATTTGTCGACATCGTTATCTCATTGCTCTCCACCTATGGCCTATACTTTTTCTCATCACTGATGTACCTAGATCCTTGGCACATGTTTACATCATCCATACAATACTTTTTGACACTTCCCGCCTTTACGTGTACTTTACAGATTTTTGCCTTCTGTAATACACACGACGTTTCCTGGGGTACTAAAGGTTCCACACAGGAGTCCAAGCAATTGTCCAAGGCCATTGTCGTTCAAGGTCCAGATGGGAAACAGATTGTGGAAACAGATTGGCCTCAGGAAGTTGATAAGAAGTTTTTGGAAATAAAAAGTCGTTTGAAAGAACCAGAATTTGAAGAATCAAGCGGCAATGAAAAACAATCCAAGAATGATTATTATAGAGATATAAGAACCAGAATTGTGATGATTTGGATGCTATCAAATCTAATACTGATCATGTCTATAATTCAAGTCTTTACACCACAAGATACTGACAATGGTTATTTGATATTCATTTTATGGTCTGTGGCCGCTTTAGCTGCCTTTAGGGTGGTTGGTTCCATGGCCTTTTTGTTCATGAAATACTTGCGTATAATAGTGAGTTACAGAAATAAAGTTGAAGGTAGCGGCTCATGGGAAGTCTCTAAATTAGACTTACCAAATGTTTTCCACAAAAAGGGCTAA
SEQ ID NO:5是具有软骨素合酶活性的多肽的核酸序列:嵌合核酸,其包含来自编码源自多杀巴斯德菌的透明质酸合酶的核酸的片段,和来自编码源自酿酒酵母的几丁质合酶2的核酸的片段(HHASA.Sc)
ATGAACACCCTTTCCCAGGCAATTAAGGCTTATAATAGTAATGATTATCAACTAGCCCTCAAGCTGTTCGAAAAGTCGGCAGAAATCTACGGCAGAAAGATAGTTGAgTTCCAAATTACGAAGTGCAAGGAGAAACTTTCTGCGCACCCATCCGTTAACAGTGCGCATCTCTCGGTTAACAAAGAAGAGAAGGTGAATGTTTGCGACAGTCCATTAGACATAGCCACTCAATTATTGTTATCGAATGTGAAAAAACTCGTCCTTAGTGATAGCGAGAAAAATACACTAAAGAATAAATGGAAGTTGTTGACTGAAAAGAAGTCTGAGAACGCAGAGGTCCGGGCCGTAGCTTTAGTTCCCAAGGACTTTCCGAAAGATTTAGTGCTTGCGCCGTTACCAGACCATGTGAACGATTTTACGTGGTATAAGAAGCGGAAGAAACGCCTAGGAATCAAACCAGAACACCAACACGTTGGCCTCTCCATTATTGTGACAACGTTCAACCGTCCTGCCATCCTCAGCATCACCCTGGCTTGCCTCGTCAATCAAAAGACCCATTATCCTTTTGAGGTGATCGTGACCGACGATGGTTCTCAAGAGGATTTATCGCCTATAATCCGTCAATATGAGAACAAGCTAGACATCCGTTATGTTCGGCAAAAGGACAACGGTTTTCAGGCATCGGCCGCACGTAATATGGGCCTACGTCTAGCCAAATATGACTTCATTGGGCTCCTTGATTGTGATATGGCTCCCAACCCTTTGTGGGTACACTCATACGTTGCGGAACTATTAGAGGACGATGATTTGACCATAATAGGCCCCAGGAAGTACATTGACACGCAACACATAGATCCCAAGGATTTCCTTAATAACGCCTCTCTGTTAGAGTCGTTGCCAGAGGTTAAGACCAATAATTCCGTCGCGGCTAAGGGCGAGGGGACCGTATCTTTAGACTGGCGTTTGGAACAATTTGAGAAGACCGAGAACTTGAGGCTATCCGATAGCCCTTTCCGATTCTTCGCAGCTGGGAATGTGGCTTTCGCCAAGAAGTGGCTTAACAAGTCAGGATTCTTCGACGAGGAATTCAATCACTGGGGAGGTGAAGATGTAGAGTTCGGTTATCGTCTGTTTCGGTACGGTTCGTTCTTCAAAACTATAGACGGCATCATGGCCTATCATCAGGAACCGCCAGGTAAAGAAAACGAAACTGACAGAGAAGCGGGCAAGAACATTACCCTCGATATAATGAGGGAGAAGGTGCCTTACATCTACCGTAAACTCCTGCCTATAGAAGACAGTCATATCAACCGAGTACCATTGGTATCAATTTACATCCCGGCCTACAACTGTGCTAACTATATTCAAAGATGTGTTGATTCAGCTTTGAATCAAACGGTAGTTGATCTCGAAGTGTGCATTTGCAACGACGGTAGTACTGACAACACGCTGGAAGTTATTAACAAGCTGTATGGTAATAATCCGCGTGTGCGTATAATGTCTAAACCCAATGGCGGCATTGCGAGTGCATCCAACGCAGCGGTCAGCTTCGCAAAGGGTTATTACATAGGACAGTTGGACAGCGACGATTACTTAGAACCCGACGCAGTGGAGTTATGTCTCAAGGAATTTCTTAAGGATAAGACCCTTGCGTGCGTTTACACCACTAATCGTAACGTCAACCCAGATGGCTCTTTAATAGCCAATGGCTATAACTGGCCAGAGTTCAGTCGTGAGAAGTTGACTACGGCCATGATTGCTCATCACTTCCGGATGTTTACCATTCGTGCTTGGCATCTGACGGATGGGTTCAATGAGAAGATTGAGAACGCTGTTGACTACGACATGTTTCTCAAGCTCAGTGAAGTTGGTAAATTTAAGCATCTGAACAAAATATGTTATAATCGGGTGTTACACGGCGATAACACCTCAATCAAGAAgCTTGGCATACAAAAGAAGAATCATTTCGTAGTTGTCAATCAGTCTCTAAACCGCCAAGGTATAACTTATTATAACTACGATGAATTTGATGATCTCGATGAGAGTCGGAAATACATTTTCAACAAGACTGCAGAGTATCAAGAAGAGATAGATATTCTTAAAGATATTTTTATTCAGATGCTTTTTTCCTGGTTTTCTATTGCAAATTTCGTTCTTACCTTTTATTATTTAGCAGGATCAATGAATTTAGTTATTAAACATGGTGAGGCCTTATTCATTTTTTTTAAATACCTGATCTTTTGTGACTTGGCAAGTTTATTCATTATTTCCATGGGTAATAGACCCCAGGGCGCGAAACATTTATTCATTACCTCCATGGTTATACTGTCTATATGTGCCACATATTCTCTAATTTGTGGGTTTGTTTTTGCTTTCAAGTCGTTAGCTTCTGGAACGGAATCCCACAAAATATTTGTCGACATCGTTATCTCATTGCTCTCCACCTATGGCCTATACTTTTTCTCATCACTGATGTACCTAGATCCTTGGCACATGTTTACATCATCCATACAATACTTTTTGACACTTCCCGCCTTTACGTGTACTTTACAGATTTTTGCCTTCTGTAATACACACGACGTTTCCTGGGGTACTAAAGGTTCCACACAGGAGTCCAAGCAATTGTCCAAGGCCATTGTCGTTCAAGGTCCAGATGGGAAACAGATTGTGGAAACAGATTGGCCTCAGGAAGTTGATAAGAAGTTTTTGGAAATAAAAAGTCGTTTGAAAGAACCAGAATTTGAAGAATCAAGCGGCAATGAAAAACAATCCAAGAATGATTATTATAGAGATATAAGAACCAGAATTGTGATGATTTGGATGCTATCAAATCTAATACTGATCATGTCTATAATTCAAGTCTTTACACCACAAGATACTGACAATGGTTATTTGATATTCATTTTATGGTCTGTGGCCGCTTTAGCTGCCTTTAGGGTGGTTGGTTCCATGGCCTTTTTGTTCATGAAATACTTGCGTATAATAGTGAGTTACAGAAATAAAGTTGAAGGTAGCGGCTCATGGGAAGTCTCTAAATTAGACTTACCAAATGTTTTCCACAAAAAGGGCTAA
SEQ ID NO:6是具有软骨素合酶活性的多肽的核酸序列:嵌合核酸,其包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的核酸的片段,和来自编码源自大肠埃希氏菌的软骨素合酶的核酸的片段(HCOS1-Vir)
ATGGGTAAGAACATCATTATTATGGTTTCTTGGTACACTATTATTACATCCAATCTCATCGCAGTGGGTGGCGCCTCACTCATACTAGCCCCAGCTATTACGGGCTATGTCCTTCACTGGAACATTGCCCTTTCAACAATTTGGGGAGTGTCGGCCTACGGAATTTTCGTGTTTGGTTTCTTTCTTGCCCAGGTATTATTTAGTGAACTCAACCGGAAAAGGCTCCGGAAGTGGATTTCCCTCCGACCCAAAGGGTGGAATGATGTTAGGTTGGCTGTAATTATTGCCGGCTACCGTGAGGACCCGTATATGTTCCAAAAGTGTCTTGAAAGTGTGCGTGACTCAGACTATGGGAATGTAGCTAGACTAATATGCGTTATTGACGGCGATGAAGACGACGACATGAGGATGGCTGCAGTGTACAAGGCTATCTATAACGACAACATCAAGAAACCTGAGTTTGTCCTCTGTGAGAGTGACGATAAGGAGGGTGAGAGAATAGATAGCGATTTCAGCCGTGATATCTGCGTGCTGCAACCGCATCGCGGAAAGCGTGAATGTTTGTACACAGGGTTCCAATTGGCAAAGATGGACCCCTCAGTTAATGCCGTCGTCCTAATCGACAGTGACACTGTGTTAGAAAAGGACGCGATTCTCGAaGTAGTATACCCGCTGGCATGCGATCCAGAAATACAGGCTGTAGCAGGCGAATGCAAAATATGGAATACTGACACACTGTTGAGTTTGCTGGTAGCCTGGCGATATTACAGCGCATTTTGCGTAGAGCGTAGCGCCCAATCATTCTTCAGGACAGTACAATGCGTCGGAGGACCTCTCGGCGCCTACAAGATTGATATAATTAAGGAAATCAAGGACCCATGGATCAGCCAACGTTTCCTTGGCCAAAAGTGCACATACGGCGACGATAGACGACTCACTAATGAAATACTAATGAGGGGTAAGAAAGTAGTTTTCACCCCATTCGCTGTTGGCTGGGGATGGTTCGACGAGGAGTTCACACACTGGGGTGGCCGTTACATTGTACAGCAAACACGGTGGTCCAAGTCGTGGTGTAGGGAGATATGGTATACACTGTTTGCAGCATGGAAGCATGGACTTTCGGGCATTTGGCTCGCATTCGAGTGCTTATACCAGATTACTTATTTCTTCCTGGTGATTTACCTATTCTCCCGTTTGGCTGTTGAGGCTGACCCACGGGCGCAAACGGCCACCGTCATTGTTTCGACCACAGTTGCGCTTATTAAGTGCGGTTACTTTAGCTTCAGAGCTAAAGACATTAGGGCCTTCTATTTCGTCCTCTACACGTTCGTTTACTTCTTCTGCATGATTCCGGCACGAATAACTGCGATGATGACCCTGTGGGACATAGGTTGGGGAACCAGGGGAGGAAATGAGAAGCCTTCCGTAGGCACCAGAGTTGCTTTGTGGGCCAAGCAATATTTGATTGCTTACATGTGGTGGGCCGCTGTCGTCGGTGCTGGCGTGTACTCCATCGTTCATAATTGGATGTTTGACTGGAATTCACTTTCCTACAGGTTCGCACTGGTAGGCATCTGTTCGTATATAGTTTTCATTGTAATAGTGCTGGTAGTCTACTTTACAGGAAAGATCACGACCTGGAACTTCACGAAGCTACAGAAAGAATTGATCGAGGACCGCGTACTGTACGACGCAACGACCAATGCCCAGTCGGTATAA
SEQ ID NO:7是具有软骨素合酶活性的多肽的重编码核酸序列:嵌合核酸,其包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的核酸的片段,和来自编码源自大肠埃希氏菌的软骨素合酶的核酸的片段(HCOS2-Vir)
ATGGGTAAGAACATCATTATTATGGTTTCTTGGTACACTATTATTACATCCAATCTCATCGCAGTGGGTGGCGCCTCACTCATACTAGCCCCAGCTATTACGGGCTATGTCCTTCACTGGAACATTGCCCTTTCAACAATTTGGGGAGTGTCGGCCTACGGAATTTTCGTGTTTGGTTTCTTTCTTGCCCAGGTATTATTTAGTGAACTCAACCGGAAAAGGCTCCGGAAGTGGATTTCCCTCCGACCCAAAGGGTGGAATGATGTTAGGTTGGCTGTAATTATTGCCGGCTACCGTGAGGACCCGTATATGTTCCAAAAGTGTCTTGAAAGTGTGCGTGACTCAGACTATGGGAATGTAGCTAGACTAATATGCGTTATTGACGGCGATGAAGACGACGACATGAGGATGGCTGCAGTGTACAAGGCTATCTATAACGACAACATCAAGAAACCTGAGTTTGTCCTCTGTGAGAGTGACGATAAGGAGGGTGAGAGAATAGATAGCGATTTCAGCCGTGATATCTGCGTGCTGCAACCGCATCGCGGAAAGCGTGAATGTTTGTACACAGGGTTCCAATTGGCAAAGATGGACCCCTCAGTTAATGCCGTCGTCCTAATCGACAGTGACACTGTGTTAGAAAAGGACGCGATTCTCGAaGTAGTATACCCGCTGGCATGCGATCCAGAAATACAGGCTGTAGCAGGCGAATGCAAAATATGGAATACTGACACACTGTTGAGTTTGCTGGTAGCCTGGCGATATTACAGCGCATTTTGCGTAGAGCGTAGCGCCCAATCATTCTTCAGGACAGTACAATGCGTCGGAGGACCTCTCGGCGCCTACAAGATTGATATAATTAAGGAAATCAAGGACCCATGGATCAGCCAACGTTTCCTTGGCCAAAAGTGCACATACGGCGACGATAGACGACTCACTAATGAAATACTAATGAGGGGTAAGAAAGTAGTTTTCACCCCATTCGCTGTTGGCTGGCTACACGGTGAGAATACGTCTATCAAGAAGTTACGTTACATTGTACAGCAAACACGGTGGTCCAAGTCGTGGTGTAGGGAGATATGGTATACACTGTTTGCAGCATGGAAGCATGGACTTTCGGGCATTTGGCTCGCATTCGAGTGCTTATACCAGATTACTTATTTCTTCCTGGTGATTTACCTATTCTCCCGTTTGGCTGTTGAGGCTGACCCACGGGCGCAAACGGCCACCGTCATTGTTTCGACCACAGTTGCGCTTATTAAGTGCGGTTACTTTAGCTTCAGAGCTAAAGACATTAGGGCCTTCTATTTCGTCCTCTACACGTTCGTTTACTTCTTCTGCATGATTCCGGCACGAATAACTGCGATGATGACCCTGTGGGACATAGGTTGGGGAACCAGGGGAGGAAATGAGAAGCCTTCCGTAGGCACCAGAGTTGCTTTGTGGGCCAAGCAATATTTGATTGCTTACATGTGGTGGGCCGCTGTCGTCGGTGCTGGCGTGTACTCCATCGTTCATAATTGGATGTTTGACTGGAATTCACTTTCCTACAGGTTCGCACTGGTAGGCATCTGTTCGTATATAGTTTTCATTGTAATAGTGCTGGTAGTCTACTTTACAGGAAAGATCACGACCTGGAACTTCACGAAGCTACAGAAAGAATTGATCGAGGACCGCGTACTGTACGACGCAACGACCAATGCCCAGTCGGTATAA
SEQ ID NO:8是具有软骨素合酶活性的多肽的重编码核酸序列:嵌合核酸,其包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的核酸的片段,和来自编码源自结核分枝杆菌的呋喃半乳糖基转移酶的核酸的片段(HCOS3-Vir)
ATGGGTAAGAACATCATTATTATGGTTTCTTGGTACACTATTATTACATCCAATCTCATCGCAGTGGGTGGCGCCTCACTCATACTAGCCCCAGCTATTACGGGCTATGTCCTTCACTGGAACATTGCCCTTTCAACAATTTGGGGAGTGTCGGCCTACGGAATTTTCGTGTTTGGTTTCTTTCTTGCCCAGGTATTATTTAGTGAACTCAACCGGAAAAGGCTCCGGAAGTGGATTTCCCTCCGACCCAAAGGGTGGAATGATGTTAGGTTGGCTGTAATTATTGCCGGCTACCGTGAGGACCCGTATATGTTCCAAAAGTGTCTTGAAAGTGTGCGTGACTCAGACTATGGGAATGTAGCTAGACTAATATGCGTTATTGACGGCGATGAAGACGACGACATGAGGATGGCTGCAGTGTACAAGGCTATCTATAACGACAACATCAAGAAACCTGAGTTTGTCCTCTGTGAGAGTGACGATAAGGAGGGTGAGAGAATAGATAGCGATTTCAGCCGTGATATCTGCGTGCTGCAACCGCATCGCGGAAAGCGTGAATGTTTGTACACAGGGTTCCAATTGGCAAAGATGGACCCCTCAGTTAATGCCGTCGTCCTAATCGACAGTGACACTGTGTTAGAAAAGGACGCGATTCTCGAaGTAGTATACCCGCTGGCATGCGATCCAGAAATACAGGCTGTAGCAGGCGAATGCAAAATATGGAATACTGACACACTGTTGAGTTTGCTGGTAGCCTGGCGATATTACAGCGCATTTTGCGTAGAGCGTAGCGCCCAATCATTCTTCAGGACAGTACAATGCGTCGGAGGACCTCTCGGCGCCTACAAGATTGATATAATTAAGGAAATCAAGGACCCATGGATCAGCCAACGTTTCCTTGGCCAAAAGTGCACATACGGCGACGATAGACGACTCACTAATGAAATACTAATGAGGGGTAAGAAAGTAGTTTTCACCCCATTCGCTGTTGGCTGGCACATGGCATGGTCCGACAAGGACGACGCAATCGACCGTTACATTGTACAGCAAACACGGTGGTCCAAGTCGTGGTGTAGGGAGATATGGTATACACTGTTTGCAGCATGGAAGCATGGACTTTCGGGCATTTGGCTCGCATTCGAGTGCTTATACCAGATTACTTATTTCTTCCTGGTGATTTACCTATTCTCCCGTTTGGCTGTTGAGGCTGACCCACGGGCGCAAACGGCCACCGTCATTGTTTCGACCACAGTTGCGCTTATTAAGTGCGGTTACTTTAGCTTCAGAGCTAAAGACATTAGGGCCTTCTATTTCGTCCTCTACACGTTCGTTTACTTCTTCTGCATGATTCCGGCACGAATAACTGCGATGATGACCCTGTGGGACATAGGTTGGGGAACCAGGGGAGGAAATGAGAAGCCTTCCGTAGGCACCAGAGTTGCTTTGTGGGCCAAGCAATATTTGATTGCTTACATGTGGTGGGCCGCTGTCGTCGGTGCTGGCGTGTACTCCATCGTTCATAATTGGATGTTTGACTGGAATTCACTTTCCTACAGGTTCGCACTGGTAGGCATCTGTTCGTATATAGTTTTCATTGTAATAGTGCTGGTAGTCTACTTTACAGGAAAGATCACGACCTGGAACTTCACGAAGCTACAGAAAGAATTGATCGAGGACCGCGTACTGTACGACGCAACGACCAATGCCCAGTCGGTATAA
SEQ ID NO:9是具有软骨素合酶活性的多肽的重编码核酸序列:嵌合核酸,其包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的核酸的片段,和来自编码源自大肠埃希氏菌的软骨素合酶的核酸的片段(HCOS4-Vir)
ATGGGTAAGAACATCATTATTATGGTTTCTTGGTACACTATTATTACATCCAATCTCATCGCAGTGGGTGGCGCCTCACTCATACTAGCCCCAGCTATTACGGGCTATGTCCTTCACTGGAACATTGCCCTTTCAACAATTTGGGGAGTGTCGGCCTACGGAATTTTCGTGTTTGGTTTCTTTCTTGCCCAGGTATTATTTAGTGAACTCAACCGGAAAAGGCTCCGGAAGTGGATTTCCCTCCGACCCAAAGGGTGGAATGATGTTAGGTTGGCTGTAATTATTGCCGGCTACCGTGAGGACCCGTATATGTTCCAAAAGTGTCTTGAAAGTGTGCGTGACTCAGACTATGGGAATGTAGCTAGACTAATATGCGTTATTGACGGCGATGAAGACGACGACATGAGGATGGCTGCAGTGTACAAGGCTATCTATAACGACAACATCAAGAAACCTGAGTTTGTCCTCTGTGAGAGTGACGATAAGGAGGGTGAGAGAATAGATAGCGATTTCAGCCGTGATATCTGCGTGCTGCAACCGCATCGCGGAAAGCGTGAATGTTTGTACACAGGGTTCCAATTGGCAAAGATGGACCCCTCAGTTAATGCCGTCGTCCTAATCGACAGTGACACTGTGTTAGAAAAGGACGCGATTCTCGAaGTAGTATACCCGCTGGCATGCGATCCAGAAATACAGGCTGTAGCAGGCGAATGCAAAATATGGAATACTGACACACTGTTGAGTTTGCTGGTAGCCTGGCGATATTACAGCGCATTTTGCGTAGAGCGTAGCGCCCAATCATTCTTCAGGACAGTACAATGCGTCGGAGGACCTCTCGGCGCCTACAAGATTGATATAATTAAGGAAATCAAGGACCCATGGATCAGCCAACGTTTCCTTGGCCAAAAGTGCACATACGGCGACGATAGACGACTCACTAATGAAATACTAATGAGGGGTAAGAAAGTAGTTTTCACCCCATTCGCTGTTGGCTGGTTCGACGAGGAGTTCACACACTGGGGTGGCCGTTACATTGTACAGCAAACACGGTGGTCCAAGTCGTGGTGTAGGGAGATATGGTATACACTGTTTGCAGCATGGAAGCATGGACTTTCGGGCATTTGGCTCGCATTCGAGTGCTTATACCAGATTACTTATTTCTTCCTGGTGATTTACCTATTCTCCCGTTTGGCTGTTGAGGCTGACCCACGGGCGCAAACGGCCACCGTCATTGTTTCGACCACAGTTGCGCTTATTAAGTGCGGTTACTTTAGCTTCAGAGCTAAAGACATTAGGGCCTTCTATTTCGTCCTCTACACGTTCGTTTACTTCTTCTGCATGATTCCGGCACGAATAACTGCGATGATGACCCTGTGGGACATAGGTTGGGGAACCAGGGGAGGAAATGAGAAGCCTTCCGTAGGCACCAGAGTTGCTTTGTGGGCCAAGCAATATTTGATTGCTTACATGTGGTGGGCCGCTGTCGTCGGTGCTGGCGTGTACTCCATCGTTCATAATTGGATGTTTGACTGGAATTCACTTTCCTACAGGTTCGCACTGGTAGGCATCTGTTCGTATATAGTTTTCATTGTAATAGTGCTGGTAGTCTACTTTACAGGAAAGATCACGACCTGGAACTTCACGAAGCTACAGAAAGAATTGATCGAGGACCGCGTACTGTACGACGCAACGACCAATGCCCAGTCGGTATAA
SEQ ID NO:10是具有软骨素合酶活性的多肽的核酸序列:嵌合核酸,其包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的核酸的片段,和来自编码源自草酸青霉的软骨素合酶的核酸的片段(HCOS5-Vir)
ATGGGTAAGAACATCATTATTATGGTTTCTTGGTACACTATTATTACATCCAATCTCATCGCAGTGGGTGGCGCCTCACTCATACTAGCCCCAGCTATTACGGGCTATGTCCTTCACTGGAACATTGCCCTTTCAACAATTTGGGGAGTGTCGGCCTACGGAATTTTCGTGTTTGGTTTCTTTCTTGCCCAGGTATTATTTAGTGAACTCAACCGGAAAAGGCTCCGGAAGTGGATTTCCCTCCGACCCAAATCCATTCACCATCCAATTTCGAAAACGACTCACCCCGACACAGAAAATGCAGGTGACTCAACATTGTTGTGCCCGCCCATGGATGGTATGGACGACATATTAGTCGTTATGAAGACAGGTGTCACAGAGGCTAAGGAAAAGGTGCCAGTACATTTTCAGACAACGCTGAGGTGTGTGCCGCACTACGTTATCTATAGCGACTTCGAAGAAGAGATAGAAGGTGTAAAGATTTACGACGTCTTGCAAGGAATGGACCCCGATGTTATGACGCAGGTTCCGGACTTCGATCTTTACAATCGTATTAAGAAGTTAGGGCGTCAGGGCCTTGCGGAGAACGACTTCGCGGACGAAGCGAACTCTGCGGTGGGTAAGCCTAATAACCCTGGTTGGAAGTTAGATAAATGGAAGTTCTTACCTATGATCATTGAGGCTCTGAGATACAAACCAAAGGCTAAGTGGTATGTTTTCATGGAAGCAGACACTTATATATCTTGGCCGACTTTATTAGCCTGGCTAAAACACTTCAACCACAAGAAGCCGTGGTATCTTGGCACTGAGACACAGATAGCCGATGTGATTTTCGCTCATGGTGGTTCAGGATTCATGATTAGTCATGCCGCGCTTAAGCTTGCTGCTGAAGAATATACCGCACGTCGTACTGAGTTGCACCACTACACAGACGGTCACTGGGCAGGAGACTGCGTATTAGGTAAAGTTCTTGCTGACGCAGGTGTGAACTTGCATTTCTCCTGGCCAATTTTACAGAATTCCAATCTGGGCGAACTGGATGAGTTCAACGTTGACTTATACAGGCAACCTTGGTGCTTTCCAGCTGCCGCTTTCCACCACTTGAACGCTCAGAAGATCCAGGACTTATGGTCTTACGAGCAGAAAAGGTGGCAGGACAAGGACAAGAGGGTTCTGTTACATAGCGACGTCTTCAGGGACCTATTATATCCGGATATAGCATTAAAACCCGCGAGGATCGGTTGGGACAACCTGAGTGCAGACGAACAGTCTACGGCCTCTAGTTTCGAGGAATGCAGGCAAATTTGTGATCAATTAGACGATTGTACCCAGTTTAGTTTCAGGGACAAATCCTGTTTTACATCAAGAACTCCACGTTTGGGCGCAGCCAATCCAAATACAGTTAGCGGATGGATGGTTGATCGTATCCGTGCGAATATGGAGAAGTCTGGACTGTTTGCAGCATGGAAGCATGGACTTTCGGGCATTTGGCTCGCATTCGAGTGCTTATACCAGATTACTTATTTCTTCCTGGTGATTTACCTATTCTCCCGTTTGGCTGTTGAGGCTGACCCACGGGCGCAAACGGCCACCGTCATTGTTTCGACCACAGTTGCGCTTATTAAGTGCGGTTACTTTAGCTTCAGAGCTAAAGACATTAGGGCCTTCTATTTCGTCCTCTACACGTTCGTTTACTTCTTCTGCATGATTCCGGCACGAATAACTGCGATGATGACCCTGTGGGACATAGGTTGGGGAACCAGGGGAGGAAATGAGAAGCCTTCCGTAGGCACCAGAGTTGCTTTGTGGGCCAAGCAATATTTGATTGCTTACATGTGGTGGGCCGCTGTCGTCGGTGCTGGCGTGTACTCCATCGTTCATAATTGGATGTTTGACTGGAATTCACTTTCCTACAGGTTCGCACTGGTAGGCATCTGTTCGTATATAGTTTTCATTGTAATAGTGCTGGTAGTCTACTTTACAGGAAAGATCACGACCTGGAACTTCACGAAGCTACAGAAAGAATTGATCGAGGACCGCGTACTGTACGACGCAACGACCAATGCCCAGTCGGTAtaa
SEQ ID NO:11:是具有软骨素合酶活性的多肽的核酸序列:嵌合核酸,其包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的核酸的片段,和来自编码源自多杀巴斯德菌的软骨素合酶的核酸的片段(HCOS6-Vir)
ATGGGTAAGAACATCATTATTATGGTTTCTTGGTACACTATTATTACATCCAATCTCATCGCAGTGGGTGGCGCCTCACTCATACTAGCCCCAGCTATTACGGGCTATGTCCTTCACTGGAACATTGCCCTTTCAACAATTTGGGGAGTGTCGGCCTACGGAATTTTCGTGTTTGGTTTCTTTCTTGCCCAGGTATTATTTAGTGAACTCAACCGGAAAAGGCTCCGGAAGTGGATTTCCCTCCGACCCAAATTAGACATTGCAACACAGTTATTACTATCGAATGTTAAGAAATTGACCTTAAGCGAGTCCGAAAAGAACAGCTTAAAGAATAAGTGGAAGAGTATAACAGGCAAGAAGTCCGAGAATGCTGAAATTAGGAAGGTTGAGTTAGTCCCAAAGGATTTTCCCAAAGACTTAGTTTTAGCGCCACTACCAGACCATGTGAACGATTTTACCTGGTACAAGAATAGAAAGAAGAGCCTGGGCATAAAGCCTGTGAACAAGAACATCGGGTTGTCAATCATAATCCCAACTTTCAATCGTAGTAGGATATTAGACATTACCCTGGCGTGTCTAGTTAATCAGAAAACTAACTATCCGTTTGAGGTGGTTGTTGCAGATGATGGGTCGAAGGAAAATCTATTGACTATAGTTCAGAAATACGAGCAGAAACTAGACATTAAGTATGTGAGACAGAAGGACTATGGGTATCAGCTGTGCGCCGTTAGAAACCTTGGTCTAAGGACAGCGAAGTATGACTTTGTCTCTATCTTGGATTGCGACATGGCCCCGCAGCAGCTATGGGTTCACTCTTACCTTACAGAGTTACTGGAAGACAACGACATCGTCTTGATCGGGCCAAGGAAATACGTTGATACCCACAACATCACGGCTGAGCAGTTTCTGAACGACCCATATTTAATTGAGAGTTTACCGGAAACCGCCACAAACAATAATCCATCGATTACCAGTAAGGGTAACATCTCATTAGATTGGAGATTAGAACATTTTAAGAAGACAGACAACCTAAGACTATGCGACTCCCCGTTCAGGTATTTCTCATGCGGAAATGTGGCCTTCTCCAAAGAGTGGCTGAACAAAGTTGGCTGGTTCGACGAAGAATTTAATCACTGGGGCGGCGAAGACGTCGAATTCGGCTACAGGTTATTTGCAAAAGGGTGCTTCTTTAGGGTTATCGACGGTGGTATGGCCTACCATCAAGAGCCACCAGGAAAGGAGAACGAAACGGATCGTGAGGCCGGTAAGTCTATCACTCTTAAAATAGTAAAGGAGAAAGTGCCCTACATCTACAGGAAGTTGTTGCCGATTGAGGACTCCCACATACACCGTATACCGCTTGTGAGCATATACATTCCAGCGTACAACTGCGCCAATTATATTCAAAGGTGTGTAGATAGCGCGTTGAATCAAACAGTGGTAGATTTGGAAGTTTGTATATGTAACGACGGAAGTACTGACAATACTTTAGAGGTGATTAACAAGCTGTATGGCAACAACCCGCGTGTCAGGATAATGAGCAAGCCCAATGGTGGAATTGCTTCCGCGTCTAACGCTGCCGTTTCATTCGCGAAAGGCTACTACATTGGCCAGTTGGACTCGGATGATTACTTGGAACCTGACGCAGTGGAGCTTTGTTTAAAGGAGTTCTTGAAGGACAAAACACTAGCCTGTGTATATACAACGAACAGAAATGTTAATCCTGACGGTTCCCTAATCGCTAACGGATACAATTGGCCTGAGTTCAGCAGGGAGAAGCTGACCACTGCTATGATCGCCCACCATTTCAGGATGTTCACAATCAGGGCTTGGCATTTAACAGATGGTTTTAATGAGAAAATAGAGAACGCAGTAGACTACGATATGTTTCTGAAGTTATCAGAGGTCGGGAAATTCAAACACTTGAACAAAATTTGTTACAATAGGGTATTACACGGTGACAACACCAGTATTAAGAATCTTGACACCCAAAAGAAGAACCACTTCGTAGTAGTGAACCAGTCTCTGAACAGACAAAGGGTGTCGAATTATAACTACGATGAGTTTGATAACCTGGACGAGAGCCGTAAGTACATATTCAACAAGCTGTTTGCAGCATGGAAGCATGGACTTTCGGGCATTTGGCTCGCATTCGAGTGCTTATACCAGATTACTTATTTCTTCCTGGTGATTTACCTATTCTCCCGTTTGGCTGTTGAGGCTGACCCACGGGCGCAAACGGCCACCGTCATTGTTTCGACCACAGTTGCGCTTATTAAGTGCGGTTACTTTAGCTTCAGAGCTAAAGACATTAGGGCCTTCTATTTCGTCCTCTACACGTTCGTTTACTTCTTCTGCATGATTCCGGCACGAATAACTGCGATGATGACCCTGTGGGACATAGGTTGGGGAACCAGGGGAGGAAATGAGAAGCCTTCCGTAGGCACCAGAGTTGCTTTGTGGGCCAAGCAATATTTGATTGCTTACATGTGGTGGGCCGCTGTCGTCGGTGCTGGCGTGTACTCCATCGTTCATAATTGGATGTTTGACTGGAATTCACTTTCCTACAGGTTCGCACTGGTAGGCATCTGTTCGTATATAGTTTTCATTGTAATAGTGCTGGTAGTCTACTTTACAGGAAAGATCACGACCTGGAACTTCACGAAGCTACAGAAAGAATTGATCGAGGACCGCGTACTGTACGACGCAACGACCAATGCCCAGTCGGTAtaa
SEQ ID NO:12:是具有软骨素合酶活性的多肽的重编码核酸序列:嵌合核酸,其包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的核酸的片段,和来自编码源自多杀巴斯德菌的软骨素合酶的核酸的片段(HCOS7-Vir)
ATGGGTAAGAACATCATTATTATGGTTTCTTGGTACACTATTATTACATCCAATCTCATCGCAGTGGGTGGCGCCTCACTCATACTAGCCCCAGCTATTACGGGCTATGTCCTTCACTGGAACATTGCCCTTTCAACAATTTGGGGAGTGTCGGCCTACGGAATTTTCGTGTTTGGTTTCTTTCTTGCCCAGGTATTATTTAGTGAACTCAACCGGAAAAGGCTCCGGAAGTGGATTTCCCTCCGACCCAAAATCCCAACTTTCAATCGTAGTAGGATATTAGACATTACCCTGGCGTGTCTAGTTAATCAGAAAACTAACTATCCGTTTGAGGTGGTTGTTGCAGATGATGGGTCGAAGGAAAATCTATTGACTATAGTTCAGAAATACGAGCAGAAACTAGACATTAAGTATGTGAGACAGAAGGACTATGGGTATCAGCTGTGCGCCGTTAGAAACCTTGGTCTAAGGACAGCGAAGTATGACTTTGTCTCTATCTTGGATTGCGACATGGCCCCGCAGCAGCTATGGGTTCACTCTTACCTTACAGAGTTACTGGAAGACAACGACATCGTCTTGATCGGGCCAAGGAAATACGTTGATACCCACAACATCACGGCTGAGCAGTTTCTGAACGACCCATATTTAATTGAGAGTTTACCGGAAACCGCCACAAACAATAATCCATCGATTACCAGTAAGGGTAACATCTCATTAGATTGGAGATTAGAACATTTTAAGAAGACAGACAACCTAAGACTATGCGACTCCCCGTTCAGGTATTTCTCATGCGGAAATGTGGCCTTCTCCAAAGAGTGGCTGAACAAAGTTGGCTGGTTCGACGAAGAATTTAATCACTGGGGCGGCGAAGACGTCGAATTCGGCTACAGGTTATTTGCAAAAGGGTGCTTCTTTAGGGTTATCGACGGTGGTATGGCCTACCATCAAGAGCCACCAGGAAAGGAGAACGAAACGGATCGTGAGGCCGGTAAGTCTATCACTCTTAAAATAGTAAAGGAGAAAGTGCCCTACATCTACAGGAAGTTGTTGCCGATTGAGGACTCCCACATACACCGTATACCGCTTGTGAGCATATACATTCCAGCGTACAACTGCGCCAATTATATTCAAAGGTGTGTAGATAGCGCGTTGAATCAAACAGTGGTAGATTTGGAAGTTTGTATATGTAACGACGGAAGTACTGACAATACTTTAGAGGTGATTAACAAGCTGTATGGCAACAACCCGCGTGTCAGGATAATGAGCAAGCCCAATGGTGGAATTGCTTCCGCGTCTAACGCTGCCGTTTCATTCGCGAAAGGCTACTACATTGGCCAGTTGGACTCGGATGATTACTTGGAACCTGACGCAGTGGAGCTTTGTTTAAAGGAGTTCTTGAAGGACAAAACACTAGCCTGTGTATATACAACGAACAGAAATGTTAATCCTGACGGTTCCCTAATCGCTAACGGATACAATTGGCCTCTGTTTGCAGCATGGAAGCATGGACTTTCGGGCATTTGGCTCGCATTCGAGTGCTTATACCAGATTACTTATTTCTTCCTGGTGATTTACCTATTCTCCCGTTTGGCTGTTGAGGCTGACCCACGGGCGCAAACGGCCACCGTCATTGTTTCGACCACAGTTGCGCTTATTAAGTGCGGTTACTTTAGCTTCAGAGCTAAAGACATTAGGGCCTTCTATTTCGTCCTCTACACGTTCGTTTACTTCTTCTGCATGATTCCGGCACGAATAACTGCGATGATGACCCTGTGGGACATAGGTTGGGGAACCAGGGGAGGAAATGAGAAGCCTTCCGTAGGCACCAGAGTTGCTTTGTGGGCCAAGCAATATTTGATTGCTTACATGTGGTGGGCCGCTGTCGTCGGTGCTGGCGTGTACTCCATCGTTCATAATTGGATGTTTGACTGGAATTCACTTTCCTACAGGTTCGCACTGGTAGGCATCTGTTCGTATATAGTTTTCATTGTAATAGTGCTGGTAGTCTACTTTACAGGAAAGATCACGACCTGGAACTTCACGAAGCTACAGAAAGAATTGATCGAGGACCGCGTACTGTACGACGCAACGACCAATGCCCAGTCGGTAtaa
SEQ ID NO:13:是具有软骨素合酶活性的多肽的重编码核酸序列:嵌合核酸,其包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的核酸的片段,和来自编码源自多杀巴斯德菌的软骨素合酶的核酸的片段(HCOS8-Vir)
ATGGGTAAGAACATCATTATTATGGTTTCTTGGTACACTATTATTACATCCAATCTCATCGCAGTGGGTGGCGCCTCACTCATACTAGCCCCAGCTATTACGGGCTATGTCCTTCACTGGAACATTGCCCTTTCAACAATTTGGGGAGTGTCGGCCTACGGAATTTTCGTGTTTGGTTTCTTTCTTGCCCAGGTATTATTTAGTGAACTCAACCGGAAAAGGCTCCGGAAGTGGATTTCCCTCCGACCCAAAGGGTGGAATGATGTTAGGTTGGCTGTAATTATTGCCGGCTACCGTGAGGACCCGTATATGTTCCAAAAGTGTCTTGAAAGTGTGCGTGACTCAGACTATGGGAATGTAGCTAGACTAATATGCGTTATTGACGGCGATGAAGACGACGACATGAGGATGGCTGCAGTGTACAAGGCTATCTATAACGACAACATCAAGAAACCTGAGTTTGTCCTCTGTGAGAGTGACGATAAGGAGGGTGAGAGAATAGATAGCGATTTCAGCCGTGATATCTGCGTGCTGCAACCGCATCGCGGAAAGCGTGAATGTTTGTACACAGGGTTCCAATTGGCAAAGATGGACCCCTCAGTTAATGCCGTCGTCCTAATCGACAGTGACACTGTGTTAGAAAAGGACGCGATTCTCGAaGTAGTATACCCGCTGGCATGCGATCCAGAAATACAGGCTGTAGCAGGCGAATGCAAAATATGGAATACTGACACACTGTTGAGTTTGCTGGTAGCCTGGCGATATTACAGCGCATTTTGCGTAGAGCGTAGCGCCCAATCATTCTTCAGGACAGTACAATGCGTCAGACTATGCGACTCCCCGTTCAGGTATTTCTCATGCGGAAATGTGGCCTTCTCCAAAGAGTGGCTGAACAAAGTTGGCTGGTTCGACGAAGAATTTAATCACTGGGGCGGCGAAGACGTCGAATTCGGCTACAGGTTAAAGAAAGTAGTTTTCACCCCATTCGCTGTTGGCTGGTCCGACAGCCCGACGAACGTCTTCCGTTACATTGTACAGCAAACACGGTGGTCCAAGTCGTGGTGTAGGGAGATATGGTATACACTGTTTGCAGCATGGAAGCATGGACTTTCGGGCATTTGGCTCGCATTCGAGTGCTTATACCAGATTACTTATTTCTTCCTGGTGATTTACCTATTCTCCCGTTTGGCTGTTGAGGCTGACCCACGGGCGCAAACGGCCACCGTCATTGTTTCGACCACAGTTGCGCTTATTAAGTGCGGTTACTTTAGCTTCAGAGCTAAAGACATTAGGGCCTTCTATTTCGTCCTCTACACGTTCGTTTACTTCTTCTGCATGATTCCGGCACGAATAACTGCGATGATGACCCTGTGGGACATAGGTTGGGGAACCAGGGGAGGAAATGAGAAGCCTTCCGTAGGCACCAGAGTTGCTTTGTGGGCCAAGCAATATTTGATTGCTTACATGTGGTGGGCCGCTGTCGTCGGTGCTGGCGTGTACTCCATCGTTCATAATTGGATGTTTGACTGGAATTCACTTTCCTACAGGTTCGCACTGGTAGGCATCTGTTCGTATATAGTTTTCATTGTAATAGTGCTGGTAGTCTACTTTACAGGAAAGATCACGACCTGGAACTTCACGAAGCTACAGAAAGAATTGATCGAGGACCGCGTACTGTACGACGCAACGACCAATGCCCAGTCGGTAtaa
SEQ ID NO:14:是具有软骨素合酶活性的多肽的核酸序列:嵌合核酸,其包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的核酸的片段,和来自编码源自智人的硫酸软骨素合酶的核酸的片段(HCOS9-Vir)
ATGGGTAAGAACATCATTATTATGGTTTCTTGGTACACTATTATTACATCCAATCTCATCGCAGTGGGTGGCGCCTCACTCATACTAGCCCCAGCTATTACGGGCTATGTCCTTCACTGGAACATTGCCCTTTCAACAATTTGGGGAGTGTCGGCCTACGGAATTTTCGTGTTTGGTTTCTTTCTTGCCCAGGTATTATTTAGTGAACTCAACCGGAAAAGGCTCCGGAAGTGGATTTCCCTCCGACCCAAACACATTGGTAAGTGTCTAAGGGAAATGTATACGACTCATGAGGACGTGGAAGTAGGAAGATGCGTTAGGAGATTCGCTGGAGTACAGTGTGTTTGGTCTTACGAGATGCAACAGTTATTCTACGAGAACTACGAGCAGAATAAGAAGGGATACATCCGTGATCTGCACAACTCCAAAATTCACCAAGCAATAACGCTGCATCCTAACAAGAATCCGCCCTATCAGTATAGGTTGCACTCTTACATGTTGAGTAGAAAGATATCTGAGCTACGTCATAGAACTATTCAGTTGCACAGGGAGATAGTACTGATGTCTAAATACTCAAACACGGAGATCCATAAGGAAGACCTACAGTTGGGTATACCACCTTCGTTCATGAGATTCCAGCCAAGACAGAGGGAAGAAATTTTGGAGTGGGAGTTCTTGACTGGTAAATACTTGTATTCTGCTGTTGACGGTCAACCACCTAGGAGAGGGATGGACTCTGCACAGCGTGAGGCTTTAGACGATATAGTGATGCAAGTAATGGAAATGATCAACGCTAATGCAAAGACACGTGGTCGTATCATAGATTTCAAAGAGATCCAGTATGGATATCGTCGTGTGAACCCAATGTACGGCGCGGAGTATATTCTTGACTTATTGTTGCTATACAAGAAACATAAGGGTAAGAAGATGACTGTCCCGGTTCGTAGGCACGCGTATTTGCAACAGACTTTCTCGAAAATACAGTTTGTAGAGCATGAGGAACTTGACGCGCAAGAGTTAGCGAAACGTATAAACCAAGAGTCGGGGAGTTTATCCTTCTTAAGTAATTCCCTTAAGAAGTTGGTTCCTTTCCAGCTGCCTGGAAGTAAAAGTGAGCACAAGGAGCCAAAGGATAAGAAAATCAACATTCTTATACCTCTTTCCGGCAGATTCGACATGTTCGTTAGGTTCATGGGTAACTTCGAGAAGACCTGCTTAATTCCTAACCAGAATGTTAAGTTGGTAGTTTTGTTATTCAATTCTGACAGTAACCCCGACAAAGCAAAGCAGGTTGAACTGATGAGAGACTATAGGATTAAGTACCCAAAAGCAGATATGCAGATACTACCTGTTTCCGGAGAATTCTCAAGAGCCTTGGCTCTGGAAGTAGGCAGCTCTCAGTTTAATAATGAGTCTCTTCTGTTCTTCTGCGACGTTGACTTAGTTTTCACGACAGAGTTTCTGCAGAGATGTCGTGCAAACACTGTACTAGGTCAGCAGATATATTTCCCCATTATTTTCAGTCAGTACGATCCAAAGATTGTTTATAGTGGAAAAGTTCCATCTGACAACCATTTTGCGTTTACTCAAAAGACAGGGTTTTGGCGTAACTACGGGTTCGGCATAACATGTATCTATAAAGGGGACCTGGTAAGAGTTGGCGGATTCGACGTATCTATACAGGGCTGGGGTTTAGAAGACGTCGATCTATTTAATAAAGTAGTTCAGGCAGGTTTGAAGACATTCCGTAGTCAAGAGGTAGGCGTTGTACACGTGCACCATCCAGTATTTTGCGACCCAAACTTAGACCCGAAGCAATATAAAATGTGCTTGGGTTCCAAGGCATCGACTTACGGTTCCACGCAGCAACTACTGTTTGCAGCATGGAAGCATGGACTTTCGGGCATTTGGCTCGCATTCGAGTGCTTATACCAGATTACTTATTTCTTCCTGGTGATTTACCTATTCTCCCGTTTGGCTGTTGAGGCTGACCCACGGGCGCAAACGGCCACCGTCATTGTTTCGACCACAGTTGCGCTTATTAAGTGCGGTTACTTTAGCTTCAGAGCTAAAGACATTAGGGCCTTCTATTTCGTCCTCTACACGTTCGTTTACTTCTTCTGCATGATTCCGGCACGAATAACTGCGATGATGACCCTGTGGGACATAGGTTGGGGAACCAGGGGAGGAAATGAGAAGCCTTCCGTAGGCACCAGAGTTGCTTTGTGGGCCAAGCAATATTTGATTGCTTACATGTGGTGGGCCGCTGTCGTCGGTGCTGGCGTGTACTCCATCGTTCATAATTGGATGTTTGACTGGAATTCACTTTCCTACAGGTTCGCACTGGTAGGCATCTGTTCGTATATAGTTTTCATTGTAATAGTGCTGGTAGTCTACTTTACAGGAAAGATCACGACCTGGAACTTCACGAAGCTACAGAAAGAATTGATCGAGGACCGCGTACTGTACGACGCAACGACCAATGCCCAGTCGGTATAA
SEQ ID NO:15:是具有软骨素合酶活性的多肽的重编码核酸序列:嵌合核酸,其包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的核酸的片段,和来自编码源自智人的硫酸软骨素合酶的核酸的片段(HCOS10-Vir)
ATGGGTAAGAACATCATTATTATGGTTTCTTGGTACACTATTATTACATCCAATCTCATCGCAGTGGGTGGCGCCTCACTCATACTAGCCCCAGCTATTACGGGCTATGTCCTTCACTGGAACATTGCCCTTTCAACAATTTGGGGAGTGTCGGCCTACGGAATTTTCGTGTTTGGTTTCTTTCTTGCCCAGGTATTATTTAGTGAACTCAACCGGAAAAGGCTCCGGAAGTGGATTTCCCTCCGACCCAAAAGAGATAGAAACTTCCTATTCGTTGGTGTTATGACAGCTCAGAAGTACTTACAGACCAGGGCGGTTGCAGCATATAGAACCTGGTCAAAGACAATTCCAGGTAAGGTACAGTTCTTCAGCTCCGAGGGTTCTGACACCAGCGTCCCTATCCCAGTAGTGCCTTTGCGTGGAGTGGATGATTCATACCCACCTCAGAAGAAGTCCTTCATGATGCTTAAGTATATGCACGACCACTATCTGGACAAATACGAGTGGTTCATGAGAGCAGACGACGACGTTTACATAAAGGGTGATAGACTGGAGAATTTCTTGAGGTCACTAAACAGTTCAGAACCACTTTTCCTAGGACAGACGGGCCTTGGTACGACAGAGGAGATGGGTAAGTTGGCATTGGAGCCAGGGGAGAACTTCTGCATGGGTGGCCCTGGTGTGATTATGAGTAGGGAAGTTTTAAGAAGAATGGTTCCGCACATTGGTAAGTGTCTAAGGGAAATGTATACGACTCATGAGGACGTGGAAGTAGGAAGATGCGTTAGGAGATTCGCTGGAGTACAGTGTGTTTGGTCTTACGAGATGCAACAGTTATTCTACGAGAACTACGAGCAGAATAAGAAGGGATACATCCGTGATCTGCACAACTCCAAAATTCACCAAGCAATAACGCTGCATCCTAACAAGAATCCGCCCTATCAGTATAGGTTGCACTCTTACATGTTGAGTAGAAAGATATCTGAGCTACGTCATAGAACTATTCAGTTGCACAGGGAGATAGTACTGATGTCTAAATACTCAAACACGGAGATCCATAAGGAAGACCTACAGTTGGGTATACCACCTTCGTTCATGAGATTCCAGCCAAGACAGAGGGAAGAAATTTTGGAGTGGGAGTTCTTGACTGGTAAATACTTGTATTCTGCTGTTGACGGTCAACCACCTAGGAGAGGGATGGACTCTGCACAGCGTGAGGCTTTAGACGATATAGTGATGCAAGTAATGGAAATGATCAACGCTAATGCAAAGACACGTGGTCGTATCATAGATTTCAAAGAGATCCAGTATGGATATCGTCGTGTGAACCCAATGTACGGCGCGGAGTATATTCTTGACTTATTGTTGCTATACAAGAAACATAAGGGTAAGAAGATGACTGTCCCGGTTCGTAGGCACGCGTATTTGCAACAGACTTTCTCGAAAATACAGTTTGTAGAGCATGAGGAACTTGACGCGCAAGAGTTAGCGAAACGTATAAACCAAGAGTCGGGGAGTTTATCCTTCTTAAGTAATTCCCTTAAGAAGTTGGTTCCTTTCCAGCTGCCTGGAAGTAAAAGTGAGCACAAGGAGCCAAAGGATAAGAAAATCAACATTCTTATACCTCTTTCCGGCAGATTCGACATGTTCGTTAGGTTCATGGGTAACTTCGAGAAGACCTGCTTAATTCCTAACCAGAATGTTAAGTTGGTAGTTTTGTTATTCAATTCTGACAGTAACCCCGACAAAGCAAAGCAGGTTGAACTGATGAGAGACTATAGGATTAAGTACCCAAAAGCAGATATGCAGATACTACCTGTTTCCGGAGAATTCTCAAGAGCCTTGGCTCTGGAAGTAGGCAGCTCTCAGTTTAATAATGAGTCTCTTCTGTTCTTCTGCGACGTTGACTTAGTTTTCACGACAGAGTTTCTGCAGAGATGTCGTGCAAACACTGTACTAGGTCAGCAGATATATTTCCCCATTATTTTCAGTCAGTACGATCCAAAGATTGTTTATAGTGGAAAAGTTCCATCTGACAACCATTTTGCGTTTACTCAAAAGACAGGGTTTTGGCGTAACTACGGGTTCGGCATAACATGTATCTATAAAGGGGACCTGGTAAGAGTTGGCGGATTCGACGTATCTATACAGGGCTGGGGTTTAGAAGACGTCGATCTATTTAATAAAGTAGTTCAGGCAGGTTTGAAGACATTCCGTAGTCAAGAGGTAGGCGTTGTACACGTGCACCATCCAGTATTTTGCGACCCAAACTTAGACCCGAAGCAATATAAAATGTGCTTGGGTTCCAAGGCATCGACTTACGGTTCCACGCAGCAACTAGCAGAGATGTGGTTGGAGAAGAACGACCCATCTTATAGCCTGTTTGCAGCATGGAAGCATGGACTTTCGGGCATTTGGCTCGCATTCGAGTGCTTATACCAGATTACTTATTTCTTCCTGGTGATTTACCTATTCTCCCGTTTGGCTGTTGAGGCTGACCCACGGGCGCAAACGGCCACCGTCATTGTTTCGACCACAGTTGCGCTTATTAAGTGCGGTTACTTTAGCTTCAGAGCTAAAGACATTAGGGCCTTCTATTTCGTCCTCTACACGTTCGTTTACTTCTTCTGCATGATTCCGGCACGAATAACTGCGATGATGACCCTGTGGGACATAGGTTGGGGAACCAGGGGAGGAAATGAGAAGCCTTCCGTAGGCACCAGAGTTGCTTTGTGGGCCAAGCAATATTTGATTGCTTACATGTGGTGGGCCGCTGTCGTCGGTGCTGGCGTGTACTCCATCGTTCATAATTGGATGTTTGACTGGAATTCACTTTCCTACAGGTTCGCACTGGTAGGCATCTGTTCGTATATAGTTTTCATTGTAATAGTGCTGGTAGTCTACTTTACAGGAAAGATCACGACCTGGAACTTCACGAAGCTACAGAAAGAATTGATCGAGGACCGCGTACTGTACGACGCAACGACCAATGCCCAGTCGGTATAA
SEQ ID NO:16:是具有软骨素合酶活性的多肽的重编码核酸序列:嵌合核酸,其包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的核酸的片段,和来自编码源自智人的硫酸软骨素合酶的核酸的片段(HCOS11-Vir)
ATGGGTAAGAACATCATTATTATGGTTTCTTGGTACACTATTATTACATCCAATCTCATCGCAGTGGGTGGCGCCTCACTCATACTAGCCCCAGCTATTACGGGCTATGTCCTTCACTGGAACATTGCCCTTTCAACAATTTGGGGAGTGTCGGCCTACGGAATTTTCGTGTTTGGTTTCTTTCTTGCCCAGGTATTATTTAGTGAACTCAACCGGAAAAGGCTCCGGAAGTGGATTTCCCTCCGACCCAAAAGAGATAGAAACTTCCTATTCGTTGGTGTTATGACAGCTCAGAAGTACTTACAGACCAGGGCGGTTGCAGCATATAGAACCTGGTCAAAGACAATTCCAGGTAAGGTACAGTTCTTCAGCTCCGAGGGTTCTGACACCAGCGTCCCTATCCCAGTAGTGCCTTTGCGTGGAGTGGATGATTCATACCCACCTCAGAAGAAGTCCTTCATGATGCTTAAGTATATGCACGACCACTATCTGGACAAATACGAGTGGTTCATGAGAGCAGACGACGACGTTTACATAAAGGGTGATAGACTGGAGAATTTCTTGAGGTCACTAAACAGTTCAGAACCACTTTTCCTAGGACAGACGGGCCTTGGTACGACAGAGGAGATGGGTAAGTTGGCATTGGAGCCAGGGGAGAACTTCTGCATGGGTGGCCCTGGTGTGATTATGAGTAGGGAAGTTTTAAGAAGAATGGTTCCGCACATTGGTAAGTGTCTAAGGGAAATGTATACGACTCATGAGGACGTGGAAGTAGGAAGATGCGTTAGGAGATTCGCTGGAGTACAGTGTGTTTGGTCTTACGAGATGCAACAGTTATTCTACGAGAACTACGAGCAGAATAAGAAGGGATACATCCGTGATCTGCACAACTCCAAAATTCACCAAGCAATAACGCTGCATCCTAACAAGAATCCGCCCTATCAGTATAGGTTGCACTCTTACATGTTGCTGTTTGCAGCATGGAAGCATGGACTTTCGGGCATTTGGCTCGCATTCGAGTGCTTATACCAGATTACTTATTTCTTCCTGGTGATTTACCTATTCTCCCGTTTGGCTGTTGAGGCTGACCCACGGGCGCAAACGGCCACCGTCATTGTTTCGACCACAGTTGCGCTTATTAAGTGCGGTTACTTTAGCTTCAGAGCTAAAGACATTAGGGCCTTCTATTTCGTCCTCTACACGTTCGTTTACTTCTTCTGCATGATTCCGGCACGAATAACTGCGATGATGACCCTGTGGGACATAGGTTGGGGAACCAGGGGAGGAAATGAGAAGCCTTCCGTAGGCACCAGAGTTGCTTTGTGGGCCAAGCAATATTTGATTGCTTACATGTGGTGGGCCGCTGTCGTCGGTGCTGGCGTGTACTCCATCGTTCATAATTGGATGTTTGACTGGAATTCACTTTCCTACAGGTTCGCACTGGTAGGCATCTGTTCGTATATAGTTTTCATTGTAATAGTGCTGGTAGTCTACTTTACAGGAAAGATCACGACCTGGAACTTCACGAAGCTACAGAAAGAATTGATCGAGGACCGCGTACTGTACGACGCAACGACCAATGCCCAGTCGGTATAA
SEQ ID NO:17:是具有软骨素合酶活性的多肽的重编码核酸序列:嵌合核酸,其包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的核酸的片段,和来自编码源自智人的硫酸软骨素合酶的核酸的片段(HCOS12-Vir)
ATGGGTAAGAACATCATTATTATGGTTTCTTGGTACACTATTATTACATCCAATCTCATCGCAGTGGGTGGCGCCTCACTCATACTAGCCCCAGCTATTACGGGCTATGTCCTTCACTGGAACATTGCCCTTTCAACAATTTGGGGAGTGTCGGCCTACGGAATTTTCGTGTTTGGTTTCTTTCTTGCCCAGGTATTATTTAGTGAACTCAACCGGAAAAGGCTCCGGAAGTGGATTTCCCTCCGACCCAAAAAGGATAAGAAAATCAACATTCTTATACCTCTTTCCGGCAGATTCGACATGTTCGTTAGGTTCATGGGTAACTTCGAGAAGACCTGCTTAATTCCTAACCAGAATGTTAAGTTGGTAGTTTTGTTATTCAATTCTGACAGTAACCCCGACAAAGCAAAGCAGGTTGAACTGATGAGAGACTATAGGATTAAGTACCCAAAAGCAGATATGCAGATACTACCTGTTTCCGGAGAATTCTCAAGAGCCTTGGCTCTGGAAGTAGGCAGCTCTCAGTTTAATAATGAGTCTCTTCTGTTCTTCTGCGACGTTGACTTAGTTTTCACGACAGAGTTTCTGCAGAGATGTCGTGCAAACACTGTACTAGGTCAGCAGATATATTTCCCCATTATTTTCAGTCAGTACGATCCAAAGATTGTTTATAGTGGAAAAGTTCCATCTGACAACCATTTTGCGTTTACTCAAAAGACAGGGTTTTGGCGTAACTACGGGTTCGGCATAACATGTATCTATAAAGGGGACCTGGTAAGAGTTGGCGGATTCGACGTATCTATACAGGGCTGGGGTTTAGAAGACGTCGATCTATTTAATAAAGTAGTTCAGGCAGGTTTGAAGACATTCCGTAGTCAAGAGGTAGGCGTTGTACACGTGCACCATCCAGTATTTTGCGACCCAAACTTAGACCCGAAGCAATATAAAATGTGCTTGGGTTCCAAGGCATCGACTTACGGTTCCACGCAGCAACTAGCAGAGATGTGGTTGGAGAAGAACGACCCATCTTATAGCCTGTTTGCAGCATGGAAGCATGGACTTTCGGGCATTTGGCTCGCATTCGAGTGCTTATACCAGATTACTTATTTCTTCCTGGTGATTTACCTATTCTCCCGTTTGGCTGTTGAGGCTGACCCACGGGCGCAAACGGCCACCGTCATTGTTTCGACCACAGTTGCGCTTATTAAGTGCGGTTACTTTAGCTTCAGAGCTAAAGACATTAGGGCCTTCTATTTCGTCCTCTACACGTTCGTTTACTTCTTCTGCATGATTCCGGCACGAATAACTGCGATGATGACCCTGTGGGACATAGGTTGGGGAACCAGGGGAGGAAATGAGAAGCCTTCCGTAGGCACCAGAGTTGCTTTGTGGGCCAAGCAATATTTGATTGCTTACATGTGGTGGGCCGCTGTCGTCGGTGCTGGCGTGTACTCCATCGTTCATAATTGGATGTTTGACTGGAATTCACTTTCCTACAGGTTCGCACTGGTAGGCATCTGTTCGTATATAGTTTTCATTGTAATAGTGCTGGTAGTCTACTTTACAGGAAAGATCACGACCTGGAACTTCACGAAGCTACAGAAAGAATTGATCGAGGACCGCGTACTGTACGACGCAACGACCAATGCCCAGTCGGTATAA
SEQ ID NO:18是具有软骨素合酶活性的多肽的氨基酸序列:嵌合氨基酸,其包含来自编码源自多杀巴斯德菌的透明质酸合酶的氨基酸的片段,和来自编码源自多杀巴斯德菌的软骨素合酶的氨基酸的片段(HCOS1-1)
MNTLSQAIKAYNSNDYQLALKLFEKSAEIYGRKIVEFQITKCKEKLSAHPSVNSAHLSVNKEEKVNVCDSPLDIATQLLLSNVKKLVLSDSEKNTLKNKWKLLTEKKSENAEVRAVALVPKDFPKDLVLAPLPDHVNDFTWYKKRKKRLGIKPEHQHVGLSIIVTTFNRPAILSITLACLVNQKTHYPFEVIVTDDGSQEDLSPIIRQYENKLDIRYVRQKDYGYQLCAVRNLGLRTAKYDFVSILDCDMAPQQLWVHSYLTELLEDDDLTIIGPRKYIDTQHIDPKDFLNNASLLESLPEVKTNNSVAAKGEGTVSLDWRLEQFEKTENLRLSDSPFRFFAAGNVAFAKKWLNKSGFFDEEFNHWGGEDVEFGYRLFRYGSFFKTIDGIMAYHQEPPGKENETDREAGKNITLDIMREKVPYIYRKLLPIEDSHINRVPLVSIYIPAYNCANYIQRCVDSALNQTVVDLEVCICNDGSTDNTLEVINKLYGNNPRVRIMSKPNGGIASASNAAVSFAKGYYIGQLDSDDYLEPDAVELCLKEFLKDKTLACVYTTNRNVNPDGSLIANGYNWPEFSREKLTTAMIAHHFRMFTIRAWHLTDGFNEKIENAVDYDMFLKLSEVGKFKHLNKICYNRVLHGDNTSIKKLGIQKKNHFVVVNQSLNRQGITYYNYDEFDDLDESRKYIFNKTAEYQEEIDILKDIKIIQNKDAKIAVSIFYPNTLNGLVKKLNNIIEYNKNIFVIVLHVDKNHLTPDIKKEILAFYHKHQVNILLNNDISYYTSNRLIKTEAHLSNINKLSQLNLNCEYIIFDNHDSLFVKNDSYAYMKKYDVGMNFSALTHDWIEKINAHPPFKKLIKTYFNDNDLKSMNVKGASQGMFMTYALAHELLTIIKEVITSCQSIDSVPEYNTEDIWFQFALLILEKKTGHVFNKTSTLTYMPWERKLQWTNEQIESAKRGENIPVNKFIINSITL
SEQ ID NO:19是具有软骨素合酶活性的多肽的氨基酸序列:嵌合氨基酸,其包含来自编码源自多杀巴斯德菌的透明质酸合酶的氨基酸的片段,和来自编码源自多杀巴斯德菌的软骨素合酶的氨基酸的片段(HCOS1-2)
MNTLSQAIKAYNSNDYQLALKLFEKSAEIYGRKIVEFQITKCKEKLSAHPSVNSAHLSVNKEEKVNVCDSPLDIATQLLLSNVKKLVLSDSEKNTLKNKWKLLTEKKSENAEVRAVALVPKDFPKDLVLAPLPDHVNDFTWYKKRKKRLGIKPVNKNIGLSIIIPTFNRSRILDITLACLVNQKTHYPFEVIVTDDGSQEDLSPIIRQYENKLDIRYVRQKDYGYQLCAVRNLGLRTAKYDFVSILDCDMAPQQLWVHSYLTELLEDDDLTIIGPRKYIDTQHIDPKDFLNNASLLESLPEVKTNNSVAAKGEGTVSLDWRLEQFEKTENLRLSDSPFRFFSCGNVAFSKEWLNKVGWFDEEFNHWGGEDVEFGYRLFRYGSFFKTIDGIMAYHQEPPGKENETDREAGKNITLDIMREKVPYIYRKLLPIEDSHINRVPLVSIYIPAYNCANYIQRCVDSALNQTVVDLEVCICNDGSTDNTLEVINKLYGNNPRVRIMSKPNGGIASASNAAVSFAKGYYIGQLDSDDYLEPDAVELCLKEFLKDKTLACVYTTNRNVNPDGSLIANGYNWPEFSREKLTTAMIAHHFRMFTIRAWHLTDGFNEKIENAVDYDMFLKLSEVGKFKHLNKICYNRVLHGDNTSIKKLGIQKKNHFVVVNQSLNRQGITYYNYDEFDDLDESRKYIFNKTAEYQEEIDILKDIKIIQNKDAKIAVSIFYPNTLNGLVKKLNNIIEYNKNIFVIVLHVDKNHLTPDIKKEILAFYHKHQVNILLNNDISYYTSNRLIKTEAHLSNINKLSQLNLNCEYIIFDNHDSLFVKNDSYAYMKKYDVGMNFSALTHDWIEKINAHPPFKKLIKTYFNDNDLKSMNVKGASQGMFMTYALAHELLTIIKEVITSCQSIDSVPEYNTEDIWFQFALLILEKKTGHVFNKTSTLTYMPWERKLQWTNEQIESAKRGENIPVNKFIINSITL
SEQ ID NO:20是具有软骨素合酶活性的多肽的氨基酸序列:嵌合氨基酸,其包含来自编码源自多杀巴斯德菌的透明质酸合酶的氨基酸的片段,和来自编码源自多杀巴斯德菌的软骨素合酶的氨基酸的片段(HCOS1-3)
MNTLSQAIKAYNSNDYQLALKLFEKSAEIYGRKIVEFQITKCKEKLSAHPSVNSAHLSVNKEEKVNVCDSPLDIATQLLLSNVKKLVLSDSEKNTLKNKWKLLTEKKSENAEVRAVALVPKDFPKDLVLAPLPDHVNDFTWYKNRKKSLGIKPVNKNIGLSIIIPTFNRSRILDITLACLVNQKTNYPFEVVVADDGSKENLLTIVQKYEQKLDIKYVRQKDYGYQLCAVRNLGLRTAKYDFVSILDCDMAPQQLWVHSYLTELLEDNDIVLIGPRKYVDTHNITAEQFLNDPYLIESLPETATNNNPSITSKGNISLDWRLEHFKKTDNLRLCDSPFRYFSCGNVAFSKEWLNKVGWFDEEFNHWGGEDVEFGYRLFAKGCFFRVIDGGMAYHQEPPGKENETDREAGKSITLKIVKEKVPYIYRKLLPIEDSHINRVPLVSIYIPAYNCANYIQRCVDSALNQTVVDLEVCICNDGSTDNTLEVINKLYGNNPRVRIMSKPNGGIASASNAAVSFAKGYYIGQLDSDDYLEPDAVELCLKEFLKDKTLACVYTTNRNVNPDGSLIANGYNWPEFSREKLTTAMIAHHFRMFTIRAWHLTDGFNEKIENAVDYDMFLKLSEVGKFKHLNKICYNRVLHGDNTSIKKLGIQKKNHFVVVNQSLNRQGITYYNYDEFDDLDESRKYIFNKTAEYQEEIDILKDIKIIQNKDAKIAVSIFYPNTLNGLVKKLNNIIEYNKNIFVIVLHVDKNHLTPDIKKEILAFYHKHQVNILLNNDISYYTSNRLIKTEAHLSNINKLSQLNLNCEYIIFDNHDSLFVKNDSYAYMKKYDVGMNFSALTHDWIEKINAHPPFKKLIKTYFNDNDLKSMNVKGASQGMFMTYALAHELLTIIKEVITSCQSIDSVPEYNTEDIWFQFALLILEKKTGHVFNKTSTLTYMPWERKLQWTNEQIESAKRGENIPVNKFIINSITL
SEQ ID NO:21:是具有软骨素合酶活性的多肽的氨基酸序列:嵌合氨基酸,其包含来自编码源自多杀巴斯德菌的透明质酸合酶的氨基酸的片段,来自编码源自多杀巴斯德菌的软骨素合酶的氨基酸的片段,和编码来自酿酒酵母的几丁质合酶2的氨基酸的片段(HCOS.Sc)
MNTLSQAIKAYNSNDYQLALKLFEKSAEIYGRKIVEFQITKCKEKLSAHPSVNSAHLSVNKEEKVNVCDSPLDIATQLLLSNVKKLVLSDSEKNTLKNKWKLLTEKKSENAEVRAVALVPKDFPKDLVLAPLPDHVNDFTWYKNRKKSLGIKPVNKNIGLSIIIPTFNRSRILDITLACLVNQKTNYPFEVVVADDGSKENLLTIVQKYEQKLDIKYVRQKDYGYQLCAVRNLGLRTAKYDFVSILDCDMAPQQLWVHSYLTELLEDNDIVLIGPRKYVDTHNITAEQFLNDPYLIESLPETATNNNPSITSKGNISLDWRLEHFKKTDNLRLCDSPFRYFSCGNVAFSKEWLNKVGWFDEEFNHWGGEDVEFGYRLFAKGCFFRVIDGGMAYHQEPPGKENETDREAGKSITLKIVKEKVPYIYRKLLPIEDSHINRVPLVSIYIPAYNCANYIQRCVDSALNQTVVDLEVCICNDGSTDNTLEVINKLYGNNPRVRIMSKPNGGIASASNAAVSFAKGYYIGQLDSDDYLEPDAVELCLKEFLKDKTLACVYTTNRNVNPDGSLIANGYNWPEFSREKLTTAMIAHHFRMFTIRAWHLTDGFNEKIENAVDYDMFLKLSEVGKFKHLNKICYNRVLHGDNTSIKKLGIQKKNHFVVVNQSLNRQGITYYNYDEFDDLDESRKYIFNKTAEYQEEIDILKDIFIQMLFSWFSIANFVLTFYYLAGSMNLVIKHGEALFIFFKYLIFCDLASLFIISMGNRPQGAKHLFITSMVILSICATYSLICGFVFAFKSLASGTESHKIFVDIVISLLSTYGLYFFSSLMYLDPWHMFTSSIQYFLTLPAFTCTLQIFAFCNTHDVSWGTKGSTQESKQLSKAIVVQGPDGKQIVETDWPQEVDKKFLEIKSRLKEPEFEESSGNEKQSKNDYYRDIRTRIVMIWMLSNLILIMSIIQVFTPQDTDNGYLIFILWSVAALAAFRVVGSMAFLFMKYLRIIVSYRNKVEGSGSWEVSKLDLPNVFHKKG
SEQ ID NO:22:是具有软骨素合酶活性的多肽的氨基酸序列:嵌合氨基酸,其包含来自编码源自多杀巴斯德菌的透明质酸合酶的氨基酸的片段,和来自编码源自酿酒酵母的几丁质合酶2的氨基酸的片段(HHASA.Sc)
MNTLSQAIKAYNSNDYQLALKLFEKSAEIYGRKIVEFQITKCKEKLSAHPSVNSAHLSVNKEEKVNVCDSPLDIATQLLLSNVKKLVLSDSEKNTLKNKWKLLTEKKSENAEVRAVALVPKDFPKDLVLAPLPDHVNDFTWYKKRKKRLGIKPEHQHVGLSIIVTTFNRPAILSITLACLVNQKTHYPFEVIVTDDGSQEDLSPIIRQYENKLDIRYVRQKDNGFQASAARNMGLRLAKYDFIGLLDCDMAPNPLWVHSYVAELLEDDDLTIIGPRKYIDTQHIDPKDFLNNASLLESLPEVKTNNSVAAKGEGTVSLDWRLEQFEKTENLRLSDSPFRFFAAGNVAFAKKWLNKSGFFDEEFNHWGGEDVEFGYRLFRYGSFFKTIDGIMAYHQEPPGKENETDREAGKNITLDIMREKVPYIYRKLLPIEDSHINRVPLVSIYIPAYNCANYIQRCVDSALNQTVVDLEVCICNDGSTDNTLEVINKLYGNNPRVRIMSKPNGGIASASNAAVSFAKGYYIGQLDSDDYLEPDAVELCLKEFLKDKTLACVYTTNRNVNPDGSLIANGYNWPEFSREKLTTAMIAHHFRMFTIRAWHLTDGFNEKIENAVDYDMFLKLSEVGKFKHLNKICYNRVLHGDNTSIKKLGIQKKNHFVVVNQSLNRQGITYYNYDEFDDLDESRKYIFNKTAEYQEEIDILKDIFIQMLFSWFSIANFVLTFYYLAGSMNLVIKHGEALFIFFKYLIFCDLASLFIISMGNRPQGAKHLFITSMVILSICATYSLICGFVFAFKSLASGTESHKIFVDIVISLLSTYGLYFFSSLMYLDPWHMFTSSIQYFLTLPAFTCTLQIFAFCNTHDVSWGTKGSTQESKQLSKAIVVQGPDGKQIVETDWPQEVDKKFLEIKSRLKEPEFEESSGNEKQSKNDYYRDIRTRIVMIWMLSNLILIMSIIQVFTPQDTDNGYLIFILWSVAALAAFRVVGSMAFLFMKYLRIIVSYRNKVEGSGSWEVSKLDLPNVFHKKG
SEQ ID NO:23:是具有软骨素合酶活性的多肽的氨基酸序列:嵌合氨基酸,其包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的氨基酸的片段,和来自编码源自大肠埃希氏菌的软骨素合酶的氨基酸的片段(HCOS1-Vir)
MGKNIIIMVSWYTIITSNLIAVGGASLILAPAITGYVLHWNIALSTIWGVSAYGIFVFGFFLAQVLFSELNRKRLRKWISLRPKGWNDVRLAVIIAGYREDPYMFQKCLESVRDSDYGNVARLICVIDGDEDDDMRMAAVYKAIYNDNIKKPEFVLCESDDKEGERIDSDFSRDICVLQPHRGKRECLYTGFQLAKMDPSVNAVVLIDSDTVLEKDAILEVVYPLACDPEIQAVAGECKIWNTDTLLSLLVAWRYYSAFCVERSAQSFFRTVQCVGGPLGAYKIDIIKEIKDPWISQRFLGQKCTYGDDRRLTNEILMRGKKVVFTPFAVGWGWFDEEFTHWGGRYIVQQTRWSKSWCREIWYTLFAAWKHGLSGIWLAFECLYQITYFFLVIYLFSRLAVEADPRAQTATVIVSTTVALIKCGYFSFRAKDIRAFYFVLYTFVYFFCMIPARITAMMTLWDIGWGTRGGNEKPSVGTRVALWAKQYLIAYMWWAAVVGAGVYSIVHNWMFDWNSLSYRFALVGICSYIVFIVIVLVVYFTGKITTWNFTKLQKELIEDRVLYDATTNAQSV
SEQ ID NO:24:是具有软骨素合酶活性的多肽的重编码氨基酸序列:嵌合氨基酸,其包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的氨基酸的片段,和来自编码源自大肠埃希氏菌的软骨素合酶的氨基酸的片段(HCOS2-Vir)
MGKNIIIMVSWYTIITSNLIAVGGASLILAPAITGYVLHWNIALSTIWGVSAYGIFVFGFFLAQVLFSELNRKRLRKWISLRPKGWNDVRLAVIIAGYREDPYMFQKCLESVRDSDYGNVARLICVIDGDEDDDMRMAAVYKAIYNDNIKKPEFVLCESDDKEGERIDSDFSRDICVLQPHRGKRECLYTGFQLAKMDPSVNAVVLIDSDTVLEKDAILEVVYPLACDPEIQAVAGECKIWNTDTLLSLLVAWRYYSAFCVERSAQSFFRTVQCVGGPLGAYKIDIIKEIKDPWISQRFLGQKCTYGDDRRLTNEILMRGKKVVFTPFAVGWLHGENTSIKKLRYIVQQTRWSKSWCREIWYTLFAAWKHGLSGIWLAFECLYQITYFFLVIYLFSRLAVEADPRAQTATVIVSTTVALIKCGYFSFRAKDIRAFYFVLYTFVYFFCMIPARITAMMTLWDIGWGTRGGNEKPSVGTRVALWAKQYLIAYMWWAAVVGAGVYSIVHNWMFDWNSLSYRFALVGICSYIVFIVIVLVVYFTGKITTWNFTKLQKELIEDRVLYDATTNAQSV
SEQ ID NO:25:是具有软骨素合酶活性的多肽的重编码氨基酸序列:嵌合氨基酸,其包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的氨基酸的片段,和来自编码源自结核分枝杆菌的呋喃半乳糖基转移酶的氨基酸的片段(HCOS3-Vir)
MGKNIIIMVSWYTIITSNLIAVGGASLILAPAITGYVLHWNIALSTIWGVSAYGIFVFGFFLAQVLFSELNRKRLRKWISLRPKGWNDVRLAVIIAGYREDPYMFQKCLESVRDSDYGNVARLICVIDGDEDDDMRMAAVYKAIYNDNIKKPEFVLCESDDKEGERIDSDFSRDICVLQPHRGKRECLYTGFQLAKMDPSVNAVVLIDSDTVLEKDAILEVVYPLACDPEIQAVAGECKIWNTDTLLSLLVAWRYYSAFCVERSAQSFFRTVQCVGGPLGAYKIDIIKEIKDPWISQRFLGQKCTYGDDRRLTNEILMRGKKVVFTPFAVGWHMAWSDKDDAIDRYIVQQTRWSKSWCREIWYTLFAAWKHGLSGIWLAFECLYQITYFFLVIYLFSRLAVEADPRAQTATVIVSTTVALIKCGYFSFRAKDIRAFYFVLYTFVYFFCMIPARITAMMTLWDIGWGTRGGNEKPSVGTRVALWAKQYLIAYMWWAAVVGAGVYSIVHNWMFDWNSLSYRFALVGICSYIVFIVIVLVVYFTGKITTWNFTKLQKELIEDRVLYDATTNAQSV
SEQ ID NO:26:是具有软骨素合酶活性的多肽的重编码氨基酸序列:嵌合氨基酸,其包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的氨基酸的片段,和来自编码源自大肠埃希氏菌的软骨素合酶的氨基酸的片段(HCOS4-Vir)
MGKNIIIMVSWYTIITSNLIAVGGASLILAPAITGYVLHWNIALSTIWGVSAYGIFVFGFFLAQVLFSELNRKRLRKWISLRPKGWNDVRLAVIIAGYREDPYMFQKCLESVRDSDYGNVARLICVIDGDEDDDMRMAAVYKAIYNDNIKKPEFVLCESDDKEGERIDSDFSRDICVLQPHRGKRECLYTGFQLAKMDPSVNAVVLIDSDTVLEKDAILEVVYPLACDPEIQAVAGECKIWNTDTLLSLLVAWRYYSAFCVERSAQSFFRTVQCVGGPLGAYKIDIIKEIKDPWISQRFLGQKCTYGDDRRLTNEILMRGKKVVFTPFAVGWFDEEFTHWGGRYIVQQTRWSKSWCREIWYTLFAAWKHGLSGIWLAFECLYQITYFFLVIYLFSRLAVEADPRAQTATVIVSTTVALIKCGYFSFRAKDIRAFYFVLYTFVYFFCMIPARITAMMTLWDIGWGTRGGNEKPSVGTRVALWAKQYLIAYMWWAAVVGAGVYSIVHNWMFDWNSLSYRFALVGICSYIVFIVIVLVVYFTGKITTWNFTKLQKELIEDRVLYDATTNAQSV
SEQ ID NO:27:是具有软骨素合酶活性的多肽的氨基酸序列:嵌合氨基酸,其包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的氨基酸的片段,和来自编码源自草酸青霉的软骨素合酶的氨基酸的片段(HCOS5-Vir)
MGKNIIIMVSWYTIITSNLIAVGGASLILAPAITGYVLHWNIALSTIWGVSAYGIFVFGFFLAQVLFSELNRKRLRKWISLRPKSIHHPISKTTHPDTENAGDSTLLCPPMDGMDDILVVMKTGVTEAKEKVPVHFQTTLRCVPHYVIYSDFEEEIEGVKIYDVLQGMDPDVMTQVPDFDLYNRIKKLGRQGLAENDFADEANSAVGKPNNPGWKLDKWKFLPMIIEALRYKPKAKWYVFMEADTYISWPTLLAWLKHFNHKKPWYLGTETQIADVIFAHGGSGFMISHAALKLAAEEYTARRTELHHYTDGHWAGDCVLGKVLADAGVNLHFSWPILQNSNLGELDEFNVDLYRQPWCFPAAAFHHLNAQKIQDLWSYEQKRWQDKDKRVLLHSDVFRDLLYPDIALKPARIGWDNLSADEQSTASSFEECRQICDQLDDCTQFSFRDKSCFTSRTPRLGAANPNTVSGWMVDRIRANMEKSGLFAAWKHGLSGIWLAFECLYQITYFFLVIYLFSRLAVEADPRAQTATVIVSTTVALIKCGYFSFRAKDIRAFYFVLYTFVYFFCMIPARITAMMTLWDIGWGTRGGNEKPSVGTRVALWAKQYLIAYMWWAAVVGAGVYSIVHNWMFDWNSLSYRFALVGICSYIVFIVIVLVVYFTGKITTWNFTKLQKELIEDRVLYDATTNAQSV
SEQ ID NO:28:是具有软骨素合酶活性的多肽的氨基酸序列:嵌合氨基酸,其包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的氨基酸的片段,和来自编码源自多杀巴斯德菌的软骨素合酶的氨基酸的片段(HCOS6-Vir)
MGKNIIIMVSWYTIITSNLIAVGGASLILAPAITGYVLHWNIALSTIWGVSAYGIFVFGFFLAQVLFSELNRKRLRKWISLRPKLDIATQLLLSNVKKLTLSESEKNSLKNKWKSITGKKSENAEIRKVELVPKDFPKDLVLAPLPDHVNDFTWYKNRKKSLGIKPVNKNIGLSIIIPTFNRSRILDITLACLVNQKTNYPFEVVVADDGSKENLLTIVQKYEQKLDIKYVRQKDYGYQLCAVRNLGLRTAKYDFVSILDCDMAPQQLWVHSYLTELLEDNDIVLIGPRKYVDTHNITAEQFLNDPYLIESLPETATNNNPSITSKGNISLDWRLEHFKKTDNLRLCDSPFRYFSCGNVAFSKEWLNKVGWFDEEFNHWGGEDVEFGYRLFAKGCFFRVIDGGMAYHQEPPGKENETDREAGKSITLKIVKEKVPYIYRKLLPIEDSHIHRIPLVSIYIPAYNCANYIQRCVDSALNQTVVDLEVCICNDGSTDNTLEVINKLYGNNPRVRIMSKPNGGIASASNAAVSFAKGYYIGQLDSDDYLEPDAVELCLKEFLKDKTLACVYTTNRNVNPDGSLIANGYNWPEFSREKLTTAMIAHHFRMFTIRAWHLTDGFNEKIENAVDYDMFLKLSEVGKFKHLNKICYNRVLHGDNTSIKNLDTQKKNHFVVVNQSLNRQRVSNYNYDEFDNLDESRKYIFNKLFAAWKHGLSGIWLAFECLYQITYFFLVIYLFSRLAVEADPRAQTATVIVSTTVALIKCGYFSFRAKDIRAFYFVLYTFVYFFCMIPARITAMMTLWDIGWGTRGGNEKPSVGTRVALWAKQYLIAYMWWAAVVGAGVYSIVHNWMFDWNSLSYRFALVGICSYIVFIVIVLVVYFTGKITTWNFTKLQKELIEDRVLYDATTNAQSV
SEQ ID NO:29:是具有软骨素合酶活性的多肽的重编码氨基酸序列:嵌合氨基酸,其包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的氨基酸的片段,和来自编码源自多杀巴斯德菌的软骨素合酶的氨基酸的片段(HCOS7-Vir)
MGKNIIIMVSWYTIITSNLIAVGGASLILAPAITGYVLHWNIALSTIWGVSAYGIFVFGFFLAQVLFSELNRKRLRKWISLRPKIPTFNRSRILDITLACLVNQKTNYPFEVVVADDGSKENLLTIVQKYEQKLDIKYVRQKDYGYQLCAVRNLGLRTAKYDFVSILDCDMAPQQLWVHSYLTELLEDNDIVLIGPRKYVDTHNITAEQFLNDPYLIESLPETATNNNPSITSKGNISLDWRLEHFKKTDNLRLCDSPFRYFSCGNVAFSKEWLNKVGWFDEEFNHWGGEDVEFGYRLFAKGCFFRVIDGGMAYHQEPPGKENETDREAGKSITLKIVKEKVPYIYRKLLPIEDSHIHRIPLVSIYIPAYNCANYIQRCVDSALNQTVVDLEVCICNDGSTDNTLEVINKLYGNNPRVRIMSKPNGGIASASNAAVSFAKGYYIGQLDSDDYLEPDAVELCLKEFLKDKTLACVYTTNRNVNPDGSLIANGYNWPLFAAWKHGLSGIWLAFECLYQITYFFLVIYLFSRLAVEADPRAQTATVIVSTTVALIKCGYFSFRAKDIRAFYFVLYTFVYFFCMIPARITAMMTLWDIGWGTRGGNEKPSVGTRVALWAKQYLIAYMWWAAVVGAGVYSIVHNWMFDWNSLSYRFALVGICSYIVFIVIVLVVYFTGKITTWNFTKLQKELIEDRVLYDATTNAQSV
SEQ ID NO:30:是具有软骨素合酶活性的多肽的重编码氨基酸序列:嵌合氨基酸,其包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的氨基酸的片段,和来自编码源自多杀巴斯德菌的软骨素合酶的氨基酸的片段(HCOS8-Vir)
MGKNIIIMVSWYTIITSNLIAVGGASLILAPAITGYVLHWNIALSTIWGVSAYGIFVFGFFLAQVLFSELNRKRLRKWISLRPKGWNDVRLAVIIAGYREDPYMFQKCLESVRDSDYGNVARLICVIDGDEDDDMRMAAVYKAIYNDNIKKPEFVLCESDDKEGERIDSDFSRDICVLQPHRGKRECLYTGFQLAKMDPSVNAVVLIDSDTVLEKDAILEVVYPLACDPEIQAVAGECKIWNTDTLLSLLVAWRYYSAFCVERSAQSFFRTVQCVRLCDSPFRYFSCGNVAFSKEWLNKVGWFDEEFNHWGGEDVEFGYRLKKVVFTPFAVGWSDSPTNVFRYIVQQTRWSKSWCREIWYTLFAAWKHGLSGIWLAFECLYQITYFFLVIYLFSRLAVEADPRAQTATVIVSTTVALIKCGYFSFRAKDIRAFYFVLYTFVYFFCMIPARITAMMTLWDIGWGTRGGNEKPSVGTRVALWAKQYLIAYMWWAAVVGAGVYSIVHNWMFDWNSLSYRFALVGICSYIVFIVIVLVVYFTGKITTWNFTKLQKELIEDRVLYDATTNAQSV
SEQ ID NO:31:是具有软骨素合酶活性的多肽的氨基酸序列:嵌合氨基酸,其包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的氨基酸的片段,和来自编码源自智人的硫酸软骨素合酶的氨基酸的片段(HCOS9-Vir)
MGKNIIIMVSWYTIITSNLIAVGGASLILAPAITGYVLHWNIALSTIWGVSAYGIFVFGFFLAQVLFSELNRKRLRKWISLRPKHIGKCLREMYTTHEDVEVGRCVRRFAGVQCVWSYEMQQLFYENYEQNKKGYIRDLHNSKIHQAITLHPNKNPPYQYRLHSYMLSRKISELRHRTIQLHREIVLMSKYSNTEIHKEDLQLGIPPSFMRFQPRQREEILEWEFLTGKYLYSAVDGQPPRRGMDSAQREALDDIVMQVMEMINANAKTRGRIIDFKEIQYGYRRVNPMYGAEYILDLLLLYKKHKGKKMTVPVRRHAYLQQTFSKIQFVEHEELDAQELAKRINQESGSLSFLSNSLKKLVPFQLPGSKSEHKEPKDKKINILIPLSGRFDMFVRFMGNFEKTCLIPNQNVKLVVLLFNSDSNPDKAKQVELMRDYRIKYPKADMQILPVSGEFSRALALEVGSSQFNNESLLFFCDVDLVFTTEFLQRCRANTVLGQQIYFPIIFSQYDPKIVYSGKVPSDNHFAFTQKTGFWRNYGFGITCIYKGDLVRVGGFDVSIQGWGLEDVDLFNKVVQAGLKTFRSQEVGVVHVHHPVFCDPNLDPKQYKMCLGSKASTYGSTQQLLFAAWKHGLSGIWLAFECLYQITYFFLVIYLFSRLAVEADPRAQTATVIVSTTVALIKCGYFSFRAKDIRAFYFVLYTFVYFFCMIPARITAMMTLWDIGWGTRGGNEKPSVGTRVALWAKQYLIAYMWWAAVVGAGVYSIVHNWMFDWNSLSYRFALVGICSYIVFIVIVLVVYFTGKITTWNFTKLQKELIEDRVLYDATTNAQSV
SEQ ID NO:32:是具有软骨素合酶活性的多肽的重编码氨基酸序列:嵌合氨基酸,其包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的氨基酸的片段,和来自编码源自智人的硫酸软骨素合酶的氨基酸的片段(HCOS10-Vir)
MGKNIIIMVSWYTIITSNLIAVGGASLILAPAITGYVLHWNIALSTIWGVSAYGIFVFGFFLAQVLFSELNRKRLRKWISLRPKRDRNFLFVGVMTAQKYLQTRAVAAYRTWSKTIPGKVQFFSSEGSDTSVPIPVVPLRGVDDSYPPQKKSFMMLKYMHDHYLDKYEWFMRADDDVYIKGDRLENFLRSLNSSEPLFLGQTGLGTTEEMGKLALEPGENFCMGGPGVIMSREVLRRMVPHIGKCLREMYTTHEDVEVGRCVRRFAGVQCVWSYEMQQLFYENYEQNKKGYIRDLHNSKIHQAITLHPNKNPPYQYRLHSYMLSRKISELRHRTIQLHREIVLMSKYSNTEIHKEDLQLGIPPSFMRFQPRQREEILEWEFLTGKYLYSAVDGQPPRRGMDSAQREALDDIVMQVMEMINANAKTRGRIIDFKEIQYGYRRVNPMYGAEYILDLLLLYKKHKGKKMTVPVRRHAYLQQTFSKIQFVEHEELDAQELAKRINQESGSLSFLSNSLKKLVPFQLPGSKSEHKEPKDKKINILIPLSGRFDMFVRFMGNFEKTCLIPNQNVKLVVLLFNSDSNPDKAKQVELMRDYRIKYPKADMQILPVSGEFSRALALEVGSSQFNNESLLFFCDVDLVFTTEFLQRCRANTVLGQQIYFPIIFSQYDPKIVYSGKVPSDNHFAFTQKTGFWRNYGFGITCIYKGDLVRVGGFDVSIQGWGLEDVDLFNKVVQAGLKTFRSQEVGVVHVHHPVFCDPNLDPKQYKMCLGSKASTYGSTQQLAEMWLEKNDPSYSLFAAWKHGLSGIWLAFECLYQITYFFLVIYLFSRLAVEADPRAQTATVIVSTTVALIKCGYFSFRAKDIRAFYFVLYTFVYFFCMIPARITAMMTLWDIGWGTRGGNEKPSVGTRVALWAKQYLIAYMWWAAVVGAGVYSIVHNWMFDWNSLSYRFALVGICSYIVFIVIVLVVYFTGKITTWNFTKLQKELIEDRVLYDATTNAQSV
SEQ ID NO:33:是具有软骨素合酶活性的多肽的重编码氨基酸序列:嵌合氨基酸,其包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的氨基酸的片段,和来自编码源自智人的硫酸软骨素合酶的氨基酸的片段(HCOS11-Vir)
MGKNIIIMVSWYTIITSNLIAVGGASLILAPAITGYVLHWNIALSTIWGVSAYGIFVFGFFLAQVLFSELNRKRLRKWISLRPKRDRNFLFVGVMTAQKYLQTRAVAAYRTWSKTIPGKVQFFSSEGSDTSVPIPVVPLRGVDDSYPPQKKSFMMLKYMHDHYLDKYEWFMRADDDVYIKGDRLENFLRSLNSSEPLFLGQTGLGTTEEMGKLALEPGENFCMGGPGVIMSREVLRRMVPHIGKCLREMYTTHEDVEVGRCVRRFAGVQCVWSYEMQQLFYENYEQNKKGYIRDLHNSKIHQAITLHPNKNPPYQYRLHSYMLLFAAWKHGLSGIWLAFECLYQITYFFLVIYLFSRLAVEADPRAQTATVIVSTTVALIKCGYFSFRAKDIRAFYFVLYTFVYFFCMIPARITAMMTLWDIGWGTRGGNEKPSVGTRVALWAKQYLIAYMWWAAVVGAGVYSIVHNWMFDWNSLSYRFALVGICSYIVFIVIVLVVYFTGKITTWNFTKLQKELIEDRVLYDATTNAQSV
SEQ ID NO:34:是具有软骨素合酶活性的多肽的重编码氨基酸序列:嵌合氨基酸,其包含来自编码源自小球藻属病毒PBCV-1的透明质酸合酶的氨基酸的片段,和来自编码源自智人的硫酸软骨素合酶的氨基酸的片段(HCOS12-Vir)
MGKNIIIMVSWYTIITSNLIAVGGASLILAPAITGYVLHWNIALSTIWGVSAYGIFVFGFFLAQVLFSELNRKRLRKWISLRPKKDKKINILIPLSGRFDMFVRFMGNFEKTCLIPNQNVKLVVLLFNSDSNPDKAKQVELMRDYRIKYPKADMQILPVSGEFSRALALEVGSSQFNNESLLFFCDVDLVFTTEFLQRCRANTVLGQQIYFPIIFSQYDPKIVYSGKVPSDNHFAFTQKTGFWRNYGFGITCIYKGDLVRVGGFDVSIQGWGLEDVDLFNKVVQAGLKTFRSQEVGVVHVHHPVFCDPNLDPKQYKMCLGSKASTYGSTQQLAEMWLEKNDPSYSLFAAWKHGLSGIWLAFECLYQITYFFLVIYLFSRLAVEADPRAQTATVIVSTTVALIKCGYFSFRAKDIRAFYFVLYTFVYFFCMIPARITAMMTLWDIGWGTRGGNEKPSVGTRVALWAKQYLIAYMWWAAVVGAGVYSIVHNWMFDWNSLSYRFALVGICSYIVFIVIVLVVYFTGKITTWNFTKLQKELIEDRVLYDATTNAQSV
SEQ ID NO:35是源自拟南芥的UDP-葡萄糖脱氢酶(HASB)的核酸序列
ATGGTCAAAATATGCTGTATCGGGGCTGGATATGTCGGTGGGCCTACAATGGCCGTTATGGCCCTAAAGTGTCCAGAGATTGAAGTCGTGGTAGTTGATATATCGGAGCCACGAATTAACGCATGGAACTCAGACCGTCTACCAATTTATGAGCCAGGGTTAGAGGATGTCGTCAAACAGTGTAGAGGGAAGAATTTGTTCTTCTCTACAGATGTAGAGAAGCATGTATTTGAGTCAGATATAGTGTTTGTTTCGGTAAACACTCCTACGAAAACGCAGGGTCTGGGTGCAGGTAAAGCAGCAGATTTGACATATTGGGAGTCCGCTGCTCGCATGATAGCTGATGTGAGCAAATCGTCGAAAATCGTCGTTGAAAAGAGTACAGTACCAGTTCGTACAGCCGAGGCTATAGAAAAGATTTTAACGCACAATTCGAAGGGTATCGAATTCCAGATCTTATCAAATCCAGAATTCTTGGCCGAAGGGACGGCGATTAAAGACTTATATAACCCTGATAGAGTTCTAATCGGTGGCAGGGACACCGCTGCGGGACAAAAGGCCATTAAGGCGTTGCGTGACGTGTATGCCCACTGGGTTCCTGTTGAGCAAATAATCTGTACTAATTTATGGAGTGCCGAGCTATCAAAGTTGGCTGCGAACGCATTTCTAGCTCAAAGGATAAGTTCAGTAAACGCAATGTCAGCGCTTTGTGAGGCAACTGGTGCTGACGTAACCCAAGTCGCTCACGCCGTTGGAACCGACACTAGAATTGGACCGAAGTTTCTTAACGCATCCGTAGGCTTCGGCGGATCTTGCTTTCAGAAAGACATCCTGAATCTTATTTACATCTGCGAATGCAATGGTCTTCCAGAAGCAGCCAATTATTGGAAACAGGTAGTCAAGGTAAATGACTACCAAAAGATTAGGTTTGCTAATCGAGTCGTATCTTCTATGTTCAACACCGTCTCCGGTAAGAAAATTGCTATTTTGGGATTTGCGTTCAAGAAGGACACCGGCGACACGCGTGAAACTCCTGCCATAGATGTGTGTAATCGCCTCGTGGCTGATAAAGCAAAGCTGTCGATCTATGATCCGCAAGTATTAGAAGAGCAGATCCGCCGTGATCTGTCCATGGCCCGATTCGATTGGGACCATCCAGTCCCACTCCAGCAGATCAAAGCTGAAGGTATCTCCGAACAGGTTAACGTTGTGTCCGACGCCTACGAGGCTACGAAGGATGCTCATGGTTTATGTGTTTTAACCGAATGGGACGAATTCAAGTCACTTGATTTTAAGAAGATCTTTGATAATATGCAGAAACCCGCTTTCGTTTTCGACGGAAGAAACGTGGTCGACGCTGTGAAATTGAGAGAAATTGGATTCATAGTATATTCCATAGGTAAACCTCTGGATAGTTGGCTCAAGGATATGCCGGCTGTTGCATAA
SEQ ID NO:36是源自小球藻属病毒PBCV-1的UDP-葡萄糖脱氢酶(HASB)的重编码核酸序列
ATGAGTAGAATTGCTGTCGTTGGATGCGGTTACGTGGGTACGGCCTGCGCCGTACTTTTGGCGCAGAAGAACGAAGTTATCGTTTTGGATATCTCGGAGGACCGGGTACAACTGATTAAGAATAAGAAGTCACCTATAGAAGATAAGGAAATCGAAGAATTCCTGGAGACGAAAGATTTGAATCTAACAGCGACGACGGATAAGGTGCTCGCCTATGAGAATGCTGAATTCGTTATAATAGCTACACCGACCGATTACGATGTCGTCACTAGATATTTCAACACTAAGTCTGTTGAAAATGTGATAGGCGATGTCATTAAGAACACTCAGACACACCCTACTATAGTGATCAAGAGTACTATTCCAATCGGTTTCGTGGATAAAGTTAGAGAACAGTTCGATTATCAAAATATTATCTTCTCGCCGGAATTCTTGAGAGAAGGACGAGCATTATATGATAATCTTTACCCCTCCCGTATCATCGTCGGTGATGACTCCCCAATTGCCTTAAAATTCGCGAATCTCTTGGTCGAGGGTAGCAAAACTCCACTAGCTCCCGTATTAACTATGGGTACGCGAGAGGCCGAAGCTGTAAAACTATTTTCAAATACATATTTGGCTATGAGAGTAGCATACTTCAATGAGCTAGACACATTTGCAATGTCCCATGGTATGAACGCAAAAGAGATTATCGACGGAGTCACACTAGAACCAAGGATAGGGCAGGGTTATTCGAATCCTTCATTTGGGTATGGAGCCTATTGTTTCCCAAAAGATACAAAGCAATTGTTGGCTAATTTTGAAGGGGTTCCACAAGATATTATTGGCGCAATCGTAGAGTCTAACGAAACTAGAAAGGAGGTTATTGTTTCTGAGGTCGAGAACAGATTTCCGACCACAGTTGGCGTATATAAGTTGGCTGCTAAAGCTGGTTCGGATAATTTCAGGTCTAGTGCGATAGTCGATATCATGGAAAGGTTGGCTAATAAGGGCTACCACATCAAAATATTTGAACCTACCGTTGAACAATTTGAGAATTTTGAGGTAGATAATAATCTCACAACTTTTGCAACCGAGTCTGATGTAATAATTGCGAACAGAGTTCCAGTCGAACATCGCATTCTGTTTGGGAAGAAGTTAATAACACGGGATGTCTATGGGGATAA
SEQ ID NO:37是源自小球藻属病毒PBCV-1的UDP-葡萄糖脱氢酶(HASB-A)的重编码核酸序列
ATGTCACGAATCGCAGTAGTTGGCTGTGGGTACGTGGGAACCGCATGCGCTGTACTGCTGGCGCAAAAGAATGAGGTAATCGTTCTTGATATTAGTGAGGATAGGGTCCAACTAATCAAGAACAAGAAATCCCCGATCGAAGATAAGGAGATTGAAGAATTCTTGGAAACAAAAGACCTAAACTTAACTGCAACAACTGACAAAGTTTTAGCCTACGAAAACGCTGAGTTTGTGATTATAGCGACACCCACAGATTATGACGTAGTTACCAGATACTTTAACACGAAGTCCGTAGAGAACGTCATTGGAGATGTTATAAAGAATACTCAGACTCATCCTACGATAGTAATAAAGTCAACCATTCCCATAGGTTTCGTAGATAAGGTTAGGGAGCAATTCGATTACCAGAACATTATATTTTCGCCAGAATTTCTGAGAGAGGGTCGCGCCCTGTATGATAATCTATATCCATCACGGATTATAGTGGGCGATGACTCTCCGATTGCACTTAAGTTTGCTAATCTTTTAGTTGAGGGCTCCAAAACTCCGCTCGCCCCAGTACTTACGATGGGTACACGTGAGGCTGAAGCTGTCAAGCTGTTTTCAAACACATACCTTGCTATGCGAGTCGCATACTTTAACGAACTAGATACCTTTGCTATGTCGCACGGTATGAATGCTAAAGAAATCATAGATGGCGTAACGTTGGAGCCTCGGATAGGTCAAGGATATTCCAATCCATCTTTTGGCTACGGTGCGTATTGTTTCCCAAAGGACACGAAGCAATTATTAGCTAACTTTGAGGGTGTTCCGCAAGATATAATTGGGGCGATAGTAGAAAGCAATGAAACACGGAAGGAGGTAATCGTGAGTGAAGTGGAAAACCGATTCCCCACTACGGTCGGCGTTTACAAATTAGCCGCCAAGGCTGGTTCCGACAATTTCCGATCCAGCGCAATAGTAGATATTATGGAAAGATTAGCTAATAAGGGATACCACATTAAAATCTTTGAACCTACTGTCGAACAGTTCGAGAACTTCGAGGTTGATAATAACTTGACGACTTTCGCAACGGAGAGCGATGTAATTATTGCAAACCGCGTACCTGTGGAACATCGAATTTTGTTCGGAAAGAAGCTGATTACACGCGATGTATATGGCGATAACTAA
SEQ ID NO:38是源自兽瘟链球菌的UDP-葡萄糖脱氢酶(HASB)的核酸序列
ATGAAGATATCGGTAGCGGGTTCGGGGTACGTGGGGTTATCCTTGTCAATCTTGCTTGCCCAACATAACGATGTGACTGTTGTAGATATAATCGACGAAAAGGTACGGCTAATTAACCAGGGCATATCTCCGATTAAGGATGCGGACATTGAGGAATATCTGAAGAATGCACCGTTGAATCTTACGGCTACACTAGACGGAGCTTCGGCTTATAGTAATGCTGATCTGATTATAATCGCAACGCCAACTAATTACGATTCAGAACGCAATTATTTCGACACCAGACACGTTGAAGAAGTAATTGAGCAAGTATTGGATTTAAATGCCTCCGCTACTATAATCATCAAGAGTACCATACCCTTGGGTTTTATTAAACACGTAAGAGAGAAATACCAAACAGACAGAATCATCTTTTCTCCAGAGTTCTTAAGAGAGTCAAAGGCATTGTACGATAACTTATACCCCTCTCGTATAATAGTCAGTTATGAGAAGGATGACTCTCCAAGAGTTATACAAGCAGCTAAGGCGTTCGCGGGTTTATTAAAAGAGGGGGCAAAGAGCAAGGATACCCCAGTTCTGTTTATGGGCTCTCAAGAAGCTGAAGCTGTCAAGCTGTTTGCTAATACTTTTCTCGCCATGAGGGTCAGTTACTTCAACGAGCTTGACACTTATAGCGAATCAAAAGGACTAGACGCCCAAAGAGTTATAGAAGGCGTCTGCCATGATCAAAGGATAGGTAATCATTACAATAATCCATCCTTCGGATATGGCGGTTATTGTTTACCCAAAGACTCAAAGCAACTTTTGGCTAATTATAGAGGCATACCTCAGTCTCTAATGTCTGCCATCGTTGAATCGAACAAGATCCGTAAGTCGTATTTAGCTGAACAAATATTAGATAGGGCTTCTTCACAAAAGCAGGCTGGTGTACCTTTAACCATAGGATTTTACCGTTTGATTATGAAGTCCAACTCCGATAACTTTAGAGAATCAGCCATTAAAGATATTATTGACATCATTAATGACTACGGTGTCAATATTGTCATTTATGAACCTATGTTGGGAGAAGACATTGGTTATAGAGTCGTTAAAGATTTGGAACAGTTTAAGAACGAAAGTACAATTATTGTTAGTAACAGGTTTGAAGATGATTTAGGTGATGTTATTGATAAAGTTTATACACGTGACGTCTTTGGTAG
SEQ ID NO:39是源自拟南芥的UDP-葡萄糖脱氢酶(HASB)的氨基酸序列
MVKICCIGAGYVGGPTMAVMALKCPEIEVVVVDISEPRINAWNSDRLPIYEPGLEDVVKQCRGKNLFFSTDVEKHVFESDIVFVSVNTPTKTQGLGAGKAADLTYWESAARMIADVSKSSKIVVEKSTVPVRTAEAIEKILTHNSKGIEFQILSNPEFLAEGTAIKDLYNPDRVLIGGRDTAAGQKAIKALRDVYAHWVPVEQIICTNLWSAELSKLAANAFLAQRISSVNAMSALCEATGADVTQVAHAVGTDTRIGPKFLNASVGFGGSCFQKDILNLIYICECNGLPEAANYWKQVVKVNDYQKIRFANRVVSSMFNTVSGKKIAILGFAFKKDTGDTRETPAIDVCNRLVADKAKLSIYDPQVLEEQIRRDLSMARFDWDHPVPLQQIKAEGISEQVNVVSDAYEATKDAHGLCVLTEWDEFKSLDFKKIFDNMQKPAFVFDGRNVVDAVKLREIGFIVYSIGKPLDSWLKDMPAVA
SEQ ID NO:40是源自小球藻属病毒PBCV1的UDP-葡萄糖脱氢酶(HASB)的氨基酸序列
MSRIAVVGCGYVGTACAVLLAQKNEVIVLDISEDRVQLIKNKKSPIEDKEIEEFLETKDLNLTATTDKVLAYENAEFVIIATPTDYDVVTRYFNTKSVENVIGDVIKNTQTHPTIVIKSTIPIGFVDKVREQFDYQNIIFSPEFLREGRALYDNLYPSRIIVGDDSPIALKFANLLVEGSKTPLAPVLTMGTREAEAVKLFSNTYLAMRVAYFNELDTFAMSHGMNAKEIIDGVTLEPRIGQGYSNPSFGYGAYCFPKDTKQLLANFEGVPQDIIGAIVESNETRKEVIVSEVENRFPTTVGVYKLAAKAGSDNFRSSAIVDIMERLANKGYHIKIFEPTVEQFENFEVDNNLTTFATESDVIIANRVPVEHRILFGKKLITRDVYGDN
SEQ ID NO:41是源自兽瘟链球菌的UDP-葡萄糖脱氢酶(HASB)的氨基酸序列
MKISVAGSGYVGLSLSILLAQHNDVTVVDIIDEKVRLINQGISPIKDADIEEYLKNAPLNLTATLDGASAYSNADLIIIATPTNYDSERNYFDTRHVEEVIEQVLDLNASATIIIKSTIPLGFIKHVREKYQTDRIIFSPEFLRESKALYDNLYPSRIIVSYEKDDSPRVIQAAKAFAGLLKEGAKSKDTPVLFMGSQEAEAVKLFANTFLAMRVSYFNELDTYSESKGLDAQRVIEGVCHDQRIGNHYNNPSFGYGGYCLPKDSKQLLANYRGIPQSLMSAIVESNKIRKSYLAEQILDRASSQKQAGVPLTIGFYRLIMKSNSDNFRESAIKDIIDIINDYGVNIVIYEPMLGEDIGYRVVKDLEQFKNESTIIVSNRFEDDLGDVIDKVYTRDVFGRD
SEQ ID NO:42是源自铜绿假单胞菌的UDP-葡萄糖-4-差向异构酶(GNE1)的核酸序列
ATGATGTCCCGTTACGAGGAACTTCGTAAAGAGCTGCCTGCACAGCCGAAGGTATGGTTGATCACTGGTGTCGCGGGCTTCATCGGGTCAAATCTGCTAGAGACCTTGCTTAAATTGGATCAGAAGGTTGTTGGCTTGGACAACTTTGCAACTGGCCACCAGAGGAATCTGGACGAGGTGAGGTCATTGGTTTCTGAGAAACAGTGGAGCAACTTTAAGTTTATTCAAGGGGACATTAGAAATCTGGACGACTGCAACAACGCATGTGCAGGCGTCGATTATGTCTTACACCAGGCAGCATTGGGCAGTGTGCCGAGGTCTATAAACGACCCTATAACATCGAATGCAACTAACATAGACGGTTTCTTGAACATGCTGATTGCAGCGAGGGATGCAAAAGTTCAGTCTTTTACCTATGCCGCTTCATCCTCTACATACGGGGATCACCCCGGTTTGCCAAAGGTGGAAGACACTATCGGCAAGCCTCTATCTCCATACGCTGTGACGAAGTATGTTAATGAGTTGTACGCAGACGTGTTTTCACGTTGTTATGGATTTTCAACCATCGGTCTGAGATACTTTAACGTCTTCGGCCGTAGACAAGATCCGAATGGGGCATACGCCGCCGTAATCCCTAAGTGGACATCCTCAATGATACAGGGTGACGACGTCTACATTAACGGAGATGGAGAGACATCACGTGACTTCTGCTACATAGAAAACACAGTTCAAGCAAACTTATTAGCCGCAACGGCCGGCCTAGACGCCAGAAACCAGGTGTATAATATCGCGGTGGGTGGTAGAACGTCACTAAATCAGCTTTTCTTCGCCTTGAGAGACGGTCTAGCTGAGAACGGCGTTAGCTACCATAGGGAACCAGTTTATAGGGATTTTAGAGAAGGAGATGTGAGACACAGCTTGGCAGATATTTCCAAGGCGGCTAAACTTCTTGGGTATGCTCCTAAATATGACGTATCAGCAGGGGTGGCGCTTGCAATGCCATGGTATATAATGTTTCTTAAGTAA
SEQ ID NO:43是源自多杀巴斯德菌的UDP-葡萄糖-4-差向异构酶(KFOA)的核酸序列
ATGAACATTCTAGTGACCGGCGGTGCTGGCTATATCGGCTCCCATACCAGTTTATGCTTACTGAATAAAGGATATAACGTGGTCATCATTGACAACCTGATCAATAGTTCATGCGAGTCGATCCGTAGGATAGAACTGATAGCTAAGAAGAAGGTCACCTTCTACGAGCTGAACATTAATAATGAAAAGGAAGTGAACCAGATCCTTAAGAAACACAAATTCGATTGCATAATGCACTTCGCAGGTGCCAAGTCGGTGGCCGAGTCACTAATTAAGCCAATTTTCTACTATGACAACAACGTCTCTGGAACTTTGCAGCTGATTAATTGTGCTATAAAGAACGACGTCGCAAATTTCATCTTTTCTTCATCAGCAACTGTTTATGGTGAGTCAAAGATTATGCCAGTGACAGAGGACTGCCACATCGGCGGCACACTAAATCCATACGGAACATCAAAATACATTTCAGAGTTGATGATAAGGGACATCGCCAAGAAGTACTCAGACACTAATTTCTTATGCTTGCGTTATTTCAATCCTACCGGGGCCCACGAGTCCGGCATGATCGGCGAGTCTCCAGCTGATATACCATCCAATCTGGTGCCTTACATTTTACAGGTGGCCATGGGCAAGTTGGAGAAGTTAATGGTATTCGGCGGTGACTACCCAACAAAGGACGGCACGGGTGTGAGAGACTATATTCACGTGATGGACCTAGCGGAAGGTCATGTGGCAGCCCTAAGCTACCTTTTCAGAGATAATAACACTAATTACCATGTATTCAATCTGGGCACGGGTAAGGGCTACAGTGTCCTTGAATTAGTAAGCACATTCGAGAAAATCTCGGGTGTCAGGATTCCATACGAGATCGTTTCTCGTCGTGATGGGGACATCGCAGAGAGTTGGTCATCACCGGAGAAAGCGAACAAGTACTTAAATTGGAAGGCCAAGAGGGAGCTTGAGACAATGCTAGAAGACGCATGGCGTTGGCAGATGAAGAACCCGAATGGTTACATATAA
SEQ ID NO:44是源自大肠埃希氏菌的UDP-葡萄糖-4-差向异构酶(KFOA)的核酸序列
AATGAACATTCTAGTGACCGGCGGTGCTGGCTATATCGGCTCCCATACCAGTTTATGCTTACTGAATAAAGGATATAACGTGGTCATCATTGACAACCTGATCAATAGTTCATGCGAGTCGATCCGTAGGATAGAACTGATAGCTAAGAAGAAGGTCACCTTCTACGAGCTGAACATTAATAATGAAAAGGAAGTGAACCAGATCCTTAAGAAACACAAATTCGATTGCATAATGCACTTCGCAGGTGCCAAGTCGGTGGCCGAGTCACTAATTAAGCCAATTTTCTACTATGACAACAACGTCTCTGGAACTTTGCAGCTGATTAATTGTGCTATAAAGAACGACGTCGCAAATTTCATCTTTTCTTCATCAGCAACTGTTTATGGTGAGTCAAAGATTATGCCAGTGACAGAGGACTGCCACATCGGCGGCACACTAAATCCATACGGAACATCAAAATACATTTCAGAGTTGATGATAAGGGACATCGCCAAGAAGTACTCAGACACTAATTTCTTATGCTTGCGTTATTTCAATCCTACCGGGGCCCACGAGTCCGGCATGATCGGCGAGTCTCCAGCTGATATACCATCCAATCTGGTGCCTTACATTTTACAGGTGGCCATGGGCAAGTTGGAGAAGTTAATGGTATTCGGCGGTGACTACCCAACAAAGGACGGCACGGGTGTGAGAGACTATATTCACGTGATGGACCTAGCGGAAGGTCATGTGGCAGCCCTAAGCTACCTTTTCAGAGATAATAACACTAATTACCATGTATTCAATCTGGGCACGGGTAAGGGCTACAGTGTCCTTGAATTAGTAAGCACATTCGAGAAAATCTCGGGTGTCAGGATTCCATACGAGATCGTTTCTCGTCGTGATGGGGACATCGCAGAGAGTTGGTCATCACCGGAGAAAGCGAACAAGTACTTAAATTGGAAGGCCAAGAGGGAGCTTGAGACAATGCTAGAAGACGCATGGCGTTGGCAGATGAAGAACCCGAATGGTTACATATAA
SEQ ID NO:45是源自铜绿假单胞菌的UDP-葡萄糖-4-差向异构酶(GNE1)的氨基酸序列
MMSRYEELRKELPAQPKVWLITGVAGFIGSNLLETLLKLDQKVVGLDNFATGHQRNLDEVRSLVSEKQWSNFKFIQGDIRNLDDCNNACAGVDYVLHQAALGSVPRSINDPITSNATNIDGFLNMLIAARDAKVQSFTYAASSSTYGDHPGLPKVEDTIGKPLSPYAVTKYVNELYADVFSRCYGFSTIGLRYFNVFGRRQDPNGAYAAVIPKWTSSMIQGDDVYINGDGETSRDFCYIENTVQANLLAATAGLDARNQVYNIAVGGRTSLNQLFFALRDGLAENGVSYHREPVYRDFREGDVRHSLADISKAAKLLGYAPKYDVSAGVALAMPWYIMFLK
SEQ ID NO:46是源自多杀巴斯德菌的UDP-葡萄糖-4-差向异构酶(KFOA)的氨基酸序列
MAILVTGGAGYIGSHTVVELLNANKDVVVLDNLCNSSPKSLERVAQITGKQVKFYQGDILDTALLQKIFAENQIQSVIHFAGLKAVGESVQKPAEYYMNNVTGSLVLIQEMKKAGVWNFVFSSSATVYGDPEIIPITESCKVGGTTNPYGTSKFMVEQILKDIAKATPEFSITILRYFNPVGAHESGLIGEDPNGIPNNLLPYISQVAIGKLPQLSVFGSDYETHDGTGVRDYIHVVDLAIGHLKALDRHEGDAGLHIYNLGTGSGYSVLDMVKAFEKVNDIKIPYKLVDRRPGDIATCYSDPSLAKTELNWTAARGLEQMMKDTWHWQKKNPKGYRD
SEQ ID NO:47是源自大肠埃希氏菌的UDP-葡萄糖-4-差向异构酶(KFOA)的氨基酸序列
MNILVTGGAGYIGSHTSLCLLNKGYNVVIIDNLINSSCESIRRIELIAKKKVTFYELNINNEKEVNQILKKHKFDCIMHFAGAKSVAESLIKPIFYYDNNVSGTLQLINCAIKNDVANFIFSSSATVYGESKIMPVTEDCHIGGTLNPYGTSKYISELMIRDIAKKYSDTNFLCLRYFNPTGAHESGMIGESPADIPSNLVPYILQVAMGKLEKLMVFGGDYPTKDGTGVRDYIHVMDLAEGHVAALSYLFRDNNTNYHVFNLGTGKGYSVLELVSTFEKISGVRIPYEIVSRRDGDIAESWSSPEKANKYLNWKAKRELETMLEDAWRWQMKNPNGYI
SEQ ID NO:48是具有N-末端分泌信号的源自萨氏九杯蛛的透明质酸酶(HYAL)的重编码核酸序列
ATGCAATTCAGCACTGTTGCATCAGTTGCATTTGTCGCCCTGGCGAATTTTGTAGCCGCGTTCAAGATTTACTGGAACGTCCCAACTTTTCAGTGCACGCATAACTACAAAATCGATTATGTCAAATTGTTGTCCACTTACGGGATACAGGTCAATGATGGCGGTAAGTTTCAAGGAAACCAAGTGACTATCTTTTATGAAACCCAGTTGGGTTTGTATCCACGAATCCTAAAATCTGGTAAAATGGAAAACGGCGGAATCCCTCAACGCGGTAACTTTGAGAAACACCTAGAAAAGGCAAGCACGGACCTCCAGAAAGTGATCCCTTGGAAAGAGTTTAGCGGATTAGGTGTGATAGATTGGGAGGCTTGGAGACCCACATGGGAATTTAACTGGGAACCGTTGAGGATATATCAAACCGAATCAATTAAGAGAGCTAAAGAACTACACCCTACCGCAAACGATTCCGCAGTAAAAGAAATTGCAGAGCGGCAATGGGAAGATTCAGCCAAGTTATACATGTTAGAAACACTGCGGCTGGCAAAGAAACTTCGACCTCAAGCGCCTTGGTGTTACTACTTATTTCCTGATTGCTATAATTACGTCGGAAAGAAACCAAAAGATTTCCAATGTAGTGCCTCGATACGTAAAGGTAACGATAAGCTAAGCTGGTTGTGGAAAGATTCTACGGCATTGTGTCCATCGATATACGTATATGAATCACAATTAGACAGGTATTCTTTTGAACAAAGGACATGGCGCGACAATGAGAAACTTCGGGAAGCGTTGCGTGTAGCCACGAGAACCTCTAAAATATACCCATACGTTAACTATTTCGATAAGGAGCTTATACCGGAGCAAGAAGTATGGAGAATGCTTGCGCAGGCAGCTGCTGTCGGTGGCAGTGGTGCGGTAATTTGGGGCTCATCTGCTGCAGTTGCATCTGAAGAGTTATGTAAATCTTTAAAACAGTATATTATTGAAACGCTTGGGCCGGCGGCAGAGAAGGTGGCTTGGCGTAGTGACTTATGCAGCAAAGAAATTTGTAATAATCAGGGTCGCTGCACATTCCCGGACGATGATTATGCAAACGCATGGAAATTATTTACAGATGATACTGTTAAGTTTTATGCTGGTAATATTACATGTAGGTGCTCCGAGAATTATTCTGGTCGTTTCTGCGAAAAGAAGAATTAA
SEQ ID NO:49是具有N-末端分泌信号的源自巴西钳蝎的透明质酸酶(HYAL)的重编码核酸序列
ATGCAATTCTCTACTGTCGCTTCCGTTGCTTTCGTCGCTTTGGCTAACTTTGTTGCCGCTGCTGATTTTAAAGTTTACTGGGAAGTGCCTTCCTTCCTTTGTTCTAAACGTTTTAAAATTAATGTAACGGAAGTTTTAACAAGTCACGAGATTCTTGTCAATCAGGGTGAGAGTTTCAACGGTGACAAGATAGTAATCTTTTACGAAAACCAATTGGGGAAGTACCCGCATATTGACTCAAACAATGTGGAGATCAATGGAGGAATACTTCAAGTAGCCGATTTGGCGAAGCATTTGAAAGTAGCCAAGGATAATATCACTAAATTCGTCCCGAATCCTAATTTCAACGGTGTCGGAGTGATCGACTGGGAAGCTTGGCGGCCATCATGGGAATTTAACTGGGGTAAGTTAAAAGTATATAAAGAAAAGAGCATTGACTTGGTCAAGTCGAAACATCCGGAGTGGCCCTCCGACAGGGTTGAAAAGGTTGCTAAAGAGGAGTGGGAGGAGAGTGCCAAAGAATGGATGGTGAAGACCCTGAAGTTAGCACAGGAAATGCGACCGAACGCAGTTTGGTGCTATTATCTATTCCCTGACTGCTACAATTATTTCGGTAAGGATCAACCCTCTCAATTCAGCTGCTCGTCTCGAATTCAGAAGGAAAATTCTCGTCTTTCTTGGCTCTGGAATCAATCAACAGCCATTTGCCTAAGCATTTATATCCAGGAATCCCATGTTACCAAATATAATATGTCCCAGCGGACATGGTGGATCGATGCGAGATTAAGAGAAGCAATTCGAGTCAGCGAACACAGACCAAACATACCCATCTACCCTTACATTAATTATATTCTACCTGGAACTAATCAAACTGTACCAGCAATGGACTTTAAAAGGACACTGGGTCAAATAGCTAGCCTCGGCCTAGATGGTGCTTTGTTATGGGGATCTAGCTATCATGTTTTAACAGAATCTCAATGCAAAATCACTTCTGATTATGTGAAATCAGTGATTGCTCCTACCGTGGCTACTGTCGTTCTCAATACAAACAGATGCTCACAGATAATTTGTAAGGGTCGCGGCAACTGTGTTTGGCCTGAAGAACCATTTAGTTCTTGGAAATACTTAGTTGACCCCAAAATGCCAGTGTTCAAGCCAACCAACATCCACTGTAAATGTAAAGGTTACCTAGGTAGATACTGTGAGATCCCAAAGTAA
SEQ ID NO:50是具有N-末端分泌信号的源自家牛的透明质酸酶(HYAL)的重编码核酸序列
ATGCAATTTTCTACTGTTGCTTCTGTCGCTTTCGTAGCACTGGCCAATTTTGTAGCTGCTGGAAGCCGTGACCCCGTTGTCCCAAACCAGCCTTTCACAACAATATGGAACGCAAATACGGAGTGGTGCATGAAGAAGCATGGAGTGGACGTCGATATTTCAATCTTCGACGTGGTCACTAATCCAGGACAGACATTTAGAGGTCCAAATATGACAATATTTTACAGTTCACAATTGGGGACCTACCCTTACTACACATCCGCGGGTGAGCCAGTATTCGGTGGTCTACCCCAGAACGCAAGTTTGAATGCCCACTTGGCTAGGACATTTCAAGATATTCTGGCAGCCATGCCAGAGCCCAGGTTCTCAGGTTTGGCTGTCATAGACTGGGAAGCGTGGAGACCTCGTTGGGCATTTAATTGGGATACGAAAGACATATACAGGCAGAGGTCCAGAGCATTGGTTCAGAAACAGCACCCGGATTGGCTGGCGCCACGTGTTGAGGCCGCAGCGCAAGACCAGTTCGAGGGCGCTGCTGAGGAGTGGATGGCCGGCACACTTAAATTAGGGCAGGCGCTTCGTCCTCAAGGCTTGTGGGGTTTCTATAACTTCCCGGAGTGTTACAATTATGACTTCAAATCTCCGAACTACACAGGAAGGTGCCCTTTAAACATCTGTGCGCAGAACGACCAGTTAGGTTGGCTATGGGGTCAAAGTCGTGCACTATATCCATCAATCTACTTGCCGGCGGCTTTGGAAGGCACGAAGAAGACTCAGATGTTCGTTCAGCACCGTGTAGCAGAGGCATTTAGGGTGGCGGCAGGCGCTGGTGACCCCAAGCTACCCGTCTTACCCTATATGCAGCTATTTTACGATATGACAAACCACTTCTTGCCCGCGGAAGAACTGGAACATAGCTTAGGTGAGTCAGCAGCGCAGGGTGCAGCCGGGGTTGTTCTGTGGGTTTCCTGGTTATCAACTTCGACAAAGGAAAGCTGTCAAGCAATCAAGGAATACGTAGATACTACGTTGGGCCCTTCAATCTTGAACGTCACATCTGGTGCCAGGTTGTGTTCTCAGGTATTGTGCAGTGGCCACGGGAGATGCGCGAGAAGACCTTCATATCCTAAAGCCAGGCTGATTCTAAATTCAACGTCGTTCTCCATCAAGCCAACACCCGGTGGTGGTCCATTGACACTTCAAGGCGCTTTGAGTTTGGAAGACAGATTACGTATGGCAGTTGAGTTTGAATGCAGATGTTACAGAGGATGGAGAGGGACACGTTGTGAGCAGTGGGGCATGTGGTAA
SEQ ID NO:51是具有N-末端分泌信号的源自西方蜜蜂的透明质酸酶(HYAL)的重编码核酸序列
ATGCAGTTTTCCACAGTTGCTTCCGTAGCTTTCGTAGCTTTAGCAAATTTTGTCGCAGCTTTGTTGTTGGGCTTCGTTCAGTCTACTCCAGATAATAATAAGACTGTGCGTGAATTTAACGTGTATTGGAACGTTCCTACATTCATGTGCCATAAGTACGGGTTGAGATTCGAAGAGGTGAGCGAGAAGTATGGCATTTTGCAAAATTGGATGGACAAATTCAGAGGAGAGGAAATTGCGATCTTATACGACCCCGGCATGTTCCCCGCACTGTTGAAAGACCCCAATGGGAATGTAGTAGCTAGGAATGGCGGAGTGCCCCAGCTTGGCAATTTAACTAAACATTTACAGGTGTTCAGGGACCACCTAATCAATCAGATTCCAGATAAAAGCTTTCCCGGAGTTGGTGTAATAGATTTCGAGTCATGGAGACCTATTTTCAGACAGAACTGGGCCTCTTTGCAACCGTACAAGAAGCTATCAGTCGAAGTCGTACGTCGTGAGCACCCATTCTGGGATGATCAGAGAGTGGAGCAAGAGGCGAAAAGAAGATTTGAAAAGTACGGCCAGCTTTTCATGGAAGAGACCTTGAAAGCCGCAAAACGTATGCGTCCTGCAGCCAATTGGGGCTACTACGCTTACCCTTATTGCTACAACCTGACCCCAAACCAGCCCTCAGCTCAATGCGAGGCTACAACAATGCAGGAGAACGACAAGATGTCATGGTTATTCGAGTCCGAGGACGTCTTACTGCCCAGCGTCTATTTGAGGTGGAACCTGACTAGCGGAGAGAGGGTTGGTTTAGTTGGTGGTCGTGTCAAGGAAGCCCTGAGAATAGCTCGTCAGATGACCACCTCTAGGAAGAAGGTCCTACCATACTACTGGTACAAATACCAGGATAGGAGAGACACGGACCTAAGTAGGGCTGATCTTGAGGCGACTCTACGTAAAATCACGGACTTAGGAGCCGACGGTTTCATAATCTGGGGATCTTCCGATGACATCAACACCAAGGCAAAATGTTTGCAGTTCAGAGAATATTTGAATAACGAGTTGGGCCCGGCAGTGAAGAGAATAGCCTTAAACAATAATGCGAATGACAGGCTAACAGTGGATGTGTCTGTTGACCAGGTTTAA
SEQ ID NO:52是具有N-末端分泌信号的源自野捕恒河猴的透明质酸酶(HYAL)的重编码核酸序列
ATGCAATTCAGTACTGTCGCTAGCGTCGCCTTTGTGGCTCTTGCAAATTTCGTCGCTGCTTCACGTGGGCCTTTATTGCCGAACAGACCATTTGCAACGGTATGGAATGCTAACACCCAATGGTGTTTAGAGAGGCACTCAGTAGACGTCGATGTCTCCATATTTGATGTTGTAGCAAACCCCGGCCAGACTTTTCGTGGGCCGGACATGACTATTTTCTATTCCAGTCAGCTAGGTACTTACCCTTATTATACCCCGACGGGTGAACCTGTCTTTGGTGGCCTTCCACAGAACGCATCACTTATAGCGCACTTGGCTAGGACTTTCCAGGATATATTGGCAGCTATACCAGCCCCCGACTTTTCTGGGCTAGCCGTAATTGACTGGGAAGCATGGAGACCGAGATGGGCATTTAACTGGGACACGAAAGACATTTACAGGCAAAGGTCCCGTGCCTTAGTCCAAGCACAGCATCCCGACTGGCCAGTTACTCAAGTTGAGGCTGTGGCACAAGACCAGTTCCAGGGTGCTGCGAGGGCATGGATGGCAGGAACCTTGCAATTAGGCCGTGCTTTAAGACCAAGGGGACTATGGGGCTTCTACGGTTTTCCCGATTGCTACAATTACGATTTCCTATCTCCTAATTACACAGGGCAATGCCCATCAGGGATCAGAGCACAAAATGACCAGTTAGGATGGTTGTGGGGTCAGAGTCGTGCATTATATCCCAGTATCTACATGCCGGCTGTTTTGGAAGGAACAGGCAAATCCCAAATGTACGTGCAGCACAGGGTCGCGGAAGCCTTTAGGGTTGCTGTTGCAGCAGGCGACCCAAACTTACCCGTCCTACCGTACGTCCAGATTTTCTACGATATGACCAACCACTTTCTTCCATTGGACGAGTTAGAGCATAGTCTTGGAGAATCAGCGGCTCAGGGCGCAGCAGGAGTCGTGTTATGGGTGTCATGGGAGAATACTAGAACAAAAGAATCTTGCCAGGCAATTAAAGAATATATGGACACTACCTTGGGGCCTTTTATTCTGAACGTCACTTCGGGTGCGTTGTTATGCTCGCAAGCCTTATGTTCAAGCCATGGTCGTTGTGTCCGTCGTCCCTCACATCCAAAAGCCTTGCTAATCCTTAATCCCGCAAGCTTTAGTATTCAGTTGACACCAGATGGTGGTCCCTTGTCGTTAAGGGGAGCATTGTCACTTGAGGACCAGGCACAAATGGCTGTTGAATTCAAATGCAGGTGCTACCCCGGGTGGCAAGGCCCTTGGTGTGAGCAGAAGAGTATGTGGTAA
SEQ ID NO:53是具有N-末端分泌信号的源自大胡蜂的透明质酸酶(HYAL)的重编码核酸序列
ATGCAATTTTCTACAGTGGCAAGTGTTGCATTCGTTGCACTAGCCAACTTTGTGGCGGCAGATAGCTGTGGGTCAAACTGCGAAAAGAGTGAGAGACCGAAAAGGGTCTTCAACATTTACTGGAACGTACCTACATTCATGTGTCACCAGTACGGACTATACTTTGACGAGGTCACGAATTTTAATATAAAGCACAACAGCAAAGACAATTTTCAAGGGGACAAGATCGCGATCTTTTATGACCCCGGGGAGTTTCCCGCTCTGCTGCCACTAAACTATGGTAAGTACAAGATCAGGAATGGTGGTGTTCCACAAGAGGGTAACATCACCATCCATCTGCAGAGATTCATAGAGTACCTAGATAAGACCTATCCGAACCGTAACTTTTCAGGCATCGGTGTGATCGATTTCGAGAGGTGGAGACCAATTTTCAGACAGAATTGGGGTAATATGAAGATTTACAAGAACTTCTCCATCGATCTTGTGCGTAAAGAGCATCCTTTCTGGAATAAGAAAATGATCGAGTTGGAAGCTTCTAAAAGATTCGAGAAATACGCCCGTCTGTTCATGGAAGAAACATTAAAGTTGGCTAAGAAAACTAGAAAACAGGCCGATTGGGGCTACTACGGTTACCCCTATTGCTTCAACATGTCTCCTACTAATTTCGTTCCTGACTGCGATGTCACAGCTAGGGATGAGAACAACGAGATGTCTTGGTTGTTTAACAACCAGAATGTCCTATTACCAAGTGTATACATTAGGAGAGAGCTAACTCCTGACCAGAGGATTGGGCTTGTACAGGGGAGAGTGAAGGAAGCTGTGAGAATTTCAAATAAACTGAAGCACTCACCTAAAGTCTTCAGCTATTGGTGGTATGTTTACCAAGACGAGACCAACACCTTCTTAACGGAGACCGACGTCAAGAAGACGTTTCAGGAGATTGTGATCAACGGTGGAGATGGGATTATAATCTGGGGTTCGTCCTCTGATGTAAACAGCTTGTCCAAGTGTACGAGGTTAAGGGAGTACCTATTGACAGTCTTGGGACCAATTGCTGTTAACGTGACTGAAGCAGTAAACTAA
SEQ ID NO:54是具有N-末端分泌信号和C-末端锚定信号的源自萨氏九杯蛛的透明质酸酶(HYAL)的重编码核酸序列
ATGCAATTCAGCACTGTTGCATCAGTTGCATTTGTCGCCCTGGCGAATTTTGTAGCCGCGTTCAAGATTTACTGGAACGTCCCAACTTTTCAGTGCACGCATAACTACAAAATCGATTATGTCAAATTGTTGTCCACTTACGGGATACAGGTCAATGATGGCGGTAAGTTTCAAGGAAACCAAGTGACTATCTTTTATGAAACCCAGTTGGGTTTGTATCCACGAATCCTAAAATCTGGTAAAATGGAAAACGGCGGAATCCCTCAACGCGGTAACTTTGAGAAACACCTAGAAAAGGCAAGCACGGACCTCCAGAAAGTGATCCCTTGGAAAGAGTTTAGCGGATTAGGTGTGATAGATTGGGAGGCTTGGAGACCCACATGGGAATTTAACTGGGAACCGTTGAGGATATATCAAACCGAATCAATTAAGAGAGCTAAAGAACTACACCCTACCGCAAACGATTCCGCAGTAAAAGAAATTGCAGAGCGGCAATGGGAAGATTCAGCCAAGTTATACATGTTAGAAACACTGCGGCTGGCAAAGAAACTTCGACCTCAAGCGCCTTGGTGTTACTACTTATTTCCTGATTGCTATAATTACGTCGGAAAGAAACCAAAAGATTTCCAATGTAGTGCCTCGATACGTAAAGGTAACGATAAGCTAAGCTGGTTGTGGAAAGATTCTACGGCATTGTGTCCATCGATATACGTATATGAATCACAATTAGACAGGTATTCTTTTGAACAAAGGACATGGCGCGACAATGAGAAACTTCGGGAAGCGTTGCGTGTAGCCACGAGAACCTCTAAAATATACCCATACGTTAACTATTTCGATAAGGAGCTTATACCGGAGCAAGAAGTATGGAGAATGCTTGCGCAGGCAGCTGCTGTCGGTGGCAGTGGTGCGGTAATTTGGGGCTCATCTGCTGCAGTTGCATCTGAAGAGTTATGTAAATCTTTAAAACAGTATATTATTGAAACGCTTGGGCCGGCGGCAGAGAAGGTGGCTTGGCGTAGTGACTTATGCAGCAAAGAAATTTGTAATAATCAGGGTCGCTGCACATTCCCGGACGATGATTATGCAAACGCATGGAAATTATTTACAGATGATACTGTTAAGTTTTATGCTGGTAATATTACATGTAGGTGCTCCGAGAATTATTCTGGTCGTTTCTGCGAAAAGAAGAATGGATCCGCCATTTCTCAAATCACTGACGGTCAAATCCAAGCTACTACCACTGCTACCACCGAAGCTACCACCACTGCTGCCCCATCTTCCACCGTTGAAACTGTTTCTCCATCCAGCACCGAAACTATCTCTCAACAAACTGAAAATGGTGCTGCTAAGGCCGCTGTCGGTATGGGTGCCGGTGCTCTAGCTGCTGCTGCTATGTTGTTATAA
SEQ ID NO:55是具有N-末端分泌信号和C-末端锚定信号的源自巴西钳蝎的透明质酸酶(HYAL)的重编码核酸序列
ATGCAATTCTCTACTGTCGCTTCCGTTGCTTTCGTCGCTTTGGCTAACTTTGTTGCCGCTGCTGATTTTAAAGTTTACTGGGAAGTGCCTTCCTTCCTTTGTTCTAAACGTTTTAAAATTAATGTAACGGAAGTTTTAACAAGTCACGAGATTCTTGTCAATCAGGGTGAGAGTTTCAACGGTGACAAGATAGTAATCTTTTACGAAAACCAATTGGGGAAGTACCCGCATATTGACTCAAACAATGTGGAGATCAATGGAGGAATACTTCAAGTAGCCGATTTGGCGAAGCATTTGAAAGTAGCCAAGGATAATATCACTAAATTCGTCCCGAATCCTAATTTCAACGGTGTCGGAGTGATCGACTGGGAAGCTTGGCGGCCATCATGGGAATTTAACTGGGGTAAGTTAAAAGTATATAAAGAAAAGAGCATTGACTTGGTCAAGTCGAAACATCCGGAGTGGCCCTCCGACAGGGTTGAAAAGGTTGCTAAAGAGGAGTGGGAGGAGAGTGCCAAAGAATGGATGGTGAAGACCCTGAAGTTAGCACAGGAAATGCGACCGAACGCAGTTTGGTGCTATTATCTATTCCCTGACTGCTACAATTATTTCGGTAAGGATCAACCCTCTCAATTCAGCTGCTCGTCTCGAATTCAGAAGGAAAATTCTCGTCTTTCTTGGCTCTGGAATCAATCAACAGCCATTTGCCTAAGCATTTATATCCAGGAATCCCATGTTACCAAATATAATATGTCCCAGCGGACATGGTGGATCGATGCGAGATTAAGAGAAGCAATTCGAGTCAGCGAACACAGACCAAACATACCCATCTACCCTTACATTAATTATATTCTACCTGGAACTAATCAAACTGTACCAGCAATGGACTTTAAAAGGACACTGGGTCAAATAGCTAGCCTCGGCCTAGATGGTGCTTTGTTATGGGGATCTAGCTATCATGTTTTAACAGAATCTCAATGCAAAATCACTTCTGATTATGTGAAATCAGTGATTGCTCCTACCGTGGCTACTGTCGTTCTCAATACAAACAGATGCTCACAGATAATTTGTAAGGGTCGCGGCAACTGTGTTTGGCCTGAAGAACCATTTAGTTCTTGGAAATACTTAGTTGACCCCAAAATGCCAGTGTTCAAGCCAACCAACATCCACTGTAAATGTAAAGGTTACCTAGGTAGATACTGTGAGATCCCAAAGGGATCCGCCATTTCTCAAATCACTGACGGTCAAATCCAAGCTACTACCACTGCTACCACCGAAGCTACCACCACTGCTGCCCCATCTTCCACCGTTGAAACTGTTTCTCCATCCAGCACCGAAACTATCTCTCAACAAACTGAAAATGGTGCTGCTAAGGCCGCTGTCGGTATGGGTGCCGGTGCTCTAGCTGCTGCTGCTATGTTGTTATAA
SEQ ID NO:56是具有N-末端分泌信号和C-末端锚定信号的源自家牛的透明质酸酶(HYAL)的重编码核酸序列
ATGCAATTTTCTACTGTTGCTTCTGTCGCTTTCGTAGCACTGGCCAATTTTGTAGCTGCTGGAAGCCGTGACCCCGTTGTCCCAAACCAGCCTTTCACAACAATATGGAACGCAAATACGGAGTGGTGCATGAAGAAGCATGGAGTGGACGTCGATATTTCAATCTTCGACGTGGTCACTAATCCAGGACAGACATTTAGAGGTCCAAATATGACAATATTTTACAGTTCACAATTGGGGACCTACCCTTACTACACATCCGCGGGTGAGCCAGTATTCGGTGGTCTACCCCAGAACGCAAGTTTGAATGCCCACTTGGCTAGGACATTTCAAGATATTCTGGCAGCCATGCCAGAGCCCAGGTTCTCAGGTTTGGCTGTCATAGACTGGGAAGCGTGGAGACCTCGTTGGGCATTTAATTGGGATACGAAAGACATATACAGGCAGAGGTCCAGAGCATTGGTTCAGAAACAGCACCCGGATTGGCTGGCGCCACGTGTTGAGGCCGCAGCGCAAGACCAGTTCGAGGGCGCTGCTGAGGAGTGGATGGCCGGCACACTTAAATTAGGGCAGGCGCTTCGTCCTCAAGGCTTGTGGGGTTTCTATAACTTCCCGGAGTGTTACAATTATGACTTCAAATCTCCGAACTACACAGGAAGGTGCCCTTTAAACATCTGTGCGCAGAACGACCAGTTAGGTTGGCTATGGGGTCAAAGTCGTGCACTATATCCATCAATCTACTTGCCGGCGGCTTTGGAAGGCACGAAGAAGACTCAGATGTTCGTTCAGCACCGTGTAGCAGAGGCATTTAGGGTGGCGGCAGGCGCTGGTGACCCCAAGCTACCCGTCTTACCCTATATGCAGCTATTTTACGATATGACAAACCACTTCTTGCCCGCGGAAGAACTGGAACATAGCTTAGGTGAGTCAGCAGCGCAGGGTGCAGCCGGGGTTGTTCTGTGGGTTTCCTGGTTATCAACTTCGACAAAGGAAAGCTGTCAAGCAATCAAGGAATACGTAGATACTACGTTGGGCCCTTCAATCTTGAACGTCACATCTGGTGCCAGGTTGTGTTCTCAGGTATTGTGCAGTGGCCACGGGAGATGCGCGAGAAGACCTTCATATCCTAAAGCCAGGCTGATTCTAAATTCAACGTCGTTCTCCATCAAGCCAACACCCGGTGGTGGTCCATTGACACTTCAAGGCGCTTTGAGTTTGGAAGACAGATTACGTATGGCAGTTGAGTTTGAATGCAGATGTTACAGAGGATGGAGAGGGACACGTTGTGAGCAGTGGGGCATGTGGGGATCCGCCATTTCTCAAATCACTGACGGTCAAATCCAAGCTACTACCACTGCTACCACCGAAGCTACCACCACTGCTGCCCCATCTTCCACCGTTGAAACTGTTTCTCCATCCAGCACCGAAACTATCTCTCAACAAACTGAAAATGGTGCTGCTAAGGCCGCTGTCGGTATGGGTGCCGGTGCTCTAGCTGCTGCTGCTATGTTGTTATAA
SEQ ID NO:57是具有N-末端分泌信号和C-末端锚定信号的源自西方蜜蜂的透明质酸酶(HYAL)的重编码核酸序列
ATGCAGTTTTCCACAGTTGCTTCCGTAGCTTTCGTAGCTTTAGCAAATTTTGTCGCAGCTTTGTTGTTGGGCTTCGTTCAGTCTACTCCAGATAATAATAAGACTGTGCGTGAATTTAACGTGTATTGGAACGTTCCTACATTCATGTGCCATAAGTACGGGTTGAGATTCGAAGAGGTGAGCGAGAAGTATGGCATTTTGCAAAATTGGATGGACAAATTCAGAGGAGAGGAAATTGCGATCTTATACGACCCCGGCATGTTCCCCGCACTGTTGAAAGACCCCAATGGGAATGTAGTAGCTAGGAATGGCGGAGTGCCCCAGCTTGGCAATTTAACTAAACATTTACAGGTGTTCAGGGACCACCTAATCAATCAGATTCCAGATAAAAGCTTTCCCGGAGTTGGTGTAATAGATTTCGAGTCATGGAGACCTATTTTCAGACAGAACTGGGCCTCTTTGCAACCGTACAAGAAGCTATCAGTCGAAGTCGTACGTCGTGAGCACCCATTCTGGGATGATCAGAGAGTGGAGCAAGAGGCGAAAAGAAGATTTGAAAAGTACGGCCAGCTTTTCATGGAAGAGACCTTGAAAGCCGCAAAACGTATGCGTCCTGCAGCCAATTGGGGCTACTACGCTTACCCTTATTGCTACAACCTGACCCCAAACCAGCCCTCAGCTCAATGCGAGGCTACAACAATGCAGGAGAACGACAAGATGTCATGGTTATTCGAGTCCGAGGACGTCTTACTGCCCAGCGTCTATTTGAGGTGGAACCTGACTAGCGGAGAGAGGGTTGGTTTAGTTGGTGGTCGTGTCAAGGAAGCCCTGAGAATAGCTCGTCAGATGACCACCTCTAGGAAGAAGGTCCTACCATACTACTGGTACAAATACCAGGATAGGAGAGACACGGACCTAAGTAGGGCTGATCTTGAGGCGACTCTACGTAAAATCACGGACTTAGGAGCCGACGGTTTCATAATCTGGGGATCTTCCGATGACATCAACACCAAGGCAAAATGTTTGCAGTTCAGAGAATATTTGAATAACGAGTTGGGCCCGGCAGTGAAGAGAATAGCCTTAAACAATAATGCGAATGACAGGCTAACAGTGGATGTGTCTGTTGACCAGGTTGGATCCGCCATTTCTCAAATCACTGACGGTCAAATCCAAGCTACTACCACTGCTACCACCGAAGCTACCACCACTGCTGCCCCATCTTCCACCGTTGAAACTGTTTCTCCATCCAGCACCGAAACTATCTCTCAACAAACTGAAAATGGTGCTGCTAAGGCCGCTGTCGGTATGGGTGCCGGTGCTCTAGCTGCTGCTGCTATGTTGTTATAA
SEQ ID NO:58是具有N-末端分泌信号和C-末端锚定信号的源自野捕恒河猴的透明质酸酶(HYAL)的重编码核酸序列
ATGCAATTCAGTACTGTCGCTAGCGTCGCCTTTGTGGCTCTTGCAAATTTCGTCGCTGCTTCACGTGGGCCTTTATTGCCGAACAGACCATTTGCAACGGTATGGAATGCTAACACCCAATGGTGTTTAGAGAGGCACTCAGTAGACGTCGATGTCTCCATATTTGATGTTGTAGCAAACCCCGGCCAGACTTTTCGTGGGCCGGACATGACTATTTTCTATTCCAGTCAGCTAGGTACTTACCCTTATTATACCCCGACGGGTGAACCTGTCTTTGGTGGCCTTCCACAGAACGCATCACTTATAGCGCACTTGGCTAGGACTTTCCAGGATATATTGGCAGCTATACCAGCCCCCGACTTTTCTGGGCTAGCCGTAATTGACTGGGAAGCATGGAGACCGAGATGGGCATTTAACTGGGACACGAAAGACATTTACAGGCAAAGGTCCCGTGCCTTAGTCCAAGCACAGCATCCCGACTGGCCAGTTACTCAAGTTGAGGCTGTGGCACAAGACCAGTTCCAGGGTGCTGCGAGGGCATGGATGGCAGGAACCTTGCAATTAGGCCGTGCTTTAAGACCAAGGGGACTATGGGGCTTCTACGGTTTTCCCGATTGCTACAATTACGATTTCCTATCTCCTAATTACACAGGGCAATGCCCATCAGGGATCAGAGCACAAAATGACCAGTTAGGATGGTTGTGGGGTCAGAGTCGTGCATTATATCCCAGTATCTACATGCCGGCTGTTTTGGAAGGAACAGGCAAATCCCAAATGTACGTGCAGCACAGGGTCGCGGAAGCCTTTAGGGTTGCTGTTGCAGCAGGCGACCCAAACTTACCCGTCCTACCGTACGTCCAGATTTTCTACGATATGACCAACCACTTTCTTCCATTGGACGAGTTAGAGCATAGTCTTGGAGAATCAGCGGCTCAGGGCGCAGCAGGAGTCGTGTTATGGGTGTCATGGGAGAATACTAGAACAAAAGAATCTTGCCAGGCAATTAAAGAATATATGGACACTACCTTGGGGCCTTTTATTCTGAACGTCACTTCGGGTGCGTTGTTATGCTCGCAAGCCTTATGTTCAAGCCATGGTCGTTGTGTCCGTCGTCCCTCACATCCAAAAGCCTTGCTAATCCTTAATCCCGCAAGCTTTAGTATTCAGTTGACACCAGATGGTGGTCCCTTGTCGTTAAGGGGAGCATTGTCACTTGAGGACCAGGCACAAATGGCTGTTGAATTCAAATGCAGGTGCTACCCCGGGTGGCAAGGCCCTTGGTGTGAGCAGAAGAGTATGTGGGGATCCGCCATTTCTCAAATCACTGACGGTCAAATCCAAGCTACTACCACTGCTACCACCGAAGCTACCACCACTGCTGCCCCATCTTCCACCGTTGAAACTGTTTCTCCATCCAGCACCGAAACTATCTCTCAACAAACTGAAAATGGTGCTGCTAAGGCCGCTGTCGGTATGGGTGCCGGTGCTCTAGCTGCTGCTGCTATGTTGTTATAA
SEQ ID NO:59是具有N-末端分泌信号和C-末端锚定信号的源自大胡蜂的透明质酸酶(HYAL)的重编码核酸序列
ATGCAATTTTCTACAGTGGCAAGTGTTGCATTCGTTGCACTAGCCAACTTTGTGGCGGCAGATAGCTGTGGGTCAAACTGCGAAAAGAGTGAGAGACCGAAAAGGGTCTTCAACATTTACTGGAACGTACCTACATTCATGTGTCACCAGTACGGACTATACTTTGACGAGGTCACGAATTTTAATATAAAGCACAACAGCAAAGACAATTTTCAAGGGGACAAGATCGCGATCTTTTATGACCCCGGGGAGTTTCCCGCTCTGCTGCCACTAAACTATGGTAAGTACAAGATCAGGAATGGTGGTGTTCCACAAGAGGGTAACATCACCATCCATCTGCAGAGATTCATAGAGTACCTAGATAAGACCTATCCGAACCGTAACTTTTCAGGCATCGGTGTGATCGATTTCGAGAGGTGGAGACCAATTTTCAGACAGAATTGGGGTAATATGAAGATTTACAAGAACTTCTCCATCGATCTTGTGCGTAAAGAGCATCCTTTCTGGAATAAGAAAATGATCGAGTTGGAAGCTTCTAAAAGATTCGAGAAATACGCCCGTCTGTTCATGGAAGAAACATTAAAGTTGGCTAAGAAAACTAGAAAACAGGCCGATTGGGGCTACTACGGTTACCCCTATTGCTTCAACATGTCTCCTACTAATTTCGTTCCTGACTGCGATGTCACAGCTAGGGATGAGAACAACGAGATGTCTTGGTTGTTTAACAACCAGAATGTCCTATTACCAAGTGTATACATTAGGAGAGAGCTAACTCCTGACCAGAGGATTGGGCTTGTACAGGGGAGAGTGAAGGAAGCTGTGAGAATTTCAAATAAACTGAAGCACTCACCTAAAGTCTTCAGCTATTGGTGGTATGTTTACCAAGACGAGACCAACACCTTCTTAACGGAGACCGACGTCAAGAAGACGTTTCAGGAGATTGTGATCAACGGTGGAGATGGGATTATAATCTGGGGTTCGTCCTCTGATGTAAACAGCTTGTCCAAGTGTACGAGGTTAAGGGAGTACCTATTGACAGTCTTGGGACCAATTGCTGTTAACGTGACTGAAGCAGTAAACGGATCCGCCATTTCTCAAATCACTGACGGTCAAATCCAAGCTACTACCACTGCTACCACCGAAGCTACCACCACTGCTGCCCCATCTTCCACCGTTGAAACTGTTTCTCCATCCAGCACCGAAACTATCTCTCAACAAACTGAAAATGGTGCTGCTAAGGCCGCTGTCGGTATGGGTGCCGGTGCTCTAGCTGCTGCTGCTATGTTGTTATAA
SEQ ID NO:60是具有N-末端分泌信号的源自萨氏九杯蛛的透明质酸酶(HYAL)的氨基酸序列
MQFSTVASVAFVALANFVAAFKIYWNVPTFQCTHNYKIDYVKLLSTYGIQVNDGGKFQGNQVTIFYETQLGLYPRILKSGKMENGGIPQRGNFEKHLEKASTDLQKVIPWKEFSGLGVIDWEAWRPTWEFNWEPLRIYQTESIKRAKELHPTANDSAVKEIAERQWEDSAKLYMLETLRLAKKLRPQAPWCYYLFPDCYNYVGKKPKDFQCSASIRKGNDKLSWLWKDSTALCPSIYVYESQLDRYSFEQRTWRDNEKLREALRVATRTSKIYPYVNYFDKELIPEQEVWRMLAQAAAVGGSGAVIWGSSAAVASEELCKSLKQYIIETLGPAAEKVAWRSDLCSKEICNNQGRCTFPDDDYANAWKLFTDDTVKFYAGNITCRCSENYSGRFCEKKN
SEQ ID NO:61是具有N-末端分泌信号的源自巴西钳蝎的透明质酸酶(HYAL)的氨基酸序列
MQFSTVASVAFVALANFVAAADFKVYWEVPSFLCSKRFKINVTEVLTSHEILVNQGESFNGDKIVIFYENQLGKYPHIDSNNVEINGGILQVADLAKHLKVAKDNITKFVPNPNFNGVGVIDWEAWRPSWEFNWGKLKVYKEKSIDLVKSKHPEWPSDRVEKVAKEEWEESAKEWMVKTLKLAQEMRPNAVWCYYLFPDCYNYFGKDQPSQFSCSSRIQKENSRLSWLWNQSTAICLSIYIQESHVTKYNMSQRTWWIDARLREAIRVSEHRPNIPIYPYINYILPGTNQTVPAMDFKRTLGQIASLGLDGALLWGSSYHVLTESQCKITSDYVKSVIAPTVATVVLNTNRCSQIICKGRGNCVWPEEPFSSWKYLVDPKMPVFKPTNIHCKCKGYLGRYCEIPK
SEQ ID NO:62是具有N-末端分泌信号的源自家牛的透明质酸酶(HYAL)的氨基酸序列
MQFSTVASVAFVALANFVAAGSRDPVVPNQPFTTIWNANTEWCMKKHGVDVDISIFDVVTNPGQTFRGPNMTIFYSSQLGTYPYYTSAGEPVFGGLPQNASLNAHLARTFQDILAAMPEPRFSGLAVIDWEAWRPRWAFNWDTKDIYRQRSRALVQKQHPDWLAPRVEAAAQDQFEGAAEEWMAGTLKLGQALRPQGLWGFYNFPECYNYDFKSPNYTGRCPLNICAQNDQLGWLWGQSRALYPSIYLPAALEGTKKTQMFVQHRVAEAFRVAAGAGDPKLPVLPYMQLFYDMTNHFLPAEELEHSLGESAAQGAAGVVLWVSWLSTSTKESCQAIKEYVDTTLGPSILNVTSGARLCSQVLCSGHGRCARRPSYPKARLILNSTSFSIKPTPGGGPLTLQGALSLEDRLRMAVEFECRCYRGWRGTRCEQWGMW
SEQ ID NO:63是具有N-末端分泌信号的源自西方蜜蜂的透明质酸酶(HYAL)的氨基酸序列
MQFSTVASVAFVALANFVAALLLGFVQSTPDNNKTVREFNVYWNVPTFMCHKYGLRFEEVSEKYGILQNWMDKFRGEEIAILYDPGMFPALLKDPNGNVVARNGGVPQLGNLTKHLQVFRDHLINQIPDKSFPGVGVIDFESWRPIFRQNWASLQPYKKLSVEVVRREHPFWDDQRVEQEAKRRFEKYGQLFMEETLKAAKRMRPAANWGYYAYPYCYNLTPNQPSAQCEATTMQENDKMSWLFESEDVLLPSVYLRWNLTSGERVGLVGGRVKEALRIARQMTTSRKKVLPYYWYKYQDRRDTDLSRADLEATLRKITDLGADGFIIWGSSDDINTKAKCLQFREYLNNELGPAVKRIALNNNANDRLTVDVSVDQV
SEQ ID NO:64是具有N-末端分泌信号的源自野捕恒河猴的透明质酸酶(HYAL)的氨基酸序列
MQFSTVASVAFVALANFVAASRGPLLPNRPFATVWNANTQWCLERHSVDVDVSIFDVVANPGQTFRGPDMTIFYSSQLGTYPYYTPTGEPVFGGLPQNASLIAHLARTFQDILAAIPAPDFSGLAVIDWEAWRPRWAFNWDTKDIYRQRSRALVQAQHPDWPVTQVEAVAQDQFQGAARAWMAGTLQLGRALRPRGLWGFYGFPDCYNYDFLSPNYTGQCPSGIRAQNDQLGWLWGQSRALYPSIYMPAVLEGTGKSQMYVQHRVAEAFRVAVAAGDPNLPVLPYVQIFYDMTNHFLPLDELEHSLGESAAQGAAGVVLWVSWENTRTKESCQAIKEYMDTTLGPFILNVTSGALLCSQALCSSHGRCVRRPSHPKALLILNPASFSIQLTPDGGPLSLRGALSLEDQAQMAVEFKCRCYPGWQGPWCEQKSMW
SEQ ID NO:65是具有N-末端分泌信号的源自大胡蜂的透明质酸酶(HYAL)的氨基酸序列
MQFSTVASVAFVALANFVAADSCGSNCEKSERPKRVFNIYWNVPTFMCHQYGLYFDEVTNFNIKHNSKDNFQGDKIAIFYDPGEFPALLPLNYGKYKIRNGGVPQEGNITIHLQRFIEYLDKTYPNRNFSGIGVIDFERWRPIFRQNWGNMKIYKNFSIDLVRKEHPFWNKKMIELEASKRFEKYARLFMEETLKLAKKTRKQADWGYYGYPYCFNMSPTNFVPDCDVTARDENNEMSWLFNNQNVLLPSVYIRRELTPDQRIGLVQGRVKEAVRISNKLKHSPKVFSYWWYVYQDETNTFLTETDVKKTFQEIVINGGDGIIIWGSSSDVNSLSKCTRLREYLLTVLGPIAVNVTEAVN
SEQ ID NO:66是具有N-末端分泌信号和C-末端锚定信号的源自萨氏九杯蛛的透明质酸酶(HYAL)的氨基酸序列
MQFSTVASVAFVALANFVAAFKIYWNVPTFQCTHNYKIDYVKLLSTYGIQVNDGGKFQGNQVTIFYETQLGLYPRILKSGKMENGGIPQRGNFEKHLEKASTDLQKVIPWKEFSGLGVIDWEAWRPTWEFNWEPLRIYQTESIKRAKELHPTANDSAVKEIAERQWEDSAKLYMLETLRLAKKLRPQAPWCYYLFPDCYNYVGKKPKDFQCSASIRKGNDKLSWLWKDSTALCPSIYVYESQLDRYSFEQRTWRDNEKLREALRVATRTSKIYPYVNYFDKELIPEQEVWRMLAQAAAVGGSGAVIWGSSAAVASEELCKSLKQYIIETLGPAAEKVAWRSDLCSKEICNNQGRCTFPDDDYANAWKLFTDDTVKFYAGNITCRCSENYSGRFCEKKNGSAISQITDGQIQATTTATTEATTTAAPSSTVETVSPSSTETISQQTENGAAKAAVGMGAGALAAAAMLL
SEQ ID NO:67是具有N-末端分泌信号和C-末端锚定信号的源自巴西钳蝎的透明质酸酶(HYAL)的氨基酸序列
MQFSTVASVAFVALANFVAAADFKVYWEVPSFLCSKRFKINVTEVLTSHEILVNQGESFNGDKIVIFYENQLGKYPHIDSNNVEINGGILQVADLAKHLKVAKDNITKFVPNPNFNGVGVIDWEAWRPSWEFNWGKLKVYKEKSIDLVKSKHPEWPSDRVEKVAKEEWEESAKEWMVKTLKLAQEMRPNAVWCYYLFPDCYNYFGKDQPSQFSCSSRIQKENSRLSWLWNQSTAICLSIYIQESHVTKYNMSQRTWWIDARLREAIRVSEHRPNIPIYPYINYILPGTNQTVPAMDFKRTLGQIASLGLDGALLWGSSYHVLTESQCKITSDYVKSVIAPTVATVVLNTNRCSQIICKGRGNCVWPEEPFSSWKYLVDPKMPVFKPTNIHCKCKGYLGRYCEIPKGSAISQITDGQIQATTTATTEATTTAAPSSTVETVSPSSTETISQQTENGAAKAAVGMGAGALAAAAMLL
SEQ ID NO:68是具有N-末端分泌信号和C-末端锚定信号的源自家牛的透明质酸酶(HYAL)的氨基酸序列
MQFSTVASVAFVALANFVAAGSRDPVVPNQPFTTIWNANTEWCMKKHGVDVDISIFDVVTNPGQTFRGPNMTIFYSSQLGTYPYYTSAGEPVFGGLPQNASLNAHLARTFQDILAAMPEPRFSGLAVIDWEAWRPRWAFNWDTKDIYRQRSRALVQKQHPDWLAPRVEAAAQDQFEGAAEEWMAGTLKLGQALRPQGLWGFYNFPECYNYDFKSPNYTGRCPLNICAQNDQLGWLWGQSRALYPSIYLPAALEGTKKTQMFVQHRVAEAFRVAAGAGDPKLPVLPYMQLFYDMTNHFLPAEELEHSLGESAAQGAAGVVLWVSWLSTSTKESCQAIKEYVDTTLGPSILNVTSGARLCSQVLCSGHGRCARRPSYPKARLILNSTSFSIKPTPGGGPLTLQGALSLEDRLRMAVEFECRCYRGWRGTRCEQWGMWGSAISQITDGQIQATTTATTEATTTAAPSSTVETVSPSSTETISQQTENGAAKAAVGMGAGALAAAAMLL
SEQ ID NO:69是具有N-末端分泌信号和C-末端锚定信号的源自西方蜜蜂的透明质酸酶(HYAL)的氨基酸序列
MQFSTVASVAFVALANFVAALLLGFVQSTPDNNKTVREFNVYWNVPTFMCHKYGLRFEEVSEKYGILQNWMDKFRGEEIAILYDPGMFPALLKDPNGNVVARNGGVPQLGNLTKHLQVFRDHLINQIPDKSFPGVGVIDFESWRPIFRQNWASLQPYKKLSVEVVRREHPFWDDQRVEQEAKRRFEKYGQLFMEETLKAAKRMRPAANWGYYAYPYCYNLTPNQPSAQCEATTMQENDKMSWLFESEDVLLPSVYLRWNLTSGERVGLVGGRVKEALRIARQMTTSRKKVLPYYWYKYQDRRDTDLSRADLEATLRKITDLGADGFIIWGSSDDINTKAKCLQFREYLNNELGPAVKRIALNNNANDRLTVDVSVDQVGSAISQITDGQIQATTTATTEATTTAAPSSTVETVSPSSTETISQQTENGAAKAAVGMGAGALAAAAMLL
SEQ ID NO:70是具有N-末端分泌信号和C-末端锚定信号的源自野捕恒河猴的透明质酸酶(HYAL)的氨基酸序列
MQFSTVASVAFVALANFVAASRGPLLPNRPFATVWNANTQWCLERHSVDVDVSIFDVVANPGQTFRGPDMTIFYSSQLGTYPYYTPTGEPVFGGLPQNASLIAHLARTFQDILAAIPAPDFSGLAVIDWEAWRPRWAFNWDTKDIYRQRSRALVQAQHPDWPVTQVEAVAQDQFQGAARAWMAGTLQLGRALRPRGLWGFYGFPDCYNYDFLSPNYTGQCPSGIRAQNDQLGWLWGQSRALYPSIYMPAVLEGTGKSQMYVQHRVAEAFRVAVAAGDPNLPVLPYVQIFYDMTNHFLPLDELEHSLGESAAQGAAGVVLWVSWENTRTKESCQAIKEYMDTTLGPFILNVTSGALLCSQALCSSHGRCVRRPSHPKALLILNPASFSIQLTPDGGPLSLRGALSLEDQAQMAVEFKCRCYPGWQGPWCEQKSMWGSAISQITDGQIQATTTATTEATTTAAPSSTVETVSPSSTETISQQTENGAAKAAVGMGAGALAAAAMLL
SEQ ID NO:71是具有N-末端分泌信号和C-末端锚定信号的源自大胡蜂的透明质酸酶(HYAL)的氨基酸序列
MQFSTVASVAFVALANFVAADSCGSNCEKSERPKRVFNIYWNVPTFMCHQYGLYFDEVTNFNIKHNSKDNFQGDKIAIFYDPGEFPALLPLNYGKYKIRNGGVPQEGNITIHLQRFIEYLDKTYPNRNFSGIGVIDFERWRPIFRQNWGNMKIYKNFSIDLVRKEHPFWNKKMIELEASKRFEKYARLFMEETLKLAKKTRKQADWGYYGYPYCFNMSPTNFVPDCDVTARDENNEMSWLFNNQNVLLPSVYIRRELTPDQRIGLVQGRVKEAVRISNKLKHSPKVFSYWWYVYQDETNTFLTETDVKKTFQEIVINGGDGIIIWGSSSDVNSLSKCTRLREYLLTVLGPIAVNVTEAVNAISQITDGQIQATTTATTEATTTAAPSSTVETVSPSSTETISQQTENGAAKAAVGMGAGALAAAAMLL
SEQ ID NO:72是源自酿酒酵母的谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)的核酸序列
ATGTGTGGTATCTTTGGTTACTGCAATTATCTAGTGGAAAGATCCAGAGGAGAAATTATCGACACCTTAGTGGATGGTTTACAAAGATTAGAATATAGAGGCTATGATTCCACCGGTATTGCTATCGATGGTGACGAAGCTGATTCTACTTTCATCTATAAGCAAATCGGTAAAGTGAGTGCTTTGAAAGAGGAGATTACTAAGCAAAATCCGAACAGAGACGTTACTTTTGTCTCTCATTGTGGTATTGCGCATACTAGATGGGCTACTCACGGTCGACCAGAACAAGTTAACTGTCACCCTCAAAGATCTGACCCAGAAGACCAATTTGTGGTCGTTCATAATGGTATCATCACAAATTTTAGAGAACTGAAGACTCTTTTAATTAACAAAGGTTATAAATTCGAAAGTGATACCGATACCGAGTGTATTGCTAAACTATATTTGCATTTATACAATACAAATTTACAAAATGGGCATGACTTAGATTTCCACGAATTAACCAAGCTAGTTCTTTTAGAACTAGAAGGTTCATACGGGTTATTATGTAAATCTTGTCACTATCCTAATGAGGTTATCGCCACTAGAAAAGGGTCCCCTTTACTGATTGGTGTCAAATCTGAAAAAAAACTAAAAGTCGACTTCGTGGATGTGGAATTTCCCGAAGAAAACGCTGGTCAACCGGAAATTCCATTGAAATCTAACAACAAATCATTTGGCTTGGGCCCAAAGAAAGCTCGTGAATTTGAAGCTGGTTCCCAAAATGCCAATTTACTACCAATTGCCGCCAATGAATTTAACTTGAGACATTCTCAATCCAGGGCTTTCCTATCAGAAGATGGATCTCCAACACCGGTGGAATTTTTTGTTTCTTCGGATGCGGCATCTGTTGTTAAACATACCAAGAAGGTGCTATTTTTAGAAGATGACGATTTGGCTCATATTTACGATGGTGAGTTACATATTCATAGATCTAGAAGAGAAGTAGGCGCATCAATGACAAGGTCCATTCAAACTTTAGAGATGGAGTTAGCTCAGATCATGAAGGGCCCTTACGACCATTTTATGCAAAAGGAAATCTATGAGCAACCAGAATCTACTTTCAATACTATGAGAGGTAGAATCGACTATGAAAATAATAAAGTGATATTGGGTGGTTTAAAGGCATGGTTACCAGTTGTCAGAAGAGCACGGAGACTGATCATGATCGCATGCGGTACTTCTTATCATTCATGTTTGGCTACTCGTGCTATCTTCGAAGAATTATCAGATATCCCAGTTAGTGTGGAATTAGCGTCTGACTTTCTGGACAGAAAATGCCCTGTCTTCAGAGACGATGTATGCGTGTTTGTTTCACAAAGTGGTGAAACTGCGGATACCATGCTGGCTCTAAATTATTGTTTAGAAAGAGGAGCCTTAACTGTCGGAATTGTTAACAGTGTTGGTTCTTCTATCTCTCGTGTCACCCACTGTGGTGTTCATATTAACGCTGGTCCTGAAATTGGTGTTGCCTCTACAAAAGCTTATACTTCCCAGTATATTGCCTTAGTGATGTTTGCTCTATCGCTGTCAGATGACCGTGTATCGAAAATAGACAGAAGAATTGAAATCATTCAAGGCTTGAAGTTAATCCCGGGCCAAATTAAGCAGGTATTAAAGCTGGAACCAAGAATAAAAAAGCTCTGTGCGACTGAATTAAAGGATCAAAAATCTCTATTGTTATTGGGTAGAGGTTACCAATTTGCTGCTGCTCTGGAAGGTGCTTTGAAGATCAAAGAAATTTCTTATATGCATTCTGAAGGTGTTTTGGCAGGTGAGTTGAAGCACGGTGTCTTGGCCTTGGTGGACGAAAACTTGCCAATCATTGCTTTTGGTACCAGAGACTCTCTATTCCCTAAAGTAGTTTCCTCTATTGAGCAAGTTACTGTAAGAAAGGGCCATCCAATTATTATTTGTAACGAAAATGATGAAGTGTGGGCGCAAAAATCTAAATCAATCGACCTGCAAACCTTAGAAGTTCCACAAACTGTTGATTGTTTACAAGGTCTAATTAATATTATTCCATTACAACTAATGTCATATTGGTTGGCTGTTAATAAAGGGATTGATGTTGATTTTCCAAGAAACTTGGCTAAATCTGTTACCGTCGAATAA
SEQ ID NO:73是源自小球藻属病毒1(PBCV-1)的谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)的重编码核酸序列
ATGTGCGGGATCTTCGGTGCTGTGTCGAACAATAATAGCATAGAAGTTTCCATCAAGGGTATACAGAAGCTAGAGTACCGCGGGTACGATTCGTGTGGAATAGCCTATACAGACGGAGGCGCCATTGAACGGATCAGGTCAATAGATGGGATCGACGACTTAAGGAAGAAAACAATAACAGAGTCTTCCCCGGTAGCTATCGCTCATTCAAGGTGGAGTACCACTGGGATTCCAAGTGTTGTGAACGCCCACCCGCACATCTCTCGGGGCACGTCTGGATGCGAGTCGCGCATTGCAGTCGTACACAATGGCATTATTGAAAATTACCAGCAGATCCGCAAGTACTTGATAAATCTTGGGTATACTTTCGATTCACAGACCGACACGGAAGTCATTGCTCATCTAATAGACTCGCAGTATAACGGGAACATCCTGCACACCGTCCAAATGGCAGTTAAGCACCTCAAAGGAAGCTACGCCATAGCAGTCATGTGCCATAAGGAGTCCGGGAAGATCGTGGTGGCAAAACAGAAGAGTCCGTTGGTATTGGGTATAGGAAGCGACGGAGCTTATTATATCGCATCGGACGTATTGGCTCTTCCCACTAACAAAGTGGTCTACATAAGTGACGGATTCTCTGCTGAGTTAAGTCCTGGATCGATGACTATCTATGATCTGGATGGCAATAAGGTAGAATACGAGGTGGAAGACGTTGAAATGGAGCAGACGTCGATGTCTTTAGATAACTTTGATCACTACATGATCAAAGAGATCAATGAACAGCCGATATCAATTCTCAATACTATTAAGAACAAAGGATTCTATGCAGAGATATTTGGTGATCTAGCACATGAAATATTTCAGAAGATCGACAATATATTGATTCTAGCCTGCGGAACTTCGTATCATGCAGGTCTCGTCGGGAAGCAATGGATAGAGACCATCTCACGCATCCCGGTGGATGTTCATATTGCAAGCGAGTATGAGCCGACAATTCCACGAGCCAATACACTTGTGATAACGATTAGTCAAAGCGGCGAGACTGCGGATACAATCGCAGCCCTTCAACGAGCGCAAAACGCAGGAATGATATACACTTTGTGTATCTGCAACAGCCCCAAGTCAACTCTAGTGCGCGAGTCGATAATGAAATACATAACCAAATGCGGTTCAGAAGTTTCTGTTGCCAGTACTAAAGCATTTACGTCGCAACTTGTGGTGTTGTATATGCTTGCGAACGTTCTTGCGAACAAAACTGATGATCTGCTAGGGGATCTTCCTCAAGCTATCGAGAGAGTAATCTGTCTTACTAATGACGAAATGAAGCGTTGGGCGGATGAAATTTGTACTGCCAAAAGTGCCATCTTCTTAGGGAGAGGACTGAACGCACCTGTAGCATTTGAGGGCGCGCTAAAGTTGAAGGAAATCTCATATATCCATGCCGAGGGTTTCCTCGGTGGAGAGTTGAAGCATGGGCCGCTGGCTTTGTTGGACGATAAGATCCCTGTAATCGTGACTGTTGCTGACCACGCTTATTTGGATCACATTAAGGCTAACATCGACGAGGTATTGGCACGAAACGTTACCGTATACGCGATCGTCGATCAGTATGTTAATATTGAACCACAGGAGCGACTGCATGTAGTAAAAGTGCCGTTTGTGAGTAAAGAGTTTTCTCCCATCATCCACACAATTCCGATGCAATTGTTATCGTATTATGTCGCGATCAAGCTGGGCAAGAACGTTGACAAGCCACGTAACCTGGCGAAAAGTGTTACAACATTCtaa
SEQ ID NO:74是源自小球藻属病毒1(PBCV-1)的谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)的重编码核酸序列
ATGTGTGGCATCTTTGGAGCAGTGTCAAACAACAACTCTATCGAGGTGTCAATCAAGGGTATTCAGAAGCTAGAATATCGTGGGTATGATTCGTGCGGTATTGCGTATACAGATGGGGGTGCGATTGAGCGTATACGTTCTATTGACGGCATTGACGATCTGCGTAAGAAAACAATCACAGAATCATCACCAGTGGCCATTGCTCACTCGCGGTGGAGCACCACTGGAATTCCATCAGTGGTGAACGCACATCCTCATATTTCTCGCGGAACCAGTGGGTGTGAGTCTCGTATCGCGGTAGTCCACAACGGTATCATTGAAAACTATCAGCAGATCCGAAAATATCTCATCAATCTTGGTTATACGTTTGATAGTCAAACGGACACAGAGGTCATTGCGCATTTGATTGATTCTCAGTACAATGGGAATATCTTGCACACCGTCCAAATGGCTGTCAAGCACCTGAAGGGCTCTTATGCCATTGCAGTTATGTGTCATAAAGAGTCTGGTAAAATAGTCGTGGCGAAACAGAAGTCACCCCTCGTACTTGGAATCGGCTCAGATGGTGCTTACTACATCGCTTCGGACGTGCTGGCGCTGCCGACAAATAAAGTTGTTTATATTTCAGACGGTTTCTCCGCAGAACTATCTCCAGGGAGTATGACCATTTACGATCTTGATGGAAATAAAGTAGAATATGAAGTAGAGGACGTTGAAATGGAACAAACTAGTATGTCTCTCGATAACTTTGATCATTACATGATTAAGGAAATTAATGAGCAACCAATCAGTATTCTAAACACTATAAAAAATAAAGGGTTCTATGCAGAAATATTCGGTGATTTGGCTCATGAAATCTTCCAAAAAATAGACAACATCCTGATACTGGCTTGTGGTACAAGTTATCACGCCGGTCTTGTAGGAAAACAGTGGATAGAGACCATCTCtAGAATCCCCGTGGATGTTCACATCGCGAGTGAATACGAACCTACTATTCCGAGAGCGAACACATTGGTAATCACTATTTCACAGTCGGGTGAAACTGCGGACACGATAGCGGCTTTGCAACGGGCCCAAAACGCCGGGATGATTTATACATTGTGTATTTGCAATTCACCAAAGAGCACTCTTGTTCGTGAGAGCATTATGAAGTACATCACGAAATGTGGTTCTGAGGTGTCAGTGGCATCAACGAAGGCGTTTACTTCTCAGCTCGTAGTACTGTACATGCTGGCAAACGTATTGGCAAATAAAACCGATGATTTGCTGGGAGACCTCCCACAGGCAATAGAACGGGTAATTTGTTTGACAAATGACGAAATGAAACGATGGGCCGACGAAATTTGCACTGCGAAATCCGCGATCTTCCTGGGAAGAGGACTAAACGCACCAGTTGCCTTTGAGGGAGCGTTGAAGCTCAAAGAAATCTCTTACATTCATGCAGAGGGCTTCCTGGGAGGTGAGTTGAAACACGGCCCCCTCGCACTCCTTGATGACAAGATTCCTGTTATCGTAACCGTAGCAGATCATGCTTATTTGGACCATATCAAAGCAAATATCGACGAAGTGCTTGCGAGGAACGTTACGGTATACGCCATAGTAGACCAGTATGTGAACATCGAGCCCCAGGAACGCCTTCACGTCGTCAAGGTTCCGTTTGTATCCAAAGAATTTTCTCCGATAATTCACACTATCCCGATGCAACTGCTTTCGTATTACGTGGCAATTAAGCTTGGAAAGAACGTTGACAAACCAAGGAATCTTGCAAAATCCGTGACTACCTTTTAA
SEQ ID NO:75是源自酿酒酵母的谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)的氨基酸序列
MCGIFGYCNYLVERSRGEIIDTLVDGLQRLEYRGYDSTGIAIDGDEADSTFIYKQIGKVSALKEEITKQNPNRDVTFVSHCGIAHTRWATHGRPEQVNCHPQRSDPEDQFVVVHNGIITNFRELKTLLINKGYKFESDTDTECIAKLYLHLYNTNLQNGHDLDFHELTKLVLLELEGSYGLLCKSCHYPNEVIATRKGSPLLIGVKSEKKLKVDFVDVEFPEENAGQPEIPLKSNNKSFGLGPKKAREFEAGSQNANLLPIAANEFNLRHSQSRAFLSEDGSPTPVEFFVSSDAASVVKHTKKVLFLEDDDLAHIYDGELHIHRSRREVGASMTRSIQTLEMELAQIMKGPYDHFMQKEIYEQPESTFNTMRGRIDYENNKVILGGLKAWLPVVRRARRLIMIACGTSYHSCLATRAIFEELSDIPVSVELASDFLDRKCPVFRDDVCVFVSQSGETADTMLALNYCLERGALTVGIVNSVGSSISRVTHCGVHINAGPEIGVASTKAYTSQYIALVMFALSLSDDRVSKIDRRIEIIQGLKLIPGQIKQVLKLEPRIKKLCATELKDQKSLLLLGRGYQFAAALEGALKIKEISYMHSEGVLAGELKHGVLALVDENLPIIAFGTRDSLFPKVVSSIEQVTARKGHPIIICNENDEVWAQKSKSIDLQTLEVPQTVDCLQGLINIIPLQLMSYWLAVNKGIDVDFPRNLAKSVTVE
SEQ ID NO:76是源自小球藻属病毒1(PBCV-1)的谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)的氨基酸序列
MCGIFGAVSNNNSIEVSIKGIQKLEYRGYDSCGIAYTDGGAIERIRSIDGIDDLRKKTITESSPVAIAHSRWSTTGIPSVVNAHPHISRGTSGCESRIAVVHNGIIENYQQIRKYLINLGYTFDSQTDTEVIAHLIDSQYNGNILHTVQMAVKHLKGSYAIAVMCHKESGKIVVAKQKSPLVLGIGSDGAYYIASDVLALPTNKVVYISDGFSAELSPGSMTIYDLDGNKVEYEVEDVEMEQTSMSLDNFDHYMIKEINEQPISILNTIKNKGFYAEIFGDLAHEIFQKIDNILILACGTSYHAGLVGKQWIETISRIPVDVHIASEYEPTIPRANTLVITISQSGETADTIAALQRAQNAGMIYTLCICNSPKSTLVRESIMKYITKCGSEVSVASTKAFTSQLVVLYMLANVLANKTDDLLGDLPQAIERVICLTNDEMKRWADEICTAKSAIFLGRGLNAPVAFEGALKLKEISYIHAEGFLGGELKHGPLALLDDKIPVIVTVADHAYLDHIKANIDEVLARNVTVYAIVDQYVNIEPQERLHVVKVPFVSKEFSPIIHTIPMQLLSYYVAIKLGKNVDKPRNLAKSVTTF
SEQ ID NO:77是源自酿酒酵母的UDP-N-乙酰葡萄糖胺焦磷酸化酶(QRI1)的核酸序列
ATGACTGACACAAAACAGCTATTCATTGAAGCCGGACAAAGTCAACTTTTCCACAATTGGGAAAGCTTGTCTCGCAAAGACCAAGAAGAATTGCTTTCAAACCTGGAGCAAATATCTTCCAAGAGGTCCCCTGCAAAACTACTGGAAGACTGTCAAAATGCTATTAAATTCTCACTAGCTAACTCTTCTAAGGATACTGGCGTCGAAATTTCACCATTGCCCCCTACTTCGTACGAGTCGCTTATTGGCAACAGTAAGAAAGAAAATGAATACTGGCGTTTAGGCCTTGAAGCTATTGGCAAGGGTGAAGTCGCAGTGATTTTAATGGCTGGCGGACAAGGTACGCGGTTAGGATCCTCTCAACCAAAGGGCTGTTACGACATTGGATTGCCTTCTAAGAAATCTCTTTTTCAAATTCAAGCTGAAAAGTTGATCAGGTTGCAAGATATGGTAAAGGACAAAAAGGTAGAAATTCCTTGGTATATTATGACATCAGGCCCCACTAGAGCGGCTACTGAGGCATACTTTCAAGAACACAATTATTTTGGCTTGAATAAAGAACAAATTACGTTCTTCAACCAGGGAACCCTGCCTGCCTTTGATTTAACCGGGAAGCATTTCCTAATGAAAGACCCAGTAAACCTATCTCAATCACCAGATGGAAATGGTGGACTCTACCGTGCCATCAAGGAAAACAAGTTGAACGAAGACTTTGATAGGAGAGGAATCAAGCATGTTTACATGTACTGTGTCGATAATGTCCTATCTAAAATCGCAGACCCTGTATTTATTGGTTTTGCCATCAAGCATGGCTTCGAACTGGCCACCAAAGCCGTTAGAAAGAGAGATGCGCATGAATCAGTTGGGTTAATTGCTACTAAAAACGAGAAACCATGTGTCATAGAATATTCTGAAATTTCCAATGAATTGGCTGAAGCAAAGGATAAAGATGGCTTATTAAAACTACGCGCAGGCAACATTGTAAATCATTATTACCTAGTGGATTTACTAAAACGTGATTTGGATCAGTGGTGTGAGAATATGCCATATCACATTGCGAAGAAGAAAATTCCAGCTTATGATAGTGTTACCGGCAAGTACACTAAGCCTACCGAACCAAACGGTATAAAATTAGAGCAATTCATATTTGATGTCTTTGACACTGTACCACTGAACAAGTTTGGGTGCTTAGAAGTAGATAGATGCAAAGAATTTTCACCTTTAAAAAACGGTCCTGGTTCTAAGAACGATAATCCTGAGACCAGCAGACTAGCATATTTGAAACTAGGAACCTCGTGGTTGGAAGATGCAGGCGCTATTGTAAAAGATGGGGTACTAGTCGAAGTTTCCAGCAAATTGAGTTATGCAGGTGAAAATCTATCCCAGTTCAAAGGTAAAGTCTTTGACAGAAGTGGTATAGTATTAGAAAAATAA
SEQ ID NO:78是源自酿酒酵母的UDP-N-乙酰葡萄糖胺焦磷酸化酶(QRI1)的氨基酸序列
MTDTKQLFIEAGQSQLFHNWESLSRKDQEELLSNLEQISSKRSPAKLLEDCQNAIKFSLANSSKDTGVEISPLPPTSYESLIGNSKKENEYWRLGLEAIGKGEVAVILMAGGQGTRLGSSQPKGCYDIGLPSKKSLFQIQAEKLIRLQDMVKDKKVEIPWYIMTSGPTRAATEAYFQEHNYFGLNKEQITFFNQGTLPAFDLTGKHFLMKDPVNLSQSPDGNGGLYRAIKENKLNEDFDRRGIKHVYMYCVDNVLSKIADPVFIGFAIKHGFELATKAVRKRDAHESVGLIATKNEKPCVIEYSEISNELAEAKDKDGLLKLRAGNIVNHYYLVDLLKRDLDQWCENMPYHIAKKKIPAYDSVTGKYTKPTEPNGIKLEQFIFDVFDTVPLNKFGCLEVDRCKEFSPLKNGPGSKNDNPETSRLAYLKLGTSWLEDAGAIVKDGVLVEVSSKLSYAGENLSQFKGKVFDRSGIVLEK
SEQ ID NO:79是源自酿酒酵母的磷酸葡萄糖变位酶-1(PGM1)的核酸序列
ATGTCACTTCTAATAGATTCTGTACCAACAGTTGCTTATAAGGACCAAAAACCGGGTACTTCAGGTTTACGTAAGAAGACCAAGGTTTTCATGGATGAGCCTCATTATACTGAGAACTTCATTCAAGCAACAATGCAATCTATCCCTAATGGCTCAGAGGGAACCACTTTAGTTGTTGGAGGAGATGGTCGTTTCTACAACGATGTTATCATGAACAAGATTGCCGCAGTAGGTGCTGCAAACGGTGTCAGAAAGTTAGTCATTGGTCAAGGCGGTTTACTTTCAACACCAGCTGCTTCTCATATAATTAGAACATACGAGGAAAAGTGTACCGGTGGTGGTATCATATTAACTGCCTCACACAACCCAGGCGGTCCAGAGAATGATTTAGGTATCAAGTATAATTTACCTAATGGTGGGCCAGCTCCAGAGAGTGTCACTAACGCTATCTGGGAAGCGTCTAAAAAATTAACTCACTATAAAATTATAAAGAACTTCCCCAAGTTGAATTTGAACAAGCTTGGTAAAAACCAAAAATATGGCCCATTGTTAGTGGACATAATTGATCCTGCCAAAGCATACGTTCAATTTCTGAAGGAAATTTTTGATTTTGACTTAATTAAAAGCTTCTTAGCGAAACAGCGCAAAGACAAAGGGTGGAAGTTGTTGTTTGACTCCTTAAATGGTATTACAGGACCATATGGTAAGGCTATATTTGTTGATGAATTTGGTTTACCGGCAGAGGAAGTTCTTCAAAATTGGCACCCTTTACCTGATTTCGGCGGTTTACATCCCGATCCGAATCTAACCTATGCACGAACTCTTGTTGACAGGGTTGACCGCGAAAAAATTGCCTTTGGAGCAGCCTCCGATGGTGATGGTGATAGGAATATGATTTACGGTTATGGCCCTGCTTTCGTTTCGCCAGGTGATTCTGTTGCCATTATTGCCGAATATGCACCCGAAATTCCATACTTCGCCAAACAAGGTATTTATGGCTTGGCACGTTCATTTCCTACATCCTCAGCCATTGATCGTGTTGCAGCAAAAAAGGGATTAAGATGTTACGAAGTTCCAACCGGCTGGAAATTCTTCTGTGCCTTATTTGATGCTAAAAAGCTATCAATCTGTGGTGAAGAATCCTTCGGTACAGGTTCCAATCATATCAGAGAAAAGGACGGTCTATGGGCCATTATTGCTTGGTTAAATATCTTGGCTATCTACCATAGGCGTAACCCTGAAAAGGAAGCTTCGATCAAAACTATTCAGGACGAATTTTGGAACGAGTATGGCCGTACTTTCTTCACAAGATACGATTACGAACATATCGAATGCGAGCAGGCCGAAAAAGTTGTAGCTCTTTTGAGTGAATTTGTATCAAGGCCAAACGTTTGTGGCTCCCACTTCCCAGCTGATGAGTCTTTAACCGTTATCGATTGTGGTGATTTTTCGTATAGAGATCTAGATGGCTCCATCTCTGAAAATCAAGGCCTTTTCGTAAAGTTTTCGAATGGGACTAAATTTGTTTTGAGGTTATCCGGCACAGGCAGTTCTGGTGCAACAATAAGATTATACGTAGAAAAGTATACTGATAAAAAGGAGAACTATGGCCAAACAGCTGACGTCTTCTTGAAACCCGTCATCAACTCCATTGTAAAATTCTTAAGATTTAAAGAAATTTTAGGAACAGACGAACCAACAGTCCGCACATAG
SEQ ID NO:80是源自酿酒酵母的磷酸葡萄糖变位酶-1(PGM1)的氨基酸序列
MSLLIDSVPTVAYKDQKPGTSGLRKKTKVFMDEPHYTENFIQATMQSIPNGSEGTTLVVGGDGRFYNDVIMNKIAAVGAANGVRKLVIGQGGLLSTPAASHIIRTYEEKCTGGGIILTASHNPGGPENDLGIKYNLPNGGPAPESVTNAIWEASKKLTHYKIIKNFPKLNLNKLGKNQKYGPLLVDIIDPAKAYVQFLKEIFDFDLIKSFLAKQRKDKGWKLLFDSLNGITGPYGKAIFVDEFGLPAEEVLQNWHPLPDFGGLHPDPNLTYARTLVDRVDREKIAFGAASDGDGDRNMIYGYGPAFVSPGDSVAIIAEYAPEIPYFAKQGIYGLARSFPTSSAIDRVAAKKGLRCYEVPTGWKFFCALFDAKKLSICGEESFGTGSNHIREKDGLWAIIAWLNILAIYHRRNPEKEASIKTIQDEFWNEYGRTFFTRYDYEHIECEQAEKVVALLSEFVSRPNVCGSHFPADESLTVIDCGDFSYRDLDGSISENQGLFVKFSNGTKFVLRLSGTGSSGATIRLYVEKYTDKKENYGQTADVFLKPVINSIVKFLRFKEILGTDEPTVRT
SEQ ID NO:81是源自酿酒酵母的UTP-葡萄糖-1-磷酸尿苷酰转移酶(UGP1)的核酸序列
ATGTCCACTAAGAAGCACACCAAAACACATTCCACTTATGCATTCGAGAGCAACACAAACAGCGTTGCTGCCTCACAAATGAGAAACGCCTTAAACAAGTTGGCGGACTCTAGTAAACTTGACGATGCTGCTCGCGCTAAGTTTGAGAACGAACTGGATTCGTTTTTCACGCTTTTCAGGAGATATTTGGTAGAGAAGTCTTCTAGAACCACCTTGGAATGGGACAAGATCAAGTCTCCCAACCCGGATGAAGTGGTTAAGTATGAAATTATTTCTCAGCAGCCCGAGAATGTCTCAAACCTTTCCAAATTGGCTGTTTTGAAGTTGAACGGTGGGCTGGGTACCTCCATGGGCTGCGTTGGCCCTAAATCTGTTATTGAAGTGAGAGAGGGAAACACCTTTTTGGATTTGTCTGTTCGTCAAATTGAATACTTGAACAGACAGTACGATAGCGACGTGCCATTGTTATTGATGAATTCTTTCAACACTGACAAGGATACGGAACACTTGATTAAGAAGTATTCCGCTAACAGAATCAGAATCAGATCTTTCAATCAATCCAGGTTCCCAAGAGTCTACAAGGATTCTTTATTGCCTGTCCCCACCGAATACGATTCTCCACTGGATGCTTGGTATCCACCAGGTCACGGTGATTTGTTTGAATCTTTACACGTATCTGGTGAACTGGATGCCTTAATTGCCCAAGGAAGAGAAATATTATTTGTTTCTAACGGTGACAACTTGGGTGCTACCGTCGACTTAAAAATTTTAAACCACATGATCGAGACTGGTGCCGAATATATAATGGAATTGACTGATAAGACCAGAGCCGATGTTAAAGGTGGTACTTTGATTTCTTACGATGGTCAAGTCCGTTTATTGGAAGTCGCCCAAGTTCCAAAAGAACACATTGACGAATTCAAAAATATCAGAAAGTTTACCAACTTCAACACGAATAACTTATGGATCAATCTGAAAGCAGTAAAGAGGTTGATCGAATCGAGCAATTTGGAGATGGAAATCATTCCAAACCAAAAAACTATAACAAGAGACGGTCATGAAATTAATGTCTTACAATTAGAAACCGCTTGTGGTGCTGCTATCAGGCATTTTGATGGTGCTCACGGTGTTGTCGTTCCAAGATCAAGATTCTTGCCTGTCAAGACCTGTTCCGATTTGTTGCTGGTTAAATCAGATCTATTCCGTCTGGAACACGGTTCTTTGAAGTTAGACCCATCCCGTTTTGGTCCAAACCCATTAATCAAGTTGGGCTCGCATTTCAAAAAGGTTTCTGGTTTTAACGCAAGAATCCCTCACATCCCAAAAATCGTCGAGCTAGATCATTTGACCATCACTGGTAACGTCTTTTTAGGTAAAGATGTCACTTTGAGGGGTACTGTCATCATCGTTTGCTCCGACGGTCATAAAATCGATATTCCAAACGGCTCCATATTGGAAAATGTTGTCGTTACTGGTAATTTGCAAATCTTGGAACATTGA
SEQ ID NO:82是源自酿酒酵母的UTP--葡萄糖-1-磷酸尿苷酰转移酶(UGP1)的氨基酸序列
MSTKKHTKTHSTYAFESNTNSVAASQMRNALNKLADSSKLDDAARAKFENELDSFFTLFRRYLVEKSSRTTLEWDKIKSPNPDEVVKYEIISQQPENVSNLSKLAVLKLNGGLGTSMGCVGPKSVIEVREGNTFLDLSVRQIEYLNRQYDSDVPLLLMNSFNTDKDTEHLIKKYSANRIRIRSFNQSRFPRVYKDSLLPVPTEYDSPLDAWYPPGHGDLFESLHVSGELDALIAQGREILFVSNGDNLGATVDLKILNHMIETGAEYIMELTDKTRADVKGGTLISYDGQVRLLEVAQVPKEHIDEFKNIRKFTNFNTNNLWINLKAVKRLIESSNLEMEIIPNQKTITRDGHEINVLQLETACGAAIRHFDGAHGVVVPRSRFLPVKTCSDLLLVKSDLFRLEHGSLKLDPSRFGPNPLIKLGSHFKKVSGFNARIPHIPKIVELDHLTITGNVFLGKDVTLRGTVIIVCSDGHKIDIPNGSILENVVVTGNLQILEH
SEQ ID NO:83是源自酿酒酵母的葡萄糖胺6-磷酸N-乙酰转移酶(GNA1)的核酸序列
ATGAGCTTACCCGATGGATTTTATATAAGGCGAATGGAAGAGGGGGATTTGGAACAGGTCACTGAGACGCTAAAGGTTTTGACCACCGTGGGCACTATTACCCCCGAATCCTTCAGCAAACTCATAAAATACTGGAATGAAGCCACAGTATGGAATGATAACGAAGATAAAAAAATAATGCAATATAACCCCATGGTGATTGTGGACAAGCGCACCGAGACGGTTGCCGCTACGGGGAATATCATCATCGAAAGAAAGATCATTCATGAACTGGGGCTATGTGGCCACATCGAGGACATTGCAGTAAACTCCAAGTATCAGGGCCAAGGTTTGGGCAAGCTCTTGATTGATCAATTGGTAACTATCGGCTTTGACTACGGTTGTTATAAGATTATTTTAGATTGCGATGAGAAAAATGTCAAATTCTATGAAAAATGTGGGTTTAGCAACGCAGGCGTGGAAATGCAAATTAGAAAATAG
SEQ ID NO:84是源自酿酒酵母的葡萄糖胺6-磷酸N-乙酰转移酶(GNA1)的氨基酸序列
MSLPDGFYIRRMEEGDLEQVTETLKVLTTVGTITPESFSKLIKYWNEATVWNDNEDKKIMQYNPMVIVDKRTETVAATGNIIIERKIIHELGLCGHIEDIAVNSKYQGQGLGKLLIDQLVTIGFDYGCYKIILDCDEKNVKFYEKCGFSNAGVEMQIRK
SEQ ID NO:85是源自酿酒酵母的磷酸乙酰葡萄糖胺变位酶(PCM1)的核酸序列
ATGAAGGTTGATTACGAGCAATTGTGCAAACTCTACGATGACACGTGCCGCACAAAGAATGTGCAGTTCAGTTACGGTACGGCCGGATTCAGAACGCTGGCCAAGAATTTGGATACGGTGATGTTCAGTACTGGTATACTGGCGGTTCTCAGGTCGCTGAAGCTTCAGGGTCAGTATGTGGGGGTGATGATCACGGCGTCGCACAACCCATACCAGGACAACGGGGTCAAGATCGTGGAACCAGACGGATCGATGCTTTTGGCCACATGGGAGCCATATGCCATGCAGTTGGCCAATGCGGCCTCTTTTGCCACTAATTTTGAAGAATTTCGTGTTGAGTTGGCCAAGCTGATTGAACACGAAAAGATTGATTTGAATACAACCGTCGTGCCTCACATCGTGGTTGGGAGAGACTCTAGGGAAAGTAGTCCATACTTGCTGCGCTGCTTGACTTCCTCCATGGCCAGCGTCTTCCACGCGCAAGTTTTGGACCTAGGCTGTGTCACTACGCCTCAATTGCATTACATTACTGATTTGTCCAACAGGCGGAAACTGGAAGGAGACACAGCGCCAGTTGCCACAGAACAGGACTACTATTCGTTCTTTATAGGAGCCTTCAACGAGCTCTTCGCCACGTATCAGCTGGAGAAGAGGCTGTCTGTCCCAAAATTGTTCATAGACACAGCCAATGGTATCGGTGGTCCACAGTTGAAAAAACTACTGGCCTCCGAAGATTGGGACGTGCCAGCGGAGCAAGTTGAGGTAATCAACGACAGGTCCGATGTTCCAGAACTGTTGAATTTTGAATGCGGTGCGGATTATGTGAAGACTAACCAGAGATTACCCAAGGGTCTTTCTCCATCCTCGTTTGATTCGCTATATTGCTCCTTTGATGGTGACGCAGACAGGGTTGTGTTCTACTATGTCGACTCAGGATCAAAATTTCATTTGTTGGATGGTGACAAAATTTCCACTTTGTTTGCAAAGTTCTTGTCTAAACAACTAGAATTGGCACACCTAGAACATTCTTTGAAGATTGGTGTTGTGCAAACTGCCTATGCAAACGGCAGTTCCACCGCTTACATAAAAAATACGTTGCACTGTCCCGTGTCTTGCACTAAGACAGGTGTTAAACACTTGCATCATGAAGCTGCCACTCAGTACGATATTGGCATTTATTTCGAAGCAAATGGACATGGTACGATTATATTCAGCGAAAAATTTCATCGAACTATCAAATCTGAATTATCCAAGTCCAAGTTAAATGGTGATACGTTAGCTTTGAGAACTTTGAAGTGTTTCTCTGAATTGATTAATCAGACCGTGGGAGATGCTATTTCAGACATGCTTGCTGTCCTTGCTACTTTGGCGATTTTGAAAATGTCGCCAATGGATTGGGATGAAGAGTATACTGATTTGCCCAACAAGCTGGTTAAGTGCATCGTTCCTGATAGGTCAATTTTCCAAACCACGGACCAGGAAAGAAAATTGCTCAATCCAGTGGGGTTGCAAGACAAGATAGATCTTGTGGTAGCCAAGTATCCCATGGGAAGAAGCTTTGTCAGAGCCAGTGGTACGGAGGATGCGGTGAGGGTTTATGCGGAATGTAAGGACTCCTCTAAGTTAGGTCAATTTTGTGACGAAGTGGTGGAGCACGTTAAGGCATCTGCTTGA
SEQ ID NO:86是源自酿酒酵母的磷酸乙酰葡萄糖胺变位酶(PCM1)的氨基酸序列
MKVDYEQLCKLYDDTCRTKNVQFSYGTAGFRTLAKNLDTVMFSTGILAVLRSLKLQGQYVGVMITASHNPYQDNGVKIVEPDGSMLLATWEPYAMQLANAASFATNFEEFRVELAKLIEHEKIDLNTTVVPHIVVGRDSRESSPYLLRCLTSSMASVFHAQVLDLGCVTTPQLHYITDLSNRRKLEGDTAPVATEQDYYSFFIGAFNELFATYQLEKRLSVPKLFIDTANGIGGPQLKKLLASEDWDVPAEQVEVINDRSDVPELLNFECGADYVKTNQRLPKGLSPSSFDSLYCSFDGDADRVVFYYVDSGSKFHLLDGDKISTLFAKFLSKQLELAHLEHSLKIGVVQTAYANGSSTAYIKNTLHCPVSCTKTGVKHLHHEAATQYDIGIYFEANGHGTIIFSEKFHRTIKSELSKSKLNGDTLALRTLKCFSELINQTVGDAISDMLAVLATLAILKMSPMDWDEEYTDLPNKLVKCIVPDRSIFQTTDQERKLLNPVGLQDKIDLVVAKYPMGRSFVRASGTEDAVRVYAECKDSSKLGQFCDEVVEHVKASA
SEQ ID NO:87是启动子pTDH3的核酸序列
CTGCTGTAACCCGTACATGCCCAAAATAGGGGGCGGGTTACACAGAATATATAACATCGTAGGTGTCTGGGTGAACAGTTTATTCCTGGCATCCACTAAATATAATGGAGCCCGCTTTTTAAGCTGGCATCCAGAAAAAAAAAGAATCCCAGCACCAAAATATTGTTTTCTTCACCAACCATCAGTTCATAGGTCCATTCTCTTAGCGCAACTACAGAGAACAGGGGCACAAACAGGCAAAAAACGGGCACAACCTCAATGGAGTGATGCAACCTGCCTGGAGTAAATGATGACACAAGGCAATTGACCCACGCATGTATCTATCTCATTTTCTTACACCTTCTATTACCTTCTGCTCTCTCTGATTTGGAAAAAGCTGAAAAAAAAGGTTGAAACCAGTTCCCTGAAATTATTCCCCTACTTGACTAATAAGTATATAAAGACGGTAGGTATTGATTGTAATTCTGTAAATCTATTTCTTAAACTTCTTAAATTCTACTTTTATAGTTAGTCTTTTTTTTAGTTTTAAAACACCAAGAACTTAGTTTCGAATAAACACACATAAACAAACAAA
SEQ ID NO:88是启动子pTDH3.Sk的核酸序列
CAATTCATCGGCCCTTTTAGCGGCTACCCGCGCCATCTAAATGATAGGGCGGGTGACACTATGGTAAATCCCATAATTAGGTGTCTGGGTGAGTGGTTCTGATGCCGGCATCCACTAAATATATTGGAGCCCATTTTTTACGCGGGCTTCCAGAAAAAAAGAGAATCCCAGCACCAAAAGGTGGTTCTCTTCACCAACCATCAGATCATAGGTCCACAACCACACATAACAGGGGCACAAAAAGGCAAAAAACGGACATAACCTCAATGGAGTGATGCAAATTGACTGGAGCAAAAGCTGACACAAGGCATTGATTGACCTACGCATGTATCTGTATTCTTTTCTTACACCTTCTATTACCTTCTAACTCTTTGGGTTGGAAAAAACTGAAAAAAAAGGTTGGGACCTGGTTCCCCCAAGTTGTCCCCCTACTTGGTTATTAAATATATAAAGACAGCAAGTGTTGATTATAATCTTGTAAATCTATAGTTCTTAATCTATACTTCTATTTATATTTTAAATTAGTCTTTTTATTTCCAAGTCCCCAAGAACTTAGTTTCGAATAAACACACACAAATAAACACA
SEQ ID NO:89是启动子pTDH3-1.sba的核酸序列-1
GCAGCGCTTCTTCCGCTCTAGTTTTTATAGTTATTATTACTACCACCTTAAAAATACGTAAATACTCAAAATAGTAGTGATATTCCCAACCTTATTCATCCAAGGCACATCATCATCATCAGCCATTCATCTTTCACCTGCCATTAGTAACCCGTCTTCTCATTGAGCGGGTTACGGCAGCCACAGGCCACATTCCGAATGTCTGGGTGAGCGGTCCCTTTTCCAGCATCCACTAAATATCTCCGATCCCGCTTTTTAATCTGGCTTCCTGAAAAAAAGAGAATCCCAGCACCAAAAAATGGCTCTCTTCACCAACCATCAGATCATAGGTCCCATTCTCTTACCGCAACCGTACAGAACAGGGGAAAACGGGTACAACCTCAATGGAGTGATGCAAACTGACTGGAGCAAAAAGCTGACACAAGGCAATCGACCTACGTGTCTGTCTATTTTCTCACACCTTCTATTACCTTCTAACTCTCTGGGTTGGAAAAAACTGAAAAAAAGGTTGAGACCAGTTTCCACAAATCATCCCCCTGTTTGATTAATAAATATATAAAGACGACAACTATCGATCATAAACTCATAAAACTATAACTCCTTTACACTTCTTATTTTATAGTTATTCTATTTTAATTCTTATTGATTTTAAAACCCCAAGAACTTAGTTTCGAAAACACACACACACAAACAATTAAAA
SEQ ID NO:90是启动子pTDH3.Sar的核酸序列
GAGCTAAATATCAGCCCTTCGGGTCCTGCCTGCTACCCGGTCCTGTTCGAATAAAAACGCGGGTAACACGACCCAGTAACACCTGTCGTTGGGTGTCTGGGTCAGAAGTTCTGATACCGGCTTCCACTAAATAGATTGGGTTCCGCTCTTTACGCTGGCTTCCTGAAAAAAGAGATTCCGGGCACCAAAAAATTGGTCTCTTTGCCAACCATCAGATCATAGGTCCATTCTCTTACCATAACCACACAGGATAGGGGCACCACAGGCGAAAATGGGCACAAAATCTCAATGGAGTGATGCAAATTAGCTGGAACAAAAGCTGACACAAGGCAATTAACCTGCGCATGTATCCATCTCCTTTTCTTACACCTTCTCTTACGTTCTAACTGTTTGGGTTGGAAAAATTAAAAAAAAAAGGTTGAGACCAGTTTCCCCAAATCGTCCCCCTACTTGATTCATAAATATATAAAGACGACAACTATTGATTATAATCTTGTAAATCTATAACTCTTTACTTTCTCCTATTTATAATTTAACTTAATCTTTTTAGATTTAAAACCCCAAGAACTTAGTTTCGAACAAACACACACAAATAAACAAAA
SEQ ID NO:91是启动子pENO2的核酸序列
CGCTCAGCATCTGCTTCTTCCCAAAGATGAACGCGGCGTTATGTCACTAACGACGTGCACCAACTTGCGGAAAGTGGAATCCCGTTCCAAAACTGGCATCCACTAATTGATACATCTACACACCGCACGCCTTTTTTCTGAAGCCCACTTTCGTGGACTTTGCCATATGCAAAATTCATGAAGTGTGATACCAAGTCAGCATACACCTCACTAGGGTAGTTTCTTTGGTTGTATTGATCATTTGGTTCATCGTGGTTCATTAATTTTTTTTCTCCATTGCTTTCTGGCTTTGATCTTACTATCATTTGGATTTTTGTCGAAGGTTGTAGAATTGTATGTGACAAGTGGCACCAAGCATATATAAAAAAAAAAAGCATTATCTTCCTACCAGAGTTGATTGTTAAAAACGTATTTATAGCAAACGCAATTGTAATTAATTCTTATTTTGTATCTTTTCTTCCCTTGTCTCAATCTTTTATTTTTATTTTATTTTTCTTTTCTTAGTTTCTTTCATAACACCAAGCAACTAATACTATAACATACAATAATA
SEQ ID NO:92是启动子pTEF3的核酸序列
GGCTGATAATAGCGTATAAACAATGCATACTTTGTACGTTCAAAATACAATGCAGTAGATATATTTATGCATATTACATATAATACATATCACATAGGAAGCAACAGGCGCGTTGGACTTTTAATTTTCGAGGACCGCGAATCCTTACATCACACCCAATCCCCCACAAGTGATCCCCCACACACCATAGCTTCAAAATGTTTCTACTCCTTTTTTACTCTTCCAGATTTTCTCGGACTCCGCGCATCGCCGTACCACTTCAAAACACCCAAGCACAGCATACTAAATTTCCCCTCTTTCTTCCTCTAGGGTGTCGTTAATTACCCGTACTAAAGGTTTGGAAAAGAAAAAAGAGACCGCCTCGTTTCTTTTTCTTCGTCGAAAAAGGCAATAAAAATTTTTATCACGTTTCTTTTTCTTGAAAATTTTTTTTTTTGATTTTTTTCTCTTTCGATGACCTCCCATTGATATTTAAGTTAATAAACGGTCTTCAATTTCTCAAGTTTCAGTTTCATTTTTCTTGTTCTATTACAACTTTTTTTACTTCTTGCTCATTAGAAAGAAAGCATAGCAATCTAATCTAAGTTTTAATTACAAA
SEQ ID NO:93是启动子pTEF1的核酸序列
GTTTAGCTTGCCTCGTCCCCGCCGGGTCACCCGGCCAGCGACATGGAGGCCCAGAATACCCTCCTTGACAGTCTTGACGTGCGCAGCTCAGGGGCATGATGTGACTGTCGCCCGTACATTTAGCCCATACATCCCCATGTATAATCATTTGCATCCATACATTTTGATGGCCGCACGGCGCGAAGCAAAAATTACGGCTCCTCGCTGCAGACCTGCGAGCAGGGAAACGCTCCCCTCACAGACGCGTTGAATTGTCCCCACGCCGCGCCCCTGTAGAGAAATATAAAAGGTTAGGATTTGCCACTGAGGTTCTTCTTTCATATACTTCCTTTTAAAATCTTGCTACGATACAGTTCTCACATCACATCCGAACATAAACAACC
SEQ ID NO:94是启动子pTEF1.ago的核酸序列
GTTTAGCTTGCCTCGTCCCCGCCGGGTCACCCGGCCAGCGACATGGAGGCCCAGAATACCCTCCTTGACAGTCTTGACGTGCGCAGCTCAGGGGCATGATGTGACTGTCGCCCGTACATTTAGCCCATACATCCCCATGTATAATCATTTGCATCCATACATTTTGATGGCCGCACGGCGCGAAGCAAAAATTACGGCTCCTCGCTGCAGACCTGCGAGCAGGGAAACGCTCCCCTCACAGACGCGTTGAATTGTCCCCACGCCGCGCCCCTGTAGAGAAATATAAAAGGTTAGGATTTGCCACTGAGGTTCTTCTTTCATATACTTCCTTTTAAAATCTTGCTACGATACAGTTCTCACATCACATCCGAACATAAACAACC
SEQ ID NO:95是启动子pTEF1.Sba的核酸序列
CGCCAACAAACCTTCGAACACTTTAATTTTCGAGGACCGCAGATCCTCACATCACACCCACACCCAAGACTGCTTCCCCCACACACCCTGCATCTGTACACTTTCTTCTGCTCTGTTTTTCTCTCCGGCGTTCTCTCGGGTCGCCCGCATCGCCGCGCCGGCTGGAACCGCCCACGCACCGCATATTGCAAATCGCCTGCCCCCTCTTGCTCCTTTTTGAGGGCGCGCCGTTACCCGCGCCCAGGGTCCGGAAAAAGAAACAAGGCTCTACCGCGTTTCTTTTTCCTTGTCGAAAAAGGCAAAAATGAAAATTTTTATCACGTTTCTTTTTTTTTGAAAAATTTTTTTTTTGGTTTTTTTTCTTTCGATGGCCTCCCATTGATATTTAAGTTAATAAATGGTTTTCAGTTTTCAAGTTTCAGTTTGTGTTCTTCTTTGCTAACTTTCACTTACACCTCGAAAGAAAGTATAGCAATCTAATCTTAGTTTTAATTACAA
SEQ ID NO:96是启动子pPDC1的核酸序列
TTATTTACCTATCTCTAAACTTCAACACCTTATATCATAACTAATATTTCTTGAGATAAGCACACTGCACCCATACCTTCCTTAAAAACGTAGCTTCCAGTTTTTGGTGGTTCCGGCTTCCTTCCCGATTCCGCCCGCTAAACGCATATTTTTGTTGCCTGGTGGCATTTGCAAAATGCATAACCTATGCATTTAAAAGATTATGTATGCTCTTCTGACTTTTCGTGTGATGAGGCTCGTGGAAAAAATGAATAATTTATGAATTTGAGAACAATTTTGTGTTGTTACGGTATTTTACTATGGAATAATCAATCAATTGAGGATTTTATGCAAATATCGTTTGAATATTTTTCCGACCCTTTGAGTACTTTTCTTCATAATTGCATAATATTGTCCGCTGCCCCTTTTTCTGTTAGACGGTGTCTTGATCTACTTGCTATCGTTCAACACCACCTTATTTTCTAACTATTTTTTTTTTAGCTCATTTGAATCAGCTTATGGTGATGGCACATTTTTGCATAAACCTAGCTGTCCTCGTTGAACATAGGAAAAAAAAATATATAAACAAGGCTCTTTCACTCTCCTTGCAATCAGATTTGGGTTTGTTCCCTTTATTTTCATATTTCTTGTCATATTCCTTTCTCAATTATTATTTTCTACTCATAACCTCACGCAAAATAACACAGTCAAATCAATCAAA
SEQ ID NO:97是启动子pCCW12的核酸序列
aaccagggcaaagcaaaataaaagAAACTTAATACGTTATGCCGTAATGAAGGGCTACCAAAAACGATAATCTCAACTGTAAACAGGTACAATGCGGACCCTTTTGCCACAAAACATACATCATTCATTGCCGGAAAAAGAAAGAAGTGAAGACAGCAGTGCAGCCAGCCATGTTGCGCCAATCTAATTATAGATGCTGGTGCCCTGAGGATGTATCTGGAGCCAGCCATGGCATCATGCGCTACCGCCGGATGTAAAATCCGACACGCAAAAGAAAACCTTCGAGGTTGCGCACTTCGCCCACCCATGAACCACACGGTTAGTCCAAAAGGGGCAGTTCAGATTCCAGATGCGGGAATTAGCTTGCTGCCACCCTCACCTCACTAACGCTGCGGTGTGCGGATACTTCATGCTATTTATAGACGCGCGTGTCGGAATCAGCACGCGCAAGAACCAAATGGGAAAATCGGAATGGGTCCAGAACTGCTTTGAGTGCTGGCTATTGGCGTCTGATTTCCGTTTTGGGAATCCTTTGCCGCGCGCCCCTCTCAAAACTCCGCACAAGTCCCAGAAAGCGGGAAAGAAATAAAACGCCACCAAAAAAAAAAATAAAAGCCAATCCTCGAAGCGTGGGTGGTAGGCCCTGGATTATCCCGTACAAGTATTTCTCAGGAGTAAAAAAACCGTTTGTTTTGGAATTCCCCATTTCGCGGCCACCTACGCCGCTATCTTTGCAACAACTATCTGCGATAACTCAGCAAATTTTGCATATTCGTGTTGCAGTATTGCGATAATGGGAGTCTTACTTCCAACATAACGGCAGAAAGAAATGTGAGAAAATTTTGCATCCTTTGCCTCCGTTCAAGTATATAAAGTCGGCATGCTTGATAATCTTTCTTTCCATCCTACATTGTTCTAATTATTCTTATTCTCCTTTATTCTTTCCTAACATACCAAGAAATTAATCTTctgtcattcgcttaaacactatatcaata
SEQ ID NO:98是启动子pCCW12.Sm的核酸序列
CGTTGTGCTGTAGTGAAGGAAGACTAAAAAGGATAATCACAGTTGTAAAGAGGTATAATGCGGACCCTTTTGCCACAAAACACACATCTTTCGTTTCCAAAATAAGAAAGAAGAAAGCAAAAAGATTAGCAGCCACGTTGCTGCGATCTAATTATAGACGGTGGCGTCATCATTCTCACCCAAGATTGTGTCTTGAACCTGCCACGGGTCCTGCGTTATCGCCGGATGTAAAACTAGACATGCAAAAAAAGGACCTTCCAGGTAGCGTGCTCCACACCACCCATGACCACCACAGTTAGTCCAAAAGAGGCAGCACCACTTCCCGATGGGGGAATTAGATTGCTGCCACCCTCACCTCACTAATGCTGCGGTGTGCGGATATGCCCTGCTATATATAGCTCCGCGTTTTTGAACCAGCACAGCGCGAGCACCAAAAAGGAAAATCGCATAGGCCCAGAACTGATTTCAGCACGGGCTATTGGCGTTGGGTTTCCGTTCTGGGAAACCTTCGCCGCGTCCCCCTCACAAACCTCCGCACAAGTTCGAGCAAGCGGGAAAAAACGAAAAACGCCATTAATACTAAATAAAGCAAATCCTCGAAGCGTGGGTGGCAAGCCCCTGGATTTTTCCGCACAAGTACTCTTCTCAGGAGTAAAAAAACCCGTTTGTTTTGGAATTCCCCATTTCGCGGCCATCTACGCCGGTATCTTCGCAATATCTATCAGCGATAACTCAGCAATTTTAATATTCGTGTTGCAGTGCTGCGATAGCGGGAGTCTTGTTTGTAACATAACGGCAGAAAGGAATGAGAGAAAATTTTCCATTCTTTGGCCTCCGTTCAAGTATATAAAGCCGGCATGCTTGGTAATCTTTCTCTCTCTTCTGTATTGTTTCTATAATACTTTTATCTTCTAATTATTTTCTGAAAAAACCAAGAAATTAATCTTCTGTCATTCGCTTAAACACTATATCAATA
SEQ ID NO:99是启动子pCCW12.Sk的核酸序列
TGTAAAATCCTACACGCAAAAAACCTCTTGGGTTGCGCGTTTTCCACCACCCACGACCCGCACAATCAATCCAAAAGGGGCAACGCCAGTTCCCAATGCGGGAATTAGCTCCTCACCCCCCTCACCCGCTAACGCTGCGGTGTGCGGACACGCAGCAGTATTTATAGATCCTCGTGTTGGAACCAGCCCGCGTGAGCACCAAATTGGAAAGTCGCAATGGGCCCAGAACCGCTTTCAGTACTGGGCCATTGGCGTCTAGTTTCCGTTTTGAGCGTCCTTCGCCGCGTCTCTCTGTGAAATCCCCGCACAAGTCTGAGCAGGCAAAAAAAAAAAACGCCACCAAAAATAAATAAAGCCAATCCTCGAAGGATGAGTAGGAAAGGAAGCCCCTGGTTTTTTCCCGCACGAATATTTTTCAGGAGTGAAAAAATCCGTTTGTTTTGGAATTCCCCATTTCGCGCTCACCTACGCCGGTATCTTTGGAACAACTATCAGCGATAACTCAGCAAAATTTGCATATCCGTGCTGCAATAGTGCGATAGTGGGATTGGGAGTCTTGTTGCATCATAACGGCAGAAAGGAATGAATAAAAATTTTCCGTTCTTTGTCTCCGTTCAAGTATATAAAGTCGGCATGCTTGATTATCTTTTCTTCTCTTCTACTACATTTCTATTTCACTTTCTACTCTATTCTTCCCTGAAAAACCCAAGAAAATAATCTTCTGTCATTCGCTTAAACAATATATCAAAA
SEQ ID NO:100是启动子pCCW12.Sba的核酸序列
ACCATGCCACGGTGCTGGCCCCACTTCCACCCACGACCCGCACGGTTGGCCCGAAAGGGGCAACACCAGTTCCCAATACGGAAATTAGTCCGCCACCACCCTCACCTCGCTAGAGCTGCGGTGTGCGGGCGTGCATCGCTATTTATAGACATGCCTGCTGGCGTCACCGCGCGCGAGCACCAAACAGGAAAATCGCACTGGGCCCAGAACCACGCTATGCGCTGGGCCGATGGCGTCCGGTTTCCCTTTGGGAGCCCCCTGCCACGTTCGCCTAACAAATCCCCGCACCGGCTTGAGAAAAAAGCGAAAAGCGAAAAAAAAAAATCAACGCCACCAAAATTAAAAAAAAAGAGCCATCCTCGAAGGGTGAATAGTAGCCCCTGACTTTTCCCGCACAGACAGACACCTTTCAGGAGTGAACAAAAAAGCAGTTTGTTTTGGAATTCCCCCATTTCGCGGTGGCCTGCGCAGGTATCTCTGCGTCAACTATCAGCGATAACTCAGCAAATTTTGCATATTCGTGTTGCGATACTACGATAATGGGAGTCTGTCGCCTAATAACGGCAACAAGGAATGAGAGAGAAAAATTTTCTTCATTCTCCAGCTCCCGTTCAAGTATATAAGGTCGGCATGGTCGATTGTCTTTCCTTCTCTTCAGTTACGTCTCTCTATTTACATTATTCTTATTTTTATTTAATAAAAACCCCAAGAAATTAATCTTCTGTCATTCGCTTAAACACTATATCAAAA
SEQ ID NO:101是启动子pCCW12.Sar的核酸序列
AAAAAACAACCTTCTGCCAACCTGCGTGCTTCTCACCACCCATGACCCACACAATTGACCCGAATGGGGCAACTCCAGTTCCCAATACGGGAATTAACTCGCCACCATATTTACCGCGTTGAAGCTGTGGTGTGCGGACACTCCGTACTATTTATAGACCCACGCGGTGGAACCAGCACGCGCGCGCACTAAACAGGAAAATCGCATTGAGTCCAGAACCGCCACCAGCACTTGGCCATTGGCGTCTAATTTCCGTTTTCGGCGCCCCTCACCGCGTCCTTCTAACAAAGCGCGCACAAGCTTGAGCAAGTGAAAAGAAAATTAAAAATAAAAAACCGCCACCAAAACAAATAAAGCAATCTTCGAAGTGTGGGTTGGTGGGAAGCCCCTGGCTTTTCCCGCACCAGTCGTTTTCAGGAGTAAAAAAATACCCGTTTGTTTTGGAATTCCCCATTTCGCGGCGACCTGCGCCGGTATCTTTGCAACAACTATTTGCGATAACTCAGCAAAATTTGCATATTCGTGTTGGGATATTGCGATAGTGGGAGTCTTGTTGCATAATAACGGTAAAAAGAAGTGAAGGAAAAAAATTTGCATCCTTTAGTCTCAGTTCAAGTATATAAAGTCGGGATATTCAATTATCTTTCTTTCTCTTGCTCAAAGGTTTCTATATTTTTTTTATAGTATTTCTTTTGTTATAAAATACCAAGAAATTAATCTTCTGTCATTCGCTTAAATACTACATCAATA
SEQ ID NO:102是启动子pNUP57的核酸序列
TCATCTGCGCAATGACTATCAAGACCTTCTGCAAGAATTTCAAATCTCACTGAAAATCTTGACCGAAAAGTGTCTTGAAAACCCATCAAGCCTGCAAAACCTATCTTTGACATTAGTCTCCATTATAAAAACGGCATAGTTGGGAGAAAACTTTCCATACTTCAATTGTGGACTGATATAAGTATTTTAGTTTTGCCCGCATGATCATCCCACATGGCTACAGCAGTTCTCTCATAGGAAAATAGTACAATAGCTACGTGATATAATCTAAATAATTGTTGCCAATGTGTAATTATATCATTTTGAACGTACGCGAAATGGATTATTTTCAAAAATTTTGTTTCTTGAAATGAGTAAAAGCAAAAGTCCAACTCTCCAAGTCGATGTAAACAACTTTTTGCCAAAGGGACTGAAAGACTAAATCGAGGATTATCCCGTTCAAACTATTCCAGAAACGCTCGTTAGTAACAAAAGACATACCTTGTTGACCAATTGATCAC
SEQ ID NO:103是启动子pCCW10.ago的核酸序列
GGTACCACGGCAACCTCGTTCGCTGTTCATCCCCTTCGTCACACAGGACGTTGGATGCCGTAAGCAGCGTTGCTTTTGATCCTCagGATCGGCCGGGTAACCCGCGGCtGCTTCTATTTTAGTATTCATATCTCAAGCACATCCATTCCGGCCGTTTGGGGGCGCCGCCGCACTCGTGTCCATTCCTACCGTGGCACTTAGGGCTATCCTGTCGGAGCGCCCCGCCGACCGCCTTATCGGCACCAAAAGTAGAAGCCCCGGCCCCGCGTGGCTCAGACTCACCATCGGTGCTATTTACTTTTCGATCAGATCGCGGCGCGCGGTGGCCGGCATTTCCGGAAGCGGCCACGGAGCAGAGGTGGCGCATTCGAATCGCATACGTCTTCGCCACGCCGGAAAAAAAATTTTCGGCTATATAAGGAGAGGCGGCCGTCTTGCTGCAGGCAGTTTCACTTTCTCTAAAACCAAAGAACATCGATTTCTTTAGTCACTCGCTTCCTTACACCGAACTCGAGGCGGCCGC
SEQ ID NO:104是启动子pCWP2的核酸序列
CTAGCCTCCCCTTTTTATTTTGTGCGGTCACCGCAAGGGACAAAGCTTTTCTTAGAAAACCGTCTGAGAAGCATAACGTACGCCATCCCCTAGACATATTAATAATGCTACAGATACTATGCTGCTCGTCTTTTTTTGACGACCCTTTTATTGCAATGTGCAACTAATGGCAAACAACCACATAGTATCACAGTATTACATTGCCTCCACCGATGCGGATGTTAGGGCGCCAAGTCTGTCATGAAGCATGTTCCTGTCATAATCTTGTATGCAAAATACCGCGTTCTGCGCCACTGATATGCTAGGCAGCAGCAACCTATGCAGAAGATTGCTTTTCCCACGCCTGTTTTACGTCTCCAGGGCACTTGAAACAATGCAGCGATCGCCGCCACAACACGCCAAAGAGAAGCGAAAGTGGGCCTGGGCGGCCTCAGTTTCGGCAGAGGTAAACAACACGAACTGAACTGCCTTAGCTCCGAAGGGCAATTCCACAGGCACTCCGCGGGGCCCGGCCAAGGCCCAAAAGGCGTGGAATATGCGCGTTTTGGGGCCATAACACCCAGTACCACGGCCGGAACGGGCCATATAATAAGTTTTTCACTCTCAAGAATGGTAAACGTAAATAGGAACATCCCACTACCCTAGAAATTGCGGAAATTTCGCGCTTATCATTAGAAAATCTGGAACCGTCCTTTTTCCTCTTTCTTGCATTTCCCTTTCCGTATTATTGCCATTCTTTAACTGCATTTGGGGAACCGTAGACCAAAAGCCAAACAGAGAAATGTAACGTTCTAAAAAAAAAACAACGAAAAAATTGAAAAATAAGATACAATAATCGTATATAAATCAGGCTTCTTGTTCATCATTTTCAATTCTCTTCTTGCCATCCCTTTTCCTATCTTTGTTCTTTTCTTCTCATAATCAAGAATAAATAACTTCATCA
SEQ ID NO:105是启动子pFBA1的核酸序列
ACGCAAGCCCTAAGAAATGAATAACAATACTGACAGTACTAAATAATTGCCTACTTGGCTTCACATACGTTGCATACGTCGATATAGATAATAATGATAATGACAGCAGGATTATCGTAATACGTAATAGTTGAAAATCTCAAAAATGTGTGGGTCATTACGTAAATAATGATAGGAATGGGATTCTTCTATTTTTCCTTTTTCCATTCTAGCAGCCGTCGGGAAAACGTGGCATCCTCTCTTTCGGGCTCAATTGGAGTCACGCTGCCGTGAGCATCCTCTCTTTCCATATCTAACAACTGAGCACGTAACCAATGGAAAAGCATGAGCTTAGCGTTGCTCCAAAAAAGTATTGGATGGTTAATACCATTTGTCTGTTCTCTTCTGACTTTGACTCCTCAAAAAAAAAAAATCTACAATCAACAGATCGCTTCAATTACGCCCTCACAAAAACTTTTTTCCTTCTTCTTCGCCCACGTTAAATTTTATCCCTCATGTTGTCTAACGGATTTCTGCACTTGATTTATTATAAAAAGACAAAGACATAATACTTCTCTATCAATTTCAGTTATTGTTCTTCCTTGCGTTATTCTTCTGTTCTTCTTTTTCTTTTGTCATATATAACCATAACCAAGTAATACATATTCAAA
SEQ ID NO:106是启动子pCCW120.Sm的核酸序列
CGTTGTGCTGTAGTGAAGGAAGACTAAAAAGGATAATCACAGTTGTAAAGAGGTATAATGCGGACCCTTTTGCCACAAAACACACATCTTTCGTTTCCAAAATAAGAAAGAAGAAAGCAAAAAGATTAGCAGCCACGTTGCTGCGATCTAATTATAGACGGTGGCGTCATCATTCTCACCCAAGATTGTGTCTTGAACCTGCCACGGGTCCTGCGTTATCGCCGGATGTAAAACTAGACATGCAAAAAAAGGACCTTCCAGGTAGCGTGCTCCACACCACCCATGACCACCACAGTTAGTCCAAAAGAGGCAGCACCACTTCCCGATGGGGGAATTAGATTGCTGCCACCCTCACCTCACTAATGCTGCGGTGTGCGGATATGCCCTGCTATATATAGCTCCGCGTTTTTGAACCAGCACAGCGCGAGCACCAAAAAGGAAAATCGCATAGGCCCAGAACTGATTTCAGCACGGGCTATTGGCGTTGGGTTTCCGTTCTGGGAAACCTTCGCCGCGTCCCCCTCACAAACCTCCGCACAAGTTCGAGCAAGCGGGAAAAAACGAAAAACGCCATTAATACTAAATAAAGCAAATCCTCGAAGCGTGGGTGGCAAGCCCCTGGATTTTTCCGCACAAGTACTCTTCTCAGGAGTAAAAAAACCCGTTTGTTTTGGAATTCCCCATTTCGCGGCCATCTACGCCGGTATCTTCGCAATATCTATCAGCGATAACTCAGCAATTTTAATATTCGTGTTGCAGTGCTGCGATAGCGGGAGTCTTGTTTGTAACATAACGGCAGAAAGGAATGAGAGAAAATTTTCCATTCTTTGGCCTCCGTTCAAGTATATAAAGCCGGCATGCTTGGTAATCTTTCTCTCTCTTCTGTATTGTTTCTATAATACTTTTATCTTCTAATTATTTTCTGAAAAAACCAAGAAATTAATCTTCTGTCATTCGCTTAAACACTATATCAATACTCGAAATCCAAGGTGGTGT
SEQ ID NO:107是启动子pCUP1的核酸序列
CGGCAAACTTCAACGATTTCTATGATGCATTTTATAATTAGTAAGCCGATCCCATTACCGACATTTGGGCGCTATACGTGCATATGTTCATGTATGTATCTGTATTTAAAACACTTTTGTATTATTTTTCCTCATATATGTGTATAGGTTTATACGGATGATTTAATTATTACTTCACCACCCTTTATTTCAGGCTGATATCTTAGCCTTGTTACTAGTTAGAAAAAGACATTTTTGCTGTCAGTCACTGTCAAGAGATTCTTTTGCTGGCATTTCTTCTAGAAGCAAAAAGAGCGATGCGTCTTTTCCGCTGAACCGTTCCAGCAAAAAAGACTACCAACGCAATATGGATTGTCAGAATCATATAAAAGAGAAGCAAATAACTCCTTGTCTTGTATCAATTGCATTATAATATCTTCTTGTTAGTGCAATATCATATAGAAGTCATCGAAATAGATATTAAGAAAAACAAACTGTACAATCAATCAATCAATCATCACATAAA
SEQ ID NO:108是启动子pMET6的核酸序列
CCACAGGAAATATTTCACGTGACTTACAAACAGAGTCGTACGTCAGGACCGGAGTCAGGTGAAAAAATGTGGGCCGGTAAAGGGAAAAAACCAGAAACGGGACTACTATCGAACTCGTTTAGTCGCGAACGTGCAAAAGGCCAATATTTTTCGCTAGAGTCATCGCAGTCATGGCAGCTCTTTCGCTCTATCTCCCGGTCGCAAAACTGTGGTAGTCATAGCTCGTTCTGCTCAATTGAGAACTGTGAATGTGAATATGGAACAAATGCGATAGATGCACTAATTTAAGGGAAGCTAGCTAGTTTTCCCAACTGCGAAAGAAAAAAAGGAAAGAAAAAAAAATTCTATATAAGTGATAGATATTTCCATCTTTACTAGCATTAGTTTCTCTTTTACGTATTCAATATTTTTGTTAAACTCTTCCTTTATCATAAAAAAGCAAGCATCTAAGAGCATTGACAACACTCTAAGAAACAAAATACCAATATAATTTCAAAGTACATATCAAAA
SEQ ID NO:109是启动子pMET25的核酸序列
TTACATTATCAATCCTTGCGTTTCAGCTTCCACTAATTTAGATGACTATTTCTCATCATTTGCGTCATCTTCTAACACCGTATATGATAATATACTAGTAACGTAAATACTAGTTAGTAGATGATAGTTGATTTTTATTCCAACACTAAGAAATAATTTCGCCATTTCTTGAATGTATTTAAAGATATTTAATGCTATAATAGACATTTAAATCCAATTCTTCCAACATACAATGGGAGTTTGGCCGAGTGGTTTAAGGCGTCAGATTTAGGTGGATTTAACCTCTAAAATCTCTGATATCTTCGGATGCAAGGGTTCGAATCCCTTAGCTCTCATTATTTTTTGCTTTTTCTCTTGAGGTCACATGATCGCAAAATGGCAAATGGCACGTGAAGCTGTCGATATTGGGGAACTGTGGTGGTTGGCAAATGACTAATTAAGTTAGTCAAGGCGCCATCCTCATGAAAACTGTGTAACATAATAACCGAAGTGTCGAAAAGGTGGCACCTTGTCCAATTGAACACGCTCGATGAAAAAAATAAGATATATATAAGGTTAAGTAAAGCGTCTGTTAGAAAGGAAGTTTTTCCTTTTTCTTGCTCTCTTGTCTTTTCATCTACTATTTCCTTCGTGTAATACAGGGTCGTCAGATACATAGATACAATTCTATTACCCCCATCCATACA
SEQ ID NO:110是启动子pSAM1的核酸序列
GAAACGGACGTAAGACGGAAATAGAATTTGAAGATAAAGTTATATATCACTACACACGAATACTTTCTTTTTTTTTTTTCACAGGAAAACTGTGGTGGCGCCCTTGCCTACTAGTGCATTTCTTTTTTCGGGTTCTTGTCTCGAcGAAATTTTAGCCTCATCGTAGTTTTTCACTCTGGTATCGATGAAAAAGGGAAGAGTAAAAAGTTTTCCGTTTAGTACTTAATGGGATTGGTTTGGGACGTATATATCGACTGGTGTTGTCTGTTATTCATCGTTGTTTTTCGGTTAGCTTCGAAAAAAAAATAGAGTAAAAACCAGGAATTTACCCTAAAAACAAGAAAAAATAAGATAAACGAAAAT
SEQ ID NO:111是终止子tTPI1的核酸序列
GATTAATATAATTATATAAAAATATTATCTTCTTTTCTTTATATCTAGTGTTATGTAAAATAAATTGATGACTACGGAAAGCTTTTTTATATTGTTTCTTTTTCATTCTGAGCCACTTAAATTTCGTGAATGTTCTTGTAAGGGACGGTAGATTTACAAGTGATACAACAAAAAGCAAGGCGCTTTTTCTAATAAAAAGAAGAAAAGCATTTAACAATTGAACACCTCTATATCAACGAAGAATATTACTTTGTCTCTAAATCCTTGTAAAATGTGTACGATCTCTATATGGGTTACTCA
SEQ ID NO:112是终止子tMET25的核酸序列
GTGTGCGTAATGAGTTGTAAAATTATGTATAAACCTACTTTCTCTCACAAGTACTATACTTTTATAAAACGAACTTTATTGAAATGAATATCCTTTTTTTCCCTTGTTACATGTCGTGACTCGTACTTTGAACCTAAATTGTTCTAACATCAAAGAACAGTGTTAATTCGCAGTCGAGAAGAAAAATATGGTGAACAAGACTCATCTACTTCATGAGACTACTTTACGCCTCCTATAAAGCTGTCACACTGGATAAATTTATTGTAGGACCAAGTTACAAAAGAGGATGATGGAGGTTT
SEQ ID NO:113是终止子tDIT1的核酸序列
TAAAGTAAGAGCGCTACATTGGTCTACCTTTTTGTTCTTTTACTTAAACATTAGTTAGTTCGTTTTCTTTTTCTCATTTTTTTATGTTTCCCCCCCAAAGTTCTGATTTTATAATATTTTATTTCACACAATTCCATTTAACAGAGGGGGAATAGATTCTTTAGCTTAGAAAATTAGTGATCAATATATATTTGCCTTTCTTTTCATCTTTTCAGTGATATTAATGGTTTCGAGACACTGCAATGGCCCTAGTTGTCTAAGAGGATAGATGTTACTGTCAAAGATGATATTTTGAATTTC
SEQ ID NO:114是终止子tRPL3的核酸序列
GAAGTTTTGTTAGAAAATAAATCATTTTTTAATTGAGCATTCTTATTCCTATTTTATTTAAATAGTTTTATGTATTGTTAGCTACATACAACAGTTTAAATCAAATTTTCTTTTTCCCAAGTCCAAAATGGAGGTTTATTTTGATGACCCGCATGCGATTATGTTTTGAAAGTATAAGACTACATACATGTACATATATTTAAACATGTAAACCCGTCCATTATATTGCTTACTTTCTTCTTTTTTGCCGTTTTGACTTGGACCTCTGGTTTGCTATTTCCTTACAATCTTTGCTACAAT
SEQ ID NO:115是终止子tRPL3.sm的核酸序列
GAAGTTTTTAAAGCATTTTTTAGACACTTCTCATTTTTCTAAGTTTTTTTAAAATAGTTTTATGTATTTACTACGTATCACAATTTGAAATAATTCATCTTCCCAAAAAACTAAGATTTTTATCCTTGTCACGATCCGTAACCAGTTTATAATATTTTAGAGCTTATACACGTACGTATACACACGTGTCGGTACATGAGAATTACGTTCAAAATTATTCACTTTTTTTTTCTCTGCCGTTTTACTTTTGAACTCTGTCTCGCTATTTCCTTACAATCTTCGCTACAATACCACTTGCCCTTGG
SEQ ID NO:116是终止子tRPL3.sba的核酸序列
GAAGTTTTCTGACAAAAACATAACGTTTTTTCCAATCATTTCTTATTTTTCCGGTTTATTTAAATAGTTTTTATGTACTATTATACGTATGACTATTTAACTTAAATTCTTCCTCCCAAGAAATCTCCCAAGTTTTTCATTATCATGGCATACACCACTATCAGTTACAAAATGGTAGCTCAACCATATATATATCTCTATATACACATATAAATGCAAACAGGTCCAAGTCACCGCTCACTGCAGTTTCTTTTGCCGTTTTGACTTCGATCTCTGCTTGGCTATTTTCTCACAATCCT
SEQ ID NO:117是终止子tRPL41B的核酸序列
GCGGATTGAGAGCAAATCGTTAAGTTCAGGTCAAGTAAAAATTGATTTCGAAAACTAATTTCTCTTATACAATCCTTTGATTGGACCGTCATCCTTTCGAATATAAGATTTTGTTAAGAATATTTTAGACAGAGATCTACTTTATATTTAATATCTAGATATTACATAATTTCCTCTCTAATAAAATATCATTAATAAAATAAAAATGAAGCGATTTGATTTTGTGTTGTCAACTTAGTTTGCCGCTATGCCTCTTGGGTAATGCTATTATTGAATCGAAGGGCTTTATTATATTACCCT
SEQ ID NO:118是终止子tRPL41B.Sba的核酸序列
GCGGATTGCGAGTGATTTTTTGAGTACAGACCAAGTAAAATTGATCTATGCATAATCTTTTCTCATCCACAATCCCTAGAATGGACCGTCATCCTTTCTAAAATGTTTTATTAAGAATATTTAAAGTGGAAGTCAGGTTTATATCTATCAATTAAATATTACATAATTTCCCCTTAATAAAATACTGTTAATAAAATAACGAAACGTTCATAGTTTTTCATAAATAGTCCTGATGCTTACTGCACCGGAACGTACTGTTTTAGTGTATTGCTCCCTTCATTGCCATTTTTCCTAGTTATTG
SEQ ID NO:119是终止子tRPL15A的核酸序列
GCTGGTTGATGGAAAATATAATTTTATTGGGCAAACTTTTGTTTATCTGATGTGTTTTATACTATTATCTTTTTAATTAATGATTCTATATACAAACCTGTATATTTTTTCTTTAACCAATTTTTTTTTTTATAGACCTAGAGCTGTACTTTTATTCTGCTATCAAGCAAACCCCTACCCCCTCTTCTCAATCCTCCCCTCAGGCAGAACTTATCTACCTGTATCAAGGAGCGGACGAGGGAGTCCTAATTGTTCTACGTATACCAATGCTAGCAGCTTACATAGGTGGTGGCACTACCA
SEQ ID NO:120是终止子tRPL15A.Sm的核酸序列
GCTAATTAGAACCATATATACATCGATAAAAACACTTGAATGTATTTTTCTTTTTCTTCTTATTTTTTCATTTTCCTTCGCTTTCTATTAGCGTGCGAATCTAAAGTGTGCAGCGCTATCTTTGACTCTTTTTTTCCTTTAGTGGGAACGAACAATATTAATCATGCCAAGTTAAGTCATTGAAGAAGTCAGTAGTATGTTATTCGGAGAGAAGACCCTGCTATGTATCTCAGCCTACCCAAAAAATGAATTGACTCCTCTCATAACTTGTTAATATTCGGATGAGCACATCACGTTCG
SEQ ID NO:121是终止子tRPL15A.sba的核酸序列
GCTGGCTGATGAAAAATATAGTTCTGTTGGGCAAGCATTTGTTTACCTAGCATCTCTTTTATACTATTATTATCTTTATATTTGATGATTTTATATACAAGTTGTATACCTTTTCTTTAACCAATTTTTTTTTTTCTAATGGTGCACCTAGAAGTACATTTTTTCTCACCAATAGATAGTCAAGATACTCCCAGCCTCTATGGCGTTACCACGGAGCCGACAAGGGAAAGCTGCTTATCTTACATATGCAGATGCCAAGGCCCGTTACAGGCCGCCTTATTGATGTTTAGAAATAGCTTC
SEQ ID NO:122是终止子tIDP1的核酸序列
TCGAATTTACGTAGCCCAATCTACCACTTTTTTTTTTCATTTTTTAAAGTGTTATACTTAGTTATGCTCTAGGATAATGAACTACTTTTTTTTTTTTTTTTTTACTGTTATCATAAATATATATACCTTATTGTTGTTTGCAACCGTCGGTTAATTCCTTATCAAGGTTCCCCAAGTTCGGATCATTACCATCAATTTCCAACATTTTCATGAGTTCTTCTTCTTCATTACCGTGTTTTAGGGGGCTGTTCGCACTTCTAATAGGGCTATCACCAAGCTGTTCTAATTCGTCCAAAAGTT
SEQ ID NO:123是终止子tIDP1.Sba的核酸序列
TCTGATCTTTGGAATGCTCCATTTACTTTTTTATTTCATATTTAGGTACGATATATAGTTACGCTTGAGAACTATGAACTAATAACTTCCTTTTTCTCTAATACATACTTACTTCAGCTGATGGTTGCAAACAACAATAAAATTCCTTGTCGAGGTTCCCTAAATTAGGATCATTGCCATCGACTTCTAACATTTTCATGAGATCCTCCTCTTCGTTCCCATTCTTTAAAAGACTGTTTCCACTTCTAATAGGGTTATCGCCCAATTGTTCTAGTTCGTCTAGCAATTCG
SEQ ID NO:124是终止子tTEF1.sba的核酸序列
GGAGATTGATAGGACTTTTCTAGTTGCATATCTTTTATTTTTAAATCTTATCTATTAGTTAATTTTTTGTAATTTATCCTTATATATATAGTTTGGTTATTCTAAAACATCATTTCAGTATCTAAAACCTCTCTTATTCATTACCTTTTTATTTAATGGTTTTTGCTACAGGCAAAAATTTAATGGTTTTTGCTACAGGCAAAAATCCCGCCGTGGACTTATTCCACGTTAACTCGGTTACAGGGTCATGAACCATTTTGTCAATTATCGAAATAACTTCTTCAAAAGTCCCTCTTACTT
SEQ ID NO:125是在5’添加的分泌序列的核酸序列
ATGCAATTTAGCACAGTCGCATCAGTAGCCTTCGTTGCCTTGGCCAACTTCGTGGCAGCA
SEQ ID NO:126是在N末端添加的分泌序列的氨基酸序列
MQFSTVASVAFVALANFVAA
SEQ ID NO:127是在3’添加的锚定序列的核酸序列
GGATCCGCCATTTCTCAAATCACTGACGGTCAAATCCAAGCTACTACCACTGCTACCACCGAAGCTACCACCACTGCTGCCCCATCTTCCACCGTTGAAACTGTTTCTCCATCCAGCACCGAAACTATCTCTCAACAAACTGAAAATGGTGCTGCTAAGGCCGCTGTCGGTATGGGTGCCGGTGCTCTAGCTGCTGCTGCTATGTTGTTATAA
SEQ ID NO:128是C末端添加的锚定序列的氨基酸序列
AISQITDGQIQATTTATTEATTTAAPSSTVETVSPSSTETISQQTENGAAKAAVGMGAGALAAAAMLL
序列表
<110> 奇华顿股份有限公司
<120> 生产软骨素的重组细胞
<130> PR92298/MGG
<150> EP21166740.7
<151> 2021-04-01
<160> 128
<170> BiSSAP 1.3.6
<210> 1
<211> 2919
<212> DNA
<213> 其他序列
<220>
<223> 具有软骨素合酶活性的多肽的重编码核酸序列(HCOS-1)
<400> 1
atgaacaccc tttcccaggc aattaaggct tataatagta atgattatca actagccctc 60
aagctgttcg aaaagtcggc agaaatctac ggcagaaaga tagttgagtt ccaaattacg 120
aagtgcaagg agaaactttc tgcgcaccca tccgttaaca gtgcgcatct ctcggttaac 180
aaagaagaga aggtgaatgt ttgcgacagt ccattagaca tagccactca attattgtta 240
tcgaatgtga aaaaactcgt ccttagtgat agcgagaaaa atacactaaa gaataaatgg 300
aagttgttga ctgaaaagaa gtctgagaac gcagaggtcc gggccgtagc tttagttccc 360
aaggactttc cgaaagattt agtgcttgcg ccgttaccag accatgtgaa cgattttacg 420
tggtataaga agcggaagaa acgcctagga atcaaaccag aacaccaaca cgttggcctc 480
tccattattg tgacaacgtt caaccgtcct gccatcctca gcatcaccct ggcttgcctc 540
gtcaatcaaa agacccatta tccttttgag gtgatcgtga ccgacgatgg ttctcaagag 600
gatttatcgc ctataatccg tcaatatgag aacaagctag acatccgtta tgttcggcaa 660
aaggactatg ggtatcagct gtgcgccgtt agaaaccttg gtctaaggac agcgaagtat 720
gactttgtct ctatcttgga ttgcgacatg gccccgcagc agctatgggt tcactcttac 780
cttacagaac tattagagga cgatgatttg accataatag gccccaggaa gtacattgac 840
acgcaacaca tagatcccaa ggatttcctt aataacgcct ctctgttaga gtcgttgcca 900
gaggttaaga ccaataattc cgtcgcggct aagggcgagg ggaccgtatc tttagactgg 960
cgtttggaac aatttgagaa gaccgagaac ttgaggctat ccgatagccc tttccgattc 1020
ttcgcagctg ggaatgtggc tttcgccaag aagtggctta acaagtcagg attcttcgac 1080
gaggaattca atcactgggg aggtgaagat gtagagttcg gttatcgtct gtttcggtac 1140
ggttcgttct tcaaaactat agacggcatc atggcctatc atcaggaacc gccaggtaaa 1200
gaaaacgaaa ctgacagaga agcgggcaag aacattaccc tcgatataat gagggagaag 1260
gtgccttaca tctaccgtaa actcctgcct atagaagaca gtcatatcaa ccgagtacca 1320
ttggtatcaa tttacatccc ggcctacaac tgtgctaact atattcaaag atgtgttgat 1380
tcagctttga atcaaacggt agttgatctc gaagtgtgca tttgcaacga cggtagtact 1440
gacaacacgc tggaagttat taacaagctg tatggtaata atccgcgtgt gcgtataatg 1500
tctaaaccca atggcggcat tgcgagtgca tccaacgcag cggtcagctt cgcaaagggt 1560
tattacatag gacagttgga cagcgacgat tacttagaac ccgacgcagt ggagttatgt 1620
ctcaaggaat ttcttaagga taagaccctt gcgtgcgttt acaccactaa tcgtaacgtc 1680
aacccagatg gctctttaat agccaatggc tataactggc cagagttcag tcgtgagaag 1740
ttgactacgg ccatgattgc tcatcacttc cggatgttta ccattcgtgc ttggcatctg 1800
acggatgggt tcaatgagaa gattgagaac gctgttgact acgacatgtt tctcaagctc 1860
agtgaagttg gtaaatttaa gcatctgaac aaaatatgtt ataatcgggt gttacacggc 1920
gataacacct caatcaagaa gcttggcata caaaagaaga atcatttcgt agttgtcaat 1980
cagtctctaa accgccaagg tataacttat tataactacg atgaatttga tgatctcgat 2040
gagagtcgga aatacatttt caacaagact gcagagtatc aagaagagat agatattctt 2100
aaagatatta agatcattca gaacaaagac gccaaaatag ctgtctccat tttctatccg 2160
aacactctaa acgggttggt gaagaagcta aataatatta tagagtataa taagaatatc 2220
ttcgttattg tacttcatgt cgataagaat cacttaaccc cagacatcaa gaaggagata 2280
ttagccttct accataagca tcaggtgaac atcttattga acaatgacat ctcctactat 2340
acatcaaatc gtctgattaa gacagaagcc catttgagta acattaacaa gctaagtcaa 2400
ttaaatctta actgcgaata cattatattc gacaatcacg attccttatt tgtgaagaac 2460
gattcctatg catacatgaa gaagtatgat gttggaatga acttctctgc attgactcat 2520
gattggattg aaaagataaa cgctcacccg ccatttaaga agctgatcaa aacttacttc 2580
aatgacaatg atcttaagtc gatgaatgta aagggtgcct cccagggaat gtttatgaca 2640
tacgcattag cccacgagtt attgacgatc atcaaggagg tgataacctc ttgtcaatcc 2700
attgactccg tccccgaata caacacagaa gatatttggt ttcagtttgc acttttaatt 2760
ctggaaaaga agaccggcca cgtattcaac aagacaagca ctctcacgta tatgccatgg 2820
gaacgtaaac tgcagtggac gaatgaacaa atagagtccg caaagagggg cgaaaacatt 2880
ccggtaaaca agttcatcat taacagcatt accctttaa 2919
<210> 2
<211> 2919
<212> DNA
<213> 其他序列
<220>
<223> 具有软骨素合酶活性的多肽的重编码核酸序列(HCOS1-2)
<400> 2
atgaacaccc tttcccaggc aattaaggct tataatagta atgattatca actagccctc 60
aagctgttcg aaaagtcggc agaaatctac ggcagaaaga tagttgagtt ccaaattacg 120
aagtgcaagg agaaactttc tgcgcaccca tccgttaaca gtgcgcatct ctcggttaac 180
aaagaagaga aggtgaatgt ttgcgacagt ccattagaca tagccactca attattgtta 240
tcgaatgtga aaaaactcgt ccttagtgat agcgagaaaa atacactaaa gaataaatgg 300
aagttgttga ctgaaaagaa gtctgagaac gcagaggtcc gggccgtagc tttagttccc 360
aaggactttc cgaaagattt agtgcttgcg ccgttaccag accatgtgaa cgattttacg 420
tggtataaga agcggaagaa acgcctagga atcaaaccag tgaacaagaa catcgggttg 480
tcaatcataa tcccaacttt caatcgtagt aggatattag acatcaccct ggcttgcctc 540
gtcaatcaaa agacccatta tccttttgag gtgatcgtga ccgacgatgg ttctcaagag 600
gatttatcgc ctataatccg tcaatatgag aacaagctag acatccgtta tgttcggcaa 660
aaggactatg ggtatcagct gtgcgccgtt agaaaccttg gtctaaggac agcgaagtat 720
gactttgtct ctatcttgga ttgcgacatg gccccgcagc agctatgggt tcactcttac 780
cttacagaac tattagagga cgatgatttg accataatag gccccaggaa gtacattgac 840
acgcaacaca tagatcccaa ggatttcctt aataacgcct ctctgttaga gtcgttgcca 900
gaggttaaga ccaataattc cgtcgcggct aagggcgagg ggaccgtatc tttagactgg 960
cgtttggaac aatttgagaa gaccgagaac ttgaggctat ccgatagccc tttccgattc 1020
ttctcatgcg gaaatgtggc cttctccaaa gagtggctga acaaagttgg ctggttcgac 1080
gaggaattca atcactgggg aggtgaagat gtagagttcg gttatcgtct gtttcggtac 1140
ggttcgttct tcaaaactat agacggcatc atggcctatc atcaggaacc gccaggtaaa 1200
gaaaacgaaa ctgacagaga agcgggcaag aacattaccc tcgatataat gagggagaag 1260
gtgccttaca tctaccgtaa actcctgcct atagaagaca gtcatatcaa ccgagtacca 1320
ttggtatcaa tttacatccc ggcctacaac tgtgctaact atattcaaag atgtgttgat 1380
tcagctttga atcaaacggt agttgatctc gaagtgtgca tttgcaacga cggtagtact 1440
gacaacacgc tggaagttat taacaagctg tatggtaata atccgcgtgt gcgtataatg 1500
tctaaaccca atggcggcat tgcgagtgca tccaacgcag cggtcagctt cgcaaagggt 1560
tattacatag gacagttgga cagcgacgat tacttagaac ccgacgcagt ggagttatgt 1620
ctcaaggaat ttcttaagga taagaccctt gcgtgcgttt acaccactaa tcgtaacgtc 1680
aacccagatg gctctttaat agccaatggc tataactggc cagagttcag tcgtgagaag 1740
ttgactacgg ccatgattgc tcatcacttc cggatgttta ccattcgtgc ttggcatctg 1800
acggatgggt tcaatgagaa gattgagaac gctgttgact acgacatgtt tctcaagctc 1860
agtgaagttg gtaaatttaa gcatctgaac aaaatatgtt ataatcgggt gttacacggc 1920
gataacacct caatcaagaa gcttggcata caaaagaaga atcatttcgt agttgtcaat 1980
cagtctctaa accgccaagg tataacttat tataactacg atgaatttga tgatctcgat 2040
gagagtcgga aatacatttt caacaagact gcagagtatc aagaagagat agatattctt 2100
aaagatatta agatcattca gaacaaagac gccaaaatag ctgtctccat tttctatccg 2160
aacactctaa acgggttggt gaagaagcta aataatatta tagagtataa taagaatatc 2220
ttcgttattg tacttcatgt cgataagaat cacttaaccc cagacatcaa gaaggagata 2280
ttagccttct accataagca tcaggtgaac atcttattga acaatgacat ctcctactat 2340
acatcaaatc gtctgattaa gacagaagcc catttgagta acattaacaa gctaagtcaa 2400
ttaaatctta actgcgaata cattatattc gacaatcacg attccttatt tgtgaagaac 2460
gattcctatg catacatgaa gaagtatgat gttggaatga acttctctgc attgactcat 2520
gattggattg aaaagataaa cgctcacccg ccatttaaga agctgatcaa aacttacttc 2580
aatgacaatg atcttaagtc gatgaatgta aagggtgcct cccagggaat gtttatgaca 2640
tacgcattag cccacgagtt attgacgatc atcaaggagg tgataacctc ttgtcaatcc 2700
attgactccg tccccgaata caacacagaa gatatttggt ttcagtttgc acttttaatt 2760
ctggaaaaga agaccggcca cgtattcaac aagacaagca ctctcacgta tatgccatgg 2820
gaacgtaaac tgcagtggac gaatgaacaa atagagtccg caaagagggg cgaaaacatt 2880
ccggtaaaca agttcatcat taacagcatt accctttaa 2919
<210> 3
<211> 2919
<212> DNA
<213> 其他序列
<220>
<223> 具有软骨素合酶活性的多肽的重编码核酸序列(HCOS1-3)
<400> 3
atgaacaccc tttcccaggc aattaaggct tataatagta atgattatca actagccctc 60
aagctgttcg aaaagtcggc agaaatctac ggcagaaaga tagttgagtt ccaaattacg 120
aagtgcaagg agaaactttc tgcgcaccca tccgttaaca gtgcgcatct ctcggttaac 180
aaagaagaga aggtgaatgt ttgcgacagt ccattagaca tagccactca attattgtta 240
tcgaatgtga aaaaactcgt ccttagtgat agcgagaaaa atacactaaa gaataaatgg 300
aagttgttga ctgaaaagaa gtctgagaac gcagaggtcc gggccgtagc tttagtccca 360
aaggattttc ccaaagactt agttttagcg ccactaccag accatgtgaa cgattttacc 420
tggtacaaga atagaaagaa gagcctgggc ataaagcctg tgaacaagaa catcgggttg 480
tcaatcataa tcccaacttt caatcgtagt aggatattag acattaccct ggcgtgtcta 540
gttaatcaga aaactaacta tccgtttgag gtggttgttg cagatgatgg gtcgaaggaa 600
aatctattga ctatagttca gaaatacgag cagaaactag acattaagta tgtgagacag 660
aaggactatg ggtatcagct gtgcgccgtt agaaaccttg gtctaaggac agcgaagtat 720
gactttgtct ctatcttgga ttgcgacatg gccccgcagc agctatgggt tcactcttac 780
cttacagagt tactggaaga caacgacatc gtcttgatcg ggccaaggaa atacgttgat 840
acccacaaca tcacggctga gcagtttctg aacgacccat atttaattga gagtttaccg 900
gaaaccgcca caaacaataa tccatcgatt accagtaagg gtaacatctc attagattgg 960
agattagaac attttaagaa gacagacaac ctaagactat gcgactcccc gttcaggtat 1020
ttctcatgcg gaaatgtggc cttctccaaa gagtggctga acaaagttgg ctggttcgac 1080
gaagaattta atcactgggg cggcgaagac gtcgaattcg gctacaggtt atttgcaaaa 1140
gggtgcttct ttagggttat cgacggtggt atggcctacc atcaagagcc accaggaaag 1200
gagaacgaaa cggatcgtga ggccggtaag tctatcactc ttaaaatagt aaaggagaaa 1260
gtgccctaca tctacaggaa gttgttgccg attgaggact cccacataaa ccgagtacca 1320
ttggtatcaa tttacatccc ggcctacaac tgtgctaact atattcaaag atgtgttgat 1380
tcagctttga atcaaacggt agttgatctc gaagtgtgca tttgcaacga cggtagtact 1440
gacaacacgc tggaagttat taacaagctg tatggtaata atccgcgtgt gcgtataatg 1500
tctaaaccca atggcggcat tgcgagtgca tccaacgcag cggtcagctt cgcaaagggt 1560
tattacatag gacagttgga cagcgacgat tacttagaac ccgacgcagt ggagttatgt 1620
ctcaaggaat ttcttaagga taagaccctt gcgtgcgttt acaccactaa tcgtaacgtc 1680
aacccagatg gctctttaat agccaatggc tataactggc cagagttcag tcgtgagaag 1740
ttgactacgg ccatgattgc tcatcacttc cggatgttta ccattcgtgc ttggcatctg 1800
acggatgggt tcaatgagaa gattgagaac gctgttgact acgacatgtt tctcaagctc 1860
agtgaagttg gtaaatttaa gcatctgaac aaaatatgtt ataatcgggt gttacacggc 1920
gataacacct caatcaagaa gcttggcata caaaagaaga atcatttcgt agttgtcaat 1980
cagtctctaa accgccaagg tataacttat tataactacg atgaatttga tgatctcgat 2040
gagagtcgga aatacatttt caacaagact gcagagtatc aagaagagat agatattctt 2100
aaagatatta agatcattca gaacaaagac gccaaaatag ctgtctccat tttctatccg 2160
aacactctaa acgggttggt gaagaagcta aataatatta tagagtataa taagaatatc 2220
ttcgttattg tacttcatgt cgataagaat cacttaaccc cagacatcaa gaaggagata 2280
ttagccttct accataagca tcaggtgaac atcttattga acaatgacat ctcctactat 2340
acatcaaatc gtctgattaa gacagaagcc catttgagta acattaacaa gctaagtcaa 2400
ttaaatctta actgcgaata cattatattc gacaatcacg attccttatt tgtgaagaac 2460
gattcctatg catacatgaa gaagtatgat gttggaatga acttctctgc attgactcat 2520
gattggattg aaaagataaa cgctcacccg ccatttaaga agctgatcaa aacttacttc 2580
aatgacaatg atcttaagtc gatgaatgta aagggtgcct cccagggaat gtttatgaca 2640
tacgcattag cccacgagtt attgacgatc atcaaggagg tgataacctc ttgtcaatcc 2700
attgactccg tccccgaata caacacagaa gatatttggt ttcagtttgc acttttaatt 2760
ctggaaaaga agaccggcca cgtattcaac aagacaagca ctctcacgta tatgccatgg 2820
gaacgtaaac tgcagtggac gaatgaacaa atagagtccg caaagagggg cgaaaacatt 2880
ccggtaaaca agttcatcat taacagcatt accctttaa 2919
<210> 4
<211> 3072
<212> DNA
<213> 其他序列
<220>
<223> 具有软骨素合酶活性的多肽的核酸序列(HCOS.Sc)
<400> 4
atgaacaccc tttcccaggc aattaaggct tataatagta atgattatca actagccctc 60
aagctgttcg aaaagtcggc agaaatctac ggcagaaaga tagttgagtt ccaaattacg 120
aagtgcaagg agaaactttc tgcgcaccca tccgttaaca gtgcgcatct ctcggttaac 180
aaagaagaga aggtgaatgt ttgcgacagt ccattagaca tagccactca attattgtta 240
tcgaatgtga aaaaactcgt ccttagtgat agcgagaaaa atacactaaa gaataaatgg 300
aagttgttga ctgaaaagaa gtctgagaac gcagaggtcc gggccgtagc tttagtccca 360
aaggattttc ccaaagactt agttttagcg ccactaccag accatgtgaa cgattttacc 420
tggtacaaga atagaaagaa gagcctgggc ataaagcctg tgaacaagaa catcgggttg 480
tcaatcataa tcccaacttt caatcgtagt aggatattag acattaccct ggcgtgtcta 540
gttaatcaga aaactaacta tccgtttgag gtggttgttg cagatgatgg gtcgaaggaa 600
aatctattga ctatagttca gaaatacgag cagaaactag acattaagta tgtgagacag 660
aaggactatg ggtatcagct gtgcgccgtt agaaaccttg gtctaaggac agcgaagtat 720
gactttgtct ctatcttgga ttgcgacatg gccccgcagc agctatgggt tcactcttac 780
cttacagagt tactggaaga caacgacatc gtcttgatcg ggccaaggaa atacgttgat 840
acccacaaca tcacggctga gcagtttctg aacgacccat atttaattga gagtttaccg 900
gaaaccgcca caaacaataa tccatcgatt accagtaagg gtaacatctc attagattgg 960
agattagaac attttaagaa gacagacaac ctaagactat gcgactcccc gttcaggtat 1020
ttctcatgcg gaaatgtggc cttctccaaa gagtggctga acaaagttgg ctggttcgac 1080
gaagaattta atcactgggg cggcgaagac gtcgaattcg gctacaggtt atttgcaaaa 1140
gggtgcttct ttagggttat cgacggtggt atggcctacc atcaagagcc accaggaaag 1200
gagaacgaaa cggatcgtga ggccggtaag tctatcactc ttaaaatagt aaaggagaaa 1260
gtgccctaca tctacaggaa gttgttgccg attgaggact cccacataaa ccgagtacca 1320
ttggtatcaa tttacatccc ggcctacaac tgtgctaact atattcaaag atgtgttgat 1380
tcagctttga atcaaacggt agttgatctc gaagtgtgca tttgcaacga cggtagtact 1440
gacaacacgc tggaagttat taacaagctg tatggtaata atccgcgtgt gcgtataatg 1500
tctaaaccca atggcggcat tgcgagtgca tccaacgcag cggtcagctt cgcaaagggt 1560
tattacatag gacagttgga cagcgacgat tacttagaac ccgacgcagt ggagttatgt 1620
ctcaaggaat ttcttaagga taagaccctt gcgtgcgttt acaccactaa tcgtaacgtc 1680
aacccagatg gctctttaat agccaatggc tataactggc cagagttcag tcgtgagaag 1740
ttgactacgg ccatgattgc tcatcacttc cggatgttta ccattcgtgc ttggcatctg 1800
acggatgggt tcaatgagaa gattgagaac gctgttgact acgacatgtt tctcaagctc 1860
agtgaagttg gtaaatttaa gcatctgaac aaaatatgtt ataatcgggt gttacacggc 1920
gataacacct caatcaagaa gcttggcata caaaagaaga atcatttcgt agttgtcaat 1980
cagtctctaa accgccaagg tataacttat tataactacg atgaatttga tgatctcgat 2040
gagagtcgga aatacatttt caacaagact gcagagtatc aagaagagat agatattctt 2100
aaagatattt ttattcagat gcttttttcc tggttttcta ttgcaaattt cgttcttacc 2160
ttttattatt tagcaggatc aatgaattta gttattaaac atggtgaggc cttattcatt 2220
ttttttaaat acctgatctt ttgtgacttg gcaagtttat tcattatttc catgggtaat 2280
agaccccagg gcgcgaaaca tttattcatt acctccatgg ttatactgtc tatatgtgcc 2340
acatattctc taatttgtgg gtttgttttt gctttcaagt cgttagcttc tggaacggaa 2400
tcccacaaaa tatttgtcga catcgttatc tcattgctct ccacctatgg cctatacttt 2460
ttctcatcac tgatgtacct agatccttgg cacatgttta catcatccat acaatacttt 2520
ttgacacttc ccgcctttac gtgtacttta cagatttttg ccttctgtaa tacacacgac 2580
gtttcctggg gtactaaagg ttccacacag gagtccaagc aattgtccaa ggccattgtc 2640
gttcaaggtc cagatgggaa acagattgtg gaaacagatt ggcctcagga agttgataag 2700
aagtttttgg aaataaaaag tcgtttgaaa gaaccagaat ttgaagaatc aagcggcaat 2760
gaaaaacaat ccaagaatga ttattataga gatataagaa ccagaattgt gatgatttgg 2820
atgctatcaa atctaatact gatcatgtct ataattcaag tctttacacc acaagatact 2880
gacaatggtt atttgatatt cattttatgg tctgtggccg ctttagctgc ctttagggtg 2940
gttggttcca tggccttttt gttcatgaaa tacttgcgta taatagtgag ttacagaaat 3000
aaagttgaag gtagcggctc atgggaagtc tctaaattag acttaccaaa tgttttccac 3060
aaaaagggct aa 3072
<210> 5
<211> 3072
<212> DNA
<213> 其他序列
<220>
<223> 具有软骨素合酶活性的多肽的核酸序列(HHASA.Sc)
<400> 5
atgaacaccc tttcccaggc aattaaggct tataatagta atgattatca actagccctc 60
aagctgttcg aaaagtcggc agaaatctac ggcagaaaga tagttgagtt ccaaattacg 120
aagtgcaagg agaaactttc tgcgcaccca tccgttaaca gtgcgcatct ctcggttaac 180
aaagaagaga aggtgaatgt ttgcgacagt ccattagaca tagccactca attattgtta 240
tcgaatgtga aaaaactcgt ccttagtgat agcgagaaaa atacactaaa gaataaatgg 300
aagttgttga ctgaaaagaa gtctgagaac gcagaggtcc gggccgtagc tttagttccc 360
aaggactttc cgaaagattt agtgcttgcg ccgttaccag accatgtgaa cgattttacg 420
tggtataaga agcggaagaa acgcctagga atcaaaccag aacaccaaca cgttggcctc 480
tccattattg tgacaacgtt caaccgtcct gccatcctca gcatcaccct ggcttgcctc 540
gtcaatcaaa agacccatta tccttttgag gtgatcgtga ccgacgatgg ttctcaagag 600
gatttatcgc ctataatccg tcaatatgag aacaagctag acatccgtta tgttcggcaa 660
aaggacaacg gttttcaggc atcggccgca cgtaatatgg gcctacgtct agccaaatat 720
gacttcattg ggctccttga ttgtgatatg gctcccaacc ctttgtgggt acactcatac 780
gttgcggaac tattagagga cgatgatttg accataatag gccccaggaa gtacattgac 840
acgcaacaca tagatcccaa ggatttcctt aataacgcct ctctgttaga gtcgttgcca 900
gaggttaaga ccaataattc cgtcgcggct aagggcgagg ggaccgtatc tttagactgg 960
cgtttggaac aatttgagaa gaccgagaac ttgaggctat ccgatagccc tttccgattc 1020
ttcgcagctg ggaatgtggc tttcgccaag aagtggctta acaagtcagg attcttcgac 1080
gaggaattca atcactgggg aggtgaagat gtagagttcg gttatcgtct gtttcggtac 1140
ggttcgttct tcaaaactat agacggcatc atggcctatc atcaggaacc gccaggtaaa 1200
gaaaacgaaa ctgacagaga agcgggcaag aacattaccc tcgatataat gagggagaag 1260
gtgccttaca tctaccgtaa actcctgcct atagaagaca gtcatatcaa ccgagtacca 1320
ttggtatcaa tttacatccc ggcctacaac tgtgctaact atattcaaag atgtgttgat 1380
tcagctttga atcaaacggt agttgatctc gaagtgtgca tttgcaacga cggtagtact 1440
gacaacacgc tggaagttat taacaagctg tatggtaata atccgcgtgt gcgtataatg 1500
tctaaaccca atggcggcat tgcgagtgca tccaacgcag cggtcagctt cgcaaagggt 1560
tattacatag gacagttgga cagcgacgat tacttagaac ccgacgcagt ggagttatgt 1620
ctcaaggaat ttcttaagga taagaccctt gcgtgcgttt acaccactaa tcgtaacgtc 1680
aacccagatg gctctttaat agccaatggc tataactggc cagagttcag tcgtgagaag 1740
ttgactacgg ccatgattgc tcatcacttc cggatgttta ccattcgtgc ttggcatctg 1800
acggatgggt tcaatgagaa gattgagaac gctgttgact acgacatgtt tctcaagctc 1860
agtgaagttg gtaaatttaa gcatctgaac aaaatatgtt ataatcgggt gttacacggc 1920
gataacacct caatcaagaa gcttggcata caaaagaaga atcatttcgt agttgtcaat 1980
cagtctctaa accgccaagg tataacttat tataactacg atgaatttga tgatctcgat 2040
gagagtcgga aatacatttt caacaagact gcagagtatc aagaagagat agatattctt 2100
aaagatattt ttattcagat gcttttttcc tggttttcta ttgcaaattt cgttcttacc 2160
ttttattatt tagcaggatc aatgaattta gttattaaac atggtgaggc cttattcatt 2220
ttttttaaat acctgatctt ttgtgacttg gcaagtttat tcattatttc catgggtaat 2280
agaccccagg gcgcgaaaca tttattcatt acctccatgg ttatactgtc tatatgtgcc 2340
acatattctc taatttgtgg gtttgttttt gctttcaagt cgttagcttc tggaacggaa 2400
tcccacaaaa tatttgtcga catcgttatc tcattgctct ccacctatgg cctatacttt 2460
ttctcatcac tgatgtacct agatccttgg cacatgttta catcatccat acaatacttt 2520
ttgacacttc ccgcctttac gtgtacttta cagatttttg ccttctgtaa tacacacgac 2580
gtttcctggg gtactaaagg ttccacacag gagtccaagc aattgtccaa ggccattgtc 2640
gttcaaggtc cagatgggaa acagattgtg gaaacagatt ggcctcagga agttgataag 2700
aagtttttgg aaataaaaag tcgtttgaaa gaaccagaat ttgaagaatc aagcggcaat 2760
gaaaaacaat ccaagaatga ttattataga gatataagaa ccagaattgt gatgatttgg 2820
atgctatcaa atctaatact gatcatgtct ataattcaag tctttacacc acaagatact 2880
gacaatggtt atttgatatt cattttatgg tctgtggccg ctttagctgc ctttagggtg 2940
gttggttcca tggccttttt gttcatgaaa tacttgcgta taatagtgag ttacagaaat 3000
aaagttgaag gtagcggctc atgggaagtc tctaaattag acttaccaaa tgttttccac 3060
aaaaagggct aa 3072
<210> 6
<211> 1719
<212> DNA
<213> 其他序列
<220>
<223> 具有软骨素合酶活性的多肽的核酸序列(HCOS1-Vir)
<400> 6
atgggtaaga acatcattat tatggtttct tggtacacta ttattacatc caatctcatc 60
gcagtgggtg gcgcctcact catactagcc ccagctatta cgggctatgt ccttcactgg 120
aacattgccc tttcaacaat ttggggagtg tcggcctacg gaattttcgt gtttggtttc 180
tttcttgccc aggtattatt tagtgaactc aaccggaaaa ggctccggaa gtggatttcc 240
ctccgaccca aagggtggaa tgatgttagg ttggctgtaa ttattgccgg ctaccgtgag 300
gacccgtata tgttccaaaa gtgtcttgaa agtgtgcgtg actcagacta tgggaatgta 360
gctagactaa tatgcgttat tgacggcgat gaagacgacg acatgaggat ggctgcagtg 420
tacaaggcta tctataacga caacatcaag aaacctgagt ttgtcctctg tgagagtgac 480
gataaggagg gtgagagaat agatagcgat ttcagccgtg atatctgcgt gctgcaaccg 540
catcgcggaa agcgtgaatg tttgtacaca gggttccaat tggcaaagat ggacccctca 600
gttaatgccg tcgtcctaat cgacagtgac actgtgttag aaaaggacgc gattctcgaa 660
gtagtatacc cgctggcatg cgatccagaa atacaggctg tagcaggcga atgcaaaata 720
tggaatactg acacactgtt gagtttgctg gtagcctggc gatattacag cgcattttgc 780
gtagagcgta gcgcccaatc attcttcagg acagtacaat gcgtcggagg acctctcggc 840
gcctacaaga ttgatataat taaggaaatc aaggacccat ggatcagcca acgtttcctt 900
ggccaaaagt gcacatacgg cgacgataga cgactcacta atgaaatact aatgaggggt 960
aagaaagtag ttttcacccc attcgctgtt ggctggggat ggttcgacga ggagttcaca 1020
cactggggtg gccgttacat tgtacagcaa acacggtggt ccaagtcgtg gtgtagggag 1080
atatggtata cactgtttgc agcatggaag catggacttt cgggcatttg gctcgcattc 1140
gagtgcttat accagattac ttatttcttc ctggtgattt acctattctc ccgtttggct 1200
gttgaggctg acccacgggc gcaaacggcc accgtcattg tttcgaccac agttgcgctt 1260
attaagtgcg gttactttag cttcagagct aaagacatta gggccttcta tttcgtcctc 1320
tacacgttcg tttacttctt ctgcatgatt ccggcacgaa taactgcgat gatgaccctg 1380
tgggacatag gttggggaac caggggagga aatgagaagc cttccgtagg caccagagtt 1440
gctttgtggg ccaagcaata tttgattgct tacatgtggt gggccgctgt cgtcggtgct 1500
ggcgtgtact ccatcgttca taattggatg tttgactgga attcactttc ctacaggttc 1560
gcactggtag gcatctgttc gtatatagtt ttcattgtaa tagtgctggt agtctacttt 1620
acaggaaaga tcacgacctg gaacttcacg aagctacaga aagaattgat cgaggaccgc 1680
gtactgtacg acgcaacgac caatgcccag tcggtataa 1719
<210> 7
<211> 1716
<212> DNA
<213> 其他序列
<220>
<223> 具有软骨素合酶活性的多肽的重编码核酸序列(HCOS2-Vir)
<400> 7
atgggtaaga acatcattat tatggtttct tggtacacta ttattacatc caatctcatc 60
gcagtgggtg gcgcctcact catactagcc ccagctatta cgggctatgt ccttcactgg 120
aacattgccc tttcaacaat ttggggagtg tcggcctacg gaattttcgt gtttggtttc 180
tttcttgccc aggtattatt tagtgaactc aaccggaaaa ggctccggaa gtggatttcc 240
ctccgaccca aagggtggaa tgatgttagg ttggctgtaa ttattgccgg ctaccgtgag 300
gacccgtata tgttccaaaa gtgtcttgaa agtgtgcgtg actcagacta tgggaatgta 360
gctagactaa tatgcgttat tgacggcgat gaagacgacg acatgaggat ggctgcagtg 420
tacaaggcta tctataacga caacatcaag aaacctgagt ttgtcctctg tgagagtgac 480
gataaggagg gtgagagaat agatagcgat ttcagccgtg atatctgcgt gctgcaaccg 540
catcgcggaa agcgtgaatg tttgtacaca gggttccaat tggcaaagat ggacccctca 600
gttaatgccg tcgtcctaat cgacagtgac actgtgttag aaaaggacgc gattctcgaa 660
gtagtatacc cgctggcatg cgatccagaa atacaggctg tagcaggcga atgcaaaata 720
tggaatactg acacactgtt gagtttgctg gtagcctggc gatattacag cgcattttgc 780
gtagagcgta gcgcccaatc attcttcagg acagtacaat gcgtcggagg acctctcggc 840
gcctacaaga ttgatataat taaggaaatc aaggacccat ggatcagcca acgtttcctt 900
ggccaaaagt gcacatacgg cgacgataga cgactcacta atgaaatact aatgaggggt 960
aagaaagtag ttttcacccc attcgctgtt ggctggctac acggtgagaa tacgtctatc 1020
aagaagttac gttacattgt acagcaaaca cggtggtcca agtcgtggtg tagggagata 1080
tggtatacac tgtttgcagc atggaagcat ggactttcgg gcatttggct cgcattcgag 1140
tgcttatacc agattactta tttcttcctg gtgatttacc tattctcccg tttggctgtt 1200
gaggctgacc cacgggcgca aacggccacc gtcattgttt cgaccacagt tgcgcttatt 1260
aagtgcggtt actttagctt cagagctaaa gacattaggg ccttctattt cgtcctctac 1320
acgttcgttt acttcttctg catgattccg gcacgaataa ctgcgatgat gaccctgtgg 1380
gacataggtt ggggaaccag gggaggaaat gagaagcctt ccgtaggcac cagagttgct 1440
ttgtgggcca agcaatattt gattgcttac atgtggtggg ccgctgtcgt cggtgctggc 1500
gtgtactcca tcgttcataa ttggatgttt gactggaatt cactttccta caggttcgca 1560
ctggtaggca tctgttcgta tatagttttc attgtaatag tgctggtagt ctactttaca 1620
ggaaagatca cgacctggaa cttcacgaag ctacagaaag aattgatcga ggaccgcgta 1680
ctgtacgacg caacgaccaa tgcccagtcg gtataa 1716
<210> 8
<211> 1719
<212> DNA
<213> 其他序列
<220>
<223> 具有软骨素合酶活性的多肽的重编码核酸序列(HCOS3-Vir)
<400> 8
atgggtaaga acatcattat tatggtttct tggtacacta ttattacatc caatctcatc 60
gcagtgggtg gcgcctcact catactagcc ccagctatta cgggctatgt ccttcactgg 120
aacattgccc tttcaacaat ttggggagtg tcggcctacg gaattttcgt gtttggtttc 180
tttcttgccc aggtattatt tagtgaactc aaccggaaaa ggctccggaa gtggatttcc 240
ctccgaccca aagggtggaa tgatgttagg ttggctgtaa ttattgccgg ctaccgtgag 300
gacccgtata tgttccaaaa gtgtcttgaa agtgtgcgtg actcagacta tgggaatgta 360
gctagactaa tatgcgttat tgacggcgat gaagacgacg acatgaggat ggctgcagtg 420
tacaaggcta tctataacga caacatcaag aaacctgagt ttgtcctctg tgagagtgac 480
gataaggagg gtgagagaat agatagcgat ttcagccgtg atatctgcgt gctgcaaccg 540
catcgcggaa agcgtgaatg tttgtacaca gggttccaat tggcaaagat ggacccctca 600
gttaatgccg tcgtcctaat cgacagtgac actgtgttag aaaaggacgc gattctcgaa 660
gtagtatacc cgctggcatg cgatccagaa atacaggctg tagcaggcga atgcaaaata 720
tggaatactg acacactgtt gagtttgctg gtagcctggc gatattacag cgcattttgc 780
gtagagcgta gcgcccaatc attcttcagg acagtacaat gcgtcggagg acctctcggc 840
gcctacaaga ttgatataat taaggaaatc aaggacccat ggatcagcca acgtttcctt 900
ggccaaaagt gcacatacgg cgacgataga cgactcacta atgaaatact aatgaggggt 960
aagaaagtag ttttcacccc attcgctgtt ggctggcaca tggcatggtc cgacaaggac 1020
gacgcaatcg accgttacat tgtacagcaa acacggtggt ccaagtcgtg gtgtagggag 1080
atatggtata cactgtttgc agcatggaag catggacttt cgggcatttg gctcgcattc 1140
gagtgcttat accagattac ttatttcttc ctggtgattt acctattctc ccgtttggct 1200
gttgaggctg acccacgggc gcaaacggcc accgtcattg tttcgaccac agttgcgctt 1260
attaagtgcg gttactttag cttcagagct aaagacatta gggccttcta tttcgtcctc 1320
tacacgttcg tttacttctt ctgcatgatt ccggcacgaa taactgcgat gatgaccctg 1380
tgggacatag gttggggaac caggggagga aatgagaagc cttccgtagg caccagagtt 1440
gctttgtggg ccaagcaata tttgattgct tacatgtggt gggccgctgt cgtcggtgct 1500
ggcgtgtact ccatcgttca taattggatg tttgactgga attcactttc ctacaggttc 1560
gcactggtag gcatctgttc gtatatagtt ttcattgtaa tagtgctggt agtctacttt 1620
acaggaaaga tcacgacctg gaacttcacg aagctacaga aagaattgat cgaggaccgc 1680
gtactgtacg acgcaacgac caatgcccag tcggtataa 1719
<210> 9
<211> 1713
<212> DNA
<213> 其他序列
<220>
<223> 具有软骨素合酶活性的多肽的重编码核酸序列(HCOS4-Vir)
<400> 9
atgggtaaga acatcattat tatggtttct tggtacacta ttattacatc caatctcatc 60
gcagtgggtg gcgcctcact catactagcc ccagctatta cgggctatgt ccttcactgg 120
aacattgccc tttcaacaat ttggggagtg tcggcctacg gaattttcgt gtttggtttc 180
tttcttgccc aggtattatt tagtgaactc aaccggaaaa ggctccggaa gtggatttcc 240
ctccgaccca aagggtggaa tgatgttagg ttggctgtaa ttattgccgg ctaccgtgag 300
gacccgtata tgttccaaaa gtgtcttgaa agtgtgcgtg actcagacta tgggaatgta 360
gctagactaa tatgcgttat tgacggcgat gaagacgacg acatgaggat ggctgcagtg 420
tacaaggcta tctataacga caacatcaag aaacctgagt ttgtcctctg tgagagtgac 480
gataaggagg gtgagagaat agatagcgat ttcagccgtg atatctgcgt gctgcaaccg 540
catcgcggaa agcgtgaatg tttgtacaca gggttccaat tggcaaagat ggacccctca 600
gttaatgccg tcgtcctaat cgacagtgac actgtgttag aaaaggacgc gattctcgaa 660
gtagtatacc cgctggcatg cgatccagaa atacaggctg tagcaggcga atgcaaaata 720
tggaatactg acacactgtt gagtttgctg gtagcctggc gatattacag cgcattttgc 780
gtagagcgta gcgcccaatc attcttcagg acagtacaat gcgtcggagg acctctcggc 840
gcctacaaga ttgatataat taaggaaatc aaggacccat ggatcagcca acgtttcctt 900
ggccaaaagt gcacatacgg cgacgataga cgactcacta atgaaatact aatgaggggt 960
aagaaagtag ttttcacccc attcgctgtt ggctggttcg acgaggagtt cacacactgg 1020
ggtggccgtt acattgtaca gcaaacacgg tggtccaagt cgtggtgtag ggagatatgg 1080
tatacactgt ttgcagcatg gaagcatgga ctttcgggca tttggctcgc attcgagtgc 1140
ttataccaga ttacttattt cttcctggtg atttacctat tctcccgttt ggctgttgag 1200
gctgacccac gggcgcaaac ggccaccgtc attgtttcga ccacagttgc gcttattaag 1260
tgcggttact ttagcttcag agctaaagac attagggcct tctatttcgt cctctacacg 1320
ttcgtttact tcttctgcat gattccggca cgaataactg cgatgatgac cctgtgggac 1380
ataggttggg gaaccagggg aggaaatgag aagccttccg taggcaccag agttgctttg 1440
tgggccaagc aatatttgat tgcttacatg tggtgggccg ctgtcgtcgg tgctggcgtg 1500
tactccatcg ttcataattg gatgtttgac tggaattcac tttcctacag gttcgcactg 1560
gtaggcatct gttcgtatat agttttcatt gtaatagtgc tggtagtcta ctttacagga 1620
aagatcacga cctggaactt cacgaagcta cagaaagaat tgatcgagga ccgcgtactg 1680
tacgacgcaa cgaccaatgc ccagtcggta taa 1713
<210> 10
<211> 2079
<212> DNA
<213> 其他序列
<220>
<223> 具有软骨素合酶活性的多肽的核酸序列(HCOS5-Vir)
<400> 10
atgggtaaga acatcattat tatggtttct tggtacacta ttattacatc caatctcatc 60
gcagtgggtg gcgcctcact catactagcc ccagctatta cgggctatgt ccttcactgg 120
aacattgccc tttcaacaat ttggggagtg tcggcctacg gaattttcgt gtttggtttc 180
tttcttgccc aggtattatt tagtgaactc aaccggaaaa ggctccggaa gtggatttcc 240
ctccgaccca aatccattca ccatccaatt tcgaaaacga ctcaccccga cacagaaaat 300
gcaggtgact caacattgtt gtgcccgccc atggatggta tggacgacat attagtcgtt 360
atgaagacag gtgtcacaga ggctaaggaa aaggtgccag tacattttca gacaacgctg 420
aggtgtgtgc cgcactacgt tatctatagc gacttcgaag aagagataga aggtgtaaag 480
atttacgacg tcttgcaagg aatggacccc gatgttatga cgcaggttcc ggacttcgat 540
ctttacaatc gtattaagaa gttagggcgt cagggccttg cggagaacga cttcgcggac 600
gaagcgaact ctgcggtggg taagcctaat aaccctggtt ggaagttaga taaatggaag 660
ttcttaccta tgatcattga ggctctgaga tacaaaccaa aggctaagtg gtatgttttc 720
atggaagcag acacttatat atcttggccg actttattag cctggctaaa acacttcaac 780
cacaagaagc cgtggtatct tggcactgag acacagatag ccgatgtgat tttcgctcat 840
ggtggttcag gattcatgat tagtcatgcc gcgcttaagc ttgctgctga agaatatacc 900
gcacgtcgta ctgagttgca ccactacaca gacggtcact gggcaggaga ctgcgtatta 960
ggtaaagttc ttgctgacgc aggtgtgaac ttgcatttct cctggccaat tttacagaat 1020
tccaatctgg gcgaactgga tgagttcaac gttgacttat acaggcaacc ttggtgcttt 1080
ccagctgccg ctttccacca cttgaacgct cagaagatcc aggacttatg gtcttacgag 1140
cagaaaaggt ggcaggacaa ggacaagagg gttctgttac atagcgacgt cttcagggac 1200
ctattatatc cggatatagc attaaaaccc gcgaggatcg gttgggacaa cctgagtgca 1260
gacgaacagt ctacggcctc tagtttcgag gaatgcaggc aaatttgtga tcaattagac 1320
gattgtaccc agtttagttt cagggacaaa tcctgtttta catcaagaac tccacgtttg 1380
ggcgcagcca atccaaatac agttagcgga tggatggttg atcgtatccg tgcgaatatg 1440
gagaagtctg gactgtttgc agcatggaag catggacttt cgggcatttg gctcgcattc 1500
gagtgcttat accagattac ttatttcttc ctggtgattt acctattctc ccgtttggct 1560
gttgaggctg acccacgggc gcaaacggcc accgtcattg tttcgaccac agttgcgctt 1620
attaagtgcg gttactttag cttcagagct aaagacatta gggccttcta tttcgtcctc 1680
tacacgttcg tttacttctt ctgcatgatt ccggcacgaa taactgcgat gatgaccctg 1740
tgggacatag gttggggaac caggggagga aatgagaagc cttccgtagg caccagagtt 1800
gctttgtggg ccaagcaata tttgattgct tacatgtggt gggccgctgt cgtcggtgct 1860
ggcgtgtact ccatcgttca taattggatg tttgactgga attcactttc ctacaggttc 1920
gcactggtag gcatctgttc gtatatagtt ttcattgtaa tagtgctggt agtctacttt 1980
acaggaaaga tcacgacctg gaacttcacg aagctacaga aagaattgat cgaggaccgc 2040
gtactgtacg acgcaacgac caatgcccag tcggtataa 2079
<210> 11
<211> 2733
<212> DNA
<213> 其他序列
<220>
<223> 具有软骨素合酶活性的多肽的核酸序列(HCOS6-Vir)
<400> 11
atgggtaaga acatcattat tatggtttct tggtacacta ttattacatc caatctcatc 60
gcagtgggtg gcgcctcact catactagcc ccagctatta cgggctatgt ccttcactgg 120
aacattgccc tttcaacaat ttggggagtg tcggcctacg gaattttcgt gtttggtttc 180
tttcttgccc aggtattatt tagtgaactc aaccggaaaa ggctccggaa gtggatttcc 240
ctccgaccca aattagacat tgcaacacag ttattactat cgaatgttaa gaaattgacc 300
ttaagcgagt ccgaaaagaa cagcttaaag aataagtgga agagtataac aggcaagaag 360
tccgagaatg ctgaaattag gaaggttgag ttagtcccaa aggattttcc caaagactta 420
gttttagcgc cactaccaga ccatgtgaac gattttacct ggtacaagaa tagaaagaag 480
agcctgggca taaagcctgt gaacaagaac atcgggttgt caatcataat cccaactttc 540
aatcgtagta ggatattaga cattaccctg gcgtgtctag ttaatcagaa aactaactat 600
ccgtttgagg tggttgttgc agatgatggg tcgaaggaaa atctattgac tatagttcag 660
aaatacgagc agaaactaga cattaagtat gtgagacaga aggactatgg gtatcagctg 720
tgcgccgtta gaaaccttgg tctaaggaca gcgaagtatg actttgtctc tatcttggat 780
tgcgacatgg ccccgcagca gctatgggtt cactcttacc ttacagagtt actggaagac 840
aacgacatcg tcttgatcgg gccaaggaaa tacgttgata cccacaacat cacggctgag 900
cagtttctga acgacccata tttaattgag agtttaccgg aaaccgccac aaacaataat 960
ccatcgatta ccagtaaggg taacatctca ttagattgga gattagaaca ttttaagaag 1020
acagacaacc taagactatg cgactccccg ttcaggtatt tctcatgcgg aaatgtggcc 1080
ttctccaaag agtggctgaa caaagttggc tggttcgacg aagaatttaa tcactggggc 1140
ggcgaagacg tcgaattcgg ctacaggtta tttgcaaaag ggtgcttctt tagggttatc 1200
gacggtggta tggcctacca tcaagagcca ccaggaaagg agaacgaaac ggatcgtgag 1260
gccggtaagt ctatcactct taaaatagta aaggagaaag tgccctacat ctacaggaag 1320
ttgttgccga ttgaggactc ccacatacac cgtataccgc ttgtgagcat atacattcca 1380
gcgtacaact gcgccaatta tattcaaagg tgtgtagata gcgcgttgaa tcaaacagtg 1440
gtagatttgg aagtttgtat atgtaacgac ggaagtactg acaatacttt agaggtgatt 1500
aacaagctgt atggcaacaa cccgcgtgtc aggataatga gcaagcccaa tggtggaatt 1560
gcttccgcgt ctaacgctgc cgtttcattc gcgaaaggct actacattgg ccagttggac 1620
tcggatgatt acttggaacc tgacgcagtg gagctttgtt taaaggagtt cttgaaggac 1680
aaaacactag cctgtgtata tacaacgaac agaaatgtta atcctgacgg ttccctaatc 1740
gctaacggat acaattggcc tgagttcagc agggagaagc tgaccactgc tatgatcgcc 1800
caccatttca ggatgttcac aatcagggct tggcatttaa cagatggttt taatgagaaa 1860
atagagaacg cagtagacta cgatatgttt ctgaagttat cagaggtcgg gaaattcaaa 1920
cacttgaaca aaatttgtta caatagggta ttacacggtg acaacaccag tattaagaat 1980
cttgacaccc aaaagaagaa ccacttcgta gtagtgaacc agtctctgaa cagacaaagg 2040
gtgtcgaatt ataactacga tgagtttgat aacctggacg agagccgtaa gtacatattc 2100
aacaagctgt ttgcagcatg gaagcatgga ctttcgggca tttggctcgc attcgagtgc 2160
ttataccaga ttacttattt cttcctggtg atttacctat tctcccgttt ggctgttgag 2220
gctgacccac gggcgcaaac ggccaccgtc attgtttcga ccacagttgc gcttattaag 2280
tgcggttact ttagcttcag agctaaagac attagggcct tctatttcgt cctctacacg 2340
ttcgtttact tcttctgcat gattccggca cgaataactg cgatgatgac cctgtgggac 2400
ataggttggg gaaccagggg aggaaatgag aagccttccg taggcaccag agttgctttg 2460
tgggccaagc aatatttgat tgcttacatg tggtgggccg ctgtcgtcgg tgctggcgtg 2520
tactccatcg ttcataattg gatgtttgac tggaattcac tttcctacag gttcgcactg 2580
gtaggcatct gttcgtatat agttttcatt gtaatagtgc tggtagtcta ctttacagga 2640
aagatcacga cctggaactt cacgaagcta cagaaagaat tgatcgagga ccgcgtactg 2700
tacgacgcaa cgaccaatgc ccagtcggta taa 2733
<210> 12
<211> 2112
<212> DNA
<213> 其他序列
<220>
<223> 具有软骨素合酶活性的多肽的重编码核酸序列(HCOS7-Vir)
<400> 12
atgggtaaga acatcattat tatggtttct tggtacacta ttattacatc caatctcatc 60
gcagtgggtg gcgcctcact catactagcc ccagctatta cgggctatgt ccttcactgg 120
aacattgccc tttcaacaat ttggggagtg tcggcctacg gaattttcgt gtttggtttc 180
tttcttgccc aggtattatt tagtgaactc aaccggaaaa ggctccggaa gtggatttcc 240
ctccgaccca aaatcccaac tttcaatcgt agtaggatat tagacattac cctggcgtgt 300
ctagttaatc agaaaactaa ctatccgttt gaggtggttg ttgcagatga tgggtcgaag 360
gaaaatctat tgactatagt tcagaaatac gagcagaaac tagacattaa gtatgtgaga 420
cagaaggact atgggtatca gctgtgcgcc gttagaaacc ttggtctaag gacagcgaag 480
tatgactttg tctctatctt ggattgcgac atggccccgc agcagctatg ggttcactct 540
taccttacag agttactgga agacaacgac atcgtcttga tcgggccaag gaaatacgtt 600
gatacccaca acatcacggc tgagcagttt ctgaacgacc catatttaat tgagagttta 660
ccggaaaccg ccacaaacaa taatccatcg attaccagta agggtaacat ctcattagat 720
tggagattag aacattttaa gaagacagac aacctaagac tatgcgactc cccgttcagg 780
tatttctcat gcggaaatgt ggccttctcc aaagagtggc tgaacaaagt tggctggttc 840
gacgaagaat ttaatcactg gggcggcgaa gacgtcgaat tcggctacag gttatttgca 900
aaagggtgct tctttagggt tatcgacggt ggtatggcct accatcaaga gccaccagga 960
aaggagaacg aaacggatcg tgaggccggt aagtctatca ctcttaaaat agtaaaggag 1020
aaagtgccct acatctacag gaagttgttg ccgattgagg actcccacat acaccgtata 1080
ccgcttgtga gcatatacat tccagcgtac aactgcgcca attatattca aaggtgtgta 1140
gatagcgcgt tgaatcaaac agtggtagat ttggaagttt gtatatgtaa cgacggaagt 1200
actgacaata ctttagaggt gattaacaag ctgtatggca acaacccgcg tgtcaggata 1260
atgagcaagc ccaatggtgg aattgcttcc gcgtctaacg ctgccgtttc attcgcgaaa 1320
ggctactaca ttggccagtt ggactcggat gattacttgg aacctgacgc agtggagctt 1380
tgtttaaagg agttcttgaa ggacaaaaca ctagcctgtg tatatacaac gaacagaaat 1440
gttaatcctg acggttccct aatcgctaac ggatacaatt ggcctctgtt tgcagcatgg 1500
aagcatggac tttcgggcat ttggctcgca ttcgagtgct tataccagat tacttatttc 1560
ttcctggtga tttacctatt ctcccgtttg gctgttgagg ctgacccacg ggcgcaaacg 1620
gccaccgtca ttgtttcgac cacagttgcg cttattaagt gcggttactt tagcttcaga 1680
gctaaagaca ttagggcctt ctatttcgtc ctctacacgt tcgtttactt cttctgcatg 1740
attccggcac gaataactgc gatgatgacc ctgtgggaca taggttgggg aaccagggga 1800
ggaaatgaga agccttccgt aggcaccaga gttgctttgt gggccaagca atatttgatt 1860
gcttacatgt ggtgggccgc tgtcgtcggt gctggcgtgt actccatcgt tcataattgg 1920
atgtttgact ggaattcact ttcctacagg ttcgcactgg taggcatctg ttcgtatata 1980
gttttcattg taatagtgct ggtagtctac tttacaggaa agatcacgac ctggaacttc 2040
acgaagctac agaaagaatt gatcgaggac cgcgtactgt acgacgcaac gaccaatgcc 2100
cagtcggtat aa 2112
<210> 13
<211> 1710
<212> DNA
<213> 其他序列
<220>
<223> 具有软骨素合酶活性的多肽的重编码核酸序列(HCOS8-Vir)
<400> 13
atgggtaaga acatcattat tatggtttct tggtacacta ttattacatc caatctcatc 60
gcagtgggtg gcgcctcact catactagcc ccagctatta cgggctatgt ccttcactgg 120
aacattgccc tttcaacaat ttggggagtg tcggcctacg gaattttcgt gtttggtttc 180
tttcttgccc aggtattatt tagtgaactc aaccggaaaa ggctccggaa gtggatttcc 240
ctccgaccca aagggtggaa tgatgttagg ttggctgtaa ttattgccgg ctaccgtgag 300
gacccgtata tgttccaaaa gtgtcttgaa agtgtgcgtg actcagacta tgggaatgta 360
gctagactaa tatgcgttat tgacggcgat gaagacgacg acatgaggat ggctgcagtg 420
tacaaggcta tctataacga caacatcaag aaacctgagt ttgtcctctg tgagagtgac 480
gataaggagg gtgagagaat agatagcgat ttcagccgtg atatctgcgt gctgcaaccg 540
catcgcggaa agcgtgaatg tttgtacaca gggttccaat tggcaaagat ggacccctca 600
gttaatgccg tcgtcctaat cgacagtgac actgtgttag aaaaggacgc gattctcgaa 660
gtagtatacc cgctggcatg cgatccagaa atacaggctg tagcaggcga atgcaaaata 720
tggaatactg acacactgtt gagtttgctg gtagcctggc gatattacag cgcattttgc 780
gtagagcgta gcgcccaatc attcttcagg acagtacaat gcgtcagact atgcgactcc 840
ccgttcaggt atttctcatg cggaaatgtg gccttctcca aagagtggct gaacaaagtt 900
ggctggttcg acgaagaatt taatcactgg ggcggcgaag acgtcgaatt cggctacagg 960
ttaaagaaag tagttttcac cccattcgct gttggctggt ccgacagccc gacgaacgtc 1020
ttccgttaca ttgtacagca aacacggtgg tccaagtcgt ggtgtaggga gatatggtat 1080
acactgtttg cagcatggaa gcatggactt tcgggcattt ggctcgcatt cgagtgctta 1140
taccagatta cttatttctt cctggtgatt tacctattct cccgtttggc tgttgaggct 1200
gacccacggg cgcaaacggc caccgtcatt gtttcgacca cagttgcgct tattaagtgc 1260
ggttacttta gcttcagagc taaagacatt agggccttct atttcgtcct ctacacgttc 1320
gtttacttct tctgcatgat tccggcacga ataactgcga tgatgaccct gtgggacata 1380
ggttggggaa ccaggggagg aaatgagaag ccttccgtag gcaccagagt tgctttgtgg 1440
gccaagcaat atttgattgc ttacatgtgg tgggccgctg tcgtcggtgc tggcgtgtac 1500
tccatcgttc ataattggat gtttgactgg aattcacttt cctacaggtt cgcactggta 1560
ggcatctgtt cgtatatagt tttcattgta atagtgctgg tagtctactt tacaggaaag 1620
atcacgacct ggaacttcac gaagctacag aaagaattga tcgaggaccg cgtactgtac 1680
gacgcaacga ccaatgccca gtcggtataa 1710
<210> 14
<211> 2499
<212> DNA
<213> 其他序列
<220>
<223> 具有软骨素合酶活性的多肽的核酸序列(HCOS9-Vir)
<400> 14
atgggtaaga acatcattat tatggtttct tggtacacta ttattacatc caatctcatc 60
gcagtgggtg gcgcctcact catactagcc ccagctatta cgggctatgt ccttcactgg 120
aacattgccc tttcaacaat ttggggagtg tcggcctacg gaattttcgt gtttggtttc 180
tttcttgccc aggtattatt tagtgaactc aaccggaaaa ggctccggaa gtggatttcc 240
ctccgaccca aacacattgg taagtgtcta agggaaatgt atacgactca tgaggacgtg 300
gaagtaggaa gatgcgttag gagattcgct ggagtacagt gtgtttggtc ttacgagatg 360
caacagttat tctacgagaa ctacgagcag aataagaagg gatacatccg tgatctgcac 420
aactccaaaa ttcaccaagc aataacgctg catcctaaca agaatccgcc ctatcagtat 480
aggttgcact cttacatgtt gagtagaaag atatctgagc tacgtcatag aactattcag 540
ttgcacaggg agatagtact gatgtctaaa tactcaaaca cggagatcca taaggaagac 600
ctacagttgg gtataccacc ttcgttcatg agattccagc caagacagag ggaagaaatt 660
ttggagtggg agttcttgac tggtaaatac ttgtattctg ctgttgacgg tcaaccacct 720
aggagaggga tggactctgc acagcgtgag gctttagacg atatagtgat gcaagtaatg 780
gaaatgatca acgctaatgc aaagacacgt ggtcgtatca tagatttcaa agagatccag 840
tatggatatc gtcgtgtgaa cccaatgtac ggcgcggagt atattcttga cttattgttg 900
ctatacaaga aacataaggg taagaagatg actgtcccgg ttcgtaggca cgcgtatttg 960
caacagactt tctcgaaaat acagtttgta gagcatgagg aacttgacgc gcaagagtta 1020
gcgaaacgta taaaccaaga gtcggggagt ttatccttct taagtaattc ccttaagaag 1080
ttggttcctt tccagctgcc tggaagtaaa agtgagcaca aggagccaaa ggataagaaa 1140
atcaacattc ttatacctct ttccggcaga ttcgacatgt tcgttaggtt catgggtaac 1200
ttcgagaaga cctgcttaat tcctaaccag aatgttaagt tggtagtttt gttattcaat 1260
tctgacagta accccgacaa agcaaagcag gttgaactga tgagagacta taggattaag 1320
tacccaaaag cagatatgca gatactacct gtttccggag aattctcaag agccttggct 1380
ctggaagtag gcagctctca gtttaataat gagtctcttc tgttcttctg cgacgttgac 1440
ttagttttca cgacagagtt tctgcagaga tgtcgtgcaa acactgtact aggtcagcag 1500
atatatttcc ccattatttt cagtcagtac gatccaaaga ttgtttatag tggaaaagtt 1560
ccatctgaca accattttgc gtttactcaa aagacagggt tttggcgtaa ctacgggttc 1620
ggcataacat gtatctataa aggggacctg gtaagagttg gcggattcga cgtatctata 1680
cagggctggg gtttagaaga cgtcgatcta tttaataaag tagttcaggc aggtttgaag 1740
acattccgta gtcaagaggt aggcgttgta cacgtgcacc atccagtatt ttgcgaccca 1800
aacttagacc cgaagcaata taaaatgtgc ttgggttcca aggcatcgac ttacggttcc 1860
acgcagcaac tactgtttgc agcatggaag catggacttt cgggcatttg gctcgcattc 1920
gagtgcttat accagattac ttatttcttc ctggtgattt acctattctc ccgtttggct 1980
gttgaggctg acccacgggc gcaaacggcc accgtcattg tttcgaccac agttgcgctt 2040
attaagtgcg gttactttag cttcagagct aaagacatta gggccttcta tttcgtcctc 2100
tacacgttcg tttacttctt ctgcatgatt ccggcacgaa taactgcgat gatgaccctg 2160
tgggacatag gttggggaac caggggagga aatgagaagc cttccgtagg caccagagtt 2220
gctttgtggg ccaagcaata tttgattgct tacatgtggt gggccgctgt cgtcggtgct 2280
ggcgtgtact ccatcgttca taattggatg tttgactgga attcactttc ctacaggttc 2340
gcactggtag gcatctgttc gtatatagtt ttcattgtaa tagtgctggt agtctacttt 2400
acaggaaaga tcacgacctg gaacttcacg aagctacaga aagaattgat cgaggaccgc 2460
gtactgtacg acgcaacgac caatgcccag tcggtataa 2499
<210> 15
<211> 3006
<212> DNA
<213> 其他序列
<220>
<223> 具有软骨素合酶活性的多肽的重编码核酸序列(HCOS10-Vir)
<400> 15
atgggtaaga acatcattat tatggtttct tggtacacta ttattacatc caatctcatc 60
gcagtgggtg gcgcctcact catactagcc ccagctatta cgggctatgt ccttcactgg 120
aacattgccc tttcaacaat ttggggagtg tcggcctacg gaattttcgt gtttggtttc 180
tttcttgccc aggtattatt tagtgaactc aaccggaaaa ggctccggaa gtggatttcc 240
ctccgaccca aaagagatag aaacttccta ttcgttggtg ttatgacagc tcagaagtac 300
ttacagacca gggcggttgc agcatataga acctggtcaa agacaattcc aggtaaggta 360
cagttcttca gctccgaggg ttctgacacc agcgtcccta tcccagtagt gcctttgcgt 420
ggagtggatg attcataccc acctcagaag aagtccttca tgatgcttaa gtatatgcac 480
gaccactatc tggacaaata cgagtggttc atgagagcag acgacgacgt ttacataaag 540
ggtgatagac tggagaattt cttgaggtca ctaaacagtt cagaaccact tttcctagga 600
cagacgggcc ttggtacgac agaggagatg ggtaagttgg cattggagcc aggggagaac 660
ttctgcatgg gtggccctgg tgtgattatg agtagggaag ttttaagaag aatggttccg 720
cacattggta agtgtctaag ggaaatgtat acgactcatg aggacgtgga agtaggaaga 780
tgcgttagga gattcgctgg agtacagtgt gtttggtctt acgagatgca acagttattc 840
tacgagaact acgagcagaa taagaaggga tacatccgtg atctgcacaa ctccaaaatt 900
caccaagcaa taacgctgca tcctaacaag aatccgccct atcagtatag gttgcactct 960
tacatgttga gtagaaagat atctgagcta cgtcatagaa ctattcagtt gcacagggag 1020
atagtactga tgtctaaata ctcaaacacg gagatccata aggaagacct acagttgggt 1080
ataccacctt cgttcatgag attccagcca agacagaggg aagaaatttt ggagtgggag 1140
ttcttgactg gtaaatactt gtattctgct gttgacggtc aaccacctag gagagggatg 1200
gactctgcac agcgtgaggc tttagacgat atagtgatgc aagtaatgga aatgatcaac 1260
gctaatgcaa agacacgtgg tcgtatcata gatttcaaag agatccagta tggatatcgt 1320
cgtgtgaacc caatgtacgg cgcggagtat attcttgact tattgttgct atacaagaaa 1380
cataagggta agaagatgac tgtcccggtt cgtaggcacg cgtatttgca acagactttc 1440
tcgaaaatac agtttgtaga gcatgaggaa cttgacgcgc aagagttagc gaaacgtata 1500
aaccaagagt cggggagttt atccttctta agtaattccc ttaagaagtt ggttcctttc 1560
cagctgcctg gaagtaaaag tgagcacaag gagccaaagg ataagaaaat caacattctt 1620
atacctcttt ccggcagatt cgacatgttc gttaggttca tgggtaactt cgagaagacc 1680
tgcttaattc ctaaccagaa tgttaagttg gtagttttgt tattcaattc tgacagtaac 1740
cccgacaaag caaagcaggt tgaactgatg agagactata ggattaagta cccaaaagca 1800
gatatgcaga tactacctgt ttccggagaa ttctcaagag ccttggctct ggaagtaggc 1860
agctctcagt ttaataatga gtctcttctg ttcttctgcg acgttgactt agttttcacg 1920
acagagtttc tgcagagatg tcgtgcaaac actgtactag gtcagcagat atatttcccc 1980
attattttca gtcagtacga tccaaagatt gtttatagtg gaaaagttcc atctgacaac 2040
cattttgcgt ttactcaaaa gacagggttt tggcgtaact acgggttcgg cataacatgt 2100
atctataaag gggacctggt aagagttggc ggattcgacg tatctataca gggctggggt 2160
ttagaagacg tcgatctatt taataaagta gttcaggcag gtttgaagac attccgtagt 2220
caagaggtag gcgttgtaca cgtgcaccat ccagtatttt gcgacccaaa cttagacccg 2280
aagcaatata aaatgtgctt gggttccaag gcatcgactt acggttccac gcagcaacta 2340
gcagagatgt ggttggagaa gaacgaccca tcttatagcc tgtttgcagc atggaagcat 2400
ggactttcgg gcatttggct cgcattcgag tgcttatacc agattactta tttcttcctg 2460
gtgatttacc tattctcccg tttggctgtt gaggctgacc cacgggcgca aacggccacc 2520
gtcattgttt cgaccacagt tgcgcttatt aagtgcggtt actttagctt cagagctaaa 2580
gacattaggg ccttctattt cgtcctctac acgttcgttt acttcttctg catgattccg 2640
gcacgaataa ctgcgatgat gaccctgtgg gacataggtt ggggaaccag gggaggaaat 2700
gagaagcctt ccgtaggcac cagagttgct ttgtgggcca agcaatattt gattgcttac 2760
atgtggtggg ccgctgtcgt cggtgctggc gtgtactcca tcgttcataa ttggatgttt 2820
gactggaatt cactttccta caggttcgca ctggtaggca tctgttcgta tatagttttc 2880
attgtaatag tgctggtagt ctactttaca ggaaagatca cgacctggaa cttcacgaag 2940
ctacagaaag aattgatcga ggaccgcgta ctgtacgacg caacgaccaa tgcccagtcg 3000
gtataa 3006
<210> 16
<211> 1596
<212> DNA
<213> 其他序列
<220>
<223> 具有软骨素合酶活性的多肽的重编码核酸序列(HCOS11-Vir)
<400> 16
atgggtaaga acatcattat tatggtttct tggtacacta ttattacatc caatctcatc 60
gcagtgggtg gcgcctcact catactagcc ccagctatta cgggctatgt ccttcactgg 120
aacattgccc tttcaacaat ttggggagtg tcggcctacg gaattttcgt gtttggtttc 180
tttcttgccc aggtattatt tagtgaactc aaccggaaaa ggctccggaa gtggatttcc 240
ctccgaccca aaagagatag aaacttccta ttcgttggtg ttatgacagc tcagaagtac 300
ttacagacca gggcggttgc agcatataga acctggtcaa agacaattcc aggtaaggta 360
cagttcttca gctccgaggg ttctgacacc agcgtcccta tcccagtagt gcctttgcgt 420
ggagtggatg attcataccc acctcagaag aagtccttca tgatgcttaa gtatatgcac 480
gaccactatc tggacaaata cgagtggttc atgagagcag acgacgacgt ttacataaag 540
ggtgatagac tggagaattt cttgaggtca ctaaacagtt cagaaccact tttcctagga 600
cagacgggcc ttggtacgac agaggagatg ggtaagttgg cattggagcc aggggagaac 660
ttctgcatgg gtggccctgg tgtgattatg agtagggaag ttttaagaag aatggttccg 720
cacattggta agtgtctaag ggaaatgtat acgactcatg aggacgtgga agtaggaaga 780
tgcgttagga gattcgctgg agtacagtgt gtttggtctt acgagatgca acagttattc 840
tacgagaact acgagcagaa taagaaggga tacatccgtg atctgcacaa ctccaaaatt 900
caccaagcaa taacgctgca tcctaacaag aatccgccct atcagtatag gttgcactct 960
tacatgttgc tgtttgcagc atggaagcat ggactttcgg gcatttggct cgcattcgag 1020
tgcttatacc agattactta tttcttcctg gtgatttacc tattctcccg tttggctgtt 1080
gaggctgacc cacgggcgca aacggccacc gtcattgttt cgaccacagt tgcgcttatt 1140
aagtgcggtt actttagctt cagagctaaa gacattaggg ccttctattt cgtcctctac 1200
acgttcgttt acttcttctg catgattccg gcacgaataa ctgcgatgat gaccctgtgg 1260
gacataggtt ggggaaccag gggaggaaat gagaagcctt ccgtaggcac cagagttgct 1320
ttgtgggcca agcaatattt gattgcttac atgtggtggg ccgctgtcgt cggtgctggc 1380
gtgtactcca tcgttcataa ttggatgttt gactggaatt cactttccta caggttcgca 1440
ctggtaggca tctgttcgta tatagttttc attgtaatag tgctggtagt ctactttaca 1500
ggaaagatca cgacctggaa cttcacgaag ctacagaaag aattgatcga ggaccgcgta 1560
ctgtacgacg caacgaccaa tgcccagtcg gtataa 1596
<210> 17
<211> 1662
<212> DNA
<213> 其他序列
<220>
<223> 具有软骨素合酶活性的多肽的重编码核酸序列(HCOS12-Vir)
<400> 17
atgggtaaga acatcattat tatggtttct tggtacacta ttattacatc caatctcatc 60
gcagtgggtg gcgcctcact catactagcc ccagctatta cgggctatgt ccttcactgg 120
aacattgccc tttcaacaat ttggggagtg tcggcctacg gaattttcgt gtttggtttc 180
tttcttgccc aggtattatt tagtgaactc aaccggaaaa ggctccggaa gtggatttcc 240
ctccgaccca aaaaggataa gaaaatcaac attcttatac ctctttccgg cagattcgac 300
atgttcgtta ggttcatggg taacttcgag aagacctgct taattcctaa ccagaatgtt 360
aagttggtag ttttgttatt caattctgac agtaaccccg acaaagcaaa gcaggttgaa 420
ctgatgagag actataggat taagtaccca aaagcagata tgcagatact acctgtttcc 480
ggagaattct caagagcctt ggctctggaa gtaggcagct ctcagtttaa taatgagtct 540
cttctgttct tctgcgacgt tgacttagtt ttcacgacag agtttctgca gagatgtcgt 600
gcaaacactg tactaggtca gcagatatat ttccccatta ttttcagtca gtacgatcca 660
aagattgttt atagtggaaa agttccatct gacaaccatt ttgcgtttac tcaaaagaca 720
gggttttggc gtaactacgg gttcggcata acatgtatct ataaagggga cctggtaaga 780
gttggcggat tcgacgtatc tatacagggc tggggtttag aagacgtcga tctatttaat 840
aaagtagttc aggcaggttt gaagacattc cgtagtcaag aggtaggcgt tgtacacgtg 900
caccatccag tattttgcga cccaaactta gacccgaagc aatataaaat gtgcttgggt 960
tccaaggcat cgacttacgg ttccacgcag caactagcag agatgtggtt ggagaagaac 1020
gacccatctt atagcctgtt tgcagcatgg aagcatggac tttcgggcat ttggctcgca 1080
ttcgagtgct tataccagat tacttatttc ttcctggtga tttacctatt ctcccgtttg 1140
gctgttgagg ctgacccacg ggcgcaaacg gccaccgtca ttgtttcgac cacagttgcg 1200
cttattaagt gcggttactt tagcttcaga gctaaagaca ttagggcctt ctatttcgtc 1260
ctctacacgt tcgtttactt cttctgcatg attccggcac gaataactgc gatgatgacc 1320
ctgtgggaca taggttgggg aaccagggga ggaaatgaga agccttccgt aggcaccaga 1380
gttgctttgt gggccaagca atatttgatt gcttacatgt ggtgggccgc tgtcgtcggt 1440
gctggcgtgt actccatcgt tcataattgg atgtttgact ggaattcact ttcctacagg 1500
ttcgcactgg taggcatctg ttcgtatata gttttcattg taatagtgct ggtagtctac 1560
tttacaggaa agatcacgac ctggaacttc acgaagctac agaaagaatt gatcgaggac 1620
cgcgtactgt acgacgcaac gaccaatgcc cagtcggtat aa 1662
<210> 18
<211> 972
<212> PRT
<213> 其他序列
<220>
<223> 具有软骨素合酶活性的多肽的氨基酸序列(HCOS-1)
<400> 18
Met Asn Thr Leu Ser Gln Ala Ile Lys Ala Tyr Asn Ser Asn Asp Tyr
1 5 10 15
Gln Leu Ala Leu Lys Leu Phe Glu Lys Ser Ala Glu Ile Tyr Gly Arg
20 25 30
Lys Ile Val Glu Phe Gln Ile Thr Lys Cys Lys Glu Lys Leu Ser Ala
35 40 45
His Pro Ser Val Asn Ser Ala His Leu Ser Val Asn Lys Glu Glu Lys
50 55 60
Val Asn Val Cys Asp Ser Pro Leu Asp Ile Ala Thr Gln Leu Leu Leu
65 70 75 80
Ser Asn Val Lys Lys Leu Val Leu Ser Asp Ser Glu Lys Asn Thr Leu
85 90 95
Lys Asn Lys Trp Lys Leu Leu Thr Glu Lys Lys Ser Glu Asn Ala Glu
100 105 110
Val Arg Ala Val Ala Leu Val Pro Lys Asp Phe Pro Lys Asp Leu Val
115 120 125
Leu Ala Pro Leu Pro Asp His Val Asn Asp Phe Thr Trp Tyr Lys Lys
130 135 140
Arg Lys Lys Arg Leu Gly Ile Lys Pro Glu His Gln His Val Gly Leu
145 150 155 160
Ser Ile Ile Val Thr Thr Phe Asn Arg Pro Ala Ile Leu Ser Ile Thr
165 170 175
Leu Ala Cys Leu Val Asn Gln Lys Thr His Tyr Pro Phe Glu Val Ile
180 185 190
Val Thr Asp Asp Gly Ser Gln Glu Asp Leu Ser Pro Ile Ile Arg Gln
195 200 205
Tyr Glu Asn Lys Leu Asp Ile Arg Tyr Val Arg Gln Lys Asp Tyr Gly
210 215 220
Tyr Gln Leu Cys Ala Val Arg Asn Leu Gly Leu Arg Thr Ala Lys Tyr
225 230 235 240
Asp Phe Val Ser Ile Leu Asp Cys Asp Met Ala Pro Gln Gln Leu Trp
245 250 255
Val His Ser Tyr Leu Thr Glu Leu Leu Glu Asp Asp Asp Leu Thr Ile
260 265 270
Ile Gly Pro Arg Lys Tyr Ile Asp Thr Gln His Ile Asp Pro Lys Asp
275 280 285
Phe Leu Asn Asn Ala Ser Leu Leu Glu Ser Leu Pro Glu Val Lys Thr
290 295 300
Asn Asn Ser Val Ala Ala Lys Gly Glu Gly Thr Val Ser Leu Asp Trp
305 310 315 320
Arg Leu Glu Gln Phe Glu Lys Thr Glu Asn Leu Arg Leu Ser Asp Ser
325 330 335
Pro Phe Arg Phe Phe Ala Ala Gly Asn Val Ala Phe Ala Lys Lys Trp
340 345 350
Leu Asn Lys Ser Gly Phe Phe Asp Glu Glu Phe Asn His Trp Gly Gly
355 360 365
Glu Asp Val Glu Phe Gly Tyr Arg Leu Phe Arg Tyr Gly Ser Phe Phe
370 375 380
Lys Thr Ile Asp Gly Ile Met Ala Tyr His Gln Glu Pro Pro Gly Lys
385 390 395 400
Glu Asn Glu Thr Asp Arg Glu Ala Gly Lys Asn Ile Thr Leu Asp Ile
405 410 415
Met Arg Glu Lys Val Pro Tyr Ile Tyr Arg Lys Leu Leu Pro Ile Glu
420 425 430
Asp Ser His Ile Asn Arg Val Pro Leu Val Ser Ile Tyr Ile Pro Ala
435 440 445
Tyr Asn Cys Ala Asn Tyr Ile Gln Arg Cys Val Asp Ser Ala Leu Asn
450 455 460
Gln Thr Val Val Asp Leu Glu Val Cys Ile Cys Asn Asp Gly Ser Thr
465 470 475 480
Asp Asn Thr Leu Glu Val Ile Asn Lys Leu Tyr Gly Asn Asn Pro Arg
485 490 495
Val Arg Ile Met Ser Lys Pro Asn Gly Gly Ile Ala Ser Ala Ser Asn
500 505 510
Ala Ala Val Ser Phe Ala Lys Gly Tyr Tyr Ile Gly Gln Leu Asp Ser
515 520 525
Asp Asp Tyr Leu Glu Pro Asp Ala Val Glu Leu Cys Leu Lys Glu Phe
530 535 540
Leu Lys Asp Lys Thr Leu Ala Cys Val Tyr Thr Thr Asn Arg Asn Val
545 550 555 560
Asn Pro Asp Gly Ser Leu Ile Ala Asn Gly Tyr Asn Trp Pro Glu Phe
565 570 575
Ser Arg Glu Lys Leu Thr Thr Ala Met Ile Ala His His Phe Arg Met
580 585 590
Phe Thr Ile Arg Ala Trp His Leu Thr Asp Gly Phe Asn Glu Lys Ile
595 600 605
Glu Asn Ala Val Asp Tyr Asp Met Phe Leu Lys Leu Ser Glu Val Gly
610 615 620
Lys Phe Lys His Leu Asn Lys Ile Cys Tyr Asn Arg Val Leu His Gly
625 630 635 640
Asp Asn Thr Ser Ile Lys Lys Leu Gly Ile Gln Lys Lys Asn His Phe
645 650 655
Val Val Val Asn Gln Ser Leu Asn Arg Gln Gly Ile Thr Tyr Tyr Asn
660 665 670
Tyr Asp Glu Phe Asp Asp Leu Asp Glu Ser Arg Lys Tyr Ile Phe Asn
675 680 685
Lys Thr Ala Glu Tyr Gln Glu Glu Ile Asp Ile Leu Lys Asp Ile Lys
690 695 700
Ile Ile Gln Asn Lys Asp Ala Lys Ile Ala Val Ser Ile Phe Tyr Pro
705 710 715 720
Asn Thr Leu Asn Gly Leu Val Lys Lys Leu Asn Asn Ile Ile Glu Tyr
725 730 735
Asn Lys Asn Ile Phe Val Ile Val Leu His Val Asp Lys Asn His Leu
740 745 750
Thr Pro Asp Ile Lys Lys Glu Ile Leu Ala Phe Tyr His Lys His Gln
755 760 765
Val Asn Ile Leu Leu Asn Asn Asp Ile Ser Tyr Tyr Thr Ser Asn Arg
770 775 780
Leu Ile Lys Thr Glu Ala His Leu Ser Asn Ile Asn Lys Leu Ser Gln
785 790 795 800
Leu Asn Leu Asn Cys Glu Tyr Ile Ile Phe Asp Asn His Asp Ser Leu
805 810 815
Phe Val Lys Asn Asp Ser Tyr Ala Tyr Met Lys Lys Tyr Asp Val Gly
820 825 830
Met Asn Phe Ser Ala Leu Thr His Asp Trp Ile Glu Lys Ile Asn Ala
835 840 845
His Pro Pro Phe Lys Lys Leu Ile Lys Thr Tyr Phe Asn Asp Asn Asp
850 855 860
Leu Lys Ser Met Asn Val Lys Gly Ala Ser Gln Gly Met Phe Met Thr
865 870 875 880
Tyr Ala Leu Ala His Glu Leu Leu Thr Ile Ile Lys Glu Val Ile Thr
885 890 895
Ser Cys Gln Ser Ile Asp Ser Val Pro Glu Tyr Asn Thr Glu Asp Ile
900 905 910
Trp Phe Gln Phe Ala Leu Leu Ile Leu Glu Lys Lys Thr Gly His Val
915 920 925
Phe Asn Lys Thr Ser Thr Leu Thr Tyr Met Pro Trp Glu Arg Lys Leu
930 935 940
Gln Trp Thr Asn Glu Gln Ile Glu Ser Ala Lys Arg Gly Glu Asn Ile
945 950 955 960
Pro Val Asn Lys Phe Ile Ile Asn Ser Ile Thr Leu
965 970
<210> 19
<211> 972
<212> PRT
<213> 其他序列
<220>
<223> 具有软骨素合酶活性的多肽的氨基酸序列(HCOS1-2)
<400> 19
Met Asn Thr Leu Ser Gln Ala Ile Lys Ala Tyr Asn Ser Asn Asp Tyr
1 5 10 15
Gln Leu Ala Leu Lys Leu Phe Glu Lys Ser Ala Glu Ile Tyr Gly Arg
20 25 30
Lys Ile Val Glu Phe Gln Ile Thr Lys Cys Lys Glu Lys Leu Ser Ala
35 40 45
His Pro Ser Val Asn Ser Ala His Leu Ser Val Asn Lys Glu Glu Lys
50 55 60
Val Asn Val Cys Asp Ser Pro Leu Asp Ile Ala Thr Gln Leu Leu Leu
65 70 75 80
Ser Asn Val Lys Lys Leu Val Leu Ser Asp Ser Glu Lys Asn Thr Leu
85 90 95
Lys Asn Lys Trp Lys Leu Leu Thr Glu Lys Lys Ser Glu Asn Ala Glu
100 105 110
Val Arg Ala Val Ala Leu Val Pro Lys Asp Phe Pro Lys Asp Leu Val
115 120 125
Leu Ala Pro Leu Pro Asp His Val Asn Asp Phe Thr Trp Tyr Lys Lys
130 135 140
Arg Lys Lys Arg Leu Gly Ile Lys Pro Val Asn Lys Asn Ile Gly Leu
145 150 155 160
Ser Ile Ile Ile Pro Thr Phe Asn Arg Ser Arg Ile Leu Asp Ile Thr
165 170 175
Leu Ala Cys Leu Val Asn Gln Lys Thr His Tyr Pro Phe Glu Val Ile
180 185 190
Val Thr Asp Asp Gly Ser Gln Glu Asp Leu Ser Pro Ile Ile Arg Gln
195 200 205
Tyr Glu Asn Lys Leu Asp Ile Arg Tyr Val Arg Gln Lys Asp Tyr Gly
210 215 220
Tyr Gln Leu Cys Ala Val Arg Asn Leu Gly Leu Arg Thr Ala Lys Tyr
225 230 235 240
Asp Phe Val Ser Ile Leu Asp Cys Asp Met Ala Pro Gln Gln Leu Trp
245 250 255
Val His Ser Tyr Leu Thr Glu Leu Leu Glu Asp Asp Asp Leu Thr Ile
260 265 270
Ile Gly Pro Arg Lys Tyr Ile Asp Thr Gln His Ile Asp Pro Lys Asp
275 280 285
Phe Leu Asn Asn Ala Ser Leu Leu Glu Ser Leu Pro Glu Val Lys Thr
290 295 300
Asn Asn Ser Val Ala Ala Lys Gly Glu Gly Thr Val Ser Leu Asp Trp
305 310 315 320
Arg Leu Glu Gln Phe Glu Lys Thr Glu Asn Leu Arg Leu Ser Asp Ser
325 330 335
Pro Phe Arg Phe Phe Ser Cys Gly Asn Val Ala Phe Ser Lys Glu Trp
340 345 350
Leu Asn Lys Val Gly Trp Phe Asp Glu Glu Phe Asn His Trp Gly Gly
355 360 365
Glu Asp Val Glu Phe Gly Tyr Arg Leu Phe Arg Tyr Gly Ser Phe Phe
370 375 380
Lys Thr Ile Asp Gly Ile Met Ala Tyr His Gln Glu Pro Pro Gly Lys
385 390 395 400
Glu Asn Glu Thr Asp Arg Glu Ala Gly Lys Asn Ile Thr Leu Asp Ile
405 410 415
Met Arg Glu Lys Val Pro Tyr Ile Tyr Arg Lys Leu Leu Pro Ile Glu
420 425 430
Asp Ser His Ile Asn Arg Val Pro Leu Val Ser Ile Tyr Ile Pro Ala
435 440 445
Tyr Asn Cys Ala Asn Tyr Ile Gln Arg Cys Val Asp Ser Ala Leu Asn
450 455 460
Gln Thr Val Val Asp Leu Glu Val Cys Ile Cys Asn Asp Gly Ser Thr
465 470 475 480
Asp Asn Thr Leu Glu Val Ile Asn Lys Leu Tyr Gly Asn Asn Pro Arg
485 490 495
Val Arg Ile Met Ser Lys Pro Asn Gly Gly Ile Ala Ser Ala Ser Asn
500 505 510
Ala Ala Val Ser Phe Ala Lys Gly Tyr Tyr Ile Gly Gln Leu Asp Ser
515 520 525
Asp Asp Tyr Leu Glu Pro Asp Ala Val Glu Leu Cys Leu Lys Glu Phe
530 535 540
Leu Lys Asp Lys Thr Leu Ala Cys Val Tyr Thr Thr Asn Arg Asn Val
545 550 555 560
Asn Pro Asp Gly Ser Leu Ile Ala Asn Gly Tyr Asn Trp Pro Glu Phe
565 570 575
Ser Arg Glu Lys Leu Thr Thr Ala Met Ile Ala His His Phe Arg Met
580 585 590
Phe Thr Ile Arg Ala Trp His Leu Thr Asp Gly Phe Asn Glu Lys Ile
595 600 605
Glu Asn Ala Val Asp Tyr Asp Met Phe Leu Lys Leu Ser Glu Val Gly
610 615 620
Lys Phe Lys His Leu Asn Lys Ile Cys Tyr Asn Arg Val Leu His Gly
625 630 635 640
Asp Asn Thr Ser Ile Lys Lys Leu Gly Ile Gln Lys Lys Asn His Phe
645 650 655
Val Val Val Asn Gln Ser Leu Asn Arg Gln Gly Ile Thr Tyr Tyr Asn
660 665 670
Tyr Asp Glu Phe Asp Asp Leu Asp Glu Ser Arg Lys Tyr Ile Phe Asn
675 680 685
Lys Thr Ala Glu Tyr Gln Glu Glu Ile Asp Ile Leu Lys Asp Ile Lys
690 695 700
Ile Ile Gln Asn Lys Asp Ala Lys Ile Ala Val Ser Ile Phe Tyr Pro
705 710 715 720
Asn Thr Leu Asn Gly Leu Val Lys Lys Leu Asn Asn Ile Ile Glu Tyr
725 730 735
Asn Lys Asn Ile Phe Val Ile Val Leu His Val Asp Lys Asn His Leu
740 745 750
Thr Pro Asp Ile Lys Lys Glu Ile Leu Ala Phe Tyr His Lys His Gln
755 760 765
Val Asn Ile Leu Leu Asn Asn Asp Ile Ser Tyr Tyr Thr Ser Asn Arg
770 775 780
Leu Ile Lys Thr Glu Ala His Leu Ser Asn Ile Asn Lys Leu Ser Gln
785 790 795 800
Leu Asn Leu Asn Cys Glu Tyr Ile Ile Phe Asp Asn His Asp Ser Leu
805 810 815
Phe Val Lys Asn Asp Ser Tyr Ala Tyr Met Lys Lys Tyr Asp Val Gly
820 825 830
Met Asn Phe Ser Ala Leu Thr His Asp Trp Ile Glu Lys Ile Asn Ala
835 840 845
His Pro Pro Phe Lys Lys Leu Ile Lys Thr Tyr Phe Asn Asp Asn Asp
850 855 860
Leu Lys Ser Met Asn Val Lys Gly Ala Ser Gln Gly Met Phe Met Thr
865 870 875 880
Tyr Ala Leu Ala His Glu Leu Leu Thr Ile Ile Lys Glu Val Ile Thr
885 890 895
Ser Cys Gln Ser Ile Asp Ser Val Pro Glu Tyr Asn Thr Glu Asp Ile
900 905 910
Trp Phe Gln Phe Ala Leu Leu Ile Leu Glu Lys Lys Thr Gly His Val
915 920 925
Phe Asn Lys Thr Ser Thr Leu Thr Tyr Met Pro Trp Glu Arg Lys Leu
930 935 940
Gln Trp Thr Asn Glu Gln Ile Glu Ser Ala Lys Arg Gly Glu Asn Ile
945 950 955 960
Pro Val Asn Lys Phe Ile Ile Asn Ser Ile Thr Leu
965 970
<210> 20
<211> 972
<212> PRT
<213> 其他序列
<220>
<223> 具有软骨素合酶活性的多肽的氨基酸序列(HCOS1-3)
<400> 20
Met Asn Thr Leu Ser Gln Ala Ile Lys Ala Tyr Asn Ser Asn Asp Tyr
1 5 10 15
Gln Leu Ala Leu Lys Leu Phe Glu Lys Ser Ala Glu Ile Tyr Gly Arg
20 25 30
Lys Ile Val Glu Phe Gln Ile Thr Lys Cys Lys Glu Lys Leu Ser Ala
35 40 45
His Pro Ser Val Asn Ser Ala His Leu Ser Val Asn Lys Glu Glu Lys
50 55 60
Val Asn Val Cys Asp Ser Pro Leu Asp Ile Ala Thr Gln Leu Leu Leu
65 70 75 80
Ser Asn Val Lys Lys Leu Val Leu Ser Asp Ser Glu Lys Asn Thr Leu
85 90 95
Lys Asn Lys Trp Lys Leu Leu Thr Glu Lys Lys Ser Glu Asn Ala Glu
100 105 110
Val Arg Ala Val Ala Leu Val Pro Lys Asp Phe Pro Lys Asp Leu Val
115 120 125
Leu Ala Pro Leu Pro Asp His Val Asn Asp Phe Thr Trp Tyr Lys Asn
130 135 140
Arg Lys Lys Ser Leu Gly Ile Lys Pro Val Asn Lys Asn Ile Gly Leu
145 150 155 160
Ser Ile Ile Ile Pro Thr Phe Asn Arg Ser Arg Ile Leu Asp Ile Thr
165 170 175
Leu Ala Cys Leu Val Asn Gln Lys Thr Asn Tyr Pro Phe Glu Val Val
180 185 190
Val Ala Asp Asp Gly Ser Lys Glu Asn Leu Leu Thr Ile Val Gln Lys
195 200 205
Tyr Glu Gln Lys Leu Asp Ile Lys Tyr Val Arg Gln Lys Asp Tyr Gly
210 215 220
Tyr Gln Leu Cys Ala Val Arg Asn Leu Gly Leu Arg Thr Ala Lys Tyr
225 230 235 240
Asp Phe Val Ser Ile Leu Asp Cys Asp Met Ala Pro Gln Gln Leu Trp
245 250 255
Val His Ser Tyr Leu Thr Glu Leu Leu Glu Asp Asn Asp Ile Val Leu
260 265 270
Ile Gly Pro Arg Lys Tyr Val Asp Thr His Asn Ile Thr Ala Glu Gln
275 280 285
Phe Leu Asn Asp Pro Tyr Leu Ile Glu Ser Leu Pro Glu Thr Ala Thr
290 295 300
Asn Asn Asn Pro Ser Ile Thr Ser Lys Gly Asn Ile Ser Leu Asp Trp
305 310 315 320
Arg Leu Glu His Phe Lys Lys Thr Asp Asn Leu Arg Leu Cys Asp Ser
325 330 335
Pro Phe Arg Tyr Phe Ser Cys Gly Asn Val Ala Phe Ser Lys Glu Trp
340 345 350
Leu Asn Lys Val Gly Trp Phe Asp Glu Glu Phe Asn His Trp Gly Gly
355 360 365
Glu Asp Val Glu Phe Gly Tyr Arg Leu Phe Ala Lys Gly Cys Phe Phe
370 375 380
Arg Val Ile Asp Gly Gly Met Ala Tyr His Gln Glu Pro Pro Gly Lys
385 390 395 400
Glu Asn Glu Thr Asp Arg Glu Ala Gly Lys Ser Ile Thr Leu Lys Ile
405 410 415
Val Lys Glu Lys Val Pro Tyr Ile Tyr Arg Lys Leu Leu Pro Ile Glu
420 425 430
Asp Ser His Ile Asn Arg Val Pro Leu Val Ser Ile Tyr Ile Pro Ala
435 440 445
Tyr Asn Cys Ala Asn Tyr Ile Gln Arg Cys Val Asp Ser Ala Leu Asn
450 455 460
Gln Thr Val Val Asp Leu Glu Val Cys Ile Cys Asn Asp Gly Ser Thr
465 470 475 480
Asp Asn Thr Leu Glu Val Ile Asn Lys Leu Tyr Gly Asn Asn Pro Arg
485 490 495
Val Arg Ile Met Ser Lys Pro Asn Gly Gly Ile Ala Ser Ala Ser Asn
500 505 510
Ala Ala Val Ser Phe Ala Lys Gly Tyr Tyr Ile Gly Gln Leu Asp Ser
515 520 525
Asp Asp Tyr Leu Glu Pro Asp Ala Val Glu Leu Cys Leu Lys Glu Phe
530 535 540
Leu Lys Asp Lys Thr Leu Ala Cys Val Tyr Thr Thr Asn Arg Asn Val
545 550 555 560
Asn Pro Asp Gly Ser Leu Ile Ala Asn Gly Tyr Asn Trp Pro Glu Phe
565 570 575
Ser Arg Glu Lys Leu Thr Thr Ala Met Ile Ala His His Phe Arg Met
580 585 590
Phe Thr Ile Arg Ala Trp His Leu Thr Asp Gly Phe Asn Glu Lys Ile
595 600 605
Glu Asn Ala Val Asp Tyr Asp Met Phe Leu Lys Leu Ser Glu Val Gly
610 615 620
Lys Phe Lys His Leu Asn Lys Ile Cys Tyr Asn Arg Val Leu His Gly
625 630 635 640
Asp Asn Thr Ser Ile Lys Lys Leu Gly Ile Gln Lys Lys Asn His Phe
645 650 655
Val Val Val Asn Gln Ser Leu Asn Arg Gln Gly Ile Thr Tyr Tyr Asn
660 665 670
Tyr Asp Glu Phe Asp Asp Leu Asp Glu Ser Arg Lys Tyr Ile Phe Asn
675 680 685
Lys Thr Ala Glu Tyr Gln Glu Glu Ile Asp Ile Leu Lys Asp Ile Lys
690 695 700
Ile Ile Gln Asn Lys Asp Ala Lys Ile Ala Val Ser Ile Phe Tyr Pro
705 710 715 720
Asn Thr Leu Asn Gly Leu Val Lys Lys Leu Asn Asn Ile Ile Glu Tyr
725 730 735
Asn Lys Asn Ile Phe Val Ile Val Leu His Val Asp Lys Asn His Leu
740 745 750
Thr Pro Asp Ile Lys Lys Glu Ile Leu Ala Phe Tyr His Lys His Gln
755 760 765
Val Asn Ile Leu Leu Asn Asn Asp Ile Ser Tyr Tyr Thr Ser Asn Arg
770 775 780
Leu Ile Lys Thr Glu Ala His Leu Ser Asn Ile Asn Lys Leu Ser Gln
785 790 795 800
Leu Asn Leu Asn Cys Glu Tyr Ile Ile Phe Asp Asn His Asp Ser Leu
805 810 815
Phe Val Lys Asn Asp Ser Tyr Ala Tyr Met Lys Lys Tyr Asp Val Gly
820 825 830
Met Asn Phe Ser Ala Leu Thr His Asp Trp Ile Glu Lys Ile Asn Ala
835 840 845
His Pro Pro Phe Lys Lys Leu Ile Lys Thr Tyr Phe Asn Asp Asn Asp
850 855 860
Leu Lys Ser Met Asn Val Lys Gly Ala Ser Gln Gly Met Phe Met Thr
865 870 875 880
Tyr Ala Leu Ala His Glu Leu Leu Thr Ile Ile Lys Glu Val Ile Thr
885 890 895
Ser Cys Gln Ser Ile Asp Ser Val Pro Glu Tyr Asn Thr Glu Asp Ile
900 905 910
Trp Phe Gln Phe Ala Leu Leu Ile Leu Glu Lys Lys Thr Gly His Val
915 920 925
Phe Asn Lys Thr Ser Thr Leu Thr Tyr Met Pro Trp Glu Arg Lys Leu
930 935 940
Gln Trp Thr Asn Glu Gln Ile Glu Ser Ala Lys Arg Gly Glu Asn Ile
945 950 955 960
Pro Val Asn Lys Phe Ile Ile Asn Ser Ile Thr Leu
965 970
<210> 21
<211> 1023
<212> PRT
<213> 其他序列
<220>
<223> 具有软骨素合酶活性的多肽的氨基酸序列(HCOS.Sc)
<400> 21
Met Asn Thr Leu Ser Gln Ala Ile Lys Ala Tyr Asn Ser Asn Asp Tyr
1 5 10 15
Gln Leu Ala Leu Lys Leu Phe Glu Lys Ser Ala Glu Ile Tyr Gly Arg
20 25 30
Lys Ile Val Glu Phe Gln Ile Thr Lys Cys Lys Glu Lys Leu Ser Ala
35 40 45
His Pro Ser Val Asn Ser Ala His Leu Ser Val Asn Lys Glu Glu Lys
50 55 60
Val Asn Val Cys Asp Ser Pro Leu Asp Ile Ala Thr Gln Leu Leu Leu
65 70 75 80
Ser Asn Val Lys Lys Leu Val Leu Ser Asp Ser Glu Lys Asn Thr Leu
85 90 95
Lys Asn Lys Trp Lys Leu Leu Thr Glu Lys Lys Ser Glu Asn Ala Glu
100 105 110
Val Arg Ala Val Ala Leu Val Pro Lys Asp Phe Pro Lys Asp Leu Val
115 120 125
Leu Ala Pro Leu Pro Asp His Val Asn Asp Phe Thr Trp Tyr Lys Asn
130 135 140
Arg Lys Lys Ser Leu Gly Ile Lys Pro Val Asn Lys Asn Ile Gly Leu
145 150 155 160
Ser Ile Ile Ile Pro Thr Phe Asn Arg Ser Arg Ile Leu Asp Ile Thr
165 170 175
Leu Ala Cys Leu Val Asn Gln Lys Thr Asn Tyr Pro Phe Glu Val Val
180 185 190
Val Ala Asp Asp Gly Ser Lys Glu Asn Leu Leu Thr Ile Val Gln Lys
195 200 205
Tyr Glu Gln Lys Leu Asp Ile Lys Tyr Val Arg Gln Lys Asp Tyr Gly
210 215 220
Tyr Gln Leu Cys Ala Val Arg Asn Leu Gly Leu Arg Thr Ala Lys Tyr
225 230 235 240
Asp Phe Val Ser Ile Leu Asp Cys Asp Met Ala Pro Gln Gln Leu Trp
245 250 255
Val His Ser Tyr Leu Thr Glu Leu Leu Glu Asp Asn Asp Ile Val Leu
260 265 270
Ile Gly Pro Arg Lys Tyr Val Asp Thr His Asn Ile Thr Ala Glu Gln
275 280 285
Phe Leu Asn Asp Pro Tyr Leu Ile Glu Ser Leu Pro Glu Thr Ala Thr
290 295 300
Asn Asn Asn Pro Ser Ile Thr Ser Lys Gly Asn Ile Ser Leu Asp Trp
305 310 315 320
Arg Leu Glu His Phe Lys Lys Thr Asp Asn Leu Arg Leu Cys Asp Ser
325 330 335
Pro Phe Arg Tyr Phe Ser Cys Gly Asn Val Ala Phe Ser Lys Glu Trp
340 345 350
Leu Asn Lys Val Gly Trp Phe Asp Glu Glu Phe Asn His Trp Gly Gly
355 360 365
Glu Asp Val Glu Phe Gly Tyr Arg Leu Phe Ala Lys Gly Cys Phe Phe
370 375 380
Arg Val Ile Asp Gly Gly Met Ala Tyr His Gln Glu Pro Pro Gly Lys
385 390 395 400
Glu Asn Glu Thr Asp Arg Glu Ala Gly Lys Ser Ile Thr Leu Lys Ile
405 410 415
Val Lys Glu Lys Val Pro Tyr Ile Tyr Arg Lys Leu Leu Pro Ile Glu
420 425 430
Asp Ser His Ile Asn Arg Val Pro Leu Val Ser Ile Tyr Ile Pro Ala
435 440 445
Tyr Asn Cys Ala Asn Tyr Ile Gln Arg Cys Val Asp Ser Ala Leu Asn
450 455 460
Gln Thr Val Val Asp Leu Glu Val Cys Ile Cys Asn Asp Gly Ser Thr
465 470 475 480
Asp Asn Thr Leu Glu Val Ile Asn Lys Leu Tyr Gly Asn Asn Pro Arg
485 490 495
Val Arg Ile Met Ser Lys Pro Asn Gly Gly Ile Ala Ser Ala Ser Asn
500 505 510
Ala Ala Val Ser Phe Ala Lys Gly Tyr Tyr Ile Gly Gln Leu Asp Ser
515 520 525
Asp Asp Tyr Leu Glu Pro Asp Ala Val Glu Leu Cys Leu Lys Glu Phe
530 535 540
Leu Lys Asp Lys Thr Leu Ala Cys Val Tyr Thr Thr Asn Arg Asn Val
545 550 555 560
Asn Pro Asp Gly Ser Leu Ile Ala Asn Gly Tyr Asn Trp Pro Glu Phe
565 570 575
Ser Arg Glu Lys Leu Thr Thr Ala Met Ile Ala His His Phe Arg Met
580 585 590
Phe Thr Ile Arg Ala Trp His Leu Thr Asp Gly Phe Asn Glu Lys Ile
595 600 605
Glu Asn Ala Val Asp Tyr Asp Met Phe Leu Lys Leu Ser Glu Val Gly
610 615 620
Lys Phe Lys His Leu Asn Lys Ile Cys Tyr Asn Arg Val Leu His Gly
625 630 635 640
Asp Asn Thr Ser Ile Lys Lys Leu Gly Ile Gln Lys Lys Asn His Phe
645 650 655
Val Val Val Asn Gln Ser Leu Asn Arg Gln Gly Ile Thr Tyr Tyr Asn
660 665 670
Tyr Asp Glu Phe Asp Asp Leu Asp Glu Ser Arg Lys Tyr Ile Phe Asn
675 680 685
Lys Thr Ala Glu Tyr Gln Glu Glu Ile Asp Ile Leu Lys Asp Ile Phe
690 695 700
Ile Gln Met Leu Phe Ser Trp Phe Ser Ile Ala Asn Phe Val Leu Thr
705 710 715 720
Phe Tyr Tyr Leu Ala Gly Ser Met Asn Leu Val Ile Lys His Gly Glu
725 730 735
Ala Leu Phe Ile Phe Phe Lys Tyr Leu Ile Phe Cys Asp Leu Ala Ser
740 745 750
Leu Phe Ile Ile Ser Met Gly Asn Arg Pro Gln Gly Ala Lys His Leu
755 760 765
Phe Ile Thr Ser Met Val Ile Leu Ser Ile Cys Ala Thr Tyr Ser Leu
770 775 780
Ile Cys Gly Phe Val Phe Ala Phe Lys Ser Leu Ala Ser Gly Thr Glu
785 790 795 800
Ser His Lys Ile Phe Val Asp Ile Val Ile Ser Leu Leu Ser Thr Tyr
805 810 815
Gly Leu Tyr Phe Phe Ser Ser Leu Met Tyr Leu Asp Pro Trp His Met
820 825 830
Phe Thr Ser Ser Ile Gln Tyr Phe Leu Thr Leu Pro Ala Phe Thr Cys
835 840 845
Thr Leu Gln Ile Phe Ala Phe Cys Asn Thr His Asp Val Ser Trp Gly
850 855 860
Thr Lys Gly Ser Thr Gln Glu Ser Lys Gln Leu Ser Lys Ala Ile Val
865 870 875 880
Val Gln Gly Pro Asp Gly Lys Gln Ile Val Glu Thr Asp Trp Pro Gln
885 890 895
Glu Val Asp Lys Lys Phe Leu Glu Ile Lys Ser Arg Leu Lys Glu Pro
900 905 910
Glu Phe Glu Glu Ser Ser Gly Asn Glu Lys Gln Ser Lys Asn Asp Tyr
915 920 925
Tyr Arg Asp Ile Arg Thr Arg Ile Val Met Ile Trp Met Leu Ser Asn
930 935 940
Leu Ile Leu Ile Met Ser Ile Ile Gln Val Phe Thr Pro Gln Asp Thr
945 950 955 960
Asp Asn Gly Tyr Leu Ile Phe Ile Leu Trp Ser Val Ala Ala Leu Ala
965 970 975
Ala Phe Arg Val Val Gly Ser Met Ala Phe Leu Phe Met Lys Tyr Leu
980 985 990
Arg Ile Ile Val Ser Tyr Arg Asn Lys Val Glu Gly Ser Gly Ser Trp
995 1000 1005
Glu Val Ser Lys Leu Asp Leu Pro Asn Val Phe His Lys Lys Gly
1010 1015 1020
<210> 22
<211> 1023
<212> PRT
<213> 其他序列
<220>
<223> 具有软骨素合酶活性的多肽的氨基酸序列(HHASA.Sc)
<400> 22
Met Asn Thr Leu Ser Gln Ala Ile Lys Ala Tyr Asn Ser Asn Asp Tyr
1 5 10 15
Gln Leu Ala Leu Lys Leu Phe Glu Lys Ser Ala Glu Ile Tyr Gly Arg
20 25 30
Lys Ile Val Glu Phe Gln Ile Thr Lys Cys Lys Glu Lys Leu Ser Ala
35 40 45
His Pro Ser Val Asn Ser Ala His Leu Ser Val Asn Lys Glu Glu Lys
50 55 60
Val Asn Val Cys Asp Ser Pro Leu Asp Ile Ala Thr Gln Leu Leu Leu
65 70 75 80
Ser Asn Val Lys Lys Leu Val Leu Ser Asp Ser Glu Lys Asn Thr Leu
85 90 95
Lys Asn Lys Trp Lys Leu Leu Thr Glu Lys Lys Ser Glu Asn Ala Glu
100 105 110
Val Arg Ala Val Ala Leu Val Pro Lys Asp Phe Pro Lys Asp Leu Val
115 120 125
Leu Ala Pro Leu Pro Asp His Val Asn Asp Phe Thr Trp Tyr Lys Lys
130 135 140
Arg Lys Lys Arg Leu Gly Ile Lys Pro Glu His Gln His Val Gly Leu
145 150 155 160
Ser Ile Ile Val Thr Thr Phe Asn Arg Pro Ala Ile Leu Ser Ile Thr
165 170 175
Leu Ala Cys Leu Val Asn Gln Lys Thr His Tyr Pro Phe Glu Val Ile
180 185 190
Val Thr Asp Asp Gly Ser Gln Glu Asp Leu Ser Pro Ile Ile Arg Gln
195 200 205
Tyr Glu Asn Lys Leu Asp Ile Arg Tyr Val Arg Gln Lys Asp Asn Gly
210 215 220
Phe Gln Ala Ser Ala Ala Arg Asn Met Gly Leu Arg Leu Ala Lys Tyr
225 230 235 240
Asp Phe Ile Gly Leu Leu Asp Cys Asp Met Ala Pro Asn Pro Leu Trp
245 250 255
Val His Ser Tyr Val Ala Glu Leu Leu Glu Asp Asp Asp Leu Thr Ile
260 265 270
Ile Gly Pro Arg Lys Tyr Ile Asp Thr Gln His Ile Asp Pro Lys Asp
275 280 285
Phe Leu Asn Asn Ala Ser Leu Leu Glu Ser Leu Pro Glu Val Lys Thr
290 295 300
Asn Asn Ser Val Ala Ala Lys Gly Glu Gly Thr Val Ser Leu Asp Trp
305 310 315 320
Arg Leu Glu Gln Phe Glu Lys Thr Glu Asn Leu Arg Leu Ser Asp Ser
325 330 335
Pro Phe Arg Phe Phe Ala Ala Gly Asn Val Ala Phe Ala Lys Lys Trp
340 345 350
Leu Asn Lys Ser Gly Phe Phe Asp Glu Glu Phe Asn His Trp Gly Gly
355 360 365
Glu Asp Val Glu Phe Gly Tyr Arg Leu Phe Arg Tyr Gly Ser Phe Phe
370 375 380
Lys Thr Ile Asp Gly Ile Met Ala Tyr His Gln Glu Pro Pro Gly Lys
385 390 395 400
Glu Asn Glu Thr Asp Arg Glu Ala Gly Lys Asn Ile Thr Leu Asp Ile
405 410 415
Met Arg Glu Lys Val Pro Tyr Ile Tyr Arg Lys Leu Leu Pro Ile Glu
420 425 430
Asp Ser His Ile Asn Arg Val Pro Leu Val Ser Ile Tyr Ile Pro Ala
435 440 445
Tyr Asn Cys Ala Asn Tyr Ile Gln Arg Cys Val Asp Ser Ala Leu Asn
450 455 460
Gln Thr Val Val Asp Leu Glu Val Cys Ile Cys Asn Asp Gly Ser Thr
465 470 475 480
Asp Asn Thr Leu Glu Val Ile Asn Lys Leu Tyr Gly Asn Asn Pro Arg
485 490 495
Val Arg Ile Met Ser Lys Pro Asn Gly Gly Ile Ala Ser Ala Ser Asn
500 505 510
Ala Ala Val Ser Phe Ala Lys Gly Tyr Tyr Ile Gly Gln Leu Asp Ser
515 520 525
Asp Asp Tyr Leu Glu Pro Asp Ala Val Glu Leu Cys Leu Lys Glu Phe
530 535 540
Leu Lys Asp Lys Thr Leu Ala Cys Val Tyr Thr Thr Asn Arg Asn Val
545 550 555 560
Asn Pro Asp Gly Ser Leu Ile Ala Asn Gly Tyr Asn Trp Pro Glu Phe
565 570 575
Ser Arg Glu Lys Leu Thr Thr Ala Met Ile Ala His His Phe Arg Met
580 585 590
Phe Thr Ile Arg Ala Trp His Leu Thr Asp Gly Phe Asn Glu Lys Ile
595 600 605
Glu Asn Ala Val Asp Tyr Asp Met Phe Leu Lys Leu Ser Glu Val Gly
610 615 620
Lys Phe Lys His Leu Asn Lys Ile Cys Tyr Asn Arg Val Leu His Gly
625 630 635 640
Asp Asn Thr Ser Ile Lys Lys Leu Gly Ile Gln Lys Lys Asn His Phe
645 650 655
Val Val Val Asn Gln Ser Leu Asn Arg Gln Gly Ile Thr Tyr Tyr Asn
660 665 670
Tyr Asp Glu Phe Asp Asp Leu Asp Glu Ser Arg Lys Tyr Ile Phe Asn
675 680 685
Lys Thr Ala Glu Tyr Gln Glu Glu Ile Asp Ile Leu Lys Asp Ile Phe
690 695 700
Ile Gln Met Leu Phe Ser Trp Phe Ser Ile Ala Asn Phe Val Leu Thr
705 710 715 720
Phe Tyr Tyr Leu Ala Gly Ser Met Asn Leu Val Ile Lys His Gly Glu
725 730 735
Ala Leu Phe Ile Phe Phe Lys Tyr Leu Ile Phe Cys Asp Leu Ala Ser
740 745 750
Leu Phe Ile Ile Ser Met Gly Asn Arg Pro Gln Gly Ala Lys His Leu
755 760 765
Phe Ile Thr Ser Met Val Ile Leu Ser Ile Cys Ala Thr Tyr Ser Leu
770 775 780
Ile Cys Gly Phe Val Phe Ala Phe Lys Ser Leu Ala Ser Gly Thr Glu
785 790 795 800
Ser His Lys Ile Phe Val Asp Ile Val Ile Ser Leu Leu Ser Thr Tyr
805 810 815
Gly Leu Tyr Phe Phe Ser Ser Leu Met Tyr Leu Asp Pro Trp His Met
820 825 830
Phe Thr Ser Ser Ile Gln Tyr Phe Leu Thr Leu Pro Ala Phe Thr Cys
835 840 845
Thr Leu Gln Ile Phe Ala Phe Cys Asn Thr His Asp Val Ser Trp Gly
850 855 860
Thr Lys Gly Ser Thr Gln Glu Ser Lys Gln Leu Ser Lys Ala Ile Val
865 870 875 880
Val Gln Gly Pro Asp Gly Lys Gln Ile Val Glu Thr Asp Trp Pro Gln
885 890 895
Glu Val Asp Lys Lys Phe Leu Glu Ile Lys Ser Arg Leu Lys Glu Pro
900 905 910
Glu Phe Glu Glu Ser Ser Gly Asn Glu Lys Gln Ser Lys Asn Asp Tyr
915 920 925
Tyr Arg Asp Ile Arg Thr Arg Ile Val Met Ile Trp Met Leu Ser Asn
930 935 940
Leu Ile Leu Ile Met Ser Ile Ile Gln Val Phe Thr Pro Gln Asp Thr
945 950 955 960
Asp Asn Gly Tyr Leu Ile Phe Ile Leu Trp Ser Val Ala Ala Leu Ala
965 970 975
Ala Phe Arg Val Val Gly Ser Met Ala Phe Leu Phe Met Lys Tyr Leu
980 985 990
Arg Ile Ile Val Ser Tyr Arg Asn Lys Val Glu Gly Ser Gly Ser Trp
995 1000 1005
Glu Val Ser Lys Leu Asp Leu Pro Asn Val Phe His Lys Lys Gly
1010 1015 1020
<210> 23
<211> 572
<212> PRT
<213> 其他序列
<220>
<223> 具有软骨素合酶活性的多肽的氨基酸序列(HCOS1-Vir)
<400> 23
Met Gly Lys Asn Ile Ile Ile Met Val Ser Trp Tyr Thr Ile Ile Thr
1 5 10 15
Ser Asn Leu Ile Ala Val Gly Gly Ala Ser Leu Ile Leu Ala Pro Ala
20 25 30
Ile Thr Gly Tyr Val Leu His Trp Asn Ile Ala Leu Ser Thr Ile Trp
35 40 45
Gly Val Ser Ala Tyr Gly Ile Phe Val Phe Gly Phe Phe Leu Ala Gln
50 55 60
Val Leu Phe Ser Glu Leu Asn Arg Lys Arg Leu Arg Lys Trp Ile Ser
65 70 75 80
Leu Arg Pro Lys Gly Trp Asn Asp Val Arg Leu Ala Val Ile Ile Ala
85 90 95
Gly Tyr Arg Glu Asp Pro Tyr Met Phe Gln Lys Cys Leu Glu Ser Val
100 105 110
Arg Asp Ser Asp Tyr Gly Asn Val Ala Arg Leu Ile Cys Val Ile Asp
115 120 125
Gly Asp Glu Asp Asp Asp Met Arg Met Ala Ala Val Tyr Lys Ala Ile
130 135 140
Tyr Asn Asp Asn Ile Lys Lys Pro Glu Phe Val Leu Cys Glu Ser Asp
145 150 155 160
Asp Lys Glu Gly Glu Arg Ile Asp Ser Asp Phe Ser Arg Asp Ile Cys
165 170 175
Val Leu Gln Pro His Arg Gly Lys Arg Glu Cys Leu Tyr Thr Gly Phe
180 185 190
Gln Leu Ala Lys Met Asp Pro Ser Val Asn Ala Val Val Leu Ile Asp
195 200 205
Ser Asp Thr Val Leu Glu Lys Asp Ala Ile Leu Glu Val Val Tyr Pro
210 215 220
Leu Ala Cys Asp Pro Glu Ile Gln Ala Val Ala Gly Glu Cys Lys Ile
225 230 235 240
Trp Asn Thr Asp Thr Leu Leu Ser Leu Leu Val Ala Trp Arg Tyr Tyr
245 250 255
Ser Ala Phe Cys Val Glu Arg Ser Ala Gln Ser Phe Phe Arg Thr Val
260 265 270
Gln Cys Val Gly Gly Pro Leu Gly Ala Tyr Lys Ile Asp Ile Ile Lys
275 280 285
Glu Ile Lys Asp Pro Trp Ile Ser Gln Arg Phe Leu Gly Gln Lys Cys
290 295 300
Thr Tyr Gly Asp Asp Arg Arg Leu Thr Asn Glu Ile Leu Met Arg Gly
305 310 315 320
Lys Lys Val Val Phe Thr Pro Phe Ala Val Gly Trp Gly Trp Phe Asp
325 330 335
Glu Glu Phe Thr His Trp Gly Gly Arg Tyr Ile Val Gln Gln Thr Arg
340 345 350
Trp Ser Lys Ser Trp Cys Arg Glu Ile Trp Tyr Thr Leu Phe Ala Ala
355 360 365
Trp Lys His Gly Leu Ser Gly Ile Trp Leu Ala Phe Glu Cys Leu Tyr
370 375 380
Gln Ile Thr Tyr Phe Phe Leu Val Ile Tyr Leu Phe Ser Arg Leu Ala
385 390 395 400
Val Glu Ala Asp Pro Arg Ala Gln Thr Ala Thr Val Ile Val Ser Thr
405 410 415
Thr Val Ala Leu Ile Lys Cys Gly Tyr Phe Ser Phe Arg Ala Lys Asp
420 425 430
Ile Arg Ala Phe Tyr Phe Val Leu Tyr Thr Phe Val Tyr Phe Phe Cys
435 440 445
Met Ile Pro Ala Arg Ile Thr Ala Met Met Thr Leu Trp Asp Ile Gly
450 455 460
Trp Gly Thr Arg Gly Gly Asn Glu Lys Pro Ser Val Gly Thr Arg Val
465 470 475 480
Ala Leu Trp Ala Lys Gln Tyr Leu Ile Ala Tyr Met Trp Trp Ala Ala
485 490 495
Val Val Gly Ala Gly Val Tyr Ser Ile Val His Asn Trp Met Phe Asp
500 505 510
Trp Asn Ser Leu Ser Tyr Arg Phe Ala Leu Val Gly Ile Cys Ser Tyr
515 520 525
Ile Val Phe Ile Val Ile Val Leu Val Val Tyr Phe Thr Gly Lys Ile
530 535 540
Thr Thr Trp Asn Phe Thr Lys Leu Gln Lys Glu Leu Ile Glu Asp Arg
545 550 555 560
Val Leu Tyr Asp Ala Thr Thr Asn Ala Gln Ser Val
565 570
<210> 24
<211> 571
<212> PRT
<213> 其他序列
<220>
<223> 具有软骨素合酶活性的多肽的重编码氨基酸序列(HCOS2-Vir)
<400> 24
Met Gly Lys Asn Ile Ile Ile Met Val Ser Trp Tyr Thr Ile Ile Thr
1 5 10 15
Ser Asn Leu Ile Ala Val Gly Gly Ala Ser Leu Ile Leu Ala Pro Ala
20 25 30
Ile Thr Gly Tyr Val Leu His Trp Asn Ile Ala Leu Ser Thr Ile Trp
35 40 45
Gly Val Ser Ala Tyr Gly Ile Phe Val Phe Gly Phe Phe Leu Ala Gln
50 55 60
Val Leu Phe Ser Glu Leu Asn Arg Lys Arg Leu Arg Lys Trp Ile Ser
65 70 75 80
Leu Arg Pro Lys Gly Trp Asn Asp Val Arg Leu Ala Val Ile Ile Ala
85 90 95
Gly Tyr Arg Glu Asp Pro Tyr Met Phe Gln Lys Cys Leu Glu Ser Val
100 105 110
Arg Asp Ser Asp Tyr Gly Asn Val Ala Arg Leu Ile Cys Val Ile Asp
115 120 125
Gly Asp Glu Asp Asp Asp Met Arg Met Ala Ala Val Tyr Lys Ala Ile
130 135 140
Tyr Asn Asp Asn Ile Lys Lys Pro Glu Phe Val Leu Cys Glu Ser Asp
145 150 155 160
Asp Lys Glu Gly Glu Arg Ile Asp Ser Asp Phe Ser Arg Asp Ile Cys
165 170 175
Val Leu Gln Pro His Arg Gly Lys Arg Glu Cys Leu Tyr Thr Gly Phe
180 185 190
Gln Leu Ala Lys Met Asp Pro Ser Val Asn Ala Val Val Leu Ile Asp
195 200 205
Ser Asp Thr Val Leu Glu Lys Asp Ala Ile Leu Glu Val Val Tyr Pro
210 215 220
Leu Ala Cys Asp Pro Glu Ile Gln Ala Val Ala Gly Glu Cys Lys Ile
225 230 235 240
Trp Asn Thr Asp Thr Leu Leu Ser Leu Leu Val Ala Trp Arg Tyr Tyr
245 250 255
Ser Ala Phe Cys Val Glu Arg Ser Ala Gln Ser Phe Phe Arg Thr Val
260 265 270
Gln Cys Val Gly Gly Pro Leu Gly Ala Tyr Lys Ile Asp Ile Ile Lys
275 280 285
Glu Ile Lys Asp Pro Trp Ile Ser Gln Arg Phe Leu Gly Gln Lys Cys
290 295 300
Thr Tyr Gly Asp Asp Arg Arg Leu Thr Asn Glu Ile Leu Met Arg Gly
305 310 315 320
Lys Lys Val Val Phe Thr Pro Phe Ala Val Gly Trp Leu His Gly Glu
325 330 335
Asn Thr Ser Ile Lys Lys Leu Arg Tyr Ile Val Gln Gln Thr Arg Trp
340 345 350
Ser Lys Ser Trp Cys Arg Glu Ile Trp Tyr Thr Leu Phe Ala Ala Trp
355 360 365
Lys His Gly Leu Ser Gly Ile Trp Leu Ala Phe Glu Cys Leu Tyr Gln
370 375 380
Ile Thr Tyr Phe Phe Leu Val Ile Tyr Leu Phe Ser Arg Leu Ala Val
385 390 395 400
Glu Ala Asp Pro Arg Ala Gln Thr Ala Thr Val Ile Val Ser Thr Thr
405 410 415
Val Ala Leu Ile Lys Cys Gly Tyr Phe Ser Phe Arg Ala Lys Asp Ile
420 425 430
Arg Ala Phe Tyr Phe Val Leu Tyr Thr Phe Val Tyr Phe Phe Cys Met
435 440 445
Ile Pro Ala Arg Ile Thr Ala Met Met Thr Leu Trp Asp Ile Gly Trp
450 455 460
Gly Thr Arg Gly Gly Asn Glu Lys Pro Ser Val Gly Thr Arg Val Ala
465 470 475 480
Leu Trp Ala Lys Gln Tyr Leu Ile Ala Tyr Met Trp Trp Ala Ala Val
485 490 495
Val Gly Ala Gly Val Tyr Ser Ile Val His Asn Trp Met Phe Asp Trp
500 505 510
Asn Ser Leu Ser Tyr Arg Phe Ala Leu Val Gly Ile Cys Ser Tyr Ile
515 520 525
Val Phe Ile Val Ile Val Leu Val Val Tyr Phe Thr Gly Lys Ile Thr
530 535 540
Thr Trp Asn Phe Thr Lys Leu Gln Lys Glu Leu Ile Glu Asp Arg Val
545 550 555 560
Leu Tyr Asp Ala Thr Thr Asn Ala Gln Ser Val
565 570
<210> 25
<211> 572
<212> PRT
<213> 其他序列
<220>
<223> 具有软骨素合酶活性的多肽的重编码氨基酸序列(HCOS3-Vir)
<400> 25
Met Gly Lys Asn Ile Ile Ile Met Val Ser Trp Tyr Thr Ile Ile Thr
1 5 10 15
Ser Asn Leu Ile Ala Val Gly Gly Ala Ser Leu Ile Leu Ala Pro Ala
20 25 30
Ile Thr Gly Tyr Val Leu His Trp Asn Ile Ala Leu Ser Thr Ile Trp
35 40 45
Gly Val Ser Ala Tyr Gly Ile Phe Val Phe Gly Phe Phe Leu Ala Gln
50 55 60
Val Leu Phe Ser Glu Leu Asn Arg Lys Arg Leu Arg Lys Trp Ile Ser
65 70 75 80
Leu Arg Pro Lys Gly Trp Asn Asp Val Arg Leu Ala Val Ile Ile Ala
85 90 95
Gly Tyr Arg Glu Asp Pro Tyr Met Phe Gln Lys Cys Leu Glu Ser Val
100 105 110
Arg Asp Ser Asp Tyr Gly Asn Val Ala Arg Leu Ile Cys Val Ile Asp
115 120 125
Gly Asp Glu Asp Asp Asp Met Arg Met Ala Ala Val Tyr Lys Ala Ile
130 135 140
Tyr Asn Asp Asn Ile Lys Lys Pro Glu Phe Val Leu Cys Glu Ser Asp
145 150 155 160
Asp Lys Glu Gly Glu Arg Ile Asp Ser Asp Phe Ser Arg Asp Ile Cys
165 170 175
Val Leu Gln Pro His Arg Gly Lys Arg Glu Cys Leu Tyr Thr Gly Phe
180 185 190
Gln Leu Ala Lys Met Asp Pro Ser Val Asn Ala Val Val Leu Ile Asp
195 200 205
Ser Asp Thr Val Leu Glu Lys Asp Ala Ile Leu Glu Val Val Tyr Pro
210 215 220
Leu Ala Cys Asp Pro Glu Ile Gln Ala Val Ala Gly Glu Cys Lys Ile
225 230 235 240
Trp Asn Thr Asp Thr Leu Leu Ser Leu Leu Val Ala Trp Arg Tyr Tyr
245 250 255
Ser Ala Phe Cys Val Glu Arg Ser Ala Gln Ser Phe Phe Arg Thr Val
260 265 270
Gln Cys Val Gly Gly Pro Leu Gly Ala Tyr Lys Ile Asp Ile Ile Lys
275 280 285
Glu Ile Lys Asp Pro Trp Ile Ser Gln Arg Phe Leu Gly Gln Lys Cys
290 295 300
Thr Tyr Gly Asp Asp Arg Arg Leu Thr Asn Glu Ile Leu Met Arg Gly
305 310 315 320
Lys Lys Val Val Phe Thr Pro Phe Ala Val Gly Trp His Met Ala Trp
325 330 335
Ser Asp Lys Asp Asp Ala Ile Asp Arg Tyr Ile Val Gln Gln Thr Arg
340 345 350
Trp Ser Lys Ser Trp Cys Arg Glu Ile Trp Tyr Thr Leu Phe Ala Ala
355 360 365
Trp Lys His Gly Leu Ser Gly Ile Trp Leu Ala Phe Glu Cys Leu Tyr
370 375 380
Gln Ile Thr Tyr Phe Phe Leu Val Ile Tyr Leu Phe Ser Arg Leu Ala
385 390 395 400
Val Glu Ala Asp Pro Arg Ala Gln Thr Ala Thr Val Ile Val Ser Thr
405 410 415
Thr Val Ala Leu Ile Lys Cys Gly Tyr Phe Ser Phe Arg Ala Lys Asp
420 425 430
Ile Arg Ala Phe Tyr Phe Val Leu Tyr Thr Phe Val Tyr Phe Phe Cys
435 440 445
Met Ile Pro Ala Arg Ile Thr Ala Met Met Thr Leu Trp Asp Ile Gly
450 455 460
Trp Gly Thr Arg Gly Gly Asn Glu Lys Pro Ser Val Gly Thr Arg Val
465 470 475 480
Ala Leu Trp Ala Lys Gln Tyr Leu Ile Ala Tyr Met Trp Trp Ala Ala
485 490 495
Val Val Gly Ala Gly Val Tyr Ser Ile Val His Asn Trp Met Phe Asp
500 505 510
Trp Asn Ser Leu Ser Tyr Arg Phe Ala Leu Val Gly Ile Cys Ser Tyr
515 520 525
Ile Val Phe Ile Val Ile Val Leu Val Val Tyr Phe Thr Gly Lys Ile
530 535 540
Thr Thr Trp Asn Phe Thr Lys Leu Gln Lys Glu Leu Ile Glu Asp Arg
545 550 555 560
Val Leu Tyr Asp Ala Thr Thr Asn Ala Gln Ser Val
565 570
<210> 26
<211> 570
<212> PRT
<213> 其他序列
<220>
<223> 具有软骨素合酶活性的多肽的重编码氨基酸序列(HCOS4-Vir)
<400> 26
Met Gly Lys Asn Ile Ile Ile Met Val Ser Trp Tyr Thr Ile Ile Thr
1 5 10 15
Ser Asn Leu Ile Ala Val Gly Gly Ala Ser Leu Ile Leu Ala Pro Ala
20 25 30
Ile Thr Gly Tyr Val Leu His Trp Asn Ile Ala Leu Ser Thr Ile Trp
35 40 45
Gly Val Ser Ala Tyr Gly Ile Phe Val Phe Gly Phe Phe Leu Ala Gln
50 55 60
Val Leu Phe Ser Glu Leu Asn Arg Lys Arg Leu Arg Lys Trp Ile Ser
65 70 75 80
Leu Arg Pro Lys Gly Trp Asn Asp Val Arg Leu Ala Val Ile Ile Ala
85 90 95
Gly Tyr Arg Glu Asp Pro Tyr Met Phe Gln Lys Cys Leu Glu Ser Val
100 105 110
Arg Asp Ser Asp Tyr Gly Asn Val Ala Arg Leu Ile Cys Val Ile Asp
115 120 125
Gly Asp Glu Asp Asp Asp Met Arg Met Ala Ala Val Tyr Lys Ala Ile
130 135 140
Tyr Asn Asp Asn Ile Lys Lys Pro Glu Phe Val Leu Cys Glu Ser Asp
145 150 155 160
Asp Lys Glu Gly Glu Arg Ile Asp Ser Asp Phe Ser Arg Asp Ile Cys
165 170 175
Val Leu Gln Pro His Arg Gly Lys Arg Glu Cys Leu Tyr Thr Gly Phe
180 185 190
Gln Leu Ala Lys Met Asp Pro Ser Val Asn Ala Val Val Leu Ile Asp
195 200 205
Ser Asp Thr Val Leu Glu Lys Asp Ala Ile Leu Glu Val Val Tyr Pro
210 215 220
Leu Ala Cys Asp Pro Glu Ile Gln Ala Val Ala Gly Glu Cys Lys Ile
225 230 235 240
Trp Asn Thr Asp Thr Leu Leu Ser Leu Leu Val Ala Trp Arg Tyr Tyr
245 250 255
Ser Ala Phe Cys Val Glu Arg Ser Ala Gln Ser Phe Phe Arg Thr Val
260 265 270
Gln Cys Val Gly Gly Pro Leu Gly Ala Tyr Lys Ile Asp Ile Ile Lys
275 280 285
Glu Ile Lys Asp Pro Trp Ile Ser Gln Arg Phe Leu Gly Gln Lys Cys
290 295 300
Thr Tyr Gly Asp Asp Arg Arg Leu Thr Asn Glu Ile Leu Met Arg Gly
305 310 315 320
Lys Lys Val Val Phe Thr Pro Phe Ala Val Gly Trp Phe Asp Glu Glu
325 330 335
Phe Thr His Trp Gly Gly Arg Tyr Ile Val Gln Gln Thr Arg Trp Ser
340 345 350
Lys Ser Trp Cys Arg Glu Ile Trp Tyr Thr Leu Phe Ala Ala Trp Lys
355 360 365
His Gly Leu Ser Gly Ile Trp Leu Ala Phe Glu Cys Leu Tyr Gln Ile
370 375 380
Thr Tyr Phe Phe Leu Val Ile Tyr Leu Phe Ser Arg Leu Ala Val Glu
385 390 395 400
Ala Asp Pro Arg Ala Gln Thr Ala Thr Val Ile Val Ser Thr Thr Val
405 410 415
Ala Leu Ile Lys Cys Gly Tyr Phe Ser Phe Arg Ala Lys Asp Ile Arg
420 425 430
Ala Phe Tyr Phe Val Leu Tyr Thr Phe Val Tyr Phe Phe Cys Met Ile
435 440 445
Pro Ala Arg Ile Thr Ala Met Met Thr Leu Trp Asp Ile Gly Trp Gly
450 455 460
Thr Arg Gly Gly Asn Glu Lys Pro Ser Val Gly Thr Arg Val Ala Leu
465 470 475 480
Trp Ala Lys Gln Tyr Leu Ile Ala Tyr Met Trp Trp Ala Ala Val Val
485 490 495
Gly Ala Gly Val Tyr Ser Ile Val His Asn Trp Met Phe Asp Trp Asn
500 505 510
Ser Leu Ser Tyr Arg Phe Ala Leu Val Gly Ile Cys Ser Tyr Ile Val
515 520 525
Phe Ile Val Ile Val Leu Val Val Tyr Phe Thr Gly Lys Ile Thr Thr
530 535 540
Trp Asn Phe Thr Lys Leu Gln Lys Glu Leu Ile Glu Asp Arg Val Leu
545 550 555 560
Tyr Asp Ala Thr Thr Asn Ala Gln Ser Val
565 570
<210> 27
<211> 692
<212> PRT
<213> 其他序列
<220>
<223> 具有软骨素合酶活性的多肽的氨基酸序列(HCOS5-Vir)
<400> 27
Met Gly Lys Asn Ile Ile Ile Met Val Ser Trp Tyr Thr Ile Ile Thr
1 5 10 15
Ser Asn Leu Ile Ala Val Gly Gly Ala Ser Leu Ile Leu Ala Pro Ala
20 25 30
Ile Thr Gly Tyr Val Leu His Trp Asn Ile Ala Leu Ser Thr Ile Trp
35 40 45
Gly Val Ser Ala Tyr Gly Ile Phe Val Phe Gly Phe Phe Leu Ala Gln
50 55 60
Val Leu Phe Ser Glu Leu Asn Arg Lys Arg Leu Arg Lys Trp Ile Ser
65 70 75 80
Leu Arg Pro Lys Ser Ile His His Pro Ile Ser Lys Thr Thr His Pro
85 90 95
Asp Thr Glu Asn Ala Gly Asp Ser Thr Leu Leu Cys Pro Pro Met Asp
100 105 110
Gly Met Asp Asp Ile Leu Val Val Met Lys Thr Gly Val Thr Glu Ala
115 120 125
Lys Glu Lys Val Pro Val His Phe Gln Thr Thr Leu Arg Cys Val Pro
130 135 140
His Tyr Val Ile Tyr Ser Asp Phe Glu Glu Glu Ile Glu Gly Val Lys
145 150 155 160
Ile Tyr Asp Val Leu Gln Gly Met Asp Pro Asp Val Met Thr Gln Val
165 170 175
Pro Asp Phe Asp Leu Tyr Asn Arg Ile Lys Lys Leu Gly Arg Gln Gly
180 185 190
Leu Ala Glu Asn Asp Phe Ala Asp Glu Ala Asn Ser Ala Val Gly Lys
195 200 205
Pro Asn Asn Pro Gly Trp Lys Leu Asp Lys Trp Lys Phe Leu Pro Met
210 215 220
Ile Ile Glu Ala Leu Arg Tyr Lys Pro Lys Ala Lys Trp Tyr Val Phe
225 230 235 240
Met Glu Ala Asp Thr Tyr Ile Ser Trp Pro Thr Leu Leu Ala Trp Leu
245 250 255
Lys His Phe Asn His Lys Lys Pro Trp Tyr Leu Gly Thr Glu Thr Gln
260 265 270
Ile Ala Asp Val Ile Phe Ala His Gly Gly Ser Gly Phe Met Ile Ser
275 280 285
His Ala Ala Leu Lys Leu Ala Ala Glu Glu Tyr Thr Ala Arg Arg Thr
290 295 300
Glu Leu His His Tyr Thr Asp Gly His Trp Ala Gly Asp Cys Val Leu
305 310 315 320
Gly Lys Val Leu Ala Asp Ala Gly Val Asn Leu His Phe Ser Trp Pro
325 330 335
Ile Leu Gln Asn Ser Asn Leu Gly Glu Leu Asp Glu Phe Asn Val Asp
340 345 350
Leu Tyr Arg Gln Pro Trp Cys Phe Pro Ala Ala Ala Phe His His Leu
355 360 365
Asn Ala Gln Lys Ile Gln Asp Leu Trp Ser Tyr Glu Gln Lys Arg Trp
370 375 380
Gln Asp Lys Asp Lys Arg Val Leu Leu His Ser Asp Val Phe Arg Asp
385 390 395 400
Leu Leu Tyr Pro Asp Ile Ala Leu Lys Pro Ala Arg Ile Gly Trp Asp
405 410 415
Asn Leu Ser Ala Asp Glu Gln Ser Thr Ala Ser Ser Phe Glu Glu Cys
420 425 430
Arg Gln Ile Cys Asp Gln Leu Asp Asp Cys Thr Gln Phe Ser Phe Arg
435 440 445
Asp Lys Ser Cys Phe Thr Ser Arg Thr Pro Arg Leu Gly Ala Ala Asn
450 455 460
Pro Asn Thr Val Ser Gly Trp Met Val Asp Arg Ile Arg Ala Asn Met
465 470 475 480
Glu Lys Ser Gly Leu Phe Ala Ala Trp Lys His Gly Leu Ser Gly Ile
485 490 495
Trp Leu Ala Phe Glu Cys Leu Tyr Gln Ile Thr Tyr Phe Phe Leu Val
500 505 510
Ile Tyr Leu Phe Ser Arg Leu Ala Val Glu Ala Asp Pro Arg Ala Gln
515 520 525
Thr Ala Thr Val Ile Val Ser Thr Thr Val Ala Leu Ile Lys Cys Gly
530 535 540
Tyr Phe Ser Phe Arg Ala Lys Asp Ile Arg Ala Phe Tyr Phe Val Leu
545 550 555 560
Tyr Thr Phe Val Tyr Phe Phe Cys Met Ile Pro Ala Arg Ile Thr Ala
565 570 575
Met Met Thr Leu Trp Asp Ile Gly Trp Gly Thr Arg Gly Gly Asn Glu
580 585 590
Lys Pro Ser Val Gly Thr Arg Val Ala Leu Trp Ala Lys Gln Tyr Leu
595 600 605
Ile Ala Tyr Met Trp Trp Ala Ala Val Val Gly Ala Gly Val Tyr Ser
610 615 620
Ile Val His Asn Trp Met Phe Asp Trp Asn Ser Leu Ser Tyr Arg Phe
625 630 635 640
Ala Leu Val Gly Ile Cys Ser Tyr Ile Val Phe Ile Val Ile Val Leu
645 650 655
Val Val Tyr Phe Thr Gly Lys Ile Thr Thr Trp Asn Phe Thr Lys Leu
660 665 670
Gln Lys Glu Leu Ile Glu Asp Arg Val Leu Tyr Asp Ala Thr Thr Asn
675 680 685
Ala Gln Ser Val
690
<210> 28
<211> 910
<212> PRT
<213> 其他序列
<220>
<223> 具有软骨素合酶活性的多肽的氨基酸序列(HCOS6-Vir)
<400> 28
Met Gly Lys Asn Ile Ile Ile Met Val Ser Trp Tyr Thr Ile Ile Thr
1 5 10 15
Ser Asn Leu Ile Ala Val Gly Gly Ala Ser Leu Ile Leu Ala Pro Ala
20 25 30
Ile Thr Gly Tyr Val Leu His Trp Asn Ile Ala Leu Ser Thr Ile Trp
35 40 45
Gly Val Ser Ala Tyr Gly Ile Phe Val Phe Gly Phe Phe Leu Ala Gln
50 55 60
Val Leu Phe Ser Glu Leu Asn Arg Lys Arg Leu Arg Lys Trp Ile Ser
65 70 75 80
Leu Arg Pro Lys Leu Asp Ile Ala Thr Gln Leu Leu Leu Ser Asn Val
85 90 95
Lys Lys Leu Thr Leu Ser Glu Ser Glu Lys Asn Ser Leu Lys Asn Lys
100 105 110
Trp Lys Ser Ile Thr Gly Lys Lys Ser Glu Asn Ala Glu Ile Arg Lys
115 120 125
Val Glu Leu Val Pro Lys Asp Phe Pro Lys Asp Leu Val Leu Ala Pro
130 135 140
Leu Pro Asp His Val Asn Asp Phe Thr Trp Tyr Lys Asn Arg Lys Lys
145 150 155 160
Ser Leu Gly Ile Lys Pro Val Asn Lys Asn Ile Gly Leu Ser Ile Ile
165 170 175
Ile Pro Thr Phe Asn Arg Ser Arg Ile Leu Asp Ile Thr Leu Ala Cys
180 185 190
Leu Val Asn Gln Lys Thr Asn Tyr Pro Phe Glu Val Val Val Ala Asp
195 200 205
Asp Gly Ser Lys Glu Asn Leu Leu Thr Ile Val Gln Lys Tyr Glu Gln
210 215 220
Lys Leu Asp Ile Lys Tyr Val Arg Gln Lys Asp Tyr Gly Tyr Gln Leu
225 230 235 240
Cys Ala Val Arg Asn Leu Gly Leu Arg Thr Ala Lys Tyr Asp Phe Val
245 250 255
Ser Ile Leu Asp Cys Asp Met Ala Pro Gln Gln Leu Trp Val His Ser
260 265 270
Tyr Leu Thr Glu Leu Leu Glu Asp Asn Asp Ile Val Leu Ile Gly Pro
275 280 285
Arg Lys Tyr Val Asp Thr His Asn Ile Thr Ala Glu Gln Phe Leu Asn
290 295 300
Asp Pro Tyr Leu Ile Glu Ser Leu Pro Glu Thr Ala Thr Asn Asn Asn
305 310 315 320
Pro Ser Ile Thr Ser Lys Gly Asn Ile Ser Leu Asp Trp Arg Leu Glu
325 330 335
His Phe Lys Lys Thr Asp Asn Leu Arg Leu Cys Asp Ser Pro Phe Arg
340 345 350
Tyr Phe Ser Cys Gly Asn Val Ala Phe Ser Lys Glu Trp Leu Asn Lys
355 360 365
Val Gly Trp Phe Asp Glu Glu Phe Asn His Trp Gly Gly Glu Asp Val
370 375 380
Glu Phe Gly Tyr Arg Leu Phe Ala Lys Gly Cys Phe Phe Arg Val Ile
385 390 395 400
Asp Gly Gly Met Ala Tyr His Gln Glu Pro Pro Gly Lys Glu Asn Glu
405 410 415
Thr Asp Arg Glu Ala Gly Lys Ser Ile Thr Leu Lys Ile Val Lys Glu
420 425 430
Lys Val Pro Tyr Ile Tyr Arg Lys Leu Leu Pro Ile Glu Asp Ser His
435 440 445
Ile His Arg Ile Pro Leu Val Ser Ile Tyr Ile Pro Ala Tyr Asn Cys
450 455 460
Ala Asn Tyr Ile Gln Arg Cys Val Asp Ser Ala Leu Asn Gln Thr Val
465 470 475 480
Val Asp Leu Glu Val Cys Ile Cys Asn Asp Gly Ser Thr Asp Asn Thr
485 490 495
Leu Glu Val Ile Asn Lys Leu Tyr Gly Asn Asn Pro Arg Val Arg Ile
500 505 510
Met Ser Lys Pro Asn Gly Gly Ile Ala Ser Ala Ser Asn Ala Ala Val
515 520 525
Ser Phe Ala Lys Gly Tyr Tyr Ile Gly Gln Leu Asp Ser Asp Asp Tyr
530 535 540
Leu Glu Pro Asp Ala Val Glu Leu Cys Leu Lys Glu Phe Leu Lys Asp
545 550 555 560
Lys Thr Leu Ala Cys Val Tyr Thr Thr Asn Arg Asn Val Asn Pro Asp
565 570 575
Gly Ser Leu Ile Ala Asn Gly Tyr Asn Trp Pro Glu Phe Ser Arg Glu
580 585 590
Lys Leu Thr Thr Ala Met Ile Ala His His Phe Arg Met Phe Thr Ile
595 600 605
Arg Ala Trp His Leu Thr Asp Gly Phe Asn Glu Lys Ile Glu Asn Ala
610 615 620
Val Asp Tyr Asp Met Phe Leu Lys Leu Ser Glu Val Gly Lys Phe Lys
625 630 635 640
His Leu Asn Lys Ile Cys Tyr Asn Arg Val Leu His Gly Asp Asn Thr
645 650 655
Ser Ile Lys Asn Leu Asp Thr Gln Lys Lys Asn His Phe Val Val Val
660 665 670
Asn Gln Ser Leu Asn Arg Gln Arg Val Ser Asn Tyr Asn Tyr Asp Glu
675 680 685
Phe Asp Asn Leu Asp Glu Ser Arg Lys Tyr Ile Phe Asn Lys Leu Phe
690 695 700
Ala Ala Trp Lys His Gly Leu Ser Gly Ile Trp Leu Ala Phe Glu Cys
705 710 715 720
Leu Tyr Gln Ile Thr Tyr Phe Phe Leu Val Ile Tyr Leu Phe Ser Arg
725 730 735
Leu Ala Val Glu Ala Asp Pro Arg Ala Gln Thr Ala Thr Val Ile Val
740 745 750
Ser Thr Thr Val Ala Leu Ile Lys Cys Gly Tyr Phe Ser Phe Arg Ala
755 760 765
Lys Asp Ile Arg Ala Phe Tyr Phe Val Leu Tyr Thr Phe Val Tyr Phe
770 775 780
Phe Cys Met Ile Pro Ala Arg Ile Thr Ala Met Met Thr Leu Trp Asp
785 790 795 800
Ile Gly Trp Gly Thr Arg Gly Gly Asn Glu Lys Pro Ser Val Gly Thr
805 810 815
Arg Val Ala Leu Trp Ala Lys Gln Tyr Leu Ile Ala Tyr Met Trp Trp
820 825 830
Ala Ala Val Val Gly Ala Gly Val Tyr Ser Ile Val His Asn Trp Met
835 840 845
Phe Asp Trp Asn Ser Leu Ser Tyr Arg Phe Ala Leu Val Gly Ile Cys
850 855 860
Ser Tyr Ile Val Phe Ile Val Ile Val Leu Val Val Tyr Phe Thr Gly
865 870 875 880
Lys Ile Thr Thr Trp Asn Phe Thr Lys Leu Gln Lys Glu Leu Ile Glu
885 890 895
Asp Arg Val Leu Tyr Asp Ala Thr Thr Asn Ala Gln Ser Val
900 905 910
<210> 29
<211> 703
<212> PRT
<213> 其他序列
<220>
<223> 具有软骨素合酶活性的多肽的重编码氨基酸序列(HCOS7-Vir)
<400> 29
Met Gly Lys Asn Ile Ile Ile Met Val Ser Trp Tyr Thr Ile Ile Thr
1 5 10 15
Ser Asn Leu Ile Ala Val Gly Gly Ala Ser Leu Ile Leu Ala Pro Ala
20 25 30
Ile Thr Gly Tyr Val Leu His Trp Asn Ile Ala Leu Ser Thr Ile Trp
35 40 45
Gly Val Ser Ala Tyr Gly Ile Phe Val Phe Gly Phe Phe Leu Ala Gln
50 55 60
Val Leu Phe Ser Glu Leu Asn Arg Lys Arg Leu Arg Lys Trp Ile Ser
65 70 75 80
Leu Arg Pro Lys Ile Pro Thr Phe Asn Arg Ser Arg Ile Leu Asp Ile
85 90 95
Thr Leu Ala Cys Leu Val Asn Gln Lys Thr Asn Tyr Pro Phe Glu Val
100 105 110
Val Val Ala Asp Asp Gly Ser Lys Glu Asn Leu Leu Thr Ile Val Gln
115 120 125
Lys Tyr Glu Gln Lys Leu Asp Ile Lys Tyr Val Arg Gln Lys Asp Tyr
130 135 140
Gly Tyr Gln Leu Cys Ala Val Arg Asn Leu Gly Leu Arg Thr Ala Lys
145 150 155 160
Tyr Asp Phe Val Ser Ile Leu Asp Cys Asp Met Ala Pro Gln Gln Leu
165 170 175
Trp Val His Ser Tyr Leu Thr Glu Leu Leu Glu Asp Asn Asp Ile Val
180 185 190
Leu Ile Gly Pro Arg Lys Tyr Val Asp Thr His Asn Ile Thr Ala Glu
195 200 205
Gln Phe Leu Asn Asp Pro Tyr Leu Ile Glu Ser Leu Pro Glu Thr Ala
210 215 220
Thr Asn Asn Asn Pro Ser Ile Thr Ser Lys Gly Asn Ile Ser Leu Asp
225 230 235 240
Trp Arg Leu Glu His Phe Lys Lys Thr Asp Asn Leu Arg Leu Cys Asp
245 250 255
Ser Pro Phe Arg Tyr Phe Ser Cys Gly Asn Val Ala Phe Ser Lys Glu
260 265 270
Trp Leu Asn Lys Val Gly Trp Phe Asp Glu Glu Phe Asn His Trp Gly
275 280 285
Gly Glu Asp Val Glu Phe Gly Tyr Arg Leu Phe Ala Lys Gly Cys Phe
290 295 300
Phe Arg Val Ile Asp Gly Gly Met Ala Tyr His Gln Glu Pro Pro Gly
305 310 315 320
Lys Glu Asn Glu Thr Asp Arg Glu Ala Gly Lys Ser Ile Thr Leu Lys
325 330 335
Ile Val Lys Glu Lys Val Pro Tyr Ile Tyr Arg Lys Leu Leu Pro Ile
340 345 350
Glu Asp Ser His Ile His Arg Ile Pro Leu Val Ser Ile Tyr Ile Pro
355 360 365
Ala Tyr Asn Cys Ala Asn Tyr Ile Gln Arg Cys Val Asp Ser Ala Leu
370 375 380
Asn Gln Thr Val Val Asp Leu Glu Val Cys Ile Cys Asn Asp Gly Ser
385 390 395 400
Thr Asp Asn Thr Leu Glu Val Ile Asn Lys Leu Tyr Gly Asn Asn Pro
405 410 415
Arg Val Arg Ile Met Ser Lys Pro Asn Gly Gly Ile Ala Ser Ala Ser
420 425 430
Asn Ala Ala Val Ser Phe Ala Lys Gly Tyr Tyr Ile Gly Gln Leu Asp
435 440 445
Ser Asp Asp Tyr Leu Glu Pro Asp Ala Val Glu Leu Cys Leu Lys Glu
450 455 460
Phe Leu Lys Asp Lys Thr Leu Ala Cys Val Tyr Thr Thr Asn Arg Asn
465 470 475 480
Val Asn Pro Asp Gly Ser Leu Ile Ala Asn Gly Tyr Asn Trp Pro Leu
485 490 495
Phe Ala Ala Trp Lys His Gly Leu Ser Gly Ile Trp Leu Ala Phe Glu
500 505 510
Cys Leu Tyr Gln Ile Thr Tyr Phe Phe Leu Val Ile Tyr Leu Phe Ser
515 520 525
Arg Leu Ala Val Glu Ala Asp Pro Arg Ala Gln Thr Ala Thr Val Ile
530 535 540
Val Ser Thr Thr Val Ala Leu Ile Lys Cys Gly Tyr Phe Ser Phe Arg
545 550 555 560
Ala Lys Asp Ile Arg Ala Phe Tyr Phe Val Leu Tyr Thr Phe Val Tyr
565 570 575
Phe Phe Cys Met Ile Pro Ala Arg Ile Thr Ala Met Met Thr Leu Trp
580 585 590
Asp Ile Gly Trp Gly Thr Arg Gly Gly Asn Glu Lys Pro Ser Val Gly
595 600 605
Thr Arg Val Ala Leu Trp Ala Lys Gln Tyr Leu Ile Ala Tyr Met Trp
610 615 620
Trp Ala Ala Val Val Gly Ala Gly Val Tyr Ser Ile Val His Asn Trp
625 630 635 640
Met Phe Asp Trp Asn Ser Leu Ser Tyr Arg Phe Ala Leu Val Gly Ile
645 650 655
Cys Ser Tyr Ile Val Phe Ile Val Ile Val Leu Val Val Tyr Phe Thr
660 665 670
Gly Lys Ile Thr Thr Trp Asn Phe Thr Lys Leu Gln Lys Glu Leu Ile
675 680 685
Glu Asp Arg Val Leu Tyr Asp Ala Thr Thr Asn Ala Gln Ser Val
690 695 700
<210> 30
<211> 569
<212> PRT
<213> 其他序列
<220>
<223> 具有软骨素合酶活性的多肽的重编码氨基酸序列(HCOS8-Vir)
<400> 30
Met Gly Lys Asn Ile Ile Ile Met Val Ser Trp Tyr Thr Ile Ile Thr
1 5 10 15
Ser Asn Leu Ile Ala Val Gly Gly Ala Ser Leu Ile Leu Ala Pro Ala
20 25 30
Ile Thr Gly Tyr Val Leu His Trp Asn Ile Ala Leu Ser Thr Ile Trp
35 40 45
Gly Val Ser Ala Tyr Gly Ile Phe Val Phe Gly Phe Phe Leu Ala Gln
50 55 60
Val Leu Phe Ser Glu Leu Asn Arg Lys Arg Leu Arg Lys Trp Ile Ser
65 70 75 80
Leu Arg Pro Lys Gly Trp Asn Asp Val Arg Leu Ala Val Ile Ile Ala
85 90 95
Gly Tyr Arg Glu Asp Pro Tyr Met Phe Gln Lys Cys Leu Glu Ser Val
100 105 110
Arg Asp Ser Asp Tyr Gly Asn Val Ala Arg Leu Ile Cys Val Ile Asp
115 120 125
Gly Asp Glu Asp Asp Asp Met Arg Met Ala Ala Val Tyr Lys Ala Ile
130 135 140
Tyr Asn Asp Asn Ile Lys Lys Pro Glu Phe Val Leu Cys Glu Ser Asp
145 150 155 160
Asp Lys Glu Gly Glu Arg Ile Asp Ser Asp Phe Ser Arg Asp Ile Cys
165 170 175
Val Leu Gln Pro His Arg Gly Lys Arg Glu Cys Leu Tyr Thr Gly Phe
180 185 190
Gln Leu Ala Lys Met Asp Pro Ser Val Asn Ala Val Val Leu Ile Asp
195 200 205
Ser Asp Thr Val Leu Glu Lys Asp Ala Ile Leu Glu Val Val Tyr Pro
210 215 220
Leu Ala Cys Asp Pro Glu Ile Gln Ala Val Ala Gly Glu Cys Lys Ile
225 230 235 240
Trp Asn Thr Asp Thr Leu Leu Ser Leu Leu Val Ala Trp Arg Tyr Tyr
245 250 255
Ser Ala Phe Cys Val Glu Arg Ser Ala Gln Ser Phe Phe Arg Thr Val
260 265 270
Gln Cys Val Arg Leu Cys Asp Ser Pro Phe Arg Tyr Phe Ser Cys Gly
275 280 285
Asn Val Ala Phe Ser Lys Glu Trp Leu Asn Lys Val Gly Trp Phe Asp
290 295 300
Glu Glu Phe Asn His Trp Gly Gly Glu Asp Val Glu Phe Gly Tyr Arg
305 310 315 320
Leu Lys Lys Val Val Phe Thr Pro Phe Ala Val Gly Trp Ser Asp Ser
325 330 335
Pro Thr Asn Val Phe Arg Tyr Ile Val Gln Gln Thr Arg Trp Ser Lys
340 345 350
Ser Trp Cys Arg Glu Ile Trp Tyr Thr Leu Phe Ala Ala Trp Lys His
355 360 365
Gly Leu Ser Gly Ile Trp Leu Ala Phe Glu Cys Leu Tyr Gln Ile Thr
370 375 380
Tyr Phe Phe Leu Val Ile Tyr Leu Phe Ser Arg Leu Ala Val Glu Ala
385 390 395 400
Asp Pro Arg Ala Gln Thr Ala Thr Val Ile Val Ser Thr Thr Val Ala
405 410 415
Leu Ile Lys Cys Gly Tyr Phe Ser Phe Arg Ala Lys Asp Ile Arg Ala
420 425 430
Phe Tyr Phe Val Leu Tyr Thr Phe Val Tyr Phe Phe Cys Met Ile Pro
435 440 445
Ala Arg Ile Thr Ala Met Met Thr Leu Trp Asp Ile Gly Trp Gly Thr
450 455 460
Arg Gly Gly Asn Glu Lys Pro Ser Val Gly Thr Arg Val Ala Leu Trp
465 470 475 480
Ala Lys Gln Tyr Leu Ile Ala Tyr Met Trp Trp Ala Ala Val Val Gly
485 490 495
Ala Gly Val Tyr Ser Ile Val His Asn Trp Met Phe Asp Trp Asn Ser
500 505 510
Leu Ser Tyr Arg Phe Ala Leu Val Gly Ile Cys Ser Tyr Ile Val Phe
515 520 525
Ile Val Ile Val Leu Val Val Tyr Phe Thr Gly Lys Ile Thr Thr Trp
530 535 540
Asn Phe Thr Lys Leu Gln Lys Glu Leu Ile Glu Asp Arg Val Leu Tyr
545 550 555 560
Asp Ala Thr Thr Asn Ala Gln Ser Val
565
<210> 31
<211> 832
<212> PRT
<213> 其他序列
<220>
<223> 具有软骨素合酶活性的多肽的氨基酸序列(HCOS9-Vir)
<400> 31
Met Gly Lys Asn Ile Ile Ile Met Val Ser Trp Tyr Thr Ile Ile Thr
1 5 10 15
Ser Asn Leu Ile Ala Val Gly Gly Ala Ser Leu Ile Leu Ala Pro Ala
20 25 30
Ile Thr Gly Tyr Val Leu His Trp Asn Ile Ala Leu Ser Thr Ile Trp
35 40 45
Gly Val Ser Ala Tyr Gly Ile Phe Val Phe Gly Phe Phe Leu Ala Gln
50 55 60
Val Leu Phe Ser Glu Leu Asn Arg Lys Arg Leu Arg Lys Trp Ile Ser
65 70 75 80
Leu Arg Pro Lys His Ile Gly Lys Cys Leu Arg Glu Met Tyr Thr Thr
85 90 95
His Glu Asp Val Glu Val Gly Arg Cys Val Arg Arg Phe Ala Gly Val
100 105 110
Gln Cys Val Trp Ser Tyr Glu Met Gln Gln Leu Phe Tyr Glu Asn Tyr
115 120 125
Glu Gln Asn Lys Lys Gly Tyr Ile Arg Asp Leu His Asn Ser Lys Ile
130 135 140
His Gln Ala Ile Thr Leu His Pro Asn Lys Asn Pro Pro Tyr Gln Tyr
145 150 155 160
Arg Leu His Ser Tyr Met Leu Ser Arg Lys Ile Ser Glu Leu Arg His
165 170 175
Arg Thr Ile Gln Leu His Arg Glu Ile Val Leu Met Ser Lys Tyr Ser
180 185 190
Asn Thr Glu Ile His Lys Glu Asp Leu Gln Leu Gly Ile Pro Pro Ser
195 200 205
Phe Met Arg Phe Gln Pro Arg Gln Arg Glu Glu Ile Leu Glu Trp Glu
210 215 220
Phe Leu Thr Gly Lys Tyr Leu Tyr Ser Ala Val Asp Gly Gln Pro Pro
225 230 235 240
Arg Arg Gly Met Asp Ser Ala Gln Arg Glu Ala Leu Asp Asp Ile Val
245 250 255
Met Gln Val Met Glu Met Ile Asn Ala Asn Ala Lys Thr Arg Gly Arg
260 265 270
Ile Ile Asp Phe Lys Glu Ile Gln Tyr Gly Tyr Arg Arg Val Asn Pro
275 280 285
Met Tyr Gly Ala Glu Tyr Ile Leu Asp Leu Leu Leu Leu Tyr Lys Lys
290 295 300
His Lys Gly Lys Lys Met Thr Val Pro Val Arg Arg His Ala Tyr Leu
305 310 315 320
Gln Gln Thr Phe Ser Lys Ile Gln Phe Val Glu His Glu Glu Leu Asp
325 330 335
Ala Gln Glu Leu Ala Lys Arg Ile Asn Gln Glu Ser Gly Ser Leu Ser
340 345 350
Phe Leu Ser Asn Ser Leu Lys Lys Leu Val Pro Phe Gln Leu Pro Gly
355 360 365
Ser Lys Ser Glu His Lys Glu Pro Lys Asp Lys Lys Ile Asn Ile Leu
370 375 380
Ile Pro Leu Ser Gly Arg Phe Asp Met Phe Val Arg Phe Met Gly Asn
385 390 395 400
Phe Glu Lys Thr Cys Leu Ile Pro Asn Gln Asn Val Lys Leu Val Val
405 410 415
Leu Leu Phe Asn Ser Asp Ser Asn Pro Asp Lys Ala Lys Gln Val Glu
420 425 430
Leu Met Arg Asp Tyr Arg Ile Lys Tyr Pro Lys Ala Asp Met Gln Ile
435 440 445
Leu Pro Val Ser Gly Glu Phe Ser Arg Ala Leu Ala Leu Glu Val Gly
450 455 460
Ser Ser Gln Phe Asn Asn Glu Ser Leu Leu Phe Phe Cys Asp Val Asp
465 470 475 480
Leu Val Phe Thr Thr Glu Phe Leu Gln Arg Cys Arg Ala Asn Thr Val
485 490 495
Leu Gly Gln Gln Ile Tyr Phe Pro Ile Ile Phe Ser Gln Tyr Asp Pro
500 505 510
Lys Ile Val Tyr Ser Gly Lys Val Pro Ser Asp Asn His Phe Ala Phe
515 520 525
Thr Gln Lys Thr Gly Phe Trp Arg Asn Tyr Gly Phe Gly Ile Thr Cys
530 535 540
Ile Tyr Lys Gly Asp Leu Val Arg Val Gly Gly Phe Asp Val Ser Ile
545 550 555 560
Gln Gly Trp Gly Leu Glu Asp Val Asp Leu Phe Asn Lys Val Val Gln
565 570 575
Ala Gly Leu Lys Thr Phe Arg Ser Gln Glu Val Gly Val Val His Val
580 585 590
His His Pro Val Phe Cys Asp Pro Asn Leu Asp Pro Lys Gln Tyr Lys
595 600 605
Met Cys Leu Gly Ser Lys Ala Ser Thr Tyr Gly Ser Thr Gln Gln Leu
610 615 620
Leu Phe Ala Ala Trp Lys His Gly Leu Ser Gly Ile Trp Leu Ala Phe
625 630 635 640
Glu Cys Leu Tyr Gln Ile Thr Tyr Phe Phe Leu Val Ile Tyr Leu Phe
645 650 655
Ser Arg Leu Ala Val Glu Ala Asp Pro Arg Ala Gln Thr Ala Thr Val
660 665 670
Ile Val Ser Thr Thr Val Ala Leu Ile Lys Cys Gly Tyr Phe Ser Phe
675 680 685
Arg Ala Lys Asp Ile Arg Ala Phe Tyr Phe Val Leu Tyr Thr Phe Val
690 695 700
Tyr Phe Phe Cys Met Ile Pro Ala Arg Ile Thr Ala Met Met Thr Leu
705 710 715 720
Trp Asp Ile Gly Trp Gly Thr Arg Gly Gly Asn Glu Lys Pro Ser Val
725 730 735
Gly Thr Arg Val Ala Leu Trp Ala Lys Gln Tyr Leu Ile Ala Tyr Met
740 745 750
Trp Trp Ala Ala Val Val Gly Ala Gly Val Tyr Ser Ile Val His Asn
755 760 765
Trp Met Phe Asp Trp Asn Ser Leu Ser Tyr Arg Phe Ala Leu Val Gly
770 775 780
Ile Cys Ser Tyr Ile Val Phe Ile Val Ile Val Leu Val Val Tyr Phe
785 790 795 800
Thr Gly Lys Ile Thr Thr Trp Asn Phe Thr Lys Leu Gln Lys Glu Leu
805 810 815
Ile Glu Asp Arg Val Leu Tyr Asp Ala Thr Thr Asn Ala Gln Ser Val
820 825 830
<210> 32
<211> 1001
<212> PRT
<213> 其他序列
<220>
<223> 具有软骨素合酶活性的多肽的重编码氨基酸序列(HCOS10-Vir)
<400> 32
Met Gly Lys Asn Ile Ile Ile Met Val Ser Trp Tyr Thr Ile Ile Thr
1 5 10 15
Ser Asn Leu Ile Ala Val Gly Gly Ala Ser Leu Ile Leu Ala Pro Ala
20 25 30
Ile Thr Gly Tyr Val Leu His Trp Asn Ile Ala Leu Ser Thr Ile Trp
35 40 45
Gly Val Ser Ala Tyr Gly Ile Phe Val Phe Gly Phe Phe Leu Ala Gln
50 55 60
Val Leu Phe Ser Glu Leu Asn Arg Lys Arg Leu Arg Lys Trp Ile Ser
65 70 75 80
Leu Arg Pro Lys Arg Asp Arg Asn Phe Leu Phe Val Gly Val Met Thr
85 90 95
Ala Gln Lys Tyr Leu Gln Thr Arg Ala Val Ala Ala Tyr Arg Thr Trp
100 105 110
Ser Lys Thr Ile Pro Gly Lys Val Gln Phe Phe Ser Ser Glu Gly Ser
115 120 125
Asp Thr Ser Val Pro Ile Pro Val Val Pro Leu Arg Gly Val Asp Asp
130 135 140
Ser Tyr Pro Pro Gln Lys Lys Ser Phe Met Met Leu Lys Tyr Met His
145 150 155 160
Asp His Tyr Leu Asp Lys Tyr Glu Trp Phe Met Arg Ala Asp Asp Asp
165 170 175
Val Tyr Ile Lys Gly Asp Arg Leu Glu Asn Phe Leu Arg Ser Leu Asn
180 185 190
Ser Ser Glu Pro Leu Phe Leu Gly Gln Thr Gly Leu Gly Thr Thr Glu
195 200 205
Glu Met Gly Lys Leu Ala Leu Glu Pro Gly Glu Asn Phe Cys Met Gly
210 215 220
Gly Pro Gly Val Ile Met Ser Arg Glu Val Leu Arg Arg Met Val Pro
225 230 235 240
His Ile Gly Lys Cys Leu Arg Glu Met Tyr Thr Thr His Glu Asp Val
245 250 255
Glu Val Gly Arg Cys Val Arg Arg Phe Ala Gly Val Gln Cys Val Trp
260 265 270
Ser Tyr Glu Met Gln Gln Leu Phe Tyr Glu Asn Tyr Glu Gln Asn Lys
275 280 285
Lys Gly Tyr Ile Arg Asp Leu His Asn Ser Lys Ile His Gln Ala Ile
290 295 300
Thr Leu His Pro Asn Lys Asn Pro Pro Tyr Gln Tyr Arg Leu His Ser
305 310 315 320
Tyr Met Leu Ser Arg Lys Ile Ser Glu Leu Arg His Arg Thr Ile Gln
325 330 335
Leu His Arg Glu Ile Val Leu Met Ser Lys Tyr Ser Asn Thr Glu Ile
340 345 350
His Lys Glu Asp Leu Gln Leu Gly Ile Pro Pro Ser Phe Met Arg Phe
355 360 365
Gln Pro Arg Gln Arg Glu Glu Ile Leu Glu Trp Glu Phe Leu Thr Gly
370 375 380
Lys Tyr Leu Tyr Ser Ala Val Asp Gly Gln Pro Pro Arg Arg Gly Met
385 390 395 400
Asp Ser Ala Gln Arg Glu Ala Leu Asp Asp Ile Val Met Gln Val Met
405 410 415
Glu Met Ile Asn Ala Asn Ala Lys Thr Arg Gly Arg Ile Ile Asp Phe
420 425 430
Lys Glu Ile Gln Tyr Gly Tyr Arg Arg Val Asn Pro Met Tyr Gly Ala
435 440 445
Glu Tyr Ile Leu Asp Leu Leu Leu Leu Tyr Lys Lys His Lys Gly Lys
450 455 460
Lys Met Thr Val Pro Val Arg Arg His Ala Tyr Leu Gln Gln Thr Phe
465 470 475 480
Ser Lys Ile Gln Phe Val Glu His Glu Glu Leu Asp Ala Gln Glu Leu
485 490 495
Ala Lys Arg Ile Asn Gln Glu Ser Gly Ser Leu Ser Phe Leu Ser Asn
500 505 510
Ser Leu Lys Lys Leu Val Pro Phe Gln Leu Pro Gly Ser Lys Ser Glu
515 520 525
His Lys Glu Pro Lys Asp Lys Lys Ile Asn Ile Leu Ile Pro Leu Ser
530 535 540
Gly Arg Phe Asp Met Phe Val Arg Phe Met Gly Asn Phe Glu Lys Thr
545 550 555 560
Cys Leu Ile Pro Asn Gln Asn Val Lys Leu Val Val Leu Leu Phe Asn
565 570 575
Ser Asp Ser Asn Pro Asp Lys Ala Lys Gln Val Glu Leu Met Arg Asp
580 585 590
Tyr Arg Ile Lys Tyr Pro Lys Ala Asp Met Gln Ile Leu Pro Val Ser
595 600 605
Gly Glu Phe Ser Arg Ala Leu Ala Leu Glu Val Gly Ser Ser Gln Phe
610 615 620
Asn Asn Glu Ser Leu Leu Phe Phe Cys Asp Val Asp Leu Val Phe Thr
625 630 635 640
Thr Glu Phe Leu Gln Arg Cys Arg Ala Asn Thr Val Leu Gly Gln Gln
645 650 655
Ile Tyr Phe Pro Ile Ile Phe Ser Gln Tyr Asp Pro Lys Ile Val Tyr
660 665 670
Ser Gly Lys Val Pro Ser Asp Asn His Phe Ala Phe Thr Gln Lys Thr
675 680 685
Gly Phe Trp Arg Asn Tyr Gly Phe Gly Ile Thr Cys Ile Tyr Lys Gly
690 695 700
Asp Leu Val Arg Val Gly Gly Phe Asp Val Ser Ile Gln Gly Trp Gly
705 710 715 720
Leu Glu Asp Val Asp Leu Phe Asn Lys Val Val Gln Ala Gly Leu Lys
725 730 735
Thr Phe Arg Ser Gln Glu Val Gly Val Val His Val His His Pro Val
740 745 750
Phe Cys Asp Pro Asn Leu Asp Pro Lys Gln Tyr Lys Met Cys Leu Gly
755 760 765
Ser Lys Ala Ser Thr Tyr Gly Ser Thr Gln Gln Leu Ala Glu Met Trp
770 775 780
Leu Glu Lys Asn Asp Pro Ser Tyr Ser Leu Phe Ala Ala Trp Lys His
785 790 795 800
Gly Leu Ser Gly Ile Trp Leu Ala Phe Glu Cys Leu Tyr Gln Ile Thr
805 810 815
Tyr Phe Phe Leu Val Ile Tyr Leu Phe Ser Arg Leu Ala Val Glu Ala
820 825 830
Asp Pro Arg Ala Gln Thr Ala Thr Val Ile Val Ser Thr Thr Val Ala
835 840 845
Leu Ile Lys Cys Gly Tyr Phe Ser Phe Arg Ala Lys Asp Ile Arg Ala
850 855 860
Phe Tyr Phe Val Leu Tyr Thr Phe Val Tyr Phe Phe Cys Met Ile Pro
865 870 875 880
Ala Arg Ile Thr Ala Met Met Thr Leu Trp Asp Ile Gly Trp Gly Thr
885 890 895
Arg Gly Gly Asn Glu Lys Pro Ser Val Gly Thr Arg Val Ala Leu Trp
900 905 910
Ala Lys Gln Tyr Leu Ile Ala Tyr Met Trp Trp Ala Ala Val Val Gly
915 920 925
Ala Gly Val Tyr Ser Ile Val His Asn Trp Met Phe Asp Trp Asn Ser
930 935 940
Leu Ser Tyr Arg Phe Ala Leu Val Gly Ile Cys Ser Tyr Ile Val Phe
945 950 955 960
Ile Val Ile Val Leu Val Val Tyr Phe Thr Gly Lys Ile Thr Thr Trp
965 970 975
Asn Phe Thr Lys Leu Gln Lys Glu Leu Ile Glu Asp Arg Val Leu Tyr
980 985 990
Asp Ala Thr Thr Asn Ala Gln Ser Val
995 1000
<210> 33
<211> 531
<212> PRT
<213> 其他序列
<220>
<223> 具有软骨素合酶活性的多肽的重编码氨基酸序列(HCOS11-Vir)
<400> 33
Met Gly Lys Asn Ile Ile Ile Met Val Ser Trp Tyr Thr Ile Ile Thr
1 5 10 15
Ser Asn Leu Ile Ala Val Gly Gly Ala Ser Leu Ile Leu Ala Pro Ala
20 25 30
Ile Thr Gly Tyr Val Leu His Trp Asn Ile Ala Leu Ser Thr Ile Trp
35 40 45
Gly Val Ser Ala Tyr Gly Ile Phe Val Phe Gly Phe Phe Leu Ala Gln
50 55 60
Val Leu Phe Ser Glu Leu Asn Arg Lys Arg Leu Arg Lys Trp Ile Ser
65 70 75 80
Leu Arg Pro Lys Arg Asp Arg Asn Phe Leu Phe Val Gly Val Met Thr
85 90 95
Ala Gln Lys Tyr Leu Gln Thr Arg Ala Val Ala Ala Tyr Arg Thr Trp
100 105 110
Ser Lys Thr Ile Pro Gly Lys Val Gln Phe Phe Ser Ser Glu Gly Ser
115 120 125
Asp Thr Ser Val Pro Ile Pro Val Val Pro Leu Arg Gly Val Asp Asp
130 135 140
Ser Tyr Pro Pro Gln Lys Lys Ser Phe Met Met Leu Lys Tyr Met His
145 150 155 160
Asp His Tyr Leu Asp Lys Tyr Glu Trp Phe Met Arg Ala Asp Asp Asp
165 170 175
Val Tyr Ile Lys Gly Asp Arg Leu Glu Asn Phe Leu Arg Ser Leu Asn
180 185 190
Ser Ser Glu Pro Leu Phe Leu Gly Gln Thr Gly Leu Gly Thr Thr Glu
195 200 205
Glu Met Gly Lys Leu Ala Leu Glu Pro Gly Glu Asn Phe Cys Met Gly
210 215 220
Gly Pro Gly Val Ile Met Ser Arg Glu Val Leu Arg Arg Met Val Pro
225 230 235 240
His Ile Gly Lys Cys Leu Arg Glu Met Tyr Thr Thr His Glu Asp Val
245 250 255
Glu Val Gly Arg Cys Val Arg Arg Phe Ala Gly Val Gln Cys Val Trp
260 265 270
Ser Tyr Glu Met Gln Gln Leu Phe Tyr Glu Asn Tyr Glu Gln Asn Lys
275 280 285
Lys Gly Tyr Ile Arg Asp Leu His Asn Ser Lys Ile His Gln Ala Ile
290 295 300
Thr Leu His Pro Asn Lys Asn Pro Pro Tyr Gln Tyr Arg Leu His Ser
305 310 315 320
Tyr Met Leu Leu Phe Ala Ala Trp Lys His Gly Leu Ser Gly Ile Trp
325 330 335
Leu Ala Phe Glu Cys Leu Tyr Gln Ile Thr Tyr Phe Phe Leu Val Ile
340 345 350
Tyr Leu Phe Ser Arg Leu Ala Val Glu Ala Asp Pro Arg Ala Gln Thr
355 360 365
Ala Thr Val Ile Val Ser Thr Thr Val Ala Leu Ile Lys Cys Gly Tyr
370 375 380
Phe Ser Phe Arg Ala Lys Asp Ile Arg Ala Phe Tyr Phe Val Leu Tyr
385 390 395 400
Thr Phe Val Tyr Phe Phe Cys Met Ile Pro Ala Arg Ile Thr Ala Met
405 410 415
Met Thr Leu Trp Asp Ile Gly Trp Gly Thr Arg Gly Gly Asn Glu Lys
420 425 430
Pro Ser Val Gly Thr Arg Val Ala Leu Trp Ala Lys Gln Tyr Leu Ile
435 440 445
Ala Tyr Met Trp Trp Ala Ala Val Val Gly Ala Gly Val Tyr Ser Ile
450 455 460
Val His Asn Trp Met Phe Asp Trp Asn Ser Leu Ser Tyr Arg Phe Ala
465 470 475 480
Leu Val Gly Ile Cys Ser Tyr Ile Val Phe Ile Val Ile Val Leu Val
485 490 495
Val Tyr Phe Thr Gly Lys Ile Thr Thr Trp Asn Phe Thr Lys Leu Gln
500 505 510
Lys Glu Leu Ile Glu Asp Arg Val Leu Tyr Asp Ala Thr Thr Asn Ala
515 520 525
Gln Ser Val
530
<210> 34
<211> 553
<212> PRT
<213> 其他序列
<220>
<223> 具有软骨素合酶活性的多肽的重编码氨基酸序列(HCOS12-Vir)
<400> 34
Met Gly Lys Asn Ile Ile Ile Met Val Ser Trp Tyr Thr Ile Ile Thr
1 5 10 15
Ser Asn Leu Ile Ala Val Gly Gly Ala Ser Leu Ile Leu Ala Pro Ala
20 25 30
Ile Thr Gly Tyr Val Leu His Trp Asn Ile Ala Leu Ser Thr Ile Trp
35 40 45
Gly Val Ser Ala Tyr Gly Ile Phe Val Phe Gly Phe Phe Leu Ala Gln
50 55 60
Val Leu Phe Ser Glu Leu Asn Arg Lys Arg Leu Arg Lys Trp Ile Ser
65 70 75 80
Leu Arg Pro Lys Lys Asp Lys Lys Ile Asn Ile Leu Ile Pro Leu Ser
85 90 95
Gly Arg Phe Asp Met Phe Val Arg Phe Met Gly Asn Phe Glu Lys Thr
100 105 110
Cys Leu Ile Pro Asn Gln Asn Val Lys Leu Val Val Leu Leu Phe Asn
115 120 125
Ser Asp Ser Asn Pro Asp Lys Ala Lys Gln Val Glu Leu Met Arg Asp
130 135 140
Tyr Arg Ile Lys Tyr Pro Lys Ala Asp Met Gln Ile Leu Pro Val Ser
145 150 155 160
Gly Glu Phe Ser Arg Ala Leu Ala Leu Glu Val Gly Ser Ser Gln Phe
165 170 175
Asn Asn Glu Ser Leu Leu Phe Phe Cys Asp Val Asp Leu Val Phe Thr
180 185 190
Thr Glu Phe Leu Gln Arg Cys Arg Ala Asn Thr Val Leu Gly Gln Gln
195 200 205
Ile Tyr Phe Pro Ile Ile Phe Ser Gln Tyr Asp Pro Lys Ile Val Tyr
210 215 220
Ser Gly Lys Val Pro Ser Asp Asn His Phe Ala Phe Thr Gln Lys Thr
225 230 235 240
Gly Phe Trp Arg Asn Tyr Gly Phe Gly Ile Thr Cys Ile Tyr Lys Gly
245 250 255
Asp Leu Val Arg Val Gly Gly Phe Asp Val Ser Ile Gln Gly Trp Gly
260 265 270
Leu Glu Asp Val Asp Leu Phe Asn Lys Val Val Gln Ala Gly Leu Lys
275 280 285
Thr Phe Arg Ser Gln Glu Val Gly Val Val His Val His His Pro Val
290 295 300
Phe Cys Asp Pro Asn Leu Asp Pro Lys Gln Tyr Lys Met Cys Leu Gly
305 310 315 320
Ser Lys Ala Ser Thr Tyr Gly Ser Thr Gln Gln Leu Ala Glu Met Trp
325 330 335
Leu Glu Lys Asn Asp Pro Ser Tyr Ser Leu Phe Ala Ala Trp Lys His
340 345 350
Gly Leu Ser Gly Ile Trp Leu Ala Phe Glu Cys Leu Tyr Gln Ile Thr
355 360 365
Tyr Phe Phe Leu Val Ile Tyr Leu Phe Ser Arg Leu Ala Val Glu Ala
370 375 380
Asp Pro Arg Ala Gln Thr Ala Thr Val Ile Val Ser Thr Thr Val Ala
385 390 395 400
Leu Ile Lys Cys Gly Tyr Phe Ser Phe Arg Ala Lys Asp Ile Arg Ala
405 410 415
Phe Tyr Phe Val Leu Tyr Thr Phe Val Tyr Phe Phe Cys Met Ile Pro
420 425 430
Ala Arg Ile Thr Ala Met Met Thr Leu Trp Asp Ile Gly Trp Gly Thr
435 440 445
Arg Gly Gly Asn Glu Lys Pro Ser Val Gly Thr Arg Val Ala Leu Trp
450 455 460
Ala Lys Gln Tyr Leu Ile Ala Tyr Met Trp Trp Ala Ala Val Val Gly
465 470 475 480
Ala Gly Val Tyr Ser Ile Val His Asn Trp Met Phe Asp Trp Asn Ser
485 490 495
Leu Ser Tyr Arg Phe Ala Leu Val Gly Ile Cys Ser Tyr Ile Val Phe
500 505 510
Ile Val Ile Val Leu Val Val Tyr Phe Thr Gly Lys Ile Thr Thr Trp
515 520 525
Asn Phe Thr Lys Leu Gln Lys Glu Leu Ile Glu Asp Arg Val Leu Tyr
530 535 540
Asp Ala Thr Thr Asn Ala Gln Ser Val
545 550
<210> 35
<211> 1446
<212> DNA
<213> 拟南芥
<220>
<223> UDP-葡萄糖脱氢酶(HASB)的核酸序列
<400> 35
atggtcaaaa tatgctgtat cggggctgga tatgtcggtg ggcctacaat ggccgttatg 60
gccctaaagt gtccagagat tgaagtcgtg gtagttgata tatcggagcc acgaattaac 120
gcatggaact cagaccgtct accaatttat gagccagggt tagaggatgt cgtcaaacag 180
tgtagaggga agaatttgtt cttctctaca gatgtagaga agcatgtatt tgagtcagat 240
atagtgtttg tttcggtaaa cactcctacg aaaacgcagg gtctgggtgc aggtaaagca 300
gcagatttga catattggga gtccgctgct cgcatgatag ctgatgtgag caaatcgtcg 360
aaaatcgtcg ttgaaaagag tacagtacca gttcgtacag ccgaggctat agaaaagatt 420
ttaacgcaca attcgaaggg tatcgaattc cagatcttat caaatccaga attcttggcc 480
gaagggacgg cgattaaaga cttatataac cctgatagag ttctaatcgg tggcagggac 540
accgctgcgg gacaaaaggc cattaaggcg ttgcgtgacg tgtatgccca ctgggttcct 600
gttgagcaaa taatctgtac taatttatgg agtgccgagc tatcaaagtt ggctgcgaac 660
gcatttctag ctcaaaggat aagttcagta aacgcaatgt cagcgctttg tgaggcaact 720
ggtgctgacg taacccaagt cgctcacgcc gttggaaccg acactagaat tggaccgaag 780
tttcttaacg catccgtagg cttcggcgga tcttgctttc agaaagacat cctgaatctt 840
atttacatct gcgaatgcaa tggtcttcca gaagcagcca attattggaa acaggtagtc 900
aaggtaaatg actaccaaaa gattaggttt gctaatcgag tcgtatcttc tatgttcaac 960
accgtctccg gtaagaaaat tgctattttg ggatttgcgt tcaagaagga caccggcgac 1020
acgcgtgaaa ctcctgccat agatgtgtgt aatcgcctcg tggctgataa agcaaagctg 1080
tcgatctatg atccgcaagt attagaagag cagatccgcc gtgatctgtc catggcccga 1140
ttcgattggg accatccagt cccactccag cagatcaaag ctgaaggtat ctccgaacag 1200
gttaacgttg tgtccgacgc ctacgaggct acgaaggatg ctcatggttt atgtgtttta 1260
accgaatggg acgaattcaa gtcacttgat tttaagaaga tctttgataa tatgcagaaa 1320
cccgctttcg ttttcgacgg aagaaacgtg gtcgacgctg tgaaattgag agaaattgga 1380
ttcatagtat attccatagg taaacctctg gatagttggc tcaaggatat gccggctgtt 1440
gcataa 1446
<210> 36
<211> 1166
<212> DNA
<213> 小球藻属病毒
<220>
<223> UDP-葡萄糖脱氢酶(HASB)的重编码核酸序列
<400> 36
atgagtagaa ttgctgtcgt tggatgcggt tacgtgggta cggcctgcgc cgtacttttg 60
gcgcagaaga acgaagttat cgttttggat atctcggagg accgggtaca actgattaag 120
aataagaagt cacctataga agataaggaa atcgaagaat tcctggagac gaaagatttg 180
aatctaacag cgacgacgga taaggtgctc gcctatgaga atgctgaatt cgttataata 240
gctacaccga ccgattacga tgtcgtcact agatatttca acactaagtc tgttgaaaat 300
gtgataggcg atgtcattaa gaacactcag acacacccta ctatagtgat caagagtact 360
attccaatcg gtttcgtgga taaagttaga gaacagttcg attatcaaaa tattatcttc 420
tcgccggaat tcttgagaga aggacgagca ttatatgata atctttaccc ctcccgtatc 480
atcgtcggtg atgactcccc aattgcctta aaattcgcga atctcttggt cgagggtagc 540
aaaactccac tagctcccgt attaactatg ggtacgcgag aggccgaagc tgtaaaacta 600
ttttcaaata catatttggc tatgagagta gcatacttca atgagctaga cacatttgca 660
atgtcccatg gtatgaacgc aaaagagatt atcgacggag tcacactaga accaaggata 720
gggcagggtt attcgaatcc ttcatttggg tatggagcct attgtttccc aaaagataca 780
aagcaattgt tggctaattt tgaaggggtt ccacaagata ttattggcgc aatcgtagag 840
tctaacgaaa ctagaaagga ggttattgtt tctgaggtcg agaacagatt tccgaccaca 900
gttggcgtat ataagttggc tgctaaagct ggttcggata atttcaggtc tagtgcgata 960
gtcgatatca tggaaaggtt ggctaataag ggctaccaca tcaaaatatt tgaacctacc 1020
gttgaacaat ttgagaattt tgaggtagat aataatctca caacttttgc aaccgagtct 1080
gatgtaataa ttgcgaacag agttccagtc gaacatcgca ttctgtttgg gaagaagtta 1140
ataacacggg atgtctatgg ggataa 1166
<210> 37
<211> 1170
<212> DNA
<213> 小球藻属病毒
<220>
<223> UDP-葡萄糖脱氢酶(HASB-A)的重编码核酸序列
<400> 37
atgtcacgaa tcgcagtagt tggctgtggg tacgtgggaa ccgcatgcgc tgtactgctg 60
gcgcaaaaga atgaggtaat cgttcttgat attagtgagg atagggtcca actaatcaag 120
aacaagaaat ccccgatcga agataaggag attgaagaat tcttggaaac aaaagaccta 180
aacttaactg caacaactga caaagtttta gcctacgaaa acgctgagtt tgtgattata 240
gcgacaccca cagattatga cgtagttacc agatacttta acacgaagtc cgtagagaac 300
gtcattggag atgttataaa gaatactcag actcatccta cgatagtaat aaagtcaacc 360
attcccatag gtttcgtaga taaggttagg gagcaattcg attaccagaa cattatattt 420
tcgccagaat ttctgagaga gggtcgcgcc ctgtatgata atctatatcc atcacggatt 480
atagtgggcg atgactctcc gattgcactt aagtttgcta atcttttagt tgagggctcc 540
aaaactccgc tcgccccagt acttacgatg ggtacacgtg aggctgaagc tgtcaagctg 600
ttttcaaaca cataccttgc tatgcgagtc gcatacttta acgaactaga tacctttgct 660
atgtcgcacg gtatgaatgc taaagaaatc atagatggcg taacgttgga gcctcggata 720
ggtcaaggat attccaatcc atcttttggc tacggtgcgt attgtttccc aaaggacacg 780
aagcaattat tagctaactt tgagggtgtt ccgcaagata taattggggc gatagtagaa 840
agcaatgaaa cacggaagga ggtaatcgtg agtgaagtgg aaaaccgatt ccccactacg 900
gtcggcgttt acaaattagc cgccaaggct ggttccgaca atttccgatc cagcgcaata 960
gtagatatta tggaaagatt agctaataag ggataccaca ttaaaatctt tgaacctact 1020
gtcgaacagt tcgagaactt cgaggttgat aataacttga cgactttcgc aacggagagc 1080
gatgtaatta ttgcaaaccg cgtacctgtg gaacatcgaa ttttgttcgg aaagaagctg 1140
attacacgcg atgtatatgg cgataactaa 1170
<210> 38
<211> 1199
<212> DNA
<213> 链球菌
<220>
<223> UDP-葡萄糖脱氢酶(HASB)的核酸序列
<400> 38
atgaagatat cggtagcggg ttcggggtac gtggggttat ccttgtcaat cttgcttgcc 60
caacataacg atgtgactgt tgtagatata atcgacgaaa aggtacggct aattaaccag 120
ggcatatctc cgattaagga tgcggacatt gaggaatatc tgaagaatgc accgttgaat 180
cttacggcta cactagacgg agcttcggct tatagtaatg ctgatctgat tataatcgca 240
acgccaacta attacgattc agaacgcaat tatttcgaca ccagacacgt tgaagaagta 300
attgagcaag tattggattt aaatgcctcc gctactataa tcatcaagag taccataccc 360
ttgggtttta ttaaacacgt aagagagaaa taccaaacag acagaatcat cttttctcca 420
gagttcttaa gagagtcaaa ggcattgtac gataacttat acccctctcg tataatagtc 480
agttatgaga aggatgactc tccaagagtt atacaagcag ctaaggcgtt cgcgggttta 540
ttaaaagagg gggcaaagag caaggatacc ccagttctgt ttatgggctc tcaagaagct 600
gaagctgtca agctgtttgc taatactttt ctcgccatga gggtcagtta cttcaacgag 660
cttgacactt atagcgaatc aaaaggacta gacgcccaaa gagttataga aggcgtctgc 720
catgatcaaa ggataggtaa tcattacaat aatccatcct tcggatatgg cggttattgt 780
ttacccaaag actcaaagca acttttggct aattatagag gcatacctca gtctctaatg 840
tctgccatcg ttgaatcgaa caagatccgt aagtcgtatt tagctgaaca aatattagat 900
agggcttctt cacaaaagca ggctggtgta cctttaacca taggatttta ccgtttgatt 960
atgaagtcca actccgataa ctttagagaa tcagccatta aagatattat tgacatcatt 1020
aatgactacg gtgtcaatat tgtcatttat gaacctatgt tgggagaaga cattggttat 1080
agagtcgtta aagatttgga acagtttaag aacgaaagta caattattgt tagtaacagg 1140
tttgaagatg atttaggtga tgttattgat aaagtttata cacgtgacgt ctttggtag 1199
<210> 39
<211> 481
<212> PRT
<213> 拟南芥
<220>
<223> UDP-葡萄糖脱氢酶(HASB)的氨基酸序列
<400> 39
Met Val Lys Ile Cys Cys Ile Gly Ala Gly Tyr Val Gly Gly Pro Thr
1 5 10 15
Met Ala Val Met Ala Leu Lys Cys Pro Glu Ile Glu Val Val Val Val
20 25 30
Asp Ile Ser Glu Pro Arg Ile Asn Ala Trp Asn Ser Asp Arg Leu Pro
35 40 45
Ile Tyr Glu Pro Gly Leu Glu Asp Val Val Lys Gln Cys Arg Gly Lys
50 55 60
Asn Leu Phe Phe Ser Thr Asp Val Glu Lys His Val Phe Glu Ser Asp
65 70 75 80
Ile Val Phe Val Ser Val Asn Thr Pro Thr Lys Thr Gln Gly Leu Gly
85 90 95
Ala Gly Lys Ala Ala Asp Leu Thr Tyr Trp Glu Ser Ala Ala Arg Met
100 105 110
Ile Ala Asp Val Ser Lys Ser Ser Lys Ile Val Val Glu Lys Ser Thr
115 120 125
Val Pro Val Arg Thr Ala Glu Ala Ile Glu Lys Ile Leu Thr His Asn
130 135 140
Ser Lys Gly Ile Glu Phe Gln Ile Leu Ser Asn Pro Glu Phe Leu Ala
145 150 155 160
Glu Gly Thr Ala Ile Lys Asp Leu Tyr Asn Pro Asp Arg Val Leu Ile
165 170 175
Gly Gly Arg Asp Thr Ala Ala Gly Gln Lys Ala Ile Lys Ala Leu Arg
180 185 190
Asp Val Tyr Ala His Trp Val Pro Val Glu Gln Ile Ile Cys Thr Asn
195 200 205
Leu Trp Ser Ala Glu Leu Ser Lys Leu Ala Ala Asn Ala Phe Leu Ala
210 215 220
Gln Arg Ile Ser Ser Val Asn Ala Met Ser Ala Leu Cys Glu Ala Thr
225 230 235 240
Gly Ala Asp Val Thr Gln Val Ala His Ala Val Gly Thr Asp Thr Arg
245 250 255
Ile Gly Pro Lys Phe Leu Asn Ala Ser Val Gly Phe Gly Gly Ser Cys
260 265 270
Phe Gln Lys Asp Ile Leu Asn Leu Ile Tyr Ile Cys Glu Cys Asn Gly
275 280 285
Leu Pro Glu Ala Ala Asn Tyr Trp Lys Gln Val Val Lys Val Asn Asp
290 295 300
Tyr Gln Lys Ile Arg Phe Ala Asn Arg Val Val Ser Ser Met Phe Asn
305 310 315 320
Thr Val Ser Gly Lys Lys Ile Ala Ile Leu Gly Phe Ala Phe Lys Lys
325 330 335
Asp Thr Gly Asp Thr Arg Glu Thr Pro Ala Ile Asp Val Cys Asn Arg
340 345 350
Leu Val Ala Asp Lys Ala Lys Leu Ser Ile Tyr Asp Pro Gln Val Leu
355 360 365
Glu Glu Gln Ile Arg Arg Asp Leu Ser Met Ala Arg Phe Asp Trp Asp
370 375 380
His Pro Val Pro Leu Gln Gln Ile Lys Ala Glu Gly Ile Ser Glu Gln
385 390 395 400
Val Asn Val Val Ser Asp Ala Tyr Glu Ala Thr Lys Asp Ala His Gly
405 410 415
Leu Cys Val Leu Thr Glu Trp Asp Glu Phe Lys Ser Leu Asp Phe Lys
420 425 430
Lys Ile Phe Asp Asn Met Gln Lys Pro Ala Phe Val Phe Asp Gly Arg
435 440 445
Asn Val Val Asp Ala Val Lys Leu Arg Glu Ile Gly Phe Ile Val Tyr
450 455 460
Ser Ile Gly Lys Pro Leu Asp Ser Trp Leu Lys Asp Met Pro Ala Val
465 470 475 480
Ala
<210> 40
<211> 389
<212> PRT
<213> 小球藻属病毒
<220>
<223> UDP-葡萄糖脱氢酶(HASB)的氨基酸序列
<400> 40
Met Ser Arg Ile Ala Val Val Gly Cys Gly Tyr Val Gly Thr Ala Cys
1 5 10 15
Ala Val Leu Leu Ala Gln Lys Asn Glu Val Ile Val Leu Asp Ile Ser
20 25 30
Glu Asp Arg Val Gln Leu Ile Lys Asn Lys Lys Ser Pro Ile Glu Asp
35 40 45
Lys Glu Ile Glu Glu Phe Leu Glu Thr Lys Asp Leu Asn Leu Thr Ala
50 55 60
Thr Thr Asp Lys Val Leu Ala Tyr Glu Asn Ala Glu Phe Val Ile Ile
65 70 75 80
Ala Thr Pro Thr Asp Tyr Asp Val Val Thr Arg Tyr Phe Asn Thr Lys
85 90 95
Ser Val Glu Asn Val Ile Gly Asp Val Ile Lys Asn Thr Gln Thr His
100 105 110
Pro Thr Ile Val Ile Lys Ser Thr Ile Pro Ile Gly Phe Val Asp Lys
115 120 125
Val Arg Glu Gln Phe Asp Tyr Gln Asn Ile Ile Phe Ser Pro Glu Phe
130 135 140
Leu Arg Glu Gly Arg Ala Leu Tyr Asp Asn Leu Tyr Pro Ser Arg Ile
145 150 155 160
Ile Val Gly Asp Asp Ser Pro Ile Ala Leu Lys Phe Ala Asn Leu Leu
165 170 175
Val Glu Gly Ser Lys Thr Pro Leu Ala Pro Val Leu Thr Met Gly Thr
180 185 190
Arg Glu Ala Glu Ala Val Lys Leu Phe Ser Asn Thr Tyr Leu Ala Met
195 200 205
Arg Val Ala Tyr Phe Asn Glu Leu Asp Thr Phe Ala Met Ser His Gly
210 215 220
Met Asn Ala Lys Glu Ile Ile Asp Gly Val Thr Leu Glu Pro Arg Ile
225 230 235 240
Gly Gln Gly Tyr Ser Asn Pro Ser Phe Gly Tyr Gly Ala Tyr Cys Phe
245 250 255
Pro Lys Asp Thr Lys Gln Leu Leu Ala Asn Phe Glu Gly Val Pro Gln
260 265 270
Asp Ile Ile Gly Ala Ile Val Glu Ser Asn Glu Thr Arg Lys Glu Val
275 280 285
Ile Val Ser Glu Val Glu Asn Arg Phe Pro Thr Thr Val Gly Val Tyr
290 295 300
Lys Leu Ala Ala Lys Ala Gly Ser Asp Asn Phe Arg Ser Ser Ala Ile
305 310 315 320
Val Asp Ile Met Glu Arg Leu Ala Asn Lys Gly Tyr His Ile Lys Ile
325 330 335
Phe Glu Pro Thr Val Glu Gln Phe Glu Asn Phe Glu Val Asp Asn Asn
340 345 350
Leu Thr Thr Phe Ala Thr Glu Ser Asp Val Ile Ile Ala Asn Arg Val
355 360 365
Pro Val Glu His Arg Ile Leu Phe Gly Lys Lys Leu Ile Thr Arg Asp
370 375 380
Val Tyr Gly Asp Asn
385
<210> 41
<211> 401
<212> PRT
<213> 链球菌
<220>
<223> UDP-葡萄糖脱氢酶(HASB)的氨基酸序列
<400> 41
Met Lys Ile Ser Val Ala Gly Ser Gly Tyr Val Gly Leu Ser Leu Ser
1 5 10 15
Ile Leu Leu Ala Gln His Asn Asp Val Thr Val Val Asp Ile Ile Asp
20 25 30
Glu Lys Val Arg Leu Ile Asn Gln Gly Ile Ser Pro Ile Lys Asp Ala
35 40 45
Asp Ile Glu Glu Tyr Leu Lys Asn Ala Pro Leu Asn Leu Thr Ala Thr
50 55 60
Leu Asp Gly Ala Ser Ala Tyr Ser Asn Ala Asp Leu Ile Ile Ile Ala
65 70 75 80
Thr Pro Thr Asn Tyr Asp Ser Glu Arg Asn Tyr Phe Asp Thr Arg His
85 90 95
Val Glu Glu Val Ile Glu Gln Val Leu Asp Leu Asn Ala Ser Ala Thr
100 105 110
Ile Ile Ile Lys Ser Thr Ile Pro Leu Gly Phe Ile Lys His Val Arg
115 120 125
Glu Lys Tyr Gln Thr Asp Arg Ile Ile Phe Ser Pro Glu Phe Leu Arg
130 135 140
Glu Ser Lys Ala Leu Tyr Asp Asn Leu Tyr Pro Ser Arg Ile Ile Val
145 150 155 160
Ser Tyr Glu Lys Asp Asp Ser Pro Arg Val Ile Gln Ala Ala Lys Ala
165 170 175
Phe Ala Gly Leu Leu Lys Glu Gly Ala Lys Ser Lys Asp Thr Pro Val
180 185 190
Leu Phe Met Gly Ser Gln Glu Ala Glu Ala Val Lys Leu Phe Ala Asn
195 200 205
Thr Phe Leu Ala Met Arg Val Ser Tyr Phe Asn Glu Leu Asp Thr Tyr
210 215 220
Ser Glu Ser Lys Gly Leu Asp Ala Gln Arg Val Ile Glu Gly Val Cys
225 230 235 240
His Asp Gln Arg Ile Gly Asn His Tyr Asn Asn Pro Ser Phe Gly Tyr
245 250 255
Gly Gly Tyr Cys Leu Pro Lys Asp Ser Lys Gln Leu Leu Ala Asn Tyr
260 265 270
Arg Gly Ile Pro Gln Ser Leu Met Ser Ala Ile Val Glu Ser Asn Lys
275 280 285
Ile Arg Lys Ser Tyr Leu Ala Glu Gln Ile Leu Asp Arg Ala Ser Ser
290 295 300
Gln Lys Gln Ala Gly Val Pro Leu Thr Ile Gly Phe Tyr Arg Leu Ile
305 310 315 320
Met Lys Ser Asn Ser Asp Asn Phe Arg Glu Ser Ala Ile Lys Asp Ile
325 330 335
Ile Asp Ile Ile Asn Asp Tyr Gly Val Asn Ile Val Ile Tyr Glu Pro
340 345 350
Met Leu Gly Glu Asp Ile Gly Tyr Arg Val Val Lys Asp Leu Glu Gln
355 360 365
Phe Lys Asn Glu Ser Thr Ile Ile Val Ser Asn Arg Phe Glu Asp Asp
370 375 380
Leu Gly Asp Val Ile Asp Lys Val Tyr Thr Arg Asp Val Phe Gly Arg
385 390 395 400
Asp
<210> 42
<211> 1026
<212> DNA
<213> 铜绿假单胞菌
<220>
<223> UDP-葡萄糖-4-差向异构酶(GNE1)的核酸序列
<400> 42
atgatgtccc gttacgagga acttcgtaaa gagctgcctg cacagccgaa ggtatggttg 60
atcactggtg tcgcgggctt catcgggtca aatctgctag agaccttgct taaattggat 120
cagaaggttg ttggcttgga caactttgca actggccacc agaggaatct ggacgaggtg 180
aggtcattgg tttctgagaa acagtggagc aactttaagt ttattcaagg ggacattaga 240
aatctggacg actgcaacaa cgcatgtgca ggcgtcgatt atgtcttaca ccaggcagca 300
ttgggcagtg tgccgaggtc tataaacgac cctataacat cgaatgcaac taacatagac 360
ggtttcttga acatgctgat tgcagcgagg gatgcaaaag ttcagtcttt tacctatgcc 420
gcttcatcct ctacatacgg ggatcacccc ggtttgccaa aggtggaaga cactatcggc 480
aagcctctat ctccatacgc tgtgacgaag tatgttaatg agttgtacgc agacgtgttt 540
tcacgttgtt atggattttc aaccatcggt ctgagatact ttaacgtctt cggccgtaga 600
caagatccga atggggcata cgccgccgta atccctaagt ggacatcctc aatgatacag 660
ggtgacgacg tctacattaa cggagatgga gagacatcac gtgacttctg ctacatagaa 720
aacacagttc aagcaaactt attagccgca acggccggcc tagacgccag aaaccaggtg 780
tataatatcg cggtgggtgg tagaacgtca ctaaatcagc ttttcttcgc cttgagagac 840
ggtctagctg agaacggcgt tagctaccat agggaaccag tttataggga ttttagagaa 900
ggagatgtga gacacagctt ggcagatatt tccaaggcgg ctaaacttct tgggtatgct 960
cctaaatatg acgtatcagc aggggtggcg cttgcaatgc catggtatat aatgtttctt 1020
aagtaa 1026
<210> 43
<211> 1020
<212> DNA
<213> 多杀巴斯德菌
<220>
<223> UDP-葡萄糖-4-差向异构酶(KFOA)的核酸序列
<400> 43
atgaacattc tagtgaccgg cggtgctggc tatatcggct cccataccag tttatgctta 60
ctgaataaag gatataacgt ggtcatcatt gacaacctga tcaatagttc atgcgagtcg 120
atccgtagga tagaactgat agctaagaag aaggtcacct tctacgagct gaacattaat 180
aatgaaaagg aagtgaacca gatccttaag aaacacaaat tcgattgcat aatgcacttc 240
gcaggtgcca agtcggtggc cgagtcacta attaagccaa ttttctacta tgacaacaac 300
gtctctggaa ctttgcagct gattaattgt gctataaaga acgacgtcgc aaatttcatc 360
ttttcttcat cagcaactgt ttatggtgag tcaaagatta tgccagtgac agaggactgc 420
cacatcggcg gcacactaaa tccatacgga acatcaaaat acatttcaga gttgatgata 480
agggacatcg ccaagaagta ctcagacact aatttcttat gcttgcgtta tttcaatcct 540
accggggccc acgagtccgg catgatcggc gagtctccag ctgatatacc atccaatctg 600
gtgccttaca ttttacaggt ggccatgggc aagttggaga agttaatggt attcggcggt 660
gactacccaa caaaggacgg cacgggtgtg agagactata ttcacgtgat ggacctagcg 720
gaaggtcatg tggcagccct aagctacctt ttcagagata ataacactaa ttaccatgta 780
ttcaatctgg gcacgggtaa gggctacagt gtccttgaat tagtaagcac attcgagaaa 840
atctcgggtg tcaggattcc atacgagatc gtttctcgtc gtgatgggga catcgcagag 900
agttggtcat caccggagaa agcgaacaag tacttaaatt ggaaggccaa gagggagctt 960
gagacaatgc tagaagacgc atggcgttgg cagatgaaga acccgaatgg ttacatataa 1020
<210> 44
<211> 1021
<212> DNA
<213> 大肠埃希氏菌
<220>
<223> UDP-葡萄糖-4-差向异构酶(KFOA)的核酸序列
<400> 44
aatgaacatt ctagtgaccg gcggtgctgg ctatatcggc tcccatacca gtttatgctt 60
actgaataaa ggatataacg tggtcatcat tgacaacctg atcaatagtt catgcgagtc 120
gatccgtagg atagaactga tagctaagaa gaaggtcacc ttctacgagc tgaacattaa 180
taatgaaaag gaagtgaacc agatccttaa gaaacacaaa ttcgattgca taatgcactt 240
cgcaggtgcc aagtcggtgg ccgagtcact aattaagcca attttctact atgacaacaa 300
cgtctctgga actttgcagc tgattaattg tgctataaag aacgacgtcg caaatttcat 360
cttttcttca tcagcaactg tttatggtga gtcaaagatt atgccagtga cagaggactg 420
ccacatcggc ggcacactaa atccatacgg aacatcaaaa tacatttcag agttgatgat 480
aagggacatc gccaagaagt actcagacac taatttctta tgcttgcgtt atttcaatcc 540
taccggggcc cacgagtccg gcatgatcgg cgagtctcca gctgatatac catccaatct 600
ggtgccttac attttacagg tggccatggg caagttggag aagttaatgg tattcggcgg 660
tgactaccca acaaaggacg gcacgggtgt gagagactat attcacgtga tggacctagc 720
ggaaggtcat gtggcagccc taagctacct tttcagagat aataacacta attaccatgt 780
attcaatctg ggcacgggta agggctacag tgtccttgaa ttagtaagca cattcgagaa 840
aatctcgggt gtcaggattc catacgagat cgtttctcgt cgtgatgggg acatcgcaga 900
gagttggtca tcaccggaga aagcgaacaa gtacttaaat tggaaggcca agagggagct 960
tgagacaatg ctagaagacg catggcgttg gcagatgaag aacccgaatg gttacatata 1020
a 1021
<210> 45
<211> 341
<212> PRT
<213> 铜绿假单胞菌
<220>
<223> UDP-葡萄糖-4-差向异构酶(GNE1)的氨基酸序列
<400> 45
Met Met Ser Arg Tyr Glu Glu Leu Arg Lys Glu Leu Pro Ala Gln Pro
1 5 10 15
Lys Val Trp Leu Ile Thr Gly Val Ala Gly Phe Ile Gly Ser Asn Leu
20 25 30
Leu Glu Thr Leu Leu Lys Leu Asp Gln Lys Val Val Gly Leu Asp Asn
35 40 45
Phe Ala Thr Gly His Gln Arg Asn Leu Asp Glu Val Arg Ser Leu Val
50 55 60
Ser Glu Lys Gln Trp Ser Asn Phe Lys Phe Ile Gln Gly Asp Ile Arg
65 70 75 80
Asn Leu Asp Asp Cys Asn Asn Ala Cys Ala Gly Val Asp Tyr Val Leu
85 90 95
His Gln Ala Ala Leu Gly Ser Val Pro Arg Ser Ile Asn Asp Pro Ile
100 105 110
Thr Ser Asn Ala Thr Asn Ile Asp Gly Phe Leu Asn Met Leu Ile Ala
115 120 125
Ala Arg Asp Ala Lys Val Gln Ser Phe Thr Tyr Ala Ala Ser Ser Ser
130 135 140
Thr Tyr Gly Asp His Pro Gly Leu Pro Lys Val Glu Asp Thr Ile Gly
145 150 155 160
Lys Pro Leu Ser Pro Tyr Ala Val Thr Lys Tyr Val Asn Glu Leu Tyr
165 170 175
Ala Asp Val Phe Ser Arg Cys Tyr Gly Phe Ser Thr Ile Gly Leu Arg
180 185 190
Tyr Phe Asn Val Phe Gly Arg Arg Gln Asp Pro Asn Gly Ala Tyr Ala
195 200 205
Ala Val Ile Pro Lys Trp Thr Ser Ser Met Ile Gln Gly Asp Asp Val
210 215 220
Tyr Ile Asn Gly Asp Gly Glu Thr Ser Arg Asp Phe Cys Tyr Ile Glu
225 230 235 240
Asn Thr Val Gln Ala Asn Leu Leu Ala Ala Thr Ala Gly Leu Asp Ala
245 250 255
Arg Asn Gln Val Tyr Asn Ile Ala Val Gly Gly Arg Thr Ser Leu Asn
260 265 270
Gln Leu Phe Phe Ala Leu Arg Asp Gly Leu Ala Glu Asn Gly Val Ser
275 280 285
Tyr His Arg Glu Pro Val Tyr Arg Asp Phe Arg Glu Gly Asp Val Arg
290 295 300
His Ser Leu Ala Asp Ile Ser Lys Ala Ala Lys Leu Leu Gly Tyr Ala
305 310 315 320
Pro Lys Tyr Asp Val Ser Ala Gly Val Ala Leu Ala Met Pro Trp Tyr
325 330 335
Ile Met Phe Leu Lys
340
<210> 46
<211> 338
<212> PRT
<213> 多杀巴斯德菌
<220>
<223> UDP-葡萄糖-4-差向异构酶(KFOA)的氨基酸序列
<400> 46
Met Ala Ile Leu Val Thr Gly Gly Ala Gly Tyr Ile Gly Ser His Thr
1 5 10 15
Val Val Glu Leu Leu Asn Ala Asn Lys Asp Val Val Val Leu Asp Asn
20 25 30
Leu Cys Asn Ser Ser Pro Lys Ser Leu Glu Arg Val Ala Gln Ile Thr
35 40 45
Gly Lys Gln Val Lys Phe Tyr Gln Gly Asp Ile Leu Asp Thr Ala Leu
50 55 60
Leu Gln Lys Ile Phe Ala Glu Asn Gln Ile Gln Ser Val Ile His Phe
65 70 75 80
Ala Gly Leu Lys Ala Val Gly Glu Ser Val Gln Lys Pro Ala Glu Tyr
85 90 95
Tyr Met Asn Asn Val Thr Gly Ser Leu Val Leu Ile Gln Glu Met Lys
100 105 110
Lys Ala Gly Val Trp Asn Phe Val Phe Ser Ser Ser Ala Thr Val Tyr
115 120 125
Gly Asp Pro Glu Ile Ile Pro Ile Thr Glu Ser Cys Lys Val Gly Gly
130 135 140
Thr Thr Asn Pro Tyr Gly Thr Ser Lys Phe Met Val Glu Gln Ile Leu
145 150 155 160
Lys Asp Ile Ala Lys Ala Thr Pro Glu Phe Ser Ile Thr Ile Leu Arg
165 170 175
Tyr Phe Asn Pro Val Gly Ala His Glu Ser Gly Leu Ile Gly Glu Asp
180 185 190
Pro Asn Gly Ile Pro Asn Asn Leu Leu Pro Tyr Ile Ser Gln Val Ala
195 200 205
Ile Gly Lys Leu Pro Gln Leu Ser Val Phe Gly Ser Asp Tyr Glu Thr
210 215 220
His Asp Gly Thr Gly Val Arg Asp Tyr Ile His Val Val Asp Leu Ala
225 230 235 240
Ile Gly His Leu Lys Ala Leu Asp Arg His Glu Gly Asp Ala Gly Leu
245 250 255
His Ile Tyr Asn Leu Gly Thr Gly Ser Gly Tyr Ser Val Leu Asp Met
260 265 270
Val Lys Ala Phe Glu Lys Val Asn Asp Ile Lys Ile Pro Tyr Lys Leu
275 280 285
Val Asp Arg Arg Pro Gly Asp Ile Ala Thr Cys Tyr Ser Asp Pro Ser
290 295 300
Leu Ala Lys Thr Glu Leu Asn Trp Thr Ala Ala Arg Gly Leu Glu Gln
305 310 315 320
Met Met Lys Asp Thr Trp His Trp Gln Lys Lys Asn Pro Lys Gly Tyr
325 330 335
Arg Asp
<210> 47
<211> 339
<212> PRT
<213> 大肠埃希氏菌
<220>
<223> UDP-葡萄糖-4-差向异构酶(KFOA)的氨基酸序列
<400> 47
Met Asn Ile Leu Val Thr Gly Gly Ala Gly Tyr Ile Gly Ser His Thr
1 5 10 15
Ser Leu Cys Leu Leu Asn Lys Gly Tyr Asn Val Val Ile Ile Asp Asn
20 25 30
Leu Ile Asn Ser Ser Cys Glu Ser Ile Arg Arg Ile Glu Leu Ile Ala
35 40 45
Lys Lys Lys Val Thr Phe Tyr Glu Leu Asn Ile Asn Asn Glu Lys Glu
50 55 60
Val Asn Gln Ile Leu Lys Lys His Lys Phe Asp Cys Ile Met His Phe
65 70 75 80
Ala Gly Ala Lys Ser Val Ala Glu Ser Leu Ile Lys Pro Ile Phe Tyr
85 90 95
Tyr Asp Asn Asn Val Ser Gly Thr Leu Gln Leu Ile Asn Cys Ala Ile
100 105 110
Lys Asn Asp Val Ala Asn Phe Ile Phe Ser Ser Ser Ala Thr Val Tyr
115 120 125
Gly Glu Ser Lys Ile Met Pro Val Thr Glu Asp Cys His Ile Gly Gly
130 135 140
Thr Leu Asn Pro Tyr Gly Thr Ser Lys Tyr Ile Ser Glu Leu Met Ile
145 150 155 160
Arg Asp Ile Ala Lys Lys Tyr Ser Asp Thr Asn Phe Leu Cys Leu Arg
165 170 175
Tyr Phe Asn Pro Thr Gly Ala His Glu Ser Gly Met Ile Gly Glu Ser
180 185 190
Pro Ala Asp Ile Pro Ser Asn Leu Val Pro Tyr Ile Leu Gln Val Ala
195 200 205
Met Gly Lys Leu Glu Lys Leu Met Val Phe Gly Gly Asp Tyr Pro Thr
210 215 220
Lys Asp Gly Thr Gly Val Arg Asp Tyr Ile His Val Met Asp Leu Ala
225 230 235 240
Glu Gly His Val Ala Ala Leu Ser Tyr Leu Phe Arg Asp Asn Asn Thr
245 250 255
Asn Tyr His Val Phe Asn Leu Gly Thr Gly Lys Gly Tyr Ser Val Leu
260 265 270
Glu Leu Val Ser Thr Phe Glu Lys Ile Ser Gly Val Arg Ile Pro Tyr
275 280 285
Glu Ile Val Ser Arg Arg Asp Gly Asp Ile Ala Glu Ser Trp Ser Ser
290 295 300
Pro Glu Lys Ala Asn Lys Tyr Leu Asn Trp Lys Ala Lys Arg Glu Leu
305 310 315 320
Glu Thr Met Leu Glu Asp Ala Trp Arg Trp Gln Met Lys Asn Pro Asn
325 330 335
Gly Tyr Ile
<210> 48
<211> 1197
<212> DNA
<213> 萨氏九杯蛛
<220>
<223> 具有N-末端分泌信号的源自萨氏九杯蛛的透明质酸酶(HYAL)的重编码核酸序列
<400> 48
atgcaattca gcactgttgc atcagttgca tttgtcgccc tggcgaattt tgtagccgcg 60
ttcaagattt actggaacgt cccaactttt cagtgcacgc ataactacaa aatcgattat 120
gtcaaattgt tgtccactta cgggatacag gtcaatgatg gcggtaagtt tcaaggaaac 180
caagtgacta tcttttatga aacccagttg ggtttgtatc cacgaatcct aaaatctggt 240
aaaatggaaa acggcggaat ccctcaacgc ggtaactttg agaaacacct agaaaaggca 300
agcacggacc tccagaaagt gatcccttgg aaagagttta gcggattagg tgtgatagat 360
tgggaggctt ggagacccac atgggaattt aactgggaac cgttgaggat atatcaaacc 420
gaatcaatta agagagctaa agaactacac cctaccgcaa acgattccgc agtaaaagaa 480
attgcagagc ggcaatggga agattcagcc aagttataca tgttagaaac actgcggctg 540
gcaaagaaac ttcgacctca agcgccttgg tgttactact tatttcctga ttgctataat 600
tacgtcggaa agaaaccaaa agatttccaa tgtagtgcct cgatacgtaa aggtaacgat 660
aagctaagct ggttgtggaa agattctacg gcattgtgtc catcgatata cgtatatgaa 720
tcacaattag acaggtattc ttttgaacaa aggacatggc gcgacaatga gaaacttcgg 780
gaagcgttgc gtgtagccac gagaacctct aaaatatacc catacgttaa ctatttcgat 840
aaggagctta taccggagca agaagtatgg agaatgcttg cgcaggcagc tgctgtcggt 900
ggcagtggtg cggtaatttg gggctcatct gctgcagttg catctgaaga gttatgtaaa 960
tctttaaaac agtatattat tgaaacgctt gggccggcgg cagagaaggt ggcttggcgt 1020
agtgacttat gcagcaaaga aatttgtaat aatcagggtc gctgcacatt cccggacgat 1080
gattatgcaa acgcatggaa attatttaca gatgatactg ttaagtttta tgctggtaat 1140
attacatgta ggtgctccga gaattattct ggtcgtttct gcgaaaagaa gaattaa 1197
<210> 49
<211> 1218
<212> DNA
<213> 巴西钳蝎
<220>
<223> 具有N-末端分泌信号的源自巴西钳蝎的透明质酸酶(HYAL)的重编码核酸序列
<400> 49
atgcaattct ctactgtcgc ttccgttgct ttcgtcgctt tggctaactt tgttgccgct 60
gctgatttta aagtttactg ggaagtgcct tccttccttt gttctaaacg ttttaaaatt 120
aatgtaacgg aagttttaac aagtcacgag attcttgtca atcagggtga gagtttcaac 180
ggtgacaaga tagtaatctt ttacgaaaac caattgggga agtacccgca tattgactca 240
aacaatgtgg agatcaatgg aggaatactt caagtagccg atttggcgaa gcatttgaaa 300
gtagccaagg ataatatcac taaattcgtc ccgaatccta atttcaacgg tgtcggagtg 360
atcgactggg aagcttggcg gccatcatgg gaatttaact ggggtaagtt aaaagtatat 420
aaagaaaaga gcattgactt ggtcaagtcg aaacatccgg agtggccctc cgacagggtt 480
gaaaaggttg ctaaagagga gtgggaggag agtgccaaag aatggatggt gaagaccctg 540
aagttagcac aggaaatgcg accgaacgca gtttggtgct attatctatt ccctgactgc 600
tacaattatt tcggtaagga tcaaccctct caattcagct gctcgtctcg aattcagaag 660
gaaaattctc gtctttcttg gctctggaat caatcaacag ccatttgcct aagcatttat 720
atccaggaat cccatgttac caaatataat atgtcccagc ggacatggtg gatcgatgcg 780
agattaagag aagcaattcg agtcagcgaa cacagaccaa acatacccat ctacccttac 840
attaattata ttctacctgg aactaatcaa actgtaccag caatggactt taaaaggaca 900
ctgggtcaaa tagctagcct cggcctagat ggtgctttgt tatggggatc tagctatcat 960
gttttaacag aatctcaatg caaaatcact tctgattatg tgaaatcagt gattgctcct 1020
accgtggcta ctgtcgttct caatacaaac agatgctcac agataatttg taagggtcgc 1080
ggcaactgtg tttggcctga agaaccattt agttcttgga aatacttagt tgaccccaaa 1140
atgccagtgt tcaagccaac caacatccac tgtaaatgta aaggttacct aggtagatac 1200
tgtgagatcc caaagtaa 1218
<210> 50
<211> 1308
<212> DNA
<213> 家牛
<220>
<223> 具有N-末端分泌信号的源自家牛的透明质酸酶(HYAL)的重编码核酸序列
<400> 50
atgcaatttt ctactgttgc ttctgtcgct ttcgtagcac tggccaattt tgtagctgct 60
ggaagccgtg accccgttgt cccaaaccag cctttcacaa caatatggaa cgcaaatacg 120
gagtggtgca tgaagaagca tggagtggac gtcgatattt caatcttcga cgtggtcact 180
aatccaggac agacatttag aggtccaaat atgacaatat tttacagttc acaattgggg 240
acctaccctt actacacatc cgcgggtgag ccagtattcg gtggtctacc ccagaacgca 300
agtttgaatg cccacttggc taggacattt caagatattc tggcagccat gccagagccc 360
aggttctcag gtttggctgt catagactgg gaagcgtgga gacctcgttg ggcatttaat 420
tgggatacga aagacatata caggcagagg tccagagcat tggttcagaa acagcacccg 480
gattggctgg cgccacgtgt tgaggccgca gcgcaagacc agttcgaggg cgctgctgag 540
gagtggatgg ccggcacact taaattaggg caggcgcttc gtcctcaagg cttgtggggt 600
ttctataact tcccggagtg ttacaattat gacttcaaat ctccgaacta cacaggaagg 660
tgccctttaa acatctgtgc gcagaacgac cagttaggtt ggctatgggg tcaaagtcgt 720
gcactatatc catcaatcta cttgccggcg gctttggaag gcacgaagaa gactcagatg 780
ttcgttcagc accgtgtagc agaggcattt agggtggcgg caggcgctgg tgaccccaag 840
ctacccgtct taccctatat gcagctattt tacgatatga caaaccactt cttgcccgcg 900
gaagaactgg aacatagctt aggtgagtca gcagcgcagg gtgcagccgg ggttgttctg 960
tgggtttcct ggttatcaac ttcgacaaag gaaagctgtc aagcaatcaa ggaatacgta 1020
gatactacgt tgggcccttc aatcttgaac gtcacatctg gtgccaggtt gtgttctcag 1080
gtattgtgca gtggccacgg gagatgcgcg agaagacctt catatcctaa agccaggctg 1140
attctaaatt caacgtcgtt ctccatcaag ccaacacccg gtggtggtcc attgacactt 1200
caaggcgctt tgagtttgga agacagatta cgtatggcag ttgagtttga atgcagatgt 1260
tacagaggat ggagagggac acgttgtgag cagtggggca tgtggtaa 1308
<210> 51
<211> 1137
<212> DNA
<213> 西方蜜蜂
<220>
<223> 具有N-末端分泌信号的源自西方蜜蜂的透明质酸酶(HYAL)的重编码核酸序列
<400> 51
atgcagtttt ccacagttgc ttccgtagct ttcgtagctt tagcaaattt tgtcgcagct 60
ttgttgttgg gcttcgttca gtctactcca gataataata agactgtgcg tgaatttaac 120
gtgtattgga acgttcctac attcatgtgc cataagtacg ggttgagatt cgaagaggtg 180
agcgagaagt atggcatttt gcaaaattgg atggacaaat tcagaggaga ggaaattgcg 240
atcttatacg accccggcat gttccccgca ctgttgaaag accccaatgg gaatgtagta 300
gctaggaatg gcggagtgcc ccagcttggc aatttaacta aacatttaca ggtgttcagg 360
gaccacctaa tcaatcagat tccagataaa agctttcccg gagttggtgt aatagatttc 420
gagtcatgga gacctatttt cagacagaac tgggcctctt tgcaaccgta caagaagcta 480
tcagtcgaag tcgtacgtcg tgagcaccca ttctgggatg atcagagagt ggagcaagag 540
gcgaaaagaa gatttgaaaa gtacggccag cttttcatgg aagagacctt gaaagccgca 600
aaacgtatgc gtcctgcagc caattggggc tactacgctt acccttattg ctacaacctg 660
accccaaacc agccctcagc tcaatgcgag gctacaacaa tgcaggagaa cgacaagatg 720
tcatggttat tcgagtccga ggacgtctta ctgcccagcg tctatttgag gtggaacctg 780
actagcggag agagggttgg tttagttggt ggtcgtgtca aggaagccct gagaatagct 840
cgtcagatga ccacctctag gaagaaggtc ctaccatact actggtacaa ataccaggat 900
aggagagaca cggacctaag tagggctgat cttgaggcga ctctacgtaa aatcacggac 960
ttaggagccg acggtttcat aatctgggga tcttccgatg acatcaacac caaggcaaaa 1020
tgtttgcagt tcagagaata tttgaataac gagttgggcc cggcagtgaa gagaatagcc 1080
ttaaacaata atgcgaatga caggctaaca gtggatgtgt ctgttgacca ggtttaa 1137
<210> 52
<211> 1305
<212> DNA
<213> 野捕恒河猴
<220>
<223> 具有N-末端分泌信号的源自野捕恒河猴的透明质酸酶(HYAL)的重编码核酸序列
<400> 52
atgcaattca gtactgtcgc tagcgtcgcc tttgtggctc ttgcaaattt cgtcgctgct 60
tcacgtgggc ctttattgcc gaacagacca tttgcaacgg tatggaatgc taacacccaa 120
tggtgtttag agaggcactc agtagacgtc gatgtctcca tatttgatgt tgtagcaaac 180
cccggccaga cttttcgtgg gccggacatg actattttct attccagtca gctaggtact 240
tacccttatt ataccccgac gggtgaacct gtctttggtg gccttccaca gaacgcatca 300
cttatagcgc acttggctag gactttccag gatatattgg cagctatacc agcccccgac 360
ttttctgggc tagccgtaat tgactgggaa gcatggagac cgagatgggc atttaactgg 420
gacacgaaag acatttacag gcaaaggtcc cgtgccttag tccaagcaca gcatcccgac 480
tggccagtta ctcaagttga ggctgtggca caagaccagt tccagggtgc tgcgagggca 540
tggatggcag gaaccttgca attaggccgt gctttaagac caaggggact atggggcttc 600
tacggttttc ccgattgcta caattacgat ttcctatctc ctaattacac agggcaatgc 660
ccatcaggga tcagagcaca aaatgaccag ttaggatggt tgtggggtca gagtcgtgca 720
ttatatccca gtatctacat gccggctgtt ttggaaggaa caggcaaatc ccaaatgtac 780
gtgcagcaca gggtcgcgga agcctttagg gttgctgttg cagcaggcga cccaaactta 840
cccgtcctac cgtacgtcca gattttctac gatatgacca accactttct tccattggac 900
gagttagagc atagtcttgg agaatcagcg gctcagggcg cagcaggagt cgtgttatgg 960
gtgtcatggg agaatactag aacaaaagaa tcttgccagg caattaaaga atatatggac 1020
actaccttgg ggccttttat tctgaacgtc acttcgggtg cgttgttatg ctcgcaagcc 1080
ttatgttcaa gccatggtcg ttgtgtccgt cgtccctcac atccaaaagc cttgctaatc 1140
cttaatcccg caagctttag tattcagttg acaccagatg gtggtccctt gtcgttaagg 1200
ggagcattgt cacttgagga ccaggcacaa atggctgttg aattcaaatg caggtgctac 1260
cccgggtggc aaggcccttg gtgtgagcag aagagtatgt ggtaa 1305
<210> 53
<211> 1083
<212> DNA
<213> 大胡蜂
<220>
<223> 具有N-末端分泌信号的源自大胡蜂的透明质酸酶(HYAL)的重编码核酸序列
<400> 53
atgcaatttt ctacagtggc aagtgttgca ttcgttgcac tagccaactt tgtggcggca 60
gatagctgtg ggtcaaactg cgaaaagagt gagagaccga aaagggtctt caacatttac 120
tggaacgtac ctacattcat gtgtcaccag tacggactat actttgacga ggtcacgaat 180
tttaatataa agcacaacag caaagacaat tttcaagggg acaagatcgc gatcttttat 240
gaccccgggg agtttcccgc tctgctgcca ctaaactatg gtaagtacaa gatcaggaat 300
ggtggtgttc cacaagaggg taacatcacc atccatctgc agagattcat agagtaccta 360
gataagacct atccgaaccg taacttttca ggcatcggtg tgatcgattt cgagaggtgg 420
agaccaattt tcagacagaa ttggggtaat atgaagattt acaagaactt ctccatcgat 480
cttgtgcgta aagagcatcc tttctggaat aagaaaatga tcgagttgga agcttctaaa 540
agattcgaga aatacgcccg tctgttcatg gaagaaacat taaagttggc taagaaaact 600
agaaaacagg ccgattgggg ctactacggt tacccctatt gcttcaacat gtctcctact 660
aatttcgttc ctgactgcga tgtcacagct agggatgaga acaacgagat gtcttggttg 720
tttaacaacc agaatgtcct attaccaagt gtatacatta ggagagagct aactcctgac 780
cagaggattg ggcttgtaca ggggagagtg aaggaagctg tgagaatttc aaataaactg 840
aagcactcac ctaaagtctt cagctattgg tggtatgttt accaagacga gaccaacacc 900
ttcttaacgg agaccgacgt caagaagacg tttcaggaga ttgtgatcaa cggtggagat 960
gggattataa tctggggttc gtcctctgat gtaaacagct tgtccaagtg tacgaggtta 1020
agggagtacc tattgacagt cttgggacca attgctgtta acgtgactga agcagtaaac 1080
taa 1083
<210> 54
<211> 1407
<212> DNA
<213> 萨氏九杯蛛
<220>
<223> 具有N-末端分泌信号和C-末端锚定信号的源自萨氏九杯蛛的透明质酸酶(HYAL)的重编码核酸序列
<400> 54
atgcaattca gcactgttgc atcagttgca tttgtcgccc tggcgaattt tgtagccgcg 60
ttcaagattt actggaacgt cccaactttt cagtgcacgc ataactacaa aatcgattat 120
gtcaaattgt tgtccactta cgggatacag gtcaatgatg gcggtaagtt tcaaggaaac 180
caagtgacta tcttttatga aacccagttg ggtttgtatc cacgaatcct aaaatctggt 240
aaaatggaaa acggcggaat ccctcaacgc ggtaactttg agaaacacct agaaaaggca 300
agcacggacc tccagaaagt gatcccttgg aaagagttta gcggattagg tgtgatagat 360
tgggaggctt ggagacccac atgggaattt aactgggaac cgttgaggat atatcaaacc 420
gaatcaatta agagagctaa agaactacac cctaccgcaa acgattccgc agtaaaagaa 480
attgcagagc ggcaatggga agattcagcc aagttataca tgttagaaac actgcggctg 540
gcaaagaaac ttcgacctca agcgccttgg tgttactact tatttcctga ttgctataat 600
tacgtcggaa agaaaccaaa agatttccaa tgtagtgcct cgatacgtaa aggtaacgat 660
aagctaagct ggttgtggaa agattctacg gcattgtgtc catcgatata cgtatatgaa 720
tcacaattag acaggtattc ttttgaacaa aggacatggc gcgacaatga gaaacttcgg 780
gaagcgttgc gtgtagccac gagaacctct aaaatatacc catacgttaa ctatttcgat 840
aaggagctta taccggagca agaagtatgg agaatgcttg cgcaggcagc tgctgtcggt 900
ggcagtggtg cggtaatttg gggctcatct gctgcagttg catctgaaga gttatgtaaa 960
tctttaaaac agtatattat tgaaacgctt gggccggcgg cagagaaggt ggcttggcgt 1020
agtgacttat gcagcaaaga aatttgtaat aatcagggtc gctgcacatt cccggacgat 1080
gattatgcaa acgcatggaa attatttaca gatgatactg ttaagtttta tgctggtaat 1140
attacatgta ggtgctccga gaattattct ggtcgtttct gcgaaaagaa gaatggatcc 1200
gccatttctc aaatcactga cggtcaaatc caagctacta ccactgctac caccgaagct 1260
accaccactg ctgccccatc ttccaccgtt gaaactgttt ctccatccag caccgaaact 1320
atctctcaac aaactgaaaa tggtgctgct aaggccgctg tcggtatggg tgccggtgct 1380
ctagctgctg ctgctatgtt gttataa 1407
<210> 55
<211> 1428
<212> DNA
<213> 巴西钳蝎
<220>
<223> 具有N-末端分泌信号和C-末端锚定信号的源自巴西钳蝎的透明质酸酶(HYAL)的重编码核酸序列
<400> 55
atgcaattct ctactgtcgc ttccgttgct ttcgtcgctt tggctaactt tgttgccgct 60
gctgatttta aagtttactg ggaagtgcct tccttccttt gttctaaacg ttttaaaatt 120
aatgtaacgg aagttttaac aagtcacgag attcttgtca atcagggtga gagtttcaac 180
ggtgacaaga tagtaatctt ttacgaaaac caattgggga agtacccgca tattgactca 240
aacaatgtgg agatcaatgg aggaatactt caagtagccg atttggcgaa gcatttgaaa 300
gtagccaagg ataatatcac taaattcgtc ccgaatccta atttcaacgg tgtcggagtg 360
atcgactggg aagcttggcg gccatcatgg gaatttaact ggggtaagtt aaaagtatat 420
aaagaaaaga gcattgactt ggtcaagtcg aaacatccgg agtggccctc cgacagggtt 480
gaaaaggttg ctaaagagga gtgggaggag agtgccaaag aatggatggt gaagaccctg 540
aagttagcac aggaaatgcg accgaacgca gtttggtgct attatctatt ccctgactgc 600
tacaattatt tcggtaagga tcaaccctct caattcagct gctcgtctcg aattcagaag 660
gaaaattctc gtctttcttg gctctggaat caatcaacag ccatttgcct aagcatttat 720
atccaggaat cccatgttac caaatataat atgtcccagc ggacatggtg gatcgatgcg 780
agattaagag aagcaattcg agtcagcgaa cacagaccaa acatacccat ctacccttac 840
attaattata ttctacctgg aactaatcaa actgtaccag caatggactt taaaaggaca 900
ctgggtcaaa tagctagcct cggcctagat ggtgctttgt tatggggatc tagctatcat 960
gttttaacag aatctcaatg caaaatcact tctgattatg tgaaatcagt gattgctcct 1020
accgtggcta ctgtcgttct caatacaaac agatgctcac agataatttg taagggtcgc 1080
ggcaactgtg tttggcctga agaaccattt agttcttgga aatacttagt tgaccccaaa 1140
atgccagtgt tcaagccaac caacatccac tgtaaatgta aaggttacct aggtagatac 1200
tgtgagatcc caaagggatc cgccatttct caaatcactg acggtcaaat ccaagctact 1260
accactgcta ccaccgaagc taccaccact gctgccccat cttccaccgt tgaaactgtt 1320
tctccatcca gcaccgaaac tatctctcaa caaactgaaa atggtgctgc taaggccgct 1380
gtcggtatgg gtgccggtgc tctagctgct gctgctatgt tgttataa 1428
<210> 56
<211> 1518
<212> DNA
<213> 家牛
<220>
<223> 具有N-末端分泌信号和C-末端锚定信号的源自家牛的透明质酸酶(HYAL)的重编码核酸序列
<400> 56
atgcaatttt ctactgttgc ttctgtcgct ttcgtagcac tggccaattt tgtagctgct 60
ggaagccgtg accccgttgt cccaaaccag cctttcacaa caatatggaa cgcaaatacg 120
gagtggtgca tgaagaagca tggagtggac gtcgatattt caatcttcga cgtggtcact 180
aatccaggac agacatttag aggtccaaat atgacaatat tttacagttc acaattgggg 240
acctaccctt actacacatc cgcgggtgag ccagtattcg gtggtctacc ccagaacgca 300
agtttgaatg cccacttggc taggacattt caagatattc tggcagccat gccagagccc 360
aggttctcag gtttggctgt catagactgg gaagcgtgga gacctcgttg ggcatttaat 420
tgggatacga aagacatata caggcagagg tccagagcat tggttcagaa acagcacccg 480
gattggctgg cgccacgtgt tgaggccgca gcgcaagacc agttcgaggg cgctgctgag 540
gagtggatgg ccggcacact taaattaggg caggcgcttc gtcctcaagg cttgtggggt 600
ttctataact tcccggagtg ttacaattat gacttcaaat ctccgaacta cacaggaagg 660
tgccctttaa acatctgtgc gcagaacgac cagttaggtt ggctatgggg tcaaagtcgt 720
gcactatatc catcaatcta cttgccggcg gctttggaag gcacgaagaa gactcagatg 780
ttcgttcagc accgtgtagc agaggcattt agggtggcgg caggcgctgg tgaccccaag 840
ctacccgtct taccctatat gcagctattt tacgatatga caaaccactt cttgcccgcg 900
gaagaactgg aacatagctt aggtgagtca gcagcgcagg gtgcagccgg ggttgttctg 960
tgggtttcct ggttatcaac ttcgacaaag gaaagctgtc aagcaatcaa ggaatacgta 1020
gatactacgt tgggcccttc aatcttgaac gtcacatctg gtgccaggtt gtgttctcag 1080
gtattgtgca gtggccacgg gagatgcgcg agaagacctt catatcctaa agccaggctg 1140
attctaaatt caacgtcgtt ctccatcaag ccaacacccg gtggtggtcc attgacactt 1200
caaggcgctt tgagtttgga agacagatta cgtatggcag ttgagtttga atgcagatgt 1260
tacagaggat ggagagggac acgttgtgag cagtggggca tgtggggatc cgccatttct 1320
caaatcactg acggtcaaat ccaagctact accactgcta ccaccgaagc taccaccact 1380
gctgccccat cttccaccgt tgaaactgtt tctccatcca gcaccgaaac tatctctcaa 1440
caaactgaaa atggtgctgc taaggccgct gtcggtatgg gtgccggtgc tctagctgct 1500
gctgctatgt tgttataa 1518
<210> 57
<211> 1347
<212> DNA
<213> 西方蜜蜂
<220>
<223> 具有N-末端分泌信号和C-末端锚定信号的源自西方蜜蜂的透明质酸酶(HYAL)的重编码核酸序列
<400> 57
atgcagtttt ccacagttgc ttccgtagct ttcgtagctt tagcaaattt tgtcgcagct 60
ttgttgttgg gcttcgttca gtctactcca gataataata agactgtgcg tgaatttaac 120
gtgtattgga acgttcctac attcatgtgc cataagtacg ggttgagatt cgaagaggtg 180
agcgagaagt atggcatttt gcaaaattgg atggacaaat tcagaggaga ggaaattgcg 240
atcttatacg accccggcat gttccccgca ctgttgaaag accccaatgg gaatgtagta 300
gctaggaatg gcggagtgcc ccagcttggc aatttaacta aacatttaca ggtgttcagg 360
gaccacctaa tcaatcagat tccagataaa agctttcccg gagttggtgt aatagatttc 420
gagtcatgga gacctatttt cagacagaac tgggcctctt tgcaaccgta caagaagcta 480
tcagtcgaag tcgtacgtcg tgagcaccca ttctgggatg atcagagagt ggagcaagag 540
gcgaaaagaa gatttgaaaa gtacggccag cttttcatgg aagagacctt gaaagccgca 600
aaacgtatgc gtcctgcagc caattggggc tactacgctt acccttattg ctacaacctg 660
accccaaacc agccctcagc tcaatgcgag gctacaacaa tgcaggagaa cgacaagatg 720
tcatggttat tcgagtccga ggacgtctta ctgcccagcg tctatttgag gtggaacctg 780
actagcggag agagggttgg tttagttggt ggtcgtgtca aggaagccct gagaatagct 840
cgtcagatga ccacctctag gaagaaggtc ctaccatact actggtacaa ataccaggat 900
aggagagaca cggacctaag tagggctgat cttgaggcga ctctacgtaa aatcacggac 960
ttaggagccg acggtttcat aatctgggga tcttccgatg acatcaacac caaggcaaaa 1020
tgtttgcagt tcagagaata tttgaataac gagttgggcc cggcagtgaa gagaatagcc 1080
ttaaacaata atgcgaatga caggctaaca gtggatgtgt ctgttgacca ggttggatcc 1140
gccatttctc aaatcactga cggtcaaatc caagctacta ccactgctac caccgaagct 1200
accaccactg ctgccccatc ttccaccgtt gaaactgttt ctccatccag caccgaaact 1260
atctctcaac aaactgaaaa tggtgctgct aaggccgctg tcggtatggg tgccggtgct 1320
ctagctgctg ctgctatgtt gttataa 1347
<210> 58
<211> 1515
<212> DNA
<213> 野捕恒河猴
<220>
<223> 具有N-末端分泌信号和C-末端锚定信号的源自野捕恒河猴的透明质酸酶(HYAL)的重编码核酸序列
<400> 58
atgcaattca gtactgtcgc tagcgtcgcc tttgtggctc ttgcaaattt cgtcgctgct 60
tcacgtgggc ctttattgcc gaacagacca tttgcaacgg tatggaatgc taacacccaa 120
tggtgtttag agaggcactc agtagacgtc gatgtctcca tatttgatgt tgtagcaaac 180
cccggccaga cttttcgtgg gccggacatg actattttct attccagtca gctaggtact 240
tacccttatt ataccccgac gggtgaacct gtctttggtg gccttccaca gaacgcatca 300
cttatagcgc acttggctag gactttccag gatatattgg cagctatacc agcccccgac 360
ttttctgggc tagccgtaat tgactgggaa gcatggagac cgagatgggc atttaactgg 420
gacacgaaag acatttacag gcaaaggtcc cgtgccttag tccaagcaca gcatcccgac 480
tggccagtta ctcaagttga ggctgtggca caagaccagt tccagggtgc tgcgagggca 540
tggatggcag gaaccttgca attaggccgt gctttaagac caaggggact atggggcttc 600
tacggttttc ccgattgcta caattacgat ttcctatctc ctaattacac agggcaatgc 660
ccatcaggga tcagagcaca aaatgaccag ttaggatggt tgtggggtca gagtcgtgca 720
ttatatccca gtatctacat gccggctgtt ttggaaggaa caggcaaatc ccaaatgtac 780
gtgcagcaca gggtcgcgga agcctttagg gttgctgttg cagcaggcga cccaaactta 840
cccgtcctac cgtacgtcca gattttctac gatatgacca accactttct tccattggac 900
gagttagagc atagtcttgg agaatcagcg gctcagggcg cagcaggagt cgtgttatgg 960
gtgtcatggg agaatactag aacaaaagaa tcttgccagg caattaaaga atatatggac 1020
actaccttgg ggccttttat tctgaacgtc acttcgggtg cgttgttatg ctcgcaagcc 1080
ttatgttcaa gccatggtcg ttgtgtccgt cgtccctcac atccaaaagc cttgctaatc 1140
cttaatcccg caagctttag tattcagttg acaccagatg gtggtccctt gtcgttaagg 1200
ggagcattgt cacttgagga ccaggcacaa atggctgttg aattcaaatg caggtgctac 1260
cccgggtggc aaggcccttg gtgtgagcag aagagtatgt ggggatccgc catttctcaa 1320
atcactgacg gtcaaatcca agctactacc actgctacca ccgaagctac caccactgct 1380
gccccatctt ccaccgttga aactgtttct ccatccagca ccgaaactat ctctcaacaa 1440
actgaaaatg gtgctgctaa ggccgctgtc ggtatgggtg ccggtgctct agctgctgct 1500
gctatgttgt tataa 1515
<210> 59
<211> 1293
<212> DNA
<213> 大胡蜂
<220>
<223> 具有N-末端分泌信号和C-末端锚定信号的源自大胡蜂的透明质酸酶(HYAL)的重编码核酸序列
<400> 59
atgcaatttt ctacagtggc aagtgttgca ttcgttgcac tagccaactt tgtggcggca 60
gatagctgtg ggtcaaactg cgaaaagagt gagagaccga aaagggtctt caacatttac 120
tggaacgtac ctacattcat gtgtcaccag tacggactat actttgacga ggtcacgaat 180
tttaatataa agcacaacag caaagacaat tttcaagggg acaagatcgc gatcttttat 240
gaccccgggg agtttcccgc tctgctgcca ctaaactatg gtaagtacaa gatcaggaat 300
ggtggtgttc cacaagaggg taacatcacc atccatctgc agagattcat agagtaccta 360
gataagacct atccgaaccg taacttttca ggcatcggtg tgatcgattt cgagaggtgg 420
agaccaattt tcagacagaa ttggggtaat atgaagattt acaagaactt ctccatcgat 480
cttgtgcgta aagagcatcc tttctggaat aagaaaatga tcgagttgga agcttctaaa 540
agattcgaga aatacgcccg tctgttcatg gaagaaacat taaagttggc taagaaaact 600
agaaaacagg ccgattgggg ctactacggt tacccctatt gcttcaacat gtctcctact 660
aatttcgttc ctgactgcga tgtcacagct agggatgaga acaacgagat gtcttggttg 720
tttaacaacc agaatgtcct attaccaagt gtatacatta ggagagagct aactcctgac 780
cagaggattg ggcttgtaca ggggagagtg aaggaagctg tgagaatttc aaataaactg 840
aagcactcac ctaaagtctt cagctattgg tggtatgttt accaagacga gaccaacacc 900
ttcttaacgg agaccgacgt caagaagacg tttcaggaga ttgtgatcaa cggtggagat 960
gggattataa tctggggttc gtcctctgat gtaaacagct tgtccaagtg tacgaggtta 1020
agggagtacc tattgacagt cttgggacca attgctgtta acgtgactga agcagtaaac 1080
ggatccgcca tttctcaaat cactgacggt caaatccaag ctactaccac tgctaccacc 1140
gaagctacca ccactgctgc cccatcttcc accgttgaaa ctgtttctcc atccagcacc 1200
gaaactatct ctcaacaaac tgaaaatggt gctgctaagg ccgctgtcgg tatgggtgcc 1260
ggtgctctag ctgctgctgc tatgttgtta taa 1293
<210> 60
<211> 398
<212> PRT
<213> 萨氏九杯蛛
<220>
<223> 具有N-末端分泌信号的源自萨氏九杯蛛的透明质酸酶(HYAL)的氨基酸序列
<400> 60
Met Gln Phe Ser Thr Val Ala Ser Val Ala Phe Val Ala Leu Ala Asn
1 5 10 15
Phe Val Ala Ala Phe Lys Ile Tyr Trp Asn Val Pro Thr Phe Gln Cys
20 25 30
Thr His Asn Tyr Lys Ile Asp Tyr Val Lys Leu Leu Ser Thr Tyr Gly
35 40 45
Ile Gln Val Asn Asp Gly Gly Lys Phe Gln Gly Asn Gln Val Thr Ile
50 55 60
Phe Tyr Glu Thr Gln Leu Gly Leu Tyr Pro Arg Ile Leu Lys Ser Gly
65 70 75 80
Lys Met Glu Asn Gly Gly Ile Pro Gln Arg Gly Asn Phe Glu Lys His
85 90 95
Leu Glu Lys Ala Ser Thr Asp Leu Gln Lys Val Ile Pro Trp Lys Glu
100 105 110
Phe Ser Gly Leu Gly Val Ile Asp Trp Glu Ala Trp Arg Pro Thr Trp
115 120 125
Glu Phe Asn Trp Glu Pro Leu Arg Ile Tyr Gln Thr Glu Ser Ile Lys
130 135 140
Arg Ala Lys Glu Leu His Pro Thr Ala Asn Asp Ser Ala Val Lys Glu
145 150 155 160
Ile Ala Glu Arg Gln Trp Glu Asp Ser Ala Lys Leu Tyr Met Leu Glu
165 170 175
Thr Leu Arg Leu Ala Lys Lys Leu Arg Pro Gln Ala Pro Trp Cys Tyr
180 185 190
Tyr Leu Phe Pro Asp Cys Tyr Asn Tyr Val Gly Lys Lys Pro Lys Asp
195 200 205
Phe Gln Cys Ser Ala Ser Ile Arg Lys Gly Asn Asp Lys Leu Ser Trp
210 215 220
Leu Trp Lys Asp Ser Thr Ala Leu Cys Pro Ser Ile Tyr Val Tyr Glu
225 230 235 240
Ser Gln Leu Asp Arg Tyr Ser Phe Glu Gln Arg Thr Trp Arg Asp Asn
245 250 255
Glu Lys Leu Arg Glu Ala Leu Arg Val Ala Thr Arg Thr Ser Lys Ile
260 265 270
Tyr Pro Tyr Val Asn Tyr Phe Asp Lys Glu Leu Ile Pro Glu Gln Glu
275 280 285
Val Trp Arg Met Leu Ala Gln Ala Ala Ala Val Gly Gly Ser Gly Ala
290 295 300
Val Ile Trp Gly Ser Ser Ala Ala Val Ala Ser Glu Glu Leu Cys Lys
305 310 315 320
Ser Leu Lys Gln Tyr Ile Ile Glu Thr Leu Gly Pro Ala Ala Glu Lys
325 330 335
Val Ala Trp Arg Ser Asp Leu Cys Ser Lys Glu Ile Cys Asn Asn Gln
340 345 350
Gly Arg Cys Thr Phe Pro Asp Asp Asp Tyr Ala Asn Ala Trp Lys Leu
355 360 365
Phe Thr Asp Asp Thr Val Lys Phe Tyr Ala Gly Asn Ile Thr Cys Arg
370 375 380
Cys Ser Glu Asn Tyr Ser Gly Arg Phe Cys Glu Lys Lys Asn
385 390 395
<210> 61
<211> 405
<212> PRT
<213> 巴西钳蝎
<220>
<223> 具有N-末端分泌信号的源自巴西钳蝎的透明质酸酶(HYAL)的氨基酸序列
<400> 61
Met Gln Phe Ser Thr Val Ala Ser Val Ala Phe Val Ala Leu Ala Asn
1 5 10 15
Phe Val Ala Ala Ala Asp Phe Lys Val Tyr Trp Glu Val Pro Ser Phe
20 25 30
Leu Cys Ser Lys Arg Phe Lys Ile Asn Val Thr Glu Val Leu Thr Ser
35 40 45
His Glu Ile Leu Val Asn Gln Gly Glu Ser Phe Asn Gly Asp Lys Ile
50 55 60
Val Ile Phe Tyr Glu Asn Gln Leu Gly Lys Tyr Pro His Ile Asp Ser
65 70 75 80
Asn Asn Val Glu Ile Asn Gly Gly Ile Leu Gln Val Ala Asp Leu Ala
85 90 95
Lys His Leu Lys Val Ala Lys Asp Asn Ile Thr Lys Phe Val Pro Asn
100 105 110
Pro Asn Phe Asn Gly Val Gly Val Ile Asp Trp Glu Ala Trp Arg Pro
115 120 125
Ser Trp Glu Phe Asn Trp Gly Lys Leu Lys Val Tyr Lys Glu Lys Ser
130 135 140
Ile Asp Leu Val Lys Ser Lys His Pro Glu Trp Pro Ser Asp Arg Val
145 150 155 160
Glu Lys Val Ala Lys Glu Glu Trp Glu Glu Ser Ala Lys Glu Trp Met
165 170 175
Val Lys Thr Leu Lys Leu Ala Gln Glu Met Arg Pro Asn Ala Val Trp
180 185 190
Cys Tyr Tyr Leu Phe Pro Asp Cys Tyr Asn Tyr Phe Gly Lys Asp Gln
195 200 205
Pro Ser Gln Phe Ser Cys Ser Ser Arg Ile Gln Lys Glu Asn Ser Arg
210 215 220
Leu Ser Trp Leu Trp Asn Gln Ser Thr Ala Ile Cys Leu Ser Ile Tyr
225 230 235 240
Ile Gln Glu Ser His Val Thr Lys Tyr Asn Met Ser Gln Arg Thr Trp
245 250 255
Trp Ile Asp Ala Arg Leu Arg Glu Ala Ile Arg Val Ser Glu His Arg
260 265 270
Pro Asn Ile Pro Ile Tyr Pro Tyr Ile Asn Tyr Ile Leu Pro Gly Thr
275 280 285
Asn Gln Thr Val Pro Ala Met Asp Phe Lys Arg Thr Leu Gly Gln Ile
290 295 300
Ala Ser Leu Gly Leu Asp Gly Ala Leu Leu Trp Gly Ser Ser Tyr His
305 310 315 320
Val Leu Thr Glu Ser Gln Cys Lys Ile Thr Ser Asp Tyr Val Lys Ser
325 330 335
Val Ile Ala Pro Thr Val Ala Thr Val Val Leu Asn Thr Asn Arg Cys
340 345 350
Ser Gln Ile Ile Cys Lys Gly Arg Gly Asn Cys Val Trp Pro Glu Glu
355 360 365
Pro Phe Ser Ser Trp Lys Tyr Leu Val Asp Pro Lys Met Pro Val Phe
370 375 380
Lys Pro Thr Asn Ile His Cys Lys Cys Lys Gly Tyr Leu Gly Arg Tyr
385 390 395 400
Cys Glu Ile Pro Lys
405
<210> 62
<211> 435
<212> PRT
<213> 家牛
<220>
<223> 具有N-末端分泌信号的源自家牛的透明质酸酶(HYAL)的氨基酸序列
<400> 62
Met Gln Phe Ser Thr Val Ala Ser Val Ala Phe Val Ala Leu Ala Asn
1 5 10 15
Phe Val Ala Ala Gly Ser Arg Asp Pro Val Val Pro Asn Gln Pro Phe
20 25 30
Thr Thr Ile Trp Asn Ala Asn Thr Glu Trp Cys Met Lys Lys His Gly
35 40 45
Val Asp Val Asp Ile Ser Ile Phe Asp Val Val Thr Asn Pro Gly Gln
50 55 60
Thr Phe Arg Gly Pro Asn Met Thr Ile Phe Tyr Ser Ser Gln Leu Gly
65 70 75 80
Thr Tyr Pro Tyr Tyr Thr Ser Ala Gly Glu Pro Val Phe Gly Gly Leu
85 90 95
Pro Gln Asn Ala Ser Leu Asn Ala His Leu Ala Arg Thr Phe Gln Asp
100 105 110
Ile Leu Ala Ala Met Pro Glu Pro Arg Phe Ser Gly Leu Ala Val Ile
115 120 125
Asp Trp Glu Ala Trp Arg Pro Arg Trp Ala Phe Asn Trp Asp Thr Lys
130 135 140
Asp Ile Tyr Arg Gln Arg Ser Arg Ala Leu Val Gln Lys Gln His Pro
145 150 155 160
Asp Trp Leu Ala Pro Arg Val Glu Ala Ala Ala Gln Asp Gln Phe Glu
165 170 175
Gly Ala Ala Glu Glu Trp Met Ala Gly Thr Leu Lys Leu Gly Gln Ala
180 185 190
Leu Arg Pro Gln Gly Leu Trp Gly Phe Tyr Asn Phe Pro Glu Cys Tyr
195 200 205
Asn Tyr Asp Phe Lys Ser Pro Asn Tyr Thr Gly Arg Cys Pro Leu Asn
210 215 220
Ile Cys Ala Gln Asn Asp Gln Leu Gly Trp Leu Trp Gly Gln Ser Arg
225 230 235 240
Ala Leu Tyr Pro Ser Ile Tyr Leu Pro Ala Ala Leu Glu Gly Thr Lys
245 250 255
Lys Thr Gln Met Phe Val Gln His Arg Val Ala Glu Ala Phe Arg Val
260 265 270
Ala Ala Gly Ala Gly Asp Pro Lys Leu Pro Val Leu Pro Tyr Met Gln
275 280 285
Leu Phe Tyr Asp Met Thr Asn His Phe Leu Pro Ala Glu Glu Leu Glu
290 295 300
His Ser Leu Gly Glu Ser Ala Ala Gln Gly Ala Ala Gly Val Val Leu
305 310 315 320
Trp Val Ser Trp Leu Ser Thr Ser Thr Lys Glu Ser Cys Gln Ala Ile
325 330 335
Lys Glu Tyr Val Asp Thr Thr Leu Gly Pro Ser Ile Leu Asn Val Thr
340 345 350
Ser Gly Ala Arg Leu Cys Ser Gln Val Leu Cys Ser Gly His Gly Arg
355 360 365
Cys Ala Arg Arg Pro Ser Tyr Pro Lys Ala Arg Leu Ile Leu Asn Ser
370 375 380
Thr Ser Phe Ser Ile Lys Pro Thr Pro Gly Gly Gly Pro Leu Thr Leu
385 390 395 400
Gln Gly Ala Leu Ser Leu Glu Asp Arg Leu Arg Met Ala Val Glu Phe
405 410 415
Glu Cys Arg Cys Tyr Arg Gly Trp Arg Gly Thr Arg Cys Glu Gln Trp
420 425 430
Gly Met Trp
435
<210> 63
<211> 378
<212> PRT
<213> 西方蜜蜂
<220>
<223> 具有N-末端分泌信号的源自西方蜜蜂的透明质酸酶(HYAL)的氨基酸序列
<400> 63
Met Gln Phe Ser Thr Val Ala Ser Val Ala Phe Val Ala Leu Ala Asn
1 5 10 15
Phe Val Ala Ala Leu Leu Leu Gly Phe Val Gln Ser Thr Pro Asp Asn
20 25 30
Asn Lys Thr Val Arg Glu Phe Asn Val Tyr Trp Asn Val Pro Thr Phe
35 40 45
Met Cys His Lys Tyr Gly Leu Arg Phe Glu Glu Val Ser Glu Lys Tyr
50 55 60
Gly Ile Leu Gln Asn Trp Met Asp Lys Phe Arg Gly Glu Glu Ile Ala
65 70 75 80
Ile Leu Tyr Asp Pro Gly Met Phe Pro Ala Leu Leu Lys Asp Pro Asn
85 90 95
Gly Asn Val Val Ala Arg Asn Gly Gly Val Pro Gln Leu Gly Asn Leu
100 105 110
Thr Lys His Leu Gln Val Phe Arg Asp His Leu Ile Asn Gln Ile Pro
115 120 125
Asp Lys Ser Phe Pro Gly Val Gly Val Ile Asp Phe Glu Ser Trp Arg
130 135 140
Pro Ile Phe Arg Gln Asn Trp Ala Ser Leu Gln Pro Tyr Lys Lys Leu
145 150 155 160
Ser Val Glu Val Val Arg Arg Glu His Pro Phe Trp Asp Asp Gln Arg
165 170 175
Val Glu Gln Glu Ala Lys Arg Arg Phe Glu Lys Tyr Gly Gln Leu Phe
180 185 190
Met Glu Glu Thr Leu Lys Ala Ala Lys Arg Met Arg Pro Ala Ala Asn
195 200 205
Trp Gly Tyr Tyr Ala Tyr Pro Tyr Cys Tyr Asn Leu Thr Pro Asn Gln
210 215 220
Pro Ser Ala Gln Cys Glu Ala Thr Thr Met Gln Glu Asn Asp Lys Met
225 230 235 240
Ser Trp Leu Phe Glu Ser Glu Asp Val Leu Leu Pro Ser Val Tyr Leu
245 250 255
Arg Trp Asn Leu Thr Ser Gly Glu Arg Val Gly Leu Val Gly Gly Arg
260 265 270
Val Lys Glu Ala Leu Arg Ile Ala Arg Gln Met Thr Thr Ser Arg Lys
275 280 285
Lys Val Leu Pro Tyr Tyr Trp Tyr Lys Tyr Gln Asp Arg Arg Asp Thr
290 295 300
Asp Leu Ser Arg Ala Asp Leu Glu Ala Thr Leu Arg Lys Ile Thr Asp
305 310 315 320
Leu Gly Ala Asp Gly Phe Ile Ile Trp Gly Ser Ser Asp Asp Ile Asn
325 330 335
Thr Lys Ala Lys Cys Leu Gln Phe Arg Glu Tyr Leu Asn Asn Glu Leu
340 345 350
Gly Pro Ala Val Lys Arg Ile Ala Leu Asn Asn Asn Ala Asn Asp Arg
355 360 365
Leu Thr Val Asp Val Ser Val Asp Gln Val
370 375
<210> 64
<211> 434
<212> PRT
<213> 野捕恒河猴
<220>
<223> 具有N-末端分泌信号的源自野捕恒河猴的透明质酸酶(HYAL)的氨基酸序列
<400> 64
Met Gln Phe Ser Thr Val Ala Ser Val Ala Phe Val Ala Leu Ala Asn
1 5 10 15
Phe Val Ala Ala Ser Arg Gly Pro Leu Leu Pro Asn Arg Pro Phe Ala
20 25 30
Thr Val Trp Asn Ala Asn Thr Gln Trp Cys Leu Glu Arg His Ser Val
35 40 45
Asp Val Asp Val Ser Ile Phe Asp Val Val Ala Asn Pro Gly Gln Thr
50 55 60
Phe Arg Gly Pro Asp Met Thr Ile Phe Tyr Ser Ser Gln Leu Gly Thr
65 70 75 80
Tyr Pro Tyr Tyr Thr Pro Thr Gly Glu Pro Val Phe Gly Gly Leu Pro
85 90 95
Gln Asn Ala Ser Leu Ile Ala His Leu Ala Arg Thr Phe Gln Asp Ile
100 105 110
Leu Ala Ala Ile Pro Ala Pro Asp Phe Ser Gly Leu Ala Val Ile Asp
115 120 125
Trp Glu Ala Trp Arg Pro Arg Trp Ala Phe Asn Trp Asp Thr Lys Asp
130 135 140
Ile Tyr Arg Gln Arg Ser Arg Ala Leu Val Gln Ala Gln His Pro Asp
145 150 155 160
Trp Pro Val Thr Gln Val Glu Ala Val Ala Gln Asp Gln Phe Gln Gly
165 170 175
Ala Ala Arg Ala Trp Met Ala Gly Thr Leu Gln Leu Gly Arg Ala Leu
180 185 190
Arg Pro Arg Gly Leu Trp Gly Phe Tyr Gly Phe Pro Asp Cys Tyr Asn
195 200 205
Tyr Asp Phe Leu Ser Pro Asn Tyr Thr Gly Gln Cys Pro Ser Gly Ile
210 215 220
Arg Ala Gln Asn Asp Gln Leu Gly Trp Leu Trp Gly Gln Ser Arg Ala
225 230 235 240
Leu Tyr Pro Ser Ile Tyr Met Pro Ala Val Leu Glu Gly Thr Gly Lys
245 250 255
Ser Gln Met Tyr Val Gln His Arg Val Ala Glu Ala Phe Arg Val Ala
260 265 270
Val Ala Ala Gly Asp Pro Asn Leu Pro Val Leu Pro Tyr Val Gln Ile
275 280 285
Phe Tyr Asp Met Thr Asn His Phe Leu Pro Leu Asp Glu Leu Glu His
290 295 300
Ser Leu Gly Glu Ser Ala Ala Gln Gly Ala Ala Gly Val Val Leu Trp
305 310 315 320
Val Ser Trp Glu Asn Thr Arg Thr Lys Glu Ser Cys Gln Ala Ile Lys
325 330 335
Glu Tyr Met Asp Thr Thr Leu Gly Pro Phe Ile Leu Asn Val Thr Ser
340 345 350
Gly Ala Leu Leu Cys Ser Gln Ala Leu Cys Ser Ser His Gly Arg Cys
355 360 365
Val Arg Arg Pro Ser His Pro Lys Ala Leu Leu Ile Leu Asn Pro Ala
370 375 380
Ser Phe Ser Ile Gln Leu Thr Pro Asp Gly Gly Pro Leu Ser Leu Arg
385 390 395 400
Gly Ala Leu Ser Leu Glu Asp Gln Ala Gln Met Ala Val Glu Phe Lys
405 410 415
Cys Arg Cys Tyr Pro Gly Trp Gln Gly Pro Trp Cys Glu Gln Lys Ser
420 425 430
Met Trp
<210> 65
<211> 360
<212> PRT
<213> 大胡蜂
<220>
<223> 具有N-末端分泌信号的源自大胡蜂的透明质酸酶(HYAL)的氨基酸序列
<400> 65
Met Gln Phe Ser Thr Val Ala Ser Val Ala Phe Val Ala Leu Ala Asn
1 5 10 15
Phe Val Ala Ala Asp Ser Cys Gly Ser Asn Cys Glu Lys Ser Glu Arg
20 25 30
Pro Lys Arg Val Phe Asn Ile Tyr Trp Asn Val Pro Thr Phe Met Cys
35 40 45
His Gln Tyr Gly Leu Tyr Phe Asp Glu Val Thr Asn Phe Asn Ile Lys
50 55 60
His Asn Ser Lys Asp Asn Phe Gln Gly Asp Lys Ile Ala Ile Phe Tyr
65 70 75 80
Asp Pro Gly Glu Phe Pro Ala Leu Leu Pro Leu Asn Tyr Gly Lys Tyr
85 90 95
Lys Ile Arg Asn Gly Gly Val Pro Gln Glu Gly Asn Ile Thr Ile His
100 105 110
Leu Gln Arg Phe Ile Glu Tyr Leu Asp Lys Thr Tyr Pro Asn Arg Asn
115 120 125
Phe Ser Gly Ile Gly Val Ile Asp Phe Glu Arg Trp Arg Pro Ile Phe
130 135 140
Arg Gln Asn Trp Gly Asn Met Lys Ile Tyr Lys Asn Phe Ser Ile Asp
145 150 155 160
Leu Val Arg Lys Glu His Pro Phe Trp Asn Lys Lys Met Ile Glu Leu
165 170 175
Glu Ala Ser Lys Arg Phe Glu Lys Tyr Ala Arg Leu Phe Met Glu Glu
180 185 190
Thr Leu Lys Leu Ala Lys Lys Thr Arg Lys Gln Ala Asp Trp Gly Tyr
195 200 205
Tyr Gly Tyr Pro Tyr Cys Phe Asn Met Ser Pro Thr Asn Phe Val Pro
210 215 220
Asp Cys Asp Val Thr Ala Arg Asp Glu Asn Asn Glu Met Ser Trp Leu
225 230 235 240
Phe Asn Asn Gln Asn Val Leu Leu Pro Ser Val Tyr Ile Arg Arg Glu
245 250 255
Leu Thr Pro Asp Gln Arg Ile Gly Leu Val Gln Gly Arg Val Lys Glu
260 265 270
Ala Val Arg Ile Ser Asn Lys Leu Lys His Ser Pro Lys Val Phe Ser
275 280 285
Tyr Trp Trp Tyr Val Tyr Gln Asp Glu Thr Asn Thr Phe Leu Thr Glu
290 295 300
Thr Asp Val Lys Lys Thr Phe Gln Glu Ile Val Ile Asn Gly Gly Asp
305 310 315 320
Gly Ile Ile Ile Trp Gly Ser Ser Ser Asp Val Asn Ser Leu Ser Lys
325 330 335
Cys Thr Arg Leu Arg Glu Tyr Leu Leu Thr Val Leu Gly Pro Ile Ala
340 345 350
Val Asn Val Thr Glu Ala Val Asn
355 360
<210> 66
<211> 468
<212> PRT
<213> 萨氏九杯蛛
<220>
<223> 具有N-末端分泌信号和C-末端锚定信号的源自萨氏九杯蛛的透明质酸酶(HYAL)的氨基酸序列
<400> 66
Met Gln Phe Ser Thr Val Ala Ser Val Ala Phe Val Ala Leu Ala Asn
1 5 10 15
Phe Val Ala Ala Phe Lys Ile Tyr Trp Asn Val Pro Thr Phe Gln Cys
20 25 30
Thr His Asn Tyr Lys Ile Asp Tyr Val Lys Leu Leu Ser Thr Tyr Gly
35 40 45
Ile Gln Val Asn Asp Gly Gly Lys Phe Gln Gly Asn Gln Val Thr Ile
50 55 60
Phe Tyr Glu Thr Gln Leu Gly Leu Tyr Pro Arg Ile Leu Lys Ser Gly
65 70 75 80
Lys Met Glu Asn Gly Gly Ile Pro Gln Arg Gly Asn Phe Glu Lys His
85 90 95
Leu Glu Lys Ala Ser Thr Asp Leu Gln Lys Val Ile Pro Trp Lys Glu
100 105 110
Phe Ser Gly Leu Gly Val Ile Asp Trp Glu Ala Trp Arg Pro Thr Trp
115 120 125
Glu Phe Asn Trp Glu Pro Leu Arg Ile Tyr Gln Thr Glu Ser Ile Lys
130 135 140
Arg Ala Lys Glu Leu His Pro Thr Ala Asn Asp Ser Ala Val Lys Glu
145 150 155 160
Ile Ala Glu Arg Gln Trp Glu Asp Ser Ala Lys Leu Tyr Met Leu Glu
165 170 175
Thr Leu Arg Leu Ala Lys Lys Leu Arg Pro Gln Ala Pro Trp Cys Tyr
180 185 190
Tyr Leu Phe Pro Asp Cys Tyr Asn Tyr Val Gly Lys Lys Pro Lys Asp
195 200 205
Phe Gln Cys Ser Ala Ser Ile Arg Lys Gly Asn Asp Lys Leu Ser Trp
210 215 220
Leu Trp Lys Asp Ser Thr Ala Leu Cys Pro Ser Ile Tyr Val Tyr Glu
225 230 235 240
Ser Gln Leu Asp Arg Tyr Ser Phe Glu Gln Arg Thr Trp Arg Asp Asn
245 250 255
Glu Lys Leu Arg Glu Ala Leu Arg Val Ala Thr Arg Thr Ser Lys Ile
260 265 270
Tyr Pro Tyr Val Asn Tyr Phe Asp Lys Glu Leu Ile Pro Glu Gln Glu
275 280 285
Val Trp Arg Met Leu Ala Gln Ala Ala Ala Val Gly Gly Ser Gly Ala
290 295 300
Val Ile Trp Gly Ser Ser Ala Ala Val Ala Ser Glu Glu Leu Cys Lys
305 310 315 320
Ser Leu Lys Gln Tyr Ile Ile Glu Thr Leu Gly Pro Ala Ala Glu Lys
325 330 335
Val Ala Trp Arg Ser Asp Leu Cys Ser Lys Glu Ile Cys Asn Asn Gln
340 345 350
Gly Arg Cys Thr Phe Pro Asp Asp Asp Tyr Ala Asn Ala Trp Lys Leu
355 360 365
Phe Thr Asp Asp Thr Val Lys Phe Tyr Ala Gly Asn Ile Thr Cys Arg
370 375 380
Cys Ser Glu Asn Tyr Ser Gly Arg Phe Cys Glu Lys Lys Asn Gly Ser
385 390 395 400
Ala Ile Ser Gln Ile Thr Asp Gly Gln Ile Gln Ala Thr Thr Thr Ala
405 410 415
Thr Thr Glu Ala Thr Thr Thr Ala Ala Pro Ser Ser Thr Val Glu Thr
420 425 430
Val Ser Pro Ser Ser Thr Glu Thr Ile Ser Gln Gln Thr Glu Asn Gly
435 440 445
Ala Ala Lys Ala Ala Val Gly Met Gly Ala Gly Ala Leu Ala Ala Ala
450 455 460
Ala Met Leu Leu
465
<210> 67
<211> 475
<212> PRT
<213> 巴西钳蝎
<220>
<223> 具有N-末端分泌信号和C-末端锚定信号的源自巴西钳蝎的透明质酸酶(HYAL)的氨基酸序列
<400> 67
Met Gln Phe Ser Thr Val Ala Ser Val Ala Phe Val Ala Leu Ala Asn
1 5 10 15
Phe Val Ala Ala Ala Asp Phe Lys Val Tyr Trp Glu Val Pro Ser Phe
20 25 30
Leu Cys Ser Lys Arg Phe Lys Ile Asn Val Thr Glu Val Leu Thr Ser
35 40 45
His Glu Ile Leu Val Asn Gln Gly Glu Ser Phe Asn Gly Asp Lys Ile
50 55 60
Val Ile Phe Tyr Glu Asn Gln Leu Gly Lys Tyr Pro His Ile Asp Ser
65 70 75 80
Asn Asn Val Glu Ile Asn Gly Gly Ile Leu Gln Val Ala Asp Leu Ala
85 90 95
Lys His Leu Lys Val Ala Lys Asp Asn Ile Thr Lys Phe Val Pro Asn
100 105 110
Pro Asn Phe Asn Gly Val Gly Val Ile Asp Trp Glu Ala Trp Arg Pro
115 120 125
Ser Trp Glu Phe Asn Trp Gly Lys Leu Lys Val Tyr Lys Glu Lys Ser
130 135 140
Ile Asp Leu Val Lys Ser Lys His Pro Glu Trp Pro Ser Asp Arg Val
145 150 155 160
Glu Lys Val Ala Lys Glu Glu Trp Glu Glu Ser Ala Lys Glu Trp Met
165 170 175
Val Lys Thr Leu Lys Leu Ala Gln Glu Met Arg Pro Asn Ala Val Trp
180 185 190
Cys Tyr Tyr Leu Phe Pro Asp Cys Tyr Asn Tyr Phe Gly Lys Asp Gln
195 200 205
Pro Ser Gln Phe Ser Cys Ser Ser Arg Ile Gln Lys Glu Asn Ser Arg
210 215 220
Leu Ser Trp Leu Trp Asn Gln Ser Thr Ala Ile Cys Leu Ser Ile Tyr
225 230 235 240
Ile Gln Glu Ser His Val Thr Lys Tyr Asn Met Ser Gln Arg Thr Trp
245 250 255
Trp Ile Asp Ala Arg Leu Arg Glu Ala Ile Arg Val Ser Glu His Arg
260 265 270
Pro Asn Ile Pro Ile Tyr Pro Tyr Ile Asn Tyr Ile Leu Pro Gly Thr
275 280 285
Asn Gln Thr Val Pro Ala Met Asp Phe Lys Arg Thr Leu Gly Gln Ile
290 295 300
Ala Ser Leu Gly Leu Asp Gly Ala Leu Leu Trp Gly Ser Ser Tyr His
305 310 315 320
Val Leu Thr Glu Ser Gln Cys Lys Ile Thr Ser Asp Tyr Val Lys Ser
325 330 335
Val Ile Ala Pro Thr Val Ala Thr Val Val Leu Asn Thr Asn Arg Cys
340 345 350
Ser Gln Ile Ile Cys Lys Gly Arg Gly Asn Cys Val Trp Pro Glu Glu
355 360 365
Pro Phe Ser Ser Trp Lys Tyr Leu Val Asp Pro Lys Met Pro Val Phe
370 375 380
Lys Pro Thr Asn Ile His Cys Lys Cys Lys Gly Tyr Leu Gly Arg Tyr
385 390 395 400
Cys Glu Ile Pro Lys Gly Ser Ala Ile Ser Gln Ile Thr Asp Gly Gln
405 410 415
Ile Gln Ala Thr Thr Thr Ala Thr Thr Glu Ala Thr Thr Thr Ala Ala
420 425 430
Pro Ser Ser Thr Val Glu Thr Val Ser Pro Ser Ser Thr Glu Thr Ile
435 440 445
Ser Gln Gln Thr Glu Asn Gly Ala Ala Lys Ala Ala Val Gly Met Gly
450 455 460
Ala Gly Ala Leu Ala Ala Ala Ala Met Leu Leu
465 470 475
<210> 68
<211> 448
<212> PRT
<213> 家牛
<220>
<223> 具有N-末端分泌信号和C-末端锚定信号的源自家牛的透明质酸酶(HYAL)的氨基酸序列
<400> 68
Met Gln Phe Ser Thr Val Ala Ser Val Ala Phe Val Ala Leu Ala Asn
1 5 10 15
Phe Val Ala Ala Leu Leu Leu Gly Phe Val Gln Ser Thr Pro Asp Asn
20 25 30
Asn Lys Thr Val Arg Glu Phe Asn Val Tyr Trp Asn Val Pro Thr Phe
35 40 45
Met Cys His Lys Tyr Gly Leu Arg Phe Glu Glu Val Ser Glu Lys Tyr
50 55 60
Gly Ile Leu Gln Asn Trp Met Asp Lys Phe Arg Gly Glu Glu Ile Ala
65 70 75 80
Ile Leu Tyr Asp Pro Gly Met Phe Pro Ala Leu Leu Lys Asp Pro Asn
85 90 95
Gly Asn Val Val Ala Arg Asn Gly Gly Val Pro Gln Leu Gly Asn Leu
100 105 110
Thr Lys His Leu Gln Val Phe Arg Asp His Leu Ile Asn Gln Ile Pro
115 120 125
Asp Lys Ser Phe Pro Gly Val Gly Val Ile Asp Phe Glu Ser Trp Arg
130 135 140
Pro Ile Phe Arg Gln Asn Trp Ala Ser Leu Gln Pro Tyr Lys Lys Leu
145 150 155 160
Ser Val Glu Val Val Arg Arg Glu His Pro Phe Trp Asp Asp Gln Arg
165 170 175
Val Glu Gln Glu Ala Lys Arg Arg Phe Glu Lys Tyr Gly Gln Leu Phe
180 185 190
Met Glu Glu Thr Leu Lys Ala Ala Lys Arg Met Arg Pro Ala Ala Asn
195 200 205
Trp Gly Tyr Tyr Ala Tyr Pro Tyr Cys Tyr Asn Leu Thr Pro Asn Gln
210 215 220
Pro Ser Ala Gln Cys Glu Ala Thr Thr Met Gln Glu Asn Asp Lys Met
225 230 235 240
Ser Trp Leu Phe Glu Ser Glu Asp Val Leu Leu Pro Ser Val Tyr Leu
245 250 255
Arg Trp Asn Leu Thr Ser Gly Glu Arg Val Gly Leu Val Gly Gly Arg
260 265 270
Val Lys Glu Ala Leu Arg Ile Ala Arg Gln Met Thr Thr Ser Arg Lys
275 280 285
Lys Val Leu Pro Tyr Tyr Trp Tyr Lys Tyr Gln Asp Arg Arg Asp Thr
290 295 300
Asp Leu Ser Arg Ala Asp Leu Glu Ala Thr Leu Arg Lys Ile Thr Asp
305 310 315 320
Leu Gly Ala Asp Gly Phe Ile Ile Trp Gly Ser Ser Asp Asp Ile Asn
325 330 335
Thr Lys Ala Lys Cys Leu Gln Phe Arg Glu Tyr Leu Asn Asn Glu Leu
340 345 350
Gly Pro Ala Val Lys Arg Ile Ala Leu Asn Asn Asn Ala Asn Asp Arg
355 360 365
Leu Thr Val Asp Val Ser Val Asp Gln Val Gly Ser Ala Ile Ser Gln
370 375 380
Ile Thr Asp Gly Gln Ile Gln Ala Thr Thr Thr Ala Thr Thr Glu Ala
385 390 395 400
Thr Thr Thr Ala Ala Pro Ser Ser Thr Val Glu Thr Val Ser Pro Ser
405 410 415
Ser Thr Glu Thr Ile Ser Gln Gln Thr Glu Asn Gly Ala Ala Lys Ala
420 425 430
Ala Val Gly Met Gly Ala Gly Ala Leu Ala Ala Ala Ala Met Leu Leu
435 440 445
<210> 69
<211> 448
<212> PRT
<213> 西方蜜蜂
<220>
<223> 具有N-末端分泌信号和C-末端锚定信号的源自西方蜜蜂的透明质酸酶(HYAL)的氨基酸序列
<400> 69
Met Gln Phe Ser Thr Val Ala Ser Val Ala Phe Val Ala Leu Ala Asn
1 5 10 15
Phe Val Ala Ala Leu Leu Leu Gly Phe Val Gln Ser Thr Pro Asp Asn
20 25 30
Asn Lys Thr Val Arg Glu Phe Asn Val Tyr Trp Asn Val Pro Thr Phe
35 40 45
Met Cys His Lys Tyr Gly Leu Arg Phe Glu Glu Val Ser Glu Lys Tyr
50 55 60
Gly Ile Leu Gln Asn Trp Met Asp Lys Phe Arg Gly Glu Glu Ile Ala
65 70 75 80
Ile Leu Tyr Asp Pro Gly Met Phe Pro Ala Leu Leu Lys Asp Pro Asn
85 90 95
Gly Asn Val Val Ala Arg Asn Gly Gly Val Pro Gln Leu Gly Asn Leu
100 105 110
Thr Lys His Leu Gln Val Phe Arg Asp His Leu Ile Asn Gln Ile Pro
115 120 125
Asp Lys Ser Phe Pro Gly Val Gly Val Ile Asp Phe Glu Ser Trp Arg
130 135 140
Pro Ile Phe Arg Gln Asn Trp Ala Ser Leu Gln Pro Tyr Lys Lys Leu
145 150 155 160
Ser Val Glu Val Val Arg Arg Glu His Pro Phe Trp Asp Asp Gln Arg
165 170 175
Val Glu Gln Glu Ala Lys Arg Arg Phe Glu Lys Tyr Gly Gln Leu Phe
180 185 190
Met Glu Glu Thr Leu Lys Ala Ala Lys Arg Met Arg Pro Ala Ala Asn
195 200 205
Trp Gly Tyr Tyr Ala Tyr Pro Tyr Cys Tyr Asn Leu Thr Pro Asn Gln
210 215 220
Pro Ser Ala Gln Cys Glu Ala Thr Thr Met Gln Glu Asn Asp Lys Met
225 230 235 240
Ser Trp Leu Phe Glu Ser Glu Asp Val Leu Leu Pro Ser Val Tyr Leu
245 250 255
Arg Trp Asn Leu Thr Ser Gly Glu Arg Val Gly Leu Val Gly Gly Arg
260 265 270
Val Lys Glu Ala Leu Arg Ile Ala Arg Gln Met Thr Thr Ser Arg Lys
275 280 285
Lys Val Leu Pro Tyr Tyr Trp Tyr Lys Tyr Gln Asp Arg Arg Asp Thr
290 295 300
Asp Leu Ser Arg Ala Asp Leu Glu Ala Thr Leu Arg Lys Ile Thr Asp
305 310 315 320
Leu Gly Ala Asp Gly Phe Ile Ile Trp Gly Ser Ser Asp Asp Ile Asn
325 330 335
Thr Lys Ala Lys Cys Leu Gln Phe Arg Glu Tyr Leu Asn Asn Glu Leu
340 345 350
Gly Pro Ala Val Lys Arg Ile Ala Leu Asn Asn Asn Ala Asn Asp Arg
355 360 365
Leu Thr Val Asp Val Ser Val Asp Gln Val Gly Ser Ala Ile Ser Gln
370 375 380
Ile Thr Asp Gly Gln Ile Gln Ala Thr Thr Thr Ala Thr Thr Glu Ala
385 390 395 400
Thr Thr Thr Ala Ala Pro Ser Ser Thr Val Glu Thr Val Ser Pro Ser
405 410 415
Ser Thr Glu Thr Ile Ser Gln Gln Thr Glu Asn Gly Ala Ala Lys Ala
420 425 430
Ala Val Gly Met Gly Ala Gly Ala Leu Ala Ala Ala Ala Met Leu Leu
435 440 445
<210> 70
<211> 504
<212> PRT
<213> 野捕恒河猴
<220>
<223> 具有N-末端分泌信号和C-末端锚定信号的源自野捕恒河猴的透明质酸酶(HYAL)的氨基酸序列
<400> 70
Met Gln Phe Ser Thr Val Ala Ser Val Ala Phe Val Ala Leu Ala Asn
1 5 10 15
Phe Val Ala Ala Ser Arg Gly Pro Leu Leu Pro Asn Arg Pro Phe Ala
20 25 30
Thr Val Trp Asn Ala Asn Thr Gln Trp Cys Leu Glu Arg His Ser Val
35 40 45
Asp Val Asp Val Ser Ile Phe Asp Val Val Ala Asn Pro Gly Gln Thr
50 55 60
Phe Arg Gly Pro Asp Met Thr Ile Phe Tyr Ser Ser Gln Leu Gly Thr
65 70 75 80
Tyr Pro Tyr Tyr Thr Pro Thr Gly Glu Pro Val Phe Gly Gly Leu Pro
85 90 95
Gln Asn Ala Ser Leu Ile Ala His Leu Ala Arg Thr Phe Gln Asp Ile
100 105 110
Leu Ala Ala Ile Pro Ala Pro Asp Phe Ser Gly Leu Ala Val Ile Asp
115 120 125
Trp Glu Ala Trp Arg Pro Arg Trp Ala Phe Asn Trp Asp Thr Lys Asp
130 135 140
Ile Tyr Arg Gln Arg Ser Arg Ala Leu Val Gln Ala Gln His Pro Asp
145 150 155 160
Trp Pro Val Thr Gln Val Glu Ala Val Ala Gln Asp Gln Phe Gln Gly
165 170 175
Ala Ala Arg Ala Trp Met Ala Gly Thr Leu Gln Leu Gly Arg Ala Leu
180 185 190
Arg Pro Arg Gly Leu Trp Gly Phe Tyr Gly Phe Pro Asp Cys Tyr Asn
195 200 205
Tyr Asp Phe Leu Ser Pro Asn Tyr Thr Gly Gln Cys Pro Ser Gly Ile
210 215 220
Arg Ala Gln Asn Asp Gln Leu Gly Trp Leu Trp Gly Gln Ser Arg Ala
225 230 235 240
Leu Tyr Pro Ser Ile Tyr Met Pro Ala Val Leu Glu Gly Thr Gly Lys
245 250 255
Ser Gln Met Tyr Val Gln His Arg Val Ala Glu Ala Phe Arg Val Ala
260 265 270
Val Ala Ala Gly Asp Pro Asn Leu Pro Val Leu Pro Tyr Val Gln Ile
275 280 285
Phe Tyr Asp Met Thr Asn His Phe Leu Pro Leu Asp Glu Leu Glu His
290 295 300
Ser Leu Gly Glu Ser Ala Ala Gln Gly Ala Ala Gly Val Val Leu Trp
305 310 315 320
Val Ser Trp Glu Asn Thr Arg Thr Lys Glu Ser Cys Gln Ala Ile Lys
325 330 335
Glu Tyr Met Asp Thr Thr Leu Gly Pro Phe Ile Leu Asn Val Thr Ser
340 345 350
Gly Ala Leu Leu Cys Ser Gln Ala Leu Cys Ser Ser His Gly Arg Cys
355 360 365
Val Arg Arg Pro Ser His Pro Lys Ala Leu Leu Ile Leu Asn Pro Ala
370 375 380
Ser Phe Ser Ile Gln Leu Thr Pro Asp Gly Gly Pro Leu Ser Leu Arg
385 390 395 400
Gly Ala Leu Ser Leu Glu Asp Gln Ala Gln Met Ala Val Glu Phe Lys
405 410 415
Cys Arg Cys Tyr Pro Gly Trp Gln Gly Pro Trp Cys Glu Gln Lys Ser
420 425 430
Met Trp Gly Ser Ala Ile Ser Gln Ile Thr Asp Gly Gln Ile Gln Ala
435 440 445
Thr Thr Thr Ala Thr Thr Glu Ala Thr Thr Thr Ala Ala Pro Ser Ser
450 455 460
Thr Val Glu Thr Val Ser Pro Ser Ser Thr Glu Thr Ile Ser Gln Gln
465 470 475 480
Thr Glu Asn Gly Ala Ala Lys Ala Ala Val Gly Met Gly Ala Gly Ala
485 490 495
Leu Ala Ala Ala Ala Met Leu Leu
500
<210> 71
<211> 360
<212> PRT
<213> 大胡蜂
<220>
<223> 具有N-末端分泌信号和C-末端锚定信号的源自大胡蜂的透明质酸酶(HYAL)的氨基酸序列
<400> 71
Asp Asn Phe Gln Gly Asp Lys Ile Ala Ile Phe Tyr Asp Pro Gly Glu
1 5 10 15
Phe Pro Ala Leu Leu Pro Leu Asn Tyr Gly Lys Tyr Lys Ile Arg Asn
20 25 30
Gly Gly Val Pro Gln Glu Gly Asn Ile Thr Ile His Leu Gln Arg Phe
35 40 45
Ile Glu Tyr Leu Asp Lys Thr Tyr Pro Asn Arg Asn Phe Ser Gly Ile
50 55 60
Gly Val Ile Asp Phe Glu Arg Trp Arg Pro Ile Phe Arg Gln Asn Trp
65 70 75 80
Gly Asn Met Lys Ile Tyr Lys Asn Phe Ser Ile Asp Leu Val Arg Lys
85 90 95
Glu His Pro Phe Trp Asn Lys Lys Met Ile Glu Leu Glu Ala Ser Lys
100 105 110
Arg Phe Glu Lys Tyr Ala Arg Leu Phe Met Glu Glu Thr Leu Lys Leu
115 120 125
Ala Lys Lys Thr Arg Lys Gln Ala Asp Trp Gly Tyr Tyr Gly Tyr Pro
130 135 140
Tyr Cys Phe Asn Met Ser Pro Thr Asn Phe Val Pro Asp Cys Asp Val
145 150 155 160
Thr Ala Arg Asp Glu Asn Asn Glu Met Ser Trp Leu Phe Asn Asn Gln
165 170 175
Asn Val Leu Leu Pro Ser Val Tyr Ile Arg Arg Glu Leu Thr Pro Asp
180 185 190
Gln Arg Ile Gly Leu Val Gln Gly Arg Val Lys Glu Ala Val Arg Ile
195 200 205
Ser Asn Lys Leu Lys His Ser Pro Lys Val Phe Ser Tyr Trp Trp Tyr
210 215 220
Val Tyr Gln Asp Glu Thr Asn Thr Phe Leu Thr Glu Thr Asp Val Lys
225 230 235 240
Lys Thr Phe Gln Glu Ile Val Ile Asn Gly Gly Asp Gly Ile Ile Ile
245 250 255
Trp Gly Ser Ser Ser Asp Val Asn Ser Leu Ser Lys Cys Thr Arg Leu
260 265 270
Arg Glu Tyr Leu Leu Thr Val Leu Gly Pro Ile Ala Val Asn Val Thr
275 280 285
Glu Ala Val Asn Ala Ile Ser Gln Ile Thr Asp Gly Gln Ile Gln Ala
290 295 300
Thr Thr Thr Ala Thr Thr Glu Ala Thr Thr Thr Ala Ala Pro Ser Ser
305 310 315 320
Thr Val Glu Thr Val Ser Pro Ser Ser Thr Glu Thr Ile Ser Gln Gln
325 330 335
Thr Glu Asn Gly Ala Ala Lys Ala Ala Val Gly Met Gly Ala Gly Ala
340 345 350
Leu Ala Ala Ala Ala Met Leu Leu
355 360
<210> 72
<211> 2154
<212> DNA
<213> 酿酒酵母
<220>
<223> 源自酿酒酵母的谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)的核酸序列
<400> 72
atgtgtggta tctttggtta ctgcaattat ctagtggaaa gatccagagg agaaattatc 60
gacaccttag tggatggttt acaaagatta gaatatagag gctatgattc caccggtatt 120
gctatcgatg gtgacgaagc tgattctact ttcatctata agcaaatcgg taaagtgagt 180
gctttgaaag aggagattac taagcaaaat ccgaacagag acgttacttt tgtctctcat 240
tgtggtattg cgcatactag atgggctact cacggtcgac cagaacaagt taactgtcac 300
cctcaaagat ctgacccaga agaccaattt gtggtcgttc ataatggtat catcacaaat 360
tttagagaac tgaagactct tttaattaac aaaggttata aattcgaaag tgataccgat 420
accgagtgta ttgctaaact atatttgcat ttatacaata caaatttaca aaatgggcat 480
gacttagatt tccacgaatt aaccaagcta gttcttttag aactagaagg ttcatacggg 540
ttattatgta aatcttgtca ctatcctaat gaggttatcg ccactagaaa agggtcccct 600
ttactgattg gtgtcaaatc tgaaaaaaaa ctaaaagtcg acttcgtgga tgtggaattt 660
cccgaagaaa acgctggtca accggaaatt ccattgaaat ctaacaacaa atcatttggc 720
ttgggcccaa agaaagctcg tgaatttgaa gctggttccc aaaatgccaa tttactacca 780
attgccgcca atgaatttaa cttgagacat tctcaatcca gggctttcct atcagaagat 840
ggatctccaa caccggtgga attttttgtt tcttcggatg cggcatctgt tgttaaacat 900
accaagaagg tgctattttt agaagatgac gatttggctc atatttacga tggtgagtta 960
catattcata gatctagaag agaagtaggc gcatcaatga caaggtccat tcaaacttta 1020
gagatggagt tagctcagat catgaagggc ccttacgacc attttatgca aaaggaaatc 1080
tatgagcaac cagaatctac tttcaatact atgagaggta gaatcgacta tgaaaataat 1140
aaagtgatat tgggtggttt aaaggcatgg ttaccagttg tcagaagagc acggagactg 1200
atcatgatcg catgcggtac ttcttatcat tcatgtttgg ctactcgtgc tatcttcgaa 1260
gaattatcag atatcccagt tagtgtggaa ttagcgtctg actttctgga cagaaaatgc 1320
cctgtcttca gagacgatgt atgcgtgttt gtttcacaaa gtggtgaaac tgcggatacc 1380
atgctggctc taaattattg tttagaaaga ggagccttaa ctgtcggaat tgttaacagt 1440
gttggttctt ctatctctcg tgtcacccac tgtggtgttc atattaacgc tggtcctgaa 1500
attggtgttg cctctacaaa agcttatact tcccagtata ttgccttagt gatgtttgct 1560
ctatcgctgt cagatgaccg tgtatcgaaa atagacagaa gaattgaaat cattcaaggc 1620
ttgaagttaa tcccgggcca aattaagcag gtattaaagc tggaaccaag aataaaaaag 1680
ctctgtgcga ctgaattaaa ggatcaaaaa tctctattgt tattgggtag aggttaccaa 1740
tttgctgctg ctctggaagg tgctttgaag atcaaagaaa tttcttatat gcattctgaa 1800
ggtgttttgg caggtgagtt gaagcacggt gtcttggcct tggtggacga aaacttgcca 1860
atcattgctt ttggtaccag agactctcta ttccctaaag tagtttcctc tattgagcaa 1920
gttactgtaa gaaagggcca tccaattatt atttgtaacg aaaatgatga agtgtgggcg 1980
caaaaatcta aatcaatcga cctgcaaacc ttagaagttc cacaaactgt tgattgttta 2040
caaggtctaa ttaatattat tccattacaa ctaatgtcat attggttggc tgttaataaa 2100
gggattgatg ttgattttcc aagaaacttg gctaaatctg ttaccgtcga ataa 2154
<210> 73
<211> 1788
<212> DNA
<213> 小球藻属病毒
<220>
<223> 源自小球藻属病毒1(PBCV-1)的谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)的重编码核酸序列
<400> 73
atgtgcggga tcttcggtgc tgtgtcgaac aataatagca tagaagtttc catcaagggt 60
atacagaagc tagagtaccg cgggtacgat tcgtgtggaa tagcctatac agacggaggc 120
gccattgaac ggatcaggtc aatagatggg atcgacgact taaggaagaa aacaataaca 180
gagtcttccc cggtagctat cgctcattca aggtggagta ccactgggat tccaagtgtt 240
gtgaacgccc acccgcacat ctctcggggc acgtctggat gcgagtcgcg cattgcagtc 300
gtacacaatg gcattattga aaattaccag cagatccgca agtacttgat aaatcttggg 360
tatactttcg attcacagac cgacacggaa gtcattgctc atctaataga ctcgcagtat 420
aacgggaaca tcctgcacac cgtccaaatg gcagttaagc acctcaaagg aagctacgcc 480
atagcagtca tgtgccataa ggagtccggg aagatcgtgg tggcaaaaca gaagagtccg 540
ttggtattgg gtataggaag cgacggagct tattatatcg catcggacgt attggctctt 600
cccactaaca aagtggtcta cataagtgac ggattctctg ctgagttaag tcctggatcg 660
atgactatct atgatctgga tggcaataag gtagaatacg aggtggaaga cgttgaaatg 720
gagcagacgt cgatgtcttt agataacttt gatcactaca tgatcaaaga gatcaatgaa 780
cagccgatat caattctcaa tactattaag aacaaaggat tctatgcaga gatatttggt 840
gatctagcac atgaaatatt tcagaagatc gacaatatat tgattctagc ctgcggaact 900
tcgtatcatg caggtctcgt cgggaagcaa tggatagaga ccatctcacg catcccggtg 960
gatgttcata ttgcaagcga gtatgagccg acaattccac gagccaatac acttgtgata 1020
acgattagtc aaagcggcga gactgcggat acaatcgcag cccttcaacg agcgcaaaac 1080
gcaggaatga tatacacttt gtgtatctgc aacagcccca agtcaactct agtgcgcgag 1140
tcgataatga aatacataac caaatgcggt tcagaagttt ctgttgccag tactaaagca 1200
tttacgtcgc aacttgtggt gttgtatatg cttgcgaacg ttcttgcgaa caaaactgat 1260
gatctgctag gggatcttcc tcaagctatc gagagagtaa tctgtcttac taatgacgaa 1320
atgaagcgtt gggcggatga aatttgtact gccaaaagtg ccatcttctt agggagagga 1380
ctgaacgcac ctgtagcatt tgagggcgcg ctaaagttga aggaaatctc atatatccat 1440
gccgagggtt tcctcggtgg agagttgaag catgggccgc tggctttgtt ggacgataag 1500
atccctgtaa tcgtgactgt tgctgaccac gcttatttgg atcacattaa ggctaacatc 1560
gacgaggtat tggcacgaaa cgttaccgta tacgcgatcg tcgatcagta tgttaatatt 1620
gaaccacagg agcgactgca tgtagtaaaa gtgccgtttg tgagtaaaga gttttctccc 1680
atcatccaca caattccgat gcaattgtta tcgtattatg tcgcgatcaa gctgggcaag 1740
aacgttgaca agccacgtaa cctggcgaaa agtgttacaa cattctaa 1788
<210> 74
<211> 1788
<212> DNA
<213> 小球藻属病毒
<220>
<223> 源自小球藻属病毒1(PBCV-1)的谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)的重编码核酸序列
<400> 74
atgtgtggca tctttggagc agtgtcaaac aacaactcta tcgaggtgtc aatcaagggt 60
attcagaagc tagaatatcg tgggtatgat tcgtgcggta ttgcgtatac agatgggggt 120
gcgattgagc gtatacgttc tattgacggc attgacgatc tgcgtaagaa aacaatcaca 180
gaatcatcac cagtggccat tgctcactcg cggtggagca ccactggaat tccatcagtg 240
gtgaacgcac atcctcatat ttctcgcgga accagtgggt gtgagtctcg tatcgcggta 300
gtccacaacg gtatcattga aaactatcag cagatccgaa aatatctcat caatcttggt 360
tatacgtttg atagtcaaac ggacacagag gtcattgcgc atttgattga ttctcagtac 420
aatgggaata tcttgcacac cgtccaaatg gctgtcaagc acctgaaggg ctcttatgcc 480
attgcagtta tgtgtcataa agagtctggt aaaatagtcg tggcgaaaca gaagtcaccc 540
ctcgtacttg gaatcggctc agatggtgct tactacatcg cttcggacgt gctggcgctg 600
ccgacaaata aagttgttta tatttcagac ggtttctccg cagaactatc tccagggagt 660
atgaccattt acgatcttga tggaaataaa gtagaatatg aagtagagga cgttgaaatg 720
gaacaaacta gtatgtctct cgataacttt gatcattaca tgattaagga aattaatgag 780
caaccaatca gtattctaaa cactataaaa aataaagggt tctatgcaga aatattcggt 840
gatttggctc atgaaatctt ccaaaaaata gacaacatcc tgatactggc ttgtggtaca 900
agttatcacg ccggtcttgt aggaaaacag tggatagaga ccatctctag aatccccgtg 960
gatgttcaca tcgcgagtga atacgaacct actattccga gagcgaacac attggtaatc 1020
actatttcac agtcgggtga aactgcggac acgatagcgg ctttgcaacg ggcccaaaac 1080
gccgggatga tttatacatt gtgtatttgc aattcaccaa agagcactct tgttcgtgag 1140
agcattatga agtacatcac gaaatgtggt tctgaggtgt cagtggcatc aacgaaggcg 1200
tttacttctc agctcgtagt actgtacatg ctggcaaacg tattggcaaa taaaaccgat 1260
gatttgctgg gagacctccc acaggcaata gaacgggtaa tttgtttgac aaatgacgaa 1320
atgaaacgat gggccgacga aatttgcact gcgaaatccg cgatcttcct gggaagagga 1380
ctaaacgcac cagttgcctt tgagggagcg ttgaagctca aagaaatctc ttacattcat 1440
gcagagggct tcctgggagg tgagttgaaa cacggccccc tcgcactcct tgatgacaag 1500
attcctgtta tcgtaaccgt agcagatcat gcttatttgg accatatcaa agcaaatatc 1560
gacgaagtgc ttgcgaggaa cgttacggta tacgccatag tagaccagta tgtgaacatc 1620
gagccccagg aacgccttca cgtcgtcaag gttccgtttg tatccaaaga attttctccg 1680
ataattcaca ctatcccgat gcaactgctt tcgtattacg tggcaattaa gcttggaaag 1740
aacgttgaca aaccaaggaa tcttgcaaaa tccgtgacta ccttttaa 1788
<210> 75
<211> 717
<212> PRT
<213> 酿酒酵母
<220>
<223> 源自酿酒酵母的谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)的氨基酸序列
<400> 75
Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg
1 5 10 15
Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp
35 40 45
Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu
50 55 60
Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His
65 70 75 80
Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu Gln
85 90 95
Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val
100 105 110
Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu
115 120 125
Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile
130 135 140
Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Gln Asn Gly His
145 150 155 160
Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu
195 200 205
Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn
210 215 220
Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly
225 230 235 240
Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala
245 250 255
Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln
260 265 270
Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe
275 280 285
Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val
290 295 300
Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu
305 310 315 320
His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser
325 330 335
Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr
340 345 350
Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe
355 360 365
Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu
370 375 380
Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu
385 390 395 400
Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg
405 410 415
Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala
420 425 430
Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys
435 440 445
Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu
450 455 460
Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser
465 470 475 480
Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn
485 490 495
Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln
500 505 510
Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val
515 520 525
Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile
530 535 540
Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys
545 550 555 560
Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly
565 570 575
Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys
580 585 590
Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys
595 600 605
His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe
610 615 620
Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln
625 630 635 640
Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp
645 650 655
Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu
660 665 670
Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro
675 680 685
Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val
690 695 700
Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu
705 710 715
<210> 76
<211> 595
<212> PRT
<213> 小球藻属病毒
<220>
<223> 源自小球藻属病毒1(PBCV-1)的谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)的氨基酸序列
<400> 76
Met Cys Gly Ile Phe Gly Ala Val Ser Asn Asn Asn Ser Ile Glu Val
1 5 10 15
Ser Ile Lys Gly Ile Gln Lys Leu Glu Tyr Arg Gly Tyr Asp Ser Cys
20 25 30
Gly Ile Ala Tyr Thr Asp Gly Gly Ala Ile Glu Arg Ile Arg Ser Ile
35 40 45
Asp Gly Ile Asp Asp Leu Arg Lys Lys Thr Ile Thr Glu Ser Ser Pro
50 55 60
Val Ala Ile Ala His Ser Arg Trp Ser Thr Thr Gly Ile Pro Ser Val
65 70 75 80
Val Asn Ala His Pro His Ile Ser Arg Gly Thr Ser Gly Cys Glu Ser
85 90 95
Arg Ile Ala Val Val His Asn Gly Ile Ile Glu Asn Tyr Gln Gln Ile
100 105 110
Arg Lys Tyr Leu Ile Asn Leu Gly Tyr Thr Phe Asp Ser Gln Thr Asp
115 120 125
Thr Glu Val Ile Ala His Leu Ile Asp Ser Gln Tyr Asn Gly Asn Ile
130 135 140
Leu His Thr Val Gln Met Ala Val Lys His Leu Lys Gly Ser Tyr Ala
145 150 155 160
Ile Ala Val Met Cys His Lys Glu Ser Gly Lys Ile Val Val Ala Lys
165 170 175
Gln Lys Ser Pro Leu Val Leu Gly Ile Gly Ser Asp Gly Ala Tyr Tyr
180 185 190
Ile Ala Ser Asp Val Leu Ala Leu Pro Thr Asn Lys Val Val Tyr Ile
195 200 205
Ser Asp Gly Phe Ser Ala Glu Leu Ser Pro Gly Ser Met Thr Ile Tyr
210 215 220
Asp Leu Asp Gly Asn Lys Val Glu Tyr Glu Val Glu Asp Val Glu Met
225 230 235 240
Glu Gln Thr Ser Met Ser Leu Asp Asn Phe Asp His Tyr Met Ile Lys
245 250 255
Glu Ile Asn Glu Gln Pro Ile Ser Ile Leu Asn Thr Ile Lys Asn Lys
260 265 270
Gly Phe Tyr Ala Glu Ile Phe Gly Asp Leu Ala His Glu Ile Phe Gln
275 280 285
Lys Ile Asp Asn Ile Leu Ile Leu Ala Cys Gly Thr Ser Tyr His Ala
290 295 300
Gly Leu Val Gly Lys Gln Trp Ile Glu Thr Ile Ser Arg Ile Pro Val
305 310 315 320
Asp Val His Ile Ala Ser Glu Tyr Glu Pro Thr Ile Pro Arg Ala Asn
325 330 335
Thr Leu Val Ile Thr Ile Ser Gln Ser Gly Glu Thr Ala Asp Thr Ile
340 345 350
Ala Ala Leu Gln Arg Ala Gln Asn Ala Gly Met Ile Tyr Thr Leu Cys
355 360 365
Ile Cys Asn Ser Pro Lys Ser Thr Leu Val Arg Glu Ser Ile Met Lys
370 375 380
Tyr Ile Thr Lys Cys Gly Ser Glu Val Ser Val Ala Ser Thr Lys Ala
385 390 395 400
Phe Thr Ser Gln Leu Val Val Leu Tyr Met Leu Ala Asn Val Leu Ala
405 410 415
Asn Lys Thr Asp Asp Leu Leu Gly Asp Leu Pro Gln Ala Ile Glu Arg
420 425 430
Val Ile Cys Leu Thr Asn Asp Glu Met Lys Arg Trp Ala Asp Glu Ile
435 440 445
Cys Thr Ala Lys Ser Ala Ile Phe Leu Gly Arg Gly Leu Asn Ala Pro
450 455 460
Val Ala Phe Glu Gly Ala Leu Lys Leu Lys Glu Ile Ser Tyr Ile His
465 470 475 480
Ala Glu Gly Phe Leu Gly Gly Glu Leu Lys His Gly Pro Leu Ala Leu
485 490 495
Leu Asp Asp Lys Ile Pro Val Ile Val Thr Val Ala Asp His Ala Tyr
500 505 510
Leu Asp His Ile Lys Ala Asn Ile Asp Glu Val Leu Ala Arg Asn Val
515 520 525
Thr Val Tyr Ala Ile Val Asp Gln Tyr Val Asn Ile Glu Pro Gln Glu
530 535 540
Arg Leu His Val Val Lys Val Pro Phe Val Ser Lys Glu Phe Ser Pro
545 550 555 560
Ile Ile His Thr Ile Pro Met Gln Leu Leu Ser Tyr Tyr Val Ala Ile
565 570 575
Lys Leu Gly Lys Asn Val Asp Lys Pro Arg Asn Leu Ala Lys Ser Val
580 585 590
Thr Thr Phe
595
<210> 77
<211> 1434
<212> DNA
<213> 酿酒酵母
<220>
<223> 源自酿酒酵母的UDP-N-乙酰葡萄糖胺焦磷酸化酶(QRI1)的核酸序列
<400> 77
atgactgaca caaaacagct attcattgaa gccggacaaa gtcaactttt ccacaattgg 60
gaaagcttgt ctcgcaaaga ccaagaagaa ttgctttcaa acctggagca aatatcttcc 120
aagaggtccc ctgcaaaact actggaagac tgtcaaaatg ctattaaatt ctcactagct 180
aactcttcta aggatactgg cgtcgaaatt tcaccattgc cccctacttc gtacgagtcg 240
cttattggca acagtaagaa agaaaatgaa tactggcgtt taggccttga agctattggc 300
aagggtgaag tcgcagtgat tttaatggct ggcggacaag gtacgcggtt aggatcctct 360
caaccaaagg gctgttacga cattggattg ccttctaaga aatctctttt tcaaattcaa 420
gctgaaaagt tgatcaggtt gcaagatatg gtaaaggaca aaaaggtaga aattccttgg 480
tatattatga catcaggccc cactagagcg gctactgagg catactttca agaacacaat 540
tattttggct tgaataaaga acaaattacg ttcttcaacc agggaaccct gcctgccttt 600
gatttaaccg ggaagcattt cctaatgaaa gacccagtaa acctatctca atcaccagat 660
ggaaatggtg gactctaccg tgccatcaag gaaaacaagt tgaacgaaga ctttgatagg 720
agaggaatca agcatgttta catgtactgt gtcgataatg tcctatctaa aatcgcagac 780
cctgtattta ttggttttgc catcaagcat ggcttcgaac tggccaccaa agccgttaga 840
aagagagatg cgcatgaatc agttgggtta attgctacta aaaacgagaa accatgtgtc 900
atagaatatt ctgaaatttc caatgaattg gctgaagcaa aggataaaga tggcttatta 960
aaactacgcg caggcaacat tgtaaatcat tattacctag tggatttact aaaacgtgat 1020
ttggatcagt ggtgtgagaa tatgccatat cacattgcga agaagaaaat tccagcttat 1080
gatagtgtta ccggcaagta cactaagcct accgaaccaa acggtataaa attagagcaa 1140
ttcatatttg atgtctttga cactgtacca ctgaacaagt ttgggtgctt agaagtagat 1200
agatgcaaag aattttcacc tttaaaaaac ggtcctggtt ctaagaacga taatcctgag 1260
accagcagac tagcatattt gaaactagga acctcgtggt tggaagatgc aggcgctatt 1320
gtaaaagatg gggtactagt cgaagtttcc agcaaattga gttatgcagg tgaaaatcta 1380
tcccagttca aaggtaaagt ctttgacaga agtggtatag tattagaaaa ataa 1434
<210> 78
<211> 477
<212> PRT
<213> 酿酒酵母
<220>
<223> 源自酿酒酵母的UDP-N-乙酰葡萄糖胺焦磷酸化酶(QRI1)的氨基酸序列
<400> 78
Met Thr Asp Thr Lys Gln Leu Phe Ile Glu Ala Gly Gln Ser Gln Leu
1 5 10 15
Phe His Asn Trp Glu Ser Leu Ser Arg Lys Asp Gln Glu Glu Leu Leu
20 25 30
Ser Asn Leu Glu Gln Ile Ser Ser Lys Arg Ser Pro Ala Lys Leu Leu
35 40 45
Glu Asp Cys Gln Asn Ala Ile Lys Phe Ser Leu Ala Asn Ser Ser Lys
50 55 60
Asp Thr Gly Val Glu Ile Ser Pro Leu Pro Pro Thr Ser Tyr Glu Ser
65 70 75 80
Leu Ile Gly Asn Ser Lys Lys Glu Asn Glu Tyr Trp Arg Leu Gly Leu
85 90 95
Glu Ala Ile Gly Lys Gly Glu Val Ala Val Ile Leu Met Ala Gly Gly
100 105 110
Gln Gly Thr Arg Leu Gly Ser Ser Gln Pro Lys Gly Cys Tyr Asp Ile
115 120 125
Gly Leu Pro Ser Lys Lys Ser Leu Phe Gln Ile Gln Ala Glu Lys Leu
130 135 140
Ile Arg Leu Gln Asp Met Val Lys Asp Lys Lys Val Glu Ile Pro Trp
145 150 155 160
Tyr Ile Met Thr Ser Gly Pro Thr Arg Ala Ala Thr Glu Ala Tyr Phe
165 170 175
Gln Glu His Asn Tyr Phe Gly Leu Asn Lys Glu Gln Ile Thr Phe Phe
180 185 190
Asn Gln Gly Thr Leu Pro Ala Phe Asp Leu Thr Gly Lys His Phe Leu
195 200 205
Met Lys Asp Pro Val Asn Leu Ser Gln Ser Pro Asp Gly Asn Gly Gly
210 215 220
Leu Tyr Arg Ala Ile Lys Glu Asn Lys Leu Asn Glu Asp Phe Asp Arg
225 230 235 240
Arg Gly Ile Lys His Val Tyr Met Tyr Cys Val Asp Asn Val Leu Ser
245 250 255
Lys Ile Ala Asp Pro Val Phe Ile Gly Phe Ala Ile Lys His Gly Phe
260 265 270
Glu Leu Ala Thr Lys Ala Val Arg Lys Arg Asp Ala His Glu Ser Val
275 280 285
Gly Leu Ile Ala Thr Lys Asn Glu Lys Pro Cys Val Ile Glu Tyr Ser
290 295 300
Glu Ile Ser Asn Glu Leu Ala Glu Ala Lys Asp Lys Asp Gly Leu Leu
305 310 315 320
Lys Leu Arg Ala Gly Asn Ile Val Asn His Tyr Tyr Leu Val Asp Leu
325 330 335
Leu Lys Arg Asp Leu Asp Gln Trp Cys Glu Asn Met Pro Tyr His Ile
340 345 350
Ala Lys Lys Lys Ile Pro Ala Tyr Asp Ser Val Thr Gly Lys Tyr Thr
355 360 365
Lys Pro Thr Glu Pro Asn Gly Ile Lys Leu Glu Gln Phe Ile Phe Asp
370 375 380
Val Phe Asp Thr Val Pro Leu Asn Lys Phe Gly Cys Leu Glu Val Asp
385 390 395 400
Arg Cys Lys Glu Phe Ser Pro Leu Lys Asn Gly Pro Gly Ser Lys Asn
405 410 415
Asp Asn Pro Glu Thr Ser Arg Leu Ala Tyr Leu Lys Leu Gly Thr Ser
420 425 430
Trp Leu Glu Asp Ala Gly Ala Ile Val Lys Asp Gly Val Leu Val Glu
435 440 445
Val Ser Ser Lys Leu Ser Tyr Ala Gly Glu Asn Leu Ser Gln Phe Lys
450 455 460
Gly Lys Val Phe Asp Arg Ser Gly Ile Val Leu Glu Lys
465 470 475
<210> 79
<211> 1713
<212> DNA
<213> 酿酒酵母
<220>
<223> 源自酿酒酵母的磷酸葡萄糖变位酶-1(PGM1)的核酸序列
<400> 79
atgtcacttc taatagattc tgtaccaaca gttgcttata aggaccaaaa accgggtact 60
tcaggtttac gtaagaagac caaggttttc atggatgagc ctcattatac tgagaacttc 120
attcaagcaa caatgcaatc tatccctaat ggctcagagg gaaccacttt agttgttgga 180
ggagatggtc gtttctacaa cgatgttatc atgaacaaga ttgccgcagt aggtgctgca 240
aacggtgtca gaaagttagt cattggtcaa ggcggtttac tttcaacacc agctgcttct 300
catataatta gaacatacga ggaaaagtgt accggtggtg gtatcatatt aactgcctca 360
cacaacccag gcggtccaga gaatgattta ggtatcaagt ataatttacc taatggtggg 420
ccagctccag agagtgtcac taacgctatc tgggaagcgt ctaaaaaatt aactcactat 480
aaaattataa agaacttccc caagttgaat ttgaacaagc ttggtaaaaa ccaaaaatat 540
ggcccattgt tagtggacat aattgatcct gccaaagcat acgttcaatt tctgaaggaa 600
atttttgatt ttgacttaat taaaagcttc ttagcgaaac agcgcaaaga caaagggtgg 660
aagttgttgt ttgactcctt aaatggtatt acaggaccat atggtaaggc tatatttgtt 720
gatgaatttg gtttaccggc agaggaagtt cttcaaaatt ggcacccttt acctgatttc 780
ggcggtttac atcccgatcc gaatctaacc tatgcacgaa ctcttgttga cagggttgac 840
cgcgaaaaaa ttgcctttgg agcagcctcc gatggtgatg gtgataggaa tatgatttac 900
ggttatggcc ctgctttcgt ttcgccaggt gattctgttg ccattattgc cgaatatgca 960
cccgaaattc catacttcgc caaacaaggt atttatggct tggcacgttc atttcctaca 1020
tcctcagcca ttgatcgtgt tgcagcaaaa aagggattaa gatgttacga agttccaacc 1080
ggctggaaat tcttctgtgc cttatttgat gctaaaaagc tatcaatctg tggtgaagaa 1140
tccttcggta caggttccaa tcatatcaga gaaaaggacg gtctatgggc cattattgct 1200
tggttaaata tcttggctat ctaccatagg cgtaaccctg aaaaggaagc ttcgatcaaa 1260
actattcagg acgaattttg gaacgagtat ggccgtactt tcttcacaag atacgattac 1320
gaacatatcg aatgcgagca ggccgaaaaa gttgtagctc ttttgagtga atttgtatca 1380
aggccaaacg tttgtggctc ccacttccca gctgatgagt ctttaaccgt tatcgattgt 1440
ggtgattttt cgtatagaga tctagatggc tccatctctg aaaatcaagg ccttttcgta 1500
aagttttcga atgggactaa atttgttttg aggttatccg gcacaggcag ttctggtgca 1560
acaataagat tatacgtaga aaagtatact gataaaaagg agaactatgg ccaaacagct 1620
gacgtcttct tgaaacccgt catcaactcc attgtaaaat tcttaagatt taaagaaatt 1680
ttaggaacag acgaaccaac agtccgcaca tag 1713
<210> 80
<211> 570
<212> PRT
<213> 酿酒酵母
<220>
<223> 源自酿酒酵母的磷酸葡萄糖变位酶-1(PGM1)的氨基酸序列
<400> 80
Met Ser Leu Leu Ile Asp Ser Val Pro Thr Val Ala Tyr Lys Asp Gln
1 5 10 15
Lys Pro Gly Thr Ser Gly Leu Arg Lys Lys Thr Lys Val Phe Met Asp
20 25 30
Glu Pro His Tyr Thr Glu Asn Phe Ile Gln Ala Thr Met Gln Ser Ile
35 40 45
Pro Asn Gly Ser Glu Gly Thr Thr Leu Val Val Gly Gly Asp Gly Arg
50 55 60
Phe Tyr Asn Asp Val Ile Met Asn Lys Ile Ala Ala Val Gly Ala Ala
65 70 75 80
Asn Gly Val Arg Lys Leu Val Ile Gly Gln Gly Gly Leu Leu Ser Thr
85 90 95
Pro Ala Ala Ser His Ile Ile Arg Thr Tyr Glu Glu Lys Cys Thr Gly
100 105 110
Gly Gly Ile Ile Leu Thr Ala Ser His Asn Pro Gly Gly Pro Glu Asn
115 120 125
Asp Leu Gly Ile Lys Tyr Asn Leu Pro Asn Gly Gly Pro Ala Pro Glu
130 135 140
Ser Val Thr Asn Ala Ile Trp Glu Ala Ser Lys Lys Leu Thr His Tyr
145 150 155 160
Lys Ile Ile Lys Asn Phe Pro Lys Leu Asn Leu Asn Lys Leu Gly Lys
165 170 175
Asn Gln Lys Tyr Gly Pro Leu Leu Val Asp Ile Ile Asp Pro Ala Lys
180 185 190
Ala Tyr Val Gln Phe Leu Lys Glu Ile Phe Asp Phe Asp Leu Ile Lys
195 200 205
Ser Phe Leu Ala Lys Gln Arg Lys Asp Lys Gly Trp Lys Leu Leu Phe
210 215 220
Asp Ser Leu Asn Gly Ile Thr Gly Pro Tyr Gly Lys Ala Ile Phe Val
225 230 235 240
Asp Glu Phe Gly Leu Pro Ala Glu Glu Val Leu Gln Asn Trp His Pro
245 250 255
Leu Pro Asp Phe Gly Gly Leu His Pro Asp Pro Asn Leu Thr Tyr Ala
260 265 270
Arg Thr Leu Val Asp Arg Val Asp Arg Glu Lys Ile Ala Phe Gly Ala
275 280 285
Ala Ser Asp Gly Asp Gly Asp Arg Asn Met Ile Tyr Gly Tyr Gly Pro
290 295 300
Ala Phe Val Ser Pro Gly Asp Ser Val Ala Ile Ile Ala Glu Tyr Ala
305 310 315 320
Pro Glu Ile Pro Tyr Phe Ala Lys Gln Gly Ile Tyr Gly Leu Ala Arg
325 330 335
Ser Phe Pro Thr Ser Ser Ala Ile Asp Arg Val Ala Ala Lys Lys Gly
340 345 350
Leu Arg Cys Tyr Glu Val Pro Thr Gly Trp Lys Phe Phe Cys Ala Leu
355 360 365
Phe Asp Ala Lys Lys Leu Ser Ile Cys Gly Glu Glu Ser Phe Gly Thr
370 375 380
Gly Ser Asn His Ile Arg Glu Lys Asp Gly Leu Trp Ala Ile Ile Ala
385 390 395 400
Trp Leu Asn Ile Leu Ala Ile Tyr His Arg Arg Asn Pro Glu Lys Glu
405 410 415
Ala Ser Ile Lys Thr Ile Gln Asp Glu Phe Trp Asn Glu Tyr Gly Arg
420 425 430
Thr Phe Phe Thr Arg Tyr Asp Tyr Glu His Ile Glu Cys Glu Gln Ala
435 440 445
Glu Lys Val Val Ala Leu Leu Ser Glu Phe Val Ser Arg Pro Asn Val
450 455 460
Cys Gly Ser His Phe Pro Ala Asp Glu Ser Leu Thr Val Ile Asp Cys
465 470 475 480
Gly Asp Phe Ser Tyr Arg Asp Leu Asp Gly Ser Ile Ser Glu Asn Gln
485 490 495
Gly Leu Phe Val Lys Phe Ser Asn Gly Thr Lys Phe Val Leu Arg Leu
500 505 510
Ser Gly Thr Gly Ser Ser Gly Ala Thr Ile Arg Leu Tyr Val Glu Lys
515 520 525
Tyr Thr Asp Lys Lys Glu Asn Tyr Gly Gln Thr Ala Asp Val Phe Leu
530 535 540
Lys Pro Val Ile Asn Ser Ile Val Lys Phe Leu Arg Phe Lys Glu Ile
545 550 555 560
Leu Gly Thr Asp Glu Pro Thr Val Arg Thr
565 570
<210> 81
<211> 1500
<212> DNA
<213> 酿酒酵母
<220>
<223> 源自酿酒酵母的UTP-葡萄糖-1-磷酸尿苷酰转移酶(UGP1)的核酸序列
<400> 81
atgtccacta agaagcacac caaaacacat tccacttatg cattcgagag caacacaaac 60
agcgttgctg cctcacaaat gagaaacgcc ttaaacaagt tggcggactc tagtaaactt 120
gacgatgctg ctcgcgctaa gtttgagaac gaactggatt cgtttttcac gcttttcagg 180
agatatttgg tagagaagtc ttctagaacc accttggaat gggacaagat caagtctccc 240
aacccggatg aagtggttaa gtatgaaatt atttctcagc agcccgagaa tgtctcaaac 300
ctttccaaat tggctgtttt gaagttgaac ggtgggctgg gtacctccat gggctgcgtt 360
ggccctaaat ctgttattga agtgagagag ggaaacacct ttttggattt gtctgttcgt 420
caaattgaat acttgaacag acagtacgat agcgacgtgc cattgttatt gatgaattct 480
ttcaacactg acaaggatac ggaacacttg attaagaagt attccgctaa cagaatcaga 540
atcagatctt tcaatcaatc caggttccca agagtctaca aggattcttt attgcctgtc 600
cccaccgaat acgattctcc actggatgct tggtatccac caggtcacgg tgatttgttt 660
gaatctttac acgtatctgg tgaactggat gccttaattg cccaaggaag agaaatatta 720
tttgtttcta acggtgacaa cttgggtgct accgtcgact taaaaatttt aaaccacatg 780
atcgagactg gtgccgaata tataatggaa ttgactgata agaccagagc cgatgttaaa 840
ggtggtactt tgatttctta cgatggtcaa gtccgtttat tggaagtcgc ccaagttcca 900
aaagaacaca ttgacgaatt caaaaatatc agaaagttta ccaacttcaa cacgaataac 960
ttatggatca atctgaaagc agtaaagagg ttgatcgaat cgagcaattt ggagatggaa 1020
atcattccaa accaaaaaac tataacaaga gacggtcatg aaattaatgt cttacaatta 1080
gaaaccgctt gtggtgctgc tatcaggcat tttgatggtg ctcacggtgt tgtcgttcca 1140
agatcaagat tcttgcctgt caagacctgt tccgatttgt tgctggttaa atcagatcta 1200
ttccgtctgg aacacggttc tttgaagtta gacccatccc gttttggtcc aaacccatta 1260
atcaagttgg gctcgcattt caaaaaggtt tctggtttta acgcaagaat ccctcacatc 1320
ccaaaaatcg tcgagctaga tcatttgacc atcactggta acgtcttttt aggtaaagat 1380
gtcactttga ggggtactgt catcatcgtt tgctccgacg gtcataaaat cgatattcca 1440
aacggctcca tattggaaaa tgttgtcgtt actggtaatt tgcaaatctt ggaacattga 1500
<210> 82
<211> 499
<212> PRT
<213> 酿酒酵母
<220>
<223> 源自酿酒酵母的UTP--葡萄糖-1-磷酸尿苷酰转移酶(UGP1)的氨基酸序列
<400> 82
Met Ser Thr Lys Lys His Thr Lys Thr His Ser Thr Tyr Ala Phe Glu
1 5 10 15
Ser Asn Thr Asn Ser Val Ala Ala Ser Gln Met Arg Asn Ala Leu Asn
20 25 30
Lys Leu Ala Asp Ser Ser Lys Leu Asp Asp Ala Ala Arg Ala Lys Phe
35 40 45
Glu Asn Glu Leu Asp Ser Phe Phe Thr Leu Phe Arg Arg Tyr Leu Val
50 55 60
Glu Lys Ser Ser Arg Thr Thr Leu Glu Trp Asp Lys Ile Lys Ser Pro
65 70 75 80
Asn Pro Asp Glu Val Val Lys Tyr Glu Ile Ile Ser Gln Gln Pro Glu
85 90 95
Asn Val Ser Asn Leu Ser Lys Leu Ala Val Leu Lys Leu Asn Gly Gly
100 105 110
Leu Gly Thr Ser Met Gly Cys Val Gly Pro Lys Ser Val Ile Glu Val
115 120 125
Arg Glu Gly Asn Thr Phe Leu Asp Leu Ser Val Arg Gln Ile Glu Tyr
130 135 140
Leu Asn Arg Gln Tyr Asp Ser Asp Val Pro Leu Leu Leu Met Asn Ser
145 150 155 160
Phe Asn Thr Asp Lys Asp Thr Glu His Leu Ile Lys Lys Tyr Ser Ala
165 170 175
Asn Arg Ile Arg Ile Arg Ser Phe Asn Gln Ser Arg Phe Pro Arg Val
180 185 190
Tyr Lys Asp Ser Leu Leu Pro Val Pro Thr Glu Tyr Asp Ser Pro Leu
195 200 205
Asp Ala Trp Tyr Pro Pro Gly His Gly Asp Leu Phe Glu Ser Leu His
210 215 220
Val Ser Gly Glu Leu Asp Ala Leu Ile Ala Gln Gly Arg Glu Ile Leu
225 230 235 240
Phe Val Ser Asn Gly Asp Asn Leu Gly Ala Thr Val Asp Leu Lys Ile
245 250 255
Leu Asn His Met Ile Glu Thr Gly Ala Glu Tyr Ile Met Glu Leu Thr
260 265 270
Asp Lys Thr Arg Ala Asp Val Lys Gly Gly Thr Leu Ile Ser Tyr Asp
275 280 285
Gly Gln Val Arg Leu Leu Glu Val Ala Gln Val Pro Lys Glu His Ile
290 295 300
Asp Glu Phe Lys Asn Ile Arg Lys Phe Thr Asn Phe Asn Thr Asn Asn
305 310 315 320
Leu Trp Ile Asn Leu Lys Ala Val Lys Arg Leu Ile Glu Ser Ser Asn
325 330 335
Leu Glu Met Glu Ile Ile Pro Asn Gln Lys Thr Ile Thr Arg Asp Gly
340 345 350
His Glu Ile Asn Val Leu Gln Leu Glu Thr Ala Cys Gly Ala Ala Ile
355 360 365
Arg His Phe Asp Gly Ala His Gly Val Val Val Pro Arg Ser Arg Phe
370 375 380
Leu Pro Val Lys Thr Cys Ser Asp Leu Leu Leu Val Lys Ser Asp Leu
385 390 395 400
Phe Arg Leu Glu His Gly Ser Leu Lys Leu Asp Pro Ser Arg Phe Gly
405 410 415
Pro Asn Pro Leu Ile Lys Leu Gly Ser His Phe Lys Lys Val Ser Gly
420 425 430
Phe Asn Ala Arg Ile Pro His Ile Pro Lys Ile Val Glu Leu Asp His
435 440 445
Leu Thr Ile Thr Gly Asn Val Phe Leu Gly Lys Asp Val Thr Leu Arg
450 455 460
Gly Thr Val Ile Ile Val Cys Ser Asp Gly His Lys Ile Asp Ile Pro
465 470 475 480
Asn Gly Ser Ile Leu Glu Asn Val Val Val Thr Gly Asn Leu Gln Ile
485 490 495
Leu Glu His
<210> 83
<211> 480
<212> DNA
<213> 酿酒酵母
<220>
<223> 源自酿酒酵母的葡萄糖胺6-磷酸N-乙酰转移酶(GNA1)的核酸序列
<400> 83
atgagcttac ccgatggatt ttatataagg cgaatggaag agggggattt ggaacaggtc 60
actgagacgc taaaggtttt gaccaccgtg ggcactatta cccccgaatc cttcagcaaa 120
ctcataaaat actggaatga agccacagta tggaatgata acgaagataa aaaaataatg 180
caatataacc ccatggtgat tgtggacaag cgcaccgaga cggttgccgc tacggggaat 240
atcatcatcg aaagaaagat cattcatgaa ctggggctat gtggccacat cgaggacatt 300
gcagtaaact ccaagtatca gggccaaggt ttgggcaagc tcttgattga tcaattggta 360
actatcggct ttgactacgg ttgttataag attattttag attgcgatga gaaaaatgtc 420
aaattctatg aaaaatgtgg gtttagcaac gcaggcgtgg aaatgcaaat tagaaaatag 480
<210> 84
<211> 159
<212> PRT
<213> 酿酒酵母
<220>
<223> 源自酿酒酵母的葡萄糖胺6-磷酸N-乙酰转移酶(GNA1)的氨基酸序列
<400> 84
Met Ser Leu Pro Asp Gly Phe Tyr Ile Arg Arg Met Glu Glu Gly Asp
1 5 10 15
Leu Glu Gln Val Thr Glu Thr Leu Lys Val Leu Thr Thr Val Gly Thr
20 25 30
Ile Thr Pro Glu Ser Phe Ser Lys Leu Ile Lys Tyr Trp Asn Glu Ala
35 40 45
Thr Val Trp Asn Asp Asn Glu Asp Lys Lys Ile Met Gln Tyr Asn Pro
50 55 60
Met Val Ile Val Asp Lys Arg Thr Glu Thr Val Ala Ala Thr Gly Asn
65 70 75 80
Ile Ile Ile Glu Arg Lys Ile Ile His Glu Leu Gly Leu Cys Gly His
85 90 95
Ile Glu Asp Ile Ala Val Asn Ser Lys Tyr Gln Gly Gln Gly Leu Gly
100 105 110
Lys Leu Leu Ile Asp Gln Leu Val Thr Ile Gly Phe Asp Tyr Gly Cys
115 120 125
Tyr Lys Ile Ile Leu Asp Cys Asp Glu Lys Asn Val Lys Phe Tyr Glu
130 135 140
Lys Cys Gly Phe Ser Asn Ala Gly Val Glu Met Gln Ile Arg Lys
145 150 155
<210> 85
<211> 1674
<212> DNA
<213> 酿酒酵母
<220>
<223> 源自酿酒酵母的磷酸乙酰葡萄糖胺变位酶(PCM1)的核酸序列
<400> 85
atgaaggttg attacgagca attgtgcaaa ctctacgatg acacgtgccg cacaaagaat 60
gtgcagttca gttacggtac ggccggattc agaacgctgg ccaagaattt ggatacggtg 120
atgttcagta ctggtatact ggcggttctc aggtcgctga agcttcaggg tcagtatgtg 180
ggggtgatga tcacggcgtc gcacaaccca taccaggaca acggggtcaa gatcgtggaa 240
ccagacggat cgatgctttt ggccacatgg gagccatatg ccatgcagtt ggccaatgcg 300
gcctcttttg ccactaattt tgaagaattt cgtgttgagt tggccaagct gattgaacac 360
gaaaagattg atttgaatac aaccgtcgtg cctcacatcg tggttgggag agactctagg 420
gaaagtagtc catacttgct gcgctgcttg acttcctcca tggccagcgt cttccacgcg 480
caagttttgg acctaggctg tgtcactacg cctcaattgc attacattac tgatttgtcc 540
aacaggcgga aactggaagg agacacagcg ccagttgcca cagaacagga ctactattcg 600
ttctttatag gagccttcaa cgagctcttc gccacgtatc agctggagaa gaggctgtct 660
gtcccaaaat tgttcataga cacagccaat ggtatcggtg gtccacagtt gaaaaaacta 720
ctggcctccg aagattggga cgtgccagcg gagcaagttg aggtaatcaa cgacaggtcc 780
gatgttccag aactgttgaa ttttgaatgc ggtgcggatt atgtgaagac taaccagaga 840
ttacccaagg gtctttctcc atcctcgttt gattcgctat attgctcctt tgatggtgac 900
gcagacaggg ttgtgttcta ctatgtcgac tcaggatcaa aatttcattt gttggatggt 960
gacaaaattt ccactttgtt tgcaaagttc ttgtctaaac aactagaatt ggcacaccta 1020
gaacattctt tgaagattgg tgttgtgcaa actgcctatg caaacggcag ttccaccgct 1080
tacataaaaa atacgttgca ctgtcccgtg tcttgcacta agacaggtgt taaacacttg 1140
catcatgaag ctgccactca gtacgatatt ggcatttatt tcgaagcaaa tggacatggt 1200
acgattatat tcagcgaaaa atttcatcga actatcaaat ctgaattatc caagtccaag 1260
ttaaatggtg atacgttagc tttgagaact ttgaagtgtt tctctgaatt gattaatcag 1320
accgtgggag atgctatttc agacatgctt gctgtccttg ctactttggc gattttgaaa 1380
atgtcgccaa tggattggga tgaagagtat actgatttgc ccaacaagct ggttaagtgc 1440
atcgttcctg ataggtcaat tttccaaacc acggaccagg aaagaaaatt gctcaatcca 1500
gtggggttgc aagacaagat agatcttgtg gtagccaagt atcccatggg aagaagcttt 1560
gtcagagcca gtggtacgga ggatgcggtg agggtttatg cggaatgtaa ggactcctct 1620
aagttaggtc aattttgtga cgaagtggtg gagcacgtta aggcatctgc ttga 1674
<210> 86
<211> 557
<212> PRT
<213> 酿酒酵母
<220>
<223> 源自酿酒酵母的磷酸乙酰葡萄糖胺变位酶(PCM1)的氨基酸序列
<400> 86
Met Lys Val Asp Tyr Glu Gln Leu Cys Lys Leu Tyr Asp Asp Thr Cys
1 5 10 15
Arg Thr Lys Asn Val Gln Phe Ser Tyr Gly Thr Ala Gly Phe Arg Thr
20 25 30
Leu Ala Lys Asn Leu Asp Thr Val Met Phe Ser Thr Gly Ile Leu Ala
35 40 45
Val Leu Arg Ser Leu Lys Leu Gln Gly Gln Tyr Val Gly Val Met Ile
50 55 60
Thr Ala Ser His Asn Pro Tyr Gln Asp Asn Gly Val Lys Ile Val Glu
65 70 75 80
Pro Asp Gly Ser Met Leu Leu Ala Thr Trp Glu Pro Tyr Ala Met Gln
85 90 95
Leu Ala Asn Ala Ala Ser Phe Ala Thr Asn Phe Glu Glu Phe Arg Val
100 105 110
Glu Leu Ala Lys Leu Ile Glu His Glu Lys Ile Asp Leu Asn Thr Thr
115 120 125
Val Val Pro His Ile Val Val Gly Arg Asp Ser Arg Glu Ser Ser Pro
130 135 140
Tyr Leu Leu Arg Cys Leu Thr Ser Ser Met Ala Ser Val Phe His Ala
145 150 155 160
Gln Val Leu Asp Leu Gly Cys Val Thr Thr Pro Gln Leu His Tyr Ile
165 170 175
Thr Asp Leu Ser Asn Arg Arg Lys Leu Glu Gly Asp Thr Ala Pro Val
180 185 190
Ala Thr Glu Gln Asp Tyr Tyr Ser Phe Phe Ile Gly Ala Phe Asn Glu
195 200 205
Leu Phe Ala Thr Tyr Gln Leu Glu Lys Arg Leu Ser Val Pro Lys Leu
210 215 220
Phe Ile Asp Thr Ala Asn Gly Ile Gly Gly Pro Gln Leu Lys Lys Leu
225 230 235 240
Leu Ala Ser Glu Asp Trp Asp Val Pro Ala Glu Gln Val Glu Val Ile
245 250 255
Asn Asp Arg Ser Asp Val Pro Glu Leu Leu Asn Phe Glu Cys Gly Ala
260 265 270
Asp Tyr Val Lys Thr Asn Gln Arg Leu Pro Lys Gly Leu Ser Pro Ser
275 280 285
Ser Phe Asp Ser Leu Tyr Cys Ser Phe Asp Gly Asp Ala Asp Arg Val
290 295 300
Val Phe Tyr Tyr Val Asp Ser Gly Ser Lys Phe His Leu Leu Asp Gly
305 310 315 320
Asp Lys Ile Ser Thr Leu Phe Ala Lys Phe Leu Ser Lys Gln Leu Glu
325 330 335
Leu Ala His Leu Glu His Ser Leu Lys Ile Gly Val Val Gln Thr Ala
340 345 350
Tyr Ala Asn Gly Ser Ser Thr Ala Tyr Ile Lys Asn Thr Leu His Cys
355 360 365
Pro Val Ser Cys Thr Lys Thr Gly Val Lys His Leu His His Glu Ala
370 375 380
Ala Thr Gln Tyr Asp Ile Gly Ile Tyr Phe Glu Ala Asn Gly His Gly
385 390 395 400
Thr Ile Ile Phe Ser Glu Lys Phe His Arg Thr Ile Lys Ser Glu Leu
405 410 415
Ser Lys Ser Lys Leu Asn Gly Asp Thr Leu Ala Leu Arg Thr Leu Lys
420 425 430
Cys Phe Ser Glu Leu Ile Asn Gln Thr Val Gly Asp Ala Ile Ser Asp
435 440 445
Met Leu Ala Val Leu Ala Thr Leu Ala Ile Leu Lys Met Ser Pro Met
450 455 460
Asp Trp Asp Glu Glu Tyr Thr Asp Leu Pro Asn Lys Leu Val Lys Cys
465 470 475 480
Ile Val Pro Asp Arg Ser Ile Phe Gln Thr Thr Asp Gln Glu Arg Lys
485 490 495
Leu Leu Asn Pro Val Gly Leu Gln Asp Lys Ile Asp Leu Val Val Ala
500 505 510
Lys Tyr Pro Met Gly Arg Ser Phe Val Arg Ala Ser Gly Thr Glu Asp
515 520 525
Ala Val Arg Val Tyr Ala Glu Cys Lys Asp Ser Ser Lys Leu Gly Gln
530 535 540
Phe Cys Asp Glu Val Val Glu His Val Lys Ala Ser Ala
545 550 555
<210> 87
<211> 574
<212> DNA
<213> 其他序列
<220>
<223> 启动子pTDH3的核酸序列
<400> 87
ctgctgtaac ccgtacatgc ccaaaatagg gggcgggtta cacagaatat ataacatcgt 60
aggtgtctgg gtgaacagtt tattcctggc atccactaaa tataatggag cccgcttttt 120
aagctggcat ccagaaaaaa aaagaatccc agcaccaaaa tattgttttc ttcaccaacc 180
atcagttcat aggtccattc tcttagcgca actacagaga acaggggcac aaacaggcaa 240
aaaacgggca caacctcaat ggagtgatgc aacctgcctg gagtaaatga tgacacaagg 300
caattgaccc acgcatgtat ctatctcatt ttcttacacc ttctattacc ttctgctctc 360
tctgatttgg aaaaagctga aaaaaaaggt tgaaaccagt tccctgaaat tattccccta 420
cttgactaat aagtatataa agacggtagg tattgattgt aattctgtaa atctatttct 480
taaacttctt aaattctact tttatagtta gtcttttttt tagttttaaa acaccaagaa 540
cttagtttcg aataaacaca cataaacaaa caaa 574
<210> 88
<211> 585
<212> DNA
<213> 其他序列
<220>
<223> 启动子pTDH3.Sk的核酸序列
<400> 88
caattcatcg gcccttttag cggctacccg cgccatctaa atgatagggc gggtgacact 60
atggtaaatc ccataattag gtgtctgggt gagtggttct gatgccggca tccactaaat 120
atattggagc ccatttttta cgcgggcttc cagaaaaaaa gagaatccca gcaccaaaag 180
gtggttctct tcaccaacca tcagatcata ggtccacaac cacacataac aggggcacaa 240
aaaggcaaaa aacggacata acctcaatgg agtgatgcaa attgactgga gcaaaagctg 300
acacaaggca ttgattgacc tacgcatgta tctgtattct tttcttacac cttctattac 360
cttctaactc tttgggttgg aaaaaactga aaaaaaaggt tgggacctgg ttcccccaag 420
ttgtccccct acttggttat taaatatata aagacagcaa gtgttgatta taatcttgta 480
aatctatagt tcttaatcta tacttctatt tatattttaa attagtcttt ttatttccaa 540
gtccccaaga acttagtttc gaataaacac acacaaataa acaca 585
<210> 89
<211> 700
<212> DNA
<213> 其他序列
<220>
<223> 启动子pTDH3-1.sba的核酸序列-1
<400> 89
gcagcgcttc ttccgctcta gtttttatag ttattattac taccacctta aaaatacgta 60
aatactcaaa atagtagtga tattcccaac cttattcatc caaggcacat catcatcatc 120
agccattcat ctttcacctg ccattagtaa cccgtcttct cattgagcgg gttacggcag 180
ccacaggcca cattccgaat gtctgggtga gcggtccctt ttccagcatc cactaaatat 240
ctccgatccc gctttttaat ctggcttcct gaaaaaaaga gaatcccagc accaaaaaat 300
ggctctcttc accaaccatc agatcatagg tcccattctc ttaccgcaac cgtacagaac 360
aggggaaaac gggtacaacc tcaatggagt gatgcaaact gactggagca aaaagctgac 420
acaaggcaat cgacctacgt gtctgtctat tttctcacac cttctattac cttctaactc 480
tctgggttgg aaaaaactga aaaaaaggtt gagaccagtt tccacaaatc atccccctgt 540
ttgattaata aatatataaa gacgacaact atcgatcata aactcataaa actataactc 600
ctttacactt cttattttat agttattcta ttttaattct tattgatttt aaaaccccaa 660
gaacttagtt tcgaaaacac acacacacaa acaattaaaa 700
<210> 90
<211> 602
<212> DNA
<213> 其他序列
<220>
<223> 启动子pTDH3.Sar的核酸序列
<400> 90
gagctaaata tcagcccttc gggtcctgcc tgctacccgg tcctgttcga ataaaaacgc 60
gggtaacacg acccagtaac acctgtcgtt gggtgtctgg gtcagaagtt ctgataccgg 120
cttccactaa atagattggg ttccgctctt tacgctggct tcctgaaaaa agagattccg 180
ggcaccaaaa aattggtctc tttgccaacc atcagatcat aggtccattc tcttaccata 240
accacacagg ataggggcac cacaggcgaa aatgggcaca aaatctcaat ggagtgatgc 300
aaattagctg gaacaaaagc tgacacaagg caattaacct gcgcatgtat ccatctcctt 360
ttcttacacc ttctcttacg ttctaactgt ttgggttgga aaaattaaaa aaaaaaggtt 420
gagaccagtt tccccaaatc gtccccctac ttgattcata aatatataaa gacgacaact 480
attgattata atcttgtaaa tctataactc tttactttct cctatttata atttaactta 540
atctttttag atttaaaacc ccaagaactt agtttcgaac aaacacacac aaataaacaa 600
aa 602
<210> 91
<211> 550
<212> DNA
<213> 其他序列
<220>
<223> 启动子pENO2的核酸序列
<400> 91
cgctcagcat ctgcttcttc ccaaagatga acgcggcgtt atgtcactaa cgacgtgcac 60
caacttgcgg aaagtggaat cccgttccaa aactggcatc cactaattga tacatctaca 120
caccgcacgc cttttttctg aagcccactt tcgtggactt tgccatatgc aaaattcatg 180
aagtgtgata ccaagtcagc atacacctca ctagggtagt ttctttggtt gtattgatca 240
tttggttcat cgtggttcat taattttttt tctccattgc tttctggctt tgatcttact 300
atcatttgga tttttgtcga aggttgtaga attgtatgtg acaagtggca ccaagcatat 360
ataaaaaaaa aaagcattat cttcctacca gagttgattg ttaaaaacgt atttatagca 420
aacgcaattg taattaattc ttattttgta tcttttcttc ccttgtctca atcttttatt 480
tttattttat ttttcttttc ttagtttctt tcataacacc aagcaactaa tactataaca 540
tacaataata 550
<210> 92
<211> 598
<212> DNA
<213> 其他序列
<220>
<223> 启动子pTEF3的核酸序列
<400> 92
ggctgataat agcgtataaa caatgcatac tttgtacgtt caaaatacaa tgcagtagat 60
atatttatgc atattacata taatacatat cacataggaa gcaacaggcg cgttggactt 120
ttaattttcg aggaccgcga atccttacat cacacccaat cccccacaag tgatccccca 180
cacaccatag cttcaaaatg tttctactcc ttttttactc ttccagattt tctcggactc 240
cgcgcatcgc cgtaccactt caaaacaccc aagcacagca tactaaattt cccctctttc 300
ttcctctagg gtgtcgttaa ttacccgtac taaaggtttg gaaaagaaaa aagagaccgc 360
ctcgtttctt tttcttcgtc gaaaaaggca ataaaaattt ttatcacgtt tctttttctt 420
gaaaattttt ttttttgatt tttttctctt tcgatgacct cccattgata tttaagttaa 480
taaacggtct tcaatttctc aagtttcagt ttcatttttc ttgttctatt acaacttttt 540
ttacttcttg ctcattagaa agaaagcata gcaatctaat ctaagtttta attacaaa 598
<210> 93
<211> 383
<212> DNA
<213> 其他序列
<220>
<223> 启动子pTEF1的核酸序列
<400> 93
gtttagcttg cctcgtcccc gccgggtcac ccggccagcg acatggaggc ccagaatacc 60
ctccttgaca gtcttgacgt gcgcagctca ggggcatgat gtgactgtcg cccgtacatt 120
tagcccatac atccccatgt ataatcattt gcatccatac attttgatgg ccgcacggcg 180
cgaagcaaaa attacggctc ctcgctgcag acctgcgagc agggaaacgc tcccctcaca 240
gacgcgttga attgtcccca cgccgcgccc ctgtagagaa atataaaagg ttaggatttg 300
ccactgaggt tcttctttca tatacttcct tttaaaatct tgctacgata cagttctcac 360
atcacatccg aacataaaca acc 383
<210> 94
<211> 383
<212> DNA
<213> 其他序列
<220>
<223> 启动子pTEF1.ago的核酸序列
<400> 94
gtttagcttg cctcgtcccc gccgggtcac ccggccagcg acatggaggc ccagaatacc 60
ctccttgaca gtcttgacgt gcgcagctca ggggcatgat gtgactgtcg cccgtacatt 120
tagcccatac atccccatgt ataatcattt gcatccatac attttgatgg ccgcacggcg 180
cgaagcaaaa attacggctc ctcgctgcag acctgcgagc agggaaacgc tcccctcaca 240
gacgcgttga attgtcccca cgccgcgccc ctgtagagaa atataaaagg ttaggatttg 300
ccactgaggt tcttctttca tatacttcct tttaaaatct tgctacgata cagttctcac 360
atcacatccg aacataaaca acc 383
<210> 95
<211> 498
<212> DNA
<213> 其他序列
<220>
<223> 启动子pTEF1.Sba的核酸序列
<400> 95
cgccaacaaa ccttcgaaca ctttaatttt cgaggaccgc agatcctcac atcacaccca 60
cacccaagac tgcttccccc acacaccctg catctgtaca ctttcttctg ctctgttttt 120
ctctccggcg ttctctcggg tcgcccgcat cgccgcgccg gctggaaccg cccacgcacc 180
gcatattgca aatcgcctgc cccctcttgc tcctttttga gggcgcgccg ttacccgcgc 240
ccagggtccg gaaaaagaaa caaggctcta ccgcgtttct ttttccttgt cgaaaaaggc 300
aaaaatgaaa atttttatca cgtttctttt tttttgaaaa attttttttt tggttttttt 360
tctttcgatg gcctcccatt gatatttaag ttaataaatg gttttcagtt ttcaagtttc 420
agtttgtgtt cttctttgct aactttcact tacacctcga aagaaagtat agcaatctaa 480
tcttagtttt aattacaa 498
<210> 96
<211> 700
<212> DNA
<213> 其他序列
<220>
<223> 启动子pPDC1的核酸序列
<400> 96
ttatttacct atctctaaac ttcaacacct tatatcataa ctaatatttc ttgagataag 60
cacactgcac ccataccttc cttaaaaacg tagcttccag tttttggtgg ttccggcttc 120
cttcccgatt ccgcccgcta aacgcatatt tttgttgcct ggtggcattt gcaaaatgca 180
taacctatgc atttaaaaga ttatgtatgc tcttctgact tttcgtgtga tgaggctcgt 240
ggaaaaaatg aataatttat gaatttgaga acaattttgt gttgttacgg tattttacta 300
tggaataatc aatcaattga ggattttatg caaatatcgt ttgaatattt ttccgaccct 360
ttgagtactt ttcttcataa ttgcataata ttgtccgctg cccctttttc tgttagacgg 420
tgtcttgatc tacttgctat cgttcaacac caccttattt tctaactatt ttttttttag 480
ctcatttgaa tcagcttatg gtgatggcac atttttgcat aaacctagct gtcctcgttg 540
aacataggaa aaaaaaatat ataaacaagg ctctttcact ctccttgcaa tcagatttgg 600
gtttgttccc tttattttca tatttcttgt catattcctt tctcaattat tattttctac 660
tcataacctc acgcaaaata acacagtcaa atcaatcaaa 700
<210> 97
<211> 924
<212> DNA
<213> 其他序列
<220>
<223> 启动子pCCW12的核酸序列
<400> 97
aactgtaaac aggtacaatg cggacccttt tgccacaaaa catacatcat tcattgccgg 60
aaaaagaaag aagtgaagac agcagtgcag ccagccatgt tgcgccaatc taattataga 120
tgctggtgcc ctgaggatgt atctggagcc agccatggca tcatgcgcta ccgccggatg 180
taaaatccga cacgcaaaag aaaaccttcg aggttgcgca cttcgcccac ccatgaacca 240
cacggttagt ccaaaagggg cagttcagat tccagatgcg ggaattagct tgctgccacc 300
ctcacctcac taacgctgcg gtgtgcggat acttcatgct atttatagac gcgcgtgtcg 360
gaatcagcac gcgcaagaac caaatgggaa aatcggaatg ggtccagaac tgctttgagt 420
gctggctatt ggcgtctgat ttccgttttg ggaatccttt gccgcgcgcc cctctcaaaa 480
ctccgcacaa gtcccagaaa gcgggaaaga aataaaacgc caccaaaaaa aaaaataaaa 540
gccaatcctc gaagcgtggg tggtaggccc tggattatcc cgtacaagta tttctcagga 600
gtaaaaaaac cgtttgtttt ggaattcccc atttcgcggc cacctacgcc gctatctttg 660
caacaactat ctgcgataac tcagcaaatt ttgcatattc gtgttgcagt attgcgataa 720
tgggagtctt acttccaaca taacggcaga aagaaatgtg agaaaatttt gcatcctttg 780
cctccgttca agtatataaa gtcggcatgc ttgataatct ttctttccat cctacattgt 840
tctaattatt cttattctcc tttattcttt cctaacatac caagaaatta atcttctgtc 900
attcgcttaa acactatatc aata 924
<210> 98
<211> 976
<212> DNA
<213> 其他序列
<220>
<223> 启动子pCCW12.Sm的核酸序列
<400> 98
cgttgtgctg tagtgaagga agactaaaaa ggataatcac agttgtaaag aggtataatg 60
cggacccttt tgccacaaaa cacacatctt tcgtttccaa aataagaaag aagaaagcaa 120
aaagattagc agccacgttg ctgcgatcta attatagacg gtggcgtcat cattctcacc 180
caagattgtg tcttgaacct gccacgggtc ctgcgttatc gccggatgta aaactagaca 240
tgcaaaaaaa ggaccttcca ggtagcgtgc tccacaccac ccatgaccac cacagttagt 300
ccaaaagagg cagcaccact tcccgatggg ggaattagat tgctgccacc ctcacctcac 360
taatgctgcg gtgtgcggat atgccctgct atatatagct ccgcgttttt gaaccagcac 420
agcgcgagca ccaaaaagga aaatcgcata ggcccagaac tgatttcagc acgggctatt 480
ggcgttgggt ttccgttctg ggaaaccttc gccgcgtccc cctcacaaac ctccgcacaa 540
gttcgagcaa gcgggaaaaa acgaaaaacg ccattaatac taaataaagc aaatcctcga 600
agcgtgggtg gcaagcccct ggatttttcc gcacaagtac tcttctcagg agtaaaaaaa 660
cccgtttgtt ttggaattcc ccatttcgcg gccatctacg ccggtatctt cgcaatatct 720
atcagcgata actcagcaat tttaatattc gtgttgcagt gctgcgatag cgggagtctt 780
gtttgtaaca taacggcaga aaggaatgag agaaaatttt ccattctttg gcctccgttc 840
aagtatataa agccggcatg cttggtaatc tttctctctc ttctgtattg tttctataat 900
acttttatct tctaattatt ttctgaaaaa accaagaaat taatcttctg tcattcgctt 960
aaacactata tcaata 976
<210> 99
<211> 750
<212> DNA
<213> 其他序列
<220>
<223> 启动子pCCW12.Sk的核酸序列
<400> 99
tgtaaaatcc tacacgcaaa aaacctcttg ggttgcgcgt tttccaccac ccacgacccg 60
cacaatcaat ccaaaagggg caacgccagt tcccaatgcg ggaattagct cctcaccccc 120
ctcacccgct aacgctgcgg tgtgcggaca cgcagcagta tttatagatc ctcgtgttgg 180
aaccagcccg cgtgagcacc aaattggaaa gtcgcaatgg gcccagaacc gctttcagta 240
ctgggccatt ggcgtctagt ttccgttttg agcgtccttc gccgcgtctc tctgtgaaat 300
ccccgcacaa gtctgagcag gcaaaaaaaa aaaacgccac caaaaataaa taaagccaat 360
cctcgaagga tgagtaggaa aggaagcccc tggttttttc ccgcacgaat atttttcagg 420
agtgaaaaaa tccgtttgtt ttggaattcc ccatttcgcg ctcacctacg ccggtatctt 480
tggaacaact atcagcgata actcagcaaa atttgcatat ccgtgctgca atagtgcgat 540
agtgggattg ggagtcttgt tgcatcataa cggcagaaag gaatgaataa aaattttccg 600
ttctttgtct ccgttcaagt atataaagtc ggcatgcttg attatctttt cttctcttct 660
actacatttc tatttcactt tctactctat tcttccctga aaaacccaag aaaataatct 720
tctgtcattc gcttaaacaa tatatcaaaa 750
<210> 100
<211> 750
<212> DNA
<213> 其他序列
<220>
<223> 启动子pCCW12.Sba的核酸序列
<400> 100
accatgccac ggtgctggcc ccacttccac ccacgacccg cacggttggc ccgaaagggg 60
caacaccagt tcccaatacg gaaattagtc cgccaccacc ctcacctcgc tagagctgcg 120
gtgtgcgggc gtgcatcgct atttatagac atgcctgctg gcgtcaccgc gcgcgagcac 180
caaacaggaa aatcgcactg ggcccagaac cacgctatgc gctgggccga tggcgtccgg 240
tttccctttg ggagccccct gccacgttcg cctaacaaat ccccgcaccg gcttgagaaa 300
aaagcgaaaa gcgaaaaaaa aaaatcaacg ccaccaaaat taaaaaaaaa gagccatcct 360
cgaagggtga atagtagccc ctgacttttc ccgcacagac agacaccttt caggagtgaa 420
caaaaaagca gtttgttttg gaattccccc atttcgcggt ggcctgcgca ggtatctctg 480
cgtcaactat cagcgataac tcagcaaatt ttgcatattc gtgttgcgat actacgataa 540
tgggagtctg tcgcctaata acggcaacaa ggaatgagag agaaaaattt tcttcattct 600
ccagctcccg ttcaagtata taaggtcggc atggtcgatt gtctttcctt ctcttcagtt 660
acgtctctct atttacatta ttcttatttt tatttaataa aaaccccaag aaattaatct 720
tctgtcattc gcttaaacac tatatcaaaa 750
<210> 101
<211> 750
<212> DNA
<213> 其他序列
<220>
<223> 启动子pCCW12.Sar的核酸序列
<400> 101
aaaaaacaac cttctgccaa cctgcgtgct tctcaccacc catgacccac acaattgacc 60
cgaatggggc aactccagtt cccaatacgg gaattaactc gccaccatat ttaccgcgtt 120
gaagctgtgg tgtgcggaca ctccgtacta tttatagacc cacgcggtgg aaccagcacg 180
cgcgcgcact aaacaggaaa atcgcattga gtccagaacc gccaccagca cttggccatt 240
ggcgtctaat ttccgttttc ggcgcccctc accgcgtcct tctaacaaag cgcgcacaag 300
cttgagcaag tgaaaagaaa attaaaaata aaaaaccgcc accaaaacaa ataaagcaat 360
cttcgaagtg tgggttggtg ggaagcccct ggcttttccc gcaccagtcg ttttcaggag 420
taaaaaaata cccgtttgtt ttggaattcc ccatttcgcg gcgacctgcg ccggtatctt 480
tgcaacaact atttgcgata actcagcaaa atttgcatat tcgtgttggg atattgcgat 540
agtgggagtc ttgttgcata ataacggtaa aaagaagtga aggaaaaaaa tttgcatcct 600
ttagtctcag ttcaagtata taaagtcggg atattcaatt atctttcttt ctcttgctca 660
aaggtttcta tatttttttt atagtatttc ttttgttata aaataccaag aaattaatct 720
tctgtcattc gcttaaatac tacatcaata 750
<210> 102
<211> 500
<212> DNA
<213> 其他序列
<220>
<223> 启动子pNUP57的核酸序列
<400> 102
tcatctgcgc aatgactatc aagaccttct gcaagaattt caaatctcac tgaaaatctt 60
gaccgaaaag tgtcttgaaa acccatcaag cctgcaaaac ctatctttga cattagtctc 120
cattataaaa acggcatagt tgggagaaaa ctttccatac ttcaattgtg gactgatata 180
agtattttag ttttgcccgc atgatcatcc cacatggcta cagcagttct ctcataggaa 240
aatagtacaa tagctacgtg atataatcta aataattgtt gccaatgtgt aattatatca 300
ttttgaacgt acgcgaaatg gattattttc aaaaattttg tttcttgaaa tgagtaaaag 360
caaaagtcca actctccaag tcgatgtaaa caactttttg ccaaagggac tgaaagacta 420
aatcgaggat tatcccgttc aaactattcc agaaacgctc gttagtaaca aaagacatac 480
cttgttgacc aattgatcac 500
<210> 103
<211> 523
<212> DNA
<213> 其他序列
<220>
<223> 启动子pCCW10.ago的核酸序列
<400> 103
ggtaccacgg caacctcgtt cgctgttcat ccccttcgtc acacaggacg ttggatgccg 60
taagcagcgt tgcttttgat cctcaggatc ggccgggtaa cccgcggctg cttctatttt 120
agtattcata tctcaagcac atccattccg gccgtttggg ggcgccgccg cactcgtgtc 180
cattcctacc gtggcactta gggctatcct gtcggagcgc cccgccgacc gccttatcgg 240
caccaaaagt agaagccccg gccccgcgtg gctcagactc accatcggtg ctatttactt 300
ttcgatcaga tcgcggcgcg cggtggccgg catttccgga agcggccacg gagcagaggt 360
ggcgcattcg aatcgcatac gtcttcgcca cgccggaaaa aaaattttcg gctatataag 420
gagaggcggc cgtcttgctg caggcagttt cactttctct aaaaccaaag aacatcgatt 480
tctttagtca ctcgcttcct tacaccgaac tcgaggcggc cgc 523
<210> 104
<211> 943
<212> DNA
<213> 其他序列
<220>
<223> 启动子pCWP2的核酸序列
<400> 104
ctagcctccc ctttttattt tgtgcggtca ccgcaaggga caaagctttt cttagaaaac 60
cgtctgagaa gcataacgta cgccatcccc tagacatatt aataatgcta cagatactat 120
gctgctcgtc tttttttgac gaccctttta ttgcaatgtg caactaatgg caaacaacca 180
catagtatca cagtattaca ttgcctccac cgatgcggat gttagggcgc caagtctgtc 240
atgaagcatg ttcctgtcat aatcttgtat gcaaaatacc gcgttctgcg ccactgatat 300
gctaggcagc agcaacctat gcagaagatt gcttttccca cgcctgtttt acgtctccag 360
ggcacttgaa acaatgcagc gatcgccgcc acaacacgcc aaagagaagc gaaagtgggc 420
ctgggcggcc tcagtttcgg cagaggtaaa caacacgaac tgaactgcct tagctccgaa 480
gggcaattcc acaggcactc cgcggggccc ggccaaggcc caaaaggcgt ggaatatgcg 540
cgttttgggg ccataacacc cagtaccacg gccggaacgg gccatataat aagtttttca 600
ctctcaagaa tggtaaacgt aaataggaac atcccactac cctagaaatt gcggaaattt 660
cgcgcttatc attagaaaat ctggaaccgt cctttttcct ctttcttgca tttccctttc 720
cgtattattg ccattcttta actgcatttg gggaaccgta gaccaaaagc caaacagaga 780
aatgtaacgt tctaaaaaaa aaacaacgaa aaaattgaaa aataagatac aataatcgta 840
tataaatcag gcttcttgtt catcattttc aattctcttc ttgccatccc ttttcctatc 900
tttgttcttt tcttctcata atcaagaata aataacttca tca 943
<210> 105
<211> 650
<212> DNA
<213> 其他序列
<220>
<223> 启动子pFBA1的核酸序列
<400> 105
acgcaagccc taagaaatga ataacaatac tgacagtact aaataattgc ctacttggct 60
tcacatacgt tgcatacgtc gatatagata ataatgataa tgacagcagg attatcgtaa 120
tacgtaatag ttgaaaatct caaaaatgtg tgggtcatta cgtaaataat gataggaatg 180
ggattcttct atttttcctt tttccattct agcagccgtc gggaaaacgt ggcatcctct 240
ctttcgggct caattggagt cacgctgccg tgagcatcct ctctttccat atctaacaac 300
tgagcacgta accaatggaa aagcatgagc ttagcgttgc tccaaaaaag tattggatgg 360
ttaataccat ttgtctgttc tcttctgact ttgactcctc aaaaaaaaaa aatctacaat 420
caacagatcg cttcaattac gccctcacaa aaactttttt ccttcttctt cgcccacgtt 480
aaattttatc cctcatgttg tctaacggat ttctgcactt gatttattat aaaaagacaa 540
agacataata cttctctatc aatttcagtt attgttcttc cttgcgttat tcttctgttc 600
ttctttttct tttgtcatat ataaccataa ccaagtaata catattcaaa 650
<210> 106
<211> 996
<212> DNA
<213> 其他序列
<220>
<223> 启动子pCCW120.Sm的核酸序列
<400> 106
cgttgtgctg tagtgaagga agactaaaaa ggataatcac agttgtaaag aggtataatg 60
cggacccttt tgccacaaaa cacacatctt tcgtttccaa aataagaaag aagaaagcaa 120
aaagattagc agccacgttg ctgcgatcta attatagacg gtggcgtcat cattctcacc 180
caagattgtg tcttgaacct gccacgggtc ctgcgttatc gccggatgta aaactagaca 240
tgcaaaaaaa ggaccttcca ggtagcgtgc tccacaccac ccatgaccac cacagttagt 300
ccaaaagagg cagcaccact tcccgatggg ggaattagat tgctgccacc ctcacctcac 360
taatgctgcg gtgtgcggat atgccctgct atatatagct ccgcgttttt gaaccagcac 420
agcgcgagca ccaaaaagga aaatcgcata ggcccagaac tgatttcagc acgggctatt 480
ggcgttgggt ttccgttctg ggaaaccttc gccgcgtccc cctcacaaac ctccgcacaa 540
gttcgagcaa gcgggaaaaa acgaaaaacg ccattaatac taaataaagc aaatcctcga 600
agcgtgggtg gcaagcccct ggatttttcc gcacaagtac tcttctcagg agtaaaaaaa 660
cccgtttgtt ttggaattcc ccatttcgcg gccatctacg ccggtatctt cgcaatatct 720
atcagcgata actcagcaat tttaatattc gtgttgcagt gctgcgatag cgggagtctt 780
gtttgtaaca taacggcaga aaggaatgag agaaaatttt ccattctttg gcctccgttc 840
aagtatataa agccggcatg cttggtaatc tttctctctc ttctgtattg tttctataat 900
acttttatct tctaattatt ttctgaaaaa accaagaaat taatcttctg tcattcgctt 960
aaacactata tcaatactcg aaatccaagg tggtgt 996
<210> 107
<211> 505
<212> DNA
<213> 其他序列
<220>
<223> 启动子pCUP1的核酸序列
<400> 107
cggcaaactt caacgatttc tatgatgcat tttataatta gtaagccgat cccattaccg 60
acatttgggc gctatacgtg catatgttca tgtatgtatc tgtatttaaa acacttttgt 120
attatttttc ctcatatatg tgtataggtt tatacggatg atttaattat tacttcacca 180
ccctttattt caggctgata tcttagcctt gttactagtt agaaaaagac atttttgctg 240
tcagtcactg tcaagagatt cttttgctgg catttcttct agaagcaaaa agagcgatgc 300
gtcttttccg ctgaaccgtt ccagcaaaaa agactaccaa cgcaatatgg attgtcagaa 360
tcatataaaa gagaagcaaa taactccttg tcttgtatca attgcattat aatatcttct 420
tgttagtgca atatcatata gaagtcatcg aaatagatat taagaaaaac aaactgtaca 480
atcaatcaat caatcatcac ataaa 505
<210> 108
<211> 510
<212> DNA
<213> 其他序列
<220>
<223> 启动子pMET6的核酸序列
<400> 108
ccacaggaaa tatttcacgt gacttacaaa cagagtcgta cgtcaggacc ggagtcaggt 60
gaaaaaatgt gggccggtaa agggaaaaaa ccagaaacgg gactactatc gaactcgttt 120
agtcgcgaac gtgcaaaagg ccaatatttt tcgctagagt catcgcagtc atggcagctc 180
tttcgctcta tctcccggtc gcaaaactgt ggtagtcata gctcgttctg ctcaattgag 240
aactgtgaat gtgaatatgg aacaaatgcg atagatgcac taatttaagg gaagctagct 300
agttttccca actgcgaaag aaaaaaagga aagaaaaaaa aattctatat aagtgataga 360
tatttccatc tttactagca ttagtttctc ttttacgtat tcaatatttt tgttaaactc 420
ttcctttatc ataaaaaagc aagcatctaa gagcattgac aacactctaa gaaacaaaat 480
accaatataa tttcaaagta catatcaaaa 510
<210> 109
<211> 686
<212> DNA
<213> 其他序列
<220>
<223> 启动子pMET25的核酸序列
<400> 109
ttacattatc aatccttgcg tttcagcttc cactaattta gatgactatt tctcatcatt 60
tgcgtcatct tctaacaccg tatatgataa tatactagta acgtaaatac tagttagtag 120
atgatagttg atttttattc caacactaag aaataatttc gccatttctt gaatgtattt 180
aaagatattt aatgctataa tagacattta aatccaattc ttccaacata caatgggagt 240
ttggccgagt ggtttaaggc gtcagattta ggtggattta acctctaaaa tctctgatat 300
cttcggatgc aagggttcga atcccttagc tctcattatt ttttgctttt tctcttgagg 360
tcacatgatc gcaaaatggc aaatggcacg tgaagctgtc gatattgggg aactgtggtg 420
gttggcaaat gactaattaa gttagtcaag gcgccatcct catgaaaact gtgtaacata 480
ataaccgaag tgtcgaaaag gtggcacctt gtccaattga acacgctcga tgaaaaaaat 540
aagatatata taaggttaag taaagcgtct gttagaaagg aagtttttcc tttttcttgc 600
tctcttgtct tttcatctac tatttccttc gtgtaataca gggtcgtcag atacatagat 660
acaattctat tacccccatc cataca 686
<210> 110
<211> 363
<212> DNA
<213> 其他序列
<220>
<223> 启动子pSAM1的核酸序列
<400> 110
gaaacggacg taagacggaa atagaatttg aagataaagt tatatatcac tacacacgaa 60
tactttcttt tttttttttc acaggaaaac tgtggtggcg cccttgccta ctagtgcatt 120
tcttttttcg ggttcttgtc tcgacgaaat tttagcctca tcgtagtttt tcactctggt 180
atcgatgaaa aagggaagag taaaaagttt tccgtttagt acttaatggg attggtttgg 240
gacgtatata tcgactggtg ttgtctgtta ttcatcgttg tttttcggtt agcttcgaaa 300
aaaaaataga gtaaaaacca ggaatttacc ctaaaaacaa gaaaaaataa gataaacgaa 360
aat 363
<210> 111
<211> 300
<212> DNA
<213> 其他序列
<220>
<223> 终止子tTPI1的核酸序列
<400> 111
gattaatata attatataaa aatattatct tcttttcttt atatctagtg ttatgtaaaa 60
taaattgatg actacggaaa gcttttttat attgtttctt tttcattctg agccacttaa 120
atttcgtgaa tgttcttgta agggacggta gatttacaag tgatacaaca aaaagcaagg 180
cgctttttct aataaaaaga agaaaagcat ttaacaattg aacacctcta tatcaacgaa 240
gaatattact ttgtctctaa atccttgtaa aatgtgtacg atctctatat gggttactca 300
<210> 112
<211> 299
<212> DNA
<213> 其他序列
<220>
<223> 终止子tMET25的核酸序列
<400> 112
gtgtgcgtaa tgagttgtaa aattatgtat aaacctactt tctctcacaa gtactatact 60
tttataaaac gaactttatt gaaatgaata tccttttttt cccttgttac atgtcgtgac 120
tcgtactttg aacctaaatt gttctaacat caaagaacag tgttaattcg cagtcgagaa 180
gaaaaatatg gtgaacaaga ctcatctact tcatgagact actttacgcc tcctataaag 240
ctgtcacact ggataaattt attgtaggac caagttacaa aagaggatga tggaggttt 299
<210> 113
<211> 300
<212> DNA
<213> 其他序列
<220>
<223> 终止子tDIT1的核酸序列
<400> 113
taaagtaaga gcgctacatt ggtctacctt tttgttcttt tacttaaaca ttagttagtt 60
cgttttcttt ttctcatttt tttatgtttc ccccccaaag ttctgatttt ataatatttt 120
atttcacaca attccattta acagaggggg aatagattct ttagcttaga aaattagtga 180
tcaatatata tttgcctttc ttttcatctt ttcagtgata ttaatggttt cgagacactg 240
caatggccct agttgtctaa gaggatagat gttactgtca aagatgatat tttgaatttc 300
<210> 114
<211> 300
<212> DNA
<213> 其他序列
<220>
<223> 终止子tRPL3的核酸序列
<400> 114
gaagttttgt tagaaaataa atcatttttt aattgagcat tcttattcct attttattta 60
aatagtttta tgtattgtta gctacataca acagtttaaa tcaaattttc tttttcccaa 120
gtccaaaatg gaggtttatt ttgatgaccc gcatgcgatt atgttttgaa agtataagac 180
tacatacatg tacatatatt taaacatgta aacccgtcca ttatattgct tactttcttc 240
ttttttgccg ttttgacttg gacctctggt ttgctatttc cttacaatct ttgctacaat 300
<210> 115
<211> 304
<212> DNA
<213> 其他序列
<220>
<223> 终止子tRPL3.sm的核酸序列
<400> 115
gaagttttta aagcattttt tagacacttc tcatttttct aagttttttt aaaatagttt 60
tatgtattta ctacgtatca caatttgaaa taattcatct tcccaaaaaa ctaagatttt 120
tatccttgtc acgatccgta accagtttat aatattttag agcttataca cgtacgtata 180
cacacgtgtc ggtacatgag aattacgttc aaaattattc actttttttt tctctgccgt 240
tttacttttg aactctgtct cgctatttcc ttacaatctt cgctacaata ccacttgccc 300
ttgg 304
<210> 116
<211> 299
<212> DNA
<213> 其他序列
<220>
<223> 终止子tRPL3.sba的核酸序列
<400> 116
gaagttttct gacaaaaaca taacgttttt tccaatcatt tcttattttt ccggtttatt 60
taaatagttt ttatgtacta ttatacgtat gactatttaa cttaaattct tcctcccaag 120
aaatctccca agtttttcat tatcatggca tacaccacta tcagttacaa aatggtagct 180
caaccatata tatatctcta tatacacata taaatgcaaa caggtccaag tcaccgctca 240
ctgcagtttc ttttgccgtt ttgacttcga tctctgcttg gctattttct cacaatcct 299
<210> 117
<211> 300
<212> DNA
<213> 其他序列
<220>
<223> 终止子tRPL41B的核酸序列
<400> 117
gcggattgag agcaaatcgt taagttcagg tcaagtaaaa attgatttcg aaaactaatt 60
tctcttatac aatcctttga ttggaccgtc atcctttcga atataagatt ttgttaagaa 120
tattttagac agagatctac tttatattta atatctagat attacataat ttcctctcta 180
ataaaatatc attaataaaa taaaaatgaa gcgatttgat tttgtgttgt caacttagtt 240
tgccgctatg cctcttgggt aatgctatta ttgaatcgaa gggctttatt atattaccct 300
<210> 118
<211> 301
<212> DNA
<213> 其他序列
<220>
<223> 终止子tRPL41B.Sba的核酸序列
<400> 118
gcggattgcg agtgattttt tgagtacaga ccaagtaaaa ttgatctatg cataatcttt 60
tctcatccac aatccctaga atggaccgtc atcctttcta aaatgtttta ttaagaatat 120
ttaaagtgga agtcaggttt atatctatca attaaatatt acataatttc cccttaataa 180
aatactgtta ataaaataac gaaacgttca tagtttttca taaatagtcc tgatgcttac 240
tgcaccggaa cgtactgttt tagtgtattg ctcccttcat tgccattttt cctagttatt 300
g 301
<210> 119
<211> 300
<212> DNA
<213> 其他序列
<220>
<223> 终止子tRPL15A的核酸序列
<400> 119
gctggttgat ggaaaatata attttattgg gcaaactttt gtttatctga tgtgttttat 60
actattatct ttttaattaa tgattctata tacaaacctg tatatttttt ctttaaccaa 120
tttttttttt tatagaccta gagctgtact tttattctgc tatcaagcaa acccctaccc 180
cctcttctca atcctcccct caggcagaac ttatctacct gtatcaagga gcggacgagg 240
gagtcctaat tgttctacgt ataccaatgc tagcagctta cataggtggt ggcactacca 300
<210> 120
<211> 299
<212> DNA
<213> 其他序列
<220>
<223> 终止子tRPL15A.Sm的核酸序列
<400> 120
gctaattaga accatatata catcgataaa aacacttgaa tgtatttttc tttttcttct 60
tattttttca ttttccttcg ctttctatta gcgtgcgaat ctaaagtgtg cagcgctatc 120
tttgactctt tttttccttt agtgggaacg aacaatatta atcatgccaa gttaagtcat 180
tgaagaagtc agtagtatgt tattcggaga gaagaccctg ctatgtatct cagcctaccc 240
aaaaaatgaa ttgactcctc tcataacttg ttaatattcg gatgagcaca tcacgttcg 299
<210> 121
<211> 300
<212> DNA
<213> 其他序列
<220>
<223> 终止子tRPL15A.sba的核酸序列
<400> 121
gctggctgat gaaaaatata gttctgttgg gcaagcattt gtttacctag catctctttt 60
atactattat tatctttata tttgatgatt ttatatacaa gttgtatacc ttttctttaa 120
ccaatttttt tttttctaat ggtgcaccta gaagtacatt ttttctcacc aatagatagt 180
caagatactc ccagcctcta tggcgttacc acggagccga caagggaaag ctgcttatct 240
tacatatgca gatgccaagg cccgttacag gccgccttat tgatgtttag aaatagcttc 300
<210> 122
<211> 300
<212> DNA
<213> 其他序列
<220>
<223> 终止子tIDP1的核酸序列
<400> 122
tcgaatttac gtagcccaat ctaccacttt tttttttcat tttttaaagt gttatactta 60
gttatgctct aggataatga actacttttt tttttttttt tttactgtta tcataaatat 120
atatacctta ttgttgtttg caaccgtcgg ttaattcctt atcaaggttc cccaagttcg 180
gatcattacc atcaatttcc aacattttca tgagttcttc ttcttcatta ccgtgtttta 240
gggggctgtt cgcacttcta atagggctat caccaagctg ttctaattcg tccaaaagtt 300
<210> 123
<211> 290
<212> DNA
<213> 其他序列
<220>
<223> 终止子tIDP1.Sba的核酸序列
<400> 123
tctgatcttt ggaatgctcc atttactttt ttatttcata tttaggtacg atatatagtt 60
acgcttgaga actatgaact aataacttcc tttttctcta atacatactt acttcagctg 120
atggttgcaa acaacaataa aattccttgt cgaggttccc taaattagga tcattgccat 180
cgacttctaa cattttcatg agatcctcct cttcgttccc attctttaaa agactgtttc 240
cacttctaat agggttatcg cccaattgtt ctagttcgtc tagcaattcg 290
<210> 124
<211> 300
<212> DNA
<213> 其他序列
<220>
<223> 终止子tTEF1.sba的核酸序列
<400> 124
ggagattgat aggacttttc tagttgcata tcttttattt ttaaatctta tctattagtt 60
aattttttgt aatttatcct tatatatata gtttggttat tctaaaacat catttcagta 120
tctaaaacct ctcttattca ttaccttttt atttaatggt ttttgctaca ggcaaaaatt 180
taatggtttt tgctacaggc aaaaatcccg ccgtggactt attccacgtt aactcggtta 240
cagggtcatg aaccattttg tcaattatcg aaataacttc ttcaaaagtc cctcttactt 300
<210> 125
<211> 60
<212> DNA
<213> 其他序列
<220>
<223> 在5’添加的分泌序列的核酸序列
<400> 125
atgcaattta gcacagtcgc atcagtagcc ttcgttgcct tggccaactt cgtggcagca 60
<210> 126
<211> 20
<212> PRT
<213> 其他序列
<220>
<223> 在N末端添加的分泌序列的氨基酸序列
<400> 126
Met Gln Phe Ser Thr Val Ala Ser Val Ala Phe Val Ala Leu Ala Asn
1 5 10 15
Phe Val Ala Ala
20
<210> 127
<211> 213
<212> DNA
<213> 其他序列
<220>
<223> 在3’添加的锚定序列的核酸序列
<400> 127
ggatccgcca tttctcaaat cactgacggt caaatccaag ctactaccac tgctaccacc 60
gaagctacca ccactgctgc cccatcttcc accgttgaaa ctgtttctcc atccagcacc 120
gaaactatct ctcaacaaac tgaaaatggt gctgctaagg ccgctgtcgg tatgggtgcc 180
ggtgctctag ctgctgctgc tatgttgtta taa 213
<210> 128
<211> 68
<212> PRT
<213> 其他序列
<220>
<223> C末端添加的锚定序列的氨基酸序列
<400> 128
Ala Ile Ser Gln Ile Thr Asp Gly Gln Ile Gln Ala Thr Thr Thr Ala
1 5 10 15
Thr Thr Glu Ala Thr Thr Thr Ala Ala Pro Ser Ser Thr Val Glu Thr
20 25 30
Val Ser Pro Ser Ser Thr Glu Thr Ile Ser Gln Gln Thr Glu Asn Gly
35 40 45
Ala Ala Lys Ala Ala Val Gly Met Gly Ala Gly Ala Leu Ala Ala Ala
50 55 60
Ala Met Leu Leu
65

Claims (32)

1.一种生产软骨素的重组酵母细胞,其中,所述重组酵母细胞包含:
(a)编码具有软骨素合酶(HCOS)活性的多肽的一种或多种重组核酸;
(b)编码具有UDP-葡萄糖脱氢酶(UDP-GlcDH或HASB)活性的多肽的一种或多种重组核酸;和
(c)编码具有UDP-葡萄糖-4-差向异构酶(kfoA或GNE1)活性的多肽的一种或多种重组核酸。
2.根据权利要求1所述的重组细胞,其中,所述重组细胞包含编码具有软骨素酶活性的多肽的一种或多种重组核酸,其中所述具有软骨素酶活性的多肽包含分泌信号和任选的锚定信号。
3.一种生产软骨素的重组宿主细胞,其中,所述重组宿主细胞包含:
(a)编码具有软骨素合酶(HCOS)活性的多肽的一种或多种重组核酸;
(b)编码具有UDP-葡萄糖脱氢酶(UDP-GlcDH或HASB)活性的多肽的一种或多种重组核酸;
(c)编码具有UDP-葡萄糖-4-差向异构酶(kfoA或GNE1)活性的多肽的一种或多种重组核酸;和
(d)编码具有软骨素酶活性的多肽的一种或多种重组核酸,其中所述具有软骨素酶活性的多肽包含分泌信号和任选的锚定序列,使得软骨素、特别是具有所想要分子量的软骨素由所述宿主细胞生产。
4.根据权利要求2或3所述的重组宿主细胞,其中,所述编码具有软骨素酶活性的多肽的重组核酸获自或源自以下中的至少一者:萨氏九杯蛛、巴西钳蝎、家牛、大胡蜂、野捕恒河猴或西方蜜蜂,并且优选来自巴西钳蝎。
5.根据权利要求2至4中任一项所述的重组细胞,其中,所述软骨素的分子量在小于50kDa的范围内,优选在约20kDa至约50kDa的范围内。
6.根据权利要求1至4中任一项所述的重组细胞,其中,所述软骨素的分子量在大于50kDa的范围内,优选在约50kDa至约250kDa的范围内。
7.根据权利要求1至4中任一项所述的重组细胞,其中,所述软骨素的分子量在大于100kDa的范围内,优选在约100kDa至约1500kDa的范围内。
8.根据权利要求1至7中任一项所述的重组细胞,其中,编码具有UDP-葡萄糖脱氢酶(UDP-GlcDH或HASB)活性的多肽的核酸获自或源自以下中的至少一者:拟南芥、小球藻属病毒PBCV1或兽瘟链球菌,并且特别来自拟南芥或小球藻属病毒PBCV1中的至少一者。
9.根据权利要求1至8中任一项所述的重组细胞,其中,所述编码具有软骨素合酶(HCOS)活性的多肽的核酸是
(i)编码软骨素合酶的核酸;或
(ii)编码具有软骨素合酶活性的嵌合多肽的核酸。
10.根据权利要求9所述的重组细胞,其中,所述核酸获自或源自以下中的至少一者:多杀巴斯德菌、小球藻属病毒PBCV1、结核分枝杆菌、智人、大肠埃希氏菌、酿酒酵母或草酸青霉。
11.根据权利要求1至10中任一项所述的重组细胞,其中,所述编码具有UDP-葡萄糖-4-差向异构酶(kfoA或GNE1)活性的多肽的核酸获自或源自细菌,并且特别是来自选自由以下组成的组的细菌:铜绿假单胞菌、多杀巴斯德菌和大肠埃希氏菌。
12.根据权利要求1至11中任一项所述的重组细胞,其中,所述重组细胞还包含至少一种编码以下中的一者或多者的重组核酸:
(i)具有谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)活性的多肽;和/或
(ii)具有UDP-N-乙酰葡萄糖胺焦磷酸化酶(QRI1)活性的多肽。
13.根据权利要求1至12中任一项所述的重组细胞,其中,所述重组细胞还包含至少一种编码以下中的一者或多者的重组核酸:
(i)具有磷酸葡萄糖变位酶-1(PGM1)活性的多肽;
(ii)具有UTP-葡萄糖-1-磷酸尿苷酰转移酶(UGP1)活性的多肽;
(iii)具有葡萄糖胺-6-磷酸N-乙酰转移酶(GNA1)活性的多肽;和/或
(iv)具有磷酸乙酰葡萄糖胺变位酶(PCM1)活性的多肽。
14.根据权利要求12或13所述的重组细胞,其中:
-编码具有谷氨酰胺-果糖-6-磷酸酰胺转移酶(GFA1)活性的多肽的核酸;
-编码具有UDP-N-乙酰葡萄糖胺焦磷酸化酶(QRI1)活性的多肽的核酸;
-编码具有磷酸葡萄糖变位酶-1(PGM1)活性的多肽的核酸;
-编码具有UTP-葡萄糖-1-磷酸尿苷酰转移酶(UGP1)活性的多肽的核酸;
-编码具有葡萄糖胺-6-磷酸N-乙酰转移酶(GNA1)活性的多肽的核酸;和/或
-编码具有磷酸乙酰葡萄糖胺变位酶(PCM1)的多肽的核酸;
获自或源自酿酒酵母。
15.根据权利要求3至14中任一项所述的重组宿主细胞,其中,所述重组宿主细胞是酵母。
16.根据权利要求1至15中任一项所述的重组细胞,其中,所述重组细胞属于酵母属,或属于念珠菌属,或属于克鲁维酵母菌属,或属于汉逊酵母属,或属于耶氏酵母属,或属于德巴利酵母属,或属于阿舒囊霉属,并且特别是属于酵母属。
17.根据权利要求16所述的重组细胞,其中,所述重组细胞选自由以下组成的组:酿酒酵母、布拉氏酵母、贝酵母、奇异酵母、米卡酵母、卡氏酵母、白念珠菌、光滑念珠菌、热带念珠菌、乳酸克鲁维酵母、马克斯克鲁维酵母、多孢克鲁维酵母、耐热克鲁维酵母、多形汉逊酵母、解脂耶氏酵母、汉逊德巴利酵母和棉阿舒囊霉,并且优选酿酒酵母。
18.一种生产具有所想要分子量的软骨素的方法,其包括:
(a)在培养基中培养如权利要求1至17中任一项所定义的重组细胞持续足以生产具有所想要分子量的软骨素的时间;和
(b)任选地从所述重组细胞和/或从所述培养基分离或回收所述软骨素。
19.根据权利要求18所述的方法,其中,所述软骨素的分子量为约20kDa至约50kDa。
20.根据权利要求18所述的方法,其中,所述软骨素的分子量为约50kDa至约150kDa。
21.根据权利要求18所述的方法,其中,所述软骨素的分子量为约150kDa至约1500kDa。
22.根据权利要求18至21中任一项所述的方法,其中,所述重组细胞是属于酵母属的酵母,并且特别是酿酒酵母。
23.根据权利要求18至22中任一项所述的方法,其中,所述足以生产具有所想要分子量的软骨素的时间是约35小时至约50小时、优选约40小时至约50小时、优选约48小时的时间段。
24.根据权利要求18至23中任一项所述的方法,其中,所生产的软骨素的分子量由步骤(a)期间调节所述培养基的pH来控制。
25.根据权利要求18至24中任一项所述的方法,其中,所述方法以工业规模进行,优选地其中所述培养基是至少约100L,更优选地在约1,000L至约3,000L的范围内,甚至更优选约10,000L或甚至更优选约100,000L,或甚至约250,000L。
26.一种软骨素,其是从根据权利要求1至17中任一项所述的重组细胞可获得的或从根据权利要求18至25中任一项所述的方法可获得的。
27.一种培养基,其包含根据权利要求26所述的软骨素。
28.一种组合物,其包含根据权利要求26所述的软骨素。
29.一种工业产品或消费产品或消费品,其包含(i)具有如权利要求5至7中任一项所定义的分子量的软骨素,(ii)如权利要求27所述的培养基或(iii)如权利要求28所述的组合物。
30.根据权利要求29所述的工业产品或消费产品或消费品,其中,所述工业产品或消费产品或消费品是美容品、调味品、香料产品、食品、食物、饮料、食品定形剂、药物组合物、膳食补充剂、营养制品、清洁产品、牙科和/或口腔卫生组合物。
31.根据权利要求2至17中任一项所定义的重组细胞用于生产具有约20kDa至约50kDa或约50kDa至约1000kDa范围内的分子量的软骨素的用途。
32.一种用于生产软骨素的方法,其包括以下步骤:
(a)在培养基中培养如权利要求1至17中任一项所定义的重组酵母;和
(b)从所述培养基回收软骨素,
其中,步骤(b)中回收的软骨素具有通过选择以下而控制的分子量:
-所述重组酵母的编码具有软骨素酶活性的多肽的重组核酸的性质和来源,
-控制所述重组酵母的编码具有软骨素酶活性的多肽的重组核酸的表达的启动子的性质和来源,
-所述重组酵母的与具有软骨素酶活性的多肽相关的锚定信号和/或分泌信号的存在,
-培养所述重组酵母的步骤期间的所述培养基的pH,和/或
-培养所述重组酵母的持续时间。
CN202280039395.9A 2021-04-01 2022-03-31 生产软骨素的重组细胞 Pending CN117460824A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP21166740.7 2021-04-01
EP21166740.7A EP4067487A1 (en) 2021-04-01 2021-04-01 Chondroitin-producing recombinant cell
PCT/EP2022/058583 WO2022207797A1 (en) 2021-04-01 2022-03-31 Chondroitin-producing recombinant cell

Publications (1)

Publication Number Publication Date
CN117460824A true CN117460824A (zh) 2024-01-26

Family

ID=75362519

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280039395.9A Pending CN117460824A (zh) 2021-04-01 2022-03-31 生产软骨素的重组细胞

Country Status (6)

Country Link
EP (2) EP4067487A1 (zh)
JP (1) JP2024511877A (zh)
KR (1) KR20240007135A (zh)
CN (1) CN117460824A (zh)
BR (1) BR112023019848A2 (zh)
WO (1) WO2022207797A1 (zh)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030104601A1 (en) * 1999-04-01 2003-06-05 Deangelis Paul L. Chondroitin synthase gene and methods of making and using same
WO2007069693A1 (ja) 2005-12-15 2007-06-21 Seikagaku Corporation 長鎖コンドロイチン糖鎖及びその製造方法並びにコンドロイチン合成の促進方法
EP2142643B1 (en) 2007-04-24 2017-11-01 Seikagaku Corporation Chondroitin-producing bacterium and method of producing chondroitin
US8697398B2 (en) 2010-03-01 2014-04-15 Dsm Ip Assets B.V. Compositions and methods for bacterial production of chondroitin

Also Published As

Publication number Publication date
BR112023019848A2 (pt) 2024-01-16
KR20240007135A (ko) 2024-01-16
EP4067487A1 (en) 2022-10-05
JP2024511877A (ja) 2024-03-15
WO2022207797A1 (en) 2022-10-06
EP4314270A1 (en) 2024-02-07

Similar Documents

Publication Publication Date Title
JP2024026179A (ja) バイオレチノールを生産する微生物及びそれを用いたバイオレチノールの生産方法
JP2024508555A (ja) ヒアルロン酸加水分解酵素を効率的に発現する遺伝子及びその発現方法
DE112011105535T5 (de) Verfahren zum Herstellen eines Alkans und rekombinanter Mikroorganismus, der in der Lage ist, das Alkan zu synthetisieren
CN117460821A (zh) 生产透明质酸的重组细胞
CN110892073B (zh) 增强型代谢物生产酵母
WO2021201282A1 (en) Method for producing sulfated polysaccharide and method for producing paps
CN109593744B (zh) 一种琼胶酶及其制备方法
CN108779444A (zh) 生产脂肪酸的方法
CN117460824A (zh) 生产软骨素的重组细胞
CN106701800B (zh) 一种出芽短梗霉聚酮合成酶基因及其应用
KR20240007906A (ko) 히알루론산-생산 재조합 세포
EP4067499A1 (en) Hyaluronic acid-producing recombinant cells
CN117460835A (zh) 生产肝素前体的重组细胞
KR102306725B1 (ko) 아세토인 생산능을 갖는 유전적으로 조작된 효모 및 이를 이용한 아세토인 생산방법
KR102605543B1 (ko) 메티오닌-생산 효모
KR20160093492A (ko) 2,3-부탄다이올 생산능을 갖는 유전적으로 조작된 효모 세포 및 그를 사용하여 2,3-부탄다이올을 생산하는 방법
KR102016050B1 (ko) 신규한 프로모터 및 이의 용도
KR102332395B1 (ko) 야로위아 속 변이체 및 이를 이용한 지방의 제조 방법
KR20100015868A (ko) 소포체 국재화 시그널 부착 스핑고지질 δ4-디새튜라아제를 사용한 형질 전환 세포에 있어서의 세라마이드 제조 방법
CN110106222B (zh) 一种糖基转移酶在合成甘草酸中的应用
EP4263845A1 (en) Biosynthesis of vanillin from isoeugenol
CN110914434A (zh) 苏氨酸生产酵母

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination