CN101709285A - 透明质素合成酶基因及其表达 - Google Patents

透明质素合成酶基因及其表达 Download PDF

Info

Publication number
CN101709285A
CN101709285A CN200910006838A CN200910006838A CN101709285A CN 101709285 A CN101709285 A CN 101709285A CN 200910006838 A CN200910006838 A CN 200910006838A CN 200910006838 A CN200910006838 A CN 200910006838A CN 101709285 A CN101709285 A CN 101709285A
Authority
CN
China
Prior art keywords
udp
host cell
nucleic acid
coding region
project
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200910006838A
Other languages
English (en)
Other versions
CN101709285B (zh
Inventor
P·L·德安格里斯
P·H·威格尔
K·库马里
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Oklahoma
Original Assignee
University of Oklahoma
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Oklahoma filed Critical University of Oklahoma
Publication of CN101709285A publication Critical patent/CN101709285A/zh
Application granted granted Critical
Publication of CN101709285B publication Critical patent/CN101709285B/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明涉及含有重组载体的重组芽孢杆菌属(Bacillus)宿主细胞,该重组载体包括具有编码酶活性的透明质素合成酶(HAS)的编码区区段的核酸区段。该重组芽孢杆菌属宿主细胞用于生产透明质酸(HA)的方法中。

Description

透明质素合成酶基因及其表达
本申请为专利申请号02813370.6,申请日为2002年6月13日,发明名称为“透明质素合成酶基因及其表达”的专利申请的分案申请。
对相关申请的交叉引用
本发明是美国专利申请No.09/469,200(于1999年12月21日提交,题目为“透明质酸合成酶基因及其用途”)的美国部分继续申请,后者是美国专利申请No.09/178,851(于1998年10月26日提交,题目为“透明质酸合成酶基因及其用途”)的美国继续申请,美国专利申请No.09/178,851根据35U.S.C.§119(e)要求美国专利申请No.60/064,435(于1997年10月31日提交,题目为“C组透明质素合成酶基因及其用途”)的利益。
本发明根据35U.S.C.§119(e)要求以下申请的公约优先权以及利益:(1)美国专利申请No.60/297,788(于2001年6月13日提交,题目为“透明质素合成酶基因及其在枯草芽孢杆菌(BACILLUS SUBTILIS)中表达的方法”);和(2)美国专利申请No.60/297,744(于2001年6月13日提交,题目为“透明质素合成酶基因及其表达方法”)。美国专利申请No s.09/469,200、09/178,851、60/064,435、60/297,788和60/297,744的内容在此处清楚引入作为参考。
关于联邦赞助的研究或开发的声明
美国政府依照来自美国国家健康研究所(National Institute ofHealth)的资助号码GM35978而在本发明中拥有某些权利。
发明背景
1.发明领域
本发明涉及具有编码酶活性透明质酸合成酶(HAS)的编码区的核酸区段,并涉及该核酸区段在制备重组细胞中的应用,该重组细胞生产透明质酸合成酶及其透明质酸产物。透明质酸(hyalutonate)也已知为透明质酸(hyaluronicacid)或透明质素。
2.相关技术简述
链球菌感染的发生是全球主要的健康和经济问题,特别是在发展中国家。原因之一是由于链球菌(Streptococcal)细菌具有不被身体的吞噬细胞即巨噬细胞和多形核细胞(PMNs)探测而生长的能力。这些细胞负责识别及吞入外源微生物。细菌逃避监视的一个有效途径是通过将自身用多糖被膜进行包被,如透明质酸(HA)被膜。HA的结构在原核生物和真核生物中是相同的。
由于HA通常是非免疫原性的,所以被囊化的细菌不引起免疫反应,因此不被破坏。此外,该被膜在体外具有抗PMNs吞噬的作用,且防止链球菌属与巨噬细胞的附着。正由于此,在A组和C组链球菌属中,HA被膜在天然和实验室感染中是主要的病毒因子。A组链球菌属负责多种人类疾病,包括咽炎、脓疱病、组织深部感染、风湿热和中毒性休克样综合症。C组类马链球菌(Streptococcusequisimilis)负责骨髓炎、咽炎、脑脓肿和肺炎。
就结构而言,HA是高分子量的重复二糖单元的线性多糖,该二糖单元由N-乙酰葡糖胺(GlcNAc)和葡糖醛酸(GlcUA)。HA分子重复二糖的数目可超过30,000,Mr>107。HA是唯一由哺乳动物和细菌细胞两者都能合成的糖胺聚糖,该细菌细胞特别为A和C组链球菌和A型多杀巴斯德氏杆菌(Pasteurella multocida)。这些菌株生产分泌到培养基中的HA以及HA被膜。这些细菌合成HA的机制具有广泛的医学重要性,这是因为HA被膜的生产是链球菌用于逃避免疫系统监视的非常有效和聪明的途径。此外,用HA包被的有机或无机分子具有使得其能够逃脱宿主免疫系统探测和破坏的性质。
HA是由哺乳动物和细菌细胞用透明质酸合成酶进行合成的,该酶定位于质膜上。人们相信HA在这些生物中的合成是多步骤的过程。起始步骤包括起始前体(UDP-GlcNAc或UDP-GlcUA)的结合。随后进行延伸,包括向生长的寡糖链交替添加两种糖。生长的多聚体从细胞的质膜区域伸出并伸到细胞外空间。尽管HA生物合成系统是最初研究的膜杂多糖合成途径之一,但HA合成的机制仍然没有充分理解。这可能是因为至今发展的体外系统是不足够的,因为在该系统中未实现HA的从头生物合成。
HA多聚体生长的方向在那些本领域中的技术人员中仍然是有分歧的问题。单糖的添加可在生长的HA链的还原或非还原末端。此外,仍存在关于下面部分的问题,即(i)新生的链是否共价连接到蛋白质、UDP或脂质中间物上,(ii)链是否是用引物起始的,和(iii)成熟的多聚体从链球菌的质膜伸出的机制。理解HA生物合成的机制可使得能够开发通过干扰该过程而控制链球菌和巴斯德氏菌属(Pasteurella)感染的可选择的策略。
HA事实上已在脊椎动物中的每一种组织中得到了鉴定,且已在多种临床应用中获得了广泛的应用,最引人注目的和适当的是作为关节内基质补加物和在眼外科中。科学文献也显示从最初认为HA主要是少数结缔组织的基质和某些细菌菌株的被膜中的被动结构成分的理解转变为对于该遍在大分子动态地参与许多生物学过程的认识:例如在胚胎发生过程中调节细胞迁移和分化、细胞外基质组织和代谢的调节、在转移、伤口愈合和炎症的复杂过程中的重要作用等。进一步地,渐渐清楚的是HA是高度代谢活性的,且细胞非常关注其合成和分解代谢的过程。例如,组织中HA的半衰期在软骨中为1~3周,在表皮中为<1天。HA也用于许多技术应用(如润滑化合物)、化妆品和神经药物(neutraceutical)中。
现在明白单独一个蛋白质利用两种糖底物合成HA,即HA合成酶是具有双重催化性质的单一的酶。HA合成酶的缩写HAS已得到广泛支持以指代该类酶。Markovitz等人成功地表征了来自酿脓链球菌(Streptococcus pyogenes)的HAS活性,并发现了酶的膜定位及其对糖核苷酸前体和Mg2+的需要。Prehm发现由B6细胞制备的延伸的HA被添加到培养基中的透明质酸酶消化,并提出HAS存在于质膜上。Philipson和Schwartz也显示小鼠少突胶质细胞瘤细胞中HAS活性与质膜标记共分馏(cofractionated)。
在糖胺聚糖合成进行时,HAS装配了高Mr的HA,该HA同时从膜伸出到细胞外空间(或者在细菌的情况下,制备细胞被膜)。该生物合成模式在大分子中是独特的,因为核酸、蛋白质和脂质是在细胞核、内质网/高尔基体、胞质或线粒体中合成的。生长的链向细胞外空间的伸出也使得能够进行不受拘束的多聚体的生长,因此得到了异常大的HA,而合成局限于高尔基体或高尔基体后区室(post-GolgiCompartment)中限制了形成的多聚体的总量或长度。被限制的腔中高浓度的HA也可形成高粘度的环境,该环境对于其他细胞器的功能可为有害的。
已有几个研究试图从形成被膜覆盖物的链球菌菌株以及从真核细胞中溶解、鉴定及纯化HAS。尽管对链球菌和鼠少突胶质细胞瘤的酶成功地用去污剂进行了溶解并进行了研究,但纯化活性HAS以进一步研究或进行分子克隆的努力在数十年中仍然是不成功的。Prehm和Mausolf用高碘酸盐氧化的UDP-GlcUA或UDP-GlcNAc以对链球菌膜中与HAS共纯化的~52kDa的蛋白质进行亲和标记。这导致了一个报道宣称已克隆了C组链球菌HAS,不幸的是该报道是错误的。该研究未能证明活性合成酶的表达,且可能事实上克隆了一个肽转运蛋白。Triscott和van de Rijn用毛地黄皂苷使来自链球菌膜的HAS以活性形式溶解。Van de Rijn和Drake用5-叠氮-UDP-GlcUA对42、33和27kDa的3种链球菌膜蛋白质进行了放射性标记,并认为33-kDa的蛋白质是HAS。然而如在后文所示的,HAS事实上为42-kDa的蛋白质。
尽管有这些努力,但在理解HA合成的调节和机制中的进展基本上是停滞的,这是因为没有HAS mRNA或HAS蛋白质的分子探针。1993年当DeAngelis等人报道编码蛋白质HasA的A组链球菌基因的分子克隆或特征时,这种情况发生了重大的突破。该基因已知为细菌HA合成所需的操纵子的一部分,尽管现在称为spHAS(酿脓链球菌的HAS)的该蛋白质的功能是未知的。随后证明spHAS负责HA的延伸且是第一个鉴定、克隆及成功表达的糖胺聚糖合成酶。酿脓链球菌的HA合成操纵子编码2个其他的蛋白质。HasB是UDP-葡萄糖脱氢酶,该酶是UDP-葡萄糖转变为HA合成的底物之一UDP-GlcUA所必需的。HasC是UDP-葡萄糖焦磷酸化酶,该酶是葡萄糖1-磷酸与UTP转变为UDP-葡萄糖所必需的。hasA和hasB基因向无被膜的链球菌菌株或粪肠球菌(Enteroccus faecalis)中的共转染授予它们合成HA和形成被膜的能力。这提供了关于spHAS(hasA)是HA合成酶的第一个有力的证据。
难捉摸的HA合成酶基因最终通过转座子诱变方法进行了克隆,其中形成了无被膜的突变型A组菌株,该菌株含有HA合成操纵子的转座子中断。转座子的已知序列使得能够鉴定与链球菌DNA连接的区域,然后从野生型细胞中克隆。编码的spHAS与酵母几丁质合成酶家族具有5-10%的一致性,与非洲爪蟾(Xenopus laevis)蛋白质DG42(在原肠胚形成过程中发育性表达的)具有30%的一致性,DG42的功能当时是未知的。DeAngelis和Weigel在大肠杆菌(Escherichiacoli)中表达了活性的重组spHAS,并显示该单一的纯化基因产物当在体外与UDP-GlcUA和UDP-GlcNAc进行温育时合成高Mr的HA,从而显示HA合成所必需的两种糖基转移酶活性是由相同的蛋白质催化的,如首先于1959年提出的。利用下面的知识:(i)spHAS是双重作用的单一酶和(ii)spHAS、几丁质合成酶和DG42之间的序列同源区,1996年4个实验室同时对真核HAS cDNA的鉴定进一步巩固了发明者的蛋白质假说,即HAS是编码不同同工酶的多基因家族。在哺乳动物中很快发现了2个基因(HAS1和HAS2),后来发现了第3个基因HAS3。在1999年12月21日提交的美国Serial No.09/469,200中对第2个链球菌seHAS或类马链球菌透明质酸合成酶进行了鉴定和详细的公开,其内容在此处特别地整体引入作为参考。seHAS蛋白质与spHAS酶具有高水平的一致性(约70%)。然而,该一致性是令人感兴趣的,这是因为seHAS基因与spHAS基因不相互杂交。
当提供两种底物时,从表达重组seHAS的大肠杆菌中制备的膜合成HA。该结果证实Lansing等人声称已克隆了C组HAS的较早的报道是错误的。不幸的是,几个研究已应用对该未进行表征的52-kDa链球菌蛋白质的抗体以研究什么是真核HAS。
Itano和Kimata用不能合成HA的突变小鼠乳腺癌细胞系中的表达克隆来克隆第一个推定的哺乳动物HAS cDNA(mmHAS1)。HA合成有缺陷的亚克隆分成3个单独的类别,这些类别在体细胞融合实验中对于HA合成是互补的,这提示至少3个蛋白质是必需的。这些类别的2个维持了一些HA合成活性,而1个不显示活性。将后一个细胞系用从亲代细胞中制备的cDNA来进行瞬时转染实验以鉴定恢复HA合成活性的单一蛋白质。序列分析揭示~65kDa蛋白质的推定的一级结构,该蛋白质具有与spHAS相似的膜拓扑学。mmHAS1与spHAS具有30%的一致性,与DG42具有55%的一致性。在该报道出现的同月,3个其他的研究组提交了论文,该论文描述编码最初认为是相同的小鼠和人的酶的cDNA。然而,通过特别的环境,4个实验室的每一个在两个物种中都发现了单独的HAS同工酶。
利用与Itano和Kimata的相似的功能克隆方法,Shyjan等人鉴定了HAS1的人同系物。将肠系膜淋巴结cDNA文库用于转染鼠粘膜T淋巴细胞,然后筛选其在花结测定中粘着的能力。一个转染子的粘着被公知的细胞表面HA-结合蛋白质即CD44的抗血清抑制,并被用透明质酸酶的预处理直接取消。因而,由该转染子的花结(rosetting)需要HA的合成。对负责的cDNA的克隆和测序鉴定了hsHAS1。Itano和Kimata也报道从胎儿脑文库中分离的人HAS1 cDNA。然而,由2个组报道的hsHAS1 cDNA在长度上有差异;它们编码578或543个氨基酸的蛋白质。仅在较长的形式中证明了HAS活性。
基于spHAS作为可信的HA合成酶和DG42、spHAS和NodC(根瘤菌属(Rhizobium)中的β-GlcNAc转移酶结瘤因子)中几乎一致的区域的分子鉴定,Spicer等人用兼并RT-PCR方法克隆编码称为mmHAS2的第二个不同的酶的小鼠胚胎cDNA。颗粒排除测定探测到mmHAS2cDNA向COS细胞中的转染指导HA细胞被膜的从头生产,因而提供了HAS2蛋白质可合成HA的有力证据。利用相似的方法,Watanabe和Yamaguchi筛选了人胎儿脑cDNA文库以鉴定hsHAS2。Fulop等人独立地用相似的策略鉴定RNA中的mmHAS2,该RNA从活跃地合成HA的卵丘细胞分离,其中HA合成是排卵前滤泡中正常卵丘延伸的关键过程。紧接在起始排卵周期之后、在HA合成开始之前和在当HA合成刚刚开始(3h)或已经明显(4h)时的较晚时间从小鼠中分离了卵丘细胞-卵母细胞复合物。RT-PCR显示HAS2mRNA最初不存在,但3-4h之后高水平的表达,提示HAS2的转录调节该过程中的HA合成。两种hsHAS2长度均为552个氨基酸,并为98%一致的。mmHAS1是583个氨基酸长的,且与578个氨基酸长的hsHAS1具有95%的一致性。
最近Spicer等人用PCR方法在哺乳动物中鉴定了第三个HAS基因。mmHAS3是554个氨基酸长的,且分别与mmHAS1、mmHAS2、DG42和spHAS具有71、56和28%的一致性。Spicer等人也将3个人和小鼠基因定位于3个不同的染色体上(HAS1定位于hsChr 19/mmChr17;HAS2定位于hs Chr 8/mmChr 15;HAS3定位于hsChr 16/mmChr 8)。3个HAS基因在不同染色体上的定位和遍及脊椎动物种类中的HA的出现提示该基因家族是古老的,且同工酶是在脊椎动物进化早期通过复制而出现的。细菌和真核HAS之间的高一致性(~30%)也提示它们两者之间具有共同的祖先基因。可能在真核基因变得更大更复杂之前,原始的细菌从早期脊椎动物祖先中夺取HAS基因。可选择地,细菌可能获得较大的脊椎动物HAS基因并删除了对于酶活性非关键的调节序列。
Dawid及其同事对非洲爪蟾DG42的发现在这些最近的发展中起重要的作用,即使不知道该蛋白质是HA合成酶。但是DG42和spHAS有30%的一致性对于设计寡核苷酸是关键的,该寡核苷酸使得能够鉴定哺乳动物HAS2。讽刺地是,DG2是真正的HA合成酶的确定证据仅在发现哺乳动物同工酶之后才报道,其时DeAngelis和Achyuthan在酵母(不能合成HA的生物)中表达了该重组蛋白质,并显示当给分离的膜提供两种底物时它们可合成HA。Meyer和Kreil也显示来自用DG42的cDNA转染的细胞的裂解产物合成增高水平的HA。既然其功能已知了,因此DG42可命名为XIHAS。
所有HAS蛋白质共享共同的预测的结构特征,该特征包括大的中央结构域和蛋白质氨基和羧基末端的2-3个跨膜或膜相关结构域的族。包含高达~88%的预测的细胞内HAS蛋白质序列的中央结构域可能含有酶的催化区。该预测的中央结构域在spHAS中为264个氨基酸长(总蛋白质的63%),在真核HAS成员中为307-328个氨基酸长(总蛋白质的54-56%)。膜结构域的准确的数目和方向和细胞外及细胞内环的拓扑组织对于任何HAS均未进行实验确定。
spHAS是已进行纯化和部分进行表征的HAS家族成员。用spHAS/碱性磷酸酶融合蛋白质的最初研究显示spHAS的N末端、C末端和大的中央结构域事实上位于细胞中。spHAS具有6个半胱氨酸(SEQID NO:44),而HAS1、HAS2和HAS3分别具有13、14和14个Cys残基。spHAS中6个Cys残基(SEQ ID NO:44)中的2个是保守的且在HAS1和HAS2中是相同的。发现只有一个保守Cys残基位于所有HAS家族成员的相同位置(spHAS中的Cys-225)。这可能是一个基本的Cys,由巯基毒物对它的修饰部分地抑制酶活性。对于HAS家族的任何成员尚未阐明二硫键的可能存在或对关键Cys残基的鉴定,该二硫键或Cys残基是下文提及的多重HAS功能的任何一种所需要的。
除所提出的在质膜合成的独特模式之外,HAS酶家族在HA的全部多聚化所必需的大量功能中是高度不寻常的。在HAS酶中存在至少6种分立的活性:2个不同的糖核苷酸前体(UDP-GlcNAc和UDP-GlcUA)的每一个的结合位点,2种不同的糖基转移酶活性,将生长的HA多聚体锚定到酶上一个或多个结合位点(可能涉及B-X7-B基元),以及以一次一个或两个糖的方式移动生长的多聚体的棘齿样转运机制。这后一种活性可能与多聚体通过膜的逐步前进相一致。所有这些功能以及可能尚未知道的其他功能存在于大小在419(spHAS)到588(xHAS)个氨基酸的相对小的蛋白质中。
尽管所有可用的证据支持仅有spHAS蛋白质是细菌或体外HA生物合成所必需的结论,可能的是较大的真核HAS家族成员是多成分复合物的部分。由于真核HAS蛋白质比spHAS大~40%,它们额外的蛋白质结构域可参与更精巧的功能,如细胞内运输和定位、酶活性调节及介导与其他细胞成分的相互作用。
关于存在多个编码不同合成酶的脊椎动物HAS基因的意外发现有力地支持正形成的一致意见,即HA是细胞行为的重要调节剂,而不简单地是组织中的结构成分。因而,在少于6个月中,该领域从一个已知的克隆的HAS(spHAS)发展为多基因家族,这保证我们对HA合成和生物学的理解的快速、大量和激动人心的未来进展。
例如,在下文中公开的是来自多杀巴斯德氏杆菌、缘草履虫小球藻病毒(Paramecium bursaria Chlorella virus)(PBCV-1)、酿脓链球菌、乳房链球菌(Streptococcus uberis)、硫磺矿硫化叶菌(Sulfolobus soifataricus)、炭疽芽孢杆菌(Bacillus anthracis)质粒pXO1和Ectocarpus siliculosus病毒的HAS基因的序列。这些系统中透明质素合成酶的存在和来自这些不同的系统的透明质素合成酶的纯化和应用显示了在许多不同的真核和病毒来源(总的来说,是从微生物来源)中纯化和分离编码酶活性透明质素合成酶的核酸序列的能力。
C组类马链球菌菌株D181合成并分泌透明质酸(HA)。研究人员用该菌株和A组酿脓链球菌菌株如S43和A111研究HA的生物合成,并在其二价阳离子需求、前体(UDP-GlcNAc和UDP-GlcUA)利用和最适pH方面对HA-合成活性进行了表征。
传统上,HA已通过从公鸡鸡冠或来自链球菌培养物的细胞外培养基中分离而商业地制备。为制备HA已发展的一种方法是通过应用生产HA的链球菌细菌的培养物。在此处整体引用作为参考的美国专利No.4,517,295描述了这样一种程序,其中生产HA的链球菌是在富含CO2的生长培养基中于厌氧条件下进行发酵的。在这些条件下,HA得到生产并可从液体培养基中提取。通常感觉HA从公鸡鸡冠中的分离是费力且困难的,这是因为人们从较不纯状态的HA开始分离。从公鸡鸡冠分离的优点是生产的HA具有较高的分子量。然而,通过细菌发酵制备HA是较容易的,因为这是以较高的纯度开始的。然而,通常以这种方式生产的HA的分子量比从公鸡鸡冠得到的小。此外,通过链球菌发酵制备的HA时常引起与从公鸡鸡冠中获得的HA一样的免疫反应。因此,使得能够通过细菌发酵生产高分子量的HA的技术对于现有的程序是明显的改进。
如在前文所述的,高分子量的HA具有多种有用的应用-从美容到眼外科。由于其高粘度及其高生物相容性的潜力,HA在眼外科中作为玻璃体液的替代物具有特别的应用。由于其高粘度及其在长的时间段中保持湿润的能力,HA也已用于通过HA的关节内注射治疗赛马的创伤性关节炎、用于作为润滑剂的剃须膏及用于多种化妆品产品。事实上,1997年8月,美国食品和药品局(Food and Drug Agency)批准在几种关节炎的治疗中使用高分子量的HA,该治疗是通过将这种高分子量的HA直接注射入患病的关节中。通常,所用的HA的分子量越高越好。这是因为HA溶液的粘度随溶液中单独的HA多聚体分子的平均分子量而增加。不幸的是,非常高分子量的HA如高达107的已难以通过现有可用的分离程序获得。然而,此处所公开的重组生产方法使得能够生产具有分子量高达107或更大的HA。
为了解决这些或其他的困难,需要可用于生产HA的新方法和构建体,该HA具有一种或多种改进的性质,如更大的纯度或制备的容易性。特别地,需要用于生产比现有商业可达到的更大量的具有相对高分子量和相对纯的HA。仍然有另一种需要以能够发展生产具有修饰的大小分布的HA(HAΔsize)以及具有修饰的结构的HA(HAΔmod)的方法。
工业的酶生产是每年15亿美元的商业,且这些产品的百分之七十是从芽孢杆菌物种生产的。使用芽孢杆菌物种中有效的表达系统的优点是芽孢杆菌是蛋白质的有效分泌者,因此在基因工程加工的蛋白质的生产过程中芽孢杆菌对大肠杆菌或酵母的替代获得了所述的蛋白质增加的分泌。芽孢杆菌物种也是“通常认为是安全的(Generally Recognized As Safe)”或“GRAS”微生物,这与其他商业上使用的细菌菌株如大肠杆菌相反。芽孢杆菌已长期用于食品和饮料工业,以及用于抗生素的生产中。芽孢杆菌的一个优点是它不含有热源物质或不生产毒素。在发酵中使用芽孢杆菌有大量的工业实践,如在去污剂蛋白酶和α-淀粉酶的生产中。
本发明解决了本领域中的一个或多个缺点。利用重组DNA技术,在芽孢杆菌细胞中生产酶活性HAS的方法已与生产HAS及其透明质酸产物的重组芽孢杆菌细胞的制备方法一起被公开并申请专利保护了,其中在所述细胞中已引入了具有编码酶活性HAS的编码区的纯化的核酸片段。
发明概述
本发明涉及应用重组DNA技术以在透明质酸(HA)制备领域中解决一种或多种问题。这些问题是通过分离和应用具有编码酶活性透明质酸合成酶(HAS)基因的编码区的核酸区段而解决的,所述基因为负责HA链生物合成的基因,如来自A或C组链球菌、多杀巴斯德氏杆菌、硫磺矿硫化叶菌和Ectocarpus siliculosus病毒的HAS基因。在此处公开的HAS基因是从适当的微生物来源的DNA克隆的,并通过基因工程插入到有用的重组构建体中,该构建体被引入到芽孢杆菌细胞中以制备HA及制备大量的HAS酶本身。
术语“透明质酸合成酶”、“透明质素合成酶”和“HA合成酶”是可互换使用的以描述使糖胺聚糖多糖链多聚化的酶,该多糖链由β1,3和β1,4连接的交替的葡糖醛酸和N-乙酰葡糖胺糖组成。例如术语“seHAS”描述源自类马链球菌的HAS酶,其中编码seHAS酶的基因的表达通过提供逃避内吞作用和免疫监视的方式而与链球菌的A组和C组菌株的毒性相关。
本发明涉及透明质酸合成酶基因、cDNA和基因产物(HAS)的分离和表征,其可用于使葡糖醛酸和N-乙酰葡糖胺多聚化以形成糖胺聚糖透明质酸。本发明鉴定了HAS座位,并公开了编码来自类马链球菌、酿脓链球菌、乳房链球菌、多杀巴斯德氏杆菌、硫磺矿硫化叶菌、炭疽芽孢杆菌pXO1和Ectocarpus siliculosus病毒的酶活性HAS基因的核酸序列。HAS基因也提供了新探针以估计细菌样品生产透明质酸的潜力。
通过应用在此处提出的技术和知识,本领域的技术人员将能够获得编码HAS基因的额外的核酸区段。如那些本领域的技术人员可认识的,根据本公开内容,这些优点提供了显著的效用以能够控制HAS基因的表达和控制所产生的HAS基因产物即HAS酶的特性。
因此,本发明针对纯化的核酸区段的分离,该核酸区段具有编码酶活性HAS的编码区,不论它是原核还是真核来源的。这是可能的,因为该酶(事实上是基因)是在真核生物和一些原核生物两者中发现的。也已知真核生物可生产HA并因而具有HA合成酶基因,该基因可连同本发明一起使用。
本发明编码HA合成酶的核酸区段定义为分离的不含总染色体或基因组DNA的,从而它们可易于通过重组DNA技术进行操作。因此,如在此处所用的,短语“纯化的核酸区段”指分离的不含无关染色体或基因组DNA的DNA区段,并且该区段保持使得其能够用于重组技术实践的状态,如分立的分离DNA片段形式的DNA,或者插入了这种片段的载体(如质粒、噬菌体或病毒)。
本发明包含重组宿主细胞,其中重组宿主细胞是包含重组载体的芽孢杆菌细胞,该载体包含具有编码酶活性透明质素合成酶SEQ ID NO:2、10、12、14、16、18或20的编码区的纯化的核酸区段。纯化的核酸区段可以含有SEQ ID NO:1、9、11、13、15、17或19的核苷酸序列。重组载体可通过转化、转染、转导和电穿孔中的至少一种而引入芽孢杆菌细胞中。
在上文中描述的编码区可处于启动子的控制之下,如革兰氏阳性相容性启动子或芽孢杆菌相容性启动子。重组宿主细胞也可包括至少一种修饰的RNA聚合酶启动子,其中当修饰的RNA聚合酶启动子被RNA聚合酶识别时,RNA聚合酶能够以比内源RNA聚合酶启动子高的量表达RNA。这种修饰可为突变或串联的启动子元件的存在,该元件可为相同的或不同的启动子元件。此外,重组宿主细胞可进一步包括至少一种在天然芽孢杆菌细胞中没有发现的额外的mRNA稳定或去稳定元件。
芽孢杆菌细胞可具有至少UDP-GlcUA和UDP-GlcNAc之一的增强的生产。可选择地,重组宿主细胞可进一步具有至少一种纯化的核酸区段,该核酸区段具有编码UDP-糖前体途径酶中有功能活性的酶的编码区,该酶如选自UDP-葡萄糖脱氢酶、UDP-葡萄糖焦磷酸化酶及其组合的酶活性UDP-GlcUA生物合成途径的酶。这种纯化的核酸区段可在上述重组载体中提供或在不同的重组载体中提供。当在相同的载体上提供时,2个编码区可处于至少一个启动子的至少一个拷贝的控制下或在不同启动子的控制下。至少一个编码UDP-糖前体生物合成途径的酶的核酸区段的存在将向重组宿主细胞提供比天然宿主细胞更高的活性,其中该天然宿主细胞也表达内源UDP-糖前体生物合成途径的酶。
在进一步的选择中,重组宿主细胞可包括至少一种突变的UDP-糖前体生物合成基因,其中突变增加了从中转录的mRNA的半衰期、编码具有增加的转录效率的mRNA或发生于UDP-糖前体生物合成基因中的核糖体结合位点中,从而核糖体对该核糖体结合位点具有增加的结合亲和力。
本发明进一步包含生产透明质酸的方法,该方法包含通过引入在上文中描述的纯化的核酸区段而构建在上文中描述的重组宿主细胞,并使该重组宿主细胞在培养基上生长以分泌透明质酸。芽孢杆菌宿主可于约25℃到约42℃的温度范围生长于化学确定成分培养基、复合培养基或含有葡萄糖和至少N-乙酰葡糖胺和葡糖胺之一的培养基中。然后回收分泌的透明质酸,且回收的透明质酸可进一步从培养基中提取并然后纯化。例如,透明质酸可通过至少过滤、离心和絮凝作用之一而从细胞和残渣中分离,随后浓缩透明质酸,然后通过至少一种选自沉淀、超滤和透析的方法从培养基中分离浓缩的透明质酸。该分离可进一步包括三氯乙酸的添加,这促进细胞和残渣与透明质酸的分离。沉淀剂可为乙醇、有机溶剂或化合物和脂族的带正电的盐中的至少一种,且可选自乙醇、异丙醇、丙酮、鲸蜡基溴化三铵或鲸蜡基氯化吡啶鎓。
本发明进一步包含通过在上文中描述的方法制备的透明质酸。具体地,本发明涉及:
1.一种重组宿主细胞,其中该重组宿主细胞是包含重组载体的芽孢杆菌细胞,所述重组载体包含具有编码SEQ ID NO:14所示酶活性透明质素合成酶的编码区的纯化核酸区段,其中编码区在启动子的控制之下。
2.项目1的重组宿主细胞,其中重组宿主细胞是枯草芽孢杆菌或地衣芽孢杆菌细胞。
3.项目1的重组宿主细胞,其中纯化的核酸区段包含根据SEQID NO:13的核苷酸序列。
4.项目3的重组宿主细胞,其中宿主细胞生产透明质酸。
5.项目1的重组宿主细胞,其中纯化核酸区段的编码酶活性透明质素合成酶的编码区处于革兰氏阳性细菌相容性启动子的控制之下。
6.项目5的重组宿主细胞,其中启动子是芽孢杆菌相容性启动子。
7.项目1的重组宿主细胞,其中枯草芽孢杆菌进一步包含重组载体,该重组载体包含具有编码酶活性UDP-GlcUA生物合成途径的酶的编码区的纯化核酸区段,其中酶活性UDP-GlcUA生物合成途径的酶选自UDP-葡萄糖脱氢酶、UDP-葡萄糖焦磷酸化酶及其组合。
8.项目1的重组宿主细胞,其中重组载体进一步包含具有编码酶活性UDP-葡萄糖脱氢酶的编码区的纯化核酸区段。
9.项目8的重组宿主细胞,其中编码酶活性HAS的编码区和编码酶活性UDP-葡萄糖脱氢酶的编码区是在至少一个启动子的至少一个拷贝的控制之下的。
10.项目8的重组宿主细胞,其中编码酶活性HAS的编码区和编码酶活性UDP-葡萄糖脱氢酶的编码区是在不同启动子的控制之下的。
11.一种生产透明质酸的方法,该方法包含以下步骤:
将具有编码SEQ ID NO:14所示酶活性透明质素合成酶的编码区的纯化核酸区段引入芽孢杆菌宿主中,其中编码区是在启动子的控制之下的;
使宿主在培养基上生长以分泌透明质酸;和
回收分泌的透明质酸。
12.项目11的方法,其中芽孢杆菌宿主是枯草芽孢杆菌或地衣芽孢杆菌。
13.根据项目11的方法,其中回收透明质酸的步骤包含从培养基中提取分泌的透明质酸。
14.根据项目13的方法,该方法进一步包含纯化提取的透明质酸的步骤。
15.项目11的方法,该方法进一步包含引入纯化的核酸区段的步骤,该核酸区段具有编码酶活性UDP-葡萄糖脱氢酶的编码区。
16.项目11的方法,其中编码酶活性透明质素合成酶的编码区和编码酶活性UDP-葡萄糖脱氢酶的编码区是在相同的启动子控制之下的。
17.项目11的方法,其中编码酶活性透明质素合成酶的编码区和编码酶活性UDP-葡萄糖脱氢酶的编码区是在不同的启动子控制之下的。
18.项目11的方法,其中在引入具有编码酶活性透明质素合成酶的编码区的纯化核酸区段的步骤中,该纯化核酸区段包含根据SEQ IDNO:13的核苷酸序列。
19.项目11的方法,其中在将具有编码酶活性透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该纯化核酸区段的编码酶活性透明质素合成酶的编码区是在革兰氏阳性细菌相容性启动子的控制之下的。
20.项目19的方法,其中启动子是芽孢杆菌相容性启动子。
21.一种生产透明质酸的方法,该方法包含以下步骤:
将具有编码SEQ ID NO:14所示酶活性透明质素合成酶的编码区的纯化核酸区段引入芽孢杆菌宿主中,其中编码区是在启动子的控制之下的;
将具有编码酶活性UDP-葡萄糖脱氢酶的编码区的纯化核酸区段引入芽孢杆菌宿主中;
使芽孢杆菌宿主在培养基上生长以分泌透明质酸;和
回收分泌的透明质酸。
22.项目21的方法,其中在引入具有编码酶活性透明质素合成酶的编码区的纯化核酸区段的步骤中,该纯化核酸区段包含根据SEQ IDNO:13的核苷酸序列。
23.项目21的方法,其中编码酶活性透明质素合成酶的编码区和编码酶活性UDP-葡萄糖脱氢酶的编码区是在相同启动子的控制之下的。
24.项目21的方法,其中编码酶活性透明质素合成酶的编码区和编码酶活性UDP-葡萄糖脱氢酶的编码区是在不同启动子的控制之下的。
25.项目21的方法,其中芽孢杆菌宿主是枯草芽孢杆菌或地衣芽孢杆菌。
26.根据项目21的方法,其中回收透明质酸的步骤包含从培养基中提取分泌的透明质酸。
27.根据项目26的方法,该方法进一步包含对提取的透明质酸进行纯化的步骤。
28.项目21的方法,其中在将具有编码酶活性透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该纯化核酸区段的编码酶活性透明质素合成酶的编码区是在革兰氏阳性细菌相容性启动子的控制之下的。
29.项目28的方法,其中启动子是芽孢杆菌相容性启动子。
30.一种重组宿主细胞,其中重组宿主细胞是芽孢杆菌细胞,其包含:
一种包含纯化的核酸区段的重组载体,该纯化的核酸区段具有编码SEQ ID NO:14所示酶活性酿脓链球菌透明质素合成酶的编码区;和
一种包含纯化的核酸区段的重组载体,该纯化的核酸区段具有编码酶活性UDP-葡萄糖脱氢酶的编码区。
31.项目30的重组宿主细胞,其中重组宿主细胞是枯草芽孢杆菌或地衣芽孢杆菌细胞。
32.项目30的重组宿主细胞,其中宿主细胞生产透明质酸。
33.项目30的重组宿主细胞,其中纯化的核酸区段的编码酶活性酿脓链球菌透明质素合成酶的编码区是在革兰氏阳性细菌相容性启动子的控制之下的。
34.项目33的重组宿主细胞,其中启动子是芽孢杆菌相容性启动子。
35.项目30的重组宿主细胞,其中纯化的核酸区段包含根据SEQID NO:13的核苷酸序列。
36.一种重组宿主细胞,其中重组宿主细胞是在其中引入了重组载体的芽孢杆菌细胞,该重组载体包含:
一种纯化的核酸区段,该纯化的核酸区段具有编码SEQ ID NO:14所示酶活性酿脓链球菌透明质素合成酶的编码区;和
一种编码酶活性UDP-葡萄糖脱氢酶的编码区。
37.项目36的重组宿主细胞,其中纯化的核酸区段包含根据SEQID NO:13的核苷酸序列。
38.项目36的重组宿主细胞,其中编码酶活性酿脓链球菌透明质素合成酶的编码区和编码酶活性UDP-葡萄糖脱氢酶的编码区是在相同启动子的控制之下的。
39.项目36的重组宿主细胞,其中编码酶活性酿脓链球菌透明质素合成酶的编码区和编码酶活性UDP-葡萄糖脱氢酶的编码区是在不同启动子的控制之下的。
40.项目36的重组宿主细胞,其中重组宿主细胞是枯草芽孢杆菌或地衣芽孢杆菌细胞。
41.项目36的重组宿主细胞,其中宿主细胞生产透明质酸。
42.项目36的重组宿主细胞,其中纯化的核酸区段的编码SEQ IDNO:14所示酶活性酿脓链球菌透明质素合成酶的编码区是在革兰氏阳性细菌相容性启动子的控制之下的。
43.项目42的重组宿主细胞,其中启动子是芽孢杆菌相容性启动子。
44.由包含下面步骤的方法制备的透明质酸:
将具有编码SEQ ID NO:14所示酶活性酿脓链球菌透明质素合成酶的编码区的纯化核酸区段引入芽孢杆菌宿主中,其中编码区是在启动子的控制之下的;
使芽孢杆菌宿主在培养基上生长以分泌透明质酸;和
回收分泌的透明质酸。
45.由项目44的方法制备的透明质酸,其中纯化的核酸区段包含根据SEQ ID NO:3的核苷酸序列。
46.由根据项目44的方法制备的透明质酸,其中芽孢杆菌宿主是枯草芽孢杆菌或地衣芽孢杆菌。
47.由根据项目44的方法制备的透明质酸,其中使芽孢杆菌宿主在培养基上生长以分泌透明质酸的步骤进一步限定为使芽孢杆菌宿主于约25℃~约42℃在化学确定成分的培养基上生长以分泌透明质酸。
48.由根据项目44的方法制备的透明质酸,其中使芽孢杆菌宿主在培养基上生长以分泌透明质酸的步骤进一步限定为使芽孢杆菌宿主于约25℃~约42℃在复合培养基上生长以分泌透明质酸。
49.由根据项目44的方法制备的透明质酸,其中使芽孢杆菌宿主在培养基上生长以分泌透明质酸的步骤进一步限定为使芽孢杆菌宿主在含有葡萄糖以及N-乙酰葡糖胺和葡糖胺两者中至少一种的培养基上生长以分泌透明质酸。
50.由根据项目44的方法制备的透明质酸,其中回收分泌的透明质酸的步骤进一步限定为:
--通过过滤、离心和絮凝作用中至少一种方法从细胞和残渣中分离透明质酸;
--浓缩分离的透明质酸;和
--通过至少一种选自沉淀、超滤和透析的方法从培养基中分离浓缩的透明质酸。
51.由根据项目50的方法制备的透明质酸,其中通过过滤、离心和絮凝作用中至少一种方法从细胞和残渣中分离透明质酸的步骤进一步包括添加三氯乙酸,这促进细胞和残渣与透明质酸的分离。
52.由根据项目50的方法制备的透明质酸,其中沉淀剂是醇、有机溶剂或化合物及脂族带正电荷的盐中的至少一种。
53.由根据项目52的方法制备的透明质酸,其中沉淀剂选自乙醇、异丙醇、丙酮、鲸蜡基溴化三铵或鲸蜡基氯化吡啶鎓。
54.由根据项目44的方法制备的透明质酸,该方法进一步包含对提取的透明质酸进行纯化的步骤。
55.由根据项目44的方法制备的透明质酸,其中该方法进一步包括引入纯化的核酸区段的步骤,其中该纯化的核酸区段具有编码酶活性UDP-葡萄糖脱氢酶的编码区。
56.由根据项目55的方法制备的透明质酸,其中编码酶活性透明质素合成酶的编码区和编码酶活性UDP-葡萄糖脱氢酶的编码区是在相同启动子的控制之下的。
57.由根据项目55的方法制备的透明质酸,其中编码酶活性透明质素合成酶的编码区和编码酶活性UDP-葡萄糖脱氢酶的编码区是在不同启动子的控制之下的。
58.由根据项目44的方法制备的透明质酸,其中在将具有编码SEQ ID NO:14所示酶活性酿脓链球菌透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该纯化核酸区段的编码SEQ ID NO:14所示酶活性酿脓链球菌透明质素合成酶的编码区是在来自革兰氏阳性细菌相容性启动子的启动子控制之下的。
59.由根据项目44的方法制备的透明质酸,其中在将具有编码SEQ ID NO:14所示酶活性酿脓链球菌透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该纯化核酸区段是通过转化、转染、转导和电穿孔的至少一种引入到芽孢杆菌宿主的。
60.一种重组宿主细胞,其中该重组宿主细胞是具有UDP-GlcUA和UDP-GlcNAc中至少一种的增强的生产的芽孢杆菌细胞,该重组宿主细胞进一步具有包含纯化的核酸区段的重组载体,该纯化的核酸区段具有编码SEQ ID NO:14所示酶活性酿脓链球菌透明质素合成酶的编码区。
61.项目60的重组宿主细胞,其中纯化的核酸区段包含根据SEQID NO:13的核苷酸序列。
62.项目60的重组宿主细胞,其中重组宿主细胞是枯草芽孢杆菌或地衣芽孢杆菌细胞。
63.项目60的重组宿主细胞,其中重组宿主细胞进一步包括至少一种修饰的RNA聚合酶启动子,其中当修饰的RNA聚合酶启动子由RNA聚合酶识别时,该RNA聚合酶能够以比内源RNA聚合酶启动子更大的量表达RNA。
64.项目63的重组宿主细胞,其中所述修饰是突变。
65.项目63的重组宿主细胞,其中所述修饰是串联启动子元件。
66.项目60的重组宿主细胞,其中重组宿主细胞是用包含纯化的核酸区段的重组载体进行转化的,该纯化的核酸载体具有编码UDP-糖前体生物合成途径中有功能活性的酶的编码区。
67.项目66的重组宿主细胞,其中UDP-糖前体生物合成途径中的酶是UDP-葡萄糖脱氢酶。
68.项目66的重组宿主细胞,其中UDP-糖前体生物合成途径中的酶是UDP-葡萄糖焦磷酸化酶。
69.项目60的重组宿主细胞,其中重组宿主细胞进一步包括比在天然芽孢杆菌细胞中发现的至少多一个的信使RNA稳定元件。
70.项目60的重组宿主细胞,其中重组宿主细胞进一步包括比在天然芽孢杆菌细胞中发现的至少少一个的信使RNA去稳定元件。
71.项目60的重组宿主细胞,其中重组宿主细胞进一步包括至少一种核酸区段,该核酸区段具有编码在UDP-糖前体生物合成途径中有功能活性的酶的编码区,从而该重组宿主细胞比表达内源UDP-糖前体生物合成途径的酶的天然宿主细胞具有更大的活性。
72.项目60的重组宿主细胞,其中重组宿主细胞进一步包括至少一种突变的UDP-糖前体生物合成基因,其中突变的UDP-糖前体基因增加转录的信使RNA的半衰期。
73.项目60的重组宿主细胞,其中重组宿主细胞进一步包括至少一种突变的UDP-糖前体生物合成基因,该基因编码具有增加的翻译效率的信使RNA。
74.项目60的重组宿主细胞,其中UDP-糖前体生物合成基因中的突变是在UDP-糖前体生物合成基因的核糖体结合位点上发生的,从而核糖体对核糖体结合位点具有增加的结合亲和力。
75.一种生产透明质酸的方法,该方法包含以下步骤:
将具有编码SEQ ID NO:14所示酶活性酿脓链球菌透明质素合成酶的编码区的纯化核酸区段引入芽孢杆菌宿主中,其中芽孢杆菌宿主具有UDP-GlcUA和UDP-GlcNAc中至少一种的增强的生产;
使芽孢杆菌宿主在培养基上生长以分泌透明质酸;和
回收分泌的透明质酸。
76.项目75的方法,其中在引入具有编码SEQ ID NO:14所示酶活性酿脓链球菌透明质素合成酶的编码区的纯化核酸区段的步骤中,该纯化核酸区段包含根据SEQ ID NO:13的核苷酸序列。
77.项目75的方法,其中芽孢杆菌宿主是枯草芽孢杆菌或地衣芽孢杆菌。
78.根据项目75的方法,其中在将具有编码SEQ ID NO:14所示酶活性酿脓链球菌透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该芽孢杆菌宿主进一步包括至少一种具有增加的启动子活性的修饰的RNA聚合酶启动子。
79.项目78的方法,其中RNA聚合酶启动子的所述修饰是突变。
80.项目78的方法,其中RNA聚合酶启动子的所述修饰是串联启动子元件。
81.根据项目75的方法,其中在将具有编码SEQ ID NO:14所示酶活性酿脓链球菌透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该芽孢杆菌宿主是用包含纯化的核酸区段的载体进行转化的,该纯化的核酸区段具有编码UDP-糖前体生物合成途径的酶的编码区。
82.根据项目81的方法,其中UDP-糖前体生物合成途径的酶是UDP-葡萄糖脱氢酶。
83.根据项目81的方法,其中UDP-糖前体生物合成途径的酶是UDP-葡萄糖焦磷酸化酶。
84.根据项目75的方法,其中在将具有编码SEQ ID NO:14所示酶活性酿脓链球菌透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该芽孢杆菌宿主进一步包括比在天然芽孢杆菌宿主中发现的至少多一个的信使RNA稳定元件。
85.根据项目75的方法,其中在将具有编码SEQ ID NO:14所示酶活性酿脓链球菌透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该芽孢杆菌宿主进一步包括比在天然芽孢杆菌宿主中发现的至少少一个的信使RNA去稳定元件。
86.根据项目75的方法,其中在将具有编码SEQ ID NO:14所示酶活性酿脓链球菌透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该芽孢杆菌宿主进一步包括至少一种核酸区段,该核酸区段具有编码UDP-糖前体生物合成途径的酶的编码区,从而该重组宿主细胞比表达内源UDP-糖前体生物合成途径的酶的天然宿主细胞具有更大的活性。
87.根据项目75的方法,其中在将具有编码SEQ ID NO:14所示酶活性酿脓链球菌透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该芽孢杆菌宿主进一步包括至少一种突变的内源UDP-糖前体生物合成基因,其中该突变导致从突变的UDP-糖前体基因转录的信使RNA的半衰期的增加。
88.根据项目75的方法,其中在将具有编码SEQ ID NO:14所示酶活性酿脓链球菌透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该芽孢杆菌宿主进一步包含至少一种突变的UDP-糖前体生物合成基因,该基因编码具有增加的翻译效率的信使RNA。
89.根据项目88的方法,其中UDP-糖前体生物合成基因中的突变是在UDP-糖前体生物合成基因的核糖体结合位点上发生的,从而核糖体对核糖体结合位点具有增加的结合亲和力。
90.由下面方法制备的透明质酸,该方法包含以下步骤:
将具有编码SEQ ID NO:14所示酶活性酿脓链球菌透明质素合成酶的编码区的纯化核酸区段引入芽孢杆菌宿主中,其中芽孢杆菌宿主具有UDP-GlcUA和UDP-GlcNAc中至少一种的增强的生产;
使芽孢杆菌宿主在培养基上生长以分泌透明质酸;和
回收分泌的透明质酸。
91.由项目90的方法制备的透明质酸,其中纯化的核酸区段包含根据SEQ ID NO:13的核苷酸序列。
92.由根据项目90的方法制备的透明质酸,其中在将具有编码SEQ ID NO:14所示酶活性酿脓链球菌透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该芽孢杆菌宿主进一步包括至少一种比内源RNA聚合酶启动子具有更大启动子活性的修饰的RNA聚合酶启动子。
93.由根据项目92的方法制备的透明质酸,其中所述RNA聚合酶启动子的修饰是突变。
94.由根据项目92的方法制备的透明质酸,其中所述RNA聚合酶启动子的修饰是串联启动子元件。
95.由根据项目92的方法制备的透明质酸,其中在将具有编码SEQ ID NO:14所示酶活性酿脓链球菌透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该芽孢杆菌宿主是用包含纯化的核酸区段的重组载体进行转化的,该纯化的核酸区段具有编码UDP-糖前体生物合成途径的酶的编码区。
96.由根据项目95的方法制备的透明质酸,其中UDP-糖前体生物合成途径的酶是UDP-葡萄糖脱氢酶。
97.由根据项目95的方法制备的透明质酸,其中UDP-糖前体生物合成途径的酶是UDP-葡萄糖焦磷酸化酶。
98.由根据项目90的方法制备的透明质酸,其中在将具有编码SEQ ID NO:14所示酶活性酿脓链球菌透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该芽孢杆菌宿主进一步包括比在用于形成重组宿主细胞的芽孢杆菌宿主细胞中发现的至少多一个的信使RNA稳定元件。
99.由根据项目90的方法制备的透明质酸,其中在将具有编码SEQ ID NO:14所示酶活性酿脓链球菌透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该芽孢杆菌宿主进一步包括比在用于形成重组宿主细胞的芽孢杆菌宿主细胞中发现的至少少一个的信使RNA去稳定元件。
100.由根据项目90的方法制备的透明质酸,其中在将具有编码SEQ ID NO:14所示酶活性酿脓链球菌透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该芽孢杆菌宿主进一步包括至少一种核酸区段,该核酸区段具有编码UDP-糖前体生物合成途径中有功能活性的酶的编码区,从而该重组宿主细胞比表达内源UDP-糖前体生物合成途径的酶的天然宿主细胞具有更大的活性。
101.由根据项目90的方法制备的透明质酸,其中在将具有编码SEQ ID NO:14所示酶活性酿脓链球菌透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该枯草芽孢杆菌菌株包含至少一种突变的UDP-糖前体生物合成基因,其中该突变导致从突变的UDP-糖前体基因转录的信使RNA的半衰期的增加。
102.由根据项目90的方法制备的透明质酸,其中在将具有编码SEQ ID NO:14所示酶活性酿脓链球菌透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该枯草芽孢杆菌菌株包含至少一种突变的UDP-糖前体生物合成基因,该基因编码具有增加的翻译效率的信使RNA。
103.由根据项目102的方法制备的透明质酸,其中UDP-糖前体生物合成基因中的突变是在UDP-糖前体生物合成基因的核糖体结合位点上发生的,从而核糖体对核糖体结合位点具有增加的结合亲和力。
104.一种重组宿主细胞,其中重组宿主细胞是包含重组载体的芽孢杆菌细胞,该重组载体包含具有编码SEQ ID NO:10所示酶活性透明质素合成酶的编码区的纯化核酸区段,其中编码区是在启动子的控制之下的。
105.项目104的重组宿主细胞,其中重组宿主细胞是枯草芽孢杆菌或地衣芽孢杆菌细胞。
106.项目104的重组宿主细胞,其中纯化的核酸区段包含根据SEQIDNO:9的核苷酸序列。
107.项目106的重组宿主细胞,其中宿主细胞生产透明质酸。
108.项目104的重组宿主细胞,其中纯化的核酸区段的编码酶活性透明质素合成酶的编码区是在革兰氏阳性细菌相容性启动子的控制之下的。
109.项目108的重组宿主细胞,其中启动子是芽孢杆菌相容性启动子。
110.项目104的重组宿主细胞,其中重组宿主细胞是枯草芽孢杆菌细胞,且其中宿主细胞进一步包含重组载体,该重组载体包含具有编码酶活性UDP-GlcUA生物合成途径的酶的编码区的纯化核酸区段,其中酶活性UDP-GlcUA生物合成途径的酶选自UDP-葡萄糖脱氢酶、UDP-葡萄糖焦磷酸化酶及其组合。
111.项目104的重组宿主细胞,其中重组载体进一步包含具有编码酶活性UDP-葡萄糖脱氢酶的编码区的纯化核酸区段。
112.项目111的重组宿主细胞,其中编码酶活性HAS的编码区和编码酶活性UDP-葡萄糖脱氢酶的编码区是在至少一个启动子的至少一个拷贝的控制之下的。
113.项目111的重组宿主细胞,其中编码酶活性HAS的编码区和编码酶活性UDP-葡萄糖脱氢酶的编码区是在不同启动子的控制之下的。
114.一种生产透明质酸的方法,该方法包含以下步骤:
将具有编码SEQ ID NO:10所示酶活性透明质素合成酶的编码区的纯化核酸区段引入芽孢杆菌宿主中,其中编码区是在启动子的控制之下的;
使宿主在培养基上生长以分泌透明质酸;和
回收分泌的透明质酸。
115.项目114的方法,其中芽孢杆菌宿主是枯草芽孢杆菌或地衣芽孢杆菌。
116.根据项目114的方法,其中回收透明质酸的步骤包含从培养基中提取分泌的透明质酸。
117.根据项目116的方法,该方法进一步包含对提取的透明质酸进行纯化的步骤。
118.根据项目114的方法,该方法进一步包含引入纯化的核酸区段的步骤,其中该纯化的核酸区段具有编码酶活性UDP-葡萄糖脱氢酶的编码区。
119.项目114的方法,其中编码酶活性透明质素合成酶的编码区和编码酶活性UDP-葡萄糖脱氢酶的编码区是在相同启动子的控制之下的。
120.根据项目114的方法,其中编码酶活性透明质素合成酶的编码区和编码酶活性UDP-葡萄糖脱氢酶的编码区是在不同启动子的控制之下的。
121.根据项目114的方法,其中在引入具有编码酶活性透明质素合成酶的编码区的纯化核酸区段的步骤中,该纯化的核酸区段包含根据SEQ ID NO:9的核苷酸序列。
122.根据项目114的方法,其中在将具有编码酶活性透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该纯化核酸区段的编码酶活性透明质素合成酶的编码区是在革兰氏阳性细菌相容性启动子的控制之下的。
123.根据项目122的方法,其中启动子是芽孢杆菌相容性启动子。
124.一种生产透明质酸的方法,该方法包含以下步骤:
将具有编码SEQ ID NO:10所示酶活性透明质素合成酶的编码区的纯化核酸区段引入芽孢杆菌宿主中,其中编码区是在启动子的控制之下的;
将具有编码酶活性UDP-葡萄糖脱氢酶的编码区的纯化核酸区段引入芽孢杆菌宿主中;
使芽孢杆菌宿主在培养基上生长以分泌透明质酸;和
回收分泌的透明质酸。
125.项目124的方法,其中在引入具有编码酶活性透明质素合成酶的编码区的纯化核酸区段的步骤中,该纯化核酸区段包含根据SEQID NO:9的核苷酸序列。
126.项目124的方法,其中编码酶活性透明质素合成酶的编码区和编码酶活性UDP-葡萄糖脱氢酶的编码区是在相同启动子的控制之下的。
127.项目124的方法,其中编码酶活性透明质素合成酶的编码区和编码酶活性UDP-葡萄糖脱氢酶的编码区是在不同启动子的控制之下的。
128.项目124的方法,其中芽孢杆菌宿主是枯草芽孢杆菌或地衣芽孢杆菌。
129.根据项目124的方法,其中回收透明质酸的步骤包含从培养基中提取分泌的透明质酸。
130.根据项目129的方法,该方法进一步包含对提取的透明质酸进行纯化的步骤。
131.项目124的方法,其中在将具有编码酶活性透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该纯化核酸区段的编码酶活性透明质素合成酶的编码区是在革兰氏阳性细菌相容性启动子的控制之下的。
132.项目131的方法,其中启动子是芽孢杆菌相容性启动子。
133.一种重组宿主细胞,其中重组宿主细胞是芽孢杆菌细胞,该细胞包含:
一种包含纯化的核酸区段的重组载体,该纯化的核酸区段具有编码SEQ ID NO:10所示酶活性多杀巴斯德氏杆菌透明质素合成酶的编码区;和
一种包含纯化的核酸区段的重组载体,该纯化的核酸区段具有编码酶活性UDP-葡萄糖脱氢酶的编码区。
134.项目133的重组宿主细胞,其中重组宿主细胞是枯草芽孢杆菌或地衣芽孢杆菌细胞。
135.项目133的重组宿主细胞,其中宿主细胞生产透明质酸。
136.项目133的重组宿主细胞,其中纯化的核酸区段的编码SEQID NO:10所示酶活性多杀巴斯德氏杆菌透明质素合成酶的编码区是在革兰氏阳性细菌相容性启动子的控制之下的。
137.项目136的重组宿主细胞,其中启动子是芽孢杆菌相容性启动子。
138.项目133的重组宿主细胞,其中纯化的核酸区段包含根据SEQID NO:9的核苷酸序列。
139.一种重组宿主细胞,其中重组宿主细胞是在其中引入了重组载体的芽孢杆菌细胞,该重组载体包含:
一种纯化的核酸区段,该纯化的核酸区段具有编码SEQ ID NO:10所示酶活性多杀巴斯德氏杆菌透明质素合成酶的编码区;和
一种编码酶活性UDP-葡萄糖脱氢酶的编码区。
140.项目139的重组宿主细胞,其中纯化的核酸区段包含根据SEQID NO:9的核苷酸序列。
141.项目139的重组宿主细胞,其中编码酶活性多杀巴斯德氏杆菌透明质素合成酶的编码区和编码酶活性UDP-葡萄糖脱氢酶的编码区是在相同启动子的控制之下的。
142.项目139的重组宿主细胞,其中编码酶活性多杀巴斯德氏杆菌透明质素合成酶的编码区和编码酶活性UDP-葡萄糖脱氢酶的编码区是在不同启动子的控制之下的。
143.项目139的重组宿主细胞,其中重组宿主细胞是枯草芽孢杆菌或地衣芽孢杆菌细胞。
144.项目139的重组宿主细胞,其中宿主细胞生产透明质酸。
145.项目139的重组宿主细胞,其中纯化的核酸区段的编码SEQID NO:10所示酶活性多杀巴斯德氏杆菌透明质素合成酶的编码区是在革兰氏阳性细菌相容性启动子的控制之下的。
146.项目145的重组宿主细胞,其中启动子是芽孢杆菌相容性启动子。
147.由包含下面步骤的方法制备的透明质酸:
将具有编码SEQ ID NO:10所示酶活性多杀巴斯德氏杆菌透明质素合成酶的编码区的纯化核酸区段引入芽孢杆菌宿主中,其中编码区是在启动子的控制之下的;
使芽孢杆菌宿主在培养基上生长以分泌透明质酸;和
回收分泌的透明质酸。
148.由项目147的方法制备的透明质酸,其中纯化的核酸区段包含根据SEQ ID NO:3的核苷酸序列。
149.由根据项目147的方法制备的透明质酸,其中芽孢杆菌宿主是枯草芽孢杆菌或地衣芽孢杆菌。
150.由根据项目147的方法制备的透明质酸,其中使芽孢杆菌宿主在培养基上生长以分泌透明质酸的步骤进一步限定为使芽孢杆菌宿主于约25℃~约42℃在化学确定成分的培养基上生长以分泌透明质酸。
151.由根据项目147的方法制备的透明质酸,其中使芽孢杆菌宿主在培养基上生长以分泌透明质酸的步骤进一步限定为使芽孢杆菌宿主于约25℃~约42℃在复合培养基上生长以分泌透明质酸。
152.由根据项目147的方法制备的透明质酸,其中使芽孢杆菌宿主在培养基上生长以分泌透明质酸的步骤进一步限定为使芽孢杆菌宿主在含有葡萄糖和至少N-乙酰葡糖胺和葡糖胺之一的培养基上生长以分泌透明质酸。
153.由根据项目147的方法制备的透明质酸,其中回收分泌的透明质酸的步骤进一步限定为:
--通过过滤、离心和絮凝作用中至少一种方法从细胞和残渣中分离透明质酸;
--浓缩分离的透明质酸;和
--通过至少一种选自沉淀、超滤和透析的方法从培养基中分离浓缩的透明质酸。
154.由根据项目153的方法制备的透明质酸,其中通过过滤、离心和絮凝作用中至少一种方法从细胞和残渣中分离透明质酸的步骤进一步包括添加三氯乙酸,这促进细胞和残渣与透明质酸的分离。
155.由根据项目153的方法制备的透明质酸,其中沉淀剂是醇、有机溶剂或化合物及脂族带正电荷的盐中的至少一种。
156.由根据项目155的方法制备的透明质酸,其中沉淀剂选自乙醇、异丙醇、丙酮、鲸蜡基溴化三铵或鲸蜡基氯化吡啶鎓。
157.由根据项目147的方法制备的透明质酸,该方法进一步包含对提取的透明质酸进行纯化的步骤。
158.由根据项目147的方法制备的透明质酸,其中该方法进一步包括引入纯化的核酸区段的步骤,该纯化的核酸区段具有编码酶活性UDP-葡萄糖脱氢酶的编码区。
159.由根据项目158的方法制备的透明质酸,其中编码酶活性透明质素合成酶的编码区和编码酶活性UDP-葡萄糖脱氢酶的编码区是在相同启动子的控制之下的。
160.由根据项目158的方法制备的透明质酸,其中编码酶活性透明质素合成酶的编码区和编码酶活性UDP-葡萄糖脱氢酶的编码区是在不同启动子的控制之下的。
161.由根据项目147的方法制备的透明质酸,其中在将具有编码SEQ ID NO:10所示酶活性多杀巴斯德氏杆菌透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该纯化核酸区段的编码SEQ ID NO:10所示酶活性多杀巴斯德氏杆菌透明质素合成酶的编码区是在来自革兰氏阳性细菌相容性启动子的启动子控制之下的。
162.由根据项目147的方法制备的透明质酸,其中在将具有编码SEQ ID NO:10所示酶活性多杀巴斯德氏杆菌透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该纯化核酸区段是通过转化、转染、转导和电穿孔的至少一种引入到芽孢杆菌宿主的。
163.一种重组宿主细胞,其中该重组宿主细胞是具有UDP-GlcUA和UDP-GlcNAc中至少一种的增强的生产的芽孢杆菌细胞,该重组宿主细胞进一步具有包含纯化的核酸区段的重组载体,该纯化的核酸区段具有编码SEQ ID NO:10所示酶活性多杀巴斯德氏杆菌透明质素合成酶的编码区。
164.项目163的重组宿主细胞,其中纯化的核酸区段包含根据SEQID NO:9的核苷酸序列。
165.项目163的重组宿主细胞,其中重组宿主细胞是枯草芽孢杆菌或地衣芽孢杆菌细胞。
166.项目163的重组宿主细胞,其中重组宿主细胞进一步包括至少一种修饰的RNA聚合酶启动子,其中当修饰的RNA聚合酶启动子由RNA聚合酶识别时,该RNA聚合酶能够以比内源RNA聚合酶启动子更大的量表达RNA。
167.项目166的重组宿主细胞,其中所述修饰是突变。
168.项目166的重组宿主细胞,其中所述修饰是串联启动子元件。
169.项目163的重组宿主细胞,其中重组宿主细胞是用包含纯化的核酸区段的重组载体进行转化的,该纯化的核酸载体具有编码UDP-糖前体生物合成途径中有功能活性的酶的编码区。
170.项目169的重组宿主细胞,其中UDP-糖前体生物合成途径中的酶是UDP-葡萄糖脱氢酶。
171.项目169的重组宿主细胞,其中UDP-糖前体生物合成途径中的酶是UDP-葡萄糖焦磷酸化酶。
172.项目163的重组宿主细胞,其中重组宿主细胞进一步包括比在天然芽孢杆菌细胞中发现的至少多一个的信使RNA稳定元件。
173.项目163的重组宿主细胞,其中重组宿主细胞进一步包括比在天然芽孢杆菌细胞中发现的至少少一个的信使RNA去稳定元件。
174.项目163的重组宿主细胞,其中重组宿主细胞进一步包括至少一种核酸区段,该核酸区段具有编码在UDP-糖前体生物合成途径中有功能活性的酶的编码区,从而该重组宿主细胞比表达内源UDP-糖前体生物合成途径的酶的天然宿主细胞具有更大的活性。
175.项目163的重组宿主细胞,其中重组宿主细胞进一步包括至少一种突变的UDP-糖前体生物合成基因,其中突变的UDP-糖前体基因增加转录的信使RNA的半衰期。
176.项目163的重组宿主细胞,其中重组宿主细胞进一步包括至少一种突变的UDP-糖前体生物合成基因,该基因编码具有增加的翻译效率的信使RNA。
177.项目163的重组宿主细胞,其中UDP-糖前体生物合成基因中的突变是在UDP-糖前体生物合成基因的核糖体结合位点上发生的,从而核糖体对核糖体结合位点具有增加的结合亲和力。
178.一种生产透明质酸的方法,该方法包含以下步骤:
将具有编码SEQ ID NO:10所示酶活性多杀巴斯德氏杆菌透明质素合成酶的编码区的纯化核酸区段引入芽孢杆菌宿主中,其中芽孢杆菌宿主具有UDP-GlcUA和UDP-GlcNAc中至少一种的增强的生产;
使芽孢杆菌宿主在培养基上生长以分泌透明质酸;和
回收分泌的透明质酸。
179.项目178的方法,其中在引入具有编码SEQ ID NO:10所示酶活性多杀巴斯德氏杆菌透明质素合成酶的编码区的纯化核酸区段的步骤中,该纯化的核酸区段包含根据SEQ ID NO:9的核苷酸序列。
180.项目178的方法,其中芽孢杆菌宿主是枯草芽孢杆菌或地衣芽孢杆菌。
181.根据项目178的方法,其中在将具有编码SEQ ID NO:10所示酶活性多杀巴斯德氏杆菌透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该芽孢杆菌宿主进一步包括至少一种具有增加的启动子活性的修饰的RNA聚合酶启动子。
182.项目181的方法,其中所述RNA聚合酶启动子的修饰是突变。
183.项目181的方法,其中所述RNA聚合酶启动子的修饰是串联启动子元件。
184.根据项目178的方法,其中在将具有编码SEQ ID NO:10所示酶活性多杀巴斯德氏杆菌透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该芽孢杆菌宿主是用包含纯化的核酸区段的载体进行转化的,该纯化的核酸区段具有编码UDP-糖前体生物合成途径的酶的编码区。
185.根据项目184的方法,其中UDP-糖前体生物合成途径的酶是UDP-葡萄糖脱氢酶。
186.根据项目184的方法,其中UDP-糖前体生物合成途径的酶是UDP-葡萄糖焦磷酸化酶。
187.根据项目178的方法,其中在将具有编码SEQ ID NO:10所示酶活性多杀巴斯德氏杆菌透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该芽孢杆菌宿主进一步包括比在天然芽孢杆菌宿主中发现的至少多一个的信使RNA稳定元件。
188.根据项目178的方法,其中在将具有编码SEQ ID NO:10所示酶活性多杀巴斯德氏杆菌透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该芽孢杆菌宿主进一步包括比在天然芽孢杆菌宿主中发现的至少少一个的信使RNA去稳定元件。
189.根据项目178的方法,其中在将具有编码酶SEQ ID NO:10所示活性多杀巴斯德氏杆菌透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该芽孢杆菌宿主进一步包括至少一种核酸区段,该核酸区段具有编码UDP-糖前体生物合成途径的酶的编码区,从而该重组宿主细胞比表达内源UDP-糖前体生物合成途径的酶的天然宿主细胞具有更大的活性。
190.根据项目178的方法,其中在将具有编码SEQ ID NO:10所示酶活性多杀巴斯德氏杆菌透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该芽孢杆菌宿主包括至少一种突变的UDP-糖前体生物合成基因,其中该突变导致从突变的UDP-糖前体基因转录的信使RNA的半衰期的增加。
191.根据项目178的方法,其中在将具有编码SEQ ID NO:10所示酶活性多杀巴斯德氏杆菌透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该芽孢杆菌宿主包含至少一种突变的UDP-糖前体生物合成基因,该基因编码具有增加的翻译效率的信使RNA。
192.根据项目191的方法,其中UDP-糖前体生物合成基因中的突变是在UDP-糖前体生物合成基因的核糖体结合位点上发生的,从而核糖体对核糖体结合位点具有增加的结合亲和力。
193.由下面方法制备的透明质酸,该方法包含以下步骤:
将具有编码SEQ ID NO:10所示酶活性多杀巴斯德氏杆菌透明质素合成酶的编码区的纯化核酸区段引入芽孢杆菌宿主中,其中芽孢杆菌宿主具有UDP-GlcUA和UDP-GlcNAc中至少一种的增强的生产;
使芽孢杆菌宿主在培养基上生长以分泌透明质酸;和
回收分泌的透明质酸。
194.由项目193的方法制备的透明质酸,其中纯化的核酸区段包含根据SEQ ID NO:9的核苷酸序列。
195.由根据项目193的方法制备的透明质酸,其中在将具有编码SEQ ID NO:10所示酶活性多杀巴斯德氏杆菌透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该芽孢杆菌宿主进一步包括至少一种比内源RNA聚合酶启动子具有更大启动子活性的修饰的RNA聚合酶启动子。
196.由根据项目195的方法制备的透明质酸,其中所述RNA聚合酶启动子的修饰是突变。
197.由根据项目195的方法制备的透明质酸,其中所述RNA聚合酶启动子的修饰是串联启动子元件。
198.由根据项目195的方法制备的透明质酸,其中在将具有编码SEQ ID NO:10所示酶活性多杀巴斯德氏杆菌透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该芽孢杆菌宿主是用包含纯化的核酸区段的重组载体进行转化的,该纯化的核酸区段具有编码UDP-糖前体生物合成途径的酶的编码区。
199.由根据项目198的方法制备的透明质酸,其中UDP-糖前体生物合成途径的酶是UDP-葡萄糖脱氢酶。
200.由根据项目198的方法制备的透明质酸,其中UDP-糖前体生物合成途径的酶是UDP-葡萄糖焦磷酸化酶。
201.由根据项目193的方法制备的透明质酸,其中在将具有编码SEQ ID NO:10所示酶活性多杀巴斯德氏杆菌透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该芽孢杆菌宿主进一步包括比在用于形成重组宿主细胞的芽孢杆菌宿主细胞中发现的至少多一个的信使RNA稳定元件。
202.由根据项目193的方法制备的透明质酸,其中在将具有编码SEQ ID NO:10所示酶活性多杀巴斯德氏杆菌透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该芽孢杆菌宿主进一步包括比在用于形成重组宿主细胞的芽孢杆菌宿主细胞中发现的至少少一个的信使RNA去稳定元件。
203.由根据项目193的方法制备的透明质酸,其中在将具有编码SEQ ID NO:10所示酶活性多杀巴斯德氏杆菌透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该芽孢杆菌宿主进一步包括至少一种核酸区段,该核酸区段具有编码UDP-糖前体生物合成途径中有功能活性的酶的编码区,从而该重组宿主细胞比表达内源UDP-糖前体生物合成途径的酶的天然宿主细胞具有更大的活性。
204.由根据项目193的方法制备的透明质酸,其中在将具有编码SEQ ID NO:10所示酶活性多杀巴斯德氏杆菌透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该枯草芽孢杆菌菌株包含至少一种突变的UDP-糖前体生物合成基因,其中该突变导致从突变的UDP-糖前体基因转录的信使RNA的半衰期的增加。
205.由根据项目193的方法制备的透明质酸,其中在将具有编码SEQ ID NO:10所示酶活性多杀巴斯德氏杆菌透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该枯草芽孢杆菌菌株包含至少一种突变的UDP-糖前体生物合成基因,该基因编码具有增加的翻译效率的信使RNA。
206.由根据项目205的方法制备的透明质酸,其中UDP-糖前体生物合成基因中的突变是在UDP-糖前体生物合成基因的核糖体结合位点上发生的,从而核糖体对核糖体结合位点具有增加的结合亲和力。
207.一种重组宿主细胞,其中重组宿主细胞是包含重组载体的芽孢杆菌细胞,该重组载体包含具有编码SEQ ID NO:12所示酶活性透明质素合成酶的编码区的纯化核酸区段,其中编码区是在启动子的控制之下的。
208.项目207的重组宿主细胞,其中重组宿主细胞是枯草芽孢杆菌或地衣芽孢杆菌细胞。
209.项目207的重组宿主细胞,其中纯化的核酸区段包含根据SEQID NO:11的核苷酸序列。
210.项目209的重组宿主细胞,其中宿主细胞生产透明质酸。
211.项目207的重组宿主细胞,其中纯化的核酸区段的编码酶活性透明质素合成酶的编码区是在革兰氏阳性细菌相容性启动子的控制之下的。
212.项目211的重组宿主细胞,其中启动子是芽孢杆菌相容性启动子。
213.项目207的重组宿主细胞,其中枯草芽孢杆菌细胞进一步包含重组载体,该重组载体包含具有编码酶活性UDP-GlcUA生物合成途径的酶的编码区的纯化核酸区段,其中酶活性UDP-GlcUA生物合成途径的酶选自UDP-葡萄糖脱氢酶、UDP-葡萄糖焦磷酸化酶及其组合。
214.项目207的重组宿主细胞,其中重组载体进一步包含具有编码酶活性UDP-葡萄糖脱氢酶的编码区的纯化核酸区段。
215.项目214的重组宿主细胞,其中编码酶活性HAS的编码区和编码酶活性UDP-葡萄糖脱氢酶的编码区是在至少一个启动子的至少一个拷贝的控制之下的。
216.项目214的重组宿主细胞,其中编码酶活性HAS的编码区和编码酶活性UDP-葡萄糖脱氢酶的编码区是在不同启动子的控制之下的。
217.一种生产透明质酸的方法,该方法包含以下步骤:
将具有编码SEQ ID NO:12所示酶活性透明质素合成酶的编码区的纯化核酸区段引入芽孢杆菌宿主中,其中编码区是在启动子的控制之下的;
使宿主在培养基上生长以分泌透明质酸;和
回收分泌的透明质酸。
218.项目217的方法,其中芽孢杆菌宿主是枯草芽孢杆菌或地衣芽孢杆菌。
219.根据项目217的方法,其中回收透明质酸的步骤包含从培养基中提取分泌的透明质酸。
220.根据项目219的方法,该方法进一步包含对提取的透明质酸进行纯化的步骤。
221.根据项目217的方法,该方法进一步包含引入纯化的核酸区段的步骤,该纯化的核酸区段具有编码酶活性UDP-葡萄糖脱氢酶的编码区。
222.根据项目217的方法,其中编码酶活性透明质素合成酶的编码区和编码酶活性UDP-葡萄糖脱氢酶的编码区是在相同启动子的控制之下的。
223.根据项目217的方法,其中编码酶活性透明质素合成酶的编码区和编码酶活性UDP-葡萄糖脱氢酶的编码区是在不同启动子的控制之下的。
224.根据项目217的方法,其中在引入具有编码酶活性透明质素合成酶的编码区的纯化核酸区段的步骤中,该纯化核酸区段包含根据SEQ ID NO:11的核苷酸序列。
225.根据项目217的方法,其中在将具有编码酶活性透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该纯化核酸区段的编码酶活性透明质素合成酶的编码区是在革兰氏阳性细菌相容性启动子的控制之下的。
226.根据项目225的方法,其中启动子是芽孢杆菌相容性启动子。
227.一种生产透明质酸的方法,该方法包含以下步骤:
将具有编码SEQ ID NO:12所示酶活性透明质素合成酶的编码区的纯化核酸区段引入芽孢杆菌宿主中,其中编码区是在启动子的控制之下的;
将具有编码酶活性UDP-葡萄糖脱氢酶的编码区的纯化核酸区段引入芽孢杆菌宿主中;
使芽孢杆菌宿主在培养基上生长以分泌透明质酸;和
回收分泌的透明质酸。
228.项目227的方法,其中在引入具有编码酶活性透明质素合成酶的编码区的纯化核酸区段的步骤中,该纯化核酸区段包含根据SEQID NO:11的核苷酸序列。
229.项目227的方法,其中编码酶活性透明质素合成酶的编码区和编码酶活性UDP-葡萄糖脱氢酶的编码区是在相同启动子的控制之下的。
230.项目227的方法,其中编码酶活性透明质素合成酶的编码区和编码酶活性UDP-葡萄糖脱氢酶的编码区是在不同启动子的控制之下的。
231.项目227的方法,其中芽孢杆菌宿主是枯草芽孢杆菌或地衣芽孢杆菌。
232.根据项目227的方法,其中回收透明质酸的步骤包含从培养基中提取分泌的透明质酸。
233.根据项目232的方法,该方法进一步包含对提取的透明质酸进行纯化的步骤。
234.项目227的方法,其中在将具有编码酶活性透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该纯化核酸区段的编码酶活性透明质素合成酶的编码区是在革兰氏阳性细菌相容性启动子的控制之下的。
235.项目234的方法,其中启动子是芽孢杆菌相容性启动子。
236.一种重组宿主细胞,其中该重组宿主细胞是芽孢杆菌细胞,该细胞包含:
一种包含纯化的核酸区段的重组载体,该纯化的核酸区段具有编码SEQ ID NO:12所示酶活性乳房链球菌透明质素合成酶的编码区;和
一种包含纯化的核酸区段的重组载体,该纯化的核酸区段具有编码酶活性UDP-葡萄糖脱氢酶的编码区。
237.项目236的重组宿主细胞,其中重组宿主细胞是枯草芽孢杆菌或地衣芽孢杆菌细胞。
238.项目236的重组宿主细胞,其中宿主细胞生产透明质酸。
239.项目236的重组宿主细胞,其中纯化的核酸区段的编码SEQID NO:12所示酶活性乳房链球菌透明质素合成酶的编码区是在革兰氏阳性细菌相容性启动子的控制之下的。
240.项目239的重组宿主细胞,其中启动子是芽孢杆菌相容性启动子。
241.项目236的重组宿主细胞,其中纯化的核酸区段包含根据SEQID NO:11的核苷酸序列。
242.一种重组宿主细胞,其中重组宿主细胞是在其中引入了重组载体的芽孢杆菌细胞,该重组载体包含:
一种纯化的核酸区段,该纯化的核酸区段具有编码SEQ ID NO:12所示酶活性乳房链球菌透明质素合成酶的编码区;和
一种编码酶活性UDP-葡萄糖脱氢酶的编码区。
243.项目242的重组宿主细胞,其中纯化的核酸区段包含根据SEQID NO:11的核苷酸序列。
244.项目242的重组宿主细胞,其中编码酶活性乳房链球菌透明质素合成酶的编码区和编码酶活性UDP-葡萄糖脱氢酶的编码区是在相同启动子的控制之下的。
245.项目242的重组宿主细胞,其中编码酶活性乳房链球菌透明质素合成酶的编码区和编码酶活性UDP-葡萄糖脱氢酶的编码区是在不同启动子的控制之下的。
246.项目242的重组宿主细胞,其中重组宿主细胞是枯草芽孢杆菌或地衣芽孢杆菌细胞。
247.项目242的重组宿主细胞,其中宿主细胞生产透明质酸。
248.项目242的重组宿主细胞,其中纯化的核酸区段的编码SEQID NO:12所示酶活性乳房链球菌透明质素合成酶的编码区是在革兰氏阳性细菌相容性启动子的控制之下的。
249.项目248的重组宿主细胞,其中启动子是芽孢杆菌相容性启动子。
250.由包含下面步骤的方法制备的透明质酸:
将具有编码SEQ ID NO:12所示酶活性乳房链球菌透明质素合成酶的编码区的纯化核酸区段引入芽孢杆菌宿主中,其中编码区是在启动子的控制之下的;
使芽孢杆菌宿主在培养基上生长以分泌透明质酸;和
回收分泌的透明质酸。
251.由项目250的方法制备的透明质酸,其中纯化的核酸区段包含根据SEQ ID NO:3的核苷酸序列。
252.由根据项目250的方法制备的透明质酸,其中芽孢杆菌宿主是枯草芽孢杆菌或地衣芽孢杆菌。
253.由根据项目250的方法制备的透明质酸,其中使芽孢杆菌宿主在培养基上生长以分泌透明质酸的步骤进一步限定为使芽孢杆菌宿主于约25℃~约42℃在化学确定成分的培养基上生长以分泌透明质酸。
254.由根据项目250的方法制备的透明质酸,其中使芽孢杆菌宿主在培养基上生长以分泌透明质酸的步骤进一步限定为使芽孢杆菌宿主于约25℃~约42℃在复合培养基上生长以分泌透明质酸。
255.由根据项目250的方法制备的透明质酸,其中使芽孢杆菌宿主在培养基上生长以分泌透明质酸的步骤进一步限定为使芽孢杆菌宿主在含有葡萄糖以及N-乙酰葡糖胺和葡糖胺两者中至少一种的培养基上生长以分泌透明质酸。
256.由根据项目250的方法制备的透明质酸,其中回收分泌的透明质酸的步骤进一步限定为:
--通过过滤、离心和絮凝作用中至少一种方法从细胞和残渣中分离透明质酸;
--浓缩分离的透明质酸;和
--通过至少一种选自沉淀、超滤和透析的方法从培养基中分离浓缩的透明质酸。
257.由根据项目256的方法制备的透明质酸,其中通过过滤、离心和絮凝作用中至少一种方法从细胞和残渣中分离透明质酸的步骤进一步包括添加三氯乙酸,这促进细胞和残渣与透明质酸的分离。
258.由根据项目256的方法制备的透明质酸,其中沉淀剂是醇、有机溶剂或化合物及脂族带正电荷的盐中的至少一种。
259.由根据项目258的方法制备的透明质酸,其中沉淀剂选自乙醇、异丙醇、丙酮、鲸蜡基溴化三铵或鲸蜡基氯化吡啶鎓。
260.由根据项目250的方法制备的透明质酸,该方法进一步包含对提取的透明质酸进行纯化的步骤。
261.由根据项目250的方法制备的透明质酸,其中该方法进一步包括引入纯化的核酸区段的步骤,该纯化的核酸区段具有编码酶活性UDP-葡萄糖脱氢酶的编码区。
262.由根据项目261的方法制备的透明质酸,其中编码酶活性透明质素合成酶的编码区和编码酶活性UDP-葡萄糖脱氢酶的编码区是在相同启动子的控制之下的。
263.由根据项目261的方法制备的透明质酸,其中编码酶活性透明质素合成酶的编码区和编码酶活性UDP-葡萄糖脱氢酶的编码区是在不同启动子的控制之下的。
264.由根据项目250的方法制备的透明质酸,其中在将具有编码SEQ ID NO:12所示酶活性乳房链球菌透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该纯化核酸区段的编码SEQ ID NO:12所示酶活性乳房链球菌透明质素合成酶的编码区是在来自革兰氏阳性细菌相容性启动子的启动子控制之下的。
265.由根据项目250的方法制备的透明质酸,其中在将具有编码SEQ ID NO:12所示酶活性乳房链球菌透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该纯化核酸区段是通过转化、转染、转导和电穿孔的至少一种引入到芽孢杆菌宿主的。
266.一种重组宿主细胞,其中该重组宿主细胞是具有UDP-GlcUA和UDP-GlcNAc中至少一种的增强的生产的芽孢杆菌细胞,该重组宿主细胞进一步具有包含纯化的核酸区段的重组载体,该纯化的核酸区段具有编码SEQ ID NO:12所示酶活性乳房链球菌透明质素合成酶的编码区。
267.项目266的重组宿主细胞,其中纯化的核酸区段包含根据SEQID NO:11的核苷酸序列。
268.项目266的重组宿主细胞,其中重组宿主细胞是枯草芽孢杆菌或地衣芽孢杆菌细胞。
269.项目266的重组宿主细胞,其中重组宿主细胞进一步包括至少一种修饰的RNA聚合酶启动子,其中当修饰的RNA聚合酶启动子由RNA聚合酶识别时,该RNA聚合酶能够以比内源RNA聚合酶启动子更大的量表达RNA。
270.项目269的重组宿主细胞,其中所述修饰是突变。
271.项目269的重组宿主细胞,其中所述修饰是串联启动子元件。
272.项目266的重组宿主细胞,其中重组宿主细胞是用包含纯化的核酸区段的重组载体进行转化的,该纯化的核酸区段具有编码UDP-糖前体生物合成途径中有功能活性的酶的编码区。
273.项目272的重组宿主细胞,其中UDP-糖前体生物合成途径中的酶是UDP-葡萄糖脱氢酶。
274.项目272的重组宿主细胞,其中UDP-糖前体生物合成途径中的酶是UDP-葡萄糖焦磷酸化酶。
275.项目266的重组宿主细胞,其中重组宿主细胞进一步包括比在天然芽孢杆菌细胞中发现的至少多一个的信使RNA稳定元件。
276.项目266的重组宿主细胞,其中重组宿主细胞进一步包括比在天然芽孢杆菌细胞中发现的至少少一个的信使RNA去稳定元件。
277.项目266的重组宿主细胞,其中重组宿主细胞进一步包括至少一种核酸区段,该核酸区段具有编码在UDP-糖前体生物合成途径中有功能活性的酶的编码区,从而该重组宿主细胞比表达内源UDP-糖前体生物合成途径的酶的天然宿主细胞具有更大的活性。
278.项目266的重组宿主细胞,其中重组宿主细胞进一步包括至少一种突变的UDP-糖前体生物合成基因,其中突变的UDP-糖前体基因增加转录的信使RNA的半衰期。
279.项目266的重组宿主细胞,其中重组宿主细胞进一步包括至少一种突变的UDP-糖前体生物合成基因,该基因编码具有增加的翻译效率的信使RNA。
280.项目266的重组宿主细胞,其中UDP-糖前体生物合成基因中的突变是在UDP-糖前体生物合成基因的核糖体结合位点上发生的,从而核糖体对核糖体结合位点具有增加的结合亲和力。
281.一种生产透明质酸的方法,该方法包含以下步骤:
将具有编码SEQ ID NO:12所示酶活性乳房链球菌透明质素合成酶的编码区的纯化核酸区段引入芽孢杆菌宿主中,其中芽孢杆菌宿主具有UDP-GlcUA和UDP-GlcNAc中至少一种的增强的生产;
使芽孢杆菌宿主在培养基上生长以分泌透明质酸;和
回收分泌的透明质酸。
282.项目281的方法,其中在引入具有编码SEQ ID NO:12所示酶活性乳房链球菌透明质素合成酶的编码区的纯化核酸区段的步骤中,该纯化核酸区段包含根据SEQ ID NO:11的核苷酸序列。
283.项目281的方法,其中芽孢杆菌宿主是枯草芽孢杆菌或地衣芽孢杆菌。
284.根据项目281的方法,其中在将具有编码SEQ ID NO:12所示酶活性乳房链球菌透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该芽孢杆菌宿主进一步包括至少一种具有增加的启动子活性的修饰的RNA聚合酶启动子。
285.项目284的方法,其中所述RNA聚合酶启动子的修饰是突变。
286.项目284的方法,其中所述RNA聚合酶启动子的修饰是串联启动子元件。
287.根据项目281的方法,其中在将具有编码SEQ ID NO:12所示酶活性乳房链球菌透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该芽孢杆菌宿主是用包含纯化的核酸区段的载体进行转化的,该纯化的核酸区段具有编码UDP-糖前体生物合成途径的酶的编码区。
288.根据项目287的方法,其中UDP-糖前体生物合成途径的酶是UDP-葡萄糖脱氢酶。
289.根据项目287的方法,其中UDP-糖前体生物合成途径的酶是UDP-葡萄糖焦磷酸化酶。
290.根据项目281的方法,其中在将具有编码SEQ ID NO:12所示酶活性乳房链球菌透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该芽孢杆菌宿主进一步包括比在天然芽孢杆菌宿主中发现的至少多一个的信使RNA稳定元件。
291.根据项目281的方法,其中在将具有编码SEQ ID NO:12所示酶活性乳房链球菌透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该芽孢杆菌宿主进一步包括比在天然芽孢杆菌宿主中发现的至少少一个的信使RNA去稳定元件。
292.根据项目281的方法,其中在将具有编码SEQ ID NO:12所示酶活性乳房链球菌透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该芽孢杆菌宿主进一步包括至少一种核酸区段,该核酸区段具有编码UDP-糖前体生物合成途径的酶的编码区,从而该重组宿主细胞比表达内源UDP-糖前体生物合成途径的酶的天然宿主细胞具有更大的活性。
293.根据项目281的方法,其中在将具有编码SEQ ID NO:12所示酶活性乳房链球菌透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该芽孢杆菌宿主包括至少一种突变的内源UDP-糖前体生物合成基因,其中该突变导致从突变的UDP-糖前体基因转录的信使RNA的半衰期的增加。
294.根据项目281的方法,其中在将具有编码SEQ ID NO:12所示酶活性乳房链球菌透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该芽孢杆菌宿主包含至少一种突变的UDP-糖前体生物合成基因,该基因编码具有增加的翻译效率的信使RNA。
295.根据项目294的方法,其中UDP-糖前体生物合成基因中的突变是在UDP-糖前体生物合成基因的核糖体结合位点上发生的,从而核糖体对核糖体结合位点具有增加的结合亲和力。
296.由下面方法制备的透明质酸,该方法包含以下步骤:
将具有编码SEQ ID NO:12所示酶活性乳房链球菌透明质素合成酶的编码区的纯化核酸区段引入芽孢杆菌宿主中,其中芽孢杆菌宿主具有UDP-GlcUA和UDP-GlcNAc中至少一种的增强的生产;
使芽孢杆菌宿主在培养基上生长以分泌透明质酸;和
回收分泌的透明质酸。
297.由项目296的方法制备的透明质酸,其中纯化的核酸区段包含根据SEQ ID NO:11的核苷酸序列。
298.由根据项目296的方法制备的透明质酸,其中在将具有编码SEQ ID NO:12所示酶活性乳房链球菌透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该芽孢杆菌宿主进一步包括至少一种比内源RNA聚合酶启动子具有更大启动子活性的修饰的RNA聚合酶启动子。
299.由根据项目298的方法制备的透明质酸,其中所述RNA聚合酶启动子的修饰是突变。
300.由根据项目298的方法制备的透明质酸,其中所述RNA聚合酶启动子的修饰是串联启动子元件。
301.由根据项目298的方法制备的透明质酸,其中在将具有编码SEQ ID NO:12所示酶活性乳房链球菌透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该芽孢杆菌宿主是用包含纯化的核酸区段的重组载体进行转化的,该纯化的核酸区段具有编码UDP-糖前体生物合成途径的酶的编码区。
302.由根据项目300的方法制备的透明质酸,其中UDP-糖前体生物合成途径的酶是UDP-葡萄糖脱氢酶。
303.由根据项目300的方法制备的透明质酸,其中UDP-糖前体生物合成途径的酶是UDP-葡萄糖焦磷酸化酶。
304.由根据项目296的方法制备的透明质酸,其中在将具有编码SEQ ID NO:12所示酶活性乳房链球菌透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该芽孢杆菌宿主进一步包括比在用于形成重组宿主细胞的芽孢杆菌宿主细胞中发现的至少多一个的信使RNA稳定元件。
305.由根据项目296的方法制备的透明质酸,其中在将具有编码SEQ ID NO:12所示酶活性乳房链球菌透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该芽孢杆菌宿主进一步包括比在用于形成重组宿主细胞的芽孢杆菌宿主细胞中发现的至少少一个的信使RNA去稳定元件。
306.由根据项目296的方法制备的透明质酸,其中在将具有编码SEQ ID NO:12所示酶活性乳房链球菌透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该芽孢杆菌宿主进一步包括至少一种核酸区段,该核酸区段具有编码UDP-糖前体生物合成途径中有功能活性的酶的编码区,从而该重组宿主细胞比表达内源UDP-糖前体生物合成途径的酶的天然宿主细胞具有更大的活性。
307.由根据项目296的方法制备的透明质酸,其中在将具有编码SEQ ID NO:12所示酶活性乳房链球菌透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该枯草芽孢杆菌菌株包含至少一种突变的UDP-糖前体生物合成基因,其中该突变导致从突变的UDP-糖前体基因转录的信使RNA的半衰期的增加。
308.由根据项目296的方法制备的透明质酸,其中在将具有编码SEQ ID NO:12所示酶活性乳房链球菌透明质素合成酶的编码区的纯化核酸区段引入到芽孢杆菌宿主的步骤中,该枯草芽孢杆菌菌株包含至少一种突变的UDP-糖前体生物合成基因,该基因编码具有增加的翻译效率的信使RNA。
309.由根据项目307的方法制备的透明质酸,其中UDP-糖前体生物合成基因中的突变是在UDP-糖前体生物合成基因的核糖体结合位点上发生的,从而核糖体对核糖体结合位点具有增加的结合亲和力。
310.一种宿主细胞,其中宿主细胞包含载体,该载体包含具有编码SEQ ID NO:14所示透明质素合成酶的编码区的核酸区段。
311.一种生产透明质酸的方法,该方法包含以下步骤:
将具有编码SEQ ID NO:14所示透明质素合成酶的编码区的核酸区段引入宿主生物中;和
使宿主生物生长以分泌透明质酸。
312.一种生产透明质酸的方法,该方法包含以下步骤:
将具有编码SEQ ID NO:14所示透明质素合成酶的编码区的核酸区段引入宿主中;
将具有编码UDP-葡萄糖脱氢酶的编码区的核酸区段引入到宿主中;和
使宿主生长以分泌透明质酸。
313.一种宿主细胞,其中宿主细胞包含:
一种包含核酸区段的载体,该核酸区段具有编码SEQ ID NO:14所示透明质素合成酶的编码区;和
一种包含核酸区段的载体,该核酸区段具有编码UDP-葡萄糖脱氢酶的编码区。
314.一种宿主细胞,其中宿主细胞具有引入的载体,该载体包含:
一种具有编码SEQ ID NO:14所示透明质素合成酶的编码区的核酸区段;和
一种编码UDP-葡萄糖脱氢酶的编码区。
315.由下面方法制备的透明质酸,该方法包含以下步骤:
将具有编码SEQ ID NO:14所示透明质素合成酶的编码区的核酸区段引入宿主中;
使宿主生长以分泌透明质酸。
316.一种宿主细胞,其中该宿主细胞具有UDP-GlcUA和UDP-GlcNAc中至少一种的增强的生产,该重组宿主细胞进一步具有包含核酸区段的载体,该核酸区段具有编码SEQ ID NO:14所示透明质素合成酶的编码区。
317.一种生产透明质酸的方法,该方法包含以下步骤:
将具有编码SEQ ID NO:14所示透明质素合成酶的编码区的核酸区段引入宿主中,其中宿主具有UDP-GlcUA和UDP-GlcNAc中至少一种的增强的生产;和
使宿主生长以分泌透明质酸。
318.由下面方法制备的透明质酸,该方法包含以下步骤:
将具有编码SEQ ID NO:14所示透明质素合成酶的编码区的核酸区段引入宿主中,其中宿主具有UDP-GlcUA和UDP-GlcNAc中至少一种的增强的生产;和
使宿主生长以分泌透明质酸。
319.一种宿主细胞,其中宿主细胞包含载体,该载体包含具有编码SEQ ID NO:10所示透明质素合成酶的编码区的核酸区段。
320.一种生产透明质酸的方法,该方法包含以下步骤:
将具有编码SEQ ID NO:10所示透明质素合成酶的编码区的核酸区段引入宿主生物中;和
使宿主生物生长以分泌透明质酸。
321.一种生产透明质酸的方法,该方法包含以下步骤:
将具有编码SEQ ID NO:14所示透明质素合成酶的编码区的核酸区段引入宿主中;
将具有编码UDP-葡萄糖脱氢酶的编码区的核酸区段引入到宿主中;和
使宿主生长以分泌透明质酸。
322.一种宿主细胞,其中宿主细胞包含:
一种包含核酸区段的载体,该核酸区段具有编码SEQ ID NO:10所示透明质素合成酶的编码区;和
一种包含核酸区段的载体,该核酸区段具有编码UDP-葡萄糖脱氢酶的编码区。
323.一种宿主细胞,其中宿主细胞具有引入的载体,该载体包含:
一种具有编码SEQ ID NO:10所示透明质素合成酶的编码区的核酸区段;和
一种编码UDP-葡萄糖脱氢酶的编码区。
324.由下面方法制备的透明质酸,该方法包含以下步骤:
将具有编码SEQ ID NO:10所示透明质素合成酶的编码区的核酸区段引入宿主中;和
使宿主生长以分泌透明质酸。
325.一种宿主细胞,其中该宿主细胞具有UDP-GlcUA和UDP-GlcNAc中至少一种的增强的生产,该重组宿主细胞进一步具有包含核酸区段的载体,该核酸区段具有编码SEQ ID NO:10所示透明质素合成酶的编码区。
326.一种生产透明质酸的方法,该方法包含以下步骤:
将具有编码SEQ ID NO:10所示透明质素合成酶的编码区的核酸区段引入宿主中,其中宿主具有UDP-GlcUA和UDP-GlcNAc中至少一种的增强的生产;和
使宿主生长以分泌透明质酸。
327.由下面方法制备的透明质酸,该方法包含以下步骤:
将具有编码SEQ ID NO:10所示透明质素合成酶的编码区的核酸区段引入宿主中,其中宿主具有UDP-GlcUA和UDP-GlcNAc中至少一种的增强的生产;和
使宿主生长以分泌透明质酸。
328.一种宿主细胞,其中宿主细胞包含载体,该载体包含具有编码SEQ ID NO:12所示透明质素合成酶的编码区的核酸区段。
329.一种生产透明质酸的方法,该方法包含以下步骤:
将具有编码SEQ ID NO:12所示透明质素合成酶的编码区的核酸区段引入宿主生物中;和
使宿主生物生长以分泌透明质酸。
330.一种生产透明质酸的方法,该方法包含以下步骤:
将具有编码SEQ ID NO:12所示透明质素合成酶的编码区的核酸区段引入宿主中;
将具有编码UDP-葡萄糖脱氢酶的编码区的核酸区段引入到宿主中;和
使宿主生长以分泌透明质酸。
331.一种宿主细胞,其中宿主细胞包含:
一种包含核酸区段的载体,该核酸区段具有编码SEQ ID NO:12所示透明质素合成酶的编码区;和
一种包含核酸区段的载体,该核酸区段具有编码UDP-葡萄糖脱氢酶的编码区。
332.一种宿主细胞,其中宿主细胞具有引入的载体,该载体包含:
一种具有编码SEQ ID NO:12所示透明质素合成酶的编码区的核酸区段;和
一种编码UDP-葡萄糖脱氢酶的编码区。
333.由下面方法制备的透明质酸,该方法包含以下步骤:
将具有编码SEQ ID NO:12所示透明质素合成酶的编码区的核酸区段引入宿主中;和
使宿主生长以分泌透明质酸。
334.一种宿主细胞,其中该宿主细胞具有UDP-GlcUA和UDP-GlcNAc中至少一种的增强的生产,该重组宿主细胞进一步具有包含核酸区段的载体,该核酸区段具有编码SEQ ID NO:12所示透明质素合成酶的编码区。
335.一种生产透明质酸的方法,该方法包含以下步骤:
将具有编码SEQ ID NO:12所示透明质素合成酶的编码区的核酸区段引入宿主中,其中宿主具有UDP-GlcUA和UDP-GlcNAc中至少一种的增强的生产;和
使宿主生长以分泌透明质酸。
336.由含有以下步骤的方法制备的透明质酸:
将具有编码SEQ ID NO:12所示透明质素合成酶的编码区的核酸区段引入宿主中,其中宿主具有UDP-GlcUA和UDP-GlcNAc中至少一种的增强的生产;和
使宿主生长以分泌透明质酸。
附图简述
图1描述seHAS和spHAS基因之间的相互杂交不发生。用于泳道1和2的A组探针仅与A组DNA(泳道2)杂交,而用于泳道3和4的C组探针仅与泳道3杂交。
图2图解说明seHAS与细菌、病毒和真核HAS蛋白质之间的关系。
图3图解说明一些已知的透明质素合成酶之间可能的进化关系和相似性。
图4描述由各种基因工程处理的链球菌HAS酶生产的HA的大小分布。
图5图解说明大肠杆菌中重组seHAS和spHAS的过表达。
图6描述枯草芽孢杆菌和地衣芽孢杆菌(Bacilluslicheniformis)中的重组HA生产。
图7描述链球菌HA合成酶的纯化。
图8描述由在酵母膜中表达的重组链球菌HAS合成的HA的凝胶过滤分析。
图9是用特殊抗体对重组seHAS的蛋白质印迹分析。
图10是由重组seHAS和spHAS生产的HA大小分布的动力学分析。
图11图解seHAS的亲水图和预测的膜结合区域。
图12是膜中seHAS的拓扑学组织的图形模型。
图13是由重组seHAS合成真正的HA的证明。
图14描述用特定的寡核苷酸和PCR对编码seHAS、编码spHAS或编码seHAS和spHAS两者的核酸序列的识别。
图15描述用于特定PCR杂交的寡核苷酸。
图16A是通过比较枯草芽孢杆菌168(单独的pSM143载体)的HA合成与枯草芽孢杆菌168(含有seHAS的pSM143载体)的HA合成而描述活枯草芽孢杆菌中重组HA生产的图。图16B是图16A中的部分的放大。
图17A是描述对活枯草芽孢杆菌中由spHAS生产的重组HA大小分布的营养性控制的图。
图17B是描述与单独含有载体的枯草芽孢杆菌相比的活枯草芽孢杆菌168中重组HA生产的图。
图18A和图18B是重组大肠杆菌的显微照片。在图18A中,墨汁染色(1,000×放大倍率)揭示具有pPmHAS的大肠杆菌K5细胞生产坚固的荚膜,该荚膜显示为围绕细胞的白色光环。在图18B中,荚膜材料可通过用链霉菌属(Streptomyces)的HA裂解酶的简单处理而从大肠杆菌K5(pPmHAS)细胞中去除。PmHAS指导了HA多糖的多聚化。
图19是革兰氏阳性和革兰氏阴性细菌中GAG生物合成的示意模型。
图20是证明来自乳房链球菌的HAS基因PCR扩增的琼脂糖凝胶。
图21描述来自酿脓链球菌、类马链球菌和乳房链球菌的HA合成酶活性。
发明详述
在详细解释本发明的至少一个实施方案之前,应理解的是本发明的应用不限于在下面的描述中提出的或在附图中阐明的成分的构建和组织的细节。本发明能够用于其他实施方案或能够以各种途径实践或实现。同样地,应理解的是在此处应用的措词和术语是为了描述的目的,而不应该认为是限制性的。
如在此处所用的,术语“核酸区段”和“DNA区段”是互换使用的,且指已分离的不含特定物种的总基因组DNA的DNA分子。因此,如在此处所使用的“纯化的”DNA或核酸区段指含有透明质酸合成酶(“HAS”)编码序列的DNA区段,然而该编码序列是从源细胞的无关基因组DNA分离的或是纯化的不含后者的形式。包括于术语“DNA区段”中的是DNA区段和这种区段的较小片段以及重组载体,该载体包括如质粒、粘粒、噬菌体、病毒等。
相似地,包含分离的或纯化的HAS基因的DNA区段指包括HAS编码序列的DNA区段,该区段基本从其他天然存在的基因或蛋白质编码序列中分离。在这方面,为简单起见将术语“基因”用于指功能蛋白质、多肽或肽编码单位。如本领域的技术人员将理解的,该功能术语包括基因组序列、cDNA序列或其组合。“基本从其他编码序列分离的”指目标基因(在本情况下为HAS)形成了DNA区段的编码区的重要部分,且该DNA区段不含有大的部分的天然存在的编码DNA,如大的染色体片段或其他功能基因或DNA编码区。当然,这指的是最初分离的DNA区段,但不排除后面加入的或由人们手工在区段中有意留下的基因或编码区。
由于某些与原核来源的应用相关的优点,人们很可能认识到从原核生物分离HAS基因的许多优点。特别地,人们可选择利用I类或II类HAS,如来自类马链球菌或酿脓链球菌的I类HAS或来自多杀巴斯德氏杆菌的II类HAS。
链球菌基于不同的细胞壁糖类抗原而在分类学上细分为兰斯非尔德类群。有18个不同的类群,但最普遍的病原体是A、B、C和D。以历史的眼光看,最普遍的病原体也经常有特定的物种名字,但统一的兰斯非尔德检验方法被认为是确定类型的明确方法并因而是有用的分类方案。可用作HAS基因的来源的链球菌物种包括A组链球菌,如酿脓链球菌和溶血链球菌(S.haemolyticus),以及C组链球菌,如马链球菌(s.equi)、类马链球菌、兽瘟链球菌(S.zooepidemicus)、乳房链球菌和停乳链球菌(S.dysgalactiae)。
从原核生物中分离HAS基因的一个这样的优点是真核的酶一般可能需要重要的翻译后修饰,该修饰仅可在真核宿主中实现。这将倾向于限制获得的任何真核HA合成酶基因的应用性。此外,本领域的技术人员很可能认识到在应用原核的酶基因时,在时间和基因操作的容易性方面的额外的优点。这些额外的优点包括:(a)原核基因由于相对小的基因组大小,以及在筛选相应的基因组文库时减少的量,因此较容易分离;和(b)操作的容易性,这是因为由于不含有内含子,原核基因的编码区的总大小是显著较小的。此外,如果HAS基因的产物(即酶)需要翻译后修饰,那么这将最好在该基因所源自的相似的原核细胞环境(宿主)中实现。
优选地,根据本发明的DNA序列将进一步包括基因控制区,该控制区使得该序列能够在选择的重组宿主中表达。当然,应用的控制区的特性一般依赖于想要的特殊用途(如克隆宿主)而变化。
在特别的实施方案中,本发明涉及分离的DNA区段和插入了编码HAS基因的DNA序列的重组载体,该基因在其氨基酸序列中包括根据SEQ ID NO:2、10、12、14、16、18和20中至少一个的氨基酸序列。此外,在其他特别的实施方案中,本发明涉及分离的DNA区段和插入了编码基因的DNA序列的重组载体,该基因在其氨基酸序列中包括HAS基因或DNA的氨基酸序列,且特别地包括相应于类马链球菌HAS、酿脓链球菌HAS、乳房链球菌HAS、多杀巴斯德氏杆菌HAS、硫磺矿硫化叶菌HAS、Ectocarpus siliculosus病毒HAS和炭疽芽孢杆菌质粒pXO1HAS的HAS基因或cDNA。例如,当DNA区段或载体编码全长的HAS蛋白质时,或想要用于表达HAS蛋白质时,优选的序列是那些基本在SEQ ID NO:2、10、12、14、16、18和20中至少一个中提出的。
具有HA合成酶活性的核酸区段可通过在此处描述的方法分离。术语“基本在SEQ ID NO:X中提出的序列”指基本相应于SEQID NO:X的部分的序列,并且该序列与SEQ ID NO:X的氨基酸序列相比只有相对少数的氨基酸不同或该序列是SEQ ID NO:X的生物学功能等价物。术语“生物学功能等价物”是本领域中众所周知的,并进一步在此处详细定义为具有基本在SEQ ID NO:X中提出的序列并且与原核生物生产HA或透明质酸被膜的能力相关的基因。
例如,seHAS和spHAS编码序列为约70%相同的且富含碱基腺嘌呤(A)和胸腺嘧啶(T)。SeHAS的碱基含量为A-26.71%、C-19.13%、G-20.81%和T-33.33%(A/T=60%),而spHAS为A-31.34%、C-16.42%、G-16.34%和T-35.8%(A/T=67%)。本领域的技术人员惊讶的是seHAS编码序列不与spHAS基因杂交,反之亦然,尽管它们是70%相同的。该意想不到的不能相互杂交可归因于在可读框中错配碱基造成的短中断。SpHAS不能与seHAS相互杂交显示于图1中。SeHAS和spHAS编码序列共同的相同核苷酸的最长一段仅20个核苷酸。此外,高度富含A-T的序列将形成比富含G-C的序列不稳定的杂交复合物。另一个可能的解释是在两个序列中均有几个As或Ts区段,该区段可以以错误排列和不稳定的方式杂交。这将使得seHAS和spHAS基因序列相互不在可读框内配对,因而降低了有效杂交的概率。
由于70%相同的两个编码蛋白质的基因不能够相互杂交的独特现象,有益的是依照其功能考虑所述的核酸区段;即编码酶活性透明质酸合成酶的核酸区段。本领域的技术人员可理解编码酶活性透明质酸合成酶的核酸区段可含有对在SEQ ID NO:1、2和9-20中提出的序列的保守的或半保守的替代,且仍然在本发明的范围之内。
特别地,本领域充满从业者对核酸区段做结构改变(即编码保守的或半保守的氨基酸替代)并仍然保持其酶或功能活性的例子。例如参见:(1)Risler等人“结构相关蛋白质中的氨基酸替代。模式识别方法。”J.Mol.Biol.204:1019-1029(1988)[“...根据氨基酸侧链的观察到的可交换性,仅可描绘4组;(i)Ile和Val;(ii)Leu和Met;(iii)Lys、Arg和Gln及(iv)Tyr和Phe。”];(2)Niefind等人“蛋白质模型的氨基酸相似系数和源自主链折叠Anoles的序列比对”J.Mol.Biol.219:481-497(1991)[相似性参数使得能够设计氨基酸替代];和(3)Overington等人“环境特异性氨基酸替代表:蛋白质折叠的三级模板和预测”Protein Science 1:216-226(1992)[“观察到的替代作为局部环境的函数的分析显示有不同的模式...”可做相容的改变。],每一个的内容都清楚地在此处整体引用作为参考。
这些参考文献和无数其他的文献显示在给出核酸序列时,本领域的技术人员可对该核酸序列进行替代和改变而不改变其功能性。同样地,替代的核酸区段可与其未改变的亲代高度相同,且保持其未改变的亲代的酶活性,并仍然不能进行杂交。
本发明公开了编码酶活性透明质酸合成酶如seHAS、spHAS、suHAS和pmHAS的核酸区段。尽管seHAS与spHAS 70%相同且均编码酶活性透明质酸合成酶,但它们不相互杂交。因而,本领域的技术人员可理解可对在SEQ ID NO:1中列出的seHAS核酸区段进行替代而不背离本发明的范围和项目。标准化的和可接受的功能等价氨基酸替代显示于表I中。
表I
  氨基酸组   保守的和半保守的替代
  非极性R组   丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、甲硫氨酸、苯丙氨酸、色氨酸
 极性但不带电荷的R组   甘氨酸、丝氨酸、苏氨酸、半胱氨酸、天冬酰胺、谷氨酰胺
  氨基酸组   保守的和半保守的替代
  带负电荷的R组   天冬氨酸、谷氨酸
  带正电荷的R组   赖氨酸、精氨酸、组氨酸
本发明另一个优选的实施方案是可进一步限定为重组载体的纯化的核酸区段,该区段编码根据SEQ ID Nos:2、10、12、14、16、18或20的蛋白质。如在此处所用的,术语“重组载体”指已进行修饰以含有编码HAS蛋白质或其片段的核酸区段的载体。该重组载体可进一步限定为包含启动子的表达载体,该启动子可操作地连接到该编码HAS的核酸区段上。
本发明进一步优选的实施方案是一个宿主细胞,该宿主细胞用包含HAS基因的重组载体制备为重组体。该优选的重组宿主细胞可为原核细胞。在另一个实施方案中,该重组宿主细胞可为真核细胞。如在此处所用的,术语“基因工程处理的”或“重组”细胞是要指向其中引入了重组基因如编码HAS的基因的细胞。因此,基因工程处理的细胞与不含有重组引入的基因的天然存在的细胞可区别。因而,基因工程处理的细胞是具有人工引入的基因的细胞。重组引入的基因将为cDNA基因的形式,基因组基因的拷贝,或者包括位于启动子附近的基因,该启动子天然地与引入的特定基因无关。
当人们想要用除链球菌之外的宿主生产重组HA合成酶时,有利的是应用原核系统如大肠杆菌、芽孢杆菌菌株、乳球菌属(Lactococcus sp.),或者甚至用真核系统如酵母或中国仓鼠卵巢细胞、非洲绿猴肾细胞、VERO细胞等。当然,在着手该工作时,通常需要的是使HA合成酶基因处于选择的替代宿主中有功能的序列的控制之下。该适当的DNA控制序列以及其构建和使用通常是本领域中众所周知的,如在下文中更加详细讨论的。例如,在一个优选的实施方案中,宿主细胞可为芽孢杆菌细胞,如枯草芽孢杆菌或地衣芽孢杆菌细胞,且在其中引入的载体含有与has基因可操作地连接的芽孢杆菌相容性启动子。
在更优选的实施方案中,宿主细胞是芽孢杆菌细胞,如嗜碱芽孢杆菌(Bacillus alkalophilus)、解淀粉芽孢杆菌(Bacillusamyloliquefaciens)、短芽孢杆菌(Bacillus brevis)、环状芽孢杆菌(Bacillus circulans)、Bacillus clausii、凝结芽孢杆菌(Bacillus coagulans)、坚强芽孢杆菌(Bacillus firmus)、灿烂芽孢杆菌(Bacillus lautus)、迟缓芽孢杆菌(Bacillus lentus)、地衣芽孢杆菌、Bacillus metaterium、短小芽孢杆菌(Bacilluspumilus)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)、枯草芽孢杆菌和苏云金芽孢杆菌(Bacillus thuringienisis)。
在优选的实施方案中,编码HA合成酶的DNA区段进一步包括本领域中公知的功能为复制或“复制子”起点的DNA序列,该序列使得能够由特定的宿主进行连续的序列的复制。这种起点使得能够制备染色体外定位的且复制的嵌合体区段或质粒,在其中连接了HA合成酶DNA序列。在更优选的的例子中,应用的起点是能够在适合于生物技术应用的细菌宿主中复制的。然而,对于更加多功能的克隆DNA区段,想要的是可选择地甚至额外地应用由其他想要应用的宿主系统识别的起点(如在穿梭载体中)。
其他复制起点如SV40、多形瘤或牛乳头状瘤病毒起点的分离和应用是本领域的技术人员众所周知的,其中所述病毒可应用于许多高等生物的克隆或表达。在某些实施方案中,本发明因而可按照重组转化载体而限定,该载体包括编码HA合成酶的基因序列和适当的复制起点,并在选择的控制区的控制之下。
因而,本领域的技术人员可理解的是按照本发明的公开内容,可使用其他的方式获得HAS基因或cDNA。例如,可获得聚合酶链反应或RT-PCR生产的DNA片段,该片段含有来自许多来源的基因或cDNA的全长互补物,该来源包括链球菌的其他菌株,或者来自真核来源如cDNA文库。事实上可将任何分子克隆方法用于生成根据本发明的DNA片段。因而,通常对用于DNA分离的特定方法的唯一限制是分离的核酸应该编码生物学功能性等价物HA合成酶。
一旦已分离DNA,则将其与选择的载体连接在一起。事实上可应用根据本发明的任何克隆载体以实现该优点。一般有用的载体包括用于原核生物的质粒和噬菌体,及甚至用于真核生物的病毒载体。例子包括pKK223-3、pSA3、重组的λ、SV40、多形瘤、腺病毒、牛乳头状瘤病毒和反转录病毒。然而,人们相信当应用能够在乳球菌属或芽孢杆菌菌株和大肠杆菌两者中复制的载体时,最终可实现特别的优点。
如这些由Dao和Ferretti的pSA3载体或Trieu-Cuot等人的pAT19载体所示例的载体使得人们能够在容易操作的宿主如大肠杆菌中进行克隆群体选择,并随后转移入食品等级的乳球菌属或芽孢杆菌菌株中以生产HA。这些是用于生产某些食品和生物技术产品的良性和充分研究的生物。这些在下面情况中是有利的,即人们可通过基因剂量作用(即通过扩增而提供额外拷贝的HA合成酶基因)和/或包括额外的基因来增加乳球菌属或芽孢杆菌菌株合成HA的能力,从而增加HA前体的可用性。细菌合成HA的固有能力也可通过形成额外的携带HA合成酶基因的质粒拷贝或扩增该质粒而增加。该扩增可导致质粒拷贝数目及因此的HA合成酶基因拷贝数目中10-倍的增加。
可进一步增加HA合成酶基因拷贝数目的另一个程序是向质粒中插入多拷贝的基因。另一种技术可包括将HAS基因整合入染色体DNA中。该额外的扩增尤其可行,这是因为细菌HA合成酶基因是小的。在一些计划中,将染色体DNA-连接的载体通过使用能够在选择的宿主中表达插入的DNA的载体来应用于转染宿主,该宿主是为筛选的目的而选择的,如大肠杆菌。
在另一个优选的实施方案中,HA合成酶基因是通过同源或异源重组而引入到宿主细胞染色体中的。has基因在这种构型中更加稳定,尤其是当无药物选择时。多种载体可用于将has基因引入到芽孢杆菌中,如pTLH或pKSV7,或者引入到酵母中,如YIp211,或者引入到动物细胞中,如pcDNA/FRT。首先将DNA通过转化、转导或电穿孔引入到宿主细胞中。然后将具有has基因的DNA区段稳定地整合入宿主染色体中。例如,spH4S基因用于通过转导和整合修复链球菌染色体的突变;该操作结果导致HA的生产(DeAngelis等人,1993)。
当应用真核来源如皮或滑膜成纤维细胞或公鸡鸡冠细胞时,人们想要首先通过制备cDNA文库而进行。这是首先通过从上述细胞中分离mRNA而实施的,随后用具有反转录酶活性的酶制备双链cDNA并与选择的载体连接。在本领域中对于双链cDNA的制备许多可能性都是可用且公知的,且所有这种技术都认为是可采用的。优选的技术包括反转录。一旦获得了双链cDNA群体,则在选择的宿主中通过可接受的技术制备cDNA文库,如通过连接入适当的载体中并在适当的宿主中扩增。由于所获得的极大数目的克隆及通过在此处提出的技术筛选极大数目克隆的容易性,人们可想要应用噬菌体表达载体以克隆和表达筛选cDNA克隆,如λgt11、λgt12、λGem11和/或λZAP。
在某些其他的实施方案中,本发明涉及分离的DNA区段和重组载体,它们在其序列中包括基本在SEQ ID NOS:1、9、11、13、15、17和19的至少一个中提出的核酸序列。例如,术语“基本在SEQID NO:1中提出的”是以与上述的相同的意义使用的,意思是核酸序列基本相应于SEQ ID NO:1的部分,且具有相对少的与SEQ ID NO:1的密码子不同或不是功能等价物的密码子。术语“功能等价物密码子”在此处用于指编码相同氨基酸的密码子如精氨酸或丝氨酸的6个密码子,且也可指编码在表I中提出的生物学等价的氨基酸的密码子。
也可理解氨基酸和核酸序列可包括额外的残基,如额外的N-或C-末端氨基酸或额外的5’或3’核酸序列,且仍然是基本如在此处公开的序列之一中提出的,只要该序列满足上文提出的标准,该标准包括当涉及蛋白质表达和酶活性时维持生物学的蛋白质活性。末端序列的添加特别地应用于核酸序列,该序列包括如在侧面与编码区的5’或3’部分相接的多种非编码序列,或可包括已知在基因中存在的多种内部序列。特别地,真核生物中has基因产物的氨基酸序列比在原核生物中发现的大大约40%。
虑及遗传密码的简并性以及保守和半保守的替代,与SEQID NOS:1、9、11、13、15、17或19的核苷酸具有约40%~约80%的一致性的;或者更优选地为约80%~约90%的一致性的;或者更加优选地为约90%~约99%的一致性的。序列为“基本如在SEQ ID NOS:1、9、11、13、15、17或19中提出的”序列;基本与那些在SEQ ID NOS:1、9、11、13、15、17或19中提出的序列相同的序列也可功能性地定义为能够在标准或较低严格性杂交条件下与含有SEQ ID NOS:1、9、11、13、15、17或19的互补物的核酸区段杂交的序列。适当的标准杂交条件是本领域技术人员众所周知的,并在此处明确地提出。
如在此处所用的术语“标准杂交条件”用于描述这样的条件,即在该条件下基本互补的核酸区段将形成标准的沃森-克里克碱基对。已知有许多因子决定结合或杂交的特异性,如pH、温度、盐浓度、如甲酰胺和二甲基亚砜等试剂的存在、杂交的区段的长度等。当预期将较短的核酸区段用于杂交时,例如约14和约100个核苷酸之间的片段,杂交的盐和温度优选的条件将包括40-50℃时1.2-1.8×的高磷酸盐缓冲液(HPB)。
自然地,本发明也包含与在SEQ ID NOS:1、9、11、13、15、17或19中提出的序列互补或基本互补的DNA区段。“互补”的核酸序列是那些能够根据标准的沃森-克里克互补原则进行碱基配对的。如在此处所用的,术语“互补序列”指基本互补的核酸序列,如可由在上文中提出的相同的核苷酸比较进行估计的,或定义为能够与SEQ ID NOS:1、9、11、13、15、17或19的核酸区段进行杂交的。
不管其本身编码序列的长度怎样,本发明的核酸区段可与其他DNA序列组合,如启动子、聚腺苷酸化信号、额外的限制性酶切位点、多克隆位点、抗原决定部位标记、多组氨酸区域、其他编码区段等,从而其总长度可有相当大的变化。因此预期可应用几乎任何长度的核酸片段,其总长度优选地受到在想要的重组DNA规程中制备和使用的容易性的限制。
自然地,也应理解本发明不局限于分别为SEQ ID NOS:1、9、11、13、15、17和19和SEQ ID NOS:2、10、12、14、16、18和20的特定的核酸和氨基酸序列。因此重组的载体和分离的DNA区段可不同地包括HAS编码区本身、在基本编码区中具有选择的替代或修饰的编码区,或者它们可编码较大的多肽,然而该多肽包括HAS-编码区,或可编码具有氨基酸序列变体的生物学功能性等价物蛋白质或肽。
长期以来猜测Carter A型多杀巴斯德氏杆菌的被膜含有透明质酸(HA)。多杀巴斯德氏杆菌的透明质酸的表征导致它和seHAS和spHAS蛋白质之间的有趣的酶学差异。
多杀巴斯德氏杆菌细胞产生易于看到的细胞外HA被膜,且由于两种链球菌HAS是膜蛋白质,所以检验了鸡霍乱病原体的膜制备物。在早期的试验中,当在与那些测量链球菌HAS活性的条件相似的条件下测定时,源自单独超声处理的粗制膜组分具有非常低水平的UDP-GlcNAc-依赖性UDP-[14C]GlcUA向HA的整合[~0.2pmol的GlcUA转移(μg蛋白质)-1h-1]。来自具有重组hasA质粒的大肠杆菌的酶也首先是抗分离的。这些结果与用相似的方法从链球菌获得的易于探测的量相反。
在蛋白酶抑制剂存在时用冰冷的裂解酶处理的可选择的制备规程与超声处理一起使得能够从两种革兰氏阴性细菌的物种中基本恢复HAS活性。特定的HAS活性,即转移的5-10pmolGlcUA(μg蛋白质)-1h-1,通常能从野生型多杀巴斯德氏杆菌的粗制膜中用新方法获得。在UDP-GlcNAc不存在时,在较高分子量的材料中几乎未整合来自UDP-[14C]GlcUA的放射性(是用同一方法对两种糖前体进行测定结果的不到1%)。从无被膜的突变体TnA制备的膜当补充了两种糖前体时不具有可探测的HAS活性(数据未显示)。用聚丙烯酰胺葡聚糖S-200柱的凝胶过滤分析显示,自材料在孔隙体积(Void volume)洗脱开始,在体外合成的14C-标记的产物的大多数的分子量≥8×104Da,该值相应于由至少400个单体组成的HA分子。该产物对链霉菌透明质酸酶消化敏感但抗蛋白酶处理。
对HAS测定的参数进行改变以由多杀巴斯德氏杆菌的膜使UDP-糖向多糖的整合最大化。链球菌spHAS需要Mg2+,因此该金属离子包括在多杀巴斯德氏杆菌的膜的最初测定中。多杀巴斯德氏杆菌HAS(pmHAS)在Tris-类型的缓冲液中从pH 6.5~8.6为相对活性的,最适值为pH 7。HAS活性在中性pH下至少1h期间内相对于温育时间是线性的。pmHAS在较高离子强度时是明显低活性的,这是因为向含有pH 7的50mM Tris和20mM MgCl2的反应体系中加入100mM的NaCl减少了~50%的糖整合。
在pH 7时测定了pmHAS的金属离子特异性。在存在EDTA的无金属条件下,没有探测到放射性标记的前体向多糖的整合(<5%的最大信号)。在试验的金属离子(Mg、Mn、Co、Cu和Ni)中Mn2+离子在最低浓度时具有最大的整合率。Mg2+给出Mn2+刺激的50%,但是在10-倍高的浓度上。10mM的Co2+或Ni2+支持较低水平的活性(分别为1mM Mn2+测定的20%或9%),但提供了10mM Cu2+的膜是无活性的。事实上,使10mM Cu2+和20mM Mg2+与膜制剂混合几乎不导致标记向多糖中的整合(<8%的单用Mg的值)。
pmHAS的最初表征是在Mg2+存在时进行的。酶对其糖核苷酸前体的结合亲和力是通过测量表现KM值而测定的。[14C]GlcUA或[3H]GlcNAc向多糖的整合是分别在不同的UDP-GlcNAc或UDP-GlcUA浓度进行监控。在含Mg2+的缓冲液中,UDP-GlcUA的~20μM的表观KM值和UDP-GlcNAc的~75μM的表现KM值是用滴定数据的Hanes-Woolf图([S]/v对[S])来确定的。两种糖的Vmax值是相同的,这是因为相应于1/Vmax的Hanes-Woolf图的斜率是相同的。与用Mg2+测定的结果相比较,在Mn2+存在时UDP-GlcNAc的KM值增加了约25-50%到~105μM,且Vmax增加了2-3-倍。
来自多杀巴斯德氏杆菌、类马链球菌或酿脓链球菌的HA合成酶利用UDP-糖,但它们在pH和金属离子依赖性和KM值方面具有一些不同的动力学最适值。该酶在pH 7时是最大活性的;然而,据报道pmHAS在微酸性pH时具有更大的活性且在大于pH 7.4时相对无活性。在体外测定条件下pmHAS利用Mn2+比利用Mg2+更有效,但细菌细胞中生理学金属辅因子的特性是未知的。作为比较,在前文用链球菌酶的研究中Mg2+大大好于Mn2+,虽然在比最适的Mg2+浓度低~10-倍的浓度时Mn2+作用是最大的。pmHAS结合UDP-糖明显地比spHAS更紧密。对于每一种底物,在粗制膜中测量的pmHAS的KM值比那些从发现于链球菌膜中的HAS获得的低约2-3-倍:UDP-GlcUA分别为50或39μM,UDP-GlcNAc分别为500或150μM。
通过动力学分析,pmHAS的Vmax在Mn2+存在时比在Mg2+存在时高2-3-倍,但在用前一种离子的测定中UDP-GlcNAc的KM值稍微增加了。该明显降低的亲和力提示增加的多聚化速率不是归因于Mn2+离子/糖核苷酸复合物与酶活性位点的更好的结合的。因此,可能的是Mn2+增强了一些其他的反应步骤,改变了酶的另一个位点/结构,或修饰了磷脂膜环境。pmHAS的基因序列和蛋白质序列分别显示于SEQ IDNO:9和10中。
小球藻病毒(Chlorella virus)PBCV-1编码可合成透明质素的有功能的糖基转移酶。该发现与通常对病毒的以下观察相反,即:(a)病毒利用宿主细胞的糖基转移酶来生成新的糖结构或者(b)在病毒体成熟过程中积聚宿主细胞的糖缀合物。此外,通常认为HA仅限于动物和少数其毒性细菌病原体中。尽管已对许多植物糖类进行了表征,但在植物或原生生物细胞中以前未发现HA或相关的类似物。
脊椎动物、细菌和病毒HAS酶具有几个序列相似区。在对病毒PBCV-1[缘草履虫小球藻病毒]的基因组双链DNA进行测序时,发现了一个ORF[可读框]即A98R(访问号#442580),该ORF编码与多种HAS具有28~33%的氨基酸一致性的567个残基的蛋白质。该蛋白质命名为cvHAS(小球藻病毒HA合成酶)。编码PBCV-1的基因序列和其编码的蛋白质序列分别显示于SEQ ID NO:7和8中。
PBCV-1是大的(直径为175-190nm)多角体噬斑形成性病毒科(藻DNA病毒科)的原型,该科病毒在某些单细胞的真核小球藻样绿藻中复制。PBCV-1病毒体含有至少50个不同的蛋白质和位于外层糖蛋白被膜内侧的脂质成分。PBCV-1基因组是具有共价闭合发夹末端的线性且无序列改变的330-kb长的dsDNA分子。
基于其推断的氨基酸序列,A98R基因产物应为整合膜蛋白质。为了检验该假说,在大肠杆菌中生产了重组A98R,并对膜组分进行了HAS活性的测定。UDP-GlcUA和UDP-GlcNAc是通过源自在质粒pCVHAS上含有A98R基因的细胞的膜组分而整合到多糖中的(平均的特异性活性为2.5pmoles GlcUA转移/μg蛋白质/分钟),而不是通过来自对照细胞的样品的(<0.001pmoles GlcUA转移/μg蛋白质/分钟)。在用pCVHAS转化的细胞的可溶性组分中未探测到活性。UDP-GlcUA和UDP-GlcNAc对于多聚化是同时需要的。其活性在10mMMnCl2存在时的pH 7.2的Hepes缓冲液中是最适的,而在不含该金属离子时探测不到活性。在相似的浓度Mg2+和Co2+的有效性仅为Mn2+的~20%。pmHAS具有相似的金属需求,但其他HAS偏好Mg2+
重组A98R酶合成了平均分子量为3-6×106Da的多糖,该多糖比由重组s pHAS或DG42x l HAS在体外合成的HA小(分别为~107Da和~5-8×106Da)。该多糖被Streptomyces hyaluroniticusHA裂解酶完全降解,该酶能使HA解聚,但不使结构上相关的糖胺聚糖如肝素和软骨素解聚。
对PBCV-1感染的小球藻细胞进行了A98R基因表达的检查。在感染后~15分钟出现了~1,700个核苷酸的A98R转录物,且该转录物在感染60分钟之后消失,从而显示A98R是早期基因。随后,对来自未感染的和PBCV-1感染的小球藻细胞的膜组分在感染后50和90分钟进行了HAS活性的测定。感染的细胞而不是未感染的细胞具有活性。与细菌来源的重组A98R酶一样,放射性标记从UDP-[14C]GlcUA向多糖的整合依赖于Mn2+和UDP-GlcNAc两者。该放射性标记的产物也被HA裂解酶降解。破坏的PBCV-1病毒体不具有HAS活性。
对PBCV-1感染的小球藻细胞用高度特异性的125I-标记的HA-结合蛋白质进行了HA多糖的分析。来自感染后50和90分钟时细胞的提取物含有大量的HA,但来自未感染的藻类或破坏的PBCV-1病毒体含有HA。标记的HA-结合蛋白质也与感染后50和90分钟的完整感染细胞进行相互作用,但不与健康细胞相互作用。因此,新合成的HA多糖的相当大部分是固定于感染的藻类的细胞外表面的。细胞外HA在病毒与其藻类宿主之间的相互作用中不起明显的作用,这是因为通过在PBCV-1噬斑测定的顶层琼脂中包括睾丸透明质酸酶(465单位/ml)或自由HA多糖(100μg/ml),噬斑的大小和噬斑的数目均未改变。
PBCV-1基因组也具有编码UDP-葡萄糖脱氢酶(UDP-GlcDH)和谷氨酰胺:果糖-6-磷酸氨基转移酶(GFAT)的额外基因。UDP-GlcDH将UDP-Glc转变为UDP-GlcUA,即HA生物合成的必需前体。GFAT将果糖-6-磷酸转变为葡糖胺-6-磷酸,即UDP-GlcNAc代谢途径中的中间物。与A98R HAS一样,这两个PBCV-1基因在感染早期表达并编码酶活性蛋白质。多个酶在HA生物合成途径中的存在显示HA生产一定在小球藻病毒的生活史中发挥重要的功能。
链球菌、脊椎动物和PBCV-1的HA合成酶具有许多基元,该基元为以相同的相对顺序存在至少2~4个相同的残基的模式。这些保守的基元可能反映如在图2中所示的HA生物合成中关键的结构域。图2是分别来自类马链球菌和乳房链球菌的C组seHAS和suHAS;来自酿脓链球菌的A组spHAS;小鼠同工酶mHAS1、mHAS2和mHAS3;人同工酶hHAS1、hHAS2和hHAS3;蛙同工酶xlHAS1和xlHAS2;最初的PBCV-1病毒HAS、cvHAS以及新病毒HASs vNC、vMA、vAL和vCA;大鼠rnHAS2;鸡ggHAS2;牛btHAS2和兔同工酶ocHAS2和ocHAS3的蛋白质序列的比对。图2的比对是用Mutalin 5.4.1版的多重比对程序实现的(版权I.N.R.A.法国1989、1991、1994、1996;用等级聚类(hierarchical clustering)的多重序列比对,Corpet,Nucl.AcidsRes.,16:10881(1988))。在比对的较下面的线上提供了一致线(consensus line)。一致线中的大写字母代表所列的所有HAS蛋白质中相同的残基,而小写字母代表那些在所有情况下均不相同的一致残基。一致线也含有下面的符号:!是I、V的任何一个;$是L、M的任何一个;%是F、Y的任何一个;#是N、D、Q、E、B、Z的任何一个。符号比较表为blosum62,缺口权重为12,且缺口长度权重为2。
当对更多的糖基转移酶进行测序时,也发现了HAS和其他从UDP-糖前体合成β-连接的多糖的酶之间相似性的区域。例子包括细菌纤维素合成酶、真菌和细菌几丁质合成酶和各种HAS。当糖基转移酶的三维结构信息积聚时,这些相似的结构基元的重要性将变得明显。
图3描述已知的透明质素合成酶之间的可能的进化关系。图3的系统树是用DNAsis多重比对程序通过Higgins-Sharp算法生成的。计算的匹配百分数显示于系统树的每一个分支上。
本发明的DNA区段包含生物学功能性等价物HAS蛋白质和肽。这种序列可作为已知天然发生于核酸序列及其编码的蛋白质中的密码子丰余性和功能性等价性的结果而出现。可选择地,功能性等价物蛋白质或肽可通过应用重组DNA技术而生成,其中基于对交换的氨基酸的特性的考虑可进行对蛋白质结构的改变。人工设计的改变可通过应用定点诱变技术而引入,如改进酶活性或HAS蛋白质的抗原性,或者检验HAS突变体以在分子水平检查HA合成酶活性。
同样地,HAS编码区中的特定改变可导致具有修饰的大小分布或结构构型的HA的生产。本领域的技术人员可理解可以以生产改变的透明质酸合成酶的方式对HAS编码区进行处理,这反过来能够生产具有不同多聚体大小和/或功能能力的透明质酸。例如,可以以透明质酸合成酶具有改变的糖底物特异性的方式对HAS编码区进行改变,从而透明质酸合成酶生成新的透明质酸样的多聚体,该多聚体整合了不同的结构如以前未整合的糖或糖衍生物。该新整合的糖将产生具有不同功能特性的透明质酸、具有较小或较大多聚体大小/分子量的透明质酸或两者。在给定HAS编码序列的情况下,本领域的技术人员可以理解可对HAS编码序列进行改变和/或替代,从而可实现这些想要的特性和/或大小的修饰。表II列出了重组seHAS的糖核苷酸特异性和镁离子需求。
表II
重组seHAS的糖核苷酸特异性和镁离子需求
Figure G2009100068380D00621
*膜(324ng蛋白质)与120μM UDP-[24C]GlcUA(2.8×104dpm)或300μM UDP-[3H]GlcNAc(2×104dpm)在37℃温育1小时。在显示的第二个非标记的糖核苷酸存在时使用放射性标记的糖核苷酸。HA合成酶活性是如在申请中描述的进行确定的。
如在此处所用的术语“修饰的结构”表示含有通常不发现于天然存在的HA多糖中的糖或衍生物的透明质酸多聚体。术语“修饰的大小分布”指大小分布通常不发现于天然酶中的透明质酸分子的合成;所设计的大小比正常的小或大。
不同大小的各种透明质酸产物已应用于各个领域,如药物送递中。如果约4~约20个单糖的透明质酸多聚体可以以好的量制备,那么在血管发生和伤口愈合中的应用将有很大潜力。小的透明质酸寡糖的另一个特别的应用是用于医学目的的重组人蛋白质的稳定化。这种蛋白质的主要问题是其从血液中的清除和短的生物学半衰期。对该问题的一个现有的解决方法是偶联一个小分子的屏蔽,该屏蔽防止该蛋白质太快地从血液循环中清除。非常小分子量的透明质酸非常适用于该角色且为非免疫原性的和生物相容性的。附着到药物或蛋白质上的较大分子量的透明质酸可用于导向具有透明质酸的内吞受体的网状内皮细胞系统。
在该公开内容的启示下,本领域的技术人员可理解有几个途径可对由透明质酸合成酶制备的透明质酸多聚体的大小分布进行调节以得到不同的大小。首先,产物大小的动力学控制可通过降低温度、降低酶反应时间及降低一种或两种糖核苷酸底物的浓度而进行改变。降低这些变量的任何一项或全部将得到透明质酸产物的较小的量和较小的大小。这些方法的缺点是产物的产量也将降低,且可能难以实现天与天或批与批之间的可重复性。
其次,HA多聚体的大小分布可通过改变酶合成大的透明质酸产物的内在能力而调节。对蛋白质的改变可通过重组DNA技术进行处理,如特定氨基酸的替代、缺失和添加(或者甚至通过代谢处理引入辅基)。然后这种产生内在较慢的酶的改变使得能够通过动力学方式对透明质酸的大小进行更多的可重复性控制。最终的透明质酸大小分布是通过酶的某些特征决定的,该特征依赖于序列中的特定的氨基酸。在链球菌酶和真核透明质酸合成酶之间绝对保守的残基的20%中,在特定的位置有一套氨基酸控制或巨大地影响酶可制备的透明质酸多聚体的大小。这些残基的任何一个的特定的改变都可产生修饰的HAS,该HAS产生具有修饰的大小分布的HA产物。在透明质酸释放之前对降低酶可制备的透明质酸的内在大小的seHAS、spHAS、suHAS、pmHAS或cvHAS进行的改变将提供生产透明质酸产物的有力方式,该透明质酸产物的大小比天然的酶的小或潜在的大。
最后,大分子量的透明质酸可用特定的透明质酸酶进行降解以制备低分子量的透明质酸。然而,该实践非常难以实现可重复性,且人们必须小心翼翼地再次纯化透明质酸以去除透明质酸酶和不想要的消化产物。
如在图4中所示的,可对透明质素合成酶进行处理以同正常的野生型酶相比生产不同大小的透明质酸多聚体,特别是较小的。该图显示一系列spHAS酶的HA大小的分布(分子量测量为百万道尔顿),对每一种酶均用定点诱变进行了处理以使其与天然的酶具有单一的氨基酸改变。每一种均用丙氨酸替代了不同的半胱氨酸残基。具有空心符号的5个曲线的聚合代表下面的spHAS蛋白质:野生型、C124A、C261A、C366A和C402A。实心的圈代表仅为部分活性的很少表达的C225A蛋白质。
实心三角形代表C280A spHAS蛋白质,人们发现该蛋白质可合成比正常的酶或所示的其他变体范围小许多的HA多聚体。这种实践显示对透明质酸合成酶进行处理以合成想要的HA产物大小的范围是可行的。在此处公开的编码透明质酸合成酶的HAS基因的任何一种也可通过定点诱变进行处理以生产合成想要的HA产物大小范围的酶。
结构上修饰的透明质酸在概念上与通过在想要的HAS或spHAS中改变特定的氨基酸而改变透明质酸产物的大小分布是没有区别的。预期UDP-GlcNAc的衍生物是特别有用的,在其中N-乙酰基团是缺失的UDP-GlcN或是用另一个化学上有用的基团进行替代的。强的底物特异性必须依赖于保守的20%的氨基酸中的特定氨基酸亚组。对一个或多个这种残基的特定的改变生成了有功能的合成酶,该合成酶可比天然的酶以较低的特异性与一种或多种底物进行相互作用。然后该改变的酶将利用可选择的天然或特定的糖核苷酸以整合糖衍生物,该糖衍生物设计为使得不同的化学性质能够用于下面的目的:(i)为了普通或定向的药物递送、放射学程序等,使结构上修饰的透明质酸与特定的药物、蛋白质或毒素共价偶联;(ii)使透明质酸自身或与其他支持体进行共价偶联以形成凝胶或其他具有更强的物理特性的三维生物材料,及(iii)使透明质酸与一种表面进行偶联以形成生物相容性的膜或单分子层。
也可对细菌进行基因工程处理以生产透明质酸。例如,我们生成了含有HAS基因以及糖核苷酸前体之一的基因的枯草芽孢杆菌菌株。我们之所以选择该菌株是因为它经常用于生产人用产物的生物技术工业中。这些细菌想要作为能够以比现在用野生型天然菌株可获得的更大量生产透明质酸的细菌世代的第一个世代原型。
例如,构建了3个枯草芽孢杆菌菌株以含有透明质素合成酶(spHAS)和UDP-葡萄糖脱氢酶(hasB)的酿脓链球菌基因之一或两者,其结果显示于表III中。基于对HA进行探测和定量的敏感的商业放射分析测定,可确定具有两个基因的菌株(#3菌株)生产HA并将其分泌到培养基中。亲代菌株或仅有脱氢酶基因的菌株(#1菌株)不生产HA。仅含有spHAS基因的#2菌株生产HA,但仅为#3菌株所生产的约10%。琼脂糖凝胶电泳显示由#3菌株分泌到培养基中的HA具有非常高的分子量。
表III数据表明枯草芽孢杆菌168可以通过重组DNA技术引入spHAS基因和hasB基因,从而经过基因工程处理而生产和分泌HA。尽管在不引入hasB基因的情况下,该修饰的菌株也能生产HA,但是有了hasB之后,HA的水平会大大提高。枯草芽孢杆菌168含有两个基因(tauD和gtaB),它们能够提高HA合成所需的两种糖核苷酸的水平。表IV证明当对其进行处理以含有并(在质粒pSM143中,ATCC)表达seHAS以及特定seHAS变体(该变体是进行处理以生产与野生型相比大小不同的HA的)时,枯草芽孢杆菌168也制备HA,即使在hasB基因不存在时。特别地,变体seHAS(C226A)和seHAS(C281A)支持活枯草芽孢杆菌168细胞中的HA合成。这些后一种情况中的HA合成水平比用表达spHAS和hasB基因观察到的低,这归因于HA合成所需的两种前体的较低的内源水平。
用从枯草芽孢杆菌168细胞分离的膜的体外试验证明由这些修饰的HAS酶制备的HA的大小分布分别比由野生型seHAS制备的大和小,其中所述枯草芽孢杆菌168细胞用含有hasB和seHAS(C226A)或seHAS(C281A)变体的质粒进行转化了。在枯草芽孢杆菌中从野生型seHAS生产的HA的大约大小是1.5MDa。
在地衣芽孢杆菌和粪肠球菌(Enterococcus faecalis)中也已证明了重组HA从spHAS基因的生产。图6是对HA染色的琼脂糖凝胶的数字图象。在具有编码spHAS(pPD41Δ5)的质粒的枯草芽孢杆菌、地衣芽孢杆菌和粪肠球菌菌株中可看到HA生产。作为负对照,将含有无功能的hasA基因(pPD41ΔEcoR V)的质粒引入到每一个菌株中,且这些菌株均不能生产HA。
表III
含有spHAS和hasB基因的枯草芽孢杆菌168中HA的生产
Figure G2009100068380D00651
(*)大多数HA在培养基中但一些是细胞结合的;HA是用购自Pharmacia的HA Test 50试剂盒进行确定的。
表IV
枯草芽孢杆菌168中生产的透明质素(HA)
  重组菌株   HA(g/L)ELISA方法
  pPD41Δ5中的spHAS WT   5.16
  pSM143中的seHAS WT   0.37
  pSM143中的seHAS(C226A)   0.25
  pSM143中的seHAS(C281A)   0.32
  枯草芽孢杆菌168中的pSM143(载体自身)   0.05
使100ml培养物生长过夜;培养基通过购自Corgenix(透明质酸“Chugai”)的HA检验试剂盒进行分析。
这些实验利用通常与这些基因相连的链球菌启动子以驱动蛋白质表达。人们预期用在革兰氏阳性的或芽孢杆菌相容的启动子控制下的spHAS或seHAS读框构建菌株将产生更好的结果。所用的载体是革兰氏阳性/大肠杆菌穿梭载体,该载体在枯草芽孢杆菌中具有中等的拷贝数和红霉素抗性基因(使得在枯草芽孢杆菌中能够对8μg/ml产生抗性,在大肠杆菌中能够对175μg/ml产生抗性)。所用的枯草芽孢杆菌宿主菌株是来自BGSC的1A1且可形成孢子,该菌株具有色氨酸需求但在其他方面是野生型的。细胞生长和HA生产是在SpizizensMinimal Media加色氨酸、葡萄糖、痕量元素和红霉素(8μg/ml)中进行的。在32℃时的剧烈搅拌中进行生长直到培养基耗尽(~36个小时)。
表III和IV证明这些进行了生物工程加工的细胞当用spHAS或seHAS基因转化时能够生产透明质酸,它们正常时是不能生产的。在此处描述的HAS基因的任何一个也能够引入到非透明质酸生产性细菌中以生成能够生产透明质酸的生物工程加工的菌株。
当转向在此处所描述的来自基因组DNA或cDNA的HAS基因之一的表达时,人们可制备用于重组制备HAS蛋白质的表达系统。用于在原核或真核系统中表达的DNA区段的处理可通过重组表达领域中的技术人员通常知道的技术来实现。
HAS可成功表达于真核表达系统中,然而本发明者主张细菌表达系统可用于所有目的的HAS制备。人们相信细菌表达最终将在应用的容易性、生产成本和因而获得的材料的数量方面比真核表达更有利。
链球菌透明质素合成酶(seHAS)的纯化显示于表V和图7中。来自纯化方案的各个阶段的级分是通过在12.5%的凝胶上的SDS-PAGE进行分析的,然后将其用考马斯亮蓝R-250染色。泳道:分子量标记;1,含有重组seHAS-H6的大肠杆菌全细胞膜;2,在用去污剂对膜进行增溶后的不溶性级分;3,去污剂增溶的级分;4,从Ni-NTA层析树脂中流过的;5-9,5次连续的对柱的洗涤(每次以两倍柱的体积);10,单一条带的洗脱的纯HA合成酶。spHAS的纯化与seHAS所显示的相同(Tlapak-Simmons,1999)。
表V
  步骤   总蛋白质(μg)   特定的活性(mmol/μg/hr)   总活性(nmolUDP-GlcUA)   产率(%)   纯化(-倍)
  膜   3690   1.0   3649   100   1.0
  提取物   2128   2.2   4725   129   2.2
  亲和柱   39   13   500   14   13.1
人们认为用编码HAS的DNA区段对宿主细胞的转化将提供获得HAS蛋白质的方便方法。人们同样认为cDNA、基因组序列及其组合适合于真核表达,这是因为宿主细胞当然将对基因组转录物进行加工以产生有功能的mRNA进行蛋白质翻译。
本发明的另一个实施方案是制备蛋白质组合物的方法,该方法包含使包含编码蛋白质的载体的重组宿主细胞生长,该蛋白质包括根据SEQ ID NOS:2、10、12、14、16、18或20的氨基酸序列或具有保守的或半保守的氨基酸变化的功能相似物。宿主细胞将在允许核酸表达和蛋白质生产的条件下生长,随后对这样生产的蛋白质进行回收。HAS和最终HA(包括宿主细胞)的生产,允许核酸表达、蛋白质生产和回收的条件按照本公开内容和在此处描述的方法是本领域的技术人员所知的。
表达透明质酸的优选的宿主是原核生物,如类马链球菌和其他链球菌物种的适当成员。然而,也已知HA可用表达重组HA合成酶的异源宿主细胞来合成,如芽孢杆菌、肠球菌属(Enterococcus)或甚至埃希氏菌属(Escherichia)的物种成员。本发明表达HA合成酶最优选的宿主是用本发明的HAS基因转化的细菌,如乳球菌属(Lactococcus)物种、枯草芽孢杆菌或大肠杆菌。
用于本发明的HA表达方法的最优选的宿主包括芽孢杆菌物种,这是因为这种细胞是有效的工业分泌者,且几个物种已命名为GRAS生物。可用于本发明的方法的芽孢杆菌细胞的例子包括但不局限于嗜碱芽孢杆菌(Bacillus alkalophilus)、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、Bacillus clausii、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、Bacillusmetaterium、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌和苏云金芽孢杆菌。最优选的宿主是枯草芽孢杆菌。
相似地,人们相信几乎任何真核表达系统均可用于表达HAS,如可应用基于杆状病毒(baculovirus)的、基于谷氨酰胺合成酶的、基于二氢叶酸还原酶的系统、基于SV-40的、基于腺病毒的、基于巨细胞病毒的、基于酵母的等。对于这种方式的表达,人们可以使编码序列靠近或在启动子的控制之下。在本领域中可以理解的是为了使编码序列在这种启动子的控制之下,人们使蛋白质的转录读框的转录起始位点的5’末端位于选择的启动子“下游”(即3’)的约1个和约50个核苷酸之间。同样地,酿酒酵母(Saccharomycescerevisiae)表达载体系统如pYES2也可在如显示于图8中的GAL启动子的控制之下生产HAS。图8显示spHAS或xlHAS酶是用pYES2质粒在重组酵母中表达的。当提供了UDP-GlcUA和UDP-GlcNAc时,每一种酶都制备高分子量的HA,如在这些凝胶过滤层析曲线中观察到的(HA峰值在约13ml~约25ml)。
图8表示用表达于酵母膜上的重组HAS合成的透明质酸的凝胶过滤分析。用标准方法将DNA片段亚克隆入pYES2酵母表达载体(购自Invitrogen)中以产生pYES/HA,所述DNA片段编码(a)相应于spHAS的419个氨基酸残基的可读框(最初的Val密码子变为Met)或(b)xlHAS蛋白质。来自具有该构建体的细胞的膜是通过用玻璃珠搅拌而制备的。源自pYES/HA构建体的样品含有大量的HA合成酶活性,且“42kDa”的HAS蛋白质是通过用特异性抗体的蛋白质印迹进行探测的;来自仅具有载体的细胞的膜既不具有活性也不具有免疫反应性条带(未显示)。使膜(315μg蛋白质)首先与无载体的UDP-[14C]GlcUA(1μCi14C)和900μM未标记的UDP-GlcNAc在50mM pH 7的Tris、20mM MgCl2、1mM DTT和0.05M NaCl(450μl反应体积)中于30摄氏度温育1.5分钟。在该脉冲标记之后,然后将非放射性标记的UDP-GlcUA添加至终浓度为900μM。样品(100μL)是在脉冲后于“追踪(chase)”后的1.5分钟(深色圆圈)和15分钟(黑色方形)和45分钟(黑色三角形)获取的。该反应是通过添加SDS至2%并于95摄氏度加热1分钟而终止的。在将半数样品注射入在0.2M NaCl、5mMpH 8的Tris中平衡的聚丙烯酰胺葡聚糖S-500HR凝胶过滤柱(Pharmacia;1×50cm)中之前用离心(10,000×g,5分钟)使样品澄清。
该柱于0.5ml/分钟的速度洗脱,且级分(1ml)中的放射活性是通过在加入了BioSafe II cocktail(4.5ml,ResearchProducts Intl.)之后用液体闪烁计数法进行定量的。孔隙体积和总包含体积(totally included volume)分别在14ml和35.5ml的洗脱体积。蓝色葡聚糖的峰值(平均为2×106Da)在25-27ml处洗脱。在真核酵母细胞中表达的重组HAS在体外生成高分子量的透明质酸。
当预期真核表达时,人们一般也想要将适当的聚腺苷酸化位点(如5’-AATAAA-3’)插入到包括HAS基因或DNA的转录单位中,如果在最初的克隆区段中不含有该聚腺苷酸化位点的话。一般地,使聚腺苷酸化添加位点置于蛋白质终止位点下游约30~2000个核苷酸的位置,并处于转录终止子之前。
人们预期事实上任何常用的真核宿主细胞可用于根据此处的HAS表达。用于表达本发明的HAS cDNA的优选的细胞系的例子包括一般用于真核表达的细胞系,如293、AtT-20、HepG2、VERO、HeLa、CHO、WI 38、BHK、COS-7、RIN和MDCK细胞系。这一般包括提供具有编码HAS酶的重组DNA区段且能够表达该酶的重组宿主的步骤;将重组宿主在下面条件下培养于培养基中,该条件使得克隆的HAS基因或cDNA能够转录且适合于透明质酸的生产;及分离和纯化HAS酶或从重组宿主中分泌的透明质酸。
通常,适合于克隆的HAS基因或cDNA表达的条件将依赖于所应用的启动子、载体和宿主系统。例如,当人们应用lac启动子时,人们可以通过引入可刺激lac转录的材料如异丙基硫代半乳糖苷而诱导转录。例如,克隆的seHAS和spHAS基因是为了如在图5中所示的纯化HAS的目的而在大肠杆菌中表达为含有HIS6的蛋白质的。当应用其他启动子时,可需要不同的材料以诱导或增量调节转录。
图5描述大肠杆菌中重组seHAS和spHAS的过表达。膜蛋白质(每泳道5μg)是用10%(w/v)的凝胶在还原性条件下通过SDS-PAGE进行分级分离的。该凝胶用考马斯亮蓝R-250进行染色、照相、扫描并用molecular dynamics personal densitometer(PDSI P60型号)进行定量。HA合成酶的位置用箭头标记。泳道A是天然的spHAS(A组);泳道C是天然的seHAS;泳道E是重组seHAS;泳道P是重组spHAS;泳道V是单独的载体。所用的标准是Bio-rad的低Mr并以kDa显示。
除获得合成酶表达之外,人们优选地想要提供有利于HA合成的环境,这是通过引入编码糖核苷酸前体生物合成所需的酶的适当基因,或者通过使用含有前体提供酶(precursor-supplyingenzyme)的底物的生长培养基而实现的,该底物如N-乙酰葡糖胺或葡糖胺(GlcNAc或GlcNH2)和葡萄糖(Glc)。
人们将进一步想要在透明质酸酶缺陷的宿主中整合基因,从而由酶合成的产物将不在培养基中降解。此外,可选择宿主使HA的生产最适化。例如,适当的宿主是生产大量糖核苷酸前体以支持HAS酶并使得该酶能够生产大量的HA的。这种宿主可天然地存在,或者可由各种技术包括诱变或重组DNA技术来制备。糖核苷酸合成酶的基因,特别是生产UDP-GlcUA所必需的UDP-Glc脱氢酶也可连同HAS基因或cDNA分离并整合到载体中。本发明的一个优选的实施方案是含有这些辅助的重组基因或cDNA的宿主,因而使得能够有糖核苷酸及因此的HA的增加的生产。
人们相信用于培养宿主细胞的方法不是特别关键的。为了有用的细节,人们可以参考美国专利No s.4,517,295;4,801,539;4,784,990或4,780,414的公开内容,它们均在此处明确地整体引用作为参考。当应用原核宿主如类马链球菌时,人们可能想要在厌氧的条件下在富含CO2的液体生长培养基中使细菌发酵。这使得能够有比在好氧情况下更大的HA生产。另一个考虑是厌氧生长的链球菌细胞不生产致热性外毒素。适当的生长条件可依照本公开内容对其他的原核宿主进行设定,如本领域的技术人员公知的。
一旦已构建了合适的宿主并在适合于HA生产的条件下进行培养,那么人们将想要分离这样生产的HA。一般地,HA将被分离或由重组生物释放到周围的培养基中,从而使得能够易于用公知的技术从培养基中分离HA。例如,HA可至少通过过滤、离心和絮凝作用之一而从细胞和残渣中分离,且三氯乙酸的添加可进一步促进细胞和残渣与透明质酸的分离。然后HA可通过沉淀、超滤和透析的至少一种而从培养基中分离。沉淀剂包括醇如乙醇和异丙醇、有机溶剂或化合物如丙酮或有机(脂族的带正电荷的)季铵盐如鲸蜡基氯化吡啶鎓(CPC)或鲸蜡基溴化三铵(CTB)。
用于分离HA的优选的技术描述于美国专利No.4,517,295中,该专利在此处引入作为参考,在其中于发酵末期将有机羧酸即三氯乙酸添加到细菌悬浮液中。三氯乙酸导致细菌细胞凝块并死亡,并促进这季铵盐些细胞和关联的残渣与想要的产物HA分离的容易性。将澄清的上清液浓缩并透析以去除包括有机酸的低分子量的污染物。前述的程序利用通过过滤盒的过滤程序,如那些含有0.22μm孔大小的滤器。继续渗滤直到溶液的导电性降低到约0.5百万欧姆。
浓缩的HA是通过添加过量的试剂级的乙醇或其他有机溶剂而沉淀的,且沉淀的HA然后通过用乙醇洗涤和真空干燥进行干燥、冻干以去除乙醇。然后HA可再溶解于pH 8的硼酸盐缓冲液中,并用CPC或某些其他的有机铵盐如一种混合的三甲基溴化铵溶液CETAB于4摄氏度进行沉淀。沉淀的HA是通过粗过滤进行回收的,并重悬于1MNaCl中,如进一步在上文中参考的专利中描述的进行渗滤和浓缩。结果所得的HA是过滤除菌的,并依赖于想要的最终用途易于转变为适当的盐、干粉或无菌的溶液。
A.可采用的一般的基因工程方法
如果将无强大的细胞膜屏障的细胞用作宿主细胞,那么转化可通过本领域的技术人员众所周知的磷酸钙沉淀方法实现。然而,其他方法也可用于将DNA引入细胞中,如通过核注射、阳离子脂质、电穿孔、原生质体融合或通过由DuPont开发的BIOLISTICTM生物颗粒送递系统(1989)。使用DuPont系统的优点是高的转化效率。如果使用原核细胞或含有大量细胞壁结构的细胞,那么优选的转化方法是用氯化钙诱导感受态的钙处理或电穿孔。
含有想要的克隆和控制序列的适当的载体的构建应用标准的连接技术。将分离的质粒或DNA片段进行切割、剪切并以想要构建想要的质粒的形式进行再连接。切割是在适当的缓冲液中通过用限制性内切酶处理来实现的。通常,在约20μl缓冲液中约1μg的质粒或DNA片段使用约1单位的酶。用于特定的限制性内切酶的合适缓冲液和底物数量由生产商详细说明。于37℃约1小时的温育时间是可用的。
在温育之后,蛋白质通过用酚和氯仿提取而去除,且核酸是通过乙醇沉淀从水相级分中回收的。如果需要平末端,那么将制剂于15℃用10单位的聚合酶I(Klenow)处理15分钟、进行酚-氯仿提取并用乙醇沉淀。为了连接,约等摩尔量的想要成分(进行了剪切以提供正确配对)用每0.5μg DNA约10单位的T4DNA连接酶进行处理。当将切割的载体用作成分时,有用的是通过用细菌碱性磷酸酶预处理以防止切割的载体的再连接。
对于在构建的质粒中证实功能序列的分析,第一个步骤是通过于30-32℃进行转化以克隆入特定的感受态大肠杆菌SURE细胞(Stratagene)中而扩增质粒DNA。其次,将重组质粒用于转化大肠杆菌K5菌株Bi8337-41,该菌株可生产UDP-GlcUA前体,且成功的转化体是通过适当的抗生素抗性进行选择的。然后对来自转化体文库的质粒进行筛选以获得展示HA生产的细菌菌落。将这些菌落挑取、扩增,且将质粒用限制酶切作图进行纯化和分析。然后将显示功能性HAS基因迹象的质粒进一步通过本领域的技术人员公知的许多序列分析技术进行表征。
B.来源和宿主细胞培养物和载体
通常,将原核生物用于DNA序列的起始克隆和本发明中有用的载体的构建。人们相信适当的来源为革兰氏阳性细胞,特别是那些源自C组链球菌菌株的。具有单一的膜但具有厚细胞壁的细菌如葡萄球菌(Staphylococci)和链球菌(Streptococci)是革兰氏阳性的。革兰氏阴性细菌如大肠杆菌含有两层不连续的膜,而不是一层围绕细胞的膜。革兰氏阴性生物倾向于具有较薄的细胞壁。革兰氏阳性生物的单一的膜与革兰氏阴性细菌的内膜类似。
通常,将含有源自与宿主细胞相容的物种的复制起点和控制序列的质粒载体与这些宿主一起使用。该载体通常带有复制起点,以及能够在转化的细胞中提供表型选择的标记序列。例如,大肠杆菌一般用源自一个大肠杆菌物种的质粒pBR322进行转化。pBR322含有氨苄青霉素和四环素抗性基因,从而提供了鉴定转化细胞的简单方法。pBR质粒或pUC质粒或其他微生物质粒或噬菌体也必须含有或经修饰后含有可由微生物用于表达其蛋白质的启动子。这种启动子可为异源的启动子,即来自其他生物的启动子,只要该启动子与宿主细胞相容,即该启动子可被宿主细胞的RNA聚合酶识别,从而RNA聚合酶转录宿主相容性启动子附着的基因。
这些最经常用于重组DNA构建体的启动子包括lacZ启动子、tac启动子、T7噬菌体启动子和色氨酸(trp)启动子系统。尽管这些是最经常使用的,也已发现并使用了其他的微生物启动子,且已发表了关于其核苷酸序列的细节,从而使得技术人员能够将它们功能性地与质粒载体进行连接。
此外,该启动子可为具有增加的启动子活性的修饰的RNA聚合酶启动子。对启动子的修饰可为突变或串联加入两个或多个启动子元件。当以串联方式提供两个或多个启动子元件时,该两个或多个启动子元件可为相同的启动子元件或两个或多个不同的启动子元件。如在此处所用的术语“串联启动子元件”可理解为指两个或多个启动子序列,其中每一个该序列都可操作地连接到编码序列上,从而该启动子序列通过介导编码序列向mRNA的转录而指导由编码序列编码的多肽的生产。串联启动子以及构建体及其在芽孢杆菌细胞表达中的应用详细描述于美国专利No s.5,955,310和6,255,076中,该专利分别于1999年9月21日和2001年7月3日授予Widner等人,在此处明确地将其内容整体引入作为参考。
此外,当本发明的重组载体含有超过一个核酸区段时,其中每一个区段都具有编码蛋白质的编码区,如具有编码酶活性透明质素合成酶的编码区的核酸区段和具有编码酶活性UDP-葡萄糖脱氢酶的编码区的核酸区段,则每一个核酸区段均可操作地连接到启动子上。两个或多个核酸区段可连接到相同的启动子上,且该单一的启动子可驱动两个基因的表达,或者两个或多个核酸区段可连接到不同的启动子上。
除原核生物之外,也可使用真核微生物如酵母培养物。酿酒酵母或普通的面包酵母是真核微生物中最普遍使用的,尽管通常许多其他的菌株也是可用的。对于在糖酵母(Saccharomyces)中的表达,例如质粒YRp7是普遍使用的。该质粒已含有trp1基因,该基因提供对无色氨酸时缺乏生长能力的酵母突变菌株的选择标记,例如ATCC No.44076或PEP4-1。然后作为酵母宿主细胞基因组的特征的trp1损害的存在提供了通过在无色氨酸存在时生长而探测转化体的有效环境。酵母载体中适当的启动序列包括半乳糖利用基因、3-磷酸甘油酸激酶或其他糖酵解酶的启动子,如烯醇化酶、甘油醛-3-磷酸脱氢酶、己糖激酶、丙酮酸脱羧酶、磷酸果糖激酶、葡萄糖-6-磷酸异构酶、3-磷酸甘油酸变位酶、丙酮酸激酶、丙糖磷酸异构酶、磷酸葡糖异构酶和葡糖激酶。
在构建适当的表达质粒中,与这些基因相关的终止序列也连接到表达载体中想要表达的序列的3’以提供mRNA的聚腺苷酸化和终止。其他具有由生长条件控制的转录的额外优点的启动子是乙醇脱氢酶2、细胞色素C、酸性磷酸酶、与氮代谢相关的降解性酶类和前文所述的甘油醛-3-磷酸脱氢酶和负责麦芽糖和半乳糖利用的酶类的启动子区域。含有酵母相容性启动子、复制起点和终止序列的任何质粒载体均为适当的。
除微生物之外,源自多细胞生物的细胞培养物也可用作宿主。原则上,任何这样的细胞培养物均为可用的,不论其来自脊椎动物还是无脊椎动物培养物。然而,对脊椎动物具有最大的兴趣,且脊椎动物细胞在培养物中的繁殖在最近几年中已成为常规程序。这种有用的细胞系的例子为VERO和HeLa细胞、中国仓鼠卵巢(CHO)细胞系和WI38、BHK、COS和MDCK细胞系。
对于在哺乳动物中的应用,对表达载体的控制功能通常是由病毒材料提供的。例如,常用的启动子是源自多形瘤、腺病毒2、牛乳头状病毒和使用频率最大的猿猴病毒40(SV40)的。SV40病毒的早期和晚期启动子是特别有用的,这是因为两者均易于作为也含有SV40病毒复制起点的片段而从病毒获得。也可使用较小的或较大的SV40片段,前提是其包括了从HindIII位点延伸到位于病毒复制起点的Bg1I位点的约250bp长的序列。
进一步地,也可能且经常想要的是利用通常与想要的基因序列相关的启动子或控制序列,只要这种控制序列与宿主细胞系统相容。复制起点可通过构建包括外源起点(如源自SV40或其他病毒(如多形瘤、腺病毒(Adeno)、BPV)来源的)的载体来提供,或者通过宿主细胞染色体复制机制来提供。如果载体是整合入宿主细胞染色体中的,那么后一种机制经常是足够的。
C.真实的HA合成酶从C组类马链球菌的高度被囊化的菌株中的分离。
命名为seHAS的编码的蛋白质具有417个氨基酸(计算的分子量为47,778且PI为9.1),且是迄今鉴定的HAS家族的最小的成员(图2)。seHAS在SDS-PAGE中也迁移得异常快(Mr~42kDa)(图5和9)。
图9是用特异性抗体对重组seHAS的蛋白质印迹分析的图示。含有重组seHAS(E;泳道2、7和9)或spHAS(P;泳道3、6、8和10)的C组(C;泳道1)或A组(A;泳道4)链球菌膜和大肠杆菌膜(9μg/泳道)是通过还原性SDS-PAGE而进行分级分离及转移到硝酸纤维素膜上。硝酸纤维素膜条是如在申请中描述的那样用纯化的IgG组分进行探测和显影的,该IgG组分是针对下面的spHAS区的:中央结构域肽E147-T161(泳道1-4);C-末端肽(泳道5-6);完整的蛋白质(泳道7和8);重组中央结构域(泳道9和10)。来自单独用载体转化的细胞的非免疫性IgG或膜不着色,如在泳道5中所示。
seHAS和spHAS蛋白质编码序列(分别为SEQ ID NOS:1和13)是72%相同的。推断的seHAS的蛋白质序列是通过与合成的肽抗体的反应性来证实的(图9)。在大肠杆菌中表达的重组seHAS是作为主要蛋白质在膜中回收的(图5),并在UDP-GlcNAc和UDP-GlcUA存在时在体外合成了非常大分子量的HA(图10)。
图10表示对由seHAS和spHAS生产的HA大小分布的动力学分析。含有等量seHAS或spHAS蛋白质的大肠杆菌膜如在申请中描述的与1.35mM UDP-[14C]GlcUA(1.3×103dpm/nmol)和3.0mMUDP-GlcNAc于37℃进行温育。这些底物浓度大于15倍的各自Km值。对在0.5、1.0和60分钟获取的样品用SDS进行处理并在聚丙烯酰胺葡聚糖S400HR上进行层析。将柱子的分级分离范围内的HA(组分12-24)曲线标准化为每一组分中总HA的百分数。在顶部图中箭头上面的值是用Dawn多角激光散射仪器(Wyatt Technology Corp.)在分离实验中直接确定的HA的MW(百万)。由seHAS(●、■、▲)和spHAS(○、□、△)在0.5分钟(○、●)、1.0分钟(□、■)和60分钟(△、▲)合成的HA的大小分布如图所示。分析显示seHAS和spHAS在它们合成的HA链的大小分布中是基本相同的(图10)。在制备HA的能力上seHAS是spHAS的两倍快。
C.1细菌菌株和载体
粘液样C组菌株D181(类马链球菌)是从RockefellerUniversity Collection获得的。大肠杆菌宿主菌株Sure和XL1-BlueMRF’购自Stratagene,且Top10F’购自Invitrogen。除非另外注明,链球菌生长于THY中,且大肠杆菌菌株生长于LB培养基中。pKK-223表达载体购自Pharmacia,PCR 2.1克隆载体购自Invitrogen,且预消化的λZap Expression TM BamH I/CIAP载体购自Stratagene。
C.2重组DNA和克隆
将用Caparon和Scott方法(如本领域的技术人员公知的)从类马链球菌分离的高分子量基因组DNA用Sau3A1进行部分消化为平均大小为2-12kb。消化的DNA用乙醇进行沉淀、洗涤并连接到BamHI/CIAPλZAP Expression载体上。将连接的DNA用购自Promega的PackageneTM提取物包装入噬菌体中。包装的噬菌体文库的滴度是用XL1-Blue MRF’大肠杆菌作为宿主进行检查的。
C.3简并PCR扩增
简并寡核苷酸是基于spHAS(酿脓链球菌)、DG42(非洲爪蟾HAS;19)和nodC(苜蓿根瘤菌(Rhizobium meliloti)结瘤因子;20)中的保守序列设计的,并用于用D181基因组DNA作为模板的PCR扩增。扩增条件为于94℃1分钟、44℃1分钟、72℃1.5分钟进行34个循环,随后于72℃最后延伸10分钟。寡核苷酸HADRF15’-GAY MGA YRT YTXACX AAT TAY GCT ATH GAY TTR GG-3’(SEQ ID NO:45)(有义链)相应于序列D259RCLTNYAIDL(SEQ ID NO:46)(spHAS)。寡核苷酸HACTR15’-ACG WGT WCC CCA NTC XGY ATT TTT NAD XGT RCA-3’(SEQ ID NO:47)(反义链)相应于区域C404TIKNTEWGTR(SEQ ID NO:48)(spHAS)。一些位置的碱基的简并性由IUPAC采用的命名法以其列于表VI中的简并碱基编码代表。
表VI
  IUPAC编码-简并碱基国际理论和应用化学联合会(IUPAC)确立了简并碱基的标准单字母名称。它们是:B=C+G+TD=A+G+TH=A+C+TK=T+GM=A+CN=A+C+G+TR=A+GS=G+CW=A+TV=A+C+GX=稀有碱基(在别处详细说明)Y=C+T
这两个寡核苷酸得到了459bp的PCR产物,该产物是在琼脂糖凝胶上进行分离的并用BIO-101Geneclean试剂盒进行纯化。然后根据生产商的说明书用TOP 10F’细胞作为宿主将该片段克隆入PCR2.1载体中。双链质粒DNA是用QIAfilter Plasmid Midi Kit(Qiagen)从大肠杆菌(TOP 10F’)中纯化的。也合成了两个其他的简并的有义引物:HAVAF1 5’-GTN GCT GCT GTW RTX CCW WSX TWTAAY GAR GA-3’(SEQ ID NO:49)(相应于spHAS的区域V66AAVIPSYNE(SEQ ID NO:50))和HAVDF15’-GTX RWT GAY GGN WSX WSN RAX GATGAX GC-3’(SEQ ID NO:51)(基于spHAS的V100DDGSSNTD(SEQ IDNO:52))。基于459bp长的PCR产物序列合成了两个唯一的反义引物。它们是:D181.25’-GAA GGA CTT GTT CCA GCG GT-3’(SEQ IDNO:53)和D181.45’-TGA ATG TTC CGA CAC AGG GC-3’(SEQ IDNO:54)。当与D181.2或D181.4一起用于扩增D181基因组DNA时,两个简并有义引物的每一个都可以得到预期大小的PCR产物。将4个PCR产物用与上文相同的策略进行克隆和测序。对于每一个PCR产物,对从6个不同克隆中获得的序列进行比较以得到一致序列。因而我们获得了与spHAS具有高度同源性的具有连续ORF的1042bp长的序列。
C.4文库筛选
将两个分子探针用于筛选文库:克隆的459bp长的PCR产物和寡核苷酸D181.5(源自1042bp长序列的5’-GCTTGATAGGTCACCAGTGTCACG-3’(SEQ ID NO:55))。将459bp长的PCR产物根据生产商的说明书用Prime-It 11随机引物标记试剂盒(Stratagene)进行放射性标记。寡核苷酸是通过Kinace-ItKinasing Kit(Stratagene)用[λ32P]ATP进行标记的。将放射性标记的产物在NucTrap Push柱(Stratagene)上从非标记材料中分离。寡探针特异性地与D181基因组消化物在DNA印迹中进行杂交。为了筛选λ噬菌体文库,将XLBLUE MRF’用作含有吸附的噬菌体的硝酸纤维素膜上的宿主(3000噬斑/平板),于60℃进行预杂交,并根据说明书于80℃在QuikHyb杂交溶液(Stratagene)中与5’-末端标记的寡核苷酸D181.5进行杂交。
然后将膜于室温用2×SSC缓冲液和0.1%(w/v)的SDS洗涤15分钟,于60℃用0.1×SSC缓冲液和0.1%的SDS(w/v)洗涤30分钟,干燥并然后于-70℃对Bio-Max MS膜曝光过夜。将阳性噬斑再次平板培养并再筛选两次。纯的阳性噬菌体保存于具有氯仿的SM缓冲液中。用载体引物在这些噬菌体上的PCR揭示了3个不同大小的插入体。
用载体引物和来自克隆的1042bp长的序列的不同区域的引物组合揭示3个不同的噬菌体中只有一个具有完整的HA基因。该噬菌体中的插入体大小为6.5kb。通过来自选择的噬菌体文库克隆的自身切除将插入物亚克隆入质粒形式的尝试失败了。因此,在纯的阳性噬菌体DNA上再次采用PCR策略以获得ORF的5’和3’末端。寡核苷酸引物D181.3(5’-GCCCTGTGTCGGAACATTCA-3’)(SEQ ID NO:56)和T 3(载体引物)扩增了3kb长的产物,且寡核苷酸D181.了和T7(载体引物)扩增了2.5kb长的产物。ORF的5’和3’末端序列是通过对上述这两个产物的测序获得的。对所有PCR产物序列的分析使得我们能够重构1254bp长的seHAS基因的ORF。
C.5seHAS的表达克隆
引物是在seHAS的起始和终止密码子区域进行设计的,从而在有义寡核苷酸(5’-AGGATCCGAATTCATGAGAACAT TAAAAAACCTC-3’)(SEQ ID NO:57)中含有EcoR I限制位点而在反义寡核苷酸(5’-AGAATTCTGCAGTTATAATAA TTTTTTACGTGT-3’)(SEQ ID NO:58)中含有Pst I位点。这些引物从D181基因组DNA以及纯的杂交阳性噬菌体中扩增了1.2kb长的PCR产物。将该1.2kb长的产物用琼脂糖凝胶电泳进行纯化,用Pst I和EcoR I进行消化并定向克隆入Pst I-和EcoR I-消化的pKK223载体中。将连接的载体转化入大肠杆菌SURE细胞中,然后使该细胞在30℃进行生长。该步骤实际上是重要的,这是因为其他宿主细胞或高温导致克隆的插入物的缺失。将菌落分离并纯化其pDNA。在6个菌落中(名为a、b、c、d、e和f),5个具有正确大小的插入物,而1个无插入物。
C.6HA合成酶活性
HA合成酶活性是在从5个上述克隆制备的膜上进行测定的。将新鲜的对数期细胞于3000g收获、于4℃用PBS洗涤,且将膜通过本领域的技术人员公知的原生质体方法的修改方法进行分离。来自酿脓链球菌和类马链球菌的膜制剂也通过不同原生质体方法的修改方法而获得。将膜于37℃在50mM pH 7.0的磷酸钠和钾中与20mMMgCl2、1mM DTE、120μM UDP-GlcUA和300μM UDP-GlcNAc进行温育。糖的整合是用UDP-[14C]GlcUA(318mCi/mmol;ICN)和/或UDP-[3H]GlcNAc(29.2Ci/mmol NEN)进行监控的。反应是通过加入SDS至终浓度为2%(w/v)而终止的。产物HA是通过下行纸层析从前体分离的并通过在起始时确定整合的放射性而测量。
C.7凝胶过滤分析
用含有重组seHAS或spHAS的膜在体外生产的放射性标记的HA是通过在聚丙烯酰胺葡聚糖S500HR(Pharmacia Biotech Inc.)的柱(0.9×40cm)上的层析进行分析的。样品(0.4ml于200mM NaCl、5mM pH 8.0的Tris-HCl加0.5%SDS中)是用200mM NaCl、5mM的Tris-HCl进行洗脱的,并将pH8.0的0.5ml级分进行14C和/或3H放射性的测定。HA多糖的真实性是通过用Streptomyceshyalurolyticus的HA-特异性透明质酸裂解酶(EC 4.2.2.1)于37℃对独立的相同样品处理3个小时而测定的。然后将消化物进行凝胶过滤。
C.8SDS-PAGE和蛋白质印迹
SDS-PAGE是根据Laemmli方法进行的。向硝酸纤维素的电转移是用Bio-Rad mini Transblot仪器用20%的甲醇在标准印迹缓冲液中进行的。该印迹用TBS中的2%BSA进行封闭。将蛋白质A/G碱性磷酸酶缀合物(Pierce)和对氮蓝四唑/5-溴-4-氯-3吲哚磷酸对甲苯胺用于探测。
C.9DNA测序和分析
质粒是用荧光标记的载体引物在两条链上进行测序的。测序反应是用荧光标记的引物(用7-脱氮G)的ThermosequenaseTM试剂盒进行的。样品在Pharmacia ALF Express DNA Sequencer上进行电泳,且数据用ALF Manager软件v 3.02进行分析。插入物的内部区域是用ABI Prism 377以内部引物进行测序的(软件版本2.1.1)。不明确的区域是用SequenaseTM7-脱氮-DNA聚合酶、7-脱氮GTP mastermix(USB)和[α-35S]dATP(Amersham Life Sciences)进行人工测序的。将获得的序列用DNASIS v2.1(Hitachi Software EngineeringCo.,Ltd.)进行汇编和分析。将核苷酸和氨基酸序列与Genbank和其他的数据库中的其他序列进行比较。
C.10seHAS的鉴定
seHAS的鉴定是用PCR方法实现的,该PCR方法具有基于spHAS、DG42(现在已知为发育调节的非洲爪蟾HAS并命名为xlHAS)和NodC(根瘤菌β-GlcNAc转移酶)中高度一致性的几个区域的寡核苷酸引物。XlHAS和NodC蛋白质分别与spHAS具有~50%和~10%的一致性。该策略得到了459bp长的PCR产物,其序列与spHAS具有66.4%的一致性,显示已鉴定了A组(spHAS)HA合成酶基因的C组同系物(seHAS)。然后将该基因的完整编码区用相似的基于PCR的策略进行重构。然后将最终一套PCR引物用于从基因组DNA中扩增完整的ORF。当将1.2kb长的PCR片段插入到表达载体pKK223中并转化入大肠杆菌SURE细胞中时,在来自5个检验的菌落中的分离膜中证实了HA合成活性。
重构的基因的ORF编码417个氨基酸的预测的新蛋白质,该蛋白质未在数据库中且比spHAS短2个氨基酸。两个细菌蛋白质具有72%的一致性,且核酸序列具有70%的一致性。seHAS蛋白质的预测分子量是47,778,且预测的等电点为pH 9.1。最近鉴定的哺乳动物HAS如小鼠和人同工酶(在图2中分别为mHAS1、2、3和hHAS1、2、3)与细菌蛋白质相似。两组之间的总一致性为~28-31%,且此外seHAS中的许多氨基酸与那些真核的HAS是高度保守的(如K/R或D/E替代)。PBCY-1HAS即A98R与哺乳动物HAS具有28-33%的一致性,并预测在脂质膜上具有相似的拓扑学。在哺乳动物物种中,相同科的成员是几乎完全相同的(如muHAS1和huHAS1是95%相同的;muHAS2和huHAS2是98%相同的)。然而,如图3所示,即使在相同的物种中,不同的HAS家族成员也是相当不同的(如muHAS1和muHAS2是53%相同的;muHAS1和muHAS3是57%相同的;muHAS2和muHAS3是71%相同的)。
图11显示seHAS的亲水性图和预测的膜拓扑学。链球菌C组HAS的亲水性图是由Kyte和Doolittle的方法(J.Mol.Biol.157,105,1982)用DNASIS生成的。该蛋白质据预测为整合膜蛋白质。
图12显示膜中seHAS的拓扑学组织的模型。所提出的蛋白质拓扑学遵守进料(charge-in)规则,并使大的中央结构域置于内部。该结构域可能含有酶的大多数底物结合和催化功能。在所有HAS家族成员中保守的seHAS中的Cys226以及其他3个半胱氨酸显示于中央结构域中。Cys281是关键的残基,其改变可巨大地改变由酶合成的HA产物的大小分布。
对seHAS预测的总体膜拓扑学与迄今报道的对spHAS和真核HAS预测的相同。该蛋白质在氨基末端具有两个推定的跨膜结构域,且在羧基末端具有2-3个膜结合或跨膜结构域。两个链球菌酶的亲水性图几乎是相同的,并阐明了在预测seHAS中K313-R406(spHAS中K313-K405)的~90个残基的极度疏水区域的拓扑学中的困难。
seHAS在大肠杆菌细胞中是有效表达的。如由SDS-PAGE凝胶染色测定的,大约10%的总膜蛋白质是seHAS(图5)。42kD的显著的seHAS条带在仅有载体的对照泳道中是基本缺失的。在SURE细胞中用相同的载体,对于spHAS也发现膜蛋白质这一异常高水平的表达。大肠杆菌SURE细胞中约8%的膜蛋白质是spHAS。相反地,C组膜中seHAS的量不超过总膜蛋白质的1%。A组膜中的spHAS几乎不能被探测到。在大肠杆菌SURE细胞中表达的重组seHAS在体内不合成HA,这是因为这些细胞缺失必需底物之一UDP-GlcUA。然而,含有重组seHAS蛋白质的膜在提供底物UDP-GlcNAc和UDP-GlcUA时合成HA(图13)。
图13表示由重组seHAS对真实HA的合成。将从含有重组seHAS或单独载体的细胞制备的大肠杆菌膜(69μg)于37℃与700μMUDP-[3H]GlcNAc(2.78×103dpm/nmol;□、■)和300μM UDP-[14C]GlcUA(3.83×103dpm/nmol;○、●)在此处描述的200μl终体积中温育1个小时。酶反应是通过加入EDTA至25mM的终浓度而终止。将反应混合物的一半用链霉菌透明质酸酶于37℃处理3小时。将SDS(2%,w/v)加入到透明质酸酶处理的(○、□)和未处理的(●、■)样品中,该样品于90℃加热1分钟。将该样品用柱缓冲液(5mM Tris、0.2M NaCl,pH 8.0)稀释到500μl,用离心使其澄清并将200μl注射入聚丙烯酰胺葡聚糖S-500HR柱中。收集级分(1ml)并确定放射性。BD是蓝色葡聚糖(~2×106DA;Pharmacia)的峰值洗脱位置。V0标记孔隙体积,且V1标记内体积(included volume)。整合到柱中分级分离的HA的总量中的[14C]GlcUA:[3H]GlcNAc比例是1.4,该比例与两种底物的特异性活性比例相同。因此,整合到产物中的糖的摩尔比例是如对真实的HA预测的1∶1。来自用单独载体转化的细胞的膜不合成HA。
使用120μM UDP-GlcUA和300μM UDP-GlcNAc,HA合成相对于膜蛋白质是线性的(在≤0.2μg时)且这种线性维持至少1个小时。同样地,从未转化的细胞或用载体单独转化的细胞制备的膜不具有可探测的HAS活性。如果Mg+2与EDTA螯合(<对照的5%)或如果缺失了两种底物之一(对照的~2%),那么HA合成是没有的。重组seHAS也显示对糖核苷酸底物的预期的特异性,不能够使UDP-GalA、UDP-Glc或UDP-GalNAc之一与两种正常底物之一共聚合(表II)。
根据凝胶过滤分析,在分离的膜中由seHAS合成的HA的平均质量为5-10×106Da。基于两种糖的等摩尔整合及其对特定的链霉菌透明质酸酶降解的敏感性,可以断定重组seHAS的产物是真实的HA(图13)。尽管对于总体HA合成的条件不是最适的(因为一种底物的~90%整合到产物中),但该酶产生了HA链长度的广泛分布。峰值级分相应于7.5×106Da的HA物质,该HA物质是含有约36,000个单聚糖的多聚体。在该柱子上分解的HA大小的分布范围为2-20×106Da。
推定的seHAS的蛋白质序列是通过spHAS蛋白质的抗体与C组蛋白质的交叉作用的能力证实的(图9)。全长spHAS蛋白质或仅仅spHAS的中央结构域的多克隆抗体也与seHAS蛋白质相互作用。针对spHAS的C-末端的抗肽的抗体不与seHAS蛋白质中这一有些趋异的区域相互作用。然而,抗spHAS序列E147-T161的抗肽抗体识别seHAS中相同的预测序列。该抗肽抗体也与链球菌膜中的天然seHAS和spHAS蛋白质反应,并证实来自两个物种的天然和重组酶具有相同的大小。如同spHAS蛋白质,seHAS在SDS-PAGE上迁移异常地快。尽管计算质量为47,778Da,由SDS-PAGE所得的Mr一致地为~42kDa。
由于其中央结构域区域中的序列一致性和对两种细菌酶预测的总体一致的结构,抗区域E147-T161的肽特异性抗体可用于在膜中使HAS蛋白质的表达标准化,该膜从用两种不同酶的基因进行转化的细胞制备。利用这种方法,将具有基本相同量的重组spHAS或seHAS的膜进行关于HA合成的起始速率和HA产物的大小分布的比较。
如对于spHAS所显示的,HA链由HAS的合成是持续的。该酶表现为与生长的HA链结合,直到该链作为终产物释放。因此,可能的是在第一轮HA链合成中,通过监控在早期生产的HA链的大小分布而比较由seHAS和spHAS使HA延伸的速率。基于不同时间对HA产物大小的凝胶过滤分析,我们估计由seHAS延伸的平均速率在37℃为约9,000个单糖/分钟(图10)。在5分钟内,该酶可聚合5-10×106Da的HA链。因此在60分钟的温育中,每一个酶分子能够起始、完成并释放5-8个这样的大HA分子。在早期(如≤1分钟时),作为第一条HA链延伸的反映,由seHAS合成的HA的大小与spHAS相比更大。在60分钟时,HA产物大小的两种分布不可区别。
克隆的seHAS代表真实的C组HA合成酶。因此前面报道的或公开的“C组”蛋白质不是真正的C组HAS。seHAS蛋白质与来自细菌、脊椎动物和病毒的9种目前已知的HA合成酶同源,这些合成酶组成该快速增长的HA合成酶家族。该同源性特别地显示于图2中。在哺乳动物中,3个命名为HAS1、HAS2和HAS3的基因已得到鉴定并定位到人和小鼠的3个不同的染色体上。在两栖动物中,迄今鉴定的唯一的HAS蛋白质是发育调节的DG42,该蛋白质于1988年克隆且现在通过在酵母膜中重组蛋白质的分析已知其编码HA合成酶活性。可能其他非洲爪蟾的HAS基因将很快被鉴定。
趋异的进化模型表明原始的细菌HAS前体可能在脊椎动物发育的早期被侵占了,或者当原始细菌捕获了原始的HAS时细菌制备HA被膜的致病策略得到发展。细菌和真核HAS酶向共同结构的趋同进化似乎是不可能的,但也许已发生。
至少10个鉴定的HAS蛋白质预测为具有相似拓扑学的膜蛋白质。HA合成发生于质膜上,且HA或者释放入培养基中或者保持与细胞结合以形成细菌被膜或真核细胞外周被膜。胞质中的糖核苷酸底物用于组装HA链,该HA链通过膜伸出到外周空间。
HAS蛋白质的极其疏水的羧基部分的蛋白质拓扑学在理解该酶如何同时在生长的HA链从膜伸出时使其延伸中是关键的。例如,空前的酶活性可能需要蛋白质与脂双层的异常且复杂的相互作用。基于spHAS-碱性磷酸酶融合蛋白质分析的初步结果显示氨基和羧基末端及大的中央结构域均为细胞内的,如图11和12所示。seHAS蛋白质也含有大的中央结构域(为总蛋白质的~63%),该结构域似乎含有两个底物结合位点和HA合成所需的两种糖基转移酶活性。尽管目前的软件程序不能可靠地预测长的C-末端疏水区段中的膜结合结构域的数目和特性,但所提出的拓扑学组织与目前的证据一致,且也适用于真核的酶,该真核的酶主要由于蛋白质的C-末端2个预测的额外跨膜结构域的延伸而大~40%。
spHAS中6个Cys残基的4个是与seHAS保守的。仅有spHAS中的Cys225和seHAS中的Cys224是在HAS家族的所有成员中保守的。由于巯基反应试剂如对苯甲酸汞(p-mercurobenzoate)或NEM极大地抑制HAS活性,可能的是该保守的Cys是酶活性必需或重要的。然而,来自定点诱变研究的最初结果显示spHAS的C225S突变体不是无活性的,它保持了野生型活性的5-10%。
用特异性的寡核苷酸对仅编码seHAS、仅编码spHAS或编码seHAS和spHAS两者的核酸序列的识别显示于图14中。基于SEQ IDNO:1的序列和spHAS的编码序列设计了3对有义-反义寡核苷酸。基于seHAS的核酸区段(分别为se1-se2和sesp1-sesp2,SEQ ID NOS:3-6)显示于图15中。使这3个寡核苷酸对在一般的PCR反应条件下与基因组DNA进行杂交,该基因组DNA来自C组(seHAS)(泳道2、4和6)或A组(spHAS)(泳道3、5和7)链球菌。泳道1和8以kb(千碱基)显示MW标准的位置。PCR反应用Taq DNA聚合酶(来自Promega)进行如下25个循环:94摄氏度1分钟以实现DNA变性、48摄氏度(对于较小的通用sesp引物为42摄氏度)1分钟以使得能够杂交、72摄氏度1.5分钟以进行DNA合成。然后将PCR反应混合物通过在1%琼脂糖凝胶上的电泳而进行分离。
se1-se2引物对设计为对C组HAS(seHAS)具有唯一的特异性。sp1-sp2引物对设计为对A组HAS(spHAS)具有唯一的特异性。sesp1-sesp2引物对设计为可与A组和C组HAS核酸序列两者进行杂交的。所有3个引物对均如预期地起作用,从而显示相互杂交及支持特异性的和/或唯一的PCR产物生成的适当能力。
用于特异性PCR或杂交的寡核苷酸显示于图15中。对于SEQ ID NOS:3、4、5和6的合成寡核苷酸的每一个均显示了SEQ ID NO:1的相应区域。该4个寡核苷酸的每一个均将特异性地与seHAS序列杂交,且适当的有义/反义引物对适合用于如在图14中所示的聚合酶链反应。
在枯草芽孢杆菌中seHAS的表达
图16A和16B证明来自枯草芽孢杆菌菌株枯草芽孢杆菌168中的seHAS的重组HA生产,如由凝胶过滤层析所证实的。图16A是用单独的pSM143载体转化的枯草芽孢杆菌168中HA生产与用含有seHAS的pSM143转化的枯草芽孢杆菌168进行比较的图。HA的生产可通过约13.5分钟~约16分钟之间的峰值来显现。图16B是该峰值的放大以忽略由未整合到HA中的放射性标记的蛋白质和糖导致的大峰值,该峰值可在图16A中于约16.5分钟~约20分钟之间看到。
在枯草芽孢杆菌中对由spHAS的重组HA生产的凝胶过滤分析
图17A证明枯草芽孢杆菌中由spHAS生产的重组HA大小分布的营养控制。编码spHAS酶的枯草芽孢杆菌168(pPD41Δ5)培养于Luria Bertani液体培养基(LB)中,其生产的HA在比培养于Spizzizens培养基(Sp)中的相同菌株(峰值在约14.43分钟)更早的时间点(峰值在13.48分钟)从凝胶过滤柱上洗脱。这两种培养物是平行生长的,但更大的HA是由生长于LB中的细菌生产的。含氚的HA的放射性是由每秒的裂变(DPS)来定量的。阴性对照显示枯草芽孢杆菌通常不生产HA。由用spHAS转化的枯草芽孢杆菌得到的HA峰值对特异性的HA裂解酶敏感但不对蛋白酶敏感。
因此,人们可通过改变宿主细胞所生长的培养基而改变在重组宿主细胞中生产的HA的分子量。例如,与在化学确定成分培养基如Spizzizens培养基或M9基本培养基中生长的重组宿主细胞生产的HA相比,通过使重组宿主细胞在复合培养基中生长可生产更大分子量的HA分子,如LB(Luria Bertani)、Terrific Broth、NZCYM、SOB、SOC或2xYT培养基。HA的大小也可通过提供的碳源如葡萄糖而改变。
图17B显示当利用含有spHAS的枯草芽孢杆菌168和含有单独载体的枯草芽孢杆菌时在峰值中的差异。
将在用3H葡糖胺对枯草芽孢杆菌进行体内标记之后获得的培养基样品通过凝胶过滤进行分析。通过利用该方法,可能确定由细菌生产的透明质酸(HA)的相对大小和量。所有样品在进行凝胶过滤之前通过16,000×g离5分钟而澄清。放射性成分是用LB508Radioflow Detector(EG&G Berthold)和Zinsser cocktail(1.8ml/min)探测的。
多聚物的大小是通过在Phenomenex PolySep-GFC-P 5000或6000柱(300×7.8mm)上的层析进行分析的,该柱在Waters 600E系统上以0.2M硝酸钠在0.6ml/min进行洗脱。该柱是用各种大小的葡聚糖(580、145、50和20kDa)或具有平均分子量为600和80kDa的MANT-标记的HA(DeAngelis,2001)通过MALLS进行标准化。对于MALLS,首先将HA多聚物(100μg)加载到两个串联Toso BiosepTSK-GEL柱(6000PWXL伴随4000PWXL;每一个7.8mm’30cm;日本)上并在pH 7的50mM磷酸钠、150mM NaCl中于0.5ml/min进行洗脱。使洗脱液以多角度的模式流经Optilab DSP干涉度量折光计,然后流经Dawn DSF激光光度计(632.8nm;Wyatt Technology,SantaBarbara,CA)。生产商的软件包用于用0.153的dn/dC系数确定绝对平均分子量。
HA标准是通过用N-methylisatonic anhydride对链球菌HA多糖上的羟基基团进行亚化学计量标记(1MANT/~50个单糖)而制备的。600kDa的标准是通过用制备级HPLC通过对大批HA的分级分离而获得的。对大批HA用具有microtip的HeatSystems-Ultrasonic W-380超声波仪(电源设置4)进行延长的超声处理(总时间30分钟,2分钟间隔时间,1%丙酮水溶液,冰溶)以生产80kDa的标准。
多杀巴斯德氏杆菌HAS的异源表达
pPm7A插入物中的PmHAS ORF是用Taq聚合酶(Fisher)和引物的13个循环的PCR进行扩增的,该引物相应于靠近推定的氨基和羧基末端的序列(密码子为大写:有义的,5’-gcgaattcaaaggacagaaaATGAAcACATTATCACAAG-3’(SEQ ID NO:59),和反义的,5’-gggaattctgcagttaTAGAGTTATACTATTAATAATGAAC-3’(SEQ ID NO:60);起始和终止密码子分别为粗体)。对密码子2(T到C)进行了改变(斜体小写字母)以增加大肠杆菌中蛋白质的生产。该引物也含有EcoR I和Pst I限制位点(下划线的)以促进向表达质粒pKK223-3中(tac启动子,Pharmacia)的克隆。将结果所得的重组构建体pPmHAS转化入大肠杆菌SURE细胞(Stratagene)中,并将该菌株用作体外HAS测定的膜制剂的来源。将对数期培养物(LB液体培养基,30℃)在收获前用0.5mM的异丙基硫代半乳糖苷诱导3个小时。将该质粒也转化入大肠杆菌K5中;对结果所得的菌株用光学显微镜和浮力密度离心进行被膜存在是否的鉴定。K5细菌培养物常规地不受诱导,这是因为IPTG的加入不显著地增加LB或确定成分培养基中HA的水平。K5细菌是有用的外源宿主,这是因为它们含有在HA合成中与pmHAS相互作用的多糖转运蛋白质和机制;这些蛋白质促进HA向细胞外的转运。
源自含有pPmHAS质粒的大肠杆菌SURE细胞的膜而不是源自仅单独具有载体pKK223-3的细胞的样品,当提供了两种UDP-GlcUA和UDP-GlcNAc时可在体外合成HA(分别为25vs.*1.5pMol GlcUA转移[mg蛋白质]-1[小时]-1)。如果省略了UDP-GlcNAc或如果二价金属离子用EDTA螯合时,观察不到[14C]GlcA的整合。源自重组HAS的HAS活性与从野生型多杀巴斯德氏杆菌膜中获得的酶相似,这是由于Mn2+比Mg2+刺激了至少多10倍的活性。
利用标记的HA结合蛋白质也对重组大肠杆菌培养物用放射分析测定进行了HA多糖存在性的检验。具有pPmHAS的大肠杆菌K5产生了每A600为460μg/ml的HA)。具有单独的pKK223-3载体的K5细胞不产生HA(*每A600为0.01μg/ml的HA)。作为比较地,生长于相同培养基上的野生型多杀巴斯德氏杆菌P-1059产生了每A600为1,100μg/ml的HA。具有pPmHAS的大肠杆菌K5产生了这样高水平的HA从而细胞变成被囊化的了(图18A)。重组菌株的被膜的半径为~0.2-0.5μm(假设细菌细胞的宽度为0.5μm)。该被膜可通过用绵羊睾丸透明质酸酶或链霉菌HA裂解酶进行处理而去除(图18B)。天然的K5宿主菌株或含有pKK223-3载体的转化体均不具有由光学显微镜确定的易于观察的被膜。通过浮力密度离心也相信具有pPmHAS的K5细胞是被囊化的。重组细胞浮在58%的Precoll垫层的顶部,而载体对照细胞或透明质酸酶处理的重组细胞经过Percoll垫层而沉淀(未显示)。
被膜生物合成过程中糖基转移酶在转运中的作用
糖基转移酶催化重复的GAG主链的形成,但是在某些情况中,这些相同的多肽也可在多聚物经过细胞膜的转运中起作用。革兰氏阳性的A和C组链球菌仅具有一层脂膜,且被膜操纵子编码合成酶和UDP-GlcUA生产的两种酶:UDP-葡萄糖脱氢酶和UDP-葡萄糖焦磷酸化酶(~4千碱基的DNA;Crater和van de Rijn,1995)。对一系列含有报道酶的链球菌spHAS融合蛋白质的拓扑学分析显示该合成酶至少跨过双分子层4次且密切地与膜相联(Heldermon等人,2001)(图19)。根据生物化学和生物物理学分析,由spHAS或seHAS多肽单体和~16个脂质分子组成的复合物可催化两种UDP-糖向新生的HA链的转移(Tlapak-Simmons等人,1998)。人们推测小的膜内在多肽spHAS或seHAS需要脂质的辅助以促进生长的HA多聚物链通过生成蛋白质/脂质核心而跨过疏水核心的转运。
另一方面,能够进行GAG生物合成的革兰氏阴性细菌大肠杆菌和多杀巴斯德氏杆菌具有两层脂膜,且其被膜座位编码除糖基转移酶和UDP-GlcUA形成酶之外的许多转运相关蛋白质(~10-18千碱基;Roberts,1996;Townsend等人,2001)。尽管许多细节尚未完全理解,但在最充分研究的模型大肠杆菌II组被膜系统中,看来新生多聚物链的转运需要由至少7个不同的多肽种类组成的装置(Whitfield和Roberts,1999;Silver等人,2001)。简单地说,含有KpsC、M、S、T的复合物在内膜进行装配并与KfiA、B、C催化复合物相互作用。KpsM和T形成ATP-结合型盒式(ABC)转运蛋白。周质蛋白质KpsD和另一种膜蛋白质KpsE的二聚体有助于将多聚体转运过周质间隙(Arrecubieta,2001)。在外膜上招募了孔蛋白复合物以将生长的多糖链转运出细胞。
某些Kps突变体使被膜多糖链多聚化,但具有错误的转位,结果导致胞质或周质中多聚体的积聚。基于其推定的转运蛋白质与大肠杆菌蛋白质的序列相似性和基因组织,同样认为多杀巴斯德氏杆菌具有类似II组的转运系统。
在pmHAS和pmCS的情况中,羧基末端尾巴可能含有与转运机制相互作用的停靠(docking)区段(Jing和DeAngelis,2000)(图19),在此处明确地整体引入作为参考。
乳房链球菌HAS
图21阐明来自乳房链球菌的4个独立的粘液样菌落的HAS基因的PCR扩增。对于每一个样品,在约1.25kb长的预期大小处有明显的条带,该条带相应于suHAS的完整读框加通过PCR扩增加入的限制位点。
图22阐明来自酿脓链球菌、类马链球菌和乳房链球菌的HA合成酶活性。
其他鉴定的HAS序列
除已在此处公开的且在图2中的比对中阐明的HAS序列之外,也鉴定了其他HAS序列,该序列可用于在本发明的芽孢杆菌物种中生产HA的方法。例如,SEQ ID NOS:15和16分别公开了在古细菌硫磺矿硫化叶菌中发现的HA合成酶的核苷酸和氨基酸序列。由于其在高温下即约75℃发挥功能的能力,该HA合成酶从嗜极端菌中(extremophile)的分离提供了具有比在此处前文中描述的HA合成酶更好的稳定性和更快的动力学的HAS。
与链球菌hasABC操纵子相似的一组基因已在炭疽芽孢杆菌质粒pXO1中鉴定,该质粒含有炭疽毒素基因。然而,pXO1中基因的顺序为A、C、B。pXO1质粒的完整序列在访问号No.AF 065404下,且与hasA相似的序列是该序列的ORF 93,其起始于111374而终止于112474。SEQ ID NOS:17和18分别代表与在炭疽芽孢杆菌pXO1中鉴定的hasA相似的基因的核苷酸和氨基酸序列。在炭疽芽孢杆菌中没有多糖被膜的报道,因此,鉴定这些基因的研究小组Okinaka等人相信pOX1ORF 93、94和95是仍然必须被抛弃的无功能基因的例子(J.Bacteriol.181:6509(1999))。
在可感染褐藻Ectocarpus siliculosus的病毒中已鉴定了第三个推定的HAS。氨基酸和核苷酸序列分别列于SEQ ID NOS:19和20中。该情况可能与PBCV-1病毒的cvHAS相似。
一个证明任何推定的HA合成酶的HA合成酶活性(天然的或重组的)的方法包括使细菌生长于液体培养基中、提取多糖级分(即阳离子去污剂沉淀/高盐提取/醇沉淀/再溶解于水中/溶剂提取/醇沉淀)及在酸水解之后进行单糖成分的分析。进一步的分析包括完整多聚物和酶(HA裂解酶、软骨素酶(chondroitinase)等)处理的样品的琼脂糖凝胶电泳。同样地,在ELISA或竞争形式用特异性HA结合蛋白质的生物学测定是有用的。为对酶进行检验,从细胞中制备了膜,提供了各种UDP-糖,然后分析了向多聚物的整合,随后进行层析和/或电泳。通过用PCR和引物与基因组DNA制备使得能够将ORF克隆入表达载体的基因盒,观察到了异源表达。各种宿主均可用这种载体进行转化,且可对结果所得的重组细胞进行在此处前文描述的多糖和/或酶的分析。
因而应该明显的是已经根据本发明提供了重组宿主细胞,该细胞具有在其中引入的编码酶活性HAS的编码区的纯化核酸区段,以及从重组宿主细胞生产透明质酸的方法,该方法完全满足在上面提出的目的和优点。尽管本发明已与其特定的实施方案一起进行了描述,但明显的是许多改变、修饰和变化对于本领域的技术人员将是明显的。因此,在附加的项目中想要包含所有这些在附加的项目的精神和广泛范围内的改变、修饰和变化。
在本申请中提出的所有数字和数量测量(包括在实施例和项目中的)均为近似值。
在此处说明性地公开和申请专利的本发明可适当地在不存在任何没有在此处特定地公开或申请专利的元件时进行实践。因而,本发明可包含在此处公开或申请专利的元件、由其组成或基本由其组成。
下面的项目在符合本申请的情况下具有尽可能宽的范围。该项目不必限于优选的实施方案或在实施例中显示的实施方案。
图6:
透明质素在琼脂凝胶上染色的数字图像。不同的菌种被标明的质粒转化,所述质粒含有hasB基因以及功能性hasA基因(pPD41Δ5)或非功能性hasA基因(pPD41ΔEcoRV)。每一泳道代表在新鲜生长培养基中接种的独立菌落,所有培养物在同一时间收获。收获培养物时600nm吸收值标示于图像底部。细胞离心之后,移去培养基,并用琼脂凝胶分析。StainsA11染色为黑色的表明有HA。在另一个实验中,几乎所有由转化的细菌生产的材料都被特异性透明质酸裂解酶去除,这证明了所述材料是HA。含有pPD41ΔEcoRV的菌株不能生产HA,因此它们实际上都是阴性的。地衣芽孢杆菌培养物也表明能生产HA。
图20:
基因组DNA从乳房链球菌的四个分离的粘液状菌落(泳道2-5)制备,并用设计来扩增全长编码区的引物进行PCR扩增。5′(正向)引物含有5′BamHI和pstI限制性酶切位点(斜体字),其序列如下:ATG GAA AAA CTA AAA AAT CTC(SEQ ID NO:42)。3′(反向)引物含有5′EcoRI和pstI位点(斜体字),其序列如下:TTA TTT ACT TGT CTT TTT ACG(SEQ ID NO:43)。反应产物用琼脂凝胶电泳分析,并用溴化乙锭染色,接着制备数字图象。在每一样品中,在~1.25kb的预期大小处,有一明显的条带(箭头指示),其相应于suHAS的完整阅读框加限制性位点。泳道1含有lambda DNA的HindIII消化物,其作为标准标记。
图21:
HA合成活性用纸层析测定法通过[14C]UDP-GlcUA整合入HA而测定(使用约5-12μg膜蛋白)。
-----Original Message-----
序列表
<110>WEIGEL,PAUL H.
     KUMARI,KSHAMA
     DEANGELIS,PAUL
<120>透明质素合成酶基因及其表达
<130>619908-5
<140>PCT/US02/18915
<141>2002-06-13
<150>60/297,744
<151>2001-06-13
<150>60/297,788
<151>2001-06-13
<150>09/469,2000
<151>1999-12-21
<150>09/178,851
<151>1998-10-26
<150>60/064,435
<151>1997-10-31
<160>60
<170>PatentIn Ver.2.1
<210>1
<211>1254
<212>DNA
<213>类马链球菌
<400>1
atgagaacat taaaaaacct cataactgtt gtggccttta gtattttttg ggtactgttg 60
atttacgtca atgtttatct ctttggtgct aaaggaagct tgtcaattta tggctttttg 120
ctgatagctt acctattagt caaaatgtcc ttatcctttt tttacaagcc atttaaggga 180
agggctgggc aatataaggt tgcagccatt attccctctt ataacgaaga tgctgagtca 240
ttgctagaga ccttaaaaag tgttcagcag caaacctatc ccctagcaga aatttatgtt 300
gttgacgatg gaagtgctga tgagacaggt attaagcgca ttgaagacta tgtgcgtgac 360
actggtgacc tatcaagcaa tgtcattgtt catcggtcag agaaaaatca aggaaagcgt 420
catgcacagg cctgggcctt tgaaagatca gacgctgatg tctttttgac cgttgactca 480
gatacttata tctaccctga tgctttagag gagttgttaa aaacctttaa tgacccaact 540
gtttttgctg cgacgggtca ccttaatgtc agaaatagac aaaccaatct cttaacacgc 600
ttgacagata ttcgctatga taatgctttt ggcgttgaac gagctgccca atccgttaca 660
ggtaatatcc ttgtttgctc aggtccgctt agcgtttaca gacgcgaggt ggttgttcct 720
aacatagata gatacatcaa ccagaccttc ctgggtattc ctgtaagtat tggtgatgac 780
aggtgcttga ccaactatgc aactgattta ggaaagactg tttatcaatc cactgctaaa 840
tgtattacag atgttcctga caagatgtct acttacttga agcagcaaaa ccgctggaac 900
aagtccttct ttagagagtc cattatttct gttaagaaaa tcatgaacaa tccttttgta 960
gccctatgga ccatacttga ggtgtctatg tttatgatgc ttgtttattc tgtggtggat 1020
ttctttgtag gcaatgtcag agaatttgat tggctcaggg ttttagcctt tctggtgatt 1080
atcttcattg ttgccctgtg tcggaacatt cattacatgc ttaagcaccc gctgtccttc 1140
ttgttatctc cgttttatgg ggtgctgcat ttgtttgtcc tacagccctt gaaattatat 1200
tctcttttta ctattagaaa tgctgactgg ggaacacgta aaaaattatt ataa       1254
<210>2
<211>417
<212>PRT
<213>类马链球菌
<400>2
Met Arg Thr Leu Lys Asn Leu Ile Thr Val Val Ala Phe Ser Ile Phe
  1               5                  10                  15
Trp Val Leu Leu Ile Tyr Val Asn Val Tyr Leu Phe Gly Ala Lys Gly
             20                  25                  30
Ser Leu Ser Ile Tyr Gly Phe Leu Leu Ile Ala Tyr Leu Leu Val Lys
         35                  40                  45
Met Ser Leu Ser Phe Phe Tyr Lys Pro Phe Lys Gly Arg Ala Gly Gln
     50                  55                  60
Tyr Lys Val Ala Ala Ile Ile Pro Ser Tyr Asn Glu Asp Ala Glu Ser
 65                  70                  75                  80
Leu Leu Glu Thr Leu Lys Ser Val Gln Gln Gln Thr Tyr Pro Leu Ala
                 85                  90                  95
Glu Ile Tyr Val Val Asp Asp Gly Ser Ala Asp Glu Thr Gly Ile Lys
            100                 105                 110
Arg Ile Glu Asp Tyr Val Arg Asp Thr Gly Asp Leu Ser Ser Asn Val
         115                 120                 125
Ile Val His Arg Ser Glu Lys Asn Gln Gly Lys Arg His Ala Gln Ala
    130                 135                 140
Trp Ala Phe Glu Arg Ser Asp Ala Asp Val Phe Leu Thr Val Asp Ser
145                 150                 155                 160
Asp Thr Tyr Ile Tyr Pro Asp Ala Leu Glu Glu Leu Leu Lys Thr Phe
                165                 170                 175
Asn Asp Pro Thr Val Phe Ala Ala Thr Gly His Leu Asn Val Arg Asn
            180                 185                 190
Arg Gln Thr Asn Leu Leu Thr Arg Leu Thr Asp Ile Arg Tyr Asp Asn
        195                 200                 205
Ala Phe Gly Val Glu Arg Ala Ala Gln Ser Val Thr Gly Asn Ile Leu
    210                 215                 220
Val Cys Ser Gly Pro Leu Ser Val Tyr Arg Arg Glu Val Val Val Pro
225                 230                 235                 240
Asn Ile Asp Arg Tyr Ile Asn Gln Thr Phe Leu Gly Ile Pro Val Ser
                245                 250                 255
Ile Gly Asp Asp Arg Cys Leu Thr Asn Tyr Ala Thr Asp Leu Gly Lys
            260                 265                 270
Thr Val Tyr Gln Ser Thr Ala Lys Cys Ile Thr Asp Val Pro Asp Lys
        275                 280                 285
Met Ser Thr Tyr Leu Lys Gln Gln Asn Arg Trp Asn Lys Ser Phe Phe
    290                 295                 300
Arg Glu Ser Ile Ile Ser Val Lys Lys Ile Met Asn Asn Pro Phe Val
305                 310                 315                 320
Ala Leu Trp Thr Ile Leu Glu Val Ser Met Phe Met Met Leu Val Tyr
                325                 330                 335
Ser Val Val Asp Phe Phe Val Gly Asn Val Arg Glu Phe Asp Trp Leu
            340                 345                 350
Arg Val Leu Ala Phe Leu Val Ile Ile Phe Ile Val Ala Leu Cys Arg
        355                 360                 365
Asn Ile His Tyr Met Leu Lys His Pro Leu Ser Phe Leu Leu Ser Pro
    370                 375                 380
Phe Tyr Gly Val Leu His Leu Phe Val Leu Gln Pro Leu Lys Leu Tyr
385                 390                 395                 400
Ser Leu Phe Thr Ile Arg Asn Ala Asp Trp Gly Thr Arg Lys Lys Leu
                405                 410                 415
Leu
<210>3
<211>22
<212>DNA
<213>类马链球菌
<400>3
gctgatgaga caggtattaa gc                      22
<210>4
<211>20
<212>DNA
<213>类马链球菌
<400>4
atcaaattct ctgacattgc                         20
<210>5
<211>20
<212>DNA
<213>类马链球菌
<400>5
gactcagata cttatatcta                         20
<210>6
<211>17
<212>DNA
<213>类马链球菌
<400>6
tttttacgtg ttcccca                                    17
<210>7
<211>567
<212>PRT
<213>小球藻病毒PBCV-1
<400>7
Met Gly Lys Asn Ile Ile Ile Met Val Ser Trp Tyr Thr Ile Ile Thr
  1               5                  10                  15
Ser Asn Leu Ile Ala Val Gly Gly Ala Ser Leu Ile Leu Ala Pro Ala
             20                  25                  30
Ile Thr Gly Tyr Val Leu His Trp Asn Ile Ala Leu Ser Thr Ile Trp
         35                  40                  45
Gly Val Ser Ala Tyr Gly Ile Phe Val Phe Gly Phe Phe Leu Ala Gln
     50                  55                  60
Val Leu Phe Ser Glu Leu Asn Arg Lys Arg Leu Arg Lys Trp Ile Ser
 65                  70                  75                  80
Leu Arg Pro Lys Gly Trp Asn Asp Val Arg Leu Ala Val Ile Ile Ala
                 85                  90                  95
Gly Tyr Arg Glu Asp Pro Tyr Met Phe Gln Lys Cys Leu Glu Ser Val
             100                 105                 110
Arg Asp Ser Asp Tyr Gly Asn Val Ala Arg Leu Ile Cys Val Ile Asp
        115                 120                 125
Gly Asp Glu Asp Asp Asp Met Arg Met Ala Ala Val Tyr Lys Ala Ile
    130                 135                 140
Tyr Asn Asp Asn Ile Lys Lys Pro Glu Phe Val Leu Cys Glu Ser Asp
145                 150                 155                 160
Asp Lys Glu Gly Glu Arg Ile Asp Ser Asp Phe Ser Arg Asp Ile Cys
                165                 170                 175
Val Leu Gln Pro His Arg Gly Lys Arg Glu Cys Leu Tyr Thr Gly Phe
            180                 185                 190
Gln Leu Ala Lys Met Asp Pro Ser Val Asn Ala Val Val Leu Ile Asp
        195                 200                 205
Ser Asp Thr Val Leu Glu Lys Asp Ala Ile Leu Glu Val Val Tyr Pro
    210                 215                 220
Leu Ala Cys Asp Pro Glu Ile Gln Ala Val Ala GlyGlu Cys Lys Ile
225                 230                 235                 240
Trp Asn Thr Asp Thr Leu Leu Ser Leu Leu Val Ala Trp Arg Tyr Tyr
                245                 250                 255
Ser Ala Phe Cys Val Glu Arg Ser Ala Gln Ser Phe Phe Arg Thr Val
            260                 265                 270
Gln Cys Val Gly Gly Pro Leu Gly Ala Tyr Lys Asp Ile Ile Lys Glu
        275                 280                 285
Ile Lys Asp Pro Trp Ile Ser Gln Arg Phe Leu Gly Gln Lys Cys Thr
    290                 295                 300
Tyr Gly Asp Asp Arg Arg Leu Thr Asn Glu Ile Leu Met Arg Gly Lys
305                 310                 315                 320
Lys Val Val Phe Thr Pro Phe Ala Val Gly Trp Ser Asp Ser Pro Thr
                325                 330                 335
Asn Val Phe Arg Tyr Ile Val Gln Gln Thr Arg Trp Ser Lys Ser Trp
            340                 345                 350
Cys Arg Glu Ile Trp Tyr Thr Leu Phe Ala Ala Trp Lys His Gly Leu
        355                 360                 365
Ser Gly Ile Trp Leu Ala Phe Glu Cys Leu Tyr Gln Ile Thr Tyr Phe
    370                 375                 380
Phe Leu Val Ile Tyr Leu Phe Ser Arg Leu Ala Val Glu Ala Asp Pro
385                 390                 395                 400
Arg Ala Gln Thr Ala Thr Val Ile Val Ser Thr Thr Val Ala Leu Ile
                405                 410                 415
Lys Cys Gly Tyr Phe Ser Phe Arg Ala Lys Asp Ile Arg Ala Phe Tyr
            420                 425                 430
Phe Val Leu Tyr Thr Phe Val Tyr Phe Phe Cys Met Ile Pro Ala Arg
        435                 440                 445
Ile Thr Ala Met Met Thr Leu Trp Asp Ile Gly Trp Asp Thr Arg Gly
    450                 455                 460
Gly Asn Glu Lys Pro Ser Val Gly Thr Arg Val Ala Leu Trp Ala Lys
465                 470                 475                 480
Gln Tyr Leu Ile Ala Tyr Met Trp Trp Ala Ala Val Val Gly Ala Gly
                485                 490                 495
Val Tyr Ser Ile Val His Asn Trp Met Phe Asp Trp Asn Ser Leu Ser
            500                 505                 510
Tyr Arg Phe Ala Leu Val Gly Ile Cys Ser Tyr Ile Val Phe Ile Val
        515                 520                 525
Ile Val Leu Val Val Tyr Phe Thr Gly Lys Ile Thr Thr Trp Asn Phe
    530                 535                 540
Thr Lys Leu Gln Lys Glu Leu Ile Glu Asp Arg Val Leu Tyr Asp Ala
545                 550                 555                 560
Thr Thr Asn Ala Gln Ser Val
                565
<210>8
<211>1740
<212>DNA
<213>小球藻病毒PBCV-1
<400>8
aagacttctt gaaagttaca atgggtaaaa atataatcat aatggtttcg tggtacacca 60
tcataacttc aaatctaatc gcggttggag gagcctctct aatcttggct ccggcaatta 120
ctgggtatgt tctacattgg aatattgctc tctcgacaat ctggggagta tcagcttatg 180
gtattttcgt ttttgggttt ttccttgcac aagttttatt ttcagaactg aacaggaaac 240
gtcttcgcaa gtggatttct ctcagaccta agggttggaa tgatgttcgt ttggctgtga 300
tcattgctgg atatcgcgag gatccttata tgttccagaa gtgcctcgag tctgtacgtg 360
actctgatta tggcaacgtt gcccgtctga tttgtgtgat tgacggtgat gaggacgatg 420
atatgaggat ggctgccgtt tacaaggcga tctacaatga taatatcaag aagcccgagt 480
ttgttctgtg tgagtcagac gacaaggaag gtgaacgcat cgactctgat ttctctcgcg 540
acatttgtgt cctccagcct catcgtggaa aacgggagtg tctttatact gggtttcaac 600
ttgcaaagat ggaccccagt gtcaatgctg tcgttctgat tgacagcgat accgttctcg 660
agaaggatgc tattctggaa gttgtatacc cacttgcatg cgatcccgag atccaagccg 720
ttgcaggtga gtgtaagatt tggaacacag acactctttt gagtcttctc gtcgcttggc 780
ggtactattc tgcgttttgt gtggagagga gtgcccagtc ttttttcagg actgttcagt 840
gcgttggggg gccactgggt gcctacaaga ttgatatcat taaggagatt aaggacccct 900
ggatttccca gcgctttctt ggtcagaagt gtacttacgg tgacgaccgc cggctaacca 960
acgagatctt gatgcgtggt aaaaaggttg tgttcactcc atttgctgtt ggttggtctg 1020
acagtccgac caatgtgttt cggtacatcg ttcagcagac ccgctggagt aagtcgtggt 1080
gccgcgaaat ttggtacacc ctcttcgccg cgtggaagca cggtttgtct ggaatttggc 1140
tggcctttga atgtttgtat caaattacat acttcttcct cgtgatttac ctcttttctc 1200
gcctagccgt tgaggccgac cctcgcgccc agacagccac ggtgattgtg agcaccacgg 1260
ttgcattgat taagtgtggg tatttttcat tccgagccaa ggatattcgg gcgttttact 1320
ttgtgcttta tacatttgtt tactttttct gtatgattcc ggccaggatt actgcaatga 1380
tgacgctttg ggacattggc tgggatactc gcggtggaaa cgagaagcct tccgttggca 1440
cccgggtcgc tctgtgggca aagcaatatc tcattgcata tatgtggtgg gccgcggttg 1500
ttggcgctgg agtttacagc atcgtccata actggatgtt cgattggaat tctctttctt 1560
atcgttttgc tttggttggt atttgttctt acattgtttt tattgttatt gtgctggtgg 1620
tttatttcac cggcaaaatt acgacttgga atttcacgaa gcttcagaag gagctaatcg 1680
aggatcgcgt tctgtacgat gcaactacca atgctcagtc tgtgtgattt ttcctgcaag 1740
<210>9
<211>2937
<212>DNA
<213>多杀巴斯德氏杆菌
<400>9
attttttaag gacagaaaat gaatacatta tcacaagcaa taaaagcata taacagcaat 60
gactatcaat tagcactcaa attatttgaa aagtcggcgg aaatctatgg acggaaaatt 120
gttgaatttc aaattaccaa atgccaagaa aaactctcag cacatccttc tgttaattca 180
gcacatcttt ctgtaaataa agaagaaaaa gtcaatgttt gcgatagtcc gttagatatt 240
gcaacacaac tgttactttc caacgtaaaa aaattagtac tttctgactc ggaaaaaaac 300
acgttaaaaa ataaatggaa attgctcact gagaagaaat ctgaaaatgc ggaggtaaga 360
gcggtcgccc ttgtaccaaa agattttccc aaagatctgg ttttagcgcc tttacctgat 420
catgttaatg attttacatg gtacaaaaag cgaaagaaaa gacttggcat aaaacctgaa 480
catcaacatg ttggtctttc tattatcgtt acaacattca atcgaccagc aattttatcg 540
attacattag cctgtttagt aaaccaaaaa acacattacc cgtttgaagt tatcgtgaca 600
gatgatggta gtcaggaaga tctatcaccg atcattcgcc aatatgaaaa taaattggat 660
attcgctacg tcagacaaaa agataacggt tttcaagcca gtgccgctcg gaatatggga 720
ttacgcttag caaaatatga ctttattggc ttactcgact gtgatatggc gccaaatcca 780
ttatgggttc attcttatgt tgcagagcta ttagaagatg atgatttaac aatcattggt 840
ccaagaaaat acatcgatac acaacatatt gacccaaaag acttcttaaa taacgcgagt 900
ttgcttgaat cattaccaga agtgaaaacc aataatagtg ttgccgcaaa aggggaagga 960
acagtttctc tggattggcg cttagaacaa ttcgaaaaaa cagaaaatct ccgcttatcc 1020
gattcgcctt tccgtttttt tgcggcgggt aatgttgctt tcgctaaaaa atggctaaat 1080
aaatccggtt tctttgatga ggaatttaat cactggggtg gagaagatgt ggaatttgga 1140
tatcgcttat tccgttacgg tagtttcttt aaaactattg atggcattat ggcctaccat 1200
caagagccac caggtaaaga aaatgaaacc gatcgtgaag cgggaaaaaa tattacgctc 1260
gatattatga gagaaaaggt cccttatatc tatagaaaac ttttaccaat agaagattcg 1320
catatcaata gagtaccttt agtttcaatt tatatcccag cttataactg tgcaaactat 1380
attcaacgtt gcgtagatag tgcactgaat cagactgttg ttgatctcga ggtttgtatt 1440
tgtaacgatg gttcaacaga taatacctta gaagtgatca ataagcttta tggtaataat 1500
cctagggtac gcatcatgtc taaaccaaat ggcggaatag cctcagcatc aaatgcagcc 1560
gtttcttttg ctaaaggtta ttacattggg cagttagatt cagatgatta tcttgagcct 1620
gatgcagttg aactgtgttt aaaagaattt ttaaaagata aaacgctagc ttgtgtttat 1680
accactaata gaaacgtcaa tccggatggt agcttaatcg ctaatggtta caattggcca 1740
gaattttcac gagaaaaact cacaacggct atgattgctc accactttag aatgttcacg 1800
attagagctt ggcatttaac tgatggattc aatgaaaaaa ttgaaaatgc cgtagactat 1860
gacatgttcc tcaaactcag tgaagttgga aaatttaaac atcttaataa aatctgctat 1920
aaccgtgtat tacatggtga taacacatca attaagaaac ttggcattca aaagaaaaac 1980
cattttgttg tagtcaatca gtcattaaat agacaaggca taacttatta taattatgac 2040
gaatttgatg atttagatga aagtagaaag tatattttca ataaaaccgc tgaatatcaa 2100
gaagagattg atatcttaaa agatattaaa atcatccaga ataaagatgc caaaatcgca 2160
gtcagtattt tttatcccaa tacattaaac ggcttagtga aaaaactaaa caatattatt 2220
gaatataata aaaatatatt cgttattgtt ctacatgttg ataagaatca tcttacacca 2280
gatatcaaaa aagaaatact agccttctat cataaacatc aagtgaatat tttactaaat 2340
aatgatatct catattacac gagtaataga ttaataaaaa ctgaggcgca tttaagtaat 2400
attaataaat taagtcagtt aaatctaaat tgtgaataca tcatttttga taatcatgac 2460
agcctattcg ttaaaaatga cagctatgct tatatgaaaa aatatgatgt cggcatgaat 2520
ttctcagcat taacacatga ttggatcgag aaaatcaatg cgcatccacc atttaaaaag 2580
ctcattaaaa cttattttaa tgacaatgac ttaaaaagta tgaatgtgaa aggggcatca 2640
caaggtatgt ttatgacgta tgcgctagcg catgagcttc tgacgattat taaagaagtc 2700
atcacatctt gccagtcaat tgatagtgtg ccagaatata acactgagga tatttggttc 2760
caatttgcac ttttaatctt agaaaagaaa accggccatg tatttaataa aacatcgacc 2820
ctgacttata tgccttggga acgaaaatta caatggacaa atgaacaaat tgaaagtgca 2880
aaaagaggag aaaatatacc tgttaacaag ttcattatta atagtataac tctataa    2937
<210>10
<211>972
<212>PRT
<213>多杀巴斯德氏杆菌
<400>10
Met Asn Thr Leu Ser Gln Ala Ile Lys Ala Tyr Asn Ser Asn Asp Tyr
  1               5                  10                  15
Gln Leu Ala Leu Lys Leu Phe Glu Lys Ser Ala Glu Ile Tyr Gly Arg
             20                  25                  30
Lys Ile Val Glu Phe Gln Ile Thr Lys Cys Gln Glu Lys Leu Ser Ala
         35                  40                  45
His Pro Ser Val Asn Ser Ala His Leu Ser Val Asn Lys Glu Glu Lys
     50                  55                  60
Val Asn Val Cys Asp Ser Pro Leu Asp Ile Ala Thr Gln Leu Leu Leu
 65                  70                  75                  80
Ser Asn Val Lys Lys Leu Val Leu Ser Asp Ser Glu Lys Asn Thr Leu
                 85                  90                  95
Lys Asn Lys Trp Lys Leu Leu Thr Glu Lys Lys Ser Glu Asn Ala Glu
            100                 105                 110
Val Arg Ala Val Ala Leu Val Pro Lys Asp Phe Pro Lys Asp Leu Val
        115                 120                 125
Leu Ala Pro Leu Pro Asp His Val Asn Asp Phe Thr Trp Tyr Lys Lys
    130                 135                 140
Arg Lys Lys Arg Leu Gly Ile Lys Pro Glu His Gln His Val Gly Leu
145                 150                 155                 160
Ser Ile Ile Val Thr Thr Phe Asn Arg Pro Ala Ile Leu Ser Ile Thr
                165                 170                 175
Leu Ala Cys Leu Val Asn Gln Lys Thr His Tyr Pro Phe Glu Val Ile
            180                 185                 190
Val Thr Asp Asp Gly Ser Gln Glu Asp Leu Ser Pro Ile Ile Arg Gln
        195                 200                 205
Tyr Glu Asn Lys Leu Asp Ile Arg Tyr Val Arg Gln Lys Asp Asn Gly
    210                 215                 220
Phe Gln Ala Ser Ala Ala Arg Asn Met Gly Leu Arg Leu Ala Lys Tyr
225                 230                 235                 240
Asp Phe Ile Gly Leu Leu Asp Cys Asp Met Ala Pro Asn Pro Leu Trp
                245                 250                 255
Val His Ser Tyr Val Ala Glu Leu Leu Glu Asp Asp Asp Leu Thr Ile
            260                 265                 270
Ile Gly Pro Arg Lys Tyr Ile Asp Thr Gln His Ile Asp Pro Lys Asp
        275                 280                 285
Phe Leu Asn Asn Ala Ser Leu Leu Glu Ser Leu Pro Glu Val Lys Thr
    290                 295                 300
Asn Asn Ser Val Ala Ala Lys Gly Glu Gly Thr Val Ser Leu Asp Trp
305                 310                 315                 320
Arg Leu Glu Gln Phe Glu Lys Thr Glu Asn Leu Arg Leu Ser Asp Ser
                325                 330                 335
Pro Phe Arg Phe Phe Ala Ala Gly Asn Val Ala Phe Ala Lys Lys Trp
            340                 345                 350
Leu Asn Lys Ser Gly Phe Phe Asp Glu Glu Phe Asn His Trp Gly Gly
        355                 360                 365
Glu Asp Val Glu Phe Gly Tyr Arg Leu Phe Arg Tyr Gly Ser Phe Phe
    370                 375                 380
Lys Thr Ile Asp Gly Ile Met Ala Tyr His Gln Glu Pro Pro Gly Lys
385                 390                 395                 400
Glu Asn Glu Thr Asp Arg Glu Ala Gly Lys Asn Ile Thr Leu Asp Ile
                405                 410                 415
Met Arg Glu Lys Val Pro Tyr Ile Tyr Arg Lys Leu Leu ProIle Glu
            420                 425                 430
Asp Ser His Ile Asn Arg Val Pro Leu Val Ser Ile Tyr Ile Pro Ala
        435                 440                 445
Tyr Asn Cys Ala Asn Tyr Ile Gln Arg Cys Val Asp Ser Ala Leu Asn
    450                 455                 460
Gln Thr Val Val Asp Leu Glu Val Cys Ile Cys Asn Asp Gly Ser Thr
465                 470                 475                 480
Asp Asn Thr Leu Glu Val Ile Asn Lys Leu Tyr Gly Asn Asn Pro Arg
                485                 490                 495
Val Arg Ile Met Ser Lys Pro Asn Gly Gly Ile Ala Ser Ala Ser Asn
            500                 505                 510
Ala Ala Val Ser Phe Ala Lys Gly Tyr Tyr Ile Gly Gln Leu Asp Ser
        515                 520                 525
Asp Asp Tyr Leu Glu Pro Asp Ala Val Glu Leu Cys Leu Lys Glu Phe
    530                 535                 540
Leu Lys Asp Lys Thr Leu Ala Cys Val Tyr Thr Thr Asn Arg Asn Val
545                 550                 555                 560
Asn Pro Asp Gly Ser Leu Ile Ala Asn Gly Tyr Asn Trp Pro Glu Phe
                565                 570                 575
Ser Arg Glu Lys Leu Thr Thr Ala Met Ile Ala His His Phe Arg Met
            580                 585                 590
Phe Thr Ile Arg Ala Trp His Leu Thr Asp Gly Phe Asn Glu Lys Ile
        595                 600                 605
Glu Asn Ala Val Asp Tyr Asp Met Phe Leu Lys Leu Ser Glu Val Gly
    610                 615                 620
Lys Phe Lys His Leu Asn Lys Ile Cys Tyr Asn Arg Val Leu His Gly
625                 630                 635                 640
Asp Asn Thr Ser Ile Lys Lys Leu Gly Ile Gln Lys Lys Asn His Phe
                645                 650                 655
Val Val Val Asn Gln Ser Leu Asn Arg Gln Gly Ile Thr Tyr Tyr Asn
            660                 665                 670
Tyr Asp Glu Phe Asp Asp Leu Asp Glu Ser Arg Lys Tyr Ile Phe Asn
        675                 680                 685
Lys Thr Ala Glu Tyr Gln Glu Glu Ile Asp Ile Leu Lys Asp Ile Lys
    690                 695                 700
Ile Ile Gln Asn Lys Asp Ala Lys Ile Ala Val Ser Ile Phe Tyr Pro
705                 710                 715                 720
Asn Thr Leu Asn Gly Leu Val Lys Lys Leu Asn Asn Ile Ile Glu Tyr
                725                 730                 735
Asn Lys Asn Ile Phe Val Ile Val Leu His Val Asp Lys Asn His Leu
            740                 745                 750
Thr Pro Asp Ile Lys Lys Glu Ile Leu Ala Phe Tyr His Lys His Gln
        755                 760                 765
Val Asn Ile Leu Leu Asn Asn Asp Ile Ser Tyr Tyr Thr Ser Asn Arg
    770                 775                 780
Leu Ile Lys Thr Glu Ala His Leu Ser Asn Ile Asn Lys Leu Ser Gln
785                 790                 795                 800
Leu Asn Leu Asn Cys Glu Tyr Ile Ile Phe Asp Asn His Asp Ser Leu
                805                 810                 815
Phe Val Lys Asn Asp Ser Tyr Ala Tyr Met Lys Lys Tyr Asp Val Gly
            820                 825                 830
Met Asn Phe Ser Ala Leu Thr His Asp Trp Ile Glu Lys Ile Asn Ala
        835                 840                 845
His Pro Pro Phe Lys Lys Leu Ile Lys Thr Tyr Phe Asn Asp Asn Asp
    850                 855                 860
Leu Lys Ser Met Asn Val Lys Gly Ala Ser Gln Gly Met Phe Met Thr
865                 870                 875                 880
Tyr Ala Leu Ala His Glu Leu Leu Thr Ile Ile Lys Glu Val Ile Thr
                885                 890                 895
Ser Cys Gln Ser Ile Asp Ser Val Pro Glu Tyr Asn Thr Glu Asp Ile
            900                 905                 910
Trp Phe Gln Phe Ala Leu Leu Ile Leu Glu Lys Lys Thr Gly His Val
        915                 920                 925
Phe Asn Lys Thr Ser Thr Leu Thr Tyr Met Pro Trp Glu Arg Lys Leu
    930                 935                 940
Gln Trp Thr Asn Glu Gln Ile Glu Ser Ala Lys Arg Gly Glu Asn Ile
945                 950                 955                 960
Pro Val Asn Lys Phe Ile Ile Asn Ser Ile Thr Leu
                965                 970
<210>11
<211>3466
<212>DNA
<213>乳房链球菌
<400>11
gcaaaagttt aaaggaggaa ttatggaaaa actaaaaaat ctcattacat ttatgacttt 60
tattttcctg tggctcataa ttattgggct taatgttttt gtatttggaa ctaaaggaag 120
tctaacagtg tatgggatta ttctattaac ctatttgtcg ataaaaatgg gattatcttt 180
tttttatcgt ccctataaag gaagtgtagg tcaatataag gtagcagcta ttatcccatc 240
ttataatgag gatggtgtcg gtttactaga aactctaaag agtgttcaaa aacaaacata 300
tccaattgca gaaattttcg taattgacga tgggtcagta gataaaacag gtataaaatt 360
ggtcgaagac tatgtgaagt taaatggctt tggagaccaa gttatcgttc atcagatgcc 420
tgaaaatgtt ggtaaaagac atgctcaggc ttgggcattt gaaaggtctg atgctgatgt 480
tttcttaaca gtggattcag atacctacat ctatcctgat gctcttgaag aattattaaa 540
gacatttaat gatccagagg tctacgctgc aactggtcat ttaaatgcaa gaaatagaca 600
aactaatctc ttaactagac tgactgatat tcgttacgat aatgcatttg gtgtagaacg 660
tgctgctcag tctgttacgg gaaatatttt ggtttgttcc ggacctttaa gtatttatag 720
acgttccgtc ggtattccaa atcttgaacg ctatacctca caaacatttc ttggtgtccc 780
tgtaagcata ggggatgacc gttgtttgac aaattatgca actgatttgg gaaaaacggt 840
ttatcagtca actgcaagat gtgatactga cgttccagat aagtttaagg ttttcatcaa 900
acaacaaaat cgttggaata agtcattttt tagggagtct attatctctg ttaagaagtt 960
attagccaca ccaagtgttg ctgtttggac tattacagaa gtttccatgt tcatcatgct 1020
agtttattct atctttagct tattgatagg agaggctcaa gaatttaatc tcataaaact 1080
ggttgctttt ttagttatta ttttcatagt agctctttgt agaaatgttc attacatggt 1140
taagcatcca tttgcttttt tattgtcacc gttttatgga ttgatacatc tattcgtttt 1200
gcaacctctt aagatatatt cgttatttac tataagaaat gctacatggg gaactcgtaa 1260
aaagacaagt aaataattca attagagaaa ggacaaaata gtgaaaattg cagttgcagg 1320
ttctggctat gttggcctat cattaagtgt attattagca cagaaaaatc ctgttacagt 1380
tgtagatatt attgagaaga aagtaaatct cataaatcaa aaacaatcac caatccagga 1440
tgttgatatt gaaaactatt taaaagaaaa aaagttacaa ttaagagcta ctctagacgc 1500
cgatcaagca tttagggatg cagatatact aattattgct acaccaacca attatgatgt 1560
ggagaagaat ttttttgata ctagtcatgt tgagactgta attgagaaag ctttagcttt 1620
aaatagtcag gctttgttag ttattaaatc aacgatacca cttggtttta ttaaaaagat 1680
gcgtcaaaaa tatcagacag accgtattat ttttagtccc gaatttctta gagagtctaa 1740
agctttaaaa gataatcttt atcctagtcg aataattgtt tcctttgaag atgatgattc 1800
tatggaagta atagaagcag caaagacttt tgctcaattg ttaaaagatg gttctttgga 1860
taaagatgtt cctgtacttt ttatgggttc agcagaggct gaagcagtaa aattatttgc 1920
caatacctat ttagctatgc gtgtctccta ttttaatgag ttagatacat atgctgaaaa 1980
gaatggttta cgtgtggata atattattga gggcgtttgc catgatcgac gcataggaat 2040
tcattataat aacccttctt ttggctatgg aggatactgc ttacctaaag ataccaaaca 2100
gttgctagca ggctatgatg gtattcctca atcgcttata aaagcaattg ttgattctaa 2160
taaaattcgt aaagagtata tcgcatcaca aattttacaa caattgagtg atattaatgt 2220
agatcctaaa gatgcaacga ttggtattta ccgccttatc atgaaaagta actctgataa 2280
tttcagagag agtgcaataa aagatattat tgatcatatt aagagctatc aaattaatat 2340
agtcttgtat gagccaatga tgaatgaaga ttttgattta ccaatcattg atgatttatc 2400
tgacttcaaa gccatgtcac atattatcgt ttcaaataga tatgatttag ccttagaaga 2460
tgttaaagaa aaagtttaca ccagagatat ttacggtgtg gattaagttt gatttttaac 2520
aaatctccaa aaaatagata aaaaaaacag actctgataa aagagtctgt tttttaaaag 2580
tgtgagcatc ctattgctag gatgctcagg aaatttatga aaagggagat aagagggaac 2640
ttatcttccc caacggtttg ggagaccatt atttaggata gtcttatcat aagctatcaa 2700
ccttaaagat ttcttaactc gttttcgttt gggtcttgtc tttttaattt tttgatgaga 2760
attaaacttg atggaatgag aatcaggaca ctgcctatcc aggctgctgg attagctgaa 2820
gccacaccaa caaaaccaaa gtataacagg ccaataatgg cgactcctgc tctcatgact 2880
aattccataa tgccagctaa agtaggaaca aaaccgtatc cgagaccttg aatgaaactt 2940
cttagtataa ataggatggc taaaatccaa taaagagagc cattaatcag ataatagaga 3000
taggctaaat ggaaaacagc tggatcagcc ttactaatga aaatgccaga gaaaaagcgg 3060
tgttggaaaa ttaacagaat agcaaaaaga acagaccaaa taatacagat aatgagtgaa 3120
tctttaagac cctcaaggat tcttttataa gctttagcgc catagttctg agctgtaaag 3180
gttgacaagg ctaagcccag atttaacatc ggtagcatgg ccagttggtc tgttttactg 3240
gcaatagcaa tagctgcgat agcttcggtc cccaacttat taatggttac ctgcagtgta 3300
atggctccaa tggctataat actagcctga aatgccatgg gaaaaccaag gcgagcatga 3360
tttctgagat tttccctatc aagagtcaaa tcgtctttct tcagtcggaa atgggggatc 3420
tttttgttga tgtaaaggac caaatagagt acggagaaag cttgca                3466
<210>12
<211>417
<212>PRT
<213>乳房链球菌
<400>12
Met Glu Lys Leu Lys Asn Leu Ile Thr Phe Met Thr Phe Ile Phe Leu
  1               5                  10                  15
Trp Leu Ile Ile Ile Gly Leu Asn Val Phe Val Phe Gly Thr Lys Gly
             20                  25                  30
Ser Leu Thr Val Tyr Gly Ile Ile Leu Leu Thr Tyr Leu Ser Ile Lys
         35                  40                  45
Met Gly Leu Ser Phe Phe Tyr Arg Pro Tyr Lys Gly Ser Val Gly Gln
     50                  55                  60
Tyr Lys Val Ala Ala Ile Ile Pro Ser Tyr Asn Glu Asp Gly Val Gly
 65                  70                  75                  80
Leu Leu Glu Thr Leu Lys Ser Val Gln Lys Gln Thr Tyr Pro Ile Ala
                 85                  90                  95
Glu Ile Phe Val Ile Asp Asp Gly Ser Val Asp Lys Thr Gly Ile Lys
            100                 105                 110
Leu Val Glu Asp Tyr Val Lys Leu Asn Gly Phe Gly Asp Gln Val Ile
        115                 120                 125
Val His Gln Met Pro Glu Asn Val Gly Lys Arg His Ala Gln Ala Trp
    130                 135                 140
Ala Phe Glu Arg Ser Asp Ala Asp Val Phe Leu Thr Val Asp Ser Asp
145                 150                 155                 160
Thr Tyr Ile Tyr Pro Asp Ala Leu Glu Glu Leu Leu Lys Thr Phe Asn
                165                 170                 175
Asp Pro Glu Val Tyr Ala Ala Thr Gly His Leu Asn Ala Arg Asn Arg
            180                 185                 190
Gln Thr Asn Leu Leu Thr Arg Leu Thr Asp Ile Arg Tyr Asp Asn Ala
        195                 200                 205
Phe Gly Val Glu Arg Ala Ala Gln Ser Val Thr Gly Asn Ile Leu Val
    210                 215                 220
Cys Ser Gly Pro Leu Ser Ile Tyr Arg Arg Ser Val Gly Ile Pro Asn
225                 230                 235                 240
Leu Glu Arg Tyr Thr Ser Gln Thr Phe Leu Gly Val Pro Val Ser Ile
                245                 250                 255
Gly Asp Asp Arg Cys Leu Thr Asn Tyr Ala Thr Asp Leu Gly Lys Thr
            260                 265                 270
Val Tyr Gln Ser Thr Ala Arg Cys Asp Thr Asp Val Pro Asp Lys Phe
        275                 280                 285
Lys Val Phe Ile Lys Gln Gln Asn Arg Trp Asn Lys Ser Phe Phe Arg
    290                 295                 300
Glu Ser Ile Ile Ser Val Lys Lys Leu Leu Ala Thr Pro Ser Val Ala
305                 310                 315                 320
Val Trp Thr Ile Thr Glu Val Ser Met Phe Ile Met Leu Val Tyr Ser
                325                 330                 335
Ile Phe Ser Leu Leu Ile Gly Glu Ala Gln Glu Phe Asn Leu Ile Lys
            340                 345                 350
Leu Val Ala Phe Leu Val Ile Ile Phe Ile Val Ala Leu Cys Arg Asn
        355                 360                 365
Val His Tyr Met Val Lys His Pro Phe Ala Phe Leu Leu Ser Pro Phe
    370                 375                 380
Tyr Gly Leu Ile His Leu Phe Val Leu Gln Pro Leu Lys Ile Tyr Ser
385                 390                 395                 400
Leu Phe Thr Ile Arg Asn Ala Thr Trp Gly Thr Arg Lys Lys Thr Ser
                405                 410                 415
Lys
<210>13
<211>1440
<212>DNA
<213>酿脓链球菌
<400>13
tttaatggaa acacaatttt attaaaaata tctctatatc tagttgacat tatttcttat 60
ttatattata atattgaggt cctttctttc aaggaaatta aaaaagaaag aggtgtaatt 120
gtgcctattt ttaaaaaaac tttaattgtt ttatccttta tttttttgat atctatcttg 180
atttatctaa atatgtatct atttggaaca tcaactgtag gaatttatgg agtaatatta 240
ataacctatc tagttatcaa acttggatta tctttccttt atgagccatt taaaggaaat 300
ccacatgact ataaagttgc tgctgtaatt ccttcttata atgaagatgc cgagtcatta 360
ttagaaacac ttaaaagtgt gttagcacag acctatccgt tatcagaaat ttatattgtt 420
gatgatggga gttcaaacac agatgcaata caattaattg aagagtatgt aaatagagaa 480
gtggatattt gtcgaaacgt tatcgttcac cgttcccttg tcaataaagg aaaacgccat 540
gctcaagcgt gggcatttga aagatctgac gctgacgttt ttttaaccgt agactcagat 600
acttatatct atccaaatgc cttagaagaa ctcctaaaaa gcttcaatga tgagacagtt 660
tatgctgcaa caggacattt gaatgctaga aacagacaaa ctaatctatt aacgcgactt 720
acagatatcc gttacgataa tgcctttggg gtggagcgtg ctgctcaatc attaacaggt 780
aatattttag tttgctcagg accattgagt atttatcgac gtgaagtgat tattcctaac 840
ttagagcgct ataaaaatca aacattccta ggtttacctg ttagcattgg ggatgatcga 900
tgtttaacaa attatgctat tgatttagga cgcactgtct accaatcaac agctagatgt 960
gatactgatg tacctttcca attaaaaagt tatttaaagc aacaaaatcg atggaataaa 1020
tcttttttta gagaatctat tatttctgtt aaaaaaattc tttctaatcc catcgttgcc 1080
ttatggacta ttttcgaagt cgttatgttt atgatgttga ttgtcgcaat tgggaatctt 1140
ttgtttaatc aagctattca attagacctt attaaacttt ttgccttttt atccatcatc 1200
tttatcgttg ctttatgtcg taatgttcat tatatggtca aacatcctgc tagttttttg 1260
ttatctcctc tgtatggaat attacacttg tttgtcttac agcccctaaa actttattct 1320
ttatgcacca ttaaaaatac ggaatgggga acacgtaaaa aggtcactat ttttaaataa 1380
tatatgcatc gagtagttag agaaggagta attttatgaa aatagcagtt gctggatcag 1440
<210>14
<211>419
<212>PRT
<213>酿脓链球菌
<400>14
Met Pro Ile Phe Lys Lys Thr Leu Ile Val Leu Ser Phe Ile Phe Leu
  1               5                  10                  15
Ile Ser Ile Leu Ile Tyr Leu Asn Met Tyr Leu Phe Gly Thr Ser Thr
             20                  25                  30
Val Gly Ile Tyr Gly Val Ile Leu Ile Thr Tyr Leu Val Ile Lys Leu
         35                  40                  45
Gly Leu Ser Phe Leu Tyr Glu Pro Phe Lys Gly Asn Pro His Asp Tyr
     50                  55                  60
Lys Val Ala Ala Val Ile Pro Ser Tyr Asn Glu Asp Ala Glu Ser Leu
 65                  70                  75                  80
Leu Glu Thr Leu Lys Ser Val Leu Ala Gln Thr Tyr Pro Leu Ser Glu
                 85                  90                  95
Ile Tyr Ile Val Asp Asp Gly Ser Ser Asn Thr Asp Ala Ile Gln Leu
            100                 105                 110
Ile Glu Glu Tyr Val Asn Arg Glu Val Asp Ile Cys Arg Asn Val Ile
        115                 120                 125
Val His Arg Ser Leu Val Asn Lys Gly Lys Arg His Ala Gln Ala Trp
    130                 135                 140
Ala Phe Glu Arg Ser Asp Ala Asp Val Phe Leu Thr Val Asp Ser Asp
145                 150                 155                 160
Thr Tyr Ile Tyr Pro Asn Ala Leu Glu Glu Leu Leu Lys Ser Phe Asn
                165                 170                 175
Asp Glu Thr Val Tyr Ala Ala Thr Gly His Leu Asn Ala Arg Asn Arg
            180                 185                 190
Gln Thr Asn Leu Leu Thr Arg Leu Thr Asp Ile Arg Tyr Asp Asn Ala
        195                 200                 205
Phe Gly Val Glu Arg Ala Ala Gln Ser Leu Thr Gly Asn Ile Leu Val
    210                 215                 220
Cys Ser Gly Pro Leu Ser Ile Tyr Arg Arg Glu Val Ile Ile Pro Asn
225                 230                 235                 240
Leu Glu Arg Tyr Lys Asn Gln Thr Phe Leu Gly Leu Pro Val Ser Ile
                245                 250                 255
Gly Asp Asp Arg Cys Leu Thr Asn Tyr Ala Ile Asp Leu Gly Arg Thr
            260                 265                 270
Val Tyr Gln Ser Thr Ala Arg Cys Asp Thr Asp Val Pro Phe Gln Leu
        275                 280                 285
Lys Ser Tyr Leu Lys Gln Gln Asn Arg Trp Asn Lys Ser Phe Phe Arg
    290                 295                 300
Glu Ser Ile Ile Ser Val Lys Lys Ile Leu Ser Asn Pro Ile Val Ala
305                 310                 315                 320
Leu Trp Thr Ile Phe Glu Val Val Met Phe Met Met Leu Ile Val Ala
                325                 330                 335
Ile Gly Asn Leu Leu Phe Asn Gln Ala Ile Gln Leu Asp Leu Ile Lys
            340                 345                 350
Leu Phe Ala Phe Leu Ser Ile Ile Phe Ile Val Ala Leu Cys Arg Asn
        355                 360                 365
Val His Tyr Met Val Lys His Pro Ala Ser Phe Leu Leu Ser Pro Leu
    370                 375                 380
Tyr Gly Ile Leu His Leu Phe Val Leu Gln Pro Leu Lys Leu Tyr Ser
385                 390                 395                 400
Leu Cys Thr Ile Lys Asn Thr Glu Trp Gly Thr Arg Lys Lys Val Thr
                405                 410                 415
Ile Phe Lys
<210>15
<211>1380
<212>DNA
<213>硫磺矿硫化叶菌
<400>15
tgccctcatg cggttaagct tgaaatggcc ttttttagaa agagaaagga gttatctagt 60
taaccaatct tgccaccaga aagttatcat agcatatagg gaagcaatat attgcactgc 120
tagtgcgata gaaccgtata ttagagtttt caatttatct tctggaatta aataaatcat 180
ggtcattaca aagggtatta tagctataaa tcctccgtaa tgcaagaata aataaaagat 240
aaagaagtcg gaatggtaac gggttggcag atacaatagt aataagagct tagtattaat 300
tacattaatt gaggaataga tcttaagaat tctagtgaaa ctcatataaa ggaacaagag 360
cgtaaataat ggtaacagat tggtgtatat catattaaaa acgtataatg aacccctttt 420
acttatacta ccgtcagcta tctcccttat aaaattaaga taatttgctc ttgtccatct 480
agttacttgt ttcgtaaaca tttttatgtc tctagggggt tttgtatatg ccactgcatc 540
aaagactttt acagccctat accctttttt tataacaaaa tcggttaaat ctctatcatc 600
ggaaatttta attggtcttc caaacatttt cggctctaaa aactctttag ataatatata 660
tggttttacg agttcggtcc tatatattac acattgtcca cttaatatta tagcacttcc 720
aaaatagttt accgccctgt ttactatctc acttattctc tcaaagaatt caccataata 780
atatgcatat ttatttttct cgtcatacat aattctaata tttggcccta ctccacctac 840
tgactcatca aaaacactta acatctttag tatagagtct ttataaataa tcgtatcact 900
atctagaaac atcactagag gagatcttac atacttaact ccctcggcta acgegtatct 960
tttcccctta tgttcacgca tataaataaa tttaccacca tatctttccg taattgattt 1020
gtatggttct agaacactat cccctacaac aataaattct aaccttgtgt catataaagt 1080
ccttatcact ttttcaaaaa tatctatttc ctccttataa actggtatca caactgtaag 1140
atcagagaga ttataaaaac ttgagtgttg agtttttcta ttattactta ttactgcaaa 1200
aaatgaattc aaaaagaaat aaagaatagt tataattgtg aatgaaagag aataaatgaa 1260
atatgagact ccgtgaaata agtgaaacat aatcaccact ataatgctcg atatcgaaat 1320
atataacgat ttttcctaat tcaccattcg aattctccgt tcaaaaaggg gttagttaac 1380
<210>16
<211>415
<212>PRT
<213>硫磺矿硫化叶菌
<400>16
Met Val Ile Met Phe His Leu Phe His Gly Val Ser Tyr Phe Ile Tyr
  1               5                  10                  15
Ser Leu Ser Phe Thr Ile Ile Thr Ile Leu Tyr Phe Phe Leu Asn Ser
             20                  25                  30
Phe Phe Ala Val Ile Ser Asn Asn Arg Lys Thr Gln His Ser Ser Phe
         35                  40                  45
Tyr Asn Leu Ser Asp Leu Thr Val Val Ile Pro Val Tyr Lys Glu Glu
     50                  55                  60
Ile Asp Ile Phe Glu Lys Val Ile Arg Thr Leu Tyr Asp Thr Arg Leu
 65                  70                  75                  80
Glu Phe Ile Val Val Gly Asp Ser Val Leu Glu Pro Tyr Lys Ser Ile
                 85                  90                  95
Thr Glu Arg Tyr Gly Gly Lys Phe Ile Tyr Met Arg Glu His Lys Gly
            100                 105                 110
Lys Arg Tyr Ala Leu Ala Glu Gly Val Lys Tyr Val Arg Ser Pro Leu
        115                 120                 125
Val Met Phe Leu Asp Ser Asp Thr Ile Ile Tyr Lys Asp Ser Ile Leu
    130                 135                 140
Lys Met Leu Ser Val Phe Asp Glu Ser Val Gly Gly Val Gly Pro Asn
145                 150                 155                 160
Ile Arg Ile Met Tyr Asp Glu Lys Asn Lys Tyr Ala Tyr Tyr Tyr Gly
                165                 170                 175
Glu Phe Phe Glu Arg Ile Ser Glu Ile Val Asn Arg Ala Val Asn Tyr
            180                 185                 190
Phe Gly Ser Ala Ile Ile Leu Ser Gly Gln Cys Val Ile Tyr Arg Thr
        195                 200                 205
Glu Leu Val Lys Pro Tyr Ile Leu Ser Lys Glu Phe Leu Glu Pro Lys
    210                 215                 220
Met Phe Gly Arg Pro Ile Lys Ile Ser Asp Asp Arg Asp Leu Thr Asp
225                 230                 235                 240
Phe Val Ile Lys Lys Gly Tyr Arg Ala Val Lys Val Phe Asp Ala Val
                245                 250                 255
Ala Tyr Thr Lys Pro Pro Arg Asp Ile Lys Met Phe Thr Lys Gln Val
            260                 265                 270
Thr Arg Trp Thr Arg Ala Asn Tyr Leu Asn Phe Ile Arg Glu Ile Ala
        275                 280                 285
Asp Gly Ser Ile Ser Lys Arg Gly Ser Leu Tyr Val Phe Asn Met Ile
    290                 295                 300
Tyr Thr Asn Leu Leu Pro Leu Phe Thr Leu Leu Phe Leu Tyr Met Ser
305                 310                 315                 320
Phe Thr Arg Ile Leu Lys Ile Tyr Ser Ser Ile Asn Val Ile Asn Thr
                325                 330                 335
Lys Leu Leu Leu Leu Leu Tyr Leu Pro Thr Arg Tyr His Ser Asp Phe
            340                 345                 350
Phe Ile Phe Tyr Leu Phe Leu His Tyr Gly Gly Phe Ile Ala Ile Ile
        355                 360                 365
Pro Phe Val Met Thr Met Ile Tyr Leu Ile Pro Glu Asp Lys Leu Lys
    370                 375                 380
Thr Leu Ile Tyr Gly Ser Ile Ala Leu Ala Val Gln Tyr Ile Ala Ser
385                 390                 395                 400
Leu Tyr Ala Met Ile Thr Phe Trp Trp Gln Asp Trp Leu Thr Arg
            405                 410                 415
<210>17
<211>1200
<212>DNA
<213>炭疽芽孢杆菌
<400>17
taaggttcca aatatgaaag tggcagtagt ggtcccctca tataatgaaa gtgcaagtgc 60
tattgttaat acaattaata gcgttttagc tcaagattat ccaattcatg aaattttctt 120
tgttgatgat ggtagtaagg ataaatcggc ttatgaagta gcacttaaaa tgagggagga 180
acttcttaga actcaacgag aaattgctgc tacaactaag aatatttgtt ctgaaatatt 240
aggtattcct gacttaatcg tacatcgttt acctaagaat tgcgggaaaa gacatgctca 300
attatgggct tttaaacgga caacagcaga tgctattgtt accattgatt cagatggtga 360
tttgttccca aatgctgtta gagagttatt gaaacccttt aatgatgaaa aagtaatggc 420
cacaactggt cacgtgaaca ttcgtaatag aaatgataat ttattaacaa aactaattga 480
tatgcgttat gacaatgcgt tccgtgtgga gcgtgcagca cagtccgtaa caggaaatgt 540
tcttgtttgt agtgggccgt taagttgtta tcgtagagaa gtaataactg aaaatttaga 600
acattatgga agtcagatgt tccttggtga ggaggtgcag tttggagatg atagatgtct 660
aactaattat gctattttga aagggaaaac agtttatcaa tccactgctc gatgtattac 720
tgatgctcca actacattaa aacaatttct taaacagcaa ctacgttgga acaagtcatt 780
ttttagagaa agtttaattt cacttggcat tggtatgaaa aaaccaaatg ttcttgtttg 840
gacaattttc gaaatatcgt tatggatttt atttgggctt tccctacttc taagtattat 900
tctcaaggca agtcatgtag ggttaatttt ggctgtttat tatttgggtt atatttcatt 960
agctgtatat gctagaaatg tattttatct attaaaacat ccccttactt tcttactggc 1020
gccattatat ggaattctcc atgtattagc actattacct atacgctttt atgctttact 1080
aactattaaa tctaatggtt ggggaacacg ttaattacag taattttatg tattttttta 1140
ggaggatatt attaagtgaa gattagaaaa gcgattatcc cagcagcggg attaggcaca 1200
<210>18
<211>366
<212>PRT
<213>炭疽芽孢杆菌
<400>18
Met Lys Val Ala Val Val Val Pro Ser Tyr Asn Glu Ser Ala Ser Ala
  1               5                  10                  15
Ile Val Asn Thr Ile Asn Ser Val Leu Ala Gln Asp Tyr Pro Ile His
             20                  25                  30
Glu Ile Phe Phe Val Asp Asp Gly Ser Lys Asp Lys Ser Ala Tyr Glu
         35                  40                  45
Val Ala Leu Lys Met Arg Glu Glu Leu Leu Arg Thr Gln Arg Glu Ile
     50                  55                  60
Ala Ala Thr Thr Lys Asn Ile Cys Ser Glu Ile Leu Gly Ile Pro Asp
65                  70                  75                  80
Leu Ile Val His Arg Leu Pro Lys Asn Cys Gly Lys Arg His Ala Gln
                 85                  90                  95
Leu Trp Ala Phe Lys Arg Thr Thr Ala Asp Ala Ile Val Thr Ile Asp
            100                 105                 110
Ser Asp Gly Asp Leu Phe Pro Asn Ala Val Arg Glu Leu Leu Lys Pro
        115                 120                 125
Phe Asn Asp Glu Lys Val Met Ala Thr Thr Gly His Val Asn Ile Arg
    130                 135                 140
Asn Arg Asn Asp Asn Leu Leu Thr Lys Leu Ile Asp Met Arg Tyr Asp
145                 150                 155                 160
Asn Ala Phe Arg Val Glu Arg Ala Ala Gln Ser Val Thr Gly Asn Val
                165                 170                 175
Leu Val Cys Ser Gly Pro Leu Ser Cys Tyr Arg Arg Glu Val Ile Thr
            180                 185                 190
Glu Asn Leu Glu His Tyr Gly Ser Gln Met Phe Leu Gly Glu Glu Val
        195                 200                 205
Gln Phe Gly Asp Asp Arg Cys Leu Thr Asn Tyr Ala Ile Leu Lys Gly
    210                 215                 220
Lys Thr Val Tyr Gln Ser Thr Ala Arg Cys Ile Thr Asp Ala Pro Thr
225                 230                 235                 240
Thr Leu Lys Gln Phe Leu Lys Gln Gln Leu Arg Trp Asn Lys Ser Phe
                245                 250                 255
Phe Arg Glu Ser Leu Ile Ser Leu Gly Ile Gly Met Lys Lys Pro Asn
            260                 265                 270
Val Leu Val Trp Thr Ile Phe Glu Ile Ser Leu Trp Ile Leu Phe Gly
        275                 280                 285
Leu Ser Leu Leu Leu Ser Ile Ile Leu Lys Ala Ser His Val Gly Leu
    290                 295                 300
Ile Leu Ala Val Tyr Tyr Leu Gly Tyr Ile Ser Leu Ala Val Tyr Ala
305                 310                 315                 320
Arg Asn Val Phe Tyr Leu Leu Lys His Pro Leu Thr Phe Leu Leu Ala
                325                 330                 335
Pro Leu Tyr Gly Ile Leu His Val Leu Ala Leu Leu Pro Ile Arg Phe
            340                 345                 350
Tyr Ala Leu Leu Thr Ile Lys Ser Asn Gly Trp Gly Thr Arg
        355                 360                 365
<210>19
<211>1680
<212>DNA
<213>Ectocarpus siliculosus virus
<400>19
gccatttaca tcttggcgcg atcgttgcaa agtaaaaata atgttttctg tgacggaaac 60
aggggcatga catgcttctc ggcctgaaga aaaacctctt gttcattgcg tatctgttct 120
tcaatgccct tttaacgctt ttgttgcttg gattcgatta cggctacatc atcgtatcga 180
tattcgttgt cggcggacac ttcagagatg tgatcaacgt agcataccaa ttacttcaca 240
tgcacaggat actcaggcgt tgtgccgaca tcccggaaga cgatgccaag atagttattt 300
gttgcttggt tccggtgtac aacgagaagc cttcgatgtt aaagaagaat cttgatgctc 360
tgacgacaca gaagctatcg gaaaacacca agttggtggt gatgcttctc tttgacggac 420
tgaacaacca caacgcagat ctcttcaatg ccgtcgtcga tgccattggc cttgacaccg 480
gatgcggaga agagcaatgg tttccgaatt ggaagagcaa gctgctgaag aagttggtgt 540
acaaaatcgg catatacaat gacacgtcgg tcatcctgtc gtacaaggag aacaattcgg 600
gaaaaaaaga ctctctcatc atcggggaaa acttcatcgt gctcggcatc ccgaggatcg 660
aatctctgga cgtacgacaa gtggatttca tctatcacac ggacggcgac accatttccg 720
acgaaaactg tttgaacgag atggtgaagt ctctcgtgga tgatccagac ctcgacggcg 780
tctctggcct cctgagaaca tacctcaagg acgacgcgac ttgctcggaa agtgcgttcg 840
tagcgatgca agactttcag tacttcttct ccattgttgt ccgtaggatg acggagagca 900
taatgaattc aactacctgc ctcccggggt gctccaacat gatcaggata agcgaaaaga 960
ctcacgctgc gattgaaaaa tacggaaacc ttccggtcaa gaagagcggt ctggtgcaga 1020
cagtcacgcg gatgcaagga accgaccgac gatacaccac gctcttgctg agacagggtt 1080
ccaagctaca gatgaattgg cgtgcgtttg ttcacacgga gccaccgctg aacgcgacgg 1140
cgtttgtgaa tcaacgcaga cgatggtctt caaactcctt cttcaattcc atgatcacgc  1200
tgtactccaa caacatcccg atgtacatca agctatcgaa ccttgtcgac atcgcccgag  1260
tcttcaccac gatctttcgc gtgatatcgt acttgtgctt ttgggtttac gtcaagaatt  1320
tttcccttgt caacatcgtt tttttctcta tatttatcgc ccttccctac ctctatgcct  1380
tcgcctggat attctgtatc gttccagagt ggaagcagat gatagccggt ttttttttga  1440
acaaaatctt cacgcctttt ttatctgtga tcgcggtcac aaagatgttc ttcacttcaa  1500
ccgatttcgc ttggggcagt acgcggttga caccaccgga tgcagcgtct taaactcaac  1560
caacaatcgt ctctattaat aaacctgatt cgtgattttg ggttcgattc tcctgtttcc  1620
tttttttcct ttttttcctt tttttccttt ttttcctatt ttcctttttg attttgtttt  1680
<210>20
<211>493
<212>PRT
<213>Ectocarpus siliculosus virus
<400>20
Met Leu Leu Gly Leu Lys Lys Asn Leu Leu Phe Ile Ala Tyr Leu Phe
  1               5                  10                  15
Phe Asn Ala Leu Leu Thr Leu Leu Leu Leu Gly Phe Asp Tyr Gly Tyr
             20                  25                  30
Ile Ile Val Ser Ile Phe Val Val Gly Gly His Phe Arg Asp Val Ile
         35                  40                  45
Asn Val Ala Tyr Gln Leu Leu His Met His Arg Ile Leu Arg Arg Cys
     50                  55                  60
Ala Asp Ile Pro Glu Asp Asp Ala Lys Ile Val Ile Cys Cys Leu Val
65                  70                  75                  80
Pro Val Tyr Asn Glu Lys Pro Ser Met Leu Lys Lys Asn Leu Asp Ala
                 85                  90                  95
Leu Thr Thr Gln Lys Leu Ser Glu Asn Thr Lys Leu Val Val Met Leu
            100                 105                 110
Leu Phe Asp Gly Leu Asn Asn His Asn Ala Asp Leu Phe Asn Ala Val
        115                 120                 125
Val Asp Ala Ile Gly Leu Asp Thr Gly Cys Gly Glu Glu Gln Trp Phe
    130                 135                 140
Pro Asn Trp Lys Ser Lys Leu Leu Lys Lys Leu Val Tyr Lys Ile Gly
145                 150                 155                 160
Ile Tyr Asn Asp Thr Ser Val Ile Leu Ser Tyr Lys Glu Asn Asn Ser
                165                 170                 175
Gly Lys Lys Asp Ser Leu Ile Ile Gly Glu Asn Phe Ile Val Leu Gly
            180                 185                 190
Ile Pro Arg Ile Glu Ser Leu Asp Val Arg Gln Val Asp Phe Ile Tyr
        195                 200                 205
His Thr Asp Gly Asp Thr Ile Ser Asp Glu Asn Cys Leu Asn Glu Met
    210                 215                 220
Val Lys Ser Leu Val Asp Asp Pro Asp Leu Asp Gly Val Ser Gly Leu
225                 230                 235                 240
Leu Arg Thr Tyr Leu Lys Asp Asp Ala Thr Cys Ser Glu Ser Ala Phe
                245                 250                 255
Val Ala Met Gln Asp Phe Gln Tyr Phe Phe Ser Ile Val Val Arg Arg
            260                 265                 270
Met Thr Glu Ser Ile Met Asn Ser Thr Thr Cys Leu Pro Gly Cys Ser
        275                 280                 285
Asn Met Ile Arg Ile Ser Glu Lys Thr His Ala Ala Ile Glu Lys Tyr
    290                 295                 300
Gly Asn Leu Pro Val Lys Lys Ser Gly Leu Val Gln Thr Val Thr Arg
305                 310                 315                 320
Met Gln Gly Thr Asp Arg Arg Tyr Thr Thr Leu Leu Leu Arg Gln Gly
                325                 330                 335
Ser Lys Leu Gln Met Asn Trp Arg Ala Phe Val His Thr Glu Pro Pro
            340                 345                 350
Leu Asn Ala Thr Ala Phe Val Asn Gln Arg Arg Arg Trp Ser Ser Asn
        355                 360                 365
Ser Phe Phe Asn Ser Met Ile Thr Leu Tyr Ser Asn Asn Ile Pro Met
    370                 375                 380
Tyr Ile Lys Leu Ser Asn Leu Val Asp Ile Ala Arg Val Phe Thr Thr
385                 390                 395                 400
Ile Phe Arg Val Ile Ser Tyr Leu Cys Phe Trp Val Tyr Val Lys Asn
                405                 410                 415
Phe Ser Leu Val Asn Ile Val Phe Phe Ser Ile Phe Ile Ala Leu Pro
            420                 425                 430
Tyr Leu Tyr Ala Phe Ala Trp Ile Phe Cys Ile Val Pro Glu Trp Lys
        435                 440                 445
Gln Met Ile Ala Gly Phe Phe Leu Asn Lys Ile Phe Thr Pro Phe Leu
    450                 455                 460
Ser Val Ile Ala Val Thr Lys Met Phe Phe Thr Ser Thr Asp Phe Ala
465                 470                 475                 480
Trp Gly Ser Thr Arg Leu Thr Pro Pro Asp Ala Ala Ser
                485                 490

Claims (10)

1.一种重组宿主细胞,其中该重组宿主细胞是包含重组载体的芽孢杆菌细胞,所述重组载体包含具有编码SEQ ID NO:14所示酶活性透明质素合成酶的编码区的纯化核酸区段,其中编码区在启动子的控制之下。
2.权利要求1的重组宿主细胞,其中重组宿主细胞是枯草芽孢杆菌或地衣芽孢杆菌细胞。
3.权利要求1的重组宿主细胞,其中纯化的核酸区段包含根据SEQ ID NO:13的核苷酸序列。
4.权利要求3的重组宿主细胞,其中宿主细胞生产透明质酸。
5.权利要求1的重组宿主细胞,其中纯化核酸区段的编码酶活性透明质素合成酶的编码区处于革兰氏阳性细菌相容性启动子的控制之下。
6.权利要求5的重组宿主细胞,其中启动子是芽孢杆菌相容性启动子。
7.权利要求1的重组宿主细胞,其中枯草芽孢杆菌进一步包含重组载体,该重组载体包含具有编码酶活性UDP-G1cUA生物合成途径的酶的编码区的纯化核酸区段,其中酶活性UDP-G1cUA生物合成途径的酶选自UDP-葡萄糖脱氢酶、UDP-葡萄糖焦磷酸化酶及其组合。
8.权利要求1的重组宿主细胞,其中重组载体进一步包含具有编码酶活性UDP-葡萄糖脱氢酶的编码区的纯化核酸区段。
9.权利要求8的重组宿主细胞,其中编码酶活性HAS的编码区和编码酶活性UDP-葡萄糖脱氢酶的编码区是在至少一个启动子的至少一个拷贝的控制之下的。
10.权利要求8的重组宿主细胞,其中编码酶活性HAS的编码区和编码酶活性UDP-葡萄糖脱氢酶的编码区是在不同启动子的控制之下的。
CN200910006838.0A 2001-06-13 2002-06-13 透明质素合成酶基因及其表达 Expired - Fee Related CN101709285B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US29774401P 2001-06-13 2001-06-13
US29778801P 2001-06-13 2001-06-13
US60/297,788 2001-06-13
US60/297,744 2001-06-13

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CNA028133706A Division CN1620511A (zh) 2001-06-13 2002-06-13 透明质素合成酶基因及其表达

Publications (2)

Publication Number Publication Date
CN101709285A true CN101709285A (zh) 2010-05-19
CN101709285B CN101709285B (zh) 2014-03-26

Family

ID=31498148

Family Applications (2)

Application Number Title Priority Date Filing Date
CNA028133706A Pending CN1620511A (zh) 2001-06-13 2002-06-13 透明质素合成酶基因及其表达
CN200910006838.0A Expired - Fee Related CN101709285B (zh) 2001-06-13 2002-06-13 透明质素合成酶基因及其表达

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CNA028133706A Pending CN1620511A (zh) 2001-06-13 2002-06-13 透明质素合成酶基因及其表达

Country Status (10)

Country Link
EP (1) EP1481052B1 (zh)
JP (1) JP2005514059A (zh)
CN (2) CN1620511A (zh)
AT (1) ATE470708T1 (zh)
AU (2) AU2002365206B2 (zh)
CA (1) CA2451443C (zh)
DE (1) DE60236688D1 (zh)
DK (1) DK1481052T3 (zh)
ES (1) ES2346196T3 (zh)
WO (1) WO2003060063A2 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102559559A (zh) * 2012-02-21 2012-07-11 山东福瑞达生物医药有限公司 一种芽孢杆菌及采用该菌种生产透明质酸酶的方法
CN103255076A (zh) * 2012-02-21 2013-08-21 华熙福瑞达生物医药有限公司 一种芽孢杆菌、一种透明质酸酶及其制备方法和用途
WO2021077580A1 (zh) * 2019-10-24 2021-04-29 华熙生物科技股份有限公司 一种高效合成高纯度透明质酸及其寡聚糖的重组谷氨酸棒状杆菌

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2008200910C1 (en) * 2001-12-21 2012-11-22 Novozymes A/S Methods for producing hyaluronan in a recombinant host cell
US7811806B2 (en) 2001-12-21 2010-10-12 Novozymes, Inc. Methods for producing hyaluronan in a recombinant host cell
CA2563173A1 (en) * 2004-03-31 2005-10-20 Novozymes Biopolymer A/S Methods for producing hyaluronic acid in a bacillus cell
EP1696032A1 (de) 2005-02-23 2006-08-30 Bayer CropScience GmbH Verfahren und Mittel zur Herstellung von Hyaluronan in Pilzen
JP4639904B2 (ja) 2005-03-30 2011-02-23 チッソ株式会社 蛍光活性を有するルシフェラーゼの活性増強方法
JP4609177B2 (ja) 2005-04-28 2011-01-12 チッソ株式会社 カルシウム結合型発光蛋白質溶液の発光時間延長方法
US20080038780A1 (en) * 2006-02-15 2008-02-14 Novozymes Biopolymer A/S Production of low molecular weight hyaluronic acid
GB0610498D0 (en) * 2006-05-26 2006-07-05 Univ York Modified molecule
JP2010536387A (ja) * 2007-08-31 2010-12-02 ザ・ユニバーシティ・オブ・クイーンズランド ヒアルロン酸の生産
CN108587918A (zh) * 2018-05-30 2018-09-28 昆明理工大学 一种基于兼养微藻油脂积累的方法
CN108841862A (zh) * 2018-07-19 2018-11-20 中国农业科学院北京畜牧兽医研究所 一种含有ha蛋白融合标签的植物表达质粒载体及其载体的构建方法
CN115315242A (zh) * 2020-04-22 2022-11-08 株式会社资生堂 透明质酸产生促进剂
EP4067499A1 (en) * 2021-04-01 2022-10-05 Givaudan SA Hyaluronic acid-producing recombinant cells

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6455304B1 (en) * 1994-07-01 2002-09-24 The Board Of Regents Of The University Of Oklahoma Hyaluronate synthase gene and uses thereof
US6492150B1 (en) * 1996-07-03 2002-12-10 Clear Colutions Biotech, Inc. Gene encoding hyaluronan synthase
AU770903B2 (en) * 1998-04-02 2004-03-04 Board Of Regents For Oklahoma State University, The Nucleic acid encoding hyaluronan synthase and methods of use
EP1478746A4 (en) * 2001-12-03 2005-06-29 Regents For The University Of HYALURONIC SYNTHESES AND METHOD FOR THE PRODUCTION AND USE THEREOF
US7811806B2 (en) * 2001-12-21 2010-10-12 Novozymes, Inc. Methods for producing hyaluronan in a recombinant host cell

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102559559A (zh) * 2012-02-21 2012-07-11 山东福瑞达生物医药有限公司 一种芽孢杆菌及采用该菌种生产透明质酸酶的方法
CN103255076A (zh) * 2012-02-21 2013-08-21 华熙福瑞达生物医药有限公司 一种芽孢杆菌、一种透明质酸酶及其制备方法和用途
WO2021077580A1 (zh) * 2019-10-24 2021-04-29 华熙生物科技股份有限公司 一种高效合成高纯度透明质酸及其寡聚糖的重组谷氨酸棒状杆菌

Also Published As

Publication number Publication date
CN101709285B (zh) 2014-03-26
JP2005514059A (ja) 2005-05-19
AU2002365206A1 (en) 2003-07-30
EP1481052A4 (en) 2005-11-16
AU2002365206B2 (en) 2008-03-20
DE60236688D1 (de) 2010-07-22
EP1481052B1 (en) 2010-06-09
EP1481052A2 (en) 2004-12-01
WO2003060063A2 (en) 2003-07-24
ES2346196T3 (es) 2010-10-13
CA2451443A1 (en) 2003-07-24
CA2451443C (en) 2013-05-28
DK1481052T3 (da) 2010-09-20
WO2003060063A3 (en) 2004-09-16
AU2008202651B2 (en) 2011-06-02
CN1620511A (zh) 2005-05-25
AU2008202651A1 (en) 2008-07-10
ATE470708T1 (de) 2010-06-15

Similar Documents

Publication Publication Date Title
CN1322121C (zh) 透明质酸合酶基因及其应用
AU2008202651B2 (en) Hyaluronan synthase genes and expression thereof
CA2326821C (en) Nucleic acid encoding hyaluronan synthase and methods of use
US8735102B2 (en) Hyaluronan synthase genes and expression thereof in Bacillus hosts
JP2003199583A (ja) コンドロイチン合成酵素及びそれをコードするdna
US20030092118A1 (en) Hyaluronan synthase genes and expression thereof in bacillus hosts
US7029880B2 (en) Streptococcus equisimilis hyaluronan synthase gene and expression thereof in Bacillus subtilis
US20030235893A1 (en) Hyaluronan synthases and methods of making and using same

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20140326

Termination date: 20180613

CF01 Termination of patent right due to non-payment of annual fee