CN1636052A - 在重组宿主细胞中制备透明质酸的方法 - Google Patents

在重组宿主细胞中制备透明质酸的方法 Download PDF

Info

Publication number
CN1636052A
CN1636052A CNA028282833A CN02828283A CN1636052A CN 1636052 A CN1636052 A CN 1636052A CN A028282833 A CNA028282833 A CN A028282833A CN 02828283 A CN02828283 A CN 02828283A CN 1636052 A CN1636052 A CN 1636052A
Authority
CN
China
Prior art keywords
seq
sequence
gene
nucleotide sequence
polypeptide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA028282833A
Other languages
English (en)
Other versions
CN1636052B (zh
Inventor
艾伦·斯洛马
里金·贝尔
威廉·威德纳
玛丽亚·唐
戴维·斯滕伯格
斯蒂芬·布朗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Novozymes AS
Original Assignee
Novozymes Biopolymer AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novozymes Biopolymer AS filed Critical Novozymes Biopolymer AS
Publication of CN1636052A publication Critical patent/CN1636052A/zh
Application granted granted Critical
Publication of CN1636052B publication Critical patent/CN1636052B/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/04Polysaccharides, i.e. compounds containing more than five saccharide radicals attached to each other by glycosidic bonds

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Polysaccharides And Polysaccharide Derivatives (AREA)

Abstract

本发明涉及制备透明质酸的方法,包括:(a)在适宜制备透明质酸的条件下培养芽孢杆菌属宿主细胞,其中芽孢杆菌属宿主细胞包含核酸构建体,所述核酸构建体含有透明质酸合酶编码序列,该序列可操作性连接于与透明质酸合酶编码序列异源的启动子序列;和(b)从培养基中回收透明质酸。本发明还涉及编码透明质酸合酶操纵子的分离的核酸序列,所述透明质酸合酶操纵子含有透明质酸合酶基因或其部分和UDP-葡萄糖6-脱氢酶基因,和可选的选自UDP-葡萄糖焦磷酸化酶基因、UDP-N-乙酰葡糖胺焦磷酸化酶基因和葡萄糖-6-磷酸异构酶基因的一个或多个基因。本发明还涉及编码UDP-葡萄糖6-脱氢酶基因、UDP-葡萄糖焦磷酸化酶基因和UDP-N-乙酰葡糖胺焦磷酸化酶的分离的核酸序列。

Description

在重组宿主细胞中制备透明质酸的方法
                        发明领域
本发明涉及在重组宿主细胞中制备透明质酸的方法。
                        背景技术
人体内最丰富的杂多糖(heteropolysaccharide)是葡糖胺聚糖(glycosaminoglycan)。葡糖胺聚糖是无分枝糖类聚合物,含有重复二糖单位(仅硫酸角质素在糖的核心区中为分枝的)。所述二糖单位一般包括作为第一个糖单位的两种修饰糖-N-乙酰半乳糖胺(GaINAc)或N-乙酰葡萄糖胺(GlcNAc)中的一种。第二个单位通常是糖醛酸,如葡萄糖醛酸(GlcUA)或艾杜糖醛酸。
葡糖胺聚糖是带负电荷的分子,且在溶液中具有能够带来高粘度的扩展构象。葡糖胺聚糖主要位于细胞表面上或细胞外基质中。葡糖胺聚糖在溶液中还具有低压缩性,这使得其可作为理想的生理润滑液,例如,关节。葡糖胺聚糖的刚性提供了细胞的结构完整性并提供了能使细胞发生迁移的细胞间通道。具有最重要的生理学价值的葡糖胺聚糖是透明质酸(hyaluronan)、硫酸软骨素、肝素、硫酸乙酰肝素、硫酸皮肤素和硫酸角质素。多数葡糖胺聚糖通过特异性寡糖结构与蛋白多糖核心蛋白共价结合。除游离糖链与蛋白多糖构成非共价复合物外,透明质酸与特定蛋白多糖构成大聚集物。
已经确定了透明质酸在体内的多种作用(参见LaurentT.C.and FraserJ.R.E.,1992,FASEB J.6:2397-2404;and Toole B.P.,1991,“Proteoglycans andhyaluronan in morphogenesis and  differentiation.”In:Cell Biology of theExtracellular Matrix,305-341页,Hay E.D.,ed.,Plenum,New York)。透明质酸存在于透明软骨、关节液和皮肤组织的真皮以及表皮中。透明质酸还被推测在多种生理功能,如粘附,发育,细胞运动性,癌症,血管发生和创伤愈合中发挥作用。根据透明质酸的独特物理和生物学特性,可将其用于眼和关节外科中,并且正在研究其在其它医学应用中的价值。透明质酸制品已被用于矫形学,风湿病学和皮肤病学中。
公鸡冠是透明质酸的重要商业来源。微生物是可选择的来源。美国专利No.4,801,539中公开了制备透明质酸的发酵法,其中包括兽瘟链球菌菌株,所报道的产率约为3.6g透明质酸/升。欧洲专利No.EP0694616公开了采用改良的兽瘟链球菌菌株的发酵方法,所报道的产率约为3.5g透明质酸/升。
通过发酵而用于制备透明质酸的微生物是病原性细菌菌株,其中最主要的细菌属于某些链球菌属菌种。A型和C型链球菌用由透明质酸组成的非病原性荚膜将其自身围绕,所述透明质酸在组成上与在结缔组织和关节中发现的透明质酸相同。出血败血性巴斯德菌(Pasteurella multocida)(另一种病原性荚膜菌)也用透明质酸围绕其自身细胞。
已有报道描述了来自脊椎动物、细菌病原体和海藻病毒的透明质酸合酶(DeAngelis,P.L.,1999,Cell.Mol.Life SCI,56:670-682)。WO 99/23227公开了来自似马链球菌的I型透明质酸合酶。WO 99/51265和WO 00/27437公开了来自出血败血性巴斯德菌的II型透明质酸合酶(Group II hyaluronatesynthase)。Ferretti等公开了酿脓链球菌的透明质酸合酶操纵子,该操纵子包含分别编码透明质酸合酶、UDP葡萄糖脱氢酶和UDP-葡萄糖焦磷酸化酶的三个基因,hasA、hasB和hasC(Proc.Natl.Acad.Sci.USA.98,4658-4663,2001)。WO 99/51265公开了含有似马链球菌透明质酸合酶编码区的核酸片段。
杆菌已被很好地建立为用于制备天然和重组蛋白的宿主细胞系统。本发明的一个目的是提供在重组芽孢杆菌属宿主细胞中制备透明质酸的方法。
                          发明简述
本发明涉及制备透明质酸(hyaluronic acid)的方法,包括:(a)在适宜制备透明质酸的条件下培养芽孢杆菌属宿主细胞,其中芽孢杆菌属宿主细胞包含核酸构建体,所述核酸构建体含有透明质酸合酶编码序列,该序列可操作性连接于与透明质酸合酶编码序列异源的启动子序列;和(b)从培养基中回收透明质酸。
在优选的实施方案中,所述核酸构建体还包含一个或多个基因,所述基因编码透明质酸前体糖生物合成中的酶或芽孢杆菌属宿主细胞还包含一个或多个第二核酸构建体,该构建体含有一个或多个基因,所述基因编码前体糖生物合成中的酶。
在另一优选的实施方案中,一个或多个编码前体糖的基因受控于与透明质酸合酶编码序列相同或不同的启动子。
本发明还涉及包含核酸构建体的芽孢杆菌属宿主细胞,所述核酸构建体含有透明质酸合酶编码序列,该编码序列可操作性连接于与透明质酸合酶编码序列和所述核酸构建体异源的启动子序列。
本发明还涉及编码透明质酸合酶操纵子的分离的核酸序列,所述透明质酸合酶操纵子含有透明质酸合酶基因或其部分和UDP-葡萄糖6-脱氢酶基因,和可选的选自UDP-葡萄糖焦磷酸化酶基因、UDP-N-乙酰葡糖胺焦磷酸化酶基因和葡萄糖-6-磷酸异构酶基因的一个或多个基因。
本发明还涉及分离的编码UDP-葡萄糖6-脱氢酶的核酸序列,其选自:(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO:41有至少约75%、约80%、约85%、约90%,或约95%的同一性;(b)与SEQID NO:40有至少约75%、约80%、约85%、约90%,或约95%同一性的核酸序列;(c)在中或高严紧条件下与(i)SEQ ID NO:40的核酸序列,(ii)SEQ ID NO:40中包含的cDNA序列,或(iii)(i)或(ii)的互补链杂交的核酸序列;和(d)(a),(b)或(c)的亚序列,其中亚序列编码一种具有UDP-葡萄糖6-脱氢酶活性的多肽片段。
本发明还涉及分离的编码UDP葡萄糖焦磷酸化酶的核酸序列,其选自:(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO:43有至少90%、约95%,或约97%的同一性;(b)与SEQ ID NO:42有至少约90%、约95%,或约97%同一性的核酸序列;(c)在低、中、或高严紧条件下与(i)SEQ ID NO:42的核酸序列,(ii)SEQ ID NO:42中包含的cDNA序列,或(iii)(i)或(ii)的互补链杂交的核酸序列;和(d)(a),(b)或(c)的亚序列,其中亚序列编码一种具有UDP-N-乙酰葡糖胺焦磷酸化酶活性的多肽片段。
本发明还涉及分离的编码UDP-N-乙酰葡糖胺焦磷酸化酶的核酸序列,其选自:(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO:45有至少约75%、约80%、约85%、约90%,或约95%的同一性;(b)与SEQ ID NO:44有至少约75%、约80%、约85%、约90%,或约95%同一性的核酸序列;(c)在低、中、或高严紧条件下与(i)SEQ ID NO:44的核酸序列,(ii)SEQ ID NO:44中包含的cDNA序列,或(iii)(i)或(ii)的互补链杂交的核酸序列;和(d)(a)(b),或(c)的亚序列,其中亚序列编码一种具有UDP-N-乙酰葡糖胺焦磷酸化酶活性的多肽片段。
                        附图简述
图1显示透明质酸的化学结构。
图2显示透明质酸合成的生物合成途径。
图3显示pCR2.1-sehasA的限制性图谱。
图4显示pCR2.1-tuaD的限制性图谱。
图5显示pCR2.1-gtaB的限制性图谱。
图6显示pCR2.1-gcaD的限制性图谱。
图7显示PHA1的限制性图谱。
图8显示pHA2的限制性图谱。
图9显示pHA3的限制性图谱。
图10显示pHA4的限制性图谱。
图11显示pHA5的限制性图谱。
图12显示pHA6的限制性图谱。
图13显示pHA7的限制性图谱。
图14显示pMRT106的限制性图谱。
图15显示pHA8的限制性图谱。
图16显示pHA9的限制性图谱。
图17显示pHA10的限制性图谱。
图18显示pRB157的限制性图谱。
图19显示pMRT084的限制性图谱。
图20显示pMRT086的限制性图谱。
图21显示pCJ791的限制性图谱。
图22显示pMRT032的限制性图谱。
图23显示pNNB194neo的限制性图谱。
图24显示pNNB194neo-oriT的限制性图谱。
图25显示pShV3的限制性图谱。
图26显示pShV2.1-amyEΔB的限制性图谱。
图27显示pShV3A的限制性图谱。
图28显示PMRT036的限制性图谱。
图29显示pMRT037的限制性图谱。
图30显示pMRT041的限制性图谱。
图31显示PMRT064.1的限制性图谱。
图32显示pMRT068的限制性图谱。
图33显示pMRT069的限制性图谱。
图34显示pMRT071的限制性图谱。
图35显示PMRT074的限制性图谱。
图36显示pMRT120的限制性图谱。
图37显示pMRT122的限制性图谱。
图38显示pCR2.1-pel5’的限制性图谱。
图39显示pCR2.1-pel3’的限制性图谱。
图40显示pRB161的限制性图谱。
图41显示pRB162的限制性图谱。
图42显示pRB156的限制性图谱。
图43显示pRB164的限制性图谱。
图44显示多种透明质酸制备枯草芽孢杆菌菌株以大约2g蔗糖/L0-小时的分批补料,37℃发酵的总结。
图45显示获自以大约2g蔗糖/L0-小时分批补料,37℃发酵的多种透明质酸制备枯草芽孢杆菌菌株的峰量透明质酸的平均分子量(MDa)的总结。
                            发明详述
本发明涉及制备透明质酸的方法,包括:(a)在适宜制备透明质酸的条件下培养芽孢杆菌属宿主细胞,其中芽孢杆菌属宿主细胞包含核酸构建体,所述核酸构建体含有透明质酸合酶编码序列,该序列可操作性连接于与透明质酸合酶编码序列异源的启动子序列;和(b)从培养基中回收透明质酸。
本发明的方法改进了从病原性,荚膜细菌中制备透明质酸的方法。在荚膜细菌中,大量的透明质酸是从荚膜中制备的。在从所述来源中制备和纯化透明质酸时,首先需要从荚膜中除去透明质酸,如通过使用表面活性剂或去垢剂,如SDS。由于为了释放大部分透明质酸而必须加入表面活性剂且随后必须从最终纯化中除去表面活性剂,故此使得透明质酸的商业生产步骤非常复杂。
本发明可以从非荚膜宿主细胞中制备大量游离透明质酸。在显微镜下观察不到与重组杆菌菌株相关的可视荚膜,而通常用于透明质酸制备中的病原性细菌株包括透明质酸荚膜,该荚膜的直径至少是细胞自身的两倍。
由于将重组芽孢杆菌属细胞的透明质酸直接表达于培养基中,故可使用简单的方法从培养基中分离透明质酸。首先,从培养基中物理除去芽孢杆菌属细胞和细胞碎片,如有需要,可首先稀释所述培养基从而降低培养基的粘性。本领域技术人员已知多种可用于从培养基中除去细胞的方法,如离心或微量过滤。如有需要,可过滤保留的上清,如通过超滤,从而浓缩并从透明质酸中除去小分子污染物。除去细胞和细胞碎片后,采用已知方法对培养基中的透明质酸实施简单的沉淀。盐、乙醇或盐和乙醇组合可用于从滤出液中沉淀透明质酸。一经沉淀,透明质酸易于通过物理方法从溶液中分离出来。或者,可采用本领域已知的蒸发干燥技术,如喷雾干燥从滤出液中干燥或分离透明质酸。
因此本发明的方法改进了现有技术中通过发酵而用于商业上制备透明质酸的方法,且无须在从培养细胞中纯化的透明质酸时使用表面活性剂。
透明质酸
本文将“透明质酸”定义为非磺化葡糖胺聚糖(unsulphatedglycolsaminoglycan),其包含通过交替beta-1,4和beta-1,3糖苷键连接在一起的N-乙酰葡糖胺(GlcNAc)和葡萄糖醛酸(GlcUA)的重复二糖单位(图1)。已知,透明质酸(Hyaluronic aicd)为透明质酸(hyaluronan),透明质酸盐(酯)或HA。此处使用的术语透明质酸(hyaluronan)和透明质酸(Hyaluronic acid)可以互换。
在一个优选的实施方案中,采用本发明的方法获得的透明质酸的分子量为约10,000-约10,000,000 Da。在更优选的实施方案中,采用本发明的方法获得的透明质酸的分子量为约25,000-约5,000,000 Da。在最优选的实施方案中,采用本发明的方法获得的透明质酸的分子量为约50,000-至约3,000,000 Da。
采用本发明的芽孢杆菌属宿主细胞制备的透明质酸的水平可根据改良咔唑法(Bitter和Muir,1962,Anal Biochem.4:330-334)测定。此外,可使用现有技术中如Ueno等,1988,Chem.Pharm.Bull.36,4971-4975;Wyatt,1993,ANAL.Chim.Acta 272:1-40;和Wyatt Technologies,1999,“LightScattering University DAWN Course Manual”和“DAWN EOS Manual”WyattTechnology Corporation,Santa Barbara,California所描述的标准方法测定透明质酸的平均分子量。
可使用本领域已知的多种方法如,在美国专利No.5,616,568、5,652,347和5,874,417中所描述的交联方法,对采用本发明的方法获得的透明质酸进行修饰。此外,可使用本领域已知的方法改变透明质酸的分子量。
宿主细胞
在本发明的方法中,芽孢杆菌属宿主细胞可以是适用于重组制备透明质酸的任何芽孢杆菌属细胞。芽孢杆菌属宿主细胞可以是野生型芽孢杆菌属细胞或其突变体。适用于实施本发明的芽孢杆菌属细胞包括(但不限于)Bacillus agaraderhens、嗜碱芽孢杆菌(Bacillus alkalophilus)、解淀粉芽胞杆菌(Bacillus amyloliquefaciens)、短芽胞杆菌(Bacillus brevis)、环状芽胞杆菌(Bacillus circulans)、克劳氏芽孢杆菌(Bacillus clausii)、凝结芽胞杆菌(Bacillus coagulans,)、坚硬芽胞杆菌(Bacillus firmus)、灿烂芽胞杆菌(Bacillus lautus)、迟缓芽胞杆菌(Bacillus lentus)、地衣形芽胞杆菌(Bacilluslicheniformis)、巨大芽胞杆菌(Bacillus megaterium)、短小芽胞杆菌(Bacilluspumilus)、嗜热脂肪芽胞杆菌(Bacillus Stearothermophilus)、枯草芽孢杆菌(Bacillus subtilis)和苏芸金芽胞杆菌(Bacillus thuringiensis)细胞。WO98/22598中公开了特别适用于重组表达的枯草芽孢杆菌细胞突变体。非荚膜芽孢杆菌属细胞特别适用于本发明。
在一个优选的实施方案中,芽孢杆菌属宿主细胞是解淀粉芽胞杆菌、克劳氏芽孢杆菌、迟缓芽胞杆菌、地衣形芽胞杆菌、嗜热脂肪芽胞杆菌或枯草芽孢杆菌细胞。在更优选的实施方案中,芽孢杆菌属细胞是解淀粉芽胞杆菌细胞。在另一更为优选的实施方案中,芽孢杆菌属细胞是克劳氏芽孢杆菌细胞。在另一更为优选的实施方案中,芽孢杆菌属细胞是迟缓芽胞杆菌细胞。在另一更为优选的实施方案中,芽孢杆菌属细胞是地衣形芽胞杆菌细胞。在另一更为优选的实施方案中,芽孢杆菌属细胞是枯草芽孢杆菌细胞。在最优选的实施方案中,芽孢杆菌属宿主细胞是枯草芽孢杆菌A164Δ5(参见美国专利No.5,891,701)或枯草芽孢杆菌168Δ4。
用本发明的核酸构建体转化芽孢杆菌属宿主细胞可通过如下方法实施,例如,原生质体转化(参见例如Chang和Cohen,1979,Molecular GeneralGenetics 168:111-115)、使用感受态细胞(参见例如Young和Spizizen,1961,Journal of Bacteriology 81:823-829,或Dubnau和Davidoff-Abelson,1971,Journal of Molecular Biology 56:209-221)、电穿孔法(参见例如Shigekawa和Dower,1988,Biotechniques 6:742-751)或接合(参见例如KOEHLER和Thorne,1987,Journal of Bacteriology 169:5271-5278)。
核酸构建体
本文中将“核酸构建体”定义为一种单链或双链核酸分子,其分离自天然存在的基因或经修饰后含有以自然界不存在的方式联合和并置的核酸片段。当核酸构建体包含编码序列表达所需的所有控制序列时,术语核酸构建体可与术语表达盒同义。本文将术语“编码序列”定义为当将其置于下述控制序列的控制下时,能够转录为mRNA并翻译为目的酶的序列。编码序列的界限通常由mRNA5’末端紧接着位于开放阅读框上游的核糖体结合位点和mRNA 3’末端紧接着位于开放阅读框下游的转录终止序列来确定。编码序列可包括(但不限于)DNA、cDNA和重组核酸序列。
用于分离或克隆编码多肽的核酸序列的方法是本领域众所周知的,例如包括从基因组DNA中分离、从cDNA制备或其组合。从所述基因组DNA克隆本发明的核酸序列例如可通过表达文库的抗体筛选以检测具有共同结构特点的克隆化DNA片段或众所周知的聚合酶链反应(PCR)而得以实施。参见,例如Innis等,1990,PCR Protocols:A Guide to Methods andApplication,Academic Press,New York。可以使用其它核酸扩增方法如连接酶链反应,连接激活转录和基于核酸序列的扩增。克隆方法可能涉及对包括编码所述多肽的核酸序列的目的核酸片段进行切除和分离、所述片段插入载体分子中以及重组载体向芽孢杆菌属细胞中的掺入,在所述芽孢杆菌属细胞中所述核酸序列的克隆将被复制。所述核酸序列可以是基因组的、cDNA、RNA、半-合成、合成来源的或其任意组合。
可以用多种方式操作编码酶的分离的核酸序列以提供所述酶的表达。在将核酸序列插入到构建体或载体中之前对其操作是优选或必需的,这取决于表达载体或芽孢杆菌属宿主细胞。用克隆方法修饰核酸序列的技术是本领域众所周知的。还应认识到,核酸序列还可以通过使用本领域众所周知的方法在宿主细胞中于体内操作。
透明质酸生物合成中涉及多种酶。这些酶包括透明质酸合酶、UDP-葡萄糖6-脱氢酶、UDP-葡萄糖焦磷酸化酶、UDP-N-乙酰葡糖胺焦磷酸化酶、6-磷酸葡萄糖异构酶、己糖激酶、磷酸葡糖变位酶、酰胺转移酶、变位酶和乙酰基转移酶。透明质酸合酶是透明质酸制备过程中的关键酶。
本文将“透明质酸合酶”定义为通过加入GlcUA和GlcNAc糖前体而催化透明质酸链延长的合酶。链球菌透明质酸合酶、脊椎动物透明质酸合酶和病毒透明质酸合酶氨基酸序列不同于来自巴斯德菌的透明质酸合酶,并已经将其分为I型和II型透明质酸合酶,I型透明质酸合酶包括链球菌透明质酸合酶(DeAngelis,1999)。为了用于在芽孢杆菌属宿主细胞中制备透明质酸,真核生物源性的透明质酸合酶,如哺乳动物透明质酸合酶,为次优选的。
透明质酸合酶编码序列可以是任何能够在芽孢杆菌属宿主细胞中表达的核酸序列,所述核酸序列可以是任何来源的。优选的透明质酸合酶基因包括I型或II型的任一种,如来自似马链球菌、酿脓链球菌、乳房链球菌和马链球菌兽瘟亚种的I型透明质酸合酶基因,或出血败血性巴斯德菌的II型透明质酸合酶基因。
在一个优选的实施方案中,透明质酸合酶编码序列选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO:2、SEQ ID NO:93或SEQ ID NO:103有至少约70%、约75%、约80%、约85%、约90%,或约95%的同一性;(b)在低、中、或高严紧条件下与SEQ ID NO:1、SEQ IDNO:92或SEQ ID NO:102杂交的核酸序列;和(c)(a)或(b)的互补链。
在更优选的实施方案中,透明质酸合酶编码序列一种多肽,所述多肽含有SEQ ID NO:2、SEQ ID NO:93或SEQ ID NO:103的氨基酸序列或其具有透明质酸合酶活性的片段。
在另一优选的实施方案中,透明质酸合酶编码序列选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO:95有至少约70%、约75%、约80%、约85%、约90%,或约95%的同一性;(b)在低、中、或高严紧条件下与SEQ ID NO:94杂交的核酸序列;和(c)(a)或(b)的互补链。
在另一更为优选的实施方案中,透明质酸合酶编码序列一种多肽,所述多肽含有SEQ ID NO:95的氨基酸序列或其具有透明质酸合酶活性的片段。
本发明的方法还包括构建体,透明质酸的前体糖(precursor sugars)经由所述构建体而供给宿主细胞,或供给培养基,或由芽孢杆菌属宿主细胞中的内源性基因、或非内源性基因、或内源性和非内源性基因的组合所编码。前体糖可以是D-葡萄糖醛酸或N-乙酰葡糖胺。
在本发明的方法中,核酸构建体还可包含一个或多个基因,所述基因编码透明质酸前体糖生物合成中的酶。或者,芽孢杆菌属宿主细胞还包含一个或多个第二核酸构建体,该构建体含有一个或多个基因,所述基因编码前体糖生物合成中的酶。通过使用含有编码指导透明质酸前体糖合成途径步骤的一个基因或多个基因的一种核酸序列或多种核酸序列的构建体提高了透明质酸的生产。“指导透明质酸前体糖合成途径中的步骤”指基因的表达蛋白具有N-乙酰葡糖胺或D-葡萄糖醛酸或是N-乙酰葡糖胺或D-葡萄糖醛酸前体的糖形式的活性(图2)。
在优选的用于供应前体糖的方法中,通过培养含有重组构建体的宿主细胞,所述重组构建体含有可操作性连接于编码指导透明质酸前体糖合成途径中步骤的基因的核酸序列的异源性启动子区,提供用于在含有透明质酸合酶的宿主细胞中提高透明质酸生产的构建体。在优选的方法中,所述宿主细胞还包含含有可操作性连接于透明质酸合酶的启动子区的重组构建体,其可以使用与N-乙酰葡糖胺的生物合成中所涉及的合酶的核酸序列相同或不同的启动子区。在另一优选的实施方案中,所述宿主细胞可包含含有可操作性连接于编码透明质酸前体糖的生物合成中所涉及的第二个基因的不同核酸序列的启动子区的重组构建体。
因此,本发明还涉及通过使用编码指导透明质酸前体糖的生物合成中步骤的基因的核酸序列的构建体而提高透明质酸生产的构建体。前体糖的核酸序列可由与编码透明质酸合酶相同或不同的启动子表达。
制备透明质酸的前体糖的生物合成中涉及的基因包括UDP-葡萄糖6-脱氢酶基因、UDP-葡萄糖焦磷酸化酶基因、UDP-N-乙酰葡糖胺焦磷酸化酶基因、葡萄糖-6-磷酸异构酶基因、己糖激酶基因、磷酸葡糖变位酶基因、酰胺转移酶基因、变位酶基因和乙酰基转移酶基因。
在含有透明质酸合酶的细胞中,可表达两个或多个hasB,hasC和hasD,或其同系物,如分别是枯草芽孢杆菌tuaD,gtaB,和gcaD,以及hasE的任一个或其组合以增加透明质酸合酶可用的前体糖的量。Bacillus基因组已经公开在Kunst等,Nature 390,249-256,“The complete genome sequence of theGram-positive bacterium Bacillus Subtilis”(20 November 1997)中。在某些情况下,如当宿主细胞不含天然透明质酸合酶活性时,所述构建体可包含hasA基因。
所述编码生物合成酶的核酸序列可以是宿主细胞天然含有的,而在其他情况下也可以使用异源序列。如果表达两个或多个基因,  其可以是与天然操纵子中的另一个基因(如包含hasA,hasB,hasC和hasD的似马链球菌HAS操纵子的基因)相关的基因。在其他情况下,可能需要使用某些前体基因序列的组合,而没有所包括操纵子的每个元件。在其他情况下,还可以优选使用宿主细胞天然的某些基因和其他外源性基因。选择将基于给定宿主细胞中的糖的可用量,细胞供应生产过剩而不会妨碍宿主细胞其它功能的能力,和所述细胞是否能调节其与外源性基因不同的天然基因的表达。
例如,根据细胞的代谢需要和生长条件以及可用的前体糖的量,其可能需要通过表达编码UDP-N-乙酰葡糖胺焦磷酸化酶的核酸序列,如hasD基因、芽孢杆菌属的gcaD基因及其同系物而提高N-乙酰葡糖胺的生产。或者,前体糖可以是D-葡萄糖醛酸。在一个所述实施方案中,所述核酸序列编码UDP-葡萄糖6-脱氢酶。所述核酸序列包括芽孢杆菌属的tuaD基因、链球菌属的hasB基因及其同系物。所述核酸序列还可编码UDP-葡萄糖焦磷酸化酶,如芽孢杆菌属中的gtaB基因、链球菌属的the hasC基因及其同系物。
在本发明的方法中,UDP-葡萄糖6-脱氢酶基因可以是hasB基因或tuaD基因或其同系物。
在一个优选的实施方案中,hasB基因选自(a)编码多肽的核酸序列,所述多肽含有具有与SEQ ID NO:41、SEQ ID NO:97或SEQ ID NO:105至少约70%、约75%、约80%、约85%、约90%或约95%同一性的氨基酸序列;(b)在低、中、或高严紧条件下与SEQ ID NO:40、SEQ ID NO:96或SEQ ID NO:104杂交的核酸序列;和(c)(a)或(b)的互补链。
在更优选的实施方案中,the hasB基因所编码的多肽含有SEQ ID NO:41、SEQ ID NO:97或SEQ ID NO:105的氨基酸序列或其具有UDP-葡萄糖6-脱氢酶活性的片段。
在另一优选的实施方案中,tuaD基因选自(a)编码多肽的核酸序列,所述多肽含有具有与SEQ ID NO:12至少约70%,约75%、约80%、约85%、约90%或约95%同一性的氨基酸序列;(b)在低、中、或高严紧条件下与SEQ ID NO:11杂交的核酸序列;和(c)(a)或(b)的互补链。
在另一更为优选的实施方案中,tuaD基因所编码的多肽含有SEQ IDNO:12的氨基酸序列或其具有UDP-葡萄糖6-脱氢酶活性的片段。
在本发明的方法中,UDP葡萄糖焦磷酸化酶基因可以是hasC基因或gtaB基因或其同系物。
在一个优选的实施方案中,hasC基因选自(a)编码多肽的核酸序列,所述多肽含有具有与SEQ ID NO:43、SEQ ID NO:99或SEQ ID NO:107至少约70%、约75%、约80%、约85%、约90%或约95%同一性的氨基酸序列;(b)在低、中、或高严紧条件下与SEQ ID NO:42或SEQ ID NO:98或SEQ ID NO:106杂交的核酸序列;和(c)(a)或(b)的互补链。
在另一更为优选的实施方案中,hasC基因所编码的多肽含有SEQ IDNO:43或SEQ ID NO:99,或SEQ ID NO:107的氨基酸序列或其具有UDP葡萄糖焦磷酸化酶活性的片段。
在另一优选的实施方案中,gtaB基因选自(a)编码多肽的核酸序列,所述多肽含有具有与SEQ ID NO:22至少约70%、约75%、约80%、约85%、约90%或约95%同一性的氨基酸序列;(b)在低、中、或高严紧条件下与SEQ ID NO:21杂交的核酸序列;和(c)(a)或(b)的互补链。
在另一更为优选的实施方案中,gtaB基因所编码的多肽含有SEQ IDNO:22的氨基酸序列或其具有UDP-葡萄糖焦磷酸化酶活性的片段。
在本发明的方法中,UDP-N-乙酰葡糖胺焦磷酸化酶基因可以是hasD或gcaD基因或其同系物。
在一个优选的实施方案中,hasD基因选自(a)编码多肽的核酸序列,所述多肽含有具有与SEQ ID NO:45至少约75%、约80%、约85%、约90%或约95%同一性的氨基酸序列;(b)在低、中、或高严紧条件下与SEQ IDNO:44杂交的核酸序列;和(c)(a)或(b)的互补链。
在另一更为优选的实施方案中,hasD基因所编码的多肽含有SEQ IDNO:45的氨基酸序列或其具有UDP-N-乙酰葡糖胺葡萄糖焦磷酸化酶活性的片段。
在另一优选的实施方案中,gcaD基因选自(a)编码多肽的核酸序列,所述多肽含有具有与SEQ ID NO:30至少约70%、约75%、约80%、约85%、约90%或约95%同一性的氨基酸序列;(b)在低、中、或高严紧条件下与SEQ ID NO:29杂交的核酸序列;和(c)(a)或(b)的互补链。
在另一更为优选的实施方案中,gcaD基因所编码的多肽含有SEQ IDNO:30的氨基酸序列或其具有UDP-N-乙酰葡糖胺葡萄糖焦磷酸化酶活性的片段。
在本发明的方法中,6-磷酸葡萄糖异构酶基因可以是hasE或其同系物。
在一个优选的实施方案中,hasE基因选自(a)编码多肽的核酸序列,所述多肽含有具有与SEQ ID NO:101至少约70%、约75%、约80%、约85%、约90%或约95%同一性的氨基酸序列;(b)在低、中、或高严紧条件下与SEQ ID NO:100杂交的核酸序列;和(c)(a)或(b)的互补链。
在另一更为优选的实施方案中,hasE基因所编码的多肽含有SEQ IDNO:101的氨基酸序列,或其具有6-磷酸葡萄糖异构酶活性的片段。
在本发明的方法中,透明质酸合酶基因和一个或多个编码前体糖的基因受控于相同的启动子。或者,一个或多个编码前体糖的基因受控于相同的启动子而用不同的启动子指导透明质酸合酶基因。另一种选择是透明质酸合酶基因和每个前体糖的基因均受控于不同的启动子。在一个优选的实施方案中,透明质酸合酶基因和一个或多个前体糖的基因受控于相同的启动子。
本发明还涉及包含编码透明质酸合酶操纵子的分离的核酸序列的核酸构建体,所述操纵子包含透明质酸合酶基因和UDP-葡萄糖6-脱氢酶基因,和可选地选自UDP-葡萄糖焦磷酸化酶基因、UDP-N-乙酰葡糖胺焦磷酸化酶基因和葡萄糖-6-磷酸异构酶基因的一个或多个基因。SEQ ID NO:108中显示编码似马链球菌的多数透明质酸合酶操纵子的核酸序列。该序列包含分别与枯草芽孢杆菌tuaD基因(SEQ ID NO:11)和gtaB基因(SEQ ID NO:21)相似的hasB(SEQ ID NO:40)和hasC(SEQ ID nO:42),以及在酿脓链球菌时,gcaD基因(SEQ ID NO:29)的已经被命名为hasD(SEQ ID NO:44)的同系物。枯草芽孢杆菌gcaD编码N-乙酰葡糖胺(两种透明质酸糖的一种)合成中的UDP-N-乙酰葡糖胺焦磷酸化酶。gcaD的似马链球菌同系物,hasD,由似马链球菌排列在透明质酸合酶操纵子上。该核酸序列还包含部分hasA基因(SEQ ID NO:1的后1156bp)。
在某些情况下,宿主细胞将包含含有可操作性连接于编码指导透明质酸前体糖合成途径中的步骤的基因的核酸序列的异源性启动子区的重组构建体,其可对应于从重组构建体表达透明质酸合酶。所述透明质酸合酶可经由与编码前体生物合成途径中涉及的酶的核酸序列相同或不同的启动子区而表达。在另一优选的实施方案中,宿主细胞可包含含有可操作性连接于编码透明质酸前体糖合成中涉及的第二个基因的不同核酸序列的启动子区的重组构建体。
编码前体糖的合成中所涉及的酶的核酸序列可用相同或不同的启动子如编码透明质酸合酶的核酸序列实施表达。在前一意义中,构建“人工操纵子”,其能模拟含有每个hasA,hasB,hasC和hasD,或其同系物的似马链球菌的操纵子,或者,可使用似马链球菌操纵子中存在的全长补体的序列。所述“人工操纵子”还可包含6-磷酸葡萄糖异构酶基因(hasE)以及一个或多个选自己糖激酶基因、磷酸葡糖变位酶基因、酰胺转移酶基因、变位酶基因和乙酰基转移酶基因的基因。在人工操纵子中,至少一个元件与其它元件是异源的,如启动子区与编码序列异源。
在一个优选的实施方案中,核酸构建体包含hasA,tuaD和gtaB。在另一优选的实施方案中,核酸构建体包含hasA,tuaD,gtaB和gcaD。在另一优选的实施方案中,核酸构建体包含hasA和tuaD。在另一优选的实施方案中,核酸构建体包含hasA。在另一优选的实施方案中,核酸构建体包含hasA,tuaD,gtaB,GCAD和hasE。在另一优选的实施方案中,核酸构建体包含HASA,HASB,HASC和hasD。在另一优选的实施方案中,核酸构建体包含hasA,HASB,hasC,HASD和hasE。基于上述优选的实施方案,所述基因可用其同系物取代。
在本发明的方法中,核酸构建体包含可操作性连接于透明质酸合酶编码序列异源的启动子序列的透明质酸合酶编码序列。所述启动子序列可以是,例如,单启动子或串联启动子(tandem promoter)。
本文将“启动子”定义为一段参与RNA聚合酶结合以启动基因转录的核酸序列。本文将“串联启动子”定义为两个或多个启动子序列,其中每个启动子序列均与编码序列可操作性连接和并介导该编码序列转录成mRNA。本文将“可操作性连接”定义为一种构型,其中一段控制序列例如启动子序列位于相对编码序列恰当的位置,从而使该控制序列指导由该编码序列编码的多肽的产生。如前所述,本文将“编码序列”定义为当置于适宜的控制序列的控制下时可转录为mRNA并翻译为多肽的核酸序列。编码序列的界限通常由恰位于mRNA的5’末端开放阅读框上游的核糖体结合位点和恰位于mRNA的3’末端开放阅读框下游的转录终止序列来确定。编码序列可包括(但不限于)基因组DNA、cDNA、半合成、合成来源和重组核酸序列。
在一个优选的实施方案中,启动子序列可以获自细菌来源。在更优选的实施方案中,启动子序列可以获自革兰氏阳性细菌如芽孢杆菌属,例如,Bacillus agaradherens、嗜碱芽孢杆菌、解淀粉芽胞杆菌、短芽胞杆菌、环状芽胞杆菌、克劳氏芽孢杆菌、凝结芽胞杆菌、坚硬芽胞杆菌、灿烂芽胞杆菌、迟缓芽胞杆菌、地衣形芽胞杆菌、巨大芽胞杆菌、短小芽胞杆菌、嗜热脂肪芽胞杆菌、枯草芽孢杆菌、或苏芸金芽胞杆菌或链霉菌属,例如,浅青紫链霉菌(Streptomyces lividans)或鼠灰链霉菌(Streptomyces murinus)或获自革兰氏阴性细菌,例如,大肠杆菌或假单胞杆菌(Pseudomonas sp)。
用于在本发明的方法中指导核酸序列转录的适宜启动子的实例是获自大肠杆菌lac操纵子,天蓝色链霉菌琼脂糖酶基因(dagA)、迟缓芽胞杆菌或克劳氏芽孢杆菌碱性蛋白酶基因(aprH)、地衣形芽胞杆菌碱性蛋白酶基因(subtilisin Carlsberg基因)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、枯草芽孢杆菌α-淀粉酶基因(amyE)、地衣形芽胞杆菌α-淀粉酶基因(amyL)、嗜热脂肪芽胞杆菌产麦芽淀粉酶基因(amyM)、解淀粉芽胞杆菌α-淀粉酶基因(amyQ)、地衣形芽胞杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因、苏芸金芽胞杆菌tenebrionis亚种CryIIIA基因(cryIIIA)或其部分、原核生物β-内酰胺酶基因(Villa-Kamaroff等,1978,Proceedingsof the National Academy of Sciences USA 75:3727-3731)的启动子。其它实例为spol细菌噬菌体启动子和tac启动子(DeBoer等,1983,Proceedingsof the National Academy of Sciences USA 80:21-25)。其它启动子描述于“Useful proteins from recombinant bacteria”in Scientific American,1980,242:74-94;和in Sambrook,Fritsch,和Maniatus,1989,Molecular Cloning,ALaboratory Manual,2d edition,Cold Spring Harbor,New York。
启动子还可以是“共有序列(consensus)”启动子,该启动子含有“-35”区的TTGACA和“-10”区的TATAAT。“共有序列”启动子可以获自任何在芽孢杆菌属宿主细胞中有功能的启动子。“共有序列”启动子的构建可通过定点诱变来完成,从而产生与枯草芽孢杆菌营养期“sigma A-型”启动子“-10”区和“-35”区已确认共有序列更一致的启动子(Voskuil等,1995,MolecularMicrobiology 17:271-279)。
在一个优选的实施方案中,所述“共有序列”启动子是获自大肠杆菌lac操纵子,天蓝色链霉菌琼脂糖酶基因(dagA)、迟缓芽胞杆菌或克劳氏芽孢杆菌碱性蛋白酶基因(aprH)、地衣形芽胞杆菌碱性蛋白酶基因(subtilisinCarlsberg基因)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、枯草芽孢杆菌α-淀粉酶基因(amyE)、地衣形芽胞杆菌α-淀粉酶基因(amyL)、嗜热脂肪芽胞杆菌产麦芽淀粉酶基因(amyM)、解淀粉芽胞杆菌α-淀粉酶基因(amyQ)、地衣形芽胞杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因、苏芸金芽胞杆菌tenebrionis亚种CryIIIA基因(cryIIIA)或其部分、原核生物β-内酰胺酶基因spol细菌噬菌体启动子。在更优选的实施方案中,“共有序列”启动子获自解淀粉芽胞杆菌α-淀粉酶基因(amyQ)。
Widner等,在美国专利No.6,255,076和5,955,310中公开了用于在芽孢杆菌属细胞中表达的,包括短共有序列amyQ启动子(也称为scBAN)的串联启动子和构建体以及方法。文中还公开了将cryIIIA稳定序列以及使用了该序列的构建体用于提高芽孢杆菌属中的生产。
串联启动子中每个启动子序列可以是能在所选芽孢杆菌属细胞中表现出转录活性的任意核酸序列,包括突变的、截短的和杂合的启动子,并可获自芽孢杆菌属细胞的同源或异源性细胞内和细胞外多肽的编码基因。相对于多肽编码序列和芽孢杆菌属细胞,每一启动子序列可以是天然的和外源的。启动子序列可以是相同的启动子序列或不同的启动子序列。
串联启动子的两个或多个启动子序列可同时启动核酸序列的转录。此外,串联启动子的一个或多个启动子序列可在芽孢杆菌属细胞生长的不同阶段启动核酸序列的转录。
在一个优选的实施方案中,串联启动子至少包含解淀粉芽胞杆菌α-淀粉酶基因的amyQ启动子。在另一优选的实施方案中,串联启动子至少包含含有“-35”区的TTGACA和“-10”区的TATAAT的“共有序列”启动子。在另一优选的实施方案中,串联启动子至少包含地衣形芽胞杆菌α-淀粉酶基因的amyL启动子。在另一优选的实施方案中,串联启动子至少包含cryIIIA启动子或其部分(Agaisse和LERECLUS,1994,Molecular Microbiology 13:97-107)。
在更优选的实施方案中,串联启动子至少包含amyL启动子和cryIIIA启动子。在另一更为优选的实施方案中,串联启动子至少包含amyQ启动子和cryIIIA启动子。在另一更为优选的实施方案中,串联启动子至少包含含有“-35”区的TTGACA和“-10”区的TATAAT的“共有序列”启动子和cryIIIA启动子。在另一更为优选的实施方案中,串联启动子至少包含两个拷贝的amyL启动子。在另一更为优选的实施方案中,串联启动子至少包含两个拷贝的amyQ启动子。在另一更为优选的实施方案中,串联启动子至少包含两个拷贝的含有“-35”区的TTGACA和“-10”区的TATAAT的“共有序列”启动子。在另一更为优选的实施方案中,串联启动子至少包含两个拷贝的cryIIIA启动子。
本文将“mRNA加工/稳定序列”定义为位于一个或多个启动予序列下游和编码序列上游的一段序列,该一个或多个启动予序列中的每一个都与该序列可操作连接,使每一个启动子合成的mRNA均可加工产生在转录本5’端具有稳定予序列的mRNA转录本。mRNA转录本5’端存在这种稳定子序列可增加其半衰期(Agaisse和LERECLUS,1994,同上文,Hue等,1995,Journal of Bacteriology 177:3465-3471)。mRNA加工/稳定序列与细菌16S核糖体RNA的3’末端互补。在一个优选实施方案中,mRNA加工/稳定序列产生在转录本5’端具有稳定序列的基本单一大小的转录本。优选与细菌16S核糖体RNA的3’末端互补的mRNA加工/稳定序列。参见,美国专利No.6,255,076和5,955,310。
在一个更优选实施方案中选实施方案中,mRNA加工/稳定序列是WO94/25612和Agaisse和Lereclus(1994,同上文)所公开的苏芸金芽孢杆菌cryIIIA mRNA加工/稳定序列或其保持mRNA加工/稳定功能的部分。在另一个更优选实施方案中,mRNA加工/稳定序列是Hue等(1995,同上文)所公开的枯草芽孢杆菌SP82的mRNA加工/稳定序列或其保持mRNA加工/稳定功能的部分。
当本发明的方法使用cryIIIA启动子和其mRNA加工/稳定序列时,可采用含有WO 94/25612和Agaisse和Lereclus(1994,同上文)所公开的序列或其保持启动子和mRNA加工/稳定功能的部分的DNA片段。而且,可使用本领域众所周知的方法制备仅含有含有cryIIIA启动子或cryIIIA启动子mRNA加工/稳定序列,以构建串联启动子和mRNA加工/稳定序列的各种组合。在该实施方案中,cryIIIA启动子及其cryIIIA启动子mRNA加工/稳定序列优选位于构成串联启动子的其它启动子序列下游和目标基因编码序列序列的上游。
然后,可进一步操作编码透明质酸生产中所涉及的所需酶的分离的核酸序列以提高核酸序列的表达。应该理解,表达所述多肽生产中所涉及的任何步骤,包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。使用克隆方法修饰核酸序列的技术是本领域众所周知的。
含有编码所述酶的核酸序列的核酸构建体可以可操作性连接于能够在适于控制序列的条件下于芽孢杆菌属细胞中指导编码序列表达的一个或多个控制序列。
本文将术语“控制序列”定义为包括表达核酸序列的编码序列所必需或有利于其表达的所有组分。每个控制序列可以是编码所述酶的核酸序列的天然或外源的。除上述启动子序列外,所述控制序列(但不限于)前导序列、信号肽序列和转录终止子。至少,控制序列包括启动子以及转录和翻译终止信号。所述控制序列可带有用于导入特异性限制位点的接头,以便于将控制序列与编码多肽之核酸序列的编码区相连。
控制序列还可以是适宜的转录终止序列,即可被芽孢杆菌属细胞识别以终止转录的序列。将终止子序列与编码所述酶或操作子最后酶的核酸序列的3’端可可操作性相连。在所选芽孢杆菌属细胞中有功能的任何终止子都可用于本发明。
控制序列还可以是适宜的前导序列,即mRNA上对芽孢杆菌属细胞的翻译很重要的非翻译区。前导序列被可可操作性连接于编码所述酶的核酸序列的5’端。然和在所选芽孢杆菌属细胞中有功能的前导序列都可用于本发明。
控制序列还可以是信号肽编码区,其编码于多肽的氨基端相连的氨基酸序列,并且指导该编码的多肽进入细胞分泌途径。信号肽编码区可以是多肽天然的或可获自异源。核酸序列的编码序列的5’末端可天然包括信号肽编码区,该区天然和编码分泌性多肽的编码区的片段在翻译阅读框内连接在一起。或者,编码序列的5’末端可以包含相对于编码分泌性多肽的该编码序列部分外源的信号肽编码区。在编码序列没有天然地包含信号肽编码区的情况下,需要外源信号肽编码区。或者,可以简单地用外源信号肽编码区取代天然信号肽编码区以便相对于与编码序列相关的天然信号肽编码区而言来提高多肽的分泌。信号肽编码区可以获自芽孢杆菌属的淀粉酶或蛋白酶基因。但是,指导表达的多肽进入所选芽孢杆菌属细胞分泌途径的任何信号肽编码区均可以用于本发明。
用于芽孢杆菌属细胞的有效的信号肽编码区获自芽孢杆菌NCIB 11837产麦芽糖淀粉酶基因、嗜热脂肪芽胞杆菌α-淀粉酶基因、地衣形芽胞杆菌枯草杆菌蛋白酶基因、地衣形芽胞杆菌β-内酰胺酶基因、嗜热脂肪芽胞杆菌中性蛋白酶基因(nprT,nprS,nprM)和枯草芽孢杆菌prsA基因的信号肽编码区。Simonen和Palva,1993,Microbiological Reviews 57:109-137中描述了其它信号肽。
控制序列还可以是编码位于多肽氨基末端之氨基酸序列的前肽编码区。所得的多肽已知为酶原或多肽原(或在某些情况下为酶原)。多肽原通常是物活性的并可从所述多肽原通过催还或自我催化裂解而转变为成熟的活性多肽。前肽编码区可以获自枯草芽孢杆菌碱性蛋白酶(aprE)和枯草芽孢杆菌中性蛋白酶(nprT)的基因。
当信号肽和前肽区都存在于多肽的氨基端时,前肽区与多肽的氨基端紧邻,而信号肽区和前肽区的氨基端紧邻。
还优选加入能调节与细胞生长相关的多肽表达的调控序列。调控系统的实例包括应答化学或物理刺激(包括在有调控化合物存在的情况下)而导致基因表达的开启或关闭的那些系统。原核生物系统中的调节系统包括lac、tac和trp操纵子系统。
表达载体
在本发明的方法中,含有核酸序列、启动子和转录以及翻译终止信号的重组表达载体可用于重组制备透明质酸生产中所涉及的酶。可将上述各种核酸和调控序列连接在一起以生产包括一个或多个方便的限制位点的重组表达载体,所述位点能允许编码多肽或酶的核酸序列在所述位点插入或置换。或者,所述核酸序列可通过将该核酸序列和含有该核酸序列的核酸构建体插入适当表达载体来表达。在创建表达载体的过程中,可使编码序列在表达载体中与适当调控序列可操作性相连以便表达。
重组表达载体可以是任何载体,其可方便地进行重组DNA操作并且能使核酸序列表达。载体的选择将主要决定于载体与引入了该载体的芽孢杆菌属细胞之间的相容性。载体可以是线性和闭合环状质粒。载体可以是自主复制载体,即以染色体外实体形式存在的载体,其复制独立于染色体的复制,例如质粒,染色体外元件,小染色体(minichromosome)或人工染色体。载体可含有任何确保自我复制的手段。或者,载体可以是引入芽孢杆菌属细胞后,整合到基因组中并与其整合的染色体一起复制的那种载体。载体系统可使用单个载体或质粒、或其一起含有待引入芽孢杆菌属细胞基因组中的全长DNA的两个或多个载体或质粒、或转座子。
本发明的载体优选含有使所述载体可以稳定整合到芽孢杆菌属宿主细胞基因组中或者可在细胞中不依赖于细胞的基因组而自我复制的元件。
为了整合到宿主细胞基因组中,所述载体可依赖于编码多肽的核酸序列或载体上任何其它元件来通过同源或非同源重组而稳定整合到基因组中。或者,载体可能含有其它核酸序列,这些序列可指导通过同源重组整合进入芽孢杆菌属细胞基因组。其它核酸序列能够在染色体的精确位置使载体整合到宿主细胞基因组中。为了提高在精确位置整合的可能性,整合元件应优选含有足够量的与相应靶序列高度同源的核酸,例如100-1,500碱基对、优选400-1,500碱基对和最优选800-1,500碱基对,以便提供同源重组的可能性。整合元件可以是与芽孢杆菌属细胞基因组中的靶序列同源的任何序列。此外,整合元件还可以使非编码的或编码的核酸序列。另一方面,通过非同源重组可将载体整合到宿主细胞的基因组中。
为了进行自主复制,所述裁休还可含有能够使裁体在所研究的芽孢杆菌属细胞中自主复制的复制起始点。细菌复制起始点的实例是使载体可以在芽孢杆菌中复制的质粒pUB110、pE194、pTA1060和pAMβ1的复制起始点。复制起始点可以是带有突变的复制起始点,所述突变可以使其在宿主细胞中发挥温度敏感性的作用(参见例如Ehrlich,1978,Proceedings of theNational Academy of Sciences USA 75:1433)
本发明的载体优选含有一个或多个选择性标记,其能容易地选择出转化细胞。一个选择性标记是一种基因,其产物能提供对杀生物剂或病毒的抗性、对重金属的抗性、原养型至营养缺陷型的转变等。细菌选择性标记的实例是来源于枯草芽孢杆菌或地衣芽孢杆菌的dal基因,或赋予了抗生素抗性如氨苄青霉素、卡那霉素、氯霉素或四环素抗性的标记。此外,可通过共转化实施选择,例如WO 91/09129中所描述的,其中选择性标记位于独立的载体上。
可将一个以上拷贝的核酸序列插入到宿主细胞中以提高基因产物的产率。通过将至少一个以上其它拷贝的序列整合到宿主细抱基因组中或者通过包括可扩增选择性标记基因与所述核酸序列,其中通过在存在适宜选择性标记的条件下培养含扩增拷贝的选择性标记基因,由此增加了核酸序列的拷贝数的细胞可筛选所述细胞,这样可以使核酸序列拷贝数增加。WO94/14968中描述了用于获得基因组DNA序列扩增的方便的方法。
用于连接上述元件以构建重组表达载体的方法是本领域技术人员众所周知的(参见例如Sambrook等,1989,同上文)。
制备
在本发明的方法中,采用本领域的已知方法于适宜制备透明质酸的营养培养基中培养芽孢杆菌属宿主细胞。例如,可将该细胞在实验室或工业发酵罐中,用适宜的培养基,在允许透明质酸合成中所涉及的酶表达和/或透明质酸分离的条件下,采用摇瓶培养、小规模或大规模发酵(包括连续、分批、分批补料或固态发酵)的方法进行培养。使用本领域已知的方法,在含有碳和氮源以及无机盐的适宜营养培养基中进行培养。适宜的培养基可以从供应商处得到或可根据已经公布(例如,在美国典型培养物保藏中心的目录中)的组成来制备。分泌的透明质酸可直接从培养基中回收。
分离的可采用本领域的已知方法分离得到的透明质酸。可采用本领域的已知方法回收得到的多肽。例如,可采用包括(但不限于)离心、过滤、提取、喷雾干燥、蒸发或沉淀的传统方法从营养培养基中回收透明质酸。然后可采用本领域的已知的多种方法进一步纯化分离的透明质酸,所述方法包括(但不限于)层析法(例如,离子交换,亲和,疏水,层析聚焦和大小排阻层析),电泳方法(例如,准备型等电焦距),差异溶解(differentialsolubility)(例如,硫酸铵沉淀),SDS-PAGE,或提取(参见例如ProteinPurification,J.-C.Janson和Lars Ryden编,VCH出版公司,New York,1989)。
在本发明的方法中,芽孢杆菌属宿主细胞制备大于约4g、优选大于约6g,更优选大于约8g,甚至更优选大于约10g,及最优选大于约12g透明质酸/每升。
缺失/破坏
基因缺失或置换技术可用于完全除去可选择的标记基因或其它不需要的基因。在所述方法中,可通过使用已经构建为紧接地包含侧接于可选择的标记基因的5’和3′区的质粒的同源重组完成可选择的标记基因的缺失。可在能够使得质粒构建入细胞的许可温度下将紧接的5’和3′区联合第二可选择的标记引入至芽孢杆菌属细胞中的温度敏感性质粒,例如pE194上。然后将细胞移至非许可温度下来筛选含有整合至染色体一个同源侧翼区上的质粒的细胞。通过筛选第二可选择的标记完成质粒整合的筛选。整合后,通过将细胞移至许可温度中不经选择而传若干代来刺激在第二同源侧翼区上重组事件。将所述细胞铺板以获得单一克隆,然后检测克隆中两个可选标记的缺失(参见例如Perego,1993,INA.L.Sonneshein,J.A.Hoch,and R.Losick,editors,Bacillus subtilis and Other Gram-Positive Bacteria,Chapter 42,American Society of  Microbiology,Washington,D.C.,1993)。
还可以通过在突变细胞中导入包含缺陷基因5′和3′区,而缺少可选择的标记基因的核酸片段,然后在反选择培养基上选择的同源重组方法除去可选择的标记基因。通过同源重组,用缺少可选择的标记基因的核酸片段取代含有可选择的标记基因的缺陷基因。还可以采用本领域其它已知方法。
美国专利No.5,891,701公开了缺失包括spollAC、aprE、NPRE和amyE的若干基因的方法。
还可以通过上述方法如用cypX(登记号BG 12580)和/或yvmC(登记号BG14121)合成红色素除去其它不需要的生物化合物。
在一个优选的实施方案中,所述芽孢杆菌属宿主细胞不用任何异源性或外源性可选标记进行标记。在另一优选的实施方案中,所述芽孢杆菌属宿主细胞不能生成任何由cypX和yvmC合成的红色素。
编码具有UDP-葡萄糖6-脱氢酶活性、UDP葡萄糖焦磷酸化酶活性或UDP-N-乙酰葡糖胺焦磷酸化酶活性的多肽的分离的核酸序列
本文中将术语“UDP-葡萄糖6-脱氢酶活性”定义为能在存在2NAD+和水时催化UDP-葡萄糖转化为UDP-二磷酸葡萄糖醛酸酯和2NADH的UDP葡萄糖:NAD+6-氧化还原酶活性。为本发明的目的,可根据Jaenicke和Rudolph,1986,Biochemistry 25:7283-7287所述方法确定UDP-葡萄糖6-脱氢酶活性。将一单位UDP-葡萄糖6-脱氢酶活性定义为于25℃,pH 7时每分钟制备1.0μ摩尔的UDP-葡萄糖醛酸。
本文将术语“UDP葡萄糖焦磷酸化酶活性”定义为能在存在UTP时催化葡糖-1-磷酸转化为氯喹和UDP-葡萄糖的UTP:CL-D-葡萄糖-1-磷酸尿甙基转化酶活性。为本发明的目的,可根据Kamogawa等,1965,J.Biochem.(Tokyo)57:758-765或Hansen等,1966,Method Enzymol.8:248-253所述方法确定UDP葡萄糖焦磷酸化酶活性。将一单位UDP葡萄糖焦磷酸化酶活性的定义为于25℃,pH 7时每分钟制备1.0p摩尔的UDP-葡萄糖。
本文将术语“UDP-N-乙酰葡糖胺焦磷酸化酶活性”定义为能在存在UTP时催化N-乙酰-alpha-D-葡糖胺-1-磷酸转化为氯喹和UDP-N-乙酰-alpha-D-glucoamine的UTP:N-乙酰-alpha-D-glucoamine-1-磷酸尿苷酰转移酶活性。为本发明的目的,可根据Mangin-Lecreuix等,1994,J.Bacteriology176:5788-5795所述方法确定UDP-N-乙酰葡糖胺焦磷酸化酶活性。将一单位UDP-N-乙酰葡糖胺焦磷酸化酶活性定义为于25℃,pH 7时每分钟制备1.0μ摩尔的UDP-N-乙酰-alpha-D-glucoamine。
本文中所使用的术语“分离的核酸序列”指一种基本上不含其它核酸序列的核酸序列,例如通过琼脂糖电泳测定纯度为至少约20%、优选至少约40%、更优选至少约60%、甚至更优选至少约80%、最优选至少约90%。例如,分离的核酸序列可通过在遗传工程中用来将核酸序列从其天然位置重新定位至其将被复制的另一位点处的标准克隆过程来获得。所述克隆过程可包括切割和分离含编码该多肽的核酸序列的目的核酸片段,将该片段插入到一种载体分子中,并将该重组载体引入到一种宿主细胞中,在所述的宿主细胞中该核酸序列的多个拷贝或克隆将被复制。所述核酸序列可以是基因组DNA、cDNA、半合成、合成来源的或其任意组合。
在第一个实施方案中,本发明涉及编码多肽的分离的核酸序列,所述多肽的氨基酸序列与SEQ ID NO:41有至少约75%、优选至少约80%、更优选至少约85%、甚至更优选至少约90%、最优选至少约95%,以及甚至最优选至少约97%的同一性,所述多肽具有UDP-葡萄糖6-脱氢酶活性(此后为“同源性多肽”)。在一个优选的实施方案中,同源性多肽含有与SEQ IDNO:41中所列氨基酸序列有5个氨基酸、优选4个氨基酸、更优选3个氨基酸、甚至更优选2个氨基酸、最优选1个氨基酸不同的氨基酸序列。
在另一第一个实施方案中,本发明涉及编码多肽的分离的核酸序列,所述多肽的氨基酸序列与SEQ ID NO:43有至少约90%、优选至少约95%,更优选至少约97%的同一性,所述多肽具有UDP葡萄糖焦磷酸化酶活性(此后为“同源性多肽”)。在一个优选的实施方案中,同源性多肽含有与SEQ IDNO:43中所列氨基酸序列有5个氨基酸、优选4个氨基酸、更优选3个氨基酸、甚至更优选2个氨基酸、最优选1个氨基酸不同的氨基酸序列。
在另一第一个实施方案中,本发明涉及编码多肽的分离的核酸序列,所述多肽的氨基酸序列与SEQ ID NO:45有至少约75%、优选至少约80%、更优选至少约85%、甚至更优选至少约90%、最优选至少约95%,以及甚至最优选至少约97%的同一性,所述多肽具有UDP-N-乙酰葡糖胺焦磷酸化酶活性(此后为“同源性多肽”)。在一个优选的实施方案中,同源性多肽含有与SEQ ID NO:45中所列氨基酸序列有5个氨基酸、优选4个氨基酸、更优选3个氨基酸、甚至更优选2个氨基酸、最优选1个氨基酸不同的氨基酸序列。
为了本发明的目的,使用Clustal法(Higgins,1989,CABIOS 5:151-153)使用Vector NTI AlignX软件包(Informax INC.,Bethesda,MD)以及如下配对比对缺省参数:缺口罚分10,缺口长度罚分0.1,和分数矩阵(scorematrix):blosum62mt2来确定两个氨基酸序列间的同一性程度。
优选地,本发明的核酸序列所编码的多肽含有SEQ ID NO:41、SEQ IDNO:43或SEQ ID NO:45的氨基酸序列或其等位变体或其分别具有UDP-glucose6-脱氢酶、UDP-葡萄糖焦磷酸化酶或UDP-N-乙酰葡糖胺焦磷酸化酶活性的片段。在更优选的实施方案中,本发明的核酸序列所编码的多肽包含SEQ ID NO:41、SEQ ID NO:43或SEQ ID NO:45的氨基酸序列。在另一优选的实施方案中,本发明的核酸序列多编码的多肽包含SEQ ID NO:41,SEQ ID NO:43,或SEQ ID NO:45的氨基酸序列或其等位变体或其片段,其中多肽片段分别具有UDP-葡萄糖6-脱氢酶、UDP-葡萄糖焦磷酸化酶或UDP-N-乙酰葡糖胺焦磷酸化酶活性。在另一优选的实施方案中,本发明的核酸序列所编码的多肽含有SEQ ID NO:41、SEQ ID NO:43或SEQ IDNO:45的氨基酸序列。
本发明还包括编码多肽的核酸序列,所述多肽含有SEQ ID NO:41、SEQ ID NO:43或SEQ ID NO:45的氨基酸序列,其由于遗传密码的简并性而与SEQ ID NO:40,SEQ ID NO:42,或SEQ ID NO:44不同。本发明还涉及分别编码SEQ ID NO:41、SEQ ID NO:43或SEQ ID NO:45的片段的SEQ ID NO:40、SEQ ID NO:42或SEQ ID NO:44亚序列,所述片段分别具有UDP-葡萄糖6-脱氢酶、UDP-葡萄糖焦磷酸化酶或UDP-N-乙酰葡糖胺焦磷酸化酶活性。
SEQ ID NO:40的亚序列为除了从5′和/或3’末端的一个或多个核苷酸缺失外,由SEQ ID NO:40所包含的和酸序列。优选地,亚序列包含1020核苷酸、更优选至少1080核苷酸、和最优选至少1140核苷酸。SEQ ID NO:41的片段为含有从该氨基酸序列的氨基和/或羧基端的一个或多个氨基酸缺失的多肽。优选地,片段至少包含340氨基酸残基、更优选至少360氨基酸残基、和最优选至少380氨基酸残基。
SEQ ID NO:42的亚序列为除了从5′和/或3’末端的一个或多个核苷酸缺失外,由SEQ ID NO:42所包含的和酸序列。优选地,亚序列至少包含765核苷酸、更优选至少810核苷酸、和最优选至少855核苷酸。SEQ ID NO:43的片段为含有从该氨基酸序列的氨基和/或羧基端的一个或多个氨基酸缺失的多肽。优选地,片段至少包含255氨基酸残基、更优选至少270氨基酸残基、和最优选至少285氨基酸残基。
SEQ ID NO:44的亚序列为除了从5′和/或3’末端的一个或多个核苷酸缺失外,由SEQ ID NO:44所包含的和酸序列。优选地,亚序列至少包含1110核苷酸、更优选至少1200核苷酸、和最优选至少1290核苷酸。SEQID NO:45的片段为含有从该氨基酸序列的氨基和/或羧基端的一个或多个氨基酸缺失的多肽。优选地,片段至少包含370氨基酸残基、更优选至少400氨基酸残基、和最优选至少430氨基酸残基。
一个等位基因变体指占据相同染色体位点的一个基因的两个或多个可选形式中的任何一个。等位基因变异通过突变自然产生,并可以导致群体内表型的多态性。基因突变可以是沉默突变(即,在所编码的多肽中没有改变)或可以编码氨基酸序列发生改变的多肽。多肽的等位变体为由基因的等位变体所编码的多肽。
在第二个实施方案中,本发明涉及与SEQ ID NO:40有至少约75%、优选至少约80%、更优选至少约85%、甚至更优选至少约90%、最优选至少约95%、和甚至最优选至少约97%同一性的分离的核酸序列。
在另一第二个实施方案中,本发明涉及与SEQ ID NO:42有至少约90%、优选至少约95%、和更优选至少约97%同一性的分离的核酸序列。
在另一第二个实施方案中,本发明涉及与SEQ ID NO:44有至少约75%、优选至少约80%、更优选至少约85%、甚至更优选至少约90%、最优选至少约95%、和甚至最优选至少约97%同一性的分离的核酸序列。
为了本发明的目的,使用Vector NTI AlignX软件包(Informax INC.,Bethesda,MD)以及如下配对比对缺省参数:缺口罚分15,缺口长度罚分6.6,和分数矩阵:swgapdnamt来确定两个核酸序列间的同一性程度。
在第三个实施方案中,本发明涉及编码具有UDP-葡萄糖6-脱氢酶、UDP-葡萄糖焦磷酸化酶或UDP-N-乙酰葡糖胺焦磷酸化酶活性的多肽的分离的核酸序列,该核酸序列在非常低的严紧条件下、优选低严紧条件下,更优选中严紧条件下、更优选中-高严紧条件下,更优选高严紧条件下以及最优选非常高严紧条件下与(i)SEQ ID NO:40、SEQ ID NO:42或SEQ IDNO:44的核酸序列,(ii)包含在SEQ ID NO:40、SEQ ID NO:42或SEQ IDNO:44中的cDNA序列,或(iii)(i)或(ii)的互补链杂交(J.Sambrook,E.F.Fritsch和T.Maniatus,1989,Molecular Cloning,A Laboratory Manual,2d edition,Cold Spring Harbor,New York)。SEQ ID NO:40、SEQ ID NO:42或SEQ ID NO:44的亚序列可以是至少100个核苷酸或优选至少200个核苷酸。此外,各亚序列可编码具有UDP-葡萄糖6-脱氢酶、UDP-葡萄糖焦磷酸化酶或UDP-N-乙酰葡糖胺焦磷酸化酶活性的多肽片段。
SEQ ID NO:40、SEQ ID NO:42或SEQ ID NO:44的核酸序列,或其亚序列,以及SEQ ID NO:41、SEQ ID NO:43或SEQ ID NO:45氨基酸序列,或其片段,均可用于设计核酸探针从而根据本领域众所周知的方法分别鉴别和克隆来自不同属或种的菌株的编码具有UDP-葡萄糖6-脱氢酶、UDP-葡萄糖焦磷酸化酶或UDP-N-乙酰葡糖胺焦磷酸化酶活性的多肽的DNA。特别地,所述探针可用于在标准Southern印迹步骤后,与目的属或种的基因组或cDNA杂交,从而鉴别和分离其中的相应基因。所述探针可相当地短于全长序列,但长度上至少为15、优选至少为25,而更优选至少为35个核苷酸。也可以使用较长的探针。可以使用DNA和RNA探针。将所述探针进行典型地标记(例如,用32P、3H、35S、生物素或抗生物素蛋白)而用于检测相应基因。所述探针包含于本发明中。
因此,可从所述其它生物体中制备的基因组DNA或cDNA文库中筛选与上述探针杂交且编码具有UDP-葡萄糖6-脱氢酶、UDP-葡萄糖焦磷酸化酶或UDP-N-乙酰葡糖胺焦磷酸化酶活性的多肽的DNA。可采用琼脂糖或聚丙烯酰胺凝胶电泳或其它分离技术分离来自所述其它生物体的所述基因组或其它DNA。可将来自文库或分离的DNA的DNA转至并固定在硝酸纤维或其它适宜的载体材料上。为了鉴别与SEQ ID NO:40、SEQ ID NO:42或SEQ ID NO:44,或其亚序列同源的克隆或DNA,将所述载体材料用于Southern印迹。为本发明的目的,杂交显示出核酸序列与和SEQ ID NO:40、SEQ ID NO:42或SEQ ID NO:44所示核酸序列、其互补链或其亚序列相应的标记的核酸探针在非常低至非常高严紧条件下杂交。采用X光片检测与核酸探针在这些条件下杂交的分子。
在一个优选的实施方案中,核酸探针是编码SEQ ID NO:41、SEQ IDNO:43或SEQ ID NO:45或其亚序列的多肽的核酸序列。在另一优选的实施方案中,核酸探针是SEQ ID NO:40、SEQ ID NO:42或SEQ ID NO:44。在另一优选的实施方案中,核酸探针是包含在质粒pMRT106中的核酸序列,所述质粒包含于大肠杆菌NRRLB-30536中,其中核酸序列编码具有UDP-葡萄糖6-脱氢酶,UDP-葡萄糖焦磷酸化酶,和UDP-N-乙酰葡糖胺焦磷酸化酶活性的多肽。
对长度至少100个核苷酸的长探针而言,将非常低至非常高严紧条件定义为在42℃ 5×SSPE、0.3%SDS,200μg/ml剪切并变性的鲑精DNA,以及对于非常低和低严紧度来说25%甲酰胺,对于中和中-高严紧度来说35%甲酰胺,或对于高和非常高严紧度来说50%甲酰胺中,根据标准Southern印迹分析进行预杂交和杂交。
对长度至少100个核苷酸的长探针而言,最终用2×SSC、0.2%SDS优选在至少45℃(非常低严紧度)、更优选在至少50℃(低严紧度)、更优选在至少55℃(中严紧度)、更优选在至少60℃(中-高严紧度)、甚至更优选在至少65℃(高严紧度)以及最优选在至少70℃(非常高严紧度)将载体材料洗涤3次,每次15分钟。
对长度为约15个核苷酸至约70个核苷酸的短探针而言,将严紧条件定义为相对于按照Bolton和McCarthy(1962,Proceedings of the NationalAcademy of Sciences USA48:1390)计算的理论Tm低5℃~10℃的温度下,在0.9M NaCl、0.09M Tris-HCl pH 7.6、6mM EDTA、0.5%NP-40、1×Denhardt’s溶液、1mM焦磷酸钠、1mM磷酸氢二钠、0.1mM ATP,和0.2mg酵母RNA/ml中,根据标准Southern印迹分析进行预杂交,杂交,和杂交后洗涤。
对长度为约15个核苷酸至约70个核苷酸的短探针而言,将载体材料在低于理论Tm 5℃~10℃的温度下,在6×SSC+0.1%SDS中洗涤一次,15分钟,然后用6×SSC洗涤2次,每次15分钟。
在第四个实施方案中,本发明涉及分离的核酸序列,其编码含有包含一个或多个氨基酸的取代、缺失和/或插入的SEQ ID NO:41、SEQ ID NO:43或SEQ ID NO:45的氨基酸序列的多肽的变体。
变体多肽的氨基酸序列可通过插入或缺失一个或多个氨基酸残基和/或用不同的氨基酸残基取代一个或多个氨基酸残基而与SEQ ID NO:41、SEQID NO:43或SEQ ID NO:45的氨基酸序列有所不同。优选,氨基酸改变是微小性质的改变,即不会显著影响所述蛋白质折叠和/或活性的保守性氨基酸取代;小缺失,通常缺失1-约30个氨基酸;小的氨基-或羧基-末端延伸,如氨基-末端甲硫氨酸残基;最多约20-25个残基的小接头肽或有利于通过改变净电荷或另一功能,例如聚-组氨酸序列、抗原表位或结合结构域而纯化的小的延伸。
保守性取代的实例包括下组内的取代,碱性氨基酸(精氨酸,赖氨酸和组氨酸),酸性氨基酸(谷氨酸和天冬氨酸),极性氨基酸(谷氨酸和天东氨酸),疏水氨基酸(亮氨酸,异亮氨酸和缬氨酸),芳香族氨基酸(苯丙氨酸,色氨酸和酪氨酸),和小分子氨基酸(甘氨酸,丙氨酸,丝氨酸,苏氨酸和甲硫氨酸)。通常不会改变比活性的氨基酸取代是本领域已知的,如,H.Neurath和R.L.Hill,1979,In,The Proteins,Academic Press,New York中所述。最常发生的互换是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly以及其相反互换。
修饰本发明的核酸序列对于合成于所述多肽基本相似的多肽是必需的。“基本相似”于所述多肽是指所述多肽的非天然形式。这些多肽经基因工程改造而在一定程度上不同于从其天然来源分离的多肽,例如,在比活性、热稳定性、最佳pH等方面有所不同的变体。可根据SEQ ID NO:40、SEQ IDNO:42或SEQ ID NO:44的多肽编码部分指示的核酸序列,如其亚序列,和/或通过导入核苷酸取代来构建变体序列,所述核苷酸取代不产生由所述核酸序列编码的多肽的另一氨基酸,但对应于用于生产所述酶的宿主生物所偏好的密码子使用特点,或通过导入可产生不同氨基酸序列的核苷酸取代来构建所述变体序列。有关核苷酸取代的一般描述参见例如Ford等,1991,  Protein Expression和Purification 2:95-107。
对本领域技术人员显而易见的是,可以在对于所述分子的功能非常重要的区域外进行所述取代,这样仍得到活性多肽。根据本领域已知的方法,如定点诱变或丙氨酸所描诱变(参见例如Cunningham和Wells,1989,Science244:1081-1085)可鉴定对于本发明分离的核酸序列所编码的多肽的活性至关重要的氨基酸残基,因此优选不经过取代即可完成所述鉴定。在后一种技术中,在分子的每个正电荷残基处诱导突变,然后检测所得突变分子的酶活性以鉴定对于分子活性至关重要的氨基酸残基。底物-酶作用位点还可通过对核磁共振、晶体照相术或光亲和标记等技术所测定的三维结构的分析来确定(参见例如de Vos等,1992,Science 255:306-312;Smith等,1992,Journal of Molecular Biology 224:899-904;Wlodaver等,1992,FEBSLetters 309:59-64)。
由本发明分离的核酸序列编码的多肽具有至少20%、优选至少40%、更优选至少60%、甚至更优选至少80%、甚至更优选至少90%以及最优选至少100%的SEQ ID NO:41的多肽的UDP-葡萄糖6-脱氢酶的活性、SEQIDNO:43的多肽的UDP葡萄糖焦磷酸化酶活性或SEQ ID NO:45的多肽的UDP-N-乙酰葡糖胺焦磷酸化酶活性。
本发明的核酸序列可获自任何属的微生物。为达到本发明的目的,此处与给定来源一起使用的术语“获自”是指由核酸序列编码的多肽是由该核酸序列的来源或已插入了所述来源的核酸序列的细胞所生产的。在一个优选的实施方案中,由本发明的核酸序列多肽为细胞外分泌。
核酸序列可获自细菌来源。例如,这些多肽可以获自革兰氏阳性细菌如杆菌菌株,例如,Bacillus agaradherens、嗜碱芽孢杆菌、解淀粉芽胞杆菌、,短芽胞杆菌、,短芽胞杆菌、克劳氏芽孢杆菌、凝结芽胞杆菌、灿烂芽胞杆菌、迟缓芽胞杆菌、地衣形芽胞杆菌、巨大芽胞杆菌、嗜热脂肪芽胞杆菌、枯草芽孢杆菌或苏芸金芽胞杆菌或链霉菌属,例如,浅青紫链霉菌(Streptomyces lividans)或鼠灰链霉菌(Streptomyces murinus)或获自革兰氏阴性细菌,例如,大肠杆菌或假单胞杆菌(Pseudomonas sp)。
在一个优选的实施方案中,核酸序列可获自链球菌属或巴斯德菌属菌株。
在更优选的实施方案中,核酸序列获自似马链球菌,酿脓链球菌,乳房链球菌或马链球菌兽瘟亚种或出血败血性巴斯德菌菌株。
在最优选的实施方案中,核酸序列获自似马链球菌,例如,SEQ ID NO:40、SEQ ID NO:42或SEQ ID NO:44中所示核酸序列。在另一最优选的实施方案中,核酸探针是包含在质粒pMRT106中的序列,所述质粒包含于大肠杆菌NRRL B-30536中。在更加最优选的实施方案中,核酸序列是SEQ IDNO:40、SEQ ID NO:42或SEQ ID NO:44。
这些种的菌株很容易从各种收集中心,如美国典型培养物保藏中心(ATCC)、德意志微生物和细胞培养物保藏中心(DSM)、真菌菌株保藏中心(CBS)和农业研究服务专利培养物保藏中心(Agricultural Research ServicePatent Culture Collection)北方地区研究中心(NRRL)。
此外,使用上述探针可从其它来源,包括分离自自然界(例如,土壤、堆肥、水等)的微生物中鉴定和获得所述核酸序列。从自然环境中分离微生物的方法是本领域众所周知的。通过类似地筛选另一微生物的基因组或cDNA文库可得到所述核酸序列。一旦用所述探针检测到了编码多肽的核酸序列后,可采用本领域普通技术人员已知的技术(参见例如Sambrook等,1989,同上文)分离或克隆所述序列。
本发明还涉及含有SEQ ID NO:40、SEQ ID NO:42和SEQ ID NO:44的多肽编码序列中至少一个突变的突变核酸序列,其中突变核酸序列编码分别包含SEQ ID NO:42、SEQ ID NO:43和SEQ ID NO:45的多肽。
用于分离和克隆编码多肽的核酸序列的方法是本领域已知的,所述方法包括从基因组DNA中分离,从cDNA中制备,或其联合。获自所述基因组DNA的本发明的核酸序列的克隆可通过,例如,使用众所周知的聚合酶链反应(PCR)或表达文库的抗体筛选从而检测具有共有结构特点的克隆的DNA片段的方法实施。参见例如Innis等,1990,PCR:A GUIDE TOMETHODS and Application,Academic Press,New York。可使用其它核酸扩增方法如连接酶链反应(LCR),连接活化转录(ligated activated transcription(LAT))和基于核酸序列的扩增(NASBA)。核酸序列还可从链球菌菌株,或另一或相关的生物体中克隆并由此,例如,可以是核酸序列的多肽编码区的等位或种属变体。
本发明还涉及包含可操作性连接于一个或多个控制序列的本发明的核酸序列的核酸构建体,所述控制序列在与所述控制序列相适应的条件下在适宜的宿主细胞中指导编码序列的表达。
本发明还涉及包含本发明核酸序列,启动子以及转录和翻译终止信号的重组表达载体。
本发明还涉及包含本发明的核酸序列重组宿主细胞,其可有益地用于多肽的重组制备中。
本发明还涉及制备具有UDP-N-乙酰葡糖胺焦磷酸化酶活性的多肽的方法,包括(a)在适宜制备多肽的条件下培养宿主细胞;和(b)回收多肽。
在本发明的制备方法中,采用本领域的已知方法将细胞培养于适宜制备多肽的营养培养基中。例如,可采用摇瓶培养和在适宜的培养基中和在适宜多肽表达和/或分离的条件下在实验室或工业发酵罐中实施的小规模或大规模发酵(包括连续、分批、分批补料或固态发酵)的方法培养细胞。在包含碳源和氮源以及无机盐的适宜营养培养基中,采用本领域已知方法实施培养。适宜的培养基可获自商业供应商或可根据已经公开的组成(例如,在美国典型培养物保藏中心的目录中)制备。如果多肽被分泌至营养培养基中,则可直接从培养基中回收多肽。如果多肽未分泌,则可从细胞裂解物将其回收。
可采用特异性针对多肽的本领域的已知方法检测多肽。这些检测方法可包括使用特异性抗体,生成酶产物,或酶底物的消失。
例如,酶检测法可用于确定本说明所述的多肽的活性。
可采用本领域的已知方法回收得到的多肽。例如,可采用包括(但不限于)离心、过滤、提取、喷雾干燥、蒸发或沉淀的传统方法从营养培养基中回收多肽。
可采用本领域的已知的多种方法纯化多肽,所述方法包括(但不限于)层析法(例如,离子交换,亲和,疏水,层析聚焦和大小排阻层析),电泳方法(例如,准备型等电焦距),差异溶解(differential solubility)(例如,硫酸铵沉淀),SDS-PAGE,或提取(参见例如Protein Purification,J.-C.Janson和Lars Ryden编,VCH出版公司,New York,1989)。
本发明还涉及由上述核酸序列编码的,具有UDP-葡萄糖6-脱氢酶、UDP-葡萄糖焦磷酸化酶或UDP-N-乙酰葡糖胺焦磷酸化酶活性的分离的多肽。
下述实施例用于进一步描述本发明,而不应将其理解为对本发明范围的限制。
                              实施例
引物和寡核苷酸
全部引物和寡核苷酸均通过购买获得(MWG Biotech INC.,High Point,NC)。
实施例1:似马链球菌hasA基因和枯草芽孢杆菌tuaD、gtaB和gcaD基因的PCR扩增和克隆。
从质粒pKKseD(Weigel,1997,Journal of Biological Chemistry 272:32539-32546)中经PCR扩增出似马链球菌透明质酸合酶基因(hasA,登记号AF023876,SEQ ID NOs:1[DNA序列]和2[推导的氨基酸序列]),所使用的引物1和2为:
引物1:
5’-GAGCTCTATAAAAATGAGGAGGGAACCGAATGAGAACATTAAAAAACCT-3’
(SEQ ID NO:3)
引物2:
5’-GTTAACGAATTCAGCTATGTAGGTACCTTATAATAATTTTTTACGTGT-3’(SEQ ID NO:4)
在50μl反应中一式三份实施PCR扩增,所述反应含有如下成分:1ngpKKseD DNA,引物1和2各0.4μM,dATP、dCTP,dGTP和dTTP各200μM,2.5mM MgCl2的1×PCR缓冲液II(Applied Biosystems,INC.,Foster City,CA)和2.5单位AmpliTaq GoldTM DNA聚合酶(Applied Biosystems,INC.,Foster City,CA)。在RoboCycler 40 thermacycler(Stratagene,INC.,La Jolla,CA)中实施反应,反应条件:95℃9分钟1个循环;95℃1分钟,52℃1分钟,72℃1分钟3个循环;95℃1分钟,55℃1分钟,72℃1分钟27个循环;72℃5分钟1个循环。采用0.8%琼脂糖凝胶以及44 mM Tris碱,44mM硼酸,0.5mM EDTA缓冲液(0.5×TBE)使PCR产物显影。所要片段为约1200bp。
使用TA-TOPO克隆试剂盒(Stratagene,INC.,La Jolla,CA)将1200bp PCR片段克隆至pCR2.1并按照厂商说明(Stratagene,INC.,La Jolla,CA)将其转化至大肠杆菌感受态细胞。在加入了100μg氨卡青霉素/ml的2×酵母-胰胨(YT)琼脂板上生长16小时后,于37℃下选择转化株。使用QIAGEN自动仪(QIAGEN,Valencia,CA),按照厂商说明纯化来自这些转化株的质粒DNA,并通过使用M13(-20)正向和M13反向引物(Invitrogen,Inc,Carlsbad,CA)以及其下的内部引物的DNA测序确定插入的DNA序列。将包含1200bp PCR片段的质粒命名为pCR2.1-sehasA(图3)。
引物3:
5’-GTTGACGATGGAAGTGCTGA-3’(SEQ ID NO:5)
引物4:
5’-ATCCGTTACAGGTAATATCC-3’(SEQ ID NO:6)
引物5:
5′-TCCTTTTGTAGCCCTATGGA-3′(SEQ ID NO:7)
引物6:
5′-TCAGCACTTCCATCGTCAAC-3′(SEQ ID NO:8)
引物7:
5′-GGATATTACCTGTAACGGAT-3′(SEQ ID NO:9)
引物8:
5′-TCCATAGGGCTACAAAAGGA-3′(SEQ ID NO:10)
从枯草芽孢杆菌168(BGSC 1A1,Bacillus Genetic Stock Center,Columbus,OH)中经PCR扩增出枯草芽孢杆菌UDP-葡萄糖-6-脱氢酶基因(tuaD,登记号BG12691,SEQ ID No:11[DNA序列]和12[推导的氨基酸序列]),所使用的引物9和10为:
引物9:
5’-GGTACCGACACTGCGACCATTATAAA-3’(SEQ ID NO:13)
引物10:
5′-GTTAACGAATTCCAGCTATGTATCTAGACAGCTTCAACCAAGTAACACT-3′(SEQ ID NO:14)
在30μl反应中一式三份实施PCR扩增,所述反应含有如下成分:50ng枯草芽孢杆菌168染色体DNA,引物9和10各0.3μM,dATP、dCTP,dGTP和dTTP各200μM,2.5mM MgCl2的1×PCR缓冲液II和2.5单位AmpliTaq GoldTM DNA聚合酶。在RoboCycler 40 thermacycler中实施反应,反应条件:95℃9分钟1个循环;95℃1分钟,50℃1分钟,72℃1分钟5个循环;95℃1分钟,54℃1分钟,72℃1.5分钟32个循环;72℃7分钟1个循环。采用0.8%琼脂糖凝胶以及0.5×TBE缓冲液使PCR产物显影。所要片段为约1400 bp。
使用TA-TOPO克隆试剂盒(Stratagene,INC.,La Jolla,CA)将1400bp PCR片段克隆至pCR2.1并按照厂商说明(Stratagene,INC.,La Jolla,CA)将其转化至大肠杆菌感受态细胞。使用QIAGEN自动仪,按照厂商说明纯化质粒DNA,并通过使用M13(-20)正向和M13反向引物(Invitrogen,Inc,Carlsbad,CA)以及其下的内部引物的DNA测序确定插入的DNA序列。将包含1200 bp PCR片段的质粒命名为pCR2.1-tuaD(图4)。
引物11:
5’-AGCATCTTAACGGCTACAAA-3’(SEQ ID NO:15)
引物12:
5′-TGTGAGCGAGTCGGCGCAGA-3′(SEQ ID NO:16)
引物1 3:
5’-GGGCGCCCATGTAAAAGCAT-3’(SEQ ID NO:17)
引物14:
5’-TTTGTAGCCGTTAAGATGCT-3’(SEQ ID NO:18)
引物15:
5′-TCTGCGCCGACTCGCTCACA-3′(SEQ ID NO:19)
引物16:
5′-ATGCTTTTACATGGGCGCCC-3′(SEQ ID NO:20)
从枯草芽孢杆菌168中经PCR扩增出枯草芽孢杆菌UTP-葡萄糖-1-磷酸尿苷酰基转移酶基因(gtaB,登记号BG10402,SEQ ID No:21[DNA序列]和22[推导的氨基酸序列]),所使用的引物17和18为:
引物17:
5’-TCTAGATTTTTCGATCATAAGGAAGGT-3’(SEQ ID NO:23)
引物18:
5′-GTTAACGAATTCCAGCTATGTAGGATCCAATGTCCAATAGCCTTTTTGT-3’(SEQ ID NO:24)
在30μl反应中一式三份实施PCR扩增,所述反应含有如下成分:50ng枯草芽孢杆菌168染色体DNA,引物17和18各0.3μM,dATP、dCTP,dGTP和dTTP各200μM,2.5mM MgCl2的1×PCR缓冲液II和2.5单位AmpliTaq GoldTM DNA聚合酶。在RoboCycler 40 thermacycler中实施反应,反应条件:95℃9分钟1个循环;95℃1分钟,50℃1分钟,72℃1.5分钟5个循环;95℃1分钟,54℃1分钟,72℃1.5分钟32个循环;72℃7分钟1个循环。采用0.8%琼脂糖凝胶以及0.5×TBE缓冲液使PCR产物显影。所要片段为约900bp。
使用TA-TOPO克隆试剂盒(Stratagene,INC.,La Jolla,CA)将900bpPCR片段克隆至pCR2.1并按照厂商说明(Stratagene,INC.,La Jolla,CA)将其转化至大肠杆菌OneShotTM感受态细胞。使用QIAGEN自动仪,按照厂商说明纯化质粒DNA,并通过使用M13(-20)正向和M13反向引物(Invitrogen,Inc,Carlsbad,CA)以及其下的内部引物的DNA测序确定插入的DNA序列。将包含900bp PCR片段的质粒命名为pCR2.1-gtaB(图5)。
引物19:
5’-AAAAAGGCTTCTAACCTGGC-3’(SEQ ID NO:25)
引物20:
5’-AAACCGCCTAAAGGCACAGC-3’(SEQ ID NO:26)
引物21:
5’-GCCAGGTTAGAAGCCTTTTT-3’(SEQ ID NO:27)
引物22:
5′-GCTGTGCCTTTAGGCGGTTT-3′(SEQ ID NO:28)
从枯草芽孢杆菌168中经PCR扩增出枯草芽孢杆菌UDP-N-乙酰葡糖胺焦磷酸化酶基因(gcaD,登记号BG10113,SEQ ID No:29[DNA序列]和30[推导的氨基酸序列]),所使用的引物23和24为:
引物23:
5’-GGATCCTTTCTATGGATAAAAGGGAT-3’(SEQ ID NO:31)
引物24:
5’-GTTAACAGGATTATTTTTTATGAATATTTTT-3’(SEQ ID NO:32)
在30μl反应中一式三份实施PCR扩增,所述反应含有如下成分:50ng枯草芽孢杆菌168染色体DNA,引物23和24各0.3μM,dATP、dCTP,dGTP和dTTP各200μM,2.5mM MgCl2的1×PCR缓冲液II和2.5单位AmpliTaq GoldTM DNA聚合酶。在RoboCycler 40 thermacycler中实施反应,反应条件:95℃9分钟1个循环;95℃1分钟,50℃1分钟,72℃1.5分钟5个循环;95℃1分钟,54℃1分钟,72℃1.5分钟32个循环;72℃7分钟1个循环。采用0.8%琼脂糖凝胶以及0.5×TBE缓冲液使PCR产物显影。所要片段为约1500bp。
使用TA-TOPO克隆试剂盒(Stratagene,INC.,La Jolla,CA)将1500bp PCR片段克隆至pCR2.1并按照厂商说明(Stratagene,INC.,La Jolla,CA)将其转化至大肠杆菌OneShotTM感受态细胞。使用QIAGEN自动仪,按照厂商说明纯化质粒DNA,并通过使用M13(-20)正向和M13反向引物(Invitrogen,Inc,Carlsbad,CA)以及其下的内部引物的DNA测序确定插入的DNA序列。将包含900bp PCR片段的质粒命名为pCR2.1-gcaD(图6)。
引物25:
5’-CAGAGACGATGGAACAGATG-3’(SEQ ID NO:33)
引物26:
5’-GGAGTTAATGATAGAGTTGC-3’(SEQ ID NO:34)
引物27:
5’-GAAGATCGGGAATTTTGTAG-3’(SEQ ID NO:35)
引物28:
5′-CATCTGTTCCATCGTCTCTG-3′(SEQ ID NO:36)
引物29:
5’-GCAACTCTATCATTAACTCC-3’(SEQ ID NO:37)
引物30:
5’-CTACAAAATTCCCGATCTTC-3’(SEQ ID NO:38)
实施例2:hasA/tuaD/gtaB操纵子的构建
质粒pDG268Δneo-cryIIIA stab/Sav(美国专利No.5,955,310)和pCR2.1-tuaD(实施例1,图4)用KpnI和HpaI酶切消化。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上分析酶切消化并用QIAquick DNA提取试剂盒按厂商说明(QIAGEN,Valencia,CA)凝胶纯化来自pDG268Δneo-cryIIIAstab/Sav的较大的载体片段(约7700bp)和来自pCR2.1-tuaD的较小的tuaD片段(约1500bp)。用T4 DNA连接酶(RocheApplied Science;Indianapolis,IN)按厂商说明将两个纯化的片段连接在一起,并将连接混合物转化至大肠杆菌SURE感受态细胞(Stratagene,INC.,La Jolla,CA)中。在加入100μg氨卡青霉素/ml的2XYT琼脂板上筛选转化体。
采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并通过KpnI+HpaI酶切消化在使用0.5×TBE缓冲液的0.8%琼脂糖凝胶上进行分析。存在约1500bp的KpnI/HpaI tuaD片段即可鉴定为正确的质粒并将其命名为pHA1(图7)。
质粒pHA1和pCR2.1-gtaB(实施例1,图5)用XbaI和HpaI酶切消化。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上分析酶切消化并用QIAquickDNA提取试剂盒按厂商说明凝胶纯化来自pHA1的较大的载体片段(约9200bp)和来自pCR2.1-gtaB的较小的gtaB片段(约900bp)。用T4 DNA连接酶按厂商说明将两个纯化的片段连接在一起,并将连接混合物转化至大肠杆菌SURE感受态细胞中。于37℃在加入100μg氨卡青霉素/ml的2XYT琼脂板上筛选转化体。
采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并用XbaI+HpaI酶切消化。在使用0.5×TBE缓冲液的0.8%琼脂糖凝胶上分析酶切消化。存在约900bp的XbaI/HpaI gtaB片段即可鉴定为正确的质粒并将其命名为pHA2(图8)。
质粒pHA2和pCR2.1-sehasA(实施例1,图3)用SacI+KpnI酶切消化。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上分析酶切消化。用QIAquickDNA提取试剂盒按厂商说明凝胶纯化来自pHA2的较大的载体片段(约10000bp)和来自pCR2.1-sehasA的较小的hasA片段(约1300bp)。用T4 DNA连接酶按厂商说明将两个纯化的片段连接在一起,并将连接混合物转化至大肠杆菌SURE感受态细胞中。于37℃在加入100μg氨卡青霉素/ml的2XYT琼脂板上筛选转化体。采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并用SacI+KpnI酶切消化。在使用0.5×TBE缓冲液的0.8%琼脂糖凝胶上分析酶切消化。存在约1300bp的SacI/KpnI hasA片段即可鉴定为正确的质粒并将其命名为pHA3(图9)。
实施例3:构建hasA/tuaD/gtaB/gcaD操纵子
质粒pHA2(实施例2,图8)和pCR2.1-gcaD(实施例1,图6)用BamHI和HpaI酶切消化。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上分析酶切消化并用QIAquick DNA提取试剂盒按厂商说明凝胶纯化来自pHA2的较大的载体片段(约10,000bp)和来自pCR2.1-gcaD的较小的gcaD片段(约1,400bp)。用T4 DNA连接酶按厂商说明将两个纯化的片段连接在一起,并将连接混合物转化至大肠杆菌SURE感受态细胞中。于37℃在加入100μg氨卡青霉素/ml的2XYT琼脂板上筛选转化体。
采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并用XbaI+HpaI酶切消化。在使用0.5×TBE缓冲液的0.8%琼脂糖凝胶上分析酶切消化。存在约1400bp的BamHI/HpaI gcaD片段即可鉴定为正确的质粒并将其命名为pHA4(图10)。
质粒pHA4和pCR2.1-sehasA(实施例1,图3)用SacI和KpnI酶切消化。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上分析酶切消化并用QIAquickDNA提取试剂盒按厂商说明凝胶纯化来自pHA4的较大的载体片段(约11,000bp)和来自pCR2.1-sehasA的较小的hasA片段(约1,300bp)。用T4 DNA连接酶按厂商说明将两个纯化的片段连接在一起,并将连接混合物转化至大肠杆菌SURE感受态细胞中。在加入100μg氨卡青霉素/ml的2XYT琼脂板上筛选转化体。采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并用SacI+KpnI酶切消化。在使用0.5×TBE缓冲液的0.8%琼脂糖凝胶上分析酶切消化。存在约1,300bp的SacI/KpnI hasA片段即可鉴定为正确的质粒并将其命名为pHA5(图11)。
实施例4:构建hasA/tuaD/gcaD操纵子
质粒pHA1(实施例2,图7)和pCR2.1-gcaD(实施例1,图6)用BamHI和HpaI酶切消化。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上分析酶切消化并用QIAquick DNA提取试剂盒按厂商说明凝胶纯化来自pHA1的较大的载体片段(约9,200bp)和来自pCR2.1-gcaD的较小的gcaD片段(约1400bp)。用T4 DNA连接酶按厂商说明将两个纯化的片段连接在一起,并将连接混合物转化至大肠杆菌SURE感受态细胞中。于37℃在加入100μg氨卡青霉素/ml的2X YT琼脂板上筛选转化体。
采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并用BamHI+HpaI酶切消化。在使用0.5×TBE缓冲液的0.8%琼脂糖凝胶上分析酶切消化。存在约1400 bp的BamHI/HpaI gtaB片段即可鉴定为正确的质粒并将其命名为pHA6(图12)。
质粒pHA6和pCR2.1-sehasA(实施例1,图3)用SacI+KpnI酶切消化。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上分析酶切消化。用QIAquickDNA提取试剂盒按厂商说明凝胶纯化来自pHA6的较大的载体片段(约10,200bp)和来自pCR2.1-sehasA的较小的hasA片段(约1,300bp)。用T4DNA连接酶按厂商说明将两个纯化的片段连接在一起,并将连接混合物转化至大肠杆菌SURE感受态细胞中。于37℃在加入100μg氨卡青霉素/ml的2X YT琼脂板上筛选转化体。采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并用SacI+KpnI酶切消化。在使用0.5×TBE缓冲液的0.8%琼脂糖凝胶上分析酶切消化。存在约1300bp SacI/KpnI hasA片段即可鉴定为正确的质粒并将其命名为pHA7(图13)。
实施例5:构建枯草芽孢杆菌RB161
质粒pDG268MCSΔneo/scBAN/Sav(美国专利No.5,955,310)用SacI酶切消化。用QIAquick DNA提取试剂盒按厂商说明纯化酶切消化过的质粒,最后用NotI酶切消化。用QIAquick DNA提取试剂盒按厂商说明(QIAGEN,Valencia,CA)从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化约6800bp的最大的质粒片段。然后将回收的载体DNA与下述DNA插入片段连接。
质粒pHA3(实施例2,图9)用SacI酶切消化。按上述方法纯化酶切消化过的质粒,最后用NotI酶切消化。按上述方法凝胶纯化约3800bp的最小的质粒片段。采用Rapid DNA克隆试剂盒(Roche Applied Science;Indianapolis,IN)按厂商说明将回收的载体与DNA插入片段连接。在转化至枯草芽孢杆菌前,采用ScaI将上述连接体线性化以确保染色体中为双交换整合而不是但交换整合。将用限制性酶ScaI酶切消化的连接产物转化枯草芽孢杆菌168Δ4感受态细胞。枯草芽孢杆菌168Δ4来自枯草芽孢杆菌菌株168(BGSC 1A1,Bacillus Genetic Stock Center,Columbus,OH)并已经在spollAC,APRE,NPRE和amyE基因中进行了缺失。这四个基因的确实基本上按照关于枯草芽孢杆菌A164Δ5所述的方法实施,所述方法详细描述于美国专利No.5,891,701中。
在添加了5μg氯霉素/ml的Tryptose blood agar base(TBAB)琼脂板于34℃生长16小时筛选枯草芽孢杆菌氯霉素-抗性转化体。为筛选经由在amyE基因座处双交换的质粒的整合,将枯草芽孢杆菌原始转化体铺于添加了6μg新霉素/ml的TBAB琼脂板和在添加了5μg氯霉素/ml的TBAB琼脂板上。经由在amyE基因座处双交换的质粒的整合没有掺入新霉素抗性基因,因此生成了新霉素敏感性菌株。再将分离菌株置于小琼脂板(minimalplate)上以观察其是否在生成透明质酸。生成透明质酸的分离菌株在最小琼脂板上具有“湿”表型。使用该平板筛选,在37℃下分离氯霉素抗性和新霉素敏感性“湿”转化体(由于透明质酸的生成)。
采用QIAGEN tip-20柱(QIAGEN,Valencia,CA)按厂商说明从“湿”、氯霉素抗性和新霉素敏感性枯草芽孢杆菌168Δ4转化体中分离基因组DNA。使用下列基于hasA、tuaD和gtaB基因序列的合成寡核苷酸对这些转化体实施PCR扩增,以证实在枯草芽孢杆菌转化体操纵子存在这些基因及其完整性。
扩增反应(25μl)含有如下成分:50ng枯草芽孢杆菌168Δ4转化体的基因组DNA,每个引物各0.5μM,dATP、dCTP,dGTP和dTTP各200μM,1×PCR缓冲液II,3mM MgCl2的和0.625单位AmpliTaq GoldTM DNA聚合酶。在RoboCycler 40 thermacycler中实施反应,反应条件:95℃9分钟1个循环;95℃ 1分钟,50℃ 1分钟,72℃1.5分钟5个循环;95℃1分钟,54℃1分钟,72℃2分钟30个循环;最后一个循环72℃7分钟。
引物3和8用于证实存在hasA基因,引物3和16用于证实存在tuaD基因,引物3和22用于证实存在gtaB基因。将枯草芽孢杆菌168Δ4hasA/tuaD/gtaB整合体命名为枯草芽孢杆菌RB158。
采用QIAGEN tip-20柱按厂商说明从枯草芽孢杆菌RB158中分离基因组DNA,并用于转化感受态枯草芽孢杆菌A164Δ5(缺失spollAC,aprE,nprE,amyE和srfC基因;参见美国专利No.5,891,701)。在添加了5μg氯霉素/ml的TBAB平板上于37℃下筛选转化体。以其“湿”表型鉴定枯草芽孢杆菌A164Δ5 hasA/tuaD/gtaB整合体并将其命名为枯草芽孢杆菌RB161。
实施例6:构建枯草芽孢杆菌RB163
质粒pDG268MCSΔneo/scBAN/Sav(美国专利No.5,955,310)用SacI酶切消化。用QIAquick DNA提取试剂盒按厂商说明纯化酶切消化过的质粒,最后用NotI酶切消化。用QIAquick DNA提取试剂盒按厂商说明(QIAGEN,Valencia,CA)从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化约6800bp的最大的质粒片段。然后将回收的载体DNA与下述DNA插入片段连接。
质粒pHA7(实施例4,图13)用SacI酶切消化。按上述方法纯化酶切消化过的质粒,最后用NotI酶切消化。按上述方法凝胶纯化约4,300bp的最小的质粒片段。采用Rapid DNA克隆试剂盒按厂商说明将回收的载体与DNA插入片段连接。在转化至枯草芽孢杆菌前,采用ScaI将上述连接体线性化以确保染色体中为双交换整合而不是但交换整合。将用限制性酶ScaI酶切消化的连接产物转化枯草芽孢杆菌168Δ4感受态细胞。
在添加了5μg氯霉素/ml的TBAB平板上于37℃下筛选枯草芽孢杆菌氯霉素-抗性转化体。为筛选经由在amyE基因座处双交换的质粒的整合,将枯草芽孢杆菌原始转化体铺于添加了6μg新霉素/ml的TBAB琼脂板和在添加了5μg氯霉素/ml的TBAB琼脂板上以分离氯霉素抗性和新霉素敏感性“湿”转化体(由于透明质酸的生成)。
采用QIAGEN tip-20柱(QIAGEN,Valencia,CA)按厂商说明从“湿”、氯霉素抗性和新霉素敏感性枯草芽孢杆菌168Δ4转化体中分离基因组DNA。使用引物3、8、16、22和引物30(实施例1)对这些转化体实施PCR扩增,以证实在枯草芽孢杆菌转化体操纵子存在这些基因及其完整性。扩增反应(25μl)含有如下成分:50ng枯草芽孢杆菌168Δ4转化体的基因组DNA,每个引物各0.5μM,dATP、dCTP,dGTP和dTTP各200μM,1×PCR缓冲液II,3mM MgCl2的和0.625单位AmpliTaq GoldTM DNA聚合酶。在RoboCycler 40 thermacycler中实施反应,反应条件:95℃9分钟1个循环;95℃1分钟,55℃1分钟,72℃2分钟30个循环;最后一个循环72℃7分钟。
引物3和8用于证实存在hasA基因,引物3和16用于证实存在tuaD基因,引物3和22用于证实存在gtaB基因,引物3和30用于证实存在gcaD基因。将枯草芽孢杆菌168Δ4 hasA/tuaD/gcaB整合体命名为枯草芽孢杆菌RB160。
采用QIAGEN tip-20柱按厂商说明从枯草芽孢杆菌RB160中分离基因组DNA,并用于转化感受态枯草芽孢杆菌A164Δ5。在添加了5μg氯霉素/ml的TBAB平板上并于37℃下培养16小时筛选转化体。以其“湿”表型鉴定枯草芽孢杆菌A164Δ5 hasA/tuaD/gcaD整合体并将其命名为枯草芽孢杆菌RB163。
实施例7:构建枯草芽孢杆菌TH-1
采用下述步骤从似马链球菌中获得透明质酸合酶(has)操纵子。所述has操纵子含有hasA、hasB、hasC和hasD基因。用HindIII酶切消化约20μg的似马链球菌D181(Kumari和Weigel,1997,Joumal of BiologicalChemistry 272:32539-32546)的染色体DNA和在0.8%琼脂糖-0.5×TBE凝胶分辨。从胶上切下3-6kb范围内的DNA并用QIAquick DNA凝胶提取试剂盒按厂商说明进行纯化。然后将回收的DNA插入片段与下述载体DNA连接。
用HindIII酶切消化质粒pUC18(2μg)并用虾碱性磷酸酶按厂商说明(Roche Applied Science;Indianapolis,IN)将5′突出末端(protruding end)去磷酸化。采用Rapid DNA克隆试剂盒按厂商说明连接去磷酸的载体和DNA插入片段。将连接体用于转化大肠杆菌XL10 GOLD Kan感受态细胞(Stratagene,INC.,La Jolla,CA)。将细胞铺于Luria肉汤平板(100μg/ml氨苄青霉素)上并于37℃下培养过夜。用寡核苷酸952-55-1探测含有大约500克隆/板的5块平板,所述寡核苷酸如下述,其是与接近似马链球菌D181hasA基因3’末端的编码链相同的54bp序列(关于ATG翻译起始密码子的A残基的1098-1151位核苷酸)。
引物31:
5′-GTGTCGGAACATTCATTACATGCTTAAGCACCCGCTGTCCTTCTTGTTATCTCC-3′(SEQ ID NO:39)
用DIG寡核苷酸3′-端标记试剂盒按厂商说明(Roche Applied Science;Indianapolis,IN)对所述寡核苷酸探针实施DIG-标记。按“THE DIG SYSTEMUSER′S GUIDE FOR FILTER HYBRIDIZATION”(Boehringer MannheimGmbH)中所述实施克隆杂交和化学发光检测。
鉴定出与探针杂交的7个克隆。采用QIAGEN自动仪器(QIAGEN,Valencia,CA)并按厂商说明纯化来自这些转化体中一个的质粒DNA并用HindIII酶切消化,然后在使用0.5×TBE缓冲液的0.8%琼脂糖凝胶上分析。DNA插入片段显示出约5kb的大小。将这一质粒命名为pMRT106(图14)。
使用EZ∷TNTM<TET-1>插入试剂盒按厂商说明(Epicenter Technologies,Madison,WI)确定克隆片段的DNA序列。测序显示了克隆的插入片段包含似马链球菌hasA基因的后1156bp,其后是称为hasB、hasC和hasD的三个其它基因;推测全部四个基因包含在单操纵子中并因此共转录。似马链球菌hasB基因包含在所述片段的1411-2613位核苷酸(SEQ ID No:40[DNA序列]和41[推导的氨基酸序列])中,似马链球菌hasC基因包含在所述片段的2666-3565位核苷酸中(SEQ ID No:42[DNA序列]和43[推导的氨基酸序列]),以及似马链球菌hasD基因包含在所述片段的3735-5114位核苷酸(SEQ ID No:44[DNA序列]和45[推导的氨基酸序列])中。
由似马链球菌hasB和hasC基因编码的多肽显示其与那些分别由来自酿脓链球菌has操纵子序列(Ferretti等,2001,Proc.Natl.Acad.Sci.美国A。98(8),4658-4663)的hasB和hasC基因编码的多肽有同一性。使用Clustal法(Higgins,1989,CABIOS 5:151-153)使用Vector NTI AlignX软件包(Informax INC.,Bethesda,MD)以及如下配对比对缺省参数:pairwisealignment,缺口罚分10,缺口长度罚分0.1,和分数矩阵:blosum62mt2来确定同一性程度。
氨基酸序列比较显示出似马链球菌HAsB蛋白与来自乳房链球菌的HasB蛋白(SEQ ID NO:105)有70%的同一性;似马链球菌HasC蛋白与来自乳房链球菌的HasC蛋白(SEQ ID NO:99)有91%的同一性;和似马链球菌HasD蛋白与酿脓链球菌(登记号#Q8P286)的GlmU蛋白(推定的UDP-N-乙酰葡糖胺焦磷酸化酶)有73%的同一性。似马链球菌hasD基因编码的多肽显示出与由枯草芽孢杆菌的gcaD基因所编码的UDP-N-乙酰葡糖胺焦磷酸化酶有50.7%的同一性。
质粒pHA5(实施例3,图11)用HpaI和BamHI酶切消化。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上分析酶切消化并用QIAquick DNA提取试剂盒按厂商说明凝胶纯化较大的载体片段(约11,000bp)。质粒pMRT106用HindIII酶切消化,用Klenow片段填补粘性末端,用BamHI酶切消化DNA。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上分析酶切消化并用QIAquickDNA提取试剂盒按厂商说明凝胶纯化较小的插入片段(约1000bp,似马链球菌hasD基因的后2/3)。
用T4 DNA连接酶按厂商说明将两个纯化的片段连接在一起,并将连接混合物转化至大肠杆菌SURE感受态细胞中。于37℃在加入100μg氨卡青霉素/ml的2XYT琼脂板上筛选转化体。
采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并通过BamHI+NotI酶切消化在使用0.5×TBE缓冲液的0.8%琼脂糖凝胶上进行分析。存在约1,100bp的BamHI/NotI hasD片段即可鉴定为正确的质粒并将其命名为pHA8(图15)。用HindIII酶切消化这一质粒并用T4 DNA连接酶将其连接,将连接混合物转化至大肠杆菌SURE感受态细胞中。于37℃在加入100μg氨卡青霉素/ml的2XYT琼脂板上筛选转化体。采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并通过HindIII酶切消化在使用0.5×TBE缓冲液的0.8%琼脂糖凝胶上分析。存在约9,700bp的单条带即可鉴定为正确的质粒并将其命名为pHA9(图16)。
质粒pHA9用SacI和NotI酶切消化。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上分析酶切消化并用QIAquick DNA提取试剂盒按厂商说明凝胶纯化约2,500bp的较小片段。质粒pDG268MCSΔNEO/scBAN/Sav(美国专利No.5,955,310)用SacI和NotI酶切消化。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上分析酶切消化并用QIAquick DNA提取试剂盒按厂商说明凝胶纯化约6,800bp的较大载体片段。用T4 DNA连接酶按厂商说明将两个纯化的片段连接在一起,并将连接混合物转化至大肠杆菌SURE感受态细胞(Stratagene,INC.,La Jolla,CA)中。在加入100μg氨卡青霉素/ml的2XYT琼脂板上筛选转化体。
采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并通过SalI加HindIII酶切消化在使用0.5×TBE缓冲液的0.8%琼脂糖凝胶上分析。存在约1600bp的SalI/HindIII片段即可鉴定为正确的质粒并将其命名为pHA10(图17)。
质粒pHA10用HindIII和BamHI酶切消化。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上分析酶切消化并用QIAquick DNA提取试剂盒按厂商说明凝胶纯化较大的载体片段(约8100bp)。质粒pMRT106用HindIII和BamHI酶切消化。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上分析酶切消化并用QIAquick DNA提取试剂盒按厂商说明凝胶纯化约4,100bp的较大插入片段。用T4 DNA连接酶按厂商说明将两个纯化的片段连接在一起,并将连接混合物用于转化枯草芽孢杆菌168Δ4。于37℃在加入5μg氯霉素/ml的TBAB琼脂板上筛选转化体。将约100个转化体点在添加了氯霉素(5μg/ml)的TBAB和添加了新霉素(10μg/ml)的TBAB上以计数氯霉素抗性、新霉素敏感性克隆;该表型可用于指示双交换至amyE基因座中。鉴定少量所述克隆,所述克隆均表现出“湿”表型,该表型指示透明质酸的生成。选择一个并将其命名为枯草芽孢杆菌168Δ4∷scBAN/se hasA/hasB/hasC/hasD。
采用QIAGEN tip-20柱按厂商说明从枯草芽孢杆菌168Δ4∷scBAN/sehasA/hasB/hasC/hasD中分离基因组DNA,并用于转化感受态枯草芽孢杆菌A164Δ5。在添加了5μg氯霉素/ml的TBAB平板上并于37℃下培养16小时筛选转化体。以其“湿”表型鉴定枯草芽孢杆菌A164Δ5hasA/hasB/hasC/hasD整合体并将其命名为枯草芽孢杆菌TH-1。
实施例8:构建枯草芽孢杆菌RB184
来自似马链球菌(实施例1)的hasA基因和tuaD基因(枯草芽孢杆菌hasB的同系物)(实施例1)在短“共有序列”amyQ(scBAN)启动子(美国专利No.5,955,310)控制下进行克隆。
质粒pDG268MCSΔneo/scBAN/Sav(美国专利No.5,955,310)用SacI酶切消化。用QIAquick DNA提取试剂盒按厂商说明纯化酶切消化过的质粒,最后用NotI酶切消化。用QIAquick DNA提取试剂盒按厂商说明(QIAGEN,Valencia,CA)从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化约6,800bp的最大的质粒片段。然后将回收的载体DNA与下述DNA插入片段连接。
质粒pHA5(实施例3,图11)用HpaI酶切消化。然后按上述方法纯化酶切消化过的质粒,最后用XbaI酶切消化。按上述方法凝胶纯化约4,300bp的最小的质粒片段。然后通过首先在85℃下,30分钟灭活XbaI将双-酶切消化过的质粒平端化。通过加入10mM dNTP各0.5μl,1μl 1U/μl的T4 DNA聚合酶(Roche Applied Science;Indianapolis,IN)并在11℃下孵育30分钟实施平端化。最后通过在75℃下孵育反应10分钟灭活聚合酶。然后按上述方法凝胶纯化约11,000bp的最大质粒片段并采用Rapid DNA克隆试剂盒按厂商说明再连接。将连接混合物转化至大肠杆菌SURE感受态细胞。于37℃在加入100μg氨卡青霉素/ml的2XYT琼脂板上筛选转化体。采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并通过ScaI酶切消化在使用0.5×TBE缓冲液的0.8%琼脂糖凝胶上分析。存在约11kb片段带即可鉴定为正确的质粒并将其命名为pRB157(图18)。
质粒pRB157用SacI酶切消化。用QIAquick DNA提取试剂盒按厂商说明纯化酶切消化过的质粒,最后用NotI酶切消化。用QIAquick DNA提取试剂盒按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化约2,632bp的最小的质粒片段。然后将回收的DNA插入片段与上述载体DNA连接。
在转化至枯草芽孢杆菌前,采用ScaI将上述连接体线性化以确保染色体中为双交换整合而不是但交换整合。将用限制性酶ScaI酶切消化的连接产物转化枯草芽孢杆菌168Δ4感受态细胞。
在添加了5μg氯霉素/ml的TBAB平板上筛选枯草芽孢杆菌氯霉素-抗性转化体。为筛选经由在amyE基因座处双交换的质粒的整合,将枯草芽孢杆菌原始转化体铺于添加了6μg新霉素/ml的TBAB琼脂板和在添加了5μg氯霉素/ml的TBAB琼脂板上以分离氯霉素抗性和新霉素敏感性“湿”转化体(由于透明质酸的生成)。
采用QIAGEN tip-20柱按厂商说明从“湿”、氯霉素抗性和新霉素敏感性枯草芽孢杆菌168Δ4转化体中分离基因组DNA。采用引物3、8和16(实施例1)针对这些转化体实施PCR扩增以证实hasA和tuaD存在枯草芽孢杆菌转化体操纵子中以及所述hasA和tuaD的完整性。扩增反应(25ul)含有如下成分:50ng枯草芽孢杆菌168Δ4转化体的基因组DNA,每个引物各0.5μM,dATP、dCTP,dGTP和dTTP各200μM,1×PCR缓冲液II,3mM MgCl2的和0.625单位AmpliTaq GoldTM DNA聚合酶。在RoboCycler 40thermacycler中实施反应,反应条件:95℃9分钟1个循环;95℃1分钟,55℃1分钟,72℃2分钟30个循环;最后一个循环72℃7分钟。
引物3和8用于证实存在hasA基因而引物3和16用于证实存在tuaD基因。将枯草芽孢杆菌168Δ4hasA/tuaD整合体命名为枯草芽孢杆菌RB183。
枯草芽孢杆菌RB183的基因组DNA也用于转化感受态枯草芽孢杆菌A164Δ5。在添加了5μg氯霉素/ml的TBAB平板上并于37℃下培养16小时筛选转化体。以其“湿”表型鉴定枯草芽孢杆菌A164Δ5 hasA/tuaD整合体并将其命名为枯草芽孢杆菌RB184。
实施例9:构建枯草芽孢杆菌RB187
将枯草芽孢杆菌RB161制备为感受态然后用cat缺失的质粒pRB115(Widner等,2000,Journal of Industrial Microbiology&Biotechnology 25:204-212)转化。在非许可温度45℃下,采用红霉素(5μg/ml)筛选法实施对直接整合入染色体的筛选。在该温度下,复制的起点是无活性的。只有将质粒整合入细菌染色体上的cat基因,细胞才能保持红霉素抗性。将这些所谓的“整合体(integrant)”保持在45℃以确保在该温度下的生长和筛选。为了允许质粒的缺失或“looping out”(其将导致染色体多数cat基因的缺失),将整合体在Luria-Bertani(LB)培养基中于34℃的许可温度下不经筛选培养很多代。在该温度下,复制的PE194起点是活性的并启动质粒从基因组中的切除(Molecular Biological Methods for Bacillus,edited by C.R.Harwoodand S.M.Cutting,1990,John WILEY and Sons Ltd。)。
然后将细胞铺于非选择性LB琼脂板上并按下列标准鉴定包含cat基因中的缺失和基于PE194的复制子缺失的克隆:(1)氯霉素敏感性显示存在cat缺失;(2)红霉素敏感性显示不存在由载体PRB115编码的红霉素抗性基因;和(3)PCR证实在所研究菌株中存在cat的缺失。使用引物32和33实施PCR以证实cat基因在amyE基因座的缺失:
引物32:5′-GCGGCCGCGGTACCTGTGTTACACCTGTT-3′(SEQ ID NO:46)
引物33:
5’-GTCAAGCTTAATTCTCATGTTTGACAGCTTATCATCGG-3’(SEQ ID NO:47)
采用  REDextract-N-AmpTM Plant PCR试剂盒(Sigma ChemicalCompany,St.Louis,MO)按如下步骤从潜在缺失株中分离染色体DNA:将单芽孢杆菌克隆接种于100μl提取溶液(Sigma Chemical Company,St.Louis,MO)中,于95℃培养10分钟,然后用等体积稀释溶液(Sigma ChemicalCompany,St.Louis,MO)稀释。采用4μl提取的DNA联合REDextract-N-AmpPCR反应混合物及所需引物按厂商说明,按照实施例5中所述PCR循环条件实施PCR。使用0.8%琼脂糖-0.5×TBE凝胶显影PCR反应产物。将鉴定的菌株命名为枯草芽孢杆菌RB187。
实施例10:构建枯草芽孢杆菌RB192
通过缺失氯霉素抗性基因(cat基因)使枯草芽孢杆菌RB184未被标记。可采用实施例9中所述方法实施。将得到的菌株命名为枯草芽孢杆菌RB192。
实施例11:构建枯草芽孢杆菌RB194
通过缺失枯草芽孢杆菌RB187染色体的cypX区(实施例9)构建枯草芽孢杆菌RB194。所述cypX区包括cypX基因(其编码类细胞色素P450的与发酵期间红色素合成相关的酶)。为了缺失染色体的该区域,构建质粒pMRT086。
采用引物34和35通过PCR从枯草芽孢杆菌BRG-1中扩增出作为单片段的含有cypX-yvmC和yvmB-yvmA操纵子的染色体区。枯草芽孢杆菌BRG1基本上是枯草芽孢杆菌淀粉酶生成株的化学诱变分离株,所述枯草芽孢杆菌淀粉酶生成株基于实施例5中所述的枯草芽孢杆菌A164Δ5遗传背景。该区的序列与枯草芽孢杆菌168型菌株的已经公开的序列相同。
引物34:
5′-CATGGGAGAGACCTTTGG-3′(SEQ ID NO:48)
引物35:
5′-GTCGGTCTTCCATTTGC-3′(SEQ ID NO:49)
扩增反应(50μl)含有如下成分:200ng枯草芽孢杆菌BRG-1染色体DNA,引物34和35各0.4μM,dATP、dCTP,dGTP和dTTP各200μM,含有1.5mM MgCl2的Expand High Fidelity缓冲液(Roche Applied Science;INDIANAPOLIS,IN)和2.6单位Expand High Fidelity PCR System enzymemix(Roche Applied Science;Indianapolis,IN)。采用QIAGEN tip-20柱按厂商说明获得枯草芽孢杆菌BRG-1染色体DNA。在RoboCycler 40thermacycler(Stratagene,Inc,La Jolla,CA)中实施扩增反应,反应条件:95℃3分钟1个循环;95℃1分钟,58℃1分钟,68℃4分钟10个循环;95℃1分钟,58℃1分钟,68℃4分钟+20秒20个循环,然后72℃7分钟1个循环。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶电泳上分析反应产物。
采用TA-TOPO克隆试剂盒将含有cypX-yvmC和yvmB-yvmA操纵子的所得片段克隆至pCR2.1并按厂商说明(Invitrogen,INC.,Carlsbad,CA)将其转化至大肠杆菌ONESHOTTM细胞。在添加了100μg氨卡青霉素/ml的2X YT琼脂板上筛选转化体。用QIAGEN tip-20柱按厂商说明从若干转化体中分离质粒DNA并使用M13(-20)正向和M13反向引物和引物36-51实施DNA测序进行鉴定。
将得到的质粒命名为pMRT084(图19)。
引物36:5′-CGACCACTGTATCTTGG-3′(SEQ ID NO:50)
引物37:5’-GAGATGCCAAACAGTGC-3’(SEQ ID NO:51)
引物38:5′-CATGTCCATCGTGACG-3′(SEQ ID NO:52)
引物39:5′-CAGGAGCATTTGATACG-3′(SEQ ID NO:53)
引物40:5′-CCTTCAGATGTGATCC-3′(SEQ ID NO:54)
引物41:5’-GTGTTGACGTCAACTGC-3’(SEQ ID NO:55)
引物42:5′-GTTCAGCCTTTCCTCTCG-3′(SEQ ID NO:56)
引物43:5′-GCTACCTTCTTTCTTAGG-3′(SEQ ID NO:57)
引物44:5’-CGTCAATATGATCTGTGC-3’(SEQ ID NO:58)
引物45:5′-GGAAAGAAGGTCTGTGC-3′(SEQ ID NO:59)
引物46:5′-CAGCTATCAGCTGACAG-3′(SEQ ID NO:60)
引物47:5′-GCTCAGCTATGACATATTCC-3′(SEQ ID NO:61)
引物48:5′-GATCGTCTTGATTACCG-3′(SEQ ID NO:62)
引物49:5′-AGCTTTATCGGTGACG-3′(SEQ ID NO:63)
引物50:5′-TGAGCACGATTGCAGG-3′(SEQ ID NO:64)
引物51:5′-CATTGCGGAGACATTGC-3′(SEQ ID NO:65)
用BsgI酶切消化质粒pMRT084以缺失大部分cypX-yvmC和yvmB-yvmA操纵子,在每端留下约500碱基。用T4 DNA聚合酶处理酶切消化的BsgIDNA。用SmaI酶切消化质粒pECC1(YOUNGMAN等,1984,质粒12:1-9)。采用QIAquick DNA纯化试剂盒按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化来自pMRT084的约5,100载体片段和来自pECC1的约1,600bp片段,将其连接在一起,并按厂商说明用于转化大肠杆菌XL1Blue细胞(Stratagene,INC.,La Jolla,CA)。在添加了100μg氨卡青霉素/ml的2XYT平板上筛选氨卡青霉素-抗性转化体。通过用引物52和53的PCR扩增DNA测序鉴定携带含有缺失的大多数cypX-yvmC和yvmB-yvmA操纵子的正确质粒的转化体。在含有如下成分:1ng质粒DNA,每个引物各0.4μM,dATP、dCTP,dGTP和dTTP各200μM,含有1.5mM MgCl2的1×PCR缓冲液II,2.5单位AmpliTaq GoldTM DNA聚合酶的50μl的反应中实施PCR扩增。在RoboCycler 40 thermacycler(Stratagene,Inc,La Jolla,CA)中实施扩增反应,反应条件:95℃10分钟1个循环;95℃1分钟,55℃1分钟,72℃1分钟25个循环,72℃7分钟1个循环。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上显影PCR产物。将这一构建体命名为pMRT086(图20)。
引物52:
5’-TAGACAATTGGAAGAGAAAAGAGATA-3’(SEQ ID NO:66)
引物53:
5’-CCGTCGCTATTGTAACCAGT-3’(SEQ ID NO:67)
用ScaI线性化质粒pMRT086并在存在0.2μg氯霉素/ml的情况下将其转化至枯草芽孢杆菌RB128感受态细胞。
在添加了5μg氯霉素/ml的TBAB平板上并于37℃下培养16小时后筛选转化体。转化体使用QIAGEN tip-20柱按厂商说明从若干转化体中制备染色体DNA。通过采用引物36和52、36和53、37和52以及37和53实施针对cypX-yvmC和yvmB-yvmA操纵子缺失的PCR来筛选氯霉素抗性克隆。在含有如下成分:50ng质粒DNA,每个引物各0.4μM,dATP、dCTP,dGTP和dTTP各200μM,含有2.5mM MgCl2的1×PCR缓冲液II,2.5单位AmpliTaq GoldTM DNA聚合酶的50μl的反应中实施PCR扩增。在RoboCycler 40 thermacycler中实施扩增反应,反应条件:95℃10分钟1个循环;95℃1分钟,55℃1分钟,72℃1分钟25个循环,72℃7分钟1个循环。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上显影PCR产物。将得到枯草芽孢杆菌RB128 cypX-yvmC和yvmB-yvmA缺失株命名为枯草芽孢杆菌MaTa17。
用来自枯草芽孢杆菌MaTa17基因组DNA转化枯草芽孢杆菌RB187(实施例9)的感受态细胞。采用QIAGENtip-20柱按厂商说明从该株中获得基因组DNA。
在添加了5μg氯霉素/ml的TBAB平板上并于37℃下筛选枯草芽孢杆菌氯霉素抗性转化体。含有5μg氯霉素/ml的TBAB平板上在37℃下对原始转化体实施单克隆分离。将得到的cypX-yvmC和yvmB-yvmA缺失株命名为枯草芽孢杆菌RB194。
实施例12:构建枯草芽孢杆菌RB197
枯草芽孢杆菌RB197与枯草芽孢杆菌RB194非常相似,唯一的区别在于RB197包含cypX区中较小的缺失:在该株中仅缺失部分cypX基因以生成cypX缺失表型。为实现该目的,按下述方法构建质粒pMRT122。
通过用EcoRI/HindIII酶切消化质粒pSJ2739(WO 96/23073)构建质粒pCJ791(图21)并连接至含有来自枯草芽孢杆菌的缺失形式的WPRA基因(细胞壁丝氨酸蛋白酶)的片段。采用下述引物54和55从获自枯草芽孢杆菌DN1885(Diderichsen等,1990,Journal ofBacteriology 172:4315-4321)的染色体DNA中扩增WPRA的5′区,并采用下述引物56和57扩增WPRA的3′区。在含有如下成分:1ng枯草芽孢杆菌DN1885染色体DNA,引物39和40各0.4μM,dATP、dCTP,dGTP和dTTP各200μM,含有2.5mM MgCl2的1×PCR缓冲液II,2.5单位AmpliTaq GoldTM DNA聚合酶的50μl的反应中实施PCR扩增。在RoboCycler 40 thermacycler中实施扩增反应,反应条件:95℃10分钟1个循环;95℃1分钟,55℃1分钟,72℃1分钟25个循环,72℃7分钟1个循环。
用BglII酶切消化随后连接的方法将5’和3’WPRA PCR片段连接,和采用引物54和57对连接混合物片段实施PCR扩增。在含有如下成分:1ng连接的片段,每个引物各0.4μM,dATP、dCTP,dGTP和dTTP各200μM,含有2.5mM MgCl2的1×PCR缓冲液II,2.5单位AmpliTaq GoldTM DNA聚合酶的50μl的反应中实施PCR扩增。在RoboCycler 40 thermacycler中实施扩增反应,反应条件:95℃10分钟1个循环;95℃1分钟,55℃1分钟,72℃1分钟25个循环,72℃7分钟1个循环。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上显影PCR产物。将得到的PCR片段作为EcoRI/HindIII片段克隆至pSJ2739中,结果得到质粒pCJ791(图21)。在添加了1μg红霉素/ml和25μg卡那霉素/ml的TBAB-琼脂糖平板上并于28℃下培养24-48小时后筛选转化体。用QIAGEN tip-20柱按厂商说明从若干转化体中分离质粒DNA并使用引物54至57按上述条件实施PCR扩增进行鉴定。
引物54:
5’-GGAATTCCAAAGCTGCAGCGGCCGGCGCG-3’(SEQ ID NO:68)
引物55:
5’-GAAGATCTC GTATACTTGGCTTCTGCAGCTGC-3’(SEQ ID NO:69)
引物56:
5’-GAAGATCTGGTCAACAAGCTGGAAAGCACTC-3’(SEQ ID NO:70)
引物57:
5’-CCCAAGCTTCGTGACGTACAGCACCGTTCCGGC-3’(SEQ ID NO:71)
采用下述引物对58/59和60/61通过SOE将来自质粒pDN1981(美国专利No.5,698,415)的amyL上游序列和5′编码区融合在一起。按下述方法将所得片段克隆至载体pCR2.1以生成质粒pMRT032。在含有如下成分:1ng的pDN1981DNA,适宜的引物各0.4μM,dATP、dCTP,dGTP和dTTP各200μM,含有2.5mM MgCl2的1×PCR缓冲液II,2.5单位AmpliTaq GoldTMDNA聚合酶的50μl的反应中实施PCR扩增。在RoboCycler 40 thermacycler中实施扩增反应,反应条件:95℃9分钟1个循环;95℃1分钟,52℃1分钟,72℃1分钟3个循环;  95℃1分钟,55℃1分钟,72℃ 1分钟27个循环,72℃5分钟1个循环。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上显影PCR产物。所要片段分别为约530和466bp。采用引物对59/60生成最终的SOE片段并采用TA-TOPO克隆试剂盒将其克隆至pCR2.1载体。在添加了100μg/ml氨卡青霉素的2XYT-琼脂糖平板上并于37℃下培养16小时后筛选转化体。用QIAGEN tip-20柱按厂商说明从若干转化体中分离质粒DNA并使用M13(-20)正向和M13反向引物实施DNA测序进行鉴定。将含有amyL上游序列/5′编码序列融合片段的质粒命名为pMRT032(图22)。
引物58:
5′-CCTTAAGGGCCGAATATTTATACGGAGCTCCCTGAAACAACAAAAACGGC-3′(SEQ ID NO:72)
引物59:
5′-GGTGTTCTCTAGAGCGGCCGCGGTTGCGGTCAGC-3′(SEQ ID NO:73)
引物60:
5’-GTCCTTCTTGGTACCTGGAAGCAGAGC-3’(SEQ ID NO:74)
引物61:
5’-GTATAAATATTCGGCCCTTAAGGCCAGTACCATTTTCCC-3’(SEQID NO:75)
用NsiI和NotI酶切消化质粒pNNB194(pSK+/pE194;美国专利No.5,958,728),并用Pstl和NotI酶切消化质粒pBEST501(ITAYA等1989Nucleic Acids Research 17:4410)。采用QIAquick DNA纯化试剂盒按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化来自pNNB194的5,193bp载体片段和来自pBEST501的含有neo基因的1,306bp片段。将分离的片段连接在一起并按厂商说明用于转化大肠杆菌SURE感受态细胞。在添加了100μg氨卡青霉素/ml的2X YT平板上筛选氨卡青霉素-抗性转化体。采用QIAGEN质粒试剂盒(QIAGEN INC.,Valencia,CA)从一个所述转化株中分离质粒DNA,并用NsiI和NotI酶切消化以鉴定所述质粒。将这一质粒命名为PNNB194neo(图23)。
用SacI/NotI酶切消化质粒pNNB194neo并采用标准步骤用T4 DNA聚合酶和dNTP处理以生成平端。用Ec1136II酶切消化质粒pPL2419(美国专利No.5,958,728)。采用QIAquick DNA纯化试剂盒按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化来自pNNB194neo的6,478bp载体片段和来自pPL2419的含有oriT的562bp片段。将纯化的片段连接在一起并按厂商说明用于转化大肠杆菌SURE细胞。在添加了100μg氨卡青霉素/ml的2XYT平板上于37℃下筛选氨卡青霉素-抗性转化体。采用QIAGEN质粒试剂盒从一个所述转化株中分离质粒DNA,并用NsiI、SacI和Bscl酶切消化以鉴定所述质粒。将这一质粒命名为pNNB194neo-oriT(图24)。
用BamHI酶切消化质粒pNNB194neo-oriT并采用标准步骤用T4 DNA聚合酶和dNTP处理以生成平端。用QIAquick DNA纯化试剂盒按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化酶切消化过的质粒。用T4 DNA连接酶处理纯化的质粒并按厂商说明用于转化大肠杆菌SURE细胞。在添加了100μg氨卡青霉素/ml的2XYT平板上于37℃下筛选氨卡青霉素-抗性转化体。采用QIAGEN质粒试剂盒从一个所述转化株中分离质粒DNA,并用BamHI和ScaI酶切消化以证实BamHI位点的断裂。将得到的质粒命名为pShV3(图25)。
用Sfil和NotI酶切消化质粒pShV2.1-amyEΔ(美国专利No.5,958.728),采用QIAquick DNA纯化试剂盒按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化8696 bp载体片段。为了pShV2.1-amyEΔ的Sfil和NotI位点间插入BamHI位点,按下述步骤构建合成联接子:通过将其各50uM混合,煮沸该混合物并缓慢冷却所述混合物,退火引物62和63。
引物62:5’-GGGCCGGATCCGC-3’(SEQ ID NO:76)
引物63:3’-ATTCCCGGCCTAGGCGCCGG-5’(SEQ ID NO:77)
将纯化的pShV2.1-amyEΔ载体和退火的寡核苷酸连接在一起并按厂商说明用于转化大肠杆菌SURE感受态细胞。在添加了30μg氯霉素/ml的LB平板上于37℃下筛选氯霉素-抗性转化体。采用QIAGEN质粒试剂盒从一个所述转化株中分离质粒DNA,并用BamHI酶切消化以证实BamHI位点的插入。将这一质粒命名为pShV2.1-amyEΔB(图26)。
用SalI/HindIII酶切消化质粒pShV3和pShV2.1-amyEΔB。采用QIAquickDNA纯化试剂盒按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化来自pShV3的7033 bp载体片段和来自pShV2.1-amyEΔ的含有amyEΔ的1031bp片段。将凝胶纯化的片段连接在一起并按厂商说明用于转化大肠杆菌SURE细胞。在添加了100μg氨卡青霉素/ml的2XYT平板上于37℃下筛选氨卡青霉素-抗性转化体。采用QIAGEN质粒试剂盒从一个所述转化株中分离质粒DNA,并用SalI和HindIII酶切消化以鉴定所述质粒。将这一质粒命名为pShV3A(图27)。
用KpnI/XbaI酶切消化质粒pMRT032,在存在dNTP的情况下用Klenow片段DNA聚合酶填补,并采用QIAquick DNA纯化试剂盒按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中分离约1000bp的片段。将该片段克隆至用EcoRV酶切消化的质粒pShV3a,并按厂商说明转化至大肠杆菌XL1Blue细胞。在添加了100μg氨卡青霉素/ml的2XYT平板上并于37℃下培养16小时后筛选氨卡青霉素-抗性转化体。采用QIAGEN tip-20柱按厂商说明从若干转化体中分离质粒DNA并通过用SacI/SphI的限制性分析在0.8%琼脂糖-0.5×TBE凝胶上对其进行鉴定。将得到的质粒命名为pMRT036(图28)。
用EcoRI/HindIII酶切消化质粒pMRT036,在存在dNTP的情况下用Klenow片段DNA聚合酶填补,连接并转化至大肠杆菌XL1Blue细胞按厂商说明。在添加了100μg氨卡青霉素/ml的2XYT平板上并于37℃下培养16小时后筛选转化体。采用QIAGEN tip-20柱按厂商说明从若干转化体中分离质粒DNA并通过用SacIIXBAI、PSTL和NdeI的限制性分析在0.8%琼脂糖-0.5×TBE凝胶上对其进行鉴定。将得到的质粒命名为pMRT037(图29)。
采用QIAquick DNA纯化试剂盒按厂商说明在2%琼脂糖-0.5×TBE凝胶上从质粒pDG268Δneo-cryIIIAstaB/Sav(美国专利No.5,955,310)中以Sfil/SacI片段将scBAN/cryIIIA稳定片段分离,将其与用Sfil/SacI酶切消化的质粒pMRT037连接,并转化至大肠杆菌XL1Blue细胞。在添加了100μg氨卡青霉素/ml的2XYT平板上并于37℃下培养16小时后筛选转化体。采用QIAGEN tip-20柱按厂商说明从若干转化体中分离质粒DNA并通过用PSTL的限制性分析在0.8%琼脂糖-0.5×TBE凝胶上对其进行鉴定。将得到的质粒命名为pMRT041(图30)。
用EcoRI/HindIII酶切消化质粒pMRT041和pCJ791。采用QIAquickDNA纯化试剂盒按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中分离来自pMRT041的约1300bp片段和来自pCJ791的约4500bp片段,连接,并转化至枯草芽孢杆菌168Δ4感受态细胞。在添加了1μg红霉素/ml和25μg林可霉素的TBAB-琼脂板上并于30℃下培养24-48小时后筛选转化体。采用QIAGEN tip-20柱按厂商说明从若干转化体中分离质粒DNA并通过用SacI和EcoRI/HindIII的限制性分析在0.8%琼脂糖-0.5×TBE凝胶上对其进行鉴定。将得到的质粒命名为pMRT064.1(图31)。
使用下述引物对64和65和引物对66和67引物并采用SOE缺失质粒pMRT064.1中2666位上的SacI位点。在含有如下成分:1ng的pMRT064.1DNA,每个引物各0.4μM,dATP、dCTP,dGTP和dTTP各200μM,含有2.5mM MgCl2的1×PCR缓冲液II,2.5单位AmpliTaq GoldTM DNA聚合酶的50μl的反应中实施PCR扩增。在RoboCycler 40 thermacycler中实施扩增反应,反应条件:95℃10分钟1个循环;95℃1分钟,52℃1分钟,72℃1分钟25个循环;72℃7分钟1个循环。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上显影PCR产物。所要片段分别为约400和800bp。采用引物64和67扩增用于克隆返回至pMRT064.1的最终片段。采用TA-TOPO克隆试剂盒将该片段克隆至pCR2.1载体。在添加了100μg氨卡青霉素/ml的2XYT琼脂板上并于37℃下培养16小时后筛选转化体。通过用M13正向和反向引物和引物65,67和68的DNA测序鉴定含有正确质粒转化体。将这一质粒命名为pMRT068(图32),并按厂商说明进一步转化至大肠杆菌DM1细胞(Stratagene,INC.,La Jolla,CA)。在添加了100μg氨卡青霉素/ml的2X YT琼脂板上筛选转化体。
引物64:5’-GGAAATTATCGTGATCAAC-3’(SEQ ID NO:78)
引物65:5′-GCACGAGCACTGATAAATATG-3′(SEQ ID NO:79)
引物66:5′-CATATTTATCAGTGCTCGTGC-3′(SEQ ID NO:80)
引物67:5′-TCGTAGACCTCATATGC-3′(SEQ ID NO:81)
引物68:5′-GTCGTTAAACCGTGTGC-3′(SEQ ID NO:82)
使用引物69和70并采用上述PCR条件实施PCR扩增来缺失质粒pMRT064.1中5463和6025位上的Sac位点。采用TA-TOPO克隆试剂盒(Invitrogen,INC.,Carlsbad,CA)将得到的片段克隆至pCR2.1载体。在添加了100μg氨卡青霉素/ml的2XYT琼脂板上并于37℃下培养16小时后筛选转化体。通过用M13正向和反向引物的DNA测序鉴定含有正确质粒转化体。将这一构建体命名为pMRT069(图33)。
引物69:
5′-CTAGAGGATCCCCGGGTACCGTGCTCTGCCTTTTAGTCC-3′(SEQ IDNO:83)
引物70:5’-GTACATCGAATTCGTGCTCATTATTAATCTGTTCAGC-3’(SEQ ID NO:84)
用BclI/AccI酶切消化质粒pMRT068和pMRT064.1。采用QIAquick DNA纯化试剂盒按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中分离来自pMRT068的约1300bp片段和来自pMRT064.1的约3800bp片段,连接,并转化至枯草芽孢杆菌168Δ4感受态细胞。在添加了1μg红霉素/ml和25μg林可霉素/ml的TBAB-琼脂板上并于30℃下培养24-48小时后筛选转化体。通过用SacI和EcoRI/AvaI的限制性分析在0.8%琼脂糖-0.5×TBE凝胶上鉴定含有正确质粒转化体。将所得构建体命名为pMRT071(图34)。
用AvaI/EcoRI酶切消化质粒pMRT071和pMRT069。采用QIAquickDNA纯化试剂盒按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中分离来自pMRT069的578bp片段和来自pMRT071的4510bp片段,连接,并转化至枯草芽孢杆菌168Δ4感受态细胞。在添加了1μg红霉素/ml和25μg林可霉素/ml的TBAB-琼脂板上并于30℃下培养24-48小时后筛选转化体。通过用SacI的限制性分析在0.8%琼脂糖-0.5×TBE凝胶上鉴定含有正确质粒转化体。将得到的构建体命名为pMRT074(图35)。
按厂商说明,用SacII/NdeI酶切消化实施例11中所述的质粒pMRT084,用T4 DNA聚合酶处理,连接并转化至大肠杆菌XL1Blue细胞。在添加了100μg氨苄青霉素/ml的2XYT琼脂板上并于37℃下培养16小时后筛选转化体。通过用Dral的限制性分析在0.8%琼脂糖-0.5×TBE凝胶上鉴定含有正确质粒转化体。将得到的质粒命名为pMRT120(图36)。
用HindIII酶切消化质粒pMRT074,用KLENOW片段DNA聚合酶处理并用EcoRI酶切消化。用EcoRI/ECL136II酶切消化质粒pMRT120。采用QIAquick DNA纯化试剂盒按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中分离来自pMRT120的约600bp片段和来自pMRT074的约4300bp片段,连接,并转化至枯草芽孢杆菌168Δ4感受态细胞。在添加了1μg红霉素/ml和25μg林可霉素/ml的TBAB-琼脂板上并于30℃下培养24-48小时后筛选转化体。通过用SSPL的限制性分析在0.8%琼脂糖-0.5×TBE凝胶上鉴定含有正确质粒转化体。将得到的构建体命名为pMRT122(图37)。
将质粒pMRT122转化至枯草芽孢杆菌A164Δ5感受态细胞。在添加了1μg红霉素/ml和25μg林可霉素/ml的TBAB-琼脂板上并于30℃下培养24-48小时后筛选转化体。采用同源重组至cypX基因座的方法将所述质粒导入枯草芽孢杆菌A164Δ5的染色体,所述同源重组通过在45℃下孵育枯草芽孢杆菌A164Δ5(pMRT086)细胞的新鲜划线平板16小时并选择正常生长的克隆实施。采用QIAGENtip-20柱按厂商说明从该菌株中分离基因组DNA并用于转化枯草芽孢杆菌RB187(实施例9)。在添加了1μg红霉素/ml和25μg林可霉素/ml的TBAB-琼脂板上并于45℃下培养16小时后筛选转化体。在该温度下,PE194复制子不能复制。只有在细菌染色体中保持所述质粒才能使细胞保持红霉素抗性。
借助结果得到染色体上cypX基因部分缺失的同源重组,通过将转化体在Luria-Bertani(LB)培养基在34℃的许可温度下不经筛选生长很多代从染色体中除去所述质粒。在该温度下,复制的PE194起点是有活性的并事实上启动从染色体中切除所述质粒(Molecular Biological Methods forBacillus,edited by C.R.Harwood and S.M.Cutting,1990,John WILEY andSons Ltd.)。
在生长传代若干代后,将所述细胞铺于非选择性LB琼脂糖平板并用下述方法鉴定已缺失了质粒及现在缺失了cypX的克隆和透明质酸的生成:(1)当铺于最小琼脂板上时,“湿”细胞斑显示透明质酸的生成(2)红霉素敏感性显示缺失基于pE194的质粒,和(3)通过使用上述引物34和45实施PCR确定在所需菌株中存在800bp cypX的缺失。
采用REDextract-N-AmpTM Plant PCR试剂盒(Sigma ChemicalCompany,St.Louis,MO)按如下步骤从潜在的cypX缺失株中分离染色体DNA:将单芽孢杆菌克隆接种于100μl提取溶液中,于95℃培养10分钟,然后用等体积稀释溶液稀释。采用4μl提取的DNA联合REDextract-N-AmpPCR反应混合物及所需引物按厂商说明,按照实施例5中所述PCR循环条件实施PCR从潜在cypX缺失体中分离染色体DNA。使用0.8%琼脂糖-0.5×TBE凝胶显影PCR反应产物。将鉴定的菌株命名为枯草芽孢杆菌RB197。
实施例13:构建枯草芽孢杆菌RB200
按照实施例9中所述用于枯草芽孢杆菌RB187的相同方法缺失枯草芽孢杆菌RB192的cypX基因。将得到的菌株命名为枯草芽孢杆菌RB200.
实施例14:构建枯草芽孢杆菌RB202
按下述方法构建枯草芽孢杆菌A164Δ5ΔcypX:将质粒pMRT122(实施例12)转化至枯草芽孢杆菌A164Δ5感受态细胞。在添加了1μg红霉素/ml和25μg林可霉素/ml的TBAB-琼脂板上并于30℃下培养24-48小时后筛选转化体。采用同源重组至cypX基因座的方法将所述质粒导入枯草芽孢杆菌A164Δ5的染色体,所述同源重组通过在45℃下孵育枯草芽孢杆菌A164Δ5(pMRT086)细胞的新鲜划线平板16小时并选择正常生长的克隆实施。借助结果得到染色体上cypX基因部分缺失的同源重组,通过将转化体在Luria-Bertani(LB)培养基在34℃的许可温度下不经筛选生长很多代从染色体中除去所述质粒。在该温度下,复制的PE194起点是有活性的并事实上启动从染色体中切除所述质粒(Molecular Biological Methods for Bacillus,edited by C.R.Harwood and S.M.Cutting,1990,John WILEY and Sons Ltd.)。在生长传代若干代后,将所述细胞铺于非选择性LB琼脂糖平板并用下述方法鉴定已缺失了质粒及现在缺失了cypX的克隆:(1)红霉素敏感性显示缺失基于pE194的质粒,和(2)通过使用上述引物34和35实施PCR确定在所需菌株中存在800bp cypX的缺失。将鉴定的菌株命名为枯草芽孢杆菌A164Δ5ΔcypX。
将枯草芽孢杆菌A164Δ5cypX制成感受态并使用采用QIAGEN tip-20柱按厂商说明分离的枯草芽孢杆菌TH1基因组DNA(实施例7)转化。在添加了5μg氯霉素/ml的TBAB平板上于37℃下筛选转化体。按其“湿”表型鉴定枯草芽孢杆菌A164Δ5ΔcypX hasA/hasB/hasC/hasD整合体并将其命名为枯草芽孢杆菌RB201。采用实施例9所述相同的方法从枯草芽孢杆菌RB201中缺失cat基因。将得到的菌株命名为枯草芽孢杆菌RB202。
实施例15:构建枯草芽孢杆菌MF002(fuaD/gtaB)
质粒pHA3(实施例2,图9)用Asp718酶切消化。然后通过首先85℃,30分钟灭活限制性酶平端化酶切消化过的质粒。通过加入10mM dNTP各0.5μl,1μl 1U/μl T4聚合酶并于11℃孵育10分钟实施平端化。最后通过将反应于75℃孵育10分钟灭活聚合酶。然后QIAquick DNA提取试剂盒按厂商说明纯化酶切消化过的质粒,最后用NotI酶切消化。用QIAquick DNA提取试剂盒按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化约2522bp的最小的质粒片段。然后将回收的DNA插入片段(tuaD/gtaB)与下述载体DNA连接。
质粒pDG268MCSΔneo/scBAN/Say(美国专利No.5,955,310)用Ecl136II酶切消化。然后QIAquick DNA提取试剂盒按厂商说明纯化酶切消化过的质粒,最后用NotI酶切消化。用QIAquick DNA提取试剂盒按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化约6800bp的最大的质粒片段。
采用Rapid DNA克隆试剂盒按厂商说明连接回收的载体和DNA插入片段。在转化至枯草芽孢杆菌前,采用ScaI将上述连接体线性化以确保染色体中为双交换整合而不是但交换整合。将用限制性酶ScaI酶切消化的连接体转化枯草芽孢杆菌168Δ4感受态细胞。
在添加了5μg氯霉素/ml的TBAB平板上于37℃下筛选枯草芽孢杆菌氯霉素-抗性转化体。为筛选经由在amyE基因座处双交换的质粒的整合,将枯草芽孢杆菌原始转化体铺于添加了6μg新霉素/ml的TBAB琼脂板和在添加了5μg氯霉素/ml的TBAB琼脂板上以分离出氯霉素抗性和新霉素敏感性转化体。
采用REDextract-N-AmpTM Plant PCR试剂盒(Sigma ChemicalCompany,St.Louis,MO)从氯霉素抗性和新霉素敏感性枯草芽孢杆菌168Δ4转化体中分离染色体DNA,步骤如下:将单芽孢杆菌克隆接种于100μl提取溶液中,于95℃培养10分钟,然后用等体积稀释溶液稀释。采用4μl提取的DNA联合REDextract-N-Amp PCR反应混合物及所需引物按厂商说明,按照实施例5中所述PCR循环条件实施PCR。
采用下述合成寡核苷酸对这些转化体实施PCR扩增以确定枯草芽孢杆菌转化体操纵子的hasA,gtaB,和tuaD基因的缺失/存在及完整性。引物3和8用于证实存在hasA基因,引物71和引物15用于证实存在tuaD基因,引物20和71用于证实存在gtaB基因。在0.8%琼脂糖-0.5×TBE凝胶中显影PCR反应产物。将鉴定的菌株,枯草芽孢杆菌168Δ4 hasA/tuaD/gtaB整合体,命名为枯草芽孢杆菌RB176。
引物71:5’-AACTATTGCCGATGATAAGC-3’(结合上游tuaD)(SEQ IDNO:85)
采用QIAGEN tip-20柱按厂商说明从氯霉素抗性和新霉素敏感性枯草芽孢杆菌RB176转化体中分离基因组DNA。将枯草芽孢杆菌RB176基因组DNA用于转化感受态枯草芽孢杆菌A164Δ5。在添加了5μg氯霉素/ml的TBAB平板上并在37℃下培养以筛选转化体。
将枯草芽孢杆菌A164Δ5tuaD/gtaB整合体命名为枯草芽孢杆菌RB177。
采用实施例9中所述方法在枯草芽孢杆菌RB177菌株中缺失cat基因。将得到的菌株命名为枯草芽孢杆菌MF002。
实施例16:构建pel整合质粒pRB162
用SacI和AatII双酶切消化质粒pDG268MCSΔneo/scBAN/Sav(美国专利No.5,955,310)。采用QIAquick DNA凝胶提取试剂盒并按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化约6193bp的最大的质粒片段。然后将回收的载体DNA与下述DNA插入片段连接。
采用PCR从枯草芽孢杆菌168(BGSC 1A1,Bacillus Genetic StockCenter,Columbus,OH)中扩增枯草芽孢杆菌果胶酶基因的5’和3’片段(pel,登记号BG10840,SEQ ID NO86[DNA序列]和87[推导的氨基酸序列]),所使用的引物为针对5’pel片段的引物72(引入5′Spel限制性酶切消化位点)和73(引入3′SalI限制性酶切消化位点)和针对3′pel片段的引物74(引入5′SacI/BamHI限制性酶切消化位点)和75(引入3’NotI/AatII限制性酶切消化位点):
引物72:
5’-ACTAGTAATGATGGCTGGGGCGCGTA-3’(SEQ ID NO:88)
引物73:
5′-GTCGACATGTTGTCGTATTGTGAGTT-3′(SEQ ID NO:89)
引物74:
5’-GAGCTCTACAACGCTTATGGATCCGCGGCCGCGGCGGCACACACATCTG
GAT-3’(SEQ ID NO:90)
引物75:
5′-GACGTCAGCCCGTTTGCAGCCGATGC-3′(SEQ ID NO:91)
在30μl反应中一式三份实施PCR扩增,所述反应含有如下成分:50ng的枯草芽孢杆菌168染色体DNA,针对5’pel片段的引物对72/73或针对3’pel片段的引物对74/75各0.4μM,dATP、dCTP,dGTP和dTTP各200μM,含有2.5mM MgCl2的1×PCR缓冲液II,2.5单位AmpliTaq GoldTM DNA聚合酶的50μl的反应中实施PCR扩增。在RoboCycler 40 thermacycler中实施扩增反应,反应条件:95℃9分钟1个循环;95℃1分钟,95℃1分钟,52℃1分钟,72℃1分钟3个循环;52℃1分钟,72℃1分钟3个循环;95℃1分钟,55℃1分钟,72℃1分钟27个循环,72℃5分钟1个循环。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上显影PCR产物。所要片段为约对于5′pel片段的530bp和对于3’pel片段的530bp。
按厂商说明用TA-TOPO克隆试剂盒将530bp 5’pel和530bp 3’pelPCR片段克隆至pCR2.1并转化至大肠杆菌ONESHOTTM感受态细胞。在添加了100μg氨卡青霉素/ml的2XYT平板上并在37℃下培养以筛选转化体。采用QIAGEN自动仪器按厂商说明纯化来自这些转化体的质粒DNA并采用DNA测序确定插入片段的DNA序列,所述DNA测序中使用的上述引物:针对5’pel的引物72和73和针对3’pel的引物74和75。将包含530bp和530bp PCR片段的质粒分别命名为pCR2.1-pel 5’和pCR2.1-pel 3’(分别示于图38和39)。
用SacI和AatII双酶切消化质粒pCR2.1-pel3’。采用QIAquick DNA凝胶提取试剂盒并按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化约530 bp的最小的质粒片段。
然后采用Rapid DNA克隆试剂盒按厂商说明将回收的载体(pDG268MCSΔneo/scBAN)和DNA插入片段(3’pel)连接。将连接混合物转化至大肠杆菌SURE感受态细胞(Stratagene,INC.,La Jolla,CA)。于37℃在加入100μg氨卡青霉素/ml的2XYT琼脂板上筛选转化体。
采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并通过SAcI和Aatll酶切消化在使用0.5×TBE缓冲液的0.8%琼脂糖凝胶上分析。存在约530bp的SacI/Aatll 3′pel片段即可鉴定为正确的质粒并将其命名为pRB161(图40)。
用Spel和SalI双酶切消化质粒pRB161。采用QIAquickDNA凝胶提取试剂盒并按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化约5346bp的最大的质粒片段。然后将回收的载体DNA与下述DNA插入片段连接。
用Spel和SalI双酶切消化质粒pCR2.1-pel3’。采用QIAquick DNA凝胶提取试剂盒并按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化约530bp的最小的质粒片段。
然后采用Rapid DNA克隆试剂盒按厂商说明将回收的载体(pDG268MCSΔneo/scBAN/pel 3’)和DNA插入片段(5’pel)连接。将连接混合物转化至大肠杆菌SURE感受态细胞(Stratagene,INC.,La Jolla,CA)。在添加了100μg氨卡青霉素/ml的2XYT琼脂板上于37℃下筛选转化体。
采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并通过Spel和SalI酶切消化在使用0.5×TBE缓冲液的0.8%琼脂糖凝胶上分析。存在约530bp的Spel和SalI 3′pel片段即可鉴定为正确的质粒并将其命名为pRB162(图41)。
实施例17:构建pRB156
用HpaI酶切消化质粒pHA7(实施例4,图13)。然后采用QIAquick DNA纯化试剂盒并按厂商说明纯化酶切消化过的质粒,最后用Asp718酶切消化。然后通过首先在85℃下,30分钟灭活XbaI将双-酶切消化过的质粒平端化。通过加入10mM dNTP各0.5μl,1μl 1U/μl的T4 DNA聚合酶(Roche AppliedScience;Indianapolis,IN)并在11℃下孵育30分钟实施平端化。最后通过在75℃下孵育反应10分钟灭活聚合酶。采用QIAquick DNA凝胶提取试剂盒并按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化约8600bp的最大的质粒片段。然后采用快速DNA克隆试剂盒并按厂商说明将回收的DNA插入片段(pDG268Δneo-cryIIIA stab/sehasA)再连接。
将连接混合物转化至大肠杆菌SURE感受态细胞(Stratagene,INC.,La Jolla,CA)。于37℃在加入100μg氨卡青霉素/ml的2XYT琼脂板上筛选转化体。采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并通过ScaI酶切消化在使用0.5×TBE缓冲液的0.8%琼脂糖凝胶上分析。存在约8,755bp的片段即可鉴定为正确的质粒并将其命名为pRB156(图42)。
实施例18:构建枯草芽孢杆菌MF009
将受控于scBAN启动子的hasA基因导入枯草芽孢杆菌MF002的果胶酸裂合酶基因(pel)座中从而产生枯草芽孢杆菌MF009。
用SacI酶切消化质粒pRB156。然后采用QIAquick DNA纯化试剂盒并按厂商说明纯化酶切消化过的质粒,最后用NotI酶切消化。采用QIAquickDNA凝胶提取试剂盒并按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化约1,377bp的最小的质粒片段。然后将回收的DNA插入片段与下述载体DNA连接。
用NotI酶切消化质粒pRB162(实施例16,图41)。然后采用QIAquickDNA纯化试剂盒并按厂商说明纯化酶切消化过的质粒,最后用SacI酶切消化。采用QIAquick DNA凝胶提取试剂盒并按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化约5850bp的最大的质粒片段。然后将回收的载体DNA与上述DNA插入片段连接。
将连接混合物直接转化至枯草芽孢杆菌168Δ4感受态细胞。在添加了5μg氯霉素/ml的TBAB琼脂板上于37℃下筛选枯草芽孢杆菌氯霉素抗性转化体。为筛选经由在pel基因座处双交换的质粒的整合,将枯草芽孢杆菌原始转化体铺于添加了6μg新霉素/ml的TBAB琼脂板和在添加了5μg氯霉素/ml的TBAB琼脂板上。经由在pel基因座处双交换的质粒的整合没有掺入新霉素抗性基因,因此生成了新霉素敏感性菌株。采用该平板筛选,分离出氯霉素抗性和新霉素敏感性转化体。
采用QIAGEN tip-20柱按厂商说明从氯霉素抗性和新霉素敏感性枯草芽孢杆菌168Δ4转化体中分离基因组DNA。将该基因组DNA用于转化感受态枯草芽孢杆菌MF002(实施例15)。在添加了5μg氯霉素/ml的TBAB琼脂板上并于37℃下培养以筛选转化体。通过其“湿”表型鉴定枯草芽孢杆菌A164Δ5hasA和tuaD/gtaB整合体并将其命名为枯草芽孢杆菌MF009。
实施例19:构建枯草芽孢杆菌MF010
用NotI酶切消化质粒pDG268MCSΔneo/BAN/Sav(美国专利No.5,955,310)。然后采用QIAquick DNA纯化试剂盒并按厂商说明纯化酶切消化过的质粒,最后用SfiI酶切消化。采用QIAquick DNA凝胶提取试剂盒并按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化约185bp的最小的质粒片段。然后将回收的DNA插入片段与下述载体DNA连接。
用NotI酶切消化质粒pRB162(实施例16,图41)。然后采用QIAquickDNA纯化试剂盒并按厂商说明纯化酶切消化过的质粒,最后用SfiI酶切消化。采用QIAquick DNA凝胶提取试剂盒并按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化约5747bp的最大的质粒片段。然后将回收的载体DNA与上述DNA插入片段连接。
使用Rapid DNA克隆试剂盒按厂商说明连接回收的载体和DNA插入片段。将连接混合物转化至大肠杆菌XLI Blue感受态细胞。在加入100μg氨卡青霉素/ml的2X YT琼脂板上筛选转化体。
采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并通过BamHI酶切消化在使用0.5×TBE缓冲液的0.8%琼脂糖凝胶上分析。通过能提供约7,156bp片段的质粒的线性化即可鉴定为正确的质粒并将其命名为pRB164(图43)。
用SacI酶切消化质粒pRB156(实施例17,图42)。然后采用QIAquickDNA纯化试剂盒并按厂商说明纯化酶切消化过的质粒,最后用NotI酶切消化。采用QIAquick DNA凝胶提取试剂盒并按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化约1377bp的最小的质粒片段。然后将回收的DNA插入片段与下述载体DNA连接。
用NotI酶切消化质粒pRB164。然后采用QIAquick DNA纯化试剂盒并按厂商说明纯化酶切消化过的质粒,最后用SacI酶切消化。采用QIAquickDNA凝胶提取试剂盒并按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化约5922bp的最大的质粒片段。然后将回收的载体DNA与上述DNA插入片段连接。
将连接混合物直接转化至枯草芽孢杆菌168Δ4感受态细胞中。在添加了5μg氯霉素/ml的TBAB琼脂板上于37℃下筛选枯草芽孢杆菌氯霉素抗性转化体。为筛选经由在amyE基因座处双交换(cross-over)的质粒的整合,将枯草芽孢杆菌原始转化体铺于添加了6μg新霉素/ml的TBAB琼脂板和在添加了5μg氯霉素/ml的TBAB琼脂板上。经由在amyE基因座处双交换的质粒的整合没有掺入新霉素抗性基因,因此生成了新霉素敏感性菌株。采用该平板筛选,分离出氯霉素抗性和新霉素敏感性转化体。
采用QIAGEN tip-20柱按厂商说明从氯霉素抗性和新霉素敏感性枯草芽孢杆菌168Δ4转化体中分离基因组DNA。将该基因组DNA用于转化感受态枯草芽孢杆菌MF002(实施例15)。在添加了5μg氯霉素/ml的最小琼脂板上并于37℃下培养16小时以筛选转化体。通过其“湿”表型鉴定枯草芽孢杆菌A164Δ5 BAN/HASA和scBAN/tuaD/gtaB整合体并将其命名为枯草芽孢杆菌MF010.
实施例20:发酵
在多种生长条件下评估表1中所列枯草芽孢杆菌菌株的制备透明质酸的能力。
                             表1
枯草芽孢杆菌菌株     启动子/基因互补体               catΔ
 cypX Δ
 RB161               scBAN/hasA/tuaD/gtaB               no
           no
 RB163               scBAN/hasA/tuaD/gcaD               no
           no
 TH-1                scBANhasA/hasB/hasC/hasD           no
           no
 RB184               scBAN/hasA/tuaD               no           no
 RB187               scBAN/hasA/tuaD/gtaB               yes
           no
 RB192               scBAN/hasA/tuaD               yes          no
 RB194               scBAN/hasA/tuaD/gtaB               yes
           yes
 RB197               scBAN/hasA/tuaD/gtaB               yes
           yes
 RB200               scBAN/hasA/tuaD               yes          yes
 RB202               scBAN/hasA/hasB/hasC/hasD/         yes
           yes
 MF009               scBAN/tuaD/gtaB                    no
           no
                     scBAN/hasA
MF010                scBAN/tuaD/gtaB                    no
           no
                     BAN/hasA
在标准小发酵罐中发酵枯草芽孢杆菌菌株,所使用的培养基包含每升中6.5g的KH2PO4,4.5g Na2HPO4,3.0g(NH4)2SO4,2.0g Na3-柠檬酸-2H2O,3.0MgSO4·7H2O,6.0ml Mikrosoy-2,0.15mg生物素(1ml 0.15mg/ml乙醇),15.0g蔗糖,1.0ml SB 2066,2.0ml P2000,0.5g CaCl2·2H2O。高压灭菌前,培养基的pH为6.3-6.4(未调整)。在高压灭菌后加入CaCl2·2H2O。
所使用的接种培养基为B-3,即无琼脂的Agar-3或“S/S-1”培养基。
Agar-3培养基含有每升中4.0g营养肉汤,7.5g水解蛋白,3.0g酵母提取物,1.0g葡萄糖和2%琼脂。pH为调整;高压灭菌前,pH约为6.8;高压灭菌后,pH约为7.7。
蔗糖/大豆接种瓶培养基(S/S-1)包含每升中65g蔗糖,35g大豆粉,2g Na3-柠檬酸-2H2O,4g KH2PO4,5g Na2HPO4和6ml微量元素。用NaOH将培养基的pH调整为约7;将培养基加入瓶中后,加入0.2%植物油以抑制发泡。微量元素包括每升中100g柠檬酸-H2O,20g FeSO4·7H2O,5gMnSO4·H20,2g CuSO4·5H2O和2g ZnCl2
在接种前用氨水将pH调整为6.8-7.0并用和随后用氨水和磷酸将pH控制在pH7.0±0.2。将温度保持在37℃。采用两个叶轮直径为6cm的6叶涡轮叶轮在初始体积为1.5升的3升罐中以最大值1300RPM进行搅拌。以最大值1.5VVM通风。
使用纯蔗糖溶液给料。在溶解氧(D.O.)仍持续降低时(即在蔗糖耗尽前),于接种后约4小时开始给料。给料速率在7个小时期间从0至约6g蔗糖/L0-小时线性改变。在某些发酵中也使用较低的给料速率(从0至约2g蔗糖/L0-小时线性改变)。
约10小时后粘度已经非常显著,而24小时后粘度非常高,使得D.O.降至最低点。终粘度达到3,220cP。20小时后,细胞群形成接近最大值(12-15g/升)。采用如下方法除去细胞:用3份水稀释1份培养液,充分混合并以30,000×g离心以形成细胞上清和能进行漂洗和干燥的细胞片状沉淀。
根据透明质酸结合蛋白(蛋白和试剂盒购自Seikagaku America,Falmouth,MA),采用ELISA方法测定透明质酸浓度。
将枯草芽孢杆菌RB161和RB163在分批和分批补料发酵中培养。在分批补料步骤中,枯草芽孢杆菌菌株RB163和RB161的补料率有所不同。采用ELISA方法再次测定透明质酸浓度。结果示于表2中。
                         表2
    菌株和生长条件   HA(相对产量)ELISA方法
    RB-161(hasA/tuaD/gtaB)单一补料     0.7±0.1
    RB-163(hasA/tuaD/gcaD)分批补料-6g蔗糖/L0-小时RB-161(hasA/tuaD/gtaB)分批补料-6g蔗糖/L0-小时RB-163(hasA/tuaD/gcaD)分批补料-2g蔗糖/L0-小时RB-161(hasA/tuaD/gtaB)分批补料-2g蔗糖/L0-小时     0.9±0.10.9±0.11.0±0.21.0±0.1
对同一菌株以2g/L蔗糖L0-小时分批补料的和以6g/L蔗糖/L0-小时分批补料的培养测定的比较结果显示出较快的蔗糖补料速率不能显著地改善滴度。
图44中总结了在相同条件下(以约2g蔗糖/L0-小时,37℃分批补料)芽孢杆菌属菌株的结果。图44中给出了来自在同一条件下的多重运行的数据的标准差。没有数值的数据来自单运行。使用改良咔唑法(Bitter and Muir,1962,Anal BIOCHEM.4:330-334)确定透明质酸浓度。
图45中总结了在相同条件下(以约2g蔗糖/LO-小时,37℃分批补料)获自重组枯草芽孢杆菌菌株发酵的峰量透明质酸的平均分子量(MDa)。采用GPC MALLS测定法确定分子量。采用如下步骤从GPC MALLS测定实验中采集数据。GPC-MALLS(配合多角度激光散射的凝胶渗透或大小排阻色谱法)已广泛用于表征高分子量(MW)聚合物。通过基于洗脱液和树脂间不同分子量的分子的差异区分的GPC法实施聚合物的分离。通过基于不同MW分子的差异散射范围/角度的MALLS法测定各聚合物的平均分子量。Ueno等,1988,CHEM.PHARM.BULL.36,4971-4975;Wyatt,1993,Anal.Chim.Acta 272:1-40;和Wyatt Technologies,1999,“Light ScatteringUniversity DAWN Course Manual”和“DAWN EOS Manual”Wyatt TechnologyCorporation,Santa Barbara,California中描述了GPC-MALLS的原理和适用于透明质酸的方法步骤。将Agilent 1100等度HPLC,Tosoh Biosep G6000PWXL柱用于GPC,将Wyatt Down EOS用于MALLS。将Agilent G1362A折光率检测器联于MALLS下游以确定洗脱浓度。将具有已知分子量的多种商品化透明质酸制品作为标准物。
生物材料的保藏
根据布达佩斯条约,下列生物材料已保藏在农业研究服务专利培养物保藏中心(Agricultural Research Service Patent Culture Collection),北方地区研究中心(Northern Regional Research Center),大学街1815号(1815University Street),Peoria,伊利诺斯州(Illinois,),61604,并给予下列保藏号:
       保藏物                        保藏号          保藏日
大肠杆菌XL10 Gold kan(pMRT106)    NRRLB-30536    2001年12月12日
该菌株已经在如下状态下进行了保藏,在该专利申请的待审期内,保证根据37 C.F.R.§1.14和35 U.S.C.§122授权的专利和商标委员会所确定的人员能够获得该培养物。该保藏物代表了保藏菌株的基本上纯的培养物。在提交了该申请的副本或其后续申请的国家中,可以按照该国专利法的要求提供该保藏物。但是,应当明白保藏物的可获得性并不构成对以侵犯由政府行为授予的专利权来实施本发明的许可。
在此所描述并要求专利保护的发明并不限于本文中所公开的特定实施方案的范围内,因为这些实施方案意图作为对本发明几个方面的说明。任何等同的实施方案均在本发明的范围内。事实上,除了那些在此所示并描述的修改外,本领域的技术人员很容易根据前面的描述对本发明作各种修改。这些修改也在所附权利要求的范围内。若有抵触,以本说明书(包括定义)为准。
本文中引用了各种参考文献,其公开内容全文引入作为参考。
    申请人或代理人档案号10241.204-WO     国际申请号PCT/US02/41067
                        关于微生物保藏的说明
                            (细则13之二)
PCT/RO/134表(1992年7月)
                              序列表
<110>  艾伦.斯洛马(Sloma,Alan)
       里金.贝尔(Behr,Regine)
       威廉.威德纳(Widner,William)
       玛丽亚.唐(Tang,Maria)
       戴维.斯滕伯格(Sternberg,David)
       斯蒂芬.布朗(Brown,Stephen)
<120>  在重组宿主细胞中制备透明质酸的方法
<130>  10241.204-WO
<150>  US 60/342,644
<151>  2001-12-21
<160>  108
<170>  PatentIn version 3.1
<210>  1
<211>  1251
<212>  DNA
<213>  似马链球菌(Streptococcus equisimilis)
<220>
<221>  CDS
<222>  (1)..(1251)
<223>
<400>  1
atg aga aca tta aaa aac ctc ata act gtt gtg gcc ttt agt att ttt     48
Met Arg Thr Leu Lys Asn Leu Ile Thr Val Val Ala Phe Ser Ile Phe
1               5                   10                  15
tgg gta ctg ttg att tac gtc aat gtt tat ctc ttt ggt gct aaa gga     96
Trp Val Leu Leu Ile Tyr Val Asn Val Tyr Leu Phe Gly Ala Lys Gly
            20                  25                  30
agc ttg tca att tat ggc ttt ttg ctg ata gct tac cta tta gtc aaa    144
Ser Leu Ser Ile Tyr Gly Phe Leu Leu Ile Ala Tyr Leu Leu Val Lys
        35                  40                  45
atg tcc tta tcc ttt ttt tac aag cca ttt aag gga agg gct ggg caa    192
Met Ser Leu Ser Phe Phe Tyr Lys Pro Phe Lys Gly Arg Ala Gly Gln
    50                  55                  60
tat aag gtt gca gcc att att ccc tct tat aac gaa gat gct gag tca    240
Tyr Lys Val Ala Ala Ile Ile Pro Ser Tyr Asn Glu Asp Ala Glu Ser
65                  70                  75                  80
ttg cta gag acc tta aaa agt gtt cag cag caa acc tat ccc cta gca    288
Leu Leu Glu Thr Leu Lys Ser Val Gln Gln Gln Thr Tyr Pro Leu Ala
                85                  90                  95
gaa att tat gtt gtt gac gat gga agt gct gat gag aca ggt att aag    336
Glu Ile Tyr Val Val Asp Asp Gly Ser Ala Asp Glu Thr Gly Ile Lys
            100                 105                 110
cgc att gaa gac tat gtg cgt gac act ggt gac cta tca agc aat gtc     384
Arg Ile Glu Asp Tyr Val Arg Asp Thr Gly Asp Leu Ser Ser Asn Val
        115                 120                 125
att gtt cac cgg tca gaa aaa aat caa gga aag cgt cat gca cag gcc     432
Ile Val His Arg Ser Glu Lys Asn Gln Gly Lys Arg His Ala Gln Ala
    130                 135                 140
tgg gcc ttt gaa aga tca gac gct gat gtc ttt ttg acc gtt gac tca     480
Trp Ala Phe Glu Arg Ser Asp Ala Asp Val Phe Leu Thr Val Asp Ser
145                 150                 155                 160
gat act tat atc tac cct gat gct tta gag gag ttg tta aaa acc ttt     528
Asp Thr Tyr Ile Tyr Pro Asp Ala Leu Glu Glu Leu Leu Lys Thr Phe
                165                 170                 175
aat gac cca act gtt ttt gct gcg acg ggt cac ctt aat gtc aga aat     576
Asn Asp Pro Thr Val Phe Ala Ala Thr Gly His Leu Asn Val Arg Asn
            180                 185                 190
aga caa acc aat ctc tta aca cgc ttg aca gat att cgc tat gat aat     624
Arg Gln Thr Asn Leu Leu Thr Arg Leu Thr Asp Ile Arg Tyr Asp Asn
        195                 200                 205
gct ttt ggc gtt gaa cga gct gcc caa tcc gtt aca ggt aat att ctc     672
Ala Phe Gly Val Glu Arg Ala Ala Gln Ser Val Thr Gly Asn Ile Leu
    210                 215                 220
gtt tgc tca ggc ccg ctt agc gtt tac aga cgc gag gtg gtt gtt cct     720
Val Cys Ser Gly Pro Leu Ser Val Tyr Arg Arg Glu Val Val Val Pro
225                 230                 235                 240
aac ata gat aga tac atc aac cag acc ttc ctg ggt att cct gta agt     768
Asn Ile Asp Arg Tyr Ile Asn Gln Thr Phe Leu Gly Ile Pro Val Ser
                245                 250                 255
atc ggt gat gac agg tgc ttg acc aac tat gca act gat tta gga aag     816
Ile Gly Asp Asp Arg Cys Leu Thr Asn Tyr Ala Thr Asp Leu Gly Lys
            260                 265                 270
act gtt tat caa tcc act gct aaa tgt att aca gat gtt cct gac aag     864
Thr Val Tyr Gln Ser Thr Ala Lys Cys Ile Thr Asp Val Pro Asp Lys
        275                 280                 285
atg tct act tac ttg aag cag caa aac cgc tgg aac aag tcc ttc ttt     912
Met Ser Thr Tyr Leu Lys Gln Gln Asn Arg Trp Asn Lys Ser Phe Phe
    290                 295                 300
aga gag tcc att att tct gtt aag aaa atc atg aac aat cct ttt gta     960
Arg Glu Ser Ile Ile Ser Val Lys Lys Ile Met Asn Asn Pro Phe Val
305                 310                 315                 320
gcc cta tgg acc ata ctt gag gtg tct atg ttt atg atg ctt gtt tat    1008
Ala Leu Trp Thr Ile Leu Glu Val Ser Met Phe Met Met Leu Val Tyr
                325                 330                 335
tct gtg gtg gat ttc ttt gta gac aat gtc aga gaa ttt gat tgg ctc    1056
Ser Val Val Asp Phe Phe Val Asp Asn Val Arg Glu Phe Asp Trp Leu
            340                 345                 350
agg gtt ttg gcc ttt ctg gtg att atc ttc att gtt gct ctt tgt cgt    1104
Arg Val Leu Ala Phe Leu Val Ile Ile Phe Ile Val Ala Leu Cys Arg
        355                 360                 365
aat att cac tat atg ctt aag cac ccg ctg tcc ttc ttg tta tct ccg    1152
Asn Ile His Tyr Met Leu Lys His Pro Leu Ser Phe Leu Leu Ser Pro
    370                 375                 380
ttt tat ggg gta ctg cat ttg ttt gtc cta cag ccc ttg aaa ttg tat    1200
Phe Tyr Gly Val Leu His Leu Phe Val Leu Gln Pro Leu Lys Leu Tyr
385                 390                 395                 400
tct ctt ttt act att aga aat gct gac tgg gga aca cgt aaa aaa tta    1248
Ser Leu Phe Thr Ile Arg Asn Ala Asp Trp Gly Thr Arg Lys Lys Leu
                405                 410                 415
tta                                                                1251
Leu
<210>  2
<211>  417
<212>  PRT
<213>  似马链球菌(Streptococcus equisimilis)
<400>  2
Met Arg Thr Leu Lys Asn Leu Ile Thr Val Val Ala Phe Ser Ile Phe
1               5                   10                  15
Trp Val Leu Leu Ile Tyr Val Asn Val Tyr Leu Phe Gly Ala Lys Gly
            20                  25                  30
Ser Leu Ser Ile Tyr Gly Phe Leu Leu Ile Ala Tyr Leu Leu Val Lys
        35                  40                  45
Met Ser Leu Ser Phe Phe Tyr Lys Pro Phe Lys Gly Arg Ala Gly Gln
    50                  55                  60
Tyr Lys Val Ala Ala Ile Ile Pro Ser Tyr Asn Glu Asp Ala Glu Ser
65                  70                  75                  80
Leu Leu Glu Thr Leu Lys Ser Val Gln Gln Gln Thr Tyr Pro Leu Ala
                85                  90                  95
Glu Ile Tyr Val Val Asp Asp Gly Ser Ala Asp Glu Thr Gly Ile Lys
            100                 105                 110
Arg Ile Glu Asp Tyr Val Arg Asp Thr Gly Asp Leu Ser Ser Asn Val
        115                 120                 125
Ile Val His Arg Ser Glu Lys Asn Gln Gly Lys Arg His Ala Gln Ala
    130                 135                 140
Trp Ala Phe Glu Arg Ser Asp Ala Asp Val Phe Leu Thr Val Asp Ser
145                 150                 155                 160
Asp Thr Tyr Ile Tyr Pro Asp Ala Leu Glu Glu Leu Leu Lys Thr Phe
                165                 170                 175
Asn Asp Pro Thr Val Phe Ala Ala Thr Gly His Leu Asn Val Arg Asn
            180                 185                 190
Arg Gln Thr Asn Leu Leu Thr Arg Leu Thr Asp Ile Arg Tyr Asp Asn
        195                 200                 205
Ala Phe Gly Val Glu Arg Ala Ala Gln Ser Val Thr Gly Asn Ile Leu
    210                 215                 220
Val Cys Ser Gly Pro Leu Ser Val Tyr Arg Arg Glu Val Val Val Pro
225                 230                 235                 240
Asn Ile Asp Arg Tyr Ile Asn Gln Thr Phe Leu Gly Ile Pro Val Ser
                245                 250                 255
Ile Gly Asp Asp Arg Cys Leu Thr Asn Tyr Ala Thr Asp Leu Gly Lys
            260                 265                 270
Thr Val Tyr Gln Ser Thr Ala Lys Cys Ile Thr Asp Val Pro Asp Lys
        275                 280                 285
Met Ser Thr Tyr Leu Lys Gln Gln Asn Arg Trp Asn Lys Ser Phe Phe
    290                 295                 300
Arg Glu Ser Ile Ile Ser Val Lys Lys Ile Met Asn Asn Pro Phe Val
305                 310                 315                 320
Ala Leu Trp Thr Ile Leu Glu Val Ser Met Phe Met Met Leu Val Tyr
                325                 330                 335
Ser Val Val Asp Phe Phe Val Asp Asn Val Arg Glu Phe Asp Trp Leu
            340                 345                 350
Arg Val Leu Ala Phe Leu Val Ile Ile Phe Ile Val Ala Leu CysArg
        355                 360                 365
Asn Ile His Tyr Met Leu Lys His Pro Leu Ser Phe Leu Leu Ser Pro
    370                 375                 380
Phe Tyr Gly Val Leu His Leu Phe Val Leu Gln Pro Leu Lys Leu Tyr
385                 390                 395                 400
Ser Leu Phe Thr Ile Arg Asn Ala Asp Trp Gly Thr Arg Lys Lys Leu
                405                 410                 415
Leu
<210>  3
<211>  49
<212>  DNA
<213>  似马链球菌(Streptococcus equisimilis)
<400>  3
gagctctata aaaatgagga gggaaccgaa tgagaacatt aaaaaacct                49
<210>  4
<211>  48
<212>  DNA
<213>  似马链球菌(Streptococcus equisimilis)
<400>  4
gttaacgaat tcagctatgt aggtacctta taataatttt ttacgtgt                 48
<210>  5
<211>  20
<212>  DNA
<213>  似马链球菌(Streptococcus equisimilis)
<400>  5
gttgacgatg gaagtgctga                                                20
<210>  6
<211>  20
<212>  DNA
<213>  似马链球菌(Streptococcus equisimilis)
<400>  6
atccgttaca ggtaatatcc                                                20
<210>  7
<211>  20
<212>  DNA
<213>  似马链球菌(Streptococcus equisimilis)
<400>  7
tccttttgta gccctatgga                                                20
<210>  8
<211>  20
<212>  DNA
<213>  似马链球菌(Streptococcus equisimilis)
<400>  8
tcagcacttc catcgtcaac                                                20
<210>  9
<211>  20
<212>  DNA
<213>  似马链球菌(Streptococcus equisimilis)
<400>  9
ggatattacc tgtaacggat                                                20
<210>  10
<211>  20
<212>  DNA
<213>  似马链球菌(Streptococcus equisimilis)
<400>  10
tccatagggc tacaaaagga                                                20
<210>  11
<211>  1383
<212>  DNA
<213>  枯草芽孢杆菌(枯草芽孢杆菌(Bacillus subtilis))
<220>
<221>  CDS
<222>  (1)..(1383)
<223>
<400>  11
gtg aaa aaa ata gct gtc att gga aca ggt tat gta gga ctc gta tca     48
Val Lys Lys Ile Ala Val Ile Gly Thr Gly Tyr Val Gly Leu Val Ser
1               5                   10                  15
ggc act tgc ttt gcg gag atc ggc aat aaa gtt gtt tgc tgt gat atc     96
Gly Thr Cys Phe Ala Glu Ile Gly Asn Lys Val Val Cys Cys Asp Ile
            20                  25                  30
gat gaa tca aaa atc aga agc ctg aaa aat ggg gta atc cca atc tat    144
Asp Glu Ser Lys Ile Arg Ser Leu Lys Asn Gly Val Ile Pro Ile Tyr
        35                  40                  45
gaa cca ggg ctt gca gac tta gtt gaa aaa aat gtg ctg gat cag cgc    192
Glu Pro Gly Leu Ala Asp Leu Val Glu Lys Asn Val Leu Asp Gln Arg
    50                  55                  60
ctg acc ttt acg aac gat atc ccg tct gcc att cgg gcc tca gat att    240
Leu Thr Phe Thr Asn Asp Ile Pro Ser Ala Ile Arg Ala Ser Asp Ile
65                  70                  75                  80
att tat att gca gtc gga acg cct atg tcc aaa aca ggt gaa gct gat    288
Ile Tyr Ile Ala Val Gly Thr Pro Met Ser Lys Thr Gly Glu Ala Asp
                85                  90                  95
tta acg tac gtc aaa gcg gcg gcg aaa aca atc ggt gag cat ctt aac    336
Leu Thr Tyr Val Lys Ala Ala Ala Lys Thr Ile Gly Glu His Leu Asn
            100                 105                 110
ggc tac aaa gtg atc gta aat aaa agc aca gtc ccg gtt gga aca ggg    384
Gly Tyr Lys Val Ile Val Asn Lys Ser Thr Val Pro Val Gly Thr Gly
        115                 120                 125
aaa ctg gtg caa tct atc gtt caa aaa gcc tca aag ggg aga tac tca    432
Lys Leu Val Gln Ser Ile Val Gln Lys Ala Ser Lys Gly Arg Tyr Ser
    130                 135                 140
ttt gat gtt gta tct aac cct gaa ttc ctt cgg gaa ggg tca gcg att     480
Phe Asp Val Val Ser Asn Pro Glu Phe Leu Arg Glu Gly Ser Ala Ile
145                 150                 155                 160
cat gac acg atg aat atg gag cgt gcc gtg att ggt tca aca agt cat     528
His Asp Thr Met Asn Met Glu Arg Ala Val Ile Gly Ser Thr Ser His
                165                 170                 175
aaa gcc gct gcc atc att gag gaa ctt cat cag cca ttc cat gct cct     576
Lys Ala Ala Ala Ile Ile Glu Glu Leu His Gln Pro Phe His Ala Pro
            180                 185                 190
gtc att aaa aca aac cta gaa agt gca gaa atg att aaa tac gcc gcg     624
Val Ile Lys Thr Asn Leu Glu Ser Ala Glu Met Ile Lys Tyr Ala Ala
        195                 200                 205
aat gca ttt ctg gcg aca aag att tcc ttt atc aac gat atc gca aac     672
Asn Ala Phe Leu Ala Thr Lys Ile Ser Phe Ile Asn Asp Ile Ala Asn
    210                 215                 220
att tgt gag cga gtc ggc gca gac gtt tca aaa gtt gct gat ggt gtt     720
Ile Cys Glu Arg Val Gly Ala Asp Val Ser Lys Val Ala Asp Gly Val
225                 230                 235                 240
ggt ctt gac agc cgt atc ggc aga aag ttc ctt aaa gct ggt att gga     768
Gly Leu Asp Ser Arg Ile Gly Arg Lys Phe Leu Lys Ala Gly Ile Gly
                245                 250                 255
ttc ggc ggt tca tgt ttt cca aag gat aca acc gcg ctg ctt caa atc     816
Phe Gly Gly Ser Cys Phe Pro Lys Asp Thr Thr Ala Leu Leu Gln Ile
            260                 265                 270
gca aaa tcg gca ggc tat cca ttc aag ctc atc gaa gct gtc att gaa     864
Ala Lys Ser Ala Gly Tyr Pro Phe Lys Leu Ile Glu Ala Val Ile Glu
        275                 280                 285
acg aac gaa aag cag cgt gtt cat att gta gat aaa ctt ttg act gtt     912
Thr Asn Glu Lys Gln Arg Val His Ile Val Asp Lys Leu Leu Thr Val
    290                 295                 300
atg gga agc gtc aaa ggg aga acc att tca gtc ctg gga tta gcc ttc     960
Met Gly Ser Val Lys Gly Arg Thr Ile Ser Val Leu Gly Leu Ala Phe
305                 310                 315                 320
aaa ccg aat acg aac gat gtg aga tcc gct cca gcg ctt gat att atc    1008
Lys Pro Asn Thr Asn Asp Val Arg Ser Ala Pro Ala Leu Asp Ile Ile
                325                 330                 335
cca atg ctg cag cag ctg ggc gcc cat gta aaa gca tac gat ccg att    1056
Pro Met Leu Gln Gln Leu Gly Ala His Val Lys Ala Tyr Asp Pro Ile
            340                 345                 350
gct att cct gaa gct tca gcg atc ctt ggc gaa cag gtc gag tat tac    1104
Ala Ile Pro Glu Ala Ser Ala Ile Leu Gly Glu Gln Val Glu Tyr Tyr
        355                 360                 365
aca gat gtg tat gct gcg atg gaa gac act gat gca tgc ctg att tta    1152
Thr Asp Val Tyr Ala Ala Met Glu Asp Thr Asp Ala Cys Leu Ile Leu
    370                 375                 380
acg gat tgg ccg gaa gtg aaa gaa atg gag ctt gta aaa gtg aaa acc    1200
Thr Asp Trp Pro Glu Val Lys Glu Met Glu Leu Val Lys Val Lys Thr
385                 390                 395                 400
ctc tta aaa cag cca gtc atc att gac ggc aga aat tta ttt tca ctt    1248
Leu Leu Lys Gln Pro Val Ile Ile Asp Gly Arg Asn Leu Phe Ser Leu
                405                 410                 415
gaa gag atg cag gca gcc gga tac att tat cac tct atc ggc cgt ccc    1296
Glu Glu Met Gln Ala Ala Gly Tyr Ile Tyr His Ser Ile Gly Arg Pro
            420                 425                 430
gct gtt cgg gga acg gaa ccc tct gac aag tat ttt ccg ggc ttg ccg    1344
Ala Val Arg Gly Thr Glu Pro Ser Asp Lys Tyr Phe Pro Gly Leu Pro
        435                 440                 445
ctt gaa gaa ttg gct aaa gac ttg gga agc gtc aat tta                1383
Leu Glu Glu Leu Ala Lys Asp Leu Gly Ser Val Asn Leu
    450                 455                 460
<210>  12
<211>  461
<212>  PRT
<213>  枯草芽孢杆菌(枯草芽孢杆菌(Bacillus subtilis))
<400>  12
Val Lys Lys Ile Ala Val Ile Gly Thr Gly Tyr Val Gly Leu Val Ser
1               5                   10                  15
Gly Thr Cys Phe Ala Glu Ile Gly Asn Lys Val Val Cys Cys Asp Ile
            20                  25                  30
Asp Glu Ser Lys Ile Arg Ser Leu Lys Asn Gly Val Ile Pro Ile Tyr
        35                  40                  45
Glu Pro Gly Leu Ala Asp Leu Val Glu Lys Asn Val Leu Asp Gln Arg
    50                  55                  60
Leu Thr Phe Thr Asn Asp Ile Pro Ser Ala Ile Arg Ala Ser Asp Ile
65                  70                  75                  80
Ile Tyr Ile Ala Val Gly Thr Pro Met Ser Lys Thr Gly Glu Ala Asp
                85                  90                  95
Leu Thr Tyr Val Lys Ala Ala Ala Lys Thr Ile Gly Glu His Leu Asn
            100                 105                 110
Gly Tyr Lys Val Ile Val Asn Lys Ser Thr Val Pro Val Gly Thr Gly
        115                 120                 125
Lys Leu Val Gln Ser Ile Val Gln Lys Ala Ser Lys Gly Arg Tyr Ser
    130                 135                 140
Phe Asp Val Val Ser Asn Pro Glu Phe Leu Arg Glu Gly Ser Ala Ile
145                 150                 155                 160
His Asp Thr Met Asn Met Glu Arg Ala Val Ile Gly Ser Thr Ser His
                165                 170                 175
Lys Ala Ala Ala Ile Ile Glu Glu Leu His Gln Pro Phe His Ala Pro
            180                 185                 190
Val Ile Lys Thr Asn Leu Glu Ser Ala Glu Met Ile Lys Tyr Ala Ala
        195                 200                 205
Asn Ala Phe Leu Ala Thr Lys Ile Ser Phe Ile Asn Asp Ile Ala Asn
    210                 215                 220
Ile Cys Glu Arg Val Gly Ala Asp Val Ser Lys Val Ala Asp Gly Val
225                 230                 235                 240
Gly Leu Asp Ser Arg Ile Gly Arg Lys Phe Leu Lys Ala Gly Ile Gly
                245                 250                 255
Phe Gly Gly Ser Cys Phe Pro Lys Asp Thr Thr Ala Leu Leu Gln Ile
            260                 265                 270
Ala Lys Ser Ala Gly Tyr Pro Phe Lys Leu Ile Glu Ala Val Ile Glu
        275                 280                 285
Thr Asn Glu Lys Gln Arg Val His Ile Val Asp Lys Leu Leu Thr Val
    290                 295                 300
Met Gly Ser Val Lys Gly Arg Thr Ile Ser Val Leu Gly Leu Ala Phe
305                 310                 315                 320
Lys Pro Asn Thr Asn Asp Val Arg Ser Ala Pro Ala Leu Asp Ile Ile
                325                 330                 335
Pro Met Leu Gln Gln Leu Gly Ala His Val Lys Ala Tyr Asp Pro Ile
            340                 345                 350
Ala Ile Pro Glu Ala Ser Ala Ile Leu Gly Glu Gln Val Glu Tyr Tyr
        355                 360                 365
Thr Asp Val Tyr Ala Ala Met Glu Asp Thr Asp Ala Cys Leu Ile Leu
    370                 375                 380
Thr Asp Trp Pro Glu Val Lys Glu Met Glu Leu Val Lys Val Lys Thr
385                 390                 395                 400
Leu Leu Lys Gln Pro Val Ile Ile Asp Gly Arg Asn Leu Phe Ser Leu
                405                 4l0                 4l5
Glu Glu Met Gln Ala Ala Gly Tyr Ile Tyr His Ser Ile Gly Arg Pro
            420                 425                 430
Ala Val Arg Gly Thr Glu Pro Ser Asp Lys Tyr Phe Pro Gly Leu Pro
        435                 440                 445
Leu Glu Glu Leu Ala Lys Asp Leu Gly Ser Val Asn Leu
    450                 455                 460
<210>  13
<211>  26
<212>  DNA
<213>  枯草芽孢杆菌(枯草芽孢杆菌(Bacillus subtilis))
<400>  13
ggtaccgaca ctgcgaccat tataaa                                         26
<210>  14
<211>  49
<212>  DNA
<213>  枯草芽孢杆菌(枯草芽孢杆菌(Bacillus subtilis))
<400>  14
gttaacgaat tccagctatg tatctagaca gcttcaacca agtaacact                49
<210>  15
<211>  20
<212>  DNA
<213>  枯草芽孢杆菌(枯草芽孢杆菌(Bacillus subtilis))
<400>  15
agcatcttaa cggctacaaa                                                20
<210>  16
<211>  20
<212>  DNA
<213>  枯草芽孢杆菌(枯草芽孢杆菌(Bacillus subtilis))
<400>  16
tgtgagcgag tcggcgcaga                                                20
<210>  17
<211>  20
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  17
gggcgcccat gtaaaagcat                                                20
<210>  18
<211>  20
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  18
tttgtagccg ttaagatgct                                                20
<210>  19
<211>  20
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  19
tctgcgccga ctcgctcaca                                                20
<210>  20
<211>  20
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  20
atgcttttac atgggcgccc                                                20
<210>  21
<211>  876
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<220>
<221>  CDS
<222>  (1)..(876)
<223>
<400>  21
atg aaa aaa gta cgt aaa gcc ata att cca gca gca ggc tta gga aca      48
Met Lys Lys Val Arg Lys Ala Ile Ile Pro Ala Ala Gly Leu Gly Thr
1               5                   10                  15
cgt ttt ctt ccg gct acg aaa gca atg ccg aaa gaa atg ctt cct atc     96
Arg Phe Leu Pro Ala Thr Lys Ala Met Pro Lys Glu Met Leu Pro Ile
            20                  25                  30
gtt gat aaa cct acc att caa tac ata att gaa gaa gct gtt gaa gcc    144
Val Asp Lys Pro Thr Ile Gln Tyr Ile Ile Glu Glu Ala Val Glu Ala
        35                  40                  45
ggt att gaa gat att att atc gta aca gga aaa agc aag cgt gcg att    192
Gly Ile Glu Asp Ile Ile Ile Val Thr Gly Lys Ser Lys Arg Ala Ile
    50                  55                  60
gag gat cat ttt gat tac tct cct gag ctt gaa aga aac cta gaa gaa    240
Glu Asp His Phe Asp Tyr Ser Pro Glu Leu Glu Arg Asn Leu Glu Glu
65                  70                  75                  80
aaa gga aaa act gag ctg ctt gaa aaa gtg aaa aag gct tct aac ctg    288
Lys Gly Lys Thr Glu Leu Leu Glu Lys Val Lys Lys Ala Ser Asn Leu
                85                  90                  95
gct gac att cac tat atc cgc caa aaa gaa cct aaa ggt ctc gga cat    336
Ala Asp Ile His Tyr Ile Arg Gln Lys Glu Pro Lys Gly Leu Gly His
            100                 105                 110
gct gtc tgg tgc gca cgc aac ttt atc ggc gat gag ccg ttt gcg gta    384
Ala Val Trp Cys Ala Arg Asn Phe Ile Gly Asp Glu Pro Phe Ala Val
        115                 120                 125
ctg ctt ggt gac gat att gtt cag gct gaa act cca ggg ttg cgc caa    432
Leu Leu Gly Asp Asp Ile Val Gln Ala Glu Thr Pro Gly Leu Arg Gln
    130                 135                 140
tta atg gat gaa tat gaa aaa aca ctt tct tct att atc ggt gtt cag    480
Leu Met Asp Glu Tyr Glu Lys Thr Leu Ser Ser Ile Ile Gly Val Gln
145                 150                 155                 160
cag gtg ccc gaa gaa gaa aca cac cgc tac ggc att att gac ccg ctg    528
Gln Val Pro Glu Glu Glu Thr His Arg Tyr Gly Ile Ile Asp Pro Leu
                165                 170                 175
aca agt gaa ggc cgc cgt tat cag gtg aaa aac ttc gtt gaa aaa ccg    576
Thr Ser Glu Gly Arg Arg Tyr Gln Val Lys Asn Phe Val Glu Lys Pro
            180                 185                 190
cct aaa ggc aca gca cct tct aat ctt gcc atc tta ggc cgt tac gta    624
Pro Lys Gly Thr Ala Pro Ser Asn Leu Ala Ile Leu Gly Arg Tyr Val
        195                 200                 205
ttc acg cct gag atc ttc atg tat tta gaa gag cag cag gtt ggc gcc    672
Phe Thr Pro Glu Ile Phe Met Tyr Leu Glu Glu Gln Gln Val Gly Ala
    210                 215                 220
ggc gga gaa att cag ctc aca gac gcc att caa aag ctg aat gaa att    720
Gly Gly Glu Ile Gln Leu Thr Asp Ala Ile Gln Lys Leu Asn Glu Ile
225                 230                 235                 240
caa aga gtg ttt gct tac gat ttt gaa ggc aag cgt tat gat gtt ggt    768
Gln Arg Val Phe Ala Tyr Asp Phe Glu Gly Lys Arg Tyr Asp Val Gly
                245                 250                 255
gaa aag ctc ggc ttt atc aca aca act ctt gaa ttt gcg atg cag gat    816
Glu Lys Leu Gly Phe Ile Thr Thr Thr Leu Glu Phe Ala Met Gln Asp
            260                 265                 270
aaa gag ctt cgc gat cag ctc gtt cca ttt atg gaa ggt tta cta aac    864
Lys Glu Leu Arg Asp Gln Leu Val Pro Phe Met Glu Gly Leu Leu Asn
        275                 280                 285
aaa gaa gaa atc                                                    876
Lys Glu Glu Ile
    290
<210>  22
<211>  292
<212>  PRT
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  22
Met Lys Lys Val Arg Lys Ala Ile Ile Pro Ala Ala Gly Leu Gly Thr
1               5                   10                  15
Arg Phe Leu Pro Ala Thr Lys Ala Met Pro Lys Glu Met Leu Pro Ile
            20                  25                  30
Val Asp Lys Pro Thr Ile Gln Tyr Ile Ile Glu Glu Ala Val Glu Ala
        35                  40                  45
Gly Ile Glu Asp Ile Ile Ile Val Thr Gly Lys Ser Lys Arg Ala Ile
    50                  55                  60
Glu Asp His Phe Asp Tyr Ser Pro Glu Leu Glu Arg Asn Leu Glu Glu
65                  70                  75                  80
Lys Gly Lys Thr Glu Leu Leu Glu Lys Val Lys Lys Ala Ser Asn Leu
                85                  90                  95
Ala Asp Ile His Tyr Ile Arg Gln Lys Glu Pro Lys Gly Leu Gly His
            100                 105                 110
Ala Val Trp Cys Ala Arg Asn Phe Ile Gly Asp Glu Pro Phe Ala Val
        115                 120                 125
Leu Leu Gly Asp Asp Ile Val Gln Ala Glu Thr Pro Gly Leu Arg Gln
    130                 135                 140
Leu Met Asp Glu Tyr Glu Lys Thr Leu Ser Ser Ile Ile Gly Val Gln
145                 150                 155                 160
Gln Val Pro Glu Glu Glu Thr His Arg Tyr Gly Ile Ile Asp Pro Leu
                165                 170                 175
Thr Ser Glu Gly Arg Arg Tyr Gln Val Lys Asn Phe Val Glu Lys Pro
            180                 185                 190
Pro Lys Gly Thr Ala Pro Ser Asn Leu Ala Ile Leu Gly Arg Tyr Val
        195                 200                 205
Phe Thr Pro Glu Ile Phe Met Tyr Leu Glu Glu Gln Gln Val Gly Ala
    210                 215                 220
Gly Gly Glu Ile Gln Leu Thr Asp Ala Ile Gln Lys Leu Asn Glu Ile
225                 230                 235                 240
Gln Arg Val Phe Ala Tyr Asp Phe Glu Gly Lys Arg Tyr Asp Val Gly
                245                 250                 255
Glu Lys Leu Gly Phe Ile Thr Thr Thr Leu Glu Phe Ala Met Gln Asp
            260                 265                 270
Lys Glu Leu Arg Asp Gln Leu Val Pro Phe Met Glu Gly Leu Leu Asn
        275                 280                 285
Lys Glu Glu Ile
    290
<210>  23
<211>  27
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  23
tctagatttt tcgatcataa ggaaggt                                        27
<210>  24
<211>  49
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtiils)
<400>  24
gttaacgaat tccagctatg taggatccaa tgtccaatag cctttttgt                49
<210>  25
<211>  20
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  25
aaaaaggctt ctaacctggc                                                20
<210>  26
<211>  20
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  26
aaaccgccta aaggcacagc                                                20
<210>  27
<211>  20
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  27
gccaggttag aagccttttt                                                20
<210>  28
<211>  20
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  28
gctgtgcctt taggcggttt                                                20
<210>  29
<211>  1368
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<220>
<221>  CDS
<222>  (1)..(1368)
<223>
<400>  29
atg gat aag cgg ttt gca gtt gtt tta gcg gct gga caa gga acg aga     48
Met Asp Lys Arg Phe Ala Val Val Leu Ala Ala Gly Gln Gly Thr Arg
1               5                   10                  15
atg aaa tcg aag ctt tat aaa gtc ctt cat cca gtt tgc ggt aag cct     96
Met Lys Ser Lys Leu Tyr Lys Val Leu His Pro Val Cys Gly Lys Pro
            20                  25                  30
atg gta gag cac gtc gtg gac gaa gcc tta aaa tta tct tta tca aag    144
Met Val Glu His Val Val Asp Glu Ala Leu Lys Leu Ser Leu Ser Lys
        35                  40                  45
ctt gtc acg att gtc gga cat ggt gcg gaa gaa gtg aaa aag cag ctt    192
Leu Val Thr Ile Val Gly His Gly Ala Glu Glu Val Lys Lys Gln Leu
    50                  55                  60
ggt gat aaa agc gag tac gcg ctt caa gca aaa cag ctt ggc act gct    240
Gly Asp Lys Ser Glu Tyr Ala Leu Gln Ala Lys Gln Leu Gly Thr Ala
65                  70                  75                  80
cat gct gta aaa cag gca cag cca ttt ctt gct gac gaa aaa ggc gtc    288
His Ala Val Lys Gln Ala Gln Pro Phe Leu Ala Asp Glu Lys Gly Val
                85                  90                  95
aca att gtc att tgc gga gat acg ccg ctt ttg aca gca gag acg atg    336
Thr Ile Val Ile Cys Gly Asp Thr Pro Leu Leu Thr Ala Glu Thr Met
            100                 105                 110
gaa cag atg ctg aaa gaa cat aca caa aga gaa gcg aaa gct acg att    384
Glu Gln Met Leu Lys Glu His Thr Gln Arg Glu Ala Lys Ala Thr Ile
        115                 120                 125
tta act gcg gtt gca gaa gat cca act gga tac ggc cgc att att cgc    432
Leu Thr Ala Val Ala Glu Asp Pro Thr Gly Tyr Gly Arg Ile Ile Arg
    130                 135                 140
agc gaa aac gga gcg gtt caa aaa ata gtt gag cat aag gac gcc tct    480
Ser Glu Asn Gly Ala Val Gln Lys Ile Val Glu His Lys Asp Ala Ser
145                 150                 155                 160
gaa gaa gaa cgt ctt gta act gag atc aac acc ggt acg tat tgt ttt    528
Glu Glu Glu Arg Leu Val Thr Glu Ile Asn Thr Gly Thr Tyr Cys Phe
                165                 170                 175
gac aat gaa gcg cta ttt cgg gct att gat cag gtg tct aat gat aat    576
Asp Asn Glu Ala Leu Phe Arg Ala Ile Asp Gln Val Ser Asn Asp Asn
            180                 185                 190
gca caa ggc gag tat tat ttg ccg gat gtc ata gag att ctt aaa aat    624
Ala Gln Gly Glu Tyr Tyr Leu Pro Asp Val Ile Glu Ile Leu Lys Asn
        195                 200                 205
gaa ggc gaa act gtt gcc gct tac cag act ggt aat ttc caa gaa acg    672
Glu Gly Glu Thr Val Ala Ala Tyr Gln Thr Gly Asn Phe Gln Glu Thr
    210                 215                 220
ctc gga gtt aat gat aga gtt gct ctt tct cag gca gaa caa ttt atg    720
Leu Gly Val Asn Asp Arg Val Ala Leu Ser Gln Ala Glu Gln Phe Met
225                 230                 235                 240
aaa gag cgc att aat aaa cgg cat atg caa aat ggc gtg acg ttg att    768
Lys Glu Arg Ile Asn Lys Arg His Met Gln Asn Gly Val Thr Leu Ile
                245                 250                 255
gac ccg atg aat acg tat att tct cct gac gct gtt atc gga agc gat    816
Asp Pro Met Asn Thr Tyr Ile Ser Pro Asp Ala Val Ile Gly Ser Asp
            260                 265                 270
act gtg att tac cct gga act gtg att aaa ggt gag gtg caa atc gga     864
Thr Val Ile Tyr Pro Gly Thr Val Ile Lys Gly Glu Val Gln Ile Gly
        275                 280                 285
gaa gat acg att att ggc cct cat acg gag att atg aat agt gcc att     912
Glu Asp Thr Ile Ile Gly Pro His Thr Glu Ile Met Asn Ser Ala Ile
    290                 295                 300
ggc agc cgt acg gtt att aaa caa tcg gta gtc aat cac agt aaa gtg     960
Gly Ser Arg Thr Val Ile Lys Gln Ser Val Val Asn His Ser Lys Val
305                 310                 315                 320
ggg aat gat gta aac ata gga cct ttt gct cac atc aga cct gat tct    1008
Gly Asn Asp Val Asn Ile Gly Pro Phe Ala His Ile Arg Pro Asp Ser
                325                 330                 335
gtc atc ggg aat gaa gtg aag atc ggg aat ttt gta gaa att aaa aag    1056
Val Ile Gly Asn Glu Val Lys Ile Gly Asn Phe Val Glu Ile Lys Lys
            340                 345                 350
act caa ttc gga gac cga agc aag gca tct cat cta agc tat gtc ggc    1104
Thr Gln Phe Gly Asp Arg Ser Lys Ala Ser His Leu Ser Tyr Val Gly
        355                 360                 365
gat gct gag gta ggc act gat gta aac ctg ggc tgc ggt tca att act    1152
Asp Ala Glu Val Gly Thr Asp Val Asn Leu Gly Cys Gly Ser Ile Thr
    370                 375                 380
gtc aat tat gat gga aag aat aag tat ttg aca aaa att gaa gat ggc    1200
Val Asn Tyr Asp Gly Lys Asn Lys Tyr Leu Thr Lys Ile Glu Asp Gly
385                 390                 395                 400
gcg ttt atc ggc tgc aat tcc aac ttg gtt gcc cct gtc aca gtc gga    1248
Ala Phe Ile Gly Cys Asn Ser Asn Leu Val Ala Pro Val Thr Val Gly
                405                 410                 415
gaa ggc gct tat gtg gcg gca ggt tca act gtt acg gaa gat gta cct    1296
Glu Gly Ala Tyr Val Ala Ala Gly Ser Thr Val Thr Glu Asp Val Pro
            420                 425                 430
gga aaa gca ctt gct att gcc aga gcg aga caa gta aat aaa gac gat    1344
Gly Lys Ala Leu Ala Ile Ala Arg Ala Arg Gln Val Asn Lys Asp Asp
        435                 440                 445
tat gtg aaa aat att cat aaa aaa                                    1368
Tyr Val Lys Asn Ile His Lys Lys
    450                 455
<210>  30
<211>  456
<212>  PRT
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  30
Met Asp Lys Arg Phe Ala Val Val Leu Ala Ala Gly Gln Gly Thr Arg
1               5                   10                  15
Met Lys Ser Lys Leu Tyr Lys Val Leu His Pro Val Cys Gly Lys Pro
            20                  25                  30
Met Val Glu His Val Val Asp Glu Ala Leu Lys Leu Ser Leu Ser Lys
        35                  40                  45
Leu Val Thr Ile Val Gly His Gly Ala Glu Glu Val Lys Lys Gln Leu
    50                  55                  60
Gly Asp Lys Ser Glu Tyr Ala Leu Gln Ala Lys Gln Leu Gly Thr Ala
65                  70                  75                  80
His Ala Val Lys Gln Ala Gln Pro Phe Leu Ala Asp Glu Lys Gly Val
                85                  90                  95
Thr Ile Val Ile Cys Gly Asp Thr Pro Leu Leu Thr Ala Glu Thr Met
            100                 105                 11 0
Glu Gln Met Leu Lys Glu His Thr Gln Arg Glu Ala Lys Ala Thr Ile
        115                 120                 125
Leu Thr Ala Val Ala Glu Asp Pro Thr Gly Tyr Gly Arg Ile Ile Arg
    130                 135                 140
Ser Glu Asn Gly Ala Val Gln Lys Ile Val Glu His Lys Asp Ala Ser
145                 150                 155                 160
Glu Glu Glu Arg Leu Val Thr Glu Ile Asn Thr Gly Thr Tyr Cys Phe
                165                 170                 175
Asp Asn Glu Ala Leu Phe Arg Ala Ile Asp Gln Val Ser Asn Asp Asn
            180                 185                 190
Ala Gln Gly Glu Tyr Tyr Leu Pro Asp Val Ile Glu Ile Leu Lys Asn
        195                 200                 205
Glu Gly Glu Thr Val Ala Ala Tyr Gln Thr Gly Asn Phe Gln Glu Thr
    210                 215                 220
Leu Gly Val Asn Asp Arg Val Ala Leu Ser Gln Ala Glu Gln Phe Met
225                 230                 235                 240
Lys Glu Arg Ile Asn Lys Arg His Met Gln Asn Gly Val Thr Leu Ile
                245                 250                 255
Asp Pro Met Asn Thr Tyr Ile Ser Pro Asp Ala Val Ile Gly Ser Asp
            260                 265                 270
Thr Val Ile Tyr Pro Gly Thr Val Ile Lys Gly Glu Val Gln Ile Gly
        275                 280                 285
Glu Asp Thr Ile Ile Gly Pro His Thr Glu Ile Met Asn Ser Ala Ile
    290                 295                 300
Gly Ser Arg Thr Val Ile Lys Gln Ser Val Val Asn His Ser Lys Val
305                 310                 315                 320
Gly Asn Asp Val Asn Ile Gly Pro Phe Ala His Ile Arg Pro Asp Ser
                325                 330                 335
Val Ile Gly Asn Glu Val Lys Ile Gly Asn Phe Val Glu Ile Lys Lys
            340                 345                 350
Thr Gln Phe Gly Asp Arg Ser Lys Ala Ser His Leu Ser Tyr Val Gly
        355                 360                 365
Asp Ala Glu Val Gly Thr Asp Val Asn Leu Gly Cys Gly Ser Ile Thr
    370                 375                 380
Val Asn Tyr Asp Gly Lys Asn Lys Tyr Leu Thr Lys Ile Glu Asp Gly
385                 390                 395                 400
Ala Phe Ile Gly Cys Asn Ser Asn Leu Val Ala Pro Val Thr Val Gly
                405                 410                 415
Glu Gly Ala Tyr Val Ala Ala Gly Ser Thr Val Thr Glu Asp Val Pro
            420                 425                 430
Gly Lys Ala Leu Ala Ile Ala Arg Ala Arg Gln Val Asn Lys Asp Asp
        435                 440                 445
Tyr Val Lys Asn Ile His Lys Lys
    450                 455
<210>  31
<211>  26
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  31
ggatcctttc tatggataaa agggat                                         26
<210>  32
<211>  31
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  32
gttaacagga ttatttttta tgaatatttt t                                   31
<210>  33
<211>  20
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  33
cagagacgat ggaacagatg                                                20
<210>  34
<211>  20
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  34
ggagttaatg atagagttgc                                                20
<210>  35
<211>  20
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  35
gaagatcggg aattttgtag                                                20
<210>  36
<211>  20
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  36
catctgttcc atcgtctctg                                                20
<210>  37
<211>  20
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  37
gcaactctat cattaactcc                                                20
<210>  38
<211>  20
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  38
ctacaaaatt cccgatcttc                                                20
<210>  39
<211>  54
<212>  DNA
<213>  似马链球菌(Streptococcus equisimilis)
<400>  39
gtgtcggaac attcattaca tgcttaagca cccgctgtcc ttcttgttat ctcc          54
<210>  40
<211>  1203
<212>  DNA
<213>  似马链球菌(Streptococcus equisimilis)
<220>
<221>  CDS
<222>  (1)..(1203)
<223>
<400>  40
gtg aaa att tct gta gca ggc tca gga tat gtc ggc cta tcc ttg agt     48
Val Lys Ile Ser Val Ala Gly Ser Gly Tyr Val Gly Leu Ser Leu Ser
1               5                   10                  15
att tta ctg gca caa cat aat gac gtc act gtt gtt gat att att gat     96
Ile Leu Leu Ala Gln His Asn Asp Val Thr Val Val Asp Ile Ile Asp
            20                  25                  30
gaa aag gtg aga ttg atc aat caa ggc ata tct cca atc aag gat gct    144
Glu Lys Val Arg Leu Ile Asn Gln Gly Ile Ser Pro Ile Lys Asp Ala
        35                  40                  45
gat att gag gag tat tta aaa aat gcg ccg cta aat ctc aca gcg acc    192
Asp Ile Glu Glu Tyr Leu Lys Asn Ala Pro Leu Asn Leu Thr Ala Thr
    50                  55                  60
ctt gat ggc gca agc gct tat agc aat gca gac ctt att atc att gct    240
Leu Asp Gly Ala Ser Ala Tyr Ser Asn Ala Asp Leu Ile Ile Ile Ala
65                  70                  75                  80
act ccg aca aat tat gac agc gaa cgc aac tac ttt gac aca agg cat    288
Thr Pro Thr Asn Tyr Asp Ser Glu Arg Asn Tyr Phe Asp Thr Arg His
                85                  90                  95
gtt gaa gag gtc att gag cag gtc cta gac cta aat gcg tca gca acc    336
Val Glu Glu Val Ile Glu Gln Val Leu Asp Leu Asn Ala Ser Ala Thr
            100                 105                 110
att att atc aaa tca acc ata cca cta ggc ttt atc aag cat gtt agg    384
Ile Ile Ile Lys Ser Thr Ile Pro Leu Gly Phe Ile Lys His Val Arg
        115                 120                 125
gaa aaa tac cag aca gat cgt att att ttt agc cca gaa ttt tta aga    432
Glu Lys Tyr Gln Thr Asp Arg Ile Ile Phe Ser Pro Glu Phe Leu Arg
    130                 135                 140
gaa tca aaa gcc tta tac gat aac ctt tac cca agt cgg atc att gtt    480
Glu Ser Lys Ala Leu Tyr Asp Asn Leu Tyr Pro Ser Arg Ile Ile Val
145                 150                 155                 160
tct tat gaa aag gac gac tca cca agg gtt att cag gct gct aaa gcc    528
Ser Tyr Glu Lys Asp Asp Ser Pro Arg Val Ile Gln Ala Ala Lys Ala
                165                 170                 175
ttt gct ggt ctt tta aag gaa gga gcc aaa agc aag gat act ccg gtc    576
Phe Ala Gly Leu Leu Lys Glu Gly Ala Lys Ser Lys Asp Thr Pro Val
            180                 185                 190
tta ttt atg ggc tca cag gag gct gag gcg gtc aag cta ttt gcg aat    624
Leu Phe Met Gly Ser Gln Glu Ala Glu Ala Val Lys Leu Phe Ala Asn
        195                 200                 205
acc ttt ttg gct atg cgg gtg tct tac ttt aat gaa tta gac acc tat    672
Thr Phe Leu Ala Met Arg Val Ser Tyr Phe Asn Glu Leu Asp Thr Tyr
    210                 215                 220
tcc gaa agc aag ggt cta gat gct cag cgc gtg att gaa gga gtc tgt    720
Ser Glu Ser Lys Gly Leu Asp Ala Gln Arg Val Ile Glu Gly Val Cys
225                 230                 235                 240
cat gat cag cgc att ggt aac cat tac aat aac cct tcc ttt gga tat    768
His Asp Gln Arg Ile Gly Asn His Tyr Asn Asn Pro Ser Phe Gly Tyr
                245                 250                 255
ggc ggc tat tgc ctg cca aag gac agc aaa cag ctg ttg gca aat tat    816
Gly Gly Tyr Cys Leu Pro Lys Asp Ser Lys Gln Leu Leu Ala Asn Tyr
            260                 265                 270
aga ggc att ccc cag tcc ttg atg tca gcg att gtt gag tcc aac aag    864
Arg Gly Ile Pro Gln Ser Leu Met Ser Ala Ile Val Glu Ser Asn Lys
        275                 280                 285
ata cga aaa tcc tat tta gct gaa caa ata tta gac aga gcc tct agt    912
Ile Arg Lys Ser Tyr Leu Ala Glu Gln Ile Leu Asp Arg Ala Ser Ser
    290                 295                 300
caa aag cag gct ggt gta cca tta acg att ggc ttt tac cgc ttg att    960
Gln Lys Gln Ala Gly Val Pro Leu Thr Ile Gly Phe Tyr Arg Leu Ile
305                 310                 315                 320
atg aaa agc aac tct gat aat ttc cga gaa agc gcc att aaa gat att   1008
Met Lys Ser Asn Ser Asp Asn Phe Arg Glu Ser Ala Ile Lys Asp Ile
                325                 330                 335
att gat atc atc aac gac tat ggg gtt aat att gtc att tac gaa ccc    1056
Ile Asp Ile Ile Asn Asp Tyr Gly Val Asn Ile Val Ile Tyr Glu Pro
            340                 345                 350
atg ctt ggc gag gat att ggc tac agg gtt gtc aag gac tta gag cag    1104
Met Leu Gly Glu Asp Ile Gly Tyr Arg Val Val Lys Asp Leu Glu Gln
        355                 360                 365
ttc aaa aac gag tct aca atc att gtg tca aat cgc ttt gag gac gac    1152
Phe Lys Asn Glu Ser Thr Ile Ile Val Ser Asn Arg Phe Glu Asp Asp
    370                 375                 380
cta gga gat gtc att gat aag gtt tat acg aga gat gtc ttt gga aga    1200
Leu Gly Asp Val Ile Asp Lys Val Tyr Thr Arg Asp Val Phe Gly Arg
385                 390                 395                 400
gac                                                                1203
Asp
<210>  41
<211>  401
<212>  PRT
<213>  似马链球菌(Streptococcus equisimilis)
<400>  41
Val Lys Ile Ser Val Ala Gly Ser Gly Tyr Val Gly Leu Ser Leu Ser
1               5                   10                  15
Ile Leu Leu Ala Gln His Asn Asp Val Thr Val Val Asp Ile Ile Asp
            20                  25                  30
Glu Lys Val Arg Leu Ile Asn Gln Gly Ile Ser Pro Ile Lys Asp Ala
        35                  40                  45
Asp Ile Glu Glu Tyr Leu Lys Asn Ala Pro Leu Asn Leu Thr Ala Thr
    50                  55                  60
Leu Asp Gly Ala Ser Ala Tyr Ser Asn Ala Asp Leu Ile Ile Ile Ala
65                  70                  75                  80
Thr Pro Thr Asn Tyr Asp Ser Glu Arg Asn Tyr Phe Asp Thr Arg His
                85                  90                  95
Val Glu Glu Val Ile Glu Gln Val Leu Asp Leu Asn Ala Ser Ala Thr
            100                 105                 110
Ile Ile Ile Lys Ser Thr Ile Pro Leu Gly Phe Ile Lys His Val Arg
        115                 120                 125
Glu Lys Tyr Gln Thr Asp Arg Ile Ile Phe Ser Pro Glu Phe Leu Arg
    130                 135                 140
Glu Ser Lys Ala Leu Tyr Asp Asn Leu Tyr Pro Ser Arg Ile Ile Val
145                 150                 155                 160
Ser Tyr Glu Lys Asp Asp Ser Pro Arg Val Ile Gln Ala Ala Lys Ala
                165                 170                 175
Phe Ala Gly Leu Leu Lys Glu Gly Ala Lys Ser Lys Asp Thr Pro Val
            180                 185                 190
Leu Phe Met Gly Ser Gln Glu Ala Glu Ala Val Lys Leu Phe Ala Asn
        195                 200                 205
Thr Phe Leu Ala Met Arg Val Ser Tyr Phe Asn Glu Leu Asp Thr Tyr
    210                 215                 220
Ser Glu Ser Lys Gly Leu Asp Ala Gln Arg Val Ile Glu Gly Val Cys
225                 230                 235                 240
His Asp Gln Arg Ile Gly Asn His Tyr Asn Asn Pro Ser Phe Gly Tyr
                245                 250                 255
Gly Gly Tyr Cys Leu Pro Lys Asp Ser Lys Gln Leu Leu Ala Asn Tyr
            260                 265                 270
Arg Gly Ile Pro Gln Ser Leu Met Ser Ala Ile Val Glu Ser Asn Lys
        275                 280                 285
Ile Arg Lys Ser Tyr Leu Ala Glu Gln Ile Leu Asp Arg Ala Ser Ser
    290                 295                 300
Gln Lys Gln Ala Gly Val Pro Leu Thr Ile Gly Phe Tyr Arg Leu Ile
305                 310                 315                 320
Met Lys Ser Asn Ser Asp Asn Phe Arg Glu Ser Ala Ile Lys Asp Ile
                325                 330                 335
Ile Asp Ile Ile Asn Asp Tyr Gly Val Asn Ile Val Ile Tyr Glu Pro
            340                 345                 350
Met Leu Gly Glu Asp Ile Gly Tyr Arg Val Val Lys Asp Leu Glu Gln
        355                 360                 365
Phe Lys Asn Glu Ser Thr Ile Ile Val Ser Asn Arg Phe Glu Asp Asp
    370                 375                 380
Leu Gly Asp Val Ile Asp Lys Val Tyr Thr Arg Asp Val Phe Gly Arg
385                 390                 395                 400
Asp
<210>  42
<211>  900
<212>  DNA
<213>  似马链球菌(Streptococcus equisimilis)
<220>
<221>  CDS
<222>  (1)..(900)
<223>
<400>  42
atg aca aag gtc aga aaa gcc att atc cca gcc gcc ggc cta ggc act     48
Met Thr Lys Val Arg Lys Ala Ile Ile Pro Ala Ala Gly Leu Gly Thr
1               5                   10                  15
cgc ttc cta ccc gcc acc aag gca ctg gcc aag gaa atg ctc cca atc     96
Arg Phe Leu Pro Ala Thr Lys Ala Leu Ala Lys Glu Met Leu Pro Ile
            20                  25                  30
gtc gat aag cca acc att caa ttc atc gtc gag gaa gct cta aag gcc    144
Val Asp Lys Pro Thr Ile Gln Phe Ile Val Glu Glu Ala Leu Lys Ala
        35                  40                  45
ggt atc gag gag att ctt gtc gtc acc ggc aag gcc aaa cgc tct att    192
Gly Ile Glu Glu Ile Leu Val Val Thr Gly Lys Ala Lys Arg Ser Ile
    50                  55                  60
gaa gac cac ttt gac tcc aac ttc gag ctc gaa tac aat ctc caa gcc    240
Glu Asp His Phe Asp Ser Asn Phe Glu Leu Glu Tyr Asn Leu Gln Ala
65                  70                  75                  80
aag ggc aaa acc gag ctg ctc aag ctc gtt gat gag acc act gcc atc    288
Lys Gly Lys Thr Glu Leu Leu Lys Leu Val Asp Glu Thr Thr Ala Ile
                85                  90                  95
aac ctg cac ttc att cgt cag agc cac cct aga gga cta ggg gac gct    336
Asn Leu His Phe Ile Arg Gln Ser His Pro Arg Gly Leu Gly Asp Ala
            100                 105                 110
gtc ctc cag gcc aag gcc ttt gtg ggc aat gag ccc ttt gtg gtc atg    384
Val Leu Gln Ala Lys Ala Phe Val Gly Ash Glu Pro Phe Val Val Met
        115                 120                 125
ctg ggg gat gac ctc atg gat att acc aat cct agt gcc aag ccc ttg    432
Leu Gly Asp Asp Leu Met Asp Ile Thr Asn Pro Ser Ala Lys Pro Leu
    130                 135                 140
gcc aag cag ctc att gag gat tat gat tgc aca cac gcc tca acg att    480
Ala Lys Gln Leu Ile Glu Asp Tyr Asp Cys Thr His Ala Ser Thr Ile
145                 150                 155                 160
gca gtg atg agg gtg ccg cat gag gag gtt tcc aat tat ggc gtg att    528
Ala Val Met Arg Val Pro His Glu Glu Val Ser Asn Tyr Gly Val Ile
                165                 170                 175
gca ccg caa ggg aag gct gtt aag ggc ttg tat agt gtg gag acc ttt    576
Ala Pro Gln Gly Lys Ala Val Lys Gly Leu Tyr Ser Val Glu Thr Phe
            180                 185                 190
gtt gag aag cca agt cca gat gag gca ccg agt gac tta gcg att att    624
Val Glu Lys Pro Ser Pro Asp Glu Ala Pro Ser Asp Leu Ala Ile Ile
        195                 200                 205
ggt cga tat ttg ttg acg cct gag att ttt gcc ata ttg gag aat cag    672
Gly Arg Tyr Leu Leu Thr Pro Glu Ile Phe Ala Ile Leu Glu Asn Gln
    210                 215                 220
gcg cct ggg gct ggc aat gag gta cag cta gcc gat gcg att gac aag    720
Ala Pro Gly Ala Gly Asn Glu Val Gln Leu Ala Asp Ala Ile Asp Lys
225                 230                 235                 240
ctc aac aag act cag cgg gtt ttt gcg agg gag ttt aag gga gag cgg    768
Leu Asn Lys Thr Gln Arg Val Phe Ala Arg Glu Phe Lys Gly Glu Arg
                245                 250                 255
tat gat gtt ggg gac aag ttt ggc ttt atg aag acc tca ctt gac tat    816
Tyr Asp Val Gly Asp Lys Phe Gly Phe Met Lys Thr Ser Leu Asp Tyr
            260                 265                 270
gct ctc aag cac cct cag gtc aag gac gac ctc act gac tac att ata    864
Ala Leu Lys His Pro Gln Val Lys Asp Asp Leu Thr Asp Tyr Ile Ile
        275                 280                 285
aag ctc agt aag caa ctg aac aag gac gtt aaa aaa                    900
Lys Leu Ser Lys Gln Leu Asn Lys Asp Val Lys Lys
    290                 295                 300
<210>  43
<211>  300
<212>  PRT
<213>  似马链球菌(Streptococcus equisimiils)
<400>  43
Met Thr Lys Val Arg Lys Ala Ile Ile Pro Ala Ala Gly Leu Gly Thr
1               5                   10                  15
Arg Phe Leu Pro Ala Thr Lys Ala Leu Ala Lys Glu Met Leu Pro Ile
            20                  25                  30
Val Asp Lys Pro Thr Ile Gln Phe Ile Val Glu Glu Ala Leu Lys Ala
        35                  40                  45
Gly Ile Glu Glu Ile Leu Val Val Thr Gly Lys Ala Lys Arg Ser Ile
    50                  55                  60
Glu Asp His Phe Asp Ser Asn Phe Glu Leu Glu Tyr Asn Leu Gln Ala
65                  70                  75                  80
Lys Gly Lys Thr Glu Leu Leu Lys Leu Val Asp Glu Thr Thr Ala Ile
                85                  90                  95
Asn Leu His Phe Ile Arg Gln Ser His Pro Arg Gly Leu Gly Asp Ala
            100                 105                 110
Val Leu Gln Ala Lys Ala Phe Val Gly Asn Glu Pro Phe Val Val Met
        115                 120                 125
Leu Gly Asp Asp Leu Met Asp Ile Thr Asn Pro Ser Ala Lys Pro Leu
    130                 135                 140
Ala Lys Gln Leu Ile Glu Asp Tyr Asp Cys Thr His Ala Ser Thr Ile
145                 150                 155                 160
Ala Val Met Arg Val Pro His Glu Glu Val Ser Asn Tyr Gly Val Ile
                165                 170                 175
Ala Pro Gln Gly Lys Ala Val Lys Gly Leu Tyr Ser Val Glu Thr Phe
            180                 185                 190
Val Glu Lys Pro Ser Pro Asp Glu Ala Pro Ser Asp Leu Ala Ile Ile
        195                 200                 205
Gly Arg Tyr Leu Leu Thr Pro Glu Ile Phe Ala Ile Leu Glu Asn Gln
    210                 215                 220
Ala Pro Gly Ala Gly Asn Glu Val Gln Leu Ala Asp Ala Ile Asp Lys
225                 230                 235                 240
Leu Asn Lys Thr Gln Arg Val Phe Ala Arg Glu Phe Lys Gly Glu Arg
                245                 250                 255
Tyr Asp Val Gly Asp Lys Phe Gly Phe Met Lys Thr Ser Leu Asp Tyr
            260                 265                 270
Ala Leu Lys His Pro Gln Val Lys Asp Asp Leu Thr Asp Tyr Ile Ile
        275                 280                 285
Lys Leu Ser Lys Gln Leu Asn Lys Asp Val Lys Lys
    290                 295                 300
<210>  44
<211>  1380
<212>  DNA
<213>  似马链球菌(Streptococcus equisimilis)
<220>
<221>  CDS
<222>  (1)..(1380)
<223>
<400>  44
atg aaa aac tac gcc att atc cta gca gct gga aag gga acc cgc atg     48
Met Lys Asn Tyr Ala Ile Ile Leu Ala Ala Gly Lys Gly Thr Arg Met
1               5                   10                  15
aat tca ggg ctt tcc aag gtg ctg cac aag gta tca ggc cta agc atg     96
Asn Ser Gly Leu Ser Lys Val Leu His Lys Val Ser Gly Leu Ser Met
            20                  25                  30
ctg gag cat gtc ctc aag agc gtc tca gcc cta gct cct caa aag caa    144
Leu Glu His Val Leu Lys Ser Val Ser Ala Leu Ala Pro Gln Lys Gln
        35                  40                  45
ctc aca gtg atc ggt cat cag gca gag caa gta cgt gcc gtc cta ggt    192
Leu Thr Val Ile Gly His Gln Ala Glu Gln Val Arg Ala Val Leu Gly
    50                  55                  60
gat caa tta ctg aca gtg gtg caa gag gag cag cta gga aca ggc cat    240
Asp Gln Leu Leu Thr Val Val Gln Glu Glu Gln Leu Gly Thr Gly His
65                  70                  75                  80
gca gtc atg atg gca gaa gag gag cta tct ggc tta gaa ggg cag acc    288
Ala Val Met Met Ala Glu Glu Glu Leu Ser Gly Leu Glu Gly Gln Thr
                85                  90                  95
cta gtg att gca ggt gac acc ccc ttg atc aga gga gaa agc ctc aag    336
Leu Val Ile Ala Gly Asp Thr Pro Leu Ile Arg Gly Glu Ser Leu Lys
            100                 105                 110
gct ctg cta gac tat cat atc aga gaa aag aat gtg gca acc att ctc    384
Ala Leu Leu Asp Tyr His Ile Arg Glu Lys Asn Val Ala Thr Ile Leu
        115                 120                 125
aca gcc aat gcc aag gat ccc ttt ggc tac ggc cga atc att cgc aat     432
Thr Ala Asn Ala Lys Asp Pro Phe Gly Tyr Gly Arg Ile Ile Arg Asn
    130                 135                 140
gca gca gga gag gtg gtc aac atc gtt gaa caa aag gac gct aat gag     480
Ala Ala Gly Glu Val Val Asn Ile Val Glu Gln Lys Asp Ala Asn Glu
145                 150                 155                 160
gca gag caa gag gtc aag gag atc aac aca ggg acc tat atc ttt gac     528
Ala Glu Gln Glu Val Lys Glu Ile Asn Thr Gly Thr Tyr Ile Phe Asp
                165                 170                 175
aat aag cgc ctc ttt gag gct cta aag cat ctc acg act gat aat gcc     576
Asn Lys Arg Leu Phe Glu Ala Leu Lys His Leu Thr Thr Asp Asn Ala
            180                 185                 190
caa ggg gaa tat tac cta acc gat gtg atc agt att ttc aag gcc agc     624
Gln Gly Glu Tyr Tyr Leu Thr Asp Val Ile Ser Ile Phe Lys Ala Ser
        195                 200                 205
caa gaa aag gtt gga gct tac ctg ctg aag gat ttt gat gaa agc cta     672
Gln Glu Lys Val Gly Ala Tyr Leu Leu Lys Asp Phe Asp Glu Ser Leu
    210                 215                 220
ggg gtt aat gat cgc cta gct cta gcc cag gct gag gtg atc atg cag     720
Gly Val Asn Asp Arg Leu Ala Leu Ala Gln Ala Glu Val Ile Met Gln
225                 230                 235                 240
gag cgg atc aac aag cag cac atg ctt aat ggg gtg acc ctg caa aac     768
Glu Arg Ile Asn Lys Gln His Met Leu Asn Gly Val Thr Leu Gln Asn
                245                 250                 255
cct gca gct acc tat atc gaa agc agt gta gag att gcg ccg gac gtc     816
Pro Ala Ala Thr Tyr Ile Glu Ser Ser Val Glu Ile Ala Pro Asp Val
            260                 265                 270
ttg att gaa gct aat gtg acc cta aag gga cag act aga att ggc agc     864
Leu Ile Glu Ala Asn Val Thr Leu Lys Gly Gln Thr Arg Ile Gly Ser
        275                 280                 285
aga agt gtt ata acc aat ggg agc tat atc ctt gat tca agg ctt ggt     912
Arg Ser Val Ile Thr Asn Gly Ser Tyr Ile Leu Asp Ser Arg Leu Gly
    290                 295                 300
gag ggc gta gtg gtg agc cag tca gtg att gag ggc tca gtc cta gca     960
Glu Gly Val Val Val Ser Gln Ser Val Ile Glu Gly Ser Val Leu Ala
305                 310                 3l5                 320
gat ggt gtg aca gta ggg ccc tat gca cac att cgc ccg gac tct cag    1008
Asp Gly Val Thr Val Gly Pro Tyr Ala His Ile Arg Pro Asp Ser Gln
                325                 330                 335
ctc gat gag tgt gtt cat att ggg aac ttt gta gag gtt aag ggg tct    1056
Leu Asp Glu Cys Val His Ile Gly Asn Phe Val Glu Val Lys Gly Ser
            340                 345                 350
cat cta ggg gcc aat acc aag gca ggg cat ttg act tat ctg ggg aat    1104
His Leu Gly Ala Asn Thr Lys Ala Gly His Leu Thr Tyr Leu Gly Asn
        355                 360                 365
gcc gag att ggc tca gag gtt aat att ggt gca gga agc att acg gtt    1152
Ala Glu Ile Gly Ser Glu Val Asn Ile Gly Ala Gly Ser Ile Thr Val
    370                 375                 380
aat tat gat ggt caa cgg aaa tac cag aca gtg att ggc gat cac gct    1200
Asn Tyr Asp Gly Gln Arg Lys Tyr Gln Thr Val Ile Gly Asp His Ala
385                 390                 395                 400
ttt att ggg agt cat tcg act ttg ata gct ccg gta gag gtt ggg gag    1248
Phe Ile Gly Ser His Ser Thr Leu Ile Ala Pro Val Glu Val Gly Glu
                405                 410                 415
aat gct tta aca gca gca ggg tct acg ata gcc cag tcg gtg cca gca    1296
Asn Ala Leu Thr Ala Ala Gly Ser Thr Ile Ala Gln Ser Val Pro Ala
            420                 425                 430
gac agt gtg gct ata ggg cgt agc cgt cag gtg gtg aag gaa ggc tat    1344
Asp Ser Val Ala Ile Gly Arg Ser Arg Gln Val Val Lys Glu Gly Tyr
        435                 440                 445
gcc aag agg cta cca cat cac ccg gat cag ccc cag                    1380
Ala Lys Arg Leu Pro His His Pro Asp Gln Pro Gln
    450                 455                 460
<210>  45
<211>  460
<212>  PRT
<213>  似马链球菌(Streptococcus equisimilis)
<400>  45
Met Lys Asn Tyr Ala Ile Ile Leu Ala Ala Gly Lys Gly Thr Arg Met
1               5                   10                   15
Asn Ser Gly Leu Ser Lys Val Leu His Lys Val Ser Gly Leu Ser Met
            20                  25                  30
Leu Glu His Val Leu Lys Ser Val Ser Ala Leu Ala Pro Gln Lys Gln
        35                  40                  45
Leu Thr Val Ile Gly His Gln Ala Glu Gln Val Arg Ala Val Leu Gly
    50                  55                  60
Asp Gln Leu Leu Thr Val Val Gln Glu Glu Gln Leu Gly Thr Gly His
65                  70                  75                  80
Ala Val Met Met Ala Glu Glu Glu Leu Ser Gly Leu Glu Gly Gln Thr
                85                  90                  95
Leu Val Ile Ala Gly Asp Thr Pro Leu Ile Arg Gly Glu Ser Leu Lys
            100                 105                 110
Ala Leu Leu Asp Tyr His Ile Arg Glu Lys Asn Val Ala Thr Ile Leu
        115                 120                 125
Thr Ala Asn Ala Lys Asp Pro Phe Gly Tyr Gly Arg Ile Ile Arg Asn
    130                 135                 140
Ala Ala Gly Glu Val Val Asn Ile Val Glu Gln Lys Asp Ala Asn Glu
145                 150                 155                 160
Ala Glu Gln Glu Val Lys Glu Ile Asn Thr Gly Thr Tyr Ile Phe Asp
                165                 170                 175
Asn Lys Arg Leu Phe Glu Ala Leu Lys His Leu Thr Thr Asp Asn Ala
            180                 185                 190
Gln Gly Glu Tyr Tyr Leu Thr Asp Val Ile Ser Ile Phe Lys Ala Ser
        195                 200                 205
Gln Glu Lys Val Gly Ala Tyr Leu Leu Lys Asp Phe Asp Glu Ser Leu
    210                 215                 220
Gly Val Asn Asp Arg Leu Ala Leu Ala Gln Ala Glu Val Ile Met Gln
225                 230                 235                 240
Glu Arg Ile Asn Lys Gln His Met Leu Asn Gly Val Thr Leu Gln Asn
                245                 250                 255
Pro Ala Ala Thr Tyr Ile Glu Ser Ser Val Glu Ile Ala Pro Asp Val
            260                 265                 270
Leu Ile Glu Ala Asn Val Thr Leu Lys Gly Gln Thr Arg Ile Gly Ser
        275                 280                 285
Arg Ser Val Ile Thr Asn Gly Ser Tyr Ile Leu Asp Ser Arg Leu Gly
    290                 295                 300
Glu Gly Val Val Val Ser Gln Ser Val Ile Glu Gly Ser Val Leu Ala
305                 310                 315                 320
Asp Gly Val Thr Val Gly Pro Tyr Ala His Ile Arg Pro Asp Ser Gln
                325                 330                 335
Leu Asp Glu Cys Val His Ile Gly Asn Phe Val Glu Val Lys Gly Ser
            340                 345                 350
His Leu Gly Ala Asn Thr Lys Ala Gly His Leu Thr Tyr Leu Gly Asn
        355                 360                 365
Ala Glu Ile Gly Ser Glu Val Asn Ile Gly Ala Gly Ser Ile Thr Val
    370                 375                 380
Asn Tyr Asp Gly Gln Arg Lys Tyr Gln Thr Val Ile Gly Asp His Ala
385                 390                 395                 400
Phe Ile Gly Ser His Ser Thr Leu Ile Ala Pro Val Glu Val Gly Glu
                405                 410                 415
Asn Ala Leu Thr Ala Ala Gly Ser Thr Ile Ala Gln Ser Val Pro Ala
            420                 425                 430
Asp Ser Val Ala Ile Gly Arg Ser Arg Gln Val Val Lys Glu Gly Tyr
        435                 440                 445
 Ala Lys Arg Leu Pro His His Pro Asp Gln Pro Gln
     450                 455                 460
<210>  46
<211>  29
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  46
gcggccgcgg tacctgtgtt acacctgtt                                      29
<210>  47
<211>  38
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  47
gtcaagctta attctcatgt ttgacagctt atcatcgg                            38
<210>  48
<211>  18
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  48
catgggagag acctttgg                                                  18
<210>  49
<211>  17
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  49
gtcggtcttc catttgc                                                   17
<210>  50
<211>  17
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  50
cgaccactgt atcttgg                                                   17
<210>  51
<211>  17
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  51
gagatgccaa acagtgc                                                   17
<210>  52
<211>  16
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  52
catgtccatc gtgacg                                                    16
<210>  53
<211>  17
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  53
caggagcatt tgatacg                                                   17
<210>  54
<211>  16
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  54
ccttcagatg tgatcc                                                    16
<210>  55
<211>  17
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  55
gtgttgacgt caactgc                                                   17
<210>  56
<211>  18
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  56
gttcagcctt tcctctcg                                                  18
<210>  57
<211>  18
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  57
gctaccttct ttcttagg                                                  18
<210>  58
<211>  18
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  58
cgtcaatatg atctgtgc                                                  18
<210>   59
<211>  17
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  59
ggaaagaagg tctgtgc                                                   17
<210>  60
<211>  17
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  60
cagctatcag ctgacag                                                   17
<210>  61
<211>  20
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  61
gctcagctat gacatattcc                                                20
<210>  62
<211>  17
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  62
gatcgtcttg attaccg                                                   17
<210>  63
<211>  16
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  63
agctttatcg gtgacg                                                    16
<210>  64
<211>  16
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  64
tgagcacgat tgcagg                                                    16
<210>  65
<211>  17
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  65
cattgcggag acattgc                                                   17
<210>  66
<211>  26
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  66
tagacaattg gaagagaaaa gagata                                         26
<210>  67
<211>  20
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  67
ccgtcgctat tgtaaccagt                                                20
<210>  68
<211>  29
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  68
ggaattccaa agctgcagcg gccggcgcg                                      29
<210>  69
<211>  32
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  69
gaagatctcg tatacttggc ttctgcagct gc                                  32
<210>  70
<211>  31
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  70
gaagatctgg tcaacaagct ggaaagcact c                                   31
<210>  71
<211>  33
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  71
cccaagcttc gtgacgtaca gcaccgttcc ggc                                 33
<210>  72
<211>  50
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  72
ccttaagggc cgaatattta tacggagctc cctgaaacaa caaaaacggc               50
<210>  73
<211>  34
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  73
ggtgttctct agagcggccg cggttgcggt cagc                                34
<210>  74
<211>  27
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  74
gtccttcttg gtacctggaa gcagagc                                        27
<210>  75
<211>  39
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  75
gtataaatat tcggccctta aggccagtac cattttccc                           39
<210>  76
<211>  13
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  76
gggccggatc cgc                                                       13
<210>  77
<211>  20
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  77
attcccggcc taggcgccgg                                                20
<210>  78
<211>  19
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  78
ggaaattatc gtgatcaac                                                 19
<210>  79
<211>  21
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  79
gcacgagcac tgataaatat g                                              21
<210>  80
<211>  21
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  80
catatttatc agtgctcgtg c                                              21
<210>  81
<211>  17
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  81
tcgtagacct catatgc                                                   17
<210>  82
<211>  17
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  82
gtcgttaaac cgtgtgc                                                   17
<210>  83
<211>  39
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  83
ctagaggatc cccgggtacc gtgctctgcc ttttagtcc                           39
<210>  84
<211>  37
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  84
gtacatcgaa ttcgtgctca ttattaatct gttcagc                             37
<210>  85
<211>  20
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  85
aactattgcc gatgataagc                                                20
<210>  86
<211>  1260
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<220>
<221>  CDS
<222>  (1)..(1260)
<223>
<400>  86
atg aaa aaa gtg atg tta gct acg gct ttg ttt tta gga ttg act cca     48
Met Lys Lys Val Met Leu Ala Thr Ala Leu Phe Leu Gly Leu Thr Pro
1               5                   10                  15
gct ggc gcg aac gca gct gat tta ggc cac cag acg ttg gga tcc aat     96
Ala Gly Ala Asn Ala Ala Asp Leu Gly His Gln Thr Leu Gly Ser Asn
            20                  25                  30
gat ggc tgg ggc gcg tac tcg acc ggc acg aca ggc gga tca aaa gca    144
Asp Gly Trp Gly Ala Tyr Ser Thr Gly Thr Thr Gly Gly Ser Lys Ala
        35                  40                  45
tcc tcc tca aat gtg tat acc gtc agc aac aga aac cag ctt gtc tcg    192
Ser Ser Ser Asn Val Tyr Thr Val Ser Asn Arg Asn Gln Leu Val Ser
    50                  55                  60
gca tta ggg aag gaa acg aac aca acg cca aaa atc att tat atc aag    240
Ala Leu Gly Lys Glu Thr Asn Thr Thr Pro Lys Ile Ile Tyr Ile Lys
65                  70                  75                  80
gga acg att gac atg aac gtg gat gac aat ctg aag ccg ctt ggc cta    288
Gly Thr Ile Asp Met Asn Val Asp Asp Asn Leu Lys Pro Leu Gly Leu
                85                  90                  95
aat gac tat aaa gat ccg gag tat gat ttg gac aaa tat ttg aaa gcc    336
Asn Asp Tyr Lys Asp Pro Glu Tyr Asp Leu Asp Lys Tyr Leu Lys Ala
            l00                 105                 110
tat gat cct agc aca tgg ggc aaa aaa gag ccg tcg gga aca caa gaa    384
Tyr Asp Pro Ser Thr Trp Gly Lys Lys Glu Pro Ser Gly Thr Gln Glu
        115                 120                 125
gaa gcg aga gca cgc tct cag aaa aac caa aaa gca cgg gtc atg gtg    432
Glu Ala Arg Ala Arg Ser Gln Lys Asn Gln Lys Ala Arg Val Met Val
    130                 135                 140
gat atc cct gca aac acg acg atc gtc ggt tca ggg act aac gct aaa    480
Asp Ile Pro Ala Asn Thr Thr Ile Val Gly Ser Gly Thr Asn Ala Lys
145                 150                 155                 160
gtc gtg gga gga aac ttc caa atc aag agt gat aac gtc att att cgc    528
Val Val Gly Gly Asn Phe Gln Ile Lys Ser Asp Asn Val Ile Ile Arg
                165                 170                 175
aac att gaa ttc cag gat gcc tat gac tat ttt ccg caa tgg gat ccg    576
Asn Ile Glu Phe Gln Asp Ala Tyr Asp Tyr Phe Pro Gln Trp Asp Pro
            180                 185                 190
act gac gga agc tca ggg aac tgg aac tca caa tac gac aac atc acg    624
Thr Asp Gly Ser Ser Gly Asn Trp Asn Ser Gln Tyr Asp Asn Ile Thr
        195                 200                 205
ata aac ggc ggc aca cac atc tgg att gat cac tgt aca ttt aat gac    672
Ile Asn Gly Gly Thr His Ile Trp Ile Asp His Cys Thr Phe Asn Asp
    210                 215                 220
ggt tcg cgt ccg gac agc aca tca ccg aaa tat tat gga aga aaa tat     720
Gly Ser Arg Pro Asp Ser Thr Ser Pro Lys Tyr Tyr Gly Arg Lys Tyr
225                 230                 235                 240
cag cac cat gac ggc caa acg gat gct tcc aac ggt gct aac tat atc     768
Gln His His Asp Gly Gln Thr Asp Ala Ser Asn Gly Ala Asn Tyr Ile
                245                 250                 255
acg atg tcc tac aac tat tat cac gat cat gat aaa agc tcc att ttc     816
Thr Met Ser Tyr Asn Tyr Tyr His Asp His Asp Lys Ser Ser Ile Phe
            260                 265                 270
gga tca agt gac agc aaa acc tcc gat gac ggc aaa tta aaa att acg     864
Gly Ser Ser Asp Ser Lys Thr Ser Asp Asp Gly Lys Leu Lys Ile Thr
        275                 280                 285
ctg cat cat aac cgc tat aaa aat att gtc cag cgc gcg ccg aga gtc     912
Leu His His Asn Arg Tyr Lys Asn Ile Val Gln Arg Ala Pro Arg Val
    290                 295                 300
cgc ttc ggg caa gtg cac gta tac aac aac tat tat gaa gga agc aca     960
Arg Phe Gly Gln Val His Val Tyr Asn Asn Tyr Tyr Glu Gly Ser Thr
305                 310                 315                 320
agc tct tca agt tat cct ttt agc tat gca tgg gga atc gga aag tca    1008
Ser Ser Ser Ser Tyr Pro Phe Ser Tyr Ala Trp Gly Ile Gly Lys Ser
                325                 330                 335
tct aaa atc tat gcc caa aac aat gtc att gac gta ccg gga ctg tca    1056
Ser Lys Ile Tyr Ala Gln Asn Asn Val Ile Asp Val Pro Gly Leu Ser
            340                 345                 350
gct gct aaa acg atc agc gta ttc agc ggg gga acg gct tta tat gac    1104
Ala Ala Lys Thr Ile Ser Val Phe Ser Gly Gly Thr Ala Leu Tyr Asp
        355                 360                 365
tcc ggc acg ttg ctg aac ggc aca cag atc aac gca tcg gct gca aac    1152
Ser Gly Thr Leu Leu Asn Gly Thr Gln Ile Asn Ala Ser Ala Ala Asn
    370                 375                 380
ggg ctg agc tct tct gtc ggc tgg acg ccg tct ctg cat gga tcg att    1200
Gly Leu Ser Ser Ser Val Gly Trp Thr Pro Ser Leu His Gly Ser Ile
385                 390                 395                 400
gat gct tct gct aat gtg aaa tca aat gtt ata aat caa gcg ggt gcg    1248
Asp Ala Ser Ala Asn Val Lys Ser Asn Val Ile Asn Gln Ala Gly Ala
405                 410                 415
ggt aaa tta aat                                                    1260
Gly Lys Leu Asn
            420
<210>  87
<211>  420
<212>  PRT
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  87
Met Lys Lys Val Met Leu Ala Thr Ala Leu Phe Leu Gly Leu Thr Pro
1               5                   10                  15
Ala Gly Ala Asn Ala Ala Asp Leu Gly His Gln Thr Leu Gly Ser Asn
            20                  25                  30
Asp Gly Trp Gly Ala Tyr Ser Thr Gly Thr Thr Gly Gly Ser Lys Ala
        35                  40                  45
Ser Ser Ser Asn Val Tyr Thr Val Ser Asn Arg Asn Gln Leu Val Ser
    50                  55                  60
Ala Leu Gly Lys Glu Thr Asn Thr Thr Pro Lys Ile Ile Tyr Ile Lys
65                  70                  75                  80
Gly Thr Ile Asp Met Asn Val Asp Asp Asn Leu Lys Pro Leu Gly Leu
                85                  90                  95
Asn Asp Tyr Lys Asp Pro Glu Tyr Asp Leu Asp Lys Tyr Leu Lys Ala
            100                 105                 110
Tyr Asp Pro Ser Thr Trp Gly Lys Lys Glu Pro Ser Gly Thr Gln Glu
        115                 120                 125
Glu Ala Arg Ala Arg Ser Gln Lys Asn Gln Lys Ala Arg Val Met Val
    130                 135                 140
Asp Ile Pro Ala Asn Thr Thr Ile Val Gly Ser Gly Thr Asn Ala Lys
145                 150                 155                 160
Val Val Gly Gly Asn Phe Gln Ile Lys Ser Asp Asn Val Ile Ile Arg
                165                 170                 175
Asn Ile Glu Phe Gln Asp Ala Tyr Asp Tyr Phe Pro Gln Trp Asp Pro
            180                 185                 190
Thr Asp Gly Ser Ser Gly Asn Trp Asn Ser Gln Tyr Asp Asn Ile Thr
        195                 200                 205
Ile Asn Gly Gly Thr His Ile Trp Ile Asp His Cys Thr Phe Asn Asp
    210                 215                 220
Gly Ser Arg Pro Asp Ser Thr Ser Pro Lys Tyr Tyr Gly Arg Lys Tyr
225                 230                 235                 240
Gln His His Asp Gly Gln Thr Asp Ala Ser Asn Gly Ala Asn Tyr Ile
                245                 250                 255
Thr Met Ser Tyr Asn Tyr Tyr His Asp His Asp Lys Ser Ser Ile Phe
            260                 265                 270
Gly Ser Ser Asp Ser Lys Thr Ser Asp Asp Gly Lys Leu Lys Ile Thr
        275                 280                 285
Leu His His Asn Arg Tyr Lys Asn Ile Val Gln Arg Ala Pro Arg Val
    290                 295                 300
Arg Phe Gly Gln Val His Val Tyr Asn Asn Tyr Tyr Glu Gly Ser Thr
305                 310                 315                 320
Ser Ser Ser Ser Tyr Pro Phe Ser Tyr Ala Trp Gly Ile Gly Lys Ser
                325                 330                 335
Ser Lys Ile Tyr Ala Gln Asn Asn Val Ile Asp Val Pro Gly Leu Ser
            340                 345                 350
Ala Ala Lys Thr Ile Ser Val Phe Ser Gly Gly Thr Ala Leu Tyr Asp
        355                 360                 365
Ser Gly Thr Leu Leu Asn Gly Thr Gln Ile Asn Ala Ser Ala Ala Asn
    370                 375                 380
Gly Leu Ser Ser Ser Val Gly Trp Thr Pro Ser Leu His Gly Ser Ile
385                 390                 395                 400
Asp Ala Ser Ala Asn Val Lys Ser Asn Val Ile Asn Gln Ala Gly Ala
                405                 410                 415
Gly Lys Leu Asn
            420
<210>  88
<211>  26
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  88
actagtaatg atggctgggg cgcgta                                           26
<210>  89
<211>  26
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  89
gtcgacatgt tgtcgtattg tgagtt                                           26
<210>  90
<211>  52
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  90
gagctctaca acgcttatgg atccgcggcc gcggcggcac acacatctgg at              52
<210>  91
<211>  26
<212>  DNA
<213>  枯草芽孢杆菌(Bacillus subtilis)
<400>  91
gacgtcagcc cgtttgcagc cgatgc                                           26
<210>  92
<211>  1257
<212>  DNA
<213>  酿脓链球菌(Streptococcus pyogenes)
<220>
<221>  CDS
<222>  (1)..(1257)
<223>
<400>  92
gtg cct att ttt aaa aaa act tta att gtt tta tcc ttt att ttt ttg     48
Val Pro Ile Phe Lys Lys Thr Leu Ile Val Leu Ser Phe Ile Phe Leu
1               5                   10                  15
ata tct atc ttg att tat cta aat atg tat cta ttt gga aca tca act     96
Ile Ser Ile Leu Ile Tyr Leu Asn Met Tyr Leu Phe Gly Thr Ser Thr
            20                  25                  30
gta gga att tat gga gta ata tta ata acc tat cta gtt att aaa ctt    144
Val Gly Ile Tyr Gly Val Ile Leu Ile Thr Tyr Leu Val Ile Lys Leu
        35                  40                  45
gga tta tct ttc ctt tat gag cca ttt aaa gga aag cca cat gac tat    192
Gly Leu Ser Phe Leu Tyr Glu Pro Phe Lys Gly Lys Pro His Asp Tyr
    50                  55                  60
aaa gtt gct gct gta att cct tct tat aat gaa gat gcc gag tca tta    240
Lys Val Ala Ala Val Ile Pro Ser Tyr Asn Glu Asp Ala Glu Ser Leu
65                  70                  75                  80
tta gaa act ctt aaa agt gtg tta gca cag acc tat ccg tta tca gaa    288
Leu Glu Thr Leu Lys Ser Val Leu Ala Gln Thr Tyr Pro Leu Ser Glu
                85                  90                  95
att tat att gtt gat gat ggg agt tca aac aca gat gca ata caa tta    336
Ile Tyr Ile Val Asp Asp Gly Ser Ser Asn Thr Asp Ala Ile Gln Leu
            100                 105                 110
att gaa gag tat gta aat aga gaa gtg gat att tgt cga aac gtt atc    384
Ile Glu Glu Tyr Val Asn Arg Glu Val Asp Ile Cys Arg Asn Val Ile
        115                 120                 125
gtt cac cgt tcc ctt gtc aat aaa gga aaa cgc cat gct caa gcg tgg    432
Val His Arg Ser Leu Val Asn Lys Gly Lys Arg His Ala Gln Ala Trp
    130                 135                 140
gca ttt gaa aga tct gac gct gac gtt ttt tta acc gta gat tca gat    480
Ala Phe Glu Arg Ser Asp Ala Asp Val Phe Leu Thr Val Asp Ser Asp
145                 150                 155                 160
act tat atc tat cca aat gcc tta gaa gaa ctc cta aaa agc ttc aat    528
Thr Tyr Ile Tyr Pro Asn Ala Leu Glu Glu Leu Leu Lys Ser Phe Asn
                165                 170                 175
gat gag aca gtt tat gct gca aca gga cat ttg aat gct aga aac aga    576
Asp Glu Thr Val Tyr Ala Ala Thr Gly His Leu Asn Ala Arg Asn Arg
            180                 185                 190
caa act aat cta tta acg cga ctt aca gat atc cgt tac gat aat gcc    624
Gln Thr Asn Leu Leu Thr Arg Leu Thr Asp Ile Arg Tyr Asp Asn Ala
        195                 200                 205
ttt ggg gtg gag cgt gct gct caa tca tta aca ggt aat att tta gtt    672
Phe Gly Val Glu Arg Ala Ala Gln Ser Leu Thr Gly Asn Ile Leu Val
    210                 215                 220
tgc tca gga cca ttg agt att tat cga cgt gaa gtg att att cct aac    720
Cys Ser Gly Pro Leu Ser Ile Tyr Arg Arg Glu Val Ile Ile Pro Asn
225                 230                 235                 240
tta gag cgc tat aaa aat caa aca ttc cta ggt tta cct gtt agc att    768
Leu Glu Arg Tyr Lys Asn Gln Thr Phe Leu Gly Leu Pro Val Ser Ile
                245                 250                 255
ggg gat gat cga tgt tta aca aat tat gct att gat tta gga cgc act    816
Gly Asp Asp Arg Cys Leu Thr Asn Tyr Ala Ile Asp Leu Gly Arg Thr
            260                 265                 270
gtc tac caa tca aca gct aga tgt gat act gat gta cct ttc caa tta    864
Val Tyr Gln Ser Thr Ala Arg Cys Asp Thr Asp Val Pro Phe Gln Leu
        275                 280                 285
aaa agt tat tta aag caa caa aat cga tgg aat aaa tct ttt ttt aaa    912
Lys Ser Tyr Leu Lys Gln Gln Asn Arg Trp Asn Lys Ser Phe Phe Lys
    290                 295                 300
gaa tct att att tct gtt aaa aaa att ctt tct aat ccc atc gtt gcc     960
Glu Ser Ile Ile Ser Val Lys Lys Ile Leu Ser Asn Pro Ile Val Ala
305                 310                 315                 320
tta tgg act att ttc gaa gtc gtt atg ttt atg atg ttg att gtc gca    1008
Leu Trp Thr Ile Phe Glu Val Val Met Phe Met Met Leu Ile Val Ala
                325                 330                 335
att ggg aat ctt ttg ttt aat caa gct att caa tta gac ctt att aaa    1056
Ile Gly Asn Leu Leu Phe Asn Gln Ala Ile Gln Leu Asp Leu Ile Lys
            340                 345                 350
ctt ttt gcc ttt tta tcc atc atc ttt atc gtt gct tta tgt cgt aat    1104
Leu Phe Ala Phe Leu Ser Ile Ile Phe Ile Val Ala Leu Cys Arg Asn
        355                 360                 365
gtt cat tat atg atc aaa cat cct gct agt ttt ttg tta tct cct ctg    1152
Val His Tyr Met Ile Lys His Pro Ala Ser Phe Leu Leu Ser Pro Leu
    370                 375                 380
tat gga ata tta cac ttg ttt gtc tta cag ccc cta aaa ctt tat tct    1200
Tyr Gly Ile Leu His Leu Phe Val Leu Gln Pro Leu Lys Leu Tyr Ser
385                 390                 395                 400
tta tgc acc att aaa aat acg gaa tgg gga aca cgt aaa aag gtc act    1248
Leu Cys Thr Ile Lys Asn Thr Glu Trp Gly Thr Arg Lys Lys Val Thr
                405                 410                 415
att ttt aaa                                                        1257
Ile Phe Lys
<210>  93
<211>  419
<212>  PRT
<213>  酿脓链球菌(Streptococcus pyogenes)
<400>  93
Val Pro Ile Phe Lys Lys Thr Leu Ile Val Leu Ser Phe Ile Phe Leu
1               5                   10                  15
Ile Ser Ile Leu Ile Tyr Leu Asn Met Tyr Leu Phe Gly Thr Ser Thr
            20                  25                  30
Val Gly Ile Tyr Gly Val Ile Leu Ile Thr Tyr Leu Val Ile Lys Leu
        35                  40                  45
Gly Leu Ser Phe Leu Tyr Glu Pro Phe Lys Gly Lys Pro His Asp Tyr
    50                  55                  60
Lys Val Ala Ala Val Ile Pro Ser Tyr Asn Glu Asp Ala Glu Ser Leu
65                  70                  75                  80
Leu Glu Thr Leu Lys Ser Val Leu Ala Gln Thr Tyr Pro Leu Ser Glu
                85                  90                  95
Ile Tyr Ile Val Asp Asp Gly Ser Ser Asn Thr Asp Ala Ile Gln Leu
            100                 105                 110
Ile Glu Glu Tyr Val Asn Arg Glu Val Asp Ile Cys Arg Asn Val Ile
        115                 120                 125
Val His Arg Ser Leu Val Asn Lys Gly Lys Arg His Ala Gln Ala Trp
    130                 135                 140
Ala Phe Glu Arg Ser Asp Ala Asp Val Phe Leu Thr Val Asp Ser Asp
145                 150                 155                 160
Thr Tyr Ile Tyr Pro Asn Ala Leu Glu Glu Leu Leu Lys Ser Phe Asn
                165                 170                 175
Asp Glu Thr Val Tyr Ala Ala Thr Gly His Leu Asn Ala Arg Asn Arg
            180                 185                 190
Gln Thr Asn Leu Leu Thr Arg Leu Thr Asp Ile Arg Tyr Asp Asn Ala
        195                 200                 205
Phe Gly Val Glu Arg Ala Ala Gln Ser Leu Thr Gly Asn Ile Leu Val
    210                 215                 220
Cys Ser Gly Pro Leu Ser Ile Tyr Arg Arg Glu Val Ile Ile Pro Asn
225                 230                 235                 240
Leu Glu Arg Tyr Lys Asn Gln Thr Phe Leu Gly Leu Pro Val Ser Ile
                245                 250                 255
Gly Asp Asp Arg Cys Leu Thr Asn Tyr Ala Ile Asp Leu Gly Arg Thr
            260                 265                 270
Val Tyr Gln Ser Thr Ala Arg Cys Asp Thr Asp Val Pro Phe Gln Leu
        275                 280                 285
Lys Ser Tyr Leu Lys Gln Gln Asn Arg Trp Asn Lys Ser Phe Phe Lys
    290                 295                 300
Glu Ser Ile Ile Ser Val Lys Lys Ile Leu Ser Asn Pro Ile Val Ala
305                 310                 315                 320
Leu Trp Thr Ile Phe Glu Val Val Met Phe Met Met Leu Ile Val Ala
                325                 330                 335
Ile Gly Asn Leu Leu Phe Asn Gln Ala Ile Gln Leu Asp Leu Ile Lys
            340                 345                 350
Leu Phe Ala Phe Leu Ser Ile Ile Phe Ile Val Ala Leu Cys Arg Asn
        355                 360                 365
Val His Tyr Met Ile Lys His Pro Ala Ser Phe Leu Leu Ser Pro Leu
    370                 375                 380
Tyr Gly Ile Leu His Leu Phe Val Leu Gln Pro Leu Lys Leu Tyr Ser
385                 390                 395                 400
Leu Cys Thr Ile Lys Asn Thr Glu Trp Gly Thr Arg Lys Lys Val Thr
                405                 410                 415
Ile Phe Lys
<210>  94
<211>  2916
<212>  DNA
<213>  出血败血性巴斯德菌(Paseurella multocida)
<220>
<221>  CDS
<222>  (1)..(2916)
<223>
<400>  94
atg aat aca tta tca caa gca ata aaa gca tat aac agc aat gac tat     48
Met Asn Thr Leu Ser Gln Ala Ile Lys Ala Tyr Asn Ser Asn Asp Tyr
1               5                   10                  15
caa tta gca ctc aaa tta ttt gaa aag tcg gcg gaa atc tat gga cgg     96
Gln Leu Ala Leu Lys Leu Phe Glu Lys Ser Ala Glu Ile Tyr Gly Arg
            20                  25                  30
asa att gtt gaa ttt caa att acc aaa tgc caa gaa aaa ctc tca gca    144
Lys Ile Val Glu Phe Gln Ile Thr Lys Cys Gln Glu Lys Leu Ser Ala
        35                  40                  45
cat cct tct gtt aat tca gca cat ctt tct gta aat aaa gaa gaa aaa    192
His Pro Ser Val Asn Ser Ala His Leu Ser Val Asn Lys Glu Glu Lys
    50                  55                  60
gtc aat gtt tgc gat agt ccg tta gat att gca aca caa ctg tta ctt    240
Val Asn Val Cys Asp Ser Pro Leu Asp Ile Ala Thr Gln Leu Leu Leu
65                  70                  75                  80
tcc aac gta aaa aaa tta gta ctt tct gac tcg gaa aaa aac acg tta    288
Ser Asn Val Lys Lys Leu Val Leu Ser Asp Ser Glu Lys Asn Thr Leu
                85                  90                  95
aaa aat aaa tgg aaa ttg ctc act gag aag aaa tct gaa aat gcg gag    336
Lys Asn Lys Trp Lys Leu Leu Thr Glu Lys Lys Ser Glu Asn Ala Glu
            100                 105                 110
gta aga gcg gtc gcc ctt gta cca aaa gat ttt ccc aaa gat ctg gtt    384
Val Arg Ala Val Ala Leu Val Pro Lys Asp Phe Pro Lys Asp Leu Val
        115                 120                 125
tta gcg cct tta cct gat cat gtt aat gat ttt aca tgg tac aaa aag    432
Leu Ala Pro Leu Pro Asp His Val Asn Asp Phe Thr Trp Tyr Lys Lys
    130                 135                 140
cga aag aaa aga ctt ggc ata aaa cct gaa cat caa cat gtt ggt ctt    480
Arg Lys Lys Arg Leu Gly Ile Lys Pro Glu His Gln His Val Gly Leu
145                 150                 155                 160
tct att atc gtt aca aca ttc aat cga cca gca att tta tcg att aca    528
Ser Ile Ile Val Thr Thr Phe Asn Arg Pro Ala Ile Leu Ser Ile Thr
                165                 170                 175
tta gcc tgt tta gta aac caa aaa aca cat tac ccg ttt gaa gtt atc    576
Leu Ala Cys Leu Val Asn Gln Lys Thr His Tyr Pro Phe Glu Val Ile
            180                 185                 190
gtg aca gat gat ggt agt cag gaa gat cta tca ccg atc att cgc caa    624
Val Thr Asp Asp Gly Ser Gln Glu Asp Leu Ser Pro Ile Ile Arg Gln
        195                 200                 205
tat gaa aat aaa ttg gat att cgc tac gtc aga caa aaa gat aac ggt    672
Tyr Glu Asn Lys Leu Asp Ile Arg Tyr Val Arg Gln Lys Asp Asn Gly
    210                 215                 220
ttt caa gcc agt gcc gct cgg aat atg gga tta cgc tta gca aaa tat    720
Phe Gln Ala Ser Ala Ala Arg Asn Met Gly Leu Arg Leu Ala Lys Tyr
225                 230                 235                 240
gac ttt att ggc tta ctc gac tgt gat atg gcg cca aat cca tta tgg    768
Asp Phe Ile Gly Leu Leu Asp Cys Asp Met Ala Pro Asn Pro Leu Trp
                245                 250                 255
gtt cat tct tat gtt gca gag cta tta gaa gat gat gat tta aca atc    816
Val His Ser Tyr Val Ala Glu Leu Leu Glu Asp Asp Asp Leu Thr Ile
            260                 265                 270
att ggt cca aga aaa tac atc gat aca caa cat att gac cca aaa gac    864
Ile Gly Pro Arg Lys Tyr Ile Asp Thr Gln His Ile Asp Pro Lys Asp
        275                 280                 285
ttc tta aat aac gcg agt ttg ctt gaa tca tta cca gaa gtg aaa acc     912
Phe Leu Asn Asn Ala Ser Leu Leu Glu Ser Leu Pro Glu Val Lys Thr
    290                 295                 300
aat aat agt gtt gcc gca aaa ggg gaa gga aca gtt tct ctg gat tgg     960
Asn Asn Ser Val Ala Ala Lys Gly Glu Gly Thr Val Ser Leu Asp Trp
305                 310                 315                 320
cgc tta gaa caa ttc gaa aaa aca gaa aat ctc cgc tta tcc gat tcg    1008
Arg Leu Glu Gln Phe Glu Lys Thr Glu Asn Leu Arg Leu Ser Asp Ser
                325                 330                 335
cct ttc cgt ttt ttt gcg gcg ggt aat gtt gct ttc gct aaa aaa tgg    1056
Pro Phe Arg Phe Phe Ala Ala Gly Asn Val Ala Phe Ala Lys Lys Trp
            340                 345                 350
cta aat aaa tcc ggt ttc ttt gat gag gaa ttt aat cac tgg ggt gga    1104
Leu Asn Lys Ser Gly Phe Phe Asp Glu Glu Phe Asn His Trp Gly Gly
        355                 360                 365
gaa gat gtg gaa ttt gga tat cgc tta ttc cgt tac ggt agt ttc ttt    1152
Glu Asp Val Glu Phe Gly Tyr Arg Leu Phe Arg Tyr Gly Ser Phe Phe
    370                 375                 380
aaa act att gat ggc att atg gcc tac cat caa gag cca cca ggt aaa    1200
Lys Thr Ile Asp Gly Ile Met Ala Tyr His Gln Glu Pro Pro Gly Lys
385                 390                 395                 400
gaa aat gaa acc gat cgt gaa gcg gga aaa aat att acg ctc gat att    1248
Glu Asn Glu Thr Asp Arg Glu Ala Gly Lys Asn Ile Thr Leu Asp Ile
                405                 410                 415
atg aga gaa aag gtc cct tat atc tat aga aaa ctt tta cca ata gaa    1296
Met Arg Glu Lys Val Pro Tyr Ile Tyr Arg Lys Leu Leu Pro Ile Glu
            420                 425                 430
gat tcg cat atc aat aga gta cct tta gtt tca att tat atc cca gct    1344
Asp Ser His Ile Asn Arg Val Pro Leu Val Ser Ile Tyr Ile Pro Ala
        435                 440                 445
tat aac tgt gca aac tat att caa cgt tgc gta gat agt gca ctg aat    1392
Tyr Asn Cys Ala Asn Tyr Ile Gln Arg Cys Val Asp Ser Ala Leu Asn
    450                 455                 460
cag act gtt gtt gat ctc gag gtt tgt att tgt aac gat ggt tca aca    1440
Gln Thr Val Val Asp Leu Glu Val Cys Ile Cys Asn Asp Gly Ser Thr
465                 470                 475                 480
gat aat acc tta gaa gtg atc aat aag ctt tat ggt aat aat cct agg    1488
Asp Asn Thr Leu Glu Val Ile Asn Lys Leu Tyr Gly Asn Asn Pro Arg
                485                 490                 495
gta cgc atc atg tct aaa cca aat ggc gga ata gcc tca gca tca aat    1536
Val Arg Ile Met Ser Lys Pro Asn Gly Gly Ile Ala Ser Ala Ser Asn
            500                 505                 510
gca gcc gtt tct ttt gct aaa ggt tat tac att ggg cag tta gat tca    1584
Ala Ala Val Ser Phe Ala Lys Gly Tyr Tyr Ile Gly Gln Leu Asp Ser
        515                 520                 525
gat gat tat ctt gag cct gat gca gtt gaa ctg tgt tta aaa gaa ttt    1632
Asp Asp Tyr Leu Glu Pro Asp Ala Val Glu Leu Cys Leu Lys Glu Phe
    530                 535                 540
tta aaa gat aaa acg cta gct tgt gtt tat acc act aat aga aac gtc    1680
Leu Lys Asp Lys Thr Leu Ala Cys Val Tyr Thr Thr Asn Arg Asn Val
545                 550                 555                 560
aat ccg gat ggt agc tta atc gct aat ggt tac aat tgg cca gaa ttt    1728
Asn Pro Asp Gly Ser Leu Ile Ala Asn Gly Tyr Asn Trp Pro Glu Phe
                565                 570                 575
tca cga gaa aaa ctc aca acg gct atg att gct cac cac ttt aga atg    1776
Ser Arg Glu Lys Leu Thr Thr Ala Met Ile Ala His His Phe Arg Met
            580                 585                 590
ttc acg att aga gct tgg cat tta act gat gga ttc aat gaa aaa att    1824
Phe Thr Ile Arg Ala Trp His Leu Thr Asp Gly Phe Asn Glu Lys Ile
        595                 600                 605
gaa aat gcc gta gac tat gac atg ttc ctc aaa ctc agt gaa gtt gga    1872
Glu Asn Ala Val Asp Tyr Asp Met Phe Leu Lys Leu Ser Glu Val Gly
    610                 615                 620
aaa ttt aaa cat ctt aat aaa atc tgc tat aac cgt gta tta cat ggt    1920
Lys Phe Lys His Leu Asn Lys Ile Cys Tyr Asn Arg Val Leu His Gly
625                 630                 635                 640
gat aac aca tca att aag aaa ctt ggc att caa aag aaa aac cat ttt    1968
Asp Asn Thr Ser Ile Lys Lys Leu Gly Ile Gln Lys Lys Asn His Phe
                645                 650                 655
gtt gta gtc aat cag tca tta aat aga caa ggc ata act tat tat aat    2016
Val Val Val Asn Gln Ser Leu Asn Arg Gln Gly Ile Thr Tyr Tyr Asn
            660                 665                 670
tat gac gaa ttt gat gat tta gat gaa agt aga aag tat att ttc aat    2064
Tyr Asp Glu Phe Asp Asp Leu Asp Glu Ser Arg Lys Tyr Ile Phe Asn
        675                 680                 685
aaa acc gct gaa tat caa gaa gag att gat atc tta aaa gat att aaa    2112
Lys Thr Ala Glu Tyr Gln Glu Glu Ile Asp Ile Leu Lys Asp Ile Lys
    690                 695                 700
atc atc cag aat aaa gat gcc aaa atc gca gtc agt att ttt tat ccc    2160
Ile Ile Gln Asn Lys Asp Ala Lys Ile Ala Val Ser Ile Phe Tyr Pro
705                 710                 715                 720
aat aca tta aac ggc tta gtg aaa aaa cta aac aat att att gaa tat    2208
Asn Thr Leu Asn Gly Leu Val Lys Lys Leu Asn Asn Ile Ile Glu Tyr
                725                 730                 735
aat aaa aat ata ttc gtt att gtt cta cat gtt gat aag aat cat ctt    2256
Asn Lys Asn Ile Phe Val Ile Val Leu His Val Asp Lys Asn His Leu
            740                 745                 750
aca cca gat atc aaa aaa gaa ata cta gcc ttc tat cat aaa cat caa    2304
Thr Pro Asp Ile Lys Lys Glu Ile Leu Ala Phe Tyr His Lys His Gln
        755                 760                 765
gtg aat att tta cta aat aat gat atc tca tat tac acg agt aat aga    2352
Val Asn Ile Leu Leu Asn Asn Asp Ile Ser Tyr Tyr Thr Ser Asn Arg
    770                 775                 780
tta ata aaa act gag gcg cat tta agt aat att aat aaa tta agt cag    2400
Leu Ile Lys Thr Glu Ala His Leu Ser Asn Ile Asn Lys Leu Ser Gln
785                 790                 795                 800
tta aat cta aat tgt gaa tac atc att ttt gat aat cat gac agc cta    2448
Leu Asn Leu Asn Cys Glu Tyr Ile Ile Phe Asp Asn His Asp Ser Leu
                805                 810                 815
ttc gtt aaa aat gac agc tat gct tat atg aaa aaa tat gat gtc ggc    2496
Phe Val Lys Asn Asp Ser Tyr Ala Tyr Met Lys Lys Tyr Asp Val Gly
            820                 825                 830
atg aat ttc tca gca tta aca cat gat tgg atc gag aaa atc aat gcg    2544
Met Asn Phe Ser Ala Leu Thr His Asp Trp Ile Glu Lys Ile Asn Ala
        835                 840                 845
cat cca cca ttt aaa aag ctc att aaa act tat ttt aat gac aat gac    2592
His Pro Pro Phe Lys Lys Leu Ile Lys Thr Tyr Phe Asn Asp Asn Asp
    850                 855                 860
tta aaa agt atg aat gtg aaa ggg gca tca caa ggt atg ttt atg acg    2640
Leu Lys Ser Met Asn Val Lys Gly Ala Ser Gln Gly Met Phe Met Thr
865                 870                 875                 880
tat gcg cta gcg cat gag ctt ctg acg att att aaa gaa gtc atc aca    2688
Tyr Ala Leu Ala His Glu Leu Leu Thr Ile Ile Lys Glu Val Ile Thr
                885                 890                 895
tct tgc cag tca att gat agt gtg cca gaa tat aac act gag gat att    2736
Ser Cys Gln Ser Ile Asp Ser Val Pro Glu Tyr Asn Thr Glu Asp Ile
            900                 905                 910
tgg ttc caa ttt gca ctt tta atc tta gaa aag aaa acc ggc cat gta    2784
Trp Phe Gln Phe Ala Leu Leu Ile Leu Glu Lys Lys Thr Gly His Val
        915                 920                 925
ttt aat aaa aca tcg acc ctg act tat atg cct tgg gaa cga aaa tta    2832
Phe Asn Lys Thr Ser Thr Leu Thr Tyr Met Pro Trp Glu Arg Lys Leu
    930                 935                 940
caa tgg aca aat gaa caa att gaa agt gca aaa aga gga gaa aat ata    2880
Gln Trp Thr Asn Glu Gln Ile Glu Ser Ala Lys Arg Gly Glu Asn Ile
945                 950                 955                 960
cct gtt aac aag ttc att att aat agt ata act cta                    2916
Pro Val Asn Lys Phe Ile Ile Asn Ser Ile Thr Leu
                965                 970
<210>  95
<211>  972
<212>  PRT
<213>  出血败血性巴斯德菌(Paseurella multocida)
<400>  95
Met Asn Thr Leu Ser Gln Ala Ile Lys Ala Tyr Asn Ser Asn Asp Tyr
1               5                   10                  15
Gln Leu Ala Leu Lys Leu Phe Glu Lys Ser Ala Glu Ile Tyr Gly Arg
            20                  25                  30
Lys Ile Val Glu Phe Gln Ile Thr Lys Cys Gln Glu Lys Leu Ser Ala
        35                  40                  45
His Pro Ser Val Asn Ser Ala His Leu Ser Val Asn Lys Glu Glu Lys
    50                  55                  60
Val Asn Val Cys Asp Ser Pro Leu Asp Ile Ala Thr Gln Leu Leu Leu
65                  70                  75                  80
Ser Asn Val Lys Lys Leu Val Leu Ser Asp Ser Glu Lys Asn Thr Leu
                85                  90                  95
Lys Asn Lys Trp Lys Leu Leu Thr Glu Lys Lys Ser Glu Asn Ala Glu
            100                 105                 110
Val Arg Ala Val Ala Leu Val Pro Lys Asp Phe Pro Lys Asp Leu Val
        115                 120                 125
Leu Ala Pro Leu Pro Asp His Val Asn Asp Phe Thr Trp Tyr Lys Lys
    130                 135                 140
Arg Lys Lys Arg Leu Gly Ile Lys Pro Glu His Gln His Val Gly Leu
145                 150                 155                 160
Ser Ile Ile Val Thr Thr Phe Asn Arg Pro Ala Ile Leu Ser Ile Thr
                165                 170                 175
Leu Ala Cys Leu Val Asn Gln Lys Thr His Tyr Pro Phe Glu Val Ile
            180                 185                 190
Val Thr Asp Asp Gly Ser Gln Glu Asp Leu Ser Pro Ile Ile Arg Gln
        195                 200                 205
Tyr Glu Asn Lys Leu Asp Ile Arg Tyr Val Arg Gln Lys Asp Asn Gly
    210                 215                 220
Phe Gln Ala Ser Ala Ala Arg Asn Met Gly Leu Arg Leu Ala Lys Tyr
225                 230                 235                 240
Asp Phe Ile Gly Leu Leu Asp Cys Asp Met Ala Pro Asn Pro Leu Trp
                245                 250                 255
Val His Ser Tyr Val Ala Glu Leu Leu Glu Asp Asp Asp Leu Thr Ile
            260                 265                 270
Ile Gly Pro Arg Lys Tyr Ile Asp Thr Gln His Ile Asp Pro Lys Asp
        275                 280                 285
Phe Leu Asn Asn Ala Ser Leu Leu Glu Ser Leu Pro Glu Val Lys Thr
    290                 295                 300
Asn Asn Ser Val Ala Ala Lys Gly Glu Gly Thr Val Ser Leu Asp Trp
305                 310                 315                 320
Arg Leu Glu Gln Phe Glu Lys Thr Glu Asn Leu Arg Leu Ser Asp Ser
                325                 330                 335
Pro Phe Arg Phe Phe Ala Ala Gly Asn Val Ala Phe Ala Lys Lys Trp
            340                 345                 350
Leu Asn Lys Ser Gly Phe Phe Asp Glu Glu Phe Asn His Trp Gly Gly
        355                 360                 365
Glu Asp Val Glu Phe Gly Tyr Arg Leu Phe Arg Tyr Gly Ser Phe Phe
    370                 375                 380
Lys Thr Ile Asp Gly Ile Met Ala Tyr His Gln Glu Pro Pro Gly Lys
385                 390                 395                 400
Glu Asn Glu Thr Asp Arg Glu Ala Gly Lys Asn Ile Thr Leu Asp Ile
                405                 410                 415
Met Arg Glu Lys Val Pro Tyr Ile Tyr Arg Lys Leu Leu Pro Ile Glu
            420                 425                 430
Asp Ser His Ile Asn Arg Val Pro Leu Val Ser Ile Tyr Ile Pro Ala
        435                 440                 445
Tyr Asn Cys Ala Asn Tyr Ile Gln Arg Cys Val Asp Ser Ala Leu Asn
    450                 455                 460
Gln Thr Val Val Asp Leu Glu Val Cys Ile Cys Asn Asp Gly Ser Thr
465                 470                 475                 480
Asp Asn Thr Leu Glu Val Ile Asn Lys Leu Tyr Gly Asn Asn Pro Arg
                485                 490                 495
Val Arg Ile Met Ser Lys Pro Asn Gly Gly Ile Ala Ser Ala Ser Asn
            500                 505                 510
Ala Ala Val Ser Phe Ala Lys Gly Tyr Tyr Ile Gly Gln Leu Asp Ser
        515                 520                 525
Asp Asp Tyr Leu Glu Pro Asp Ala Val Glu Leu Cys Leu Lys Glu Phe
    530                 535                 540
Leu Lys Asp Lys Thr Leu Ala Cys Val Tyr Thr Thr Asn Arg Asn Val
545                 550                 555                 560
Asn Pro Asp Gly Ser Leu Ile Ala Asn Gly Tyr Asn Trp Pro Glu Phe
                565                 570                 575
Ser Arg Glu Lys Leu Thr Thr Ala Met Ile Ala His His Phe Arg Met
            580                 585                 590
Phe Thr Ile Arg Ala Trp His Leu Thr Asp Gly Phe Asn Glu Lys Ile
        595                 600                 605
Glu Asn Ala Val Asp Tyr Asp Met Phe Leu Lys Leu Ser Glu Val Gly
    610                 615                 620
Lys Phe Lys His Leu Asn Lys Ile Cys Tyr Asn Arg Val Leu His Gly
625                 630                 635                 640
Asp Asn Thr Ser Ile Lys Lys Leu Gly Ile Gln Lys Lys Asn His Phe
                645                 650                 655
Val Val Val Asn Gln Ser Leu Asn Arg Gln Gly Ile Thr Tyr Tyr Asn
            660                 665                 670
Tyr Asp Glu Phe Asp Asp Leu Asp Glu Ser Arg Lys Tyr Ile Phe Asn
        675                 680                 685
Lys Thr Ala Glu Tyr Gln Glu Glu Ile Asp Ile Leu Lys Asp Ile Lys
    690                 695                 700
Ile Ile Gln Asn Lys Asp Ala Lys Ile Ala Val Ser Ile Phe Tyr Pro
705                 710                 715                 720
Asn Thr Leu Asn Gly Leu Val Lys Lys Leu Asn Asn Ile Ile Glu Tyr
                725                 730                 735
Asn Lys Asn Ile Phe Val Ile Val Leu His Val Asp Lys Asn His Leu
            740                 745                 750
Thr Pro Asp Ile Lys Lys Glu Ile Leu Ala Phe Tyr His Lys His Gln
        755                 760                 765
Val Asn Ile Leu Leu Asn Asn Asp Ile Ser Tyr Tyr Thr Ser Asn Arg
    770                 775                 780
Leu Ile Lys Thr Glu Ala His Leu Ser Asn Ile Asn Lys Leu Ser Gln
785                 790                 795                 800
Leu Asn Leu Asn Cys Glu Tyr Ile Ile Phe Asp Asn His Asp Ser Leu
                805                 810                 815
Phe Val Lys Asn Asp Ser Tyr Ala Tyr Met Lys Lys Tyr Asp Val Gly
            820                 825                 830
Met Asn Phe Ser Ala Leu Thr His Asp Trp Ile Glu Lys Ile Asn Ala
        835                 840                 845
His Pro Pro Phe Lys Lys Leu Ile Lys Thr Tyr Phe Asn Asp Asn Asp
    850                 855                 860
Leu Lys Ser Met Asn Val Lys Gly Ala Ser Gln Gly Met Phe Met Thr
865                 870                 875                 880
Tyr Ala Leu Ala His Glu Leu Leu Thr Ile Ile Lys Glu Val Ile Thr
                885                 890                 895
Ser Cys Gln Ser Ile Asp Ser Val Pro Glu Tyr Asn Thr Glu Asp Ile
            900                 905                 910
Trp Phe Gln Phe Ala Leu Leu Ile Leu Glu Lys Lys Thr Gly His Val
        915                 920                 925
Phe Asn Lys Thr Ser Thr Leu Thr Tyr Met Pro Trp Glu Arg Lys Leu
    930                 935                 940
Gln Trp Thr Asn Glu Gln Ile Glu Ser Ala Lys Arg Gly Glu Asn Ile
945                 950                 955                 960
Pro Val Asn Lys Phe Ile Ile Asn Ser Ile Thr Leu
                965                 970
<210>  96
<211>  1206
<212>  DNA
<213>  酿脓链球菌(Streptococcus pyogenes)
<220>
<221>  CDS
<222>  (1)..(1206)
<223>
<400>  96
atg aaa ata gca gtt gct gga tca gga tat gtt gga tta tca cta gga     48
Met Lys Ile Ala Val Ala Gly Ser Gly Tyr Val Gly Leu Ser Leu Gly
1               5                   10                  15
gtt ctt tta tca ctt caa aac gaa gtc act att gtt gat att ctt ccc     96
Val Leu Leu Ser Leu Gln Asn Glu Val Thr Ile Val Asp Ile Leu Pro
            20                  25                  30
tct aaa gtt gat aag att aat aat ggc tta tca cca att caa gat gaa    144
Ser Lys Val Asp Lys Ile Asn Asn Gly Leu Ser Pro Ile Gln Asp Glu
        35                  40                  45
tat att gaa tat tac tta aaa agt aag caa tta tct att aaa gca act    192
Tyr Ile Glu Tyr Tyr Leu Lys Ser Lys Gln Leu Ser Ile Lys Ala Thr
    50                  55                  60
tta gat agc aaa gca gct tat aaa gaa gcg gaa ctg gtc att att gcc    240
Leu Asp Ser Lys Ala Ala Tyr Lys Glu Ala Glu Leu Val Ile Ile Ala
65                  70                  75                  80
aca cct aca aat tac aac agt aga att aat tat ttt gat aca cag cat    288
Thr Pro Thr Asn Tyr Asn Ser Arg Ile Asn Tyr Phe Asp Thr Gln His
                85                  90                  95
gtt gaa aca gtt atc aaa gag gta cta agc gtt aat agc cat gca act    336
Val Glu Thr Val Ile Lys Glu Val Leu Ser Val Asn Ser His Ala Thr
            l00                 105                 110
ctt atc atc aaa tca aca att cca ata ggt ttc att act gaa atg aga    384
Leu Ile Ile Lys Ser Thr Ile Pro Ile Gly Phe Ile Thr Glu Met Arg
        115                 120                 125
cag aaa ttc caa act gat cgt att atc ttc agc cct gaa ttt tta aga    432
Gln Lys Phe Gln Thr Asp Arg Ile Ile Phe Ser Pro Glu Phe Leu Arg
    130                 135                 140
gaa tct aaa gct tta tat gac aac tta tat cca agc cga att att gtt    480
Glu Ser Lys Ala Leu Tyr Asp Asn Leu Tyr Pro Ser Arg Ile Ile Val
145                 150                 155                 160
tct tgt gaa gaa aac gat tct cca aaa gta aag gca gac gca gaa aaa    528
Ser Cys Glu Glu Asn Asp Ser Pro Lys Val Lys Ala Asp Ala Glu Lys
                165                 170                 175
ttt gca ctt tta tta aag tct gca gct aaa aaa aat aat gta cca gta    576
Phe Ala Leu Leu Leu Lys Ser Ala Ala Lys Lys Asn Asn Val Pro Val
            180                 185                 190
ctt att atg gga gct tca gaa gct gaa gca gta aaa cta ttt gcc aat    624
Leu Ile Met Gly Ala Ser Glu Ala Glu Ala Val Lys Leu Phe Ala Asn
        195                 200                 205
act tat tta gcg tta agg gta gct tat ttt aat gag tta gac act tac    672
Thr Tyr Leu Ala Leu Arg Val Ala Tyr Phe Asn Glu Leu Asp Thr Tyr
    210                 215                 220
gca gaa tcg aga aaa tta aat agt cac atg att att caa gga att tct    720
Ala Glu Ser Arg Lys Leu Asn Ser His Met Ile Ile Gln Gly Ile Ser
225                 230                 235                 240
tat gat gat cga ata gga atg cat tat aat aac cca tca ttt ggt tat    768
Tyr Asp Asp Arg Ile Gly Met His Tyr Asn Asn Pro Ser Phe Gly Tyr
                245                 250                 255
gga ggt tat tgt cta cct aaa gat acg aag caa tta ttg gca aat tac    816
Gly Gly Tyr Cys Leu Pro Lys Asp Thr Lys Gln Leu Leu Ala Asn Tyr
            260                 265                 270
aat aat att cct caa acg cta att gaa gct atc gtt tca tca aat aat    864
Asn Asn Ile Pro Gln Thr Leu Ile Glu Ala Ile Val Ser Ser Asn Asn
        275                 280                 285
gtg cgc aag tcc tat att gct aag caa att atc aac gtc tta gaa gag    912
Val Arg Lys Ser Tyr Ile Ala Lys Gln Ile Ile Asn Val Leu Glu Glu
    290                 295                 300
cgg gag tcc cca gta aaa gta gtc ggg gtt tac cgt tta att atg aaa    960
Arg Glu Ser Pro Val Lys Val Val Gly Val Tyr Arg Leu Ile Met Lys
305                 310                 315                 320
agt aac tca gat aat ttt aga gaa agt gct atc aaa gat gtt att gac   1008
Ser Asn Ser Asp Asn Phe Arg Glu Ser Ala Ile Lys Asp Val Ile Asp
                325                 330                 335
att ctt aaa agt aaa gac att aag ata att att tat gag cca atg tta    1056
Ile Leu Lys Ser Lys Asp Ile Lys Ile Ile Ile Tyr Glu Pro Met Leu
            340                 345                 350
aac aaa ctt gaa tct gaa gat caa tct gta ctt gta aat gat tta gag    1104
Asn Lys Leu Glu Ser Glu Asp Gln Ser Val Leu Val Asn Asp Leu Glu
        355                 360                 365
aat ttc aag aaa caa gca aat att atc gta act aat cgc tat gat aat    1152
Asn Phe Lys Lys Gln Ala Asn Ile Ile Val Thr Asn Arg Tyr Asp Asn
    370                 375                 380
gaa tta caa gat gtt aaa aat aaa gtt tac agt aga gat att ttt aat    1200
Glu Leu Gln Asp Val Lys Asn Lys Val Tyr Ser Arg Asp Ile Phe Asn
385                 390                 395                 400
aga gac                                                            1206
Arg Asp
<210>  97
<211>  402
<212>  PRT
<213>  酿脓链球菌(Streptococcus pyogenes)
<400>  97
Met Lys Ile Ala Val Ala Gly Ser Gly Tyr Val Gly Leu Ser Leu Gly
1               5                   10                  15
Val Leu Leu Ser Leu Gln Asn Glu Val Thr Ile Val Asp Ile Leu Pro
            20                  25                  30
Ser Lys Val Asp Lys Ile Asn Asn Gly Leu Ser Pro Ile Gln Asp Glu
        35                  40                  45
Tyr Ile Glu Tyr Tyr Leu Lys Ser Lys Gln Leu Ser Ile Lys Ala Thr
    50                  55                  60
Leu Asp Ser Lys Ala Ala Tyr Lys Glu Ala Glu Leu Val Ile Ile Ala
65                  70                  75                  80
Thr Pro Thr Asn Tyr Asn Ser Arg Ile Asn Tyr Phe Asp Thr Gln His
                85                  90                  95
Val Glu Thr Val Ile Lys Glu Val Leu Ser Val Asn Ser His Ala Thr
            100                 105                 110
Leu Ile Ile Lys Ser Thr Ile Pro Ile Gly Phe Ile Thr Glu Met Arg
        115                 120                 125
Gln Lys Phe Gln Thr Asp Arg Ile Ile Phe Ser Pro Glu Phe Leu Arg
    130                 135                 140
Glu Ser Lys Ala Leu Tyr Asp Asn Leu Tyr Pro Ser Arg Ile Ile Val
145                 150                 155                 160
Ser Cys Glu Glu Asn Asp Ser Pro Lys Val Lys Ala Asp Ala Glu Lys
                165                 170                 175
Phe Ala Leu Leu Leu Lys Ser Ala Ala Lys Lys Asn Asn Val Pro Val
            180                 185                 190
Leu Ile Met Gly Ala Ser Glu Ala Glu Ala Val Lys Leu Phe Ala Asn
        195                 200                 205
Thr Tyr Leu Ala Leu Arg Val Ala Tyr Phe Asn Glu Leu Asp Thr Tyr
    210                 215                 220
Ala Glu Ser Arg Lys Leu Asn Ser His Met Ile Ile Gln Gly Ile Ser
225                 230                 235                 240
Tyr Asp Asp Arg Ile Gly Met His Tyr Asn Asn Pro Ser Phe Gly Tyr
                245                 250                 255
Gly Gly Tyr Cys Leu Pro Lys Asp Thr Lys Gln Leu Leu Ala Asn Tyr
            260                 265                 270
Asn Asn Ile Pro Gln Thr Leu Ile Glu Ala Ile Val Ser Ser Asn Asn
        275                 280                 285
Val Arg Lys Ser Tyr Ile Ala Lys Gln Ile Ile Asn Val Leu Glu Glu
    290                 295                 300
Arg Glu Ser Pro Val Lys Val Val Gly Val Tyr Arg Leu Ile Met Lys
305                 310                 315                 320
Ser Asn Ser Asp Asn Phe Arg Glu Ser Ala Ile Lys Asp Val Ile Asp
                325                 330                 335
Ile Leu Lys Ser Lys Asp Ile Lys Ile Ile Ile Tyr Glu Pro Met Leu
            340                 345                 350
Asn Lys Leu Glu Ser Glu Asp Gln Ser Val Leu Val Asn Asp Leu Glu
        355                 360                 365
Asn Phe Lys Lys Gln Ala Asn Ile Ile Val Thr Asn Arg Tyr Asp Asn
    370                 375                 380
Glu Leu Gln Asp Val Lys Asn Lys Val Tyr Ser Arg Asp Ile Phe Asn
385                 390                 395                 400
Arg Asp
<210>  98
<211>  912
<212>  DNA
<213>  酿脓链球菌(Streptococcus pyogenes)
<220>
<221>  CDS
<222>  (1)..(912)
<223>
<400>  98
atg acc aaa gtc aga aaa gcc att att cct gct gca ggt cta gga aca     48
Met Thr Lys Val Arg Lys Ala Ile Ile Pro Ala Ala Gly Leu Gly Thr
1               5                   10                  15
cgt ttt tta cct gct acc aaa gct ctt gcc aaa gag atg ttg ccc atc     96
Arg Phe Leu Pro Ala Thr Lys Ala Leu Ala Lys Glu Met Leu Pro Ile
            20                  25                  30
gtt gat aaa cca acc atc cag ttt atc gtc gaa gaa gcg cta aaa tct    144
Val Asp Lys Pro Thr Ile Gln Phe Ile Val Glu Glu Ala Leu Lys Ser
        35                  40                  45
ggc atc gag gaa atc ctt gtg gtg acc gga aaa gct aaa cgc tct atc    192
Gly Ile Glu Glu Ile Leu Val Val Thr Gly Lys Ala Lys Arg Set Ile
    50                  55                  60
gag gac cat ttt gat tca aac ttt gaa tta gaa tac aac ctc caa gct    240
Glu Asp His Phe Asp Ser Asn Phe Glu Leu Glu Tyr Asn Leu Gln Ala
65                  70                  75                  80
aag ggg aaa aat gaa ctg ttg aaa tta gtg gat gaa acc act gcc att    288
Lys Gly Lys Asn Glu Leu Leu Lys Leu Val Asp Glu Thr Thr Ala Ile
                85                  90                  95
aac ctt cat ttt atc cgt caa agc cac cca aga ggg ctg gga gat gct    336
Asn Leu His Phe Ile Arg Gln Ser His Pro Arg Gly Leu Gly Asp Ala
            100                 105                 110
gtc tta caa gcc aaa gcc ttt gtg ggc aat gaa ccc ttt gtg gtc atg    384
Val Leu Gln Ala Lys Ala Phe Val Gly Asn Glu Pro Phe Val Val Met
        115                 120                 125
ctt gga gat gac tta atg gac att aca aat gca tcc gct aaa cct ctc    432
Leu Gly Asp Asp Leu Met Asp Ile Thr Asn Ala Ser Ala Lys Pro Leu
    130                 135                 140
acc aaa caa crc atg gag gac tat gac aag acg cat gca tcc act atc    480
Thr Lys Gln Leu Met Glu Asp Tyr Asp Lys Thr His Ala Ser Thr Ile
145                 150                 155                 160
gct gtg atg aaa gtt cct cat gaa gat gtg tct age tat ggg gtt atc    528
Ala Val Met Lys Val Pro His Glu Asp Val Ser Ser Tyr Gly Val Ile
                165                 170                 175
gct cct caa ggc aag gct gtc aag ggc ctt tac agt gta gac acc ttt    576
Ala Pro Gln Gly Lys Ala Val Lys Gly Leu Tyr Ser Val Asp Thr Phe
            180                 185                 190
gtt gaa aaa cca caa cca gaa gat gcg cct agt gat ttg get att att    624
Val Glu Lys Pro Gln Pro Glu Asp Ala Pro Ser Asp Leu Ala Ile Ile
        195                 200                 205
ggt cgt tac ctc cta acc cct gaa att ttt ggt att ttg gaa aga cag    672
Gly Arg Tyr Leu Leu Thr Pro Glu Ile Phe Gly Ile Leu Glu Arg Gln
    210                 215                 220
acc cct gga gca ggt aac gaa gtg caa ctc aca gat gct atc gat acc    720
Thr Pro Gly Ala Gly Asn Glu Val Gln Leu Thr Asp Ala Ile Asp Thr
225                 230                 235                 240
ctc aat aaa act cag cgt gte ttt gca cga gaa ttt aaa ggc aat cgt    768
Leu Asn Lys Thr Gln Arg Val Phe Ala Arg Glu Phe Lys Gly Asn Arg
                245                 250                 255
tac gat gtt ggg gat aaa ttt gga ttc atg aaa aca tct atc gac tat    816
Tyr Asp Val Gly Asp Lys Phe Gly Phe Met Lys Thr Ser Ile Asp Tyr
            260                 265                 270
gcc tta gaa cac cca cag gtc aaa gag gac ttg aaa aat tac att atc 864
Ala Leu Glu His Pro Gln Val Lys Glu Asp Leu Lys Asn Tyr Ile Ile
        275                 280                 285
aaa cta gga aaa gct ttg gaa aaa agt aaa gta cca aca cat tca aag    912
Lys Leu Gly Lys Ala Leu Glu Lys Ser Lys Val Pro Thr His Ser Lys
    290                 295                 300
<210>  99
<211>  304
<212>  PRT
<213>  酿脓链球菌(Streptococcus pyogenes)
<400>  99
Met Thr Lys Val Arg Lys Ala Ile Ile Pro Ala Ala Gly Leu Gly Thr
1               5                   10                  15
Arg Phe Leu Pro Ala Thr Lys Ala Leu Ala Lys Glu Met Leu Pro Ile
            20                  25                  30
Val Asp Lys Pro Thr Ile Gln Phe Ile Val Glu Glu Ala Leu Lys Ser
        35                  40                  45
Gly Ile Glu Glu Ile Leu Val Val Thr Gly Lys Ala Lys Arg Ser Ile
    50                  55                  60
Glu Asp His Phe Asp Ser Asn Phe Glu Leu Glu Tyr Asn Leu Gln Ala
65                  70                  75                  80
Lys Gly Lys Asn Glu Leu Leu Lys Leu Val Asp Glu Thr Thr Ala Ile
                85                  90                  95
Asn Leu His Phe Ile Arg Gln Ser His Pro Arg Gly Leu Gly Asp Ala
            100                 105                 110
Val Leu Gln Ala Lys Ala Phe Val Gly Asn Glu Pro Phe Val Val Met
        115                 120                 125
Leu Gly Asp Asp Leu Met Asp Ile Thr Asn Ala Ser Ala Lys Pro Leu
    130                 135                 140
Thr Lys Gln Leu Met Glu Asp Tyr Asp Lys Thr His Ala Ser Thr Ile
145                 150                 155                 160
Ala Val Met Lys Val Pro His Glu Asp Val Ser Ser Tyr Gly Val Ile
                165                 170                 175
Ala Pro Gln Gly Lys Ala Val Lys Gly Leu Tyr Ser Val Asp Thr Phe
            180                 185                 190
Val Glu Lys Pro Gln Pro Glu Asp Ala Pro Ser Asp Leu Ala Ile Ile
        195                 200                 205
Gly Arg Tyr Leu Leu Thr Pro Glu Ile Phe Gly Ile Leu Glu Arg Gln
    210                 215                 220
Thr Pro Gly Ala Gly Asn Glu Val Gln Leu Thr Asp Ala Ile Asp Thr
225                 230                 235                 240
Leu Asn Lys Thr Gln Arg Val Phe Ala Arg Glu Phe Lys Gly Asn Arg
                245                 250                 255
Tyr Asp Val Gly Asp Lys Phe Gly Phe Met Lys Thr Ser Ile Asp Tyr
            260                 265                 270
Ala Leu Glu His Pro Gln Val Lys GLu Asp Leu Lys Asn Tyr Ile Ile
        275                 280                 285
Lys Leu Gly Lys Ala Leu Glu Lys Ser Lys Val Pro Thr His Ser Lys
    290                 295                 300
<210>  100
<211>  1347
<212>  DNA
<213>  马链球菌兽瘟亚种(Streptococcus equi zooepidemicus)
<220>
<221>  CDS
<222>  (1)..(1347)
<223>
<400>  100
atg tca cat att aca ttt gat tat tca aag gtt ctt gag caa ttt gcc     48
Met Ser His Ile Thr Phe Asp Tyr Ser Lys Val Leu Glu Gln Phe Ala
1               5                   10                  15
gga cag cat gaa att gac ttt tta caa ggt cag gta aca gag gct gat     96
Gly Gln His Glu Ile Asp Phe Leu Gln Gly Gln Val Thr Glu Ala Asp
            20                  25                  30
cag gca cta cgt cag ggc act gga cct gga tca gat ttc ttg ggc tgg    144
Gln Ala Leu Arg Gln Gly Thr Gly Pro Gly Ser Asp Phe Leu Gly Trp
        35                  40                  45
ctt gag tta cct gaa aac tat gac aaa gaa gaa ttt gct cgt atc ctt    192
Leu Glu Leu Pro Glu Asn Tyr Asp Lys Glu Glu Phe Ala Arg Ile Leu
    50                  55                  60
aaa gca gct gag aag att aag gct gac agt gac gtt ctt gtt gtg att    240
Lys Ala Ala Glu Lys Ile Lys Ala Asp Ser Asp Val Leu Val Val Ile
65                  70                  75                  80
ggt att ggt ggc tct tac ctt ggt gct aag gct gca att gac ttt ttg    288
Gly Ile Gly Gly Ser Tyr Leu Gly Ala Lys Ala Ala Ile Asp Phe Leu
                85                  90                  95
aac agc cat ttt gcc aac cta caa aca gca aaa gag cgc aaa gca cca    336
Asn Ser His Phe Ala Asn Leu Gln Thr Ala Lys Glu Arg Lys Ala Pro
            100                 105                 110
caa att ctt tat gct ggt aac tcc atc tca tca agc tat ctt gct gat    384
Gln Ile Leu Tyr Ala Gly Asn Ser Ile Ser Ser Ser Tyr Leu Ala Asp
        115                 120                 125
ctt gtg gac tat gtt caa gat aaa gat ttc tct gtt aac gtg att tct    432
Leu Val Asp Tyr Val Gln Asp Lys Asp Phe Ser Val Asn Val Ile Ser
    130                 135                 140
aag tct ggt aca aca aca gag cct gca atc gcc ttt cgt gtc ttt aaa     480
Lys Ser Gly Thr Thr Thr Glu Pro Ala Ile Ala Phe Arg Val Phe Lys
145                 150                 155                 160
gaa tta ctt gtt aaa aag tac ggt caa gaa gag gcc aac aag cgt atc     528
Glu Leu Leu Val Lys Lys Tyr Gly Gln Glu Glu Ala Asn Lys Arg Ile
                165                 170                 175
tat gca acg act gat aag gtc aag ggt gct gtt aag gtt gag gct gat     576
Tyr Ala Thr Thr Asp Lys Val Lys Gly Ala Val Lys Val Glu Ala Asp
            180                 185                 190
gca aat cat tgg gaa acc ttt gtt gtg cca gat aat gtt ggt ggc cgt     624
Ala Asn His Trp Glu Thr Phe Val Val Pro Asp Asn Val Gly Gly Arg
        195                 200                 205
ttc tca gtg ctg aca gct gtg ggc ttg cta cca att gca gca tca ggg     672
Phe Ser Val Leu Thr Ala Val Gly Leu Leu Pro Ile Ala Ala Ser Gly
    210                 215                 220
gct gat att acc gcg ctg atg gaa gga gca aat gca gct cgt aag gac     720
Ala Asp Ile Thr Ala Leu Met Glu Gly Ala Asn Ala Ala Arg Lys Asp
225                 230                 235                 240
ctg tca tca gat aaa atc tca gaa aac atc gct tac caa tat gct gtg     768
Leu Ser Ser Asp Lys Ile Ser Glu Asn Ile Ala Tyr Gln Tyr Ala Val
                245                 250                 255
gtc cgc aat atc ctc tat cgc aaa ggc tat gta act gaa att ttg gca     816
Val Arg Asn Ile Leu Tyr Arg Lys Gly Tyr Val Thr Glu Ile Leu Ala
            260                 265                 270
aac tat gag cca tca ttg cag tat ttt agc gaa tgg tgg aag caa ctg     864
Asn Tyr Glu Pro Ser Leu Gln Tyr Phe Ser Glu Trp Trp Lys Gln Leu
        275                 280                 285
gct ggt gag tct gaa gga aag gac caa aag ggt att tac cca act tca     912
Ala Gly Glu Ser Glu Gly Lys Asp Gln Lys Gly Ile Tyr Pro Thr Ser
    290                 295                 300
gct aat ttc tcg aca gac ctg cat tct ctt ggt caa ttt atc caa gaa     960
Ala Asn Phe Ser Thr Asp Leu His Ser Leu Gly Gln Phe Ile Gln Glu
305                 310                 315                 320
ggc tac cgt aac ctc ttt gag aca gtg att cgt gtg gac aag cca cgt    1008
Gly Tyr Arg Asn Leu Phe Glu Thr Val Ile Arg Val Asp Lys Pro Arg
                325                 330                 335
caa aat gtg att atc cca gaa atg gct gag gac ctt gat ggc ctt ggc    1056
Gln Asn Val Ile Ile Pro Glu Met Ala Glu Asp Leu Asp Gly Leu Gly
            340                 345                 350
tac cta caa gga aaa gac gtt gac ttt gtc aac aaa aaa gca aca gat    1104
Tyr Leu Gln Gly Lys Asp Val Asp Phe Val Asn Lys Lys Ala Thr Asp
        355                 360                 365
ggt gtc ctt ctt gcc cat aca gat ggt ggt gtg cca aat atg ttt atc    1152
Gly Val Leu Leu Ala His Thr Asp Gly Gly Val Pro Asn Met Phe Ile
    370                 375                 380
acg ctt cca gag caa gac gaa ttt aca cta ggc tat acg atc tac ttc    1200
Thr Leu Pro Glu Gln Asp Glu Phe Thr Leu Gly Tyr Thr Ile Tyr Phe
385                 390                 395                 400
ttt gag ctt gct att gcc ctt tca ggc tac ctc aac ggg gtc aat cca    1248
Phe Glu Leu Ala Ile Ala Leu Ser Gly Tyr Leu Asn Gly Val Asn Pro
                405                 410                 415
ttt gat cag cca ggc gtt gag gct tac aag aaa aac atg ttt gcc ctt    1296
Phe Asp Gln Pro Gly Val Glu Ala Tyr Lys Lys Asn Met Phe Ala Leu
            420                 425                 430
crt ggt aag cca ggc ttt gaa gag cta gga gca gcg ctc aac gca cgc    1344
Leu Gly Lys Pro Gly Phe Glu Glu Leu Gly Ala Ala Leu Asn Ala Arg
        435                 440                 445
ttg                                                                1347
Leu
<210>  101
<211>  449
<212>  PRT
<213>  马链球菌兽瘟亚种(Streptococcus equi zooepidemicus)
<400>  101
Met Ser His Ile Thr Phe Asp Tyr Ser Lys Val Leu Glu Gln Phe Ala
1               5                   10                  15
Gly Gln His Glu Ile Asp Phe Leu Gln Gly Gln Val Thr Glu Ala Asp
            20                  25                  30
Gln Ala Leu Arg Gln Gly Thr Gly Pro Gly Ser Asp Phe Leu Gly Trp
        35                  40                  45
Leu Glu Leu Pro Glu Asn Tyr Asp Lys Glu Glu Phe Ala Arg Ile Leu
    50                  55                  60
Lys Ala Ala Glu Lys Ile Lys Ala Asp Ser Asp Val Leu Val Val Ile
65                  70                  75                  80
Gly Ile Gly Gly Ser Tyr Leu Gly Ala Lys Ala Ala Ile Asp Phe Leu
                85                  90                  95
Asn Ser His Phe Ala Asn Leu Gln Thr Ala Lys Glu Arg Lys Ala Pro
            100                 105                 110
Gln Ile Leu Tyr Ala Gly Asn Ser Ile Ser Ser Ser Tyr Leu Ala Asp
        115                 120                 125
Leu Val Asp Tyr Val Gln Asp Lys Asp Phe Ser Val Asn Val Ile Ser
    130                 135                 140
Lys Ser Gly Thr Thr Thr Glu Pro Ala Ile Ala Phe Arg Val Phe Lys
145                 150                 155                 160
Glu Leu Leu Val Lys Lys Tyr Gly Gln Glu Glu Ala Asn Lys Arg Ile
                165                 170                 175
Tyr Ala Thr Thr Asp Lys Val Lys Gly Ala Val Lys Val Glu Ala Asp
            180                 185                 190
Ala Asn His Trp Glu Thr Phe Val Val Pro Asp Asn Val Gly Gly Arg
        195                 200                 205
Phe Ser Val Leu Thr Ala Val Gly Leu Leu Pro Ile Ala Ala Ser Gly
    210                 215                 220
Ala Asp Ile Thr Ala Leu Met Glu Gly Ala Asn Ala Ala Arg Lys Asp
225                 230                 235                 240
Leu Ser Ser Asp Lys Ile Ser Glu Asn Ile Ala Tyr Gln Tyr Ala Val
                245                 250                 255
Val Arg Asn Ile Leu Tyr Arg Lys Gly Tyr Val Thr Glu Ile Leu Ala
            260                 265                 270
Asn Tyr Glu Pro Ser Leu Gln Tyr Phe Ser Glu Trp Trp Lys Gln Leu
        275                 280                 285
Ala Gly Glu Ser Glu Gly Lys Asp Gln Lys Gly Ile Tyr Pro Thr Ser
    290                 295                 300
Ala Asn Phe Ser Thr Asp Leu His Ser Leu Gly Gln Phe Ile Gln Glu
305                 310                 315                 320
Gly Tyr Arg Asn Leu Phe Glu Thr Val Ile Arg Val Asp Lys Pro Arg
                325                 330                 335
Gln Asn Val Ile Ile Pro Glu Met Ala Glu Asp Leu Asp Gly Leu Gly
            340                 345                 350
Tyr Leu Gln Gly Lys Asp Val Asp Phe Val Asn Lys Lys Ala Thr Asp
        355                 360                 365
Gly Val Leu Leu Ala His Thr Asp Gly Gly Val Pro Asn Met Phe Ile
    370                 375                 380
Thr Leu Pro Glu Gln Asp Glu Phe Thr Leu Gly Tyr Thr Ile Tyr Phe
385                 390                 395                 400
Phe Glu Leu Ala Ile Ala Leu Ser Gly Tyr Leu Asn Gly Val Asn Pro
                405                 410                 415
Phe Asp Gln Pro Gly Val Glu Ala Tyr Lys Lys Asn Met Phe Ala Leu
            420                 425                 430
Leu Gly Lys Pro Gly Phe Glu Glu Leu Gly Ala Ala Leu Asn Ala Arg
        435                 440                 445
Leu
<210>  102
<211>  1251
<212>  DNA
<213>  乳房链球菌(Streptococcus uberis)
<220>
<221>  CDS
<222>  (1)..(1251)
<223>
<400>  102
atg gaa aaa cta aaa aat ctc att aca ttt atg act ttt att ttc ctg     48
Met Glu Lys Leu Lys Asn Leu Ile Thr Phe Met Thr Phe Ile Phe Leu
1               5                   10                  15
tgg ctc ata att att ggg ctt aat gtt ttt gta ttt gga act aaa gga     96
Trp Leu Ile Ile Ile Gly Leu Asn Val Phe Val Phe Gly Thr Lys Gly
            20                  25                  30
agt cta aca gtg tat ggg att att cta tta acc tat ttg tcg ata aaa    144
Ser Leu Thr Val Tyr Gly Ile Ile Leu Leu Thr Tyr Leu Ser Ile Lys
        35                  40                  45
atg gga tta tct ttt ttt tat cgt ccc tat aaa gga agt gta ggt caa    192
Met Gly Leu Ser Phe Phe Tyr Arg Pro Tyr Lys Gly Ser Val Gly Gln
    50                  55                  60
tat aag gta gca gct att atc cca tct tat aat gag gat ggt gtc ggt    240
Tyr Lys Val Ala Ala Ile Ile Pro Ser Tyr Asn Glu Asp Gly Val Gly
65                  70                  75                  80
tta cta gaa act cta aag agt gtt caa aaa caa aca tat cca att gca    288
Leu Leu Glu Thr Leu Lys Ser Val Gln Lys Gln Thr Tyr Pro Ile Ala
                85                  90                  95
gaa att ttc gta att gac gat ggg tca gta gat aaa aca ggt ata aaa    336
Glu Ile Phe Val Ile Asp Asp Gly Ser Val Asp Lys Thr Gly Ile Lys
            100                 105                 110
ttg gtc gaa gac tat gtg aag tta aat ggc ttt gga gac caa gtt atc    384
Leu Val Glu Asp Tyr Val Lys Leu Asn Gly Phe Gly Asp Gln Val Ile
        115                 120                 125
gtt cat cag atg cct gaa aat gtt ggt aaa aga cat gct cag gct tgg    432
Val His Gln Met Pro Glu Asn Val Gly Lys Arg His Ala Gln Ala Trp
    130                 135                 140
gca ttt gaa agg tct gat gct gat gtt ttc tta aca gtg gat tca gat    480
Ala Phe Glu Arg Ser Asp Ala Asp Val Phe Leu Thr Val Asp Ser Asp
145                 150                 155                 160
acc tac atc tat cct gat gct ctt gaa gaa tta tta aag aca ttt aat    528
Thr Tyr Ile Tyr Pro Asp Ala Leu Glu Glu Leu Leu Lys Thr Phe Asn
                165                 170                 175
gat cca gag gtc tac gct gca act ggt cat tta aat gca aga aat aga    576
Asp Pro Glu Val Tyr Ala Ala Thr Gly His Leu Asn Ala Arg Asn Arg
            180                 185                 190
caa act aat ctc tta act aga ctg act gat att cgt tac gat aat gca    624
Gln Thr Asn Leu Leu Thr Arg Leu Thr Asp Ile Arg Tyr Asp Asn Ala
        195                 200                 205
ttt ggt gta gaa cgt gct gct cag tct gtt acg gga aat att ttg gtt    672
Phe Gly Val Glu Arg Ala Ala Gln Ser Val Thr Gly Asn Ile Leu Val
    210                 215                 220
tgt tcc gga cct tta agt att tat aga cgt tcc gtc ggt att cca aat    720
Cys Ser Gly Pro Leu Ser Ile Tyr Arg Arg Ser Val Gly Ile Pro Asn
225                 230                 235                 240
ctt gaa cgc tat acc tca caa aca ttt ctt ggt gtc cct gta agc ata    768
Leu Glu Arg Tyr Thr Ser Gln Thr Phe Leu Gly Val Pro Val Ser Ile
                245                 250                 255
ggg gat gac cgt tgt ttg aca aat tat gca act gat ttg gga aaa acg    816
Gly Asp Asp Arg Cys Leu Thr Asn Tyr Ala Thr Asp Leu Gly Lys Thr
            260                 265                 270
gtt tat cag tca act gca aga tgt gat act gac gtt cca gat aag ttt    864
Val Tyr Gln Ser Thr Ala Arg Cys Asp Thr Asp Val Pro Asp Lys Phe
        275                 280                 285
aag gtt ttc atc aaa caa caa aat cgt tgg aat aag tca ttt ttt agg     912
Lys Val Phe Ile Lys Gln Gln Asn Arg Trp Asn Lys Ser Phe Phe Arg
    290                 295                 300
gag tct att atc tct gtt aag aag tta tta gcc aca cca agt gtt gct     960
Glu Ser Ile Ile Ser Val Lys Lys Leu Leu Ala Thr Pro Ser Val Ala
305                 310                 315                 320
gtt tgg act att aca gaa gtt tcc atg ttc atc atg cta gtt tat tct    1008
Val Trp Thr Ile Thr Glu Val Ser Met Phe Ile Met Leu Val Tyr Ser
                325                 330                 335
atc ttt agc tta ttg ata gga gag gct caa gaa ttt aat ctc ata aaa    1056
Ile Phe Ser Leu Leu Ile Gly Glu Ala Gln Glu Phe Asn Leu Ile Lys
            340                 345                 350
ctg gtt gct ttt tta gtt att att ttc ata gta gct ctt tgt aga aat    1104
Leu Val Ala Phe Leu Val Ile Ile Phe Ile Val Ala Leu Cys Arg Asn
        355                 360                 365
gtt cat tac atg gtt aag cat cca ttt gct ttt tta ttg tca ccg ttt    1152
Val His Tyr Met Val Lys His Pro Phe Ala Phe Leu Leu Ser Pro Phe
    370                 375                 380
tat gga ttg ata cat cta ttc gtt ttg caa cct ctt aag ata tat tcg    1200
Tyr Gly Leu Ile His Leu Phe Val Leu Gln Pro Leu Lys Ile Tyr Ser
385                 390                 395                 400
tta ttt act ata aga aat gct aca tgg gga act cgt aaa aag aca agt    1248
Leu Phe Thr Ile Arg Asn Ala Thr Trp Gly Thr Arg Lys Lys Thr Ser
                405                 410                 415
aaa                                                                1251
Lys
<210>  103
<211>  417
<212>  PRT
<213>  乳房链球菌(Streptococcus uberis)
<400>  103
Met Glu Lys Leu Lys Asn Leu Ile Thr Phe Met Thr Phe Ile Phe Leu
l               5                   10                  15
Trp Leu Ile Ile Ile Gly Leu Asn Val Phe Val Phe Gly Thr Lys Gly
            20                  25                  30
Ser Leu Thr Val Tyr Gly Ile Ile Leu Leu Thr Tyr Leu Ser Ile Lys
        35                  40                  45
Met Gly Leu Ser Phe Phe Tyr Arg Pro Tyr Lys Gly Ser Val Gly Gln
    50                  55                  60
Tyr Lys Val Ala Ala Ile Ile Pro Ser Tyr Asn Glu Asp Gly Val Gly
65                  70                  75                  80
Leu Leu Glu Thr Leu Lys Ser Val Gln Lys Gln Thr Tyr Pro Ile Ala
                85                  90                  95
Glu Ile Phe Val Ile Asp Asp Gly Ser Val Asp Lys Thr Gly Ile Lys
            100                 105                 110
Leu Val Glu Asp Tyr Val Lys Leu Asn Gly Phe Gly Asp Gln Val Ile
        115                 120                 125
Val His Gln Met Pro Glu Asn Val Gly Lys Arg His Ala Gln Ala Trp
    130                 135                 140
Ala Phe Glu Arg Ser Asp Ala Asp Val Phe Leu Thr Val Asp Ser Asp
145                 150                 155                 160
Thr Tyr Ile Tyr Pro Asp Ala Leu Glu Glu Leu Leu Lys Thr Phe Asn
                165                 170                 175
Asp Pro Glu Val Tyr Ala Ala Thr Gly His Leu Asn Ala Arg Asn Arg
            180                 185                 190
Gln Thr Asn Leu Leu Thr Arg Leu Thr Asp Ile Arg Tyr Asp Asn Ala
        195                 200                 205
Phe Gly Val Glu Arg Ala Ala Gln Ser Val Thr Gly Asn Ile Leu Val
    210                 215                 220
Cys Ser Gly Pro Leu Ser Ile Tyr Arg Arg Ser Val Gly Ile Pro Asn
225                 230                 235                 240
Leu Glu Arg Tyr Thr Ser Gln Thr Phe Leu Gly Val Pro Val Ser Ile
                245                 250                 255
Gly Asp Asp Arg Cys Leu Thr Asn Tyr Ala Thr Asp Leu Gly Lys Thr
            260                 265                 270
Val Tyr Gln Ser Thr Ala Arg Cys Asp Thr Asp Val Pro Asp Lys Phe
        275                 280                 285
Lys Val Phe Ile Lys Gln Gln Asn Arg Trp Asn Lys Ser Phe Phe Arg
    290                 295                 300
Glu Ser Ile Ile Ser Val Lys Lys Leu Leu Ala Thr Pro Ser Val Ala
305                 310                 315                 320
Val Trp Thr Ile Thr Glu Val Ser Met Phe Ile Met Leu Val Tyr Ser
                325                 330                 335
Ile Phe Ser Leu Leu Ile Gly Glu Ala Gln Glu Phe Asn Leu Ile Lys
            340                 345                 350
Leu Val Ala Phe Leu Val Ile Ile Phe Ile Val Ala Leu Cys Arg Asn
        355                 360                 365
Val His Tyr Met Val Lys His Pro Phe Ala Phe Leu Leu Ser Pro Phe
    370                 375                 380
Tyr Gly Leu Ile His Leu Phe Val Leu Gln Pro Leu Lys Ile Tyr Ser
385                 390                 395                 400
Leu Phe Thr Ile Arg Asn Ala Thr Trp Gly Thr Arg Lys Lys Thr Ser
                405                 410                 415
Lys
<210>  104
<211>  1203
<212>  DNA
<213>  乳房链球菌(streptococcus uberis)
<220>
<221>  CDS
<222>  (1)..(1203)
<223>
<400>  104
gtg aaa att gca gtt gca ggt tct ggc tat gtt ggc cta tca tta agt     48
Val Lys Ile Ala Val Ala Gly Ser Gly Tyr Val Gly Leu Ser Leu Ser
1               5                   10                  15
gta tta tta gca cag aaa aat cct gtt aca gtt gta gat att att gag     96
Val Leu Leu Ala Gln Lys Asn Pro Val Thr Val Val Asp Ile Ile Glu
            20                  25                  30
aag aaa gta aat ctc ata aat caa aaa caa tca cca atc cag gat gtt    144
Lys Lys Val Asn Leu Ile Asn Gln Lys Gln Ser Pro Ile Gln Asp Val
        35                  40                  45
gat att gaa aac tat tta aaa gaa aaa aag tta caa tta aga gct act     192
Asp Ile Glu Asn Tyr Leu Lys Glu Lys Lys Leu Gln Leu Arg Ala Thr
    50                  55                  60
cta gac gcc gat caa gca ttt agg gat gca gat ata cta att att gct     240
Leu Asp Ala Asp Gln Ala Phe Arg Asp Ala Asp Ile Leu Ile Ile Ala
65                  70                  75                  80
aca cca acc aat tat gat gtg gag aag aat ttt ttt gat act agt cat     288
Thr Pro Thr Asn Tyr Asp Val Glu Lys Asn Phe Phe Asp Thr Ser His
                85                  90                  95
gtt gag act gta att gag aaa gct tta gct tta aat agt cag gct ttg     336
Val Glu Thr Val Ile Glu Lys Ala Leu Ala Leu Asn Ser Gln Ala Leu
            100                 105                 110
tta gtt att aaa tca acg ata cca ctt ggt ttt att aaa aag atg cgt     384
Leu Val Ile Lys Ser Thr Ile Pro Leu Gly Phe Ile Lys Lys Met Arg
        115                 120                 125
caa aaa tat cag aca gac cgt att att ttt agt ccc gaa ttt ctt aga     432
Gln Lys Tyr Gln Thr Asp Arg Ile Ile Phe Ser Pro Glu Phe Leu Arg
    130                 135                 140
gag tct aaa gct tta aaa gat aat ctt tat cct agt cga ata att gtt     480
Glu Ser Lys Ala Leu Lys Asp Asn Leu Tyr Pro Ser Arg Ile Ile Val
145                 150                 155                 160
tcc ttt gaa gat gat gat tct atg gaa gta ata gaa gca gca aag act     528
Ser Phe Glu Asp Asp Asp Ser Met Glu Val Ile Glu Ala Ala Lys Thr
                165                 170                 175
ttt gct caa ttg tta aaa gat ggt tct ttg gat aaa gat gtt cct gta     576
Phe Ala Gln Leu Leu Lys Asp Gly Ser Leu Asp Lys Asp Val Pro Val
            180                 185                 190
ctt ttt atg ggt tca gca gag gct gaa gca gta aaa tta ttt gcc aat     624
Leu Phe Met Gly Ser Ala Glu Ala Glu Ala Val Lys Leu Phe Ala Asn
        195                 200                 205
acc tat tta gct atg cgt gtc tcc tat ttt aat gag tta gat aca tat     672
Thr Tyr Leu Ala Met Arg Val Ser Tyr Phe Asn Glu Leu Asp Thr Tyr
    210                 215                 220
gct gaa aag aat ggt tta cgt gtg gat aat att att gag ggc gtt tgc     720
Ala Glu Lys Asn Gly Leu Arg Val Asp Asn Ile Ile Glu Gly Val Cys
225                 230                 235                 240
cat gat cga cgc ata gga att cat tat aat aac cct tct ttt ggc tat     768
His Asp Arg Arg Ile Gly Ile His Tyr Asn Asn Pro Ser Phe Gly Tyr
                245                 250                 255
gga gga tac tgc tta cct aaa gat acc aaa cag ttg cta gca ggc tat     816
Gly Gly Tyr Cys Leu Pro Lys Asp Thr Lys Gln Leu Leu Ala Gly Tyr
            260                 265                 270
gat ggt att cct caa tcg ctt ata aaa gca att gtt gat tct aat aaa     864
Asp Gly Ile Pro Gln Ser Leu Ile Lys Ala Ile Val Asp Ser Asn Lys
        275                 280                 285
att cgt aaa gag tat atc gca tca caa att tta caa caa ttg agt gat     912
Ile Arg Lys Glu Tyr Ile Ala Ser Gln Ile Leu Gln Gln Leu Ser Asp
    290                 295                 300
att aat gta gat cct aaa gat gca acg att ggt att tac cgc ctt atc     960
Ile Asn Val Asp Pro Lys Asp Ala Thr Ile Gly Ile Tyr Arg Leu Ile
305                 310                 315                 320
atg aaa agt aac tct gat aat ttc aga gag agt gca ata aaa gat att    1008
Met Lys Ser Asn Ser Asp Asn Phe Arg Glu Ser Ala Ile Lys Asp Ile
                325                 330                 335
att gat cat att aag agc tat caa att aat ata gtc ttg tat gag cca    1056
Ile Asp His Ile Lys Ser Tyr Gln Ile Asn Ile Val Leu Tyr Glu Pro
            340                 345                 350
atg atg aat gaa gat ttt gat tta cca atc att gat gat tta tct gac    1104
Met Met Asn Glu Asp Phe Asp Leu Pro Ile Ile Asp Asp Leu Ser Asp
        355                 360                 365
ttc aaa gcc atg tca cat att atc gtt tca aat aga tat gat tta gcc    1152
Phe Lys Ala Met Ser His Ile Ile Val Ser Asn Arg Tyr Asp Leu Ala
    370                 375                 380
tta gaa gat gtt aaa gaa aaa gtt tac acc aga gat att tac ggt gtg    1200
Leu Glu Asp Val Lys Glu Lys Val Tyr Thr Arg Asp Ile Tyr Gly Val
385                 390                 395                 400
gat                                                                1203
Asp
<210>  105
<211>  401
<212>  PRT
<213>  乳房链球菌(Streptococcus uberis)
<400>  105
Val Lys Ile Ala Val Ala Gly Ser Gly Tyr Val Gly Leu Ser Leu Ser
1               5                   10                  15
Val Leu Leu Ala Gln Lys Asn Pro Val Thr Val Val Asp Ile Ile Glu
            20                  25                  30
Lys Lys Val Asn Leu Ile Asn Gln Lys Gln Ser Pro Ile Gln Asp Val
        35                  40                  45
Asp Ile Glu Asn Tyr Leu Lys Glu Lys Lys Leu Gln Leu Arg Ala Thr
    50                  55                  60
Leu Asp Ala Asp Gln Ala Phe Arg Asp Ala Asp Ile Leu Ile Ile Ala
65                  70                  75                  80
Thr Pro Thr Asn Tyr Asp Val Glu Lys Asn Phe Phe Asp Thr Ser His
                85                  90                  95
Val Glu Thr Val Ile Glu Lys Ala Leu Ala Leu Asn Ser Gln Ala Leu
            100                 105                 110
Leu Val Ile Lys Ser Thr Ile Pro Leu Gly Phe Ile Lys Lys Met Arg
        115                 120                 125
Gln Lys Tyr Gln Thr Asp Arg Ile Ile Phe Ser Pro Glu Phe Leu Arg
    130                 135                 140
Glu Ser Lys Ala Leu Lys Asp Asn Leu Tyr Pro Ser Arg Ile Ile Val
145                 150                 155                 160
Ser Phe Glu Asp Asp Asp Ser Met Glu Val Ile Glu Ala Ala Lys Thr
                165                 170                 175
Phe Ala Gln Leu Leu Lys Asp Gly Ser Leu Asp Lys Asp Val Pro Val
            180                 185                 190
Leu Phe Met Gly Ser Ala Glu Ala Glu Ala Val Lys Leu Phe Ala Asn
        195                 200                 205
Thr Tyr Leu Ala Met Arg Val Ser Tyr Phe Asn Glu Leu Asp Thr Tyr
    210                 215                 220
Ala Glu Lys Asn Gly Leu Arg Val Asp Asn Ile Ile Glu Gly Val Cys
225                 230                 235                 240
His Asp Arg Arg Ile Gly Ile His Tyr Asn Asn Pro Ser Phe Gly Tyr
                245                 250                 255
Gly Gly Tyr Cys Leu Pro Lys Asp Thr Lys Gln Leu Leu Ala Gly Tyr
            260                 265                 270
Asp Gly Ile Pro Gln Ser Leu Ile Lys Ala Ile Val Asp Ser Asn Lys
        275                 280                 285
Ile Arg Lys Glu Tyr Ile Ala Ser Gln Ile Leu Gln Gln Leu Ser Asp
    290                 295                 300
Ile Asn Val Asp Pro Lys Asp Ala Thr Ile Gly Ile Tyr Arg Leu Ile
305                 310                 315                 320
Met Lys Ser Asn Ser Asp Asn Phe Arg Glu Ser Ala Ile Lys Asp Ile
                325                 330                 335
Ile Asp His Ile Lys Ser Tyr Gln Ile Asn Ile Val Leu Tyr Glu Pro
            340                 345                 350
Met Met Asn Glu Asp Phe Asp Leu Pro Ile Ile Asp Asp Leu Ser Asp
        355                 360                 365
Phe Lys Ala Met Ser His Ile Ile Val Ser Asn Arg Tyr Asp Leu Ala
    370                 375                 380
Leu Glu Asp Val Lys Glu Lys Val Tyr Thr Arg Asp Ile Tyr Gly Val
385                 390                 395                 400
Asp
<210>  106
<211>  912
<212>  DNA
<213>  乳房链球菌(Streptococcus uberis)
<220>
<221>  CDS
<222>  (1)..(912)
<223>
<400>  106
atg act aaa gta aga aaa gcc att att cca gct gcc gga ctt ggc aca     48
Met Thr Lys Val Arg Lys Ala Ile Ile Pro Ala Ala Gly Leu Gly Thr
1               5                   10                  15
cgt ttt tta cca gca aca aaa gct ctc gct aag gaa atg ttg ccc atc     96
Arg Phe Leu Pro Ala Thr Lys Ala Leu Ala Lys Glu Met Leu Pro Ile
            20                  25                  30
gtt gac aaa cca acc att caa ttc atc gtg gaa gaa gct ttg cgt tct    144
Val Asp Lys Pro Thr Ile Gln Phe Ile Val Glu Glu Ala Leu Arg Ser
        35                  40                  45
ggc att gaa gaa atc ttg gtc gta aca gga aaa tca aaa cgc tcc att    192
Gly Ile Glu Glu Ile Leu Val Val Thr Gly Lys Ser Lys Arg Ser Ile
    50                  55                  60
gaa gac cat ttt gat tcc aac ttt gaa ctc gaa tat aat ttg caa gaa    240
Glu Asp His Phe Asp Ser Asn Phe Glu Leu Glu Tyr Asn Leu Gln Glu
65                  70                  75                  80
aaa ggg aaa act gaa ctc tta aaa tta gtt gat gaa acc act tct ata    288
Lys Gly Lys Thr Glu Leu Leu Lys Leu Val Asp Glu Thr Thr Ser Ile
                85                  90                  95
aac ttg cat ttc att cgt caa agt cat ccc aaa ggc tta ggg gat gct    336
Asn Leu His Phe Ile Arg Gln Ser His Pro Lys Gly Leu Gly Asp Ala
            100                 105                 110
gtt tta caa gca aaa gct ttt gta gga aat gaa ccc ttc att gtt atg    384
Val Leu Gln Ala Lys Ala Phe Val Gly Asn Glu Pro Phe Ile Val Met
        115                 120                 125
ctt ggt gac gat ttg atg gac att aca aat acc aaa gct gtc cca tta    432
Leu Gly Asp Asp Leu Met Asp Ile Thr Asn Thr Lys Ala Val Pro Leu
    130                 135                 140
acc aaa caa tta atg gac gat tat gaa aca aca cat gct tct aca ata    480
Thr Lys Gln Leu Met Asp Asp Tyr Glu Thr Thr His Ala Ser Thr Ile
145                 150                 155                 160
gcc gta atg aaa gtt cct cac gat gac gta tcc tct tat ggt gtc att    528
Ala Val Met Lys Val Pro His Asp Asp Val Ser Ser Tyr Gly Val Ile
                165                 170                 175
gct cca aac ggc aaa gcc ttg aat ggc tta tat agc gtg gat acc ttt    576
Ala Pro Asn Gly Lys Ala Leu Asn Gly Leu Tyr Ser Val Asp Thr Phe
            180                 185                 190
gtt gaa aaa cca aaa cct gag gac gca cca agt gac ctt gct atc att    624
Val Glu Lys Pro Lys Pro Glu Asp Ala Pro Ser Asp Leu Ala Ile Ile
        195                 200                 205
gga cgt tat ctc tta aca cct gaa att ttt gac att ctt gaa aat caa    672
Gly Arg Tyr Leu Leu Thr Pro Glu Ile Phe Asp Ile Leu Glu Asn Gln
    210                 215                 220
gca cca ggt gcc gga aac gaa gtc caa tta act gat gct atc gat acc    720
Ala Pro Gly Ala Gly Asn Glu Val Gln Leu Thr Asp Ala Ile Asp Thr
225                 230                 235                 240
ctc aac aaa aca caa cgt gtt ttt gct cgt gag ttt act ggc aaa cgc    768
Leu Asn Lys Thr Gln Arg Val Phe Ala Arg Glu Phe Thr Gly Lys Arg
                245                 250                 255
tac gat gtt gga gac aag ttt ggc ttc atg aaa aca tct atc gat tat    816
Tyr Asp Val Gly Asp Lys Phe Gly Phe Met Lys Thr Ser Ile Asp Tyr
            260                 265                 270
gcc cta aaa cac cat caa gtc aaa gat gac cta aaa gct tat att atc    864
Ala Leu Lys His His Gln Val Lys Asp Asp Leu Lys Ala Tyr Ile Ile
        275                 280                 285
aag tta ggt aaa gaa tta gaa aaa gca caa gat tcc aaa gsa agc aaa    912
Lys Leu Gly Lys Glu Leu Glu Lys Ala Gln Asp Ser Lys Glu Ser Lys
    290                 295                 300
<210>  107
<211>  304
<212>  PRT
<213>  乳房链球菌(Streptococcus uberis)
<400>  107
Met Thr Lys Val Arg Lys Ala Ile Ile Pro Ala Ala Gly Leu Gly Thr
1               5                   10                  15
Arg Phe Leu Pro Ala Thr Lys Ala Leu Ala Lys Glu Met Leu Pro Ile
            20                  25                  30
Val Asp Lys Pro Thr Ile Gln Phe Ile Val Glu Glu Ala Leu Arg Ser
        35                  40                  45
Gly Ile Glu Glu Ile Leu Val Val Thr Gly Lys Ser Lys Arg Ser Ile
    50                  55                  60
Glu Asp His Phe Asp Ser Asn Phe Glu Leu Glu Tyr Asn Leu Gln Glu
65                  70                  75                  80
Lys Gly Lys Thr Glu Leu Leu Lys Leu Val Asp Glu Thr Thr Ser Ile
                85                  90                  95
Asn Leu His Phe Ile Arg Gln Ser His Pro Lys Gly Leu Gly Asp Ala
            100                 105                 110
Val Leu Gln Ala Lys Ala Phe Val Gly Asn Glu Pro Phe Ile Val Met
        115                 120                 125
Leu Gly Asp Asp Leu Met Asp Ile Thr Asn Thr Lys Ala Val Pro Leu
    130                 135                 140
Thr Lys Gln Leu Met Asp Asp Tyr Glu Thr Thr His Ala Ser Thr Ile
145                 150                 155                 160
Ala Val Met Lys Val Pro His Asp Asp Val Ser Ser Tyr Gly Val Ile
                165                 170                 175
Ala Pro Asn Gly Lys Ala Leu Asn Gly Leu Tyr Ser Val Asp Thr Phe
            180                 185                 190
Val Glu Lys Pro Lys Pro Glu Asp Ala Pro Ser Asp Leu Ala Ile Ile
        195                 200                 205
Gly Arg Tyr Leu Leu Thr Pro Glu Ile Phe Asp Ile Leu Glu Asn Gln
    210                 215                 220
Ala Pro Gly Ala Gly Asn Glu Val Gln Leu Thr Asp Ala Ile Asp Thr
225                 230                 235                 240
Leu Asn Lys Thr Gln Arg Val Phe Ala Arg Glu Phe Thr Gly Lys Arg
                245                 250                 255
Tyr Asp Val Gly Asp Lys Phe Gly Phe Met Lys Thr Ser Ile Asp Tyr
            260                 265                 270
Ala Leu Lys His His Gln Val Lys Asp Asp Leu Lys Ala Tyr Ile Ile
        275                 280                 285
Lys Leu Gly Lys Glu Leu Glu Lys Ala Gln Asp Ser Lys Glu Ser Lys
    290                 295                 300
<210>  108
<211>  5158
<212>  DNA
<213>  似马链球菌(Streptococcus equisimilis)
<400>  108
tcaatttatg gctttttgct gatagcttac ctattagtca aaatgtcctt atcctttttt     60
tacaagccat ttaagggaag ggctgggcaa tataaggttg cagccattat tccctcttat    120
aacgaagatg ctgagtcatt gctagagacc ttaaaaagtg ttcagcagca aacctatccc    180
ctagcagaaa tttatgttgt tgacgatgga agtgctgatg agacaggtat taagcgcatt    240
gaagactatg tgcgtgacac tggtgaccta tcaagcaatg tcattgttca tcggtcagag    300
aaaaatcaag gaaagcgtca tgcacaggcc tgggcctttg aaagatcaga cgctgatgtc    360
tttttgaccg ttgactcaga tacttatatc taccctgatg ctttagagga gttgttaaaa    420
acctttaatg acccaactgt ttttgctgcg acgggtcacc ttaatgtcag aaatagacaa    480
accaatctct taacacgctt gacagatatt cgctatgata atgcttttgg cgttgaacga    540
gctgcccaat ccgttacagg taatatcctt gtttgctcag gtccgcttag cgtttacaga    600
cgcgaggtgg ttgttcctaa catagataga tacatcaacc agaccttcct gggtattcct    660
gtaagtattg gtgatgacag gtgcttgacc aactatgcaa ctgatttagg aaagactgtt     720
tatcaatcca ctgctaaatg tattacagat gttcctgaca agatgtctac ttacttgaag     780
cagcaaaacc gctggaacaa gtccttcttt agagagtcca ttatttctgt taagaaaatc     840
atgaacaatc cttttgtagc cctatggacc atacttgagg tgtctatgtt tatgatgctt     900
gtttattctg tggtggattt ctttgtaggc aatgtcagag aatttgattg gctcagggtt     960
ttagcctttc tggtgattat cttcattgtt gccctgtgtc ggaacattca ttacatgctt    1020
aagcacccgc tgtccttctt gttatctccg ttttatgggg tgctgcattt gtttgtccta    1080
cagcccttga aattatattc tctttttact attagaaatg ctgactgggg aacacgtaaa    1140
aaattattat aaaccaacta gacctaggtt ctgacaaggg agctaagcta gggataaaca    1200
aagagttttg atccgactcg agcagctcat aaacgaaagc tatcccactt gtaattgaag    1260
ctaagagctt ttagcttgca gctctataaa gacgaaccag aggctgagtg tcagctttgg    1320
tgtgagggct aggtcattat gatccttcag gtgtggcacc tgagctccgg cagtagctaa    1380
ctgtactaag gtatcaaagg aaaaaatgaa gtgaaaattt ctgtagcagg ctcaggatat    1440
gtcggcctat ccttgagtat tttactggca caacataatg acgtcactgt tgttgacatt    1500
attgatgaaa aggtgagatt gatcaatcaa ggcatatcgc caatcaagga tgctgatatt    1560
gaggagtatt taaaaaatgc gccgctaaat ctcacagcga cgcttgatgg cgcaagcgct    1620
tatagcaatg cagaccttat tatcattgct actccgacaa attatgacag cgaacgcaac    1680
tactttgaca caaggcatgt tgaagaggtc atcgagcagg tcctagacct aaatgcgtca    1740
gcaaccatta ttatcaaatc aaccatacca ctaggcttta tcaagcatgt tagggaaaaa    1800
taccagacag atcgtattat ttttagccca gaatttttaa gagaatcaaa agccttatac    1860
gataaccttt acccaagtcg gatcattgtt tcttatgaaa aggacgactc accaagggtt    1920
attcaggctg ctaaagcctt tgctggtctt ttaaaggaag gagccaaaag caaggatact    1980
ccggtcttat ttatgggctc acaggaggct gaggcggtca agctatttgc gaataccttt    2040
ttggctatgc gggtgtctta ctttaatgaa ttagacacct attccgaaag caagggtcta    2100
gatgctcagc gcgtgattga aggagtctgt catgatcagc gcattggtaa ccattacaat    2160
aacccttcct ttggatatgg cggctattgc ctgccaaagg acagcaagca gctgttggca    2220
aattatagag gcattcccca gtccttgatg tcagcgattg ttgaatccaa caagatacga    2280
aaatcttatt tggctgaaca aatattagac agagcctcta gtcaaaagca ggctggtgta    2340
ccattaacga ttggctttta ccgcttgatt atgaaaagca actctgataa tttccgagaa    2400
agcgccatta aagatattat tgatatcatc aacgactatg gggttaatat tgtcatttac    2460
gaacccatgc ttggcgagga tattggctac agggttgtca aggacttaga gcagttcaaa    2520
aacgagtcta caatcattgt gtcaaatcgc tttgaggacg acctaggaga tgtcattgat    2580
aaggtttata cgagagatgt ctttggaaga gactagtcag aaaacgaatg gcactcataa    2640
ggaaccacaa atcaaggagg aactcatgac aaaggtcaga aaagccatta tcccagccgc    2700
cggcctaggc actcgcttcc tgcccgccac caaggcactg gccaaggaaa tgctcccaat    2760
cgtcgataag ccaaccattc aattcatcgt cgaggaagcc ctaaaggcag gtatcgagga    2820
gattcttgtc gtcaccggca aggccaaacg ctctatcgag gaccactttg actccaactt    2880
cgagctcgaa tacaatctcc aagccaaggg caaaaccgag ctactcaagc tcgttgatga    2940
gaccactgcc atcaacctgc acttcattcg tcagagccac cctagaggac taggggacgc    3000
tgtcctccaa gccaaggcct ttgttggcaa tgagcccttt gtggtcatgc tgggggatga    3060
cctcatggat attaccaatc ctagtgccaa gcccttgacc aagcagctta ttgaggatta    3120
tgattgcaca cacgcctcaa cgattgcagt gatgagggtg ccgcatgagg aggtttccaa    3180
ttatggtgtg attgcaccgc aagggaaggc tgttaagggc ttgtatagtg tggagacctt    3240
tgttgagaag ccaagtccag atgaggcacc gagtgactta gcgattattg gtcgatattt    3300
gttgacgcct gagatttttg ccatattgga gaagcaggcg cctggagctg gcaatgaggt    3360
acagctgacc gatgcgattg acaagctcaa taagacacag cgggtttttg cgagggagtt    3420
taagggagag cggtatgatg ttggggacaa gtttggcttt atgaagacct cacttgacta    3480
tgctctcaag caccctcagg tcaaggacga cctcactgac tacattataa agctcagtaa    3540
gcaactgaac aaggacgtca agaaataggc gtttattgat cagctattgc agagctattt    3600
aaaagcattt agagctttaa ggtgggatac tagaggattg gtatctcact ttttaggctg    3660
acttgtatta ataccaaaag ccaaaactag gcagataagc ataaggaatt agattaaaaa    3720
taaggaacca aaacatgaaa aactacgcca ttatcctagc agctggaaag ggaacgcgca    3780
tgaagtcagc gcttcccaag gtgctgcaca aggtatcagg cctaagcatg ctggagcatg    3840
tcctcaagag tgtctcagcc ctagcccctc aaaagcagct cacagtgatc ggtcatcagg    3900
cagagcaggt gcgtgctgtc ctaggagagc aatcgctaac agtggtgcaa gaggagcagc    3960
tagggacagg ccatgcagtc atgatggcag aagaggagct atctggctta gaggggcaaa    4020
ccctagtgat tgcaggtgac acccccttga tcagaggaga aagcctcaag gctctgctag    4080
actatcatat cagagaaaag aatgtggcaa ccattctcac agccaatgcc aaggatccct    4140
ttggctatgg acgaatcatt cgcaatgcag caggagaggt ggtcaacatc gttgagcaaa    4200
aggatgctaa tgaggcagag caagaggtca aggagatcaa cacagggact tatatctttg    4260
acaataagcg cctttttgag gctctaaagc atctcacgac tgataatgcc caaggggagt    4320
actacctaac cgatgtgatc agtattttca aggctggcca agaaagggtt ggcgcttacc    4380
tgctgaagga ctttgatgag agcctagggg ttaatgatcg cttagctcta gcccaggccg    4440
aggtgattat gcaagagcgg atcaacaggc agcacatgct taatggggtg accctgcaaa    4500
acccggcagc tacctatatt gaaagcagtg tagagattgc accagacgtc ttgattgaag    4560
ccaatgtgac cttaaaggga cagactagaa ttggcagcag aagtgtcata agcaatggga    4620
gctatatcct tgattcgagg cttggtgagg gtgtagtggt tagccagtcg gtgattgagg    4680
cttcagtctt agcagatgga gtgacagtag ggccatatgc acacattcgc ccggactccc    4740
agctcgatga gtgtgttcat attgggaact ttgtagaggt taaggggtct catctagggg    4800
ccaataccaa ggcagggcat ttgacttacc tggggaatgc cgagattggc tcagaggtta    4860
acattggtgc aggaagcatt acggttaatt atgatggtca acggaaatac cagacagtga    4920
ttggcgatca cgcttttatt gggagtcatt cgactttgat agctccggta gaggttgggg    4980
agaatgcttt aacagcagca gggtctacga tagcccagtc agtgccggca gacagtgtgg    5040
ctatagggcg cagccgtcag gtggtgaagg aaggctatgc caagaggctg ccgcaccacc    5100
caaatcaagc ctaatcgctc aaccaaaaga ggcaggtgag aaaacctagg ccattaaa      5158

Claims (183)

1.一种制备透明质酸的方法,包括:(a)在适宜制备透明质酸的条件下培养芽孢杆菌属宿主细胞,其中芽孢杆菌属宿主细胞包含核酸构建体,所述核酸构建体含有透明质酸合酶编码序列,该序列可操作性连接于与透明质酸合酶编码序列异源的启动子序列;和(b)从培养基中回收透明质酸。
2.权利要求1的方法,其中透明质酸合酶编码序列编码I型透明质酸合酶。
3.权利要求2的方法,其中I型透明质酸合酶编码序列获自链球菌属菌株。
4.权利要求3的方法,其中链球菌菌株是似马链球菌、酿脓链球菌、乳房链球菌或马链球菌兽瘟亚种。
5.权利要求1的方法,其中透明质酸合酶编码序列选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO:2、SEQ ID NO:93或SEQ ID NO:103有至少约70%、约75%、约80%、约85%、约90%或约95%同一性的;氨基酸序列;(b)在低、中、或高严紧条件下与SEQ ID NO:1、SEQ ID NO:92或SEQ ID NO:102杂交的核酸序列;和(c)(a)或(b)的互补链。
6.权利要求5的方法,其中透明质酸合酶编码序列编码含有SEQ IDNO:2、SEQ ID NO:93或SEQ ID NO:103或其具有透明质酸合酶活性的片段的氨基酸序列的多肽。
7.权利要求1的方法,其中透明质酸合酶编码序列编码II型透明质酸合酶。
8.权利要求7的方法,其中II型透明质酸合酶编码序列获自巴斯德菌属菌株。
9.权利要求8的方法,其中巴斯德菌属菌株为出血败血性巴斯德菌。
10.权利要求1的方法,其中透明质酸合酶编码序列选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO:95有至少约70%、约75%、约80%、约85%、约90%或约95%同一性;(b)在低、中、或高严紧条件下与SEQ ID NO:94杂交的核酸序列;和(c)(a)或(b)的互补链。
11.权利要求10的方法,其中透明质酸合酶编码序列编码含有SEQ IDNO:95或其具有透明质酸合酶活性的片段的氨基酸序列的多肽。
12.权利要求1的方法,其中透明质酸的前体糖由芽孢杆菌属宿主细胞供给或制备。
13.权利要求12的方法,其中前体糖为D-葡萄糖醛酸或N-乙酰葡糖胺。
14.权利要求12的方法,其中前体糖由芽孢杆菌属宿主细胞中内源性基因、非内源性基因,或内源性和非内源性基因的组合所编码。
15.权利要求1的方法,其中核酸构建体还包含一个或多个编码透明质酸前体糖的生物合成中的酶的基因或所述芽孢杆菌属宿主细胞还包含一个或多个第二个核酸构建体,所述核酸构建体含有一个或多个编码透明质酸前体糖的生物合成中的酶的基因。
16.权利要求15的方法,其中一个或多个基因选自UDP-葡萄糖6-脱氢酶基因、UDP-葡萄糖焦磷酸化酶基因、UDP-N-乙酰葡糖胺焦磷酸化酶基因、葡萄糖-6-磷酸异构酶基因、己糖激酶基因、磷酸葡糖变位酶基因、酰胺转移酶基因、变位酶基因和乙酰基转移酶基因。
17.权利要求16的方法,其中所述UDP-葡萄糖6-脱氢酶基因为hasB基因或tuaD基因或其同系物。
18.权利要求17的方法,其中所述hasB基因选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO:41、SEQ ID NO:97或SEQ ID NO:105有至少约70%、约75%、约80%、约85%、约90%或约95%同一性;(b)在低、中、或高严紧条件下与SEQ ID NO:40、SEQ ID NO:96或SEQ ID NO:104杂交的核酸序列;和(c)(a)或(b)的互补链。
19.权利要求18的方法,其中所述hasB基因编码含有SEQ ID NO:41、SEQ ID NO:97或SEQ ID NO:105的氨基酸序列,或其具有UDP-葡萄糖6-脱氢酶活性的片段的多肽。
20.权利要求17的方法,其中所述tuaD基因选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO:12有至少约70%、约75%、约80%、约85%、约90%或约95%同一性;(b)在低、中、或高严紧条件下与SEQ ID NO:11杂交的核酸序列;和(c)(a)或(b)的互补链。
21.权利要求20的方法,其中所述tuaD基因编码含有SEQ ID NO:12的氨基酸序列,或其具有UDP-葡萄糖6-脱氢酶活性的片段的多肽。
22.权利要求16的方法,其中所述UDP葡萄糖焦磷酸化酶基因为hasC基因或gtaB基因或其同系物。
23.权利要求22的方法,其中所述hasC基因选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO:43、SEQ ID NO:99或SEQ ID NO:107有至少约70%、约75%、约80%、约85%、约90%或约95%同一性;(b)在低、中、或高严紧条件下与SEQ ID NO:42或SEQ ID NO:98或SEQ ID NO:106杂交的核酸序列;和(c)(a)或(b)的互补链。
24.权利要求23的方法,其中所述hasC基因编码含有SEQ ID NO:43或SEQ ID NO:99或SEQ ID NO:107的氨基酸序列,或其具有UDP葡萄糖焦磷酸化酶活性的片段的多肽。
25.权利要求22的方法,其中所述gtaB基因选自(a)编码多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO:22有至少约70%、约75%、约80%、约85%、约90%或约95%同一性;(b)在低、中、或高严紧条件下与SEQ ID NO:21杂交的核酸序列;和(c)(a)或(b)的互补链。
26.权利要求25的方法,其中所述gtaB基因编码含有SEQ ID NO:22的氨基酸序列,或其具有UDP葡萄糖焦磷酸化酶活性的片段的多肽。
27.权利要求16的方法,其中所述UDP-N-乙酰葡糖胺焦磷酸化酶基因为hasD或gcaD基因或其同系物。
28.权利要求27的方法,其中所述hasD基因选自(a)编码多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO:45有至少约70%、约75%、约80%、约85%、约90%或约95%同一性;(b)在低、中、或高严谨条件下与SEQ ID NO:44杂交的核酸序列;和(c)(a)或(b)的互补链。
29.权利要求28的方法,其中所述hasD基因编码含有SEQ ID NO:45的氨基酸序列,或其具有UDP-N-乙酰葡糖胺焦磷酸化酶活性的片段的多肽。
30.权利要求27的方法,其中所述gcaD基因选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO:30有至少约70%、约75%、约80%、约85%、约90%或约95%同一性;(b)在低、中、或高严紧条件下与SEQ ID NO:29杂交的核酸序列;和(c)(a)或(b)的互补链。
31.权利要求30的方法,其中所述gcaD基因编码含有SEQ ID NO:30的氨基酸序列,或其具有UDP-N-乙酰葡糖胺焦磷酸化酶活性的片段的多肽。
32.权利要求16的方法,其中葡萄糖-6-磷酸异构酶基因为hasE或其同系物。
33.权利要求32的方法,其中所述hasE基因选自(a)编码多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO:101有至少约70%、约75%、约80%、约85%、约90%或约95%同一性;(b)在低、中、或高严紧条件下与SEQ ID NO:100杂交的核酸序列;和(c)(a)或(b)的互补链。
34.权利要求33的方法,其中所述hasE基因编码含有SEQ ID NO:101的氨基酸序列,或其具有葡萄糖-6-磷酸异构酶活性的片段的多肽。
35.权利要求15的方法,其中一个或多个编码前体糖的基因受控于与透明质酸合酶编码序列相同或不同的启动子。
36.权利要求的方法35,其中所述相同或不同的启动子序列包含“共有序列”启动子,该“共有序列”启动子包含“-35”区的TTGACA序列和“-10”区的TATAAT序列。
37.权利要求的方法35,其中所述相同或不同的启动子序列为串联启动子,其中串联启动子的每个启动子可操作性连接于透明质酸合酶编码序列。
38.权利要求1的方法,其中所述核酸构建体还包含位于启动子序列下游和透明质酸合酶编码序列上游的mRNA加工/稳定序列。
39.权利要求15的方法,其中所述核酸构建体还包含位于不同的启动子或不同的一个或多个编码前体糖生物合成中的酶的基因的启动子下游和一个或多个基因上游的mRNA加工/稳定序列。
40.权利要求1的方法,其中所述核酸构建体还包含可选择的标记基因。
41.权利要求1的方法,其中所述芽孢杆菌属宿主细胞选自Bacillusagaradherens、嗜碱芽孢杆菌、解淀粉芽胞杆菌、短芽胞杆菌、环状芽胞杆菌、克劳氏芽孢杆菌、凝结芽胞杆菌、坚硬芽胞杆菌、灿烂芽胞杆菌、迟缓芽胞杆菌、地衣形芽胞杆菌、巨大芽胞杆菌、短小芽胞杆菌、嗜热脂肪芽胞杆菌、枯草芽孢杆菌和苏芸金芽胞杆菌。
42.权利要求1的方法,其中所述芽孢杆菌属宿主细胞为枯草芽孢杆菌。
43.权利要求1的方法,其中所述芽孢杆菌属宿主细胞为地衣形芽胞杆菌。
44.权利要求1的方法,其中所述芽孢杆菌属宿主细胞未用可选择的标记进行标记。
45.权利要求1的方法,其中所述核酸构建体包含可操作性连接于包含“-35”区TTGACA序列和“-10”区TATAAT序列的amyQ短“共有序列”启动子的透明质酸合酶基因,UDP-葡萄糖6-脱氢酶基因和UDP葡萄糖焦磷酸化酶基因。
46.包含核酸构建体的芽孢杆菌属宿主细胞,所述核酸构建体含有可操作性连接于与透明质酸合酶编码序列异源的启动子序列。
47.权利要求46的芽孢杆菌属宿主细胞,其中所述透明质酸合酶编码序列编码I型透明质酸合酶。
48.权利要求47的芽孢杆菌属宿主细胞,其中所述I型透明质酸合酶编码序列获自链球菌属菌株。
49.权利要求48的芽孢杆菌属宿主细胞,其中所述链球菌属菌株为似马链球菌,酿脓链球菌、乳房链球菌或马链球菌兽瘟亚种。
50.权利要求46的芽孢杆菌属宿主细胞,其中所述透明质酸合酶编码序列选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ IDNO:2、SEQ ID NO:93或SEQ ID NO:103有至少约70%、约75%、约80%、约85%、约90%或约95%同一性;(b)在低、中、或高严紧条件下与SEQ IDNO:1、SEQ ID NO:92或SEQ ID NO:102杂交的核酸序列;和(c)(a)或(b)的互补链。
51.权利要求50的芽孢杆菌属宿主细胞,其中所述透明质酸合酶编码序列编码含有SEQ ID NO:2、SEQ ID NO:93或SEQ ID NO:103的氨基酸序列,或其具有透明质酸合酶活性的片段的多肽。
52.权利要求46的芽孢杆菌属宿主细胞,其中所述透明质酸合酶编码序列编码II型透明质酸合酶。
53.权利要求52的芽孢杆菌属宿主细胞,其中所述II型透明质酸合酶编码序列获自巴斯德菌属菌株。
54.权利要求53的芽孢杆菌属宿主细胞,其中所述巴斯德菌属菌株为出血败血性巴斯德菌。
55.权利要求46的芽孢杆菌属宿主细胞,其中所述透明质酸合酶编码序列选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ IDNO:95有至少约70%、约75%、约80%、约85%、约90%或约95%同一性;(b)在低、中、或高严紧条件下与SEQ ID NO:94杂交的核酸序列;和(c)(a)或(b)的互补链。
56.权利要求55的芽孢杆菌属宿主细胞,其中所述透明质酸合酶编码序列编码含有SEQ ID NO:95的氨基酸序列,或其具有透明质酸合酶活性的片段的多肽。
57.权利要求46的芽孢杆菌属宿主细胞,其中将透明质酸的前体糖供应给或由芽孢杆菌属宿主细胞生成。
58.权利要求57的芽孢杆菌属宿主细胞,其中所述前体糖为D-葡萄糖醛酸或N-乙酰葡糖胺。
59.权利要求57的芽孢杆菌属宿主细胞,其中所述前体糖由芽孢杆菌属宿主细胞中的内源性基因、非内源性基因,或内源性和非内源性基因的组合编码。
60.权利要求46的芽孢杆菌属宿主细胞,其中所述核酸构建体还包含一个或多个编码透明质酸前体糖的生物合成中的酶的基因或所述芽孢杆菌属宿主细胞还包含一个或多个第二个核酸构建体,所述核酸构建体含有一个或多个编码透明质酸前体糖的生物合成中的酶的基因。
61.权利要求60的芽孢杆菌属宿主细胞,其中一个或多个基因选自UDP-葡萄糖6-脱氢酶基因、UDP-葡萄糖焦磷酸化酶基因、UDP-N-乙酰葡糖胺焦磷酸化酶基因、葡萄糖-6-磷酸异构酶基因、己糖激酶基因、磷酸葡糖变位酶基因、酰胺转移酶基因、变位酶基因和乙酰基转移酶基因。
62.权利要求61的芽孢杆菌属宿主细胞,其中所述UDP-葡萄糖6-脱氢酶基因为hasB基因或tuaD基因或其同系物。
63.权利要求62的芽孢杆菌属宿主细胞,其中所述hasB基因选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO:41、SEQID NO:97或SEQ ID NO:105有至少约70%、约75%、约80%、约85%、约90%或约95%同一性;(b)在低、中、或高严紧条件下与SEQ ID NO:40、SEQ ID NO:96或SEQ ID NO:104杂交的核酸序列;和(c)(a)或(b)的互补链。
64.权利要求63的芽孢杆菌属宿主细胞,其中所述hasB基因编码含有SEQ ID NO:41,SEQ ID NO:97,或SEQ ID NO:105的氨基酸序列,或其具有UDP-葡萄糖6-脱氢酶活性的片段的多肽。
65.权利要求62的芽孢杆菌属宿主细胞,其中所述tuaD基因选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO:12有至少约70%、约75%、约80%、约85%、约90%或约95%同一性;(b)在低、中、或高严紧条件下与SEQ ID NO:11杂交的核酸序列;和(c)(a)或(b)的互补链。
66.权利要求65的芽孢杆菌属宿主细胞,其中所述tuaD基因编码含有SEQ ID NO:12的氨基酸序列,或其具有UDP-葡萄糖6-脱氢酶活性的片段的多肽。
67.权利要求61的芽孢杆菌属宿主细胞,其中所述UDP葡萄糖焦磷酸化酶基因为hasC基因或gtaB基因或其同系物。
68.权利要求67的芽孢杆菌属宿主细胞,其中所述hasC基因选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO:43、SEQID NO:99或SEQ ID NO:107有至少约70%、约75%、约80%、约85%、约90%或约95%同一性;(b)在低、中、或高严紧条件下与SEQ ID NO:42或SEQ ID NO:98或SEQ ID NO:106杂交的核酸序列;和(c)(a)或(b)的互补链。
69.权利要求68的芽孢杆菌属宿主细胞,其中所述hasC基因编码含有SEQ ID NO:43、SEQ ID NO:99或SEQ ID NO:107的氨基酸序列,或其具有UDP葡萄糖焦磷酸化酶活性的片段的多肽。
70.权利要求61的芽孢杆菌属宿主细胞,其中所述gtaB基因选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO:22有至少约70%、约75%、约80%、约85%、约90%或约95%同一性;(b)在低、中、或高严紧条件下与SEQ ID NO:21杂交的核酸序列;和(c)(a)或(b)的互补链。
71.权利要求70的芽孢杆菌属宿主细胞,其中所述gtaB基因编码含有SEQ ID NO:22的氨基酸序列,或其具有UDP-葡萄糖焦磷酸化酶活性的片段的多肽。
72.权利要求61的芽孢杆菌属宿主细胞,其中所述UDP-N-乙酰葡糖胺焦磷酸化酶基因为hasD或gcaD基因或其同系物。
73.权利要求72的芽孢杆菌属宿主细胞,其中所述hasD基因选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO:45有至少约70%、约75%、约80%、约85%、约90%或约95%同一性;(b)在低、中、或高严紧条件下与SEQ ID NO:44杂交的核酸序列;和(c)(a)或(b)的互补链。
74.权利要求73的芽孢杆菌属宿主细胞,其中所述hasD基因编码含有SEQ ID NO:45的氨基酸序列,或其具有UDP-N-乙酰葡糖胺焦磷酸化酶活性的片段的多肽。
75.权利要求72的芽孢杆菌属宿主细胞,其中所述gcaD基因选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO:30有至少约70%、约75%、约80%、约85%、约90%或约95%同一性;(b)在低、中、或高严紧条件下与SEQ ID NO:29杂交的核酸序列;和(c)(a)或(b)的互补链。
76.权利要求75的芽孢杆菌属宿主细胞,其中所述gcaD基因编码含有SEQ ID NO:30的氨基酸序列,或其具有UDP-N-乙酰葡糖胺葡萄糖焦磷酸化酶活性的片段的多肽。
77.权利要求61的芽孢杆菌属宿主细胞,其中6-磷酸葡萄糖异构酶基因为hasE或其同系物。
78.权利要求77的芽孢杆菌属宿主细胞,其中所述hasE基因选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO:101有至少约70%、约75%、约80%、约85%、约90%或约95%同一性;(b)在低、中、或高严紧条件下与SEQ ID NO:100杂交的核酸序列;和(c)(a)或(b)的互补链。
79.权利要求78的芽孢杆菌属宿主细胞,其中所述hasE基因编码含有SEQ ID NO:101的氨基酸序列,或其具有6-磷酸葡萄糖异构酶活性的片段的多肽。
80.权利要求60的芽孢杆菌属宿主细胞,其中一个或多个编码前体糖的基因受控于与透明质酸合酶编码序列相同或不同的启动子。
81.权利要求80的芽孢杆菌属宿主细胞,其中所述所述相同或不同的启动子序列包含“共有序列”启动子,该“共有序列”启动子包含“-35”区的TTGACA序列和“-10”区的TATAAT序列。
82.权利要求80的芽孢杆菌属宿主细胞,其中所述相同或不同的启动子序列为串联启动子,其中串联启动子的每个启动子可操作性连接于透明质酸合酶编码序列。
83.权利要求46的芽孢杆菌属宿主细胞,其中所述核酸构建体还包含位于启动子序列下游和透明质酸合酶编码序列上游的mRNA加工/稳定序列。
84.权利要求60的芽孢杆菌属宿主细胞,其中所述核酸构建体还包含位于不同的启动子或不同的一个或多个编码前体糖生物合成中的酶的基因的启动子下游和一个或多个基因上游的mRNA加工/稳定序列。
85.权利要求46的芽孢杆菌属宿主细胞,其中核酸构建体还包含可选择的标记基因。
86.权利要求47的芽孢杆菌属宿主细胞,其中所述芽孢杆菌属宿主细胞选自Bacillus agaradherens、嗜碱芽孢杆菌、解淀粉芽胞杆菌、短芽胞杆菌、环状芽胞杆菌、克劳氏芽孢杆菌、凝结芽胞杆菌、坚硬芽胞杆菌、灿烂芽胞杆菌、迟缓芽胞杆菌、地衣形芽胞杆菌、巨大芽胞杆菌、短小芽胞杆菌、嗜热脂肪芽胞杆菌、枯草芽孢杆菌、和苏芸金芽胞杆菌。
87.权利要求46的芽孢杆菌属宿主细胞,其中所述芽孢杆菌属宿主细胞为枯草芽孢杆菌。
88.权利要求46的芽孢杆菌属宿主细胞,其中所述芽孢杆菌属宿主细胞为地衣形芽胞杆菌。
89.权利要求46的芽孢杆菌属宿主细胞,其未用可选择的标记进行标记。
90.权利要求46的芽孢杆菌属宿主细胞,其中所述核酸构建体包含可操作性连接于包含“-35”区TTGACA序列和“-10”区TATAAT序列的amyQ短“共有序列”启动子的透明质酸合酶基因,UDP-葡萄糖6-脱氢酶基因和UDP葡萄糖焦磷酸化酶基因。
91.含有透明质酸合酶编码序列的核酸构建体,所述透明质酸合酶编码序列可操作性连接于与透明质酸合酶编码序列异源的启动子序列。
92.权利要求91的构建体,其中前体糖的基因由与透明质酸合酶编码序列的启动子相同的启动子表达。
93.权利要求91的构建体,其中前体糖的基因由与透明质酸合酶编码序列的启动子不同的启动子表达。
94.权利要求91的构建体,其中透明质酸合酶编码序列编码I型透明质酸合酶。
95.权利要求94的构建体,其中I型透明质酸合酶编码序列获自链球菌属菌株。
96.权利要求95的构建体,其中链球菌属菌株为似马链球菌、酿脓链球菌、乳房链球菌或马链球菌兽瘟亚种。
97.权利要求的构建体91,其中透明质酸合酶编码序列选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO:2、SEQ ID NO:93或SEQ ID NO:103有至少约70%、约75%、约80%、约85%、约90%或约95%的同一性;(b)在低、中、或高严紧条件下与SEQ ID NO:1、SEQID NO:92或SEQ ID NO:102杂交的核酸序列;和(c)(a)或(b)的互补链。
98.权利要求97的构建体,其中所述透明质酸合酶编码序列编码含有SEQ ID NO:2、SEQ ID NO:93或SEQ ID NO:103的氨基酸序列,或其具有透明质酸合酶活性的片段的多肽。
99.权利要求91的构建体,其中所述透明质酸合酶编码序列编码II型透明质酸合酶。
100.权利要求99的构建体,其中所述II型透明质酸合酶编码序列获自巴斯德菌属菌株。
101.权利要求100的构建体,其中所述巴斯德菌属菌株为出血败血性巴斯德菌。
102.权利要求的构建体91,其中透明质酸合酶编码序列选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO:95有至少约70%、约75%、约80%、约85%、约90%或约95%的同一性;(b)在低、中、或高严紧条件下与SEQ ID NO:94杂交的核酸序列;和(c)(a)或(b)的互补链。
103.权利要求102的构建体,其中所述透明质酸合酶编码序列编码含有SEQ ID NO:95的氨基酸序列,或其具有透明质酸合酶活性的片段的多肽。
104.权利要求91的构建体,其中核酸构建体还包含一个或多个编码透明质酸的前体糖的生物合成中的酶的基因或芽孢杆菌属宿主细胞还包含一个或多个第二个核酸构建体,所述核酸构建体包含一个或多个编码透明质酸的前体糖的生物合成中的酶的基因。
105.权利要求104的构建体,其中一个或多个基因选自UDP-葡萄糖6-脱氢酶基因、UDP-葡萄糖焦磷酸化酶基因、UDP-N-乙酰葡糖胺焦磷酸化酶基因,葡萄糖-6-磷酸异构酶基因、己糖激酶基因、磷酸葡糖变位酶基因、酰胺转移酶基因、变位酶基因和乙酰基转移酶基因。
106.权利要求105的构建体,其中UDP-葡萄糖6-脱氢酶基因为hasB基因或tuaD基因或其同系物。
107.权利要求106的构建体,其中hasB基因选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO:97或SEQ ID NO:99有至少约70%、约75%、约80%、约85%、约90%或约95%的同一性;(b)在低、中、或高严紧条件下与SEQ ID NO:96或SEQ ID NO:98杂交的核酸序列;和(c)(a)或(b)的互补链。
108.权利要求107的构建体,其中所述hasB基因编码含有SEQ ID NO:97或SEQ ID NO:99的氨基酸序列,或其具有UDP-葡萄糖6-脱氢酶活性的片段的多肽。
109.权利要求106的构建体,其中所述tuaD基因选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO:12有至少约70%、约75%、约80%、约85%、约90%或约95%的同一性;(b)在低、中、或高严紧条件下与SEQ ID NO:11杂交的核酸序列;和(c)(a)或(b)的互补链。
110.权利要求109的构建体,其中所述tuaD基因编码含有SEQ ID NO:12的氨基酸序列,或其具有UDP-葡萄糖6-脱氢酶活性的片段的多肽。
111.权利要求105的构建体,其中所述UDP葡萄糖焦磷酸化酶基因为hasC基因或gtaB基因或其同系物。
112.权利要求111的构建体,其中所述hasC基因选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO:43、SEQ ID NO:99或SEQ ID NO:107有至少约70%、约75%、约80%、约85%、约90%或约95%的同一性;(b)在低、中、或高严紧条件下与SEQ ID NO:42或SEQ IDNO:98或SEQ ID NO:106杂交的核酸序列;和(c)(a)或(b)的互补链。
113.权利要求112的构建体,其中所述hasC基因编码含有SEQ ID NO:43、SEQ ID NO:99或SEQ ID NO:107的氨基酸序列,或其具有UDP葡萄糖焦磷酸化酶活性的片段的多肽。
114.权利要求111的构建体,其中所述gtaB基因选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO:22有至少约70%、约75%、约80%、约85%、约90%或约95%的同一性;(b)在低、中、或高严紧条件下与SEQ ID NO:21杂交的核酸序列;和(c)(a)或(b)的互补链。
115.权利要求112的构建体,其中所述gtaB基因编码含有SEQ ID NO:22的氨基酸序列,或其具有UDP-葡萄糖焦磷酸化酶活性的片段的多肽。
116.权利要求105的构建体,其中所述UDP-N-乙酰葡糖胺焦磷酸化酶基因为hasD或gcaD基因或其同系物。
117.权利要求116的构建体,其中所述hasD基因选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO:105有至少约70%、约75%、约80%、约85%、约90%或约95%的同一性;(b)核酸序列在低、中、或高严紧条件下与SEQ ID NO:104杂交的核酸序列;和(c)(a)或(b)的互补链。
118.权利要求117的构建体,其中所述hasD基因编码含有SEQ ID NO:105的氨基酸序列,或其具有UDP-N-乙酰葡糖胺葡萄糖焦磷酸化酶活性的片段的多肽。
119.权利要求116的构建体,其中所述gcaD基因选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO:30有至少约70%、约75%、约80%、约85%、约90%或约95%的同一性;(b)在低、中、或高严紧条件下与SEQ ID NO:29杂交的核酸序列;和(c)(a)或(b)的互补链。
120.权利要求119的构建体,其中所述gcaD基因编码含有SEQ IDNO:30的氨基酸序列,或其具有UDP-N-乙酰葡糖胺葡萄糖焦磷酸化酶活性的片段的多肽。
121.权利要求105的构建体,其中6-磷酸葡萄糖异构酶基因为hasE或其同系物。
122.权利要求121的构建体,其中所述hasE基因选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO:101有至少约70%、约75%、约80%、约85%、约90%或约95%的同一性;(b)在低、中、或高严紧条件下与SEQ ID NO:100杂交的核酸序列;和(c)(a)或(b)的互补链。
123.权利要求122的构建体,其中所述hasE基因编码含有SEQ IDNO:101的氨基酸序列,或其具有6-磷酸葡萄糖异构酶活性的片段的多肽。
124.权利要求104的构建体,其中一个或多个编码前体糖的基因受控于相同或不同的启动子或与透明质酸合酶编码序列不同的启动子。
125.权利要求124的构建体,其中所述相同或不同的启动子包含“共有序列”启动子,该“共有序列”启动子包含“-35”区的TTGACA序列和“-10”区的TATAAT序列。
126.权利要求130的构建体,其中所述相同或不同的启动子序列为串联启动子,其中串联启动子的每个启动子可操作性连接于透明质酸合酶编码序列。
127.权利要求91的构建体,其中所述核酸构建体还包含位于启动子序列下游和透明质酸合酶编码序列上游的mRNA加工/稳定序列。
128.权利要求124的构建体,其中还包含位于不同的启动子或不同的一个或多个编码前体糖生物合成中的酶的基因的启动子下游和一个或多个基因上游的mRNA加工/稳定序列。
129.权利要求91的构建体,其还包含可选择的标记基因。
130.权利要求91的构建体,其包含可操作性连接于含有“-35”区TTGACA序列和“-10”区TATAAT序列的amyQ短“共有序列”启动子的透明质酸合酶基因,UDP-葡萄糖6-脱氢酶基因和UDP葡萄糖焦磷酸化酶基因。
131.编码透明质酸合酶操纵子的分离的核酸序列,含有透明质酸合酶基因或其部分和UDP-葡萄糖6-脱氢酶基因,和可选的一个或多个选自UDP-葡萄糖焦磷酸化酶基因、UDP-N-乙酰葡糖胺焦磷酸化酶基因和葡萄糖-6-磷酸异构酶基因的基因。
132.权利要求131的分离的核酸序列,其中所述透明质酸合酶基因为SEQ ID NO:1、SEQ ID NO:92、SEQ ID NO:94或SEQ ID NO:102或其编码具有透明质酸合酶活性的多肽的片段。
133.权利要求131的分离的核酸序列,其中所述UDP-葡萄糖6-脱氢酶基因为SEQ ID NO:11、SEQ ID NO:40或SEQ ID NO:96、或SEQ ID NO:104或其编码具有UDP-葡萄糖6-脱氢酶活性的多肽的片段。
134.权利要求131的分离的核酸序列,其中所述UDP葡萄糖焦磷酸化酶基因为SEQ ID NO:21、SEQ ID NO:42或SEQ ID NO:98、SEQ ID NO:106或其编码具有UDP葡萄糖焦磷酸化酶活性的多肽的片段。
135.权利要求131的分离的核酸序列,其中所述UDP-N-乙酰葡糖胺焦磷酸化酶基因为SEQ ID NO:29或SEQ ID NO:44;或其编码具有UDP-N-乙酰葡糖胺焦磷酸化酶活性的多肽的片段。
136.权利要求131的分离的核酸序列,其中所述6-磷酸葡萄糖异构酶基因为SEQ ID NO:100或其编码具有6-磷酸葡萄糖异构酶活性的多肽的片段。
137.权利要求131的分离的核酸序列,其还包含一个或多个选自己糖激酶基因、磷酸葡糖变位酶基因、酰胺转移酶基因、变位酶基因和乙酰基转移酶基因的基因。
138.权利要求131的分离的核酸序列,其包含透明质酸合酶基因、UDP-葡萄糖6-脱氢酶基因和UDP葡萄糖焦磷酸化酶基因。
139.权利要求131的分离的核酸序列,含有SEQ ID NO:108的核酸序列。
140.包含权利要求131的核酸构建体的重组表达载体。
141.包含权利要求139的核酸构建体的表达载体。
142.编码UDP-葡萄糖6-脱氢酶的分离的核酸序列,选自:(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO:41有至少约75%、约80%、约85%、约90%或约95%的同一性;(b)与SEQ ID NO:40有至少75%,80%,85%,90%,或95%同一性的核酸序列;(c)在中或高严紧条件下与(i)SEQ ID NO:40的核酸序列,(ii)SEQ ID NO:40中所包含的cDNA序列,或(iii)(i)或(ii)的互补链杂交的核酸序列;和(d)(a)、(b)或(c)的亚序列,其中所述亚序列编码具有UDP-葡萄糖6-脱氢酶活性的多肽片段。
143.权利要求142的核酸序列,其编码的多肽含有与SEQ ID NO:41的氨基酸序列有至少约75%、约80%、约85%、约90%或约95%同一性的氨基酸序列。
144.权利要求142的核酸序列,其编码含有SEQ ID NO:41的氨基酸序列的多肽。
145.权利要求142的核酸序列,其编码的多肽含有SEQ ID NO:41的氨基酸序列,或其具有UDP-葡萄糖6-脱氢酶活性的片段。
146.权利要求145的核酸序列,其编码的多肽含有SEQ ID NO:41的氨基酸序列。
147.权利要求142的核酸序列,其含有SEQ ID NO:40的氨基酸序列。
148.权利要求142的核酸序列,其中所述核酸序列在中或高严紧条件下与(i)SEQ ID NO:40的核酸序列,(ii)SEQ ID NO:40所含的cDNA序列,或(iii)(i)或(ii)的互补链杂交。
149.权利要求142的核酸序列,其包含在质粒pMRT106中,所述质粒包含在大肠杆菌NRRL B-30536中。
150.含有可操作性连接于一个或多个控制序列的权利要求142的核酸序列的核酸构建体,所述控制序列在适宜的表达宿主中指导多肽的制备。
151.包含权利要求150的核酸构建体的重组表达载体。
152.包含权利要求150的核酸构建体的重组宿主细胞。
153.制备具有UDP-葡萄糖6-脱氢酶活性的多肽的方法,包括(a)在适宜制备多肽的条件下培养权利要求152的宿主细胞;和(b)回收多肽。
154.由权利要求142的核酸序列所编码的具有UDP-葡萄糖6-脱氢酶活性的分离的多肽。
155.编码UDP葡萄糖焦磷酸化酶的分离的核酸序列,选自:(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO:43有至少约90%,95%,或97%的同一性;(b)与SEQ ID NO:42有至少约90%、约95%,或约97%同一性的核酸序列;(c)在高或非常高严紧条件下与(i)SEQ IDNO:42的核酸序列,(ii)SEQ ID NO:42中所包含的cDNA序列,或(iii)(i)或(ii)的互补链杂交的核酸序列;和(d)(a)、(b)或(c)的亚序列,其中所述亚序列编码具UDP葡萄糖焦磷酸化酶活性的多肽片段。
156.权利要求155的核酸序列,其编码的多肽含有与SEQ ID NO:43的氨基酸序列有至少约至少约90%、约95%或约97%同一性的氨基酸序列。
157.权利要求155的核酸序列,其编码的多肽含有SEQ ID NO:43的氨基酸序列。
158.权利要求155的核酸序列,其编码的多肽含有SEQ ID NO:43的氨基酸序列,或其具有UDP-葡萄糖焦磷酸化酶活性的片段。
159.权利要求158的核酸序列,其编码的多肽含有SEQ ID NO:43的氨基酸序列。
160.权利要求155的核酸序列,其含有SEQ ID NO:42的核酸序列。
161.权利要求的核酸序列155,其中所述核酸序列在高或非常高严紧条件下与(i)SEQ ID NO:42的核酸序列,(ii)SEQ ID NO:42所含的cDNA序列,或(iii)(i)或(ii)的互补链杂交。
162.权利要求155的核酸序列,其包含在质粒pMRT106中,所述质粒包含在大肠杆菌NRRL B-30536中。
163.含有可操作性连接于一个或多个控制序列的权利要求155的核酸序列的核酸构建体,所述控制序列在适宜的表达宿主中指导多肽的制备。
164.包含权利要求163的核酸构建体的重组表达载体。
165.包含权利要求163的核酸构建体的重组宿主细胞。
166.制备具有UDP葡萄糖焦磷酸化酶活性的多肽的方法,包括(a)在适宜制备多肽的条件下培养权利要求165的宿主细胞;和(b)回收多肽。
167.由权利要求155的核酸序列所编码的具有UDP-葡萄糖6-脱氢酶活性的分离的多肽。
168.编码UDP-N-乙酰葡糖胺焦磷酸化酶的分离的核酸序列,选自:(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO:45有至少约75%、约80%、约85%、约90%,或约95%的同一性;(b)与SEQ ID NO:44有至少75%、80%、85%、90%或95%同一性的核酸序列;(c)在低、中、或高严紧条件下与(i)SEQ ID NO:44的核酸序列,(ii)SEQ ID NO:44的cDNA序列,或(iii)(i)或(ii)的互补链杂交的核酸序列;和(d)(a)、(b)或(c)的亚序列,其中所述亚序列编码具有UDP-N-乙酰葡糖胺焦磷酸化酶活性的多肽片段。
169.权利要求的核酸序列168,其编码的多肽含有具有与SEQ ID NO:45的氨基酸序列至少约75%、约80%、约85%、约90%或约95%同一性的氨基酸序列。
170.权利要求168的核酸序列,其编码的多肽包含SEQ ID NO:45的氨基酸序列。
171.权利要求168的核酸序列,其编码的多肽含有SEQ ID NO:45的氨基酸序列,或其具有UDP-N-乙酰葡糖胺焦磷酸化酶活性的片段。
172.权利要求171的核酸序列,其编码含有SEQ ID NO:45的氨基酸序列的多肽。
173.权利要求168的核酸序列,其含有SEQ ID NO:44的核酸序列。
174.权利要求168的核酸序列,其中核酸序列在低、中、或高严紧条件下与(i)SEQ ID NO:44的核酸序列,(ii)SEQ ID NO:44所包含的cDNA序列,或(iii)(i)或(ii)的互补链杂交。
175.权利要求168的核酸序列,其包含在质粒pMRT106中,所述质粒包含在大肠杆菌NRRL B-30536中。
176.含有可操作性连接于一个或多个控制序列的权利要求168的核酸序列的核酸构建体,所述控制序列在适宜的表达宿主中指导多肽的制备。
177.包含权利要求176的核酸构建体的重组表达载体。
178.包含权利要求176的核酸构建体的重组宿主细胞。
179.制备具有UDP-N-乙酰葡糖胺焦磷酸化酶活性的多肽的方法,包括(a)在适宜制备多肽的条件下培养权利要求178的宿主细胞;和(b)回收多肽。
180.由权利要求168的核酸序列所编码的具有UDP-葡萄糖6-脱氢酶活性的分离的多肽。
181.由权利要求168的核酸序列所编码的具有UDP-葡萄糖6-脱氢酶活性的分离的多肽。
182.权利要求1的方法,其中芽孢杆菌属宿主细胞包含破坏的或缺失的cypX和/或yvmC基因。
183.权利要求46的芽孢杆菌属宿主细胞,其包含破坏的或缺失的cypX和/或yvmC基因。
CN02828283.3A 2001-12-21 2002-12-20 在重组宿主细胞中制备透明质酸的方法 Expired - Lifetime CN1636052B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US34264401P 2001-12-21 2001-12-21
US60/342,644 2001-12-21
PCT/US2002/041067 WO2003054163A2 (en) 2001-12-21 2002-12-20 Methods for producing hyaluronan in a recombinant host cell

Publications (2)

Publication Number Publication Date
CN1636052A true CN1636052A (zh) 2005-07-06
CN1636052B CN1636052B (zh) 2014-07-02

Family

ID=23342668

Family Applications (1)

Application Number Title Priority Date Filing Date
CN02828283.3A Expired - Lifetime CN1636052B (zh) 2001-12-21 2002-12-20 在重组宿主细胞中制备透明质酸的方法

Country Status (18)

Country Link
US (5) US7811806B2 (zh)
EP (1) EP1572895B1 (zh)
JP (1) JP2005525091A (zh)
KR (2) KR100885163B1 (zh)
CN (1) CN1636052B (zh)
AT (1) ATE502115T1 (zh)
AU (1) AU2002366711C1 (zh)
BR (1) BR0215220A (zh)
CA (2) CA2803931A1 (zh)
CZ (1) CZ2004765A3 (zh)
DE (1) DE60239495D1 (zh)
DK (1) DK1572895T3 (zh)
ES (1) ES2362354T3 (zh)
HU (2) HU228693B1 (zh)
IL (2) IL162302A0 (zh)
PL (2) PL399352A1 (zh)
RU (1) RU2346049C2 (zh)
WO (1) WO2003054163A2 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102021213A (zh) * 2009-09-17 2011-04-20 上海佰加壹医药有限公司 一种发酵生产透明质酸发酵液的方法
CN102559559A (zh) * 2012-02-21 2012-07-11 山东福瑞达生物医药有限公司 一种芽孢杆菌及采用该菌种生产透明质酸酶的方法
CN102911887A (zh) * 2011-08-02 2013-02-06 山东省生物药物研究院 一种利用毕赤酵母基因调控发酵生产不同分子量透明质酸的方法
CN103255076A (zh) * 2012-02-21 2013-08-21 华熙福瑞达生物医药有限公司 一种芽孢杆菌、一种透明质酸酶及其制备方法和用途
CN106381279A (zh) * 2016-08-29 2017-02-08 中国药科大学 一种细菌胞外多糖、其制备方法及其应用
CN106755022A (zh) * 2015-11-25 2017-05-31 中国科学院大连化学物理研究所 乙酰葡萄糖胺磷酸变位酶AtAGM编码基因及其酶、制备、应用与酶活性检测方法

Families Citing this family (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7091008B1 (en) * 1994-07-01 2006-08-15 The Board Of Regents Of The University Of Oklahoma Hyaluronan synthase genes and expression thereof in Bacillus hosts
CA2307842C (en) * 1997-10-31 2010-10-19 The Board Of Regents Of The University Of Oklahoma Hyaluronan synthase gene and uses thereof
AU2002365206B2 (en) * 2001-06-13 2008-03-20 The Board Of Regents Of The University Of Oklahoma Hyaluronan synthase genes and expression thereof
EP1572895B1 (en) * 2001-12-21 2011-03-16 Novozymes Biopharma DK A/S Methods for producing hyaluronan in a recombinant host cell
AU2003223931A1 (en) * 2002-05-14 2003-11-11 Novozymes A/S Pectate lyase variants
EP1517994B1 (en) * 2002-06-20 2007-01-24 Novozymes Biopolymer A/S Flocculation with divalent salt
WO2004011609A2 (en) * 2002-07-26 2004-02-05 Novozymes Biotech, Inc. Methods for producing biological substances in pigment-deficient mutants of bacillus cells
WO2005069762A2 (en) * 2004-01-09 2005-08-04 Novozymes Inc. Bacillus licheniformis chromosome
EP1735455A2 (en) * 2004-03-31 2006-12-27 Novozymes Biopolymer A/S Methods for producing hyaluronic acid in a bacillus cell
US7002007B2 (en) * 2004-05-28 2006-02-21 Calcigen Corporation Production of high molecular weight hyaluronates
CN101006174B (zh) 2004-06-21 2010-05-26 诺维信公司 以相同取向稳定保持的至少两个orf的多拷贝
SI1805312T1 (sl) 2004-09-23 2009-12-31 Bayer Cropscience Ag Postopki in sredstva za izdelavo hialuronana
EP1640457A1 (de) * 2004-09-23 2006-03-29 Bayer CropScience GmbH Verfahren und Mittel zur Herstellung von Hyaluronan
PL1817347T3 (pl) * 2004-11-24 2017-10-31 Albumedix As Sposób sieciowania kwasu hialuronowego za pomocą diwinylosulfonu
JP2008527056A (ja) * 2004-12-30 2008-07-24 ノボザイムス バイオポリマー アクティーゼルスカブ αヒドロキシ酸のポリマーにより結合されたヒアルロン酸
EP1696032A1 (de) * 2005-02-23 2006-08-30 Bayer CropScience GmbH Verfahren und Mittel zur Herstellung von Hyaluronan in Pilzen
JP4639904B2 (ja) 2005-03-30 2011-02-23 チッソ株式会社 蛍光活性を有するルシフェラーゼの活性増強方法
JP4609177B2 (ja) 2005-04-28 2011-01-12 チッソ株式会社 カルシウム結合型発光蛋白質溶液の発光時間延長方法
US20060287512A1 (en) * 2005-05-04 2006-12-21 Novozymes Biopolymer A/S Method of controlling the content of selected component(s) from polymer(s) using molecular sieve(s)
EP1932909A4 (en) * 2005-08-25 2009-04-08 Toyo Boseki VEGETABLE PRODUCING HYALURONIC ACID
EP1772052A1 (de) 2005-10-05 2007-04-11 Bayer CropScience GmbH Verbesserte Verfahren und Mittel zur Herstellung von Hyaluronan
CA2624592C (en) * 2005-10-05 2016-07-19 Bayer Cropscience Ag Gfat-expressing plants with increased hyaluronan production
JP2007174957A (ja) * 2005-12-27 2007-07-12 Toyobo Co Ltd ヒアルロン酸生産酵母
US20080038780A1 (en) * 2006-02-15 2008-02-14 Novozymes Biopolymer A/S Production of low molecular weight hyaluronic acid
US20090118423A1 (en) * 2006-03-14 2009-05-07 Novozymes Biopolymer A/S Acrylated Hyaluronic Acid
JP2009545637A (ja) 2006-08-04 2009-12-24 ノボザイムス バイオファーマ デーコー アクティーゼルスカブ 分岐ヒアルロン酸及びその製造方法
ATE533838T1 (de) 2006-11-29 2011-12-15 Novozymes Inc Verfahren zur verbesserten einführung von dna in bakterienzellen
DK2104739T3 (da) 2006-12-21 2013-10-07 Novozymes Inc Modificerede messenger-RNA-stabiliseringssekvenser til ekspression af gener i bakterieceller
US20110281817A1 (en) * 2007-08-31 2011-11-17 Sugar Industry Innovation Pty. Ltd. Production of hyaluronic acid
EP2031053A1 (en) * 2007-08-31 2009-03-04 The University Of Queensland Production of HA
EP2036983A1 (de) 2007-09-12 2009-03-18 Bayer CropScience AG Pflanzen, die erhöhte Mengen an Glucosaminglycanen synthetisieren
CN101878230B (zh) 2007-12-19 2012-11-21 赢创高施米特有限公司 乳液中的交联透明质酸
EP2376626A4 (en) * 2008-12-13 2012-10-17 Dna Microarray MICRO-ENVIRONMENTAL NICHE ASSAY FOR SCREENING OF INDUCED PLURIPOTENT STEM CELLS (CIPS)
EP2213315A1 (en) 2009-01-30 2010-08-04 Mero S.r.L. Antibacterial hydrogel and use thereof in orthopedics
EP2542673A2 (en) 2010-03-03 2013-01-09 Novozymes, Inc. Xylanase variants and polynucleotides encoding same
IT1401498B1 (it) 2010-07-30 2013-07-26 Mero Srl Idrogelo a base di acido ialuronico e suo uso in ortopedia
IT1402384B1 (it) 2010-09-09 2013-09-04 Fidia Farmaceutici Processo per la produzione di acido ialuronico in escherichia coli o bacillus megaterium
IT1402385B1 (it) 2010-09-09 2013-09-04 Fidia Farmaceutici Processo per la produzione di acido ialuronico in escherichia coli o bacillus subtilis
CN103562229A (zh) 2011-05-30 2014-02-05 诺维信生物制药丹麦公司 高分子量透明质酸的喷雾干燥
KR20140058581A (ko) 2011-09-02 2014-05-14 노보자임스 바이오파마 디케이 에이/에스 지연된 약물 방출용 히알루론산 함유 경구 제형
DE102012201297A1 (de) * 2012-01-31 2013-08-01 Basf Se Expressionsverfahren
US20150010899A1 (en) * 2012-02-22 2015-01-08 Novozymes A/S Advanced fermentation control
WO2014100837A1 (en) 2012-12-17 2014-06-26 Bui The Duy Computer aided implantation of body implants
AU2014352672B2 (en) 2013-11-25 2018-11-29 Deuteria Biomaterials, Llc Deuterium-enriched hyaluronan
CA2896038C (en) 2015-07-03 2022-08-09 Glycobiosciences Inc. Polymer matrix compositions comprising a high concentration of bio-fermented sodium hyaluronate and uses thereof
CN109715794A (zh) 2016-07-05 2019-05-03 诺维信公司 果胶裂解酶变体以及编码它们的多核苷酸
CN107653280B (zh) * 2016-07-25 2021-05-04 安琪酵母股份有限公司 透明质酸发酵用的组合物、培养基和方法及其应用
KR102135044B1 (ko) * 2018-12-10 2020-07-17 대화제약 주식회사 히알루론산 합성효소 변이 단백질 및 이를 이용한 히알루론산 생산 방법
WO2020122429A1 (ko) * 2018-12-10 2020-06-18 대화제약 주식회사 히알루론산 합성효소 변이 단백질 및 이를 이용한 히알루론산 생산 방법
WO2020122430A1 (ko) * 2018-12-10 2020-06-18 대화제약 주식회사 비병원성 세균을 이용하여 히알루론산 생산을 위한 발현 시스템 및 상기 발현 시스템을 이용한 히알루론산 생산방법
CN110055201B (zh) * 2019-03-05 2021-05-28 江南大学 一种高产透明质酸寡糖的重组枯草芽孢杆菌的构建方法
RU2723722C1 (ru) * 2019-07-26 2020-06-17 Общество с ограниченной ответственностью "ЦЕНТР ТРАНСФЕРА БИОТЕХНОЛОГИЙ ОКА-Биотех" ТАНДЕМНЫЙ ПРОМОТОР, ФУНКЦИОНИРУЮЩИЙ В БАКТЕРИИ РОДА Bacillus, ТРАНСФОРМИРОВАННАЯ БАКТЕРИЯ РОДА Bacillus - ПРОДУЦЕНТ ЦЕЛЕВОГО ПРОДУКТА, СОДЕРЖАЩАЯ УКАЗАННЫЙ ПРОМОТОР, И СПОСОБ ПОЛУЧЕНИЯ ЦЕЛЕВОГО ПРОДУКТА С ИСПОЛЬЗОВАНИЕМ УКАЗАННОЙ БАКТЕРИИ
RU2719140C1 (ru) 2019-07-26 2020-04-17 Общество с ограниченной ответственностью "ЦЕНТР ТРАНСФЕРА БИОТЕХНОЛОГИЙ ОКА-Биотех" Бактерия рода bacillus, продуцирующая гиалуроновую кислоту, и способ получения гиалуроновой кислоты с использованием указанной бактерии
CN111518825B (zh) * 2020-04-30 2022-10-11 浙江工业大学 一种多基因组合表达制备蛹虫草多糖的方法
WO2022178432A1 (en) * 2021-02-22 2022-08-25 Danisco Us Inc. Methods and compositions for producing proteins of interest in pigment deficient bacillus cells

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60251898A (ja) 1984-05-25 1985-12-12 Shiseido Co Ltd 醗酵法によるヒアルロン酸の製造方法
US6951743B2 (en) 1997-10-31 2005-10-04 University Of Oklahoma Board Of Regents Hyaluronan synthase genes and expression thereof in bacillus hosts
US6455304B1 (en) 1994-07-01 2002-09-24 The Board Of Regents Of The University Of Oklahoma Hyaluronate synthase gene and uses thereof
IT1271001B (it) 1994-07-26 1997-05-26 Poli Ind Chimica Spa Procedimento di preparazione di acido ialuronico mediante fermentazione con streptococcus
CA2307842C (en) 1997-10-31 2010-10-19 The Board Of Regents Of The University Of Oklahoma Hyaluronan synthase gene and uses thereof
US5955310A (en) * 1998-02-26 1999-09-21 Novo Nordisk Biotech, Inc. Methods for producing a polypeptide in a bacillus cell
WO1999051265A1 (en) 1998-04-02 1999-10-14 Board Of Regents Of The Universtiy Of Oklahoma Nucleic acid encoding hyaluronan synthase and methods of use
DE69940353D1 (en) 1998-11-11 2009-03-12 Univ Oklahoma Polymerpfropfung mittels polysaccharide-synthase
WO2002077183A2 (en) 2001-03-21 2002-10-03 Elitra Pharmaceuticals, Inc. Identification of essential genes in microorganisms
AU2002365206B2 (en) * 2001-06-13 2008-03-20 The Board Of Regents Of The University Of Oklahoma Hyaluronan synthase genes and expression thereof
EP1572895B1 (en) * 2001-12-21 2011-03-16 Novozymes Biopharma DK A/S Methods for producing hyaluronan in a recombinant host cell

Non-Patent Citations (14)

* Cited by examiner, † Cited by third party
Title
DINENE L.,等: "Hyaluronic acid synthesis operon (has) expression in group A streptococci", 《J. BIOLL. CHEM.》 *
DINENE,L,等: "Hyaluronic acid synthesis operon (has) expression in group A streptococci", 《J. BIOL. CHEM.》 *
DOUGHERTY,等: "Molecular Characterization of hasA from an Operon Required for Hyaluronic Acid Synthesis in Group A Streptococci", 《J. BIOL. CHEM.》 *
FERRETT J.,等: "Complete genome sequence of an M1 strain of Streptococcus pyogenes", 《PNAS》 *
FERRETTI,J.J.,等: "UDP-glucose 6-dehydrogenase [Streptococcus pyogenes]", 《GENBANK登录号:NP_270108》 *
FERRETTI,J.J.,等: "UDP-glucose pyrophosphorylase [Streptococcus pyogenes]", 《GENBANK登录号:NP_270109》 *
FULLER, T.E.,等: "Pasteurella multocida hyaluronan synthase (has) gene, complete cds", 《GENBANK登陆号:AF237926》 *
KUMARIK,等: "Molecular Cloning, Expression, and Characterization of the Authentic Hyaluronan Synthase from Group C Streptococcus equisimilis", 《J. BIOL. CHEM.》 *
KUNST,F.,等: "UDP-N-acetylglucosamine pyrophosphorylase [Bacillus subtilis]", 《GENBANK登录号:NP_387931》 *
KUNST,F.,等: "UTP-glucose-1-phosphate uridylyltransferase [Bacillus subtilis]", 《GENBANK登录号:NP_391447》 *
SOLDO,B.,等: "Bacillus subtilis 168 teichuronic acid operon, tuaABCDEFGH genes,complete sequence", 《GENBANK登录号:AF015609》 *
VARON,D.,等: "Bacillus subtilis UDP-glucose pyrophosphorylase (gtaB) gene,complete cds", 《GENBANK登录号:L12272》 *
WARD,P.N.,等: "Streptococcus uberis hasA and hasB genes for putative hyaluronan synthase and UDP-glucose dehydrogenase", 《GENBANK登录号:AJ242946》 *
WARD,P.N.,等: "Streptococcus uberis ORF2 (partial), hasC gene and ORF3 (partial)", 《GENBANK登录号:AJ400707》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102021213A (zh) * 2009-09-17 2011-04-20 上海佰加壹医药有限公司 一种发酵生产透明质酸发酵液的方法
CN102021213B (zh) * 2009-09-17 2014-07-09 上海佰加壹医药有限公司 一种发酵生产透明质酸发酵液的方法
CN102911887A (zh) * 2011-08-02 2013-02-06 山东省生物药物研究院 一种利用毕赤酵母基因调控发酵生产不同分子量透明质酸的方法
CN102559559A (zh) * 2012-02-21 2012-07-11 山东福瑞达生物医药有限公司 一种芽孢杆菌及采用该菌种生产透明质酸酶的方法
CN103255076A (zh) * 2012-02-21 2013-08-21 华熙福瑞达生物医药有限公司 一种芽孢杆菌、一种透明质酸酶及其制备方法和用途
CN106755022A (zh) * 2015-11-25 2017-05-31 中国科学院大连化学物理研究所 乙酰葡萄糖胺磷酸变位酶AtAGM编码基因及其酶、制备、应用与酶活性检测方法
CN106755022B (zh) * 2015-11-25 2020-08-04 中国科学院大连化学物理研究所 乙酰葡萄糖胺磷酸变位酶AtAGM编码基因及其酶、制备、应用与酶活性检测方法
CN106381279A (zh) * 2016-08-29 2017-02-08 中国药科大学 一种细菌胞外多糖、其制备方法及其应用
CN106381279B (zh) * 2016-08-29 2019-11-05 中国药科大学 一种细菌胞外多糖、其制备方法及其应用

Also Published As

Publication number Publication date
US8137951B2 (en) 2012-03-20
AU2002366711A1 (en) 2003-07-09
RU2004122420A (ru) 2005-10-10
JP2005525091A (ja) 2005-08-25
ATE502115T1 (de) 2011-04-15
IL162302A0 (en) 2005-11-20
DE60239495D1 (de) 2011-04-28
US20110189737A1 (en) 2011-08-04
US20110014662A1 (en) 2011-01-20
US20030175902A1 (en) 2003-09-18
CN1636052B (zh) 2014-07-02
KR100879908B1 (ko) 2009-01-21
DK1572895T3 (da) 2011-07-11
AU2002366711C1 (en) 2009-01-22
CA2471148C (en) 2013-04-09
WO2003054163A2 (en) 2003-07-03
EP1572895A2 (en) 2005-09-14
PL399352A1 (pl) 2012-10-08
US8574886B2 (en) 2013-11-05
RU2346049C2 (ru) 2009-02-10
HU228693B1 (hu) 2013-05-28
WO2003054163A3 (en) 2005-10-27
IL162302A (en) 2011-01-31
KR20080018965A (ko) 2008-02-28
US8093036B2 (en) 2012-01-10
HU1300136D0 (hu) 2007-05-29
CA2471148A1 (en) 2003-07-03
ES2362354T3 (es) 2011-07-04
AU2002366711B2 (en) 2007-11-29
EP1572895A4 (en) 2007-07-25
CA2803931A1 (en) 2003-07-03
PL375190A1 (en) 2005-11-28
KR20040085142A (ko) 2004-10-07
PL212928B1 (pl) 2012-12-31
KR100885163B1 (ko) 2009-02-23
US20140038235A1 (en) 2014-02-06
HUP0700154A2 (en) 2007-05-29
CZ2004765A3 (cs) 2004-12-15
US20120149067A1 (en) 2012-06-14
EP1572895B1 (en) 2011-03-16
US7811806B2 (en) 2010-10-12
BR0215220A (pt) 2007-01-09

Similar Documents

Publication Publication Date Title
CN1636052A (zh) 在重组宿主细胞中制备透明质酸的方法
CN1061089C (zh) 支链淀粉酶、产生它的微生物、其制备方法和用途
CN1993377A (zh) 丙氨酸2,3氨基变位酶
CN1530438A (zh) 使用利用甲醇的细菌生产l-赖氨酸的方法
CN1203274A (zh) 用于发酵制备l-半胱氨酸、l-胱氨酸、n-乙酰丝氨酸或四氢噻唑衍生物的微生物和方法
CN1230991A (zh) 仓鼠EF-1α转录调节DNA
CN1513057A (zh) 宿主微生物
CN1729288A (zh) 新型腈水合酶
CN1845990A (zh) 耐热化蔗糖磷酸化酶(sp)的方法
CN1308457C (zh) 发酵生产s-腺苷甲硫氨酸的方法
CN1609208A (zh) L-丝氨酸的抑制性被降低的3-磷酸甘油酸脱氢酶变体及其编码基因
CN1175104C (zh) 内切-β-N-乙酰葡糖胺糖苷酶基因
CN1269838C (zh) 用于由大肠杆菌向培养基中分泌来制备Leu-水蛭素的信号序列
CN1875106A (zh) 重组微生物
CN1656225A (zh) 新型羰基还原酶及其编码基因、以及利用它们制备光学活性醇的方法
CN1536072A (zh) 属于芽孢杆菌属的肌苷生产细菌和生产肌苷的方法
CN1685057A (zh) 在芽孢杆菌细胞的色素缺陷突变体中产生生物物质的方法
CN1213146C (zh) 从新的融合蛋白制造重组胰岛素的方法
CN1156575C (zh) 分泌人粒细胞集落刺激因子(g-csf)的大肠杆菌菌株
CN1292068C (zh) 酒曲霉菌中蛋白水解酶的增强表达
CN1891820A (zh) 在表面活性剂存在下稳定的胆固醇氧化酶
CN1150323C (zh) 具有碱性支链淀粉酶和碱性α-淀粉酶两种活性的酶的基因
CN1286973C (zh) 一种组蛋白甲基转移酶及其制备方法
CN1141387C (zh) ppGpp合成酶及用于改善目的蛋白产生的表达系统
CN1527881A (zh) 来自食甲基嗜甲基菌的新的酶及其编码基因

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: NOVOZYMES BIOLOGICGAL PHARMACEUTICAL DENMARK CO.,L

Free format text: FORMER OWNER: NOVOZYMES BIOPOLYMER AS

Effective date: 20090717

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20090717

Address after: Denmark bagsvaerd

Applicant after: NOVOZYMES BIOPHARMA DK A/S

Address before: Denmark bagsvaerd

Applicant before: NOVOZYMES BIOPOLYMER A/S

C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Open date: 20050706

CI01 Publication of corrected invention patent application

Correction item: Rejection of patent application

Correct: Dismiss

False: Reject

Number: 32

Volume: 26

ERR Gazette correction

Free format text: CORRECT: PATENT APPLICATION REJECTION OF AFTER PUBLICATION; FROM: REJECTION TO: REVOCATION REJECTED

C14 Grant of patent or utility model
GR01 Patent grant
C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20160513

Address after: Denmark bagsvaerd

Patentee after: NOVOZYMES A/S

Address before: Denmark bagsvaerd

Patentee before: Novozymes Biopharma DK A/S

CX01 Expiry of patent term
CX01 Expiry of patent term

Granted publication date: 20140702