CN1636052A

CN1636052A - 在重组宿主细胞中制备透明质酸的方法

Info

Publication number: CN1636052A
Application number: CNA028282833A
Authority: CN
Inventors: 艾伦·斯洛马; 里金·贝尔; 威廉·威德纳; 玛丽亚·唐; 戴维·斯滕伯格; 斯蒂芬·布朗
Original assignee: Novozymes Biopolymer AS
Current assignee: Novozymes AS
Priority date: 2001-12-21
Filing date: 2002-12-20
Publication date: 2005-07-06
Anticipated expiration: 2022-12-20
Also published as: US8137951B2; AU2002366711A1; RU2004122420A; JP2005525091A; ATE502115T1; IL162302A0; DE60239495D1; US20110189737A1; US20110014662A1; US20030175902A1; CN1636052B; KR100879908B1; DK1572895T3; AU2002366711C1; CA2471148C; WO2003054163A2; EP1572895A2; PL399352A1; US8574886B2; RU2346049C2

Abstract

本发明涉及制备透明质酸的方法，包括：(a)在适宜制备透明质酸的条件下培养芽孢杆菌属宿主细胞，其中芽孢杆菌属宿主细胞包含核酸构建体，所述核酸构建体含有透明质酸合酶编码序列，该序列可操作性连接于与透明质酸合酶编码序列异源的启动子序列；和(b)从培养基中回收透明质酸。本发明还涉及编码透明质酸合酶操纵子的分离的核酸序列，所述透明质酸合酶操纵子含有透明质酸合酶基因或其部分和UDP－葡萄糖6－脱氢酶基因，和可选的选自UDP－葡萄糖焦磷酸化酶基因、UDP－N－乙酰葡糖胺焦磷酸化酶基因和葡萄糖－6－磷酸异构酶基因的一个或多个基因。本发明还涉及编码UDP－葡萄糖6－脱氢酶基因、UDP－葡萄糖焦磷酸化酶基因和UDP－N－乙酰葡糖胺焦磷酸化酶的分离的核酸序列。

Description

在重组宿主细胞中制备透明质酸的方法

发明领域

本发明涉及在重组宿主细胞中制备透明质酸的方法。

背景技术

人体内最丰富的杂多糖(heteropolysaccharide)是葡糖胺聚糖(glycosaminoglycan)。葡糖胺聚糖是无分枝糖类聚合物，含有重复二糖单位(仅硫酸角质素在糖的核心区中为分枝的)。所述二糖单位一般包括作为第一个糖单位的两种修饰糖-N-乙酰半乳糖胺(GaINAc)或N-乙酰葡萄糖胺(GlcNAc)中的一种。第二个单位通常是糖醛酸，如葡萄糖醛酸(GlcUA)或艾杜糖醛酸。

葡糖胺聚糖是带负电荷的分子，且在溶液中具有能够带来高粘度的扩展构象。葡糖胺聚糖主要位于细胞表面上或细胞外基质中。葡糖胺聚糖在溶液中还具有低压缩性，这使得其可作为理想的生理润滑液，例如，关节。葡糖胺聚糖的刚性提供了细胞的结构完整性并提供了能使细胞发生迁移的细胞间通道。具有最重要的生理学价值的葡糖胺聚糖是透明质酸(hyaluronan)、硫酸软骨素、肝素、硫酸乙酰肝素、硫酸皮肤素和硫酸角质素。多数葡糖胺聚糖通过特异性寡糖结构与蛋白多糖核心蛋白共价结合。除游离糖链与蛋白多糖构成非共价复合物外，透明质酸与特定蛋白多糖构成大聚集物。

已经确定了透明质酸在体内的多种作用(参见LaurentT.C.and FraserJ.R.E.，1992，FASEB J.6：2397-2404；and Toole B.P.，1991，“Proteoglycans andhyaluronan in morphogenesis and differentiation.”In：Cell Biology of theExtracellular Matrix，305-341页，Hay E.D.，ed.，Plenum，New York)。透明质酸存在于透明软骨、关节液和皮肤组织的真皮以及表皮中。透明质酸还被推测在多种生理功能，如粘附，发育，细胞运动性，癌症，血管发生和创伤愈合中发挥作用。根据透明质酸的独特物理和生物学特性，可将其用于眼和关节外科中，并且正在研究其在其它医学应用中的价值。透明质酸制品已被用于矫形学，风湿病学和皮肤病学中。

公鸡冠是透明质酸的重要商业来源。微生物是可选择的来源。美国专利No.4,801,539中公开了制备透明质酸的发酵法，其中包括兽瘟链球菌菌株，所报道的产率约为3.6g透明质酸/升。欧洲专利No.EP0694616公开了采用改良的兽瘟链球菌菌株的发酵方法，所报道的产率约为3.5g透明质酸/升。

通过发酵而用于制备透明质酸的微生物是病原性细菌菌株，其中最主要的细菌属于某些链球菌属菌种。A型和C型链球菌用由透明质酸组成的非病原性荚膜将其自身围绕，所述透明质酸在组成上与在结缔组织和关节中发现的透明质酸相同。出血败血性巴斯德菌(Pasteurella multocida)(另一种病原性荚膜菌)也用透明质酸围绕其自身细胞。

已有报道描述了来自脊椎动物、细菌病原体和海藻病毒的透明质酸合酶(DeAngelis，P.L.，1999，Cell.Mol.Life SCI，56：670-682)。WO 99/23227公开了来自似马链球菌的I型透明质酸合酶。WO 99/51265和WO 00/27437公开了来自出血败血性巴斯德菌的II型透明质酸合酶(Group II hyaluronatesynthase)。Ferretti等公开了酿脓链球菌的透明质酸合酶操纵子，该操纵子包含分别编码透明质酸合酶、UDP葡萄糖脱氢酶和UDP-葡萄糖焦磷酸化酶的三个基因，hasA、hasB和hasC(Proc.Natl.Acad.Sci.USA.98，4658-4663，2001)。WO 99/51265公开了含有似马链球菌透明质酸合酶编码区的核酸片段。

杆菌已被很好地建立为用于制备天然和重组蛋白的宿主细胞系统。本发明的一个目的是提供在重组芽孢杆菌属宿主细胞中制备透明质酸的方法。

发明简述

本发明涉及制备透明质酸(hyaluronic acid)的方法，包括：(a)在适宜制备透明质酸的条件下培养芽孢杆菌属宿主细胞，其中芽孢杆菌属宿主细胞包含核酸构建体，所述核酸构建体含有透明质酸合酶编码序列，该序列可操作性连接于与透明质酸合酶编码序列异源的启动子序列；和(b)从培养基中回收透明质酸。

在优选的实施方案中，所述核酸构建体还包含一个或多个基因，所述基因编码透明质酸前体糖生物合成中的酶或芽孢杆菌属宿主细胞还包含一个或多个第二核酸构建体，该构建体含有一个或多个基因，所述基因编码前体糖生物合成中的酶。

在另一优选的实施方案中，一个或多个编码前体糖的基因受控于与透明质酸合酶编码序列相同或不同的启动子。

本发明还涉及包含核酸构建体的芽孢杆菌属宿主细胞，所述核酸构建体含有透明质酸合酶编码序列，该编码序列可操作性连接于与透明质酸合酶编码序列和所述核酸构建体异源的启动子序列。

本发明还涉及编码透明质酸合酶操纵子的分离的核酸序列，所述透明质酸合酶操纵子含有透明质酸合酶基因或其部分和UDP-葡萄糖6-脱氢酶基因，和可选的选自UDP-葡萄糖焦磷酸化酶基因、UDP-N-乙酰葡糖胺焦磷酸化酶基因和葡萄糖-6-磷酸异构酶基因的一个或多个基因。

本发明还涉及分离的编码UDP-葡萄糖6-脱氢酶的核酸序列，其选自：(a)编码一种多肽的核酸序列，所述多肽的氨基酸序列与SEQ ID NO：41有至少约75％、约80％、约85％、约90％，或约95％的同一性；(b)与SEQID NO：40有至少约75％、约80％、约85％、约90％，或约95％同一性的核酸序列；(c)在中或高严紧条件下与(i)SEQ ID NO：40的核酸序列，(ii)SEQ ID NO：40中包含的cDNA序列，或(iii)(i)或(ii)的互补链杂交的核酸序列；和(d)(a)，(b)或(c)的亚序列，其中亚序列编码一种具有UDP-葡萄糖6-脱氢酶活性的多肽片段。

本发明还涉及分离的编码UDP葡萄糖焦磷酸化酶的核酸序列，其选自：(a)编码一种多肽的核酸序列，所述多肽的氨基酸序列与SEQ ID NO：43有至少90％、约95％，或约97％的同一性；(b)与SEQ ID NO：42有至少约90％、约95％，或约97％同一性的核酸序列；(c)在低、中、或高严紧条件下与(i)SEQ ID NO：42的核酸序列，(ii)SEQ ID NO：42中包含的cDNA序列，或(iii)(i)或(ii)的互补链杂交的核酸序列；和(d)(a)，(b)或(c)的亚序列，其中亚序列编码一种具有UDP-N-乙酰葡糖胺焦磷酸化酶活性的多肽片段。

本发明还涉及分离的编码UDP-N-乙酰葡糖胺焦磷酸化酶的核酸序列，其选自：(a)编码一种多肽的核酸序列，所述多肽的氨基酸序列与SEQ ID NO：45有至少约75％、约80％、约85％、约90％，或约95％的同一性；(b)与SEQ ID NO：44有至少约75％、约80％、约85％、约90％，或约95％同一性的核酸序列；(c)在低、中、或高严紧条件下与(i)SEQ ID NO：44的核酸序列，(ii)SEQ ID NO：44中包含的cDNA序列，或(iii)(i)或(ii)的互补链杂交的核酸序列；和(d)(a)(b)，或(c)的亚序列，其中亚序列编码一种具有UDP-N-乙酰葡糖胺焦磷酸化酶活性的多肽片段。

附图简述

图1显示透明质酸的化学结构。

图2显示透明质酸合成的生物合成途径。

图3显示pCR2.1-sehasA的限制性图谱。

图4显示pCR2.1-tuaD的限制性图谱。

图5显示pCR2.1-gtaB的限制性图谱。

图6显示pCR2.1-gcaD的限制性图谱。

图7显示PHA1的限制性图谱。

图8显示pHA2的限制性图谱。

图9显示pHA3的限制性图谱。

图10显示pHA4的限制性图谱。

图11显示pHA5的限制性图谱。

图12显示pHA6的限制性图谱。

图13显示pHA7的限制性图谱。

图14显示pMRT106的限制性图谱。

图15显示pHA8的限制性图谱。

图16显示pHA9的限制性图谱。

图17显示pHA10的限制性图谱。

图18显示pRB157的限制性图谱。

图19显示pMRT084的限制性图谱。

图20显示pMRT086的限制性图谱。

图21显示pCJ791的限制性图谱。

图22显示pMRT032的限制性图谱。

图23显示pNNB194neo的限制性图谱。

图24显示pNNB194neo-oriT的限制性图谱。

图25显示pShV3的限制性图谱。

图26显示pShV2.1-amyEΔB的限制性图谱。

图27显示pShV3A的限制性图谱。

图28显示PMRT036的限制性图谱。

图29显示pMRT037的限制性图谱。

图30显示pMRT041的限制性图谱。

图31显示PMRT064.1的限制性图谱。

图32显示pMRT068的限制性图谱。

图33显示pMRT069的限制性图谱。

图34显示pMRT071的限制性图谱。

图35显示PMRT074的限制性图谱。

图36显示pMRT120的限制性图谱。

图37显示pMRT122的限制性图谱。

图38显示pCR2.1-pel5’的限制性图谱。

图39显示pCR2.1-pel3’的限制性图谱。

图40显示pRB161的限制性图谱。

图41显示pRB162的限制性图谱。

图42显示pRB156的限制性图谱。

图43显示pRB164的限制性图谱。

图44显示多种透明质酸制备枯草芽孢杆菌菌株以大约2g蔗糖/L₀-小时的分批补料，37℃发酵的总结。

图45显示获自以大约2g蔗糖/L₀-小时分批补料，37℃发酵的多种透明质酸制备枯草芽孢杆菌菌株的峰量透明质酸的平均分子量(MDa)的总结。

发明详述

本发明涉及制备透明质酸的方法，包括：(a)在适宜制备透明质酸的条件下培养芽孢杆菌属宿主细胞，其中芽孢杆菌属宿主细胞包含核酸构建体，所述核酸构建体含有透明质酸合酶编码序列，该序列可操作性连接于与透明质酸合酶编码序列异源的启动子序列；和(b)从培养基中回收透明质酸。

本发明的方法改进了从病原性，荚膜细菌中制备透明质酸的方法。在荚膜细菌中，大量的透明质酸是从荚膜中制备的。在从所述来源中制备和纯化透明质酸时，首先需要从荚膜中除去透明质酸，如通过使用表面活性剂或去垢剂，如SDS。由于为了释放大部分透明质酸而必须加入表面活性剂且随后必须从最终纯化中除去表面活性剂，故此使得透明质酸的商业生产步骤非常复杂。

本发明可以从非荚膜宿主细胞中制备大量游离透明质酸。在显微镜下观察不到与重组杆菌菌株相关的可视荚膜，而通常用于透明质酸制备中的病原性细菌株包括透明质酸荚膜，该荚膜的直径至少是细胞自身的两倍。

由于将重组芽孢杆菌属细胞的透明质酸直接表达于培养基中，故可使用简单的方法从培养基中分离透明质酸。首先，从培养基中物理除去芽孢杆菌属细胞和细胞碎片，如有需要，可首先稀释所述培养基从而降低培养基的粘性。本领域技术人员已知多种可用于从培养基中除去细胞的方法，如离心或微量过滤。如有需要，可过滤保留的上清，如通过超滤，从而浓缩并从透明质酸中除去小分子污染物。除去细胞和细胞碎片后，采用已知方法对培养基中的透明质酸实施简单的沉淀。盐、乙醇或盐和乙醇组合可用于从滤出液中沉淀透明质酸。一经沉淀，透明质酸易于通过物理方法从溶液中分离出来。或者，可采用本领域已知的蒸发干燥技术，如喷雾干燥从滤出液中干燥或分离透明质酸。

因此本发明的方法改进了现有技术中通过发酵而用于商业上制备透明质酸的方法，且无须在从培养细胞中纯化的透明质酸时使用表面活性剂。

透明质酸

本文将“透明质酸”定义为非磺化葡糖胺聚糖(unsulphatedglycolsaminoglycan)，其包含通过交替beta-1，4和beta-1，3糖苷键连接在一起的N-乙酰葡糖胺(GlcNAc)和葡萄糖醛酸(GlcUA)的重复二糖单位(图1)。已知，透明质酸(Hyaluronic aicd)为透明质酸(hyaluronan)，透明质酸盐(酯)或HA。此处使用的术语透明质酸(hyaluronan)和透明质酸(Hyaluronic acid)可以互换。

在一个优选的实施方案中，采用本发明的方法获得的透明质酸的分子量为约10,000-约10,000,000 Da。在更优选的实施方案中，采用本发明的方法获得的透明质酸的分子量为约25,000-约5,000,000 Da。在最优选的实施方案中，采用本发明的方法获得的透明质酸的分子量为约50,000-至约3,000,000 Da。

采用本发明的芽孢杆菌属宿主细胞制备的透明质酸的水平可根据改良咔唑法(Bitter和Muir，1962，Anal Biochem.4：330-334)测定。此外，可使用现有技术中如Ueno等，1988，Chem.Pharm.Bull.36，4971-4975；Wyatt，1993，ANAL.Chim.Acta 272：1-40；和Wyatt Technologies，1999，“LightScattering University DAWN Course Manual”和“DAWN EOS Manual”WyattTechnology Corporation，Santa Barbara，California所描述的标准方法测定透明质酸的平均分子量。

可使用本领域已知的多种方法如，在美国专利No.5,616,568、5,652,347和5,874,417中所描述的交联方法，对采用本发明的方法获得的透明质酸进行修饰。此外，可使用本领域已知的方法改变透明质酸的分子量。

宿主细胞

在本发明的方法中，芽孢杆菌属宿主细胞可以是适用于重组制备透明质酸的任何芽孢杆菌属细胞。芽孢杆菌属宿主细胞可以是野生型芽孢杆菌属细胞或其突变体。适用于实施本发明的芽孢杆菌属细胞包括(但不限于)Bacillus agaraderhens、嗜碱芽孢杆菌(Bacillus alkalophilus)、解淀粉芽胞杆菌(Bacillus amyloliquefaciens)、短芽胞杆菌(Bacillus brevis)、环状芽胞杆菌(Bacillus circulans)、克劳氏芽孢杆菌(Bacillus clausii)、凝结芽胞杆菌(Bacillus coagulans，)、坚硬芽胞杆菌(Bacillus firmus)、灿烂芽胞杆菌(Bacillus lautus)、迟缓芽胞杆菌(Bacillus lentus)、地衣形芽胞杆菌(Bacilluslicheniformis)、巨大芽胞杆菌(Bacillus megaterium)、短小芽胞杆菌(Bacilluspumilus)、嗜热脂肪芽胞杆菌(Bacillus Stearothermophilus)、枯草芽孢杆菌(Bacillus subtilis)和苏芸金芽胞杆菌(Bacillus thuringiensis)细胞。WO98/22598中公开了特别适用于重组表达的枯草芽孢杆菌细胞突变体。非荚膜芽孢杆菌属细胞特别适用于本发明。

在一个优选的实施方案中，芽孢杆菌属宿主细胞是解淀粉芽胞杆菌、克劳氏芽孢杆菌、迟缓芽胞杆菌、地衣形芽胞杆菌、嗜热脂肪芽胞杆菌或枯草芽孢杆菌细胞。在更优选的实施方案中，芽孢杆菌属细胞是解淀粉芽胞杆菌细胞。在另一更为优选的实施方案中，芽孢杆菌属细胞是克劳氏芽孢杆菌细胞。在另一更为优选的实施方案中，芽孢杆菌属细胞是迟缓芽胞杆菌细胞。在另一更为优选的实施方案中，芽孢杆菌属细胞是地衣形芽胞杆菌细胞。在另一更为优选的实施方案中，芽孢杆菌属细胞是枯草芽孢杆菌细胞。在最优选的实施方案中，芽孢杆菌属宿主细胞是枯草芽孢杆菌A164Δ5(参见美国专利No.5,891,701)或枯草芽孢杆菌168Δ4。

用本发明的核酸构建体转化芽孢杆菌属宿主细胞可通过如下方法实施，例如，原生质体转化(参见例如Chang和Cohen，1979，Molecular GeneralGenetics 168：111-115)、使用感受态细胞(参见例如Young和Spizizen，1961，Journal of Bacteriology 81：823-829，或Dubnau和Davidoff-Abelson，1971，Journal of Molecular Biology 56：209-221)、电穿孔法(参见例如Shigekawa和Dower，1988，Biotechniques 6：742-751)或接合(参见例如KOEHLER和Thorne，1987，Journal of Bacteriology 169：5271-5278)。

核酸构建体

本文中将“核酸构建体”定义为一种单链或双链核酸分子，其分离自天然存在的基因或经修饰后含有以自然界不存在的方式联合和并置的核酸片段。当核酸构建体包含编码序列表达所需的所有控制序列时，术语核酸构建体可与术语表达盒同义。本文将术语“编码序列”定义为当将其置于下述控制序列的控制下时，能够转录为mRNA并翻译为目的酶的序列。编码序列的界限通常由mRNA5’末端紧接着位于开放阅读框上游的核糖体结合位点和mRNA 3’末端紧接着位于开放阅读框下游的转录终止序列来确定。编码序列可包括(但不限于)DNA、cDNA和重组核酸序列。

用于分离或克隆编码多肽的核酸序列的方法是本领域众所周知的，例如包括从基因组DNA中分离、从cDNA制备或其组合。从所述基因组DNA克隆本发明的核酸序列例如可通过表达文库的抗体筛选以检测具有共同结构特点的克隆化DNA片段或众所周知的聚合酶链反应(PCR)而得以实施。参见，例如Innis等，1990，PCR Protocols：A Guide to Methods andApplication，Academic Press，New York。可以使用其它核酸扩增方法如连接酶链反应，连接激活转录和基于核酸序列的扩增。克隆方法可能涉及对包括编码所述多肽的核酸序列的目的核酸片段进行切除和分离、所述片段插入载体分子中以及重组载体向芽孢杆菌属细胞中的掺入，在所述芽孢杆菌属细胞中所述核酸序列的克隆将被复制。所述核酸序列可以是基因组的、cDNA、RNA、半-合成、合成来源的或其任意组合。

可以用多种方式操作编码酶的分离的核酸序列以提供所述酶的表达。在将核酸序列插入到构建体或载体中之前对其操作是优选或必需的，这取决于表达载体或芽孢杆菌属宿主细胞。用克隆方法修饰核酸序列的技术是本领域众所周知的。还应认识到，核酸序列还可以通过使用本领域众所周知的方法在宿主细胞中于体内操作。

透明质酸生物合成中涉及多种酶。这些酶包括透明质酸合酶、UDP-葡萄糖6-脱氢酶、UDP-葡萄糖焦磷酸化酶、UDP-N-乙酰葡糖胺焦磷酸化酶、6-磷酸葡萄糖异构酶、己糖激酶、磷酸葡糖变位酶、酰胺转移酶、变位酶和乙酰基转移酶。透明质酸合酶是透明质酸制备过程中的关键酶。

本文将“透明质酸合酶”定义为通过加入GlcUA和GlcNAc糖前体而催化透明质酸链延长的合酶。链球菌透明质酸合酶、脊椎动物透明质酸合酶和病毒透明质酸合酶氨基酸序列不同于来自巴斯德菌的透明质酸合酶，并已经将其分为I型和II型透明质酸合酶，I型透明质酸合酶包括链球菌透明质酸合酶(DeAngelis，1999)。为了用于在芽孢杆菌属宿主细胞中制备透明质酸，真核生物源性的透明质酸合酶，如哺乳动物透明质酸合酶，为次优选的。

透明质酸合酶编码序列可以是任何能够在芽孢杆菌属宿主细胞中表达的核酸序列，所述核酸序列可以是任何来源的。优选的透明质酸合酶基因包括I型或II型的任一种，如来自似马链球菌、酿脓链球菌、乳房链球菌和马链球菌兽瘟亚种的I型透明质酸合酶基因，或出血败血性巴斯德菌的II型透明质酸合酶基因。

在一个优选的实施方案中，透明质酸合酶编码序列选自(a)编码一种多肽的核酸序列，所述多肽的氨基酸序列与SEQ ID NO：2、SEQ ID NO：93或SEQ ID NO：103有至少约70％、约75％、约80％、约85％、约90％，或约95％的同一性；(b)在低、中、或高严紧条件下与SEQ ID NO：1、SEQ IDNO：92或SEQ ID NO：102杂交的核酸序列；和(c)(a)或(b)的互补链。

在更优选的实施方案中，透明质酸合酶编码序列一种多肽，所述多肽含有SEQ ID NO：2、SEQ ID NO：93或SEQ ID NO：103的氨基酸序列或其具有透明质酸合酶活性的片段。

在另一优选的实施方案中，透明质酸合酶编码序列选自(a)编码一种多肽的核酸序列，所述多肽的氨基酸序列与SEQ ID NO：95有至少约70％、约75％、约80％、约85％、约90％，或约95％的同一性；(b)在低、中、或高严紧条件下与SEQ ID NO：94杂交的核酸序列；和(c)(a)或(b)的互补链。

在另一更为优选的实施方案中，透明质酸合酶编码序列一种多肽，所述多肽含有SEQ ID NO：95的氨基酸序列或其具有透明质酸合酶活性的片段。

本发明的方法还包括构建体，透明质酸的前体糖(precursor sugars)经由所述构建体而供给宿主细胞，或供给培养基，或由芽孢杆菌属宿主细胞中的内源性基因、或非内源性基因、或内源性和非内源性基因的组合所编码。前体糖可以是D-葡萄糖醛酸或N-乙酰葡糖胺。

在本发明的方法中，核酸构建体还可包含一个或多个基因，所述基因编码透明质酸前体糖生物合成中的酶。或者，芽孢杆菌属宿主细胞还包含一个或多个第二核酸构建体，该构建体含有一个或多个基因，所述基因编码前体糖生物合成中的酶。通过使用含有编码指导透明质酸前体糖合成途径步骤的一个基因或多个基因的一种核酸序列或多种核酸序列的构建体提高了透明质酸的生产。“指导透明质酸前体糖合成途径中的步骤”指基因的表达蛋白具有N-乙酰葡糖胺或D-葡萄糖醛酸或是N-乙酰葡糖胺或D-葡萄糖醛酸前体的糖形式的活性(图2)。

在优选的用于供应前体糖的方法中，通过培养含有重组构建体的宿主细胞，所述重组构建体含有可操作性连接于编码指导透明质酸前体糖合成途径中步骤的基因的核酸序列的异源性启动子区，提供用于在含有透明质酸合酶的宿主细胞中提高透明质酸生产的构建体。在优选的方法中，所述宿主细胞还包含含有可操作性连接于透明质酸合酶的启动子区的重组构建体，其可以使用与N-乙酰葡糖胺的生物合成中所涉及的合酶的核酸序列相同或不同的启动子区。在另一优选的实施方案中，所述宿主细胞可包含含有可操作性连接于编码透明质酸前体糖的生物合成中所涉及的第二个基因的不同核酸序列的启动子区的重组构建体。

因此，本发明还涉及通过使用编码指导透明质酸前体糖的生物合成中步骤的基因的核酸序列的构建体而提高透明质酸生产的构建体。前体糖的核酸序列可由与编码透明质酸合酶相同或不同的启动子表达。

制备透明质酸的前体糖的生物合成中涉及的基因包括UDP-葡萄糖6-脱氢酶基因、UDP-葡萄糖焦磷酸化酶基因、UDP-N-乙酰葡糖胺焦磷酸化酶基因、葡萄糖-6-磷酸异构酶基因、己糖激酶基因、磷酸葡糖变位酶基因、酰胺转移酶基因、变位酶基因和乙酰基转移酶基因。

在含有透明质酸合酶的细胞中，可表达两个或多个hasB，hasC和hasD，或其同系物，如分别是枯草芽孢杆菌tuaD，gtaB，和gcaD，以及hasE的任一个或其组合以增加透明质酸合酶可用的前体糖的量。Bacillus基因组已经公开在Kunst等，Nature 390，249-256，“The complete genome sequence of theGram-positive bacterium Bacillus Subtilis”(20 November 1997)中。在某些情况下，如当宿主细胞不含天然透明质酸合酶活性时，所述构建体可包含hasA基因。

所述编码生物合成酶的核酸序列可以是宿主细胞天然含有的，而在其他情况下也可以使用异源序列。如果表达两个或多个基因，其可以是与天然操纵子中的另一个基因(如包含hasA，hasB，hasC和hasD的似马链球菌HAS操纵子的基因)相关的基因。在其他情况下，可能需要使用某些前体基因序列的组合，而没有所包括操纵子的每个元件。在其他情况下，还可以优选使用宿主细胞天然的某些基因和其他外源性基因。选择将基于给定宿主细胞中的糖的可用量，细胞供应生产过剩而不会妨碍宿主细胞其它功能的能力，和所述细胞是否能调节其与外源性基因不同的天然基因的表达。

例如，根据细胞的代谢需要和生长条件以及可用的前体糖的量，其可能需要通过表达编码UDP-N-乙酰葡糖胺焦磷酸化酶的核酸序列，如hasD基因、芽孢杆菌属的gcaD基因及其同系物而提高N-乙酰葡糖胺的生产。或者，前体糖可以是D-葡萄糖醛酸。在一个所述实施方案中，所述核酸序列编码UDP-葡萄糖6-脱氢酶。所述核酸序列包括芽孢杆菌属的tuaD基因、链球菌属的hasB基因及其同系物。所述核酸序列还可编码UDP-葡萄糖焦磷酸化酶，如芽孢杆菌属中的gtaB基因、链球菌属的the hasC基因及其同系物。

在本发明的方法中，UDP-葡萄糖6-脱氢酶基因可以是hasB基因或tuaD基因或其同系物。

在一个优选的实施方案中，hasB基因选自(a)编码多肽的核酸序列，所述多肽含有具有与SEQ ID NO：41、SEQ ID NO：97或SEQ ID NO：105至少约70％、约75％、约80％、约85％、约90％或约95％同一性的氨基酸序列；(b)在低、中、或高严紧条件下与SEQ ID NO：40、SEQ ID NO：96或SEQ ID NO：104杂交的核酸序列；和(c)(a)或(b)的互补链。

在更优选的实施方案中，the hasB基因所编码的多肽含有SEQ ID NO：41、SEQ ID NO：97或SEQ ID NO：105的氨基酸序列或其具有UDP-葡萄糖6-脱氢酶活性的片段。

在另一优选的实施方案中，tuaD基因选自(a)编码多肽的核酸序列，所述多肽含有具有与SEQ ID NO：12至少约70％，约75％、约80％、约85％、约90％或约95％同一性的氨基酸序列；(b)在低、中、或高严紧条件下与SEQ ID NO：11杂交的核酸序列；和(c)(a)或(b)的互补链。

在另一更为优选的实施方案中，tuaD基因所编码的多肽含有SEQ IDNO：12的氨基酸序列或其具有UDP-葡萄糖6-脱氢酶活性的片段。

在本发明的方法中，UDP葡萄糖焦磷酸化酶基因可以是hasC基因或gtaB基因或其同系物。

在一个优选的实施方案中，hasC基因选自(a)编码多肽的核酸序列，所述多肽含有具有与SEQ ID NO：43、SEQ ID NO：99或SEQ ID NO：107至少约70％、约75％、约80％、约85％、约90％或约95％同一性的氨基酸序列；(b)在低、中、或高严紧条件下与SEQ ID NO：42或SEQ ID NO：98或SEQ ID NO：106杂交的核酸序列；和(c)(a)或(b)的互补链。

在另一更为优选的实施方案中，hasC基因所编码的多肽含有SEQ IDNO：43或SEQ ID NO：99，或SEQ ID NO：107的氨基酸序列或其具有UDP葡萄糖焦磷酸化酶活性的片段。

在另一优选的实施方案中，gtaB基因选自(a)编码多肽的核酸序列，所述多肽含有具有与SEQ ID NO：22至少约70％、约75％、约80％、约85％、约90％或约95％同一性的氨基酸序列；(b)在低、中、或高严紧条件下与SEQ ID NO：21杂交的核酸序列；和(c)(a)或(b)的互补链。

在另一更为优选的实施方案中，gtaB基因所编码的多肽含有SEQ IDNO：22的氨基酸序列或其具有UDP-葡萄糖焦磷酸化酶活性的片段。

在本发明的方法中，UDP-N-乙酰葡糖胺焦磷酸化酶基因可以是hasD或gcaD基因或其同系物。

在一个优选的实施方案中，hasD基因选自(a)编码多肽的核酸序列，所述多肽含有具有与SEQ ID NO：45至少约75％、约80％、约85％、约90％或约95％同一性的氨基酸序列；(b)在低、中、或高严紧条件下与SEQ IDNO：44杂交的核酸序列；和(c)(a)或(b)的互补链。

在另一更为优选的实施方案中，hasD基因所编码的多肽含有SEQ IDNO：45的氨基酸序列或其具有UDP-N-乙酰葡糖胺葡萄糖焦磷酸化酶活性的片段。

在另一优选的实施方案中，gcaD基因选自(a)编码多肽的核酸序列，所述多肽含有具有与SEQ ID NO：30至少约70％、约75％、约80％、约85％、约90％或约95％同一性的氨基酸序列；(b)在低、中、或高严紧条件下与SEQ ID NO：29杂交的核酸序列；和(c)(a)或(b)的互补链。

在另一更为优选的实施方案中，gcaD基因所编码的多肽含有SEQ IDNO：30的氨基酸序列或其具有UDP-N-乙酰葡糖胺葡萄糖焦磷酸化酶活性的片段。

在本发明的方法中，6-磷酸葡萄糖异构酶基因可以是hasE或其同系物。

在一个优选的实施方案中，hasE基因选自(a)编码多肽的核酸序列，所述多肽含有具有与SEQ ID NO：101至少约70％、约75％、约80％、约85％、约90％或约95％同一性的氨基酸序列；(b)在低、中、或高严紧条件下与SEQ ID NO：100杂交的核酸序列；和(c)(a)或(b)的互补链。

在另一更为优选的实施方案中，hasE基因所编码的多肽含有SEQ IDNO：101的氨基酸序列，或其具有6-磷酸葡萄糖异构酶活性的片段。

在本发明的方法中，透明质酸合酶基因和一个或多个编码前体糖的基因受控于相同的启动子。或者，一个或多个编码前体糖的基因受控于相同的启动子而用不同的启动子指导透明质酸合酶基因。另一种选择是透明质酸合酶基因和每个前体糖的基因均受控于不同的启动子。在一个优选的实施方案中，透明质酸合酶基因和一个或多个前体糖的基因受控于相同的启动子。

本发明还涉及包含编码透明质酸合酶操纵子的分离的核酸序列的核酸构建体，所述操纵子包含透明质酸合酶基因和UDP-葡萄糖6-脱氢酶基因，和可选地选自UDP-葡萄糖焦磷酸化酶基因、UDP-N-乙酰葡糖胺焦磷酸化酶基因和葡萄糖-6-磷酸异构酶基因的一个或多个基因。SEQ ID NO：108中显示编码似马链球菌的多数透明质酸合酶操纵子的核酸序列。该序列包含分别与枯草芽孢杆菌tuaD基因(SEQ ID NO：11)和gtaB基因(SEQ ID NO：21)相似的hasB(SEQ ID NO：40)和hasC(SEQ ID nO：42)，以及在酿脓链球菌时，gcaD基因(SEQ ID NO：29)的已经被命名为hasD(SEQ ID NO：44)的同系物。枯草芽孢杆菌gcaD编码N-乙酰葡糖胺(两种透明质酸糖的一种)合成中的UDP-N-乙酰葡糖胺焦磷酸化酶。gcaD的似马链球菌同系物，hasD，由似马链球菌排列在透明质酸合酶操纵子上。该核酸序列还包含部分hasA基因(SEQ ID NO：1的后1156bp)。

在某些情况下，宿主细胞将包含含有可操作性连接于编码指导透明质酸前体糖合成途径中的步骤的基因的核酸序列的异源性启动子区的重组构建体，其可对应于从重组构建体表达透明质酸合酶。所述透明质酸合酶可经由与编码前体生物合成途径中涉及的酶的核酸序列相同或不同的启动子区而表达。在另一优选的实施方案中，宿主细胞可包含含有可操作性连接于编码透明质酸前体糖合成中涉及的第二个基因的不同核酸序列的启动子区的重组构建体。

编码前体糖的合成中所涉及的酶的核酸序列可用相同或不同的启动子如编码透明质酸合酶的核酸序列实施表达。在前一意义中，构建“人工操纵子”，其能模拟含有每个hasA，hasB，hasC和hasD，或其同系物的似马链球菌的操纵子，或者，可使用似马链球菌操纵子中存在的全长补体的序列。所述“人工操纵子”还可包含6-磷酸葡萄糖异构酶基因(hasE)以及一个或多个选自己糖激酶基因、磷酸葡糖变位酶基因、酰胺转移酶基因、变位酶基因和乙酰基转移酶基因的基因。在人工操纵子中，至少一个元件与其它元件是异源的，如启动子区与编码序列异源。

在一个优选的实施方案中，核酸构建体包含hasA，tuaD和gtaB。在另一优选的实施方案中，核酸构建体包含hasA，tuaD，gtaB和gcaD。在另一优选的实施方案中，核酸构建体包含hasA和tuaD。在另一优选的实施方案中，核酸构建体包含hasA。在另一优选的实施方案中，核酸构建体包含hasA，tuaD，gtaB，GCAD和hasE。在另一优选的实施方案中，核酸构建体包含HASA，HASB，HASC和hasD。在另一优选的实施方案中，核酸构建体包含hasA，HASB，hasC，HASD和hasE。基于上述优选的实施方案，所述基因可用其同系物取代。

在本发明的方法中，核酸构建体包含可操作性连接于透明质酸合酶编码序列异源的启动子序列的透明质酸合酶编码序列。所述启动子序列可以是，例如，单启动子或串联启动子(tandem promoter)。

本文将“启动子”定义为一段参与RNA聚合酶结合以启动基因转录的核酸序列。本文将“串联启动子”定义为两个或多个启动子序列，其中每个启动子序列均与编码序列可操作性连接和并介导该编码序列转录成mRNA。本文将“可操作性连接”定义为一种构型，其中一段控制序列例如启动子序列位于相对编码序列恰当的位置，从而使该控制序列指导由该编码序列编码的多肽的产生。如前所述，本文将“编码序列”定义为当置于适宜的控制序列的控制下时可转录为mRNA并翻译为多肽的核酸序列。编码序列的界限通常由恰位于mRNA的5’末端开放阅读框上游的核糖体结合位点和恰位于mRNA的3’末端开放阅读框下游的转录终止序列来确定。编码序列可包括(但不限于)基因组DNA、cDNA、半合成、合成来源和重组核酸序列。

在一个优选的实施方案中，启动子序列可以获自细菌来源。在更优选的实施方案中，启动子序列可以获自革兰氏阳性细菌如芽孢杆菌属，例如，Bacillus agaradherens、嗜碱芽孢杆菌、解淀粉芽胞杆菌、短芽胞杆菌、环状芽胞杆菌、克劳氏芽孢杆菌、凝结芽胞杆菌、坚硬芽胞杆菌、灿烂芽胞杆菌、迟缓芽胞杆菌、地衣形芽胞杆菌、巨大芽胞杆菌、短小芽胞杆菌、嗜热脂肪芽胞杆菌、枯草芽孢杆菌、或苏芸金芽胞杆菌或链霉菌属，例如，浅青紫链霉菌(Streptomyces lividans)或鼠灰链霉菌(Streptomyces murinus)或获自革兰氏阴性细菌，例如，大肠杆菌或假单胞杆菌(Pseudomonas sp)。

用于在本发明的方法中指导核酸序列转录的适宜启动子的实例是获自大肠杆菌lac操纵子，天蓝色链霉菌琼脂糖酶基因(dagA)、迟缓芽胞杆菌或克劳氏芽孢杆菌碱性蛋白酶基因(aprH)、地衣形芽胞杆菌碱性蛋白酶基因(subtilisin Carlsberg基因)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、枯草芽孢杆菌α-淀粉酶基因(amyE)、地衣形芽胞杆菌α-淀粉酶基因(amyL)、嗜热脂肪芽胞杆菌产麦芽淀粉酶基因(amyM)、解淀粉芽胞杆菌α-淀粉酶基因(amyQ)、地衣形芽胞杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因、苏芸金芽胞杆菌tenebrionis亚种CryIIIA基因(cryIIIA)或其部分、原核生物β-内酰胺酶基因(Villa-Kamaroff等，1978，Proceedingsof the National Academy of Sciences USA 75：3727-3731)的启动子。其它实例为spol细菌噬菌体启动子和tac启动子(DeBoer等，1983，Proceedingsof the National Academy of Sciences USA 80：21-25)。其它启动子描述于“Useful proteins from recombinant bacteria”in Scientific American，1980，242：74-94；和in Sambrook，Fritsch，和Maniatus，1989，Molecular Cloning，ALaboratory Manual，2d edition，Cold Spring Harbor，New York。

启动子还可以是“共有序列(consensus)”启动子，该启动子含有“-35”区的TTGACA和“-10”区的TATAAT。“共有序列”启动子可以获自任何在芽孢杆菌属宿主细胞中有功能的启动子。“共有序列”启动子的构建可通过定点诱变来完成，从而产生与枯草芽孢杆菌营养期“sigma A-型”启动子“-10”区和“-35”区已确认共有序列更一致的启动子(Voskuil等，1995，MolecularMicrobiology 17：271-279)。

在一个优选的实施方案中，所述“共有序列”启动子是获自大肠杆菌lac操纵子，天蓝色链霉菌琼脂糖酶基因(dagA)、迟缓芽胞杆菌或克劳氏芽孢杆菌碱性蛋白酶基因(aprH)、地衣形芽胞杆菌碱性蛋白酶基因(subtilisinCarlsberg基因)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、枯草芽孢杆菌α-淀粉酶基因(amyE)、地衣形芽胞杆菌α-淀粉酶基因(amyL)、嗜热脂肪芽胞杆菌产麦芽淀粉酶基因(amyM)、解淀粉芽胞杆菌α-淀粉酶基因(amyQ)、地衣形芽胞杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因、苏芸金芽胞杆菌tenebrionis亚种CryIIIA基因(cryIIIA)或其部分、原核生物β-内酰胺酶基因spol细菌噬菌体启动子。在更优选的实施方案中，“共有序列”启动子获自解淀粉芽胞杆菌α-淀粉酶基因(amyQ)。

Widner等，在美国专利No.6,255,076和5,955,310中公开了用于在芽孢杆菌属细胞中表达的，包括短共有序列amyQ启动子(也称为scBAN)的串联启动子和构建体以及方法。文中还公开了将cryIIIA稳定序列以及使用了该序列的构建体用于提高芽孢杆菌属中的生产。

串联启动子中每个启动子序列可以是能在所选芽孢杆菌属细胞中表现出转录活性的任意核酸序列，包括突变的、截短的和杂合的启动子，并可获自芽孢杆菌属细胞的同源或异源性细胞内和细胞外多肽的编码基因。相对于多肽编码序列和芽孢杆菌属细胞，每一启动子序列可以是天然的和外源的。启动子序列可以是相同的启动子序列或不同的启动子序列。

串联启动子的两个或多个启动子序列可同时启动核酸序列的转录。此外，串联启动子的一个或多个启动子序列可在芽孢杆菌属细胞生长的不同阶段启动核酸序列的转录。

在一个优选的实施方案中，串联启动子至少包含解淀粉芽胞杆菌α-淀粉酶基因的amyQ启动子。在另一优选的实施方案中，串联启动子至少包含含有“-35”区的TTGACA和“-10”区的TATAAT的“共有序列”启动子。在另一优选的实施方案中，串联启动子至少包含地衣形芽胞杆菌α-淀粉酶基因的amyL启动子。在另一优选的实施方案中，串联启动子至少包含cryIIIA启动子或其部分(Agaisse和LERECLUS，1994，Molecular Microbiology 13：97-107)。

在更优选的实施方案中，串联启动子至少包含amyL启动子和cryIIIA启动子。在另一更为优选的实施方案中，串联启动子至少包含amyQ启动子和cryIIIA启动子。在另一更为优选的实施方案中，串联启动子至少包含含有“-35”区的TTGACA和“-10”区的TATAAT的“共有序列”启动子和cryIIIA启动子。在另一更为优选的实施方案中，串联启动子至少包含两个拷贝的amyL启动子。在另一更为优选的实施方案中，串联启动子至少包含两个拷贝的amyQ启动子。在另一更为优选的实施方案中，串联启动子至少包含两个拷贝的含有“-35”区的TTGACA和“-10”区的TATAAT的“共有序列”启动子。在另一更为优选的实施方案中，串联启动子至少包含两个拷贝的cryIIIA启动子。

本文将“mRNA加工/稳定序列”定义为位于一个或多个启动予序列下游和编码序列上游的一段序列，该一个或多个启动予序列中的每一个都与该序列可操作连接，使每一个启动子合成的mRNA均可加工产生在转录本5’端具有稳定予序列的mRNA转录本。mRNA转录本5’端存在这种稳定子序列可增加其半衰期(Agaisse和LERECLUS，1994，同上文，Hue等，1995，Journal of Bacteriology 177：3465-3471)。mRNA加工/稳定序列与细菌16S核糖体RNA的3’末端互补。在一个优选实施方案中，mRNA加工/稳定序列产生在转录本5’端具有稳定序列的基本单一大小的转录本。优选与细菌16S核糖体RNA的3’末端互补的mRNA加工/稳定序列。参见，美国专利No.6,255,076和5,955,310。

在一个更优选实施方案中选实施方案中，mRNA加工/稳定序列是WO94/25612和Agaisse和Lereclus(1994，同上文)所公开的苏芸金芽孢杆菌cryIIIA mRNA加工/稳定序列或其保持mRNA加工/稳定功能的部分。在另一个更优选实施方案中，mRNA加工/稳定序列是Hue等(1995，同上文)所公开的枯草芽孢杆菌SP82的mRNA加工/稳定序列或其保持mRNA加工/稳定功能的部分。

当本发明的方法使用cryIIIA启动子和其mRNA加工/稳定序列时，可采用含有WO 94/25612和Agaisse和Lereclus(1994，同上文)所公开的序列或其保持启动子和mRNA加工/稳定功能的部分的DNA片段。而且，可使用本领域众所周知的方法制备仅含有含有cryIIIA启动子或cryIIIA启动子mRNA加工/稳定序列，以构建串联启动子和mRNA加工/稳定序列的各种组合。在该实施方案中，cryIIIA启动子及其cryIIIA启动子mRNA加工/稳定序列优选位于构成串联启动子的其它启动子序列下游和目标基因编码序列序列的上游。

然后，可进一步操作编码透明质酸生产中所涉及的所需酶的分离的核酸序列以提高核酸序列的表达。应该理解，表达所述多肽生产中所涉及的任何步骤，包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。使用克隆方法修饰核酸序列的技术是本领域众所周知的。

含有编码所述酶的核酸序列的核酸构建体可以可操作性连接于能够在适于控制序列的条件下于芽孢杆菌属细胞中指导编码序列表达的一个或多个控制序列。

本文将术语“控制序列”定义为包括表达核酸序列的编码序列所必需或有利于其表达的所有组分。每个控制序列可以是编码所述酶的核酸序列的天然或外源的。除上述启动子序列外，所述控制序列(但不限于)前导序列、信号肽序列和转录终止子。至少，控制序列包括启动子以及转录和翻译终止信号。所述控制序列可带有用于导入特异性限制位点的接头，以便于将控制序列与编码多肽之核酸序列的编码区相连。

控制序列还可以是适宜的转录终止序列，即可被芽孢杆菌属细胞识别以终止转录的序列。将终止子序列与编码所述酶或操作子最后酶的核酸序列的3’端可可操作性相连。在所选芽孢杆菌属细胞中有功能的任何终止子都可用于本发明。

控制序列还可以是适宜的前导序列，即mRNA上对芽孢杆菌属细胞的翻译很重要的非翻译区。前导序列被可可操作性连接于编码所述酶的核酸序列的5’端。然和在所选芽孢杆菌属细胞中有功能的前导序列都可用于本发明。

控制序列还可以是信号肽编码区，其编码于多肽的氨基端相连的氨基酸序列，并且指导该编码的多肽进入细胞分泌途径。信号肽编码区可以是多肽天然的或可获自异源。核酸序列的编码序列的5’末端可天然包括信号肽编码区，该区天然和编码分泌性多肽的编码区的片段在翻译阅读框内连接在一起。或者，编码序列的5’末端可以包含相对于编码分泌性多肽的该编码序列部分外源的信号肽编码区。在编码序列没有天然地包含信号肽编码区的情况下，需要外源信号肽编码区。或者，可以简单地用外源信号肽编码区取代天然信号肽编码区以便相对于与编码序列相关的天然信号肽编码区而言来提高多肽的分泌。信号肽编码区可以获自芽孢杆菌属的淀粉酶或蛋白酶基因。但是，指导表达的多肽进入所选芽孢杆菌属细胞分泌途径的任何信号肽编码区均可以用于本发明。

用于芽孢杆菌属细胞的有效的信号肽编码区获自芽孢杆菌NCIB 11837产麦芽糖淀粉酶基因、嗜热脂肪芽胞杆菌α-淀粉酶基因、地衣形芽胞杆菌枯草杆菌蛋白酶基因、地衣形芽胞杆菌β-内酰胺酶基因、嗜热脂肪芽胞杆菌中性蛋白酶基因(nprT，nprS，nprM)和枯草芽孢杆菌prsA基因的信号肽编码区。Simonen和Palva，1993，Microbiological Reviews 57：109-137中描述了其它信号肽。

控制序列还可以是编码位于多肽氨基末端之氨基酸序列的前肽编码区。所得的多肽已知为酶原或多肽原(或在某些情况下为酶原)。多肽原通常是物活性的并可从所述多肽原通过催还或自我催化裂解而转变为成熟的活性多肽。前肽编码区可以获自枯草芽孢杆菌碱性蛋白酶(aprE)和枯草芽孢杆菌中性蛋白酶(nprT)的基因。

当信号肽和前肽区都存在于多肽的氨基端时，前肽区与多肽的氨基端紧邻，而信号肽区和前肽区的氨基端紧邻。

还优选加入能调节与细胞生长相关的多肽表达的调控序列。调控系统的实例包括应答化学或物理刺激(包括在有调控化合物存在的情况下)而导致基因表达的开启或关闭的那些系统。原核生物系统中的调节系统包括lac、tac和trp操纵子系统。

表达载体

在本发明的方法中，含有核酸序列、启动子和转录以及翻译终止信号的重组表达载体可用于重组制备透明质酸生产中所涉及的酶。可将上述各种核酸和调控序列连接在一起以生产包括一个或多个方便的限制位点的重组表达载体，所述位点能允许编码多肽或酶的核酸序列在所述位点插入或置换。或者，所述核酸序列可通过将该核酸序列和含有该核酸序列的核酸构建体插入适当表达载体来表达。在创建表达载体的过程中，可使编码序列在表达载体中与适当调控序列可操作性相连以便表达。

重组表达载体可以是任何载体，其可方便地进行重组DNA操作并且能使核酸序列表达。载体的选择将主要决定于载体与引入了该载体的芽孢杆菌属细胞之间的相容性。载体可以是线性和闭合环状质粒。载体可以是自主复制载体，即以染色体外实体形式存在的载体，其复制独立于染色体的复制，例如质粒，染色体外元件，小染色体(minichromosome)或人工染色体。载体可含有任何确保自我复制的手段。或者，载体可以是引入芽孢杆菌属细胞后，整合到基因组中并与其整合的染色体一起复制的那种载体。载体系统可使用单个载体或质粒、或其一起含有待引入芽孢杆菌属细胞基因组中的全长DNA的两个或多个载体或质粒、或转座子。

本发明的载体优选含有使所述载体可以稳定整合到芽孢杆菌属宿主细胞基因组中或者可在细胞中不依赖于细胞的基因组而自我复制的元件。

为了整合到宿主细胞基因组中，所述载体可依赖于编码多肽的核酸序列或载体上任何其它元件来通过同源或非同源重组而稳定整合到基因组中。或者，载体可能含有其它核酸序列，这些序列可指导通过同源重组整合进入芽孢杆菌属细胞基因组。其它核酸序列能够在染色体的精确位置使载体整合到宿主细胞基因组中。为了提高在精确位置整合的可能性，整合元件应优选含有足够量的与相应靶序列高度同源的核酸，例如100-1,500碱基对、优选400-1,500碱基对和最优选800-1,500碱基对，以便提供同源重组的可能性。整合元件可以是与芽孢杆菌属细胞基因组中的靶序列同源的任何序列。此外，整合元件还可以使非编码的或编码的核酸序列。另一方面，通过非同源重组可将载体整合到宿主细胞的基因组中。

为了进行自主复制，所述裁休还可含有能够使裁体在所研究的芽孢杆菌属细胞中自主复制的复制起始点。细菌复制起始点的实例是使载体可以在芽孢杆菌中复制的质粒pUB110、pE194、pTA1060和pAMβ1的复制起始点。复制起始点可以是带有突变的复制起始点，所述突变可以使其在宿主细胞中发挥温度敏感性的作用(参见例如Ehrlich，1978，Proceedings of theNational Academy of Sciences USA 75：1433)

本发明的载体优选含有一个或多个选择性标记，其能容易地选择出转化细胞。一个选择性标记是一种基因，其产物能提供对杀生物剂或病毒的抗性、对重金属的抗性、原养型至营养缺陷型的转变等。细菌选择性标记的实例是来源于枯草芽孢杆菌或地衣芽孢杆菌的dal基因，或赋予了抗生素抗性如氨苄青霉素、卡那霉素、氯霉素或四环素抗性的标记。此外，可通过共转化实施选择，例如WO 91/09129中所描述的，其中选择性标记位于独立的载体上。

可将一个以上拷贝的核酸序列插入到宿主细胞中以提高基因产物的产率。通过将至少一个以上其它拷贝的序列整合到宿主细抱基因组中或者通过包括可扩增选择性标记基因与所述核酸序列，其中通过在存在适宜选择性标记的条件下培养含扩增拷贝的选择性标记基因，由此增加了核酸序列的拷贝数的细胞可筛选所述细胞，这样可以使核酸序列拷贝数增加。WO94/14968中描述了用于获得基因组DNA序列扩增的方便的方法。

用于连接上述元件以构建重组表达载体的方法是本领域技术人员众所周知的(参见例如Sambrook等，1989，同上文)。

制备

在本发明的方法中，采用本领域的已知方法于适宜制备透明质酸的营养培养基中培养芽孢杆菌属宿主细胞。例如，可将该细胞在实验室或工业发酵罐中，用适宜的培养基，在允许透明质酸合成中所涉及的酶表达和/或透明质酸分离的条件下，采用摇瓶培养、小规模或大规模发酵(包括连续、分批、分批补料或固态发酵)的方法进行培养。使用本领域已知的方法，在含有碳和氮源以及无机盐的适宜营养培养基中进行培养。适宜的培养基可以从供应商处得到或可根据已经公布(例如，在美国典型培养物保藏中心的目录中)的组成来制备。分泌的透明质酸可直接从培养基中回收。

分离的可采用本领域的已知方法分离得到的透明质酸。可采用本领域的已知方法回收得到的多肽。例如，可采用包括(但不限于)离心、过滤、提取、喷雾干燥、蒸发或沉淀的传统方法从营养培养基中回收透明质酸。然后可采用本领域的已知的多种方法进一步纯化分离的透明质酸，所述方法包括(但不限于)层析法(例如，离子交换，亲和，疏水，层析聚焦和大小排阻层析)，电泳方法(例如，准备型等电焦距)，差异溶解(differentialsolubility)(例如，硫酸铵沉淀)，SDS-PAGE，或提取(参见例如ProteinPurification，J.-C.Janson和Lars Ryden编，VCH出版公司，New York，1989)。

在本发明的方法中，芽孢杆菌属宿主细胞制备大于约4g、优选大于约6g，更优选大于约8g，甚至更优选大于约10g，及最优选大于约12g透明质酸/每升。

缺失/破坏

基因缺失或置换技术可用于完全除去可选择的标记基因或其它不需要的基因。在所述方法中，可通过使用已经构建为紧接地包含侧接于可选择的标记基因的5’和3′区的质粒的同源重组完成可选择的标记基因的缺失。可在能够使得质粒构建入细胞的许可温度下将紧接的5’和3′区联合第二可选择的标记引入至芽孢杆菌属细胞中的温度敏感性质粒，例如pE194上。然后将细胞移至非许可温度下来筛选含有整合至染色体一个同源侧翼区上的质粒的细胞。通过筛选第二可选择的标记完成质粒整合的筛选。整合后，通过将细胞移至许可温度中不经选择而传若干代来刺激在第二同源侧翼区上重组事件。将所述细胞铺板以获得单一克隆，然后检测克隆中两个可选标记的缺失(参见例如Perego，1993，INA.L.Sonneshein，J.A.Hoch，and R.Losick，editors，Bacillus subtilis and Other Gram-Positive Bacteria，Chapter 42，American Society of Microbiology，Washington，D.C.，1993)。

还可以通过在突变细胞中导入包含缺陷基因5′和3′区，而缺少可选择的标记基因的核酸片段，然后在反选择培养基上选择的同源重组方法除去可选择的标记基因。通过同源重组，用缺少可选择的标记基因的核酸片段取代含有可选择的标记基因的缺陷基因。还可以采用本领域其它已知方法。

美国专利No.5,891,701公开了缺失包括spollAC、aprE、NPRE和amyE的若干基因的方法。

还可以通过上述方法如用cypX(登记号BG 12580)和/或yvmC(登记号BG14121)合成红色素除去其它不需要的生物化合物。

在一个优选的实施方案中，所述芽孢杆菌属宿主细胞不用任何异源性或外源性可选标记进行标记。在另一优选的实施方案中，所述芽孢杆菌属宿主细胞不能生成任何由cypX和yvmC合成的红色素。

编码具有UDP-葡萄糖6-脱氢酶活性、UDP葡萄糖焦磷酸化酶活性或UDP-N-乙酰葡糖胺焦磷酸化酶活性的多肽的分离的核酸序列

本文中将术语“UDP-葡萄糖6-脱氢酶活性”定义为能在存在2NAD⁺和水时催化UDP-葡萄糖转化为UDP-二磷酸葡萄糖醛酸酯和2NADH的UDP葡萄糖：NAD⁺6-氧化还原酶活性。为本发明的目的，可根据Jaenicke和Rudolph，1986，Biochemistry 25：7283-7287所述方法确定UDP-葡萄糖6-脱氢酶活性。将一单位UDP-葡萄糖6-脱氢酶活性定义为于25℃，pH 7时每分钟制备1.0μ摩尔的UDP-葡萄糖醛酸。

本文将术语“UDP葡萄糖焦磷酸化酶活性”定义为能在存在UTP时催化葡糖-1-磷酸转化为氯喹和UDP-葡萄糖的UTP：CL-D-葡萄糖-1-磷酸尿甙基转化酶活性。为本发明的目的，可根据Kamogawa等，1965，J.Biochem.(Tokyo)57：758-765或Hansen等，1966，Method Enzymol.8：248-253所述方法确定UDP葡萄糖焦磷酸化酶活性。将一单位UDP葡萄糖焦磷酸化酶活性的定义为于25℃，pH 7时每分钟制备1.0p摩尔的UDP-葡萄糖。

本文将术语“UDP-N-乙酰葡糖胺焦磷酸化酶活性”定义为能在存在UTP时催化N-乙酰-alpha-D-葡糖胺-1-磷酸转化为氯喹和UDP-N-乙酰-alpha-D-glucoamine的UTP：N-乙酰-alpha-D-glucoamine-1-磷酸尿苷酰转移酶活性。为本发明的目的，可根据Mangin-Lecreuix等，1994，J.Bacteriology176：5788-5795所述方法确定UDP-N-乙酰葡糖胺焦磷酸化酶活性。将一单位UDP-N-乙酰葡糖胺焦磷酸化酶活性定义为于25℃，pH 7时每分钟制备1.0μ摩尔的UDP-N-乙酰-alpha-D-glucoamine。

本文中所使用的术语“分离的核酸序列”指一种基本上不含其它核酸序列的核酸序列，例如通过琼脂糖电泳测定纯度为至少约20％、优选至少约40％、更优选至少约60％、甚至更优选至少约80％、最优选至少约90％。例如，分离的核酸序列可通过在遗传工程中用来将核酸序列从其天然位置重新定位至其将被复制的另一位点处的标准克隆过程来获得。所述克隆过程可包括切割和分离含编码该多肽的核酸序列的目的核酸片段，将该片段插入到一种载体分子中，并将该重组载体引入到一种宿主细胞中，在所述的宿主细胞中该核酸序列的多个拷贝或克隆将被复制。所述核酸序列可以是基因组DNA、cDNA、半合成、合成来源的或其任意组合。

在第一个实施方案中，本发明涉及编码多肽的分离的核酸序列，所述多肽的氨基酸序列与SEQ ID NO：41有至少约75％、优选至少约80％、更优选至少约85％、甚至更优选至少约90％、最优选至少约95％，以及甚至最优选至少约97％的同一性，所述多肽具有UDP-葡萄糖6-脱氢酶活性(此后为“同源性多肽”)。在一个优选的实施方案中，同源性多肽含有与SEQ IDNO：41中所列氨基酸序列有5个氨基酸、优选4个氨基酸、更优选3个氨基酸、甚至更优选2个氨基酸、最优选1个氨基酸不同的氨基酸序列。

在另一第一个实施方案中，本发明涉及编码多肽的分离的核酸序列，所述多肽的氨基酸序列与SEQ ID NO：43有至少约90％、优选至少约95％，更优选至少约97％的同一性，所述多肽具有UDP葡萄糖焦磷酸化酶活性(此后为“同源性多肽”)。在一个优选的实施方案中，同源性多肽含有与SEQ IDNO：43中所列氨基酸序列有5个氨基酸、优选4个氨基酸、更优选3个氨基酸、甚至更优选2个氨基酸、最优选1个氨基酸不同的氨基酸序列。

在另一第一个实施方案中，本发明涉及编码多肽的分离的核酸序列，所述多肽的氨基酸序列与SEQ ID NO：45有至少约75％、优选至少约80％、更优选至少约85％、甚至更优选至少约90％、最优选至少约95％，以及甚至最优选至少约97％的同一性，所述多肽具有UDP-N-乙酰葡糖胺焦磷酸化酶活性(此后为“同源性多肽”)。在一个优选的实施方案中，同源性多肽含有与SEQ ID NO：45中所列氨基酸序列有5个氨基酸、优选4个氨基酸、更优选3个氨基酸、甚至更优选2个氨基酸、最优选1个氨基酸不同的氨基酸序列。

为了本发明的目的，使用Clustal法(Higgins，1989，CABIOS 5：151-153)使用Vector NTI AlignX软件包(Informax INC.，Bethesda，MD)以及如下配对比对缺省参数：缺口罚分10，缺口长度罚分0.1，和分数矩阵(scorematrix)：blosum62mt2来确定两个氨基酸序列间的同一性程度。

优选地，本发明的核酸序列所编码的多肽含有SEQ ID NO：41、SEQ IDNO：43或SEQ ID NO：45的氨基酸序列或其等位变体或其分别具有UDP-glucose6-脱氢酶、UDP-葡萄糖焦磷酸化酶或UDP-N-乙酰葡糖胺焦磷酸化酶活性的片段。在更优选的实施方案中，本发明的核酸序列所编码的多肽包含SEQ ID NO：41、SEQ ID NO：43或SEQ ID NO：45的氨基酸序列。在另一优选的实施方案中，本发明的核酸序列多编码的多肽包含SEQ ID NO：41，SEQ ID NO：43，或SEQ ID NO：45的氨基酸序列或其等位变体或其片段，其中多肽片段分别具有UDP-葡萄糖6-脱氢酶、UDP-葡萄糖焦磷酸化酶或UDP-N-乙酰葡糖胺焦磷酸化酶活性。在另一优选的实施方案中，本发明的核酸序列所编码的多肽含有SEQ ID NO：41、SEQ ID NO：43或SEQ IDNO：45的氨基酸序列。

本发明还包括编码多肽的核酸序列，所述多肽含有SEQ ID NO：41、SEQ ID NO：43或SEQ ID NO：45的氨基酸序列，其由于遗传密码的简并性而与SEQ ID NO：40，SEQ ID NO：42，或SEQ ID NO：44不同。本发明还涉及分别编码SEQ ID NO：41、SEQ ID NO：43或SEQ ID NO：45的片段的SEQ ID NO：40、SEQ ID NO：42或SEQ ID NO：44亚序列，所述片段分别具有UDP-葡萄糖6-脱氢酶、UDP-葡萄糖焦磷酸化酶或UDP-N-乙酰葡糖胺焦磷酸化酶活性。

SEQ ID NO：40的亚序列为除了从5′和/或3’末端的一个或多个核苷酸缺失外，由SEQ ID NO：40所包含的和酸序列。优选地，亚序列包含1020核苷酸、更优选至少1080核苷酸、和最优选至少1140核苷酸。SEQ ID NO：41的片段为含有从该氨基酸序列的氨基和/或羧基端的一个或多个氨基酸缺失的多肽。优选地，片段至少包含340氨基酸残基、更优选至少360氨基酸残基、和最优选至少380氨基酸残基。

SEQ ID NO：42的亚序列为除了从5′和/或3’末端的一个或多个核苷酸缺失外，由SEQ ID NO：42所包含的和酸序列。优选地，亚序列至少包含765核苷酸、更优选至少810核苷酸、和最优选至少855核苷酸。SEQ ID NO：43的片段为含有从该氨基酸序列的氨基和/或羧基端的一个或多个氨基酸缺失的多肽。优选地，片段至少包含255氨基酸残基、更优选至少270氨基酸残基、和最优选至少285氨基酸残基。

SEQ ID NO：44的亚序列为除了从5′和/或3’末端的一个或多个核苷酸缺失外，由SEQ ID NO：44所包含的和酸序列。优选地，亚序列至少包含1110核苷酸、更优选至少1200核苷酸、和最优选至少1290核苷酸。SEQID NO：45的片段为含有从该氨基酸序列的氨基和/或羧基端的一个或多个氨基酸缺失的多肽。优选地，片段至少包含370氨基酸残基、更优选至少400氨基酸残基、和最优选至少430氨基酸残基。

一个等位基因变体指占据相同染色体位点的一个基因的两个或多个可选形式中的任何一个。等位基因变异通过突变自然产生，并可以导致群体内表型的多态性。基因突变可以是沉默突变(即，在所编码的多肽中没有改变)或可以编码氨基酸序列发生改变的多肽。多肽的等位变体为由基因的等位变体所编码的多肽。

在第二个实施方案中，本发明涉及与SEQ ID NO：40有至少约75％、优选至少约80％、更优选至少约85％、甚至更优选至少约90％、最优选至少约95％、和甚至最优选至少约97％同一性的分离的核酸序列。

在另一第二个实施方案中，本发明涉及与SEQ ID NO：42有至少约90％、优选至少约95％、和更优选至少约97％同一性的分离的核酸序列。

在另一第二个实施方案中，本发明涉及与SEQ ID NO：44有至少约75％、优选至少约80％、更优选至少约85％、甚至更优选至少约90％、最优选至少约95％、和甚至最优选至少约97％同一性的分离的核酸序列。

为了本发明的目的，使用Vector NTI AlignX软件包(Informax INC.，Bethesda，MD)以及如下配对比对缺省参数：缺口罚分15，缺口长度罚分6.6，和分数矩阵：swgapdnamt来确定两个核酸序列间的同一性程度。

在第三个实施方案中，本发明涉及编码具有UDP-葡萄糖6-脱氢酶、UDP-葡萄糖焦磷酸化酶或UDP-N-乙酰葡糖胺焦磷酸化酶活性的多肽的分离的核酸序列，该核酸序列在非常低的严紧条件下、优选低严紧条件下，更优选中严紧条件下、更优选中-高严紧条件下，更优选高严紧条件下以及最优选非常高严紧条件下与(i)SEQ ID NO：40、SEQ ID NO：42或SEQ IDNO：44的核酸序列，(ii)包含在SEQ ID NO：40、SEQ ID NO：42或SEQ IDNO：44中的cDNA序列，或(iii)(i)或(ii)的互补链杂交(J.Sambrook，E.F.Fritsch和T.Maniatus，1989，Molecular Cloning，A Laboratory Manual，2d edition，Cold Spring Harbor，New York)。SEQ ID NO：40、SEQ ID NO：42或SEQ ID NO：44的亚序列可以是至少100个核苷酸或优选至少200个核苷酸。此外，各亚序列可编码具有UDP-葡萄糖6-脱氢酶、UDP-葡萄糖焦磷酸化酶或UDP-N-乙酰葡糖胺焦磷酸化酶活性的多肽片段。

SEQ ID NO：40、SEQ ID NO：42或SEQ ID NO：44的核酸序列，或其亚序列，以及SEQ ID NO：41、SEQ ID NO：43或SEQ ID NO：45氨基酸序列，或其片段，均可用于设计核酸探针从而根据本领域众所周知的方法分别鉴别和克隆来自不同属或种的菌株的编码具有UDP-葡萄糖6-脱氢酶、UDP-葡萄糖焦磷酸化酶或UDP-N-乙酰葡糖胺焦磷酸化酶活性的多肽的DNA。特别地，所述探针可用于在标准Southern印迹步骤后，与目的属或种的基因组或cDNA杂交，从而鉴别和分离其中的相应基因。所述探针可相当地短于全长序列，但长度上至少为15、优选至少为25，而更优选至少为35个核苷酸。也可以使用较长的探针。可以使用DNA和RNA探针。将所述探针进行典型地标记(例如，用³²P、³H、³⁵S、生物素或抗生物素蛋白)而用于检测相应基因。所述探针包含于本发明中。

因此，可从所述其它生物体中制备的基因组DNA或cDNA文库中筛选与上述探针杂交且编码具有UDP-葡萄糖6-脱氢酶、UDP-葡萄糖焦磷酸化酶或UDP-N-乙酰葡糖胺焦磷酸化酶活性的多肽的DNA。可采用琼脂糖或聚丙烯酰胺凝胶电泳或其它分离技术分离来自所述其它生物体的所述基因组或其它DNA。可将来自文库或分离的DNA的DNA转至并固定在硝酸纤维或其它适宜的载体材料上。为了鉴别与SEQ ID NO：40、SEQ ID NO：42或SEQ ID NO：44，或其亚序列同源的克隆或DNA，将所述载体材料用于Southern印迹。为本发明的目的，杂交显示出核酸序列与和SEQ ID NO：40、SEQ ID NO：42或SEQ ID NO：44所示核酸序列、其互补链或其亚序列相应的标记的核酸探针在非常低至非常高严紧条件下杂交。采用X光片检测与核酸探针在这些条件下杂交的分子。

在一个优选的实施方案中，核酸探针是编码SEQ ID NO：41、SEQ IDNO：43或SEQ ID NO：45或其亚序列的多肽的核酸序列。在另一优选的实施方案中，核酸探针是SEQ ID NO：40、SEQ ID NO：42或SEQ ID NO：44。在另一优选的实施方案中，核酸探针是包含在质粒pMRT106中的核酸序列，所述质粒包含于大肠杆菌NRRLB-30536中，其中核酸序列编码具有UDP-葡萄糖6-脱氢酶，UDP-葡萄糖焦磷酸化酶，和UDP-N-乙酰葡糖胺焦磷酸化酶活性的多肽。

对长度至少100个核苷酸的长探针而言，将非常低至非常高严紧条件定义为在42℃ 5×SSPE、0.3％SDS，200μg/ml剪切并变性的鲑精DNA，以及对于非常低和低严紧度来说25％甲酰胺，对于中和中-高严紧度来说35％甲酰胺，或对于高和非常高严紧度来说50％甲酰胺中，根据标准Southern印迹分析进行预杂交和杂交。

对长度至少100个核苷酸的长探针而言，最终用2×SSC、0.2％SDS优选在至少45℃(非常低严紧度)、更优选在至少50℃(低严紧度)、更优选在至少55℃(中严紧度)、更优选在至少60℃(中-高严紧度)、甚至更优选在至少65℃(高严紧度)以及最优选在至少70℃(非常高严紧度)将载体材料洗涤3次，每次15分钟。

对长度为约15个核苷酸至约70个核苷酸的短探针而言，将严紧条件定义为相对于按照Bolton和McCarthy(1962，Proceedings of the NationalAcademy of Sciences USA48：1390)计算的理论Tm低5℃～10℃的温度下，在0.9M NaCl、0.09M Tris-HCl pH 7.6、6mM EDTA、0.5％NP-40、1×Denhardt’s溶液、1mM焦磷酸钠、1mM磷酸氢二钠、0.1mM ATP，和0.2mg酵母RNA/ml中，根据标准Southern印迹分析进行预杂交，杂交，和杂交后洗涤。

对长度为约15个核苷酸至约70个核苷酸的短探针而言，将载体材料在低于理论Tm 5℃～10℃的温度下，在6×SSC+0.1％SDS中洗涤一次，15分钟，然后用6×SSC洗涤2次，每次15分钟。

在第四个实施方案中，本发明涉及分离的核酸序列，其编码含有包含一个或多个氨基酸的取代、缺失和/或插入的SEQ ID NO：41、SEQ ID NO：43或SEQ ID NO：45的氨基酸序列的多肽的变体。

变体多肽的氨基酸序列可通过插入或缺失一个或多个氨基酸残基和/或用不同的氨基酸残基取代一个或多个氨基酸残基而与SEQ ID NO：41、SEQID NO：43或SEQ ID NO：45的氨基酸序列有所不同。优选，氨基酸改变是微小性质的改变，即不会显著影响所述蛋白质折叠和/或活性的保守性氨基酸取代；小缺失，通常缺失1-约30个氨基酸；小的氨基-或羧基-末端延伸，如氨基-末端甲硫氨酸残基；最多约20-25个残基的小接头肽或有利于通过改变净电荷或另一功能，例如聚-组氨酸序列、抗原表位或结合结构域而纯化的小的延伸。

保守性取代的实例包括下组内的取代，碱性氨基酸(精氨酸，赖氨酸和组氨酸)，酸性氨基酸(谷氨酸和天冬氨酸)，极性氨基酸(谷氨酸和天东氨酸)，疏水氨基酸(亮氨酸，异亮氨酸和缬氨酸)，芳香族氨基酸(苯丙氨酸，色氨酸和酪氨酸)，和小分子氨基酸(甘氨酸，丙氨酸，丝氨酸，苏氨酸和甲硫氨酸)。通常不会改变比活性的氨基酸取代是本领域已知的，如，H.Neurath和R.L.Hill，1979，In，The Proteins，Academic Press，New York中所述。最常发生的互换是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly以及其相反互换。

修饰本发明的核酸序列对于合成于所述多肽基本相似的多肽是必需的。“基本相似”于所述多肽是指所述多肽的非天然形式。这些多肽经基因工程改造而在一定程度上不同于从其天然来源分离的多肽，例如，在比活性、热稳定性、最佳pH等方面有所不同的变体。可根据SEQ ID NO：40、SEQ IDNO：42或SEQ ID NO：44的多肽编码部分指示的核酸序列，如其亚序列，和/或通过导入核苷酸取代来构建变体序列，所述核苷酸取代不产生由所述核酸序列编码的多肽的另一氨基酸，但对应于用于生产所述酶的宿主生物所偏好的密码子使用特点，或通过导入可产生不同氨基酸序列的核苷酸取代来构建所述变体序列。有关核苷酸取代的一般描述参见例如Ford等，1991， Protein Expression和Purification 2：95-107。

对本领域技术人员显而易见的是，可以在对于所述分子的功能非常重要的区域外进行所述取代，这样仍得到活性多肽。根据本领域已知的方法，如定点诱变或丙氨酸所描诱变(参见例如Cunningham和Wells，1989，Science244：1081-1085)可鉴定对于本发明分离的核酸序列所编码的多肽的活性至关重要的氨基酸残基，因此优选不经过取代即可完成所述鉴定。在后一种技术中，在分子的每个正电荷残基处诱导突变，然后检测所得突变分子的酶活性以鉴定对于分子活性至关重要的氨基酸残基。底物-酶作用位点还可通过对核磁共振、晶体照相术或光亲和标记等技术所测定的三维结构的分析来确定(参见例如de Vos等，1992，Science 255：306-312；Smith等，1992，Journal of Molecular Biology 224：899-904；Wlodaver等，1992，FEBSLetters 309：59-64)。

由本发明分离的核酸序列编码的多肽具有至少20％、优选至少40％、更优选至少60％、甚至更优选至少80％、甚至更优选至少90％以及最优选至少100％的SEQ ID NO：41的多肽的UDP-葡萄糖6-脱氢酶的活性、SEQIDNO：43的多肽的UDP葡萄糖焦磷酸化酶活性或SEQ ID NO：45的多肽的UDP-N-乙酰葡糖胺焦磷酸化酶活性。

本发明的核酸序列可获自任何属的微生物。为达到本发明的目的，此处与给定来源一起使用的术语“获自”是指由核酸序列编码的多肽是由该核酸序列的来源或已插入了所述来源的核酸序列的细胞所生产的。在一个优选的实施方案中，由本发明的核酸序列多肽为细胞外分泌。

核酸序列可获自细菌来源。例如，这些多肽可以获自革兰氏阳性细菌如杆菌菌株，例如，Bacillus agaradherens、嗜碱芽孢杆菌、解淀粉芽胞杆菌、，短芽胞杆菌、，短芽胞杆菌、克劳氏芽孢杆菌、凝结芽胞杆菌、灿烂芽胞杆菌、迟缓芽胞杆菌、地衣形芽胞杆菌、巨大芽胞杆菌、嗜热脂肪芽胞杆菌、枯草芽孢杆菌或苏芸金芽胞杆菌或链霉菌属，例如，浅青紫链霉菌(Streptomyces lividans)或鼠灰链霉菌(Streptomyces murinus)或获自革兰氏阴性细菌，例如，大肠杆菌或假单胞杆菌(Pseudomonas sp)。

在一个优选的实施方案中，核酸序列可获自链球菌属或巴斯德菌属菌株。

在更优选的实施方案中，核酸序列获自似马链球菌，酿脓链球菌，乳房链球菌或马链球菌兽瘟亚种或出血败血性巴斯德菌菌株。

在最优选的实施方案中，核酸序列获自似马链球菌，例如，SEQ ID NO：40、SEQ ID NO：42或SEQ ID NO：44中所示核酸序列。在另一最优选的实施方案中，核酸探针是包含在质粒pMRT106中的序列，所述质粒包含于大肠杆菌NRRL B-30536中。在更加最优选的实施方案中，核酸序列是SEQ IDNO：40、SEQ ID NO：42或SEQ ID NO：44。

这些种的菌株很容易从各种收集中心，如美国典型培养物保藏中心(ATCC)、德意志微生物和细胞培养物保藏中心(DSM)、真菌菌株保藏中心(CBS)和农业研究服务专利培养物保藏中心(Agricultural Research ServicePatent Culture Collection)北方地区研究中心(NRRL)。

此外，使用上述探针可从其它来源，包括分离自自然界(例如，土壤、堆肥、水等)的微生物中鉴定和获得所述核酸序列。从自然环境中分离微生物的方法是本领域众所周知的。通过类似地筛选另一微生物的基因组或cDNA文库可得到所述核酸序列。一旦用所述探针检测到了编码多肽的核酸序列后，可采用本领域普通技术人员已知的技术(参见例如Sambrook等，1989，同上文)分离或克隆所述序列。

本发明还涉及含有SEQ ID NO：40、SEQ ID NO：42和SEQ ID NO：44的多肽编码序列中至少一个突变的突变核酸序列，其中突变核酸序列编码分别包含SEQ ID NO：42、SEQ ID NO：43和SEQ ID NO：45的多肽。

用于分离和克隆编码多肽的核酸序列的方法是本领域已知的，所述方法包括从基因组DNA中分离，从cDNA中制备，或其联合。获自所述基因组DNA的本发明的核酸序列的克隆可通过，例如，使用众所周知的聚合酶链反应(PCR)或表达文库的抗体筛选从而检测具有共有结构特点的克隆的DNA片段的方法实施。参见例如Innis等，1990，PCR：A GUIDE TOMETHODS and Application，Academic Press，New York。可使用其它核酸扩增方法如连接酶链反应(LCR)，连接活化转录(ligated activated transcription(LAT))和基于核酸序列的扩增(NASBA)。核酸序列还可从链球菌菌株，或另一或相关的生物体中克隆并由此，例如，可以是核酸序列的多肽编码区的等位或种属变体。

本发明还涉及包含可操作性连接于一个或多个控制序列的本发明的核酸序列的核酸构建体，所述控制序列在与所述控制序列相适应的条件下在适宜的宿主细胞中指导编码序列的表达。

本发明还涉及包含本发明核酸序列，启动子以及转录和翻译终止信号的重组表达载体。

本发明还涉及包含本发明的核酸序列重组宿主细胞，其可有益地用于多肽的重组制备中。

本发明还涉及制备具有UDP-N-乙酰葡糖胺焦磷酸化酶活性的多肽的方法，包括(a)在适宜制备多肽的条件下培养宿主细胞；和(b)回收多肽。

在本发明的制备方法中，采用本领域的已知方法将细胞培养于适宜制备多肽的营养培养基中。例如，可采用摇瓶培养和在适宜的培养基中和在适宜多肽表达和/或分离的条件下在实验室或工业发酵罐中实施的小规模或大规模发酵(包括连续、分批、分批补料或固态发酵)的方法培养细胞。在包含碳源和氮源以及无机盐的适宜营养培养基中，采用本领域已知方法实施培养。适宜的培养基可获自商业供应商或可根据已经公开的组成(例如，在美国典型培养物保藏中心的目录中)制备。如果多肽被分泌至营养培养基中，则可直接从培养基中回收多肽。如果多肽未分泌，则可从细胞裂解物将其回收。

可采用特异性针对多肽的本领域的已知方法检测多肽。这些检测方法可包括使用特异性抗体，生成酶产物，或酶底物的消失。

例如，酶检测法可用于确定本说明所述的多肽的活性。

可采用本领域的已知方法回收得到的多肽。例如，可采用包括(但不限于)离心、过滤、提取、喷雾干燥、蒸发或沉淀的传统方法从营养培养基中回收多肽。

可采用本领域的已知的多种方法纯化多肽，所述方法包括(但不限于)层析法(例如，离子交换，亲和，疏水，层析聚焦和大小排阻层析)，电泳方法(例如，准备型等电焦距)，差异溶解(differential solubility)(例如，硫酸铵沉淀)，SDS-PAGE，或提取(参见例如Protein Purification，J.-C.Janson和Lars Ryden编，VCH出版公司，New York，1989)。

本发明还涉及由上述核酸序列编码的，具有UDP-葡萄糖6-脱氢酶、UDP-葡萄糖焦磷酸化酶或UDP-N-乙酰葡糖胺焦磷酸化酶活性的分离的多肽。

下述实施例用于进一步描述本发明，而不应将其理解为对本发明范围的限制。

实施例

引物和寡核苷酸

全部引物和寡核苷酸均通过购买获得(MWG Biotech INC.，High Point，NC)。

实施例1：似马链球菌hasA基因和枯草芽孢杆菌tuaD、gtaB和gcaD基因的PCR扩增和克隆。

从质粒pKKseD(Weigel，1997，Journal of Biological Chemistry 272：32539-32546)中经PCR扩增出似马链球菌透明质酸合酶基因(hasA，登记号AF023876，SEQ ID NOs：1[DNA序列]和2[推导的氨基酸序列])，所使用的引物1和2为：

引物1：

5’-GAGCTCTATAAAAATGAGGAGGGAACCGAATGAGAACATTAAAAAACCT-3’

(SEQ ID NO：3)

引物2：

5’-GTTAACGAATTCAGCTATGTAGGTACCTTATAATAATTTTTTACGTGT-3’(SEQ ID NO：4)

在50μl反应中一式三份实施PCR扩增，所述反应含有如下成分：1ngpKKseD DNA，引物1和2各0.4μM，dATP、dCTP，dGTP和dTTP各200μM，2.5mM MgCl₂的1×PCR缓冲液II(Applied Biosystems，INC.，Foster City，CA)和2.5单位AmpliTaq Gold^TM DNA聚合酶(Applied Biosystems，INC.，Foster City，CA)。在RoboCycler 40 thermacycler(Stratagene，INC.，La Jolla，CA)中实施反应，反应条件：95℃9分钟1个循环；95℃1分钟，52℃1分钟，72℃1分钟3个循环；95℃1分钟，55℃1分钟，72℃1分钟27个循环；72℃5分钟1个循环。采用0.8％琼脂糖凝胶以及44 mM Tris碱，44mM硼酸，0.5mM EDTA缓冲液(0.5×TBE)使PCR产物显影。所要片段为约1200bp。

使用TA-TOPO克隆试剂盒(Stratagene，INC.，La Jolla，CA)将1200bp PCR片段克隆至pCR2.1并按照厂商说明(Stratagene，INC.，La Jolla，CA)将其转化至大肠杆菌感受态细胞。在加入了100μg氨卡青霉素/ml的2×酵母-胰胨(YT)琼脂板上生长16小时后，于37℃下选择转化株。使用QIAGEN自动仪(QIAGEN，Valencia，CA)，按照厂商说明纯化来自这些转化株的质粒DNA，并通过使用M13(-20)正向和M13反向引物(Invitrogen，Inc，Carlsbad，CA)以及其下的内部引物的DNA测序确定插入的DNA序列。将包含1200bp PCR片段的质粒命名为pCR2.1-sehasA(图3)。

引物3：

5’-GTTGACGATGGAAGTGCTGA-3’(SEQ ID NO：5)

引物4：

5’-ATCCGTTACAGGTAATATCC-3’(SEQ ID NO：6)

引物5：

5′-TCCTTTTGTAGCCCTATGGA-3′(SEQ ID NO：7)

引物6：

5′-TCAGCACTTCCATCGTCAAC-3′(SEQ ID NO：8)

引物7：

5′-GGATATTACCTGTAACGGAT-3′(SEQ ID NO：9)

引物8：

5′-TCCATAGGGCTACAAAAGGA-3′(SEQ ID NO：10)

从枯草芽孢杆菌168(BGSC 1A1，Bacillus Genetic Stock Center，Columbus，OH)中经PCR扩增出枯草芽孢杆菌UDP-葡萄糖-6-脱氢酶基因(tuaD，登记号BG12691，SEQ ID No：11[DNA序列]和12[推导的氨基酸序列])，所使用的引物9和10为：

引物9：

5’-GGTACCGACACTGCGACCATTATAAA-3’(SEQ ID NO：13)

引物10：

5′-GTTAACGAATTCCAGCTATGTATCTAGACAGCTTCAACCAAGTAACACT-3′(SEQ ID NO：14)

在30μl反应中一式三份实施PCR扩增，所述反应含有如下成分：50ng枯草芽孢杆菌168染色体DNA，引物9和10各0.3μM，dATP、dCTP，dGTP和dTTP各200μM，2.5mM MgCl₂的1×PCR缓冲液II和2.5单位AmpliTaq Gold^TM DNA聚合酶。在RoboCycler 40 thermacycler中实施反应，反应条件：95℃9分钟1个循环；95℃1分钟，50℃1分钟，72℃1分钟5个循环；95℃1分钟，54℃1分钟，72℃1.5分钟32个循环；72℃7分钟1个循环。采用0.8％琼脂糖凝胶以及0.5×TBE缓冲液使PCR产物显影。所要片段为约1400 bp。

使用TA-TOPO克隆试剂盒(Stratagene，INC.，La Jolla，CA)将1400bp PCR片段克隆至pCR2.1并按照厂商说明(Stratagene，INC.，La Jolla，CA)将其转化至大肠杆菌感受态细胞。使用QIAGEN自动仪，按照厂商说明纯化质粒DNA，并通过使用M13(-20)正向和M13反向引物(Invitrogen，Inc，Carlsbad，CA)以及其下的内部引物的DNA测序确定插入的DNA序列。将包含1200 bp PCR片段的质粒命名为pCR2.1-tuaD(图4)。

引物11：

5’-AGCATCTTAACGGCTACAAA-3’(SEQ ID NO：15)

引物12：

5′-TGTGAGCGAGTCGGCGCAGA-3′(SEQ ID NO：16)

引物1 3：

5’-GGGCGCCCATGTAAAAGCAT-3’(SEQ ID NO：17)

引物14：

5’-TTTGTAGCCGTTAAGATGCT-3’(SEQ ID NO：18)

引物15：

5′-TCTGCGCCGACTCGCTCACA-3′(SEQ ID NO：19)

引物16：

5′-ATGCTTTTACATGGGCGCCC-3′(SEQ ID NO：20)

从枯草芽孢杆菌168中经PCR扩增出枯草芽孢杆菌UTP-葡萄糖-1-磷酸尿苷酰基转移酶基因(gtaB，登记号BG10402，SEQ ID No：21[DNA序列]和22[推导的氨基酸序列])，所使用的引物17和18为：

引物17：

5’-TCTAGATTTTTCGATCATAAGGAAGGT-3’(SEQ ID NO：23)

引物18：

5′-GTTAACGAATTCCAGCTATGTAGGATCCAATGTCCAATAGCCTTTTTGT-3’(SEQ ID NO：24)

在30μl反应中一式三份实施PCR扩增，所述反应含有如下成分：50ng枯草芽孢杆菌168染色体DNA，引物17和18各0.3μM，dATP、dCTP，dGTP和dTTP各200μM，2.5mM MgCl₂的1×PCR缓冲液II和2.5单位AmpliTaq Gold^TM DNA聚合酶。在RoboCycler 40 thermacycler中实施反应，反应条件：95℃9分钟1个循环；95℃1分钟，50℃1分钟，72℃1.5分钟5个循环；95℃1分钟，54℃1分钟，72℃1.5分钟32个循环；72℃7分钟1个循环。采用0.8％琼脂糖凝胶以及0.5×TBE缓冲液使PCR产物显影。所要片段为约900bp。

使用TA-TOPO克隆试剂盒(Stratagene，INC.，La Jolla，CA)将900bpPCR片段克隆至pCR2.1并按照厂商说明(Stratagene，INC.，La Jolla，CA)将其转化至大肠杆菌OneShot^TM感受态细胞。使用QIAGEN自动仪，按照厂商说明纯化质粒DNA，并通过使用M13(-20)正向和M13反向引物(Invitrogen，Inc，Carlsbad，CA)以及其下的内部引物的DNA测序确定插入的DNA序列。将包含900bp PCR片段的质粒命名为pCR2.1-gtaB(图5)。

引物19：

5’-AAAAAGGCTTCTAACCTGGC-3’(SEQ ID NO：25)

引物20：

5’-AAACCGCCTAAAGGCACAGC-3’(SEQ ID NO：26)

引物21：

5’-GCCAGGTTAGAAGCCTTTTT-3’(SEQ ID NO：27)

引物22：

5′-GCTGTGCCTTTAGGCGGTTT-3′(SEQ ID NO：28)

从枯草芽孢杆菌168中经PCR扩增出枯草芽孢杆菌UDP-N-乙酰葡糖胺焦磷酸化酶基因(gcaD，登记号BG10113，SEQ ID No：29[DNA序列]和30[推导的氨基酸序列])，所使用的引物23和24为：

引物23：

5’-GGATCCTTTCTATGGATAAAAGGGAT-3’(SEQ ID NO：31)

引物24：

5’-GTTAACAGGATTATTTTTTATGAATATTTTT-3’(SEQ ID NO：32)

在30μl反应中一式三份实施PCR扩增，所述反应含有如下成分：50ng枯草芽孢杆菌168染色体DNA，引物23和24各0.3μM，dATP、dCTP，dGTP和dTTP各200μM，2.5mM MgCl₂的1×PCR缓冲液II和2.5单位AmpliTaq Gold^TM DNA聚合酶。在RoboCycler 40 thermacycler中实施反应，反应条件：95℃9分钟1个循环；95℃1分钟，50℃1分钟，72℃1.5分钟5个循环；95℃1分钟，54℃1分钟，72℃1.5分钟32个循环；72℃7分钟1个循环。采用0.8％琼脂糖凝胶以及0.5×TBE缓冲液使PCR产物显影。所要片段为约1500bp。

使用TA-TOPO克隆试剂盒(Stratagene，INC.，La Jolla，CA)将1500bp PCR片段克隆至pCR2.1并按照厂商说明(Stratagene，INC.，La Jolla，CA)将其转化至大肠杆菌OneShot^TM感受态细胞。使用QIAGEN自动仪，按照厂商说明纯化质粒DNA，并通过使用M13(-20)正向和M13反向引物(Invitrogen，Inc，Carlsbad，CA)以及其下的内部引物的DNA测序确定插入的DNA序列。将包含900bp PCR片段的质粒命名为pCR2.1-gcaD(图6)。

引物25：

5’-CAGAGACGATGGAACAGATG-3’(SEQ ID NO：33)

引物26：

5’-GGAGTTAATGATAGAGTTGC-3’(SEQ ID NO：34)

引物27：

5’-GAAGATCGGGAATTTTGTAG-3’(SEQ ID NO：35)

引物28：

5′-CATCTGTTCCATCGTCTCTG-3′(SEQ ID NO：36)

引物29：

5’-GCAACTCTATCATTAACTCC-3’(SEQ ID NO：37)

引物30：

5’-CTACAAAATTCCCGATCTTC-3’(SEQ ID NO：38)

实施例2：hasA/tuaD/gtaB操纵子的构建

质粒pDG268Δneo-cryIIIA stab/Sav(美国专利No.5，955，310)和pCR2.1-tuaD(实施例1，图4)用KpnI和HpaI酶切消化。采用0.5×TBE缓冲液在0.8％琼脂糖凝胶上分析酶切消化并用QIAquick DNA提取试剂盒按厂商说明(QIAGEN，Valencia，CA)凝胶纯化来自pDG268Δneo-cryIIIAstab/Sav的较大的载体片段(约7700bp)和来自pCR2.1-tuaD的较小的tuaD片段(约1500bp)。用T4 DNA连接酶(RocheApplied Science；Indianapolis，IN)按厂商说明将两个纯化的片段连接在一起，并将连接混合物转化至大肠杆菌SURE感受态细胞(Stratagene，INC.，La Jolla，CA)中。在加入100μg氨卡青霉素/ml的2XYT琼脂板上筛选转化体。

采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并通过KpnI+HpaI酶切消化在使用0.5×TBE缓冲液的0.8％琼脂糖凝胶上进行分析。存在约1500bp的KpnI/HpaI tuaD片段即可鉴定为正确的质粒并将其命名为pHA1(图7)。

质粒pHA1和pCR2.1-gtaB(实施例1，图5)用XbaI和HpaI酶切消化。采用0.5×TBE缓冲液在0.8％琼脂糖凝胶上分析酶切消化并用QIAquickDNA提取试剂盒按厂商说明凝胶纯化来自pHA1的较大的载体片段(约9200bp)和来自pCR2.1-gtaB的较小的gtaB片段(约900bp)。用T4 DNA连接酶按厂商说明将两个纯化的片段连接在一起，并将连接混合物转化至大肠杆菌SURE感受态细胞中。于37℃在加入100μg氨卡青霉素/ml的2XYT琼脂板上筛选转化体。

采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并用XbaI+HpaI酶切消化。在使用0.5×TBE缓冲液的0.8％琼脂糖凝胶上分析酶切消化。存在约900bp的XbaI/HpaI gtaB片段即可鉴定为正确的质粒并将其命名为pHA2(图8)。

质粒pHA2和pCR2.1-sehasA(实施例1，图3)用SacI+KpnI酶切消化。采用0.5×TBE缓冲液在0.8％琼脂糖凝胶上分析酶切消化。用QIAquickDNA提取试剂盒按厂商说明凝胶纯化来自pHA2的较大的载体片段(约10000bp)和来自pCR2.1-sehasA的较小的hasA片段(约1300bp)。用T4 DNA连接酶按厂商说明将两个纯化的片段连接在一起，并将连接混合物转化至大肠杆菌SURE感受态细胞中。于37℃在加入100μg氨卡青霉素/ml的2XYT琼脂板上筛选转化体。采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并用SacI+KpnI酶切消化。在使用0.5×TBE缓冲液的0.8％琼脂糖凝胶上分析酶切消化。存在约1300bp的SacI/KpnI hasA片段即可鉴定为正确的质粒并将其命名为pHA3(图9)。

实施例3：构建hasA/tuaD/gtaB/gcaD操纵子

质粒pHA2(实施例2，图8)和pCR2.1-gcaD(实施例1，图6)用BamHI和HpaI酶切消化。采用0.5×TBE缓冲液在0.8％琼脂糖凝胶上分析酶切消化并用QIAquick DNA提取试剂盒按厂商说明凝胶纯化来自pHA2的较大的载体片段(约10,000bp)和来自pCR2.1-gcaD的较小的gcaD片段(约1,400bp)。用T4 DNA连接酶按厂商说明将两个纯化的片段连接在一起，并将连接混合物转化至大肠杆菌SURE感受态细胞中。于37℃在加入100μg氨卡青霉素/ml的2XYT琼脂板上筛选转化体。

采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并用XbaI+HpaI酶切消化。在使用0.5×TBE缓冲液的0.8％琼脂糖凝胶上分析酶切消化。存在约1400bp的BamHI/HpaI gcaD片段即可鉴定为正确的质粒并将其命名为pHA4(图10)。

质粒pHA4和pCR2.1-sehasA(实施例1，图3)用SacI和KpnI酶切消化。采用0.5×TBE缓冲液在0.8％琼脂糖凝胶上分析酶切消化并用QIAquickDNA提取试剂盒按厂商说明凝胶纯化来自pHA4的较大的载体片段(约11,000bp)和来自pCR2.1-sehasA的较小的hasA片段(约1,300bp)。用T4 DNA连接酶按厂商说明将两个纯化的片段连接在一起，并将连接混合物转化至大肠杆菌SURE感受态细胞中。在加入100μg氨卡青霉素/ml的2XYT琼脂板上筛选转化体。采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并用SacI+KpnI酶切消化。在使用0.5×TBE缓冲液的0.8％琼脂糖凝胶上分析酶切消化。存在约1,300bp的SacI/KpnI hasA片段即可鉴定为正确的质粒并将其命名为pHA5(图11)。

实施例4：构建hasA/tuaD/gcaD操纵子

质粒pHA1(实施例2，图7)和pCR2.1-gcaD(实施例1，图6)用BamHI和HpaI酶切消化。采用0.5×TBE缓冲液在0.8％琼脂糖凝胶上分析酶切消化并用QIAquick DNA提取试剂盒按厂商说明凝胶纯化来自pHA1的较大的载体片段(约9,200bp)和来自pCR2.1-gcaD的较小的gcaD片段(约1400bp)。用T4 DNA连接酶按厂商说明将两个纯化的片段连接在一起，并将连接混合物转化至大肠杆菌SURE感受态细胞中。于37℃在加入100μg氨卡青霉素/ml的2X YT琼脂板上筛选转化体。

采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并用BamHI+HpaI酶切消化。在使用0.5×TBE缓冲液的0.8％琼脂糖凝胶上分析酶切消化。存在约1400 bp的BamHI/HpaI gtaB片段即可鉴定为正确的质粒并将其命名为pHA6(图12)。

质粒pHA6和pCR2.1-sehasA(实施例1，图3)用SacI+KpnI酶切消化。采用0.5×TBE缓冲液在0.8％琼脂糖凝胶上分析酶切消化。用QIAquickDNA提取试剂盒按厂商说明凝胶纯化来自pHA6的较大的载体片段(约10,200bp)和来自pCR2.1-sehasA的较小的hasA片段(约1,300bp)。用T4DNA连接酶按厂商说明将两个纯化的片段连接在一起，并将连接混合物转化至大肠杆菌SURE感受态细胞中。于37℃在加入100μg氨卡青霉素/ml的2X YT琼脂板上筛选转化体。采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并用SacI+KpnI酶切消化。在使用0.5×TBE缓冲液的0.8％琼脂糖凝胶上分析酶切消化。存在约1300bp SacI/KpnI hasA片段即可鉴定为正确的质粒并将其命名为pHA7(图13)。

实施例5：构建枯草芽孢杆菌RB161

质粒pDG268MCSΔneo/scBAN/Sav(美国专利No.5,955,310)用SacI酶切消化。用QIAquick DNA提取试剂盒按厂商说明纯化酶切消化过的质粒，最后用NotI酶切消化。用QIAquick DNA提取试剂盒按厂商说明(QIAGEN，Valencia，CA)从0.8％琼脂糖-0.5×TBE凝胶中凝胶纯化约6800bp的最大的质粒片段。然后将回收的载体DNA与下述DNA插入片段连接。

质粒pHA3(实施例2，图9)用SacI酶切消化。按上述方法纯化酶切消化过的质粒，最后用NotI酶切消化。按上述方法凝胶纯化约3800bp的最小的质粒片段。采用Rapid DNA克隆试剂盒(Roche Applied Science；Indianapolis，IN)按厂商说明将回收的载体与DNA插入片段连接。在转化至枯草芽孢杆菌前，采用ScaI将上述连接体线性化以确保染色体中为双交换整合而不是但交换整合。将用限制性酶ScaI酶切消化的连接产物转化枯草芽孢杆菌168Δ4感受态细胞。枯草芽孢杆菌168Δ4来自枯草芽孢杆菌菌株168(BGSC 1A1，Bacillus Genetic Stock Center，Columbus，OH)并已经在spollAC，APRE，NPRE和amyE基因中进行了缺失。这四个基因的确实基本上按照关于枯草芽孢杆菌A164Δ5所述的方法实施，所述方法详细描述于美国专利No.5,891,701中。

在添加了5μg氯霉素/ml的Tryptose blood agar base(TBAB)琼脂板于34℃生长16小时筛选枯草芽孢杆菌氯霉素-抗性转化体。为筛选经由在amyE基因座处双交换的质粒的整合，将枯草芽孢杆菌原始转化体铺于添加了6μg新霉素/ml的TBAB琼脂板和在添加了5μg氯霉素/ml的TBAB琼脂板上。经由在amyE基因座处双交换的质粒的整合没有掺入新霉素抗性基因，因此生成了新霉素敏感性菌株。再将分离菌株置于小琼脂板(minimalplate)上以观察其是否在生成透明质酸。生成透明质酸的分离菌株在最小琼脂板上具有“湿”表型。使用该平板筛选，在37℃下分离氯霉素抗性和新霉素敏感性“湿”转化体(由于透明质酸的生成)。

采用QIAGEN tip-20柱(QIAGEN，Valencia，CA)按厂商说明从“湿”、氯霉素抗性和新霉素敏感性枯草芽孢杆菌168Δ4转化体中分离基因组DNA。使用下列基于hasA、tuaD和gtaB基因序列的合成寡核苷酸对这些转化体实施PCR扩增，以证实在枯草芽孢杆菌转化体操纵子存在这些基因及其完整性。

扩增反应(25μl)含有如下成分：50ng枯草芽孢杆菌168Δ4转化体的基因组DNA，每个引物各0.5μM，dATP、dCTP，dGTP和dTTP各200μM，1×PCR缓冲液II，3mM MgCl₂的和0.625单位AmpliTaq Gold^TM DNA聚合酶。在RoboCycler 40 thermacycler中实施反应，反应条件：95℃9分钟1个循环；95℃ 1分钟，50℃ 1分钟，72℃1.5分钟5个循环；95℃1分钟，54℃1分钟，72℃2分钟30个循环；最后一个循环72℃7分钟。

引物3和8用于证实存在hasA基因，引物3和16用于证实存在tuaD基因，引物3和22用于证实存在gtaB基因。将枯草芽孢杆菌168Δ4hasA/tuaD/gtaB整合体命名为枯草芽孢杆菌RB158。

采用QIAGEN tip-20柱按厂商说明从枯草芽孢杆菌RB158中分离基因组DNA，并用于转化感受态枯草芽孢杆菌A164Δ5(缺失spollAC，aprE，nprE，amyE和srfC基因；参见美国专利No.5,891,701)。在添加了5μg氯霉素/ml的TBAB平板上于37℃下筛选转化体。以其“湿”表型鉴定枯草芽孢杆菌A164Δ5 hasA/tuaD/gtaB整合体并将其命名为枯草芽孢杆菌RB161。

实施例6：构建枯草芽孢杆菌RB163

质粒pHA7(实施例4，图13)用SacI酶切消化。按上述方法纯化酶切消化过的质粒，最后用NotI酶切消化。按上述方法凝胶纯化约4,300bp的最小的质粒片段。采用Rapid DNA克隆试剂盒按厂商说明将回收的载体与DNA插入片段连接。在转化至枯草芽孢杆菌前，采用ScaI将上述连接体线性化以确保染色体中为双交换整合而不是但交换整合。将用限制性酶ScaI酶切消化的连接产物转化枯草芽孢杆菌168Δ4感受态细胞。

在添加了5μg氯霉素/ml的TBAB平板上于37℃下筛选枯草芽孢杆菌氯霉素-抗性转化体。为筛选经由在amyE基因座处双交换的质粒的整合，将枯草芽孢杆菌原始转化体铺于添加了6μg新霉素/ml的TBAB琼脂板和在添加了5μg氯霉素/ml的TBAB琼脂板上以分离氯霉素抗性和新霉素敏感性“湿”转化体(由于透明质酸的生成)。

采用QIAGEN tip-20柱(QIAGEN，Valencia，CA)按厂商说明从“湿”、氯霉素抗性和新霉素敏感性枯草芽孢杆菌168Δ4转化体中分离基因组DNA。使用引物3、8、16、22和引物30(实施例1)对这些转化体实施PCR扩增，以证实在枯草芽孢杆菌转化体操纵子存在这些基因及其完整性。扩增反应(25μl)含有如下成分：50ng枯草芽孢杆菌168Δ4转化体的基因组DNA，每个引物各0.5μM，dATP、dCTP，dGTP和dTTP各200μM，1×PCR缓冲液II，3mM MgCl₂的和0.625单位AmpliTaq Gold^TM DNA聚合酶。在RoboCycler 40 thermacycler中实施反应，反应条件：95℃9分钟1个循环；95℃1分钟，55℃1分钟，72℃2分钟30个循环；最后一个循环72℃7分钟。

引物3和8用于证实存在hasA基因，引物3和16用于证实存在tuaD基因，引物3和22用于证实存在gtaB基因，引物3和30用于证实存在gcaD基因。将枯草芽孢杆菌168Δ4 hasA/tuaD/gcaB整合体命名为枯草芽孢杆菌RB160。

采用QIAGEN tip-20柱按厂商说明从枯草芽孢杆菌RB160中分离基因组DNA，并用于转化感受态枯草芽孢杆菌A164Δ5。在添加了5μg氯霉素/ml的TBAB平板上并于37℃下培养16小时筛选转化体。以其“湿”表型鉴定枯草芽孢杆菌A164Δ5 hasA/tuaD/gcaD整合体并将其命名为枯草芽孢杆菌RB163。

实施例7：构建枯草芽孢杆菌TH-1

采用下述步骤从似马链球菌中获得透明质酸合酶(has)操纵子。所述has操纵子含有hasA、hasB、hasC和hasD基因。用HindIII酶切消化约20μg的似马链球菌D181(Kumari和Weigel，1997，Joumal of BiologicalChemistry 272：32539-32546)的染色体DNA和在0.8％琼脂糖-0.5×TBE凝胶分辨。从胶上切下3-6kb范围内的DNA并用QIAquick DNA凝胶提取试剂盒按厂商说明进行纯化。然后将回收的DNA插入片段与下述载体DNA连接。

用HindIII酶切消化质粒pUC18(2μg)并用虾碱性磷酸酶按厂商说明(Roche Applied Science；Indianapolis，IN)将5′突出末端(protruding end)去磷酸化。采用Rapid DNA克隆试剂盒按厂商说明连接去磷酸的载体和DNA插入片段。将连接体用于转化大肠杆菌XL10 GOLD Kan感受态细胞(Stratagene，INC.，La Jolla，CA)。将细胞铺于Luria肉汤平板(100μg/ml氨苄青霉素)上并于37℃下培养过夜。用寡核苷酸952-55-1探测含有大约500克隆/板的5块平板，所述寡核苷酸如下述，其是与接近似马链球菌D181hasA基因3’末端的编码链相同的54bp序列(关于ATG翻译起始密码子的A残基的1098-1151位核苷酸)。

引物31：

5′-GTGTCGGAACATTCATTACATGCTTAAGCACCCGCTGTCCTTCTTGTTATCTCC-3′(SEQ ID NO：39)

用DIG寡核苷酸3′-端标记试剂盒按厂商说明(Roche Applied Science；Indianapolis，IN)对所述寡核苷酸探针实施DIG-标记。按“THE DIG SYSTEMUSER′S GUIDE FOR FILTER HYBRIDIZATION”(Boehringer MannheimGmbH)中所述实施克隆杂交和化学发光检测。

鉴定出与探针杂交的7个克隆。采用QIAGEN自动仪器(QIAGEN，Valencia，CA)并按厂商说明纯化来自这些转化体中一个的质粒DNA并用HindIII酶切消化，然后在使用0.5×TBE缓冲液的0.8％琼脂糖凝胶上分析。DNA插入片段显示出约5kb的大小。将这一质粒命名为pMRT106(图14)。

使用EZ∷TN^TM<TET-1>插入试剂盒按厂商说明(Epicenter Technologies，Madison，WI)确定克隆片段的DNA序列。测序显示了克隆的插入片段包含似马链球菌hasA基因的后1156bp，其后是称为hasB、hasC和hasD的三个其它基因；推测全部四个基因包含在单操纵子中并因此共转录。似马链球菌hasB基因包含在所述片段的1411-2613位核苷酸(SEQ ID No：40[DNA序列]和41[推导的氨基酸序列])中，似马链球菌hasC基因包含在所述片段的2666-3565位核苷酸中(SEQ ID No：42[DNA序列]和43[推导的氨基酸序列])，以及似马链球菌hasD基因包含在所述片段的3735-5114位核苷酸(SEQ ID No：44[DNA序列]和45[推导的氨基酸序列])中。

由似马链球菌hasB和hasC基因编码的多肽显示其与那些分别由来自酿脓链球菌has操纵子序列(Ferretti等，2001，Proc.Natl.Acad.Sci.美国A。98(8)，4658-4663)的hasB和hasC基因编码的多肽有同一性。使用Clustal法(Higgins，1989，CABIOS 5：151-153)使用Vector NTI AlignX软件包(Informax INC.，Bethesda，MD)以及如下配对比对缺省参数：pairwisealignment，缺口罚分10，缺口长度罚分0.1，和分数矩阵：blosum62mt2来确定同一性程度。

氨基酸序列比较显示出似马链球菌HAsB蛋白与来自乳房链球菌的HasB蛋白(SEQ ID NO：105)有70％的同一性；似马链球菌HasC蛋白与来自乳房链球菌的HasC蛋白(SEQ ID NO：99)有91％的同一性；和似马链球菌HasD蛋白与酿脓链球菌(登记号#Q8P286)的GlmU蛋白(推定的UDP-N-乙酰葡糖胺焦磷酸化酶)有73％的同一性。似马链球菌hasD基因编码的多肽显示出与由枯草芽孢杆菌的gcaD基因所编码的UDP-N-乙酰葡糖胺焦磷酸化酶有50.7％的同一性。

质粒pHA5(实施例3，图11)用HpaI和BamHI酶切消化。采用0.5×TBE缓冲液在0.8％琼脂糖凝胶上分析酶切消化并用QIAquick DNA提取试剂盒按厂商说明凝胶纯化较大的载体片段(约11,000bp)。质粒pMRT106用HindIII酶切消化，用Klenow片段填补粘性末端，用BamHI酶切消化DNA。采用0.5×TBE缓冲液在0.8％琼脂糖凝胶上分析酶切消化并用QIAquickDNA提取试剂盒按厂商说明凝胶纯化较小的插入片段(约1000bp，似马链球菌hasD基因的后2/3)。

用T4 DNA连接酶按厂商说明将两个纯化的片段连接在一起，并将连接混合物转化至大肠杆菌SURE感受态细胞中。于37℃在加入100μg氨卡青霉素/ml的2XYT琼脂板上筛选转化体。

采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并通过BamHI+NotI酶切消化在使用0.5×TBE缓冲液的0.8％琼脂糖凝胶上进行分析。存在约1,100bp的BamHI/NotI hasD片段即可鉴定为正确的质粒并将其命名为pHA8(图15)。用HindIII酶切消化这一质粒并用T4 DNA连接酶将其连接，将连接混合物转化至大肠杆菌SURE感受态细胞中。于37℃在加入100μg氨卡青霉素/ml的2XYT琼脂板上筛选转化体。采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并通过HindIII酶切消化在使用0.5×TBE缓冲液的0.8％琼脂糖凝胶上分析。存在约9,700bp的单条带即可鉴定为正确的质粒并将其命名为pHA9(图16)。

质粒pHA9用SacI和NotI酶切消化。采用0.5×TBE缓冲液在0.8％琼脂糖凝胶上分析酶切消化并用QIAquick DNA提取试剂盒按厂商说明凝胶纯化约2,500bp的较小片段。质粒pDG268MCSΔNEO/scBAN/Sav(美国专利No.5,955,310)用SacI和NotI酶切消化。采用0.5×TBE缓冲液在0.8％琼脂糖凝胶上分析酶切消化并用QIAquick DNA提取试剂盒按厂商说明凝胶纯化约6,800bp的较大载体片段。用T4 DNA连接酶按厂商说明将两个纯化的片段连接在一起，并将连接混合物转化至大肠杆菌SURE感受态细胞(Stratagene，INC.，La Jolla，CA)中。在加入100μg氨卡青霉素/ml的2XYT琼脂板上筛选转化体。

采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并通过SalI加HindIII酶切消化在使用0.5×TBE缓冲液的0.8％琼脂糖凝胶上分析。存在约1600bp的SalI/HindIII片段即可鉴定为正确的质粒并将其命名为pHA10(图17)。

质粒pHA10用HindIII和BamHI酶切消化。采用0.5×TBE缓冲液在0.8％琼脂糖凝胶上分析酶切消化并用QIAquick DNA提取试剂盒按厂商说明凝胶纯化较大的载体片段(约8100bp)。质粒pMRT106用HindIII和BamHI酶切消化。采用0.5×TBE缓冲液在0.8％琼脂糖凝胶上分析酶切消化并用QIAquick DNA提取试剂盒按厂商说明凝胶纯化约4,100bp的较大插入片段。用T4 DNA连接酶按厂商说明将两个纯化的片段连接在一起，并将连接混合物用于转化枯草芽孢杆菌168Δ4。于37℃在加入5μg氯霉素/ml的TBAB琼脂板上筛选转化体。将约100个转化体点在添加了氯霉素(5μg/ml)的TBAB和添加了新霉素(10μg/ml)的TBAB上以计数氯霉素抗性、新霉素敏感性克隆；该表型可用于指示双交换至amyE基因座中。鉴定少量所述克隆，所述克隆均表现出“湿”表型，该表型指示透明质酸的生成。选择一个并将其命名为枯草芽孢杆菌168Δ4∷scBAN/se hasA/hasB/hasC/hasD。

采用QIAGEN tip-20柱按厂商说明从枯草芽孢杆菌168Δ4∷scBAN/sehasA/hasB/hasC/hasD中分离基因组DNA，并用于转化感受态枯草芽孢杆菌A164Δ5。在添加了5μg氯霉素/ml的TBAB平板上并于37℃下培养16小时筛选转化体。以其“湿”表型鉴定枯草芽孢杆菌A164Δ5hasA/hasB/hasC/hasD整合体并将其命名为枯草芽孢杆菌TH-1。

实施例8：构建枯草芽孢杆菌RB184

来自似马链球菌(实施例1)的hasA基因和tuaD基因(枯草芽孢杆菌hasB的同系物)(实施例1)在短“共有序列”amyQ(scBAN)启动子(美国专利No.5,955,310)控制下进行克隆。

质粒pDG268MCSΔneo/scBAN/Sav(美国专利No.5,955,310)用SacI酶切消化。用QIAquick DNA提取试剂盒按厂商说明纯化酶切消化过的质粒，最后用NotI酶切消化。用QIAquick DNA提取试剂盒按厂商说明(QIAGEN，Valencia，CA)从0.8％琼脂糖-0.5×TBE凝胶中凝胶纯化约6,800bp的最大的质粒片段。然后将回收的载体DNA与下述DNA插入片段连接。

质粒pHA5(实施例3，图11)用HpaI酶切消化。然后按上述方法纯化酶切消化过的质粒，最后用XbaI酶切消化。按上述方法凝胶纯化约4,300bp的最小的质粒片段。然后通过首先在85℃下，30分钟灭活XbaI将双-酶切消化过的质粒平端化。通过加入10mM dNTP各0.5μl，1μl 1U/μl的T4 DNA聚合酶(Roche Applied Science；Indianapolis，IN)并在11℃下孵育30分钟实施平端化。最后通过在75℃下孵育反应10分钟灭活聚合酶。然后按上述方法凝胶纯化约11,000bp的最大质粒片段并采用Rapid DNA克隆试剂盒按厂商说明再连接。将连接混合物转化至大肠杆菌SURE感受态细胞。于37℃在加入100μg氨卡青霉素/ml的2XYT琼脂板上筛选转化体。采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并通过ScaI酶切消化在使用0.5×TBE缓冲液的0.8％琼脂糖凝胶上分析。存在约11kb片段带即可鉴定为正确的质粒并将其命名为pRB157(图18)。

质粒pRB157用SacI酶切消化。用QIAquick DNA提取试剂盒按厂商说明纯化酶切消化过的质粒，最后用NotI酶切消化。用QIAquick DNA提取试剂盒按厂商说明从0.8％琼脂糖-0.5×TBE凝胶中凝胶纯化约2,632bp的最小的质粒片段。然后将回收的DNA插入片段与上述载体DNA连接。

在转化至枯草芽孢杆菌前，采用ScaI将上述连接体线性化以确保染色体中为双交换整合而不是但交换整合。将用限制性酶ScaI酶切消化的连接产物转化枯草芽孢杆菌168Δ4感受态细胞。

在添加了5μg氯霉素/ml的TBAB平板上筛选枯草芽孢杆菌氯霉素-抗性转化体。为筛选经由在amyE基因座处双交换的质粒的整合，将枯草芽孢杆菌原始转化体铺于添加了6μg新霉素/ml的TBAB琼脂板和在添加了5μg氯霉素/ml的TBAB琼脂板上以分离氯霉素抗性和新霉素敏感性“湿”转化体(由于透明质酸的生成)。

采用QIAGEN tip-20柱按厂商说明从“湿”、氯霉素抗性和新霉素敏感性枯草芽孢杆菌168Δ4转化体中分离基因组DNA。采用引物3、8和16(实施例1)针对这些转化体实施PCR扩增以证实hasA和tuaD存在枯草芽孢杆菌转化体操纵子中以及所述hasA和tuaD的完整性。扩增反应(25ul)含有如下成分：50ng枯草芽孢杆菌168Δ4转化体的基因组DNA，每个引物各0.5μM，dATP、dCTP，dGTP和dTTP各200μM，1×PCR缓冲液II，3mM MgCl₂的和0.625单位AmpliTaq Gold^TM DNA聚合酶。在RoboCycler 40thermacycler中实施反应，反应条件：95℃9分钟1个循环；95℃1分钟，55℃1分钟，72℃2分钟30个循环；最后一个循环72℃7分钟。

引物3和8用于证实存在hasA基因而引物3和16用于证实存在tuaD基因。将枯草芽孢杆菌168Δ4hasA/tuaD整合体命名为枯草芽孢杆菌RB183。

枯草芽孢杆菌RB183的基因组DNA也用于转化感受态枯草芽孢杆菌A164Δ5。在添加了5μg氯霉素/ml的TBAB平板上并于37℃下培养16小时筛选转化体。以其“湿”表型鉴定枯草芽孢杆菌A164Δ5 hasA/tuaD整合体并将其命名为枯草芽孢杆菌RB184。

实施例9：构建枯草芽孢杆菌RB187

将枯草芽孢杆菌RB161制备为感受态然后用cat缺失的质粒pRB115(Widner等，2000，Journal of Industrial Microbiology&Biotechnology 25：204-212)转化。在非许可温度45℃下，采用红霉素(5μg/ml)筛选法实施对直接整合入染色体的筛选。在该温度下，复制的起点是无活性的。只有将质粒整合入细菌染色体上的cat基因，细胞才能保持红霉素抗性。将这些所谓的“整合体(integrant)”保持在45℃以确保在该温度下的生长和筛选。为了允许质粒的缺失或“looping out”(其将导致染色体多数cat基因的缺失)，将整合体在Luria-Bertani(LB)培养基中于34℃的许可温度下不经筛选培养很多代。在该温度下，复制的PE194起点是活性的并启动质粒从基因组中的切除(Molecular Biological Methods for Bacillus，edited by C.R.Harwoodand S.M.Cutting，1990，John WILEY and Sons Ltd。)。

然后将细胞铺于非选择性LB琼脂板上并按下列标准鉴定包含cat基因中的缺失和基于PE194的复制子缺失的克隆：(1)氯霉素敏感性显示存在cat缺失；(2)红霉素敏感性显示不存在由载体PRB115编码的红霉素抗性基因；和(3)PCR证实在所研究菌株中存在cat的缺失。使用引物32和33实施PCR以证实cat基因在amyE基因座的缺失：

引物32：5′-GCGGCCGCGGTACCTGTGTTACACCTGTT-3′(SEQ ID NO：46)

引物33：

5’-GTCAAGCTTAATTCTCATGTTTGACAGCTTATCATCGG-3’(SEQ ID NO：47)

采用 REDextract-N-Amp^TM Plant PCR试剂盒(Sigma ChemicalCompany，St.Louis，MO)按如下步骤从潜在缺失株中分离染色体DNA：将单芽孢杆菌克隆接种于100μl提取溶液(Sigma Chemical Company，St.Louis，MO)中，于95℃培养10分钟，然后用等体积稀释溶液(Sigma ChemicalCompany，St.Louis，MO)稀释。采用4μl提取的DNA联合REDextract-N-AmpPCR反应混合物及所需引物按厂商说明，按照实施例5中所述PCR循环条件实施PCR。使用0.8％琼脂糖-0.5×TBE凝胶显影PCR反应产物。将鉴定的菌株命名为枯草芽孢杆菌RB187。

实施例10：构建枯草芽孢杆菌RB192

通过缺失氯霉素抗性基因(cat基因)使枯草芽孢杆菌RB184未被标记。可采用实施例9中所述方法实施。将得到的菌株命名为枯草芽孢杆菌RB192。

实施例11：构建枯草芽孢杆菌RB194

通过缺失枯草芽孢杆菌RB187染色体的cypX区(实施例9)构建枯草芽孢杆菌RB194。所述cypX区包括cypX基因(其编码类细胞色素P450的与发酵期间红色素合成相关的酶)。为了缺失染色体的该区域，构建质粒pMRT086。

采用引物34和35通过PCR从枯草芽孢杆菌BRG-1中扩增出作为单片段的含有cypX-yvmC和yvmB-yvmA操纵子的染色体区。枯草芽孢杆菌BRG1基本上是枯草芽孢杆菌淀粉酶生成株的化学诱变分离株，所述枯草芽孢杆菌淀粉酶生成株基于实施例5中所述的枯草芽孢杆菌A164Δ5遗传背景。该区的序列与枯草芽孢杆菌168型菌株的已经公开的序列相同。

引物34：

5′-CATGGGAGAGACCTTTGG-3′(SEQ ID NO：48)

引物35：

5′-GTCGGTCTTCCATTTGC-3′(SEQ ID NO：49)

扩增反应(50μl)含有如下成分：200ng枯草芽孢杆菌BRG-1染色体DNA，引物34和35各0.4μM，dATP、dCTP，dGTP和dTTP各200μM，含有1.5mM MgCl₂的Expand High Fidelity缓冲液(Roche Applied Science；INDIANAPOLIS，IN)和2.6单位Expand High Fidelity PCR System enzymemix(Roche Applied Science；Indianapolis，IN)。采用QIAGEN tip-20柱按厂商说明获得枯草芽孢杆菌BRG-1染色体DNA。在RoboCycler 40thermacycler(Stratagene，Inc，La Jolla，CA)中实施扩增反应，反应条件：95℃3分钟1个循环；95℃1分钟，58℃1分钟，68℃4分钟10个循环；95℃1分钟，58℃1分钟，68℃4分钟+20秒20个循环，然后72℃7分钟1个循环。采用0.5×TBE缓冲液在0.8％琼脂糖凝胶电泳上分析反应产物。

采用TA-TOPO克隆试剂盒将含有cypX-yvmC和yvmB-yvmA操纵子的所得片段克隆至pCR2.1并按厂商说明(Invitrogen，INC.，Carlsbad，CA)将其转化至大肠杆菌ONESHOT^TM细胞。在添加了100μg氨卡青霉素/ml的2X YT琼脂板上筛选转化体。用QIAGEN tip-20柱按厂商说明从若干转化体中分离质粒DNA并使用M13(-20)正向和M13反向引物和引物36-51实施DNA测序进行鉴定。

将得到的质粒命名为pMRT084(图19)。

引物36：5′-CGACCACTGTATCTTGG-3′(SEQ ID NO：50)

引物37：5’-GAGATGCCAAACAGTGC-3’(SEQ ID NO：51)

引物38：5′-CATGTCCATCGTGACG-3′(SEQ ID NO：52)

引物39：5′-CAGGAGCATTTGATACG-3′(SEQ ID NO：53)

引物40：5′-CCTTCAGATGTGATCC-3′(SEQ ID NO：54)

引物41：5’-GTGTTGACGTCAACTGC-3’(SEQ ID NO：55)

引物42：5′-GTTCAGCCTTTCCTCTCG-3′(SEQ ID NO：56)

引物43：5′-GCTACCTTCTTTCTTAGG-3′(SEQ ID NO：57)

引物44：5’-CGTCAATATGATCTGTGC-3’(SEQ ID NO：58)

引物45：5′-GGAAAGAAGGTCTGTGC-3′(SEQ ID NO：59)

引物46：5′-CAGCTATCAGCTGACAG-3′(SEQ ID NO：60)

引物47：5′-GCTCAGCTATGACATATTCC-3′(SEQ ID NO：61)

引物48：5′-GATCGTCTTGATTACCG-3′(SEQ ID NO：62)

引物49：5′-AGCTTTATCGGTGACG-3′(SEQ ID NO：63)

引物50：5′-TGAGCACGATTGCAGG-3′(SEQ ID NO：64)

引物51：5′-CATTGCGGAGACATTGC-3′(SEQ ID NO：65)

用BsgI酶切消化质粒pMRT084以缺失大部分cypX-yvmC和yvmB-yvmA操纵子，在每端留下约500碱基。用T4 DNA聚合酶处理酶切消化的BsgIDNA。用SmaI酶切消化质粒pECC1(YOUNGMAN等，1984，质粒12：1-9)。采用QIAquick DNA纯化试剂盒按厂商说明从0.8％琼脂糖-0.5×TBE凝胶中凝胶纯化来自pMRT084的约5,100载体片段和来自pECC1的约1,600bp片段，将其连接在一起，并按厂商说明用于转化大肠杆菌XL1Blue细胞(Stratagene，INC.，La Jolla，CA)。在添加了100μg氨卡青霉素/ml的2XYT平板上筛选氨卡青霉素-抗性转化体。通过用引物52和53的PCR扩增DNA测序鉴定携带含有缺失的大多数cypX-yvmC和yvmB-yvmA操纵子的正确质粒的转化体。在含有如下成分：1ng质粒DNA，每个引物各0.4μM，dATP、dCTP，dGTP和dTTP各200μM，含有1.5mM MgCl₂的1×PCR缓冲液II，2.5单位AmpliTaq Gold^TM DNA聚合酶的50μl的反应中实施PCR扩增。在RoboCycler 40 thermacycler(Stratagene，Inc，La Jolla，CA)中实施扩增反应，反应条件：95℃10分钟1个循环；95℃1分钟，55℃1分钟，72℃1分钟25个循环，72℃7分钟1个循环。采用0.5×TBE缓冲液在0.8％琼脂糖凝胶上显影PCR产物。将这一构建体命名为pMRT086(图20)。

引物52：

5’-TAGACAATTGGAAGAGAAAAGAGATA-3’(SEQ ID NO：66)

引物53：

5’-CCGTCGCTATTGTAACCAGT-3’(SEQ ID NO：67)

用ScaI线性化质粒pMRT086并在存在0.2μg氯霉素/ml的情况下将其转化至枯草芽孢杆菌RB128感受态细胞。

在添加了5μg氯霉素/ml的TBAB平板上并于37℃下培养16小时后筛选转化体。转化体使用QIAGEN tip-20柱按厂商说明从若干转化体中制备染色体DNA。通过采用引物36和52、36和53、37和52以及37和53实施针对cypX-yvmC和yvmB-yvmA操纵子缺失的PCR来筛选氯霉素抗性克隆。在含有如下成分：50ng质粒DNA，每个引物各0.4μM，dATP、dCTP，dGTP和dTTP各200μM，含有2.5mM MgCl₂的1×PCR缓冲液II，2.5单位AmpliTaq Gold^TM DNA聚合酶的50μl的反应中实施PCR扩增。在RoboCycler 40 thermacycler中实施扩增反应，反应条件：95℃10分钟1个循环；95℃1分钟，55℃1分钟，72℃1分钟25个循环，72℃7分钟1个循环。采用0.5×TBE缓冲液在0.8％琼脂糖凝胶上显影PCR产物。将得到枯草芽孢杆菌RB128 cypX-yvmC和yvmB-yvmA缺失株命名为枯草芽孢杆菌MaTa17。

用来自枯草芽孢杆菌MaTa17基因组DNA转化枯草芽孢杆菌RB187(实施例9)的感受态细胞。采用QIAGENtip-20柱按厂商说明从该株中获得基因组DNA。

在添加了5μg氯霉素/ml的TBAB平板上并于37℃下筛选枯草芽孢杆菌氯霉素抗性转化体。含有5μg氯霉素/ml的TBAB平板上在37℃下对原始转化体实施单克隆分离。将得到的cypX-yvmC和yvmB-yvmA缺失株命名为枯草芽孢杆菌RB194。

实施例12：构建枯草芽孢杆菌RB197

枯草芽孢杆菌RB197与枯草芽孢杆菌RB194非常相似，唯一的区别在于RB197包含cypX区中较小的缺失：在该株中仅缺失部分cypX基因以生成cypX缺失表型。为实现该目的，按下述方法构建质粒pMRT122。

通过用EcoRI/HindIII酶切消化质粒pSJ2739(WO 96/23073)构建质粒pCJ791(图21)并连接至含有来自枯草芽孢杆菌的缺失形式的WPRA基因(细胞壁丝氨酸蛋白酶)的片段。采用下述引物54和55从获自枯草芽孢杆菌DN1885(Diderichsen等，1990，Journal ofBacteriology 172：4315-4321)的染色体DNA中扩增WPRA的5′区，并采用下述引物56和57扩增WPRA的3′区。在含有如下成分：1ng枯草芽孢杆菌DN1885染色体DNA，引物39和40各0.4μM，dATP、dCTP，dGTP和dTTP各200μM，含有2.5mM MgCl₂的1×PCR缓冲液II，2.5单位AmpliTaq Gold^TM DNA聚合酶的50μl的反应中实施PCR扩增。在RoboCycler 40 thermacycler中实施扩增反应，反应条件：95℃10分钟1个循环；95℃1分钟，55℃1分钟，72℃1分钟25个循环，72℃7分钟1个循环。

用BglII酶切消化随后连接的方法将5’和3’WPRA PCR片段连接，和采用引物54和57对连接混合物片段实施PCR扩增。在含有如下成分：1ng连接的片段，每个引物各0.4μM，dATP、dCTP，dGTP和dTTP各200μM，含有2.5mM MgCl₂的1×PCR缓冲液II，2.5单位AmpliTaq Gold^TM DNA聚合酶的50μl的反应中实施PCR扩增。在RoboCycler 40 thermacycler中实施扩增反应，反应条件：95℃10分钟1个循环；95℃1分钟，55℃1分钟，72℃1分钟25个循环，72℃7分钟1个循环。采用0.5×TBE缓冲液在0.8％琼脂糖凝胶上显影PCR产物。将得到的PCR片段作为EcoRI/HindIII片段克隆至pSJ2739中，结果得到质粒pCJ791(图21)。在添加了1μg红霉素/ml和25μg卡那霉素/ml的TBAB-琼脂糖平板上并于28℃下培养24-48小时后筛选转化体。用QIAGEN tip-20柱按厂商说明从若干转化体中分离质粒DNA并使用引物54至57按上述条件实施PCR扩增进行鉴定。

引物54：

5’-GGAATTCCAAAGCTGCAGCGGCCGGCGCG-3’(SEQ ID NO：68)

引物55：

5’-GAAGATCTC GTATACTTGGCTTCTGCAGCTGC-3’(SEQ ID NO：69)

引物56：

5’-GAAGATCTGGTCAACAAGCTGGAAAGCACTC-3’(SEQ ID NO：70)

引物57：

5’-CCCAAGCTTCGTGACGTACAGCACCGTTCCGGC-3’(SEQ ID NO：71)

采用下述引物对58/59和60/61通过SOE将来自质粒pDN1981(美国专利No.5,698,415)的amyL上游序列和5′编码区融合在一起。按下述方法将所得片段克隆至载体pCR2.1以生成质粒pMRT032。在含有如下成分：1ng的pDN1981DNA，适宜的引物各0.4μM，dATP、dCTP，dGTP和dTTP各200μM，含有2.5mM MgCl₂的1×PCR缓冲液II，2.5单位AmpliTaq Gold^TMDNA聚合酶的50μl的反应中实施PCR扩增。在RoboCycler 40 thermacycler中实施扩增反应，反应条件：95℃9分钟1个循环；95℃1分钟，52℃1分钟，72℃1分钟3个循环； 95℃1分钟，55℃1分钟，72℃ 1分钟27个循环，72℃5分钟1个循环。采用0.5×TBE缓冲液在0.8％琼脂糖凝胶上显影PCR产物。所要片段分别为约530和466bp。采用引物对59/60生成最终的SOE片段并采用TA-TOPO克隆试剂盒将其克隆至pCR2.1载体。在添加了100μg/ml氨卡青霉素的2XYT-琼脂糖平板上并于37℃下培养16小时后筛选转化体。用QIAGEN tip-20柱按厂商说明从若干转化体中分离质粒DNA并使用M13(-20)正向和M13反向引物实施DNA测序进行鉴定。将含有amyL上游序列/5′编码序列融合片段的质粒命名为pMRT032(图22)。

引物58：

5′-CCTTAAGGGCCGAATATTTATACGGAGCTCCCTGAAACAACAAAAACGGC-3′(SEQ ID NO：72)

引物59：

5′-GGTGTTCTCTAGAGCGGCCGCGGTTGCGGTCAGC-3′(SEQ ID NO：73)

引物60：

5’-GTCCTTCTTGGTACCTGGAAGCAGAGC-3’(SEQ ID NO：74)

引物61：

5’-GTATAAATATTCGGCCCTTAAGGCCAGTACCATTTTCCC-3’(SEQID NO：75)

用NsiI和NotI酶切消化质粒pNNB194(pSK⁺/pE194；美国专利No.5,958,728)，并用Pstl和NotI酶切消化质粒pBEST501(ITAYA等1989Nucleic Acids Research 17：4410)。采用QIAquick DNA纯化试剂盒按厂商说明从0.8％琼脂糖-0.5×TBE凝胶中凝胶纯化来自pNNB194的5,193bp载体片段和来自pBEST501的含有neo基因的1,306bp片段。将分离的片段连接在一起并按厂商说明用于转化大肠杆菌SURE感受态细胞。在添加了100μg氨卡青霉素/ml的2X YT平板上筛选氨卡青霉素-抗性转化体。采用QIAGEN质粒试剂盒(QIAGEN INC.，Valencia，CA)从一个所述转化株中分离质粒DNA，并用NsiI和NotI酶切消化以鉴定所述质粒。将这一质粒命名为PNNB194neo(图23)。

用SacI/NotI酶切消化质粒pNNB194neo并采用标准步骤用T4 DNA聚合酶和dNTP处理以生成平端。用Ec1136II酶切消化质粒pPL2419(美国专利No.5,958,728)。采用QIAquick DNA纯化试剂盒按厂商说明从0.8％琼脂糖-0.5×TBE凝胶中凝胶纯化来自pNNB194neo的6,478bp载体片段和来自pPL2419的含有oriT的562bp片段。将纯化的片段连接在一起并按厂商说明用于转化大肠杆菌SURE细胞。在添加了100μg氨卡青霉素/ml的2XYT平板上于37℃下筛选氨卡青霉素-抗性转化体。采用QIAGEN质粒试剂盒从一个所述转化株中分离质粒DNA，并用NsiI、SacI和Bscl酶切消化以鉴定所述质粒。将这一质粒命名为pNNB194neo-oriT(图24)。

用BamHI酶切消化质粒pNNB194neo-oriT并采用标准步骤用T4 DNA聚合酶和dNTP处理以生成平端。用QIAquick DNA纯化试剂盒按厂商说明从0.8％琼脂糖-0.5×TBE凝胶中凝胶纯化酶切消化过的质粒。用T4 DNA连接酶处理纯化的质粒并按厂商说明用于转化大肠杆菌SURE细胞。在添加了100μg氨卡青霉素/ml的2XYT平板上于37℃下筛选氨卡青霉素-抗性转化体。采用QIAGEN质粒试剂盒从一个所述转化株中分离质粒DNA，并用BamHI和ScaI酶切消化以证实BamHI位点的断裂。将得到的质粒命名为pShV3(图25)。

用Sfil和NotI酶切消化质粒pShV2.1-amyEΔ(美国专利No.5,958.728)，采用QIAquick DNA纯化试剂盒按厂商说明从0.8％琼脂糖-0.5×TBE凝胶中凝胶纯化8696 bp载体片段。为了pShV2.1-amyEΔ的Sfil和NotI位点间插入BamHI位点，按下述步骤构建合成联接子：通过将其各50uM混合，煮沸该混合物并缓慢冷却所述混合物，退火引物62和63。

引物62：5’-GGGCCGGATCCGC-3’(SEQ ID NO：76)

引物63：3’-ATTCCCGGCCTAGGCGCCGG-5’(SEQ ID NO：77)

将纯化的pShV2.1-amyEΔ载体和退火的寡核苷酸连接在一起并按厂商说明用于转化大肠杆菌SURE感受态细胞。在添加了30μg氯霉素/ml的LB平板上于37℃下筛选氯霉素-抗性转化体。采用QIAGEN质粒试剂盒从一个所述转化株中分离质粒DNA，并用BamHI酶切消化以证实BamHI位点的插入。将这一质粒命名为pShV2.1-amyEΔB(图26)。

用SalI/HindIII酶切消化质粒pShV3和pShV2.1-amyEΔB。采用QIAquickDNA纯化试剂盒按厂商说明从0.8％琼脂糖-0.5×TBE凝胶中凝胶纯化来自pShV3的7033 bp载体片段和来自pShV2.1-amyEΔ的含有amyEΔ的1031bp片段。将凝胶纯化的片段连接在一起并按厂商说明用于转化大肠杆菌SURE细胞。在添加了100μg氨卡青霉素/ml的2XYT平板上于37℃下筛选氨卡青霉素-抗性转化体。采用QIAGEN质粒试剂盒从一个所述转化株中分离质粒DNA，并用SalI和HindIII酶切消化以鉴定所述质粒。将这一质粒命名为pShV3A(图27)。

用KpnI/XbaI酶切消化质粒pMRT032，在存在dNTP的情况下用Klenow片段DNA聚合酶填补，并采用QIAquick DNA纯化试剂盒按厂商说明从0.8％琼脂糖-0.5×TBE凝胶中分离约1000bp的片段。将该片段克隆至用EcoRV酶切消化的质粒pShV3a，并按厂商说明转化至大肠杆菌XL1Blue细胞。在添加了100μg氨卡青霉素/ml的2XYT平板上并于37℃下培养16小时后筛选氨卡青霉素-抗性转化体。采用QIAGEN tip-20柱按厂商说明从若干转化体中分离质粒DNA并通过用SacI/SphI的限制性分析在0.8％琼脂糖-0.5×TBE凝胶上对其进行鉴定。将得到的质粒命名为pMRT036(图28)。

用EcoRI/HindIII酶切消化质粒pMRT036，在存在dNTP的情况下用Klenow片段DNA聚合酶填补，连接并转化至大肠杆菌XL1Blue细胞按厂商说明。在添加了100μg氨卡青霉素/ml的2XYT平板上并于37℃下培养16小时后筛选转化体。采用QIAGEN tip-20柱按厂商说明从若干转化体中分离质粒DNA并通过用SacIIXBAI、PSTL和NdeI的限制性分析在0.8％琼脂糖-0.5×TBE凝胶上对其进行鉴定。将得到的质粒命名为pMRT037(图29)。

采用QIAquick DNA纯化试剂盒按厂商说明在2％琼脂糖-0.5×TBE凝胶上从质粒pDG268Δneo-cryIIIAstaB/Sav(美国专利No.5,955,310)中以Sfil/SacI片段将scBAN/cryIIIA稳定片段分离，将其与用Sfil/SacI酶切消化的质粒pMRT037连接，并转化至大肠杆菌XL1Blue细胞。在添加了100μg氨卡青霉素/ml的2XYT平板上并于37℃下培养16小时后筛选转化体。采用QIAGEN tip-20柱按厂商说明从若干转化体中分离质粒DNA并通过用PSTL的限制性分析在0.8％琼脂糖-0.5×TBE凝胶上对其进行鉴定。将得到的质粒命名为pMRT041(图30)。

用EcoRI/HindIII酶切消化质粒pMRT041和pCJ791。采用QIAquickDNA纯化试剂盒按厂商说明从0.8％琼脂糖-0.5×TBE凝胶中分离来自pMRT041的约1300bp片段和来自pCJ791的约4500bp片段，连接，并转化至枯草芽孢杆菌168Δ4感受态细胞。在添加了1μg红霉素/ml和25μg林可霉素的TBAB-琼脂板上并于30℃下培养24-48小时后筛选转化体。采用QIAGEN tip-20柱按厂商说明从若干转化体中分离质粒DNA并通过用SacI和EcoRI/HindIII的限制性分析在0.8％琼脂糖-0.5×TBE凝胶上对其进行鉴定。将得到的质粒命名为pMRT064.1(图31)。

使用下述引物对64和65和引物对66和67引物并采用SOE缺失质粒pMRT064.1中2666位上的SacI位点。在含有如下成分：1ng的pMRT064.1DNA，每个引物各0.4μM，dATP、dCTP，dGTP和dTTP各200μM，含有2.5mM MgCl₂的1×PCR缓冲液II，2.5单位AmpliTaq Gold^TM DNA聚合酶的50μl的反应中实施PCR扩增。在RoboCycler 40 thermacycler中实施扩增反应，反应条件：95℃10分钟1个循环；95℃1分钟，52℃1分钟，72℃1分钟25个循环；72℃7分钟1个循环。采用0.5×TBE缓冲液在0.8％琼脂糖凝胶上显影PCR产物。所要片段分别为约400和800bp。采用引物64和67扩增用于克隆返回至pMRT064.1的最终片段。采用TA-TOPO克隆试剂盒将该片段克隆至pCR2.1载体。在添加了100μg氨卡青霉素/ml的2XYT琼脂板上并于37℃下培养16小时后筛选转化体。通过用M13正向和反向引物和引物65，67和68的DNA测序鉴定含有正确质粒转化体。将这一质粒命名为pMRT068(图32)，并按厂商说明进一步转化至大肠杆菌DM1细胞(Stratagene，INC.，La Jolla，CA)。在添加了100μg氨卡青霉素/ml的2X YT琼脂板上筛选转化体。

引物64：5’-GGAAATTATCGTGATCAAC-3’(SEQ ID NO：78)

引物65：5′-GCACGAGCACTGATAAATATG-3′(SEQ ID NO：79)

引物66：5′-CATATTTATCAGTGCTCGTGC-3′(SEQ ID NO：80)

引物67：5′-TCGTAGACCTCATATGC-3′(SEQ ID NO：81)

引物68：5′-GTCGTTAAACCGTGTGC-3′(SEQ ID NO：82)

使用引物69和70并采用上述PCR条件实施PCR扩增来缺失质粒pMRT064.1中5463和6025位上的Sac位点。采用TA-TOPO克隆试剂盒(Invitrogen，INC.，Carlsbad，CA)将得到的片段克隆至pCR2.1载体。在添加了100μg氨卡青霉素/ml的2XYT琼脂板上并于37℃下培养16小时后筛选转化体。通过用M13正向和反向引物的DNA测序鉴定含有正确质粒转化体。将这一构建体命名为pMRT069(图33)。

引物69：

5′-CTAGAGGATCCCCGGGTACCGTGCTCTGCCTTTTAGTCC-3′(SEQ IDNO：83)

引物70：5’-GTACATCGAATTCGTGCTCATTATTAATCTGTTCAGC-3’(SEQ ID NO：84)

用BclI/AccI酶切消化质粒pMRT068和pMRT064.1。采用QIAquick DNA纯化试剂盒按厂商说明从0.8％琼脂糖-0.5×TBE凝胶中分离来自pMRT068的约1300bp片段和来自pMRT064.1的约3800bp片段，连接，并转化至枯草芽孢杆菌168Δ4感受态细胞。在添加了1μg红霉素/ml和25μg林可霉素/ml的TBAB-琼脂板上并于30℃下培养24-48小时后筛选转化体。通过用SacI和EcoRI/AvaI的限制性分析在0.8％琼脂糖-0.5×TBE凝胶上鉴定含有正确质粒转化体。将所得构建体命名为pMRT071(图34)。

用AvaI/EcoRI酶切消化质粒pMRT071和pMRT069。采用QIAquickDNA纯化试剂盒按厂商说明从0.8％琼脂糖-0.5×TBE凝胶中分离来自pMRT069的578bp片段和来自pMRT071的4510bp片段，连接，并转化至枯草芽孢杆菌168Δ4感受态细胞。在添加了1μg红霉素/ml和25μg林可霉素/ml的TBAB-琼脂板上并于30℃下培养24-48小时后筛选转化体。通过用SacI的限制性分析在0.8％琼脂糖-0.5×TBE凝胶上鉴定含有正确质粒转化体。将得到的构建体命名为pMRT074(图35)。

按厂商说明，用SacII/NdeI酶切消化实施例11中所述的质粒pMRT084，用T4 DNA聚合酶处理，连接并转化至大肠杆菌XL1Blue细胞。在添加了100μg氨苄青霉素/ml的2XYT琼脂板上并于37℃下培养16小时后筛选转化体。通过用Dral的限制性分析在0.8％琼脂糖-0.5×TBE凝胶上鉴定含有正确质粒转化体。将得到的质粒命名为pMRT120(图36)。

用HindIII酶切消化质粒pMRT074，用KLENOW片段DNA聚合酶处理并用EcoRI酶切消化。用EcoRI/ECL136II酶切消化质粒pMRT120。采用QIAquick DNA纯化试剂盒按厂商说明从0.8％琼脂糖-0.5×TBE凝胶中分离来自pMRT120的约600bp片段和来自pMRT074的约4300bp片段，连接，并转化至枯草芽孢杆菌168Δ4感受态细胞。在添加了1μg红霉素/ml和25μg林可霉素/ml的TBAB-琼脂板上并于30℃下培养24-48小时后筛选转化体。通过用SSPL的限制性分析在0.8％琼脂糖-0.5×TBE凝胶上鉴定含有正确质粒转化体。将得到的构建体命名为pMRT122(图37)。

将质粒pMRT122转化至枯草芽孢杆菌A164Δ5感受态细胞。在添加了1μg红霉素/ml和25μg林可霉素/ml的TBAB-琼脂板上并于30℃下培养24-48小时后筛选转化体。采用同源重组至cypX基因座的方法将所述质粒导入枯草芽孢杆菌A164Δ5的染色体，所述同源重组通过在45℃下孵育枯草芽孢杆菌A164Δ5(pMRT086)细胞的新鲜划线平板16小时并选择正常生长的克隆实施。采用QIAGENtip-20柱按厂商说明从该菌株中分离基因组DNA并用于转化枯草芽孢杆菌RB187(实施例9)。在添加了1μg红霉素/ml和25μg林可霉素/ml的TBAB-琼脂板上并于45℃下培养16小时后筛选转化体。在该温度下，PE194复制子不能复制。只有在细菌染色体中保持所述质粒才能使细胞保持红霉素抗性。

借助结果得到染色体上cypX基因部分缺失的同源重组，通过将转化体在Luria-Bertani(LB)培养基在34℃的许可温度下不经筛选生长很多代从染色体中除去所述质粒。在该温度下，复制的PE194起点是有活性的并事实上启动从染色体中切除所述质粒(Molecular Biological Methods forBacillus，edited by C.R.Harwood and S.M.Cutting，1990，John WILEY andSons Ltd.)。

在生长传代若干代后，将所述细胞铺于非选择性LB琼脂糖平板并用下述方法鉴定已缺失了质粒及现在缺失了cypX的克隆和透明质酸的生成：(1)当铺于最小琼脂板上时，“湿”细胞斑显示透明质酸的生成(2)红霉素敏感性显示缺失基于pE194的质粒，和(3)通过使用上述引物34和45实施PCR确定在所需菌株中存在800bp cypX的缺失。

采用REDextract-N-Amp^TM Plant PCR试剂盒(Sigma ChemicalCompany，St.Louis，MO)按如下步骤从潜在的cypX缺失株中分离染色体DNA：将单芽孢杆菌克隆接种于100μl提取溶液中，于95℃培养10分钟，然后用等体积稀释溶液稀释。采用4μl提取的DNA联合REDextract-N-AmpPCR反应混合物及所需引物按厂商说明，按照实施例5中所述PCR循环条件实施PCR从潜在cypX缺失体中分离染色体DNA。使用0.8％琼脂糖-0.5×TBE凝胶显影PCR反应产物。将鉴定的菌株命名为枯草芽孢杆菌RB197。

实施例13：构建枯草芽孢杆菌RB200

按照实施例9中所述用于枯草芽孢杆菌RB187的相同方法缺失枯草芽孢杆菌RB192的cypX基因。将得到的菌株命名为枯草芽孢杆菌RB200.

实施例14：构建枯草芽孢杆菌RB202

按下述方法构建枯草芽孢杆菌A164Δ5ΔcypX：将质粒pMRT122(实施例12)转化至枯草芽孢杆菌A164Δ5感受态细胞。在添加了1μg红霉素/ml和25μg林可霉素/ml的TBAB-琼脂板上并于30℃下培养24-48小时后筛选转化体。采用同源重组至cypX基因座的方法将所述质粒导入枯草芽孢杆菌A164Δ5的染色体，所述同源重组通过在45℃下孵育枯草芽孢杆菌A164Δ5(pMRT086)细胞的新鲜划线平板16小时并选择正常生长的克隆实施。借助结果得到染色体上cypX基因部分缺失的同源重组，通过将转化体在Luria-Bertani(LB)培养基在34℃的许可温度下不经筛选生长很多代从染色体中除去所述质粒。在该温度下，复制的PE194起点是有活性的并事实上启动从染色体中切除所述质粒(Molecular Biological Methods for Bacillus，edited by C.R.Harwood and S.M.Cutting，1990，John WILEY and Sons Ltd.)。在生长传代若干代后，将所述细胞铺于非选择性LB琼脂糖平板并用下述方法鉴定已缺失了质粒及现在缺失了cypX的克隆：(1)红霉素敏感性显示缺失基于pE194的质粒，和(2)通过使用上述引物34和35实施PCR确定在所需菌株中存在800bp cypX的缺失。将鉴定的菌株命名为枯草芽孢杆菌A164Δ5ΔcypX。

将枯草芽孢杆菌A164Δ5cypX制成感受态并使用采用QIAGEN tip-20柱按厂商说明分离的枯草芽孢杆菌TH1基因组DNA(实施例7)转化。在添加了5μg氯霉素/ml的TBAB平板上于37℃下筛选转化体。按其“湿”表型鉴定枯草芽孢杆菌A164Δ5ΔcypX hasA/hasB/hasC/hasD整合体并将其命名为枯草芽孢杆菌RB201。采用实施例9所述相同的方法从枯草芽孢杆菌RB201中缺失cat基因。将得到的菌株命名为枯草芽孢杆菌RB202。

实施例15：构建枯草芽孢杆菌MF002(fuaD/gtaB)

质粒pHA3(实施例2，图9)用Asp718酶切消化。然后通过首先85℃，30分钟灭活限制性酶平端化酶切消化过的质粒。通过加入10mM dNTP各0.5μl，1μl 1U/μl T4聚合酶并于11℃孵育10分钟实施平端化。最后通过将反应于75℃孵育10分钟灭活聚合酶。然后QIAquick DNA提取试剂盒按厂商说明纯化酶切消化过的质粒，最后用NotI酶切消化。用QIAquick DNA提取试剂盒按厂商说明从0.8％琼脂糖-0.5×TBE凝胶中凝胶纯化约2522bp的最小的质粒片段。然后将回收的DNA插入片段(tuaD/gtaB)与下述载体DNA连接。

质粒pDG268MCSΔneo/scBAN/Say(美国专利No.5,955,310)用Ecl136II酶切消化。然后QIAquick DNA提取试剂盒按厂商说明纯化酶切消化过的质粒，最后用NotI酶切消化。用QIAquick DNA提取试剂盒按厂商说明从0.8％琼脂糖-0.5×TBE凝胶中凝胶纯化约6800bp的最大的质粒片段。

采用Rapid DNA克隆试剂盒按厂商说明连接回收的载体和DNA插入片段。在转化至枯草芽孢杆菌前，采用ScaI将上述连接体线性化以确保染色体中为双交换整合而不是但交换整合。将用限制性酶ScaI酶切消化的连接体转化枯草芽孢杆菌168Δ4感受态细胞。

在添加了5μg氯霉素/ml的TBAB平板上于37℃下筛选枯草芽孢杆菌氯霉素-抗性转化体。为筛选经由在amyE基因座处双交换的质粒的整合，将枯草芽孢杆菌原始转化体铺于添加了6μg新霉素/ml的TBAB琼脂板和在添加了5μg氯霉素/ml的TBAB琼脂板上以分离出氯霉素抗性和新霉素敏感性转化体。

采用REDextract-N-Amp^TM Plant PCR试剂盒(Sigma ChemicalCompany，St.Louis，MO)从氯霉素抗性和新霉素敏感性枯草芽孢杆菌168Δ4转化体中分离染色体DNA，步骤如下：将单芽孢杆菌克隆接种于100μl提取溶液中，于95℃培养10分钟，然后用等体积稀释溶液稀释。采用4μl提取的DNA联合REDextract-N-Amp PCR反应混合物及所需引物按厂商说明，按照实施例5中所述PCR循环条件实施PCR。

采用下述合成寡核苷酸对这些转化体实施PCR扩增以确定枯草芽孢杆菌转化体操纵子的hasA，gtaB，和tuaD基因的缺失/存在及完整性。引物3和8用于证实存在hasA基因，引物71和引物15用于证实存在tuaD基因，引物20和71用于证实存在gtaB基因。在0.8％琼脂糖-0.5×TBE凝胶中显影PCR反应产物。将鉴定的菌株，枯草芽孢杆菌168Δ4 hasA/tuaD/gtaB整合体，命名为枯草芽孢杆菌RB176。

引物71：5’-AACTATTGCCGATGATAAGC-3’(结合上游tuaD)(SEQ IDNO：85)

采用QIAGEN tip-20柱按厂商说明从氯霉素抗性和新霉素敏感性枯草芽孢杆菌RB176转化体中分离基因组DNA。将枯草芽孢杆菌RB176基因组DNA用于转化感受态枯草芽孢杆菌A164Δ5。在添加了5μg氯霉素/ml的TBAB平板上并在37℃下培养以筛选转化体。

将枯草芽孢杆菌A164Δ5tuaD/gtaB整合体命名为枯草芽孢杆菌RB177。

采用实施例9中所述方法在枯草芽孢杆菌RB177菌株中缺失cat基因。将得到的菌株命名为枯草芽孢杆菌MF002。

实施例16：构建pel整合质粒pRB162

用SacI和AatII双酶切消化质粒pDG268MCSΔneo/scBAN/Sav(美国专利No.5,955,310)。采用QIAquick DNA凝胶提取试剂盒并按厂商说明从0.8％琼脂糖-0.5×TBE凝胶中凝胶纯化约6193bp的最大的质粒片段。然后将回收的载体DNA与下述DNA插入片段连接。

采用PCR从枯草芽孢杆菌168(BGSC 1A1，Bacillus Genetic StockCenter，Columbus，OH)中扩增枯草芽孢杆菌果胶酶基因的5’和3’片段(pel，登记号BG10840，SEQ ID NO86[DNA序列]和87[推导的氨基酸序列])，所使用的引物为针对5’pel片段的引物72(引入5′Spel限制性酶切消化位点)和73(引入3′SalI限制性酶切消化位点)和针对3′pel片段的引物74(引入5′SacI/BamHI限制性酶切消化位点)和75(引入3’NotI/AatII限制性酶切消化位点)：

引物72：

5’-ACTAGTAATGATGGCTGGGGCGCGTA-3’(SEQ ID NO：88)

引物73：

5′-GTCGACATGTTGTCGTATTGTGAGTT-3′(SEQ ID NO：89)

引物74：

5’-GAGCTCTACAACGCTTATGGATCCGCGGCCGCGGCGGCACACACATCTG

GAT-3’(SEQ ID NO：90)

引物75：

5′-GACGTCAGCCCGTTTGCAGCCGATGC-3′(SEQ ID NO：91)

在30μl反应中一式三份实施PCR扩增，所述反应含有如下成分：50ng的枯草芽孢杆菌168染色体DNA，针对5’pel片段的引物对72/73或针对3’pel片段的引物对74/75各0.4μM，dATP、dCTP，dGTP和dTTP各200μM，含有2.5mM MgCl₂的1×PCR缓冲液II，2.5单位AmpliTaq Gold^TM DNA聚合酶的50μl的反应中实施PCR扩增。在RoboCycler 40 thermacycler中实施扩增反应，反应条件：95℃9分钟1个循环；95℃1分钟，95℃1分钟，52℃1分钟，72℃1分钟3个循环；52℃1分钟，72℃1分钟3个循环；95℃1分钟，55℃1分钟，72℃1分钟27个循环，72℃5分钟1个循环。采用0.5×TBE缓冲液在0.8％琼脂糖凝胶上显影PCR产物。所要片段为约对于5′pel片段的530bp和对于3’pel片段的530bp。

按厂商说明用TA-TOPO克隆试剂盒将530bp 5’pel和530bp 3’pelPCR片段克隆至pCR2.1并转化至大肠杆菌ONESHOT^TM感受态细胞。在添加了100μg氨卡青霉素/ml的2XYT平板上并在37℃下培养以筛选转化体。采用QIAGEN自动仪器按厂商说明纯化来自这些转化体的质粒DNA并采用DNA测序确定插入片段的DNA序列，所述DNA测序中使用的上述引物：针对5’pel的引物72和73和针对3’pel的引物74和75。将包含530bp和530bp PCR片段的质粒分别命名为pCR2.1-pel 5’和pCR2.1-pel 3’(分别示于图38和39)。

用SacI和AatII双酶切消化质粒pCR2.1-pel3’。采用QIAquick DNA凝胶提取试剂盒并按厂商说明从0.8％琼脂糖-0.5×TBE凝胶中凝胶纯化约530 bp的最小的质粒片段。

然后采用Rapid DNA克隆试剂盒按厂商说明将回收的载体(pDG268MCSΔneo/scBAN)和DNA插入片段(3’pel)连接。将连接混合物转化至大肠杆菌SURE感受态细胞(Stratagene，INC.，La Jolla，CA)。于37℃在加入100μg氨卡青霉素/ml的2XYT琼脂板上筛选转化体。

采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并通过SAcI和Aatll酶切消化在使用0.5×TBE缓冲液的0.8％琼脂糖凝胶上分析。存在约530bp的SacI/Aatll 3′pel片段即可鉴定为正确的质粒并将其命名为pRB161(图40)。

用Spel和SalI双酶切消化质粒pRB161。采用QIAquickDNA凝胶提取试剂盒并按厂商说明从0.8％琼脂糖-0.5×TBE凝胶中凝胶纯化约5346bp的最大的质粒片段。然后将回收的载体DNA与下述DNA插入片段连接。

用Spel和SalI双酶切消化质粒pCR2.1-pel3’。采用QIAquick DNA凝胶提取试剂盒并按厂商说明从0.8％琼脂糖-0.5×TBE凝胶中凝胶纯化约530bp的最小的质粒片段。

然后采用Rapid DNA克隆试剂盒按厂商说明将回收的载体(pDG268MCSΔneo/scBAN/pel 3’)和DNA插入片段(5’pel)连接。将连接混合物转化至大肠杆菌SURE感受态细胞(Stratagene，INC.，La Jolla，CA)。在添加了100μg氨卡青霉素/ml的2XYT琼脂板上于37℃下筛选转化体。

采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并通过Spel和SalI酶切消化在使用0.5×TBE缓冲液的0.8％琼脂糖凝胶上分析。存在约530bp的Spel和SalI 3′pel片段即可鉴定为正确的质粒并将其命名为pRB162(图41)。

实施例17：构建pRB156

用HpaI酶切消化质粒pHA7(实施例4，图13)。然后采用QIAquick DNA纯化试剂盒并按厂商说明纯化酶切消化过的质粒，最后用Asp718酶切消化。然后通过首先在85℃下，30分钟灭活XbaI将双-酶切消化过的质粒平端化。通过加入10mM dNTP各0.5μl，1μl 1U/μl的T4 DNA聚合酶(Roche AppliedScience；Indianapolis，IN)并在11℃下孵育30分钟实施平端化。最后通过在75℃下孵育反应10分钟灭活聚合酶。采用QIAquick DNA凝胶提取试剂盒并按厂商说明从0.8％琼脂糖-0.5×TBE凝胶中凝胶纯化约8600bp的最大的质粒片段。然后采用快速DNA克隆试剂盒并按厂商说明将回收的DNA插入片段(pDG268Δneo-cryIIIA stab/sehasA)再连接。

将连接混合物转化至大肠杆菌SURE感受态细胞(Stratagene，INC.，La Jolla，CA)。于37℃在加入100μg氨卡青霉素/ml的2XYT琼脂板上筛选转化体。采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并通过ScaI酶切消化在使用0.5×TBE缓冲液的0.8％琼脂糖凝胶上分析。存在约8,755bp的片段即可鉴定为正确的质粒并将其命名为pRB156(图42)。

实施例18：构建枯草芽孢杆菌MF009

将受控于scBAN启动子的hasA基因导入枯草芽孢杆菌MF002的果胶酸裂合酶基因(pel)座中从而产生枯草芽孢杆菌MF009。

用SacI酶切消化质粒pRB156。然后采用QIAquick DNA纯化试剂盒并按厂商说明纯化酶切消化过的质粒，最后用NotI酶切消化。采用QIAquickDNA凝胶提取试剂盒并按厂商说明从0.8％琼脂糖-0.5×TBE凝胶中凝胶纯化约1,377bp的最小的质粒片段。然后将回收的DNA插入片段与下述载体DNA连接。

用NotI酶切消化质粒pRB162(实施例16，图41)。然后采用QIAquickDNA纯化试剂盒并按厂商说明纯化酶切消化过的质粒，最后用SacI酶切消化。采用QIAquick DNA凝胶提取试剂盒并按厂商说明从0.8％琼脂糖-0.5×TBE凝胶中凝胶纯化约5850bp的最大的质粒片段。然后将回收的载体DNA与上述DNA插入片段连接。

将连接混合物直接转化至枯草芽孢杆菌168Δ4感受态细胞。在添加了5μg氯霉素/ml的TBAB琼脂板上于37℃下筛选枯草芽孢杆菌氯霉素抗性转化体。为筛选经由在pel基因座处双交换的质粒的整合，将枯草芽孢杆菌原始转化体铺于添加了6μg新霉素/ml的TBAB琼脂板和在添加了5μg氯霉素/ml的TBAB琼脂板上。经由在pel基因座处双交换的质粒的整合没有掺入新霉素抗性基因，因此生成了新霉素敏感性菌株。采用该平板筛选，分离出氯霉素抗性和新霉素敏感性转化体。

采用QIAGEN tip-20柱按厂商说明从氯霉素抗性和新霉素敏感性枯草芽孢杆菌168Δ4转化体中分离基因组DNA。将该基因组DNA用于转化感受态枯草芽孢杆菌MF002(实施例15)。在添加了5μg氯霉素/ml的TBAB琼脂板上并于37℃下培养以筛选转化体。通过其“湿”表型鉴定枯草芽孢杆菌A164Δ5hasA和tuaD/gtaB整合体并将其命名为枯草芽孢杆菌MF009。

实施例19：构建枯草芽孢杆菌MF010

用NotI酶切消化质粒pDG268MCSΔneo/BAN/Sav(美国专利No.5,955,310)。然后采用QIAquick DNA纯化试剂盒并按厂商说明纯化酶切消化过的质粒，最后用SfiI酶切消化。采用QIAquick DNA凝胶提取试剂盒并按厂商说明从0.8％琼脂糖-0.5×TBE凝胶中凝胶纯化约185bp的最小的质粒片段。然后将回收的DNA插入片段与下述载体DNA连接。

用NotI酶切消化质粒pRB162(实施例16，图41)。然后采用QIAquickDNA纯化试剂盒并按厂商说明纯化酶切消化过的质粒，最后用SfiI酶切消化。采用QIAquick DNA凝胶提取试剂盒并按厂商说明从0.8％琼脂糖-0.5×TBE凝胶中凝胶纯化约5747bp的最大的质粒片段。然后将回收的载体DNA与上述DNA插入片段连接。

使用Rapid DNA克隆试剂盒按厂商说明连接回收的载体和DNA插入片段。将连接混合物转化至大肠杆菌XLI Blue感受态细胞。在加入100μg氨卡青霉素/ml的2X YT琼脂板上筛选转化体。

采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并通过BamHI酶切消化在使用0.5×TBE缓冲液的0.8％琼脂糖凝胶上分析。通过能提供约7,156bp片段的质粒的线性化即可鉴定为正确的质粒并将其命名为pRB164(图43)。

用SacI酶切消化质粒pRB156(实施例17，图42)。然后采用QIAquickDNA纯化试剂盒并按厂商说明纯化酶切消化过的质粒，最后用NotI酶切消化。采用QIAquick DNA凝胶提取试剂盒并按厂商说明从0.8％琼脂糖-0.5×TBE凝胶中凝胶纯化约1377bp的最小的质粒片段。然后将回收的DNA插入片段与下述载体DNA连接。

用NotI酶切消化质粒pRB164。然后采用QIAquick DNA纯化试剂盒并按厂商说明纯化酶切消化过的质粒，最后用SacI酶切消化。采用QIAquickDNA凝胶提取试剂盒并按厂商说明从0.8％琼脂糖-0.5×TBE凝胶中凝胶纯化约5922bp的最大的质粒片段。然后将回收的载体DNA与上述DNA插入片段连接。

将连接混合物直接转化至枯草芽孢杆菌168Δ4感受态细胞中。在添加了5μg氯霉素/ml的TBAB琼脂板上于37℃下筛选枯草芽孢杆菌氯霉素抗性转化体。为筛选经由在amyE基因座处双交换(cross-over)的质粒的整合，将枯草芽孢杆菌原始转化体铺于添加了6μg新霉素/ml的TBAB琼脂板和在添加了5μg氯霉素/ml的TBAB琼脂板上。经由在amyE基因座处双交换的质粒的整合没有掺入新霉素抗性基因，因此生成了新霉素敏感性菌株。采用该平板筛选，分离出氯霉素抗性和新霉素敏感性转化体。

采用QIAGEN tip-20柱按厂商说明从氯霉素抗性和新霉素敏感性枯草芽孢杆菌168Δ4转化体中分离基因组DNA。将该基因组DNA用于转化感受态枯草芽孢杆菌MF002(实施例15)。在添加了5μg氯霉素/ml的最小琼脂板上并于37℃下培养16小时以筛选转化体。通过其“湿”表型鉴定枯草芽孢杆菌A164Δ5 BAN/HASA和scBAN/tuaD/gtaB整合体并将其命名为枯草芽孢杆菌MF010.

实施例20：发酵

在多种生长条件下评估表1中所列枯草芽孢杆菌菌株的制备透明质酸的能力。

表1

枯草芽孢杆菌菌株启动子/基因互补体 catΔ

cypX Δ

RB161 scBAN/hasA/tuaD/gtaB no

no

RB163 scBAN/hasA/tuaD/gcaD no

no

TH-1 scBANhasA/hasB/hasC/hasD no

no

RB184 scBAN/hasA/tuaD no no

RB187 scBAN/hasA/tuaD/gtaB yes

no

RB192 scBAN/hasA/tuaD yes no

RB194 scBAN/hasA/tuaD/gtaB yes

yes

RB197 scBAN/hasA/tuaD/gtaB yes

yes

RB200 scBAN/hasA/tuaD yes yes

RB202 scBAN/hasA/hasB/hasC/hasD/ yes

yes

MF009 scBAN/tuaD/gtaB no

no

scBAN/hasA

MF010 scBAN/tuaD/gtaB no

no

BAN/hasA

在标准小发酵罐中发酵枯草芽孢杆菌菌株，所使用的培养基包含每升中6.5g的KH₂PO₄，4.5g Na₂HPO₄，3.0g(NH₄)₂SO₄，2.0g Na₃-柠檬酸-2H₂O，3.0MgSO₄·7H₂O，6.0ml Mikrosoy-2，0.15mg生物素(1ml 0.15mg/ml乙醇)，15.0g蔗糖，1.0ml SB 2066，2.0ml P2000，0.5g CaCl₂·2H₂O。高压灭菌前，培养基的pH为6.3-6.4(未调整)。在高压灭菌后加入CaCl₂·2H₂O。

所使用的接种培养基为B-3，即无琼脂的Agar-3或“S/S-1”培养基。

Agar-3培养基含有每升中4.0g营养肉汤，7.5g水解蛋白，3.0g酵母提取物，1.0g葡萄糖和2％琼脂。pH为调整；高压灭菌前，pH约为6.8；高压灭菌后，pH约为7.7。

蔗糖/大豆接种瓶培养基(S/S-1)包含每升中65g蔗糖，35g大豆粉，2g Na₃-柠檬酸-2H₂O，4g KH₂PO₄，5g Na₂HPO₄和6ml微量元素。用NaOH将培养基的pH调整为约7；将培养基加入瓶中后，加入0.2％植物油以抑制发泡。微量元素包括每升中100g柠檬酸-H₂O，20g FeSO₄·7H₂O，5gMnSO₄·H₂0，2g CuSO₄·5H₂O和2g ZnCl₂。

在接种前用氨水将pH调整为6.8-7.0并用和随后用氨水和磷酸将pH控制在pH7.0±0.2。将温度保持在37℃。采用两个叶轮直径为6cm的6叶涡轮叶轮在初始体积为1.5升的3升罐中以最大值1300RPM进行搅拌。以最大值1.5VVM通风。

使用纯蔗糖溶液给料。在溶解氧(D.O.)仍持续降低时(即在蔗糖耗尽前)，于接种后约4小时开始给料。给料速率在7个小时期间从0至约6g蔗糖/L₀-小时线性改变。在某些发酵中也使用较低的给料速率(从0至约2g蔗糖/L₀-小时线性改变)。

约10小时后粘度已经非常显著，而24小时后粘度非常高，使得D.O.降至最低点。终粘度达到3,220cP。20小时后，细胞群形成接近最大值(12-15g/升)。采用如下方法除去细胞：用3份水稀释1份培养液，充分混合并以30,000×g离心以形成细胞上清和能进行漂洗和干燥的细胞片状沉淀。

根据透明质酸结合蛋白(蛋白和试剂盒购自Seikagaku America，Falmouth，MA)，采用ELISA方法测定透明质酸浓度。

将枯草芽孢杆菌RB161和RB163在分批和分批补料发酵中培养。在分批补料步骤中，枯草芽孢杆菌菌株RB163和RB161的补料率有所不同。采用ELISA方法再次测定透明质酸浓度。结果示于表2中。

表2

菌株和生长条件	HA(相对产量)ELISA方法
菌株和生长条件	HA(相对产量)ELISA方法	RB-161(hasA/tuaD/gtaB)单一补料	0.7±0.1
RB-163(hasA/tuaD/gcaD)分批补料-6g蔗糖/L₀-小时RB-161(hasA/tuaD/gtaB)分批补料-6g蔗糖/L₀-小时RB-163(hasA/tuaD/gcaD)分批补料-2g蔗糖/L₀-小时RB-161(hasA/tuaD/gtaB)分批补料-2g蔗糖/L₀-小时	0.9±0.10.9±0.11.0±0.21.0±0.1	RB-161(hasA/tuaD/gtaB)单一补料	0.7±0.1

对同一菌株以2g/L蔗糖L₀-小时分批补料的和以6g/L蔗糖/L₀-小时分批补料的培养测定的比较结果显示出较快的蔗糖补料速率不能显著地改善滴度。

图44中总结了在相同条件下(以约2g蔗糖/L₀-小时，37℃分批补料)芽孢杆菌属菌株的结果。图44中给出了来自在同一条件下的多重运行的数据的标准差。没有数值的数据来自单运行。使用改良咔唑法(Bitter and Muir，1962，Anal BIOCHEM.4：330-334)确定透明质酸浓度。

图45中总结了在相同条件下(以约2g蔗糖/L_O-小时，37℃分批补料)获自重组枯草芽孢杆菌菌株发酵的峰量透明质酸的平均分子量(MDa)。采用GPC MALLS测定法确定分子量。采用如下步骤从GPC MALLS测定实验中采集数据。GPC-MALLS(配合多角度激光散射的凝胶渗透或大小排阻色谱法)已广泛用于表征高分子量(MW)聚合物。通过基于洗脱液和树脂间不同分子量的分子的差异区分的GPC法实施聚合物的分离。通过基于不同MW分子的差异散射范围/角度的MALLS法测定各聚合物的平均分子量。Ueno等，1988，CHEM.PHARM.BULL.36，4971-4975；Wyatt，1993，Anal.Chim.Acta 272：1-40；和Wyatt Technologies，1999，“Light ScatteringUniversity DAWN Course Manual”和“DAWN EOS Manual”Wyatt TechnologyCorporation，Santa Barbara，California中描述了GPC-MALLS的原理和适用于透明质酸的方法步骤。将Agilent 1100等度HPLC，Tosoh Biosep G6000PWXL柱用于GPC，将Wyatt Down EOS用于MALLS。将Agilent G1362A折光率检测器联于MALLS下游以确定洗脱浓度。将具有已知分子量的多种商品化透明质酸制品作为标准物。

生物材料的保藏

根据布达佩斯条约，下列生物材料已保藏在农业研究服务专利培养物保藏中心(Agricultural Research Service Patent Culture Collection)，北方地区研究中心(Northern Regional Research Center)，大学街1815号(1815University Street)，Peoria，伊利诺斯州(Illinois，)，61604，并给予下列保藏号：

保藏物保藏号保藏日

大肠杆菌XL10 Gold kan(pMRT106) NRRLB-30536 2001年12月12日

该菌株已经在如下状态下进行了保藏，在该专利申请的待审期内，保证根据37 C.F.R.§1.14和35 U.S.C.§122授权的专利和商标委员会所确定的人员能够获得该培养物。该保藏物代表了保藏菌株的基本上纯的培养物。在提交了该申请的副本或其后续申请的国家中，可以按照该国专利法的要求提供该保藏物。但是，应当明白保藏物的可获得性并不构成对以侵犯由政府行为授予的专利权来实施本发明的许可。

在此所描述并要求专利保护的发明并不限于本文中所公开的特定实施方案的范围内，因为这些实施方案意图作为对本发明几个方面的说明。任何等同的实施方案均在本发明的范围内。事实上，除了那些在此所示并描述的修改外，本领域的技术人员很容易根据前面的描述对本发明作各种修改。这些修改也在所附权利要求的范围内。若有抵触，以本说明书(包括定义)为准。

本文中引用了各种参考文献，其公开内容全文引入作为参考。

申请人或代理人档案号10241.204-WO

国际申请号PCT/US02/41067

关于微生物保藏的说明

(细则13之二)

PCT/RO/134表(1992年7月)

序列表

<110> 艾伦.斯洛马(Sloma，Alan)

里金.贝尔(Behr，Regine)

威廉.威德纳(Widner，William)

玛丽亚.唐(Tang，Maria)

戴维.斯滕伯格(Sternberg，David)

斯蒂芬.布朗(Brown，Stephen)

<120> 在重组宿主细胞中制备透明质酸的方法

<130> 10241.204-WO

<150> US 60/342,644

<151> 2001-12-21

<160> 108

<170> PatentIn version 3.1

<210> 1

<211> 1251

<212> DNA

<213> 似马链球菌(Streptococcus equisimilis)

<220>

<221> CDS

<222> (1)..(1251)

<223>

<400> 1

atg aga aca tta aaa aac ctc ata act gtt gtg gcc ttt agt att ttt 48

Met Arg Thr Leu Lys Asn Leu Ile Thr Val Val Ala Phe Ser Ile Phe

1 5 10 15

tgg gta ctg ttg att tac gtc aat gtt tat ctc ttt ggt gct aaa gga 96

Trp Val Leu Leu Ile Tyr Val Asn Val Tyr Leu Phe Gly Ala Lys Gly

20 25 30

agc ttg tca att tat ggc ttt ttg ctg ata gct tac cta tta gtc aaa 144

Ser Leu Ser Ile Tyr Gly Phe Leu Leu Ile Ala Tyr Leu Leu Val Lys

35 40 45

atg tcc tta tcc ttt ttt tac aag cca ttt aag gga agg gct ggg caa 192

Met Ser Leu Ser Phe Phe Tyr Lys Pro Phe Lys Gly Arg Ala Gly Gln

50 55 60

tat aag gtt gca gcc att att ccc tct tat aac gaa gat gct gag tca 240

Tyr Lys Val Ala Ala Ile Ile Pro Ser Tyr Asn Glu Asp Ala Glu Ser

65 70 75 80

ttg cta gag acc tta aaa agt gtt cag cag caa acc tat ccc cta gca 288

Leu Leu Glu Thr Leu Lys Ser Val Gln Gln Gln Thr Tyr Pro Leu Ala

85 90 95

gaa att tat gtt gtt gac gat gga agt gct gat gag aca ggt att aag 336

Glu Ile Tyr Val Val Asp Asp Gly Ser Ala Asp Glu Thr Gly Ile Lys

100 105 110

cgc att gaa gac tat gtg cgt gac act ggt gac cta tca agc aat gtc 384

Arg Ile Glu Asp Tyr Val Arg Asp Thr Gly Asp Leu Ser Ser Asn Val

115 120 125

att gtt cac cgg tca gaa aaa aat caa gga aag cgt cat gca cag gcc 432

Ile Val His Arg Ser Glu Lys Asn Gln Gly Lys Arg His Ala Gln Ala

130 135 140

tgg gcc ttt gaa aga tca gac gct gat gtc ttt ttg acc gtt gac tca 480

Trp Ala Phe Glu Arg Ser Asp Ala Asp Val Phe Leu Thr Val Asp Ser

145 150 155 160

gat act tat atc tac cct gat gct tta gag gag ttg tta aaa acc ttt 528

Asp Thr Tyr Ile Tyr Pro Asp Ala Leu Glu Glu Leu Leu Lys Thr Phe

165 170 175

aat gac cca act gtt ttt gct gcg acg ggt cac ctt aat gtc aga aat 576

Asn Asp Pro Thr Val Phe Ala Ala Thr Gly His Leu Asn Val Arg Asn

180 185 190

aga caa acc aat ctc tta aca cgc ttg aca gat att cgc tat gat aat 624

Arg Gln Thr Asn Leu Leu Thr Arg Leu Thr Asp Ile Arg Tyr Asp Asn

195 200 205

gct ttt ggc gtt gaa cga gct gcc caa tcc gtt aca ggt aat att ctc 672

Ala Phe Gly Val Glu Arg Ala Ala Gln Ser Val Thr Gly Asn Ile Leu

210 215 220

gtt tgc tca ggc ccg ctt agc gtt tac aga cgc gag gtg gtt gtt cct 720

Val Cys Ser Gly Pro Leu Ser Val Tyr Arg Arg Glu Val Val Val Pro

225 230 235 240

aac ata gat aga tac atc aac cag acc ttc ctg ggt att cct gta agt 768

Asn Ile Asp Arg Tyr Ile Asn Gln Thr Phe Leu Gly Ile Pro Val Ser

245 250 255

atc ggt gat gac agg tgc ttg acc aac tat gca act gat tta gga aag 816

Ile Gly Asp Asp Arg Cys Leu Thr Asn Tyr Ala Thr Asp Leu Gly Lys

260 265 270

act gtt tat caa tcc act gct aaa tgt att aca gat gtt cct gac aag 864

Thr Val Tyr Gln Ser Thr Ala Lys Cys Ile Thr Asp Val Pro Asp Lys

275 280 285

atg tct act tac ttg aag cag caa aac cgc tgg aac aag tcc ttc ttt 912

Met Ser Thr Tyr Leu Lys Gln Gln Asn Arg Trp Asn Lys Ser Phe Phe

290 295 300

aga gag tcc att att tct gtt aag aaa atc atg aac aat cct ttt gta 960

Arg Glu Ser Ile Ile Ser Val Lys Lys Ile Met Asn Asn Pro Phe Val

305 310 315 320

gcc cta tgg acc ata ctt gag gtg tct atg ttt atg atg ctt gtt tat 1008

Ala Leu Trp Thr Ile Leu Glu Val Ser Met Phe Met Met Leu Val Tyr

325 330 335

tct gtg gtg gat ttc ttt gta gac aat gtc aga gaa ttt gat tgg ctc 1056

Ser Val Val Asp Phe Phe Val Asp Asn Val Arg Glu Phe Asp Trp Leu

340 345 350

agg gtt ttg gcc ttt ctg gtg att atc ttc att gtt gct ctt tgt cgt 1104

Arg Val Leu Ala Phe Leu Val Ile Ile Phe Ile Val Ala Leu Cys Arg

355 360 365

aat att cac tat atg ctt aag cac ccg ctg tcc ttc ttg tta tct ccg 1152

Asn Ile His Tyr Met Leu Lys His Pro Leu Ser Phe Leu Leu Ser Pro

370 375 380

ttt tat ggg gta ctg cat ttg ttt gtc cta cag ccc ttg aaa ttg tat 1200

Phe Tyr Gly Val Leu His Leu Phe Val Leu Gln Pro Leu Lys Leu Tyr

385 390 395 400

tct ctt ttt act att aga aat gct gac tgg gga aca cgt aaa aaa tta 1248

Ser Leu Phe Thr Ile Arg Asn Ala Asp Trp Gly Thr Arg Lys Lys Leu

405 410 415

tta 1251

Leu

<210> 2

<211> 417

<212> PRT

<213> 似马链球菌(Streptococcus equisimilis)

<400> 2

Met Arg Thr Leu Lys Asn Leu Ile Thr Val Val Ala Phe Ser Ile Phe

1 5 10 15

Trp Val Leu Leu Ile Tyr Val Asn Val Tyr Leu Phe Gly Ala Lys Gly

20 25 30

Ser Leu Ser Ile Tyr Gly Phe Leu Leu Ile Ala Tyr Leu Leu Val Lys

35 40 45

Met Ser Leu Ser Phe Phe Tyr Lys Pro Phe Lys Gly Arg Ala Gly Gln

50 55 60

Tyr Lys Val Ala Ala Ile Ile Pro Ser Tyr Asn Glu Asp Ala Glu Ser

65 70 75 80

Leu Leu Glu Thr Leu Lys Ser Val Gln Gln Gln Thr Tyr Pro Leu Ala

85 90 95

Glu Ile Tyr Val Val Asp Asp Gly Ser Ala Asp Glu Thr Gly Ile Lys

100 105 110

Arg Ile Glu Asp Tyr Val Arg Asp Thr Gly Asp Leu Ser Ser Asn Val

115 120 125

Ile Val His Arg Ser Glu Lys Asn Gln Gly Lys Arg His Ala Gln Ala

130 135 140

Trp Ala Phe Glu Arg Ser Asp Ala Asp Val Phe Leu Thr Val Asp Ser

145 150 155 160

Asp Thr Tyr Ile Tyr Pro Asp Ala Leu Glu Glu Leu Leu Lys Thr Phe

165 170 175

Asn Asp Pro Thr Val Phe Ala Ala Thr Gly His Leu Asn Val Arg Asn

180 185 190

Arg Gln Thr Asn Leu Leu Thr Arg Leu Thr Asp Ile Arg Tyr Asp Asn

195 200 205

Ala Phe Gly Val Glu Arg Ala Ala Gln Ser Val Thr Gly Asn Ile Leu

210 215 220

Val Cys Ser Gly Pro Leu Ser Val Tyr Arg Arg Glu Val Val Val Pro

225 230 235 240

Asn Ile Asp Arg Tyr Ile Asn Gln Thr Phe Leu Gly Ile Pro Val Ser

245 250 255

Ile Gly Asp Asp Arg Cys Leu Thr Asn Tyr Ala Thr Asp Leu Gly Lys

260 265 270

Thr Val Tyr Gln Ser Thr Ala Lys Cys Ile Thr Asp Val Pro Asp Lys

275 280 285

Met Ser Thr Tyr Leu Lys Gln Gln Asn Arg Trp Asn Lys Ser Phe Phe

290 295 300

Arg Glu Ser Ile Ile Ser Val Lys Lys Ile Met Asn Asn Pro Phe Val

305 310 315 320

Ala Leu Trp Thr Ile Leu Glu Val Ser Met Phe Met Met Leu Val Tyr

325 330 335

Ser Val Val Asp Phe Phe Val Asp Asn Val Arg Glu Phe Asp Trp Leu

340 345 350

Arg Val Leu Ala Phe Leu Val Ile Ile Phe Ile Val Ala Leu CysArg

355 360 365

Asn Ile His Tyr Met Leu Lys His Pro Leu Ser Phe Leu Leu Ser Pro

370 375 380

Phe Tyr Gly Val Leu His Leu Phe Val Leu Gln Pro Leu Lys Leu Tyr

385 390 395 400

Ser Leu Phe Thr Ile Arg Asn Ala Asp Trp Gly Thr Arg Lys Lys Leu

405 410 415

Leu

<210> 3

<211> 49

<212> DNA

<213> 似马链球菌(Streptococcus equisimilis)

<400> 3

gagctctata aaaatgagga gggaaccgaa tgagaacatt aaaaaacct 49

<210> 4

<211> 48

<212> DNA

<213> 似马链球菌(Streptococcus equisimilis)

<400> 4

gttaacgaat tcagctatgt aggtacctta taataatttt ttacgtgt 48

<210> 5

<211> 20

<212> DNA

<213> 似马链球菌(Streptococcus equisimilis)

<400> 5

gttgacgatg gaagtgctga 20

<210> 6

<211> 20

<212> DNA

<213> 似马链球菌(Streptococcus equisimilis)

<400> 6

atccgttaca ggtaatatcc 20

<210> 7

<211> 20

<212> DNA

<213> 似马链球菌(Streptococcus equisimilis)

<400> 7

tccttttgta gccctatgga 20

<210> 8

<211> 20

<212> DNA

<213> 似马链球菌(Streptococcus equisimilis)

<400> 8

tcagcacttc catcgtcaac 20

<210> 9

<211> 20

<212> DNA

<213> 似马链球菌(Streptococcus equisimilis)

<400> 9

ggatattacc tgtaacggat 20

<210> 10

<211> 20

<212> DNA

<213> 似马链球菌(Streptococcus equisimilis)

<400> 10

tccatagggc tacaaaagga 20

<210> 11

<211> 1383

<212> DNA

<213> 枯草芽孢杆菌(枯草芽孢杆菌(Bacillus subtilis))

<220>

<221> CDS

<222> (1)..(1383)

<223>

<400> 11

gtg aaa aaa ata gct gtc att gga aca ggt tat gta gga ctc gta tca 48

Val Lys Lys Ile Ala Val Ile Gly Thr Gly Tyr Val Gly Leu Val Ser

1 5 10 15

ggc act tgc ttt gcg gag atc ggc aat aaa gtt gtt tgc tgt gat atc 96

Gly Thr Cys Phe Ala Glu Ile Gly Asn Lys Val Val Cys Cys Asp Ile

20 25 30

gat gaa tca aaa atc aga agc ctg aaa aat ggg gta atc cca atc tat 144

Asp Glu Ser Lys Ile Arg Ser Leu Lys Asn Gly Val Ile Pro Ile Tyr

35 40 45

gaa cca ggg ctt gca gac tta gtt gaa aaa aat gtg ctg gat cag cgc 192

Glu Pro Gly Leu Ala Asp Leu Val Glu Lys Asn Val Leu Asp Gln Arg

50 55 60

ctg acc ttt acg aac gat atc ccg tct gcc att cgg gcc tca gat att 240

Leu Thr Phe Thr Asn Asp Ile Pro Ser Ala Ile Arg Ala Ser Asp Ile

65 70 75 80

att tat att gca gtc gga acg cct atg tcc aaa aca ggt gaa gct gat 288

Ile Tyr Ile Ala Val Gly Thr Pro Met Ser Lys Thr Gly Glu Ala Asp

85 90 95

tta acg tac gtc aaa gcg gcg gcg aaa aca atc ggt gag cat ctt aac 336

Leu Thr Tyr Val Lys Ala Ala Ala Lys Thr Ile Gly Glu His Leu Asn

100 105 110

ggc tac aaa gtg atc gta aat aaa agc aca gtc ccg gtt gga aca ggg 384

Gly Tyr Lys Val Ile Val Asn Lys Ser Thr Val Pro Val Gly Thr Gly

115 120 125

aaa ctg gtg caa tct atc gtt caa aaa gcc tca aag ggg aga tac tca 432

Lys Leu Val Gln Ser Ile Val Gln Lys Ala Ser Lys Gly Arg Tyr Ser

130 135 140

ttt gat gtt gta tct aac cct gaa ttc ctt cgg gaa ggg tca gcg att 480

Phe Asp Val Val Ser Asn Pro Glu Phe Leu Arg Glu Gly Ser Ala Ile

145 150 155 160

cat gac acg atg aat atg gag cgt gcc gtg att ggt tca aca agt cat 528

His Asp Thr Met Asn Met Glu Arg Ala Val Ile Gly Ser Thr Ser His

165 170 175

aaa gcc gct gcc atc att gag gaa ctt cat cag cca ttc cat gct cct 576

Lys Ala Ala Ala Ile Ile Glu Glu Leu His Gln Pro Phe His Ala Pro

180 185 190

gtc att aaa aca aac cta gaa agt gca gaa atg att aaa tac gcc gcg 624

Val Ile Lys Thr Asn Leu Glu Ser Ala Glu Met Ile Lys Tyr Ala Ala

195 200 205

aat gca ttt ctg gcg aca aag att tcc ttt atc aac gat atc gca aac 672

Asn Ala Phe Leu Ala Thr Lys Ile Ser Phe Ile Asn Asp Ile Ala Asn

210 215 220

att tgt gag cga gtc ggc gca gac gtt tca aaa gtt gct gat ggt gtt 720

Ile Cys Glu Arg Val Gly Ala Asp Val Ser Lys Val Ala Asp Gly Val

225 230 235 240

ggt ctt gac agc cgt atc ggc aga aag ttc ctt aaa gct ggt att gga 768

Gly Leu Asp Ser Arg Ile Gly Arg Lys Phe Leu Lys Ala Gly Ile Gly

245 250 255

ttc ggc ggt tca tgt ttt cca aag gat aca acc gcg ctg ctt caa atc 816

Phe Gly Gly Ser Cys Phe Pro Lys Asp Thr Thr Ala Leu Leu Gln Ile

260 265 270

gca aaa tcg gca ggc tat cca ttc aag ctc atc gaa gct gtc att gaa 864

Ala Lys Ser Ala Gly Tyr Pro Phe Lys Leu Ile Glu Ala Val Ile Glu

275 280 285

acg aac gaa aag cag cgt gtt cat att gta gat aaa ctt ttg act gtt 912

Thr Asn Glu Lys Gln Arg Val His Ile Val Asp Lys Leu Leu Thr Val

290 295 300

atg gga agc gtc aaa ggg aga acc att tca gtc ctg gga tta gcc ttc 960

Met Gly Ser Val Lys Gly Arg Thr Ile Ser Val Leu Gly Leu Ala Phe

305 310 315 320

aaa ccg aat acg aac gat gtg aga tcc gct cca gcg ctt gat att atc 1008

Lys Pro Asn Thr Asn Asp Val Arg Ser Ala Pro Ala Leu Asp Ile Ile

325 330 335

cca atg ctg cag cag ctg ggc gcc cat gta aaa gca tac gat ccg att 1056

Pro Met Leu Gln Gln Leu Gly Ala His Val Lys Ala Tyr Asp Pro Ile

340 345 350

gct att cct gaa gct tca gcg atc ctt ggc gaa cag gtc gag tat tac 1104

Ala Ile Pro Glu Ala Ser Ala Ile Leu Gly Glu Gln Val Glu Tyr Tyr

355 360 365

aca gat gtg tat gct gcg atg gaa gac act gat gca tgc ctg att tta 1152

Thr Asp Val Tyr Ala Ala Met Glu Asp Thr Asp Ala Cys Leu Ile Leu

370 375 380

acg gat tgg ccg gaa gtg aaa gaa atg gag ctt gta aaa gtg aaa acc 1200

Thr Asp Trp Pro Glu Val Lys Glu Met Glu Leu Val Lys Val Lys Thr

385 390 395 400

ctc tta aaa cag cca gtc atc att gac ggc aga aat tta ttt tca ctt 1248

Leu Leu Lys Gln Pro Val Ile Ile Asp Gly Arg Asn Leu Phe Ser Leu

405 410 415

gaa gag atg cag gca gcc gga tac att tat cac tct atc ggc cgt ccc 1296

Glu Glu Met Gln Ala Ala Gly Tyr Ile Tyr His Ser Ile Gly Arg Pro

420 425 430

gct gtt cgg gga acg gaa ccc tct gac aag tat ttt ccg ggc ttg ccg 1344

Ala Val Arg Gly Thr Glu Pro Ser Asp Lys Tyr Phe Pro Gly Leu Pro

435 440 445

ctt gaa gaa ttg gct aaa gac ttg gga agc gtc aat tta 1383

Leu Glu Glu Leu Ala Lys Asp Leu Gly Ser Val Asn Leu

450 455 460

<210> 12

<211> 461

<212> PRT

<213> 枯草芽孢杆菌(枯草芽孢杆菌(Bacillus subtilis))

<400> 12

Val Lys Lys Ile Ala Val Ile Gly Thr Gly Tyr Val Gly Leu Val Ser

1 5 10 15

Gly Thr Cys Phe Ala Glu Ile Gly Asn Lys Val Val Cys Cys Asp Ile

20 25 30

Asp Glu Ser Lys Ile Arg Ser Leu Lys Asn Gly Val Ile Pro Ile Tyr

35 40 45

Glu Pro Gly Leu Ala Asp Leu Val Glu Lys Asn Val Leu Asp Gln Arg

50 55 60

Leu Thr Phe Thr Asn Asp Ile Pro Ser Ala Ile Arg Ala Ser Asp Ile

65 70 75 80

Ile Tyr Ile Ala Val Gly Thr Pro Met Ser Lys Thr Gly Glu Ala Asp

85 90 95

Leu Thr Tyr Val Lys Ala Ala Ala Lys Thr Ile Gly Glu His Leu Asn

100 105 110

Gly Tyr Lys Val Ile Val Asn Lys Ser Thr Val Pro Val Gly Thr Gly

115 120 125

Lys Leu Val Gln Ser Ile Val Gln Lys Ala Ser Lys Gly Arg Tyr Ser

130 135 140

Phe Asp Val Val Ser Asn Pro Glu Phe Leu Arg Glu Gly Ser Ala Ile

145 150 155 160

His Asp Thr Met Asn Met Glu Arg Ala Val Ile Gly Ser Thr Ser His

165 170 175

Lys Ala Ala Ala Ile Ile Glu Glu Leu His Gln Pro Phe His Ala Pro

180 185 190

Val Ile Lys Thr Asn Leu Glu Ser Ala Glu Met Ile Lys Tyr Ala Ala

195 200 205

Asn Ala Phe Leu Ala Thr Lys Ile Ser Phe Ile Asn Asp Ile Ala Asn

210 215 220

Ile Cys Glu Arg Val Gly Ala Asp Val Ser Lys Val Ala Asp Gly Val

225 230 235 240

Gly Leu Asp Ser Arg Ile Gly Arg Lys Phe Leu Lys Ala Gly Ile Gly

245 250 255

Phe Gly Gly Ser Cys Phe Pro Lys Asp Thr Thr Ala Leu Leu Gln Ile

260 265 270

Ala Lys Ser Ala Gly Tyr Pro Phe Lys Leu Ile Glu Ala Val Ile Glu

275 280 285

Thr Asn Glu Lys Gln Arg Val His Ile Val Asp Lys Leu Leu Thr Val

290 295 300

Met Gly Ser Val Lys Gly Arg Thr Ile Ser Val Leu Gly Leu Ala Phe

305 310 315 320

Lys Pro Asn Thr Asn Asp Val Arg Ser Ala Pro Ala Leu Asp Ile Ile

325 330 335

Pro Met Leu Gln Gln Leu Gly Ala His Val Lys Ala Tyr Asp Pro Ile

340 345 350

Ala Ile Pro Glu Ala Ser Ala Ile Leu Gly Glu Gln Val Glu Tyr Tyr

355 360 365

Thr Asp Val Tyr Ala Ala Met Glu Asp Thr Asp Ala Cys Leu Ile Leu

370 375 380

Thr Asp Trp Pro Glu Val Lys Glu Met Glu Leu Val Lys Val Lys Thr

385 390 395 400

Leu Leu Lys Gln Pro Val Ile Ile Asp Gly Arg Asn Leu Phe Ser Leu

405 4l0 4l5

Glu Glu Met Gln Ala Ala Gly Tyr Ile Tyr His Ser Ile Gly Arg Pro

420 425 430

Ala Val Arg Gly Thr Glu Pro Ser Asp Lys Tyr Phe Pro Gly Leu Pro

435 440 445

Leu Glu Glu Leu Ala Lys Asp Leu Gly Ser Val Asn Leu

450 455 460

<210> 13

<211> 26

<212> DNA

<213> 枯草芽孢杆菌(枯草芽孢杆菌(Bacillus subtilis))

<400> 13

ggtaccgaca ctgcgaccat tataaa 26

<210> 14

<211> 49

<212> DNA

<213> 枯草芽孢杆菌(枯草芽孢杆菌(Bacillus subtilis))

<400> 14

gttaacgaat tccagctatg tatctagaca gcttcaacca agtaacact 49

<210> 15

<211> 20

<212> DNA

<213> 枯草芽孢杆菌(枯草芽孢杆菌(Bacillus subtilis))

<400> 15

agcatcttaa cggctacaaa 20

<210> 16

<211> 20

<212> DNA

<213> 枯草芽孢杆菌(枯草芽孢杆菌(Bacillus subtilis))

<400> 16

tgtgagcgag tcggcgcaga 20

<210> 17

<211> 20

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 17

gggcgcccat gtaaaagcat 20

<210> 18

<211> 20

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 18

tttgtagccg ttaagatgct 20

<210> 19

<211> 20

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 19

tctgcgccga ctcgctcaca 20

<210> 20

<211> 20

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 20

atgcttttac atgggcgccc 20

<210> 21

<211> 876

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<220>

<221> CDS

<222> (1)..(876)

<223>

<400> 21

atg aaa aaa gta cgt aaa gcc ata att cca gca gca ggc tta gga aca 48

Met Lys Lys Val Arg Lys Ala Ile Ile Pro Ala Ala Gly Leu Gly Thr

1 5 10 15

cgt ttt ctt ccg gct acg aaa gca atg ccg aaa gaa atg ctt cct atc 96

Arg Phe Leu Pro Ala Thr Lys Ala Met Pro Lys Glu Met Leu Pro Ile

20 25 30

gtt gat aaa cct acc att caa tac ata att gaa gaa gct gtt gaa gcc 144

Val Asp Lys Pro Thr Ile Gln Tyr Ile Ile Glu Glu Ala Val Glu Ala

35 40 45

ggt att gaa gat att att atc gta aca gga aaa agc aag cgt gcg att 192

Gly Ile Glu Asp Ile Ile Ile Val Thr Gly Lys Ser Lys Arg Ala Ile

50 55 60

gag gat cat ttt gat tac tct cct gag ctt gaa aga aac cta gaa gaa 240

Glu Asp His Phe Asp Tyr Ser Pro Glu Leu Glu Arg Asn Leu Glu Glu

65 70 75 80

aaa gga aaa act gag ctg ctt gaa aaa gtg aaa aag gct tct aac ctg 288

Lys Gly Lys Thr Glu Leu Leu Glu Lys Val Lys Lys Ala Ser Asn Leu

85 90 95

gct gac att cac tat atc cgc caa aaa gaa cct aaa ggt ctc gga cat 336

Ala Asp Ile His Tyr Ile Arg Gln Lys Glu Pro Lys Gly Leu Gly His

100 105 110

gct gtc tgg tgc gca cgc aac ttt atc ggc gat gag ccg ttt gcg gta 384

Ala Val Trp Cys Ala Arg Asn Phe Ile Gly Asp Glu Pro Phe Ala Val

115 120 125

ctg ctt ggt gac gat att gtt cag gct gaa act cca ggg ttg cgc caa 432

Leu Leu Gly Asp Asp Ile Val Gln Ala Glu Thr Pro Gly Leu Arg Gln

130 135 140

tta atg gat gaa tat gaa aaa aca ctt tct tct att atc ggt gtt cag 480

Leu Met Asp Glu Tyr Glu Lys Thr Leu Ser Ser Ile Ile Gly Val Gln

145 150 155 160

cag gtg ccc gaa gaa gaa aca cac cgc tac ggc att att gac ccg ctg 528

Gln Val Pro Glu Glu Glu Thr His Arg Tyr Gly Ile Ile Asp Pro Leu

165 170 175

aca agt gaa ggc cgc cgt tat cag gtg aaa aac ttc gtt gaa aaa ccg 576

Thr Ser Glu Gly Arg Arg Tyr Gln Val Lys Asn Phe Val Glu Lys Pro

180 185 190

cct aaa ggc aca gca cct tct aat ctt gcc atc tta ggc cgt tac gta 624

Pro Lys Gly Thr Ala Pro Ser Asn Leu Ala Ile Leu Gly Arg Tyr Val

195 200 205

ttc acg cct gag atc ttc atg tat tta gaa gag cag cag gtt ggc gcc 672

Phe Thr Pro Glu Ile Phe Met Tyr Leu Glu Glu Gln Gln Val Gly Ala

210 215 220

ggc gga gaa att cag ctc aca gac gcc att caa aag ctg aat gaa att 720

Gly Gly Glu Ile Gln Leu Thr Asp Ala Ile Gln Lys Leu Asn Glu Ile

225 230 235 240

caa aga gtg ttt gct tac gat ttt gaa ggc aag cgt tat gat gtt ggt 768

Gln Arg Val Phe Ala Tyr Asp Phe Glu Gly Lys Arg Tyr Asp Val Gly

245 250 255

gaa aag ctc ggc ttt atc aca aca act ctt gaa ttt gcg atg cag gat 816

Glu Lys Leu Gly Phe Ile Thr Thr Thr Leu Glu Phe Ala Met Gln Asp

260 265 270

aaa gag ctt cgc gat cag ctc gtt cca ttt atg gaa ggt tta cta aac 864

Lys Glu Leu Arg Asp Gln Leu Val Pro Phe Met Glu Gly Leu Leu Asn

275 280 285

aaa gaa gaa atc 876

Lys Glu Glu Ile

290

<210> 22

<211> 292

<212> PRT

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 22

Met Lys Lys Val Arg Lys Ala Ile Ile Pro Ala Ala Gly Leu Gly Thr

1 5 10 15

Arg Phe Leu Pro Ala Thr Lys Ala Met Pro Lys Glu Met Leu Pro Ile

20 25 30

Val Asp Lys Pro Thr Ile Gln Tyr Ile Ile Glu Glu Ala Val Glu Ala

35 40 45

Gly Ile Glu Asp Ile Ile Ile Val Thr Gly Lys Ser Lys Arg Ala Ile

50 55 60

Glu Asp His Phe Asp Tyr Ser Pro Glu Leu Glu Arg Asn Leu Glu Glu

65 70 75 80

Lys Gly Lys Thr Glu Leu Leu Glu Lys Val Lys Lys Ala Ser Asn Leu

85 90 95

Ala Asp Ile His Tyr Ile Arg Gln Lys Glu Pro Lys Gly Leu Gly His

100 105 110

Ala Val Trp Cys Ala Arg Asn Phe Ile Gly Asp Glu Pro Phe Ala Val

115 120 125

Leu Leu Gly Asp Asp Ile Val Gln Ala Glu Thr Pro Gly Leu Arg Gln

130 135 140

Leu Met Asp Glu Tyr Glu Lys Thr Leu Ser Ser Ile Ile Gly Val Gln

145 150 155 160

Gln Val Pro Glu Glu Glu Thr His Arg Tyr Gly Ile Ile Asp Pro Leu

165 170 175

Thr Ser Glu Gly Arg Arg Tyr Gln Val Lys Asn Phe Val Glu Lys Pro

180 185 190

Pro Lys Gly Thr Ala Pro Ser Asn Leu Ala Ile Leu Gly Arg Tyr Val

195 200 205

Phe Thr Pro Glu Ile Phe Met Tyr Leu Glu Glu Gln Gln Val Gly Ala

210 215 220

Gly Gly Glu Ile Gln Leu Thr Asp Ala Ile Gln Lys Leu Asn Glu Ile

225 230 235 240

Gln Arg Val Phe Ala Tyr Asp Phe Glu Gly Lys Arg Tyr Asp Val Gly

245 250 255

Glu Lys Leu Gly Phe Ile Thr Thr Thr Leu Glu Phe Ala Met Gln Asp

260 265 270

Lys Glu Leu Arg Asp Gln Leu Val Pro Phe Met Glu Gly Leu Leu Asn

275 280 285

Lys Glu Glu Ile

290

<210> 23

<211> 27

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 23

tctagatttt tcgatcataa ggaaggt 27

<210> 24

<211> 49

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtiils)

<400> 24

gttaacgaat tccagctatg taggatccaa tgtccaatag cctttttgt 49

<210> 25

<211> 20

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 25

aaaaaggctt ctaacctggc 20

<210> 26

<211> 20

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 26

aaaccgccta aaggcacagc 20

<210> 27

<211> 20

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 27

gccaggttag aagccttttt 20

<210> 28

<211> 20

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 28

gctgtgcctt taggcggttt 20

<210> 29

<211> 1368

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<220>

<221> CDS

<222> (1)..(1368)

<223>

<400> 29

atg gat aag cgg ttt gca gtt gtt tta gcg gct gga caa gga acg aga 48

Met Asp Lys Arg Phe Ala Val Val Leu Ala Ala Gly Gln Gly Thr Arg

1 5 10 15

atg aaa tcg aag ctt tat aaa gtc ctt cat cca gtt tgc ggt aag cct 96

Met Lys Ser Lys Leu Tyr Lys Val Leu His Pro Val Cys Gly Lys Pro

20 25 30

atg gta gag cac gtc gtg gac gaa gcc tta aaa tta tct tta tca aag 144

Met Val Glu His Val Val Asp Glu Ala Leu Lys Leu Ser Leu Ser Lys

35 40 45

ctt gtc acg att gtc gga cat ggt gcg gaa gaa gtg aaa aag cag ctt 192

Leu Val Thr Ile Val Gly His Gly Ala Glu Glu Val Lys Lys Gln Leu

50 55 60

ggt gat aaa agc gag tac gcg ctt caa gca aaa cag ctt ggc act gct 240

Gly Asp Lys Ser Glu Tyr Ala Leu Gln Ala Lys Gln Leu Gly Thr Ala

65 70 75 80

cat gct gta aaa cag gca cag cca ttt ctt gct gac gaa aaa ggc gtc 288

His Ala Val Lys Gln Ala Gln Pro Phe Leu Ala Asp Glu Lys Gly Val

85 90 95

aca att gtc att tgc gga gat acg ccg ctt ttg aca gca gag acg atg 336

Thr Ile Val Ile Cys Gly Asp Thr Pro Leu Leu Thr Ala Glu Thr Met

100 105 110

gaa cag atg ctg aaa gaa cat aca caa aga gaa gcg aaa gct acg att 384

Glu Gln Met Leu Lys Glu His Thr Gln Arg Glu Ala Lys Ala Thr Ile

115 120 125

tta act gcg gtt gca gaa gat cca act gga tac ggc cgc att att cgc 432

Leu Thr Ala Val Ala Glu Asp Pro Thr Gly Tyr Gly Arg Ile Ile Arg

130 135 140

agc gaa aac gga gcg gtt caa aaa ata gtt gag cat aag gac gcc tct 480

Ser Glu Asn Gly Ala Val Gln Lys Ile Val Glu His Lys Asp Ala Ser

145 150 155 160

gaa gaa gaa cgt ctt gta act gag atc aac acc ggt acg tat tgt ttt 528

Glu Glu Glu Arg Leu Val Thr Glu Ile Asn Thr Gly Thr Tyr Cys Phe

165 170 175

gac aat gaa gcg cta ttt cgg gct att gat cag gtg tct aat gat aat 576

Asp Asn Glu Ala Leu Phe Arg Ala Ile Asp Gln Val Ser Asn Asp Asn

180 185 190

gca caa ggc gag tat tat ttg ccg gat gtc ata gag att ctt aaa aat 624

Ala Gln Gly Glu Tyr Tyr Leu Pro Asp Val Ile Glu Ile Leu Lys Asn

195 200 205

gaa ggc gaa act gtt gcc gct tac cag act ggt aat ttc caa gaa acg 672

Glu Gly Glu Thr Val Ala Ala Tyr Gln Thr Gly Asn Phe Gln Glu Thr

210 215 220

ctc gga gtt aat gat aga gtt gct ctt tct cag gca gaa caa ttt atg 720

Leu Gly Val Asn Asp Arg Val Ala Leu Ser Gln Ala Glu Gln Phe Met

225 230 235 240

aaa gag cgc att aat aaa cgg cat atg caa aat ggc gtg acg ttg att 768

Lys Glu Arg Ile Asn Lys Arg His Met Gln Asn Gly Val Thr Leu Ile

245 250 255

gac ccg atg aat acg tat att tct cct gac gct gtt atc gga agc gat 816

Asp Pro Met Asn Thr Tyr Ile Ser Pro Asp Ala Val Ile Gly Ser Asp

260 265 270

act gtg att tac cct gga act gtg att aaa ggt gag gtg caa atc gga 864

Thr Val Ile Tyr Pro Gly Thr Val Ile Lys Gly Glu Val Gln Ile Gly

275 280 285

gaa gat acg att att ggc cct cat acg gag att atg aat agt gcc att 912

Glu Asp Thr Ile Ile Gly Pro His Thr Glu Ile Met Asn Ser Ala Ile

290 295 300

ggc agc cgt acg gtt att aaa caa tcg gta gtc aat cac agt aaa gtg 960

Gly Ser Arg Thr Val Ile Lys Gln Ser Val Val Asn His Ser Lys Val

305 310 315 320

ggg aat gat gta aac ata gga cct ttt gct cac atc aga cct gat tct 1008

Gly Asn Asp Val Asn Ile Gly Pro Phe Ala His Ile Arg Pro Asp Ser

325 330 335

gtc atc ggg aat gaa gtg aag atc ggg aat ttt gta gaa att aaa aag 1056

Val Ile Gly Asn Glu Val Lys Ile Gly Asn Phe Val Glu Ile Lys Lys

340 345 350

act caa ttc gga gac cga agc aag gca tct cat cta agc tat gtc ggc 1104

Thr Gln Phe Gly Asp Arg Ser Lys Ala Ser His Leu Ser Tyr Val Gly

355 360 365

gat gct gag gta ggc act gat gta aac ctg ggc tgc ggt tca att act 1152

Asp Ala Glu Val Gly Thr Asp Val Asn Leu Gly Cys Gly Ser Ile Thr

370 375 380

gtc aat tat gat gga aag aat aag tat ttg aca aaa att gaa gat ggc 1200

Val Asn Tyr Asp Gly Lys Asn Lys Tyr Leu Thr Lys Ile Glu Asp Gly

385 390 395 400

gcg ttt atc ggc tgc aat tcc aac ttg gtt gcc cct gtc aca gtc gga 1248

Ala Phe Ile Gly Cys Asn Ser Asn Leu Val Ala Pro Val Thr Val Gly

405 410 415

gaa ggc gct tat gtg gcg gca ggt tca act gtt acg gaa gat gta cct 1296

Glu Gly Ala Tyr Val Ala Ala Gly Ser Thr Val Thr Glu Asp Val Pro

420 425 430

gga aaa gca ctt gct att gcc aga gcg aga caa gta aat aaa gac gat 1344

Gly Lys Ala Leu Ala Ile Ala Arg Ala Arg Gln Val Asn Lys Asp Asp

435 440 445

tat gtg aaa aat att cat aaa aaa 1368

Tyr Val Lys Asn Ile His Lys Lys

450 455

<210> 30

<211> 456

<212> PRT

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 30

Met Asp Lys Arg Phe Ala Val Val Leu Ala Ala Gly Gln Gly Thr Arg

1 5 10 15

Met Lys Ser Lys Leu Tyr Lys Val Leu His Pro Val Cys Gly Lys Pro

20 25 30

Met Val Glu His Val Val Asp Glu Ala Leu Lys Leu Ser Leu Ser Lys

35 40 45

Leu Val Thr Ile Val Gly His Gly Ala Glu Glu Val Lys Lys Gln Leu

50 55 60

Gly Asp Lys Ser Glu Tyr Ala Leu Gln Ala Lys Gln Leu Gly Thr Ala

65 70 75 80

His Ala Val Lys Gln Ala Gln Pro Phe Leu Ala Asp Glu Lys Gly Val

85 90 95

Thr Ile Val Ile Cys Gly Asp Thr Pro Leu Leu Thr Ala Glu Thr Met

100 105 11 0

Glu Gln Met Leu Lys Glu His Thr Gln Arg Glu Ala Lys Ala Thr Ile

115 120 125

Leu Thr Ala Val Ala Glu Asp Pro Thr Gly Tyr Gly Arg Ile Ile Arg

130 135 140

Ser Glu Asn Gly Ala Val Gln Lys Ile Val Glu His Lys Asp Ala Ser

145 150 155 160

Glu Glu Glu Arg Leu Val Thr Glu Ile Asn Thr Gly Thr Tyr Cys Phe

165 170 175

Asp Asn Glu Ala Leu Phe Arg Ala Ile Asp Gln Val Ser Asn Asp Asn

180 185 190

Ala Gln Gly Glu Tyr Tyr Leu Pro Asp Val Ile Glu Ile Leu Lys Asn

195 200 205

Glu Gly Glu Thr Val Ala Ala Tyr Gln Thr Gly Asn Phe Gln Glu Thr

210 215 220

Leu Gly Val Asn Asp Arg Val Ala Leu Ser Gln Ala Glu Gln Phe Met

225 230 235 240

Lys Glu Arg Ile Asn Lys Arg His Met Gln Asn Gly Val Thr Leu Ile

245 250 255

Asp Pro Met Asn Thr Tyr Ile Ser Pro Asp Ala Val Ile Gly Ser Asp

260 265 270

Thr Val Ile Tyr Pro Gly Thr Val Ile Lys Gly Glu Val Gln Ile Gly

275 280 285

Glu Asp Thr Ile Ile Gly Pro His Thr Glu Ile Met Asn Ser Ala Ile

290 295 300

Gly Ser Arg Thr Val Ile Lys Gln Ser Val Val Asn His Ser Lys Val

305 310 315 320

Gly Asn Asp Val Asn Ile Gly Pro Phe Ala His Ile Arg Pro Asp Ser

325 330 335

Val Ile Gly Asn Glu Val Lys Ile Gly Asn Phe Val Glu Ile Lys Lys

340 345 350

Thr Gln Phe Gly Asp Arg Ser Lys Ala Ser His Leu Ser Tyr Val Gly

355 360 365

Asp Ala Glu Val Gly Thr Asp Val Asn Leu Gly Cys Gly Ser Ile Thr

370 375 380

Val Asn Tyr Asp Gly Lys Asn Lys Tyr Leu Thr Lys Ile Glu Asp Gly

385 390 395 400

Ala Phe Ile Gly Cys Asn Ser Asn Leu Val Ala Pro Val Thr Val Gly

405 410 415

Glu Gly Ala Tyr Val Ala Ala Gly Ser Thr Val Thr Glu Asp Val Pro

420 425 430

Gly Lys Ala Leu Ala Ile Ala Arg Ala Arg Gln Val Asn Lys Asp Asp

435 440 445

Tyr Val Lys Asn Ile His Lys Lys

450 455

<210> 31

<211> 26

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 31

ggatcctttc tatggataaa agggat 26

<210> 32

<211> 31

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 32

gttaacagga ttatttttta tgaatatttt t 31

<210> 33

<211> 20

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 33

cagagacgat ggaacagatg 20

<210> 34

<211> 20

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 34

ggagttaatg atagagttgc 20

<210> 35

<211> 20

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 35

gaagatcggg aattttgtag 20

<210> 36

<211> 20

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 36

catctgttcc atcgtctctg 20

<210> 37

<211> 20

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 37

gcaactctat cattaactcc 20

<210> 38

<211> 20

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 38

ctacaaaatt cccgatcttc 20

<210> 39

<211> 54

<212> DNA

<213> 似马链球菌(Streptococcus equisimilis)

<400> 39

gtgtcggaac attcattaca tgcttaagca cccgctgtcc ttcttgttat ctcc 54

<210> 40

<211> 1203

<212> DNA

<213> 似马链球菌(Streptococcus equisimilis)

<220>

<221> CDS

<222> (1)..(1203)

<223>

<400> 40

gtg aaa att tct gta gca ggc tca gga tat gtc ggc cta tcc ttg agt 48

Val Lys Ile Ser Val Ala Gly Ser Gly Tyr Val Gly Leu Ser Leu Ser

1 5 10 15

att tta ctg gca caa cat aat gac gtc act gtt gtt gat att att gat 96

Ile Leu Leu Ala Gln His Asn Asp Val Thr Val Val Asp Ile Ile Asp

20 25 30

gaa aag gtg aga ttg atc aat caa ggc ata tct cca atc aag gat gct 144

Glu Lys Val Arg Leu Ile Asn Gln Gly Ile Ser Pro Ile Lys Asp Ala

35 40 45

gat att gag gag tat tta aaa aat gcg ccg cta aat ctc aca gcg acc 192

Asp Ile Glu Glu Tyr Leu Lys Asn Ala Pro Leu Asn Leu Thr Ala Thr

50 55 60

ctt gat ggc gca agc gct tat agc aat gca gac ctt att atc att gct 240

Leu Asp Gly Ala Ser Ala Tyr Ser Asn Ala Asp Leu Ile Ile Ile Ala

65 70 75 80

act ccg aca aat tat gac agc gaa cgc aac tac ttt gac aca agg cat 288

Thr Pro Thr Asn Tyr Asp Ser Glu Arg Asn Tyr Phe Asp Thr Arg His

85 90 95

gtt gaa gag gtc att gag cag gtc cta gac cta aat gcg tca gca acc 336

Val Glu Glu Val Ile Glu Gln Val Leu Asp Leu Asn Ala Ser Ala Thr

100 105 110

att att atc aaa tca acc ata cca cta ggc ttt atc aag cat gtt agg 384

Ile Ile Ile Lys Ser Thr Ile Pro Leu Gly Phe Ile Lys His Val Arg

115 120 125

gaa aaa tac cag aca gat cgt att att ttt agc cca gaa ttt tta aga 432

Glu Lys Tyr Gln Thr Asp Arg Ile Ile Phe Ser Pro Glu Phe Leu Arg

130 135 140

gaa tca aaa gcc tta tac gat aac ctt tac cca agt cgg atc att gtt 480

Glu Ser Lys Ala Leu Tyr Asp Asn Leu Tyr Pro Ser Arg Ile Ile Val

145 150 155 160

tct tat gaa aag gac gac tca cca agg gtt att cag gct gct aaa gcc 528

Ser Tyr Glu Lys Asp Asp Ser Pro Arg Val Ile Gln Ala Ala Lys Ala

165 170 175

ttt gct ggt ctt tta aag gaa gga gcc aaa agc aag gat act ccg gtc 576

Phe Ala Gly Leu Leu Lys Glu Gly Ala Lys Ser Lys Asp Thr Pro Val

180 185 190

tta ttt atg ggc tca cag gag gct gag gcg gtc aag cta ttt gcg aat 624

Leu Phe Met Gly Ser Gln Glu Ala Glu Ala Val Lys Leu Phe Ala Asn

195 200 205

acc ttt ttg gct atg cgg gtg tct tac ttt aat gaa tta gac acc tat 672

Thr Phe Leu Ala Met Arg Val Ser Tyr Phe Asn Glu Leu Asp Thr Tyr

210 215 220

tcc gaa agc aag ggt cta gat gct cag cgc gtg att gaa gga gtc tgt 720

Ser Glu Ser Lys Gly Leu Asp Ala Gln Arg Val Ile Glu Gly Val Cys

225 230 235 240

cat gat cag cgc att ggt aac cat tac aat aac cct tcc ttt gga tat 768

His Asp Gln Arg Ile Gly Asn His Tyr Asn Asn Pro Ser Phe Gly Tyr

245 250 255

ggc ggc tat tgc ctg cca aag gac agc aaa cag ctg ttg gca aat tat 816

Gly Gly Tyr Cys Leu Pro Lys Asp Ser Lys Gln Leu Leu Ala Asn Tyr

260 265 270

aga ggc att ccc cag tcc ttg atg tca gcg att gtt gag tcc aac aag 864

Arg Gly Ile Pro Gln Ser Leu Met Ser Ala Ile Val Glu Ser Asn Lys

275 280 285

ata cga aaa tcc tat tta gct gaa caa ata tta gac aga gcc tct agt 912

Ile Arg Lys Ser Tyr Leu Ala Glu Gln Ile Leu Asp Arg Ala Ser Ser

290 295 300

caa aag cag gct ggt gta cca tta acg att ggc ttt tac cgc ttg att 960

Gln Lys Gln Ala Gly Val Pro Leu Thr Ile Gly Phe Tyr Arg Leu Ile

305 310 315 320

atg aaa agc aac tct gat aat ttc cga gaa agc gcc att aaa gat att 1008

Met Lys Ser Asn Ser Asp Asn Phe Arg Glu Ser Ala Ile Lys Asp Ile

325 330 335

att gat atc atc aac gac tat ggg gtt aat att gtc att tac gaa ccc 1056

Ile Asp Ile Ile Asn Asp Tyr Gly Val Asn Ile Val Ile Tyr Glu Pro

340 345 350

atg ctt ggc gag gat att ggc tac agg gtt gtc aag gac tta gag cag 1104

Met Leu Gly Glu Asp Ile Gly Tyr Arg Val Val Lys Asp Leu Glu Gln

355 360 365

ttc aaa aac gag tct aca atc att gtg tca aat cgc ttt gag gac gac 1152

Phe Lys Asn Glu Ser Thr Ile Ile Val Ser Asn Arg Phe Glu Asp Asp

370 375 380

cta gga gat gtc att gat aag gtt tat acg aga gat gtc ttt gga aga 1200

Leu Gly Asp Val Ile Asp Lys Val Tyr Thr Arg Asp Val Phe Gly Arg

385 390 395 400

gac 1203

Asp

<210> 41

<211> 401

<212> PRT

<213> 似马链球菌(Streptococcus equisimilis)

<400> 41

Val Lys Ile Ser Val Ala Gly Ser Gly Tyr Val Gly Leu Ser Leu Ser

1 5 10 15

Ile Leu Leu Ala Gln His Asn Asp Val Thr Val Val Asp Ile Ile Asp

20 25 30

Glu Lys Val Arg Leu Ile Asn Gln Gly Ile Ser Pro Ile Lys Asp Ala

35 40 45

Asp Ile Glu Glu Tyr Leu Lys Asn Ala Pro Leu Asn Leu Thr Ala Thr

50 55 60

Leu Asp Gly Ala Ser Ala Tyr Ser Asn Ala Asp Leu Ile Ile Ile Ala

65 70 75 80

Thr Pro Thr Asn Tyr Asp Ser Glu Arg Asn Tyr Phe Asp Thr Arg His

85 90 95

Val Glu Glu Val Ile Glu Gln Val Leu Asp Leu Asn Ala Ser Ala Thr

100 105 110

Ile Ile Ile Lys Ser Thr Ile Pro Leu Gly Phe Ile Lys His Val Arg

115 120 125

Glu Lys Tyr Gln Thr Asp Arg Ile Ile Phe Ser Pro Glu Phe Leu Arg

130 135 140

Glu Ser Lys Ala Leu Tyr Asp Asn Leu Tyr Pro Ser Arg Ile Ile Val

145 150 155 160

Ser Tyr Glu Lys Asp Asp Ser Pro Arg Val Ile Gln Ala Ala Lys Ala

165 170 175

Phe Ala Gly Leu Leu Lys Glu Gly Ala Lys Ser Lys Asp Thr Pro Val

180 185 190

Leu Phe Met Gly Ser Gln Glu Ala Glu Ala Val Lys Leu Phe Ala Asn

195 200 205

Thr Phe Leu Ala Met Arg Val Ser Tyr Phe Asn Glu Leu Asp Thr Tyr

210 215 220

Ser Glu Ser Lys Gly Leu Asp Ala Gln Arg Val Ile Glu Gly Val Cys

225 230 235 240

His Asp Gln Arg Ile Gly Asn His Tyr Asn Asn Pro Ser Phe Gly Tyr

245 250 255

Gly Gly Tyr Cys Leu Pro Lys Asp Ser Lys Gln Leu Leu Ala Asn Tyr

260 265 270

Arg Gly Ile Pro Gln Ser Leu Met Ser Ala Ile Val Glu Ser Asn Lys

275 280 285

Ile Arg Lys Ser Tyr Leu Ala Glu Gln Ile Leu Asp Arg Ala Ser Ser

290 295 300

Gln Lys Gln Ala Gly Val Pro Leu Thr Ile Gly Phe Tyr Arg Leu Ile

305 310 315 320

Met Lys Ser Asn Ser Asp Asn Phe Arg Glu Ser Ala Ile Lys Asp Ile

325 330 335

Ile Asp Ile Ile Asn Asp Tyr Gly Val Asn Ile Val Ile Tyr Glu Pro

340 345 350

Met Leu Gly Glu Asp Ile Gly Tyr Arg Val Val Lys Asp Leu Glu Gln

355 360 365

Phe Lys Asn Glu Ser Thr Ile Ile Val Ser Asn Arg Phe Glu Asp Asp

370 375 380

Leu Gly Asp Val Ile Asp Lys Val Tyr Thr Arg Asp Val Phe Gly Arg

385 390 395 400

Asp

<210> 42

<211> 900

<212> DNA

<213> 似马链球菌(Streptococcus equisimilis)

<220>

<221> CDS

<222> (1)..(900)

<223>

<400> 42

atg aca aag gtc aga aaa gcc att atc cca gcc gcc ggc cta ggc act 48

Met Thr Lys Val Arg Lys Ala Ile Ile Pro Ala Ala Gly Leu Gly Thr

1 5 10 15

cgc ttc cta ccc gcc acc aag gca ctg gcc aag gaa atg ctc cca atc 96

Arg Phe Leu Pro Ala Thr Lys Ala Leu Ala Lys Glu Met Leu Pro Ile

20 25 30

gtc gat aag cca acc att caa ttc atc gtc gag gaa gct cta aag gcc 144

Val Asp Lys Pro Thr Ile Gln Phe Ile Val Glu Glu Ala Leu Lys Ala

35 40 45

ggt atc gag gag att ctt gtc gtc acc ggc aag gcc aaa cgc tct att 192

Gly Ile Glu Glu Ile Leu Val Val Thr Gly Lys Ala Lys Arg Ser Ile

50 55 60

gaa gac cac ttt gac tcc aac ttc gag ctc gaa tac aat ctc caa gcc 240

Glu Asp His Phe Asp Ser Asn Phe Glu Leu Glu Tyr Asn Leu Gln Ala

65 70 75 80

aag ggc aaa acc gag ctg ctc aag ctc gtt gat gag acc act gcc atc 288

Lys Gly Lys Thr Glu Leu Leu Lys Leu Val Asp Glu Thr Thr Ala Ile

85 90 95

aac ctg cac ttc att cgt cag agc cac cct aga gga cta ggg gac gct 336

Asn Leu His Phe Ile Arg Gln Ser His Pro Arg Gly Leu Gly Asp Ala

100 105 110

gtc ctc cag gcc aag gcc ttt gtg ggc aat gag ccc ttt gtg gtc atg 384

Val Leu Gln Ala Lys Ala Phe Val Gly Ash Glu Pro Phe Val Val Met

115 120 125

ctg ggg gat gac ctc atg gat att acc aat cct agt gcc aag ccc ttg 432

Leu Gly Asp Asp Leu Met Asp Ile Thr Asn Pro Ser Ala Lys Pro Leu

130 135 140

gcc aag cag ctc att gag gat tat gat tgc aca cac gcc tca acg att 480

Ala Lys Gln Leu Ile Glu Asp Tyr Asp Cys Thr His Ala Ser Thr Ile

145 150 155 160

gca gtg atg agg gtg ccg cat gag gag gtt tcc aat tat ggc gtg att 528

Ala Val Met Arg Val Pro His Glu Glu Val Ser Asn Tyr Gly Val Ile

165 170 175

gca ccg caa ggg aag gct gtt aag ggc ttg tat agt gtg gag acc ttt 576

Ala Pro Gln Gly Lys Ala Val Lys Gly Leu Tyr Ser Val Glu Thr Phe

180 185 190

gtt gag aag cca agt cca gat gag gca ccg agt gac tta gcg att att 624

Val Glu Lys Pro Ser Pro Asp Glu Ala Pro Ser Asp Leu Ala Ile Ile

195 200 205

ggt cga tat ttg ttg acg cct gag att ttt gcc ata ttg gag aat cag 672

Gly Arg Tyr Leu Leu Thr Pro Glu Ile Phe Ala Ile Leu Glu Asn Gln

210 215 220

gcg cct ggg gct ggc aat gag gta cag cta gcc gat gcg att gac aag 720

Ala Pro Gly Ala Gly Asn Glu Val Gln Leu Ala Asp Ala Ile Asp Lys

225 230 235 240

ctc aac aag act cag cgg gtt ttt gcg agg gag ttt aag gga gag cgg 768

Leu Asn Lys Thr Gln Arg Val Phe Ala Arg Glu Phe Lys Gly Glu Arg

245 250 255

tat gat gtt ggg gac aag ttt ggc ttt atg aag acc tca ctt gac tat 816

Tyr Asp Val Gly Asp Lys Phe Gly Phe Met Lys Thr Ser Leu Asp Tyr

260 265 270

gct ctc aag cac cct cag gtc aag gac gac ctc act gac tac att ata 864

Ala Leu Lys His Pro Gln Val Lys Asp Asp Leu Thr Asp Tyr Ile Ile

275 280 285

aag ctc agt aag caa ctg aac aag gac gtt aaa aaa 900

Lys Leu Ser Lys Gln Leu Asn Lys Asp Val Lys Lys

290 295 300

<210> 43

<211> 300

<212> PRT

<213> 似马链球菌(Streptococcus equisimiils)

<400> 43

Met Thr Lys Val Arg Lys Ala Ile Ile Pro Ala Ala Gly Leu Gly Thr

1 5 10 15

Arg Phe Leu Pro Ala Thr Lys Ala Leu Ala Lys Glu Met Leu Pro Ile

20 25 30

Val Asp Lys Pro Thr Ile Gln Phe Ile Val Glu Glu Ala Leu Lys Ala

35 40 45

Gly Ile Glu Glu Ile Leu Val Val Thr Gly Lys Ala Lys Arg Ser Ile

50 55 60

Glu Asp His Phe Asp Ser Asn Phe Glu Leu Glu Tyr Asn Leu Gln Ala

65 70 75 80

Lys Gly Lys Thr Glu Leu Leu Lys Leu Val Asp Glu Thr Thr Ala Ile

85 90 95

Asn Leu His Phe Ile Arg Gln Ser His Pro Arg Gly Leu Gly Asp Ala

100 105 110

Val Leu Gln Ala Lys Ala Phe Val Gly Asn Glu Pro Phe Val Val Met

115 120 125

Leu Gly Asp Asp Leu Met Asp Ile Thr Asn Pro Ser Ala Lys Pro Leu

130 135 140

Ala Lys Gln Leu Ile Glu Asp Tyr Asp Cys Thr His Ala Ser Thr Ile

145 150 155 160

Ala Val Met Arg Val Pro His Glu Glu Val Ser Asn Tyr Gly Val Ile

165 170 175

Ala Pro Gln Gly Lys Ala Val Lys Gly Leu Tyr Ser Val Glu Thr Phe

180 185 190

Val Glu Lys Pro Ser Pro Asp Glu Ala Pro Ser Asp Leu Ala Ile Ile

195 200 205

Gly Arg Tyr Leu Leu Thr Pro Glu Ile Phe Ala Ile Leu Glu Asn Gln

210 215 220

Ala Pro Gly Ala Gly Asn Glu Val Gln Leu Ala Asp Ala Ile Asp Lys

225 230 235 240

Leu Asn Lys Thr Gln Arg Val Phe Ala Arg Glu Phe Lys Gly Glu Arg

245 250 255

Tyr Asp Val Gly Asp Lys Phe Gly Phe Met Lys Thr Ser Leu Asp Tyr

260 265 270

Ala Leu Lys His Pro Gln Val Lys Asp Asp Leu Thr Asp Tyr Ile Ile

275 280 285

Lys Leu Ser Lys Gln Leu Asn Lys Asp Val Lys Lys

290 295 300

<210> 44

<211> 1380

<212> DNA

<213> 似马链球菌(Streptococcus equisimilis)

<220>

<221> CDS

<222> (1)..(1380)

<223>

<400> 44

atg aaa aac tac gcc att atc cta gca gct gga aag gga acc cgc atg 48

Met Lys Asn Tyr Ala Ile Ile Leu Ala Ala Gly Lys Gly Thr Arg Met

1 5 10 15

aat tca ggg ctt tcc aag gtg ctg cac aag gta tca ggc cta agc atg 96

Asn Ser Gly Leu Ser Lys Val Leu His Lys Val Ser Gly Leu Ser Met

20 25 30

ctg gag cat gtc ctc aag agc gtc tca gcc cta gct cct caa aag caa 144

Leu Glu His Val Leu Lys Ser Val Ser Ala Leu Ala Pro Gln Lys Gln

35 40 45

ctc aca gtg atc ggt cat cag gca gag caa gta cgt gcc gtc cta ggt 192

Leu Thr Val Ile Gly His Gln Ala Glu Gln Val Arg Ala Val Leu Gly

50 55 60

gat caa tta ctg aca gtg gtg caa gag gag cag cta gga aca ggc cat 240

Asp Gln Leu Leu Thr Val Val Gln Glu Glu Gln Leu Gly Thr Gly His

65 70 75 80

gca gtc atg atg gca gaa gag gag cta tct ggc tta gaa ggg cag acc 288

Ala Val Met Met Ala Glu Glu Glu Leu Ser Gly Leu Glu Gly Gln Thr

85 90 95

cta gtg att gca ggt gac acc ccc ttg atc aga gga gaa agc ctc aag 336

Leu Val Ile Ala Gly Asp Thr Pro Leu Ile Arg Gly Glu Ser Leu Lys

100 105 110

gct ctg cta gac tat cat atc aga gaa aag aat gtg gca acc att ctc 384

Ala Leu Leu Asp Tyr His Ile Arg Glu Lys Asn Val Ala Thr Ile Leu

115 120 125

aca gcc aat gcc aag gat ccc ttt ggc tac ggc cga atc att cgc aat 432

Thr Ala Asn Ala Lys Asp Pro Phe Gly Tyr Gly Arg Ile Ile Arg Asn

130 135 140

gca gca gga gag gtg gtc aac atc gtt gaa caa aag gac gct aat gag 480

Ala Ala Gly Glu Val Val Asn Ile Val Glu Gln Lys Asp Ala Asn Glu

145 150 155 160

gca gag caa gag gtc aag gag atc aac aca ggg acc tat atc ttt gac 528

Ala Glu Gln Glu Val Lys Glu Ile Asn Thr Gly Thr Tyr Ile Phe Asp

165 170 175

aat aag cgc ctc ttt gag gct cta aag cat ctc acg act gat aat gcc 576

Asn Lys Arg Leu Phe Glu Ala Leu Lys His Leu Thr Thr Asp Asn Ala

180 185 190

caa ggg gaa tat tac cta acc gat gtg atc agt att ttc aag gcc agc 624

Gln Gly Glu Tyr Tyr Leu Thr Asp Val Ile Ser Ile Phe Lys Ala Ser

195 200 205

caa gaa aag gtt gga gct tac ctg ctg aag gat ttt gat gaa agc cta 672

Gln Glu Lys Val Gly Ala Tyr Leu Leu Lys Asp Phe Asp Glu Ser Leu

210 215 220

ggg gtt aat gat cgc cta gct cta gcc cag gct gag gtg atc atg cag 720

Gly Val Asn Asp Arg Leu Ala Leu Ala Gln Ala Glu Val Ile Met Gln

225 230 235 240

gag cgg atc aac aag cag cac atg ctt aat ggg gtg acc ctg caa aac 768

Glu Arg Ile Asn Lys Gln His Met Leu Asn Gly Val Thr Leu Gln Asn

245 250 255

cct gca gct acc tat atc gaa agc agt gta gag att gcg ccg gac gtc 816

Pro Ala Ala Thr Tyr Ile Glu Ser Ser Val Glu Ile Ala Pro Asp Val

260 265 270

ttg att gaa gct aat gtg acc cta aag gga cag act aga att ggc agc 864

Leu Ile Glu Ala Asn Val Thr Leu Lys Gly Gln Thr Arg Ile Gly Ser

275 280 285

aga agt gtt ata acc aat ggg agc tat atc ctt gat tca agg ctt ggt 912

Arg Ser Val Ile Thr Asn Gly Ser Tyr Ile Leu Asp Ser Arg Leu Gly

290 295 300

gag ggc gta gtg gtg agc cag tca gtg att gag ggc tca gtc cta gca 960

Glu Gly Val Val Val Ser Gln Ser Val Ile Glu Gly Ser Val Leu Ala

305 310 3l5 320

gat ggt gtg aca gta ggg ccc tat gca cac att cgc ccg gac tct cag 1008

Asp Gly Val Thr Val Gly Pro Tyr Ala His Ile Arg Pro Asp Ser Gln

325 330 335

ctc gat gag tgt gtt cat att ggg aac ttt gta gag gtt aag ggg tct 1056

Leu Asp Glu Cys Val His Ile Gly Asn Phe Val Glu Val Lys Gly Ser

340 345 350

cat cta ggg gcc aat acc aag gca ggg cat ttg act tat ctg ggg aat 1104

His Leu Gly Ala Asn Thr Lys Ala Gly His Leu Thr Tyr Leu Gly Asn

355 360 365

gcc gag att ggc tca gag gtt aat att ggt gca gga agc att acg gtt 1152

Ala Glu Ile Gly Ser Glu Val Asn Ile Gly Ala Gly Ser Ile Thr Val

370 375 380

aat tat gat ggt caa cgg aaa tac cag aca gtg att ggc gat cac gct 1200

Asn Tyr Asp Gly Gln Arg Lys Tyr Gln Thr Val Ile Gly Asp His Ala

385 390 395 400

ttt att ggg agt cat tcg act ttg ata gct ccg gta gag gtt ggg gag 1248

Phe Ile Gly Ser His Ser Thr Leu Ile Ala Pro Val Glu Val Gly Glu

405 410 415

aat gct tta aca gca gca ggg tct acg ata gcc cag tcg gtg cca gca 1296

Asn Ala Leu Thr Ala Ala Gly Ser Thr Ile Ala Gln Ser Val Pro Ala

420 425 430

gac agt gtg gct ata ggg cgt agc cgt cag gtg gtg aag gaa ggc tat 1344

Asp Ser Val Ala Ile Gly Arg Ser Arg Gln Val Val Lys Glu Gly Tyr

435 440 445

gcc aag agg cta cca cat cac ccg gat cag ccc cag 1380

Ala Lys Arg Leu Pro His His Pro Asp Gln Pro Gln

450 455 460

<210> 45

<211> 460

<212> PRT

<213> 似马链球菌(Streptococcus equisimilis)

<400> 45

Met Lys Asn Tyr Ala Ile Ile Leu Ala Ala Gly Lys Gly Thr Arg Met

1 5 10 15

Asn Ser Gly Leu Ser Lys Val Leu His Lys Val Ser Gly Leu Ser Met

20 25 30

Leu Glu His Val Leu Lys Ser Val Ser Ala Leu Ala Pro Gln Lys Gln

35 40 45

Leu Thr Val Ile Gly His Gln Ala Glu Gln Val Arg Ala Val Leu Gly

50 55 60

Asp Gln Leu Leu Thr Val Val Gln Glu Glu Gln Leu Gly Thr Gly His

65 70 75 80

Ala Val Met Met Ala Glu Glu Glu Leu Ser Gly Leu Glu Gly Gln Thr

85 90 95

Leu Val Ile Ala Gly Asp Thr Pro Leu Ile Arg Gly Glu Ser Leu Lys

100 105 110

Ala Leu Leu Asp Tyr His Ile Arg Glu Lys Asn Val Ala Thr Ile Leu

115 120 125

Thr Ala Asn Ala Lys Asp Pro Phe Gly Tyr Gly Arg Ile Ile Arg Asn

130 135 140

Ala Ala Gly Glu Val Val Asn Ile Val Glu Gln Lys Asp Ala Asn Glu

145 150 155 160

Ala Glu Gln Glu Val Lys Glu Ile Asn Thr Gly Thr Tyr Ile Phe Asp

165 170 175

Asn Lys Arg Leu Phe Glu Ala Leu Lys His Leu Thr Thr Asp Asn Ala

180 185 190

Gln Gly Glu Tyr Tyr Leu Thr Asp Val Ile Ser Ile Phe Lys Ala Ser

195 200 205

Gln Glu Lys Val Gly Ala Tyr Leu Leu Lys Asp Phe Asp Glu Ser Leu

210 215 220

Gly Val Asn Asp Arg Leu Ala Leu Ala Gln Ala Glu Val Ile Met Gln

225 230 235 240

Glu Arg Ile Asn Lys Gln His Met Leu Asn Gly Val Thr Leu Gln Asn

245 250 255

Pro Ala Ala Thr Tyr Ile Glu Ser Ser Val Glu Ile Ala Pro Asp Val

260 265 270

Leu Ile Glu Ala Asn Val Thr Leu Lys Gly Gln Thr Arg Ile Gly Ser

275 280 285

Arg Ser Val Ile Thr Asn Gly Ser Tyr Ile Leu Asp Ser Arg Leu Gly

290 295 300

Glu Gly Val Val Val Ser Gln Ser Val Ile Glu Gly Ser Val Leu Ala

305 310 315 320

Asp Gly Val Thr Val Gly Pro Tyr Ala His Ile Arg Pro Asp Ser Gln

325 330 335

Leu Asp Glu Cys Val His Ile Gly Asn Phe Val Glu Val Lys Gly Ser

340 345 350

His Leu Gly Ala Asn Thr Lys Ala Gly His Leu Thr Tyr Leu Gly Asn

355 360 365

Ala Glu Ile Gly Ser Glu Val Asn Ile Gly Ala Gly Ser Ile Thr Val

370 375 380

Asn Tyr Asp Gly Gln Arg Lys Tyr Gln Thr Val Ile Gly Asp His Ala

385 390 395 400

Phe Ile Gly Ser His Ser Thr Leu Ile Ala Pro Val Glu Val Gly Glu

405 410 415

Asn Ala Leu Thr Ala Ala Gly Ser Thr Ile Ala Gln Ser Val Pro Ala

420 425 430

Asp Ser Val Ala Ile Gly Arg Ser Arg Gln Val Val Lys Glu Gly Tyr

435 440 445

Ala Lys Arg Leu Pro His His Pro Asp Gln Pro Gln

450 455 460

<210> 46

<211> 29

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 46

gcggccgcgg tacctgtgtt acacctgtt 29

<210> 47

<211> 38

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 47

gtcaagctta attctcatgt ttgacagctt atcatcgg 38

<210> 48

<211> 18

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 48

catgggagag acctttgg 18

<210> 49

<211> 17

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 49

gtcggtcttc catttgc 17

<210> 50

<211> 17

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 50

cgaccactgt atcttgg 17

<210> 51

<211> 17

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 51

gagatgccaa acagtgc 17

<210> 52

<211> 16

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 52

catgtccatc gtgacg 16

<210> 53

<211> 17

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 53

caggagcatt tgatacg 17

<210> 54

<211> 16

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 54

ccttcagatg tgatcc 16

<210> 55

<211> 17

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 55

gtgttgacgt caactgc 17

<210> 56

<211> 18

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 56

gttcagcctt tcctctcg 18

<210> 57

<211> 18

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 57

gctaccttct ttcttagg 18

<210> 58

<211> 18

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 58

cgtcaatatg atctgtgc 18

<210> 59

<211> 17

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 59

ggaaagaagg tctgtgc 17

<210> 60

<211> 17

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 60

cagctatcag ctgacag 17

<210> 61

<211> 20

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 61

gctcagctat gacatattcc 20

<210> 62

<211> 17

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 62

gatcgtcttg attaccg 17

<210> 63

<211> 16

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 63

agctttatcg gtgacg 16

<210> 64

<211> 16

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 64

tgagcacgat tgcagg 16

<210> 65

<211> 17

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 65

cattgcggag acattgc 17

<210> 66

<211> 26

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 66

tagacaattg gaagagaaaa gagata 26

<210> 67

<211> 20

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 67

ccgtcgctat tgtaaccagt 20

<210> 68

<211> 29

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 68

ggaattccaa agctgcagcg gccggcgcg 29

<210> 69

<211> 32

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 69

gaagatctcg tatacttggc ttctgcagct gc 32

<210> 70

<211> 31

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 70

gaagatctgg tcaacaagct ggaaagcact c 31

<210> 71

<211> 33

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 71

cccaagcttc gtgacgtaca gcaccgttcc ggc 33

<210> 72

<211> 50

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 72

ccttaagggc cgaatattta tacggagctc cctgaaacaa caaaaacggc 50

<210> 73

<211> 34

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 73

ggtgttctct agagcggccg cggttgcggt cagc 34

<210> 74

<211> 27

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 74

gtccttcttg gtacctggaa gcagagc 27

<210> 75

<211> 39

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 75

gtataaatat tcggccctta aggccagtac cattttccc 39

<210> 76

<211> 13

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 76

gggccggatc cgc 13

<210> 77

<211> 20

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 77

attcccggcc taggcgccgg 20

<210> 78

<211> 19

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 78

ggaaattatc gtgatcaac 19

<210> 79

<211> 21

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 79

gcacgagcac tgataaatat g 21

<210> 80

<211> 21

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 80

catatttatc agtgctcgtg c 21

<210> 81

<211> 17

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 81

tcgtagacct catatgc 17

<210> 82

<211> 17

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 82

gtcgttaaac cgtgtgc 17

<210> 83

<211> 39

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 83

ctagaggatc cccgggtacc gtgctctgcc ttttagtcc 39

<210> 84

<211> 37

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 84

gtacatcgaa ttcgtgctca ttattaatct gttcagc 37

<210> 85

<211> 20

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 85

aactattgcc gatgataagc 20

<210> 86

<211> 1260

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<220>

<221> CDS

<222> (1)..(1260)

<223>

<400> 86

atg aaa aaa gtg atg tta gct acg gct ttg ttt tta gga ttg act cca 48

Met Lys Lys Val Met Leu Ala Thr Ala Leu Phe Leu Gly Leu Thr Pro

1 5 10 15

gct ggc gcg aac gca gct gat tta ggc cac cag acg ttg gga tcc aat 96

Ala Gly Ala Asn Ala Ala Asp Leu Gly His Gln Thr Leu Gly Ser Asn

20 25 30

gat ggc tgg ggc gcg tac tcg acc ggc acg aca ggc gga tca aaa gca 144

Asp Gly Trp Gly Ala Tyr Ser Thr Gly Thr Thr Gly Gly Ser Lys Ala

35 40 45

tcc tcc tca aat gtg tat acc gtc agc aac aga aac cag ctt gtc tcg 192

Ser Ser Ser Asn Val Tyr Thr Val Ser Asn Arg Asn Gln Leu Val Ser

50 55 60

gca tta ggg aag gaa acg aac aca acg cca aaa atc att tat atc aag 240

Ala Leu Gly Lys Glu Thr Asn Thr Thr Pro Lys Ile Ile Tyr Ile Lys

65 70 75 80

gga acg att gac atg aac gtg gat gac aat ctg aag ccg ctt ggc cta 288

Gly Thr Ile Asp Met Asn Val Asp Asp Asn Leu Lys Pro Leu Gly Leu

85 90 95

aat gac tat aaa gat ccg gag tat gat ttg gac aaa tat ttg aaa gcc 336

Asn Asp Tyr Lys Asp Pro Glu Tyr Asp Leu Asp Lys Tyr Leu Lys Ala

l00 105 110

tat gat cct agc aca tgg ggc aaa aaa gag ccg tcg gga aca caa gaa 384

Tyr Asp Pro Ser Thr Trp Gly Lys Lys Glu Pro Ser Gly Thr Gln Glu

115 120 125

gaa gcg aga gca cgc tct cag aaa aac caa aaa gca cgg gtc atg gtg 432

Glu Ala Arg Ala Arg Ser Gln Lys Asn Gln Lys Ala Arg Val Met Val

130 135 140

gat atc cct gca aac acg acg atc gtc ggt tca ggg act aac gct aaa 480

Asp Ile Pro Ala Asn Thr Thr Ile Val Gly Ser Gly Thr Asn Ala Lys

145 150 155 160

gtc gtg gga gga aac ttc caa atc aag agt gat aac gtc att att cgc 528

Val Val Gly Gly Asn Phe Gln Ile Lys Ser Asp Asn Val Ile Ile Arg

165 170 175

aac att gaa ttc cag gat gcc tat gac tat ttt ccg caa tgg gat ccg 576

Asn Ile Glu Phe Gln Asp Ala Tyr Asp Tyr Phe Pro Gln Trp Asp Pro

180 185 190

act gac gga agc tca ggg aac tgg aac tca caa tac gac aac atc acg 624

Thr Asp Gly Ser Ser Gly Asn Trp Asn Ser Gln Tyr Asp Asn Ile Thr

195 200 205

ata aac ggc ggc aca cac atc tgg att gat cac tgt aca ttt aat gac 672

Ile Asn Gly Gly Thr His Ile Trp Ile Asp His Cys Thr Phe Asn Asp

210 215 220

ggt tcg cgt ccg gac agc aca tca ccg aaa tat tat gga aga aaa tat 720

Gly Ser Arg Pro Asp Ser Thr Ser Pro Lys Tyr Tyr Gly Arg Lys Tyr

225 230 235 240

cag cac cat gac ggc caa acg gat gct tcc aac ggt gct aac tat atc 768

Gln His His Asp Gly Gln Thr Asp Ala Ser Asn Gly Ala Asn Tyr Ile

245 250 255

acg atg tcc tac aac tat tat cac gat cat gat aaa agc tcc att ttc 816

Thr Met Ser Tyr Asn Tyr Tyr His Asp His Asp Lys Ser Ser Ile Phe

260 265 270

gga tca agt gac agc aaa acc tcc gat gac ggc aaa tta aaa att acg 864

Gly Ser Ser Asp Ser Lys Thr Ser Asp Asp Gly Lys Leu Lys Ile Thr

275 280 285

ctg cat cat aac cgc tat aaa aat att gtc cag cgc gcg ccg aga gtc 912

Leu His His Asn Arg Tyr Lys Asn Ile Val Gln Arg Ala Pro Arg Val

290 295 300

cgc ttc ggg caa gtg cac gta tac aac aac tat tat gaa gga agc aca 960

Arg Phe Gly Gln Val His Val Tyr Asn Asn Tyr Tyr Glu Gly Ser Thr

305 310 315 320

agc tct tca agt tat cct ttt agc tat gca tgg gga atc gga aag tca 1008

Ser Ser Ser Ser Tyr Pro Phe Ser Tyr Ala Trp Gly Ile Gly Lys Ser

325 330 335

tct aaa atc tat gcc caa aac aat gtc att gac gta ccg gga ctg tca 1056

Ser Lys Ile Tyr Ala Gln Asn Asn Val Ile Asp Val Pro Gly Leu Ser

340 345 350

gct gct aaa acg atc agc gta ttc agc ggg gga acg gct tta tat gac 1104

Ala Ala Lys Thr Ile Ser Val Phe Ser Gly Gly Thr Ala Leu Tyr Asp

355 360 365

tcc ggc acg ttg ctg aac ggc aca cag atc aac gca tcg gct gca aac 1152

Ser Gly Thr Leu Leu Asn Gly Thr Gln Ile Asn Ala Ser Ala Ala Asn

370 375 380

ggg ctg agc tct tct gtc ggc tgg acg ccg tct ctg cat gga tcg att 1200

Gly Leu Ser Ser Ser Val Gly Trp Thr Pro Ser Leu His Gly Ser Ile

385 390 395 400

gat gct tct gct aat gtg aaa tca aat gtt ata aat caa gcg ggt gcg 1248

Asp Ala Ser Ala Asn Val Lys Ser Asn Val Ile Asn Gln Ala Gly Ala

405 410 415

ggt aaa tta aat 1260

Gly Lys Leu Asn

420

<210> 87

<211> 420

<212> PRT

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 87

Met Lys Lys Val Met Leu Ala Thr Ala Leu Phe Leu Gly Leu Thr Pro

1 5 10 15

Ala Gly Ala Asn Ala Ala Asp Leu Gly His Gln Thr Leu Gly Ser Asn

20 25 30

Asp Gly Trp Gly Ala Tyr Ser Thr Gly Thr Thr Gly Gly Ser Lys Ala

35 40 45

Ser Ser Ser Asn Val Tyr Thr Val Ser Asn Arg Asn Gln Leu Val Ser

50 55 60

Ala Leu Gly Lys Glu Thr Asn Thr Thr Pro Lys Ile Ile Tyr Ile Lys

65 70 75 80

Gly Thr Ile Asp Met Asn Val Asp Asp Asn Leu Lys Pro Leu Gly Leu

85 90 95

Asn Asp Tyr Lys Asp Pro Glu Tyr Asp Leu Asp Lys Tyr Leu Lys Ala

100 105 110

Tyr Asp Pro Ser Thr Trp Gly Lys Lys Glu Pro Ser Gly Thr Gln Glu

115 120 125

Glu Ala Arg Ala Arg Ser Gln Lys Asn Gln Lys Ala Arg Val Met Val

130 135 140

Asp Ile Pro Ala Asn Thr Thr Ile Val Gly Ser Gly Thr Asn Ala Lys

145 150 155 160

Val Val Gly Gly Asn Phe Gln Ile Lys Ser Asp Asn Val Ile Ile Arg

165 170 175

Asn Ile Glu Phe Gln Asp Ala Tyr Asp Tyr Phe Pro Gln Trp Asp Pro

180 185 190

Thr Asp Gly Ser Ser Gly Asn Trp Asn Ser Gln Tyr Asp Asn Ile Thr

195 200 205

Ile Asn Gly Gly Thr His Ile Trp Ile Asp His Cys Thr Phe Asn Asp

210 215 220

Gly Ser Arg Pro Asp Ser Thr Ser Pro Lys Tyr Tyr Gly Arg Lys Tyr

225 230 235 240

Gln His His Asp Gly Gln Thr Asp Ala Ser Asn Gly Ala Asn Tyr Ile

245 250 255

Thr Met Ser Tyr Asn Tyr Tyr His Asp His Asp Lys Ser Ser Ile Phe

260 265 270

Gly Ser Ser Asp Ser Lys Thr Ser Asp Asp Gly Lys Leu Lys Ile Thr

275 280 285

Leu His His Asn Arg Tyr Lys Asn Ile Val Gln Arg Ala Pro Arg Val

290 295 300

Arg Phe Gly Gln Val His Val Tyr Asn Asn Tyr Tyr Glu Gly Ser Thr

305 310 315 320

Ser Ser Ser Ser Tyr Pro Phe Ser Tyr Ala Trp Gly Ile Gly Lys Ser

325 330 335

Ser Lys Ile Tyr Ala Gln Asn Asn Val Ile Asp Val Pro Gly Leu Ser

340 345 350

Ala Ala Lys Thr Ile Ser Val Phe Ser Gly Gly Thr Ala Leu Tyr Asp

355 360 365

Ser Gly Thr Leu Leu Asn Gly Thr Gln Ile Asn Ala Ser Ala Ala Asn

370 375 380

Gly Leu Ser Ser Ser Val Gly Trp Thr Pro Ser Leu His Gly Ser Ile

385 390 395 400

Asp Ala Ser Ala Asn Val Lys Ser Asn Val Ile Asn Gln Ala Gly Ala

405 410 415

Gly Lys Leu Asn

420

<210> 88

<211> 26

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 88

actagtaatg atggctgggg cgcgta 26

<210> 89

<211> 26

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 89

gtcgacatgt tgtcgtattg tgagtt 26

<210> 90

<211> 52

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 90

gagctctaca acgcttatgg atccgcggcc gcggcggcac acacatctgg at 52

<210> 91

<211> 26

<212> DNA

<213> 枯草芽孢杆菌(Bacillus subtilis)

<400> 91

gacgtcagcc cgtttgcagc cgatgc 26

<210> 92

<211> 1257

<212> DNA

<213> 酿脓链球菌(Streptococcus pyogenes)

<220>

<221> CDS

<222> (1)..(1257)

<223>

<400> 92

gtg cct att ttt aaa aaa act tta att gtt tta tcc ttt att ttt ttg 48

Val Pro Ile Phe Lys Lys Thr Leu Ile Val Leu Ser Phe Ile Phe Leu

1 5 10 15

ata tct atc ttg att tat cta aat atg tat cta ttt gga aca tca act 96

Ile Ser Ile Leu Ile Tyr Leu Asn Met Tyr Leu Phe Gly Thr Ser Thr

20 25 30

gta gga att tat gga gta ata tta ata acc tat cta gtt att aaa ctt 144

Val Gly Ile Tyr Gly Val Ile Leu Ile Thr Tyr Leu Val Ile Lys Leu

35 40 45

gga tta tct ttc ctt tat gag cca ttt aaa gga aag cca cat gac tat 192

Gly Leu Ser Phe Leu Tyr Glu Pro Phe Lys Gly Lys Pro His Asp Tyr

50 55 60

aaa gtt gct gct gta att cct tct tat aat gaa gat gcc gag tca tta 240

Lys Val Ala Ala Val Ile Pro Ser Tyr Asn Glu Asp Ala Glu Ser Leu

65 70 75 80

tta gaa act ctt aaa agt gtg tta gca cag acc tat ccg tta tca gaa 288

Leu Glu Thr Leu Lys Ser Val Leu Ala Gln Thr Tyr Pro Leu Ser Glu

85 90 95

att tat att gtt gat gat ggg agt tca aac aca gat gca ata caa tta 336

Ile Tyr Ile Val Asp Asp Gly Ser Ser Asn Thr Asp Ala Ile Gln Leu

100 105 110

att gaa gag tat gta aat aga gaa gtg gat att tgt cga aac gtt atc 384

Ile Glu Glu Tyr Val Asn Arg Glu Val Asp Ile Cys Arg Asn Val Ile

115 120 125

gtt cac cgt tcc ctt gtc aat aaa gga aaa cgc cat gct caa gcg tgg 432

Val His Arg Ser Leu Val Asn Lys Gly Lys Arg His Ala Gln Ala Trp

130 135 140

gca ttt gaa aga tct gac gct gac gtt ttt tta acc gta gat tca gat 480

Ala Phe Glu Arg Ser Asp Ala Asp Val Phe Leu Thr Val Asp Ser Asp

145 150 155 160

act tat atc tat cca aat gcc tta gaa gaa ctc cta aaa agc ttc aat 528

Thr Tyr Ile Tyr Pro Asn Ala Leu Glu Glu Leu Leu Lys Ser Phe Asn

165 170 175

gat gag aca gtt tat gct gca aca gga cat ttg aat gct aga aac aga 576

Asp Glu Thr Val Tyr Ala Ala Thr Gly His Leu Asn Ala Arg Asn Arg

180 185 190

caa act aat cta tta acg cga ctt aca gat atc cgt tac gat aat gcc 624

Gln Thr Asn Leu Leu Thr Arg Leu Thr Asp Ile Arg Tyr Asp Asn Ala

195 200 205

ttt ggg gtg gag cgt gct gct caa tca tta aca ggt aat att tta gtt 672

Phe Gly Val Glu Arg Ala Ala Gln Ser Leu Thr Gly Asn Ile Leu Val

210 215 220

tgc tca gga cca ttg agt att tat cga cgt gaa gtg att att cct aac 720

Cys Ser Gly Pro Leu Ser Ile Tyr Arg Arg Glu Val Ile Ile Pro Asn

225 230 235 240

tta gag cgc tat aaa aat caa aca ttc cta ggt tta cct gtt agc att 768

Leu Glu Arg Tyr Lys Asn Gln Thr Phe Leu Gly Leu Pro Val Ser Ile

245 250 255

ggg gat gat cga tgt tta aca aat tat gct att gat tta gga cgc act 816

Gly Asp Asp Arg Cys Leu Thr Asn Tyr Ala Ile Asp Leu Gly Arg Thr

260 265 270

gtc tac caa tca aca gct aga tgt gat act gat gta cct ttc caa tta 864

Val Tyr Gln Ser Thr Ala Arg Cys Asp Thr Asp Val Pro Phe Gln Leu

275 280 285

aaa agt tat tta aag caa caa aat cga tgg aat aaa tct ttt ttt aaa 912

Lys Ser Tyr Leu Lys Gln Gln Asn Arg Trp Asn Lys Ser Phe Phe Lys

290 295 300

gaa tct att att tct gtt aaa aaa att ctt tct aat ccc atc gtt gcc 960

Glu Ser Ile Ile Ser Val Lys Lys Ile Leu Ser Asn Pro Ile Val Ala

305 310 315 320

tta tgg act att ttc gaa gtc gtt atg ttt atg atg ttg att gtc gca 1008

Leu Trp Thr Ile Phe Glu Val Val Met Phe Met Met Leu Ile Val Ala

325 330 335

att ggg aat ctt ttg ttt aat caa gct att caa tta gac ctt att aaa 1056

Ile Gly Asn Leu Leu Phe Asn Gln Ala Ile Gln Leu Asp Leu Ile Lys

340 345 350

ctt ttt gcc ttt tta tcc atc atc ttt atc gtt gct tta tgt cgt aat 1104

Leu Phe Ala Phe Leu Ser Ile Ile Phe Ile Val Ala Leu Cys Arg Asn

355 360 365

gtt cat tat atg atc aaa cat cct gct agt ttt ttg tta tct cct ctg 1152

Val His Tyr Met Ile Lys His Pro Ala Ser Phe Leu Leu Ser Pro Leu

370 375 380

tat gga ata tta cac ttg ttt gtc tta cag ccc cta aaa ctt tat tct 1200

Tyr Gly Ile Leu His Leu Phe Val Leu Gln Pro Leu Lys Leu Tyr Ser

385 390 395 400

tta tgc acc att aaa aat acg gaa tgg gga aca cgt aaa aag gtc act 1248

Leu Cys Thr Ile Lys Asn Thr Glu Trp Gly Thr Arg Lys Lys Val Thr

405 410 415

att ttt aaa 1257

Ile Phe Lys

<210> 93

<211> 419

<212> PRT

<213> 酿脓链球菌(Streptococcus pyogenes)

<400> 93

Val Pro Ile Phe Lys Lys Thr Leu Ile Val Leu Ser Phe Ile Phe Leu

1 5 10 15

Ile Ser Ile Leu Ile Tyr Leu Asn Met Tyr Leu Phe Gly Thr Ser Thr

20 25 30

Val Gly Ile Tyr Gly Val Ile Leu Ile Thr Tyr Leu Val Ile Lys Leu

35 40 45

Gly Leu Ser Phe Leu Tyr Glu Pro Phe Lys Gly Lys Pro His Asp Tyr

50 55 60

Lys Val Ala Ala Val Ile Pro Ser Tyr Asn Glu Asp Ala Glu Ser Leu

65 70 75 80

Leu Glu Thr Leu Lys Ser Val Leu Ala Gln Thr Tyr Pro Leu Ser Glu

85 90 95

Ile Tyr Ile Val Asp Asp Gly Ser Ser Asn Thr Asp Ala Ile Gln Leu

100 105 110

Ile Glu Glu Tyr Val Asn Arg Glu Val Asp Ile Cys Arg Asn Val Ile

115 120 125

Val His Arg Ser Leu Val Asn Lys Gly Lys Arg His Ala Gln Ala Trp

130 135 140

Ala Phe Glu Arg Ser Asp Ala Asp Val Phe Leu Thr Val Asp Ser Asp

145 150 155 160

Thr Tyr Ile Tyr Pro Asn Ala Leu Glu Glu Leu Leu Lys Ser Phe Asn

165 170 175

Asp Glu Thr Val Tyr Ala Ala Thr Gly His Leu Asn Ala Arg Asn Arg

180 185 190

Gln Thr Asn Leu Leu Thr Arg Leu Thr Asp Ile Arg Tyr Asp Asn Ala

195 200 205

Phe Gly Val Glu Arg Ala Ala Gln Ser Leu Thr Gly Asn Ile Leu Val

210 215 220

Cys Ser Gly Pro Leu Ser Ile Tyr Arg Arg Glu Val Ile Ile Pro Asn

225 230 235 240

Leu Glu Arg Tyr Lys Asn Gln Thr Phe Leu Gly Leu Pro Val Ser Ile

245 250 255

Gly Asp Asp Arg Cys Leu Thr Asn Tyr Ala Ile Asp Leu Gly Arg Thr

260 265 270

Val Tyr Gln Ser Thr Ala Arg Cys Asp Thr Asp Val Pro Phe Gln Leu

275 280 285

Lys Ser Tyr Leu Lys Gln Gln Asn Arg Trp Asn Lys Ser Phe Phe Lys

290 295 300

Glu Ser Ile Ile Ser Val Lys Lys Ile Leu Ser Asn Pro Ile Val Ala

305 310 315 320

Leu Trp Thr Ile Phe Glu Val Val Met Phe Met Met Leu Ile Val Ala

325 330 335

Ile Gly Asn Leu Leu Phe Asn Gln Ala Ile Gln Leu Asp Leu Ile Lys

340 345 350

Leu Phe Ala Phe Leu Ser Ile Ile Phe Ile Val Ala Leu Cys Arg Asn

355 360 365

Val His Tyr Met Ile Lys His Pro Ala Ser Phe Leu Leu Ser Pro Leu

370 375 380

Tyr Gly Ile Leu His Leu Phe Val Leu Gln Pro Leu Lys Leu Tyr Ser

385 390 395 400

Leu Cys Thr Ile Lys Asn Thr Glu Trp Gly Thr Arg Lys Lys Val Thr

405 410 415

Ile Phe Lys

<210> 94

<211> 2916

<212> DNA

<213> 出血败血性巴斯德菌(Paseurella multocida)

<220>

<221> CDS

<222> (1)..(2916)

<223>

<400> 94

atg aat aca tta tca caa gca ata aaa gca tat aac agc aat gac tat 48

Met Asn Thr Leu Ser Gln Ala Ile Lys Ala Tyr Asn Ser Asn Asp Tyr

1 5 10 15

caa tta gca ctc aaa tta ttt gaa aag tcg gcg gaa atc tat gga cgg 96

Gln Leu Ala Leu Lys Leu Phe Glu Lys Ser Ala Glu Ile Tyr Gly Arg

20 25 30

asa att gtt gaa ttt caa att acc aaa tgc caa gaa aaa ctc tca gca 144

Lys Ile Val Glu Phe Gln Ile Thr Lys Cys Gln Glu Lys Leu Ser Ala

35 40 45

cat cct tct gtt aat tca gca cat ctt tct gta aat aaa gaa gaa aaa 192

His Pro Ser Val Asn Ser Ala His Leu Ser Val Asn Lys Glu Glu Lys

50 55 60

gtc aat gtt tgc gat agt ccg tta gat att gca aca caa ctg tta ctt 240

Val Asn Val Cys Asp Ser Pro Leu Asp Ile Ala Thr Gln Leu Leu Leu

65 70 75 80

tcc aac gta aaa aaa tta gta ctt tct gac tcg gaa aaa aac acg tta 288

Ser Asn Val Lys Lys Leu Val Leu Ser Asp Ser Glu Lys Asn Thr Leu

85 90 95

aaa aat aaa tgg aaa ttg ctc act gag aag aaa tct gaa aat gcg gag 336

Lys Asn Lys Trp Lys Leu Leu Thr Glu Lys Lys Ser Glu Asn Ala Glu

100 105 110

gta aga gcg gtc gcc ctt gta cca aaa gat ttt ccc aaa gat ctg gtt 384

Val Arg Ala Val Ala Leu Val Pro Lys Asp Phe Pro Lys Asp Leu Val

115 120 125

tta gcg cct tta cct gat cat gtt aat gat ttt aca tgg tac aaa aag 432

Leu Ala Pro Leu Pro Asp His Val Asn Asp Phe Thr Trp Tyr Lys Lys

130 135 140

cga aag aaa aga ctt ggc ata aaa cct gaa cat caa cat gtt ggt ctt 480

Arg Lys Lys Arg Leu Gly Ile Lys Pro Glu His Gln His Val Gly Leu

145 150 155 160

tct att atc gtt aca aca ttc aat cga cca gca att tta tcg att aca 528

Ser Ile Ile Val Thr Thr Phe Asn Arg Pro Ala Ile Leu Ser Ile Thr

165 170 175

tta gcc tgt tta gta aac caa aaa aca cat tac ccg ttt gaa gtt atc 576

Leu Ala Cys Leu Val Asn Gln Lys Thr His Tyr Pro Phe Glu Val Ile

180 185 190

gtg aca gat gat ggt agt cag gaa gat cta tca ccg atc att cgc caa 624

Val Thr Asp Asp Gly Ser Gln Glu Asp Leu Ser Pro Ile Ile Arg Gln

195 200 205

tat gaa aat aaa ttg gat att cgc tac gtc aga caa aaa gat aac ggt 672

Tyr Glu Asn Lys Leu Asp Ile Arg Tyr Val Arg Gln Lys Asp Asn Gly

210 215 220

ttt caa gcc agt gcc gct cgg aat atg gga tta cgc tta gca aaa tat 720

Phe Gln Ala Ser Ala Ala Arg Asn Met Gly Leu Arg Leu Ala Lys Tyr

225 230 235 240

gac ttt att ggc tta ctc gac tgt gat atg gcg cca aat cca tta tgg 768

Asp Phe Ile Gly Leu Leu Asp Cys Asp Met Ala Pro Asn Pro Leu Trp

245 250 255

gtt cat tct tat gtt gca gag cta tta gaa gat gat gat tta aca atc 816

Val His Ser Tyr Val Ala Glu Leu Leu Glu Asp Asp Asp Leu Thr Ile

260 265 270

att ggt cca aga aaa tac atc gat aca caa cat att gac cca aaa gac 864

Ile Gly Pro Arg Lys Tyr Ile Asp Thr Gln His Ile Asp Pro Lys Asp

275 280 285

ttc tta aat aac gcg agt ttg ctt gaa tca tta cca gaa gtg aaa acc 912

Phe Leu Asn Asn Ala Ser Leu Leu Glu Ser Leu Pro Glu Val Lys Thr

290 295 300

aat aat agt gtt gcc gca aaa ggg gaa gga aca gtt tct ctg gat tgg 960

Asn Asn Ser Val Ala Ala Lys Gly Glu Gly Thr Val Ser Leu Asp Trp

305 310 315 320

cgc tta gaa caa ttc gaa aaa aca gaa aat ctc cgc tta tcc gat tcg 1008

Arg Leu Glu Gln Phe Glu Lys Thr Glu Asn Leu Arg Leu Ser Asp Ser

325 330 335

cct ttc cgt ttt ttt gcg gcg ggt aat gtt gct ttc gct aaa aaa tgg 1056

Pro Phe Arg Phe Phe Ala Ala Gly Asn Val Ala Phe Ala Lys Lys Trp

340 345 350

cta aat aaa tcc ggt ttc ttt gat gag gaa ttt aat cac tgg ggt gga 1104

Leu Asn Lys Ser Gly Phe Phe Asp Glu Glu Phe Asn His Trp Gly Gly

355 360 365

gaa gat gtg gaa ttt gga tat cgc tta ttc cgt tac ggt agt ttc ttt 1152

Glu Asp Val Glu Phe Gly Tyr Arg Leu Phe Arg Tyr Gly Ser Phe Phe

370 375 380

aaa act att gat ggc att atg gcc tac cat caa gag cca cca ggt aaa 1200

Lys Thr Ile Asp Gly Ile Met Ala Tyr His Gln Glu Pro Pro Gly Lys

385 390 395 400

gaa aat gaa acc gat cgt gaa gcg gga aaa aat att acg ctc gat att 1248

Glu Asn Glu Thr Asp Arg Glu Ala Gly Lys Asn Ile Thr Leu Asp Ile

405 410 415

atg aga gaa aag gtc cct tat atc tat aga aaa ctt tta cca ata gaa 1296

Met Arg Glu Lys Val Pro Tyr Ile Tyr Arg Lys Leu Leu Pro Ile Glu

420 425 430

gat tcg cat atc aat aga gta cct tta gtt tca att tat atc cca gct 1344

Asp Ser His Ile Asn Arg Val Pro Leu Val Ser Ile Tyr Ile Pro Ala

435 440 445

tat aac tgt gca aac tat att caa cgt tgc gta gat agt gca ctg aat 1392

Tyr Asn Cys Ala Asn Tyr Ile Gln Arg Cys Val Asp Ser Ala Leu Asn

450 455 460

cag act gtt gtt gat ctc gag gtt tgt att tgt aac gat ggt tca aca 1440

Gln Thr Val Val Asp Leu Glu Val Cys Ile Cys Asn Asp Gly Ser Thr

465 470 475 480

gat aat acc tta gaa gtg atc aat aag ctt tat ggt aat aat cct agg 1488

Asp Asn Thr Leu Glu Val Ile Asn Lys Leu Tyr Gly Asn Asn Pro Arg

485 490 495

gta cgc atc atg tct aaa cca aat ggc gga ata gcc tca gca tca aat 1536

Val Arg Ile Met Ser Lys Pro Asn Gly Gly Ile Ala Ser Ala Ser Asn

500 505 510

gca gcc gtt tct ttt gct aaa ggt tat tac att ggg cag tta gat tca 1584

Ala Ala Val Ser Phe Ala Lys Gly Tyr Tyr Ile Gly Gln Leu Asp Ser

515 520 525

gat gat tat ctt gag cct gat gca gtt gaa ctg tgt tta aaa gaa ttt 1632

Asp Asp Tyr Leu Glu Pro Asp Ala Val Glu Leu Cys Leu Lys Glu Phe

530 535 540

tta aaa gat aaa acg cta gct tgt gtt tat acc act aat aga aac gtc 1680

Leu Lys Asp Lys Thr Leu Ala Cys Val Tyr Thr Thr Asn Arg Asn Val

545 550 555 560

aat ccg gat ggt agc tta atc gct aat ggt tac aat tgg cca gaa ttt 1728

Asn Pro Asp Gly Ser Leu Ile Ala Asn Gly Tyr Asn Trp Pro Glu Phe

565 570 575

tca cga gaa aaa ctc aca acg gct atg att gct cac cac ttt aga atg 1776

Ser Arg Glu Lys Leu Thr Thr Ala Met Ile Ala His His Phe Arg Met

580 585 590

ttc acg att aga gct tgg cat tta act gat gga ttc aat gaa aaa att 1824

Phe Thr Ile Arg Ala Trp His Leu Thr Asp Gly Phe Asn Glu Lys Ile

595 600 605

gaa aat gcc gta gac tat gac atg ttc ctc aaa ctc agt gaa gtt gga 1872

Glu Asn Ala Val Asp Tyr Asp Met Phe Leu Lys Leu Ser Glu Val Gly

610 615 620

aaa ttt aaa cat ctt aat aaa atc tgc tat aac cgt gta tta cat ggt 1920

Lys Phe Lys His Leu Asn Lys Ile Cys Tyr Asn Arg Val Leu His Gly

625 630 635 640

gat aac aca tca att aag aaa ctt ggc att caa aag aaa aac cat ttt 1968

Asp Asn Thr Ser Ile Lys Lys Leu Gly Ile Gln Lys Lys Asn His Phe

645 650 655

gtt gta gtc aat cag tca tta aat aga caa ggc ata act tat tat aat 2016

Val Val Val Asn Gln Ser Leu Asn Arg Gln Gly Ile Thr Tyr Tyr Asn

660 665 670

tat gac gaa ttt gat gat tta gat gaa agt aga aag tat att ttc aat 2064

Tyr Asp Glu Phe Asp Asp Leu Asp Glu Ser Arg Lys Tyr Ile Phe Asn

675 680 685

aaa acc gct gaa tat caa gaa gag att gat atc tta aaa gat att aaa 2112

Lys Thr Ala Glu Tyr Gln Glu Glu Ile Asp Ile Leu Lys Asp Ile Lys

690 695 700

atc atc cag aat aaa gat gcc aaa atc gca gtc agt att ttt tat ccc 2160

Ile Ile Gln Asn Lys Asp Ala Lys Ile Ala Val Ser Ile Phe Tyr Pro

705 710 715 720

aat aca tta aac ggc tta gtg aaa aaa cta aac aat att att gaa tat 2208

Asn Thr Leu Asn Gly Leu Val Lys Lys Leu Asn Asn Ile Ile Glu Tyr

725 730 735

aat aaa aat ata ttc gtt att gtt cta cat gtt gat aag aat cat ctt 2256

Asn Lys Asn Ile Phe Val Ile Val Leu His Val Asp Lys Asn His Leu

740 745 750

aca cca gat atc aaa aaa gaa ata cta gcc ttc tat cat aaa cat caa 2304

Thr Pro Asp Ile Lys Lys Glu Ile Leu Ala Phe Tyr His Lys His Gln

755 760 765

gtg aat att tta cta aat aat gat atc tca tat tac acg agt aat aga 2352

Val Asn Ile Leu Leu Asn Asn Asp Ile Ser Tyr Tyr Thr Ser Asn Arg

770 775 780

tta ata aaa act gag gcg cat tta agt aat att aat aaa tta agt cag 2400

Leu Ile Lys Thr Glu Ala His Leu Ser Asn Ile Asn Lys Leu Ser Gln

785 790 795 800

tta aat cta aat tgt gaa tac atc att ttt gat aat cat gac agc cta 2448

Leu Asn Leu Asn Cys Glu Tyr Ile Ile Phe Asp Asn His Asp Ser Leu

805 810 815

ttc gtt aaa aat gac agc tat gct tat atg aaa aaa tat gat gtc ggc 2496

Phe Val Lys Asn Asp Ser Tyr Ala Tyr Met Lys Lys Tyr Asp Val Gly

820 825 830

atg aat ttc tca gca tta aca cat gat tgg atc gag aaa atc aat gcg 2544

Met Asn Phe Ser Ala Leu Thr His Asp Trp Ile Glu Lys Ile Asn Ala

835 840 845

cat cca cca ttt aaa aag ctc att aaa act tat ttt aat gac aat gac 2592

His Pro Pro Phe Lys Lys Leu Ile Lys Thr Tyr Phe Asn Asp Asn Asp

850 855 860

tta aaa agt atg aat gtg aaa ggg gca tca caa ggt atg ttt atg acg 2640

Leu Lys Ser Met Asn Val Lys Gly Ala Ser Gln Gly Met Phe Met Thr

865 870 875 880

tat gcg cta gcg cat gag ctt ctg acg att att aaa gaa gtc atc aca 2688

Tyr Ala Leu Ala His Glu Leu Leu Thr Ile Ile Lys Glu Val Ile Thr

885 890 895

tct tgc cag tca att gat agt gtg cca gaa tat aac act gag gat att 2736

Ser Cys Gln Ser Ile Asp Ser Val Pro Glu Tyr Asn Thr Glu Asp Ile

900 905 910

tgg ttc caa ttt gca ctt tta atc tta gaa aag aaa acc ggc cat gta 2784

Trp Phe Gln Phe Ala Leu Leu Ile Leu Glu Lys Lys Thr Gly His Val

915 920 925

ttt aat aaa aca tcg acc ctg act tat atg cct tgg gaa cga aaa tta 2832

Phe Asn Lys Thr Ser Thr Leu Thr Tyr Met Pro Trp Glu Arg Lys Leu

930 935 940

caa tgg aca aat gaa caa att gaa agt gca aaa aga gga gaa aat ata 2880

Gln Trp Thr Asn Glu Gln Ile Glu Ser Ala Lys Arg Gly Glu Asn Ile

945 950 955 960

cct gtt aac aag ttc att att aat agt ata act cta 2916

Pro Val Asn Lys Phe Ile Ile Asn Ser Ile Thr Leu

965 970

<210> 95

<211> 972

<212> PRT

<213> 出血败血性巴斯德菌(Paseurella multocida)

<400> 95

Met Asn Thr Leu Ser Gln Ala Ile Lys Ala Tyr Asn Ser Asn Asp Tyr

1 5 10 15

Gln Leu Ala Leu Lys Leu Phe Glu Lys Ser Ala Glu Ile Tyr Gly Arg

20 25 30

Lys Ile Val Glu Phe Gln Ile Thr Lys Cys Gln Glu Lys Leu Ser Ala

35 40 45

His Pro Ser Val Asn Ser Ala His Leu Ser Val Asn Lys Glu Glu Lys

50 55 60

Val Asn Val Cys Asp Ser Pro Leu Asp Ile Ala Thr Gln Leu Leu Leu

65 70 75 80

Ser Asn Val Lys Lys Leu Val Leu Ser Asp Ser Glu Lys Asn Thr Leu

85 90 95

Lys Asn Lys Trp Lys Leu Leu Thr Glu Lys Lys Ser Glu Asn Ala Glu

100 105 110

Val Arg Ala Val Ala Leu Val Pro Lys Asp Phe Pro Lys Asp Leu Val

115 120 125

Leu Ala Pro Leu Pro Asp His Val Asn Asp Phe Thr Trp Tyr Lys Lys

130 135 140

Arg Lys Lys Arg Leu Gly Ile Lys Pro Glu His Gln His Val Gly Leu

145 150 155 160

Ser Ile Ile Val Thr Thr Phe Asn Arg Pro Ala Ile Leu Ser Ile Thr

165 170 175

Leu Ala Cys Leu Val Asn Gln Lys Thr His Tyr Pro Phe Glu Val Ile

180 185 190

Val Thr Asp Asp Gly Ser Gln Glu Asp Leu Ser Pro Ile Ile Arg Gln

195 200 205

Tyr Glu Asn Lys Leu Asp Ile Arg Tyr Val Arg Gln Lys Asp Asn Gly

210 215 220

Phe Gln Ala Ser Ala Ala Arg Asn Met Gly Leu Arg Leu Ala Lys Tyr

225 230 235 240

Asp Phe Ile Gly Leu Leu Asp Cys Asp Met Ala Pro Asn Pro Leu Trp

245 250 255

Val His Ser Tyr Val Ala Glu Leu Leu Glu Asp Asp Asp Leu Thr Ile

260 265 270

Ile Gly Pro Arg Lys Tyr Ile Asp Thr Gln His Ile Asp Pro Lys Asp

275 280 285

Phe Leu Asn Asn Ala Ser Leu Leu Glu Ser Leu Pro Glu Val Lys Thr

290 295 300

Asn Asn Ser Val Ala Ala Lys Gly Glu Gly Thr Val Ser Leu Asp Trp

305 310 315 320

Arg Leu Glu Gln Phe Glu Lys Thr Glu Asn Leu Arg Leu Ser Asp Ser

325 330 335

Pro Phe Arg Phe Phe Ala Ala Gly Asn Val Ala Phe Ala Lys Lys Trp

340 345 350

Leu Asn Lys Ser Gly Phe Phe Asp Glu Glu Phe Asn His Trp Gly Gly

355 360 365

Glu Asp Val Glu Phe Gly Tyr Arg Leu Phe Arg Tyr Gly Ser Phe Phe

370 375 380

Lys Thr Ile Asp Gly Ile Met Ala Tyr His Gln Glu Pro Pro Gly Lys

385 390 395 400

Glu Asn Glu Thr Asp Arg Glu Ala Gly Lys Asn Ile Thr Leu Asp Ile

405 410 415

Met Arg Glu Lys Val Pro Tyr Ile Tyr Arg Lys Leu Leu Pro Ile Glu

420 425 430

Asp Ser His Ile Asn Arg Val Pro Leu Val Ser Ile Tyr Ile Pro Ala

435 440 445

Tyr Asn Cys Ala Asn Tyr Ile Gln Arg Cys Val Asp Ser Ala Leu Asn

450 455 460

Gln Thr Val Val Asp Leu Glu Val Cys Ile Cys Asn Asp Gly Ser Thr

465 470 475 480

Asp Asn Thr Leu Glu Val Ile Asn Lys Leu Tyr Gly Asn Asn Pro Arg

485 490 495

Val Arg Ile Met Ser Lys Pro Asn Gly Gly Ile Ala Ser Ala Ser Asn

500 505 510

Ala Ala Val Ser Phe Ala Lys Gly Tyr Tyr Ile Gly Gln Leu Asp Ser

515 520 525

Asp Asp Tyr Leu Glu Pro Asp Ala Val Glu Leu Cys Leu Lys Glu Phe

530 535 540

Leu Lys Asp Lys Thr Leu Ala Cys Val Tyr Thr Thr Asn Arg Asn Val

545 550 555 560

Asn Pro Asp Gly Ser Leu Ile Ala Asn Gly Tyr Asn Trp Pro Glu Phe

565 570 575

Ser Arg Glu Lys Leu Thr Thr Ala Met Ile Ala His His Phe Arg Met

580 585 590

Phe Thr Ile Arg Ala Trp His Leu Thr Asp Gly Phe Asn Glu Lys Ile

595 600 605

Glu Asn Ala Val Asp Tyr Asp Met Phe Leu Lys Leu Ser Glu Val Gly

610 615 620

Lys Phe Lys His Leu Asn Lys Ile Cys Tyr Asn Arg Val Leu His Gly

625 630 635 640

Asp Asn Thr Ser Ile Lys Lys Leu Gly Ile Gln Lys Lys Asn His Phe

645 650 655

Val Val Val Asn Gln Ser Leu Asn Arg Gln Gly Ile Thr Tyr Tyr Asn

660 665 670

Tyr Asp Glu Phe Asp Asp Leu Asp Glu Ser Arg Lys Tyr Ile Phe Asn

675 680 685

Lys Thr Ala Glu Tyr Gln Glu Glu Ile Asp Ile Leu Lys Asp Ile Lys

690 695 700

Ile Ile Gln Asn Lys Asp Ala Lys Ile Ala Val Ser Ile Phe Tyr Pro

705 710 715 720

Asn Thr Leu Asn Gly Leu Val Lys Lys Leu Asn Asn Ile Ile Glu Tyr

725 730 735

Asn Lys Asn Ile Phe Val Ile Val Leu His Val Asp Lys Asn His Leu

740 745 750

Thr Pro Asp Ile Lys Lys Glu Ile Leu Ala Phe Tyr His Lys His Gln

755 760 765

Val Asn Ile Leu Leu Asn Asn Asp Ile Ser Tyr Tyr Thr Ser Asn Arg

770 775 780

Leu Ile Lys Thr Glu Ala His Leu Ser Asn Ile Asn Lys Leu Ser Gln

785 790 795 800

Leu Asn Leu Asn Cys Glu Tyr Ile Ile Phe Asp Asn His Asp Ser Leu

805 810 815

Phe Val Lys Asn Asp Ser Tyr Ala Tyr Met Lys Lys Tyr Asp Val Gly

820 825 830

Met Asn Phe Ser Ala Leu Thr His Asp Trp Ile Glu Lys Ile Asn Ala

835 840 845

His Pro Pro Phe Lys Lys Leu Ile Lys Thr Tyr Phe Asn Asp Asn Asp

850 855 860

Leu Lys Ser Met Asn Val Lys Gly Ala Ser Gln Gly Met Phe Met Thr

865 870 875 880

Tyr Ala Leu Ala His Glu Leu Leu Thr Ile Ile Lys Glu Val Ile Thr

885 890 895

Ser Cys Gln Ser Ile Asp Ser Val Pro Glu Tyr Asn Thr Glu Asp Ile

900 905 910

Trp Phe Gln Phe Ala Leu Leu Ile Leu Glu Lys Lys Thr Gly His Val

915 920 925

Phe Asn Lys Thr Ser Thr Leu Thr Tyr Met Pro Trp Glu Arg Lys Leu

930 935 940

Gln Trp Thr Asn Glu Gln Ile Glu Ser Ala Lys Arg Gly Glu Asn Ile

945 950 955 960

Pro Val Asn Lys Phe Ile Ile Asn Ser Ile Thr Leu

965 970

<210> 96

<211> 1206

<212> DNA

<213> 酿脓链球菌(Streptococcus pyogenes)

<220>

<221> CDS

<222> (1)..(1206)

<223>

<400> 96

atg aaa ata gca gtt gct gga tca gga tat gtt gga tta tca cta gga 48

Met Lys Ile Ala Val Ala Gly Ser Gly Tyr Val Gly Leu Ser Leu Gly

1 5 10 15

gtt ctt tta tca ctt caa aac gaa gtc act att gtt gat att ctt ccc 96

Val Leu Leu Ser Leu Gln Asn Glu Val Thr Ile Val Asp Ile Leu Pro

20 25 30

tct aaa gtt gat aag att aat aat ggc tta tca cca att caa gat gaa 144

Ser Lys Val Asp Lys Ile Asn Asn Gly Leu Ser Pro Ile Gln Asp Glu

35 40 45

tat att gaa tat tac tta aaa agt aag caa tta tct att aaa gca act 192

Tyr Ile Glu Tyr Tyr Leu Lys Ser Lys Gln Leu Ser Ile Lys Ala Thr

50 55 60

tta gat agc aaa gca gct tat aaa gaa gcg gaa ctg gtc att att gcc 240

Leu Asp Ser Lys Ala Ala Tyr Lys Glu Ala Glu Leu Val Ile Ile Ala

65 70 75 80

aca cct aca aat tac aac agt aga att aat tat ttt gat aca cag cat 288

Thr Pro Thr Asn Tyr Asn Ser Arg Ile Asn Tyr Phe Asp Thr Gln His

85 90 95

gtt gaa aca gtt atc aaa gag gta cta agc gtt aat agc cat gca act 336

Val Glu Thr Val Ile Lys Glu Val Leu Ser Val Asn Ser His Ala Thr

l00 105 110

ctt atc atc aaa tca aca att cca ata ggt ttc att act gaa atg aga 384

Leu Ile Ile Lys Ser Thr Ile Pro Ile Gly Phe Ile Thr Glu Met Arg

115 120 125

cag aaa ttc caa act gat cgt att atc ttc agc cct gaa ttt tta aga 432

Gln Lys Phe Gln Thr Asp Arg Ile Ile Phe Ser Pro Glu Phe Leu Arg

130 135 140

gaa tct aaa gct tta tat gac aac tta tat cca agc cga att att gtt 480

Glu Ser Lys Ala Leu Tyr Asp Asn Leu Tyr Pro Ser Arg Ile Ile Val

145 150 155 160

tct tgt gaa gaa aac gat tct cca aaa gta aag gca gac gca gaa aaa 528

Ser Cys Glu Glu Asn Asp Ser Pro Lys Val Lys Ala Asp Ala Glu Lys

165 170 175

ttt gca ctt tta tta aag tct gca gct aaa aaa aat aat gta cca gta 576

Phe Ala Leu Leu Leu Lys Ser Ala Ala Lys Lys Asn Asn Val Pro Val

180 185 190

ctt att atg gga gct tca gaa gct gaa gca gta aaa cta ttt gcc aat 624

Leu Ile Met Gly Ala Ser Glu Ala Glu Ala Val Lys Leu Phe Ala Asn

195 200 205

act tat tta gcg tta agg gta gct tat ttt aat gag tta gac act tac 672

Thr Tyr Leu Ala Leu Arg Val Ala Tyr Phe Asn Glu Leu Asp Thr Tyr

210 215 220

gca gaa tcg aga aaa tta aat agt cac atg att att caa gga att tct 720

Ala Glu Ser Arg Lys Leu Asn Ser His Met Ile Ile Gln Gly Ile Ser

225 230 235 240

tat gat gat cga ata gga atg cat tat aat aac cca tca ttt ggt tat 768

Tyr Asp Asp Arg Ile Gly Met His Tyr Asn Asn Pro Ser Phe Gly Tyr

245 250 255

gga ggt tat tgt cta cct aaa gat acg aag caa tta ttg gca aat tac 816

Gly Gly Tyr Cys Leu Pro Lys Asp Thr Lys Gln Leu Leu Ala Asn Tyr

260 265 270

aat aat att cct caa acg cta att gaa gct atc gtt tca tca aat aat 864

Asn Asn Ile Pro Gln Thr Leu Ile Glu Ala Ile Val Ser Ser Asn Asn

275 280 285

gtg cgc aag tcc tat att gct aag caa att atc aac gtc tta gaa gag 912

Val Arg Lys Ser Tyr Ile Ala Lys Gln Ile Ile Asn Val Leu Glu Glu

290 295 300

cgg gag tcc cca gta aaa gta gtc ggg gtt tac cgt tta att atg aaa 960

Arg Glu Ser Pro Val Lys Val Val Gly Val Tyr Arg Leu Ile Met Lys

305 310 315 320

agt aac tca gat aat ttt aga gaa agt gct atc aaa gat gtt att gac 1008

Ser Asn Ser Asp Asn Phe Arg Glu Ser Ala Ile Lys Asp Val Ile Asp

325 330 335

att ctt aaa agt aaa gac att aag ata att att tat gag cca atg tta 1056

Ile Leu Lys Ser Lys Asp Ile Lys Ile Ile Ile Tyr Glu Pro Met Leu

340 345 350

aac aaa ctt gaa tct gaa gat caa tct gta ctt gta aat gat tta gag 1104

Asn Lys Leu Glu Ser Glu Asp Gln Ser Val Leu Val Asn Asp Leu Glu

355 360 365

aat ttc aag aaa caa gca aat att atc gta act aat cgc tat gat aat 1152

Asn Phe Lys Lys Gln Ala Asn Ile Ile Val Thr Asn Arg Tyr Asp Asn

370 375 380

gaa tta caa gat gtt aaa aat aaa gtt tac agt aga gat att ttt aat 1200

Glu Leu Gln Asp Val Lys Asn Lys Val Tyr Ser Arg Asp Ile Phe Asn

385 390 395 400

aga gac 1206

Arg Asp

<210> 97

<211> 402

<212> PRT

<213> 酿脓链球菌(Streptococcus pyogenes)

<400> 97

Met Lys Ile Ala Val Ala Gly Ser Gly Tyr Val Gly Leu Ser Leu Gly

1 5 10 15

Val Leu Leu Ser Leu Gln Asn Glu Val Thr Ile Val Asp Ile Leu Pro

20 25 30

Ser Lys Val Asp Lys Ile Asn Asn Gly Leu Ser Pro Ile Gln Asp Glu

35 40 45

Tyr Ile Glu Tyr Tyr Leu Lys Ser Lys Gln Leu Ser Ile Lys Ala Thr

50 55 60

Leu Asp Ser Lys Ala Ala Tyr Lys Glu Ala Glu Leu Val Ile Ile Ala

65 70 75 80

Thr Pro Thr Asn Tyr Asn Ser Arg Ile Asn Tyr Phe Asp Thr Gln His

85 90 95

Val Glu Thr Val Ile Lys Glu Val Leu Ser Val Asn Ser His Ala Thr

100 105 110

Leu Ile Ile Lys Ser Thr Ile Pro Ile Gly Phe Ile Thr Glu Met Arg

115 120 125

Gln Lys Phe Gln Thr Asp Arg Ile Ile Phe Ser Pro Glu Phe Leu Arg

130 135 140

Glu Ser Lys Ala Leu Tyr Asp Asn Leu Tyr Pro Ser Arg Ile Ile Val

145 150 155 160

Ser Cys Glu Glu Asn Asp Ser Pro Lys Val Lys Ala Asp Ala Glu Lys

165 170 175

Phe Ala Leu Leu Leu Lys Ser Ala Ala Lys Lys Asn Asn Val Pro Val

180 185 190

Leu Ile Met Gly Ala Ser Glu Ala Glu Ala Val Lys Leu Phe Ala Asn

195 200 205

Thr Tyr Leu Ala Leu Arg Val Ala Tyr Phe Asn Glu Leu Asp Thr Tyr

210 215 220

Ala Glu Ser Arg Lys Leu Asn Ser His Met Ile Ile Gln Gly Ile Ser

225 230 235 240

Tyr Asp Asp Arg Ile Gly Met His Tyr Asn Asn Pro Ser Phe Gly Tyr

245 250 255

Gly Gly Tyr Cys Leu Pro Lys Asp Thr Lys Gln Leu Leu Ala Asn Tyr

260 265 270

Asn Asn Ile Pro Gln Thr Leu Ile Glu Ala Ile Val Ser Ser Asn Asn

275 280 285

Val Arg Lys Ser Tyr Ile Ala Lys Gln Ile Ile Asn Val Leu Glu Glu

290 295 300

Arg Glu Ser Pro Val Lys Val Val Gly Val Tyr Arg Leu Ile Met Lys

305 310 315 320

Ser Asn Ser Asp Asn Phe Arg Glu Ser Ala Ile Lys Asp Val Ile Asp

325 330 335

Ile Leu Lys Ser Lys Asp Ile Lys Ile Ile Ile Tyr Glu Pro Met Leu

340 345 350

Asn Lys Leu Glu Ser Glu Asp Gln Ser Val Leu Val Asn Asp Leu Glu

355 360 365

Asn Phe Lys Lys Gln Ala Asn Ile Ile Val Thr Asn Arg Tyr Asp Asn

370 375 380

Glu Leu Gln Asp Val Lys Asn Lys Val Tyr Ser Arg Asp Ile Phe Asn

385 390 395 400

Arg Asp

<210> 98

<211> 912

<212> DNA

<213> 酿脓链球菌(Streptococcus pyogenes)

<220>

<221> CDS

<222> (1)..(912)

<223>

<400> 98

atg acc aaa gtc aga aaa gcc att att cct gct gca ggt cta gga aca 48

Met Thr Lys Val Arg Lys Ala Ile Ile Pro Ala Ala Gly Leu Gly Thr

1 5 10 15

cgt ttt tta cct gct acc aaa gct ctt gcc aaa gag atg ttg ccc atc 96

Arg Phe Leu Pro Ala Thr Lys Ala Leu Ala Lys Glu Met Leu Pro Ile

20 25 30

gtt gat aaa cca acc atc cag ttt atc gtc gaa gaa gcg cta aaa tct 144

Val Asp Lys Pro Thr Ile Gln Phe Ile Val Glu Glu Ala Leu Lys Ser

35 40 45

ggc atc gag gaa atc ctt gtg gtg acc gga aaa gct aaa cgc tct atc 192

Gly Ile Glu Glu Ile Leu Val Val Thr Gly Lys Ala Lys Arg Set Ile

50 55 60

gag gac cat ttt gat tca aac ttt gaa tta gaa tac aac ctc caa gct 240

Glu Asp His Phe Asp Ser Asn Phe Glu Leu Glu Tyr Asn Leu Gln Ala

65 70 75 80

aag ggg aaa aat gaa ctg ttg aaa tta gtg gat gaa acc act gcc att 288

Lys Gly Lys Asn Glu Leu Leu Lys Leu Val Asp Glu Thr Thr Ala Ile

85 90 95

aac ctt cat ttt atc cgt caa agc cac cca aga ggg ctg gga gat gct 336

Asn Leu His Phe Ile Arg Gln Ser His Pro Arg Gly Leu Gly Asp Ala

100 105 110

gtc tta caa gcc aaa gcc ttt gtg ggc aat gaa ccc ttt gtg gtc atg 384

Val Leu Gln Ala Lys Ala Phe Val Gly Asn Glu Pro Phe Val Val Met

115 120 125

ctt gga gat gac tta atg gac att aca aat gca tcc gct aaa cct ctc 432

Leu Gly Asp Asp Leu Met Asp Ile Thr Asn Ala Ser Ala Lys Pro Leu

130 135 140

acc aaa caa crc atg gag gac tat gac aag acg cat gca tcc act atc 480

Thr Lys Gln Leu Met Glu Asp Tyr Asp Lys Thr His Ala Ser Thr Ile

145 150 155 160

gct gtg atg aaa gtt cct cat gaa gat gtg tct age tat ggg gtt atc 528

Ala Val Met Lys Val Pro His Glu Asp Val Ser Ser Tyr Gly Val Ile

165 170 175

gct cct caa ggc aag gct gtc aag ggc ctt tac agt gta gac acc ttt 576

Ala Pro Gln Gly Lys Ala Val Lys Gly Leu Tyr Ser Val Asp Thr Phe

180 185 190

gtt gaa aaa cca caa cca gaa gat gcg cct agt gat ttg get att att 624

Val Glu Lys Pro Gln Pro Glu Asp Ala Pro Ser Asp Leu Ala Ile Ile

195 200 205

ggt cgt tac ctc cta acc cct gaa att ttt ggt att ttg gaa aga cag 672

Gly Arg Tyr Leu Leu Thr Pro Glu Ile Phe Gly Ile Leu Glu Arg Gln

210 215 220

acc cct gga gca ggt aac gaa gtg caa ctc aca gat gct atc gat acc 720

Thr Pro Gly Ala Gly Asn Glu Val Gln Leu Thr Asp Ala Ile Asp Thr

225 230 235 240

ctc aat aaa act cag cgt gte ttt gca cga gaa ttt aaa ggc aat cgt 768

Leu Asn Lys Thr Gln Arg Val Phe Ala Arg Glu Phe Lys Gly Asn Arg

245 250 255

tac gat gtt ggg gat aaa ttt gga ttc atg aaa aca tct atc gac tat 816

Tyr Asp Val Gly Asp Lys Phe Gly Phe Met Lys Thr Ser Ile Asp Tyr

260 265 270

gcc tta gaa cac cca cag gtc aaa gag gac ttg aaa aat tac att atc 864

Ala Leu Glu His Pro Gln Val Lys Glu Asp Leu Lys Asn Tyr Ile Ile

275 280 285

aaa cta gga aaa gct ttg gaa aaa agt aaa gta cca aca cat tca aag 912

Lys Leu Gly Lys Ala Leu Glu Lys Ser Lys Val Pro Thr His Ser Lys

290 295 300

<210> 99

<211> 304

<212> PRT

<213> 酿脓链球菌(Streptococcus pyogenes)

<400> 99

Met Thr Lys Val Arg Lys Ala Ile Ile Pro Ala Ala Gly Leu Gly Thr

1 5 10 15

Arg Phe Leu Pro Ala Thr Lys Ala Leu Ala Lys Glu Met Leu Pro Ile

20 25 30

Val Asp Lys Pro Thr Ile Gln Phe Ile Val Glu Glu Ala Leu Lys Ser

35 40 45

Gly Ile Glu Glu Ile Leu Val Val Thr Gly Lys Ala Lys Arg Ser Ile

50 55 60

Glu Asp His Phe Asp Ser Asn Phe Glu Leu Glu Tyr Asn Leu Gln Ala

65 70 75 80

Lys Gly Lys Asn Glu Leu Leu Lys Leu Val Asp Glu Thr Thr Ala Ile

85 90 95

Asn Leu His Phe Ile Arg Gln Ser His Pro Arg Gly Leu Gly Asp Ala

100 105 110

Val Leu Gln Ala Lys Ala Phe Val Gly Asn Glu Pro Phe Val Val Met

115 120 125

Leu Gly Asp Asp Leu Met Asp Ile Thr Asn Ala Ser Ala Lys Pro Leu

130 135 140

Thr Lys Gln Leu Met Glu Asp Tyr Asp Lys Thr His Ala Ser Thr Ile

145 150 155 160

Ala Val Met Lys Val Pro His Glu Asp Val Ser Ser Tyr Gly Val Ile

165 170 175

Ala Pro Gln Gly Lys Ala Val Lys Gly Leu Tyr Ser Val Asp Thr Phe

180 185 190

Val Glu Lys Pro Gln Pro Glu Asp Ala Pro Ser Asp Leu Ala Ile Ile

195 200 205

Gly Arg Tyr Leu Leu Thr Pro Glu Ile Phe Gly Ile Leu Glu Arg Gln

210 215 220

Thr Pro Gly Ala Gly Asn Glu Val Gln Leu Thr Asp Ala Ile Asp Thr

225 230 235 240

Leu Asn Lys Thr Gln Arg Val Phe Ala Arg Glu Phe Lys Gly Asn Arg

245 250 255

Tyr Asp Val Gly Asp Lys Phe Gly Phe Met Lys Thr Ser Ile Asp Tyr

260 265 270

Ala Leu Glu His Pro Gln Val Lys GLu Asp Leu Lys Asn Tyr Ile Ile

275 280 285

Lys Leu Gly Lys Ala Leu Glu Lys Ser Lys Val Pro Thr His Ser Lys

290 295 300

<210> 100

<211> 1347

<212> DNA

<213> 马链球菌兽瘟亚种(Streptococcus equi zooepidemicus)

<220>

<221> CDS

<222> (1)..(1347)

<223>

<400> 100

atg tca cat att aca ttt gat tat tca aag gtt ctt gag caa ttt gcc 48

Met Ser His Ile Thr Phe Asp Tyr Ser Lys Val Leu Glu Gln Phe Ala

1 5 10 15

gga cag cat gaa att gac ttt tta caa ggt cag gta aca gag gct gat 96

Gly Gln His Glu Ile Asp Phe Leu Gln Gly Gln Val Thr Glu Ala Asp

20 25 30

cag gca cta cgt cag ggc act gga cct gga tca gat ttc ttg ggc tgg 144

Gln Ala Leu Arg Gln Gly Thr Gly Pro Gly Ser Asp Phe Leu Gly Trp

35 40 45

ctt gag tta cct gaa aac tat gac aaa gaa gaa ttt gct cgt atc ctt 192

Leu Glu Leu Pro Glu Asn Tyr Asp Lys Glu Glu Phe Ala Arg Ile Leu

50 55 60

aaa gca gct gag aag att aag gct gac agt gac gtt ctt gtt gtg att 240

Lys Ala Ala Glu Lys Ile Lys Ala Asp Ser Asp Val Leu Val Val Ile

65 70 75 80

ggt att ggt ggc tct tac ctt ggt gct aag gct gca att gac ttt ttg 288

Gly Ile Gly Gly Ser Tyr Leu Gly Ala Lys Ala Ala Ile Asp Phe Leu

85 90 95

aac agc cat ttt gcc aac cta caa aca gca aaa gag cgc aaa gca cca 336

Asn Ser His Phe Ala Asn Leu Gln Thr Ala Lys Glu Arg Lys Ala Pro

100 105 110

caa att ctt tat gct ggt aac tcc atc tca tca agc tat ctt gct gat 384

Gln Ile Leu Tyr Ala Gly Asn Ser Ile Ser Ser Ser Tyr Leu Ala Asp

115 120 125

ctt gtg gac tat gtt caa gat aaa gat ttc tct gtt aac gtg att tct 432

Leu Val Asp Tyr Val Gln Asp Lys Asp Phe Ser Val Asn Val Ile Ser

130 135 140

aag tct ggt aca aca aca gag cct gca atc gcc ttt cgt gtc ttt aaa 480

Lys Ser Gly Thr Thr Thr Glu Pro Ala Ile Ala Phe Arg Val Phe Lys

145 150 155 160

gaa tta ctt gtt aaa aag tac ggt caa gaa gag gcc aac aag cgt atc 528

Glu Leu Leu Val Lys Lys Tyr Gly Gln Glu Glu Ala Asn Lys Arg Ile

165 170 175

tat gca acg act gat aag gtc aag ggt gct gtt aag gtt gag gct gat 576

Tyr Ala Thr Thr Asp Lys Val Lys Gly Ala Val Lys Val Glu Ala Asp

180 185 190

gca aat cat tgg gaa acc ttt gtt gtg cca gat aat gtt ggt ggc cgt 624

Ala Asn His Trp Glu Thr Phe Val Val Pro Asp Asn Val Gly Gly Arg

195 200 205

ttc tca gtg ctg aca gct gtg ggc ttg cta cca att gca gca tca ggg 672

Phe Ser Val Leu Thr Ala Val Gly Leu Leu Pro Ile Ala Ala Ser Gly

210 215 220

gct gat att acc gcg ctg atg gaa gga gca aat gca gct cgt aag gac 720

Ala Asp Ile Thr Ala Leu Met Glu Gly Ala Asn Ala Ala Arg Lys Asp

225 230 235 240

ctg tca tca gat aaa atc tca gaa aac atc gct tac caa tat gct gtg 768

Leu Ser Ser Asp Lys Ile Ser Glu Asn Ile Ala Tyr Gln Tyr Ala Val

245 250 255

gtc cgc aat atc ctc tat cgc aaa ggc tat gta act gaa att ttg gca 816

Val Arg Asn Ile Leu Tyr Arg Lys Gly Tyr Val Thr Glu Ile Leu Ala

260 265 270

aac tat gag cca tca ttg cag tat ttt agc gaa tgg tgg aag caa ctg 864

Asn Tyr Glu Pro Ser Leu Gln Tyr Phe Ser Glu Trp Trp Lys Gln Leu

275 280 285

gct ggt gag tct gaa gga aag gac caa aag ggt att tac cca act tca 912

Ala Gly Glu Ser Glu Gly Lys Asp Gln Lys Gly Ile Tyr Pro Thr Ser

290 295 300

gct aat ttc tcg aca gac ctg cat tct ctt ggt caa ttt atc caa gaa 960

Ala Asn Phe Ser Thr Asp Leu His Ser Leu Gly Gln Phe Ile Gln Glu

305 310 315 320

ggc tac cgt aac ctc ttt gag aca gtg att cgt gtg gac aag cca cgt 1008

Gly Tyr Arg Asn Leu Phe Glu Thr Val Ile Arg Val Asp Lys Pro Arg

325 330 335

caa aat gtg att atc cca gaa atg gct gag gac ctt gat ggc ctt ggc 1056

Gln Asn Val Ile Ile Pro Glu Met Ala Glu Asp Leu Asp Gly Leu Gly

340 345 350

tac cta caa gga aaa gac gtt gac ttt gtc aac aaa aaa gca aca gat 1104

Tyr Leu Gln Gly Lys Asp Val Asp Phe Val Asn Lys Lys Ala Thr Asp

355 360 365

ggt gtc ctt ctt gcc cat aca gat ggt ggt gtg cca aat atg ttt atc 1152

Gly Val Leu Leu Ala His Thr Asp Gly Gly Val Pro Asn Met Phe Ile

370 375 380

acg ctt cca gag caa gac gaa ttt aca cta ggc tat acg atc tac ttc 1200

Thr Leu Pro Glu Gln Asp Glu Phe Thr Leu Gly Tyr Thr Ile Tyr Phe

385 390 395 400

ttt gag ctt gct att gcc ctt tca ggc tac ctc aac ggg gtc aat cca 1248

Phe Glu Leu Ala Ile Ala Leu Ser Gly Tyr Leu Asn Gly Val Asn Pro

405 410 415

ttt gat cag cca ggc gtt gag gct tac aag aaa aac atg ttt gcc ctt 1296

Phe Asp Gln Pro Gly Val Glu Ala Tyr Lys Lys Asn Met Phe Ala Leu

420 425 430

crt ggt aag cca ggc ttt gaa gag cta gga gca gcg ctc aac gca cgc 1344

Leu Gly Lys Pro Gly Phe Glu Glu Leu Gly Ala Ala Leu Asn Ala Arg

435 440 445

ttg 1347

Leu

<210> 101

<211> 449

<212> PRT

<213> 马链球菌兽瘟亚种(Streptococcus equi zooepidemicus)

<400> 101

Met Ser His Ile Thr Phe Asp Tyr Ser Lys Val Leu Glu Gln Phe Ala

1 5 10 15

Gly Gln His Glu Ile Asp Phe Leu Gln Gly Gln Val Thr Glu Ala Asp

20 25 30

Gln Ala Leu Arg Gln Gly Thr Gly Pro Gly Ser Asp Phe Leu Gly Trp

35 40 45

Leu Glu Leu Pro Glu Asn Tyr Asp Lys Glu Glu Phe Ala Arg Ile Leu

50 55 60

Lys Ala Ala Glu Lys Ile Lys Ala Asp Ser Asp Val Leu Val Val Ile

65 70 75 80

Gly Ile Gly Gly Ser Tyr Leu Gly Ala Lys Ala Ala Ile Asp Phe Leu

85 90 95

Asn Ser His Phe Ala Asn Leu Gln Thr Ala Lys Glu Arg Lys Ala Pro

100 105 110

Gln Ile Leu Tyr Ala Gly Asn Ser Ile Ser Ser Ser Tyr Leu Ala Asp

115 120 125

Leu Val Asp Tyr Val Gln Asp Lys Asp Phe Ser Val Asn Val Ile Ser

130 135 140

Lys Ser Gly Thr Thr Thr Glu Pro Ala Ile Ala Phe Arg Val Phe Lys

145 150 155 160

Glu Leu Leu Val Lys Lys Tyr Gly Gln Glu Glu Ala Asn Lys Arg Ile

165 170 175

Tyr Ala Thr Thr Asp Lys Val Lys Gly Ala Val Lys Val Glu Ala Asp

180 185 190

Ala Asn His Trp Glu Thr Phe Val Val Pro Asp Asn Val Gly Gly Arg

195 200 205

Phe Ser Val Leu Thr Ala Val Gly Leu Leu Pro Ile Ala Ala Ser Gly

210 215 220

Ala Asp Ile Thr Ala Leu Met Glu Gly Ala Asn Ala Ala Arg Lys Asp

225 230 235 240

Leu Ser Ser Asp Lys Ile Ser Glu Asn Ile Ala Tyr Gln Tyr Ala Val

245 250 255

Val Arg Asn Ile Leu Tyr Arg Lys Gly Tyr Val Thr Glu Ile Leu Ala

260 265 270

Asn Tyr Glu Pro Ser Leu Gln Tyr Phe Ser Glu Trp Trp Lys Gln Leu

275 280 285

Ala Gly Glu Ser Glu Gly Lys Asp Gln Lys Gly Ile Tyr Pro Thr Ser

290 295 300

Ala Asn Phe Ser Thr Asp Leu His Ser Leu Gly Gln Phe Ile Gln Glu

305 310 315 320

Gly Tyr Arg Asn Leu Phe Glu Thr Val Ile Arg Val Asp Lys Pro Arg

325 330 335

Gln Asn Val Ile Ile Pro Glu Met Ala Glu Asp Leu Asp Gly Leu Gly

340 345 350

Tyr Leu Gln Gly Lys Asp Val Asp Phe Val Asn Lys Lys Ala Thr Asp

355 360 365

Gly Val Leu Leu Ala His Thr Asp Gly Gly Val Pro Asn Met Phe Ile

370 375 380

Thr Leu Pro Glu Gln Asp Glu Phe Thr Leu Gly Tyr Thr Ile Tyr Phe

385 390 395 400

Phe Glu Leu Ala Ile Ala Leu Ser Gly Tyr Leu Asn Gly Val Asn Pro

405 410 415

Phe Asp Gln Pro Gly Val Glu Ala Tyr Lys Lys Asn Met Phe Ala Leu

420 425 430

Leu Gly Lys Pro Gly Phe Glu Glu Leu Gly Ala Ala Leu Asn Ala Arg

435 440 445

Leu

<210> 102

<211> 1251

<212> DNA

<213> 乳房链球菌(Streptococcus uberis)

<220>

<221> CDS

<222> (1)..(1251)

<223>

<400> 102

atg gaa aaa cta aaa aat ctc att aca ttt atg act ttt att ttc ctg 48

Met Glu Lys Leu Lys Asn Leu Ile Thr Phe Met Thr Phe Ile Phe Leu

1 5 10 15

tgg ctc ata att att ggg ctt aat gtt ttt gta ttt gga act aaa gga 96

Trp Leu Ile Ile Ile Gly Leu Asn Val Phe Val Phe Gly Thr Lys Gly

20 25 30

agt cta aca gtg tat ggg att att cta tta acc tat ttg tcg ata aaa 144

Ser Leu Thr Val Tyr Gly Ile Ile Leu Leu Thr Tyr Leu Ser Ile Lys

35 40 45

atg gga tta tct ttt ttt tat cgt ccc tat aaa gga agt gta ggt caa 192

Met Gly Leu Ser Phe Phe Tyr Arg Pro Tyr Lys Gly Ser Val Gly Gln

50 55 60

tat aag gta gca gct att atc cca tct tat aat gag gat ggt gtc ggt 240

Tyr Lys Val Ala Ala Ile Ile Pro Ser Tyr Asn Glu Asp Gly Val Gly

65 70 75 80

tta cta gaa act cta aag agt gtt caa aaa caa aca tat cca att gca 288

Leu Leu Glu Thr Leu Lys Ser Val Gln Lys Gln Thr Tyr Pro Ile Ala

85 90 95

gaa att ttc gta att gac gat ggg tca gta gat aaa aca ggt ata aaa 336

Glu Ile Phe Val Ile Asp Asp Gly Ser Val Asp Lys Thr Gly Ile Lys

100 105 110

ttg gtc gaa gac tat gtg aag tta aat ggc ttt gga gac caa gtt atc 384

Leu Val Glu Asp Tyr Val Lys Leu Asn Gly Phe Gly Asp Gln Val Ile

115 120 125

gtt cat cag atg cct gaa aat gtt ggt aaa aga cat gct cag gct tgg 432

Val His Gln Met Pro Glu Asn Val Gly Lys Arg His Ala Gln Ala Trp

130 135 140

gca ttt gaa agg tct gat gct gat gtt ttc tta aca gtg gat tca gat 480

Ala Phe Glu Arg Ser Asp Ala Asp Val Phe Leu Thr Val Asp Ser Asp

145 150 155 160

acc tac atc tat cct gat gct ctt gaa gaa tta tta aag aca ttt aat 528

Thr Tyr Ile Tyr Pro Asp Ala Leu Glu Glu Leu Leu Lys Thr Phe Asn

165 170 175

gat cca gag gtc tac gct gca act ggt cat tta aat gca aga aat aga 576

Asp Pro Glu Val Tyr Ala Ala Thr Gly His Leu Asn Ala Arg Asn Arg

180 185 190

caa act aat ctc tta act aga ctg act gat att cgt tac gat aat gca 624

Gln Thr Asn Leu Leu Thr Arg Leu Thr Asp Ile Arg Tyr Asp Asn Ala

195 200 205

ttt ggt gta gaa cgt gct gct cag tct gtt acg gga aat att ttg gtt 672

Phe Gly Val Glu Arg Ala Ala Gln Ser Val Thr Gly Asn Ile Leu Val

210 215 220

tgt tcc gga cct tta agt att tat aga cgt tcc gtc ggt att cca aat 720

Cys Ser Gly Pro Leu Ser Ile Tyr Arg Arg Ser Val Gly Ile Pro Asn

225 230 235 240

ctt gaa cgc tat acc tca caa aca ttt ctt ggt gtc cct gta agc ata 768

Leu Glu Arg Tyr Thr Ser Gln Thr Phe Leu Gly Val Pro Val Ser Ile

245 250 255

ggg gat gac cgt tgt ttg aca aat tat gca act gat ttg gga aaa acg 816

Gly Asp Asp Arg Cys Leu Thr Asn Tyr Ala Thr Asp Leu Gly Lys Thr

260 265 270

gtt tat cag tca act gca aga tgt gat act gac gtt cca gat aag ttt 864

Val Tyr Gln Ser Thr Ala Arg Cys Asp Thr Asp Val Pro Asp Lys Phe

275 280 285

aag gtt ttc atc aaa caa caa aat cgt tgg aat aag tca ttt ttt agg 912

Lys Val Phe Ile Lys Gln Gln Asn Arg Trp Asn Lys Ser Phe Phe Arg

290 295 300

gag tct att atc tct gtt aag aag tta tta gcc aca cca agt gtt gct 960

Glu Ser Ile Ile Ser Val Lys Lys Leu Leu Ala Thr Pro Ser Val Ala

305 310 315 320

gtt tgg act att aca gaa gtt tcc atg ttc atc atg cta gtt tat tct 1008

Val Trp Thr Ile Thr Glu Val Ser Met Phe Ile Met Leu Val Tyr Ser

325 330 335

atc ttt agc tta ttg ata gga gag gct caa gaa ttt aat ctc ata aaa 1056

Ile Phe Ser Leu Leu Ile Gly Glu Ala Gln Glu Phe Asn Leu Ile Lys

340 345 350

ctg gtt gct ttt tta gtt att att ttc ata gta gct ctt tgt aga aat 1104

Leu Val Ala Phe Leu Val Ile Ile Phe Ile Val Ala Leu Cys Arg Asn

355 360 365

gtt cat tac atg gtt aag cat cca ttt gct ttt tta ttg tca ccg ttt 1152

Val His Tyr Met Val Lys His Pro Phe Ala Phe Leu Leu Ser Pro Phe

370 375 380

tat gga ttg ata cat cta ttc gtt ttg caa cct ctt aag ata tat tcg 1200

Tyr Gly Leu Ile His Leu Phe Val Leu Gln Pro Leu Lys Ile Tyr Ser

385 390 395 400

tta ttt act ata aga aat gct aca tgg gga act cgt aaa aag aca agt 1248

Leu Phe Thr Ile Arg Asn Ala Thr Trp Gly Thr Arg Lys Lys Thr Ser

405 410 415

aaa 1251

Lys

<210> 103

<211> 417

<212> PRT

<213> 乳房链球菌(Streptococcus uberis)

<400> 103

Met Glu Lys Leu Lys Asn Leu Ile Thr Phe Met Thr Phe Ile Phe Leu

l 5 10 15

Trp Leu Ile Ile Ile Gly Leu Asn Val Phe Val Phe Gly Thr Lys Gly

20 25 30

Ser Leu Thr Val Tyr Gly Ile Ile Leu Leu Thr Tyr Leu Ser Ile Lys

35 40 45

Met Gly Leu Ser Phe Phe Tyr Arg Pro Tyr Lys Gly Ser Val Gly Gln

50 55 60

Tyr Lys Val Ala Ala Ile Ile Pro Ser Tyr Asn Glu Asp Gly Val Gly

65 70 75 80

Leu Leu Glu Thr Leu Lys Ser Val Gln Lys Gln Thr Tyr Pro Ile Ala

85 90 95

Glu Ile Phe Val Ile Asp Asp Gly Ser Val Asp Lys Thr Gly Ile Lys

100 105 110

Leu Val Glu Asp Tyr Val Lys Leu Asn Gly Phe Gly Asp Gln Val Ile

115 120 125

Val His Gln Met Pro Glu Asn Val Gly Lys Arg His Ala Gln Ala Trp

130 135 140

Ala Phe Glu Arg Ser Asp Ala Asp Val Phe Leu Thr Val Asp Ser Asp

145 150 155 160

Thr Tyr Ile Tyr Pro Asp Ala Leu Glu Glu Leu Leu Lys Thr Phe Asn

165 170 175

Asp Pro Glu Val Tyr Ala Ala Thr Gly His Leu Asn Ala Arg Asn Arg

180 185 190

Gln Thr Asn Leu Leu Thr Arg Leu Thr Asp Ile Arg Tyr Asp Asn Ala

195 200 205

Phe Gly Val Glu Arg Ala Ala Gln Ser Val Thr Gly Asn Ile Leu Val

210 215 220

Cys Ser Gly Pro Leu Ser Ile Tyr Arg Arg Ser Val Gly Ile Pro Asn

225 230 235 240

Leu Glu Arg Tyr Thr Ser Gln Thr Phe Leu Gly Val Pro Val Ser Ile

245 250 255

Gly Asp Asp Arg Cys Leu Thr Asn Tyr Ala Thr Asp Leu Gly Lys Thr

260 265 270

Val Tyr Gln Ser Thr Ala Arg Cys Asp Thr Asp Val Pro Asp Lys Phe

275 280 285

Lys Val Phe Ile Lys Gln Gln Asn Arg Trp Asn Lys Ser Phe Phe Arg

290 295 300

Glu Ser Ile Ile Ser Val Lys Lys Leu Leu Ala Thr Pro Ser Val Ala

305 310 315 320

Val Trp Thr Ile Thr Glu Val Ser Met Phe Ile Met Leu Val Tyr Ser

325 330 335

Ile Phe Ser Leu Leu Ile Gly Glu Ala Gln Glu Phe Asn Leu Ile Lys

340 345 350

Leu Val Ala Phe Leu Val Ile Ile Phe Ile Val Ala Leu Cys Arg Asn

355 360 365

Val His Tyr Met Val Lys His Pro Phe Ala Phe Leu Leu Ser Pro Phe

370 375 380

Tyr Gly Leu Ile His Leu Phe Val Leu Gln Pro Leu Lys Ile Tyr Ser

385 390 395 400

Leu Phe Thr Ile Arg Asn Ala Thr Trp Gly Thr Arg Lys Lys Thr Ser

405 410 415

Lys

<210> 104

<211> 1203

<212> DNA

<213> 乳房链球菌(streptococcus uberis)

<220>

<221> CDS

<222> (1)..(1203)

<223>

<400> 104

gtg aaa att gca gtt gca ggt tct ggc tat gtt ggc cta tca tta agt 48

Val Lys Ile Ala Val Ala Gly Ser Gly Tyr Val Gly Leu Ser Leu Ser

1 5 10 15

gta tta tta gca cag aaa aat cct gtt aca gtt gta gat att att gag 96

Val Leu Leu Ala Gln Lys Asn Pro Val Thr Val Val Asp Ile Ile Glu

20 25 30

aag aaa gta aat ctc ata aat caa aaa caa tca cca atc cag gat gtt 144

Lys Lys Val Asn Leu Ile Asn Gln Lys Gln Ser Pro Ile Gln Asp Val

35 40 45

gat att gaa aac tat tta aaa gaa aaa aag tta caa tta aga gct act 192

Asp Ile Glu Asn Tyr Leu Lys Glu Lys Lys Leu Gln Leu Arg Ala Thr

50 55 60

cta gac gcc gat caa gca ttt agg gat gca gat ata cta att att gct 240

Leu Asp Ala Asp Gln Ala Phe Arg Asp Ala Asp Ile Leu Ile Ile Ala

65 70 75 80

aca cca acc aat tat gat gtg gag aag aat ttt ttt gat act agt cat 288

Thr Pro Thr Asn Tyr Asp Val Glu Lys Asn Phe Phe Asp Thr Ser His

85 90 95

gtt gag act gta att gag aaa gct tta gct tta aat agt cag gct ttg 336

Val Glu Thr Val Ile Glu Lys Ala Leu Ala Leu Asn Ser Gln Ala Leu

100 105 110

tta gtt att aaa tca acg ata cca ctt ggt ttt att aaa aag atg cgt 384

Leu Val Ile Lys Ser Thr Ile Pro Leu Gly Phe Ile Lys Lys Met Arg

115 120 125

caa aaa tat cag aca gac cgt att att ttt agt ccc gaa ttt ctt aga 432

Gln Lys Tyr Gln Thr Asp Arg Ile Ile Phe Ser Pro Glu Phe Leu Arg

130 135 140

gag tct aaa gct tta aaa gat aat ctt tat cct agt cga ata att gtt 480

Glu Ser Lys Ala Leu Lys Asp Asn Leu Tyr Pro Ser Arg Ile Ile Val

145 150 155 160

tcc ttt gaa gat gat gat tct atg gaa gta ata gaa gca gca aag act 528

Ser Phe Glu Asp Asp Asp Ser Met Glu Val Ile Glu Ala Ala Lys Thr

165 170 175

ttt gct caa ttg tta aaa gat ggt tct ttg gat aaa gat gtt cct gta 576

Phe Ala Gln Leu Leu Lys Asp Gly Ser Leu Asp Lys Asp Val Pro Val

180 185 190

ctt ttt atg ggt tca gca gag gct gaa gca gta aaa tta ttt gcc aat 624

Leu Phe Met Gly Ser Ala Glu Ala Glu Ala Val Lys Leu Phe Ala Asn

195 200 205

acc tat tta gct atg cgt gtc tcc tat ttt aat gag tta gat aca tat 672

Thr Tyr Leu Ala Met Arg Val Ser Tyr Phe Asn Glu Leu Asp Thr Tyr

210 215 220

gct gaa aag aat ggt tta cgt gtg gat aat att att gag ggc gtt tgc 720

Ala Glu Lys Asn Gly Leu Arg Val Asp Asn Ile Ile Glu Gly Val Cys

225 230 235 240

cat gat cga cgc ata gga att cat tat aat aac cct tct ttt ggc tat 768

His Asp Arg Arg Ile Gly Ile His Tyr Asn Asn Pro Ser Phe Gly Tyr

245 250 255

gga gga tac tgc tta cct aaa gat acc aaa cag ttg cta gca ggc tat 816

Gly Gly Tyr Cys Leu Pro Lys Asp Thr Lys Gln Leu Leu Ala Gly Tyr

260 265 270

gat ggt att cct caa tcg ctt ata aaa gca att gtt gat tct aat aaa 864

Asp Gly Ile Pro Gln Ser Leu Ile Lys Ala Ile Val Asp Ser Asn Lys

275 280 285

att cgt aaa gag tat atc gca tca caa att tta caa caa ttg agt gat 912

Ile Arg Lys Glu Tyr Ile Ala Ser Gln Ile Leu Gln Gln Leu Ser Asp

290 295 300

att aat gta gat cct aaa gat gca acg att ggt att tac cgc ctt atc 960

Ile Asn Val Asp Pro Lys Asp Ala Thr Ile Gly Ile Tyr Arg Leu Ile

305 310 315 320

atg aaa agt aac tct gat aat ttc aga gag agt gca ata aaa gat att 1008

Met Lys Ser Asn Ser Asp Asn Phe Arg Glu Ser Ala Ile Lys Asp Ile

325 330 335

att gat cat att aag agc tat caa att aat ata gtc ttg tat gag cca 1056

Ile Asp His Ile Lys Ser Tyr Gln Ile Asn Ile Val Leu Tyr Glu Pro

340 345 350

atg atg aat gaa gat ttt gat tta cca atc att gat gat tta tct gac 1104

Met Met Asn Glu Asp Phe Asp Leu Pro Ile Ile Asp Asp Leu Ser Asp

355 360 365

ttc aaa gcc atg tca cat att atc gtt tca aat aga tat gat tta gcc 1152

Phe Lys Ala Met Ser His Ile Ile Val Ser Asn Arg Tyr Asp Leu Ala

370 375 380

tta gaa gat gtt aaa gaa aaa gtt tac acc aga gat att tac ggt gtg 1200

Leu Glu Asp Val Lys Glu Lys Val Tyr Thr Arg Asp Ile Tyr Gly Val

385 390 395 400

gat 1203

Asp

<210> 105

<211> 401

<212> PRT

<213> 乳房链球菌(Streptococcus uberis)

<400> 105

Val Lys Ile Ala Val Ala Gly Ser Gly Tyr Val Gly Leu Ser Leu Ser

1 5 10 15

Val Leu Leu Ala Gln Lys Asn Pro Val Thr Val Val Asp Ile Ile Glu

20 25 30

Lys Lys Val Asn Leu Ile Asn Gln Lys Gln Ser Pro Ile Gln Asp Val

35 40 45

Asp Ile Glu Asn Tyr Leu Lys Glu Lys Lys Leu Gln Leu Arg Ala Thr

50 55 60

Leu Asp Ala Asp Gln Ala Phe Arg Asp Ala Asp Ile Leu Ile Ile Ala

65 70 75 80

Thr Pro Thr Asn Tyr Asp Val Glu Lys Asn Phe Phe Asp Thr Ser His

85 90 95

Val Glu Thr Val Ile Glu Lys Ala Leu Ala Leu Asn Ser Gln Ala Leu

100 105 110

Leu Val Ile Lys Ser Thr Ile Pro Leu Gly Phe Ile Lys Lys Met Arg

115 120 125

Gln Lys Tyr Gln Thr Asp Arg Ile Ile Phe Ser Pro Glu Phe Leu Arg

130 135 140

Glu Ser Lys Ala Leu Lys Asp Asn Leu Tyr Pro Ser Arg Ile Ile Val

145 150 155 160

Ser Phe Glu Asp Asp Asp Ser Met Glu Val Ile Glu Ala Ala Lys Thr

165 170 175

Phe Ala Gln Leu Leu Lys Asp Gly Ser Leu Asp Lys Asp Val Pro Val

180 185 190

Leu Phe Met Gly Ser Ala Glu Ala Glu Ala Val Lys Leu Phe Ala Asn

195 200 205

Thr Tyr Leu Ala Met Arg Val Ser Tyr Phe Asn Glu Leu Asp Thr Tyr

210 215 220

Ala Glu Lys Asn Gly Leu Arg Val Asp Asn Ile Ile Glu Gly Val Cys

225 230 235 240

His Asp Arg Arg Ile Gly Ile His Tyr Asn Asn Pro Ser Phe Gly Tyr

245 250 255

Gly Gly Tyr Cys Leu Pro Lys Asp Thr Lys Gln Leu Leu Ala Gly Tyr

260 265 270

Asp Gly Ile Pro Gln Ser Leu Ile Lys Ala Ile Val Asp Ser Asn Lys

275 280 285

Ile Arg Lys Glu Tyr Ile Ala Ser Gln Ile Leu Gln Gln Leu Ser Asp

290 295 300

Ile Asn Val Asp Pro Lys Asp Ala Thr Ile Gly Ile Tyr Arg Leu Ile

305 310 315 320

Met Lys Ser Asn Ser Asp Asn Phe Arg Glu Ser Ala Ile Lys Asp Ile

325 330 335

Ile Asp His Ile Lys Ser Tyr Gln Ile Asn Ile Val Leu Tyr Glu Pro

340 345 350

Met Met Asn Glu Asp Phe Asp Leu Pro Ile Ile Asp Asp Leu Ser Asp

355 360 365

Phe Lys Ala Met Ser His Ile Ile Val Ser Asn Arg Tyr Asp Leu Ala

370 375 380

Leu Glu Asp Val Lys Glu Lys Val Tyr Thr Arg Asp Ile Tyr Gly Val

385 390 395 400

Asp

<210> 106

<211> 912

<212> DNA

<213> 乳房链球菌(Streptococcus uberis)

<220>

<221> CDS

<222> (1)..(912)

<223>

<400> 106

atg act aaa gta aga aaa gcc att att cca gct gcc gga ctt ggc aca 48

Met Thr Lys Val Arg Lys Ala Ile Ile Pro Ala Ala Gly Leu Gly Thr

1 5 10 15

cgt ttt tta cca gca aca aaa gct ctc gct aag gaa atg ttg ccc atc 96

Arg Phe Leu Pro Ala Thr Lys Ala Leu Ala Lys Glu Met Leu Pro Ile

20 25 30

gtt gac aaa cca acc att caa ttc atc gtg gaa gaa gct ttg cgt tct 144

Val Asp Lys Pro Thr Ile Gln Phe Ile Val Glu Glu Ala Leu Arg Ser

35 40 45

ggc att gaa gaa atc ttg gtc gta aca gga aaa tca aaa cgc tcc att 192

Gly Ile Glu Glu Ile Leu Val Val Thr Gly Lys Ser Lys Arg Ser Ile

50 55 60

gaa gac cat ttt gat tcc aac ttt gaa ctc gaa tat aat ttg caa gaa 240

Glu Asp His Phe Asp Ser Asn Phe Glu Leu Glu Tyr Asn Leu Gln Glu

65 70 75 80

aaa ggg aaa act gaa ctc tta aaa tta gtt gat gaa acc act tct ata 288

Lys Gly Lys Thr Glu Leu Leu Lys Leu Val Asp Glu Thr Thr Ser Ile

85 90 95

aac ttg cat ttc att cgt caa agt cat ccc aaa ggc tta ggg gat gct 336

Asn Leu His Phe Ile Arg Gln Ser His Pro Lys Gly Leu Gly Asp Ala

100 105 110

gtt tta caa gca aaa gct ttt gta gga aat gaa ccc ttc att gtt atg 384

Val Leu Gln Ala Lys Ala Phe Val Gly Asn Glu Pro Phe Ile Val Met

115 120 125

ctt ggt gac gat ttg atg gac att aca aat acc aaa gct gtc cca tta 432

Leu Gly Asp Asp Leu Met Asp Ile Thr Asn Thr Lys Ala Val Pro Leu

130 135 140

acc aaa caa tta atg gac gat tat gaa aca aca cat gct tct aca ata 480

Thr Lys Gln Leu Met Asp Asp Tyr Glu Thr Thr His Ala Ser Thr Ile

145 150 155 160

gcc gta atg aaa gtt cct cac gat gac gta tcc tct tat ggt gtc att 528

Ala Val Met Lys Val Pro His Asp Asp Val Ser Ser Tyr Gly Val Ile

165 170 175

gct cca aac ggc aaa gcc ttg aat ggc tta tat agc gtg gat acc ttt 576

Ala Pro Asn Gly Lys Ala Leu Asn Gly Leu Tyr Ser Val Asp Thr Phe

180 185 190

gtt gaa aaa cca aaa cct gag gac gca cca agt gac ctt gct atc att 624

Val Glu Lys Pro Lys Pro Glu Asp Ala Pro Ser Asp Leu Ala Ile Ile

195 200 205

gga cgt tat ctc tta aca cct gaa att ttt gac att ctt gaa aat caa 672

Gly Arg Tyr Leu Leu Thr Pro Glu Ile Phe Asp Ile Leu Glu Asn Gln

210 215 220

gca cca ggt gcc gga aac gaa gtc caa tta act gat gct atc gat acc 720

Ala Pro Gly Ala Gly Asn Glu Val Gln Leu Thr Asp Ala Ile Asp Thr

225 230 235 240

ctc aac aaa aca caa cgt gtt ttt gct cgt gag ttt act ggc aaa cgc 768

Leu Asn Lys Thr Gln Arg Val Phe Ala Arg Glu Phe Thr Gly Lys Arg

245 250 255

tac gat gtt gga gac aag ttt ggc ttc atg aaa aca tct atc gat tat 816

Tyr Asp Val Gly Asp Lys Phe Gly Phe Met Lys Thr Ser Ile Asp Tyr

260 265 270

gcc cta aaa cac cat caa gtc aaa gat gac cta aaa gct tat att atc 864

Ala Leu Lys His His Gln Val Lys Asp Asp Leu Lys Ala Tyr Ile Ile

275 280 285

aag tta ggt aaa gaa tta gaa aaa gca caa gat tcc aaa gsa agc aaa 912

Lys Leu Gly Lys Glu Leu Glu Lys Ala Gln Asp Ser Lys Glu Ser Lys

290 295 300

<210> 107

<211> 304

<212> PRT

<213> 乳房链球菌(Streptococcus uberis)

<400> 107

Met Thr Lys Val Arg Lys Ala Ile Ile Pro Ala Ala Gly Leu Gly Thr

1 5 10 15

Arg Phe Leu Pro Ala Thr Lys Ala Leu Ala Lys Glu Met Leu Pro Ile

20 25 30

Val Asp Lys Pro Thr Ile Gln Phe Ile Val Glu Glu Ala Leu Arg Ser

35 40 45

Gly Ile Glu Glu Ile Leu Val Val Thr Gly Lys Ser Lys Arg Ser Ile

50 55 60

Glu Asp His Phe Asp Ser Asn Phe Glu Leu Glu Tyr Asn Leu Gln Glu

65 70 75 80

Lys Gly Lys Thr Glu Leu Leu Lys Leu Val Asp Glu Thr Thr Ser Ile

85 90 95

Asn Leu His Phe Ile Arg Gln Ser His Pro Lys Gly Leu Gly Asp Ala

100 105 110

Val Leu Gln Ala Lys Ala Phe Val Gly Asn Glu Pro Phe Ile Val Met

115 120 125

Leu Gly Asp Asp Leu Met Asp Ile Thr Asn Thr Lys Ala Val Pro Leu

130 135 140

Thr Lys Gln Leu Met Asp Asp Tyr Glu Thr Thr His Ala Ser Thr Ile

145 150 155 160

Ala Val Met Lys Val Pro His Asp Asp Val Ser Ser Tyr Gly Val Ile

165 170 175

Ala Pro Asn Gly Lys Ala Leu Asn Gly Leu Tyr Ser Val Asp Thr Phe

180 185 190

Val Glu Lys Pro Lys Pro Glu Asp Ala Pro Ser Asp Leu Ala Ile Ile

195 200 205

Gly Arg Tyr Leu Leu Thr Pro Glu Ile Phe Asp Ile Leu Glu Asn Gln

210 215 220

Ala Pro Gly Ala Gly Asn Glu Val Gln Leu Thr Asp Ala Ile Asp Thr

225 230 235 240

Leu Asn Lys Thr Gln Arg Val Phe Ala Arg Glu Phe Thr Gly Lys Arg

245 250 255

Tyr Asp Val Gly Asp Lys Phe Gly Phe Met Lys Thr Ser Ile Asp Tyr

260 265 270

Ala Leu Lys His His Gln Val Lys Asp Asp Leu Lys Ala Tyr Ile Ile

275 280 285

Lys Leu Gly Lys Glu Leu Glu Lys Ala Gln Asp Ser Lys Glu Ser Lys

290 295 300

<210> 108

<211> 5158

<212> DNA

<213> 似马链球菌(Streptococcus equisimilis)

<400> 108

tcaatttatg gctttttgct gatagcttac ctattagtca aaatgtcctt atcctttttt 60

tacaagccat ttaagggaag ggctgggcaa tataaggttg cagccattat tccctcttat 120

aacgaagatg ctgagtcatt gctagagacc ttaaaaagtg ttcagcagca aacctatccc 180

ctagcagaaa tttatgttgt tgacgatgga agtgctgatg agacaggtat taagcgcatt 240

gaagactatg tgcgtgacac tggtgaccta tcaagcaatg tcattgttca tcggtcagag 300

aaaaatcaag gaaagcgtca tgcacaggcc tgggcctttg aaagatcaga cgctgatgtc 360

tttttgaccg ttgactcaga tacttatatc taccctgatg ctttagagga gttgttaaaa 420

acctttaatg acccaactgt ttttgctgcg acgggtcacc ttaatgtcag aaatagacaa 480

accaatctct taacacgctt gacagatatt cgctatgata atgcttttgg cgttgaacga 540

gctgcccaat ccgttacagg taatatcctt gtttgctcag gtccgcttag cgtttacaga 600

cgcgaggtgg ttgttcctaa catagataga tacatcaacc agaccttcct gggtattcct 660

gtaagtattg gtgatgacag gtgcttgacc aactatgcaa ctgatttagg aaagactgtt 720

tatcaatcca ctgctaaatg tattacagat gttcctgaca agatgtctac ttacttgaag 780

cagcaaaacc gctggaacaa gtccttcttt agagagtcca ttatttctgt taagaaaatc 840

atgaacaatc cttttgtagc cctatggacc atacttgagg tgtctatgtt tatgatgctt 900

gtttattctg tggtggattt ctttgtaggc aatgtcagag aatttgattg gctcagggtt 960

ttagcctttc tggtgattat cttcattgtt gccctgtgtc ggaacattca ttacatgctt 1020

aagcacccgc tgtccttctt gttatctccg ttttatgggg tgctgcattt gtttgtccta 1080

cagcccttga aattatattc tctttttact attagaaatg ctgactgggg aacacgtaaa 1140

aaattattat aaaccaacta gacctaggtt ctgacaaggg agctaagcta gggataaaca 1200

aagagttttg atccgactcg agcagctcat aaacgaaagc tatcccactt gtaattgaag 1260

ctaagagctt ttagcttgca gctctataaa gacgaaccag aggctgagtg tcagctttgg 1320

tgtgagggct aggtcattat gatccttcag gtgtggcacc tgagctccgg cagtagctaa 1380

ctgtactaag gtatcaaagg aaaaaatgaa gtgaaaattt ctgtagcagg ctcaggatat 1440

gtcggcctat ccttgagtat tttactggca caacataatg acgtcactgt tgttgacatt 1500

attgatgaaa aggtgagatt gatcaatcaa ggcatatcgc caatcaagga tgctgatatt 1560

gaggagtatt taaaaaatgc gccgctaaat ctcacagcga cgcttgatgg cgcaagcgct 1620

tatagcaatg cagaccttat tatcattgct actccgacaa attatgacag cgaacgcaac 1680

tactttgaca caaggcatgt tgaagaggtc atcgagcagg tcctagacct aaatgcgtca 1740

gcaaccatta ttatcaaatc aaccatacca ctaggcttta tcaagcatgt tagggaaaaa 1800

taccagacag atcgtattat ttttagccca gaatttttaa gagaatcaaa agccttatac 1860

gataaccttt acccaagtcg gatcattgtt tcttatgaaa aggacgactc accaagggtt 1920

attcaggctg ctaaagcctt tgctggtctt ttaaaggaag gagccaaaag caaggatact 1980

ccggtcttat ttatgggctc acaggaggct gaggcggtca agctatttgc gaataccttt 2040

ttggctatgc gggtgtctta ctttaatgaa ttagacacct attccgaaag caagggtcta 2100

gatgctcagc gcgtgattga aggagtctgt catgatcagc gcattggtaa ccattacaat 2160

aacccttcct ttggatatgg cggctattgc ctgccaaagg acagcaagca gctgttggca 2220

aattatagag gcattcccca gtccttgatg tcagcgattg ttgaatccaa caagatacga 2280

aaatcttatt tggctgaaca aatattagac agagcctcta gtcaaaagca ggctggtgta 2340

ccattaacga ttggctttta ccgcttgatt atgaaaagca actctgataa tttccgagaa 2400

agcgccatta aagatattat tgatatcatc aacgactatg gggttaatat tgtcatttac 2460

gaacccatgc ttggcgagga tattggctac agggttgtca aggacttaga gcagttcaaa 2520

aacgagtcta caatcattgt gtcaaatcgc tttgaggacg acctaggaga tgtcattgat 2580

aaggtttata cgagagatgt ctttggaaga gactagtcag aaaacgaatg gcactcataa 2640

ggaaccacaa atcaaggagg aactcatgac aaaggtcaga aaagccatta tcccagccgc 2700

cggcctaggc actcgcttcc tgcccgccac caaggcactg gccaaggaaa tgctcccaat 2760

cgtcgataag ccaaccattc aattcatcgt cgaggaagcc ctaaaggcag gtatcgagga 2820

gattcttgtc gtcaccggca aggccaaacg ctctatcgag gaccactttg actccaactt 2880

cgagctcgaa tacaatctcc aagccaaggg caaaaccgag ctactcaagc tcgttgatga 2940

gaccactgcc atcaacctgc acttcattcg tcagagccac cctagaggac taggggacgc 3000

tgtcctccaa gccaaggcct ttgttggcaa tgagcccttt gtggtcatgc tgggggatga 3060

cctcatggat attaccaatc ctagtgccaa gcccttgacc aagcagctta ttgaggatta 3120

tgattgcaca cacgcctcaa cgattgcagt gatgagggtg ccgcatgagg aggtttccaa 3180

ttatggtgtg attgcaccgc aagggaaggc tgttaagggc ttgtatagtg tggagacctt 3240

tgttgagaag ccaagtccag atgaggcacc gagtgactta gcgattattg gtcgatattt 3300

gttgacgcct gagatttttg ccatattgga gaagcaggcg cctggagctg gcaatgaggt 3360

acagctgacc gatgcgattg acaagctcaa taagacacag cgggtttttg cgagggagtt 3420

taagggagag cggtatgatg ttggggacaa gtttggcttt atgaagacct cacttgacta 3480

tgctctcaag caccctcagg tcaaggacga cctcactgac tacattataa agctcagtaa 3540

gcaactgaac aaggacgtca agaaataggc gtttattgat cagctattgc agagctattt 3600

aaaagcattt agagctttaa ggtgggatac tagaggattg gtatctcact ttttaggctg 3660

acttgtatta ataccaaaag ccaaaactag gcagataagc ataaggaatt agattaaaaa 3720

taaggaacca aaacatgaaa aactacgcca ttatcctagc agctggaaag ggaacgcgca 3780

tgaagtcagc gcttcccaag gtgctgcaca aggtatcagg cctaagcatg ctggagcatg 3840

tcctcaagag tgtctcagcc ctagcccctc aaaagcagct cacagtgatc ggtcatcagg 3900

cagagcaggt gcgtgctgtc ctaggagagc aatcgctaac agtggtgcaa gaggagcagc 3960

tagggacagg ccatgcagtc atgatggcag aagaggagct atctggctta gaggggcaaa 4020

ccctagtgat tgcaggtgac acccccttga tcagaggaga aagcctcaag gctctgctag 4080

actatcatat cagagaaaag aatgtggcaa ccattctcac agccaatgcc aaggatccct 4140

ttggctatgg acgaatcatt cgcaatgcag caggagaggt ggtcaacatc gttgagcaaa 4200

aggatgctaa tgaggcagag caagaggtca aggagatcaa cacagggact tatatctttg 4260

acaataagcg cctttttgag gctctaaagc atctcacgac tgataatgcc caaggggagt 4320

actacctaac cgatgtgatc agtattttca aggctggcca agaaagggtt ggcgcttacc 4380

tgctgaagga ctttgatgag agcctagggg ttaatgatcg cttagctcta gcccaggccg 4440

aggtgattat gcaagagcgg atcaacaggc agcacatgct taatggggtg accctgcaaa 4500

acccggcagc tacctatatt gaaagcagtg tagagattgc accagacgtc ttgattgaag 4560

ccaatgtgac cttaaaggga cagactagaa ttggcagcag aagtgtcata agcaatggga 4620

gctatatcct tgattcgagg cttggtgagg gtgtagtggt tagccagtcg gtgattgagg 4680

cttcagtctt agcagatgga gtgacagtag ggccatatgc acacattcgc ccggactccc 4740

agctcgatga gtgtgttcat attgggaact ttgtagaggt taaggggtct catctagggg 4800

ccaataccaa ggcagggcat ttgacttacc tggggaatgc cgagattggc tcagaggtta 4860

acattggtgc aggaagcatt acggttaatt atgatggtca acggaaatac cagacagtga 4920

ttggcgatca cgcttttatt gggagtcatt cgactttgat agctccggta gaggttgggg 4980

agaatgcttt aacagcagca gggtctacga tagcccagtc agtgccggca gacagtgtgg 5040

ctatagggcg cagccgtcag gtggtgaagg aaggctatgc caagaggctg ccgcaccacc 5100

caaatcaagc ctaatcgctc aaccaaaaga ggcaggtgag aaaacctagg ccattaaa 5158

Claims

1.一种制备透明质酸的方法，包括：(a)在适宜制备透明质酸的条件下培养芽孢杆菌属宿主细胞，其中芽孢杆菌属宿主细胞包含核酸构建体，所述核酸构建体含有透明质酸合酶编码序列，该序列可操作性连接于与透明质酸合酶编码序列异源的启动子序列；和(b)从培养基中回收透明质酸。

2.权利要求1的方法，其中透明质酸合酶编码序列编码I型透明质酸合酶。

3.权利要求2的方法，其中I型透明质酸合酶编码序列获自链球菌属菌株。

4.权利要求3的方法，其中链球菌菌株是似马链球菌、酿脓链球菌、乳房链球菌或马链球菌兽瘟亚种。

5.权利要求1的方法，其中透明质酸合酶编码序列选自(a)编码一种多肽的核酸序列，所述多肽的氨基酸序列与SEQ ID NO：2、SEQ ID NO：93或SEQ ID NO：103有至少约70％、约75％、约80％、约85％、约90％或约95％同一性的；氨基酸序列；(b)在低、中、或高严紧条件下与SEQ ID NO：1、SEQ ID NO：92或SEQ ID NO：102杂交的核酸序列；和(c)(a)或(b)的互补链。

6.权利要求5的方法，其中透明质酸合酶编码序列编码含有SEQ IDNO：2、SEQ ID NO：93或SEQ ID NO：103或其具有透明质酸合酶活性的片段的氨基酸序列的多肽。

7.权利要求1的方法，其中透明质酸合酶编码序列编码II型透明质酸合酶。

8.权利要求7的方法，其中II型透明质酸合酶编码序列获自巴斯德菌属菌株。

9.权利要求8的方法，其中巴斯德菌属菌株为出血败血性巴斯德菌。

10.权利要求1的方法，其中透明质酸合酶编码序列选自(a)编码一种多肽的核酸序列，所述多肽的氨基酸序列与SEQ ID NO：95有至少约70％、约75％、约80％、约85％、约90％或约95％同一性；(b)在低、中、或高严紧条件下与SEQ ID NO：94杂交的核酸序列；和(c)(a)或(b)的互补链。

11.权利要求10的方法，其中透明质酸合酶编码序列编码含有SEQ IDNO：95或其具有透明质酸合酶活性的片段的氨基酸序列的多肽。

12.权利要求1的方法，其中透明质酸的前体糖由芽孢杆菌属宿主细胞供给或制备。

13.权利要求12的方法，其中前体糖为D-葡萄糖醛酸或N-乙酰葡糖胺。

14.权利要求12的方法，其中前体糖由芽孢杆菌属宿主细胞中内源性基因、非内源性基因，或内源性和非内源性基因的组合所编码。

15.权利要求1的方法，其中核酸构建体还包含一个或多个编码透明质酸前体糖的生物合成中的酶的基因或所述芽孢杆菌属宿主细胞还包含一个或多个第二个核酸构建体，所述核酸构建体含有一个或多个编码透明质酸前体糖的生物合成中的酶的基因。

16.权利要求15的方法，其中一个或多个基因选自UDP-葡萄糖6-脱氢酶基因、UDP-葡萄糖焦磷酸化酶基因、UDP-N-乙酰葡糖胺焦磷酸化酶基因、葡萄糖-6-磷酸异构酶基因、己糖激酶基因、磷酸葡糖变位酶基因、酰胺转移酶基因、变位酶基因和乙酰基转移酶基因。

17.权利要求16的方法，其中所述UDP-葡萄糖6-脱氢酶基因为hasB基因或tuaD基因或其同系物。

18.权利要求17的方法，其中所述hasB基因选自(a)编码一种多肽的核酸序列，所述多肽的氨基酸序列与SEQ ID NO：41、SEQ ID NO：97或SEQ ID NO：105有至少约70％、约75％、约80％、约85％、约90％或约95％同一性；(b)在低、中、或高严紧条件下与SEQ ID NO：40、SEQ ID NO：96或SEQ ID NO：104杂交的核酸序列；和(c)(a)或(b)的互补链。

19.权利要求18的方法，其中所述hasB基因编码含有SEQ ID NO：41、SEQ ID NO：97或SEQ ID NO：105的氨基酸序列，或其具有UDP-葡萄糖6-脱氢酶活性的片段的多肽。

20.权利要求17的方法，其中所述tuaD基因选自(a)编码一种多肽的核酸序列，所述多肽的氨基酸序列与SEQ ID NO：12有至少约70％、约75％、约80％、约85％、约90％或约95％同一性；(b)在低、中、或高严紧条件下与SEQ ID NO：11杂交的核酸序列；和(c)(a)或(b)的互补链。

21.权利要求20的方法，其中所述tuaD基因编码含有SEQ ID NO：12的氨基酸序列，或其具有UDP-葡萄糖6-脱氢酶活性的片段的多肽。

22.权利要求16的方法，其中所述UDP葡萄糖焦磷酸化酶基因为hasC基因或gtaB基因或其同系物。

23.权利要求22的方法，其中所述hasC基因选自(a)编码一种多肽的核酸序列，所述多肽的氨基酸序列与SEQ ID NO：43、SEQ ID NO：99或SEQ ID NO：107有至少约70％、约75％、约80％、约85％、约90％或约95％同一性；(b)在低、中、或高严紧条件下与SEQ ID NO：42或SEQ ID NO：98或SEQ ID NO：106杂交的核酸序列；和(c)(a)或(b)的互补链。

24.权利要求23的方法，其中所述hasC基因编码含有SEQ ID NO：43或SEQ ID NO：99或SEQ ID NO：107的氨基酸序列，或其具有UDP葡萄糖焦磷酸化酶活性的片段的多肽。

25.权利要求22的方法，其中所述gtaB基因选自(a)编码多肽的核酸序列，所述多肽的氨基酸序列与SEQ ID NO：22有至少约70％、约75％、约80％、约85％、约90％或约95％同一性；(b)在低、中、或高严紧条件下与SEQ ID NO：21杂交的核酸序列；和(c)(a)或(b)的互补链。

26.权利要求25的方法，其中所述gtaB基因编码含有SEQ ID NO：22的氨基酸序列，或其具有UDP葡萄糖焦磷酸化酶活性的片段的多肽。

27.权利要求16的方法，其中所述UDP-N-乙酰葡糖胺焦磷酸化酶基因为hasD或gcaD基因或其同系物。

28.权利要求27的方法，其中所述hasD基因选自(a)编码多肽的核酸序列，所述多肽的氨基酸序列与SEQ ID NO：45有至少约70％、约75％、约80％、约85％、约90％或约95％同一性；(b)在低、中、或高严谨条件下与SEQ ID NO：44杂交的核酸序列；和(c)(a)或(b)的互补链。

29.权利要求28的方法，其中所述hasD基因编码含有SEQ ID NO：45的氨基酸序列，或其具有UDP-N-乙酰葡糖胺焦磷酸化酶活性的片段的多肽。

30.权利要求27的方法，其中所述gcaD基因选自(a)编码一种多肽的核酸序列，所述多肽的氨基酸序列与SEQ ID NO：30有至少约70％、约75％、约80％、约85％、约90％或约95％同一性；(b)在低、中、或高严紧条件下与SEQ ID NO：29杂交的核酸序列；和(c)(a)或(b)的互补链。

31.权利要求30的方法，其中所述gcaD基因编码含有SEQ ID NO：30的氨基酸序列，或其具有UDP-N-乙酰葡糖胺焦磷酸化酶活性的片段的多肽。

32.权利要求16的方法，其中葡萄糖-6-磷酸异构酶基因为hasE或其同系物。

33.权利要求32的方法，其中所述hasE基因选自(a)编码多肽的核酸序列，所述多肽的氨基酸序列与SEQ ID NO：101有至少约70％、约75％、约80％、约85％、约90％或约95％同一性；(b)在低、中、或高严紧条件下与SEQ ID NO：100杂交的核酸序列；和(c)(a)或(b)的互补链。

34.权利要求33的方法，其中所述hasE基因编码含有SEQ ID NO：101的氨基酸序列，或其具有葡萄糖-6-磷酸异构酶活性的片段的多肽。

35.权利要求15的方法，其中一个或多个编码前体糖的基因受控于与透明质酸合酶编码序列相同或不同的启动子。

36.权利要求的方法35，其中所述相同或不同的启动子序列包含“共有序列”启动子，该“共有序列”启动子包含“-35”区的TTGACA序列和“-10”区的TATAAT序列。

37.权利要求的方法35，其中所述相同或不同的启动子序列为串联启动子，其中串联启动子的每个启动子可操作性连接于透明质酸合酶编码序列。

38.权利要求1的方法，其中所述核酸构建体还包含位于启动子序列下游和透明质酸合酶编码序列上游的mRNA加工/稳定序列。

39.权利要求15的方法，其中所述核酸构建体还包含位于不同的启动子或不同的一个或多个编码前体糖生物合成中的酶的基因的启动子下游和一个或多个基因上游的mRNA加工/稳定序列。

40.权利要求1的方法，其中所述核酸构建体还包含可选择的标记基因。

41.权利要求1的方法，其中所述芽孢杆菌属宿主细胞选自Bacillusagaradherens、嗜碱芽孢杆菌、解淀粉芽胞杆菌、短芽胞杆菌、环状芽胞杆菌、克劳氏芽孢杆菌、凝结芽胞杆菌、坚硬芽胞杆菌、灿烂芽胞杆菌、迟缓芽胞杆菌、地衣形芽胞杆菌、巨大芽胞杆菌、短小芽胞杆菌、嗜热脂肪芽胞杆菌、枯草芽孢杆菌和苏芸金芽胞杆菌。

42.权利要求1的方法，其中所述芽孢杆菌属宿主细胞为枯草芽孢杆菌。

43.权利要求1的方法，其中所述芽孢杆菌属宿主细胞为地衣形芽胞杆菌。

44.权利要求1的方法，其中所述芽孢杆菌属宿主细胞未用可选择的标记进行标记。

45.权利要求1的方法，其中所述核酸构建体包含可操作性连接于包含“-35”区TTGACA序列和“-10”区TATAAT序列的amyQ短“共有序列”启动子的透明质酸合酶基因，UDP-葡萄糖6-脱氢酶基因和UDP葡萄糖焦磷酸化酶基因。

46.包含核酸构建体的芽孢杆菌属宿主细胞，所述核酸构建体含有可操作性连接于与透明质酸合酶编码序列异源的启动子序列。

47.权利要求46的芽孢杆菌属宿主细胞，其中所述透明质酸合酶编码序列编码I型透明质酸合酶。

48.权利要求47的芽孢杆菌属宿主细胞，其中所述I型透明质酸合酶编码序列获自链球菌属菌株。

49.权利要求48的芽孢杆菌属宿主细胞，其中所述链球菌属菌株为似马链球菌，酿脓链球菌、乳房链球菌或马链球菌兽瘟亚种。

50.权利要求46的芽孢杆菌属宿主细胞，其中所述透明质酸合酶编码序列选自(a)编码一种多肽的核酸序列，所述多肽的氨基酸序列与SEQ IDNO：2、SEQ ID NO：93或SEQ ID NO：103有至少约70％、约75％、约80％、约85％、约90％或约95％同一性；(b)在低、中、或高严紧条件下与SEQ IDNO：1、SEQ ID NO：92或SEQ ID NO：102杂交的核酸序列；和(c)(a)或(b)的互补链。

51.权利要求50的芽孢杆菌属宿主细胞，其中所述透明质酸合酶编码序列编码含有SEQ ID NO：2、SEQ ID NO：93或SEQ ID NO：103的氨基酸序列，或其具有透明质酸合酶活性的片段的多肽。

52.权利要求46的芽孢杆菌属宿主细胞，其中所述透明质酸合酶编码序列编码II型透明质酸合酶。

53.权利要求52的芽孢杆菌属宿主细胞，其中所述II型透明质酸合酶编码序列获自巴斯德菌属菌株。

54.权利要求53的芽孢杆菌属宿主细胞，其中所述巴斯德菌属菌株为出血败血性巴斯德菌。

55.权利要求46的芽孢杆菌属宿主细胞，其中所述透明质酸合酶编码序列选自(a)编码一种多肽的核酸序列，所述多肽的氨基酸序列与SEQ IDNO：95有至少约70％、约75％、约80％、约85％、约90％或约95％同一性；(b)在低、中、或高严紧条件下与SEQ ID NO：94杂交的核酸序列；和(c)(a)或(b)的互补链。

56.权利要求55的芽孢杆菌属宿主细胞，其中所述透明质酸合酶编码序列编码含有SEQ ID NO：95的氨基酸序列，或其具有透明质酸合酶活性的片段的多肽。

57.权利要求46的芽孢杆菌属宿主细胞，其中将透明质酸的前体糖供应给或由芽孢杆菌属宿主细胞生成。

58.权利要求57的芽孢杆菌属宿主细胞，其中所述前体糖为D-葡萄糖醛酸或N-乙酰葡糖胺。

59.权利要求57的芽孢杆菌属宿主细胞，其中所述前体糖由芽孢杆菌属宿主细胞中的内源性基因、非内源性基因，或内源性和非内源性基因的组合编码。

60.权利要求46的芽孢杆菌属宿主细胞，其中所述核酸构建体还包含一个或多个编码透明质酸前体糖的生物合成中的酶的基因或所述芽孢杆菌属宿主细胞还包含一个或多个第二个核酸构建体，所述核酸构建体含有一个或多个编码透明质酸前体糖的生物合成中的酶的基因。

61.权利要求60的芽孢杆菌属宿主细胞，其中一个或多个基因选自UDP-葡萄糖6-脱氢酶基因、UDP-葡萄糖焦磷酸化酶基因、UDP-N-乙酰葡糖胺焦磷酸化酶基因、葡萄糖-6-磷酸异构酶基因、己糖激酶基因、磷酸葡糖变位酶基因、酰胺转移酶基因、变位酶基因和乙酰基转移酶基因。

62.权利要求61的芽孢杆菌属宿主细胞，其中所述UDP-葡萄糖6-脱氢酶基因为hasB基因或tuaD基因或其同系物。

63.权利要求62的芽孢杆菌属宿主细胞，其中所述hasB基因选自(a)编码一种多肽的核酸序列，所述多肽的氨基酸序列与SEQ ID NO：41、SEQID NO：97或SEQ ID NO：105有至少约70％、约75％、约80％、约85％、约90％或约95％同一性；(b)在低、中、或高严紧条件下与SEQ ID NO：40、SEQ ID NO：96或SEQ ID NO：104杂交的核酸序列；和(c)(a)或(b)的互补链。

64.权利要求63的芽孢杆菌属宿主细胞，其中所述hasB基因编码含有SEQ ID NO：41，SEQ ID NO：97，或SEQ ID NO：105的氨基酸序列，或其具有UDP-葡萄糖6-脱氢酶活性的片段的多肽。

65.权利要求62的芽孢杆菌属宿主细胞，其中所述tuaD基因选自(a)编码一种多肽的核酸序列，所述多肽的氨基酸序列与SEQ ID NO：12有至少约70％、约75％、约80％、约85％、约90％或约95％同一性；(b)在低、中、或高严紧条件下与SEQ ID NO：11杂交的核酸序列；和(c)(a)或(b)的互补链。

66.权利要求65的芽孢杆菌属宿主细胞，其中所述tuaD基因编码含有SEQ ID NO：12的氨基酸序列，或其具有UDP-葡萄糖6-脱氢酶活性的片段的多肽。

67.权利要求61的芽孢杆菌属宿主细胞，其中所述UDP葡萄糖焦磷酸化酶基因为hasC基因或gtaB基因或其同系物。

68.权利要求67的芽孢杆菌属宿主细胞，其中所述hasC基因选自(a)编码一种多肽的核酸序列，所述多肽的氨基酸序列与SEQ ID NO：43、SEQID NO：99或SEQ ID NO：107有至少约70％、约75％、约80％、约85％、约90％或约95％同一性；(b)在低、中、或高严紧条件下与SEQ ID NO：42或SEQ ID NO：98或SEQ ID NO：106杂交的核酸序列；和(c)(a)或(b)的互补链。

69.权利要求68的芽孢杆菌属宿主细胞，其中所述hasC基因编码含有SEQ ID NO：43、SEQ ID NO：99或SEQ ID NO：107的氨基酸序列，或其具有UDP葡萄糖焦磷酸化酶活性的片段的多肽。

70.权利要求61的芽孢杆菌属宿主细胞，其中所述gtaB基因选自(a)编码一种多肽的核酸序列，所述多肽的氨基酸序列与SEQ ID NO：22有至少约70％、约75％、约80％、约85％、约90％或约95％同一性；(b)在低、中、或高严紧条件下与SEQ ID NO：21杂交的核酸序列；和(c)(a)或(b)的互补链。

71.权利要求70的芽孢杆菌属宿主细胞，其中所述gtaB基因编码含有SEQ ID NO：22的氨基酸序列，或其具有UDP-葡萄糖焦磷酸化酶活性的片段的多肽。

72.权利要求61的芽孢杆菌属宿主细胞，其中所述UDP-N-乙酰葡糖胺焦磷酸化酶基因为hasD或gcaD基因或其同系物。

73.权利要求72的芽孢杆菌属宿主细胞，其中所述hasD基因选自(a)编码一种多肽的核酸序列，所述多肽的氨基酸序列与SEQ ID NO：45有至少约70％、约75％、约80％、约85％、约90％或约95％同一性；(b)在低、中、或高严紧条件下与SEQ ID NO：44杂交的核酸序列；和(c)(a)或(b)的互补链。

74.权利要求73的芽孢杆菌属宿主细胞，其中所述hasD基因编码含有SEQ ID NO：45的氨基酸序列，或其具有UDP-N-乙酰葡糖胺焦磷酸化酶活性的片段的多肽。

75.权利要求72的芽孢杆菌属宿主细胞，其中所述gcaD基因选自(a)编码一种多肽的核酸序列，所述多肽的氨基酸序列与SEQ ID NO：30有至少约70％、约75％、约80％、约85％、约90％或约95％同一性；(b)在低、中、或高严紧条件下与SEQ ID NO：29杂交的核酸序列；和(c)(a)或(b)的互补链。

76.权利要求75的芽孢杆菌属宿主细胞，其中所述gcaD基因编码含有SEQ ID NO：30的氨基酸序列，或其具有UDP-N-乙酰葡糖胺葡萄糖焦磷酸化酶活性的片段的多肽。

77.权利要求61的芽孢杆菌属宿主细胞，其中6-磷酸葡萄糖异构酶基因为hasE或其同系物。

78.权利要求77的芽孢杆菌属宿主细胞，其中所述hasE基因选自(a)编码一种多肽的核酸序列，所述多肽的氨基酸序列与SEQ ID NO：101有至少约70％、约75％、约80％、约85％、约90％或约95％同一性；(b)在低、中、或高严紧条件下与SEQ ID NO：100杂交的核酸序列；和(c)(a)或(b)的互补链。

79.权利要求78的芽孢杆菌属宿主细胞，其中所述hasE基因编码含有SEQ ID NO：101的氨基酸序列，或其具有6-磷酸葡萄糖异构酶活性的片段的多肽。

80.权利要求60的芽孢杆菌属宿主细胞，其中一个或多个编码前体糖的基因受控于与透明质酸合酶编码序列相同或不同的启动子。

81.权利要求80的芽孢杆菌属宿主细胞，其中所述所述相同或不同的启动子序列包含“共有序列”启动子，该“共有序列”启动子包含“-35”区的TTGACA序列和“-10”区的TATAAT序列。

82.权利要求80的芽孢杆菌属宿主细胞，其中所述相同或不同的启动子序列为串联启动子，其中串联启动子的每个启动子可操作性连接于透明质酸合酶编码序列。

83.权利要求46的芽孢杆菌属宿主细胞，其中所述核酸构建体还包含位于启动子序列下游和透明质酸合酶编码序列上游的mRNA加工/稳定序列。

84.权利要求60的芽孢杆菌属宿主细胞，其中所述核酸构建体还包含位于不同的启动子或不同的一个或多个编码前体糖生物合成中的酶的基因的启动子下游和一个或多个基因上游的mRNA加工/稳定序列。

85.权利要求46的芽孢杆菌属宿主细胞，其中核酸构建体还包含可选择的标记基因。

86.权利要求47的芽孢杆菌属宿主细胞，其中所述芽孢杆菌属宿主细胞选自Bacillus agaradherens、嗜碱芽孢杆菌、解淀粉芽胞杆菌、短芽胞杆菌、环状芽胞杆菌、克劳氏芽孢杆菌、凝结芽胞杆菌、坚硬芽胞杆菌、灿烂芽胞杆菌、迟缓芽胞杆菌、地衣形芽胞杆菌、巨大芽胞杆菌、短小芽胞杆菌、嗜热脂肪芽胞杆菌、枯草芽孢杆菌、和苏芸金芽胞杆菌。

87.权利要求46的芽孢杆菌属宿主细胞，其中所述芽孢杆菌属宿主细胞为枯草芽孢杆菌。

88.权利要求46的芽孢杆菌属宿主细胞，其中所述芽孢杆菌属宿主细胞为地衣形芽胞杆菌。

89.权利要求46的芽孢杆菌属宿主细胞，其未用可选择的标记进行标记。

90.权利要求46的芽孢杆菌属宿主细胞，其中所述核酸构建体包含可操作性连接于包含“-35”区TTGACA序列和“-10”区TATAAT序列的amyQ短“共有序列”启动子的透明质酸合酶基因，UDP-葡萄糖6-脱氢酶基因和UDP葡萄糖焦磷酸化酶基因。

91.含有透明质酸合酶编码序列的核酸构建体，所述透明质酸合酶编码序列可操作性连接于与透明质酸合酶编码序列异源的启动子序列。

92.权利要求91的构建体，其中前体糖的基因由与透明质酸合酶编码序列的启动子相同的启动子表达。

93.权利要求91的构建体，其中前体糖的基因由与透明质酸合酶编码序列的启动子不同的启动子表达。

94.权利要求91的构建体，其中透明质酸合酶编码序列编码I型透明质酸合酶。

95.权利要求94的构建体，其中I型透明质酸合酶编码序列获自链球菌属菌株。

96.权利要求95的构建体，其中链球菌属菌株为似马链球菌、酿脓链球菌、乳房链球菌或马链球菌兽瘟亚种。

97.权利要求的构建体91，其中透明质酸合酶编码序列选自(a)编码一种多肽的核酸序列，所述多肽的氨基酸序列与SEQ ID NO：2、SEQ ID NO：93或SEQ ID NO：103有至少约70％、约75％、约80％、约85％、约90％或约95％的同一性；(b)在低、中、或高严紧条件下与SEQ ID NO：1、SEQID NO：92或SEQ ID NO：102杂交的核酸序列；和(c)(a)或(b)的互补链。

98.权利要求97的构建体，其中所述透明质酸合酶编码序列编码含有SEQ ID NO：2、SEQ ID NO：93或SEQ ID NO：103的氨基酸序列，或其具有透明质酸合酶活性的片段的多肽。

99.权利要求91的构建体，其中所述透明质酸合酶编码序列编码II型透明质酸合酶。

100.权利要求99的构建体，其中所述II型透明质酸合酶编码序列获自巴斯德菌属菌株。

101.权利要求100的构建体，其中所述巴斯德菌属菌株为出血败血性巴斯德菌。

102.权利要求的构建体91，其中透明质酸合酶编码序列选自(a)编码一种多肽的核酸序列，所述多肽的氨基酸序列与SEQ ID NO：95有至少约70％、约75％、约80％、约85％、约90％或约95％的同一性；(b)在低、中、或高严紧条件下与SEQ ID NO：94杂交的核酸序列；和(c)(a)或(b)的互补链。

103.权利要求102的构建体，其中所述透明质酸合酶编码序列编码含有SEQ ID NO：95的氨基酸序列，或其具有透明质酸合酶活性的片段的多肽。

104.权利要求91的构建体，其中核酸构建体还包含一个或多个编码透明质酸的前体糖的生物合成中的酶的基因或芽孢杆菌属宿主细胞还包含一个或多个第二个核酸构建体，所述核酸构建体包含一个或多个编码透明质酸的前体糖的生物合成中的酶的基因。

105.权利要求104的构建体，其中一个或多个基因选自UDP-葡萄糖6-脱氢酶基因、UDP-葡萄糖焦磷酸化酶基因、UDP-N-乙酰葡糖胺焦磷酸化酶基因，葡萄糖-6-磷酸异构酶基因、己糖激酶基因、磷酸葡糖变位酶基因、酰胺转移酶基因、变位酶基因和乙酰基转移酶基因。

106.权利要求105的构建体，其中UDP-葡萄糖6-脱氢酶基因为hasB基因或tuaD基因或其同系物。

107.权利要求106的构建体，其中hasB基因选自(a)编码一种多肽的核酸序列，所述多肽的氨基酸序列与SEQ ID NO：97或SEQ ID NO：99有至少约70％、约75％、约80％、约85％、约90％或约95％的同一性；(b)在低、中、或高严紧条件下与SEQ ID NO：96或SEQ ID NO：98杂交的核酸序列；和(c)(a)或(b)的互补链。

108.权利要求107的构建体，其中所述hasB基因编码含有SEQ ID NO：97或SEQ ID NO：99的氨基酸序列，或其具有UDP-葡萄糖6-脱氢酶活性的片段的多肽。

109.权利要求106的构建体，其中所述tuaD基因选自(a)编码一种多肽的核酸序列，所述多肽的氨基酸序列与SEQ ID NO：12有至少约70％、约75％、约80％、约85％、约90％或约95％的同一性；(b)在低、中、或高严紧条件下与SEQ ID NO：11杂交的核酸序列；和(c)(a)或(b)的互补链。

110.权利要求109的构建体，其中所述tuaD基因编码含有SEQ ID NO：12的氨基酸序列，或其具有UDP-葡萄糖6-脱氢酶活性的片段的多肽。

111.权利要求105的构建体，其中所述UDP葡萄糖焦磷酸化酶基因为hasC基因或gtaB基因或其同系物。

112.权利要求111的构建体，其中所述hasC基因选自(a)编码一种多肽的核酸序列，所述多肽的氨基酸序列与SEQ ID NO：43、SEQ ID NO：99或SEQ ID NO：107有至少约70％、约75％、约80％、约85％、约90％或约95％的同一性；(b)在低、中、或高严紧条件下与SEQ ID NO：42或SEQ IDNO：98或SEQ ID NO：106杂交的核酸序列；和(c)(a)或(b)的互补链。

113.权利要求112的构建体，其中所述hasC基因编码含有SEQ ID NO：43、SEQ ID NO：99或SEQ ID NO：107的氨基酸序列，或其具有UDP葡萄糖焦磷酸化酶活性的片段的多肽。

114.权利要求111的构建体，其中所述gtaB基因选自(a)编码一种多肽的核酸序列，所述多肽的氨基酸序列与SEQ ID NO：22有至少约70％、约75％、约80％、约85％、约90％或约95％的同一性；(b)在低、中、或高严紧条件下与SEQ ID NO：21杂交的核酸序列；和(c)(a)或(b)的互补链。

115.权利要求112的构建体，其中所述gtaB基因编码含有SEQ ID NO：22的氨基酸序列，或其具有UDP-葡萄糖焦磷酸化酶活性的片段的多肽。

116.权利要求105的构建体，其中所述UDP-N-乙酰葡糖胺焦磷酸化酶基因为hasD或gcaD基因或其同系物。

117.权利要求116的构建体，其中所述hasD基因选自(a)编码一种多肽的核酸序列，所述多肽的氨基酸序列与SEQ ID NO：105有至少约70％、约75％、约80％、约85％、约90％或约95％的同一性；(b)核酸序列在低、中、或高严紧条件下与SEQ ID NO：104杂交的核酸序列；和(c)(a)或(b)的互补链。

118.权利要求117的构建体，其中所述hasD基因编码含有SEQ ID NO：105的氨基酸序列，或其具有UDP-N-乙酰葡糖胺葡萄糖焦磷酸化酶活性的片段的多肽。

119.权利要求116的构建体，其中所述gcaD基因选自(a)编码一种多肽的核酸序列，所述多肽的氨基酸序列与SEQ ID NO：30有至少约70％、约75％、约80％、约85％、约90％或约95％的同一性；(b)在低、中、或高严紧条件下与SEQ ID NO：29杂交的核酸序列；和(c)(a)或(b)的互补链。

120.权利要求119的构建体，其中所述gcaD基因编码含有SEQ IDNO：30的氨基酸序列，或其具有UDP-N-乙酰葡糖胺葡萄糖焦磷酸化酶活性的片段的多肽。

121.权利要求105的构建体，其中6-磷酸葡萄糖异构酶基因为hasE或其同系物。

122.权利要求121的构建体，其中所述hasE基因选自(a)编码一种多肽的核酸序列，所述多肽的氨基酸序列与SEQ ID NO：101有至少约70％、约75％、约80％、约85％、约90％或约95％的同一性；(b)在低、中、或高严紧条件下与SEQ ID NO：100杂交的核酸序列；和(c)(a)或(b)的互补链。

123.权利要求122的构建体，其中所述hasE基因编码含有SEQ IDNO：101的氨基酸序列，或其具有6-磷酸葡萄糖异构酶活性的片段的多肽。

124.权利要求104的构建体，其中一个或多个编码前体糖的基因受控于相同或不同的启动子或与透明质酸合酶编码序列不同的启动子。

125.权利要求124的构建体，其中所述相同或不同的启动子包含“共有序列”启动子，该“共有序列”启动子包含“-35”区的TTGACA序列和“-10”区的TATAAT序列。

126.权利要求130的构建体，其中所述相同或不同的启动子序列为串联启动子，其中串联启动子的每个启动子可操作性连接于透明质酸合酶编码序列。

127.权利要求91的构建体，其中所述核酸构建体还包含位于启动子序列下游和透明质酸合酶编码序列上游的mRNA加工/稳定序列。

128.权利要求124的构建体，其中还包含位于不同的启动子或不同的一个或多个编码前体糖生物合成中的酶的基因的启动子下游和一个或多个基因上游的mRNA加工/稳定序列。

129.权利要求91的构建体，其还包含可选择的标记基因。

130.权利要求91的构建体，其包含可操作性连接于含有“-35”区TTGACA序列和“-10”区TATAAT序列的amyQ短“共有序列”启动子的透明质酸合酶基因，UDP-葡萄糖6-脱氢酶基因和UDP葡萄糖焦磷酸化酶基因。

131.编码透明质酸合酶操纵子的分离的核酸序列，含有透明质酸合酶基因或其部分和UDP-葡萄糖6-脱氢酶基因，和可选的一个或多个选自UDP-葡萄糖焦磷酸化酶基因、UDP-N-乙酰葡糖胺焦磷酸化酶基因和葡萄糖-6-磷酸异构酶基因的基因。

132.权利要求131的分离的核酸序列，其中所述透明质酸合酶基因为SEQ ID NO：1、SEQ ID NO：92、SEQ ID NO：94或SEQ ID NO：102或其编码具有透明质酸合酶活性的多肽的片段。

133.权利要求131的分离的核酸序列，其中所述UDP-葡萄糖6-脱氢酶基因为SEQ ID NO：11、SEQ ID NO：40或SEQ ID NO：96、或SEQ ID NO：104或其编码具有UDP-葡萄糖6-脱氢酶活性的多肽的片段。

134.权利要求131的分离的核酸序列，其中所述UDP葡萄糖焦磷酸化酶基因为SEQ ID NO：21、SEQ ID NO：42或SEQ ID NO：98、SEQ ID NO：106或其编码具有UDP葡萄糖焦磷酸化酶活性的多肽的片段。

135.权利要求131的分离的核酸序列，其中所述UDP-N-乙酰葡糖胺焦磷酸化酶基因为SEQ ID NO：29或SEQ ID NO：44；或其编码具有UDP-N-乙酰葡糖胺焦磷酸化酶活性的多肽的片段。

136.权利要求131的分离的核酸序列，其中所述6-磷酸葡萄糖异构酶基因为SEQ ID NO：100或其编码具有6-磷酸葡萄糖异构酶活性的多肽的片段。

137.权利要求131的分离的核酸序列，其还包含一个或多个选自己糖激酶基因、磷酸葡糖变位酶基因、酰胺转移酶基因、变位酶基因和乙酰基转移酶基因的基因。

138.权利要求131的分离的核酸序列，其包含透明质酸合酶基因、UDP-葡萄糖6-脱氢酶基因和UDP葡萄糖焦磷酸化酶基因。

139.权利要求131的分离的核酸序列，含有SEQ ID NO：108的核酸序列。

140.包含权利要求131的核酸构建体的重组表达载体。

141.包含权利要求139的核酸构建体的表达载体。

142.编码UDP-葡萄糖6-脱氢酶的分离的核酸序列，选自：(a)编码一种多肽的核酸序列，所述多肽的氨基酸序列与SEQ ID NO：41有至少约75％、约80％、约85％、约90％或约95％的同一性；(b)与SEQ ID NO：40有至少75％，80％，85％，90％，或95％同一性的核酸序列；(c)在中或高严紧条件下与(i)SEQ ID NO：40的核酸序列，(ii)SEQ ID NO：40中所包含的cDNA序列，或(iii)(i)或(ii)的互补链杂交的核酸序列；和(d)(a)、(b)或(c)的亚序列，其中所述亚序列编码具有UDP-葡萄糖6-脱氢酶活性的多肽片段。

143.权利要求142的核酸序列，其编码的多肽含有与SEQ ID NO：41的氨基酸序列有至少约75％、约80％、约85％、约90％或约95％同一性的氨基酸序列。

144.权利要求142的核酸序列，其编码含有SEQ ID NO：41的氨基酸序列的多肽。

145.权利要求142的核酸序列，其编码的多肽含有SEQ ID NO：41的氨基酸序列，或其具有UDP-葡萄糖6-脱氢酶活性的片段。

146.权利要求145的核酸序列，其编码的多肽含有SEQ ID NO：41的氨基酸序列。

147.权利要求142的核酸序列，其含有SEQ ID NO：40的氨基酸序列。

148.权利要求142的核酸序列，其中所述核酸序列在中或高严紧条件下与(i)SEQ ID NO：40的核酸序列，(ii)SEQ ID NO：40所含的cDNA序列，或(iii)(i)或(ii)的互补链杂交。

149.权利要求142的核酸序列，其包含在质粒pMRT106中，所述质粒包含在大肠杆菌NRRL B-30536中。

150.含有可操作性连接于一个或多个控制序列的权利要求142的核酸序列的核酸构建体，所述控制序列在适宜的表达宿主中指导多肽的制备。

151.包含权利要求150的核酸构建体的重组表达载体。

152.包含权利要求150的核酸构建体的重组宿主细胞。

153.制备具有UDP-葡萄糖6-脱氢酶活性的多肽的方法，包括(a)在适宜制备多肽的条件下培养权利要求152的宿主细胞；和(b)回收多肽。

154.由权利要求142的核酸序列所编码的具有UDP-葡萄糖6-脱氢酶活性的分离的多肽。

155.编码UDP葡萄糖焦磷酸化酶的分离的核酸序列，选自：(a)编码一种多肽的核酸序列，所述多肽的氨基酸序列与SEQ ID NO：43有至少约90％，95％，或97％的同一性；(b)与SEQ ID NO：42有至少约90％、约95％，或约97％同一性的核酸序列；(c)在高或非常高严紧条件下与(i)SEQ IDNO：42的核酸序列，(ii)SEQ ID NO：42中所包含的cDNA序列，或(iii)(i)或(ii)的互补链杂交的核酸序列；和(d)(a)、(b)或(c)的亚序列，其中所述亚序列编码具UDP葡萄糖焦磷酸化酶活性的多肽片段。

156.权利要求155的核酸序列，其编码的多肽含有与SEQ ID NO：43的氨基酸序列有至少约至少约90％、约95％或约97％同一性的氨基酸序列。

157.权利要求155的核酸序列，其编码的多肽含有SEQ ID NO：43的氨基酸序列。

158.权利要求155的核酸序列，其编码的多肽含有SEQ ID NO：43的氨基酸序列，或其具有UDP-葡萄糖焦磷酸化酶活性的片段。

159.权利要求158的核酸序列，其编码的多肽含有SEQ ID NO：43的氨基酸序列。

160.权利要求155的核酸序列，其含有SEQ ID NO：42的核酸序列。

161.权利要求的核酸序列155，其中所述核酸序列在高或非常高严紧条件下与(i)SEQ ID NO：42的核酸序列，(ii)SEQ ID NO：42所含的cDNA序列，或(iii)(i)或(ii)的互补链杂交。

162.权利要求155的核酸序列，其包含在质粒pMRT106中，所述质粒包含在大肠杆菌NRRL B-30536中。

163.含有可操作性连接于一个或多个控制序列的权利要求155的核酸序列的核酸构建体，所述控制序列在适宜的表达宿主中指导多肽的制备。

164.包含权利要求163的核酸构建体的重组表达载体。

165.包含权利要求163的核酸构建体的重组宿主细胞。

166.制备具有UDP葡萄糖焦磷酸化酶活性的多肽的方法，包括(a)在适宜制备多肽的条件下培养权利要求165的宿主细胞；和(b)回收多肽。

167.由权利要求155的核酸序列所编码的具有UDP-葡萄糖6-脱氢酶活性的分离的多肽。

168.编码UDP-N-乙酰葡糖胺焦磷酸化酶的分离的核酸序列，选自：(a)编码一种多肽的核酸序列，所述多肽的氨基酸序列与SEQ ID NO：45有至少约75％、约80％、约85％、约90％，或约95％的同一性；(b)与SEQ ID NO：44有至少75％、80％、85％、90％或95％同一性的核酸序列；(c)在低、中、或高严紧条件下与(i)SEQ ID NO：44的核酸序列，(ii)SEQ ID NO：44的cDNA序列，或(iii)(i)或(ii)的互补链杂交的核酸序列；和(d)(a)、(b)或(c)的亚序列，其中所述亚序列编码具有UDP-N-乙酰葡糖胺焦磷酸化酶活性的多肽片段。

169.权利要求的核酸序列168，其编码的多肽含有具有与SEQ ID NO：45的氨基酸序列至少约75％、约80％、约85％、约90％或约95％同一性的氨基酸序列。

170.权利要求168的核酸序列，其编码的多肽包含SEQ ID NO：45的氨基酸序列。

171.权利要求168的核酸序列，其编码的多肽含有SEQ ID NO：45的氨基酸序列，或其具有UDP-N-乙酰葡糖胺焦磷酸化酶活性的片段。

172.权利要求171的核酸序列，其编码含有SEQ ID NO：45的氨基酸序列的多肽。

173.权利要求168的核酸序列，其含有SEQ ID NO：44的核酸序列。

174.权利要求168的核酸序列，其中核酸序列在低、中、或高严紧条件下与(i)SEQ ID NO：44的核酸序列，(ii)SEQ ID NO：44所包含的cDNA序列，或(iii)(i)或(ii)的互补链杂交。

175.权利要求168的核酸序列，其包含在质粒pMRT106中，所述质粒包含在大肠杆菌NRRL B-30536中。

176.含有可操作性连接于一个或多个控制序列的权利要求168的核酸序列的核酸构建体，所述控制序列在适宜的表达宿主中指导多肽的制备。

177.包含权利要求176的核酸构建体的重组表达载体。

178.包含权利要求176的核酸构建体的重组宿主细胞。

179.制备具有UDP-N-乙酰葡糖胺焦磷酸化酶活性的多肽的方法，包括(a)在适宜制备多肽的条件下培养权利要求178的宿主细胞；和(b)回收多肽。

180.由权利要求168的核酸序列所编码的具有UDP-葡萄糖6-脱氢酶活性的分离的多肽。

181.由权利要求168的核酸序列所编码的具有UDP-葡萄糖6-脱氢酶活性的分离的多肽。

182.权利要求1的方法，其中芽孢杆菌属宿主细胞包含破坏的或缺失的cypX和/或yvmC基因。

183.权利要求46的芽孢杆菌属宿主细胞，其包含破坏的或缺失的cypX和/或yvmC基因。