在重组宿主细胞中制备透明质酸的方法
发明领域
本发明涉及在重组宿主细胞中制备透明质酸的方法。
背景技术
人体内最丰富的杂多糖(heteropolysaccharide)是葡糖胺聚糖(glycosaminoglycan)。葡糖胺聚糖是无分枝糖类聚合物,含有重复二糖单位(仅硫酸角质素在糖的核心区中为分枝的)。所述二糖单位一般包括作为第一个糖单位的两种修饰糖-N-乙酰半乳糖胺(GaINAc)或N-乙酰葡萄糖胺(GlcNAc)中的一种。第二个单位通常是糖醛酸,如葡萄糖醛酸(GlcUA)或艾杜糖醛酸。
葡糖胺聚糖是带负电荷的分子,且在溶液中具有能够带来高粘度的扩展构象。葡糖胺聚糖主要位于细胞表面上或细胞外基质中。葡糖胺聚糖在溶液中还具有低压缩性,这使得其可作为理想的生理润滑液,例如,关节。葡糖胺聚糖的刚性提供了细胞的结构完整性并提供了能使细胞发生迁移的细胞间通道。具有最重要的生理学价值的葡糖胺聚糖是透明质酸(hyaluronan)、硫酸软骨素、肝素、硫酸乙酰肝素、硫酸皮肤素和硫酸角质素。多数葡糖胺聚糖通过特异性寡糖结构与蛋白多糖核心蛋白共价结合。除游离糖链与蛋白多糖构成非共价复合物外,透明质酸与特定蛋白多糖构成大聚集物。
已经确定了透明质酸在体内的多种作用(参见LaurentT.C.and FraserJ.R.E.,1992,FASEB J.6:2397-2404;and Toole B.P.,1991,“Proteoglycans andhyaluronan in morphogenesis and differentiation.”In:Cell Biology of theExtracellular Matrix,305-341页,Hay E.D.,ed.,Plenum,New York)。透明质酸存在于透明软骨、关节液和皮肤组织的真皮以及表皮中。透明质酸还被推测在多种生理功能,如粘附,发育,细胞运动性,癌症,血管发生和创伤愈合中发挥作用。根据透明质酸的独特物理和生物学特性,可将其用于眼和关节外科中,并且正在研究其在其它医学应用中的价值。透明质酸制品已被用于矫形学,风湿病学和皮肤病学中。
公鸡冠是透明质酸的重要商业来源。微生物是可选择的来源。美国专利No.4,801,539中公开了制备透明质酸的发酵法,其中包括兽瘟链球菌菌株,所报道的产率约为3.6g透明质酸/升。欧洲专利No.EP0694616公开了采用改良的兽瘟链球菌菌株的发酵方法,所报道的产率约为3.5g透明质酸/升。
通过发酵而用于制备透明质酸的微生物是病原性细菌菌株,其中最主要的细菌属于某些链球菌属菌种。A型和C型链球菌用由透明质酸组成的非病原性荚膜将其自身围绕,所述透明质酸在组成上与在结缔组织和关节中发现的透明质酸相同。出血败血性巴斯德菌(Pasteurella multocida)(另一种病原性荚膜菌)也用透明质酸围绕其自身细胞。
已有报道描述了来自脊椎动物、细菌病原体和海藻病毒的透明质酸合酶(DeAngelis,P.L.,1999,Cell.Mol.Life SCI,56:670-682)。WO 99/23227公开了来自似马链球菌的I型透明质酸合酶。WO 99/51265和WO 00/27437公开了来自出血败血性巴斯德菌的II型透明质酸合酶(Group II hyaluronatesynthase)。Ferretti等公开了酿脓链球菌的透明质酸合酶操纵子,该操纵子包含分别编码透明质酸合酶、UDP葡萄糖脱氢酶和UDP-葡萄糖焦磷酸化酶的三个基因,hasA、hasB和hasC(Proc.Natl.Acad.Sci.USA.98,4658-4663,2001)。WO 99/51265公开了含有似马链球菌透明质酸合酶编码区的核酸片段。
杆菌已被很好地建立为用于制备天然和重组蛋白的宿主细胞系统。本发明的一个目的是提供在重组芽孢杆菌属宿主细胞中制备透明质酸的方法。
发明简述
本发明涉及制备透明质酸(hyaluronic acid)的方法,包括:(a)在适宜制备透明质酸的条件下培养芽孢杆菌属宿主细胞,其中芽孢杆菌属宿主细胞包含核酸构建体,所述核酸构建体含有透明质酸合酶编码序列,该序列可操作性连接于与透明质酸合酶编码序列异源的启动子序列;和(b)从培养基中回收透明质酸。
在优选的实施方案中,所述核酸构建体还包含一个或多个基因,所述基因编码透明质酸前体糖生物合成中的酶或芽孢杆菌属宿主细胞还包含一个或多个第二核酸构建体,该构建体含有一个或多个基因,所述基因编码前体糖生物合成中的酶。
在另一优选的实施方案中,一个或多个编码前体糖的基因受控于与透明质酸合酶编码序列相同或不同的启动子。
本发明还涉及包含核酸构建体的芽孢杆菌属宿主细胞,所述核酸构建体含有透明质酸合酶编码序列,该编码序列可操作性连接于与透明质酸合酶编码序列和所述核酸构建体异源的启动子序列。
本发明还涉及编码透明质酸合酶操纵子的分离的核酸序列,所述透明质酸合酶操纵子含有透明质酸合酶基因或其部分和UDP-葡萄糖6-脱氢酶基因,和可选的选自UDP-葡萄糖焦磷酸化酶基因、UDP-N-乙酰葡糖胺焦磷酸化酶基因和葡萄糖-6-磷酸异构酶基因的一个或多个基因。
本发明还涉及分离的编码UDP-葡萄糖6-脱氢酶的核酸序列,其选自:(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO:41有至少约75%、约80%、约85%、约90%,或约95%的同一性;(b)与SEQID NO:40有至少约75%、约80%、约85%、约90%,或约95%同一性的核酸序列;(c)在中或高严紧条件下与(i)SEQ ID NO:40的核酸序列,(ii)SEQ ID NO:40中包含的cDNA序列,或(iii)(i)或(ii)的互补链杂交的核酸序列;和(d)(a),(b)或(c)的亚序列,其中亚序列编码一种具有UDP-葡萄糖6-脱氢酶活性的多肽片段。
本发明还涉及分离的编码UDP葡萄糖焦磷酸化酶的核酸序列,其选自:(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO:43有至少90%、约95%,或约97%的同一性;(b)与SEQ ID NO:42有至少约90%、约95%,或约97%同一性的核酸序列;(c)在低、中、或高严紧条件下与(i)SEQ ID NO:42的核酸序列,(ii)SEQ ID NO:42中包含的cDNA序列,或(iii)(i)或(ii)的互补链杂交的核酸序列;和(d)(a),(b)或(c)的亚序列,其中亚序列编码一种具有UDP-N-乙酰葡糖胺焦磷酸化酶活性的多肽片段。
本发明还涉及分离的编码UDP-N-乙酰葡糖胺焦磷酸化酶的核酸序列,其选自:(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO:45有至少约75%、约80%、约85%、约90%,或约95%的同一性;(b)与SEQ ID NO:44有至少约75%、约80%、约85%、约90%,或约95%同一性的核酸序列;(c)在低、中、或高严紧条件下与(i)SEQ ID NO:44的核酸序列,(ii)SEQ ID NO:44中包含的cDNA序列,或(iii)(i)或(ii)的互补链杂交的核酸序列;和(d)(a)(b),或(c)的亚序列,其中亚序列编码一种具有UDP-N-乙酰葡糖胺焦磷酸化酶活性的多肽片段。
附图简述
图1显示透明质酸的化学结构。
图2显示透明质酸合成的生物合成途径。
图3显示pCR2.1-sehasA的限制性图谱。
图4显示pCR2.1-tuaD的限制性图谱。
图5显示pCR2.1-gtaB的限制性图谱。
图6显示pCR2.1-gcaD的限制性图谱。
图7显示PHA1的限制性图谱。
图8显示pHA2的限制性图谱。
图9显示pHA3的限制性图谱。
图10显示pHA4的限制性图谱。
图11显示pHA5的限制性图谱。
图12显示pHA6的限制性图谱。
图13显示pHA7的限制性图谱。
图14显示pMRT106的限制性图谱。
图15显示pHA8的限制性图谱。
图16显示pHA9的限制性图谱。
图17显示pHA10的限制性图谱。
图18显示pRB157的限制性图谱。
图19显示pMRT084的限制性图谱。
图20显示pMRT086的限制性图谱。
图21显示pCJ791的限制性图谱。
图22显示pMRT032的限制性图谱。
图23显示pNNB194neo的限制性图谱。
图24显示pNNB194neo-oriT的限制性图谱。
图25显示pShV3的限制性图谱。
图26显示pShV2.1-amyEΔB的限制性图谱。
图27显示pShV3A的限制性图谱。
图28显示PMRT036的限制性图谱。
图29显示pMRT037的限制性图谱。
图30显示pMRT041的限制性图谱。
图31显示PMRT064.1的限制性图谱。
图32显示pMRT068的限制性图谱。
图33显示pMRT069的限制性图谱。
图34显示pMRT071的限制性图谱。
图35显示PMRT074的限制性图谱。
图36显示pMRT120的限制性图谱。
图37显示pMRT122的限制性图谱。
图38显示pCR2.1-pel5’的限制性图谱。
图39显示pCR2.1-pel3’的限制性图谱。
图40显示pRB161的限制性图谱。
图41显示pRB162的限制性图谱。
图42显示pRB156的限制性图谱。
图43显示pRB164的限制性图谱。
图44显示多种透明质酸制备枯草芽孢杆菌菌株以大约2g蔗糖/L0-小时的分批补料,37℃发酵的总结。
图45显示获自以大约2g蔗糖/L0-小时分批补料,37℃发酵的多种透明质酸制备枯草芽孢杆菌菌株的峰量透明质酸的平均分子量(MDa)的总结。
发明详述
本发明涉及制备透明质酸的方法,包括:(a)在适宜制备透明质酸的条件下培养芽孢杆菌属宿主细胞,其中芽孢杆菌属宿主细胞包含核酸构建体,所述核酸构建体含有透明质酸合酶编码序列,该序列可操作性连接于与透明质酸合酶编码序列异源的启动子序列;和(b)从培养基中回收透明质酸。
本发明的方法改进了从病原性,荚膜细菌中制备透明质酸的方法。在荚膜细菌中,大量的透明质酸是从荚膜中制备的。在从所述来源中制备和纯化透明质酸时,首先需要从荚膜中除去透明质酸,如通过使用表面活性剂或去垢剂,如SDS。由于为了释放大部分透明质酸而必须加入表面活性剂且随后必须从最终纯化中除去表面活性剂,故此使得透明质酸的商业生产步骤非常复杂。
本发明可以从非荚膜宿主细胞中制备大量游离透明质酸。在显微镜下观察不到与重组杆菌菌株相关的可视荚膜,而通常用于透明质酸制备中的病原性细菌株包括透明质酸荚膜,该荚膜的直径至少是细胞自身的两倍。
由于将重组芽孢杆菌属细胞的透明质酸直接表达于培养基中,故可使用简单的方法从培养基中分离透明质酸。首先,从培养基中物理除去芽孢杆菌属细胞和细胞碎片,如有需要,可首先稀释所述培养基从而降低培养基的粘性。本领域技术人员已知多种可用于从培养基中除去细胞的方法,如离心或微量过滤。如有需要,可过滤保留的上清,如通过超滤,从而浓缩并从透明质酸中除去小分子污染物。除去细胞和细胞碎片后,采用已知方法对培养基中的透明质酸实施简单的沉淀。盐、乙醇或盐和乙醇组合可用于从滤出液中沉淀透明质酸。一经沉淀,透明质酸易于通过物理方法从溶液中分离出来。或者,可采用本领域已知的蒸发干燥技术,如喷雾干燥从滤出液中干燥或分离透明质酸。
因此本发明的方法改进了现有技术中通过发酵而用于商业上制备透明质酸的方法,且无须在从培养细胞中纯化的透明质酸时使用表面活性剂。
透明质酸
本文将“透明质酸”定义为非磺化葡糖胺聚糖(unsulphatedglycolsaminoglycan),其包含通过交替beta-1,4和beta-1,3糖苷键连接在一起的N-乙酰葡糖胺(GlcNAc)和葡萄糖醛酸(GlcUA)的重复二糖单位(图1)。已知,透明质酸(Hyaluronic aicd)为透明质酸(hyaluronan),透明质酸盐(酯)或HA。此处使用的术语透明质酸(hyaluronan)和透明质酸(Hyaluronic acid)可以互换。
在一个优选的实施方案中,采用本发明的方法获得的透明质酸的分子量为约10,000-约10,000,000 Da。在更优选的实施方案中,采用本发明的方法获得的透明质酸的分子量为约25,000-约5,000,000 Da。在最优选的实施方案中,采用本发明的方法获得的透明质酸的分子量为约50,000-至约3,000,000 Da。
采用本发明的芽孢杆菌属宿主细胞制备的透明质酸的水平可根据改良咔唑法(Bitter和Muir,1962,Anal Biochem.4:330-334)测定。此外,可使用现有技术中如Ueno等,1988,Chem.Pharm.Bull.36,4971-4975;Wyatt,1993,ANAL.Chim.Acta 272:1-40;和Wyatt Technologies,1999,“LightScattering University DAWN Course Manual”和“DAWN EOS Manual”WyattTechnology Corporation,Santa Barbara,California所描述的标准方法测定透明质酸的平均分子量。
可使用本领域已知的多种方法如,在美国专利No.5,616,568、5,652,347和5,874,417中所描述的交联方法,对采用本发明的方法获得的透明质酸进行修饰。此外,可使用本领域已知的方法改变透明质酸的分子量。
宿主细胞
在本发明的方法中,芽孢杆菌属宿主细胞可以是适用于重组制备透明质酸的任何芽孢杆菌属细胞。芽孢杆菌属宿主细胞可以是野生型芽孢杆菌属细胞或其突变体。适用于实施本发明的芽孢杆菌属细胞包括(但不限于)Bacillus agaraderhens、嗜碱芽孢杆菌(Bacillus alkalophilus)、解淀粉芽胞杆菌(Bacillus amyloliquefaciens)、短芽胞杆菌(Bacillus brevis)、环状芽胞杆菌(Bacillus circulans)、克劳氏芽孢杆菌(Bacillus clausii)、凝结芽胞杆菌(Bacillus coagulans,)、坚硬芽胞杆菌(Bacillus firmus)、灿烂芽胞杆菌(Bacillus lautus)、迟缓芽胞杆菌(Bacillus lentus)、地衣形芽胞杆菌(Bacilluslicheniformis)、巨大芽胞杆菌(Bacillus megaterium)、短小芽胞杆菌(Bacilluspumilus)、嗜热脂肪芽胞杆菌(Bacillus Stearothermophilus)、枯草芽孢杆菌(Bacillus subtilis)和苏芸金芽胞杆菌(Bacillus thuringiensis)细胞。WO98/22598中公开了特别适用于重组表达的枯草芽孢杆菌细胞突变体。非荚膜芽孢杆菌属细胞特别适用于本发明。
在一个优选的实施方案中,芽孢杆菌属宿主细胞是解淀粉芽胞杆菌、克劳氏芽孢杆菌、迟缓芽胞杆菌、地衣形芽胞杆菌、嗜热脂肪芽胞杆菌或枯草芽孢杆菌细胞。在更优选的实施方案中,芽孢杆菌属细胞是解淀粉芽胞杆菌细胞。在另一更为优选的实施方案中,芽孢杆菌属细胞是克劳氏芽孢杆菌细胞。在另一更为优选的实施方案中,芽孢杆菌属细胞是迟缓芽胞杆菌细胞。在另一更为优选的实施方案中,芽孢杆菌属细胞是地衣形芽胞杆菌细胞。在另一更为优选的实施方案中,芽孢杆菌属细胞是枯草芽孢杆菌细胞。在最优选的实施方案中,芽孢杆菌属宿主细胞是枯草芽孢杆菌A164Δ5(参见美国专利No.5,891,701)或枯草芽孢杆菌168Δ4。
用本发明的核酸构建体转化芽孢杆菌属宿主细胞可通过如下方法实施,例如,原生质体转化(参见例如Chang和Cohen,1979,Molecular GeneralGenetics 168:111-115)、使用感受态细胞(参见例如Young和Spizizen,1961,Journal of Bacteriology 81:823-829,或Dubnau和Davidoff-Abelson,1971,Journal of Molecular Biology 56:209-221)、电穿孔法(参见例如Shigekawa和Dower,1988,Biotechniques 6:742-751)或接合(参见例如KOEHLER和Thorne,1987,Journal of Bacteriology 169:5271-5278)。
核酸构建体
本文中将“核酸构建体”定义为一种单链或双链核酸分子,其分离自天然存在的基因或经修饰后含有以自然界不存在的方式联合和并置的核酸片段。当核酸构建体包含编码序列表达所需的所有控制序列时,术语核酸构建体可与术语表达盒同义。本文将术语“编码序列”定义为当将其置于下述控制序列的控制下时,能够转录为mRNA并翻译为目的酶的序列。编码序列的界限通常由mRNA5’末端紧接着位于开放阅读框上游的核糖体结合位点和mRNA 3’末端紧接着位于开放阅读框下游的转录终止序列来确定。编码序列可包括(但不限于)DNA、cDNA和重组核酸序列。
用于分离或克隆编码多肽的核酸序列的方法是本领域众所周知的,例如包括从基因组DNA中分离、从cDNA制备或其组合。从所述基因组DNA克隆本发明的核酸序列例如可通过表达文库的抗体筛选以检测具有共同结构特点的克隆化DNA片段或众所周知的聚合酶链反应(PCR)而得以实施。参见,例如Innis等,1990,PCR Protocols:A Guide to Methods andApplication,Academic Press,New York。可以使用其它核酸扩增方法如连接酶链反应,连接激活转录和基于核酸序列的扩增。克隆方法可能涉及对包括编码所述多肽的核酸序列的目的核酸片段进行切除和分离、所述片段插入载体分子中以及重组载体向芽孢杆菌属细胞中的掺入,在所述芽孢杆菌属细胞中所述核酸序列的克隆将被复制。所述核酸序列可以是基因组的、cDNA、RNA、半-合成、合成来源的或其任意组合。
可以用多种方式操作编码酶的分离的核酸序列以提供所述酶的表达。在将核酸序列插入到构建体或载体中之前对其操作是优选或必需的,这取决于表达载体或芽孢杆菌属宿主细胞。用克隆方法修饰核酸序列的技术是本领域众所周知的。还应认识到,核酸序列还可以通过使用本领域众所周知的方法在宿主细胞中于体内操作。
透明质酸生物合成中涉及多种酶。这些酶包括透明质酸合酶、UDP-葡萄糖6-脱氢酶、UDP-葡萄糖焦磷酸化酶、UDP-N-乙酰葡糖胺焦磷酸化酶、6-磷酸葡萄糖异构酶、己糖激酶、磷酸葡糖变位酶、酰胺转移酶、变位酶和乙酰基转移酶。透明质酸合酶是透明质酸制备过程中的关键酶。
本文将“透明质酸合酶”定义为通过加入GlcUA和GlcNAc糖前体而催化透明质酸链延长的合酶。链球菌透明质酸合酶、脊椎动物透明质酸合酶和病毒透明质酸合酶氨基酸序列不同于来自巴斯德菌的透明质酸合酶,并已经将其分为I型和II型透明质酸合酶,I型透明质酸合酶包括链球菌透明质酸合酶(DeAngelis,1999)。为了用于在芽孢杆菌属宿主细胞中制备透明质酸,真核生物源性的透明质酸合酶,如哺乳动物透明质酸合酶,为次优选的。
透明质酸合酶编码序列可以是任何能够在芽孢杆菌属宿主细胞中表达的核酸序列,所述核酸序列可以是任何来源的。优选的透明质酸合酶基因包括I型或II型的任一种,如来自似马链球菌、酿脓链球菌、乳房链球菌和马链球菌兽瘟亚种的I型透明质酸合酶基因,或出血败血性巴斯德菌的II型透明质酸合酶基因。
在一个优选的实施方案中,透明质酸合酶编码序列选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO:2、SEQ ID NO:93或SEQ ID NO:103有至少约70%、约75%、约80%、约85%、约90%,或约95%的同一性;(b)在低、中、或高严紧条件下与SEQ ID NO:1、SEQ IDNO:92或SEQ ID NO:102杂交的核酸序列;和(c)(a)或(b)的互补链。
在更优选的实施方案中,透明质酸合酶编码序列一种多肽,所述多肽含有SEQ ID NO:2、SEQ ID NO:93或SEQ ID NO:103的氨基酸序列或其具有透明质酸合酶活性的片段。
在另一优选的实施方案中,透明质酸合酶编码序列选自(a)编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO:95有至少约70%、约75%、约80%、约85%、约90%,或约95%的同一性;(b)在低、中、或高严紧条件下与SEQ ID NO:94杂交的核酸序列;和(c)(a)或(b)的互补链。
在另一更为优选的实施方案中,透明质酸合酶编码序列一种多肽,所述多肽含有SEQ ID NO:95的氨基酸序列或其具有透明质酸合酶活性的片段。
本发明的方法还包括构建体,透明质酸的前体糖(precursor sugars)经由所述构建体而供给宿主细胞,或供给培养基,或由芽孢杆菌属宿主细胞中的内源性基因、或非内源性基因、或内源性和非内源性基因的组合所编码。前体糖可以是D-葡萄糖醛酸或N-乙酰葡糖胺。
在本发明的方法中,核酸构建体还可包含一个或多个基因,所述基因编码透明质酸前体糖生物合成中的酶。或者,芽孢杆菌属宿主细胞还包含一个或多个第二核酸构建体,该构建体含有一个或多个基因,所述基因编码前体糖生物合成中的酶。通过使用含有编码指导透明质酸前体糖合成途径步骤的一个基因或多个基因的一种核酸序列或多种核酸序列的构建体提高了透明质酸的生产。“指导透明质酸前体糖合成途径中的步骤”指基因的表达蛋白具有N-乙酰葡糖胺或D-葡萄糖醛酸或是N-乙酰葡糖胺或D-葡萄糖醛酸前体的糖形式的活性(图2)。
在优选的用于供应前体糖的方法中,通过培养含有重组构建体的宿主细胞,所述重组构建体含有可操作性连接于编码指导透明质酸前体糖合成途径中步骤的基因的核酸序列的异源性启动子区,提供用于在含有透明质酸合酶的宿主细胞中提高透明质酸生产的构建体。在优选的方法中,所述宿主细胞还包含含有可操作性连接于透明质酸合酶的启动子区的重组构建体,其可以使用与N-乙酰葡糖胺的生物合成中所涉及的合酶的核酸序列相同或不同的启动子区。在另一优选的实施方案中,所述宿主细胞可包含含有可操作性连接于编码透明质酸前体糖的生物合成中所涉及的第二个基因的不同核酸序列的启动子区的重组构建体。
因此,本发明还涉及通过使用编码指导透明质酸前体糖的生物合成中步骤的基因的核酸序列的构建体而提高透明质酸生产的构建体。前体糖的核酸序列可由与编码透明质酸合酶相同或不同的启动子表达。
制备透明质酸的前体糖的生物合成中涉及的基因包括UDP-葡萄糖6-脱氢酶基因、UDP-葡萄糖焦磷酸化酶基因、UDP-N-乙酰葡糖胺焦磷酸化酶基因、葡萄糖-6-磷酸异构酶基因、己糖激酶基因、磷酸葡糖变位酶基因、酰胺转移酶基因、变位酶基因和乙酰基转移酶基因。
在含有透明质酸合酶的细胞中,可表达两个或多个hasB,hasC和hasD,或其同系物,如分别是枯草芽孢杆菌tuaD,gtaB,和gcaD,以及hasE的任一个或其组合以增加透明质酸合酶可用的前体糖的量。Bacillus基因组已经公开在Kunst等,Nature 390,249-256,“The complete genome sequence of theGram-positive bacterium Bacillus Subtilis”(20 November 1997)中。在某些情况下,如当宿主细胞不含天然透明质酸合酶活性时,所述构建体可包含hasA基因。
所述编码生物合成酶的核酸序列可以是宿主细胞天然含有的,而在其他情况下也可以使用异源序列。如果表达两个或多个基因, 其可以是与天然操纵子中的另一个基因(如包含hasA,hasB,hasC和hasD的似马链球菌HAS操纵子的基因)相关的基因。在其他情况下,可能需要使用某些前体基因序列的组合,而没有所包括操纵子的每个元件。在其他情况下,还可以优选使用宿主细胞天然的某些基因和其他外源性基因。选择将基于给定宿主细胞中的糖的可用量,细胞供应生产过剩而不会妨碍宿主细胞其它功能的能力,和所述细胞是否能调节其与外源性基因不同的天然基因的表达。
例如,根据细胞的代谢需要和生长条件以及可用的前体糖的量,其可能需要通过表达编码UDP-N-乙酰葡糖胺焦磷酸化酶的核酸序列,如hasD基因、芽孢杆菌属的gcaD基因及其同系物而提高N-乙酰葡糖胺的生产。或者,前体糖可以是D-葡萄糖醛酸。在一个所述实施方案中,所述核酸序列编码UDP-葡萄糖6-脱氢酶。所述核酸序列包括芽孢杆菌属的tuaD基因、链球菌属的hasB基因及其同系物。所述核酸序列还可编码UDP-葡萄糖焦磷酸化酶,如芽孢杆菌属中的gtaB基因、链球菌属的the hasC基因及其同系物。
在本发明的方法中,UDP-葡萄糖6-脱氢酶基因可以是hasB基因或tuaD基因或其同系物。
在一个优选的实施方案中,hasB基因选自(a)编码多肽的核酸序列,所述多肽含有具有与SEQ ID NO:41、SEQ ID NO:97或SEQ ID NO:105至少约70%、约75%、约80%、约85%、约90%或约95%同一性的氨基酸序列;(b)在低、中、或高严紧条件下与SEQ ID NO:40、SEQ ID NO:96或SEQ ID NO:104杂交的核酸序列;和(c)(a)或(b)的互补链。
在更优选的实施方案中,the hasB基因所编码的多肽含有SEQ ID NO:41、SEQ ID NO:97或SEQ ID NO:105的氨基酸序列或其具有UDP-葡萄糖6-脱氢酶活性的片段。
在另一优选的实施方案中,tuaD基因选自(a)编码多肽的核酸序列,所述多肽含有具有与SEQ ID NO:12至少约70%,约75%、约80%、约85%、约90%或约95%同一性的氨基酸序列;(b)在低、中、或高严紧条件下与SEQ ID NO:11杂交的核酸序列;和(c)(a)或(b)的互补链。
在另一更为优选的实施方案中,tuaD基因所编码的多肽含有SEQ IDNO:12的氨基酸序列或其具有UDP-葡萄糖6-脱氢酶活性的片段。
在本发明的方法中,UDP葡萄糖焦磷酸化酶基因可以是hasC基因或gtaB基因或其同系物。
在一个优选的实施方案中,hasC基因选自(a)编码多肽的核酸序列,所述多肽含有具有与SEQ ID NO:43、SEQ ID NO:99或SEQ ID NO:107至少约70%、约75%、约80%、约85%、约90%或约95%同一性的氨基酸序列;(b)在低、中、或高严紧条件下与SEQ ID NO:42或SEQ ID NO:98或SEQ ID NO:106杂交的核酸序列;和(c)(a)或(b)的互补链。
在另一更为优选的实施方案中,hasC基因所编码的多肽含有SEQ IDNO:43或SEQ ID NO:99,或SEQ ID NO:107的氨基酸序列或其具有UDP葡萄糖焦磷酸化酶活性的片段。
在另一优选的实施方案中,gtaB基因选自(a)编码多肽的核酸序列,所述多肽含有具有与SEQ ID NO:22至少约70%、约75%、约80%、约85%、约90%或约95%同一性的氨基酸序列;(b)在低、中、或高严紧条件下与SEQ ID NO:21杂交的核酸序列;和(c)(a)或(b)的互补链。
在另一更为优选的实施方案中,gtaB基因所编码的多肽含有SEQ IDNO:22的氨基酸序列或其具有UDP-葡萄糖焦磷酸化酶活性的片段。
在本发明的方法中,UDP-N-乙酰葡糖胺焦磷酸化酶基因可以是hasD或gcaD基因或其同系物。
在一个优选的实施方案中,hasD基因选自(a)编码多肽的核酸序列,所述多肽含有具有与SEQ ID NO:45至少约75%、约80%、约85%、约90%或约95%同一性的氨基酸序列;(b)在低、中、或高严紧条件下与SEQ IDNO:44杂交的核酸序列;和(c)(a)或(b)的互补链。
在另一更为优选的实施方案中,hasD基因所编码的多肽含有SEQ IDNO:45的氨基酸序列或其具有UDP-N-乙酰葡糖胺葡萄糖焦磷酸化酶活性的片段。
在另一优选的实施方案中,gcaD基因选自(a)编码多肽的核酸序列,所述多肽含有具有与SEQ ID NO:30至少约70%、约75%、约80%、约85%、约90%或约95%同一性的氨基酸序列;(b)在低、中、或高严紧条件下与SEQ ID NO:29杂交的核酸序列;和(c)(a)或(b)的互补链。
在另一更为优选的实施方案中,gcaD基因所编码的多肽含有SEQ IDNO:30的氨基酸序列或其具有UDP-N-乙酰葡糖胺葡萄糖焦磷酸化酶活性的片段。
在本发明的方法中,6-磷酸葡萄糖异构酶基因可以是hasE或其同系物。
在一个优选的实施方案中,hasE基因选自(a)编码多肽的核酸序列,所述多肽含有具有与SEQ ID NO:101至少约70%、约75%、约80%、约85%、约90%或约95%同一性的氨基酸序列;(b)在低、中、或高严紧条件下与SEQ ID NO:100杂交的核酸序列;和(c)(a)或(b)的互补链。
在另一更为优选的实施方案中,hasE基因所编码的多肽含有SEQ IDNO:101的氨基酸序列,或其具有6-磷酸葡萄糖异构酶活性的片段。
在本发明的方法中,透明质酸合酶基因和一个或多个编码前体糖的基因受控于相同的启动子。或者,一个或多个编码前体糖的基因受控于相同的启动子而用不同的启动子指导透明质酸合酶基因。另一种选择是透明质酸合酶基因和每个前体糖的基因均受控于不同的启动子。在一个优选的实施方案中,透明质酸合酶基因和一个或多个前体糖的基因受控于相同的启动子。
本发明还涉及包含编码透明质酸合酶操纵子的分离的核酸序列的核酸构建体,所述操纵子包含透明质酸合酶基因和UDP-葡萄糖6-脱氢酶基因,和可选地选自UDP-葡萄糖焦磷酸化酶基因、UDP-N-乙酰葡糖胺焦磷酸化酶基因和葡萄糖-6-磷酸异构酶基因的一个或多个基因。SEQ ID NO:108中显示编码似马链球菌的多数透明质酸合酶操纵子的核酸序列。该序列包含分别与枯草芽孢杆菌tuaD基因(SEQ ID NO:11)和gtaB基因(SEQ ID NO:21)相似的hasB(SEQ ID NO:40)和hasC(SEQ ID nO:42),以及在酿脓链球菌时,gcaD基因(SEQ ID NO:29)的已经被命名为hasD(SEQ ID NO:44)的同系物。枯草芽孢杆菌gcaD编码N-乙酰葡糖胺(两种透明质酸糖的一种)合成中的UDP-N-乙酰葡糖胺焦磷酸化酶。gcaD的似马链球菌同系物,hasD,由似马链球菌排列在透明质酸合酶操纵子上。该核酸序列还包含部分hasA基因(SEQ ID NO:1的后1156bp)。
在某些情况下,宿主细胞将包含含有可操作性连接于编码指导透明质酸前体糖合成途径中的步骤的基因的核酸序列的异源性启动子区的重组构建体,其可对应于从重组构建体表达透明质酸合酶。所述透明质酸合酶可经由与编码前体生物合成途径中涉及的酶的核酸序列相同或不同的启动子区而表达。在另一优选的实施方案中,宿主细胞可包含含有可操作性连接于编码透明质酸前体糖合成中涉及的第二个基因的不同核酸序列的启动子区的重组构建体。
编码前体糖的合成中所涉及的酶的核酸序列可用相同或不同的启动子如编码透明质酸合酶的核酸序列实施表达。在前一意义中,构建“人工操纵子”,其能模拟含有每个hasA,hasB,hasC和hasD,或其同系物的似马链球菌的操纵子,或者,可使用似马链球菌操纵子中存在的全长补体的序列。所述“人工操纵子”还可包含6-磷酸葡萄糖异构酶基因(hasE)以及一个或多个选自己糖激酶基因、磷酸葡糖变位酶基因、酰胺转移酶基因、变位酶基因和乙酰基转移酶基因的基因。在人工操纵子中,至少一个元件与其它元件是异源的,如启动子区与编码序列异源。
在一个优选的实施方案中,核酸构建体包含hasA,tuaD和gtaB。在另一优选的实施方案中,核酸构建体包含hasA,tuaD,gtaB和gcaD。在另一优选的实施方案中,核酸构建体包含hasA和tuaD。在另一优选的实施方案中,核酸构建体包含hasA。在另一优选的实施方案中,核酸构建体包含hasA,tuaD,gtaB,GCAD和hasE。在另一优选的实施方案中,核酸构建体包含HASA,HASB,HASC和hasD。在另一优选的实施方案中,核酸构建体包含hasA,HASB,hasC,HASD和hasE。基于上述优选的实施方案,所述基因可用其同系物取代。
在本发明的方法中,核酸构建体包含可操作性连接于透明质酸合酶编码序列异源的启动子序列的透明质酸合酶编码序列。所述启动子序列可以是,例如,单启动子或串联启动子(tandem promoter)。
本文将“启动子”定义为一段参与RNA聚合酶结合以启动基因转录的核酸序列。本文将“串联启动子”定义为两个或多个启动子序列,其中每个启动子序列均与编码序列可操作性连接和并介导该编码序列转录成mRNA。本文将“可操作性连接”定义为一种构型,其中一段控制序列例如启动子序列位于相对编码序列恰当的位置,从而使该控制序列指导由该编码序列编码的多肽的产生。如前所述,本文将“编码序列”定义为当置于适宜的控制序列的控制下时可转录为mRNA并翻译为多肽的核酸序列。编码序列的界限通常由恰位于mRNA的5’末端开放阅读框上游的核糖体结合位点和恰位于mRNA的3’末端开放阅读框下游的转录终止序列来确定。编码序列可包括(但不限于)基因组DNA、cDNA、半合成、合成来源和重组核酸序列。
在一个优选的实施方案中,启动子序列可以获自细菌来源。在更优选的实施方案中,启动子序列可以获自革兰氏阳性细菌如芽孢杆菌属,例如,Bacillus agaradherens、嗜碱芽孢杆菌、解淀粉芽胞杆菌、短芽胞杆菌、环状芽胞杆菌、克劳氏芽孢杆菌、凝结芽胞杆菌、坚硬芽胞杆菌、灿烂芽胞杆菌、迟缓芽胞杆菌、地衣形芽胞杆菌、巨大芽胞杆菌、短小芽胞杆菌、嗜热脂肪芽胞杆菌、枯草芽孢杆菌、或苏芸金芽胞杆菌或链霉菌属,例如,浅青紫链霉菌(Streptomyces lividans)或鼠灰链霉菌(Streptomyces murinus)或获自革兰氏阴性细菌,例如,大肠杆菌或假单胞杆菌(Pseudomonas sp)。
用于在本发明的方法中指导核酸序列转录的适宜启动子的实例是获自大肠杆菌lac操纵子,天蓝色链霉菌琼脂糖酶基因(dagA)、迟缓芽胞杆菌或克劳氏芽孢杆菌碱性蛋白酶基因(aprH)、地衣形芽胞杆菌碱性蛋白酶基因(subtilisin Carlsberg基因)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、枯草芽孢杆菌α-淀粉酶基因(amyE)、地衣形芽胞杆菌α-淀粉酶基因(amyL)、嗜热脂肪芽胞杆菌产麦芽淀粉酶基因(amyM)、解淀粉芽胞杆菌α-淀粉酶基因(amyQ)、地衣形芽胞杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因、苏芸金芽胞杆菌tenebrionis亚种CryIIIA基因(cryIIIA)或其部分、原核生物β-内酰胺酶基因(Villa-Kamaroff等,1978,Proceedingsof the National Academy of Sciences USA 75:3727-3731)的启动子。其它实例为spol细菌噬菌体启动子和tac启动子(DeBoer等,1983,Proceedingsof the National Academy of Sciences USA 80:21-25)。其它启动子描述于“Useful proteins from recombinant bacteria”in Scientific American,1980,242:74-94;和in Sambrook,Fritsch,和Maniatus,1989,Molecular Cloning,ALaboratory Manual,2d edition,Cold Spring Harbor,New York。
启动子还可以是“共有序列(consensus)”启动子,该启动子含有“-35”区的TTGACA和“-10”区的TATAAT。“共有序列”启动子可以获自任何在芽孢杆菌属宿主细胞中有功能的启动子。“共有序列”启动子的构建可通过定点诱变来完成,从而产生与枯草芽孢杆菌营养期“sigma A-型”启动子“-10”区和“-35”区已确认共有序列更一致的启动子(Voskuil等,1995,MolecularMicrobiology 17:271-279)。
在一个优选的实施方案中,所述“共有序列”启动子是获自大肠杆菌lac操纵子,天蓝色链霉菌琼脂糖酶基因(dagA)、迟缓芽胞杆菌或克劳氏芽孢杆菌碱性蛋白酶基因(aprH)、地衣形芽胞杆菌碱性蛋白酶基因(subtilisinCarlsberg基因)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、枯草芽孢杆菌α-淀粉酶基因(amyE)、地衣形芽胞杆菌α-淀粉酶基因(amyL)、嗜热脂肪芽胞杆菌产麦芽淀粉酶基因(amyM)、解淀粉芽胞杆菌α-淀粉酶基因(amyQ)、地衣形芽胞杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因、苏芸金芽胞杆菌tenebrionis亚种CryIIIA基因(cryIIIA)或其部分、原核生物β-内酰胺酶基因spol细菌噬菌体启动子。在更优选的实施方案中,“共有序列”启动子获自解淀粉芽胞杆菌α-淀粉酶基因(amyQ)。
Widner等,在美国专利No.6,255,076和5,955,310中公开了用于在芽孢杆菌属细胞中表达的,包括短共有序列amyQ启动子(也称为scBAN)的串联启动子和构建体以及方法。文中还公开了将cryIIIA稳定序列以及使用了该序列的构建体用于提高芽孢杆菌属中的生产。
串联启动子中每个启动子序列可以是能在所选芽孢杆菌属细胞中表现出转录活性的任意核酸序列,包括突变的、截短的和杂合的启动子,并可获自芽孢杆菌属细胞的同源或异源性细胞内和细胞外多肽的编码基因。相对于多肽编码序列和芽孢杆菌属细胞,每一启动子序列可以是天然的和外源的。启动子序列可以是相同的启动子序列或不同的启动子序列。
串联启动子的两个或多个启动子序列可同时启动核酸序列的转录。此外,串联启动子的一个或多个启动子序列可在芽孢杆菌属细胞生长的不同阶段启动核酸序列的转录。
在一个优选的实施方案中,串联启动子至少包含解淀粉芽胞杆菌α-淀粉酶基因的amyQ启动子。在另一优选的实施方案中,串联启动子至少包含含有“-35”区的TTGACA和“-10”区的TATAAT的“共有序列”启动子。在另一优选的实施方案中,串联启动子至少包含地衣形芽胞杆菌α-淀粉酶基因的amyL启动子。在另一优选的实施方案中,串联启动子至少包含cryIIIA启动子或其部分(Agaisse和LERECLUS,1994,Molecular Microbiology 13:97-107)。
在更优选的实施方案中,串联启动子至少包含amyL启动子和cryIIIA启动子。在另一更为优选的实施方案中,串联启动子至少包含amyQ启动子和cryIIIA启动子。在另一更为优选的实施方案中,串联启动子至少包含含有“-35”区的TTGACA和“-10”区的TATAAT的“共有序列”启动子和cryIIIA启动子。在另一更为优选的实施方案中,串联启动子至少包含两个拷贝的amyL启动子。在另一更为优选的实施方案中,串联启动子至少包含两个拷贝的amyQ启动子。在另一更为优选的实施方案中,串联启动子至少包含两个拷贝的含有“-35”区的TTGACA和“-10”区的TATAAT的“共有序列”启动子。在另一更为优选的实施方案中,串联启动子至少包含两个拷贝的cryIIIA启动子。
本文将“mRNA加工/稳定序列”定义为位于一个或多个启动予序列下游和编码序列上游的一段序列,该一个或多个启动予序列中的每一个都与该序列可操作连接,使每一个启动子合成的mRNA均可加工产生在转录本5’端具有稳定予序列的mRNA转录本。mRNA转录本5’端存在这种稳定子序列可增加其半衰期(Agaisse和LERECLUS,1994,同上文,Hue等,1995,Journal of Bacteriology 177:3465-3471)。mRNA加工/稳定序列与细菌16S核糖体RNA的3’末端互补。在一个优选实施方案中,mRNA加工/稳定序列产生在转录本5’端具有稳定序列的基本单一大小的转录本。优选与细菌16S核糖体RNA的3’末端互补的mRNA加工/稳定序列。参见,美国专利No.6,255,076和5,955,310。
在一个更优选实施方案中选实施方案中,mRNA加工/稳定序列是WO94/25612和Agaisse和Lereclus(1994,同上文)所公开的苏芸金芽孢杆菌cryIIIA mRNA加工/稳定序列或其保持mRNA加工/稳定功能的部分。在另一个更优选实施方案中,mRNA加工/稳定序列是Hue等(1995,同上文)所公开的枯草芽孢杆菌SP82的mRNA加工/稳定序列或其保持mRNA加工/稳定功能的部分。
当本发明的方法使用cryIIIA启动子和其mRNA加工/稳定序列时,可采用含有WO 94/25612和Agaisse和Lereclus(1994,同上文)所公开的序列或其保持启动子和mRNA加工/稳定功能的部分的DNA片段。而且,可使用本领域众所周知的方法制备仅含有含有cryIIIA启动子或cryIIIA启动子mRNA加工/稳定序列,以构建串联启动子和mRNA加工/稳定序列的各种组合。在该实施方案中,cryIIIA启动子及其cryIIIA启动子mRNA加工/稳定序列优选位于构成串联启动子的其它启动子序列下游和目标基因编码序列序列的上游。
然后,可进一步操作编码透明质酸生产中所涉及的所需酶的分离的核酸序列以提高核酸序列的表达。应该理解,表达所述多肽生产中所涉及的任何步骤,包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。使用克隆方法修饰核酸序列的技术是本领域众所周知的。
含有编码所述酶的核酸序列的核酸构建体可以可操作性连接于能够在适于控制序列的条件下于芽孢杆菌属细胞中指导编码序列表达的一个或多个控制序列。
本文将术语“控制序列”定义为包括表达核酸序列的编码序列所必需或有利于其表达的所有组分。每个控制序列可以是编码所述酶的核酸序列的天然或外源的。除上述启动子序列外,所述控制序列(但不限于)前导序列、信号肽序列和转录终止子。至少,控制序列包括启动子以及转录和翻译终止信号。所述控制序列可带有用于导入特异性限制位点的接头,以便于将控制序列与编码多肽之核酸序列的编码区相连。
控制序列还可以是适宜的转录终止序列,即可被芽孢杆菌属细胞识别以终止转录的序列。将终止子序列与编码所述酶或操作子最后酶的核酸序列的3’端可可操作性相连。在所选芽孢杆菌属细胞中有功能的任何终止子都可用于本发明。
控制序列还可以是适宜的前导序列,即mRNA上对芽孢杆菌属细胞的翻译很重要的非翻译区。前导序列被可可操作性连接于编码所述酶的核酸序列的5’端。然和在所选芽孢杆菌属细胞中有功能的前导序列都可用于本发明。
控制序列还可以是信号肽编码区,其编码于多肽的氨基端相连的氨基酸序列,并且指导该编码的多肽进入细胞分泌途径。信号肽编码区可以是多肽天然的或可获自异源。核酸序列的编码序列的5’末端可天然包括信号肽编码区,该区天然和编码分泌性多肽的编码区的片段在翻译阅读框内连接在一起。或者,编码序列的5’末端可以包含相对于编码分泌性多肽的该编码序列部分外源的信号肽编码区。在编码序列没有天然地包含信号肽编码区的情况下,需要外源信号肽编码区。或者,可以简单地用外源信号肽编码区取代天然信号肽编码区以便相对于与编码序列相关的天然信号肽编码区而言来提高多肽的分泌。信号肽编码区可以获自芽孢杆菌属的淀粉酶或蛋白酶基因。但是,指导表达的多肽进入所选芽孢杆菌属细胞分泌途径的任何信号肽编码区均可以用于本发明。
用于芽孢杆菌属细胞的有效的信号肽编码区获自芽孢杆菌NCIB 11837产麦芽糖淀粉酶基因、嗜热脂肪芽胞杆菌α-淀粉酶基因、地衣形芽胞杆菌枯草杆菌蛋白酶基因、地衣形芽胞杆菌β-内酰胺酶基因、嗜热脂肪芽胞杆菌中性蛋白酶基因(nprT,nprS,nprM)和枯草芽孢杆菌prsA基因的信号肽编码区。Simonen和Palva,1993,Microbiological Reviews 57:109-137中描述了其它信号肽。
控制序列还可以是编码位于多肽氨基末端之氨基酸序列的前肽编码区。所得的多肽已知为酶原或多肽原(或在某些情况下为酶原)。多肽原通常是物活性的并可从所述多肽原通过催还或自我催化裂解而转变为成熟的活性多肽。前肽编码区可以获自枯草芽孢杆菌碱性蛋白酶(aprE)和枯草芽孢杆菌中性蛋白酶(nprT)的基因。
当信号肽和前肽区都存在于多肽的氨基端时,前肽区与多肽的氨基端紧邻,而信号肽区和前肽区的氨基端紧邻。
还优选加入能调节与细胞生长相关的多肽表达的调控序列。调控系统的实例包括应答化学或物理刺激(包括在有调控化合物存在的情况下)而导致基因表达的开启或关闭的那些系统。原核生物系统中的调节系统包括lac、tac和trp操纵子系统。
表达载体
在本发明的方法中,含有核酸序列、启动子和转录以及翻译终止信号的重组表达载体可用于重组制备透明质酸生产中所涉及的酶。可将上述各种核酸和调控序列连接在一起以生产包括一个或多个方便的限制位点的重组表达载体,所述位点能允许编码多肽或酶的核酸序列在所述位点插入或置换。或者,所述核酸序列可通过将该核酸序列和含有该核酸序列的核酸构建体插入适当表达载体来表达。在创建表达载体的过程中,可使编码序列在表达载体中与适当调控序列可操作性相连以便表达。
重组表达载体可以是任何载体,其可方便地进行重组DNA操作并且能使核酸序列表达。载体的选择将主要决定于载体与引入了该载体的芽孢杆菌属细胞之间的相容性。载体可以是线性和闭合环状质粒。载体可以是自主复制载体,即以染色体外实体形式存在的载体,其复制独立于染色体的复制,例如质粒,染色体外元件,小染色体(minichromosome)或人工染色体。载体可含有任何确保自我复制的手段。或者,载体可以是引入芽孢杆菌属细胞后,整合到基因组中并与其整合的染色体一起复制的那种载体。载体系统可使用单个载体或质粒、或其一起含有待引入芽孢杆菌属细胞基因组中的全长DNA的两个或多个载体或质粒、或转座子。
本发明的载体优选含有使所述载体可以稳定整合到芽孢杆菌属宿主细胞基因组中或者可在细胞中不依赖于细胞的基因组而自我复制的元件。
为了整合到宿主细胞基因组中,所述载体可依赖于编码多肽的核酸序列或载体上任何其它元件来通过同源或非同源重组而稳定整合到基因组中。或者,载体可能含有其它核酸序列,这些序列可指导通过同源重组整合进入芽孢杆菌属细胞基因组。其它核酸序列能够在染色体的精确位置使载体整合到宿主细胞基因组中。为了提高在精确位置整合的可能性,整合元件应优选含有足够量的与相应靶序列高度同源的核酸,例如100-1,500碱基对、优选400-1,500碱基对和最优选800-1,500碱基对,以便提供同源重组的可能性。整合元件可以是与芽孢杆菌属细胞基因组中的靶序列同源的任何序列。此外,整合元件还可以使非编码的或编码的核酸序列。另一方面,通过非同源重组可将载体整合到宿主细胞的基因组中。
为了进行自主复制,所述裁休还可含有能够使裁体在所研究的芽孢杆菌属细胞中自主复制的复制起始点。细菌复制起始点的实例是使载体可以在芽孢杆菌中复制的质粒pUB110、pE194、pTA1060和pAMβ1的复制起始点。复制起始点可以是带有突变的复制起始点,所述突变可以使其在宿主细胞中发挥温度敏感性的作用(参见例如Ehrlich,1978,Proceedings of theNational Academy of Sciences USA 75:1433)
本发明的载体优选含有一个或多个选择性标记,其能容易地选择出转化细胞。一个选择性标记是一种基因,其产物能提供对杀生物剂或病毒的抗性、对重金属的抗性、原养型至营养缺陷型的转变等。细菌选择性标记的实例是来源于枯草芽孢杆菌或地衣芽孢杆菌的dal基因,或赋予了抗生素抗性如氨苄青霉素、卡那霉素、氯霉素或四环素抗性的标记。此外,可通过共转化实施选择,例如WO 91/09129中所描述的,其中选择性标记位于独立的载体上。
可将一个以上拷贝的核酸序列插入到宿主细胞中以提高基因产物的产率。通过将至少一个以上其它拷贝的序列整合到宿主细抱基因组中或者通过包括可扩增选择性标记基因与所述核酸序列,其中通过在存在适宜选择性标记的条件下培养含扩增拷贝的选择性标记基因,由此增加了核酸序列的拷贝数的细胞可筛选所述细胞,这样可以使核酸序列拷贝数增加。WO94/14968中描述了用于获得基因组DNA序列扩增的方便的方法。
用于连接上述元件以构建重组表达载体的方法是本领域技术人员众所周知的(参见例如Sambrook等,1989,同上文)。
制备
在本发明的方法中,采用本领域的已知方法于适宜制备透明质酸的营养培养基中培养芽孢杆菌属宿主细胞。例如,可将该细胞在实验室或工业发酵罐中,用适宜的培养基,在允许透明质酸合成中所涉及的酶表达和/或透明质酸分离的条件下,采用摇瓶培养、小规模或大规模发酵(包括连续、分批、分批补料或固态发酵)的方法进行培养。使用本领域已知的方法,在含有碳和氮源以及无机盐的适宜营养培养基中进行培养。适宜的培养基可以从供应商处得到或可根据已经公布(例如,在美国典型培养物保藏中心的目录中)的组成来制备。分泌的透明质酸可直接从培养基中回收。
分离的可采用本领域的已知方法分离得到的透明质酸。可采用本领域的已知方法回收得到的多肽。例如,可采用包括(但不限于)离心、过滤、提取、喷雾干燥、蒸发或沉淀的传统方法从营养培养基中回收透明质酸。然后可采用本领域的已知的多种方法进一步纯化分离的透明质酸,所述方法包括(但不限于)层析法(例如,离子交换,亲和,疏水,层析聚焦和大小排阻层析),电泳方法(例如,准备型等电焦距),差异溶解(differentialsolubility)(例如,硫酸铵沉淀),SDS-PAGE,或提取(参见例如ProteinPurification,J.-C.Janson和Lars Ryden编,VCH出版公司,New York,1989)。
在本发明的方法中,芽孢杆菌属宿主细胞制备大于约4g、优选大于约6g,更优选大于约8g,甚至更优选大于约10g,及最优选大于约12g透明质酸/每升。
缺失/破坏
基因缺失或置换技术可用于完全除去可选择的标记基因或其它不需要的基因。在所述方法中,可通过使用已经构建为紧接地包含侧接于可选择的标记基因的5’和3′区的质粒的同源重组完成可选择的标记基因的缺失。可在能够使得质粒构建入细胞的许可温度下将紧接的5’和3′区联合第二可选择的标记引入至芽孢杆菌属细胞中的温度敏感性质粒,例如pE194上。然后将细胞移至非许可温度下来筛选含有整合至染色体一个同源侧翼区上的质粒的细胞。通过筛选第二可选择的标记完成质粒整合的筛选。整合后,通过将细胞移至许可温度中不经选择而传若干代来刺激在第二同源侧翼区上重组事件。将所述细胞铺板以获得单一克隆,然后检测克隆中两个可选标记的缺失(参见例如Perego,1993,INA.L.Sonneshein,J.A.Hoch,and R.Losick,editors,Bacillus subtilis and Other Gram-Positive Bacteria,Chapter 42,American Society of Microbiology,Washington,D.C.,1993)。
还可以通过在突变细胞中导入包含缺陷基因5′和3′区,而缺少可选择的标记基因的核酸片段,然后在反选择培养基上选择的同源重组方法除去可选择的标记基因。通过同源重组,用缺少可选择的标记基因的核酸片段取代含有可选择的标记基因的缺陷基因。还可以采用本领域其它已知方法。
美国专利No.5,891,701公开了缺失包括spollAC、aprE、NPRE和amyE的若干基因的方法。
还可以通过上述方法如用cypX(登记号BG 12580)和/或yvmC(登记号BG14121)合成红色素除去其它不需要的生物化合物。
在一个优选的实施方案中,所述芽孢杆菌属宿主细胞不用任何异源性或外源性可选标记进行标记。在另一优选的实施方案中,所述芽孢杆菌属宿主细胞不能生成任何由cypX和yvmC合成的红色素。
编码具有UDP-葡萄糖6-脱氢酶活性、UDP葡萄糖焦磷酸化酶活性或UDP-N-乙酰葡糖胺焦磷酸化酶活性的多肽的分离的核酸序列
本文中将术语“UDP-葡萄糖6-脱氢酶活性”定义为能在存在2NAD+和水时催化UDP-葡萄糖转化为UDP-二磷酸葡萄糖醛酸酯和2NADH的UDP葡萄糖:NAD+6-氧化还原酶活性。为本发明的目的,可根据Jaenicke和Rudolph,1986,Biochemistry 25:7283-7287所述方法确定UDP-葡萄糖6-脱氢酶活性。将一单位UDP-葡萄糖6-脱氢酶活性定义为于25℃,pH 7时每分钟制备1.0μ摩尔的UDP-葡萄糖醛酸。
本文将术语“UDP葡萄糖焦磷酸化酶活性”定义为能在存在UTP时催化葡糖-1-磷酸转化为氯喹和UDP-葡萄糖的UTP:CL-D-葡萄糖-1-磷酸尿甙基转化酶活性。为本发明的目的,可根据Kamogawa等,1965,J.Biochem.(Tokyo)57:758-765或Hansen等,1966,Method Enzymol.8:248-253所述方法确定UDP葡萄糖焦磷酸化酶活性。将一单位UDP葡萄糖焦磷酸化酶活性的定义为于25℃,pH 7时每分钟制备1.0p摩尔的UDP-葡萄糖。
本文将术语“UDP-N-乙酰葡糖胺焦磷酸化酶活性”定义为能在存在UTP时催化N-乙酰-alpha-D-葡糖胺-1-磷酸转化为氯喹和UDP-N-乙酰-alpha-D-glucoamine的UTP:N-乙酰-alpha-D-glucoamine-1-磷酸尿苷酰转移酶活性。为本发明的目的,可根据Mangin-Lecreuix等,1994,J.Bacteriology176:5788-5795所述方法确定UDP-N-乙酰葡糖胺焦磷酸化酶活性。将一单位UDP-N-乙酰葡糖胺焦磷酸化酶活性定义为于25℃,pH 7时每分钟制备1.0μ摩尔的UDP-N-乙酰-alpha-D-glucoamine。
本文中所使用的术语“分离的核酸序列”指一种基本上不含其它核酸序列的核酸序列,例如通过琼脂糖电泳测定纯度为至少约20%、优选至少约40%、更优选至少约60%、甚至更优选至少约80%、最优选至少约90%。例如,分离的核酸序列可通过在遗传工程中用来将核酸序列从其天然位置重新定位至其将被复制的另一位点处的标准克隆过程来获得。所述克隆过程可包括切割和分离含编码该多肽的核酸序列的目的核酸片段,将该片段插入到一种载体分子中,并将该重组载体引入到一种宿主细胞中,在所述的宿主细胞中该核酸序列的多个拷贝或克隆将被复制。所述核酸序列可以是基因组DNA、cDNA、半合成、合成来源的或其任意组合。
在第一个实施方案中,本发明涉及编码多肽的分离的核酸序列,所述多肽的氨基酸序列与SEQ ID NO:41有至少约75%、优选至少约80%、更优选至少约85%、甚至更优选至少约90%、最优选至少约95%,以及甚至最优选至少约97%的同一性,所述多肽具有UDP-葡萄糖6-脱氢酶活性(此后为“同源性多肽”)。在一个优选的实施方案中,同源性多肽含有与SEQ IDNO:41中所列氨基酸序列有5个氨基酸、优选4个氨基酸、更优选3个氨基酸、甚至更优选2个氨基酸、最优选1个氨基酸不同的氨基酸序列。
在另一第一个实施方案中,本发明涉及编码多肽的分离的核酸序列,所述多肽的氨基酸序列与SEQ ID NO:43有至少约90%、优选至少约95%,更优选至少约97%的同一性,所述多肽具有UDP葡萄糖焦磷酸化酶活性(此后为“同源性多肽”)。在一个优选的实施方案中,同源性多肽含有与SEQ IDNO:43中所列氨基酸序列有5个氨基酸、优选4个氨基酸、更优选3个氨基酸、甚至更优选2个氨基酸、最优选1个氨基酸不同的氨基酸序列。
在另一第一个实施方案中,本发明涉及编码多肽的分离的核酸序列,所述多肽的氨基酸序列与SEQ ID NO:45有至少约75%、优选至少约80%、更优选至少约85%、甚至更优选至少约90%、最优选至少约95%,以及甚至最优选至少约97%的同一性,所述多肽具有UDP-N-乙酰葡糖胺焦磷酸化酶活性(此后为“同源性多肽”)。在一个优选的实施方案中,同源性多肽含有与SEQ ID NO:45中所列氨基酸序列有5个氨基酸、优选4个氨基酸、更优选3个氨基酸、甚至更优选2个氨基酸、最优选1个氨基酸不同的氨基酸序列。
为了本发明的目的,使用Clustal法(Higgins,1989,CABIOS 5:151-153)使用Vector NTI AlignX软件包(Informax INC.,Bethesda,MD)以及如下配对比对缺省参数:缺口罚分10,缺口长度罚分0.1,和分数矩阵(scorematrix):blosum62mt2来确定两个氨基酸序列间的同一性程度。
优选地,本发明的核酸序列所编码的多肽含有SEQ ID NO:41、SEQ IDNO:43或SEQ ID NO:45的氨基酸序列或其等位变体或其分别具有UDP-glucose6-脱氢酶、UDP-葡萄糖焦磷酸化酶或UDP-N-乙酰葡糖胺焦磷酸化酶活性的片段。在更优选的实施方案中,本发明的核酸序列所编码的多肽包含SEQ ID NO:41、SEQ ID NO:43或SEQ ID NO:45的氨基酸序列。在另一优选的实施方案中,本发明的核酸序列多编码的多肽包含SEQ ID NO:41,SEQ ID NO:43,或SEQ ID NO:45的氨基酸序列或其等位变体或其片段,其中多肽片段分别具有UDP-葡萄糖6-脱氢酶、UDP-葡萄糖焦磷酸化酶或UDP-N-乙酰葡糖胺焦磷酸化酶活性。在另一优选的实施方案中,本发明的核酸序列所编码的多肽含有SEQ ID NO:41、SEQ ID NO:43或SEQ IDNO:45的氨基酸序列。
本发明还包括编码多肽的核酸序列,所述多肽含有SEQ ID NO:41、SEQ ID NO:43或SEQ ID NO:45的氨基酸序列,其由于遗传密码的简并性而与SEQ ID NO:40,SEQ ID NO:42,或SEQ ID NO:44不同。本发明还涉及分别编码SEQ ID NO:41、SEQ ID NO:43或SEQ ID NO:45的片段的SEQ ID NO:40、SEQ ID NO:42或SEQ ID NO:44亚序列,所述片段分别具有UDP-葡萄糖6-脱氢酶、UDP-葡萄糖焦磷酸化酶或UDP-N-乙酰葡糖胺焦磷酸化酶活性。
SEQ ID NO:40的亚序列为除了从5′和/或3’末端的一个或多个核苷酸缺失外,由SEQ ID NO:40所包含的和酸序列。优选地,亚序列包含1020核苷酸、更优选至少1080核苷酸、和最优选至少1140核苷酸。SEQ ID NO:41的片段为含有从该氨基酸序列的氨基和/或羧基端的一个或多个氨基酸缺失的多肽。优选地,片段至少包含340氨基酸残基、更优选至少360氨基酸残基、和最优选至少380氨基酸残基。
SEQ ID NO:42的亚序列为除了从5′和/或3’末端的一个或多个核苷酸缺失外,由SEQ ID NO:42所包含的和酸序列。优选地,亚序列至少包含765核苷酸、更优选至少810核苷酸、和最优选至少855核苷酸。SEQ ID NO:43的片段为含有从该氨基酸序列的氨基和/或羧基端的一个或多个氨基酸缺失的多肽。优选地,片段至少包含255氨基酸残基、更优选至少270氨基酸残基、和最优选至少285氨基酸残基。
SEQ ID NO:44的亚序列为除了从5′和/或3’末端的一个或多个核苷酸缺失外,由SEQ ID NO:44所包含的和酸序列。优选地,亚序列至少包含1110核苷酸、更优选至少1200核苷酸、和最优选至少1290核苷酸。SEQID NO:45的片段为含有从该氨基酸序列的氨基和/或羧基端的一个或多个氨基酸缺失的多肽。优选地,片段至少包含370氨基酸残基、更优选至少400氨基酸残基、和最优选至少430氨基酸残基。
一个等位基因变体指占据相同染色体位点的一个基因的两个或多个可选形式中的任何一个。等位基因变异通过突变自然产生,并可以导致群体内表型的多态性。基因突变可以是沉默突变(即,在所编码的多肽中没有改变)或可以编码氨基酸序列发生改变的多肽。多肽的等位变体为由基因的等位变体所编码的多肽。
在第二个实施方案中,本发明涉及与SEQ ID NO:40有至少约75%、优选至少约80%、更优选至少约85%、甚至更优选至少约90%、最优选至少约95%、和甚至最优选至少约97%同一性的分离的核酸序列。
在另一第二个实施方案中,本发明涉及与SEQ ID NO:42有至少约90%、优选至少约95%、和更优选至少约97%同一性的分离的核酸序列。
在另一第二个实施方案中,本发明涉及与SEQ ID NO:44有至少约75%、优选至少约80%、更优选至少约85%、甚至更优选至少约90%、最优选至少约95%、和甚至最优选至少约97%同一性的分离的核酸序列。
为了本发明的目的,使用Vector NTI AlignX软件包(Informax INC.,Bethesda,MD)以及如下配对比对缺省参数:缺口罚分15,缺口长度罚分6.6,和分数矩阵:swgapdnamt来确定两个核酸序列间的同一性程度。
在第三个实施方案中,本发明涉及编码具有UDP-葡萄糖6-脱氢酶、UDP-葡萄糖焦磷酸化酶或UDP-N-乙酰葡糖胺焦磷酸化酶活性的多肽的分离的核酸序列,该核酸序列在非常低的严紧条件下、优选低严紧条件下,更优选中严紧条件下、更优选中-高严紧条件下,更优选高严紧条件下以及最优选非常高严紧条件下与(i)SEQ ID NO:40、SEQ ID NO:42或SEQ IDNO:44的核酸序列,(ii)包含在SEQ ID NO:40、SEQ ID NO:42或SEQ IDNO:44中的cDNA序列,或(iii)(i)或(ii)的互补链杂交(J.Sambrook,E.F.Fritsch和T.Maniatus,1989,Molecular Cloning,A Laboratory Manual,2d edition,Cold Spring Harbor,New York)。SEQ ID NO:40、SEQ ID NO:42或SEQ ID NO:44的亚序列可以是至少100个核苷酸或优选至少200个核苷酸。此外,各亚序列可编码具有UDP-葡萄糖6-脱氢酶、UDP-葡萄糖焦磷酸化酶或UDP-N-乙酰葡糖胺焦磷酸化酶活性的多肽片段。
SEQ ID NO:40、SEQ ID NO:42或SEQ ID NO:44的核酸序列,或其亚序列,以及SEQ ID NO:41、SEQ ID NO:43或SEQ ID NO:45氨基酸序列,或其片段,均可用于设计核酸探针从而根据本领域众所周知的方法分别鉴别和克隆来自不同属或种的菌株的编码具有UDP-葡萄糖6-脱氢酶、UDP-葡萄糖焦磷酸化酶或UDP-N-乙酰葡糖胺焦磷酸化酶活性的多肽的DNA。特别地,所述探针可用于在标准Southern印迹步骤后,与目的属或种的基因组或cDNA杂交,从而鉴别和分离其中的相应基因。所述探针可相当地短于全长序列,但长度上至少为15、优选至少为25,而更优选至少为35个核苷酸。也可以使用较长的探针。可以使用DNA和RNA探针。将所述探针进行典型地标记(例如,用32P、3H、35S、生物素或抗生物素蛋白)而用于检测相应基因。所述探针包含于本发明中。
因此,可从所述其它生物体中制备的基因组DNA或cDNA文库中筛选与上述探针杂交且编码具有UDP-葡萄糖6-脱氢酶、UDP-葡萄糖焦磷酸化酶或UDP-N-乙酰葡糖胺焦磷酸化酶活性的多肽的DNA。可采用琼脂糖或聚丙烯酰胺凝胶电泳或其它分离技术分离来自所述其它生物体的所述基因组或其它DNA。可将来自文库或分离的DNA的DNA转至并固定在硝酸纤维或其它适宜的载体材料上。为了鉴别与SEQ ID NO:40、SEQ ID NO:42或SEQ ID NO:44,或其亚序列同源的克隆或DNA,将所述载体材料用于Southern印迹。为本发明的目的,杂交显示出核酸序列与和SEQ ID NO:40、SEQ ID NO:42或SEQ ID NO:44所示核酸序列、其互补链或其亚序列相应的标记的核酸探针在非常低至非常高严紧条件下杂交。采用X光片检测与核酸探针在这些条件下杂交的分子。
在一个优选的实施方案中,核酸探针是编码SEQ ID NO:41、SEQ IDNO:43或SEQ ID NO:45或其亚序列的多肽的核酸序列。在另一优选的实施方案中,核酸探针是SEQ ID NO:40、SEQ ID NO:42或SEQ ID NO:44。在另一优选的实施方案中,核酸探针是包含在质粒pMRT106中的核酸序列,所述质粒包含于大肠杆菌NRRLB-30536中,其中核酸序列编码具有UDP-葡萄糖6-脱氢酶,UDP-葡萄糖焦磷酸化酶,和UDP-N-乙酰葡糖胺焦磷酸化酶活性的多肽。
对长度至少100个核苷酸的长探针而言,将非常低至非常高严紧条件定义为在42℃ 5×SSPE、0.3%SDS,200μg/ml剪切并变性的鲑精DNA,以及对于非常低和低严紧度来说25%甲酰胺,对于中和中-高严紧度来说35%甲酰胺,或对于高和非常高严紧度来说50%甲酰胺中,根据标准Southern印迹分析进行预杂交和杂交。
对长度至少100个核苷酸的长探针而言,最终用2×SSC、0.2%SDS优选在至少45℃(非常低严紧度)、更优选在至少50℃(低严紧度)、更优选在至少55℃(中严紧度)、更优选在至少60℃(中-高严紧度)、甚至更优选在至少65℃(高严紧度)以及最优选在至少70℃(非常高严紧度)将载体材料洗涤3次,每次15分钟。
对长度为约15个核苷酸至约70个核苷酸的短探针而言,将严紧条件定义为相对于按照Bolton和McCarthy(1962,Proceedings of the NationalAcademy of Sciences USA48:1390)计算的理论Tm低5℃~10℃的温度下,在0.9M NaCl、0.09M Tris-HCl pH 7.6、6mM EDTA、0.5%NP-40、1×Denhardt’s溶液、1mM焦磷酸钠、1mM磷酸氢二钠、0.1mM ATP,和0.2mg酵母RNA/ml中,根据标准Southern印迹分析进行预杂交,杂交,和杂交后洗涤。
对长度为约15个核苷酸至约70个核苷酸的短探针而言,将载体材料在低于理论Tm 5℃~10℃的温度下,在6×SSC+0.1%SDS中洗涤一次,15分钟,然后用6×SSC洗涤2次,每次15分钟。
在第四个实施方案中,本发明涉及分离的核酸序列,其编码含有包含一个或多个氨基酸的取代、缺失和/或插入的SEQ ID NO:41、SEQ ID NO:43或SEQ ID NO:45的氨基酸序列的多肽的变体。
变体多肽的氨基酸序列可通过插入或缺失一个或多个氨基酸残基和/或用不同的氨基酸残基取代一个或多个氨基酸残基而与SEQ ID NO:41、SEQID NO:43或SEQ ID NO:45的氨基酸序列有所不同。优选,氨基酸改变是微小性质的改变,即不会显著影响所述蛋白质折叠和/或活性的保守性氨基酸取代;小缺失,通常缺失1-约30个氨基酸;小的氨基-或羧基-末端延伸,如氨基-末端甲硫氨酸残基;最多约20-25个残基的小接头肽或有利于通过改变净电荷或另一功能,例如聚-组氨酸序列、抗原表位或结合结构域而纯化的小的延伸。
保守性取代的实例包括下组内的取代,碱性氨基酸(精氨酸,赖氨酸和组氨酸),酸性氨基酸(谷氨酸和天冬氨酸),极性氨基酸(谷氨酸和天东氨酸),疏水氨基酸(亮氨酸,异亮氨酸和缬氨酸),芳香族氨基酸(苯丙氨酸,色氨酸和酪氨酸),和小分子氨基酸(甘氨酸,丙氨酸,丝氨酸,苏氨酸和甲硫氨酸)。通常不会改变比活性的氨基酸取代是本领域已知的,如,H.Neurath和R.L.Hill,1979,In,The Proteins,Academic Press,New York中所述。最常发生的互换是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly以及其相反互换。
修饰本发明的核酸序列对于合成于所述多肽基本相似的多肽是必需的。“基本相似”于所述多肽是指所述多肽的非天然形式。这些多肽经基因工程改造而在一定程度上不同于从其天然来源分离的多肽,例如,在比活性、热稳定性、最佳pH等方面有所不同的变体。可根据SEQ ID NO:40、SEQ IDNO:42或SEQ ID NO:44的多肽编码部分指示的核酸序列,如其亚序列,和/或通过导入核苷酸取代来构建变体序列,所述核苷酸取代不产生由所述核酸序列编码的多肽的另一氨基酸,但对应于用于生产所述酶的宿主生物所偏好的密码子使用特点,或通过导入可产生不同氨基酸序列的核苷酸取代来构建所述变体序列。有关核苷酸取代的一般描述参见例如Ford等,1991, Protein Expression和Purification 2:95-107。
对本领域技术人员显而易见的是,可以在对于所述分子的功能非常重要的区域外进行所述取代,这样仍得到活性多肽。根据本领域已知的方法,如定点诱变或丙氨酸所描诱变(参见例如Cunningham和Wells,1989,Science244:1081-1085)可鉴定对于本发明分离的核酸序列所编码的多肽的活性至关重要的氨基酸残基,因此优选不经过取代即可完成所述鉴定。在后一种技术中,在分子的每个正电荷残基处诱导突变,然后检测所得突变分子的酶活性以鉴定对于分子活性至关重要的氨基酸残基。底物-酶作用位点还可通过对核磁共振、晶体照相术或光亲和标记等技术所测定的三维结构的分析来确定(参见例如de Vos等,1992,Science 255:306-312;Smith等,1992,Journal of Molecular Biology 224:899-904;Wlodaver等,1992,FEBSLetters 309:59-64)。
由本发明分离的核酸序列编码的多肽具有至少20%、优选至少40%、更优选至少60%、甚至更优选至少80%、甚至更优选至少90%以及最优选至少100%的SEQ ID NO:41的多肽的UDP-葡萄糖6-脱氢酶的活性、SEQIDNO:43的多肽的UDP葡萄糖焦磷酸化酶活性或SEQ ID NO:45的多肽的UDP-N-乙酰葡糖胺焦磷酸化酶活性。
本发明的核酸序列可获自任何属的微生物。为达到本发明的目的,此处与给定来源一起使用的术语“获自”是指由核酸序列编码的多肽是由该核酸序列的来源或已插入了所述来源的核酸序列的细胞所生产的。在一个优选的实施方案中,由本发明的核酸序列多肽为细胞外分泌。
核酸序列可获自细菌来源。例如,这些多肽可以获自革兰氏阳性细菌如杆菌菌株,例如,Bacillus agaradherens、嗜碱芽孢杆菌、解淀粉芽胞杆菌、,短芽胞杆菌、,短芽胞杆菌、克劳氏芽孢杆菌、凝结芽胞杆菌、灿烂芽胞杆菌、迟缓芽胞杆菌、地衣形芽胞杆菌、巨大芽胞杆菌、嗜热脂肪芽胞杆菌、枯草芽孢杆菌或苏芸金芽胞杆菌或链霉菌属,例如,浅青紫链霉菌(Streptomyces lividans)或鼠灰链霉菌(Streptomyces murinus)或获自革兰氏阴性细菌,例如,大肠杆菌或假单胞杆菌(Pseudomonas sp)。
在一个优选的实施方案中,核酸序列可获自链球菌属或巴斯德菌属菌株。
在更优选的实施方案中,核酸序列获自似马链球菌,酿脓链球菌,乳房链球菌或马链球菌兽瘟亚种或出血败血性巴斯德菌菌株。
在最优选的实施方案中,核酸序列获自似马链球菌,例如,SEQ ID NO:40、SEQ ID NO:42或SEQ ID NO:44中所示核酸序列。在另一最优选的实施方案中,核酸探针是包含在质粒pMRT106中的序列,所述质粒包含于大肠杆菌NRRL B-30536中。在更加最优选的实施方案中,核酸序列是SEQ IDNO:40、SEQ ID NO:42或SEQ ID NO:44。
这些种的菌株很容易从各种收集中心,如美国典型培养物保藏中心(ATCC)、德意志微生物和细胞培养物保藏中心(DSM)、真菌菌株保藏中心(CBS)和农业研究服务专利培养物保藏中心(Agricultural Research ServicePatent Culture Collection)北方地区研究中心(NRRL)。
此外,使用上述探针可从其它来源,包括分离自自然界(例如,土壤、堆肥、水等)的微生物中鉴定和获得所述核酸序列。从自然环境中分离微生物的方法是本领域众所周知的。通过类似地筛选另一微生物的基因组或cDNA文库可得到所述核酸序列。一旦用所述探针检测到了编码多肽的核酸序列后,可采用本领域普通技术人员已知的技术(参见例如Sambrook等,1989,同上文)分离或克隆所述序列。
本发明还涉及含有SEQ ID NO:40、SEQ ID NO:42和SEQ ID NO:44的多肽编码序列中至少一个突变的突变核酸序列,其中突变核酸序列编码分别包含SEQ ID NO:42、SEQ ID NO:43和SEQ ID NO:45的多肽。
用于分离和克隆编码多肽的核酸序列的方法是本领域已知的,所述方法包括从基因组DNA中分离,从cDNA中制备,或其联合。获自所述基因组DNA的本发明的核酸序列的克隆可通过,例如,使用众所周知的聚合酶链反应(PCR)或表达文库的抗体筛选从而检测具有共有结构特点的克隆的DNA片段的方法实施。参见例如Innis等,1990,PCR:A GUIDE TOMETHODS and Application,Academic Press,New York。可使用其它核酸扩增方法如连接酶链反应(LCR),连接活化转录(ligated activated transcription(LAT))和基于核酸序列的扩增(NASBA)。核酸序列还可从链球菌菌株,或另一或相关的生物体中克隆并由此,例如,可以是核酸序列的多肽编码区的等位或种属变体。
本发明还涉及包含可操作性连接于一个或多个控制序列的本发明的核酸序列的核酸构建体,所述控制序列在与所述控制序列相适应的条件下在适宜的宿主细胞中指导编码序列的表达。
本发明还涉及包含本发明核酸序列,启动子以及转录和翻译终止信号的重组表达载体。
本发明还涉及包含本发明的核酸序列重组宿主细胞,其可有益地用于多肽的重组制备中。
本发明还涉及制备具有UDP-N-乙酰葡糖胺焦磷酸化酶活性的多肽的方法,包括(a)在适宜制备多肽的条件下培养宿主细胞;和(b)回收多肽。
在本发明的制备方法中,采用本领域的已知方法将细胞培养于适宜制备多肽的营养培养基中。例如,可采用摇瓶培养和在适宜的培养基中和在适宜多肽表达和/或分离的条件下在实验室或工业发酵罐中实施的小规模或大规模发酵(包括连续、分批、分批补料或固态发酵)的方法培养细胞。在包含碳源和氮源以及无机盐的适宜营养培养基中,采用本领域已知方法实施培养。适宜的培养基可获自商业供应商或可根据已经公开的组成(例如,在美国典型培养物保藏中心的目录中)制备。如果多肽被分泌至营养培养基中,则可直接从培养基中回收多肽。如果多肽未分泌,则可从细胞裂解物将其回收。
可采用特异性针对多肽的本领域的已知方法检测多肽。这些检测方法可包括使用特异性抗体,生成酶产物,或酶底物的消失。
例如,酶检测法可用于确定本说明所述的多肽的活性。
可采用本领域的已知方法回收得到的多肽。例如,可采用包括(但不限于)离心、过滤、提取、喷雾干燥、蒸发或沉淀的传统方法从营养培养基中回收多肽。
可采用本领域的已知的多种方法纯化多肽,所述方法包括(但不限于)层析法(例如,离子交换,亲和,疏水,层析聚焦和大小排阻层析),电泳方法(例如,准备型等电焦距),差异溶解(differential solubility)(例如,硫酸铵沉淀),SDS-PAGE,或提取(参见例如Protein Purification,J.-C.Janson和Lars Ryden编,VCH出版公司,New York,1989)。
本发明还涉及由上述核酸序列编码的,具有UDP-葡萄糖6-脱氢酶、UDP-葡萄糖焦磷酸化酶或UDP-N-乙酰葡糖胺焦磷酸化酶活性的分离的多肽。
下述实施例用于进一步描述本发明,而不应将其理解为对本发明范围的限制。
实施例
引物和寡核苷酸
全部引物和寡核苷酸均通过购买获得(MWG Biotech INC.,High Point,NC)。
实施例1:似马链球菌hasA基因和枯草芽孢杆菌tuaD、gtaB和gcaD基因的PCR扩增和克隆。
从质粒pKKseD(Weigel,1997,Journal of Biological Chemistry 272:32539-32546)中经PCR扩增出似马链球菌透明质酸合酶基因(hasA,登记号AF023876,SEQ ID NOs:1[DNA序列]和2[推导的氨基酸序列]),所使用的引物1和2为:
引物1:
5’-GAGCTCTATAAAAATGAGGAGGGAACCGAATGAGAACATTAAAAAACCT-3’
(SEQ ID NO:3)
引物2:
5’-GTTAACGAATTCAGCTATGTAGGTACCTTATAATAATTTTTTACGTGT-3’(SEQ ID NO:4)
在50μl反应中一式三份实施PCR扩增,所述反应含有如下成分:1ngpKKseD DNA,引物1和2各0.4μM,dATP、dCTP,dGTP和dTTP各200μM,2.5mM MgCl2的1×PCR缓冲液II(Applied Biosystems,INC.,Foster City,CA)和2.5单位AmpliTaq GoldTM DNA聚合酶(Applied Biosystems,INC.,Foster City,CA)。在RoboCycler 40 thermacycler(Stratagene,INC.,La Jolla,CA)中实施反应,反应条件:95℃9分钟1个循环;95℃1分钟,52℃1分钟,72℃1分钟3个循环;95℃1分钟,55℃1分钟,72℃1分钟27个循环;72℃5分钟1个循环。采用0.8%琼脂糖凝胶以及44 mM Tris碱,44mM硼酸,0.5mM EDTA缓冲液(0.5×TBE)使PCR产物显影。所要片段为约1200bp。
使用TA-TOPO克隆试剂盒(Stratagene,INC.,La Jolla,CA)将1200bp PCR片段克隆至pCR2.1并按照厂商说明(Stratagene,INC.,La Jolla,CA)将其转化至大肠杆菌感受态细胞。在加入了100μg氨卡青霉素/ml的2×酵母-胰胨(YT)琼脂板上生长16小时后,于37℃下选择转化株。使用QIAGEN自动仪(QIAGEN,Valencia,CA),按照厂商说明纯化来自这些转化株的质粒DNA,并通过使用M13(-20)正向和M13反向引物(Invitrogen,Inc,Carlsbad,CA)以及其下的内部引物的DNA测序确定插入的DNA序列。将包含1200bp PCR片段的质粒命名为pCR2.1-sehasA(图3)。
引物3:
5’-GTTGACGATGGAAGTGCTGA-3’(SEQ ID NO:5)
引物4:
5’-ATCCGTTACAGGTAATATCC-3’(SEQ ID NO:6)
引物5:
5′-TCCTTTTGTAGCCCTATGGA-3′(SEQ ID NO:7)
引物6:
5′-TCAGCACTTCCATCGTCAAC-3′(SEQ ID NO:8)
引物7:
5′-GGATATTACCTGTAACGGAT-3′(SEQ ID NO:9)
引物8:
5′-TCCATAGGGCTACAAAAGGA-3′(SEQ ID NO:10)
从枯草芽孢杆菌168(BGSC 1A1,Bacillus Genetic Stock Center,Columbus,OH)中经PCR扩增出枯草芽孢杆菌UDP-葡萄糖-6-脱氢酶基因(tuaD,登记号BG12691,SEQ ID No:11[DNA序列]和12[推导的氨基酸序列]),所使用的引物9和10为:
引物9:
5’-GGTACCGACACTGCGACCATTATAAA-3’(SEQ ID NO:13)
引物10:
5′-GTTAACGAATTCCAGCTATGTATCTAGACAGCTTCAACCAAGTAACACT-3′(SEQ ID NO:14)
在30μl反应中一式三份实施PCR扩增,所述反应含有如下成分:50ng枯草芽孢杆菌168染色体DNA,引物9和10各0.3μM,dATP、dCTP,dGTP和dTTP各200μM,2.5mM MgCl2的1×PCR缓冲液II和2.5单位AmpliTaq GoldTM DNA聚合酶。在RoboCycler 40 thermacycler中实施反应,反应条件:95℃9分钟1个循环;95℃1分钟,50℃1分钟,72℃1分钟5个循环;95℃1分钟,54℃1分钟,72℃1.5分钟32个循环;72℃7分钟1个循环。采用0.8%琼脂糖凝胶以及0.5×TBE缓冲液使PCR产物显影。所要片段为约1400 bp。
使用TA-TOPO克隆试剂盒(Stratagene,INC.,La Jolla,CA)将1400bp PCR片段克隆至pCR2.1并按照厂商说明(Stratagene,INC.,La Jolla,CA)将其转化至大肠杆菌感受态细胞。使用QIAGEN自动仪,按照厂商说明纯化质粒DNA,并通过使用M13(-20)正向和M13反向引物(Invitrogen,Inc,Carlsbad,CA)以及其下的内部引物的DNA测序确定插入的DNA序列。将包含1200 bp PCR片段的质粒命名为pCR2.1-tuaD(图4)。
引物11:
5’-AGCATCTTAACGGCTACAAA-3’(SEQ ID NO:15)
引物12:
5′-TGTGAGCGAGTCGGCGCAGA-3′(SEQ ID NO:16)
引物1 3:
5’-GGGCGCCCATGTAAAAGCAT-3’(SEQ ID NO:17)
引物14:
5’-TTTGTAGCCGTTAAGATGCT-3’(SEQ ID NO:18)
引物15:
5′-TCTGCGCCGACTCGCTCACA-3′(SEQ ID NO:19)
引物16:
5′-ATGCTTTTACATGGGCGCCC-3′(SEQ ID NO:20)
从枯草芽孢杆菌168中经PCR扩增出枯草芽孢杆菌UTP-葡萄糖-1-磷酸尿苷酰基转移酶基因(gtaB,登记号BG10402,SEQ ID No:21[DNA序列]和22[推导的氨基酸序列]),所使用的引物17和18为:
引物17:
5’-TCTAGATTTTTCGATCATAAGGAAGGT-3’(SEQ ID NO:23)
引物18:
5′-GTTAACGAATTCCAGCTATGTAGGATCCAATGTCCAATAGCCTTTTTGT-3’(SEQ ID NO:24)
在30μl反应中一式三份实施PCR扩增,所述反应含有如下成分:50ng枯草芽孢杆菌168染色体DNA,引物17和18各0.3μM,dATP、dCTP,dGTP和dTTP各200μM,2.5mM MgCl2的1×PCR缓冲液II和2.5单位AmpliTaq GoldTM DNA聚合酶。在RoboCycler 40 thermacycler中实施反应,反应条件:95℃9分钟1个循环;95℃1分钟,50℃1分钟,72℃1.5分钟5个循环;95℃1分钟,54℃1分钟,72℃1.5分钟32个循环;72℃7分钟1个循环。采用0.8%琼脂糖凝胶以及0.5×TBE缓冲液使PCR产物显影。所要片段为约900bp。
使用TA-TOPO克隆试剂盒(Stratagene,INC.,La Jolla,CA)将900bpPCR片段克隆至pCR2.1并按照厂商说明(Stratagene,INC.,La Jolla,CA)将其转化至大肠杆菌OneShotTM感受态细胞。使用QIAGEN自动仪,按照厂商说明纯化质粒DNA,并通过使用M13(-20)正向和M13反向引物(Invitrogen,Inc,Carlsbad,CA)以及其下的内部引物的DNA测序确定插入的DNA序列。将包含900bp PCR片段的质粒命名为pCR2.1-gtaB(图5)。
引物19:
5’-AAAAAGGCTTCTAACCTGGC-3’(SEQ ID NO:25)
引物20:
5’-AAACCGCCTAAAGGCACAGC-3’(SEQ ID NO:26)
引物21:
5’-GCCAGGTTAGAAGCCTTTTT-3’(SEQ ID NO:27)
引物22:
5′-GCTGTGCCTTTAGGCGGTTT-3′(SEQ ID NO:28)
从枯草芽孢杆菌168中经PCR扩增出枯草芽孢杆菌UDP-N-乙酰葡糖胺焦磷酸化酶基因(gcaD,登记号BG10113,SEQ ID No:29[DNA序列]和30[推导的氨基酸序列]),所使用的引物23和24为:
引物23:
5’-GGATCCTTTCTATGGATAAAAGGGAT-3’(SEQ ID NO:31)
引物24:
5’-GTTAACAGGATTATTTTTTATGAATATTTTT-3’(SEQ ID NO:32)
在30μl反应中一式三份实施PCR扩增,所述反应含有如下成分:50ng枯草芽孢杆菌168染色体DNA,引物23和24各0.3μM,dATP、dCTP,dGTP和dTTP各200μM,2.5mM MgCl2的1×PCR缓冲液II和2.5单位AmpliTaq GoldTM DNA聚合酶。在RoboCycler 40 thermacycler中实施反应,反应条件:95℃9分钟1个循环;95℃1分钟,50℃1分钟,72℃1.5分钟5个循环;95℃1分钟,54℃1分钟,72℃1.5分钟32个循环;72℃7分钟1个循环。采用0.8%琼脂糖凝胶以及0.5×TBE缓冲液使PCR产物显影。所要片段为约1500bp。
使用TA-TOPO克隆试剂盒(Stratagene,INC.,La Jolla,CA)将1500bp PCR片段克隆至pCR2.1并按照厂商说明(Stratagene,INC.,La Jolla,CA)将其转化至大肠杆菌OneShotTM感受态细胞。使用QIAGEN自动仪,按照厂商说明纯化质粒DNA,并通过使用M13(-20)正向和M13反向引物(Invitrogen,Inc,Carlsbad,CA)以及其下的内部引物的DNA测序确定插入的DNA序列。将包含900bp PCR片段的质粒命名为pCR2.1-gcaD(图6)。
引物25:
5’-CAGAGACGATGGAACAGATG-3’(SEQ ID NO:33)
引物26:
5’-GGAGTTAATGATAGAGTTGC-3’(SEQ ID NO:34)
引物27:
5’-GAAGATCGGGAATTTTGTAG-3’(SEQ ID NO:35)
引物28:
5′-CATCTGTTCCATCGTCTCTG-3′(SEQ ID NO:36)
引物29:
5’-GCAACTCTATCATTAACTCC-3’(SEQ ID NO:37)
引物30:
5’-CTACAAAATTCCCGATCTTC-3’(SEQ ID NO:38)
实施例2:hasA/tuaD/gtaB操纵子的构建
质粒pDG268Δneo-cryIIIA stab/Sav(美国专利No.5,955,310)和pCR2.1-tuaD(实施例1,图4)用KpnI和HpaI酶切消化。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上分析酶切消化并用QIAquick DNA提取试剂盒按厂商说明(QIAGEN,Valencia,CA)凝胶纯化来自pDG268Δneo-cryIIIAstab/Sav的较大的载体片段(约7700bp)和来自pCR2.1-tuaD的较小的tuaD片段(约1500bp)。用T4 DNA连接酶(RocheApplied Science;Indianapolis,IN)按厂商说明将两个纯化的片段连接在一起,并将连接混合物转化至大肠杆菌SURE感受态细胞(Stratagene,INC.,La Jolla,CA)中。在加入100μg氨卡青霉素/ml的2XYT琼脂板上筛选转化体。
采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并通过KpnI+HpaI酶切消化在使用0.5×TBE缓冲液的0.8%琼脂糖凝胶上进行分析。存在约1500bp的KpnI/HpaI tuaD片段即可鉴定为正确的质粒并将其命名为pHA1(图7)。
质粒pHA1和pCR2.1-gtaB(实施例1,图5)用XbaI和HpaI酶切消化。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上分析酶切消化并用QIAquickDNA提取试剂盒按厂商说明凝胶纯化来自pHA1的较大的载体片段(约9200bp)和来自pCR2.1-gtaB的较小的gtaB片段(约900bp)。用T4 DNA连接酶按厂商说明将两个纯化的片段连接在一起,并将连接混合物转化至大肠杆菌SURE感受态细胞中。于37℃在加入100μg氨卡青霉素/ml的2XYT琼脂板上筛选转化体。
采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并用XbaI+HpaI酶切消化。在使用0.5×TBE缓冲液的0.8%琼脂糖凝胶上分析酶切消化。存在约900bp的XbaI/HpaI gtaB片段即可鉴定为正确的质粒并将其命名为pHA2(图8)。
质粒pHA2和pCR2.1-sehasA(实施例1,图3)用SacI+KpnI酶切消化。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上分析酶切消化。用QIAquickDNA提取试剂盒按厂商说明凝胶纯化来自pHA2的较大的载体片段(约10000bp)和来自pCR2.1-sehasA的较小的hasA片段(约1300bp)。用T4 DNA连接酶按厂商说明将两个纯化的片段连接在一起,并将连接混合物转化至大肠杆菌SURE感受态细胞中。于37℃在加入100μg氨卡青霉素/ml的2XYT琼脂板上筛选转化体。采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并用SacI+KpnI酶切消化。在使用0.5×TBE缓冲液的0.8%琼脂糖凝胶上分析酶切消化。存在约1300bp的SacI/KpnI hasA片段即可鉴定为正确的质粒并将其命名为pHA3(图9)。
实施例3:构建hasA/tuaD/gtaB/gcaD操纵子
质粒pHA2(实施例2,图8)和pCR2.1-gcaD(实施例1,图6)用BamHI和HpaI酶切消化。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上分析酶切消化并用QIAquick DNA提取试剂盒按厂商说明凝胶纯化来自pHA2的较大的载体片段(约10,000bp)和来自pCR2.1-gcaD的较小的gcaD片段(约1,400bp)。用T4 DNA连接酶按厂商说明将两个纯化的片段连接在一起,并将连接混合物转化至大肠杆菌SURE感受态细胞中。于37℃在加入100μg氨卡青霉素/ml的2XYT琼脂板上筛选转化体。
采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并用XbaI+HpaI酶切消化。在使用0.5×TBE缓冲液的0.8%琼脂糖凝胶上分析酶切消化。存在约1400bp的BamHI/HpaI gcaD片段即可鉴定为正确的质粒并将其命名为pHA4(图10)。
质粒pHA4和pCR2.1-sehasA(实施例1,图3)用SacI和KpnI酶切消化。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上分析酶切消化并用QIAquickDNA提取试剂盒按厂商说明凝胶纯化来自pHA4的较大的载体片段(约11,000bp)和来自pCR2.1-sehasA的较小的hasA片段(约1,300bp)。用T4 DNA连接酶按厂商说明将两个纯化的片段连接在一起,并将连接混合物转化至大肠杆菌SURE感受态细胞中。在加入100μg氨卡青霉素/ml的2XYT琼脂板上筛选转化体。采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并用SacI+KpnI酶切消化。在使用0.5×TBE缓冲液的0.8%琼脂糖凝胶上分析酶切消化。存在约1,300bp的SacI/KpnI hasA片段即可鉴定为正确的质粒并将其命名为pHA5(图11)。
实施例4:构建hasA/tuaD/gcaD操纵子
质粒pHA1(实施例2,图7)和pCR2.1-gcaD(实施例1,图6)用BamHI和HpaI酶切消化。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上分析酶切消化并用QIAquick DNA提取试剂盒按厂商说明凝胶纯化来自pHA1的较大的载体片段(约9,200bp)和来自pCR2.1-gcaD的较小的gcaD片段(约1400bp)。用T4 DNA连接酶按厂商说明将两个纯化的片段连接在一起,并将连接混合物转化至大肠杆菌SURE感受态细胞中。于37℃在加入100μg氨卡青霉素/ml的2X YT琼脂板上筛选转化体。
采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并用BamHI+HpaI酶切消化。在使用0.5×TBE缓冲液的0.8%琼脂糖凝胶上分析酶切消化。存在约1400 bp的BamHI/HpaI gtaB片段即可鉴定为正确的质粒并将其命名为pHA6(图12)。
质粒pHA6和pCR2.1-sehasA(实施例1,图3)用SacI+KpnI酶切消化。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上分析酶切消化。用QIAquickDNA提取试剂盒按厂商说明凝胶纯化来自pHA6的较大的载体片段(约10,200bp)和来自pCR2.1-sehasA的较小的hasA片段(约1,300bp)。用T4DNA连接酶按厂商说明将两个纯化的片段连接在一起,并将连接混合物转化至大肠杆菌SURE感受态细胞中。于37℃在加入100μg氨卡青霉素/ml的2X YT琼脂板上筛选转化体。采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并用SacI+KpnI酶切消化。在使用0.5×TBE缓冲液的0.8%琼脂糖凝胶上分析酶切消化。存在约1300bp SacI/KpnI hasA片段即可鉴定为正确的质粒并将其命名为pHA7(图13)。
实施例5:构建枯草芽孢杆菌RB161
质粒pDG268MCSΔneo/scBAN/Sav(美国专利No.5,955,310)用SacI酶切消化。用QIAquick DNA提取试剂盒按厂商说明纯化酶切消化过的质粒,最后用NotI酶切消化。用QIAquick DNA提取试剂盒按厂商说明(QIAGEN,Valencia,CA)从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化约6800bp的最大的质粒片段。然后将回收的载体DNA与下述DNA插入片段连接。
质粒pHA3(实施例2,图9)用SacI酶切消化。按上述方法纯化酶切消化过的质粒,最后用NotI酶切消化。按上述方法凝胶纯化约3800bp的最小的质粒片段。采用Rapid DNA克隆试剂盒(Roche Applied Science;Indianapolis,IN)按厂商说明将回收的载体与DNA插入片段连接。在转化至枯草芽孢杆菌前,采用ScaI将上述连接体线性化以确保染色体中为双交换整合而不是但交换整合。将用限制性酶ScaI酶切消化的连接产物转化枯草芽孢杆菌168Δ4感受态细胞。枯草芽孢杆菌168Δ4来自枯草芽孢杆菌菌株168(BGSC 1A1,Bacillus Genetic Stock Center,Columbus,OH)并已经在spollAC,APRE,NPRE和amyE基因中进行了缺失。这四个基因的确实基本上按照关于枯草芽孢杆菌A164Δ5所述的方法实施,所述方法详细描述于美国专利No.5,891,701中。
在添加了5μg氯霉素/ml的Tryptose blood agar base(TBAB)琼脂板于34℃生长16小时筛选枯草芽孢杆菌氯霉素-抗性转化体。为筛选经由在amyE基因座处双交换的质粒的整合,将枯草芽孢杆菌原始转化体铺于添加了6μg新霉素/ml的TBAB琼脂板和在添加了5μg氯霉素/ml的TBAB琼脂板上。经由在amyE基因座处双交换的质粒的整合没有掺入新霉素抗性基因,因此生成了新霉素敏感性菌株。再将分离菌株置于小琼脂板(minimalplate)上以观察其是否在生成透明质酸。生成透明质酸的分离菌株在最小琼脂板上具有“湿”表型。使用该平板筛选,在37℃下分离氯霉素抗性和新霉素敏感性“湿”转化体(由于透明质酸的生成)。
采用QIAGEN tip-20柱(QIAGEN,Valencia,CA)按厂商说明从“湿”、氯霉素抗性和新霉素敏感性枯草芽孢杆菌168Δ4转化体中分离基因组DNA。使用下列基于hasA、tuaD和gtaB基因序列的合成寡核苷酸对这些转化体实施PCR扩增,以证实在枯草芽孢杆菌转化体操纵子存在这些基因及其完整性。
扩增反应(25μl)含有如下成分:50ng枯草芽孢杆菌168Δ4转化体的基因组DNA,每个引物各0.5μM,dATP、dCTP,dGTP和dTTP各200μM,1×PCR缓冲液II,3mM MgCl2的和0.625单位AmpliTaq GoldTM DNA聚合酶。在RoboCycler 40 thermacycler中实施反应,反应条件:95℃9分钟1个循环;95℃ 1分钟,50℃ 1分钟,72℃1.5分钟5个循环;95℃1分钟,54℃1分钟,72℃2分钟30个循环;最后一个循环72℃7分钟。
引物3和8用于证实存在hasA基因,引物3和16用于证实存在tuaD基因,引物3和22用于证实存在gtaB基因。将枯草芽孢杆菌168Δ4hasA/tuaD/gtaB整合体命名为枯草芽孢杆菌RB158。
采用QIAGEN tip-20柱按厂商说明从枯草芽孢杆菌RB158中分离基因组DNA,并用于转化感受态枯草芽孢杆菌A164Δ5(缺失spollAC,aprE,nprE,amyE和srfC基因;参见美国专利No.5,891,701)。在添加了5μg氯霉素/ml的TBAB平板上于37℃下筛选转化体。以其“湿”表型鉴定枯草芽孢杆菌A164Δ5 hasA/tuaD/gtaB整合体并将其命名为枯草芽孢杆菌RB161。
实施例6:构建枯草芽孢杆菌RB163
质粒pDG268MCSΔneo/scBAN/Sav(美国专利No.5,955,310)用SacI酶切消化。用QIAquick DNA提取试剂盒按厂商说明纯化酶切消化过的质粒,最后用NotI酶切消化。用QIAquick DNA提取试剂盒按厂商说明(QIAGEN,Valencia,CA)从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化约6800bp的最大的质粒片段。然后将回收的载体DNA与下述DNA插入片段连接。
质粒pHA7(实施例4,图13)用SacI酶切消化。按上述方法纯化酶切消化过的质粒,最后用NotI酶切消化。按上述方法凝胶纯化约4,300bp的最小的质粒片段。采用Rapid DNA克隆试剂盒按厂商说明将回收的载体与DNA插入片段连接。在转化至枯草芽孢杆菌前,采用ScaI将上述连接体线性化以确保染色体中为双交换整合而不是但交换整合。将用限制性酶ScaI酶切消化的连接产物转化枯草芽孢杆菌168Δ4感受态细胞。
在添加了5μg氯霉素/ml的TBAB平板上于37℃下筛选枯草芽孢杆菌氯霉素-抗性转化体。为筛选经由在amyE基因座处双交换的质粒的整合,将枯草芽孢杆菌原始转化体铺于添加了6μg新霉素/ml的TBAB琼脂板和在添加了5μg氯霉素/ml的TBAB琼脂板上以分离氯霉素抗性和新霉素敏感性“湿”转化体(由于透明质酸的生成)。
采用QIAGEN tip-20柱(QIAGEN,Valencia,CA)按厂商说明从“湿”、氯霉素抗性和新霉素敏感性枯草芽孢杆菌168Δ4转化体中分离基因组DNA。使用引物3、8、16、22和引物30(实施例1)对这些转化体实施PCR扩增,以证实在枯草芽孢杆菌转化体操纵子存在这些基因及其完整性。扩增反应(25μl)含有如下成分:50ng枯草芽孢杆菌168Δ4转化体的基因组DNA,每个引物各0.5μM,dATP、dCTP,dGTP和dTTP各200μM,1×PCR缓冲液II,3mM MgCl2的和0.625单位AmpliTaq GoldTM DNA聚合酶。在RoboCycler 40 thermacycler中实施反应,反应条件:95℃9分钟1个循环;95℃1分钟,55℃1分钟,72℃2分钟30个循环;最后一个循环72℃7分钟。
引物3和8用于证实存在hasA基因,引物3和16用于证实存在tuaD基因,引物3和22用于证实存在gtaB基因,引物3和30用于证实存在gcaD基因。将枯草芽孢杆菌168Δ4 hasA/tuaD/gcaB整合体命名为枯草芽孢杆菌RB160。
采用QIAGEN tip-20柱按厂商说明从枯草芽孢杆菌RB160中分离基因组DNA,并用于转化感受态枯草芽孢杆菌A164Δ5。在添加了5μg氯霉素/ml的TBAB平板上并于37℃下培养16小时筛选转化体。以其“湿”表型鉴定枯草芽孢杆菌A164Δ5 hasA/tuaD/gcaD整合体并将其命名为枯草芽孢杆菌RB163。
实施例7:构建枯草芽孢杆菌TH-1
采用下述步骤从似马链球菌中获得透明质酸合酶(has)操纵子。所述has操纵子含有hasA、hasB、hasC和hasD基因。用HindIII酶切消化约20μg的似马链球菌D181(Kumari和Weigel,1997,Joumal of BiologicalChemistry 272:32539-32546)的染色体DNA和在0.8%琼脂糖-0.5×TBE凝胶分辨。从胶上切下3-6kb范围内的DNA并用QIAquick DNA凝胶提取试剂盒按厂商说明进行纯化。然后将回收的DNA插入片段与下述载体DNA连接。
用HindIII酶切消化质粒pUC18(2μg)并用虾碱性磷酸酶按厂商说明(Roche Applied Science;Indianapolis,IN)将5′突出末端(protruding end)去磷酸化。采用Rapid DNA克隆试剂盒按厂商说明连接去磷酸的载体和DNA插入片段。将连接体用于转化大肠杆菌XL10 GOLD Kan感受态细胞(Stratagene,INC.,La Jolla,CA)。将细胞铺于Luria肉汤平板(100μg/ml氨苄青霉素)上并于37℃下培养过夜。用寡核苷酸952-55-1探测含有大约500克隆/板的5块平板,所述寡核苷酸如下述,其是与接近似马链球菌D181hasA基因3’末端的编码链相同的54bp序列(关于ATG翻译起始密码子的A残基的1098-1151位核苷酸)。
引物31:
5′-GTGTCGGAACATTCATTACATGCTTAAGCACCCGCTGTCCTTCTTGTTATCTCC-3′(SEQ ID NO:39)
用DIG寡核苷酸3′-端标记试剂盒按厂商说明(Roche Applied Science;Indianapolis,IN)对所述寡核苷酸探针实施DIG-标记。按“THE DIG SYSTEMUSER′S GUIDE FOR FILTER HYBRIDIZATION”(Boehringer MannheimGmbH)中所述实施克隆杂交和化学发光检测。
鉴定出与探针杂交的7个克隆。采用QIAGEN自动仪器(QIAGEN,Valencia,CA)并按厂商说明纯化来自这些转化体中一个的质粒DNA并用HindIII酶切消化,然后在使用0.5×TBE缓冲液的0.8%琼脂糖凝胶上分析。DNA插入片段显示出约5kb的大小。将这一质粒命名为pMRT106(图14)。
使用EZ∷TNTM<TET-1>插入试剂盒按厂商说明(Epicenter Technologies,Madison,WI)确定克隆片段的DNA序列。测序显示了克隆的插入片段包含似马链球菌hasA基因的后1156bp,其后是称为hasB、hasC和hasD的三个其它基因;推测全部四个基因包含在单操纵子中并因此共转录。似马链球菌hasB基因包含在所述片段的1411-2613位核苷酸(SEQ ID No:40[DNA序列]和41[推导的氨基酸序列])中,似马链球菌hasC基因包含在所述片段的2666-3565位核苷酸中(SEQ ID No:42[DNA序列]和43[推导的氨基酸序列]),以及似马链球菌hasD基因包含在所述片段的3735-5114位核苷酸(SEQ ID No:44[DNA序列]和45[推导的氨基酸序列])中。
由似马链球菌hasB和hasC基因编码的多肽显示其与那些分别由来自酿脓链球菌has操纵子序列(Ferretti等,2001,Proc.Natl.Acad.Sci.美国A。98(8),4658-4663)的hasB和hasC基因编码的多肽有同一性。使用Clustal法(Higgins,1989,CABIOS 5:151-153)使用Vector NTI AlignX软件包(Informax INC.,Bethesda,MD)以及如下配对比对缺省参数:pairwisealignment,缺口罚分10,缺口长度罚分0.1,和分数矩阵:blosum62mt2来确定同一性程度。
氨基酸序列比较显示出似马链球菌HAsB蛋白与来自乳房链球菌的HasB蛋白(SEQ ID NO:105)有70%的同一性;似马链球菌HasC蛋白与来自乳房链球菌的HasC蛋白(SEQ ID NO:99)有91%的同一性;和似马链球菌HasD蛋白与酿脓链球菌(登记号#Q8P286)的GlmU蛋白(推定的UDP-N-乙酰葡糖胺焦磷酸化酶)有73%的同一性。似马链球菌hasD基因编码的多肽显示出与由枯草芽孢杆菌的gcaD基因所编码的UDP-N-乙酰葡糖胺焦磷酸化酶有50.7%的同一性。
质粒pHA5(实施例3,图11)用HpaI和BamHI酶切消化。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上分析酶切消化并用QIAquick DNA提取试剂盒按厂商说明凝胶纯化较大的载体片段(约11,000bp)。质粒pMRT106用HindIII酶切消化,用Klenow片段填补粘性末端,用BamHI酶切消化DNA。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上分析酶切消化并用QIAquickDNA提取试剂盒按厂商说明凝胶纯化较小的插入片段(约1000bp,似马链球菌hasD基因的后2/3)。
用T4 DNA连接酶按厂商说明将两个纯化的片段连接在一起,并将连接混合物转化至大肠杆菌SURE感受态细胞中。于37℃在加入100μg氨卡青霉素/ml的2XYT琼脂板上筛选转化体。
采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并通过BamHI+NotI酶切消化在使用0.5×TBE缓冲液的0.8%琼脂糖凝胶上进行分析。存在约1,100bp的BamHI/NotI hasD片段即可鉴定为正确的质粒并将其命名为pHA8(图15)。用HindIII酶切消化这一质粒并用T4 DNA连接酶将其连接,将连接混合物转化至大肠杆菌SURE感受态细胞中。于37℃在加入100μg氨卡青霉素/ml的2XYT琼脂板上筛选转化体。采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并通过HindIII酶切消化在使用0.5×TBE缓冲液的0.8%琼脂糖凝胶上分析。存在约9,700bp的单条带即可鉴定为正确的质粒并将其命名为pHA9(图16)。
质粒pHA9用SacI和NotI酶切消化。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上分析酶切消化并用QIAquick DNA提取试剂盒按厂商说明凝胶纯化约2,500bp的较小片段。质粒pDG268MCSΔNEO/scBAN/Sav(美国专利No.5,955,310)用SacI和NotI酶切消化。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上分析酶切消化并用QIAquick DNA提取试剂盒按厂商说明凝胶纯化约6,800bp的较大载体片段。用T4 DNA连接酶按厂商说明将两个纯化的片段连接在一起,并将连接混合物转化至大肠杆菌SURE感受态细胞(Stratagene,INC.,La Jolla,CA)中。在加入100μg氨卡青霉素/ml的2XYT琼脂板上筛选转化体。
采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并通过SalI加HindIII酶切消化在使用0.5×TBE缓冲液的0.8%琼脂糖凝胶上分析。存在约1600bp的SalI/HindIII片段即可鉴定为正确的质粒并将其命名为pHA10(图17)。
质粒pHA10用HindIII和BamHI酶切消化。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上分析酶切消化并用QIAquick DNA提取试剂盒按厂商说明凝胶纯化较大的载体片段(约8100bp)。质粒pMRT106用HindIII和BamHI酶切消化。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上分析酶切消化并用QIAquick DNA提取试剂盒按厂商说明凝胶纯化约4,100bp的较大插入片段。用T4 DNA连接酶按厂商说明将两个纯化的片段连接在一起,并将连接混合物用于转化枯草芽孢杆菌168Δ4。于37℃在加入5μg氯霉素/ml的TBAB琼脂板上筛选转化体。将约100个转化体点在添加了氯霉素(5μg/ml)的TBAB和添加了新霉素(10μg/ml)的TBAB上以计数氯霉素抗性、新霉素敏感性克隆;该表型可用于指示双交换至amyE基因座中。鉴定少量所述克隆,所述克隆均表现出“湿”表型,该表型指示透明质酸的生成。选择一个并将其命名为枯草芽孢杆菌168Δ4∷scBAN/se hasA/hasB/hasC/hasD。
采用QIAGEN tip-20柱按厂商说明从枯草芽孢杆菌168Δ4∷scBAN/sehasA/hasB/hasC/hasD中分离基因组DNA,并用于转化感受态枯草芽孢杆菌A164Δ5。在添加了5μg氯霉素/ml的TBAB平板上并于37℃下培养16小时筛选转化体。以其“湿”表型鉴定枯草芽孢杆菌A164Δ5hasA/hasB/hasC/hasD整合体并将其命名为枯草芽孢杆菌TH-1。
实施例8:构建枯草芽孢杆菌RB184
来自似马链球菌(实施例1)的hasA基因和tuaD基因(枯草芽孢杆菌hasB的同系物)(实施例1)在短“共有序列”amyQ(scBAN)启动子(美国专利No.5,955,310)控制下进行克隆。
质粒pDG268MCSΔneo/scBAN/Sav(美国专利No.5,955,310)用SacI酶切消化。用QIAquick DNA提取试剂盒按厂商说明纯化酶切消化过的质粒,最后用NotI酶切消化。用QIAquick DNA提取试剂盒按厂商说明(QIAGEN,Valencia,CA)从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化约6,800bp的最大的质粒片段。然后将回收的载体DNA与下述DNA插入片段连接。
质粒pHA5(实施例3,图11)用HpaI酶切消化。然后按上述方法纯化酶切消化过的质粒,最后用XbaI酶切消化。按上述方法凝胶纯化约4,300bp的最小的质粒片段。然后通过首先在85℃下,30分钟灭活XbaI将双-酶切消化过的质粒平端化。通过加入10mM dNTP各0.5μl,1μl 1U/μl的T4 DNA聚合酶(Roche Applied Science;Indianapolis,IN)并在11℃下孵育30分钟实施平端化。最后通过在75℃下孵育反应10分钟灭活聚合酶。然后按上述方法凝胶纯化约11,000bp的最大质粒片段并采用Rapid DNA克隆试剂盒按厂商说明再连接。将连接混合物转化至大肠杆菌SURE感受态细胞。于37℃在加入100μg氨卡青霉素/ml的2XYT琼脂板上筛选转化体。采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并通过ScaI酶切消化在使用0.5×TBE缓冲液的0.8%琼脂糖凝胶上分析。存在约11kb片段带即可鉴定为正确的质粒并将其命名为pRB157(图18)。
质粒pRB157用SacI酶切消化。用QIAquick DNA提取试剂盒按厂商说明纯化酶切消化过的质粒,最后用NotI酶切消化。用QIAquick DNA提取试剂盒按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化约2,632bp的最小的质粒片段。然后将回收的DNA插入片段与上述载体DNA连接。
在转化至枯草芽孢杆菌前,采用ScaI将上述连接体线性化以确保染色体中为双交换整合而不是但交换整合。将用限制性酶ScaI酶切消化的连接产物转化枯草芽孢杆菌168Δ4感受态细胞。
在添加了5μg氯霉素/ml的TBAB平板上筛选枯草芽孢杆菌氯霉素-抗性转化体。为筛选经由在amyE基因座处双交换的质粒的整合,将枯草芽孢杆菌原始转化体铺于添加了6μg新霉素/ml的TBAB琼脂板和在添加了5μg氯霉素/ml的TBAB琼脂板上以分离氯霉素抗性和新霉素敏感性“湿”转化体(由于透明质酸的生成)。
采用QIAGEN tip-20柱按厂商说明从“湿”、氯霉素抗性和新霉素敏感性枯草芽孢杆菌168Δ4转化体中分离基因组DNA。采用引物3、8和16(实施例1)针对这些转化体实施PCR扩增以证实hasA和tuaD存在枯草芽孢杆菌转化体操纵子中以及所述hasA和tuaD的完整性。扩增反应(25ul)含有如下成分:50ng枯草芽孢杆菌168Δ4转化体的基因组DNA,每个引物各0.5μM,dATP、dCTP,dGTP和dTTP各200μM,1×PCR缓冲液II,3mM MgCl2的和0.625单位AmpliTaq GoldTM DNA聚合酶。在RoboCycler 40thermacycler中实施反应,反应条件:95℃9分钟1个循环;95℃1分钟,55℃1分钟,72℃2分钟30个循环;最后一个循环72℃7分钟。
引物3和8用于证实存在hasA基因而引物3和16用于证实存在tuaD基因。将枯草芽孢杆菌168Δ4hasA/tuaD整合体命名为枯草芽孢杆菌RB183。
枯草芽孢杆菌RB183的基因组DNA也用于转化感受态枯草芽孢杆菌A164Δ5。在添加了5μg氯霉素/ml的TBAB平板上并于37℃下培养16小时筛选转化体。以其“湿”表型鉴定枯草芽孢杆菌A164Δ5 hasA/tuaD整合体并将其命名为枯草芽孢杆菌RB184。
实施例9:构建枯草芽孢杆菌RB187
将枯草芽孢杆菌RB161制备为感受态然后用cat缺失的质粒pRB115(Widner等,2000,Journal of Industrial Microbiology&Biotechnology 25:204-212)转化。在非许可温度45℃下,采用红霉素(5μg/ml)筛选法实施对直接整合入染色体的筛选。在该温度下,复制的起点是无活性的。只有将质粒整合入细菌染色体上的cat基因,细胞才能保持红霉素抗性。将这些所谓的“整合体(integrant)”保持在45℃以确保在该温度下的生长和筛选。为了允许质粒的缺失或“looping out”(其将导致染色体多数cat基因的缺失),将整合体在Luria-Bertani(LB)培养基中于34℃的许可温度下不经筛选培养很多代。在该温度下,复制的PE194起点是活性的并启动质粒从基因组中的切除(Molecular Biological Methods for Bacillus,edited by C.R.Harwoodand S.M.Cutting,1990,John WILEY and Sons Ltd。)。
然后将细胞铺于非选择性LB琼脂板上并按下列标准鉴定包含cat基因中的缺失和基于PE194的复制子缺失的克隆:(1)氯霉素敏感性显示存在cat缺失;(2)红霉素敏感性显示不存在由载体PRB115编码的红霉素抗性基因;和(3)PCR证实在所研究菌株中存在cat的缺失。使用引物32和33实施PCR以证实cat基因在amyE基因座的缺失:
引物32:5′-GCGGCCGCGGTACCTGTGTTACACCTGTT-3′(SEQ ID NO:46)
引物33:
5’-GTCAAGCTTAATTCTCATGTTTGACAGCTTATCATCGG-3’(SEQ ID NO:47)
采用 REDextract-N-AmpTM Plant PCR试剂盒(Sigma ChemicalCompany,St.Louis,MO)按如下步骤从潜在缺失株中分离染色体DNA:将单芽孢杆菌克隆接种于100μl提取溶液(Sigma Chemical Company,St.Louis,MO)中,于95℃培养10分钟,然后用等体积稀释溶液(Sigma ChemicalCompany,St.Louis,MO)稀释。采用4μl提取的DNA联合REDextract-N-AmpPCR反应混合物及所需引物按厂商说明,按照实施例5中所述PCR循环条件实施PCR。使用0.8%琼脂糖-0.5×TBE凝胶显影PCR反应产物。将鉴定的菌株命名为枯草芽孢杆菌RB187。
实施例10:构建枯草芽孢杆菌RB192
通过缺失氯霉素抗性基因(cat基因)使枯草芽孢杆菌RB184未被标记。可采用实施例9中所述方法实施。将得到的菌株命名为枯草芽孢杆菌RB192。
实施例11:构建枯草芽孢杆菌RB194
通过缺失枯草芽孢杆菌RB187染色体的cypX区(实施例9)构建枯草芽孢杆菌RB194。所述cypX区包括cypX基因(其编码类细胞色素P450的与发酵期间红色素合成相关的酶)。为了缺失染色体的该区域,构建质粒pMRT086。
采用引物34和35通过PCR从枯草芽孢杆菌BRG-1中扩增出作为单片段的含有cypX-yvmC和yvmB-yvmA操纵子的染色体区。枯草芽孢杆菌BRG1基本上是枯草芽孢杆菌淀粉酶生成株的化学诱变分离株,所述枯草芽孢杆菌淀粉酶生成株基于实施例5中所述的枯草芽孢杆菌A164Δ5遗传背景。该区的序列与枯草芽孢杆菌168型菌株的已经公开的序列相同。
引物34:
5′-CATGGGAGAGACCTTTGG-3′(SEQ ID NO:48)
引物35:
5′-GTCGGTCTTCCATTTGC-3′(SEQ ID NO:49)
扩增反应(50μl)含有如下成分:200ng枯草芽孢杆菌BRG-1染色体DNA,引物34和35各0.4μM,dATP、dCTP,dGTP和dTTP各200μM,含有1.5mM MgCl2的Expand High Fidelity缓冲液(Roche Applied Science;INDIANAPOLIS,IN)和2.6单位Expand High Fidelity PCR System enzymemix(Roche Applied Science;Indianapolis,IN)。采用QIAGEN tip-20柱按厂商说明获得枯草芽孢杆菌BRG-1染色体DNA。在RoboCycler 40thermacycler(Stratagene,Inc,La Jolla,CA)中实施扩增反应,反应条件:95℃3分钟1个循环;95℃1分钟,58℃1分钟,68℃4分钟10个循环;95℃1分钟,58℃1分钟,68℃4分钟+20秒20个循环,然后72℃7分钟1个循环。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶电泳上分析反应产物。
采用TA-TOPO克隆试剂盒将含有cypX-yvmC和yvmB-yvmA操纵子的所得片段克隆至pCR2.1并按厂商说明(Invitrogen,INC.,Carlsbad,CA)将其转化至大肠杆菌ONESHOTTM细胞。在添加了100μg氨卡青霉素/ml的2X YT琼脂板上筛选转化体。用QIAGEN tip-20柱按厂商说明从若干转化体中分离质粒DNA并使用M13(-20)正向和M13反向引物和引物36-51实施DNA测序进行鉴定。
将得到的质粒命名为pMRT084(图19)。
引物36:5′-CGACCACTGTATCTTGG-3′(SEQ ID NO:50)
引物37:5’-GAGATGCCAAACAGTGC-3’(SEQ ID NO:51)
引物38:5′-CATGTCCATCGTGACG-3′(SEQ ID NO:52)
引物39:5′-CAGGAGCATTTGATACG-3′(SEQ ID NO:53)
引物40:5′-CCTTCAGATGTGATCC-3′(SEQ ID NO:54)
引物41:5’-GTGTTGACGTCAACTGC-3’(SEQ ID NO:55)
引物42:5′-GTTCAGCCTTTCCTCTCG-3′(SEQ ID NO:56)
引物43:5′-GCTACCTTCTTTCTTAGG-3′(SEQ ID NO:57)
引物44:5’-CGTCAATATGATCTGTGC-3’(SEQ ID NO:58)
引物45:5′-GGAAAGAAGGTCTGTGC-3′(SEQ ID NO:59)
引物46:5′-CAGCTATCAGCTGACAG-3′(SEQ ID NO:60)
引物47:5′-GCTCAGCTATGACATATTCC-3′(SEQ ID NO:61)
引物48:5′-GATCGTCTTGATTACCG-3′(SEQ ID NO:62)
引物49:5′-AGCTTTATCGGTGACG-3′(SEQ ID NO:63)
引物50:5′-TGAGCACGATTGCAGG-3′(SEQ ID NO:64)
引物51:5′-CATTGCGGAGACATTGC-3′(SEQ ID NO:65)
用BsgI酶切消化质粒pMRT084以缺失大部分cypX-yvmC和yvmB-yvmA操纵子,在每端留下约500碱基。用T4 DNA聚合酶处理酶切消化的BsgIDNA。用SmaI酶切消化质粒pECC1(YOUNGMAN等,1984,质粒12:1-9)。采用QIAquick DNA纯化试剂盒按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化来自pMRT084的约5,100载体片段和来自pECC1的约1,600bp片段,将其连接在一起,并按厂商说明用于转化大肠杆菌XL1Blue细胞(Stratagene,INC.,La Jolla,CA)。在添加了100μg氨卡青霉素/ml的2XYT平板上筛选氨卡青霉素-抗性转化体。通过用引物52和53的PCR扩增DNA测序鉴定携带含有缺失的大多数cypX-yvmC和yvmB-yvmA操纵子的正确质粒的转化体。在含有如下成分:1ng质粒DNA,每个引物各0.4μM,dATP、dCTP,dGTP和dTTP各200μM,含有1.5mM MgCl2的1×PCR缓冲液II,2.5单位AmpliTaq GoldTM DNA聚合酶的50μl的反应中实施PCR扩增。在RoboCycler 40 thermacycler(Stratagene,Inc,La Jolla,CA)中实施扩增反应,反应条件:95℃10分钟1个循环;95℃1分钟,55℃1分钟,72℃1分钟25个循环,72℃7分钟1个循环。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上显影PCR产物。将这一构建体命名为pMRT086(图20)。
引物52:
5’-TAGACAATTGGAAGAGAAAAGAGATA-3’(SEQ ID NO:66)
引物53:
5’-CCGTCGCTATTGTAACCAGT-3’(SEQ ID NO:67)
用ScaI线性化质粒pMRT086并在存在0.2μg氯霉素/ml的情况下将其转化至枯草芽孢杆菌RB128感受态细胞。
在添加了5μg氯霉素/ml的TBAB平板上并于37℃下培养16小时后筛选转化体。转化体使用QIAGEN tip-20柱按厂商说明从若干转化体中制备染色体DNA。通过采用引物36和52、36和53、37和52以及37和53实施针对cypX-yvmC和yvmB-yvmA操纵子缺失的PCR来筛选氯霉素抗性克隆。在含有如下成分:50ng质粒DNA,每个引物各0.4μM,dATP、dCTP,dGTP和dTTP各200μM,含有2.5mM MgCl2的1×PCR缓冲液II,2.5单位AmpliTaq GoldTM DNA聚合酶的50μl的反应中实施PCR扩增。在RoboCycler 40 thermacycler中实施扩增反应,反应条件:95℃10分钟1个循环;95℃1分钟,55℃1分钟,72℃1分钟25个循环,72℃7分钟1个循环。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上显影PCR产物。将得到枯草芽孢杆菌RB128 cypX-yvmC和yvmB-yvmA缺失株命名为枯草芽孢杆菌MaTa17。
用来自枯草芽孢杆菌MaTa17基因组DNA转化枯草芽孢杆菌RB187(实施例9)的感受态细胞。采用QIAGENtip-20柱按厂商说明从该株中获得基因组DNA。
在添加了5μg氯霉素/ml的TBAB平板上并于37℃下筛选枯草芽孢杆菌氯霉素抗性转化体。含有5μg氯霉素/ml的TBAB平板上在37℃下对原始转化体实施单克隆分离。将得到的cypX-yvmC和yvmB-yvmA缺失株命名为枯草芽孢杆菌RB194。
实施例12:构建枯草芽孢杆菌RB197
枯草芽孢杆菌RB197与枯草芽孢杆菌RB194非常相似,唯一的区别在于RB197包含cypX区中较小的缺失:在该株中仅缺失部分cypX基因以生成cypX缺失表型。为实现该目的,按下述方法构建质粒pMRT122。
通过用EcoRI/HindIII酶切消化质粒pSJ2739(WO 96/23073)构建质粒pCJ791(图21)并连接至含有来自枯草芽孢杆菌的缺失形式的WPRA基因(细胞壁丝氨酸蛋白酶)的片段。采用下述引物54和55从获自枯草芽孢杆菌DN1885(Diderichsen等,1990,Journal ofBacteriology 172:4315-4321)的染色体DNA中扩增WPRA的5′区,并采用下述引物56和57扩增WPRA的3′区。在含有如下成分:1ng枯草芽孢杆菌DN1885染色体DNA,引物39和40各0.4μM,dATP、dCTP,dGTP和dTTP各200μM,含有2.5mM MgCl2的1×PCR缓冲液II,2.5单位AmpliTaq GoldTM DNA聚合酶的50μl的反应中实施PCR扩增。在RoboCycler 40 thermacycler中实施扩增反应,反应条件:95℃10分钟1个循环;95℃1分钟,55℃1分钟,72℃1分钟25个循环,72℃7分钟1个循环。
用BglII酶切消化随后连接的方法将5’和3’WPRA PCR片段连接,和采用引物54和57对连接混合物片段实施PCR扩增。在含有如下成分:1ng连接的片段,每个引物各0.4μM,dATP、dCTP,dGTP和dTTP各200μM,含有2.5mM MgCl2的1×PCR缓冲液II,2.5单位AmpliTaq GoldTM DNA聚合酶的50μl的反应中实施PCR扩增。在RoboCycler 40 thermacycler中实施扩增反应,反应条件:95℃10分钟1个循环;95℃1分钟,55℃1分钟,72℃1分钟25个循环,72℃7分钟1个循环。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上显影PCR产物。将得到的PCR片段作为EcoRI/HindIII片段克隆至pSJ2739中,结果得到质粒pCJ791(图21)。在添加了1μg红霉素/ml和25μg卡那霉素/ml的TBAB-琼脂糖平板上并于28℃下培养24-48小时后筛选转化体。用QIAGEN tip-20柱按厂商说明从若干转化体中分离质粒DNA并使用引物54至57按上述条件实施PCR扩增进行鉴定。
引物54:
5’-GGAATTCCAAAGCTGCAGCGGCCGGCGCG-3’(SEQ ID NO:68)
引物55:
5’-GAAGATCTC GTATACTTGGCTTCTGCAGCTGC-3’(SEQ ID NO:69)
引物56:
5’-GAAGATCTGGTCAACAAGCTGGAAAGCACTC-3’(SEQ ID NO:70)
引物57:
5’-CCCAAGCTTCGTGACGTACAGCACCGTTCCGGC-3’(SEQ ID NO:71)
采用下述引物对58/59和60/61通过SOE将来自质粒pDN1981(美国专利No.5,698,415)的amyL上游序列和5′编码区融合在一起。按下述方法将所得片段克隆至载体pCR2.1以生成质粒pMRT032。在含有如下成分:1ng的pDN1981DNA,适宜的引物各0.4μM,dATP、dCTP,dGTP和dTTP各200μM,含有2.5mM MgCl2的1×PCR缓冲液II,2.5单位AmpliTaq GoldTMDNA聚合酶的50μl的反应中实施PCR扩增。在RoboCycler 40 thermacycler中实施扩增反应,反应条件:95℃9分钟1个循环;95℃1分钟,52℃1分钟,72℃1分钟3个循环; 95℃1分钟,55℃1分钟,72℃ 1分钟27个循环,72℃5分钟1个循环。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上显影PCR产物。所要片段分别为约530和466bp。采用引物对59/60生成最终的SOE片段并采用TA-TOPO克隆试剂盒将其克隆至pCR2.1载体。在添加了100μg/ml氨卡青霉素的2XYT-琼脂糖平板上并于37℃下培养16小时后筛选转化体。用QIAGEN tip-20柱按厂商说明从若干转化体中分离质粒DNA并使用M13(-20)正向和M13反向引物实施DNA测序进行鉴定。将含有amyL上游序列/5′编码序列融合片段的质粒命名为pMRT032(图22)。
引物58:
5′-CCTTAAGGGCCGAATATTTATACGGAGCTCCCTGAAACAACAAAAACGGC-3′(SEQ ID NO:72)
引物59:
5′-GGTGTTCTCTAGAGCGGCCGCGGTTGCGGTCAGC-3′(SEQ ID NO:73)
引物60:
5’-GTCCTTCTTGGTACCTGGAAGCAGAGC-3’(SEQ ID NO:74)
引物61:
5’-GTATAAATATTCGGCCCTTAAGGCCAGTACCATTTTCCC-3’(SEQID NO:75)
用NsiI和NotI酶切消化质粒pNNB194(pSK+/pE194;美国专利No.5,958,728),并用Pstl和NotI酶切消化质粒pBEST501(ITAYA等1989Nucleic Acids Research 17:4410)。采用QIAquick DNA纯化试剂盒按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化来自pNNB194的5,193bp载体片段和来自pBEST501的含有neo基因的1,306bp片段。将分离的片段连接在一起并按厂商说明用于转化大肠杆菌SURE感受态细胞。在添加了100μg氨卡青霉素/ml的2X YT平板上筛选氨卡青霉素-抗性转化体。采用QIAGEN质粒试剂盒(QIAGEN INC.,Valencia,CA)从一个所述转化株中分离质粒DNA,并用NsiI和NotI酶切消化以鉴定所述质粒。将这一质粒命名为PNNB194neo(图23)。
用SacI/NotI酶切消化质粒pNNB194neo并采用标准步骤用T4 DNA聚合酶和dNTP处理以生成平端。用Ec1136II酶切消化质粒pPL2419(美国专利No.5,958,728)。采用QIAquick DNA纯化试剂盒按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化来自pNNB194neo的6,478bp载体片段和来自pPL2419的含有oriT的562bp片段。将纯化的片段连接在一起并按厂商说明用于转化大肠杆菌SURE细胞。在添加了100μg氨卡青霉素/ml的2XYT平板上于37℃下筛选氨卡青霉素-抗性转化体。采用QIAGEN质粒试剂盒从一个所述转化株中分离质粒DNA,并用NsiI、SacI和Bscl酶切消化以鉴定所述质粒。将这一质粒命名为pNNB194neo-oriT(图24)。
用BamHI酶切消化质粒pNNB194neo-oriT并采用标准步骤用T4 DNA聚合酶和dNTP处理以生成平端。用QIAquick DNA纯化试剂盒按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化酶切消化过的质粒。用T4 DNA连接酶处理纯化的质粒并按厂商说明用于转化大肠杆菌SURE细胞。在添加了100μg氨卡青霉素/ml的2XYT平板上于37℃下筛选氨卡青霉素-抗性转化体。采用QIAGEN质粒试剂盒从一个所述转化株中分离质粒DNA,并用BamHI和ScaI酶切消化以证实BamHI位点的断裂。将得到的质粒命名为pShV3(图25)。
用Sfil和NotI酶切消化质粒pShV2.1-amyEΔ(美国专利No.5,958.728),采用QIAquick DNA纯化试剂盒按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化8696 bp载体片段。为了pShV2.1-amyEΔ的Sfil和NotI位点间插入BamHI位点,按下述步骤构建合成联接子:通过将其各50uM混合,煮沸该混合物并缓慢冷却所述混合物,退火引物62和63。
引物62:5’-GGGCCGGATCCGC-3’(SEQ ID NO:76)
引物63:3’-ATTCCCGGCCTAGGCGCCGG-5’(SEQ ID NO:77)
将纯化的pShV2.1-amyEΔ载体和退火的寡核苷酸连接在一起并按厂商说明用于转化大肠杆菌SURE感受态细胞。在添加了30μg氯霉素/ml的LB平板上于37℃下筛选氯霉素-抗性转化体。采用QIAGEN质粒试剂盒从一个所述转化株中分离质粒DNA,并用BamHI酶切消化以证实BamHI位点的插入。将这一质粒命名为pShV2.1-amyEΔB(图26)。
用SalI/HindIII酶切消化质粒pShV3和pShV2.1-amyEΔB。采用QIAquickDNA纯化试剂盒按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化来自pShV3的7033 bp载体片段和来自pShV2.1-amyEΔ的含有amyEΔ的1031bp片段。将凝胶纯化的片段连接在一起并按厂商说明用于转化大肠杆菌SURE细胞。在添加了100μg氨卡青霉素/ml的2XYT平板上于37℃下筛选氨卡青霉素-抗性转化体。采用QIAGEN质粒试剂盒从一个所述转化株中分离质粒DNA,并用SalI和HindIII酶切消化以鉴定所述质粒。将这一质粒命名为pShV3A(图27)。
用KpnI/XbaI酶切消化质粒pMRT032,在存在dNTP的情况下用Klenow片段DNA聚合酶填补,并采用QIAquick DNA纯化试剂盒按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中分离约1000bp的片段。将该片段克隆至用EcoRV酶切消化的质粒pShV3a,并按厂商说明转化至大肠杆菌XL1Blue细胞。在添加了100μg氨卡青霉素/ml的2XYT平板上并于37℃下培养16小时后筛选氨卡青霉素-抗性转化体。采用QIAGEN tip-20柱按厂商说明从若干转化体中分离质粒DNA并通过用SacI/SphI的限制性分析在0.8%琼脂糖-0.5×TBE凝胶上对其进行鉴定。将得到的质粒命名为pMRT036(图28)。
用EcoRI/HindIII酶切消化质粒pMRT036,在存在dNTP的情况下用Klenow片段DNA聚合酶填补,连接并转化至大肠杆菌XL1Blue细胞按厂商说明。在添加了100μg氨卡青霉素/ml的2XYT平板上并于37℃下培养16小时后筛选转化体。采用QIAGEN tip-20柱按厂商说明从若干转化体中分离质粒DNA并通过用SacIIXBAI、PSTL和NdeI的限制性分析在0.8%琼脂糖-0.5×TBE凝胶上对其进行鉴定。将得到的质粒命名为pMRT037(图29)。
采用QIAquick DNA纯化试剂盒按厂商说明在2%琼脂糖-0.5×TBE凝胶上从质粒pDG268Δneo-cryIIIAstaB/Sav(美国专利No.5,955,310)中以Sfil/SacI片段将scBAN/cryIIIA稳定片段分离,将其与用Sfil/SacI酶切消化的质粒pMRT037连接,并转化至大肠杆菌XL1Blue细胞。在添加了100μg氨卡青霉素/ml的2XYT平板上并于37℃下培养16小时后筛选转化体。采用QIAGEN tip-20柱按厂商说明从若干转化体中分离质粒DNA并通过用PSTL的限制性分析在0.8%琼脂糖-0.5×TBE凝胶上对其进行鉴定。将得到的质粒命名为pMRT041(图30)。
用EcoRI/HindIII酶切消化质粒pMRT041和pCJ791。采用QIAquickDNA纯化试剂盒按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中分离来自pMRT041的约1300bp片段和来自pCJ791的约4500bp片段,连接,并转化至枯草芽孢杆菌168Δ4感受态细胞。在添加了1μg红霉素/ml和25μg林可霉素的TBAB-琼脂板上并于30℃下培养24-48小时后筛选转化体。采用QIAGEN tip-20柱按厂商说明从若干转化体中分离质粒DNA并通过用SacI和EcoRI/HindIII的限制性分析在0.8%琼脂糖-0.5×TBE凝胶上对其进行鉴定。将得到的质粒命名为pMRT064.1(图31)。
使用下述引物对64和65和引物对66和67引物并采用SOE缺失质粒pMRT064.1中2666位上的SacI位点。在含有如下成分:1ng的pMRT064.1DNA,每个引物各0.4μM,dATP、dCTP,dGTP和dTTP各200μM,含有2.5mM MgCl2的1×PCR缓冲液II,2.5单位AmpliTaq GoldTM DNA聚合酶的50μl的反应中实施PCR扩增。在RoboCycler 40 thermacycler中实施扩增反应,反应条件:95℃10分钟1个循环;95℃1分钟,52℃1分钟,72℃1分钟25个循环;72℃7分钟1个循环。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上显影PCR产物。所要片段分别为约400和800bp。采用引物64和67扩增用于克隆返回至pMRT064.1的最终片段。采用TA-TOPO克隆试剂盒将该片段克隆至pCR2.1载体。在添加了100μg氨卡青霉素/ml的2XYT琼脂板上并于37℃下培养16小时后筛选转化体。通过用M13正向和反向引物和引物65,67和68的DNA测序鉴定含有正确质粒转化体。将这一质粒命名为pMRT068(图32),并按厂商说明进一步转化至大肠杆菌DM1细胞(Stratagene,INC.,La Jolla,CA)。在添加了100μg氨卡青霉素/ml的2X YT琼脂板上筛选转化体。
引物64:5’-GGAAATTATCGTGATCAAC-3’(SEQ ID NO:78)
引物65:5′-GCACGAGCACTGATAAATATG-3′(SEQ ID NO:79)
引物66:5′-CATATTTATCAGTGCTCGTGC-3′(SEQ ID NO:80)
引物67:5′-TCGTAGACCTCATATGC-3′(SEQ ID NO:81)
引物68:5′-GTCGTTAAACCGTGTGC-3′(SEQ ID NO:82)
使用引物69和70并采用上述PCR条件实施PCR扩增来缺失质粒pMRT064.1中5463和6025位上的Sac位点。采用TA-TOPO克隆试剂盒(Invitrogen,INC.,Carlsbad,CA)将得到的片段克隆至pCR2.1载体。在添加了100μg氨卡青霉素/ml的2XYT琼脂板上并于37℃下培养16小时后筛选转化体。通过用M13正向和反向引物的DNA测序鉴定含有正确质粒转化体。将这一构建体命名为pMRT069(图33)。
引物69:
5′-CTAGAGGATCCCCGGGTACCGTGCTCTGCCTTTTAGTCC-3′(SEQ IDNO:83)
引物70:5’-GTACATCGAATTCGTGCTCATTATTAATCTGTTCAGC-3’(SEQ ID NO:84)
用BclI/AccI酶切消化质粒pMRT068和pMRT064.1。采用QIAquick DNA纯化试剂盒按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中分离来自pMRT068的约1300bp片段和来自pMRT064.1的约3800bp片段,连接,并转化至枯草芽孢杆菌168Δ4感受态细胞。在添加了1μg红霉素/ml和25μg林可霉素/ml的TBAB-琼脂板上并于30℃下培养24-48小时后筛选转化体。通过用SacI和EcoRI/AvaI的限制性分析在0.8%琼脂糖-0.5×TBE凝胶上鉴定含有正确质粒转化体。将所得构建体命名为pMRT071(图34)。
用AvaI/EcoRI酶切消化质粒pMRT071和pMRT069。采用QIAquickDNA纯化试剂盒按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中分离来自pMRT069的578bp片段和来自pMRT071的4510bp片段,连接,并转化至枯草芽孢杆菌168Δ4感受态细胞。在添加了1μg红霉素/ml和25μg林可霉素/ml的TBAB-琼脂板上并于30℃下培养24-48小时后筛选转化体。通过用SacI的限制性分析在0.8%琼脂糖-0.5×TBE凝胶上鉴定含有正确质粒转化体。将得到的构建体命名为pMRT074(图35)。
按厂商说明,用SacII/NdeI酶切消化实施例11中所述的质粒pMRT084,用T4 DNA聚合酶处理,连接并转化至大肠杆菌XL1Blue细胞。在添加了100μg氨苄青霉素/ml的2XYT琼脂板上并于37℃下培养16小时后筛选转化体。通过用Dral的限制性分析在0.8%琼脂糖-0.5×TBE凝胶上鉴定含有正确质粒转化体。将得到的质粒命名为pMRT120(图36)。
用HindIII酶切消化质粒pMRT074,用KLENOW片段DNA聚合酶处理并用EcoRI酶切消化。用EcoRI/ECL136II酶切消化质粒pMRT120。采用QIAquick DNA纯化试剂盒按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中分离来自pMRT120的约600bp片段和来自pMRT074的约4300bp片段,连接,并转化至枯草芽孢杆菌168Δ4感受态细胞。在添加了1μg红霉素/ml和25μg林可霉素/ml的TBAB-琼脂板上并于30℃下培养24-48小时后筛选转化体。通过用SSPL的限制性分析在0.8%琼脂糖-0.5×TBE凝胶上鉴定含有正确质粒转化体。将得到的构建体命名为pMRT122(图37)。
将质粒pMRT122转化至枯草芽孢杆菌A164Δ5感受态细胞。在添加了1μg红霉素/ml和25μg林可霉素/ml的TBAB-琼脂板上并于30℃下培养24-48小时后筛选转化体。采用同源重组至cypX基因座的方法将所述质粒导入枯草芽孢杆菌A164Δ5的染色体,所述同源重组通过在45℃下孵育枯草芽孢杆菌A164Δ5(pMRT086)细胞的新鲜划线平板16小时并选择正常生长的克隆实施。采用QIAGENtip-20柱按厂商说明从该菌株中分离基因组DNA并用于转化枯草芽孢杆菌RB187(实施例9)。在添加了1μg红霉素/ml和25μg林可霉素/ml的TBAB-琼脂板上并于45℃下培养16小时后筛选转化体。在该温度下,PE194复制子不能复制。只有在细菌染色体中保持所述质粒才能使细胞保持红霉素抗性。
借助结果得到染色体上cypX基因部分缺失的同源重组,通过将转化体在Luria-Bertani(LB)培养基在34℃的许可温度下不经筛选生长很多代从染色体中除去所述质粒。在该温度下,复制的PE194起点是有活性的并事实上启动从染色体中切除所述质粒(Molecular Biological Methods forBacillus,edited by C.R.Harwood and S.M.Cutting,1990,John WILEY andSons Ltd.)。
在生长传代若干代后,将所述细胞铺于非选择性LB琼脂糖平板并用下述方法鉴定已缺失了质粒及现在缺失了cypX的克隆和透明质酸的生成:(1)当铺于最小琼脂板上时,“湿”细胞斑显示透明质酸的生成(2)红霉素敏感性显示缺失基于pE194的质粒,和(3)通过使用上述引物34和45实施PCR确定在所需菌株中存在800bp cypX的缺失。
采用REDextract-N-AmpTM Plant PCR试剂盒(Sigma ChemicalCompany,St.Louis,MO)按如下步骤从潜在的cypX缺失株中分离染色体DNA:将单芽孢杆菌克隆接种于100μl提取溶液中,于95℃培养10分钟,然后用等体积稀释溶液稀释。采用4μl提取的DNA联合REDextract-N-AmpPCR反应混合物及所需引物按厂商说明,按照实施例5中所述PCR循环条件实施PCR从潜在cypX缺失体中分离染色体DNA。使用0.8%琼脂糖-0.5×TBE凝胶显影PCR反应产物。将鉴定的菌株命名为枯草芽孢杆菌RB197。
实施例13:构建枯草芽孢杆菌RB200
按照实施例9中所述用于枯草芽孢杆菌RB187的相同方法缺失枯草芽孢杆菌RB192的cypX基因。将得到的菌株命名为枯草芽孢杆菌RB200.
实施例14:构建枯草芽孢杆菌RB202
按下述方法构建枯草芽孢杆菌A164Δ5ΔcypX:将质粒pMRT122(实施例12)转化至枯草芽孢杆菌A164Δ5感受态细胞。在添加了1μg红霉素/ml和25μg林可霉素/ml的TBAB-琼脂板上并于30℃下培养24-48小时后筛选转化体。采用同源重组至cypX基因座的方法将所述质粒导入枯草芽孢杆菌A164Δ5的染色体,所述同源重组通过在45℃下孵育枯草芽孢杆菌A164Δ5(pMRT086)细胞的新鲜划线平板16小时并选择正常生长的克隆实施。借助结果得到染色体上cypX基因部分缺失的同源重组,通过将转化体在Luria-Bertani(LB)培养基在34℃的许可温度下不经筛选生长很多代从染色体中除去所述质粒。在该温度下,复制的PE194起点是有活性的并事实上启动从染色体中切除所述质粒(Molecular Biological Methods for Bacillus,edited by C.R.Harwood and S.M.Cutting,1990,John WILEY and Sons Ltd.)。在生长传代若干代后,将所述细胞铺于非选择性LB琼脂糖平板并用下述方法鉴定已缺失了质粒及现在缺失了cypX的克隆:(1)红霉素敏感性显示缺失基于pE194的质粒,和(2)通过使用上述引物34和35实施PCR确定在所需菌株中存在800bp cypX的缺失。将鉴定的菌株命名为枯草芽孢杆菌A164Δ5ΔcypX。
将枯草芽孢杆菌A164Δ5cypX制成感受态并使用采用QIAGEN tip-20柱按厂商说明分离的枯草芽孢杆菌TH1基因组DNA(实施例7)转化。在添加了5μg氯霉素/ml的TBAB平板上于37℃下筛选转化体。按其“湿”表型鉴定枯草芽孢杆菌A164Δ5ΔcypX hasA/hasB/hasC/hasD整合体并将其命名为枯草芽孢杆菌RB201。采用实施例9所述相同的方法从枯草芽孢杆菌RB201中缺失cat基因。将得到的菌株命名为枯草芽孢杆菌RB202。
实施例15:构建枯草芽孢杆菌MF002(fuaD/gtaB)
质粒pHA3(实施例2,图9)用Asp718酶切消化。然后通过首先85℃,30分钟灭活限制性酶平端化酶切消化过的质粒。通过加入10mM dNTP各0.5μl,1μl 1U/μl T4聚合酶并于11℃孵育10分钟实施平端化。最后通过将反应于75℃孵育10分钟灭活聚合酶。然后QIAquick DNA提取试剂盒按厂商说明纯化酶切消化过的质粒,最后用NotI酶切消化。用QIAquick DNA提取试剂盒按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化约2522bp的最小的质粒片段。然后将回收的DNA插入片段(tuaD/gtaB)与下述载体DNA连接。
质粒pDG268MCSΔneo/scBAN/Say(美国专利No.5,955,310)用Ecl136II酶切消化。然后QIAquick DNA提取试剂盒按厂商说明纯化酶切消化过的质粒,最后用NotI酶切消化。用QIAquick DNA提取试剂盒按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化约6800bp的最大的质粒片段。
采用Rapid DNA克隆试剂盒按厂商说明连接回收的载体和DNA插入片段。在转化至枯草芽孢杆菌前,采用ScaI将上述连接体线性化以确保染色体中为双交换整合而不是但交换整合。将用限制性酶ScaI酶切消化的连接体转化枯草芽孢杆菌168Δ4感受态细胞。
在添加了5μg氯霉素/ml的TBAB平板上于37℃下筛选枯草芽孢杆菌氯霉素-抗性转化体。为筛选经由在amyE基因座处双交换的质粒的整合,将枯草芽孢杆菌原始转化体铺于添加了6μg新霉素/ml的TBAB琼脂板和在添加了5μg氯霉素/ml的TBAB琼脂板上以分离出氯霉素抗性和新霉素敏感性转化体。
采用REDextract-N-AmpTM Plant PCR试剂盒(Sigma ChemicalCompany,St.Louis,MO)从氯霉素抗性和新霉素敏感性枯草芽孢杆菌168Δ4转化体中分离染色体DNA,步骤如下:将单芽孢杆菌克隆接种于100μl提取溶液中,于95℃培养10分钟,然后用等体积稀释溶液稀释。采用4μl提取的DNA联合REDextract-N-Amp PCR反应混合物及所需引物按厂商说明,按照实施例5中所述PCR循环条件实施PCR。
采用下述合成寡核苷酸对这些转化体实施PCR扩增以确定枯草芽孢杆菌转化体操纵子的hasA,gtaB,和tuaD基因的缺失/存在及完整性。引物3和8用于证实存在hasA基因,引物71和引物15用于证实存在tuaD基因,引物20和71用于证实存在gtaB基因。在0.8%琼脂糖-0.5×TBE凝胶中显影PCR反应产物。将鉴定的菌株,枯草芽孢杆菌168Δ4 hasA/tuaD/gtaB整合体,命名为枯草芽孢杆菌RB176。
引物71:5’-AACTATTGCCGATGATAAGC-3’(结合上游tuaD)(SEQ IDNO:85)
采用QIAGEN tip-20柱按厂商说明从氯霉素抗性和新霉素敏感性枯草芽孢杆菌RB176转化体中分离基因组DNA。将枯草芽孢杆菌RB176基因组DNA用于转化感受态枯草芽孢杆菌A164Δ5。在添加了5μg氯霉素/ml的TBAB平板上并在37℃下培养以筛选转化体。
将枯草芽孢杆菌A164Δ5tuaD/gtaB整合体命名为枯草芽孢杆菌RB177。
采用实施例9中所述方法在枯草芽孢杆菌RB177菌株中缺失cat基因。将得到的菌株命名为枯草芽孢杆菌MF002。
实施例16:构建pel整合质粒pRB162
用SacI和AatII双酶切消化质粒pDG268MCSΔneo/scBAN/Sav(美国专利No.5,955,310)。采用QIAquick DNA凝胶提取试剂盒并按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化约6193bp的最大的质粒片段。然后将回收的载体DNA与下述DNA插入片段连接。
采用PCR从枯草芽孢杆菌168(BGSC 1A1,Bacillus Genetic StockCenter,Columbus,OH)中扩增枯草芽孢杆菌果胶酶基因的5’和3’片段(pel,登记号BG10840,SEQ ID NO86[DNA序列]和87[推导的氨基酸序列]),所使用的引物为针对5’pel片段的引物72(引入5′Spel限制性酶切消化位点)和73(引入3′SalI限制性酶切消化位点)和针对3′pel片段的引物74(引入5′SacI/BamHI限制性酶切消化位点)和75(引入3’NotI/AatII限制性酶切消化位点):
引物72:
5’-ACTAGTAATGATGGCTGGGGCGCGTA-3’(SEQ ID NO:88)
引物73:
5′-GTCGACATGTTGTCGTATTGTGAGTT-3′(SEQ ID NO:89)
引物74:
5’-GAGCTCTACAACGCTTATGGATCCGCGGCCGCGGCGGCACACACATCTG
GAT-3’(SEQ ID NO:90)
引物75:
5′-GACGTCAGCCCGTTTGCAGCCGATGC-3′(SEQ ID NO:91)
在30μl反应中一式三份实施PCR扩增,所述反应含有如下成分:50ng的枯草芽孢杆菌168染色体DNA,针对5’pel片段的引物对72/73或针对3’pel片段的引物对74/75各0.4μM,dATP、dCTP,dGTP和dTTP各200μM,含有2.5mM MgCl2的1×PCR缓冲液II,2.5单位AmpliTaq GoldTM DNA聚合酶的50μl的反应中实施PCR扩增。在RoboCycler 40 thermacycler中实施扩增反应,反应条件:95℃9分钟1个循环;95℃1分钟,95℃1分钟,52℃1分钟,72℃1分钟3个循环;52℃1分钟,72℃1分钟3个循环;95℃1分钟,55℃1分钟,72℃1分钟27个循环,72℃5分钟1个循环。采用0.5×TBE缓冲液在0.8%琼脂糖凝胶上显影PCR产物。所要片段为约对于5′pel片段的530bp和对于3’pel片段的530bp。
按厂商说明用TA-TOPO克隆试剂盒将530bp 5’pel和530bp 3’pelPCR片段克隆至pCR2.1并转化至大肠杆菌ONESHOTTM感受态细胞。在添加了100μg氨卡青霉素/ml的2XYT平板上并在37℃下培养以筛选转化体。采用QIAGEN自动仪器按厂商说明纯化来自这些转化体的质粒DNA并采用DNA测序确定插入片段的DNA序列,所述DNA测序中使用的上述引物:针对5’pel的引物72和73和针对3’pel的引物74和75。将包含530bp和530bp PCR片段的质粒分别命名为pCR2.1-pel 5’和pCR2.1-pel 3’(分别示于图38和39)。
用SacI和AatII双酶切消化质粒pCR2.1-pel3’。采用QIAquick DNA凝胶提取试剂盒并按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化约530 bp的最小的质粒片段。
然后采用Rapid DNA克隆试剂盒按厂商说明将回收的载体(pDG268MCSΔneo/scBAN)和DNA插入片段(3’pel)连接。将连接混合物转化至大肠杆菌SURE感受态细胞(Stratagene,INC.,La Jolla,CA)。于37℃在加入100μg氨卡青霉素/ml的2XYT琼脂板上筛选转化体。
采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并通过SAcI和Aatll酶切消化在使用0.5×TBE缓冲液的0.8%琼脂糖凝胶上分析。存在约530bp的SacI/Aatll 3′pel片段即可鉴定为正确的质粒并将其命名为pRB161(图40)。
用Spel和SalI双酶切消化质粒pRB161。采用QIAquickDNA凝胶提取试剂盒并按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化约5346bp的最大的质粒片段。然后将回收的载体DNA与下述DNA插入片段连接。
用Spel和SalI双酶切消化质粒pCR2.1-pel3’。采用QIAquick DNA凝胶提取试剂盒并按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化约530bp的最小的质粒片段。
然后采用Rapid DNA克隆试剂盒按厂商说明将回收的载体(pDG268MCSΔneo/scBAN/pel 3’)和DNA插入片段(5’pel)连接。将连接混合物转化至大肠杆菌SURE感受态细胞(Stratagene,INC.,La Jolla,CA)。在添加了100μg氨卡青霉素/ml的2XYT琼脂板上于37℃下筛选转化体。
采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并通过Spel和SalI酶切消化在使用0.5×TBE缓冲液的0.8%琼脂糖凝胶上分析。存在约530bp的Spel和SalI 3′pel片段即可鉴定为正确的质粒并将其命名为pRB162(图41)。
实施例17:构建pRB156
用HpaI酶切消化质粒pHA7(实施例4,图13)。然后采用QIAquick DNA纯化试剂盒并按厂商说明纯化酶切消化过的质粒,最后用Asp718酶切消化。然后通过首先在85℃下,30分钟灭活XbaI将双-酶切消化过的质粒平端化。通过加入10mM dNTP各0.5μl,1μl 1U/μl的T4 DNA聚合酶(Roche AppliedScience;Indianapolis,IN)并在11℃下孵育30分钟实施平端化。最后通过在75℃下孵育反应10分钟灭活聚合酶。采用QIAquick DNA凝胶提取试剂盒并按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化约8600bp的最大的质粒片段。然后采用快速DNA克隆试剂盒并按厂商说明将回收的DNA插入片段(pDG268Δneo-cryIIIA stab/sehasA)再连接。
将连接混合物转化至大肠杆菌SURE感受态细胞(Stratagene,INC.,La Jolla,CA)。于37℃在加入100μg氨卡青霉素/ml的2XYT琼脂板上筛选转化体。采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并通过ScaI酶切消化在使用0.5×TBE缓冲液的0.8%琼脂糖凝胶上分析。存在约8,755bp的片段即可鉴定为正确的质粒并将其命名为pRB156(图42)。
实施例18:构建枯草芽孢杆菌MF009
将受控于scBAN启动子的hasA基因导入枯草芽孢杆菌MF002的果胶酸裂合酶基因(pel)座中从而产生枯草芽孢杆菌MF009。
用SacI酶切消化质粒pRB156。然后采用QIAquick DNA纯化试剂盒并按厂商说明纯化酶切消化过的质粒,最后用NotI酶切消化。采用QIAquickDNA凝胶提取试剂盒并按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化约1,377bp的最小的质粒片段。然后将回收的DNA插入片段与下述载体DNA连接。
用NotI酶切消化质粒pRB162(实施例16,图41)。然后采用QIAquickDNA纯化试剂盒并按厂商说明纯化酶切消化过的质粒,最后用SacI酶切消化。采用QIAquick DNA凝胶提取试剂盒并按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化约5850bp的最大的质粒片段。然后将回收的载体DNA与上述DNA插入片段连接。
将连接混合物直接转化至枯草芽孢杆菌168Δ4感受态细胞。在添加了5μg氯霉素/ml的TBAB琼脂板上于37℃下筛选枯草芽孢杆菌氯霉素抗性转化体。为筛选经由在pel基因座处双交换的质粒的整合,将枯草芽孢杆菌原始转化体铺于添加了6μg新霉素/ml的TBAB琼脂板和在添加了5μg氯霉素/ml的TBAB琼脂板上。经由在pel基因座处双交换的质粒的整合没有掺入新霉素抗性基因,因此生成了新霉素敏感性菌株。采用该平板筛选,分离出氯霉素抗性和新霉素敏感性转化体。
采用QIAGEN tip-20柱按厂商说明从氯霉素抗性和新霉素敏感性枯草芽孢杆菌168Δ4转化体中分离基因组DNA。将该基因组DNA用于转化感受态枯草芽孢杆菌MF002(实施例15)。在添加了5μg氯霉素/ml的TBAB琼脂板上并于37℃下培养以筛选转化体。通过其“湿”表型鉴定枯草芽孢杆菌A164Δ5hasA和tuaD/gtaB整合体并将其命名为枯草芽孢杆菌MF009。
实施例19:构建枯草芽孢杆菌MF010
用NotI酶切消化质粒pDG268MCSΔneo/BAN/Sav(美国专利No.5,955,310)。然后采用QIAquick DNA纯化试剂盒并按厂商说明纯化酶切消化过的质粒,最后用SfiI酶切消化。采用QIAquick DNA凝胶提取试剂盒并按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化约185bp的最小的质粒片段。然后将回收的DNA插入片段与下述载体DNA连接。
用NotI酶切消化质粒pRB162(实施例16,图41)。然后采用QIAquickDNA纯化试剂盒并按厂商说明纯化酶切消化过的质粒,最后用SfiI酶切消化。采用QIAquick DNA凝胶提取试剂盒并按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化约5747bp的最大的质粒片段。然后将回收的载体DNA与上述DNA插入片段连接。
使用Rapid DNA克隆试剂盒按厂商说明连接回收的载体和DNA插入片段。将连接混合物转化至大肠杆菌XLI Blue感受态细胞。在加入100μg氨卡青霉素/ml的2X YT琼脂板上筛选转化体。
采用QIAGEN自动仪器并按厂商说明从若干转化体中纯化质粒DNA并通过BamHI酶切消化在使用0.5×TBE缓冲液的0.8%琼脂糖凝胶上分析。通过能提供约7,156bp片段的质粒的线性化即可鉴定为正确的质粒并将其命名为pRB164(图43)。
用SacI酶切消化质粒pRB156(实施例17,图42)。然后采用QIAquickDNA纯化试剂盒并按厂商说明纯化酶切消化过的质粒,最后用NotI酶切消化。采用QIAquick DNA凝胶提取试剂盒并按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化约1377bp的最小的质粒片段。然后将回收的DNA插入片段与下述载体DNA连接。
用NotI酶切消化质粒pRB164。然后采用QIAquick DNA纯化试剂盒并按厂商说明纯化酶切消化过的质粒,最后用SacI酶切消化。采用QIAquickDNA凝胶提取试剂盒并按厂商说明从0.8%琼脂糖-0.5×TBE凝胶中凝胶纯化约5922bp的最大的质粒片段。然后将回收的载体DNA与上述DNA插入片段连接。
将连接混合物直接转化至枯草芽孢杆菌168Δ4感受态细胞中。在添加了5μg氯霉素/ml的TBAB琼脂板上于37℃下筛选枯草芽孢杆菌氯霉素抗性转化体。为筛选经由在amyE基因座处双交换(cross-over)的质粒的整合,将枯草芽孢杆菌原始转化体铺于添加了6μg新霉素/ml的TBAB琼脂板和在添加了5μg氯霉素/ml的TBAB琼脂板上。经由在amyE基因座处双交换的质粒的整合没有掺入新霉素抗性基因,因此生成了新霉素敏感性菌株。采用该平板筛选,分离出氯霉素抗性和新霉素敏感性转化体。
采用QIAGEN tip-20柱按厂商说明从氯霉素抗性和新霉素敏感性枯草芽孢杆菌168Δ4转化体中分离基因组DNA。将该基因组DNA用于转化感受态枯草芽孢杆菌MF002(实施例15)。在添加了5μg氯霉素/ml的最小琼脂板上并于37℃下培养16小时以筛选转化体。通过其“湿”表型鉴定枯草芽孢杆菌A164Δ5 BAN/HASA和scBAN/tuaD/gtaB整合体并将其命名为枯草芽孢杆菌MF010.
实施例20:发酵
在多种生长条件下评估表1中所列枯草芽孢杆菌菌株的制备透明质酸的能力。
表1
枯草芽孢杆菌菌株
启动子/基因互补体
catΔ
cypX
Δ
RB161 scBAN/hasA/tuaD/gtaB no
no
RB163 scBAN/hasA/tuaD/gcaD no
no
TH-1 scBANhasA/hasB/hasC/hasD no
no
RB184 scBAN/hasA/tuaD no no
RB187 scBAN/hasA/tuaD/gtaB yes
no
RB192 scBAN/hasA/tuaD yes no
RB194 scBAN/hasA/tuaD/gtaB yes
yes
RB197 scBAN/hasA/tuaD/gtaB yes
yes
RB200 scBAN/hasA/tuaD yes yes
RB202 scBAN/hasA/hasB/hasC/hasD/ yes
yes
MF009 scBAN/tuaD/gtaB no
no
scBAN/hasA
MF010 scBAN/tuaD/gtaB no
no
BAN/hasA
在标准小发酵罐中发酵枯草芽孢杆菌菌株,所使用的培养基包含每升中6.5g的KH2PO4,4.5g Na2HPO4,3.0g(NH4)2SO4,2.0g Na3-柠檬酸-2H2O,3.0MgSO4·7H2O,6.0ml Mikrosoy-2,0.15mg生物素(1ml 0.15mg/ml乙醇),15.0g蔗糖,1.0ml SB 2066,2.0ml P2000,0.5g CaCl2·2H2O。高压灭菌前,培养基的pH为6.3-6.4(未调整)。在高压灭菌后加入CaCl2·2H2O。
所使用的接种培养基为B-3,即无琼脂的Agar-3或“S/S-1”培养基。
Agar-3培养基含有每升中4.0g营养肉汤,7.5g水解蛋白,3.0g酵母提取物,1.0g葡萄糖和2%琼脂。pH为调整;高压灭菌前,pH约为6.8;高压灭菌后,pH约为7.7。
蔗糖/大豆接种瓶培养基(S/S-1)包含每升中65g蔗糖,35g大豆粉,2g Na3-柠檬酸-2H2O,4g KH2PO4,5g Na2HPO4和6ml微量元素。用NaOH将培养基的pH调整为约7;将培养基加入瓶中后,加入0.2%植物油以抑制发泡。微量元素包括每升中100g柠檬酸-H2O,20g FeSO4·7H2O,5gMnSO4·H20,2g CuSO4·5H2O和2g ZnCl2。
在接种前用氨水将pH调整为6.8-7.0并用和随后用氨水和磷酸将pH控制在pH7.0±0.2。将温度保持在37℃。采用两个叶轮直径为6cm的6叶涡轮叶轮在初始体积为1.5升的3升罐中以最大值1300RPM进行搅拌。以最大值1.5VVM通风。
使用纯蔗糖溶液给料。在溶解氧(D.O.)仍持续降低时(即在蔗糖耗尽前),于接种后约4小时开始给料。给料速率在7个小时期间从0至约6g蔗糖/L0-小时线性改变。在某些发酵中也使用较低的给料速率(从0至约2g蔗糖/L0-小时线性改变)。
约10小时后粘度已经非常显著,而24小时后粘度非常高,使得D.O.降至最低点。终粘度达到3,220cP。20小时后,细胞群形成接近最大值(12-15g/升)。采用如下方法除去细胞:用3份水稀释1份培养液,充分混合并以30,000×g离心以形成细胞上清和能进行漂洗和干燥的细胞片状沉淀。
根据透明质酸结合蛋白(蛋白和试剂盒购自Seikagaku America,Falmouth,MA),采用ELISA方法测定透明质酸浓度。
将枯草芽孢杆菌RB161和RB163在分批和分批补料发酵中培养。在分批补料步骤中,枯草芽孢杆菌菌株RB163和RB161的补料率有所不同。采用ELISA方法再次测定透明质酸浓度。结果示于表2中。
表2
菌株和生长条件 |
HA(相对产量)ELISA方法 |
RB-161(hasA/tuaD/gtaB)单一补料 |
0.7±0.1 |
RB-163(hasA/tuaD/gcaD)分批补料-6g蔗糖/L0-小时RB-161(hasA/tuaD/gtaB)分批补料-6g蔗糖/L0-小时RB-163(hasA/tuaD/gcaD)分批补料-2g蔗糖/L0-小时RB-161(hasA/tuaD/gtaB)分批补料-2g蔗糖/L0-小时 |
0.9±0.10.9±0.11.0±0.21.0±0.1 |
对同一菌株以2g/L蔗糖L0-小时分批补料的和以6g/L蔗糖/L0-小时分批补料的培养测定的比较结果显示出较快的蔗糖补料速率不能显著地改善滴度。
图44中总结了在相同条件下(以约2g蔗糖/L0-小时,37℃分批补料)芽孢杆菌属菌株的结果。图44中给出了来自在同一条件下的多重运行的数据的标准差。没有数值的数据来自单运行。使用改良咔唑法(Bitter and Muir,1962,Anal BIOCHEM.4:330-334)确定透明质酸浓度。
图45中总结了在相同条件下(以约2g蔗糖/LO-小时,37℃分批补料)获自重组枯草芽孢杆菌菌株发酵的峰量透明质酸的平均分子量(MDa)。采用GPC MALLS测定法确定分子量。采用如下步骤从GPC MALLS测定实验中采集数据。GPC-MALLS(配合多角度激光散射的凝胶渗透或大小排阻色谱法)已广泛用于表征高分子量(MW)聚合物。通过基于洗脱液和树脂间不同分子量的分子的差异区分的GPC法实施聚合物的分离。通过基于不同MW分子的差异散射范围/角度的MALLS法测定各聚合物的平均分子量。Ueno等,1988,CHEM.PHARM.BULL.36,4971-4975;Wyatt,1993,Anal.Chim.Acta 272:1-40;和Wyatt Technologies,1999,“Light ScatteringUniversity DAWN Course Manual”和“DAWN EOS Manual”Wyatt TechnologyCorporation,Santa Barbara,California中描述了GPC-MALLS的原理和适用于透明质酸的方法步骤。将Agilent 1100等度HPLC,Tosoh Biosep G6000PWXL柱用于GPC,将Wyatt Down EOS用于MALLS。将Agilent G1362A折光率检测器联于MALLS下游以确定洗脱浓度。将具有已知分子量的多种商品化透明质酸制品作为标准物。
生物材料的保藏
根据布达佩斯条约,下列生物材料已保藏在农业研究服务专利培养物保藏中心(Agricultural Research Service Patent Culture Collection),北方地区研究中心(Northern Regional Research Center),大学街1815号(1815University Street),Peoria,伊利诺斯州(Illinois,),61604,并给予下列保藏号:
保藏物 保藏号 保藏日
大肠杆菌XL10 Gold kan(pMRT106) NRRLB-30536 2001年12月12日
该菌株已经在如下状态下进行了保藏,在该专利申请的待审期内,保证根据37 C.F.R.§1.14和35 U.S.C.§122授权的专利和商标委员会所确定的人员能够获得该培养物。该保藏物代表了保藏菌株的基本上纯的培养物。在提交了该申请的副本或其后续申请的国家中,可以按照该国专利法的要求提供该保藏物。但是,应当明白保藏物的可获得性并不构成对以侵犯由政府行为授予的专利权来实施本发明的许可。
在此所描述并要求专利保护的发明并不限于本文中所公开的特定实施方案的范围内,因为这些实施方案意图作为对本发明几个方面的说明。任何等同的实施方案均在本发明的范围内。事实上,除了那些在此所示并描述的修改外,本领域的技术人员很容易根据前面的描述对本发明作各种修改。这些修改也在所附权利要求的范围内。若有抵触,以本说明书(包括定义)为准。
本文中引用了各种参考文献,其公开内容全文引入作为参考。
申请人或代理人档案号10241.204-WO |
国际申请号PCT/US02/41067 |
关于微生物保藏的说明
(细则13之二)
PCT/RO/134表(1992年7月)
序列表
<110> 艾伦.斯洛马(Sloma,Alan)
里金.贝尔(Behr,Regine)
威廉.威德纳(Widner,William)
玛丽亚.唐(Tang,Maria)
戴维.斯滕伯格(Sternberg,David)
斯蒂芬.布朗(Brown,Stephen)
<120> 在重组宿主细胞中制备透明质酸的方法
<130> 10241.204-WO
<150> US 60/342,644
<151> 2001-12-21
<160> 108
<170> PatentIn version 3.1
<210> 1
<211> 1251
<212> DNA
<213> 似马链球菌(Streptococcus equisimilis)
<220>
<221> CDS
<222> (1)..(1251)
<223>
<400> 1
atg aga aca tta aaa aac ctc ata act gtt gtg gcc ttt agt att ttt 48
Met Arg Thr Leu Lys Asn Leu Ile Thr Val Val Ala Phe Ser Ile Phe
1 5 10 15
tgg gta ctg ttg att tac gtc aat gtt tat ctc ttt ggt gct aaa gga 96
Trp Val Leu Leu Ile Tyr Val Asn Val Tyr Leu Phe Gly Ala Lys Gly
20 25 30
agc ttg tca att tat ggc ttt ttg ctg ata gct tac cta tta gtc aaa 144
Ser Leu Ser Ile Tyr Gly Phe Leu Leu Ile Ala Tyr Leu Leu Val Lys
35 40 45
atg tcc tta tcc ttt ttt tac aag cca ttt aag gga agg gct ggg caa 192
Met Ser Leu Ser Phe Phe Tyr Lys Pro Phe Lys Gly Arg Ala Gly Gln
50 55 60
tat aag gtt gca gcc att att ccc tct tat aac gaa gat gct gag tca 240
Tyr Lys Val Ala Ala Ile Ile Pro Ser Tyr Asn Glu Asp Ala Glu Ser
65 70 75 80
ttg cta gag acc tta aaa agt gtt cag cag caa acc tat ccc cta gca 288
Leu Leu Glu Thr Leu Lys Ser Val Gln Gln Gln Thr Tyr Pro Leu Ala
85 90 95
gaa att tat gtt gtt gac gat gga agt gct gat gag aca ggt att aag 336
Glu Ile Tyr Val Val Asp Asp Gly Ser Ala Asp Glu Thr Gly Ile Lys
100 105 110
cgc att gaa gac tat gtg cgt gac act ggt gac cta tca agc aat gtc 384
Arg Ile Glu Asp Tyr Val Arg Asp Thr Gly Asp Leu Ser Ser Asn Val
115 120 125
att gtt cac cgg tca gaa aaa aat caa gga aag cgt cat gca cag gcc 432
Ile Val His Arg Ser Glu Lys Asn Gln Gly Lys Arg His Ala Gln Ala
130 135 140
tgg gcc ttt gaa aga tca gac gct gat gtc ttt ttg acc gtt gac tca 480
Trp Ala Phe Glu Arg Ser Asp Ala Asp Val Phe Leu Thr Val Asp Ser
145 150 155 160
gat act tat atc tac cct gat gct tta gag gag ttg tta aaa acc ttt 528
Asp Thr Tyr Ile Tyr Pro Asp Ala Leu Glu Glu Leu Leu Lys Thr Phe
165 170 175
aat gac cca act gtt ttt gct gcg acg ggt cac ctt aat gtc aga aat 576
Asn Asp Pro Thr Val Phe Ala Ala Thr Gly His Leu Asn Val Arg Asn
180 185 190
aga caa acc aat ctc tta aca cgc ttg aca gat att cgc tat gat aat 624
Arg Gln Thr Asn Leu Leu Thr Arg Leu Thr Asp Ile Arg Tyr Asp Asn
195 200 205
gct ttt ggc gtt gaa cga gct gcc caa tcc gtt aca ggt aat att ctc 672
Ala Phe Gly Val Glu Arg Ala Ala Gln Ser Val Thr Gly Asn Ile Leu
210 215 220
gtt tgc tca ggc ccg ctt agc gtt tac aga cgc gag gtg gtt gtt cct 720
Val Cys Ser Gly Pro Leu Ser Val Tyr Arg Arg Glu Val Val Val Pro
225 230 235 240
aac ata gat aga tac atc aac cag acc ttc ctg ggt att cct gta agt 768
Asn Ile Asp Arg Tyr Ile Asn Gln Thr Phe Leu Gly Ile Pro Val Ser
245 250 255
atc ggt gat gac agg tgc ttg acc aac tat gca act gat tta gga aag 816
Ile Gly Asp Asp Arg Cys Leu Thr Asn Tyr Ala Thr Asp Leu Gly Lys
260 265 270
act gtt tat caa tcc act gct aaa tgt att aca gat gtt cct gac aag 864
Thr Val Tyr Gln Ser Thr Ala Lys Cys Ile Thr Asp Val Pro Asp Lys
275 280 285
atg tct act tac ttg aag cag caa aac cgc tgg aac aag tcc ttc ttt 912
Met Ser Thr Tyr Leu Lys Gln Gln Asn Arg Trp Asn Lys Ser Phe Phe
290 295 300
aga gag tcc att att tct gtt aag aaa atc atg aac aat cct ttt gta 960
Arg Glu Ser Ile Ile Ser Val Lys Lys Ile Met Asn Asn Pro Phe Val
305 310 315 320
gcc cta tgg acc ata ctt gag gtg tct atg ttt atg atg ctt gtt tat 1008
Ala Leu Trp Thr Ile Leu Glu Val Ser Met Phe Met Met Leu Val Tyr
325 330 335
tct gtg gtg gat ttc ttt gta gac aat gtc aga gaa ttt gat tgg ctc 1056
Ser Val Val Asp Phe Phe Val Asp Asn Val Arg Glu Phe Asp Trp Leu
340 345 350
agg gtt ttg gcc ttt ctg gtg att atc ttc att gtt gct ctt tgt cgt 1104
Arg Val Leu Ala Phe Leu Val Ile Ile Phe Ile Val Ala Leu Cys Arg
355 360 365
aat att cac tat atg ctt aag cac ccg ctg tcc ttc ttg tta tct ccg 1152
Asn Ile His Tyr Met Leu Lys His Pro Leu Ser Phe Leu Leu Ser Pro
370 375 380
ttt tat ggg gta ctg cat ttg ttt gtc cta cag ccc ttg aaa ttg tat 1200
Phe Tyr Gly Val Leu His Leu Phe Val Leu Gln Pro Leu Lys Leu Tyr
385 390 395 400
tct ctt ttt act att aga aat gct gac tgg gga aca cgt aaa aaa tta 1248
Ser Leu Phe Thr Ile Arg Asn Ala Asp Trp Gly Thr Arg Lys Lys Leu
405 410 415
tta 1251
Leu
<210> 2
<211> 417
<212> PRT
<213> 似马链球菌(Streptococcus equisimilis)
<400> 2
Met Arg Thr Leu Lys Asn Leu Ile Thr Val Val Ala Phe Ser Ile Phe
1 5 10 15
Trp Val Leu Leu Ile Tyr Val Asn Val Tyr Leu Phe Gly Ala Lys Gly
20 25 30
Ser Leu Ser Ile Tyr Gly Phe Leu Leu Ile Ala Tyr Leu Leu Val Lys
35 40 45
Met Ser Leu Ser Phe Phe Tyr Lys Pro Phe Lys Gly Arg Ala Gly Gln
50 55 60
Tyr Lys Val Ala Ala Ile Ile Pro Ser Tyr Asn Glu Asp Ala Glu Ser
65 70 75 80
Leu Leu Glu Thr Leu Lys Ser Val Gln Gln Gln Thr Tyr Pro Leu Ala
85 90 95
Glu Ile Tyr Val Val Asp Asp Gly Ser Ala Asp Glu Thr Gly Ile Lys
100 105 110
Arg Ile Glu Asp Tyr Val Arg Asp Thr Gly Asp Leu Ser Ser Asn Val
115 120 125
Ile Val His Arg Ser Glu Lys Asn Gln Gly Lys Arg His Ala Gln Ala
130 135 140
Trp Ala Phe Glu Arg Ser Asp Ala Asp Val Phe Leu Thr Val Asp Ser
145 150 155 160
Asp Thr Tyr Ile Tyr Pro Asp Ala Leu Glu Glu Leu Leu Lys Thr Phe
165 170 175
Asn Asp Pro Thr Val Phe Ala Ala Thr Gly His Leu Asn Val Arg Asn
180 185 190
Arg Gln Thr Asn Leu Leu Thr Arg Leu Thr Asp Ile Arg Tyr Asp Asn
195 200 205
Ala Phe Gly Val Glu Arg Ala Ala Gln Ser Val Thr Gly Asn Ile Leu
210 215 220
Val Cys Ser Gly Pro Leu Ser Val Tyr Arg Arg Glu Val Val Val Pro
225 230 235 240
Asn Ile Asp Arg Tyr Ile Asn Gln Thr Phe Leu Gly Ile Pro Val Ser
245 250 255
Ile Gly Asp Asp Arg Cys Leu Thr Asn Tyr Ala Thr Asp Leu Gly Lys
260 265 270
Thr Val Tyr Gln Ser Thr Ala Lys Cys Ile Thr Asp Val Pro Asp Lys
275 280 285
Met Ser Thr Tyr Leu Lys Gln Gln Asn Arg Trp Asn Lys Ser Phe Phe
290 295 300
Arg Glu Ser Ile Ile Ser Val Lys Lys Ile Met Asn Asn Pro Phe Val
305 310 315 320
Ala Leu Trp Thr Ile Leu Glu Val Ser Met Phe Met Met Leu Val Tyr
325 330 335
Ser Val Val Asp Phe Phe Val Asp Asn Val Arg Glu Phe Asp Trp Leu
340 345 350
Arg Val Leu Ala Phe Leu Val Ile Ile Phe Ile Val Ala Leu CysArg
355 360 365
Asn Ile His Tyr Met Leu Lys His Pro Leu Ser Phe Leu Leu Ser Pro
370 375 380
Phe Tyr Gly Val Leu His Leu Phe Val Leu Gln Pro Leu Lys Leu Tyr
385 390 395 400
Ser Leu Phe Thr Ile Arg Asn Ala Asp Trp Gly Thr Arg Lys Lys Leu
405 410 415
Leu
<210> 3
<211> 49
<212> DNA
<213> 似马链球菌(Streptococcus equisimilis)
<400> 3
gagctctata aaaatgagga gggaaccgaa tgagaacatt aaaaaacct 49
<210> 4
<211> 48
<212> DNA
<213> 似马链球菌(Streptococcus equisimilis)
<400> 4
gttaacgaat tcagctatgt aggtacctta taataatttt ttacgtgt 48
<210> 5
<211> 20
<212> DNA
<213> 似马链球菌(Streptococcus equisimilis)
<400> 5
gttgacgatg gaagtgctga 20
<210> 6
<211> 20
<212> DNA
<213> 似马链球菌(Streptococcus equisimilis)
<400> 6
atccgttaca ggtaatatcc 20
<210> 7
<211> 20
<212> DNA
<213> 似马链球菌(Streptococcus equisimilis)
<400> 7
tccttttgta gccctatgga 20
<210> 8
<211> 20
<212> DNA
<213> 似马链球菌(Streptococcus equisimilis)
<400> 8
tcagcacttc catcgtcaac 20
<210> 9
<211> 20
<212> DNA
<213> 似马链球菌(Streptococcus equisimilis)
<400> 9
ggatattacc tgtaacggat 20
<210> 10
<211> 20
<212> DNA
<213> 似马链球菌(Streptococcus equisimilis)
<400> 10
tccatagggc tacaaaagga 20
<210> 11
<211> 1383
<212> DNA
<213> 枯草芽孢杆菌(枯草芽孢杆菌(Bacillus subtilis))
<220>
<221> CDS
<222> (1)..(1383)
<223>
<400> 11
gtg aaa aaa ata gct gtc att gga aca ggt tat gta gga ctc gta tca 48
Val Lys Lys Ile Ala Val Ile Gly Thr Gly Tyr Val Gly Leu Val Ser
1 5 10 15
ggc act tgc ttt gcg gag atc ggc aat aaa gtt gtt tgc tgt gat atc 96
Gly Thr Cys Phe Ala Glu Ile Gly Asn Lys Val Val Cys Cys Asp Ile
20 25 30
gat gaa tca aaa atc aga agc ctg aaa aat ggg gta atc cca atc tat 144
Asp Glu Ser Lys Ile Arg Ser Leu Lys Asn Gly Val Ile Pro Ile Tyr
35 40 45
gaa cca ggg ctt gca gac tta gtt gaa aaa aat gtg ctg gat cag cgc 192
Glu Pro Gly Leu Ala Asp Leu Val Glu Lys Asn Val Leu Asp Gln Arg
50 55 60
ctg acc ttt acg aac gat atc ccg tct gcc att cgg gcc tca gat att 240
Leu Thr Phe Thr Asn Asp Ile Pro Ser Ala Ile Arg Ala Ser Asp Ile
65 70 75 80
att tat att gca gtc gga acg cct atg tcc aaa aca ggt gaa gct gat 288
Ile Tyr Ile Ala Val Gly Thr Pro Met Ser Lys Thr Gly Glu Ala Asp
85 90 95
tta acg tac gtc aaa gcg gcg gcg aaa aca atc ggt gag cat ctt aac 336
Leu Thr Tyr Val Lys Ala Ala Ala Lys Thr Ile Gly Glu His Leu Asn
100 105 110
ggc tac aaa gtg atc gta aat aaa agc aca gtc ccg gtt gga aca ggg 384
Gly Tyr Lys Val Ile Val Asn Lys Ser Thr Val Pro Val Gly Thr Gly
115 120 125
aaa ctg gtg caa tct atc gtt caa aaa gcc tca aag ggg aga tac tca 432
Lys Leu Val Gln Ser Ile Val Gln Lys Ala Ser Lys Gly Arg Tyr Ser
130 135 140
ttt gat gtt gta tct aac cct gaa ttc ctt cgg gaa ggg tca gcg att 480
Phe Asp Val Val Ser Asn Pro Glu Phe Leu Arg Glu Gly Ser Ala Ile
145 150 155 160
cat gac acg atg aat atg gag cgt gcc gtg att ggt tca aca agt cat 528
His Asp Thr Met Asn Met Glu Arg Ala Val Ile Gly Ser Thr Ser His
165 170 175
aaa gcc gct gcc atc att gag gaa ctt cat cag cca ttc cat gct cct 576
Lys Ala Ala Ala Ile Ile Glu Glu Leu His Gln Pro Phe His Ala Pro
180 185 190
gtc att aaa aca aac cta gaa agt gca gaa atg att aaa tac gcc gcg 624
Val Ile Lys Thr Asn Leu Glu Ser Ala Glu Met Ile Lys Tyr Ala Ala
195 200 205
aat gca ttt ctg gcg aca aag att tcc ttt atc aac gat atc gca aac 672
Asn Ala Phe Leu Ala Thr Lys Ile Ser Phe Ile Asn Asp Ile Ala Asn
210 215 220
att tgt gag cga gtc ggc gca gac gtt tca aaa gtt gct gat ggt gtt 720
Ile Cys Glu Arg Val Gly Ala Asp Val Ser Lys Val Ala Asp Gly Val
225 230 235 240
ggt ctt gac agc cgt atc ggc aga aag ttc ctt aaa gct ggt att gga 768
Gly Leu Asp Ser Arg Ile Gly Arg Lys Phe Leu Lys Ala Gly Ile Gly
245 250 255
ttc ggc ggt tca tgt ttt cca aag gat aca acc gcg ctg ctt caa atc 816
Phe Gly Gly Ser Cys Phe Pro Lys Asp Thr Thr Ala Leu Leu Gln Ile
260 265 270
gca aaa tcg gca ggc tat cca ttc aag ctc atc gaa gct gtc att gaa 864
Ala Lys Ser Ala Gly Tyr Pro Phe Lys Leu Ile Glu Ala Val Ile Glu
275 280 285
acg aac gaa aag cag cgt gtt cat att gta gat aaa ctt ttg act gtt 912
Thr Asn Glu Lys Gln Arg Val His Ile Val Asp Lys Leu Leu Thr Val
290 295 300
atg gga agc gtc aaa ggg aga acc att tca gtc ctg gga tta gcc ttc 960
Met Gly Ser Val Lys Gly Arg Thr Ile Ser Val Leu Gly Leu Ala Phe
305 310 315 320
aaa ccg aat acg aac gat gtg aga tcc gct cca gcg ctt gat att atc 1008
Lys Pro Asn Thr Asn Asp Val Arg Ser Ala Pro Ala Leu Asp Ile Ile
325 330 335
cca atg ctg cag cag ctg ggc gcc cat gta aaa gca tac gat ccg att 1056
Pro Met Leu Gln Gln Leu Gly Ala His Val Lys Ala Tyr Asp Pro Ile
340 345 350
gct att cct gaa gct tca gcg atc ctt ggc gaa cag gtc gag tat tac 1104
Ala Ile Pro Glu Ala Ser Ala Ile Leu Gly Glu Gln Val Glu Tyr Tyr
355 360 365
aca gat gtg tat gct gcg atg gaa gac act gat gca tgc ctg att tta 1152
Thr Asp Val Tyr Ala Ala Met Glu Asp Thr Asp Ala Cys Leu Ile Leu
370 375 380
acg gat tgg ccg gaa gtg aaa gaa atg gag ctt gta aaa gtg aaa acc 1200
Thr Asp Trp Pro Glu Val Lys Glu Met Glu Leu Val Lys Val Lys Thr
385 390 395 400
ctc tta aaa cag cca gtc atc att gac ggc aga aat tta ttt tca ctt 1248
Leu Leu Lys Gln Pro Val Ile Ile Asp Gly Arg Asn Leu Phe Ser Leu
405 410 415
gaa gag atg cag gca gcc gga tac att tat cac tct atc ggc cgt ccc 1296
Glu Glu Met Gln Ala Ala Gly Tyr Ile Tyr His Ser Ile Gly Arg Pro
420 425 430
gct gtt cgg gga acg gaa ccc tct gac aag tat ttt ccg ggc ttg ccg 1344
Ala Val Arg Gly Thr Glu Pro Ser Asp Lys Tyr Phe Pro Gly Leu Pro
435 440 445
ctt gaa gaa ttg gct aaa gac ttg gga agc gtc aat tta 1383
Leu Glu Glu Leu Ala Lys Asp Leu Gly Ser Val Asn Leu
450 455 460
<210> 12
<211> 461
<212> PRT
<213> 枯草芽孢杆菌(枯草芽孢杆菌(Bacillus subtilis))
<400> 12
Val Lys Lys Ile Ala Val Ile Gly Thr Gly Tyr Val Gly Leu Val Ser
1 5 10 15
Gly Thr Cys Phe Ala Glu Ile Gly Asn Lys Val Val Cys Cys Asp Ile
20 25 30
Asp Glu Ser Lys Ile Arg Ser Leu Lys Asn Gly Val Ile Pro Ile Tyr
35 40 45
Glu Pro Gly Leu Ala Asp Leu Val Glu Lys Asn Val Leu Asp Gln Arg
50 55 60
Leu Thr Phe Thr Asn Asp Ile Pro Ser Ala Ile Arg Ala Ser Asp Ile
65 70 75 80
Ile Tyr Ile Ala Val Gly Thr Pro Met Ser Lys Thr Gly Glu Ala Asp
85 90 95
Leu Thr Tyr Val Lys Ala Ala Ala Lys Thr Ile Gly Glu His Leu Asn
100 105 110
Gly Tyr Lys Val Ile Val Asn Lys Ser Thr Val Pro Val Gly Thr Gly
115 120 125
Lys Leu Val Gln Ser Ile Val Gln Lys Ala Ser Lys Gly Arg Tyr Ser
130 135 140
Phe Asp Val Val Ser Asn Pro Glu Phe Leu Arg Glu Gly Ser Ala Ile
145 150 155 160
His Asp Thr Met Asn Met Glu Arg Ala Val Ile Gly Ser Thr Ser His
165 170 175
Lys Ala Ala Ala Ile Ile Glu Glu Leu His Gln Pro Phe His Ala Pro
180 185 190
Val Ile Lys Thr Asn Leu Glu Ser Ala Glu Met Ile Lys Tyr Ala Ala
195 200 205
Asn Ala Phe Leu Ala Thr Lys Ile Ser Phe Ile Asn Asp Ile Ala Asn
210 215 220
Ile Cys Glu Arg Val Gly Ala Asp Val Ser Lys Val Ala Asp Gly Val
225 230 235 240
Gly Leu Asp Ser Arg Ile Gly Arg Lys Phe Leu Lys Ala Gly Ile Gly
245 250 255
Phe Gly Gly Ser Cys Phe Pro Lys Asp Thr Thr Ala Leu Leu Gln Ile
260 265 270
Ala Lys Ser Ala Gly Tyr Pro Phe Lys Leu Ile Glu Ala Val Ile Glu
275 280 285
Thr Asn Glu Lys Gln Arg Val His Ile Val Asp Lys Leu Leu Thr Val
290 295 300
Met Gly Ser Val Lys Gly Arg Thr Ile Ser Val Leu Gly Leu Ala Phe
305 310 315 320
Lys Pro Asn Thr Asn Asp Val Arg Ser Ala Pro Ala Leu Asp Ile Ile
325 330 335
Pro Met Leu Gln Gln Leu Gly Ala His Val Lys Ala Tyr Asp Pro Ile
340 345 350
Ala Ile Pro Glu Ala Ser Ala Ile Leu Gly Glu Gln Val Glu Tyr Tyr
355 360 365
Thr Asp Val Tyr Ala Ala Met Glu Asp Thr Asp Ala Cys Leu Ile Leu
370 375 380
Thr Asp Trp Pro Glu Val Lys Glu Met Glu Leu Val Lys Val Lys Thr
385 390 395 400
Leu Leu Lys Gln Pro Val Ile Ile Asp Gly Arg Asn Leu Phe Ser Leu
405 4l0 4l5
Glu Glu Met Gln Ala Ala Gly Tyr Ile Tyr His Ser Ile Gly Arg Pro
420 425 430
Ala Val Arg Gly Thr Glu Pro Ser Asp Lys Tyr Phe Pro Gly Leu Pro
435 440 445
Leu Glu Glu Leu Ala Lys Asp Leu Gly Ser Val Asn Leu
450 455 460
<210> 13
<211> 26
<212> DNA
<213> 枯草芽孢杆菌(枯草芽孢杆菌(Bacillus subtilis))
<400> 13
ggtaccgaca ctgcgaccat tataaa 26
<210> 14
<211> 49
<212> DNA
<213> 枯草芽孢杆菌(枯草芽孢杆菌(Bacillus subtilis))
<400> 14
gttaacgaat tccagctatg tatctagaca gcttcaacca agtaacact 49
<210> 15
<211> 20
<212> DNA
<213> 枯草芽孢杆菌(枯草芽孢杆菌(Bacillus subtilis))
<400> 15
agcatcttaa cggctacaaa 20
<210> 16
<211> 20
<212> DNA
<213> 枯草芽孢杆菌(枯草芽孢杆菌(Bacillus subtilis))
<400> 16
tgtgagcgag tcggcgcaga 20
<210> 17
<211> 20
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 17
gggcgcccat gtaaaagcat 20
<210> 18
<211> 20
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 18
tttgtagccg ttaagatgct 20
<210> 19
<211> 20
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 19
tctgcgccga ctcgctcaca 20
<210> 20
<211> 20
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 20
atgcttttac atgggcgccc 20
<210> 21
<211> 876
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<220>
<221> CDS
<222> (1)..(876)
<223>
<400> 21
atg aaa aaa gta cgt aaa gcc ata att cca gca gca ggc tta gga aca 48
Met Lys Lys Val Arg Lys Ala Ile Ile Pro Ala Ala Gly Leu Gly Thr
1 5 10 15
cgt ttt ctt ccg gct acg aaa gca atg ccg aaa gaa atg ctt cct atc 96
Arg Phe Leu Pro Ala Thr Lys Ala Met Pro Lys Glu Met Leu Pro Ile
20 25 30
gtt gat aaa cct acc att caa tac ata att gaa gaa gct gtt gaa gcc 144
Val Asp Lys Pro Thr Ile Gln Tyr Ile Ile Glu Glu Ala Val Glu Ala
35 40 45
ggt att gaa gat att att atc gta aca gga aaa agc aag cgt gcg att 192
Gly Ile Glu Asp Ile Ile Ile Val Thr Gly Lys Ser Lys Arg Ala Ile
50 55 60
gag gat cat ttt gat tac tct cct gag ctt gaa aga aac cta gaa gaa 240
Glu Asp His Phe Asp Tyr Ser Pro Glu Leu Glu Arg Asn Leu Glu Glu
65 70 75 80
aaa gga aaa act gag ctg ctt gaa aaa gtg aaa aag gct tct aac ctg 288
Lys Gly Lys Thr Glu Leu Leu Glu Lys Val Lys Lys Ala Ser Asn Leu
85 90 95
gct gac att cac tat atc cgc caa aaa gaa cct aaa ggt ctc gga cat 336
Ala Asp Ile His Tyr Ile Arg Gln Lys Glu Pro Lys Gly Leu Gly His
100 105 110
gct gtc tgg tgc gca cgc aac ttt atc ggc gat gag ccg ttt gcg gta 384
Ala Val Trp Cys Ala Arg Asn Phe Ile Gly Asp Glu Pro Phe Ala Val
115 120 125
ctg ctt ggt gac gat att gtt cag gct gaa act cca ggg ttg cgc caa 432
Leu Leu Gly Asp Asp Ile Val Gln Ala Glu Thr Pro Gly Leu Arg Gln
130 135 140
tta atg gat gaa tat gaa aaa aca ctt tct tct att atc ggt gtt cag 480
Leu Met Asp Glu Tyr Glu Lys Thr Leu Ser Ser Ile Ile Gly Val Gln
145 150 155 160
cag gtg ccc gaa gaa gaa aca cac cgc tac ggc att att gac ccg ctg 528
Gln Val Pro Glu Glu Glu Thr His Arg Tyr Gly Ile Ile Asp Pro Leu
165 170 175
aca agt gaa ggc cgc cgt tat cag gtg aaa aac ttc gtt gaa aaa ccg 576
Thr Ser Glu Gly Arg Arg Tyr Gln Val Lys Asn Phe Val Glu Lys Pro
180 185 190
cct aaa ggc aca gca cct tct aat ctt gcc atc tta ggc cgt tac gta 624
Pro Lys Gly Thr Ala Pro Ser Asn Leu Ala Ile Leu Gly Arg Tyr Val
195 200 205
ttc acg cct gag atc ttc atg tat tta gaa gag cag cag gtt ggc gcc 672
Phe Thr Pro Glu Ile Phe Met Tyr Leu Glu Glu Gln Gln Val Gly Ala
210 215 220
ggc gga gaa att cag ctc aca gac gcc att caa aag ctg aat gaa att 720
Gly Gly Glu Ile Gln Leu Thr Asp Ala Ile Gln Lys Leu Asn Glu Ile
225 230 235 240
caa aga gtg ttt gct tac gat ttt gaa ggc aag cgt tat gat gtt ggt 768
Gln Arg Val Phe Ala Tyr Asp Phe Glu Gly Lys Arg Tyr Asp Val Gly
245 250 255
gaa aag ctc ggc ttt atc aca aca act ctt gaa ttt gcg atg cag gat 816
Glu Lys Leu Gly Phe Ile Thr Thr Thr Leu Glu Phe Ala Met Gln Asp
260 265 270
aaa gag ctt cgc gat cag ctc gtt cca ttt atg gaa ggt tta cta aac 864
Lys Glu Leu Arg Asp Gln Leu Val Pro Phe Met Glu Gly Leu Leu Asn
275 280 285
aaa gaa gaa atc 876
Lys Glu Glu Ile
290
<210> 22
<211> 292
<212> PRT
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 22
Met Lys Lys Val Arg Lys Ala Ile Ile Pro Ala Ala Gly Leu Gly Thr
1 5 10 15
Arg Phe Leu Pro Ala Thr Lys Ala Met Pro Lys Glu Met Leu Pro Ile
20 25 30
Val Asp Lys Pro Thr Ile Gln Tyr Ile Ile Glu Glu Ala Val Glu Ala
35 40 45
Gly Ile Glu Asp Ile Ile Ile Val Thr Gly Lys Ser Lys Arg Ala Ile
50 55 60
Glu Asp His Phe Asp Tyr Ser Pro Glu Leu Glu Arg Asn Leu Glu Glu
65 70 75 80
Lys Gly Lys Thr Glu Leu Leu Glu Lys Val Lys Lys Ala Ser Asn Leu
85 90 95
Ala Asp Ile His Tyr Ile Arg Gln Lys Glu Pro Lys Gly Leu Gly His
100 105 110
Ala Val Trp Cys Ala Arg Asn Phe Ile Gly Asp Glu Pro Phe Ala Val
115 120 125
Leu Leu Gly Asp Asp Ile Val Gln Ala Glu Thr Pro Gly Leu Arg Gln
130 135 140
Leu Met Asp Glu Tyr Glu Lys Thr Leu Ser Ser Ile Ile Gly Val Gln
145 150 155 160
Gln Val Pro Glu Glu Glu Thr His Arg Tyr Gly Ile Ile Asp Pro Leu
165 170 175
Thr Ser Glu Gly Arg Arg Tyr Gln Val Lys Asn Phe Val Glu Lys Pro
180 185 190
Pro Lys Gly Thr Ala Pro Ser Asn Leu Ala Ile Leu Gly Arg Tyr Val
195 200 205
Phe Thr Pro Glu Ile Phe Met Tyr Leu Glu Glu Gln Gln Val Gly Ala
210 215 220
Gly Gly Glu Ile Gln Leu Thr Asp Ala Ile Gln Lys Leu Asn Glu Ile
225 230 235 240
Gln Arg Val Phe Ala Tyr Asp Phe Glu Gly Lys Arg Tyr Asp Val Gly
245 250 255
Glu Lys Leu Gly Phe Ile Thr Thr Thr Leu Glu Phe Ala Met Gln Asp
260 265 270
Lys Glu Leu Arg Asp Gln Leu Val Pro Phe Met Glu Gly Leu Leu Asn
275 280 285
Lys Glu Glu Ile
290
<210> 23
<211> 27
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 23
tctagatttt tcgatcataa ggaaggt 27
<210> 24
<211> 49
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtiils)
<400> 24
gttaacgaat tccagctatg taggatccaa tgtccaatag cctttttgt 49
<210> 25
<211> 20
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 25
aaaaaggctt ctaacctggc 20
<210> 26
<211> 20
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 26
aaaccgccta aaggcacagc 20
<210> 27
<211> 20
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 27
gccaggttag aagccttttt 20
<210> 28
<211> 20
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 28
gctgtgcctt taggcggttt 20
<210> 29
<211> 1368
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<220>
<221> CDS
<222> (1)..(1368)
<223>
<400> 29
atg gat aag cgg ttt gca gtt gtt tta gcg gct gga caa gga acg aga 48
Met Asp Lys Arg Phe Ala Val Val Leu Ala Ala Gly Gln Gly Thr Arg
1 5 10 15
atg aaa tcg aag ctt tat aaa gtc ctt cat cca gtt tgc ggt aag cct 96
Met Lys Ser Lys Leu Tyr Lys Val Leu His Pro Val Cys Gly Lys Pro
20 25 30
atg gta gag cac gtc gtg gac gaa gcc tta aaa tta tct tta tca aag 144
Met Val Glu His Val Val Asp Glu Ala Leu Lys Leu Ser Leu Ser Lys
35 40 45
ctt gtc acg att gtc gga cat ggt gcg gaa gaa gtg aaa aag cag ctt 192
Leu Val Thr Ile Val Gly His Gly Ala Glu Glu Val Lys Lys Gln Leu
50 55 60
ggt gat aaa agc gag tac gcg ctt caa gca aaa cag ctt ggc act gct 240
Gly Asp Lys Ser Glu Tyr Ala Leu Gln Ala Lys Gln Leu Gly Thr Ala
65 70 75 80
cat gct gta aaa cag gca cag cca ttt ctt gct gac gaa aaa ggc gtc 288
His Ala Val Lys Gln Ala Gln Pro Phe Leu Ala Asp Glu Lys Gly Val
85 90 95
aca att gtc att tgc gga gat acg ccg ctt ttg aca gca gag acg atg 336
Thr Ile Val Ile Cys Gly Asp Thr Pro Leu Leu Thr Ala Glu Thr Met
100 105 110
gaa cag atg ctg aaa gaa cat aca caa aga gaa gcg aaa gct acg att 384
Glu Gln Met Leu Lys Glu His Thr Gln Arg Glu Ala Lys Ala Thr Ile
115 120 125
tta act gcg gtt gca gaa gat cca act gga tac ggc cgc att att cgc 432
Leu Thr Ala Val Ala Glu Asp Pro Thr Gly Tyr Gly Arg Ile Ile Arg
130 135 140
agc gaa aac gga gcg gtt caa aaa ata gtt gag cat aag gac gcc tct 480
Ser Glu Asn Gly Ala Val Gln Lys Ile Val Glu His Lys Asp Ala Ser
145 150 155 160
gaa gaa gaa cgt ctt gta act gag atc aac acc ggt acg tat tgt ttt 528
Glu Glu Glu Arg Leu Val Thr Glu Ile Asn Thr Gly Thr Tyr Cys Phe
165 170 175
gac aat gaa gcg cta ttt cgg gct att gat cag gtg tct aat gat aat 576
Asp Asn Glu Ala Leu Phe Arg Ala Ile Asp Gln Val Ser Asn Asp Asn
180 185 190
gca caa ggc gag tat tat ttg ccg gat gtc ata gag att ctt aaa aat 624
Ala Gln Gly Glu Tyr Tyr Leu Pro Asp Val Ile Glu Ile Leu Lys Asn
195 200 205
gaa ggc gaa act gtt gcc gct tac cag act ggt aat ttc caa gaa acg 672
Glu Gly Glu Thr Val Ala Ala Tyr Gln Thr Gly Asn Phe Gln Glu Thr
210 215 220
ctc gga gtt aat gat aga gtt gct ctt tct cag gca gaa caa ttt atg 720
Leu Gly Val Asn Asp Arg Val Ala Leu Ser Gln Ala Glu Gln Phe Met
225 230 235 240
aaa gag cgc att aat aaa cgg cat atg caa aat ggc gtg acg ttg att 768
Lys Glu Arg Ile Asn Lys Arg His Met Gln Asn Gly Val Thr Leu Ile
245 250 255
gac ccg atg aat acg tat att tct cct gac gct gtt atc gga agc gat 816
Asp Pro Met Asn Thr Tyr Ile Ser Pro Asp Ala Val Ile Gly Ser Asp
260 265 270
act gtg att tac cct gga act gtg att aaa ggt gag gtg caa atc gga 864
Thr Val Ile Tyr Pro Gly Thr Val Ile Lys Gly Glu Val Gln Ile Gly
275 280 285
gaa gat acg att att ggc cct cat acg gag att atg aat agt gcc att 912
Glu Asp Thr Ile Ile Gly Pro His Thr Glu Ile Met Asn Ser Ala Ile
290 295 300
ggc agc cgt acg gtt att aaa caa tcg gta gtc aat cac agt aaa gtg 960
Gly Ser Arg Thr Val Ile Lys Gln Ser Val Val Asn His Ser Lys Val
305 310 315 320
ggg aat gat gta aac ata gga cct ttt gct cac atc aga cct gat tct 1008
Gly Asn Asp Val Asn Ile Gly Pro Phe Ala His Ile Arg Pro Asp Ser
325 330 335
gtc atc ggg aat gaa gtg aag atc ggg aat ttt gta gaa att aaa aag 1056
Val Ile Gly Asn Glu Val Lys Ile Gly Asn Phe Val Glu Ile Lys Lys
340 345 350
act caa ttc gga gac cga agc aag gca tct cat cta agc tat gtc ggc 1104
Thr Gln Phe Gly Asp Arg Ser Lys Ala Ser His Leu Ser Tyr Val Gly
355 360 365
gat gct gag gta ggc act gat gta aac ctg ggc tgc ggt tca att act 1152
Asp Ala Glu Val Gly Thr Asp Val Asn Leu Gly Cys Gly Ser Ile Thr
370 375 380
gtc aat tat gat gga aag aat aag tat ttg aca aaa att gaa gat ggc 1200
Val Asn Tyr Asp Gly Lys Asn Lys Tyr Leu Thr Lys Ile Glu Asp Gly
385 390 395 400
gcg ttt atc ggc tgc aat tcc aac ttg gtt gcc cct gtc aca gtc gga 1248
Ala Phe Ile Gly Cys Asn Ser Asn Leu Val Ala Pro Val Thr Val Gly
405 410 415
gaa ggc gct tat gtg gcg gca ggt tca act gtt acg gaa gat gta cct 1296
Glu Gly Ala Tyr Val Ala Ala Gly Ser Thr Val Thr Glu Asp Val Pro
420 425 430
gga aaa gca ctt gct att gcc aga gcg aga caa gta aat aaa gac gat 1344
Gly Lys Ala Leu Ala Ile Ala Arg Ala Arg Gln Val Asn Lys Asp Asp
435 440 445
tat gtg aaa aat att cat aaa aaa 1368
Tyr Val Lys Asn Ile His Lys Lys
450 455
<210> 30
<211> 456
<212> PRT
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 30
Met Asp Lys Arg Phe Ala Val Val Leu Ala Ala Gly Gln Gly Thr Arg
1 5 10 15
Met Lys Ser Lys Leu Tyr Lys Val Leu His Pro Val Cys Gly Lys Pro
20 25 30
Met Val Glu His Val Val Asp Glu Ala Leu Lys Leu Ser Leu Ser Lys
35 40 45
Leu Val Thr Ile Val Gly His Gly Ala Glu Glu Val Lys Lys Gln Leu
50 55 60
Gly Asp Lys Ser Glu Tyr Ala Leu Gln Ala Lys Gln Leu Gly Thr Ala
65 70 75 80
His Ala Val Lys Gln Ala Gln Pro Phe Leu Ala Asp Glu Lys Gly Val
85 90 95
Thr Ile Val Ile Cys Gly Asp Thr Pro Leu Leu Thr Ala Glu Thr Met
100 105 11 0
Glu Gln Met Leu Lys Glu His Thr Gln Arg Glu Ala Lys Ala Thr Ile
115 120 125
Leu Thr Ala Val Ala Glu Asp Pro Thr Gly Tyr Gly Arg Ile Ile Arg
130 135 140
Ser Glu Asn Gly Ala Val Gln Lys Ile Val Glu His Lys Asp Ala Ser
145 150 155 160
Glu Glu Glu Arg Leu Val Thr Glu Ile Asn Thr Gly Thr Tyr Cys Phe
165 170 175
Asp Asn Glu Ala Leu Phe Arg Ala Ile Asp Gln Val Ser Asn Asp Asn
180 185 190
Ala Gln Gly Glu Tyr Tyr Leu Pro Asp Val Ile Glu Ile Leu Lys Asn
195 200 205
Glu Gly Glu Thr Val Ala Ala Tyr Gln Thr Gly Asn Phe Gln Glu Thr
210 215 220
Leu Gly Val Asn Asp Arg Val Ala Leu Ser Gln Ala Glu Gln Phe Met
225 230 235 240
Lys Glu Arg Ile Asn Lys Arg His Met Gln Asn Gly Val Thr Leu Ile
245 250 255
Asp Pro Met Asn Thr Tyr Ile Ser Pro Asp Ala Val Ile Gly Ser Asp
260 265 270
Thr Val Ile Tyr Pro Gly Thr Val Ile Lys Gly Glu Val Gln Ile Gly
275 280 285
Glu Asp Thr Ile Ile Gly Pro His Thr Glu Ile Met Asn Ser Ala Ile
290 295 300
Gly Ser Arg Thr Val Ile Lys Gln Ser Val Val Asn His Ser Lys Val
305 310 315 320
Gly Asn Asp Val Asn Ile Gly Pro Phe Ala His Ile Arg Pro Asp Ser
325 330 335
Val Ile Gly Asn Glu Val Lys Ile Gly Asn Phe Val Glu Ile Lys Lys
340 345 350
Thr Gln Phe Gly Asp Arg Ser Lys Ala Ser His Leu Ser Tyr Val Gly
355 360 365
Asp Ala Glu Val Gly Thr Asp Val Asn Leu Gly Cys Gly Ser Ile Thr
370 375 380
Val Asn Tyr Asp Gly Lys Asn Lys Tyr Leu Thr Lys Ile Glu Asp Gly
385 390 395 400
Ala Phe Ile Gly Cys Asn Ser Asn Leu Val Ala Pro Val Thr Val Gly
405 410 415
Glu Gly Ala Tyr Val Ala Ala Gly Ser Thr Val Thr Glu Asp Val Pro
420 425 430
Gly Lys Ala Leu Ala Ile Ala Arg Ala Arg Gln Val Asn Lys Asp Asp
435 440 445
Tyr Val Lys Asn Ile His Lys Lys
450 455
<210> 31
<211> 26
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 31
ggatcctttc tatggataaa agggat 26
<210> 32
<211> 31
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 32
gttaacagga ttatttttta tgaatatttt t 31
<210> 33
<211> 20
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 33
cagagacgat ggaacagatg 20
<210> 34
<211> 20
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 34
ggagttaatg atagagttgc 20
<210> 35
<211> 20
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 35
gaagatcggg aattttgtag 20
<210> 36
<211> 20
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 36
catctgttcc atcgtctctg 20
<210> 37
<211> 20
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 37
gcaactctat cattaactcc 20
<210> 38
<211> 20
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 38
ctacaaaatt cccgatcttc 20
<210> 39
<211> 54
<212> DNA
<213> 似马链球菌(Streptococcus equisimilis)
<400> 39
gtgtcggaac attcattaca tgcttaagca cccgctgtcc ttcttgttat ctcc 54
<210> 40
<211> 1203
<212> DNA
<213> 似马链球菌(Streptococcus equisimilis)
<220>
<221> CDS
<222> (1)..(1203)
<223>
<400> 40
gtg aaa att tct gta gca ggc tca gga tat gtc ggc cta tcc ttg agt 48
Val Lys Ile Ser Val Ala Gly Ser Gly Tyr Val Gly Leu Ser Leu Ser
1 5 10 15
att tta ctg gca caa cat aat gac gtc act gtt gtt gat att att gat 96
Ile Leu Leu Ala Gln His Asn Asp Val Thr Val Val Asp Ile Ile Asp
20 25 30
gaa aag gtg aga ttg atc aat caa ggc ata tct cca atc aag gat gct 144
Glu Lys Val Arg Leu Ile Asn Gln Gly Ile Ser Pro Ile Lys Asp Ala
35 40 45
gat att gag gag tat tta aaa aat gcg ccg cta aat ctc aca gcg acc 192
Asp Ile Glu Glu Tyr Leu Lys Asn Ala Pro Leu Asn Leu Thr Ala Thr
50 55 60
ctt gat ggc gca agc gct tat agc aat gca gac ctt att atc att gct 240
Leu Asp Gly Ala Ser Ala Tyr Ser Asn Ala Asp Leu Ile Ile Ile Ala
65 70 75 80
act ccg aca aat tat gac agc gaa cgc aac tac ttt gac aca agg cat 288
Thr Pro Thr Asn Tyr Asp Ser Glu Arg Asn Tyr Phe Asp Thr Arg His
85 90 95
gtt gaa gag gtc att gag cag gtc cta gac cta aat gcg tca gca acc 336
Val Glu Glu Val Ile Glu Gln Val Leu Asp Leu Asn Ala Ser Ala Thr
100 105 110
att att atc aaa tca acc ata cca cta ggc ttt atc aag cat gtt agg 384
Ile Ile Ile Lys Ser Thr Ile Pro Leu Gly Phe Ile Lys His Val Arg
115 120 125
gaa aaa tac cag aca gat cgt att att ttt agc cca gaa ttt tta aga 432
Glu Lys Tyr Gln Thr Asp Arg Ile Ile Phe Ser Pro Glu Phe Leu Arg
130 135 140
gaa tca aaa gcc tta tac gat aac ctt tac cca agt cgg atc att gtt 480
Glu Ser Lys Ala Leu Tyr Asp Asn Leu Tyr Pro Ser Arg Ile Ile Val
145 150 155 160
tct tat gaa aag gac gac tca cca agg gtt att cag gct gct aaa gcc 528
Ser Tyr Glu Lys Asp Asp Ser Pro Arg Val Ile Gln Ala Ala Lys Ala
165 170 175
ttt gct ggt ctt tta aag gaa gga gcc aaa agc aag gat act ccg gtc 576
Phe Ala Gly Leu Leu Lys Glu Gly Ala Lys Ser Lys Asp Thr Pro Val
180 185 190
tta ttt atg ggc tca cag gag gct gag gcg gtc aag cta ttt gcg aat 624
Leu Phe Met Gly Ser Gln Glu Ala Glu Ala Val Lys Leu Phe Ala Asn
195 200 205
acc ttt ttg gct atg cgg gtg tct tac ttt aat gaa tta gac acc tat 672
Thr Phe Leu Ala Met Arg Val Ser Tyr Phe Asn Glu Leu Asp Thr Tyr
210 215 220
tcc gaa agc aag ggt cta gat gct cag cgc gtg att gaa gga gtc tgt 720
Ser Glu Ser Lys Gly Leu Asp Ala Gln Arg Val Ile Glu Gly Val Cys
225 230 235 240
cat gat cag cgc att ggt aac cat tac aat aac cct tcc ttt gga tat 768
His Asp Gln Arg Ile Gly Asn His Tyr Asn Asn Pro Ser Phe Gly Tyr
245 250 255
ggc ggc tat tgc ctg cca aag gac agc aaa cag ctg ttg gca aat tat 816
Gly Gly Tyr Cys Leu Pro Lys Asp Ser Lys Gln Leu Leu Ala Asn Tyr
260 265 270
aga ggc att ccc cag tcc ttg atg tca gcg att gtt gag tcc aac aag 864
Arg Gly Ile Pro Gln Ser Leu Met Ser Ala Ile Val Glu Ser Asn Lys
275 280 285
ata cga aaa tcc tat tta gct gaa caa ata tta gac aga gcc tct agt 912
Ile Arg Lys Ser Tyr Leu Ala Glu Gln Ile Leu Asp Arg Ala Ser Ser
290 295 300
caa aag cag gct ggt gta cca tta acg att ggc ttt tac cgc ttg att 960
Gln Lys Gln Ala Gly Val Pro Leu Thr Ile Gly Phe Tyr Arg Leu Ile
305 310 315 320
atg aaa agc aac tct gat aat ttc cga gaa agc gcc att aaa gat att 1008
Met Lys Ser Asn Ser Asp Asn Phe Arg Glu Ser Ala Ile Lys Asp Ile
325 330 335
att gat atc atc aac gac tat ggg gtt aat att gtc att tac gaa ccc 1056
Ile Asp Ile Ile Asn Asp Tyr Gly Val Asn Ile Val Ile Tyr Glu Pro
340 345 350
atg ctt ggc gag gat att ggc tac agg gtt gtc aag gac tta gag cag 1104
Met Leu Gly Glu Asp Ile Gly Tyr Arg Val Val Lys Asp Leu Glu Gln
355 360 365
ttc aaa aac gag tct aca atc att gtg tca aat cgc ttt gag gac gac 1152
Phe Lys Asn Glu Ser Thr Ile Ile Val Ser Asn Arg Phe Glu Asp Asp
370 375 380
cta gga gat gtc att gat aag gtt tat acg aga gat gtc ttt gga aga 1200
Leu Gly Asp Val Ile Asp Lys Val Tyr Thr Arg Asp Val Phe Gly Arg
385 390 395 400
gac 1203
Asp
<210> 41
<211> 401
<212> PRT
<213> 似马链球菌(Streptococcus equisimilis)
<400> 41
Val Lys Ile Ser Val Ala Gly Ser Gly Tyr Val Gly Leu Ser Leu Ser
1 5 10 15
Ile Leu Leu Ala Gln His Asn Asp Val Thr Val Val Asp Ile Ile Asp
20 25 30
Glu Lys Val Arg Leu Ile Asn Gln Gly Ile Ser Pro Ile Lys Asp Ala
35 40 45
Asp Ile Glu Glu Tyr Leu Lys Asn Ala Pro Leu Asn Leu Thr Ala Thr
50 55 60
Leu Asp Gly Ala Ser Ala Tyr Ser Asn Ala Asp Leu Ile Ile Ile Ala
65 70 75 80
Thr Pro Thr Asn Tyr Asp Ser Glu Arg Asn Tyr Phe Asp Thr Arg His
85 90 95
Val Glu Glu Val Ile Glu Gln Val Leu Asp Leu Asn Ala Ser Ala Thr
100 105 110
Ile Ile Ile Lys Ser Thr Ile Pro Leu Gly Phe Ile Lys His Val Arg
115 120 125
Glu Lys Tyr Gln Thr Asp Arg Ile Ile Phe Ser Pro Glu Phe Leu Arg
130 135 140
Glu Ser Lys Ala Leu Tyr Asp Asn Leu Tyr Pro Ser Arg Ile Ile Val
145 150 155 160
Ser Tyr Glu Lys Asp Asp Ser Pro Arg Val Ile Gln Ala Ala Lys Ala
165 170 175
Phe Ala Gly Leu Leu Lys Glu Gly Ala Lys Ser Lys Asp Thr Pro Val
180 185 190
Leu Phe Met Gly Ser Gln Glu Ala Glu Ala Val Lys Leu Phe Ala Asn
195 200 205
Thr Phe Leu Ala Met Arg Val Ser Tyr Phe Asn Glu Leu Asp Thr Tyr
210 215 220
Ser Glu Ser Lys Gly Leu Asp Ala Gln Arg Val Ile Glu Gly Val Cys
225 230 235 240
His Asp Gln Arg Ile Gly Asn His Tyr Asn Asn Pro Ser Phe Gly Tyr
245 250 255
Gly Gly Tyr Cys Leu Pro Lys Asp Ser Lys Gln Leu Leu Ala Asn Tyr
260 265 270
Arg Gly Ile Pro Gln Ser Leu Met Ser Ala Ile Val Glu Ser Asn Lys
275 280 285
Ile Arg Lys Ser Tyr Leu Ala Glu Gln Ile Leu Asp Arg Ala Ser Ser
290 295 300
Gln Lys Gln Ala Gly Val Pro Leu Thr Ile Gly Phe Tyr Arg Leu Ile
305 310 315 320
Met Lys Ser Asn Ser Asp Asn Phe Arg Glu Ser Ala Ile Lys Asp Ile
325 330 335
Ile Asp Ile Ile Asn Asp Tyr Gly Val Asn Ile Val Ile Tyr Glu Pro
340 345 350
Met Leu Gly Glu Asp Ile Gly Tyr Arg Val Val Lys Asp Leu Glu Gln
355 360 365
Phe Lys Asn Glu Ser Thr Ile Ile Val Ser Asn Arg Phe Glu Asp Asp
370 375 380
Leu Gly Asp Val Ile Asp Lys Val Tyr Thr Arg Asp Val Phe Gly Arg
385 390 395 400
Asp
<210> 42
<211> 900
<212> DNA
<213> 似马链球菌(Streptococcus equisimilis)
<220>
<221> CDS
<222> (1)..(900)
<223>
<400> 42
atg aca aag gtc aga aaa gcc att atc cca gcc gcc ggc cta ggc act 48
Met Thr Lys Val Arg Lys Ala Ile Ile Pro Ala Ala Gly Leu Gly Thr
1 5 10 15
cgc ttc cta ccc gcc acc aag gca ctg gcc aag gaa atg ctc cca atc 96
Arg Phe Leu Pro Ala Thr Lys Ala Leu Ala Lys Glu Met Leu Pro Ile
20 25 30
gtc gat aag cca acc att caa ttc atc gtc gag gaa gct cta aag gcc 144
Val Asp Lys Pro Thr Ile Gln Phe Ile Val Glu Glu Ala Leu Lys Ala
35 40 45
ggt atc gag gag att ctt gtc gtc acc ggc aag gcc aaa cgc tct att 192
Gly Ile Glu Glu Ile Leu Val Val Thr Gly Lys Ala Lys Arg Ser Ile
50 55 60
gaa gac cac ttt gac tcc aac ttc gag ctc gaa tac aat ctc caa gcc 240
Glu Asp His Phe Asp Ser Asn Phe Glu Leu Glu Tyr Asn Leu Gln Ala
65 70 75 80
aag ggc aaa acc gag ctg ctc aag ctc gtt gat gag acc act gcc atc 288
Lys Gly Lys Thr Glu Leu Leu Lys Leu Val Asp Glu Thr Thr Ala Ile
85 90 95
aac ctg cac ttc att cgt cag agc cac cct aga gga cta ggg gac gct 336
Asn Leu His Phe Ile Arg Gln Ser His Pro Arg Gly Leu Gly Asp Ala
100 105 110
gtc ctc cag gcc aag gcc ttt gtg ggc aat gag ccc ttt gtg gtc atg 384
Val Leu Gln Ala Lys Ala Phe Val Gly Ash Glu Pro Phe Val Val Met
115 120 125
ctg ggg gat gac ctc atg gat att acc aat cct agt gcc aag ccc ttg 432
Leu Gly Asp Asp Leu Met Asp Ile Thr Asn Pro Ser Ala Lys Pro Leu
130 135 140
gcc aag cag ctc att gag gat tat gat tgc aca cac gcc tca acg att 480
Ala Lys Gln Leu Ile Glu Asp Tyr Asp Cys Thr His Ala Ser Thr Ile
145 150 155 160
gca gtg atg agg gtg ccg cat gag gag gtt tcc aat tat ggc gtg att 528
Ala Val Met Arg Val Pro His Glu Glu Val Ser Asn Tyr Gly Val Ile
165 170 175
gca ccg caa ggg aag gct gtt aag ggc ttg tat agt gtg gag acc ttt 576
Ala Pro Gln Gly Lys Ala Val Lys Gly Leu Tyr Ser Val Glu Thr Phe
180 185 190
gtt gag aag cca agt cca gat gag gca ccg agt gac tta gcg att att 624
Val Glu Lys Pro Ser Pro Asp Glu Ala Pro Ser Asp Leu Ala Ile Ile
195 200 205
ggt cga tat ttg ttg acg cct gag att ttt gcc ata ttg gag aat cag 672
Gly Arg Tyr Leu Leu Thr Pro Glu Ile Phe Ala Ile Leu Glu Asn Gln
210 215 220
gcg cct ggg gct ggc aat gag gta cag cta gcc gat gcg att gac aag 720
Ala Pro Gly Ala Gly Asn Glu Val Gln Leu Ala Asp Ala Ile Asp Lys
225 230 235 240
ctc aac aag act cag cgg gtt ttt gcg agg gag ttt aag gga gag cgg 768
Leu Asn Lys Thr Gln Arg Val Phe Ala Arg Glu Phe Lys Gly Glu Arg
245 250 255
tat gat gtt ggg gac aag ttt ggc ttt atg aag acc tca ctt gac tat 816
Tyr Asp Val Gly Asp Lys Phe Gly Phe Met Lys Thr Ser Leu Asp Tyr
260 265 270
gct ctc aag cac cct cag gtc aag gac gac ctc act gac tac att ata 864
Ala Leu Lys His Pro Gln Val Lys Asp Asp Leu Thr Asp Tyr Ile Ile
275 280 285
aag ctc agt aag caa ctg aac aag gac gtt aaa aaa 900
Lys Leu Ser Lys Gln Leu Asn Lys Asp Val Lys Lys
290 295 300
<210> 43
<211> 300
<212> PRT
<213> 似马链球菌(Streptococcus equisimiils)
<400> 43
Met Thr Lys Val Arg Lys Ala Ile Ile Pro Ala Ala Gly Leu Gly Thr
1 5 10 15
Arg Phe Leu Pro Ala Thr Lys Ala Leu Ala Lys Glu Met Leu Pro Ile
20 25 30
Val Asp Lys Pro Thr Ile Gln Phe Ile Val Glu Glu Ala Leu Lys Ala
35 40 45
Gly Ile Glu Glu Ile Leu Val Val Thr Gly Lys Ala Lys Arg Ser Ile
50 55 60
Glu Asp His Phe Asp Ser Asn Phe Glu Leu Glu Tyr Asn Leu Gln Ala
65 70 75 80
Lys Gly Lys Thr Glu Leu Leu Lys Leu Val Asp Glu Thr Thr Ala Ile
85 90 95
Asn Leu His Phe Ile Arg Gln Ser His Pro Arg Gly Leu Gly Asp Ala
100 105 110
Val Leu Gln Ala Lys Ala Phe Val Gly Asn Glu Pro Phe Val Val Met
115 120 125
Leu Gly Asp Asp Leu Met Asp Ile Thr Asn Pro Ser Ala Lys Pro Leu
130 135 140
Ala Lys Gln Leu Ile Glu Asp Tyr Asp Cys Thr His Ala Ser Thr Ile
145 150 155 160
Ala Val Met Arg Val Pro His Glu Glu Val Ser Asn Tyr Gly Val Ile
165 170 175
Ala Pro Gln Gly Lys Ala Val Lys Gly Leu Tyr Ser Val Glu Thr Phe
180 185 190
Val Glu Lys Pro Ser Pro Asp Glu Ala Pro Ser Asp Leu Ala Ile Ile
195 200 205
Gly Arg Tyr Leu Leu Thr Pro Glu Ile Phe Ala Ile Leu Glu Asn Gln
210 215 220
Ala Pro Gly Ala Gly Asn Glu Val Gln Leu Ala Asp Ala Ile Asp Lys
225 230 235 240
Leu Asn Lys Thr Gln Arg Val Phe Ala Arg Glu Phe Lys Gly Glu Arg
245 250 255
Tyr Asp Val Gly Asp Lys Phe Gly Phe Met Lys Thr Ser Leu Asp Tyr
260 265 270
Ala Leu Lys His Pro Gln Val Lys Asp Asp Leu Thr Asp Tyr Ile Ile
275 280 285
Lys Leu Ser Lys Gln Leu Asn Lys Asp Val Lys Lys
290 295 300
<210> 44
<211> 1380
<212> DNA
<213> 似马链球菌(Streptococcus equisimilis)
<220>
<221> CDS
<222> (1)..(1380)
<223>
<400> 44
atg aaa aac tac gcc att atc cta gca gct gga aag gga acc cgc atg 48
Met Lys Asn Tyr Ala Ile Ile Leu Ala Ala Gly Lys Gly Thr Arg Met
1 5 10 15
aat tca ggg ctt tcc aag gtg ctg cac aag gta tca ggc cta agc atg 96
Asn Ser Gly Leu Ser Lys Val Leu His Lys Val Ser Gly Leu Ser Met
20 25 30
ctg gag cat gtc ctc aag agc gtc tca gcc cta gct cct caa aag caa 144
Leu Glu His Val Leu Lys Ser Val Ser Ala Leu Ala Pro Gln Lys Gln
35 40 45
ctc aca gtg atc ggt cat cag gca gag caa gta cgt gcc gtc cta ggt 192
Leu Thr Val Ile Gly His Gln Ala Glu Gln Val Arg Ala Val Leu Gly
50 55 60
gat caa tta ctg aca gtg gtg caa gag gag cag cta gga aca ggc cat 240
Asp Gln Leu Leu Thr Val Val Gln Glu Glu Gln Leu Gly Thr Gly His
65 70 75 80
gca gtc atg atg gca gaa gag gag cta tct ggc tta gaa ggg cag acc 288
Ala Val Met Met Ala Glu Glu Glu Leu Ser Gly Leu Glu Gly Gln Thr
85 90 95
cta gtg att gca ggt gac acc ccc ttg atc aga gga gaa agc ctc aag 336
Leu Val Ile Ala Gly Asp Thr Pro Leu Ile Arg Gly Glu Ser Leu Lys
100 105 110
gct ctg cta gac tat cat atc aga gaa aag aat gtg gca acc att ctc 384
Ala Leu Leu Asp Tyr His Ile Arg Glu Lys Asn Val Ala Thr Ile Leu
115 120 125
aca gcc aat gcc aag gat ccc ttt ggc tac ggc cga atc att cgc aat 432
Thr Ala Asn Ala Lys Asp Pro Phe Gly Tyr Gly Arg Ile Ile Arg Asn
130 135 140
gca gca gga gag gtg gtc aac atc gtt gaa caa aag gac gct aat gag 480
Ala Ala Gly Glu Val Val Asn Ile Val Glu Gln Lys Asp Ala Asn Glu
145 150 155 160
gca gag caa gag gtc aag gag atc aac aca ggg acc tat atc ttt gac 528
Ala Glu Gln Glu Val Lys Glu Ile Asn Thr Gly Thr Tyr Ile Phe Asp
165 170 175
aat aag cgc ctc ttt gag gct cta aag cat ctc acg act gat aat gcc 576
Asn Lys Arg Leu Phe Glu Ala Leu Lys His Leu Thr Thr Asp Asn Ala
180 185 190
caa ggg gaa tat tac cta acc gat gtg atc agt att ttc aag gcc agc 624
Gln Gly Glu Tyr Tyr Leu Thr Asp Val Ile Ser Ile Phe Lys Ala Ser
195 200 205
caa gaa aag gtt gga gct tac ctg ctg aag gat ttt gat gaa agc cta 672
Gln Glu Lys Val Gly Ala Tyr Leu Leu Lys Asp Phe Asp Glu Ser Leu
210 215 220
ggg gtt aat gat cgc cta gct cta gcc cag gct gag gtg atc atg cag 720
Gly Val Asn Asp Arg Leu Ala Leu Ala Gln Ala Glu Val Ile Met Gln
225 230 235 240
gag cgg atc aac aag cag cac atg ctt aat ggg gtg acc ctg caa aac 768
Glu Arg Ile Asn Lys Gln His Met Leu Asn Gly Val Thr Leu Gln Asn
245 250 255
cct gca gct acc tat atc gaa agc agt gta gag att gcg ccg gac gtc 816
Pro Ala Ala Thr Tyr Ile Glu Ser Ser Val Glu Ile Ala Pro Asp Val
260 265 270
ttg att gaa gct aat gtg acc cta aag gga cag act aga att ggc agc 864
Leu Ile Glu Ala Asn Val Thr Leu Lys Gly Gln Thr Arg Ile Gly Ser
275 280 285
aga agt gtt ata acc aat ggg agc tat atc ctt gat tca agg ctt ggt 912
Arg Ser Val Ile Thr Asn Gly Ser Tyr Ile Leu Asp Ser Arg Leu Gly
290 295 300
gag ggc gta gtg gtg agc cag tca gtg att gag ggc tca gtc cta gca 960
Glu Gly Val Val Val Ser Gln Ser Val Ile Glu Gly Ser Val Leu Ala
305 310 3l5 320
gat ggt gtg aca gta ggg ccc tat gca cac att cgc ccg gac tct cag 1008
Asp Gly Val Thr Val Gly Pro Tyr Ala His Ile Arg Pro Asp Ser Gln
325 330 335
ctc gat gag tgt gtt cat att ggg aac ttt gta gag gtt aag ggg tct 1056
Leu Asp Glu Cys Val His Ile Gly Asn Phe Val Glu Val Lys Gly Ser
340 345 350
cat cta ggg gcc aat acc aag gca ggg cat ttg act tat ctg ggg aat 1104
His Leu Gly Ala Asn Thr Lys Ala Gly His Leu Thr Tyr Leu Gly Asn
355 360 365
gcc gag att ggc tca gag gtt aat att ggt gca gga agc att acg gtt 1152
Ala Glu Ile Gly Ser Glu Val Asn Ile Gly Ala Gly Ser Ile Thr Val
370 375 380
aat tat gat ggt caa cgg aaa tac cag aca gtg att ggc gat cac gct 1200
Asn Tyr Asp Gly Gln Arg Lys Tyr Gln Thr Val Ile Gly Asp His Ala
385 390 395 400
ttt att ggg agt cat tcg act ttg ata gct ccg gta gag gtt ggg gag 1248
Phe Ile Gly Ser His Ser Thr Leu Ile Ala Pro Val Glu Val Gly Glu
405 410 415
aat gct tta aca gca gca ggg tct acg ata gcc cag tcg gtg cca gca 1296
Asn Ala Leu Thr Ala Ala Gly Ser Thr Ile Ala Gln Ser Val Pro Ala
420 425 430
gac agt gtg gct ata ggg cgt agc cgt cag gtg gtg aag gaa ggc tat 1344
Asp Ser Val Ala Ile Gly Arg Ser Arg Gln Val Val Lys Glu Gly Tyr
435 440 445
gcc aag agg cta cca cat cac ccg gat cag ccc cag 1380
Ala Lys Arg Leu Pro His His Pro Asp Gln Pro Gln
450 455 460
<210> 45
<211> 460
<212> PRT
<213> 似马链球菌(Streptococcus equisimilis)
<400> 45
Met Lys Asn Tyr Ala Ile Ile Leu Ala Ala Gly Lys Gly Thr Arg Met
1 5 10 15
Asn Ser Gly Leu Ser Lys Val Leu His Lys Val Ser Gly Leu Ser Met
20 25 30
Leu Glu His Val Leu Lys Ser Val Ser Ala Leu Ala Pro Gln Lys Gln
35 40 45
Leu Thr Val Ile Gly His Gln Ala Glu Gln Val Arg Ala Val Leu Gly
50 55 60
Asp Gln Leu Leu Thr Val Val Gln Glu Glu Gln Leu Gly Thr Gly His
65 70 75 80
Ala Val Met Met Ala Glu Glu Glu Leu Ser Gly Leu Glu Gly Gln Thr
85 90 95
Leu Val Ile Ala Gly Asp Thr Pro Leu Ile Arg Gly Glu Ser Leu Lys
100 105 110
Ala Leu Leu Asp Tyr His Ile Arg Glu Lys Asn Val Ala Thr Ile Leu
115 120 125
Thr Ala Asn Ala Lys Asp Pro Phe Gly Tyr Gly Arg Ile Ile Arg Asn
130 135 140
Ala Ala Gly Glu Val Val Asn Ile Val Glu Gln Lys Asp Ala Asn Glu
145 150 155 160
Ala Glu Gln Glu Val Lys Glu Ile Asn Thr Gly Thr Tyr Ile Phe Asp
165 170 175
Asn Lys Arg Leu Phe Glu Ala Leu Lys His Leu Thr Thr Asp Asn Ala
180 185 190
Gln Gly Glu Tyr Tyr Leu Thr Asp Val Ile Ser Ile Phe Lys Ala Ser
195 200 205
Gln Glu Lys Val Gly Ala Tyr Leu Leu Lys Asp Phe Asp Glu Ser Leu
210 215 220
Gly Val Asn Asp Arg Leu Ala Leu Ala Gln Ala Glu Val Ile Met Gln
225 230 235 240
Glu Arg Ile Asn Lys Gln His Met Leu Asn Gly Val Thr Leu Gln Asn
245 250 255
Pro Ala Ala Thr Tyr Ile Glu Ser Ser Val Glu Ile Ala Pro Asp Val
260 265 270
Leu Ile Glu Ala Asn Val Thr Leu Lys Gly Gln Thr Arg Ile Gly Ser
275 280 285
Arg Ser Val Ile Thr Asn Gly Ser Tyr Ile Leu Asp Ser Arg Leu Gly
290 295 300
Glu Gly Val Val Val Ser Gln Ser Val Ile Glu Gly Ser Val Leu Ala
305 310 315 320
Asp Gly Val Thr Val Gly Pro Tyr Ala His Ile Arg Pro Asp Ser Gln
325 330 335
Leu Asp Glu Cys Val His Ile Gly Asn Phe Val Glu Val Lys Gly Ser
340 345 350
His Leu Gly Ala Asn Thr Lys Ala Gly His Leu Thr Tyr Leu Gly Asn
355 360 365
Ala Glu Ile Gly Ser Glu Val Asn Ile Gly Ala Gly Ser Ile Thr Val
370 375 380
Asn Tyr Asp Gly Gln Arg Lys Tyr Gln Thr Val Ile Gly Asp His Ala
385 390 395 400
Phe Ile Gly Ser His Ser Thr Leu Ile Ala Pro Val Glu Val Gly Glu
405 410 415
Asn Ala Leu Thr Ala Ala Gly Ser Thr Ile Ala Gln Ser Val Pro Ala
420 425 430
Asp Ser Val Ala Ile Gly Arg Ser Arg Gln Val Val Lys Glu Gly Tyr
435 440 445
Ala Lys Arg Leu Pro His His Pro Asp Gln Pro Gln
450 455 460
<210> 46
<211> 29
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 46
gcggccgcgg tacctgtgtt acacctgtt 29
<210> 47
<211> 38
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 47
gtcaagctta attctcatgt ttgacagctt atcatcgg 38
<210> 48
<211> 18
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 48
catgggagag acctttgg 18
<210> 49
<211> 17
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 49
gtcggtcttc catttgc 17
<210> 50
<211> 17
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 50
cgaccactgt atcttgg 17
<210> 51
<211> 17
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 51
gagatgccaa acagtgc 17
<210> 52
<211> 16
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 52
catgtccatc gtgacg 16
<210> 53
<211> 17
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 53
caggagcatt tgatacg 17
<210> 54
<211> 16
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 54
ccttcagatg tgatcc 16
<210> 55
<211> 17
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 55
gtgttgacgt caactgc 17
<210> 56
<211> 18
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 56
gttcagcctt tcctctcg 18
<210> 57
<211> 18
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 57
gctaccttct ttcttagg 18
<210> 58
<211> 18
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 58
cgtcaatatg atctgtgc 18
<210> 59
<211> 17
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 59
ggaaagaagg tctgtgc 17
<210> 60
<211> 17
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 60
cagctatcag ctgacag 17
<210> 61
<211> 20
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 61
gctcagctat gacatattcc 20
<210> 62
<211> 17
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 62
gatcgtcttg attaccg 17
<210> 63
<211> 16
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 63
agctttatcg gtgacg 16
<210> 64
<211> 16
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 64
tgagcacgat tgcagg 16
<210> 65
<211> 17
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 65
cattgcggag acattgc 17
<210> 66
<211> 26
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 66
tagacaattg gaagagaaaa gagata 26
<210> 67
<211> 20
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 67
ccgtcgctat tgtaaccagt 20
<210> 68
<211> 29
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 68
ggaattccaa agctgcagcg gccggcgcg 29
<210> 69
<211> 32
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 69
gaagatctcg tatacttggc ttctgcagct gc 32
<210> 70
<211> 31
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 70
gaagatctgg tcaacaagct ggaaagcact c 31
<210> 71
<211> 33
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 71
cccaagcttc gtgacgtaca gcaccgttcc ggc 33
<210> 72
<211> 50
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 72
ccttaagggc cgaatattta tacggagctc cctgaaacaa caaaaacggc 50
<210> 73
<211> 34
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 73
ggtgttctct agagcggccg cggttgcggt cagc 34
<210> 74
<211> 27
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 74
gtccttcttg gtacctggaa gcagagc 27
<210> 75
<211> 39
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 75
gtataaatat tcggccctta aggccagtac cattttccc 39
<210> 76
<211> 13
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 76
gggccggatc cgc 13
<210> 77
<211> 20
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 77
attcccggcc taggcgccgg 20
<210> 78
<211> 19
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 78
ggaaattatc gtgatcaac 19
<210> 79
<211> 21
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 79
gcacgagcac tgataaatat g 21
<210> 80
<211> 21
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 80
catatttatc agtgctcgtg c 21
<210> 81
<211> 17
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 81
tcgtagacct catatgc 17
<210> 82
<211> 17
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 82
gtcgttaaac cgtgtgc 17
<210> 83
<211> 39
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 83
ctagaggatc cccgggtacc gtgctctgcc ttttagtcc 39
<210> 84
<211> 37
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 84
gtacatcgaa ttcgtgctca ttattaatct gttcagc 37
<210> 85
<211> 20
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 85
aactattgcc gatgataagc 20
<210> 86
<211> 1260
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<220>
<221> CDS
<222> (1)..(1260)
<223>
<400> 86
atg aaa aaa gtg atg tta gct acg gct ttg ttt tta gga ttg act cca 48
Met Lys Lys Val Met Leu Ala Thr Ala Leu Phe Leu Gly Leu Thr Pro
1 5 10 15
gct ggc gcg aac gca gct gat tta ggc cac cag acg ttg gga tcc aat 96
Ala Gly Ala Asn Ala Ala Asp Leu Gly His Gln Thr Leu Gly Ser Asn
20 25 30
gat ggc tgg ggc gcg tac tcg acc ggc acg aca ggc gga tca aaa gca 144
Asp Gly Trp Gly Ala Tyr Ser Thr Gly Thr Thr Gly Gly Ser Lys Ala
35 40 45
tcc tcc tca aat gtg tat acc gtc agc aac aga aac cag ctt gtc tcg 192
Ser Ser Ser Asn Val Tyr Thr Val Ser Asn Arg Asn Gln Leu Val Ser
50 55 60
gca tta ggg aag gaa acg aac aca acg cca aaa atc att tat atc aag 240
Ala Leu Gly Lys Glu Thr Asn Thr Thr Pro Lys Ile Ile Tyr Ile Lys
65 70 75 80
gga acg att gac atg aac gtg gat gac aat ctg aag ccg ctt ggc cta 288
Gly Thr Ile Asp Met Asn Val Asp Asp Asn Leu Lys Pro Leu Gly Leu
85 90 95
aat gac tat aaa gat ccg gag tat gat ttg gac aaa tat ttg aaa gcc 336
Asn Asp Tyr Lys Asp Pro Glu Tyr Asp Leu Asp Lys Tyr Leu Lys Ala
l00 105 110
tat gat cct agc aca tgg ggc aaa aaa gag ccg tcg gga aca caa gaa 384
Tyr Asp Pro Ser Thr Trp Gly Lys Lys Glu Pro Ser Gly Thr Gln Glu
115 120 125
gaa gcg aga gca cgc tct cag aaa aac caa aaa gca cgg gtc atg gtg 432
Glu Ala Arg Ala Arg Ser Gln Lys Asn Gln Lys Ala Arg Val Met Val
130 135 140
gat atc cct gca aac acg acg atc gtc ggt tca ggg act aac gct aaa 480
Asp Ile Pro Ala Asn Thr Thr Ile Val Gly Ser Gly Thr Asn Ala Lys
145 150 155 160
gtc gtg gga gga aac ttc caa atc aag agt gat aac gtc att att cgc 528
Val Val Gly Gly Asn Phe Gln Ile Lys Ser Asp Asn Val Ile Ile Arg
165 170 175
aac att gaa ttc cag gat gcc tat gac tat ttt ccg caa tgg gat ccg 576
Asn Ile Glu Phe Gln Asp Ala Tyr Asp Tyr Phe Pro Gln Trp Asp Pro
180 185 190
act gac gga agc tca ggg aac tgg aac tca caa tac gac aac atc acg 624
Thr Asp Gly Ser Ser Gly Asn Trp Asn Ser Gln Tyr Asp Asn Ile Thr
195 200 205
ata aac ggc ggc aca cac atc tgg att gat cac tgt aca ttt aat gac 672
Ile Asn Gly Gly Thr His Ile Trp Ile Asp His Cys Thr Phe Asn Asp
210 215 220
ggt tcg cgt ccg gac agc aca tca ccg aaa tat tat gga aga aaa tat 720
Gly Ser Arg Pro Asp Ser Thr Ser Pro Lys Tyr Tyr Gly Arg Lys Tyr
225 230 235 240
cag cac cat gac ggc caa acg gat gct tcc aac ggt gct aac tat atc 768
Gln His His Asp Gly Gln Thr Asp Ala Ser Asn Gly Ala Asn Tyr Ile
245 250 255
acg atg tcc tac aac tat tat cac gat cat gat aaa agc tcc att ttc 816
Thr Met Ser Tyr Asn Tyr Tyr His Asp His Asp Lys Ser Ser Ile Phe
260 265 270
gga tca agt gac agc aaa acc tcc gat gac ggc aaa tta aaa att acg 864
Gly Ser Ser Asp Ser Lys Thr Ser Asp Asp Gly Lys Leu Lys Ile Thr
275 280 285
ctg cat cat aac cgc tat aaa aat att gtc cag cgc gcg ccg aga gtc 912
Leu His His Asn Arg Tyr Lys Asn Ile Val Gln Arg Ala Pro Arg Val
290 295 300
cgc ttc ggg caa gtg cac gta tac aac aac tat tat gaa gga agc aca 960
Arg Phe Gly Gln Val His Val Tyr Asn Asn Tyr Tyr Glu Gly Ser Thr
305 310 315 320
agc tct tca agt tat cct ttt agc tat gca tgg gga atc gga aag tca 1008
Ser Ser Ser Ser Tyr Pro Phe Ser Tyr Ala Trp Gly Ile Gly Lys Ser
325 330 335
tct aaa atc tat gcc caa aac aat gtc att gac gta ccg gga ctg tca 1056
Ser Lys Ile Tyr Ala Gln Asn Asn Val Ile Asp Val Pro Gly Leu Ser
340 345 350
gct gct aaa acg atc agc gta ttc agc ggg gga acg gct tta tat gac 1104
Ala Ala Lys Thr Ile Ser Val Phe Ser Gly Gly Thr Ala Leu Tyr Asp
355 360 365
tcc ggc acg ttg ctg aac ggc aca cag atc aac gca tcg gct gca aac 1152
Ser Gly Thr Leu Leu Asn Gly Thr Gln Ile Asn Ala Ser Ala Ala Asn
370 375 380
ggg ctg agc tct tct gtc ggc tgg acg ccg tct ctg cat gga tcg att 1200
Gly Leu Ser Ser Ser Val Gly Trp Thr Pro Ser Leu His Gly Ser Ile
385 390 395 400
gat gct tct gct aat gtg aaa tca aat gtt ata aat caa gcg ggt gcg 1248
Asp Ala Ser Ala Asn Val Lys Ser Asn Val Ile Asn Gln Ala Gly Ala
405 410 415
ggt aaa tta aat 1260
Gly Lys Leu Asn
420
<210> 87
<211> 420
<212> PRT
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 87
Met Lys Lys Val Met Leu Ala Thr Ala Leu Phe Leu Gly Leu Thr Pro
1 5 10 15
Ala Gly Ala Asn Ala Ala Asp Leu Gly His Gln Thr Leu Gly Ser Asn
20 25 30
Asp Gly Trp Gly Ala Tyr Ser Thr Gly Thr Thr Gly Gly Ser Lys Ala
35 40 45
Ser Ser Ser Asn Val Tyr Thr Val Ser Asn Arg Asn Gln Leu Val Ser
50 55 60
Ala Leu Gly Lys Glu Thr Asn Thr Thr Pro Lys Ile Ile Tyr Ile Lys
65 70 75 80
Gly Thr Ile Asp Met Asn Val Asp Asp Asn Leu Lys Pro Leu Gly Leu
85 90 95
Asn Asp Tyr Lys Asp Pro Glu Tyr Asp Leu Asp Lys Tyr Leu Lys Ala
100 105 110
Tyr Asp Pro Ser Thr Trp Gly Lys Lys Glu Pro Ser Gly Thr Gln Glu
115 120 125
Glu Ala Arg Ala Arg Ser Gln Lys Asn Gln Lys Ala Arg Val Met Val
130 135 140
Asp Ile Pro Ala Asn Thr Thr Ile Val Gly Ser Gly Thr Asn Ala Lys
145 150 155 160
Val Val Gly Gly Asn Phe Gln Ile Lys Ser Asp Asn Val Ile Ile Arg
165 170 175
Asn Ile Glu Phe Gln Asp Ala Tyr Asp Tyr Phe Pro Gln Trp Asp Pro
180 185 190
Thr Asp Gly Ser Ser Gly Asn Trp Asn Ser Gln Tyr Asp Asn Ile Thr
195 200 205
Ile Asn Gly Gly Thr His Ile Trp Ile Asp His Cys Thr Phe Asn Asp
210 215 220
Gly Ser Arg Pro Asp Ser Thr Ser Pro Lys Tyr Tyr Gly Arg Lys Tyr
225 230 235 240
Gln His His Asp Gly Gln Thr Asp Ala Ser Asn Gly Ala Asn Tyr Ile
245 250 255
Thr Met Ser Tyr Asn Tyr Tyr His Asp His Asp Lys Ser Ser Ile Phe
260 265 270
Gly Ser Ser Asp Ser Lys Thr Ser Asp Asp Gly Lys Leu Lys Ile Thr
275 280 285
Leu His His Asn Arg Tyr Lys Asn Ile Val Gln Arg Ala Pro Arg Val
290 295 300
Arg Phe Gly Gln Val His Val Tyr Asn Asn Tyr Tyr Glu Gly Ser Thr
305 310 315 320
Ser Ser Ser Ser Tyr Pro Phe Ser Tyr Ala Trp Gly Ile Gly Lys Ser
325 330 335
Ser Lys Ile Tyr Ala Gln Asn Asn Val Ile Asp Val Pro Gly Leu Ser
340 345 350
Ala Ala Lys Thr Ile Ser Val Phe Ser Gly Gly Thr Ala Leu Tyr Asp
355 360 365
Ser Gly Thr Leu Leu Asn Gly Thr Gln Ile Asn Ala Ser Ala Ala Asn
370 375 380
Gly Leu Ser Ser Ser Val Gly Trp Thr Pro Ser Leu His Gly Ser Ile
385 390 395 400
Asp Ala Ser Ala Asn Val Lys Ser Asn Val Ile Asn Gln Ala Gly Ala
405 410 415
Gly Lys Leu Asn
420
<210> 88
<211> 26
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 88
actagtaatg atggctgggg cgcgta 26
<210> 89
<211> 26
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 89
gtcgacatgt tgtcgtattg tgagtt 26
<210> 90
<211> 52
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 90
gagctctaca acgcttatgg atccgcggcc gcggcggcac acacatctgg at 52
<210> 91
<211> 26
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 91
gacgtcagcc cgtttgcagc cgatgc 26
<210> 92
<211> 1257
<212> DNA
<213> 酿脓链球菌(Streptococcus pyogenes)
<220>
<221> CDS
<222> (1)..(1257)
<223>
<400> 92
gtg cct att ttt aaa aaa act tta att gtt tta tcc ttt att ttt ttg 48
Val Pro Ile Phe Lys Lys Thr Leu Ile Val Leu Ser Phe Ile Phe Leu
1 5 10 15
ata tct atc ttg att tat cta aat atg tat cta ttt gga aca tca act 96
Ile Ser Ile Leu Ile Tyr Leu Asn Met Tyr Leu Phe Gly Thr Ser Thr
20 25 30
gta gga att tat gga gta ata tta ata acc tat cta gtt att aaa ctt 144
Val Gly Ile Tyr Gly Val Ile Leu Ile Thr Tyr Leu Val Ile Lys Leu
35 40 45
gga tta tct ttc ctt tat gag cca ttt aaa gga aag cca cat gac tat 192
Gly Leu Ser Phe Leu Tyr Glu Pro Phe Lys Gly Lys Pro His Asp Tyr
50 55 60
aaa gtt gct gct gta att cct tct tat aat gaa gat gcc gag tca tta 240
Lys Val Ala Ala Val Ile Pro Ser Tyr Asn Glu Asp Ala Glu Ser Leu
65 70 75 80
tta gaa act ctt aaa agt gtg tta gca cag acc tat ccg tta tca gaa 288
Leu Glu Thr Leu Lys Ser Val Leu Ala Gln Thr Tyr Pro Leu Ser Glu
85 90 95
att tat att gtt gat gat ggg agt tca aac aca gat gca ata caa tta 336
Ile Tyr Ile Val Asp Asp Gly Ser Ser Asn Thr Asp Ala Ile Gln Leu
100 105 110
att gaa gag tat gta aat aga gaa gtg gat att tgt cga aac gtt atc 384
Ile Glu Glu Tyr Val Asn Arg Glu Val Asp Ile Cys Arg Asn Val Ile
115 120 125
gtt cac cgt tcc ctt gtc aat aaa gga aaa cgc cat gct caa gcg tgg 432
Val His Arg Ser Leu Val Asn Lys Gly Lys Arg His Ala Gln Ala Trp
130 135 140
gca ttt gaa aga tct gac gct gac gtt ttt tta acc gta gat tca gat 480
Ala Phe Glu Arg Ser Asp Ala Asp Val Phe Leu Thr Val Asp Ser Asp
145 150 155 160
act tat atc tat cca aat gcc tta gaa gaa ctc cta aaa agc ttc aat 528
Thr Tyr Ile Tyr Pro Asn Ala Leu Glu Glu Leu Leu Lys Ser Phe Asn
165 170 175
gat gag aca gtt tat gct gca aca gga cat ttg aat gct aga aac aga 576
Asp Glu Thr Val Tyr Ala Ala Thr Gly His Leu Asn Ala Arg Asn Arg
180 185 190
caa act aat cta tta acg cga ctt aca gat atc cgt tac gat aat gcc 624
Gln Thr Asn Leu Leu Thr Arg Leu Thr Asp Ile Arg Tyr Asp Asn Ala
195 200 205
ttt ggg gtg gag cgt gct gct caa tca tta aca ggt aat att tta gtt 672
Phe Gly Val Glu Arg Ala Ala Gln Ser Leu Thr Gly Asn Ile Leu Val
210 215 220
tgc tca gga cca ttg agt att tat cga cgt gaa gtg att att cct aac 720
Cys Ser Gly Pro Leu Ser Ile Tyr Arg Arg Glu Val Ile Ile Pro Asn
225 230 235 240
tta gag cgc tat aaa aat caa aca ttc cta ggt tta cct gtt agc att 768
Leu Glu Arg Tyr Lys Asn Gln Thr Phe Leu Gly Leu Pro Val Ser Ile
245 250 255
ggg gat gat cga tgt tta aca aat tat gct att gat tta gga cgc act 816
Gly Asp Asp Arg Cys Leu Thr Asn Tyr Ala Ile Asp Leu Gly Arg Thr
260 265 270
gtc tac caa tca aca gct aga tgt gat act gat gta cct ttc caa tta 864
Val Tyr Gln Ser Thr Ala Arg Cys Asp Thr Asp Val Pro Phe Gln Leu
275 280 285
aaa agt tat tta aag caa caa aat cga tgg aat aaa tct ttt ttt aaa 912
Lys Ser Tyr Leu Lys Gln Gln Asn Arg Trp Asn Lys Ser Phe Phe Lys
290 295 300
gaa tct att att tct gtt aaa aaa att ctt tct aat ccc atc gtt gcc 960
Glu Ser Ile Ile Ser Val Lys Lys Ile Leu Ser Asn Pro Ile Val Ala
305 310 315 320
tta tgg act att ttc gaa gtc gtt atg ttt atg atg ttg att gtc gca 1008
Leu Trp Thr Ile Phe Glu Val Val Met Phe Met Met Leu Ile Val Ala
325 330 335
att ggg aat ctt ttg ttt aat caa gct att caa tta gac ctt att aaa 1056
Ile Gly Asn Leu Leu Phe Asn Gln Ala Ile Gln Leu Asp Leu Ile Lys
340 345 350
ctt ttt gcc ttt tta tcc atc atc ttt atc gtt gct tta tgt cgt aat 1104
Leu Phe Ala Phe Leu Ser Ile Ile Phe Ile Val Ala Leu Cys Arg Asn
355 360 365
gtt cat tat atg atc aaa cat cct gct agt ttt ttg tta tct cct ctg 1152
Val His Tyr Met Ile Lys His Pro Ala Ser Phe Leu Leu Ser Pro Leu
370 375 380
tat gga ata tta cac ttg ttt gtc tta cag ccc cta aaa ctt tat tct 1200
Tyr Gly Ile Leu His Leu Phe Val Leu Gln Pro Leu Lys Leu Tyr Ser
385 390 395 400
tta tgc acc att aaa aat acg gaa tgg gga aca cgt aaa aag gtc act 1248
Leu Cys Thr Ile Lys Asn Thr Glu Trp Gly Thr Arg Lys Lys Val Thr
405 410 415
att ttt aaa 1257
Ile Phe Lys
<210> 93
<211> 419
<212> PRT
<213> 酿脓链球菌(Streptococcus pyogenes)
<400> 93
Val Pro Ile Phe Lys Lys Thr Leu Ile Val Leu Ser Phe Ile Phe Leu
1 5 10 15
Ile Ser Ile Leu Ile Tyr Leu Asn Met Tyr Leu Phe Gly Thr Ser Thr
20 25 30
Val Gly Ile Tyr Gly Val Ile Leu Ile Thr Tyr Leu Val Ile Lys Leu
35 40 45
Gly Leu Ser Phe Leu Tyr Glu Pro Phe Lys Gly Lys Pro His Asp Tyr
50 55 60
Lys Val Ala Ala Val Ile Pro Ser Tyr Asn Glu Asp Ala Glu Ser Leu
65 70 75 80
Leu Glu Thr Leu Lys Ser Val Leu Ala Gln Thr Tyr Pro Leu Ser Glu
85 90 95
Ile Tyr Ile Val Asp Asp Gly Ser Ser Asn Thr Asp Ala Ile Gln Leu
100 105 110
Ile Glu Glu Tyr Val Asn Arg Glu Val Asp Ile Cys Arg Asn Val Ile
115 120 125
Val His Arg Ser Leu Val Asn Lys Gly Lys Arg His Ala Gln Ala Trp
130 135 140
Ala Phe Glu Arg Ser Asp Ala Asp Val Phe Leu Thr Val Asp Ser Asp
145 150 155 160
Thr Tyr Ile Tyr Pro Asn Ala Leu Glu Glu Leu Leu Lys Ser Phe Asn
165 170 175
Asp Glu Thr Val Tyr Ala Ala Thr Gly His Leu Asn Ala Arg Asn Arg
180 185 190
Gln Thr Asn Leu Leu Thr Arg Leu Thr Asp Ile Arg Tyr Asp Asn Ala
195 200 205
Phe Gly Val Glu Arg Ala Ala Gln Ser Leu Thr Gly Asn Ile Leu Val
210 215 220
Cys Ser Gly Pro Leu Ser Ile Tyr Arg Arg Glu Val Ile Ile Pro Asn
225 230 235 240
Leu Glu Arg Tyr Lys Asn Gln Thr Phe Leu Gly Leu Pro Val Ser Ile
245 250 255
Gly Asp Asp Arg Cys Leu Thr Asn Tyr Ala Ile Asp Leu Gly Arg Thr
260 265 270
Val Tyr Gln Ser Thr Ala Arg Cys Asp Thr Asp Val Pro Phe Gln Leu
275 280 285
Lys Ser Tyr Leu Lys Gln Gln Asn Arg Trp Asn Lys Ser Phe Phe Lys
290 295 300
Glu Ser Ile Ile Ser Val Lys Lys Ile Leu Ser Asn Pro Ile Val Ala
305 310 315 320
Leu Trp Thr Ile Phe Glu Val Val Met Phe Met Met Leu Ile Val Ala
325 330 335
Ile Gly Asn Leu Leu Phe Asn Gln Ala Ile Gln Leu Asp Leu Ile Lys
340 345 350
Leu Phe Ala Phe Leu Ser Ile Ile Phe Ile Val Ala Leu Cys Arg Asn
355 360 365
Val His Tyr Met Ile Lys His Pro Ala Ser Phe Leu Leu Ser Pro Leu
370 375 380
Tyr Gly Ile Leu His Leu Phe Val Leu Gln Pro Leu Lys Leu Tyr Ser
385 390 395 400
Leu Cys Thr Ile Lys Asn Thr Glu Trp Gly Thr Arg Lys Lys Val Thr
405 410 415
Ile Phe Lys
<210> 94
<211> 2916
<212> DNA
<213> 出血败血性巴斯德菌(Paseurella multocida)
<220>
<221> CDS
<222> (1)..(2916)
<223>
<400> 94
atg aat aca tta tca caa gca ata aaa gca tat aac agc aat gac tat 48
Met Asn Thr Leu Ser Gln Ala Ile Lys Ala Tyr Asn Ser Asn Asp Tyr
1 5 10 15
caa tta gca ctc aaa tta ttt gaa aag tcg gcg gaa atc tat gga cgg 96
Gln Leu Ala Leu Lys Leu Phe Glu Lys Ser Ala Glu Ile Tyr Gly Arg
20 25 30
asa att gtt gaa ttt caa att acc aaa tgc caa gaa aaa ctc tca gca 144
Lys Ile Val Glu Phe Gln Ile Thr Lys Cys Gln Glu Lys Leu Ser Ala
35 40 45
cat cct tct gtt aat tca gca cat ctt tct gta aat aaa gaa gaa aaa 192
His Pro Ser Val Asn Ser Ala His Leu Ser Val Asn Lys Glu Glu Lys
50 55 60
gtc aat gtt tgc gat agt ccg tta gat att gca aca caa ctg tta ctt 240
Val Asn Val Cys Asp Ser Pro Leu Asp Ile Ala Thr Gln Leu Leu Leu
65 70 75 80
tcc aac gta aaa aaa tta gta ctt tct gac tcg gaa aaa aac acg tta 288
Ser Asn Val Lys Lys Leu Val Leu Ser Asp Ser Glu Lys Asn Thr Leu
85 90 95
aaa aat aaa tgg aaa ttg ctc act gag aag aaa tct gaa aat gcg gag 336
Lys Asn Lys Trp Lys Leu Leu Thr Glu Lys Lys Ser Glu Asn Ala Glu
100 105 110
gta aga gcg gtc gcc ctt gta cca aaa gat ttt ccc aaa gat ctg gtt 384
Val Arg Ala Val Ala Leu Val Pro Lys Asp Phe Pro Lys Asp Leu Val
115 120 125
tta gcg cct tta cct gat cat gtt aat gat ttt aca tgg tac aaa aag 432
Leu Ala Pro Leu Pro Asp His Val Asn Asp Phe Thr Trp Tyr Lys Lys
130 135 140
cga aag aaa aga ctt ggc ata aaa cct gaa cat caa cat gtt ggt ctt 480
Arg Lys Lys Arg Leu Gly Ile Lys Pro Glu His Gln His Val Gly Leu
145 150 155 160
tct att atc gtt aca aca ttc aat cga cca gca att tta tcg att aca 528
Ser Ile Ile Val Thr Thr Phe Asn Arg Pro Ala Ile Leu Ser Ile Thr
165 170 175
tta gcc tgt tta gta aac caa aaa aca cat tac ccg ttt gaa gtt atc 576
Leu Ala Cys Leu Val Asn Gln Lys Thr His Tyr Pro Phe Glu Val Ile
180 185 190
gtg aca gat gat ggt agt cag gaa gat cta tca ccg atc att cgc caa 624
Val Thr Asp Asp Gly Ser Gln Glu Asp Leu Ser Pro Ile Ile Arg Gln
195 200 205
tat gaa aat aaa ttg gat att cgc tac gtc aga caa aaa gat aac ggt 672
Tyr Glu Asn Lys Leu Asp Ile Arg Tyr Val Arg Gln Lys Asp Asn Gly
210 215 220
ttt caa gcc agt gcc gct cgg aat atg gga tta cgc tta gca aaa tat 720
Phe Gln Ala Ser Ala Ala Arg Asn Met Gly Leu Arg Leu Ala Lys Tyr
225 230 235 240
gac ttt att ggc tta ctc gac tgt gat atg gcg cca aat cca tta tgg 768
Asp Phe Ile Gly Leu Leu Asp Cys Asp Met Ala Pro Asn Pro Leu Trp
245 250 255
gtt cat tct tat gtt gca gag cta tta gaa gat gat gat tta aca atc 816
Val His Ser Tyr Val Ala Glu Leu Leu Glu Asp Asp Asp Leu Thr Ile
260 265 270
att ggt cca aga aaa tac atc gat aca caa cat att gac cca aaa gac 864
Ile Gly Pro Arg Lys Tyr Ile Asp Thr Gln His Ile Asp Pro Lys Asp
275 280 285
ttc tta aat aac gcg agt ttg ctt gaa tca tta cca gaa gtg aaa acc 912
Phe Leu Asn Asn Ala Ser Leu Leu Glu Ser Leu Pro Glu Val Lys Thr
290 295 300
aat aat agt gtt gcc gca aaa ggg gaa gga aca gtt tct ctg gat tgg 960
Asn Asn Ser Val Ala Ala Lys Gly Glu Gly Thr Val Ser Leu Asp Trp
305 310 315 320
cgc tta gaa caa ttc gaa aaa aca gaa aat ctc cgc tta tcc gat tcg 1008
Arg Leu Glu Gln Phe Glu Lys Thr Glu Asn Leu Arg Leu Ser Asp Ser
325 330 335
cct ttc cgt ttt ttt gcg gcg ggt aat gtt gct ttc gct aaa aaa tgg 1056
Pro Phe Arg Phe Phe Ala Ala Gly Asn Val Ala Phe Ala Lys Lys Trp
340 345 350
cta aat aaa tcc ggt ttc ttt gat gag gaa ttt aat cac tgg ggt gga 1104
Leu Asn Lys Ser Gly Phe Phe Asp Glu Glu Phe Asn His Trp Gly Gly
355 360 365
gaa gat gtg gaa ttt gga tat cgc tta ttc cgt tac ggt agt ttc ttt 1152
Glu Asp Val Glu Phe Gly Tyr Arg Leu Phe Arg Tyr Gly Ser Phe Phe
370 375 380
aaa act att gat ggc att atg gcc tac cat caa gag cca cca ggt aaa 1200
Lys Thr Ile Asp Gly Ile Met Ala Tyr His Gln Glu Pro Pro Gly Lys
385 390 395 400
gaa aat gaa acc gat cgt gaa gcg gga aaa aat att acg ctc gat att 1248
Glu Asn Glu Thr Asp Arg Glu Ala Gly Lys Asn Ile Thr Leu Asp Ile
405 410 415
atg aga gaa aag gtc cct tat atc tat aga aaa ctt tta cca ata gaa 1296
Met Arg Glu Lys Val Pro Tyr Ile Tyr Arg Lys Leu Leu Pro Ile Glu
420 425 430
gat tcg cat atc aat aga gta cct tta gtt tca att tat atc cca gct 1344
Asp Ser His Ile Asn Arg Val Pro Leu Val Ser Ile Tyr Ile Pro Ala
435 440 445
tat aac tgt gca aac tat att caa cgt tgc gta gat agt gca ctg aat 1392
Tyr Asn Cys Ala Asn Tyr Ile Gln Arg Cys Val Asp Ser Ala Leu Asn
450 455 460
cag act gtt gtt gat ctc gag gtt tgt att tgt aac gat ggt tca aca 1440
Gln Thr Val Val Asp Leu Glu Val Cys Ile Cys Asn Asp Gly Ser Thr
465 470 475 480
gat aat acc tta gaa gtg atc aat aag ctt tat ggt aat aat cct agg 1488
Asp Asn Thr Leu Glu Val Ile Asn Lys Leu Tyr Gly Asn Asn Pro Arg
485 490 495
gta cgc atc atg tct aaa cca aat ggc gga ata gcc tca gca tca aat 1536
Val Arg Ile Met Ser Lys Pro Asn Gly Gly Ile Ala Ser Ala Ser Asn
500 505 510
gca gcc gtt tct ttt gct aaa ggt tat tac att ggg cag tta gat tca 1584
Ala Ala Val Ser Phe Ala Lys Gly Tyr Tyr Ile Gly Gln Leu Asp Ser
515 520 525
gat gat tat ctt gag cct gat gca gtt gaa ctg tgt tta aaa gaa ttt 1632
Asp Asp Tyr Leu Glu Pro Asp Ala Val Glu Leu Cys Leu Lys Glu Phe
530 535 540
tta aaa gat aaa acg cta gct tgt gtt tat acc act aat aga aac gtc 1680
Leu Lys Asp Lys Thr Leu Ala Cys Val Tyr Thr Thr Asn Arg Asn Val
545 550 555 560
aat ccg gat ggt agc tta atc gct aat ggt tac aat tgg cca gaa ttt 1728
Asn Pro Asp Gly Ser Leu Ile Ala Asn Gly Tyr Asn Trp Pro Glu Phe
565 570 575
tca cga gaa aaa ctc aca acg gct atg att gct cac cac ttt aga atg 1776
Ser Arg Glu Lys Leu Thr Thr Ala Met Ile Ala His His Phe Arg Met
580 585 590
ttc acg att aga gct tgg cat tta act gat gga ttc aat gaa aaa att 1824
Phe Thr Ile Arg Ala Trp His Leu Thr Asp Gly Phe Asn Glu Lys Ile
595 600 605
gaa aat gcc gta gac tat gac atg ttc ctc aaa ctc agt gaa gtt gga 1872
Glu Asn Ala Val Asp Tyr Asp Met Phe Leu Lys Leu Ser Glu Val Gly
610 615 620
aaa ttt aaa cat ctt aat aaa atc tgc tat aac cgt gta tta cat ggt 1920
Lys Phe Lys His Leu Asn Lys Ile Cys Tyr Asn Arg Val Leu His Gly
625 630 635 640
gat aac aca tca att aag aaa ctt ggc att caa aag aaa aac cat ttt 1968
Asp Asn Thr Ser Ile Lys Lys Leu Gly Ile Gln Lys Lys Asn His Phe
645 650 655
gtt gta gtc aat cag tca tta aat aga caa ggc ata act tat tat aat 2016
Val Val Val Asn Gln Ser Leu Asn Arg Gln Gly Ile Thr Tyr Tyr Asn
660 665 670
tat gac gaa ttt gat gat tta gat gaa agt aga aag tat att ttc aat 2064
Tyr Asp Glu Phe Asp Asp Leu Asp Glu Ser Arg Lys Tyr Ile Phe Asn
675 680 685
aaa acc gct gaa tat caa gaa gag att gat atc tta aaa gat att aaa 2112
Lys Thr Ala Glu Tyr Gln Glu Glu Ile Asp Ile Leu Lys Asp Ile Lys
690 695 700
atc atc cag aat aaa gat gcc aaa atc gca gtc agt att ttt tat ccc 2160
Ile Ile Gln Asn Lys Asp Ala Lys Ile Ala Val Ser Ile Phe Tyr Pro
705 710 715 720
aat aca tta aac ggc tta gtg aaa aaa cta aac aat att att gaa tat 2208
Asn Thr Leu Asn Gly Leu Val Lys Lys Leu Asn Asn Ile Ile Glu Tyr
725 730 735
aat aaa aat ata ttc gtt att gtt cta cat gtt gat aag aat cat ctt 2256
Asn Lys Asn Ile Phe Val Ile Val Leu His Val Asp Lys Asn His Leu
740 745 750
aca cca gat atc aaa aaa gaa ata cta gcc ttc tat cat aaa cat caa 2304
Thr Pro Asp Ile Lys Lys Glu Ile Leu Ala Phe Tyr His Lys His Gln
755 760 765
gtg aat att tta cta aat aat gat atc tca tat tac acg agt aat aga 2352
Val Asn Ile Leu Leu Asn Asn Asp Ile Ser Tyr Tyr Thr Ser Asn Arg
770 775 780
tta ata aaa act gag gcg cat tta agt aat att aat aaa tta agt cag 2400
Leu Ile Lys Thr Glu Ala His Leu Ser Asn Ile Asn Lys Leu Ser Gln
785 790 795 800
tta aat cta aat tgt gaa tac atc att ttt gat aat cat gac agc cta 2448
Leu Asn Leu Asn Cys Glu Tyr Ile Ile Phe Asp Asn His Asp Ser Leu
805 810 815
ttc gtt aaa aat gac agc tat gct tat atg aaa aaa tat gat gtc ggc 2496
Phe Val Lys Asn Asp Ser Tyr Ala Tyr Met Lys Lys Tyr Asp Val Gly
820 825 830
atg aat ttc tca gca tta aca cat gat tgg atc gag aaa atc aat gcg 2544
Met Asn Phe Ser Ala Leu Thr His Asp Trp Ile Glu Lys Ile Asn Ala
835 840 845
cat cca cca ttt aaa aag ctc att aaa act tat ttt aat gac aat gac 2592
His Pro Pro Phe Lys Lys Leu Ile Lys Thr Tyr Phe Asn Asp Asn Asp
850 855 860
tta aaa agt atg aat gtg aaa ggg gca tca caa ggt atg ttt atg acg 2640
Leu Lys Ser Met Asn Val Lys Gly Ala Ser Gln Gly Met Phe Met Thr
865 870 875 880
tat gcg cta gcg cat gag ctt ctg acg att att aaa gaa gtc atc aca 2688
Tyr Ala Leu Ala His Glu Leu Leu Thr Ile Ile Lys Glu Val Ile Thr
885 890 895
tct tgc cag tca att gat agt gtg cca gaa tat aac act gag gat att 2736
Ser Cys Gln Ser Ile Asp Ser Val Pro Glu Tyr Asn Thr Glu Asp Ile
900 905 910
tgg ttc caa ttt gca ctt tta atc tta gaa aag aaa acc ggc cat gta 2784
Trp Phe Gln Phe Ala Leu Leu Ile Leu Glu Lys Lys Thr Gly His Val
915 920 925
ttt aat aaa aca tcg acc ctg act tat atg cct tgg gaa cga aaa tta 2832
Phe Asn Lys Thr Ser Thr Leu Thr Tyr Met Pro Trp Glu Arg Lys Leu
930 935 940
caa tgg aca aat gaa caa att gaa agt gca aaa aga gga gaa aat ata 2880
Gln Trp Thr Asn Glu Gln Ile Glu Ser Ala Lys Arg Gly Glu Asn Ile
945 950 955 960
cct gtt aac aag ttc att att aat agt ata act cta 2916
Pro Val Asn Lys Phe Ile Ile Asn Ser Ile Thr Leu
965 970
<210> 95
<211> 972
<212> PRT
<213> 出血败血性巴斯德菌(Paseurella multocida)
<400> 95
Met Asn Thr Leu Ser Gln Ala Ile Lys Ala Tyr Asn Ser Asn Asp Tyr
1 5 10 15
Gln Leu Ala Leu Lys Leu Phe Glu Lys Ser Ala Glu Ile Tyr Gly Arg
20 25 30
Lys Ile Val Glu Phe Gln Ile Thr Lys Cys Gln Glu Lys Leu Ser Ala
35 40 45
His Pro Ser Val Asn Ser Ala His Leu Ser Val Asn Lys Glu Glu Lys
50 55 60
Val Asn Val Cys Asp Ser Pro Leu Asp Ile Ala Thr Gln Leu Leu Leu
65 70 75 80
Ser Asn Val Lys Lys Leu Val Leu Ser Asp Ser Glu Lys Asn Thr Leu
85 90 95
Lys Asn Lys Trp Lys Leu Leu Thr Glu Lys Lys Ser Glu Asn Ala Glu
100 105 110
Val Arg Ala Val Ala Leu Val Pro Lys Asp Phe Pro Lys Asp Leu Val
115 120 125
Leu Ala Pro Leu Pro Asp His Val Asn Asp Phe Thr Trp Tyr Lys Lys
130 135 140
Arg Lys Lys Arg Leu Gly Ile Lys Pro Glu His Gln His Val Gly Leu
145 150 155 160
Ser Ile Ile Val Thr Thr Phe Asn Arg Pro Ala Ile Leu Ser Ile Thr
165 170 175
Leu Ala Cys Leu Val Asn Gln Lys Thr His Tyr Pro Phe Glu Val Ile
180 185 190
Val Thr Asp Asp Gly Ser Gln Glu Asp Leu Ser Pro Ile Ile Arg Gln
195 200 205
Tyr Glu Asn Lys Leu Asp Ile Arg Tyr Val Arg Gln Lys Asp Asn Gly
210 215 220
Phe Gln Ala Ser Ala Ala Arg Asn Met Gly Leu Arg Leu Ala Lys Tyr
225 230 235 240
Asp Phe Ile Gly Leu Leu Asp Cys Asp Met Ala Pro Asn Pro Leu Trp
245 250 255
Val His Ser Tyr Val Ala Glu Leu Leu Glu Asp Asp Asp Leu Thr Ile
260 265 270
Ile Gly Pro Arg Lys Tyr Ile Asp Thr Gln His Ile Asp Pro Lys Asp
275 280 285
Phe Leu Asn Asn Ala Ser Leu Leu Glu Ser Leu Pro Glu Val Lys Thr
290 295 300
Asn Asn Ser Val Ala Ala Lys Gly Glu Gly Thr Val Ser Leu Asp Trp
305 310 315 320
Arg Leu Glu Gln Phe Glu Lys Thr Glu Asn Leu Arg Leu Ser Asp Ser
325 330 335
Pro Phe Arg Phe Phe Ala Ala Gly Asn Val Ala Phe Ala Lys Lys Trp
340 345 350
Leu Asn Lys Ser Gly Phe Phe Asp Glu Glu Phe Asn His Trp Gly Gly
355 360 365
Glu Asp Val Glu Phe Gly Tyr Arg Leu Phe Arg Tyr Gly Ser Phe Phe
370 375 380
Lys Thr Ile Asp Gly Ile Met Ala Tyr His Gln Glu Pro Pro Gly Lys
385 390 395 400
Glu Asn Glu Thr Asp Arg Glu Ala Gly Lys Asn Ile Thr Leu Asp Ile
405 410 415
Met Arg Glu Lys Val Pro Tyr Ile Tyr Arg Lys Leu Leu Pro Ile Glu
420 425 430
Asp Ser His Ile Asn Arg Val Pro Leu Val Ser Ile Tyr Ile Pro Ala
435 440 445
Tyr Asn Cys Ala Asn Tyr Ile Gln Arg Cys Val Asp Ser Ala Leu Asn
450 455 460
Gln Thr Val Val Asp Leu Glu Val Cys Ile Cys Asn Asp Gly Ser Thr
465 470 475 480
Asp Asn Thr Leu Glu Val Ile Asn Lys Leu Tyr Gly Asn Asn Pro Arg
485 490 495
Val Arg Ile Met Ser Lys Pro Asn Gly Gly Ile Ala Ser Ala Ser Asn
500 505 510
Ala Ala Val Ser Phe Ala Lys Gly Tyr Tyr Ile Gly Gln Leu Asp Ser
515 520 525
Asp Asp Tyr Leu Glu Pro Asp Ala Val Glu Leu Cys Leu Lys Glu Phe
530 535 540
Leu Lys Asp Lys Thr Leu Ala Cys Val Tyr Thr Thr Asn Arg Asn Val
545 550 555 560
Asn Pro Asp Gly Ser Leu Ile Ala Asn Gly Tyr Asn Trp Pro Glu Phe
565 570 575
Ser Arg Glu Lys Leu Thr Thr Ala Met Ile Ala His His Phe Arg Met
580 585 590
Phe Thr Ile Arg Ala Trp His Leu Thr Asp Gly Phe Asn Glu Lys Ile
595 600 605
Glu Asn Ala Val Asp Tyr Asp Met Phe Leu Lys Leu Ser Glu Val Gly
610 615 620
Lys Phe Lys His Leu Asn Lys Ile Cys Tyr Asn Arg Val Leu His Gly
625 630 635 640
Asp Asn Thr Ser Ile Lys Lys Leu Gly Ile Gln Lys Lys Asn His Phe
645 650 655
Val Val Val Asn Gln Ser Leu Asn Arg Gln Gly Ile Thr Tyr Tyr Asn
660 665 670
Tyr Asp Glu Phe Asp Asp Leu Asp Glu Ser Arg Lys Tyr Ile Phe Asn
675 680 685
Lys Thr Ala Glu Tyr Gln Glu Glu Ile Asp Ile Leu Lys Asp Ile Lys
690 695 700
Ile Ile Gln Asn Lys Asp Ala Lys Ile Ala Val Ser Ile Phe Tyr Pro
705 710 715 720
Asn Thr Leu Asn Gly Leu Val Lys Lys Leu Asn Asn Ile Ile Glu Tyr
725 730 735
Asn Lys Asn Ile Phe Val Ile Val Leu His Val Asp Lys Asn His Leu
740 745 750
Thr Pro Asp Ile Lys Lys Glu Ile Leu Ala Phe Tyr His Lys His Gln
755 760 765
Val Asn Ile Leu Leu Asn Asn Asp Ile Ser Tyr Tyr Thr Ser Asn Arg
770 775 780
Leu Ile Lys Thr Glu Ala His Leu Ser Asn Ile Asn Lys Leu Ser Gln
785 790 795 800
Leu Asn Leu Asn Cys Glu Tyr Ile Ile Phe Asp Asn His Asp Ser Leu
805 810 815
Phe Val Lys Asn Asp Ser Tyr Ala Tyr Met Lys Lys Tyr Asp Val Gly
820 825 830
Met Asn Phe Ser Ala Leu Thr His Asp Trp Ile Glu Lys Ile Asn Ala
835 840 845
His Pro Pro Phe Lys Lys Leu Ile Lys Thr Tyr Phe Asn Asp Asn Asp
850 855 860
Leu Lys Ser Met Asn Val Lys Gly Ala Ser Gln Gly Met Phe Met Thr
865 870 875 880
Tyr Ala Leu Ala His Glu Leu Leu Thr Ile Ile Lys Glu Val Ile Thr
885 890 895
Ser Cys Gln Ser Ile Asp Ser Val Pro Glu Tyr Asn Thr Glu Asp Ile
900 905 910
Trp Phe Gln Phe Ala Leu Leu Ile Leu Glu Lys Lys Thr Gly His Val
915 920 925
Phe Asn Lys Thr Ser Thr Leu Thr Tyr Met Pro Trp Glu Arg Lys Leu
930 935 940
Gln Trp Thr Asn Glu Gln Ile Glu Ser Ala Lys Arg Gly Glu Asn Ile
945 950 955 960
Pro Val Asn Lys Phe Ile Ile Asn Ser Ile Thr Leu
965 970
<210> 96
<211> 1206
<212> DNA
<213> 酿脓链球菌(Streptococcus pyogenes)
<220>
<221> CDS
<222> (1)..(1206)
<223>
<400> 96
atg aaa ata gca gtt gct gga tca gga tat gtt gga tta tca cta gga 48
Met Lys Ile Ala Val Ala Gly Ser Gly Tyr Val Gly Leu Ser Leu Gly
1 5 10 15
gtt ctt tta tca ctt caa aac gaa gtc act att gtt gat att ctt ccc 96
Val Leu Leu Ser Leu Gln Asn Glu Val Thr Ile Val Asp Ile Leu Pro
20 25 30
tct aaa gtt gat aag att aat aat ggc tta tca cca att caa gat gaa 144
Ser Lys Val Asp Lys Ile Asn Asn Gly Leu Ser Pro Ile Gln Asp Glu
35 40 45
tat att gaa tat tac tta aaa agt aag caa tta tct att aaa gca act 192
Tyr Ile Glu Tyr Tyr Leu Lys Ser Lys Gln Leu Ser Ile Lys Ala Thr
50 55 60
tta gat agc aaa gca gct tat aaa gaa gcg gaa ctg gtc att att gcc 240
Leu Asp Ser Lys Ala Ala Tyr Lys Glu Ala Glu Leu Val Ile Ile Ala
65 70 75 80
aca cct aca aat tac aac agt aga att aat tat ttt gat aca cag cat 288
Thr Pro Thr Asn Tyr Asn Ser Arg Ile Asn Tyr Phe Asp Thr Gln His
85 90 95
gtt gaa aca gtt atc aaa gag gta cta agc gtt aat agc cat gca act 336
Val Glu Thr Val Ile Lys Glu Val Leu Ser Val Asn Ser His Ala Thr
l00 105 110
ctt atc atc aaa tca aca att cca ata ggt ttc att act gaa atg aga 384
Leu Ile Ile Lys Ser Thr Ile Pro Ile Gly Phe Ile Thr Glu Met Arg
115 120 125
cag aaa ttc caa act gat cgt att atc ttc agc cct gaa ttt tta aga 432
Gln Lys Phe Gln Thr Asp Arg Ile Ile Phe Ser Pro Glu Phe Leu Arg
130 135 140
gaa tct aaa gct tta tat gac aac tta tat cca agc cga att att gtt 480
Glu Ser Lys Ala Leu Tyr Asp Asn Leu Tyr Pro Ser Arg Ile Ile Val
145 150 155 160
tct tgt gaa gaa aac gat tct cca aaa gta aag gca gac gca gaa aaa 528
Ser Cys Glu Glu Asn Asp Ser Pro Lys Val Lys Ala Asp Ala Glu Lys
165 170 175
ttt gca ctt tta tta aag tct gca gct aaa aaa aat aat gta cca gta 576
Phe Ala Leu Leu Leu Lys Ser Ala Ala Lys Lys Asn Asn Val Pro Val
180 185 190
ctt att atg gga gct tca gaa gct gaa gca gta aaa cta ttt gcc aat 624
Leu Ile Met Gly Ala Ser Glu Ala Glu Ala Val Lys Leu Phe Ala Asn
195 200 205
act tat tta gcg tta agg gta gct tat ttt aat gag tta gac act tac 672
Thr Tyr Leu Ala Leu Arg Val Ala Tyr Phe Asn Glu Leu Asp Thr Tyr
210 215 220
gca gaa tcg aga aaa tta aat agt cac atg att att caa gga att tct 720
Ala Glu Ser Arg Lys Leu Asn Ser His Met Ile Ile Gln Gly Ile Ser
225 230 235 240
tat gat gat cga ata gga atg cat tat aat aac cca tca ttt ggt tat 768
Tyr Asp Asp Arg Ile Gly Met His Tyr Asn Asn Pro Ser Phe Gly Tyr
245 250 255
gga ggt tat tgt cta cct aaa gat acg aag caa tta ttg gca aat tac 816
Gly Gly Tyr Cys Leu Pro Lys Asp Thr Lys Gln Leu Leu Ala Asn Tyr
260 265 270
aat aat att cct caa acg cta att gaa gct atc gtt tca tca aat aat 864
Asn Asn Ile Pro Gln Thr Leu Ile Glu Ala Ile Val Ser Ser Asn Asn
275 280 285
gtg cgc aag tcc tat att gct aag caa att atc aac gtc tta gaa gag 912
Val Arg Lys Ser Tyr Ile Ala Lys Gln Ile Ile Asn Val Leu Glu Glu
290 295 300
cgg gag tcc cca gta aaa gta gtc ggg gtt tac cgt tta att atg aaa 960
Arg Glu Ser Pro Val Lys Val Val Gly Val Tyr Arg Leu Ile Met Lys
305 310 315 320
agt aac tca gat aat ttt aga gaa agt gct atc aaa gat gtt att gac 1008
Ser Asn Ser Asp Asn Phe Arg Glu Ser Ala Ile Lys Asp Val Ile Asp
325 330 335
att ctt aaa agt aaa gac att aag ata att att tat gag cca atg tta 1056
Ile Leu Lys Ser Lys Asp Ile Lys Ile Ile Ile Tyr Glu Pro Met Leu
340 345 350
aac aaa ctt gaa tct gaa gat caa tct gta ctt gta aat gat tta gag 1104
Asn Lys Leu Glu Ser Glu Asp Gln Ser Val Leu Val Asn Asp Leu Glu
355 360 365
aat ttc aag aaa caa gca aat att atc gta act aat cgc tat gat aat 1152
Asn Phe Lys Lys Gln Ala Asn Ile Ile Val Thr Asn Arg Tyr Asp Asn
370 375 380
gaa tta caa gat gtt aaa aat aaa gtt tac agt aga gat att ttt aat 1200
Glu Leu Gln Asp Val Lys Asn Lys Val Tyr Ser Arg Asp Ile Phe Asn
385 390 395 400
aga gac 1206
Arg Asp
<210> 97
<211> 402
<212> PRT
<213> 酿脓链球菌(Streptococcus pyogenes)
<400> 97
Met Lys Ile Ala Val Ala Gly Ser Gly Tyr Val Gly Leu Ser Leu Gly
1 5 10 15
Val Leu Leu Ser Leu Gln Asn Glu Val Thr Ile Val Asp Ile Leu Pro
20 25 30
Ser Lys Val Asp Lys Ile Asn Asn Gly Leu Ser Pro Ile Gln Asp Glu
35 40 45
Tyr Ile Glu Tyr Tyr Leu Lys Ser Lys Gln Leu Ser Ile Lys Ala Thr
50 55 60
Leu Asp Ser Lys Ala Ala Tyr Lys Glu Ala Glu Leu Val Ile Ile Ala
65 70 75 80
Thr Pro Thr Asn Tyr Asn Ser Arg Ile Asn Tyr Phe Asp Thr Gln His
85 90 95
Val Glu Thr Val Ile Lys Glu Val Leu Ser Val Asn Ser His Ala Thr
100 105 110
Leu Ile Ile Lys Ser Thr Ile Pro Ile Gly Phe Ile Thr Glu Met Arg
115 120 125
Gln Lys Phe Gln Thr Asp Arg Ile Ile Phe Ser Pro Glu Phe Leu Arg
130 135 140
Glu Ser Lys Ala Leu Tyr Asp Asn Leu Tyr Pro Ser Arg Ile Ile Val
145 150 155 160
Ser Cys Glu Glu Asn Asp Ser Pro Lys Val Lys Ala Asp Ala Glu Lys
165 170 175
Phe Ala Leu Leu Leu Lys Ser Ala Ala Lys Lys Asn Asn Val Pro Val
180 185 190
Leu Ile Met Gly Ala Ser Glu Ala Glu Ala Val Lys Leu Phe Ala Asn
195 200 205
Thr Tyr Leu Ala Leu Arg Val Ala Tyr Phe Asn Glu Leu Asp Thr Tyr
210 215 220
Ala Glu Ser Arg Lys Leu Asn Ser His Met Ile Ile Gln Gly Ile Ser
225 230 235 240
Tyr Asp Asp Arg Ile Gly Met His Tyr Asn Asn Pro Ser Phe Gly Tyr
245 250 255
Gly Gly Tyr Cys Leu Pro Lys Asp Thr Lys Gln Leu Leu Ala Asn Tyr
260 265 270
Asn Asn Ile Pro Gln Thr Leu Ile Glu Ala Ile Val Ser Ser Asn Asn
275 280 285
Val Arg Lys Ser Tyr Ile Ala Lys Gln Ile Ile Asn Val Leu Glu Glu
290 295 300
Arg Glu Ser Pro Val Lys Val Val Gly Val Tyr Arg Leu Ile Met Lys
305 310 315 320
Ser Asn Ser Asp Asn Phe Arg Glu Ser Ala Ile Lys Asp Val Ile Asp
325 330 335
Ile Leu Lys Ser Lys Asp Ile Lys Ile Ile Ile Tyr Glu Pro Met Leu
340 345 350
Asn Lys Leu Glu Ser Glu Asp Gln Ser Val Leu Val Asn Asp Leu Glu
355 360 365
Asn Phe Lys Lys Gln Ala Asn Ile Ile Val Thr Asn Arg Tyr Asp Asn
370 375 380
Glu Leu Gln Asp Val Lys Asn Lys Val Tyr Ser Arg Asp Ile Phe Asn
385 390 395 400
Arg Asp
<210> 98
<211> 912
<212> DNA
<213> 酿脓链球菌(Streptococcus pyogenes)
<220>
<221> CDS
<222> (1)..(912)
<223>
<400> 98
atg acc aaa gtc aga aaa gcc att att cct gct gca ggt cta gga aca 48
Met Thr Lys Val Arg Lys Ala Ile Ile Pro Ala Ala Gly Leu Gly Thr
1 5 10 15
cgt ttt tta cct gct acc aaa gct ctt gcc aaa gag atg ttg ccc atc 96
Arg Phe Leu Pro Ala Thr Lys Ala Leu Ala Lys Glu Met Leu Pro Ile
20 25 30
gtt gat aaa cca acc atc cag ttt atc gtc gaa gaa gcg cta aaa tct 144
Val Asp Lys Pro Thr Ile Gln Phe Ile Val Glu Glu Ala Leu Lys Ser
35 40 45
ggc atc gag gaa atc ctt gtg gtg acc gga aaa gct aaa cgc tct atc 192
Gly Ile Glu Glu Ile Leu Val Val Thr Gly Lys Ala Lys Arg Set Ile
50 55 60
gag gac cat ttt gat tca aac ttt gaa tta gaa tac aac ctc caa gct 240
Glu Asp His Phe Asp Ser Asn Phe Glu Leu Glu Tyr Asn Leu Gln Ala
65 70 75 80
aag ggg aaa aat gaa ctg ttg aaa tta gtg gat gaa acc act gcc att 288
Lys Gly Lys Asn Glu Leu Leu Lys Leu Val Asp Glu Thr Thr Ala Ile
85 90 95
aac ctt cat ttt atc cgt caa agc cac cca aga ggg ctg gga gat gct 336
Asn Leu His Phe Ile Arg Gln Ser His Pro Arg Gly Leu Gly Asp Ala
100 105 110
gtc tta caa gcc aaa gcc ttt gtg ggc aat gaa ccc ttt gtg gtc atg 384
Val Leu Gln Ala Lys Ala Phe Val Gly Asn Glu Pro Phe Val Val Met
115 120 125
ctt gga gat gac tta atg gac att aca aat gca tcc gct aaa cct ctc 432
Leu Gly Asp Asp Leu Met Asp Ile Thr Asn Ala Ser Ala Lys Pro Leu
130 135 140
acc aaa caa crc atg gag gac tat gac aag acg cat gca tcc act atc 480
Thr Lys Gln Leu Met Glu Asp Tyr Asp Lys Thr His Ala Ser Thr Ile
145 150 155 160
gct gtg atg aaa gtt cct cat gaa gat gtg tct age tat ggg gtt atc 528
Ala Val Met Lys Val Pro His Glu Asp Val Ser Ser Tyr Gly Val Ile
165 170 175
gct cct caa ggc aag gct gtc aag ggc ctt tac agt gta gac acc ttt 576
Ala Pro Gln Gly Lys Ala Val Lys Gly Leu Tyr Ser Val Asp Thr Phe
180 185 190
gtt gaa aaa cca caa cca gaa gat gcg cct agt gat ttg get att att 624
Val Glu Lys Pro Gln Pro Glu Asp Ala Pro Ser Asp Leu Ala Ile Ile
195 200 205
ggt cgt tac ctc cta acc cct gaa att ttt ggt att ttg gaa aga cag 672
Gly Arg Tyr Leu Leu Thr Pro Glu Ile Phe Gly Ile Leu Glu Arg Gln
210 215 220
acc cct gga gca ggt aac gaa gtg caa ctc aca gat gct atc gat acc 720
Thr Pro Gly Ala Gly Asn Glu Val Gln Leu Thr Asp Ala Ile Asp Thr
225 230 235 240
ctc aat aaa act cag cgt gte ttt gca cga gaa ttt aaa ggc aat cgt 768
Leu Asn Lys Thr Gln Arg Val Phe Ala Arg Glu Phe Lys Gly Asn Arg
245 250 255
tac gat gtt ggg gat aaa ttt gga ttc atg aaa aca tct atc gac tat 816
Tyr Asp Val Gly Asp Lys Phe Gly Phe Met Lys Thr Ser Ile Asp Tyr
260 265 270
gcc tta gaa cac cca cag gtc aaa gag gac ttg aaa aat tac att atc 864
Ala Leu Glu His Pro Gln Val Lys Glu Asp Leu Lys Asn Tyr Ile Ile
275 280 285
aaa cta gga aaa gct ttg gaa aaa agt aaa gta cca aca cat tca aag 912
Lys Leu Gly Lys Ala Leu Glu Lys Ser Lys Val Pro Thr His Ser Lys
290 295 300
<210> 99
<211> 304
<212> PRT
<213> 酿脓链球菌(Streptococcus pyogenes)
<400> 99
Met Thr Lys Val Arg Lys Ala Ile Ile Pro Ala Ala Gly Leu Gly Thr
1 5 10 15
Arg Phe Leu Pro Ala Thr Lys Ala Leu Ala Lys Glu Met Leu Pro Ile
20 25 30
Val Asp Lys Pro Thr Ile Gln Phe Ile Val Glu Glu Ala Leu Lys Ser
35 40 45
Gly Ile Glu Glu Ile Leu Val Val Thr Gly Lys Ala Lys Arg Ser Ile
50 55 60
Glu Asp His Phe Asp Ser Asn Phe Glu Leu Glu Tyr Asn Leu Gln Ala
65 70 75 80
Lys Gly Lys Asn Glu Leu Leu Lys Leu Val Asp Glu Thr Thr Ala Ile
85 90 95
Asn Leu His Phe Ile Arg Gln Ser His Pro Arg Gly Leu Gly Asp Ala
100 105 110
Val Leu Gln Ala Lys Ala Phe Val Gly Asn Glu Pro Phe Val Val Met
115 120 125
Leu Gly Asp Asp Leu Met Asp Ile Thr Asn Ala Ser Ala Lys Pro Leu
130 135 140
Thr Lys Gln Leu Met Glu Asp Tyr Asp Lys Thr His Ala Ser Thr Ile
145 150 155 160
Ala Val Met Lys Val Pro His Glu Asp Val Ser Ser Tyr Gly Val Ile
165 170 175
Ala Pro Gln Gly Lys Ala Val Lys Gly Leu Tyr Ser Val Asp Thr Phe
180 185 190
Val Glu Lys Pro Gln Pro Glu Asp Ala Pro Ser Asp Leu Ala Ile Ile
195 200 205
Gly Arg Tyr Leu Leu Thr Pro Glu Ile Phe Gly Ile Leu Glu Arg Gln
210 215 220
Thr Pro Gly Ala Gly Asn Glu Val Gln Leu Thr Asp Ala Ile Asp Thr
225 230 235 240
Leu Asn Lys Thr Gln Arg Val Phe Ala Arg Glu Phe Lys Gly Asn Arg
245 250 255
Tyr Asp Val Gly Asp Lys Phe Gly Phe Met Lys Thr Ser Ile Asp Tyr
260 265 270
Ala Leu Glu His Pro Gln Val Lys GLu Asp Leu Lys Asn Tyr Ile Ile
275 280 285
Lys Leu Gly Lys Ala Leu Glu Lys Ser Lys Val Pro Thr His Ser Lys
290 295 300
<210> 100
<211> 1347
<212> DNA
<213> 马链球菌兽瘟亚种(Streptococcus equi zooepidemicus)
<220>
<221> CDS
<222> (1)..(1347)
<223>
<400> 100
atg tca cat att aca ttt gat tat tca aag gtt ctt gag caa ttt gcc 48
Met Ser His Ile Thr Phe Asp Tyr Ser Lys Val Leu Glu Gln Phe Ala
1 5 10 15
gga cag cat gaa att gac ttt tta caa ggt cag gta aca gag gct gat 96
Gly Gln His Glu Ile Asp Phe Leu Gln Gly Gln Val Thr Glu Ala Asp
20 25 30
cag gca cta cgt cag ggc act gga cct gga tca gat ttc ttg ggc tgg 144
Gln Ala Leu Arg Gln Gly Thr Gly Pro Gly Ser Asp Phe Leu Gly Trp
35 40 45
ctt gag tta cct gaa aac tat gac aaa gaa gaa ttt gct cgt atc ctt 192
Leu Glu Leu Pro Glu Asn Tyr Asp Lys Glu Glu Phe Ala Arg Ile Leu
50 55 60
aaa gca gct gag aag att aag gct gac agt gac gtt ctt gtt gtg att 240
Lys Ala Ala Glu Lys Ile Lys Ala Asp Ser Asp Val Leu Val Val Ile
65 70 75 80
ggt att ggt ggc tct tac ctt ggt gct aag gct gca att gac ttt ttg 288
Gly Ile Gly Gly Ser Tyr Leu Gly Ala Lys Ala Ala Ile Asp Phe Leu
85 90 95
aac agc cat ttt gcc aac cta caa aca gca aaa gag cgc aaa gca cca 336
Asn Ser His Phe Ala Asn Leu Gln Thr Ala Lys Glu Arg Lys Ala Pro
100 105 110
caa att ctt tat gct ggt aac tcc atc tca tca agc tat ctt gct gat 384
Gln Ile Leu Tyr Ala Gly Asn Ser Ile Ser Ser Ser Tyr Leu Ala Asp
115 120 125
ctt gtg gac tat gtt caa gat aaa gat ttc tct gtt aac gtg att tct 432
Leu Val Asp Tyr Val Gln Asp Lys Asp Phe Ser Val Asn Val Ile Ser
130 135 140
aag tct ggt aca aca aca gag cct gca atc gcc ttt cgt gtc ttt aaa 480
Lys Ser Gly Thr Thr Thr Glu Pro Ala Ile Ala Phe Arg Val Phe Lys
145 150 155 160
gaa tta ctt gtt aaa aag tac ggt caa gaa gag gcc aac aag cgt atc 528
Glu Leu Leu Val Lys Lys Tyr Gly Gln Glu Glu Ala Asn Lys Arg Ile
165 170 175
tat gca acg act gat aag gtc aag ggt gct gtt aag gtt gag gct gat 576
Tyr Ala Thr Thr Asp Lys Val Lys Gly Ala Val Lys Val Glu Ala Asp
180 185 190
gca aat cat tgg gaa acc ttt gtt gtg cca gat aat gtt ggt ggc cgt 624
Ala Asn His Trp Glu Thr Phe Val Val Pro Asp Asn Val Gly Gly Arg
195 200 205
ttc tca gtg ctg aca gct gtg ggc ttg cta cca att gca gca tca ggg 672
Phe Ser Val Leu Thr Ala Val Gly Leu Leu Pro Ile Ala Ala Ser Gly
210 215 220
gct gat att acc gcg ctg atg gaa gga gca aat gca gct cgt aag gac 720
Ala Asp Ile Thr Ala Leu Met Glu Gly Ala Asn Ala Ala Arg Lys Asp
225 230 235 240
ctg tca tca gat aaa atc tca gaa aac atc gct tac caa tat gct gtg 768
Leu Ser Ser Asp Lys Ile Ser Glu Asn Ile Ala Tyr Gln Tyr Ala Val
245 250 255
gtc cgc aat atc ctc tat cgc aaa ggc tat gta act gaa att ttg gca 816
Val Arg Asn Ile Leu Tyr Arg Lys Gly Tyr Val Thr Glu Ile Leu Ala
260 265 270
aac tat gag cca tca ttg cag tat ttt agc gaa tgg tgg aag caa ctg 864
Asn Tyr Glu Pro Ser Leu Gln Tyr Phe Ser Glu Trp Trp Lys Gln Leu
275 280 285
gct ggt gag tct gaa gga aag gac caa aag ggt att tac cca act tca 912
Ala Gly Glu Ser Glu Gly Lys Asp Gln Lys Gly Ile Tyr Pro Thr Ser
290 295 300
gct aat ttc tcg aca gac ctg cat tct ctt ggt caa ttt atc caa gaa 960
Ala Asn Phe Ser Thr Asp Leu His Ser Leu Gly Gln Phe Ile Gln Glu
305 310 315 320
ggc tac cgt aac ctc ttt gag aca gtg att cgt gtg gac aag cca cgt 1008
Gly Tyr Arg Asn Leu Phe Glu Thr Val Ile Arg Val Asp Lys Pro Arg
325 330 335
caa aat gtg att atc cca gaa atg gct gag gac ctt gat ggc ctt ggc 1056
Gln Asn Val Ile Ile Pro Glu Met Ala Glu Asp Leu Asp Gly Leu Gly
340 345 350
tac cta caa gga aaa gac gtt gac ttt gtc aac aaa aaa gca aca gat 1104
Tyr Leu Gln Gly Lys Asp Val Asp Phe Val Asn Lys Lys Ala Thr Asp
355 360 365
ggt gtc ctt ctt gcc cat aca gat ggt ggt gtg cca aat atg ttt atc 1152
Gly Val Leu Leu Ala His Thr Asp Gly Gly Val Pro Asn Met Phe Ile
370 375 380
acg ctt cca gag caa gac gaa ttt aca cta ggc tat acg atc tac ttc 1200
Thr Leu Pro Glu Gln Asp Glu Phe Thr Leu Gly Tyr Thr Ile Tyr Phe
385 390 395 400
ttt gag ctt gct att gcc ctt tca ggc tac ctc aac ggg gtc aat cca 1248
Phe Glu Leu Ala Ile Ala Leu Ser Gly Tyr Leu Asn Gly Val Asn Pro
405 410 415
ttt gat cag cca ggc gtt gag gct tac aag aaa aac atg ttt gcc ctt 1296
Phe Asp Gln Pro Gly Val Glu Ala Tyr Lys Lys Asn Met Phe Ala Leu
420 425 430
crt ggt aag cca ggc ttt gaa gag cta gga gca gcg ctc aac gca cgc 1344
Leu Gly Lys Pro Gly Phe Glu Glu Leu Gly Ala Ala Leu Asn Ala Arg
435 440 445
ttg 1347
Leu
<210> 101
<211> 449
<212> PRT
<213> 马链球菌兽瘟亚种(Streptococcus equi zooepidemicus)
<400> 101
Met Ser His Ile Thr Phe Asp Tyr Ser Lys Val Leu Glu Gln Phe Ala
1 5 10 15
Gly Gln His Glu Ile Asp Phe Leu Gln Gly Gln Val Thr Glu Ala Asp
20 25 30
Gln Ala Leu Arg Gln Gly Thr Gly Pro Gly Ser Asp Phe Leu Gly Trp
35 40 45
Leu Glu Leu Pro Glu Asn Tyr Asp Lys Glu Glu Phe Ala Arg Ile Leu
50 55 60
Lys Ala Ala Glu Lys Ile Lys Ala Asp Ser Asp Val Leu Val Val Ile
65 70 75 80
Gly Ile Gly Gly Ser Tyr Leu Gly Ala Lys Ala Ala Ile Asp Phe Leu
85 90 95
Asn Ser His Phe Ala Asn Leu Gln Thr Ala Lys Glu Arg Lys Ala Pro
100 105 110
Gln Ile Leu Tyr Ala Gly Asn Ser Ile Ser Ser Ser Tyr Leu Ala Asp
115 120 125
Leu Val Asp Tyr Val Gln Asp Lys Asp Phe Ser Val Asn Val Ile Ser
130 135 140
Lys Ser Gly Thr Thr Thr Glu Pro Ala Ile Ala Phe Arg Val Phe Lys
145 150 155 160
Glu Leu Leu Val Lys Lys Tyr Gly Gln Glu Glu Ala Asn Lys Arg Ile
165 170 175
Tyr Ala Thr Thr Asp Lys Val Lys Gly Ala Val Lys Val Glu Ala Asp
180 185 190
Ala Asn His Trp Glu Thr Phe Val Val Pro Asp Asn Val Gly Gly Arg
195 200 205
Phe Ser Val Leu Thr Ala Val Gly Leu Leu Pro Ile Ala Ala Ser Gly
210 215 220
Ala Asp Ile Thr Ala Leu Met Glu Gly Ala Asn Ala Ala Arg Lys Asp
225 230 235 240
Leu Ser Ser Asp Lys Ile Ser Glu Asn Ile Ala Tyr Gln Tyr Ala Val
245 250 255
Val Arg Asn Ile Leu Tyr Arg Lys Gly Tyr Val Thr Glu Ile Leu Ala
260 265 270
Asn Tyr Glu Pro Ser Leu Gln Tyr Phe Ser Glu Trp Trp Lys Gln Leu
275 280 285
Ala Gly Glu Ser Glu Gly Lys Asp Gln Lys Gly Ile Tyr Pro Thr Ser
290 295 300
Ala Asn Phe Ser Thr Asp Leu His Ser Leu Gly Gln Phe Ile Gln Glu
305 310 315 320
Gly Tyr Arg Asn Leu Phe Glu Thr Val Ile Arg Val Asp Lys Pro Arg
325 330 335
Gln Asn Val Ile Ile Pro Glu Met Ala Glu Asp Leu Asp Gly Leu Gly
340 345 350
Tyr Leu Gln Gly Lys Asp Val Asp Phe Val Asn Lys Lys Ala Thr Asp
355 360 365
Gly Val Leu Leu Ala His Thr Asp Gly Gly Val Pro Asn Met Phe Ile
370 375 380
Thr Leu Pro Glu Gln Asp Glu Phe Thr Leu Gly Tyr Thr Ile Tyr Phe
385 390 395 400
Phe Glu Leu Ala Ile Ala Leu Ser Gly Tyr Leu Asn Gly Val Asn Pro
405 410 415
Phe Asp Gln Pro Gly Val Glu Ala Tyr Lys Lys Asn Met Phe Ala Leu
420 425 430
Leu Gly Lys Pro Gly Phe Glu Glu Leu Gly Ala Ala Leu Asn Ala Arg
435 440 445
Leu
<210> 102
<211> 1251
<212> DNA
<213> 乳房链球菌(Streptococcus uberis)
<220>
<221> CDS
<222> (1)..(1251)
<223>
<400> 102
atg gaa aaa cta aaa aat ctc att aca ttt atg act ttt att ttc ctg 48
Met Glu Lys Leu Lys Asn Leu Ile Thr Phe Met Thr Phe Ile Phe Leu
1 5 10 15
tgg ctc ata att att ggg ctt aat gtt ttt gta ttt gga act aaa gga 96
Trp Leu Ile Ile Ile Gly Leu Asn Val Phe Val Phe Gly Thr Lys Gly
20 25 30
agt cta aca gtg tat ggg att att cta tta acc tat ttg tcg ata aaa 144
Ser Leu Thr Val Tyr Gly Ile Ile Leu Leu Thr Tyr Leu Ser Ile Lys
35 40 45
atg gga tta tct ttt ttt tat cgt ccc tat aaa gga agt gta ggt caa 192
Met Gly Leu Ser Phe Phe Tyr Arg Pro Tyr Lys Gly Ser Val Gly Gln
50 55 60
tat aag gta gca gct att atc cca tct tat aat gag gat ggt gtc ggt 240
Tyr Lys Val Ala Ala Ile Ile Pro Ser Tyr Asn Glu Asp Gly Val Gly
65 70 75 80
tta cta gaa act cta aag agt gtt caa aaa caa aca tat cca att gca 288
Leu Leu Glu Thr Leu Lys Ser Val Gln Lys Gln Thr Tyr Pro Ile Ala
85 90 95
gaa att ttc gta att gac gat ggg tca gta gat aaa aca ggt ata aaa 336
Glu Ile Phe Val Ile Asp Asp Gly Ser Val Asp Lys Thr Gly Ile Lys
100 105 110
ttg gtc gaa gac tat gtg aag tta aat ggc ttt gga gac caa gtt atc 384
Leu Val Glu Asp Tyr Val Lys Leu Asn Gly Phe Gly Asp Gln Val Ile
115 120 125
gtt cat cag atg cct gaa aat gtt ggt aaa aga cat gct cag gct tgg 432
Val His Gln Met Pro Glu Asn Val Gly Lys Arg His Ala Gln Ala Trp
130 135 140
gca ttt gaa agg tct gat gct gat gtt ttc tta aca gtg gat tca gat 480
Ala Phe Glu Arg Ser Asp Ala Asp Val Phe Leu Thr Val Asp Ser Asp
145 150 155 160
acc tac atc tat cct gat gct ctt gaa gaa tta tta aag aca ttt aat 528
Thr Tyr Ile Tyr Pro Asp Ala Leu Glu Glu Leu Leu Lys Thr Phe Asn
165 170 175
gat cca gag gtc tac gct gca act ggt cat tta aat gca aga aat aga 576
Asp Pro Glu Val Tyr Ala Ala Thr Gly His Leu Asn Ala Arg Asn Arg
180 185 190
caa act aat ctc tta act aga ctg act gat att cgt tac gat aat gca 624
Gln Thr Asn Leu Leu Thr Arg Leu Thr Asp Ile Arg Tyr Asp Asn Ala
195 200 205
ttt ggt gta gaa cgt gct gct cag tct gtt acg gga aat att ttg gtt 672
Phe Gly Val Glu Arg Ala Ala Gln Ser Val Thr Gly Asn Ile Leu Val
210 215 220
tgt tcc gga cct tta agt att tat aga cgt tcc gtc ggt att cca aat 720
Cys Ser Gly Pro Leu Ser Ile Tyr Arg Arg Ser Val Gly Ile Pro Asn
225 230 235 240
ctt gaa cgc tat acc tca caa aca ttt ctt ggt gtc cct gta agc ata 768
Leu Glu Arg Tyr Thr Ser Gln Thr Phe Leu Gly Val Pro Val Ser Ile
245 250 255
ggg gat gac cgt tgt ttg aca aat tat gca act gat ttg gga aaa acg 816
Gly Asp Asp Arg Cys Leu Thr Asn Tyr Ala Thr Asp Leu Gly Lys Thr
260 265 270
gtt tat cag tca act gca aga tgt gat act gac gtt cca gat aag ttt 864
Val Tyr Gln Ser Thr Ala Arg Cys Asp Thr Asp Val Pro Asp Lys Phe
275 280 285
aag gtt ttc atc aaa caa caa aat cgt tgg aat aag tca ttt ttt agg 912
Lys Val Phe Ile Lys Gln Gln Asn Arg Trp Asn Lys Ser Phe Phe Arg
290 295 300
gag tct att atc tct gtt aag aag tta tta gcc aca cca agt gtt gct 960
Glu Ser Ile Ile Ser Val Lys Lys Leu Leu Ala Thr Pro Ser Val Ala
305 310 315 320
gtt tgg act att aca gaa gtt tcc atg ttc atc atg cta gtt tat tct 1008
Val Trp Thr Ile Thr Glu Val Ser Met Phe Ile Met Leu Val Tyr Ser
325 330 335
atc ttt agc tta ttg ata gga gag gct caa gaa ttt aat ctc ata aaa 1056
Ile Phe Ser Leu Leu Ile Gly Glu Ala Gln Glu Phe Asn Leu Ile Lys
340 345 350
ctg gtt gct ttt tta gtt att att ttc ata gta gct ctt tgt aga aat 1104
Leu Val Ala Phe Leu Val Ile Ile Phe Ile Val Ala Leu Cys Arg Asn
355 360 365
gtt cat tac atg gtt aag cat cca ttt gct ttt tta ttg tca ccg ttt 1152
Val His Tyr Met Val Lys His Pro Phe Ala Phe Leu Leu Ser Pro Phe
370 375 380
tat gga ttg ata cat cta ttc gtt ttg caa cct ctt aag ata tat tcg 1200
Tyr Gly Leu Ile His Leu Phe Val Leu Gln Pro Leu Lys Ile Tyr Ser
385 390 395 400
tta ttt act ata aga aat gct aca tgg gga act cgt aaa aag aca agt 1248
Leu Phe Thr Ile Arg Asn Ala Thr Trp Gly Thr Arg Lys Lys Thr Ser
405 410 415
aaa 1251
Lys
<210> 103
<211> 417
<212> PRT
<213> 乳房链球菌(Streptococcus uberis)
<400> 103
Met Glu Lys Leu Lys Asn Leu Ile Thr Phe Met Thr Phe Ile Phe Leu
l 5 10 15
Trp Leu Ile Ile Ile Gly Leu Asn Val Phe Val Phe Gly Thr Lys Gly
20 25 30
Ser Leu Thr Val Tyr Gly Ile Ile Leu Leu Thr Tyr Leu Ser Ile Lys
35 40 45
Met Gly Leu Ser Phe Phe Tyr Arg Pro Tyr Lys Gly Ser Val Gly Gln
50 55 60
Tyr Lys Val Ala Ala Ile Ile Pro Ser Tyr Asn Glu Asp Gly Val Gly
65 70 75 80
Leu Leu Glu Thr Leu Lys Ser Val Gln Lys Gln Thr Tyr Pro Ile Ala
85 90 95
Glu Ile Phe Val Ile Asp Asp Gly Ser Val Asp Lys Thr Gly Ile Lys
100 105 110
Leu Val Glu Asp Tyr Val Lys Leu Asn Gly Phe Gly Asp Gln Val Ile
115 120 125
Val His Gln Met Pro Glu Asn Val Gly Lys Arg His Ala Gln Ala Trp
130 135 140
Ala Phe Glu Arg Ser Asp Ala Asp Val Phe Leu Thr Val Asp Ser Asp
145 150 155 160
Thr Tyr Ile Tyr Pro Asp Ala Leu Glu Glu Leu Leu Lys Thr Phe Asn
165 170 175
Asp Pro Glu Val Tyr Ala Ala Thr Gly His Leu Asn Ala Arg Asn Arg
180 185 190
Gln Thr Asn Leu Leu Thr Arg Leu Thr Asp Ile Arg Tyr Asp Asn Ala
195 200 205
Phe Gly Val Glu Arg Ala Ala Gln Ser Val Thr Gly Asn Ile Leu Val
210 215 220
Cys Ser Gly Pro Leu Ser Ile Tyr Arg Arg Ser Val Gly Ile Pro Asn
225 230 235 240
Leu Glu Arg Tyr Thr Ser Gln Thr Phe Leu Gly Val Pro Val Ser Ile
245 250 255
Gly Asp Asp Arg Cys Leu Thr Asn Tyr Ala Thr Asp Leu Gly Lys Thr
260 265 270
Val Tyr Gln Ser Thr Ala Arg Cys Asp Thr Asp Val Pro Asp Lys Phe
275 280 285
Lys Val Phe Ile Lys Gln Gln Asn Arg Trp Asn Lys Ser Phe Phe Arg
290 295 300
Glu Ser Ile Ile Ser Val Lys Lys Leu Leu Ala Thr Pro Ser Val Ala
305 310 315 320
Val Trp Thr Ile Thr Glu Val Ser Met Phe Ile Met Leu Val Tyr Ser
325 330 335
Ile Phe Ser Leu Leu Ile Gly Glu Ala Gln Glu Phe Asn Leu Ile Lys
340 345 350
Leu Val Ala Phe Leu Val Ile Ile Phe Ile Val Ala Leu Cys Arg Asn
355 360 365
Val His Tyr Met Val Lys His Pro Phe Ala Phe Leu Leu Ser Pro Phe
370 375 380
Tyr Gly Leu Ile His Leu Phe Val Leu Gln Pro Leu Lys Ile Tyr Ser
385 390 395 400
Leu Phe Thr Ile Arg Asn Ala Thr Trp Gly Thr Arg Lys Lys Thr Ser
405 410 415
Lys
<210> 104
<211> 1203
<212> DNA
<213> 乳房链球菌(streptococcus uberis)
<220>
<221> CDS
<222> (1)..(1203)
<223>
<400> 104
gtg aaa att gca gtt gca ggt tct ggc tat gtt ggc cta tca tta agt 48
Val Lys Ile Ala Val Ala Gly Ser Gly Tyr Val Gly Leu Ser Leu Ser
1 5 10 15
gta tta tta gca cag aaa aat cct gtt aca gtt gta gat att att gag 96
Val Leu Leu Ala Gln Lys Asn Pro Val Thr Val Val Asp Ile Ile Glu
20 25 30
aag aaa gta aat ctc ata aat caa aaa caa tca cca atc cag gat gtt 144
Lys Lys Val Asn Leu Ile Asn Gln Lys Gln Ser Pro Ile Gln Asp Val
35 40 45
gat att gaa aac tat tta aaa gaa aaa aag tta caa tta aga gct act 192
Asp Ile Glu Asn Tyr Leu Lys Glu Lys Lys Leu Gln Leu Arg Ala Thr
50 55 60
cta gac gcc gat caa gca ttt agg gat gca gat ata cta att att gct 240
Leu Asp Ala Asp Gln Ala Phe Arg Asp Ala Asp Ile Leu Ile Ile Ala
65 70 75 80
aca cca acc aat tat gat gtg gag aag aat ttt ttt gat act agt cat 288
Thr Pro Thr Asn Tyr Asp Val Glu Lys Asn Phe Phe Asp Thr Ser His
85 90 95
gtt gag act gta att gag aaa gct tta gct tta aat agt cag gct ttg 336
Val Glu Thr Val Ile Glu Lys Ala Leu Ala Leu Asn Ser Gln Ala Leu
100 105 110
tta gtt att aaa tca acg ata cca ctt ggt ttt att aaa aag atg cgt 384
Leu Val Ile Lys Ser Thr Ile Pro Leu Gly Phe Ile Lys Lys Met Arg
115 120 125
caa aaa tat cag aca gac cgt att att ttt agt ccc gaa ttt ctt aga 432
Gln Lys Tyr Gln Thr Asp Arg Ile Ile Phe Ser Pro Glu Phe Leu Arg
130 135 140
gag tct aaa gct tta aaa gat aat ctt tat cct agt cga ata att gtt 480
Glu Ser Lys Ala Leu Lys Asp Asn Leu Tyr Pro Ser Arg Ile Ile Val
145 150 155 160
tcc ttt gaa gat gat gat tct atg gaa gta ata gaa gca gca aag act 528
Ser Phe Glu Asp Asp Asp Ser Met Glu Val Ile Glu Ala Ala Lys Thr
165 170 175
ttt gct caa ttg tta aaa gat ggt tct ttg gat aaa gat gtt cct gta 576
Phe Ala Gln Leu Leu Lys Asp Gly Ser Leu Asp Lys Asp Val Pro Val
180 185 190
ctt ttt atg ggt tca gca gag gct gaa gca gta aaa tta ttt gcc aat 624
Leu Phe Met Gly Ser Ala Glu Ala Glu Ala Val Lys Leu Phe Ala Asn
195 200 205
acc tat tta gct atg cgt gtc tcc tat ttt aat gag tta gat aca tat 672
Thr Tyr Leu Ala Met Arg Val Ser Tyr Phe Asn Glu Leu Asp Thr Tyr
210 215 220
gct gaa aag aat ggt tta cgt gtg gat aat att att gag ggc gtt tgc 720
Ala Glu Lys Asn Gly Leu Arg Val Asp Asn Ile Ile Glu Gly Val Cys
225 230 235 240
cat gat cga cgc ata gga att cat tat aat aac cct tct ttt ggc tat 768
His Asp Arg Arg Ile Gly Ile His Tyr Asn Asn Pro Ser Phe Gly Tyr
245 250 255
gga gga tac tgc tta cct aaa gat acc aaa cag ttg cta gca ggc tat 816
Gly Gly Tyr Cys Leu Pro Lys Asp Thr Lys Gln Leu Leu Ala Gly Tyr
260 265 270
gat ggt att cct caa tcg ctt ata aaa gca att gtt gat tct aat aaa 864
Asp Gly Ile Pro Gln Ser Leu Ile Lys Ala Ile Val Asp Ser Asn Lys
275 280 285
att cgt aaa gag tat atc gca tca caa att tta caa caa ttg agt gat 912
Ile Arg Lys Glu Tyr Ile Ala Ser Gln Ile Leu Gln Gln Leu Ser Asp
290 295 300
att aat gta gat cct aaa gat gca acg att ggt att tac cgc ctt atc 960
Ile Asn Val Asp Pro Lys Asp Ala Thr Ile Gly Ile Tyr Arg Leu Ile
305 310 315 320
atg aaa agt aac tct gat aat ttc aga gag agt gca ata aaa gat att 1008
Met Lys Ser Asn Ser Asp Asn Phe Arg Glu Ser Ala Ile Lys Asp Ile
325 330 335
att gat cat att aag agc tat caa att aat ata gtc ttg tat gag cca 1056
Ile Asp His Ile Lys Ser Tyr Gln Ile Asn Ile Val Leu Tyr Glu Pro
340 345 350
atg atg aat gaa gat ttt gat tta cca atc att gat gat tta tct gac 1104
Met Met Asn Glu Asp Phe Asp Leu Pro Ile Ile Asp Asp Leu Ser Asp
355 360 365
ttc aaa gcc atg tca cat att atc gtt tca aat aga tat gat tta gcc 1152
Phe Lys Ala Met Ser His Ile Ile Val Ser Asn Arg Tyr Asp Leu Ala
370 375 380
tta gaa gat gtt aaa gaa aaa gtt tac acc aga gat att tac ggt gtg 1200
Leu Glu Asp Val Lys Glu Lys Val Tyr Thr Arg Asp Ile Tyr Gly Val
385 390 395 400
gat 1203
Asp
<210> 105
<211> 401
<212> PRT
<213> 乳房链球菌(Streptococcus uberis)
<400> 105
Val Lys Ile Ala Val Ala Gly Ser Gly Tyr Val Gly Leu Ser Leu Ser
1 5 10 15
Val Leu Leu Ala Gln Lys Asn Pro Val Thr Val Val Asp Ile Ile Glu
20 25 30
Lys Lys Val Asn Leu Ile Asn Gln Lys Gln Ser Pro Ile Gln Asp Val
35 40 45
Asp Ile Glu Asn Tyr Leu Lys Glu Lys Lys Leu Gln Leu Arg Ala Thr
50 55 60
Leu Asp Ala Asp Gln Ala Phe Arg Asp Ala Asp Ile Leu Ile Ile Ala
65 70 75 80
Thr Pro Thr Asn Tyr Asp Val Glu Lys Asn Phe Phe Asp Thr Ser His
85 90 95
Val Glu Thr Val Ile Glu Lys Ala Leu Ala Leu Asn Ser Gln Ala Leu
100 105 110
Leu Val Ile Lys Ser Thr Ile Pro Leu Gly Phe Ile Lys Lys Met Arg
115 120 125
Gln Lys Tyr Gln Thr Asp Arg Ile Ile Phe Ser Pro Glu Phe Leu Arg
130 135 140
Glu Ser Lys Ala Leu Lys Asp Asn Leu Tyr Pro Ser Arg Ile Ile Val
145 150 155 160
Ser Phe Glu Asp Asp Asp Ser Met Glu Val Ile Glu Ala Ala Lys Thr
165 170 175
Phe Ala Gln Leu Leu Lys Asp Gly Ser Leu Asp Lys Asp Val Pro Val
180 185 190
Leu Phe Met Gly Ser Ala Glu Ala Glu Ala Val Lys Leu Phe Ala Asn
195 200 205
Thr Tyr Leu Ala Met Arg Val Ser Tyr Phe Asn Glu Leu Asp Thr Tyr
210 215 220
Ala Glu Lys Asn Gly Leu Arg Val Asp Asn Ile Ile Glu Gly Val Cys
225 230 235 240
His Asp Arg Arg Ile Gly Ile His Tyr Asn Asn Pro Ser Phe Gly Tyr
245 250 255
Gly Gly Tyr Cys Leu Pro Lys Asp Thr Lys Gln Leu Leu Ala Gly Tyr
260 265 270
Asp Gly Ile Pro Gln Ser Leu Ile Lys Ala Ile Val Asp Ser Asn Lys
275 280 285
Ile Arg Lys Glu Tyr Ile Ala Ser Gln Ile Leu Gln Gln Leu Ser Asp
290 295 300
Ile Asn Val Asp Pro Lys Asp Ala Thr Ile Gly Ile Tyr Arg Leu Ile
305 310 315 320
Met Lys Ser Asn Ser Asp Asn Phe Arg Glu Ser Ala Ile Lys Asp Ile
325 330 335
Ile Asp His Ile Lys Ser Tyr Gln Ile Asn Ile Val Leu Tyr Glu Pro
340 345 350
Met Met Asn Glu Asp Phe Asp Leu Pro Ile Ile Asp Asp Leu Ser Asp
355 360 365
Phe Lys Ala Met Ser His Ile Ile Val Ser Asn Arg Tyr Asp Leu Ala
370 375 380
Leu Glu Asp Val Lys Glu Lys Val Tyr Thr Arg Asp Ile Tyr Gly Val
385 390 395 400
Asp
<210> 106
<211> 912
<212> DNA
<213> 乳房链球菌(Streptococcus uberis)
<220>
<221> CDS
<222> (1)..(912)
<223>
<400> 106
atg act aaa gta aga aaa gcc att att cca gct gcc gga ctt ggc aca 48
Met Thr Lys Val Arg Lys Ala Ile Ile Pro Ala Ala Gly Leu Gly Thr
1 5 10 15
cgt ttt tta cca gca aca aaa gct ctc gct aag gaa atg ttg ccc atc 96
Arg Phe Leu Pro Ala Thr Lys Ala Leu Ala Lys Glu Met Leu Pro Ile
20 25 30
gtt gac aaa cca acc att caa ttc atc gtg gaa gaa gct ttg cgt tct 144
Val Asp Lys Pro Thr Ile Gln Phe Ile Val Glu Glu Ala Leu Arg Ser
35 40 45
ggc att gaa gaa atc ttg gtc gta aca gga aaa tca aaa cgc tcc att 192
Gly Ile Glu Glu Ile Leu Val Val Thr Gly Lys Ser Lys Arg Ser Ile
50 55 60
gaa gac cat ttt gat tcc aac ttt gaa ctc gaa tat aat ttg caa gaa 240
Glu Asp His Phe Asp Ser Asn Phe Glu Leu Glu Tyr Asn Leu Gln Glu
65 70 75 80
aaa ggg aaa act gaa ctc tta aaa tta gtt gat gaa acc act tct ata 288
Lys Gly Lys Thr Glu Leu Leu Lys Leu Val Asp Glu Thr Thr Ser Ile
85 90 95
aac ttg cat ttc att cgt caa agt cat ccc aaa ggc tta ggg gat gct 336
Asn Leu His Phe Ile Arg Gln Ser His Pro Lys Gly Leu Gly Asp Ala
100 105 110
gtt tta caa gca aaa gct ttt gta gga aat gaa ccc ttc att gtt atg 384
Val Leu Gln Ala Lys Ala Phe Val Gly Asn Glu Pro Phe Ile Val Met
115 120 125
ctt ggt gac gat ttg atg gac att aca aat acc aaa gct gtc cca tta 432
Leu Gly Asp Asp Leu Met Asp Ile Thr Asn Thr Lys Ala Val Pro Leu
130 135 140
acc aaa caa tta atg gac gat tat gaa aca aca cat gct tct aca ata 480
Thr Lys Gln Leu Met Asp Asp Tyr Glu Thr Thr His Ala Ser Thr Ile
145 150 155 160
gcc gta atg aaa gtt cct cac gat gac gta tcc tct tat ggt gtc att 528
Ala Val Met Lys Val Pro His Asp Asp Val Ser Ser Tyr Gly Val Ile
165 170 175
gct cca aac ggc aaa gcc ttg aat ggc tta tat agc gtg gat acc ttt 576
Ala Pro Asn Gly Lys Ala Leu Asn Gly Leu Tyr Ser Val Asp Thr Phe
180 185 190
gtt gaa aaa cca aaa cct gag gac gca cca agt gac ctt gct atc att 624
Val Glu Lys Pro Lys Pro Glu Asp Ala Pro Ser Asp Leu Ala Ile Ile
195 200 205
gga cgt tat ctc tta aca cct gaa att ttt gac att ctt gaa aat caa 672
Gly Arg Tyr Leu Leu Thr Pro Glu Ile Phe Asp Ile Leu Glu Asn Gln
210 215 220
gca cca ggt gcc gga aac gaa gtc caa tta act gat gct atc gat acc 720
Ala Pro Gly Ala Gly Asn Glu Val Gln Leu Thr Asp Ala Ile Asp Thr
225 230 235 240
ctc aac aaa aca caa cgt gtt ttt gct cgt gag ttt act ggc aaa cgc 768
Leu Asn Lys Thr Gln Arg Val Phe Ala Arg Glu Phe Thr Gly Lys Arg
245 250 255
tac gat gtt gga gac aag ttt ggc ttc atg aaa aca tct atc gat tat 816
Tyr Asp Val Gly Asp Lys Phe Gly Phe Met Lys Thr Ser Ile Asp Tyr
260 265 270
gcc cta aaa cac cat caa gtc aaa gat gac cta aaa gct tat att atc 864
Ala Leu Lys His His Gln Val Lys Asp Asp Leu Lys Ala Tyr Ile Ile
275 280 285
aag tta ggt aaa gaa tta gaa aaa gca caa gat tcc aaa gsa agc aaa 912
Lys Leu Gly Lys Glu Leu Glu Lys Ala Gln Asp Ser Lys Glu Ser Lys
290 295 300
<210> 107
<211> 304
<212> PRT
<213> 乳房链球菌(Streptococcus uberis)
<400> 107
Met Thr Lys Val Arg Lys Ala Ile Ile Pro Ala Ala Gly Leu Gly Thr
1 5 10 15
Arg Phe Leu Pro Ala Thr Lys Ala Leu Ala Lys Glu Met Leu Pro Ile
20 25 30
Val Asp Lys Pro Thr Ile Gln Phe Ile Val Glu Glu Ala Leu Arg Ser
35 40 45
Gly Ile Glu Glu Ile Leu Val Val Thr Gly Lys Ser Lys Arg Ser Ile
50 55 60
Glu Asp His Phe Asp Ser Asn Phe Glu Leu Glu Tyr Asn Leu Gln Glu
65 70 75 80
Lys Gly Lys Thr Glu Leu Leu Lys Leu Val Asp Glu Thr Thr Ser Ile
85 90 95
Asn Leu His Phe Ile Arg Gln Ser His Pro Lys Gly Leu Gly Asp Ala
100 105 110
Val Leu Gln Ala Lys Ala Phe Val Gly Asn Glu Pro Phe Ile Val Met
115 120 125
Leu Gly Asp Asp Leu Met Asp Ile Thr Asn Thr Lys Ala Val Pro Leu
130 135 140
Thr Lys Gln Leu Met Asp Asp Tyr Glu Thr Thr His Ala Ser Thr Ile
145 150 155 160
Ala Val Met Lys Val Pro His Asp Asp Val Ser Ser Tyr Gly Val Ile
165 170 175
Ala Pro Asn Gly Lys Ala Leu Asn Gly Leu Tyr Ser Val Asp Thr Phe
180 185 190
Val Glu Lys Pro Lys Pro Glu Asp Ala Pro Ser Asp Leu Ala Ile Ile
195 200 205
Gly Arg Tyr Leu Leu Thr Pro Glu Ile Phe Asp Ile Leu Glu Asn Gln
210 215 220
Ala Pro Gly Ala Gly Asn Glu Val Gln Leu Thr Asp Ala Ile Asp Thr
225 230 235 240
Leu Asn Lys Thr Gln Arg Val Phe Ala Arg Glu Phe Thr Gly Lys Arg
245 250 255
Tyr Asp Val Gly Asp Lys Phe Gly Phe Met Lys Thr Ser Ile Asp Tyr
260 265 270
Ala Leu Lys His His Gln Val Lys Asp Asp Leu Lys Ala Tyr Ile Ile
275 280 285
Lys Leu Gly Lys Glu Leu Glu Lys Ala Gln Asp Ser Lys Glu Ser Lys
290 295 300
<210> 108
<211> 5158
<212> DNA
<213> 似马链球菌(Streptococcus equisimilis)
<400> 108
tcaatttatg gctttttgct gatagcttac ctattagtca aaatgtcctt atcctttttt 60
tacaagccat ttaagggaag ggctgggcaa tataaggttg cagccattat tccctcttat 120
aacgaagatg ctgagtcatt gctagagacc ttaaaaagtg ttcagcagca aacctatccc 180
ctagcagaaa tttatgttgt tgacgatgga agtgctgatg agacaggtat taagcgcatt 240
gaagactatg tgcgtgacac tggtgaccta tcaagcaatg tcattgttca tcggtcagag 300
aaaaatcaag gaaagcgtca tgcacaggcc tgggcctttg aaagatcaga cgctgatgtc 360
tttttgaccg ttgactcaga tacttatatc taccctgatg ctttagagga gttgttaaaa 420
acctttaatg acccaactgt ttttgctgcg acgggtcacc ttaatgtcag aaatagacaa 480
accaatctct taacacgctt gacagatatt cgctatgata atgcttttgg cgttgaacga 540
gctgcccaat ccgttacagg taatatcctt gtttgctcag gtccgcttag cgtttacaga 600
cgcgaggtgg ttgttcctaa catagataga tacatcaacc agaccttcct gggtattcct 660
gtaagtattg gtgatgacag gtgcttgacc aactatgcaa ctgatttagg aaagactgtt 720
tatcaatcca ctgctaaatg tattacagat gttcctgaca agatgtctac ttacttgaag 780
cagcaaaacc gctggaacaa gtccttcttt agagagtcca ttatttctgt taagaaaatc 840
atgaacaatc cttttgtagc cctatggacc atacttgagg tgtctatgtt tatgatgctt 900
gtttattctg tggtggattt ctttgtaggc aatgtcagag aatttgattg gctcagggtt 960
ttagcctttc tggtgattat cttcattgtt gccctgtgtc ggaacattca ttacatgctt 1020
aagcacccgc tgtccttctt gttatctccg ttttatgggg tgctgcattt gtttgtccta 1080
cagcccttga aattatattc tctttttact attagaaatg ctgactgggg aacacgtaaa 1140
aaattattat aaaccaacta gacctaggtt ctgacaaggg agctaagcta gggataaaca 1200
aagagttttg atccgactcg agcagctcat aaacgaaagc tatcccactt gtaattgaag 1260
ctaagagctt ttagcttgca gctctataaa gacgaaccag aggctgagtg tcagctttgg 1320
tgtgagggct aggtcattat gatccttcag gtgtggcacc tgagctccgg cagtagctaa 1380
ctgtactaag gtatcaaagg aaaaaatgaa gtgaaaattt ctgtagcagg ctcaggatat 1440
gtcggcctat ccttgagtat tttactggca caacataatg acgtcactgt tgttgacatt 1500
attgatgaaa aggtgagatt gatcaatcaa ggcatatcgc caatcaagga tgctgatatt 1560
gaggagtatt taaaaaatgc gccgctaaat ctcacagcga cgcttgatgg cgcaagcgct 1620
tatagcaatg cagaccttat tatcattgct actccgacaa attatgacag cgaacgcaac 1680
tactttgaca caaggcatgt tgaagaggtc atcgagcagg tcctagacct aaatgcgtca 1740
gcaaccatta ttatcaaatc aaccatacca ctaggcttta tcaagcatgt tagggaaaaa 1800
taccagacag atcgtattat ttttagccca gaatttttaa gagaatcaaa agccttatac 1860
gataaccttt acccaagtcg gatcattgtt tcttatgaaa aggacgactc accaagggtt 1920
attcaggctg ctaaagcctt tgctggtctt ttaaaggaag gagccaaaag caaggatact 1980
ccggtcttat ttatgggctc acaggaggct gaggcggtca agctatttgc gaataccttt 2040
ttggctatgc gggtgtctta ctttaatgaa ttagacacct attccgaaag caagggtcta 2100
gatgctcagc gcgtgattga aggagtctgt catgatcagc gcattggtaa ccattacaat 2160
aacccttcct ttggatatgg cggctattgc ctgccaaagg acagcaagca gctgttggca 2220
aattatagag gcattcccca gtccttgatg tcagcgattg ttgaatccaa caagatacga 2280
aaatcttatt tggctgaaca aatattagac agagcctcta gtcaaaagca ggctggtgta 2340
ccattaacga ttggctttta ccgcttgatt atgaaaagca actctgataa tttccgagaa 2400
agcgccatta aagatattat tgatatcatc aacgactatg gggttaatat tgtcatttac 2460
gaacccatgc ttggcgagga tattggctac agggttgtca aggacttaga gcagttcaaa 2520
aacgagtcta caatcattgt gtcaaatcgc tttgaggacg acctaggaga tgtcattgat 2580
aaggtttata cgagagatgt ctttggaaga gactagtcag aaaacgaatg gcactcataa 2640
ggaaccacaa atcaaggagg aactcatgac aaaggtcaga aaagccatta tcccagccgc 2700
cggcctaggc actcgcttcc tgcccgccac caaggcactg gccaaggaaa tgctcccaat 2760
cgtcgataag ccaaccattc aattcatcgt cgaggaagcc ctaaaggcag gtatcgagga 2820
gattcttgtc gtcaccggca aggccaaacg ctctatcgag gaccactttg actccaactt 2880
cgagctcgaa tacaatctcc aagccaaggg caaaaccgag ctactcaagc tcgttgatga 2940
gaccactgcc atcaacctgc acttcattcg tcagagccac cctagaggac taggggacgc 3000
tgtcctccaa gccaaggcct ttgttggcaa tgagcccttt gtggtcatgc tgggggatga 3060
cctcatggat attaccaatc ctagtgccaa gcccttgacc aagcagctta ttgaggatta 3120
tgattgcaca cacgcctcaa cgattgcagt gatgagggtg ccgcatgagg aggtttccaa 3180
ttatggtgtg attgcaccgc aagggaaggc tgttaagggc ttgtatagtg tggagacctt 3240
tgttgagaag ccaagtccag atgaggcacc gagtgactta gcgattattg gtcgatattt 3300
gttgacgcct gagatttttg ccatattgga gaagcaggcg cctggagctg gcaatgaggt 3360
acagctgacc gatgcgattg acaagctcaa taagacacag cgggtttttg cgagggagtt 3420
taagggagag cggtatgatg ttggggacaa gtttggcttt atgaagacct cacttgacta 3480
tgctctcaag caccctcagg tcaaggacga cctcactgac tacattataa agctcagtaa 3540
gcaactgaac aaggacgtca agaaataggc gtttattgat cagctattgc agagctattt 3600
aaaagcattt agagctttaa ggtgggatac tagaggattg gtatctcact ttttaggctg 3660
acttgtatta ataccaaaag ccaaaactag gcagataagc ataaggaatt agattaaaaa 3720
taaggaacca aaacatgaaa aactacgcca ttatcctagc agctggaaag ggaacgcgca 3780
tgaagtcagc gcttcccaag gtgctgcaca aggtatcagg cctaagcatg ctggagcatg 3840
tcctcaagag tgtctcagcc ctagcccctc aaaagcagct cacagtgatc ggtcatcagg 3900
cagagcaggt gcgtgctgtc ctaggagagc aatcgctaac agtggtgcaa gaggagcagc 3960
tagggacagg ccatgcagtc atgatggcag aagaggagct atctggctta gaggggcaaa 4020
ccctagtgat tgcaggtgac acccccttga tcagaggaga aagcctcaag gctctgctag 4080
actatcatat cagagaaaag aatgtggcaa ccattctcac agccaatgcc aaggatccct 4140
ttggctatgg acgaatcatt cgcaatgcag caggagaggt ggtcaacatc gttgagcaaa 4200
aggatgctaa tgaggcagag caagaggtca aggagatcaa cacagggact tatatctttg 4260
acaataagcg cctttttgag gctctaaagc atctcacgac tgataatgcc caaggggagt 4320
actacctaac cgatgtgatc agtattttca aggctggcca agaaagggtt ggcgcttacc 4380
tgctgaagga ctttgatgag agcctagggg ttaatgatcg cttagctcta gcccaggccg 4440
aggtgattat gcaagagcgg atcaacaggc agcacatgct taatggggtg accctgcaaa 4500
acccggcagc tacctatatt gaaagcagtg tagagattgc accagacgtc ttgattgaag 4560
ccaatgtgac cttaaaggga cagactagaa ttggcagcag aagtgtcata agcaatggga 4620
gctatatcct tgattcgagg cttggtgagg gtgtagtggt tagccagtcg gtgattgagg 4680
cttcagtctt agcagatgga gtgacagtag ggccatatgc acacattcgc ccggactccc 4740
agctcgatga gtgtgttcat attgggaact ttgtagaggt taaggggtct catctagggg 4800
ccaataccaa ggcagggcat ttgacttacc tggggaatgc cgagattggc tcagaggtta 4860
acattggtgc aggaagcatt acggttaatt atgatggtca acggaaatac cagacagtga 4920
ttggcgatca cgcttttatt gggagtcatt cgactttgat agctccggta gaggttgggg 4980
agaatgcttt aacagcagca gggtctacga tagcccagtc agtgccggca gacagtgtgg 5040
ctatagggcg cagccgtcag gtggtgaagg aaggctatgc caagaggctg ccgcaccacc 5100
caaatcaagc ctaatcgctc aaccaaaaga ggcaggtgag aaaacctagg ccattaaa 5158