枯草芽胞杆菌中生物素的生物合成
本发明涉及用遗传工程方法加工的微生物生产生物素。
生物素(维生素B8或维生素H)是羧化和脱羧化反应的辅酶,它是活细胞的一种基本代谢物。大多数高等生物需要外源生物素,而许多细菌可合成其自身的生物素。
涉及由庚二酰(pimelyl)-CoA(PmCoA)至生物素的生物素合成途径中的酶促步骤已在大肠杆菌和球形芽胞杆菌中得以阐明(图1;见Perkins and Pero,Bacillus subtilis and otherGram-Positive Bacteria,ed.Sonenshein,Hoch and Losick,Amer.Soc.of Microbiology.pp.325-329(1993)综述)。这些步骤包括如下的转变过程:1)经7-KAP合成酶(bioF)的作用由庚二酰-CoA向7-酮-8-氨基壬酸(7-KAP或KAPA)的转变;2)经DAPA氨基转移酶(bioA)的作用由7-KAP向7,8-二氨基-壬酸(DAPA)的转变;3)经DTB合成酶(bioD)的作用由DAPA向脱硫生物素(DTB)的转变;和4)经生物素合成酶(bioB)的作用由DTB向生物素的转变。据报道PmCoA的合成在不同微生物中有不同的酶促步骤。在庚二酰-CoA合成之前的步骤中所涉及的大肠杆菌基因包括bioC(Otsuka等人,J.Biol.Chem.263.19577-19585(1988))和bioH(O′Regan et al.,Nucleic Acids Res.17,8004(1989))。在球形芽胞杆菌中,认为有两种不同的基因bioX和bioW参与了PmCoA的合成。BioX被认为参与了庚二酸盐的生物合成[Gloeckler等人,Gene 87,63-70(1990))。而bioW已被证明编码将庚二酸(PmA)转变为PmCoA的庚二酰-CoA合成酶[Ploux等人,Biochem.J.287,685-690(1992))。无论是球形芽胞杆菌基因bioW还是bioX在核苷酸或蛋白质水平均未与大肠杆菌bioC和bioH有显著的序列相似性[Gloeckler et al.,(1990)supra)。
在大肠杆菌中,生物素生物合成基因位于染色体的三个或多个操纵子内。bioA基因位于一个操纵子内而bioBFCD基因位于第二紧密连接的操纵子内。bioH基因与其它bio基因并不相连)(图2;Eisenberg,M.A,.1987 in Escherichia Coli and Salmonellatyphimurium:Cellular and Molecular Biology,Vol.1,Amer.Soc.Micro.Wash.D.C.)。
在球形芽胞杆菌中,bio基因的组成显著区别于大肠杆菌。Gloeckler等人((1990)同上)已经分离到两个来源于球形芽胞杆菌的编码bio基因的未连接DNA片段并鉴定了其特征。一个片段含有编码bioD、bioA、bioY和bioB基因的操纵子,而另一个片段则含有编码bioX、bioW和bioF基因的操纵子(图2)。大肠杆菌和球形芽胞杆菌中bio基因的次序和群集分布不同(图2)。
Fisher(美国专利5,110,731)提供了一种制备生物素的系统,其中大肠杆菌生物素操纵子的基因被转化至大肠杆菌滞留缺陷株中,并在其中进行表达。
Gloeckler等人(美国专利5,096,823)描述了参与球形芽胞杆菌中生物素的生物合成的基因:bioA、bioD、bioF、bioC和bioH。将球形芽胞杆菌的bioA和bioD基因克隆至大肠杆菌和枯草芽胞杆菌中。将bioA和bioD基因稳定地整合至枯草芽胞杆菌Bio-营养缺陷型中,并选择原养型菌株。
英国专利2,216,530提供了含有大肠杆菌bioA、bioB、bioC、bioD和bioF基因的质粒,所说基因分离自其它大肠杆菌遗传物质如控制序列。这些质粒能在非大肠杆菌菌株(较好是酵母)中进行复制并得以表达。
已经报道了枯草芽胞杆菌的三种生物素合成缺陷突变体(bioA、bioB和称为bio112的与大肠杆菌bioF类似的基因)(Pai,Jour.Bact.121,1-8(1975);and Gloeckler等人,(1990)同上文)。
Nippon Zeon Co.Ltd.(美国专利4,563,426)公开了包括在培养约24小时后加入庚二酸的生物素发酵方法。Transgene SA和Nippon Zeon Co.Ltd.(欧洲专利申请公开No.379428)公开了将庚二酸加至生物素发酵培养基中的方法。
本发明主要提供用于高水平生产生物素的枯草芽胞杆菌及其紧密相关菌种的生物素合成操纵子的基因,下文更详细描述了本发明的各具体方面。我们已具体鉴定、克隆和用遗传工程方法加工了一以前未知的基因(bioI),该基因编码细胞色素P-450样酶。我们也已发展了一种超表达整个枯草芽胞杆菌bio操纵子(当用强启动子进行遗传工程方法加工时,产生未预料的对大肠杆菌的毒性)的策略,该策略借助将两个bio操纵子片段分别克隆在体外使之结合并以所获连接构建体转化宿主微生物。由于在大肠杆菌中的毒性,获得操纵子5′末端的困难使对两个片段的克隆更复杂化了。本发明具体描绘了由上述策略获得的全长操纵子的特征。下文更详细描述了本发明的这些和其它特征。
因此,本发明一方面描绘了含选自下面一组DNA序列的DNA的特征,(a)编码枯草芽胞杆菌或与枯草芽胞杆菌紧密相关菌种的生物素生物合成酶基因的DNA序列;(b)编码(a)的生物活性片段的DNA序列;或(c)与(a)或(b)基本上同源的DNA序列。本文所用的与枯草芽胞杆菌“紧密相关”的菌种也包括以枯草芽胞杆菌为代表的芽胞杆菌属的一组成员。该组成员包括例如枯草芽胞杆菌、短小芽胞杆菌、地衣型芽胞杆菌、解淀粉芽胞杆菌、巨大芽胞杆菌、蜡状芽胞杆菌和苏云金芽胞杆菌。枯草芽胞杆菌族的各菌种是从以球形芽胞杆菌和嗜热脂肪芽胞杆菌为代表的各族更远相关的芽胞杆菌属中遗传性和代谢性分化出来的(图3;Priest,inBacillus subtilis and other Gram-Positive Bacteria,同上,pp.3-16;Stackebrandt,等人J.Gem.Micro.133,2523-2529(1987))。
如上所述,我们已经在枯草芽胞杆菌和与其紧密相关的菌种中发现了一种新基因(bioI),该基因对生物素的失调生产特别重要,并且该基因包含在本发明第一方面的优选实施方案的DNA中。也优选至少将bioA和bioB包含在本发明第一方面的DNA中。将bioD、bioF、bioW和ORF2(编码β-酮还原酶样酶)也包含在本发明的DNA中是有益的。至少有2个上面所限定的基因可以被包含在DNA中。可将DNA序列与转录启动子例如基本启动子(如由SP01噬菌体衍生的启动子)可操纵地连接。可将枯草芽胞杆菌或其紧密相关菌种的整个生物素操纵子连接至单一转录启动子。而且,我们已知包含一个第二启动子特别有用,即将一个或多个DNA序列可操作地连接到第一转录启动子,并将这些基因中的至少第二个再可操作地连接至第二转录启动子。可将第一启动子可操作地连接到枯草芽胞杆菌或其紧密相关菌种的一个或多个bioA、bioB、bioD、bioF和bioW。可将其他启动子可操作地连接到一个或多个bioI、bioA、bioB或其结合物。在具体优选的实施方案中,第一启动子控制整个操纵子的转录,而bioI、也可与bioA和/或bioB一起的转录也由第二启动子控制。DNA可包含枯草芽胞杆菌或紧密相关菌种的生物素操纵子的诱变调节位点,如操纵基因、启动子、转录终止位点、mRNA加工位点、核糖体结合位点或降解物阻遏位点。对于诱变,我们是指与野生型调节位点相关的插入、取代或缺失。
本发明的第二方面涉及我们发现的枯草芽胞杆菌bioI。这方面描绘了该基因或与枯草芽胞杆菌bioI特异性杂交的基因的特征。它也描绘了由这种基因编码的生物素生物合成酶的特征。
本发明也描述了含有如上所述DNA的载体和含有所述载体或所述DNA的细胞。优选地,将DNA在这种细胞内扩增成多拷贝。也优选地,将DNA稳定地整合至细胞的染色体中。DNA可在染色体的多个位点整合,至少其中一个位点是bio座位,并且在每个所述位点都是多拷贝。也优选地,该细胞的特征在于除含所说DNA外还经突变失调生产生物素或生物素前体。这种突变的细胞与缺乏所说DNA的野生型细胞相比可使生物素生产增加,这种突变可以是产生壬二酸抗性的突变和/或也可是bioA中的突变。
将上述细胞用于制备生物素或其前体的方法中,其中将细胞在允许生物素或其前体合成的条件下培养一段时间,然后优选从细胞外基质中分离生物素或前体。
本发明的另一方面描绘了由如上所述的DNA编码的重组蛋白质或含有一段氨基酸序列的重组生物素生物合成酶的特征,所说氨基酸序列是与枯草芽胞杆菌或其紧密相关菌种的生物素生物合成酶的氨基酸序列基本同源的。
本发明的最后一方面描绘了选择以生物素生产失调为特征的枯草芽胞杆菌突变体细胞的方法:(a)提供枯草芽胞杆菌细胞群体;(b)使该群体在壬二酸存在的情况下繁殖;(c)选择有壬二酸抗性的细胞;和(d)筛选所述细胞或进一步突变以使生物素生产失调的子代细胞,所述细胞应具有超量生产生物素的能力。
参考下述定义和解释,可以进一步理解本发明的上述描述。载体DNA可包括与编码枯草芽胞杆菌或其紧密相关菌种生物素生物合成酶的基因(或与编码该基因生物活性片段的DNA序列)基本上同源的DNA序列。借助包括在DNA序列于细胞内表达时可增加生物素合成的突变如缺失、插入或点突变的方法可从野生型序列中分出所需DNA序列。至少可将两个、三个、四个、五个或六个或优选全部的生物素操纵子基因与转录启动子可操作地连接以产生信使RNA。本文所用的“操纵子”指由所述启动子共转录的一个或多个基因。“生物素操纵子”指一组其基因产物参与生物素生物合成中一方面的基因。“启动子”指由启动位于该启动子3′方向基因转录以产生mRNA的RNA聚合酶识别的一段核苷酸序列。“与转录启动子可操作地连接”指基因与用于从启动子开始的RNA转录的启动子足够近,以使转录包含互补于所说基因的mRNA。转录启动子可以是组成型启动子如衍生于SP01噬菌体的启动子,或是可诱导启动子。
任何一个操纵子基因可包括当DNA序列在细胞内表达时增强生物素合成的突变。在一个有关的实施方案中,可以借助例如突变改变位于生物素操纵子中或生物素操纵子基因中的调节位点,以增加细胞内产生的生物素水平。可被改变的调节位点的例子包括转录终止位点、操纵子基因位点、mRNA加工位点、核糖体结合位点或降解物阻遏位点。
本发明的任何载体可被包含于宿主细胞中。由于如下所讨论的原因优选的宿主细胞是枯草芽胞杆菌细胞。然而,也可将本发明的载体插入另一类型的宿主细胞如大肠杆菌或含有任何对于维持载体和/或表达位于载体上生物素操纵子基因所必需的装置的宿主细胞中。如将宿主细胞用于表达,宿主细胞具有如枯草芽胞杆菌一样的将生物素分泌至细胞外基质以使生物素产物收集简单化的能力是符合需要的。可以使用的某些宿主细胞包括但不限于革兰氏阳性菌如枯草芽胞杆菌细胞(如枯草芽胞杆菌168、W23或natto菌株)、其它的芽胞杆菌菌株(如地衣形芽胞杆菌、解淀粉芽胞杆菌、短小芽胞杆菌、巨大芽胞杆菌或蜡状芽胞杆菌(芽胞杆菌菌株参见“Bacillus GeneticStock Center Catalogue of Strains”,Ohio state Univ.Depart.Biochem.,Columbus OH.edited by D.H.Dean(1986)3rd edition)或其它革兰氏阳性细胞如乳酸球菌属、乳酸杆菌属、棒状杆菌属、短颈细菌属、葡萄球菌属、链霉菌属或梭状芽胞杆菌属;革兰氏阴性细菌如大肠杆菌属、沙门氏菌属、沙雷氏菌属或克雷白氏杆菌属菌株;或真菌细胞如酵母。与这些革兰氏阳性细胞一起有用的菌株和载体参见“Bacillus subtilis and otherGrom-Positive Bacteria”,(edited by Sonenshein,Hoch,andLosick,Amer.Soc.of Microbiology(1993))。革兰氏阳性微生物的生物素基因可在革兰氏阴性菌中表达(Gloeckler et al.,同上文)并且即使是源于酿酒酵母的真菌基因也已在大肠杆菌中表达[Zhang et al.,Archives ofBiochemistry and Biophysics 309,29-35(1994)]。
如载体为染色体外元件,它可在细胞内扩增,即扩增至多拷贝。另外,如果载体不是染色体外元件,则可将其稳定整合到细胞染色体中。整合的载体也可在细胞内扩增至多拷贝,即整合可在多位点或在每个位点以多拷贝进行。整合可发生在染色体的随机位点处,或优选地,直接整合至优选的染色体座位,如bio座位。可以将整个载体整合入染色体,或只将生物素生物合成序列整合入染色体而不带有至少部分非生物素生物合成序列,如复制子序列。可将含有载体或生物素操纵子序列的细胞进一步进行生物素生产失调的加工。
“进行生物素生产失调的加工”指至少从细胞去除部分控制生物素生物合成水平的负性限制。负性限制包括但不限于调节蛋白质(如阻遏物)、调节蛋白质作用位点(如操纵基因)、抑制因子或低水平的产率限制酶的细胞可以包含与大肠杆菌birA座位互补的遗传座位中的突变。包含引起增加生物素分泌的突变的枯草芽胞杆菌菌株的例子包括但不限于菌株HB3、HB9、HB15、HB43、α-DB9、α-DB12、α-DB16和α-DB17,或表8、表9、表10中所列的任何突变体的或经基因工程方法加工的菌株。优选的以至少0.1mg/l、1mg/l、10mg/l、100mg/l、300mg/l、500mg/l、750mg/l或1.0g/l的浓度将生物素分泌至细胞外基质中。优选地,宿主细胞为枯草芽胞杆菌,但也可是上文所列宿主菌株中的任何一种。“同效维生素”或“生物素同效维生素”指在生物合成途径中被用于饲喂酵母的生物素之前的任何一种化合物,即表1所示的下述化合物:7-KAP、DAPA或脱硫生物素。术语“生物素前体”包括如上列出的任何一种生物素同效维生素以及PmA和PmCOA。基本上同源,我们是指具有足够的同源性以在一定条件下产生特异性杂交,所说条件允许与包括枯草芽胞杆菌在内的芽胞杆菌种DNA杂交,但所说条件非常严格,不允许与和枯草芽胞杆菌紧密相关的菌种以外的微生物DNA杂交。下面提供了用于该目的的适宜探针。适宜的杂交应用了相对严格的条件。例如:在5×SSC(0.75M NaCl和0.075M柠檬酸钠,pH7.0)、10-50%甲酰胺、1×Denhardt′s液(0.02%牛血清白蛋白、0.02%Ficoll、0.02%吡咯烷酮)和100ug/ml变性鲑鱼精子DNA存在的情况下,将含有变性DNA的硝酸纤维素滤纸与放射性标记的DNA或RNA探针于37-42℃温育。本领域技术人员可理解严格性将逐渐增加(如通过增加甲酰胺浓度或温度)直至获得适宜的特异x性(即减少或消除非特异性结合)。
“生物素合成酶”指任何一种如图1所示或本文所讨论的形成生物素生物合成途径的酶或由在本文新公开的基因(如bioI)或ORF2编码的酶。术语“生物素生物合成酶”也包括执行枯草芽胞杆菌生物素生物合成酶的生化功能的天然生物素生物合成酶的一部分或片段。这种生物素生物合成酶的一部分或片段的大小由保留天然酶生化活性的功能性要求所决定。文献中有许多有关在由蛋白水解或截短有关基因使多肽链变短之后保留一种或多种活性的酶的例子[例如,参见Dautry-Varsat and Cohen,J.Biol.Chem.252,7685-7689(1977)]。
本文中所用的术语“片段”或“部分”当用于多肽时,一般是至少约10个相邻的氨基酸,典型地至少约20个相邻的氨基酸,通常至少约30个相邻的氨基酸,优选的,至少50个相邻的氨基酸和最优选至少约60至80个相邻的氨基酸长度。与之相似的,核酸意义上的术语“片段”指编码如上所定义的多肽片段的DNA序列。可用本领域技术人员已知的方法评估候选片段执行相应天然产生酶的生物活性的能力,这些方法包括但不限于下述方案:庚二酰-CoA合成酶(bioW)、7-KAP合成酶(bioF)、DAPA氨基转移酶(bioA)和DTB合成酶(bioD)的检测法已由Izumi等描述(Methods in Enzy.62,326-338(1979))。IfuRu等人描述了生物素合成酶(bioB)的无细胞检测法[Biosci.Biotech.Biochem.561780-1785(1992)]借助Omura等人描述的光谱检测法(J.Biol.Chem.239,2310-2378(1964))可确定bioI的产物为细胞色素P-450。
“重组体”指编码酶的基因已被从枯草芽胞杆菌内其天然产生位点取除并用本领域技术人员已知的遗传工程技术被永久或暂时地插至载体中。优选地,该载体包含允许插入基因表达的序列。
本文所用的“载体”指借助如转染、转化或转导被导入细胞的核酸分子。载体包括但不限于质粒、噬菌体、噬菌体质粒、粘性质粒和转座子。本文所用的载体的例子包括但不限于pBR322、pCL1920、pCL1921、pUC18、pUC19或pSC101。这些载体在大肠杆菌和其它细菌内复制但不在枯草芽胞杆菌中复制,因此它们在加入适宜的选择性标志后可用作为枯草芽胞杆菌中的整合载体。其它常用于枯草芽胞杆菌中的载体包括质粒pUB110、pE194、pC194和其在枯草芽胞杆菌中复制的衍生物。或任何在Bacillus subtilis and other Gram-Positive Bacteria(同上文,pp585-650)40-44章中所描述的整合的载体、质粒、温和噬菌体载体或转座子。在许多微生物中所用的其它载体在“Cloning Vectors:A LaboratoryManual”(Pouwels et al Elsevier(1985)withsupplementary updates in 1986 and 1988))中得以描述。重组体,用遗传工程方法加工的枯草芽胞杆菌DNA也可插入至枯草芽胞杆菌染色体中(通过同源重组)并在其中扩增而不用任何复制质粒载体。
本文所用“基本上纯的核酸”指从以其天然产生状态与之侧接的序列中纯化或分离的核酸序列、区段或片段,如从正常情况下邻接于所说片段的序列中取除的DNA片段,所说序列为,例如邻接在其天然产生的基因组中片段的序列。该术语也应用于已从其它在细胞内天然与之一起存在的成分中基本上纯化的核酸。优选地,“编码枯草芽胞杆菌生物素生物合成酶的序列”为全部纯化核酸序列的主要成分,例如至少为全部核酸序列的1%或10%。
本文所用“同源的”指两个聚合分子间如两核酸分子间(如两DNA或RNA分子)或两个多肽分子间亚单位序列的相似性。当两个分子中的亚单位位置被同一单聚亚单位占据时,例如,如果两个DNA分子的每个中的位置被腺嘌呤占据时,则它们在该位置为同源的。“最适”同源性可以通过调整序列的排列而获得。两个序列间的同源性为匹配或同源的位置数目的函数,例如,如果两个复合序列中位置的一半(如10个亚单位长的聚合物中的5个位置)是同源的,则这两个序列是50%同源的,如果90%的位置(如9/10)是匹配或同源的,则这两个序列共享90%的同源性。在同源的序列中可能有非同源序列的间隙。“基本上同源的”序列是那些只是由于保守取代才使之相互不同的序列。例如,当取代位于核酸序列中时,取代要么不引起该位置氨基酸的改变,要么导致保守氨基酸取代。“保守的氨基酸取代”指例如用一个同型氨基酸(例如具有疏水性、电荷、pKa或其它构象或化学特征等共同特征的氨基酸,如缬氨酸取代亮氨酸、精氨酸取代赖氨酸)取代另一个氨基酸,或在不破坏多肽(如上所述)生物活性的氨基酸序列的位置一个或多个非保守氨基酸的取代、缺失或插入。如果通过减少或改变多区域酶的一个区域的生物活性而保留该酶第二区域的第二生物活性的修饰使氨基酸序列有所不同,则该氨基酸序列包括在本发明范围内。一般地,如果多肽与枯草芽胞杆菌生物素生物合成酶的天然氨基酸序列有至少75%、优选至少80%或最优选至少90%的同源则认为该多肽包括在本发明范围内。如果核酸序列与编码枯草芽胞杆菌生物素生物合成酶的天然核酸序列有至少70%、优选至少80%或最优选至少90%的同源,则认为该核酸序列包括在本发明范围内。
可将本文所提供的含有枯草芽胞杆菌基因或DNA序列的细菌菌株用于生产高水平生物素或生物素前体,所说的化合物又可被对用作人或动物的饮食添加剂。例如,可将生物素作为商售动物饲料的添加剂供给饲养的动物如牛、鸡或猪。另外,生物素也可加至人用维生素饮食补充食物中。生物素也可用作为用于研究和诊断方法的试剂。例如,生物素可用作蛋白质和核酸的非放射性标记物。借助生物素的天然产生的能与抗生物素蛋白(一种在蛋清中发现的蛋白质)结合或与抗生蛋白链霉素(一种由链霉菌产生的生物素结合蛋白)结合能力的优点,可以检测生物素标记的蛋白质。
下面对附图进行简要说明。
图1(Figl)图解说明球形芽胞杆菌的生物素合成途径。
图2图解说明大肠杆菌、球形芽胞杆菌和枯草芽胞杆菌中的生物素基因的组成。
图3图解说明包括芽胞杆菌属在内的系统发育的非一致性。
图4图解说明枯草芽胞杆菌bio启动子区(SEQ ID NO:7)的核苷酸序列,包括ORF4-5读码(SEQ ID NO:16)末端和bioW读码(SEQ ID NO:17)起始处的氨基酸翻译。
图5A为枯草芽胞杆菌生物素操纵子的物理图谱。
图5B为表明枯草芽胞杆菌生物素操纵子转录的图谱。
图6显示限制酶切位点和与pBIO质粒的互补的结果。
图7显示含缺失的互补结果以及pBIO201的亚克隆。
图8为枯草芽胞杆菌bio启动子区的物理图谱。
图9显示在枯草芽胞杆菌bioW、ORF2和ORF3中cat(氯霉素-乙酰转移酶)插入性突变的位置和Bio表型。
图10显示枯草芽胞杆菌bio启动子区、ORF4-5和ORF6中cat插入性突变的位置和Bio表型。
图11为球形芽胞杆菌bioDAYB调节区(SEQ ID NO:8)与枯草芽胞杆菌bio启动子区(SEQ ID NO:9)之核苷酸序列的比较。
图12说明为5′-生物素操纵子盒导入的限制性位点。1.上游同源性,终止子;2.启动子,操纵基因,前导序列;3.核糖体结合位点,起始密码子,5′-bioW。
图13A显示5′-bio盒的下列PCR引物的方向和序列:ORF4.1(SEQ ID NO:10)、BIOL5′(SEQ ID NO:11),Leader 1(SEQ ID NO:12)、ANEB1224(SEQ ID NO:13)、BIOL 3(SEQ ID NO:14),BIOL4(SEQ ID NO:15)。
图13B为pBIO144构建图
图14显示枯草芽胞杆菌生物素操纵子DNA序列和其侧接序列(SEQ ID NO:1)。
图15显示各种发酵肉汤的同效维生素谱。
图16说明bioW中的码内缺失。
图17A说明bioW降解物阻遏序列的元件。
图17B说明bioB和bioI间缺失的终止子区。
图18图示表明PA3和PA6菌株的壬二酸抗性。
图19图示表明BI535和BI544菌株和壬二酸抗性。
非常希望开发一种在商业上经济实用的能生产高效价生物素的有效系统。本发明申请人已知道用枯草芽胞杆菌发展的用于生物素生产的改良系统。
使用枯草芽胞杆菌比使用其也菌种有几点优点。与球形芽胞杆菌不同,枯草芽胞杆菌突出表现在可更容易地用遗传工程进行加工,即a)发展一种最理想的用于生物素生产的突变体菌株;和b)操作和构建载有编码生物素生物合成酶基因的遗传载体。最重要地,申请人在本文中公开了在一个操纵子上发现的大部分或全部编码生物素生物合成酶的基因。这使得更容易全面调节操纵子的表达并共同调节每种被表达的酶量。而且,枯草芽胞杆菌一种独特的细胞色素P-450样酶,该酶参与同效维生素生产并可被加工以显著增强同效维生素的生产。目前还没有编码该酶(bioI)和源自其它微生物其同源物的基因在生物素或生物素同效维生素合成中起作用的报道。
获得枯草芽胞杆菌生物素操纵子的基因不是一件显而易见的工作。基于与球形芽胞杆菌序列相似性而鉴别所说基因的早期尝试是失败的。失败的原因是尽管它们均在芽胞杆菌属这一分类群中,但枯草芽胞杆菌与球形芽胞杆菌为相距很远的种(Stackebrant et al.,同上文)。结果相关的球形芽胞杆菌基因与相应的枯草芽胞杆菌基因间的序列同源性很低,不足以用球形芽胞杆菌基因作为探针克隆枯草芽胞杆菌的基因。
因此本发明申请人应用了另外一种更成功的策略克隆了生物素生物合成所需的基因(bio基因)。这一进展包括用bioA、bioB、bioC、bioD、bioF和bioH的大肠杆菌突变体进行的互补作用实验和从标志-获救进行的进一步特征化以及以已知的bioA、bioB和bioF的枯草芽胞杆菌生物素突变体进行的互补作用实验(Pai etal.,同上文)。这些实验表明枯草芽胞杆菌中所有的6个生物素生物合成基因均含在一个约8kb的单一DNA片段上。已经获得该片段详细的限制性图谱,并对叠克隆、缺失突变体、亚克隆和其各自核苷酸序列进行了分析,所说核苷酸序列允许基因以bioW、bioA、bioF、bioD、bioB、bioI和ORF2的顺序(从右至左)位于DNA片段上。由于所有7个基因为单一操纵子的一部分,它们互相相容,可以相同方向进行转录。
然后将分离的枯草芽胞杆菌生物素操纵子插入至用于生物素生产的微生物宿主中。操纵子和微生物宿主可均是或分别是生物素生产失调的,从而最大量生产生物素。
实施例I
克隆用于生物素生物合成的枯草芽胞杆菌基因
本申请人已经克隆并描述了生物素生物合成所需的枯草芽胞杆菌基因(bio基因)的特征。由于在本工作之前有关枯草芽胞杆菌bio基因仅知存在bioA、bioB和bioF的突变且在染色体上紧密连接(Pai et al.,同上文),因此最初采用了两种不同的方法克隆这些基因。第一种方法包含试验根据保守序列设计的短(~45-60bps)探针,和自球形芽胞杆菌bio基因,用聚合酶链反应(PCR)产生的较大探针(~1kb)。然而,所说探针不能与枯草芽胞杆菌DNA的染色体消化物进行特异性杂交。第二种方法包括筛选枯草芽胞杆菌DNA文库,以选出与大肠杆菌bio突变体互补的重组克隆。
IA.借助与球形芽胞杆菌序列的DNA杂交来克隆bio基因
为鉴定含有bio基因的枯草芽胞杆菌的限制性片段,制备针对球形芽胞杆菌bioA、bioB和bioF基因的内部区的短(~45-61bps)探针。探针的序列是基于由大肠杆菌和球形芽胞杆菌的bio DNA核苷酸序列所预测的保守氨基酸而选出的。
所说探针的特征如下:bioA,60-链节和bioB,48-链节(分别为核苷酸#1950-2009和#3333-3380,源自球形芽胞杆菌序列,GenBankTM accession#M29292);bioF,45-链节(源自球形芽胞杆菌的核苷酸#2877-2921GenBankTM accession #M29291)。其中两个探针即使在杂交条件的严格程度较低的情况下(5×SSC,10%甲酰胺,1×Denhardt′s液,100μg/ml单链鲑鱼精子DNA,37℃)也不能与枯草芽胞杆菌DNA的不同染色体消化物杂交(bioB探针)或只能很差地杂交(bioF探针)。只有bioA探针能够杂交。然而,用bioA杂交鉴定的纯化DNA片段不能标志获救枯草芽胞杆菌bioA突变体,这表明所说片段不含bioA基因。而且,DNA杂交物不稳定;在中等程度严格性的条件下(0.25-0.1×SSC 37℃)所说探针可从滤纸上洗掉。与其相似,三个由球形芽胞杆菌染色体DNA的PCR扩增制备的bio基因的较大DNA探针(~1kb)也不能与枯草芽胞杆菌染色体DNA进行特异性杂交,结果不能将这些探针用于对基因库进行筛选以选出含有枯草芽胞杆菌bio基因的重组子克隆。
IB.借助大肠杆菌的互补作用克隆bio基因
用阳性选择载体pTR264在大肠杆菌载体中构建随机枯草芽胞杆菌片段(~10kb)的文库(Lauer.et al.,J.Bact.173,5047-5053(1991))。pTR264是一种pBR322衍生载体,带有氨苄青霉素抗性基因和λ阻遏物基因以及在由λ阻遏物调节的调节序列控制之下的四环素抗性基因。通过加回自PstI位点基因的5′末端,重新组成pTR262的氨苄青霉素抗性基因而构建pTR264。独特的BclI位点位于λ阻遏物基因内。DNA片段的插入至该位点破坏了阻遏物的功能,从而减低了tet基因的阻遏作用。借助将转化子铺板于四环素平板上选择带有插入物的克隆。
将分离自dam-大肠杆菌株并以BclI消化的pTR264与枯草芽胞杆菌染色体DNA连接,所说DNA用Sau3A部分消化并在蔗糖梯度(8-12kb片段)上分级。文库(标为BSB1)含有与所有已知大肠杆菌bio点突变体互补的Tetr质粒。用BSB1转化大肠杆菌生物素突变体R879(bioA24)、R875(bioB17)、R878(bioC23)、R877(bioD19)、R872(bioF3)和BM7086(ΔmalA-bioH)(Cleary andCampbell,J.Bact.112,830-839(1972);Hatfield etal.,J.Bact.98,559-567(1969))。从各Bio+转化体分离出质粒。通过R879(bioA)的互补作用分离出质粒pBIO100、pBIO101;通过R877(bioD)的互补作用分离出质粒pBIO102和pBIO103;通过R872(bioF)的互补作用分离出质粒pBIO104;通过BM7086(bioH)的互补作用分离出质粒pBIO109和pBIO110;和通过R878(bioC)的互补作用分离出质粒pBIO111和pBIO112(图6).最后将BSB1文库的DNA转化入大肠杆菌BM4062[birA(ts)]中[Barker and Campbell J.Med.Biol.146,469-492(1981))。从于42℃生长的菌落中分离质粒pBIO113和pBIO114。
对分离的质粒所进行的初始限制性分析表明已克隆的DNA片段的明显重叠,这指示bioA、bioC、bioD、bioF和bioH这5个基因群集在枯草芽胞杆菌的单一操纵子中。然而,birA互补质粒pBIO113和pBIO114与其它5个片段并不重叠。
IC.bio质粒的限制性图谱
图6表明了从独特的EcoRI至BamHI位点的bio座位的限制性图谱。将克隆入pBR322衍生物中的EcoRI至BamHI片段称为pBIO201。通过标准单酶和双酶消化分析获得pBIO201中9.9kb片段的详细限制性图谱。
由大肠杆菌中的互补作用分离的bio基因的第一个克隆pBIO100于BamHI位点一侧扩展了另外300bp。由大肠杆菌的bioH突变体的互补作用分离的pBIO110于EcoRI位点一侧扩展了约1100bp。Southern杂交研究表明pBIO100的插入DNA源自枯草芽胞杆菌染色体的单一连续区段。
ID.枯草芽胞杆菌和大肠杆菌bio突变体与pBIO质粒的互补作用/标志获救。
为证实pBIO100的克隆DNA含有枯草芽胞杆菌bio基因,试验了pBIO100标志获救枯草芽胞杆菌bio基因的能力。该质粒以高频率对bioA、bioB和bioF突变体重建了生物素原养型,这表明克隆的DNA含有所有或一部分的枯草芽胞杆菌bio基因。
也检测了pBIO质粒与大肠杆菌bio突变体bioA、bioD、bioF、bioC和bioH互补的能力。大多数质粒与不止1个的大肠杆菌生物素突变体互补。分离的pBIO112与bioA、bioB、bioC、bioD、bioF和bioH大肠杆菌突变体互补(图6)。pBIO112不与大肠杆菌bir(ts)或Δ(gal-uvrB)突变体互补。这些数据表明大多数已知生物素基因以单一群簇位于枯草芽胞杆菌。
通过在两个已制图的限制性位点处切割、必要时填入突出物并连接,构建pBIO201中的几个缺失。在证实已缺失质粒的结构后,将各质粒转化至不同的大肠杆菌bio突变体中并对互补作用计分。结果总结于图7中。发现缺失衍生物pBIO203与6个已知的大肠杆菌生物素基因(bioA、bioB、bioC、bioD、bioF、bioH)互补,从而得出这所有6个基因位于从BamHI至XhoI的8kb DNA片段中。从该片段(pBIO204)的左侧去除3.8kb则消除了互补bioC和bioH突变体的能力。pBIO206只含有生物素簇最右侧2.5kb并只与bioA和bioF突变体互补。基于所述观察和杂交数据的顺序为bioC、bioH,(bioB、bioD)、bioF、bioA。
IE.克隆含有完整bioW的枯草芽胞杆菌片段。
DNA测序(见下文)揭示bio操纵子的启动子未在任何初始克隆的DNA片段之上。然而,借助染色体步移找到了该启动子区。没有一个由大肠杆菌突变体互补作用初始分离的克隆可比pBIO100能向右侧扩展的更远。由于bioA位于这些克隆的最右侧且已经选择出用于克隆的8-10kb长度的片段,所以这是令人惊异的。然而,pBIO100的克隆插入物最右的DNA序列表明约300bp的开放读码与球形芽胞杆菌bioW有某些类似于含有pcnB突变以降低质粒拷贝数的大肠杆菌bioA细胞中克隆含有bioA和邻接上游区的片段(Lopilato et al.,Mol.Gen.Genet.205,285-290(1986))。在该条件下克隆含有bioA上游另外2.7kb DNA的PstI片段,用DNA测序确定bio操纵子起始位置。
大肠杆菌中pcnB突变导致ColE1-衍生的质粒包括pBR322和pUC衍生物,以低拷贝数维持,(Lopilato et al.,1986,同上文)。构建含有bioA和pcnB的大肠杆菌株BI259。限制性酶、缺失和Southern分析表明5.5kb PstI片段应含有完整的bioA基因。用PstI消化枯草芽胞杆菌GP275染色体DNA并用琼脂糖凝胶电泳按大小分级分离。将4.4至6.6kb片段的集合体与pBR322衍生质粒连接并用于转化BI259。选择氨苄青霉素抗性和生物素原养型回收含有5.5kb插入片段质粒pBIO116。所说质粒可以高频率将BI259转化为生物素原养型但不能将R879(bioA,pcnB+)转化为生物素原养型或氨苄青霉素抗性。利用含有与球形芽胞杆菌bioW有某些相似的300bp探针(pBIO100的600bp PstI-BamHI片段)进行Southern杂交证实克隆的DNA含有bioW同源物。
从pcnB背景可以获得极有限量的pBIO116。据报道用于本克隆实验的pcnB80等位基因可将pBR322复制子的拷贝数减少至约野生型水平的6%(Lopilato et al.,1986,supra)。为改善质粒产而不影响质粒稳定性,在低拷贝数质粒中克隆DNA。用bioW3′末端内一个BamHI位点从pBIO116中将3.0kb BamHI-PstI片段亚克隆至pCL1921中。pCL1921是低拷贝数质粒pSC101的衍生物,含有pUC19的LacZ′/多接头克隆区和可选择放线壮观素/链霉素抗性基因(Lerner和Inouye,Nuc.Acids.Res 18:4631,1990)。pCL1921拷贝数为每个细胞约5-10个拷贝。将由pBIO116纯化的3.0kb BamHI-PstI DNA连接至BamHI和Pst切割的pCL1921 DNA,并将连接的DNA转化至pcnB+大肠杆菌株MM 294中,选择放线壮观素抗性(100μg/ml)。回收含有正确的3.0kb BamHI-PstI片段的质粒pBIO350。由该株回收的pBIO350的量与由pcnB80株分离的pBIO116相比显著增高,且未丧失质粒稳定性。
实施例II
枯草芽胞杆菌bio基因簇的DNA测序
为进一步鉴定bio生物合成基因、理解控制其表达的调节装置和确定适于进行遗传工程方法加工的位点位置,按供应商的指示使用SequenaseTM试剂盒(第二版,United States Biochemicals,Cleveland,OH,USA),以Sanger双脱氧测序法测定在克隆pBIO100和pBIO350上所含枯草芽胞杆菌bio基因的序列。
II A.DNA测序策略
所用的获得包含枯草芽胞杆菌bio基因在内的8-10kb区的DNA序列之策略是将该区分至四个约相同大小的质粒亚克隆中,然后使多套嵌套缺失在各亚克隆中顺利进行。为产生嵌套缺失,应用了“核酸外切酶III-核酸内切酶S1”法;试剂以试剂盒的形式购得(Promega,Madison WI,USA)。嵌套缺失由其中三个亚克隆的两端和第四亚克隆的一端制得。对其中三个亚克隆的两套嵌套缺失的测序给出了每个亚克隆的双链序列,它对于获得完整准确的序列是必要的。用相似方法测定了pBIO350的一条链,并通过以约150bp的间隔合成的测序引物测定相对链。非交叠亚克隆间的连接通过用pBIO201或pBIO100(或其亚克隆)作为模板由合成的引物测序加以证实。将序列排列并与DNASTAR计算机程序(DNASTAR,Inc,Madison,WI,USA)进行比较。
IIB.bio特异性编码区和转录调节信号的鉴定与组成
对pBIO100和pBIO350~8500bp DNA序列的分析表明存在单个bio操纵子含有7个编码区(图5A,图14和SEQ ID NO:1)。所说DNA序列于pBIO350的bio操纵子的5′末端起始并贯穿pBIO100,人们发现含有由生长型(δA)枯草芽胞杆菌RNA聚合酶(称为Pbio)识别的推定的启动子序列的头~100bp邻于由与球形芽胞杆菌bio操纵子的操纵基因位点有强的序列同源性所定义的转录调节位点。
推定的启动子区的核苷酸序列示于图4(图4中的符号如下,虚线:双重对称性区;黑体下划线:与球形芽胞杆菌bioDAYB调节位点的相似性;δA:由生长型枯草芽胞杆菌RNA聚合酶识的启动子区;RBS:核糖体结合位点;*:由dam甲基化阻断的限制性位点。推断的氨基酸序列示于核苷酸序列下面)。Pbio的序列为TTGACA--17bp--TATATT(SEQ ID NO:2)并与枯草芽胞杆菌δA共有序列TTGACA--17/18bp--TATAAT(SEQ ID NO:3)具有良好的一致性。该区紧接有与bioW(259个氨基酸)同源的ORF(开放读码),然后接有与bioA(448个氨基酸)、bioF(389个氨基酸)、bioD(231个氨基酸)和bioB(335个氨基酸)同源的ORFs。接着的两个开放读码ORF1(bioI;395个氨基酸)和ORF2(253个氨基酸)表明与任何已知bio基因无序列相似性(图5A)。启动子、基因和公认的转录终止位点的位置总结于表1中。
表1.总结枯草芽胞杆菌生物素操纵子中的基因、启动子和调节元件(碱基的编号系指SEQ ID NO:1和图14)
基因或元件 |
|
起始碱基 |
中止碱基 |
评论 |
σA启动子潜在调节位点bioWbioAbioFbioDbioBbioIorf2orf3rho-非依赖性中止位点 |
5/启动子上游bioB和bioI之间bio操纵子的3′端 |
324355439120825443710440854846748769524954237501 |
3523871218255437134405541566717509--29154627543 |
Pbio与圆形芽胞杆菌bio操纵基因位点同源ATG起始ATG起始TTG起始TTG起始ATG起始GTG起始GTG起始GTG起始 |
启动子、转录终止位点和核糖体结合位点的位置和方向指示着含有bio基因的单一操纵子。各基因之前有强芽胞杆菌核糖体结合位点(RBS),其计算的ΔG’s 从-11.6至-20.4Kcal/mol。所有基因均以相同转录方向(右至右)定位。另外,bioA、bioF、bioD和bioB的5′末端与各前接基因的3′端重叠,这表明所说基因的表达部分由翻译耦联调节。bioI和ORF2分别被68和67个碱基对顺反子间区域前一个基因分开,这表明它们不是翻译性耦联的。由于bioW基因其前有潜在RNA聚合酶(δA)启动子位点和上文讨论的推定的操纵基因位点,因此它似乎是操纵子中的第一个基因。该启动子区代表bio操纵子的起始处,因为从此处上游的约50个bp为与rho-非依赖性转录终止位点相似的茎环结构。该推定的终止位点代表不同转录单位的末端,因为在它之前是带有标记为ORF4-5(299个氨基酸)的强芽胞杆菌属核糖体结合位点(RBS;ΔG=-14.8Kcal/mol)的编码区,它与bio操纵子方向相同(图8)。最后,以相反方向定位的ORF4-5更上游处存在接有一个接着另一开放读码ORF6前266个氨基酸的强芽胞杆菌属RBS(ΔG=-17.4Kcal/mol),ORF6;ORF6的其余部分在向PstI位点远测继续排列。所推断的ORF6氨基酸序列表现出与许多涉及lacI阻遏物的调节蛋白有显著的相似性,所说lacI阻遏物有:大肠杆菌ebgR(未知功能的隐蔽操纵子的阻遏物)、大肠杆菌purR(嘌呤核苷酸生物合成操纵子的阻遏物)和大肠杆菌cytR(编码降解酶的deoCABD、udp和cdd和编码转运和成孔蛋白质的nupC、nupG和tsx的多效性转录阻遏物)。可以协调ORF4-5和ORF6的转录,因为我们检测了位于ORF4-5和ORF6(TTGTAA--18bp-TAATAT(SEQ ID NO:4)→ORF6;TTGATA--17bp--AAAAGT(SEQ ID NO:5)→ORF4-5)5′末端间175个bp间隙与一系列反向重复序列中的两个重叠δA启动子序列。
基于在编码区末端紧接与rho-非依赖性转录终止位点相似的稳定茎环结构的存在,ORF2是bio操纵子中的最后一个基因。带有终止子样特征的第二茎环结构已在bioB和bioI间的顺反子间区中鉴定出。最有利结构的ΔG为-11Kcal/mol和最不利结构的ΔG为-5.6Kcal/mol之间有几种可能的mRNA二级结构。
生物素操纵子末端下游为强RBS(ΔG=-20.0Kcal/mol)和另一编码区ORF3的260个氨基酸。ORF3的其余部分在作为已测序区末端标记的BstXI位点远侧继续排列。推断的ORF3的氨基酸序列表现出与许多大肠杆菌膜相关转运蛋白质:甘油-3-磷酸盐透性酶(ugpE和ugpA麦芽糖透性酶(malG和malF)和钼透性酶(chl)显著的相似性,具体地说,部分ORF3肽在COOH-末端区含有所有膜相关转运蛋白质共有的20个氨基酸序列。用在ORF3上游95个bp的推定的δA启动子序列TAGACA-N18-TACATT(SEQ ID NO:1;图14,#7600-7629)分别从bio操纵子中转录ORF3。
基因-酶的关系、酶的大小和与源于其它生物的同种酶的同源性百分比均总结于表2中。
在lac启动子的转录控制下,使用只含有bioI或ORF2的质粒亚克隆所进行的互补研究表明单独的bioI足以与大肠杆菌的bioC或bioH突变体互补。用PCR生产bioI和ORF2的拷贝。在各基因的5′端导入HindIII位点,在bioI的3′端导入BamHI位点以及在ORF2的3′端导入AspT18I位点。将PCR产生的各片段克隆至含不同拷贝数的三种质粒中:低拷贝数质粒pCL1921,中拷贝数质粒pJGP44(衍生于pBR322)和高拷贝数质粒pUC19中。在其中两个重组质粒中,bioI和ORF2的表达在lac启动子控制之下(pCL1921和pUC19)。
含有bioI的质粒与大肠杆菌BM7086(ΔbioH)和大肠杆菌R878(bioC)互补。含有ORF2的质粒不与大肠杆菌BM7086或R878发生正常互补作用。从这些实验中可以清楚知道枯草芽胞杆菌的bioI产物可以提供生物素合成所需的活性,它能取代或克服在大肠杆菌bioC或bioH所缺少的活性。
仅含有枯草芽胞杆菌bioW基因和其启动子的质粒(pBIO403)克隆至pCL1921中(Lerner和Inouye 1990,同上文)在和只在庚二酸以约30mg/l的浓度加至培养基中的条件下与大肠杆菌ΔbioH和bioC突变体互补。该实验证实bioW编码可绕过大肠杆菌bioH和bioC的庚二酰CoA合成酶。
表2.枯草芽胞杆菌中生物素生物合成的酶、基因和核糖体结合位点
|
基因 |
RBSΔG(kcal/mol) |
预测的起始密码 |
酶或功能 |
估计的氨基酸数目 |
估计的Mr |
氨基酸与相关基因形式一致的估计百分数 |
大肠杆菌 |
球形芽胞杆菌 |
其它 |
生物素生物合成的操纵子(图(262<sup>·</sup>位) |
bioWbioAbioFbioDbioBbioIORF2 |
-11.8-15.8-11.6-18.6-12.2-18.4-17.6 |
ATGATGTTGTTGATGGTGGTG |
庚二酜-CoA合成酶DAPA氨基转移酶7-KAP合成酶DTB合成酶生物素合成酶细胞色素P-4508-酮还原酶 |
259448389231335395253 |
29,63350,11842,56725,11436,93144,83828,204 |
34353234 |
444450287130b33c23d |
22a |
下游基因 |
ORF3 |
-20.0 |
GTG |
未知的膜相关转运蛋白质 |
>258 |
>28,600 |
25<sup>e</sup>23<sup>f</sup> |
|
|
上游基因 |
ORF4-5ORF6 |
5-14.9-17.4 |
ATGATG |
未知....未知调节蛋白质 |
299>266 |
33,780>29,200 |
29<sup>g</sup>27<sup>h</sup>27<sup>i</sup> |
|
|
a.与E.coli lipA.一致
b.与巨大芽胞杆菌细胞色素P-450BM-1一致
c.与Saccharapolyspora erythraea eryF.一致
d.与Saccharapolyspora erythraea eryAII.一致
a.与E.coli malG.一致
f.与E.coli ugpE.一致
g.与E.coli ebgR一致
h.与E.coli purR一致
i.与E.coli cytR一致
在枯草芽胞杆菌bioI或ORF2的推测氨基酸序列与大肠杆菌bioC或bioH基因或其它bio基因的蛋白质序列间未测到显著的相似性。然而,其后与GenBankTM蛋白质数据库的比较显示bioI与许多细胞色素-450酶有显著的相似性,这些酶来源于巨大芽胞杆菌(BM-1),S.ergthraea(eryF和eryK)、S.griseolus(suaC和subC),S.种株SA-COO(chop)和其它微生物。细胞色素P-450s是一类酶包括已知能催化许多不同种类的底物(包括脂肪酸)羟基化的单加氧酶。由于庚二酸(一种生物素前体)的合成可能参与未鉴定脂肪酸的羟基化和/或进一步氧化,所以bioI可能涉及生物素合成的早期步骤。基于bioI与bioC和/或bioH突变体互补的能力,bioC和/或bioH基因功能上等同于bioI。相似的比较研究显示ORF2与polyketide合成酶II(ergAII)的β-酮还原酶结构域较弱的相似性,polyketide合成酶II参与了红霉素形成的早期酶学步骤。
实施例III
bio操纵子和测接编码区的cat插入性诱变
为确定由核苷酸序列所预计的bio操纵子的界限并证实以前未鉴定的bio基因的作用,用Cat盒在bioW、bioI、ORF2、bio启动子区、ORF3、ORF4-5和ORF6(位于预计的bio操纵子边界外)中的构建插入或缺失。Cat盒包括氯霉素抗性基因。为制备上述构建体,首先在大肠杆菌中构建含有这些突变的质粒衍生物。然后用标准方法通过DNA转化将Cat插入转至枯草芽胞杆菌的bio染色体座位。为确定插入或缺失是否使生物素合成失活,评估含有这些突变的克隆在不含生物素培养基琼脂平板上于生物素存在或不存在的条件下的生长情况(Bio表型)。
如图9和图10上部所示,通过连接将Cat盒插入:至使用BamHI位点的bioW的编码区;至使用SmaI位点的bioI;至使用XmnI位点的ORF3;至使用EcoRV位点的ORF6;插至缺失ORF23′端一对SstI位点之间;或至缺失ORF4-5的一对BstBI位点间。通过将其连接入Eco47III位点用Cat盒而破坏bio启动子区,或者通过将其连接于HpaI位点间而全部替代该启动子区。在每个ORF2/SstI、ORF4-5/BstBI和/Eco47III构建体中,cat基因只以与破坏的编码区或启动子区相同的方向插入。在所有的其它构建体中产生了两种不同的质粒衍生物。其中Cat盒以两个可能方向插入。然后通过用限制性酶切割bioDNA外部首先将含Cat的质粒线性化并将切割DNA转化入有资格的原养型枯草芽胞杆菌株PY79中,再选择氯霉素抗性(Cmr)株从而将各突变整合入bio座位中。各突变体Bio表型总结于图9和图10下部。在位于预计bio操纵子、ORF3、ORF4-5和ORF6外的编码区内的插入产生了Cmr原养型克隆,这表明就生物素生产和营养缺陷型而言这些突变无表型。bio操纵子内的插入产生了复杂的结果,总体上支持核苷酸序列数据。以相对于生物素操纵子相反方向插入的Cat基因打断bio启动子区并以相对于生物素操纵子的两种方向之一插入的Cat基因打断bioW,其结果产生了明确的Bio-表型,这证实了这些序列位于bio操纵子/启动子区5′末端。然而,以与生物素操纵子相同的转录方向插入的Cat基因取代Pbio启动子区产生了低频率(0.1%)的Bio+细菌。生物测定实验表明在低浓度氯霉素存在的情况下可增加细菌生物素同效维生素的生产,这提示生物素操纵子的转录在Cat启动子的控制之下。用这种遗传学方法不能明确鉴定所说操纵子的3′末端。bioI内的插入产生了Cmr菌落,它们生物素生产中是部分缺陷的,即在无生物素培养基上生长差但在生物素存在时(33μg/ml)可生长至野生型水平,而ORF2::Cat突变产生了Bio+菌落。这些结果表明bioI对生物素生产不是绝对必要的,且在无外源性生物素存在的情况下ORF2基因产物似乎对野生型生长是非必需的。在含有ORF2::Cat11突变的birA株(如BI421;参见实施例XB)中未检测出对生物素生产的显著作用。然而仍用可能ORF2为生物素超量生产所需。
被称为Bio+/-的由bioI::Cat突变产生的部分生物素缺陷表型似乎由bioI的失活而不是由极性作用导致的,因为下游基因ORF2或ORF3内的突变力Bio+。为确定Bio+/-表型是否真实和证实bio基因产物是否参与了庚二酸的形成,通过饲喂庚二酸绕过bioI::Cat突变。如图9所总结的,含有以Cat基因两种方向之一的突变的PY79株在含有庚二酸(33μg/ml)的无生物素培养基中生长至野生型水平。这些结果证实了bioI基因产物参与早期的生物素形成以及该产物的失活仅部分破坏生物素生产。
实施例IV
生物素操纵子调节机制的分析
歧异大肠杆菌bio操纵子的bioABFCD的转录由传统阻遏物/操纵基因机制调节,包括由birA座位编码的阻遏物(Cronan,Cell.58,427-429(1989)).这种阻遏物是一种在将其转至脱辅基羧化酶之前于其COOH-末端载有全酶合成酶活性的双功能分子,所说活性可将生物素转换成生物素酰基-AMP(生物素的一种腺苷酸化的形式)。生物素酰基-AMP也起辅阻遏物作用,所说辅阻遏物--阻遏物/生物素酰基-AMP复合物通过与操纵基因位点结合阻断转录,所说操纵基因位点交叠两个分开的启动子的-10区。
为用几个强的和组成性枯草芽胞杆菌启动子之一取代之(参见实施例VII),所以了解了野生型bio操纵子的5′启动子和调节区的特征。枯草芽胞杆菌bio操纵子转录起始的最可能的位点是δA启动子Pbio,它在bioW上游约84bp处,是操纵子内的第一个基因(图4)。实际的mRNA起始位点是位于“TATATT”盒末端下游3-4bp处的2个腺苷核苷酸中的一个,或是位于“TATATT”盒处7bp的鸟苷。RNA前导序列含有与球形芽胞杆菌bio操纵子的“操纵基因”位点有强的序列同源性的33bp区段。该区的核苷酸序列与球形芽胞杆菌bioDAYB操纵子的5′非编码区的比较示于图11。[图11中的符号如下。上部序列(球形芽胞杆菌bioDAYB调节区)15bp调节区:双重黑体下划线;双对称性区:虚线;由引物扩展制图测定的转录起始位点:箭头;核糖体结合位点:RBS;“G”和“T”核苷酸被移置以方便序列排列。基于与上部序列中球形芽胞杆菌调节区的相似性的下部序列(枯草芽胞杆菌bio启动子区)13bp推定的调节区:单条黑体下划线;推定的转录起始位点:箭头;核糖体结合位点:RBS;“C”核苷酸被移置以方便序列排列]。
多数保守核苷酸群集在由9bp区段分开的2个位点(13和11bp)处。这一发现提示枯草芽胞杆菌bio基因的转录由阻遏物/操纵基因机制调节,可能包括位于trp操纵子附近的birA样基因(参见实施例IX)。通过表明翻译性lacZ融合至bioW(包含Pbio和推定的调节区)显示出β-半乳糖苷酶生物素调节的表达证实bioW上游启动子的活性和调节作用(参见实施例V)。
5′RNA前导序列含有交叠操纵基因区的潜在的稳定的大茎环结构(ΔG=-14.0Kcal/mol)。
基于对bioW上游的Pbio和调节位点鉴定,将枯草芽胞杆菌bio基因作为约7200bp的单个多顺反子信息转录。另外,也可能存在位于bio操纵子内部区域中的次级启动子位点。例如,与共有δA启动子序列有某些相似性的序列TTGAAA--17bp--TCTTAT(SEQ ID NO:6和图14,#6258-6286)位于bioI内(距bioI起始密码子下游约775bp处)。可通过用bio操纵子内侧部分的限制性片段构建翻译性lacZ融合体来确定是否这些序列发挥内部启动子的功能(参见实施例V)。通过修饰一个或多个初级或次级启动子来达到最理想的生物素生产。
IVA.bio-lacZ翻译性融合体的构建与分析
为证实推定的启动子和调节区的活性与调节作用以及评估多种不同上下游序列中枯草芽胞杆菌生物素操纵子表达的相对水平,构建了翻译性lacZ融合体。通过将含有缺少启动子lacZ编码区的3.1kbBamHI-BglII片段插入pBIO350的BamHI位点中以获得pBIO397和pBIO398而完成所说构建。这两个可能相同的质粒含有于低拷贝数质粒上bioW和lacZ之间的码内“翻译性”融合体。pBIO397和pBIO398在X-gal指示剂板上的lacZ-大肠杆菌变成浅蓝色,这表明融合体在大肠杆菌中以相对低的水平表达。
为试验用于在枯草芽胞杆菌生物素调节的表达的bioW-lacZ融合体,构建Bio+部分二倍体。用位于lacZ基因下游的多接头区内的单一SmaI位点将Cat盒克隆入pBIO397中。用含有与翻译性融合体相同方向定位的Cat基因的重组质粒pBIO397Cat产生Bio+部分二倍体。用pBIO397Cat质粒DNA转化原养型枯草芽胞杆菌株PY79的感受态细胞以筛选Cmr。只能通过重组入染色体产生转化体。这使bio操纵子为一完整拷贝,从而可以在无加入的生物素存在时测定lac融合体的活性。
用生物素调节克隆入pBIO350的从BamHI至PstI片段的启动子。检测两个含有bioW-lacZ融合体的CmrBio+部分二倍体在生物素存在(100μg/升)或不存在的情况下于无生物培养基中的β-半乳糖苷酶活性。在液体ONPG测定中,两个菌株均由生物素特异性调节。在生物素存在时β-半乳糖苷酶的水平被抑制,而在生物素不存在时可诱导其至24到85倍高的特异性活性(表3)。含有在bio操纵子处整合的bioW::lacZ融合体的该菌株也可被用于在X-gal指示剂板上分离新的生物素类似物-抗性突变体。
表3.bioW-lacZ翻译性融合体的生物素调节的表达
|
|
β-半乳糖苷酶活性(Miller单位:)a |
菌株
|
OD<sub>600</sub> |
+生物素(100μg/l) |
-生物素 |
增加倍数 |
PY79(bioW-lacZ)12APY79(bioW-lacZ)14A |
对数生<u>长</u>期晚期(0.7-0.8)静止期(1.1-1.4)静止期晚期(1.4-1.6)对数生长期晚期(0.7-0.8)静止期(1.1-1.4)静止期晚期(1.4-1.6) |
0.470.170.130.640.150.10 |
11.3011.006.8521.1012.308.45 |
246553338285 |
PY79(SPβ::bioW-lacZ)/#1PY79(SPβ::bioW-lacZ)/#3BI421(SPβ::bioW-lacZ)/#1BI421(SPβ::bioW-lacZ)/#3 |
(1.04-1.08)(0.988-0.960)(1.00-0.936)(1.07-0.92) |
0.040.060.670.96 |
0.600.491.000.86 |
1591.50.9 |
α-DB9(SPβ::bioW-lacZ)/#1α-DB9(SPβ::bioW-lacZ)/#3HB3(SPβ::bioW-lacZ)/#1HB3(SPβ::bioW-lacZ)/#3 |
(0.892-0.528)(1.344-1.200)(1.068-1.076)(1.213-1.320) |
0.180.110.240.18 |
1.651.350.320.15 |
9.212.31.30.8 |
a.两次测定的平均数,除α-DB9(SPβ::DioW-lacZ)/#1外(一次测定)。
IVB.含有SPβ的bioW-lacZ翻译性融合体的构建与分析
除实施例IV A中的lacZ融合体菌株外,还可以构建其它菌株以译解生物素调节机制。例如,本申请人认识到将合质粒的bioW-lacZ融合体插入至染色体中可导致许多技术问题,因为整合的质粒以拷贝数扩增。因此,检测以单一拷贝数在远离bio操纵子的位点处的bioW-lacZ融合体的表达,它是通过将融合体导入经修饰的SPβ专化转导噬菌体中进行的(参见,如Zuber et al.,J.Bacteriol.169,2223-2230(1987))。
按如上所述的方法测定PY79(SPβ::bioW-lacZ)和BI421(SPβ::bioW-lacZ)的两种分离物的β-半乳糖苷酶活性。结果总结于表3中。
Bio+株PY79中的SPβ::bioW-lacZ的表达非常低,但显示出生物素特异性调节作用。β-半乳糖苷酶在生物素存在时被抑制,而在没有生物素时则被诱导约9-15倍。与含有2个或多个含质粒bioW-lacZ融合体拷贝的PY79的早期测定相比,结果表明单一拷贝融合体在抑制性生长条件下产生的β-半乳糖苷酶少3倍,而在去抑制性生长条件下则少约20倍。于枯草芽胞杆菌birA株(BI421;参见实施例XB)观察到融合体的低水平组成性表达。birA株中的β-半乳糖苷酶的水平仅比生长于去抑制性生长条件下的PY79(SPβ::bioW-lacZ)中所观察到该酶的水平略高。在一种BI421(SPβ::bioW-lacZ)分离物中,生物素轻度抑制β-半乳糖苷酶的表达,这表明该birA突变不能完全降低融合体的生物素调节作用。这些结果证实bioW的表达由生物素调节。
检测了两个独立分离的生物素类似物-抗性突变体中生物素调节作用。HB3含有自发的birA突变而α-DB9含有未与bioA或birA连接的α-脱氢生物素抗性突变。如上所述,转导、生长和测定所说株,除了α-DB9(SPβ::bioW-lacZ)在指数生长中期进行测定。如表3所总结的,含融合体的HB3株显示了低水平的组成性lacZ表达。然而与birA突变体不同,α-DB9(SPβ::bioW-lacZ)显示了lacZ生物素调节的表达。
实施例V
由含有枯草芽胞杆菌bio基因的大肠杆菌分泌生物素和生物素同效维生素
在互补实验中,本申请人观察到含有pBIO201的大肠杆菌bio突变体可以交叉饲喂含有对照质粒pBR322的相同菌株,这显示出由含有pBIO201的菌株合成的生物素被分泌至培养基并被Bio-菌株代谢。因此本发明人检测了不同的新构建质粒将生物素或生物素同效维生素分泌至培养基中的能力。
用pBR322、pBIO201、pUC19和pBIO289(在下文实施例VI中描述)转化大肠杆菌MM294和JM109lacIQ(这两种菌株均为bio基因野生型)。pBR322和pBIO201转化体在含2%葡萄糖的最低限度培养基中生长。由于pUC19和pBIO289转化体在液体最低限度培养基中生长不好,所以将其置于含2%甘油的富集培养基中生长。48小时后,用离心去除细胞并以氯仿杀死残余的活细胞。用补充有0.5%葡萄糖和5mg/l硫胺素的Difco生物素测定培养基以10倍稀释系列稀释上清液,并检测上清液以支持大肠杆菌Δ(mal-bioH)和大肠杆菌Δ(bioA-D)的生长,下文描述。由生物素和脱硫生物素的系列稀释液制备标准曲线。该测定对1μg/l的浓度仍敏感。
这些测定的结果示于表4。含有编码枯草芽胞杆菌bio基因质粒的菌株分泌生物素,而含对照质粒的菌株不分泌生物素。这显示出含有枯草芽胞杆菌生物素操纵子(pBIO289)的大肠杆菌株能够分泌增高水平的生物素和生物素前体。
表4.由含枯草芽胞杆菌bio基因的大肠杆菌株生产生物素和生物素同效维生素*
菌株 |
质粒 |
生物素(μg/l) |
总的生物素和生物素同效维生素 |
(μg/l)<sup>*</sup> |
MM294JM109MM294 |
pBR322pBIO201pUC19pBIO289pUC19pBIO289 |
010010010 |
3100101100 |
|
*生物素同效维生素是作为脱硬生物素的同等物给出的。
可用该测定法检测由其它菌株如枯草芽胞杆菌或其它质粒产生的生物素或生物素前体的水平。在用带有功能性生物素操纵子的质粒转化候选菌株后,对候选菌株进行检测。另外,在已知的可分泌生物素的菌株中检测候选质粒。
实施例VI
“最小”bio亚克隆的构建
最小亚克隆编码初始初级克隆(如pBIO100和pBIO201)的所有相关功能。构建“最小”亚克隆以证实由缺失体制图和DNA序列信息衍生的bio基因的位置,并证实位于转录终止子至EcoRV位点右侧下游的开放读码并不为生物素生物合成所需。
将来源于pBIO201的EcoRV(部分)至BamHI片段(含有被认为是bio基因的所有开放读码,除bioW基因外)插入pUC9的SmaI至BamHI骨架中(Viera and Messing,Gene 19,259-268(1982))以构建pBIO289。由于pBIO289的bio基因全部位于pUC9的lac启动子的下游,并且pUC9以高于pBR322(pBIO100和pBIO201的亲本)的拷贝数维持,所以希望pBIO289能在大肠杆菌宿主中以比pBIO201和pBIO100更高的水平表达bio基因。将pBIO100、201和289以及pBR322(作为对照)转化入一系列同基因的大肠杆菌bio突变体中。测定每个转化体在缺乏生物素的培养基中的互补作用。结果见表4。
pBIO289与单一bio基因有缺陷的所有突变体互补,这结果证实所有的相关基因位于推定的终止子的上游终止子下游的开放读码(ORF3)对互补于任何单一大肠杆菌bio突变体是非必需的。
表5.由经选择的质粒进行的多种大肠杆菌bio突变体的互补作用
质粒 |
突变 |
pBR322 |
pBIO100 |
pBIO201 |
pBIO289 |
无Δ(gal-uvrB)ΔbioAbioBbioC23ΔbioDΔ(mal-bioH) |
+++------ |
+++-+++++++-+++ |
+++-++++++++-+++ |
+++-+++++++++++++++ |
实施例VII
全长的野生型及经遗传工程方法加工的枯草芽胞杆菌生物素操纵子的构建
以下描述了构建经遗传工程方法加工的、全长的bio操纵子以在枯草芽胞杆菌染色体中整合和扩增的实验。
VIIA.全长野生型bio操纵子的再构建
由于已证明以低拷贝数克隆枯草芽胞杆菌生物素操纵子的5′端对在大肠杆菌中进行工作是必要的,所以也用低拷贝数质粒构建完整的、经遗传工程操作的以整合至枯草芽胞杆菌染色体中的生物素操纵子。如前所述,将枯草芽胞杆菌bio操纵子的5′端克隆成pCL1921(Lerner and Inouye,1990,同上)(以每个细胞约5-10个拷贝存在的低拷贝数质粒)中3kb PstI-BamHI片段以产生pBIO350。
然后借助将pBIO201的bio操纵子的3′部分加至pBIO350构建全长的生物素操纵子。将来自含有生物素操纵子的大部分以及约3kb下游DNA的pBIO201的10kb BamHI至EcoRI片段连接至已用BamHI和EcoRI制成缺口的pBIO350中。所产生的两个具有正确的估计结构的质粒被称为pBIO400和pBIO401。pBIO401与所有已知的大肠杆菌bio突变体(包括ΔbioA-D突变体)互补。当用于ΔbioA-D株中的互补作用选择pBIO401并在其后于富含培养基中生产时,它的稳定足以生产可用量的质粒DNA。由于pBIO401所载的放线壮观素抗性基因不在枯草芽胞杆菌中表达,所以在pBIO401的EcoRI位点加入cat盒以便用本领域技术人员已知方法在野生型枯草芽胞杆菌或失调的菌株中进行选择、整合和扩增,这一过程产生了质粒pBIO401cats。
为确定增加的bio拷贝数对生物素生产的作用,将pBIO401Cats整合入枯草芽胞杆菌野生型和生物素失调的菌株中,pBIO401Cats含有Cat盒的单一拷贝(5μg/ml时对氯霉素有抗性)和整个bio操纵子。通过于60μg/ml氯霉素的选择扩增质粒拷贝数,生物素的生产从而也增加了。
VIIB.经遗传工程方法加工的bio操纵子的构建
在构建用于整合入枯草芽胞杆菌染色体的经遗传工程方法加工的、失调的生物素操纵子中,设置转录信号、调节位点以及编码区之间的独特限制性位点以容易导入另外的元件或等位基因是有用的。这些独特位点也被用于在所说构建体中侧接经遗传工程方法加工的生物素操纵子,以便在整合之前去除大肠杆菌衍生的载体序列。
本申请人发现用强的组成性启动子构建经遗传工程方法加工的枯草芽胞杆菌bio操纵子不是一
而就的。当用强组成性启动子(如SP01-15或SP01-26启动子)转录操纵子时,在大肠杆菌的单个质粒中维持整个枯草芽胞杆菌生物素操纵子是不可能的,即使是在低拷贝质粒中。应发展另一种新的策略以将含有整个经遗传工程方法加工的bio操纵子的可扩增DNA片段导入枯草芽胞杆菌染色体中。首先,为克隆和遗传工程方法加工的目的将操纵子以两个分开的部分(5′和3′盒)进行操作。其次,当DNA遗传工程方法加工完成时,将来自合适的5′和3′盒的相关DNA片段连接并将连接的盒直接转化至枯草芽胞杆菌中。设计的连接体能转运带有或不带有伴随载体序列的环状或多联分子,从而以可使插入的DNA扩增的方式插入经遗传工程方法加工的DNA,所说的分子将与染色体中的同源序列重组。
构建用作骨架载体的质粒以发展含有经遗传工程方法加工的bio操纵子的构建体。所说质粒是基于低拷贝数载体pCL1920(Lerner和Inouye,1990,同上)之上的。将pCL1920中的多接头用由NotI位点侧接的多接头替成。为简便起见,也将pCL1920中存在的lac启动子去除。将含有lac启动子和多接头的所说片段用EcoRI消除。将含有复制的pSC101起源和编码放线壮观素抗性的omega片段的所说骨架于NotI接头存在的情况下再环化,以产生pBIO121。质粒pJGP40是含有卡那霉素抗性基因的pBR322衍生物,所说的抗性基因克隆入由NotI位点侧接的多接头中。源于pJGP40的编码卡那霉素抗性的NotI片段被克隆入pBIO121的NotI位点中以产生pBIO124,两个方向指示为“a”和“b”(图12)。用Asp718I对pBIO124的两个衍生物进行的消化和再连接消除了卡那霉素抗性元件,留下完整的多接头,以产生质粒pBIO126a和pBIO126b。
VIIBi:遗传工程方法加工5′盒
在考虑用独特限制性位点将哪一个bio操纵子的5′端的功能元件分开时,最感兴趣的元件为:1)位于推定的生物素启动子上游的推定茎环终止位点;2)推定的启动子-操纵基因-前导序列区和3)核糖体结合位点、起始密码子和bioW的5′编码区。如图12所描绘的,我们的策略是用PCR导入位于终止子上游70bp的HindIII和SalI位点,其位于生物素启动子的上游。为将终止子与启动子-操纵基因区分开,将该区内的ClaI位点转换成XhoI位点。将位于bioW核糖体结合位点之前的Eco47III位点转换成XbaI位点,使启动子-操纵基因-前导序列区与核糖体结合位点-起始密码子片段分开。图13A描绘了所用的所有PCR引物及其方向。表6列出了由PCR产生的片段。一个三种方式的连接产生了质粒pBIO139,具体的连接是:1)与导入5′Hind III-SalI位点并将Eco47III位点转交为XbaI位点的PCR片段E连接;2)与将Eco47III位点转变为XbaI位点并扩展至bioW中的BamHI位点的PCR片段B连接;3)与pBIO126A载体的HindIII-BamHI消化物连接。第二个三种方式的与PCR片段C、D和SalI与XbaI消化的pBIO139的连接将ClaI位点转变为XhoI位点并完成了作为质粒pBIO144的初步构建。pBIO144含有带独特的XhoI位点和XbaI位点的bio操纵子经修饰的野生型5′末端,所说的XhoI位点替代了位于启动子/操纵基因区上游的ClaI位点,而所说的XbaI位点则替代了紧接在所说区下游的Eco47III位点(图13A)。证实了pBIO144的从SalI位点至BamHI位点的所预期的DNA序列。
VIIBii经遗传工程方法加工的3′bio盒
在pBIO126A中构建3′盒,所说质粒为带有侧接NotI多接头的低拷贝数质粒。为使pBIO126A能用作整合和扩增的载体,在BstBI位点处导入源于PHW9的Cat基因的PCR片段(Horinouchiand Weisblum,J.Bacteriol.150,815-825(1982))以产生质粒pBIO146A。将源于pBIO201(实施例IC)和pBIO289(实施例VI)的BamHI至EcoRI片段克隆入pBIO146A的多接头中以分别产生质粒pBIO151和pBIO152。所说的两个质粒在伴随bio操纵子的3′侧接序列的数量上有所不同。
VIIC.用组成性启动子对经遗传工程方法加工的bio基因进行的调节作用
可将来自如SP01噬菌体的不同组成性启动子(如SP01-26或SP01-15)(Lee and Pero,J.Mol.Biol.152,247-265(1981))加入代替XhoI和XbaI位点间的bio启动子/操纵基因区。在枯草芽胞杆菌染色体中整合和扩增后,产生了能指导整个生物素操纵子表达的得自组成性启动子的载体。这一过程反过来实质上改善了生物素生产。
表6.用于5′bio盒构建体的PCR制成的片段
PCR片段 |
σpstream上游引物 |
Downstream下游引物 |
bp<sup>*</sup> |
功能性元件 |
BCDE |
前导序列1ORF4.1BIOL4ORF4.1 |
ANEB1224BIOL3BIOL5BIOL5 |
73314095235 |
RBS,上游同源性,启动子,上游同源性,启动子, |
起始密码子,操纵基因,操纵基因 |
5′bioW终止子前导序列终止子前导序列 |
*用限制性核酸内切酶消化后的片段大小(bp)
VIICi:含SP01-26启动子的5′盒的构建
用含SP01-26启动子的PCR片段取代源自经遗传工程方法加工的“野生型”启动子的XhoI至XbaI片段,从而构建了读入生物素操纵子的含SP01-26启动子的5′盒。含SP01-26启动子的PCR片段由pNH201产生,pNH201为克隆的SP01-26启动子的pUC8亚克隆(Lee,G.,Talkington,C.and Pero,J.Mol.Gen.Genet.180,57-65(1980))。所用引物(XHO26A和XBA26B,表6A)于所说启动子上游侧导入XhoI位点,于所说启动子下游侧导入XbaI位点。XhoI-XbaI消化的PCR片段与XhoI-XbaI消化的pBIO144连接,并将连接的DNA转化入大肠杆菌YMC9中。筛选由SpecY转化体得到的质粒微量制备物以获得位于SP01-26启动子区内的EcoRV位点。然后用引物XHO26A和BIOW1通过PCR筛选表现有所期望的EcoRV位点的质粒,以证实SP01-26启动子和5′bioW片段的并列。两个带有正确结构的质粒pBIO158和pBIO159均有期望的序列。
VIICii:含SP01-15启动子的5′盒的构建
用PCR技术也产生了含有带适宜末端的SP01-15启动子(Lee et al.,同上)的DNA片段,所说片段用于在pBIO144中克隆。选择引物(XHO15B和XBA15C,表6A)以产生侧接含XhoI(上游)和XbaI(下游)位点的SP01-15启动子的片段。在得自SP01-15的转录物的起始处附近也存在潜在的茎环结构。设计的下游引物也可在biom RNA新的5′末端处扩展所说的潜在茎环,以包含由SP01-15启动子引发的转录物的所期望+1碱基。将含有SP01-15的XhoI至XbaI片段连接入XhoI-XbaI消化的pBIO144中。将连接的DNA转化入大肠杆菌中以制得pBIO168和pBIO169。pBIO168和pBIO169为含有带SP01-15启动子的5′bio盒的同样的分离物。
表6A.PCR引物
名称 |
引物的DNA序列 |
XHO26A |
5′GGCCCTCGAG GCCTACCTAG CTTCCAAGAA3′ |
XBA26B |
5′GGCCTCTAGA GCGTCCTGCT GTTGTTAAGA3′ |
BIOW1 |
5′GCCAATCCAT TCTGGAGA3′ |
XHO15B |
5′GGCCCTCGAG GCTATTGACG ACAGCTATGG TT3′ |
XBA15C |
5′GGCCTCTAGA ACAGGCGGGG TTGCCCCCGC CTGTAATTAAATTATTACAC A3′ |
VIICiii:全长经遗传工程方法加工的“野生型”bio操纵子的构建与整合。
通过在pBIO151和pBIO152的SalI和B8mHI位点间如上文所述导入得自不同的经遗传工程方法加工的5′bio盒的SalI至BamHI片段,构建全长经遗传工程方法加工的生物素操纵子,pBIO151和pBIO152含有bio操纵子的3′末端和可选择的cat基因(上文实施例VIIC(ii)中)。通过大肠杆菌株RY607(Δbio)与Bio+的互补作用选择适宜的转化体。例如,将得自pBIO144的“野生型”经遗传工程方法加工的5′生物素操纵子的SalI至BamHI片段导入pBIO151中,产生含有带3′侧接区的全长野生型bio操纵子和以与生物素操纵子相同方向定位的cat基因的pBIO155。将得自pBIO144的相同5′片段连接入pBIO152,产生了具有与pBIO155同样特征但缺少bio操纵子下游的3′侧接区的pBIO156。
将质粒pBIO155和pBIO156整合入含整个质粒或大肠杆菌载体序列缺失的枯草芽胞杆菌中(表7)。用质粒pBIO155和pBIO156转化枯草芽胞杆菌株PY79、BI421和HB3(两者为birA突变体;参见实施例×)并选择氯霉素抗性菌落。通过在平板上将菌株划线并增加氯霉素水平从而使整合的质粒扩增(表7,菌株BI228、230、235、237、243和245)。
为构建合有野生型生物素操纵子的已扩增拷贝但不含大肠杆菌序列的菌株,用NotI消化质粒pBIO155和pBIO156。将得自各消化物的较大片段环化并用于转化枯草芽胞杆菌株PY79、BI421和HB3。通过在平板上划线并增加氯霉素水平从而扩增所说盒(表7,菌株BI232、234、239、241、247和249)。
将SP01启动子驱动的bio操纵子连接物直接转化入枯草芽胞杆菌中。在标准条件下连接得自5′盒(5′测接序列、启动子区和5′bioW)的分离的NotI至BamHI片段和得自3′盒(3′bioW、bioA、bioF、bioD、bioB、bioI、ORF2、终止子、3′侧接序列和cat)的分离的BamHI至NotI片段,并用其转化多种枯草芽胞杆菌株。5′NotI至BamHI盒是得自含SP01-26启动子的pBIO158或得自合SP01-15启动子的pBIO168。3′盒得自含扩展的3′测接序列的pBIO151或得自含截短的3′测接序列的pBIO152(表7,菌株BI267、268、274、276、278和282)。
将每个所说的DNA连接物转化入野生型株PY79,在某些情况下也可转化入生物素失调的菌株BI421(birA突变体,参见下文实施例10B)。用标准方法制备菌株的感受态细胞并用上文描述的不同的含bio的DNA连接混合物转化以选择Cmr由于这些DNA不能在枯草芽胞杆菌中复制,所以将连接的DNA在bio座位整合入染色体产生Cmr转化体,所说的整合是通过染色体与转化的DNA上存在的同源序列间的重组进行的。在各实验中,选择10-50个Cmr转化体进行特征确定。用PCR筛选转化体以证实SP01启动子与bioW并列。
表7.第一代生物素生产菌株
菌株序列 |
亲本 |
整合的DNA |
启动子 |
3′侧接 |
BI222BI224BI226BI228BI230BI232BI234BI235BI237BI239BI241BI243BI245BI247BI249BI267BI268BI274BI276BI278BI282 |
PY79BI421HB3PY79PY79PY79PY79BI421BI421BI421BI421HB3HB3HB3HB3PY79BI421PY79BI421PY79PY79 |
pBIO401cat<sub>S</sub>pBIO401cat<sub>S</sub>pBIO401cat<sub>S</sub>pBIO155pBIO156NotI 片段pBIO155NotI 片段pBIO156pBIO155pBIO156NotI 片段pBIO155NotI 片段pBIO156pBIO155pBIO156NotI 片段pBIO155NotI 片段pBIO1565′pBIO158,3′pBIO1515′pBIO158,3′pBIO1515′pBIO158,3′pBIO1525′pBIO158,3′pBIO1525′pBIO168,3′pBIO1515′pBIO168,3′pBIO152 |
生物素生物素生物素生物素生物素生物素生物素生物素生物素生物素生物素生物素生物素生物素生物素SPO1-26SPO1-26SPO1-26SPO1-26SPO1-15SPO1-15 |
有有有有无有无有无有无有无有无有有无无有无 |
实施例VIII
第一代枯草芽胞杆菌生物素生产菌株的特征
应用Southern印迹实验证实整合的盒的结构并评估经遗传工程操作菌株的代表性子集的扩增程度。从这些实验可明显看出SP01启动子的存在对扩增的程度有显著作用。将经遗传工程操作的含野生型bio启动子的全长bio操纵子于生长在60μg/ml氯霉素中的菌株中扩增,使其扩增水平相似于在相似条件下其它操纵子扩增的水平(估计15个拷贝/细胞)。然而,SP01-15启动子驱动的bio操纵子表现出少2倍的扩增,且由SP01-26启动子驱动的bio操纵子少了约4倍的扩增。因此,枯草芽胞杆菌对至少一种由bio操纵子编码的产物有有限的耐受性。
VIIIA.测定试管培养物中的生物素和生物素前体的生产
为确定野生型bio操纵子或SP01修饰的bio操纵子的多拷贝对生物素生产的作用,检测含有这些经遗传工程操作的bio操纵子的野生型和生物素失调的枯草芽胞杆菌株的生物素生产,所说bio操纵子在其染色体内整合和扩增。结果示于表8。
将所有所说的菌株于5ml VY培养基中在37℃培养过夜,然后离心,将上清液高压消毒5分钟以杀死残存细胞。(生物素及脱硫生物素对高压消毒稳定)用不含生物素的培养基稀释上清液并用大肠杆菌将RY604(ΔbioH)和RY607(ΔbioABFCD)接种。RY604和RY607是由分别转导得自BM7086和Δ(gal-uvr)B219株(Cleary and Campbell,同上;Hatfield etal.,同上)入MM294中构建的。前者依赖生物素和生物素同效维生素生长,而后者仅依赖生物素生长。用于OD600的标准曲线计算由不同枯草芽胞杆菌突变体株产生的生物素和生物素同效维生素。
测定中枯草芽胞杆菌的野生型株PY79典型地生产约6~10μg/l的生物素(表8)。用于这些实验的VY培养基在细胞生长前含20~45μg/l生物素。因此,由培养基提供的大多数生物素在野生型细菌的生长过程中被消耗了。
有几种生物素类似物抗性突变体可产生50-100μg/l生物素,该生产量比野生型菌株中发现的生物素多5-10倍。应用了2种含birA样突变的生物素类似物抗性株。一个突变体株HB3含自发的高生物素抗性突变。另一株BI421含有已被杂交至未突变背景的乙基甲基硫酸酯产生的α-脱氢生物素抗性突变(参见实施例X)。在这些实验中两菌株产生了50-100μg/l的生物素(表8和9)。
野生型株PY79中的bio操纵子“野生型”拷贝的整合与扩增总体上其生物素产量超过单以PY79所见的生物素产量10-50倍(表8)。这种菌株(BI230和BI234)可生产150-600μg/l,而PY79单独只生产6-10μg/l。然而对含野生型bio操纵子的已整合和扩增拷贝的birA突变体株的测定可看到更引入注目的结果。应用该测定法可以观察到生物素生产又增加了5-10倍,使其产量达到2000μg/l(见BI241、BI237、BI249;表8)。
对含带SP01启动子的、经遗传工程操作的bio操纵子的野生型枯草芽胞杆菌所进行的分析改善了生物素生产,其生物素效价一般为1000-2000μg/l(见BI267和BI274;表9),而带野生型bio启动子则为150-600μg/l。含有组成性启动子的野生型和birA突变体株之间未看到生物素生产的显著差异(表9)。
测定的第二种类型应用了胚芽乳杆菌作为生物素指示剂(Wrightet al.,Proc.Soc.Exp.Biol.Med.56:95-98,1944)和酿酒酵母作为生物素同效维生素的指示剂(Baldet et al.,Eur.J.Biochem.217:479-485,1993)。按描述进行测定,除了向测定培养物加入抗生素以减少污染的干扰以外。由于胚芽乳杆菌对大多数抗生素敏感,选择一种自发的放线壮观素抗性突变体(胚芽乳杆菌Str3)并用其在50μg/ml放线壮观素硫酸盐存在的情况下进行生物素测定。酿酒酵母天然对大多数抗菌化合物有抗性并也在50μg/ml放线壮观素硫酸盐存在的情况下进行使用。胚芽乳杆菌对生物素的生长反应比大肠杆菌的生长反应降低更慢(超过约50倍的稀释范围)。酿酒酵母比大肠杆菌对DAPA和KAPA有更大的反应性。
当用乳杆菌属作为指示剂测定培养物的生物素生产时,可以确知更准确的水平。用这些条件,含经遗传工程操作的SP01-bio操纵子的枯草芽胞杆菌株几乎比含野生型bio操纵子的已扩增拷贝的失调枯草芽胞杆菌株产生多一倍的生物素(表10)。
表8.试管培养物中多种含已整合和扩增野生型bio操纵子的枯草芽胞杆菌的生物素生产
菌株名称 |
相关特征 |
生物素(μg/l)* |
生物素和生物素同效维生素(μg/l)<sup>**</sup> |
PY79A |
原养型 |
10 |
10 |
PY79B |
原养型 |
6 |
6 |
HB3 |
birA |
100 |
100 |
BI230 |
PY79::[pBIO156]<sub>60</sub> |
150 |
250 |
BI234 |
PY79::[Not/156]<sub>60</sub> |
600 |
1,200 |
BI245 |
HB3::[pBIO156]<sub>60</sub> |
500 |
2,000 |
BI249 |
HB3::[Not/156]<sub>60</sub> |
1,500 |
1,500 |
BI237 |
BI421::[pBIO156]<sub>60</sub> |
1,000 |
3,000 |
BI241 |
BI421::[Not/156]<sub>60</sub> |
2,000 |
3,000 |
*用大肠杆菌RY607(ΔbioABCDF)测定
**用大肠杆菌RY604(ΔbioH)测定
表9.多种含已整合和扩增经遗传工程操作的SP01 bio操纵子的枯草芽胞杆菌的生物素生产
菌株名称 |
相关特征 |
生物素(μg/l)* |
生物素和同效维生素(μg/l)<sup>**</sup> |
PY79A |
原养型 |
10 |
10 |
BI421 |
birA |
50 |
120 |
BI421 |
birA |
80 |
150 |
BI267 |
PY79::[Not/158,151]<sub>60</sub> |
1,000 |
2,000 |
BI268 |
BI421::[Not/158,151]<sub>60</sub> |
1,300 |
5,000 |
BI274 |
PY79::[Not/158,152]<sub>60</sub> |
1,500 |
2,500 |
BI276 |
BI421::[Not/158,152]<sub>60</sub> |
1,500 |
3,500 |
*用大肠杆菌RY607(ΔbioABCDF)测定
**用大肠杆菌RY604(ΔbioH)测定
表10.多种枯草芽胞杆菌的生物素生产
菌株名称 |
相关特征 |
生物素(μg/l)* |
生物素和同效维生素(μg/l)<sup>**</sup> |
PY79 |
原养型 |
6 |
10 |
BI421 |
birA |
45 |
200 |
BI239 |
已扩增的野生型bio操纵子/birA |
580 |
2700 |
BI282 |
已扩增的SP01-15-bio操纵子/PY79 |
1100 |
3600 |
*以胚芽乳杆菌str3测定
**以酿酒酵母测定
VIIIB:评价用于大规模生物素和生物素前体生产的菌株
用发酵技术可对用于大规模生物素和生物素前体生产的经遗传工程操作的产生生物素的菌株进行评价。可应用一系列发酵罐和介质条件。例如,下文中的发酵全部在计算机控制的14升Chemap发酵罐中用DO(溶解了氧气)控制、限制葡萄糖、饲喂批量发酵策略进行。如上文所述,接种系列稀释的胚芽乳杆菌或酿酒酵母适宜菌株的高压灭菌无细胞肉汤以测定所产生的生物素和生物素前体的量。表11描述了培养基成分和其它发酵条件。
表12列出了由多种菌株产生的生物素和生物素前体。在所有发酵中,向初始批和饲喂液中加入1g/l庚二酸。BI282、BI278和BI276是生物素和生物素前体生产的最理想菌株。
表11.生物素发酵条件和培养基(VY)成分 |
初始批(液) |
|
克 |
体积 |
加入时间 |
小牛输注肉汤 |
150.00 |
4.5升 |
灭菌60分钟,发酵罐内加入12.5ml 50% NaOH,灭菌前pH为6.8,灭菌后pH为6.6 |
酵母提取物 |
30.00 |
|
谷氨酸钠 |
30.00 |
|
KH<sub>2</sub>PO<sub>4</sub> |
45.00 |
|
MgCl<sub>2</sub>·6H<sub>2</sub>O |
9.00 |
|
MnSO<sub>4</sub>·H<sub>2</sub>O |
0.30 |
|
FeCl<sub>3</sub>·6H<sub>2</sub>O2 |
0.15 |
|
(NH<sub>4</sub>)<sub>2</sub>SO<sub>4</sub> |
12.00 |
|
|
MAZU DF37C |
15.00 |
|
约增加800ml体积 |
葡萄糖 |
150.00 |
0.3升 |
接种前临时加至发酵罐 |
CaCl<sub>2</sub>·2H<sub>2</sub>O |
6.00 |
|
饲喂液 |
KH<sub>2</sub>PO<sub>4</sub> |
54.70 |
0.2升 |
加至D |
MgSO<sub>4</sub>·4H<sub>2</sub>O |
6.00 |
|
|
葡萄糖 |
3,000 |
3.3升 |
与C混合加至发酵罐 |
接种物培养基 |
E.接种物培养基 |
|
|
分别高压灭菌,灭菌前pH调节至pH6.8 |
成分=“A”+0.35gm CaCl<sub>2</sub>·2H<sub>2</sub>O |
|
300ml |
|
|
|
F.20%麦芽糖 |
|
50ml |
冷却后加至E |
G.20%葡萄糖 |
|
25ml |
冷却后加至E |
酸 |
|
|
|
H.3.5% H<sub>2</sub>SO<sub>4</sub> |
|
200ml |
通常需要pH控制 |
碱 |
|
|
|
I.无水NH<sub>3</sub> |
|
|
pH控制 |
所有溶液(A-G)分别灭菌并在冷却后混合.
条件空气:1.5-2.0vvm;RPM:1000;PH 6.8;温度:37.0℃;压力:0.6bar.
表12.实验室规模的发酵罐中第一代枯草芽胞杆菌株的生物素和同效维生素的生产 |
发酵产品a |
菌株 |
启动子/菌株背景 |
生物素(mg/升)b |
同效维生素(mg/升)c |
B22d |
BI239 |
Pbio/BI421(birA) |
1 |
30 |
B19 |
BI268 |
SP01-26/BI421(birA) |
5 |
40 |
B23 |
BI276 |
SP01-26/BI421(birA) |
8 |
120 |
B20 |
BI278 |
SP01-15/PY79 |
10 |
60 |
B24 |
BI282 |
SP01-15/PY79 |
8 |
100 |
|
a所有发酵均用初始批和饲喂液中均含1g/升庚二酸的VY盐培养基(表11已描述)。 |
b用胚芽乳杆菌str 3于34小时时测定。 |
c用酿酒酵母于34小时时测定。 |
d24小时后培养物的OD<sub>600</sub>降低。 |
VIIIC:用生物自显影法分析发酵肉汤
可用生物自显影技术测定由生产生物素菌株分泌的同效维生素谱。在目前情况下,离心澄清发酵肉汤并用高压消毒灭菌。将1微升上清培养液点在Bakerflex微晶纤维素薄层色谱(TLC)板上并以正丁醇与1N HCl(6∶1v/v)的展开剂使化合物分开。干燥后,将色谱板翻转置于含氯化2,3,5-三苯基四唑和卡那霉素的无生物素琼脂板上温育1小时,并以大肠杆菌株RY604(ΔbioH)/pok12(KanR)浸渍。将KanR质粒pok12(Viera and Messing,Gene100,189-194(1991))加至RY604以仅使之有抗生素抗性以便减少测定中的污染。然后移去TCL板并将琼脂板于37℃温育。20小时后,相对于TCL板上的生物素和同效维生素位置的生长斑点显现出来。图15显示随代表性发酵样品的生物素和同效维生素标准。以此色谱系统观察到的Rf值示于表14。也可以采用纸色谱替代纤维素TCL应用该技术(表14)。与用RY634(ΔbioA-D::KanR,Bis+)的生物自显影比较显示在发酵肉汤中有实质量的脱硫生物素和生物素存在,所说的生物自显影只能检测生物素和生物素亚砜。
向发酵培养基中加入庚二酸盐致使可能是KAPA(图15,D道)的生物素同效维生素的水平增加。这可以由与无庚二酸盐的相似发酵(图15,B道)相比KAPA/BSO斑点的增加而显示出。该物质的一部分被证实是生物素亚砜,因为也在用RY634(ΔbioA-D::KanR,Bis+)的生物自显影中检测到它,所说的生物自显影只能检测生物素和生物素亚砜。然而,在KAPA/BSO位点以RY634产生的斑点强度比以RY604/pOK12检测到的显著减少。
脱硫生物素和KAPA的积聚表明于由bioB和bioA编码的生物合成步骤的限制。这种限制可以通过所说单一基因提高的表达或在底物中增加用于这些步骤的辅因子或协作蛋白质来加以克服。通过将单一bioB或bioA基因的亚克隆或所说基因的PCR拷贝插入含强启动子(SP 01,veg,etc.)的表达载体并将DNA于噬菌体(如SPβ)中的如pUB 110的质粒上导入细胞内,或者直接整合入染色体中非必需基因(如bpr)中分别提高bioB或bioA的表达。
表14.所观察到和报导的生物素同效维生素于纤维素色谱中的Rf值
生物素同效维生素 |
R<sub>f</sub> |
观察到的,<sub>TLC</sub> |
文献a,论文 |
DAPAKAPA生物素亚砜生物素脱硫生物素 |
0.090.520.860.94 |
0.090.350.700.82 |
aAgric.Biol.Chem.39,779-784(1975)
VIIID.对经遗传工程操作的菌株中bio特异性mRNA合成的分析
对已选择的菌株进行Norttern印迹实验以检测多种经遗传工程操作的菌株中存在的bio操纵子的转录方式以及bio特异性mRNA的量。正如所预计的,在所有经遗传工程操作的菌株中均可见包含整个bio操纵子的7Kb RNA转录本。该转录本也以较少的数量出现在野生型和birA突变体枯草芽胞杆菌株中。另外,所有菌株均含有较大量(约8倍)的包含bio操纵子中头5个基因的5Kb转录本,这提示大量的转录本于在bioB之后的潜在终止位点处结束(图5A)。也可见显著数量的含大多数bioW基因的0.8Kb小转录本。该转录本在与参与降解物阻遏位点的共有序列相似的序列附近终止(Chambliss,G.H.,“Bacillus subtilis and other Gram-Positive Bacteria”edited by Sonenshein et al.,Am.Soc.Miorobiology,PP.213-219(1993))。所说三个转录本相互间的相对比率对于无生物素条件下生长的野生型菌株、birA突变体株,或由野生型bio启动子或SP01启动子驱动的经遗传工程操作的菌株来说是相同的。在这些菌株中只有全部bio特异性RNA的绝对量有显著的不同。含有野生型或SP01-15启动子的经遗传工程操作的第一代生产菌株可比抑制的野生型细胞生产更多的bio特异性RNA,分别约多30倍或60倍。birA突变体中的bio特异性RNA水平仅比抑制的野生型细胞中的RNA水平略高(2-3倍),且不被在生物素中的生长所影响。
从这些实验中似乎可以看出SP01启动子比野生型bio启动子指导了每个操纵子至少多4倍的RNA的合成。然而,用减少了拷贝数的SP01-bio操纵子,其bio特异性RNA的总量至多仅比用充分扩增的野生型操纵子多2倍。RNA水平与生物素生产水平相关,含经遗传工程操作的、已扩增的SP01-bio操纵子的菌株比含已扩增的野生型操纵子的birA突变体株生产多出2倍的生物素,因此证实了一个或多个bio基因增加的表达将导致生物素效价的提高。
实施例IX
枯草芽胞杆菌birA样基因的遗传图的绘制
除含枯草芽胞杆菌bio操纵子的已克隆DNA外,回收了两个含枯草芽胞杆菌染色体DNA的重组质粒,pBIO113和pBIO114,所说的枯草芽胞杆菌染色体DNA与大肠杆菌birA调节基因中的温度敏感性突变互补。birA基因产物在大肠杆菌中起催化增加的生物素转成脱辅基蛋白的酶的作用以及起负性调节bio生物合成基因表达的阻遏物蛋白的作用。
用PBS1广义转导绘制枯草芽胞杆菌染色体上birA-互补基因位置的图谱。为达到此目的,制备了在birA座位附近含可选择抗生素抗性标志和cat的枯草芽胞杆菌菌株。然后,通过确定染色体中cat的位置,绘制出birA-互补DNA图。构建含有得自pMI1101的cat盒[Youngman et al.,Plasmid 12,1-9(1984)]的pBIO113衍生体,并将这种整合载体导入枯草芽胞杆菌染色体中。由于pBIO113的7.0Kb克隆的插入子和在枯草芽胞杆菌染色体中与其对应的区段同源,所以用Campbell重组[Campbell,Adv.Genet.11,101-145(1962)]使含cat的pBIO113进入染色体的整合将cat基因导入至birA旁。使用标准PBS1转导制图,birA互补DNA绘制在非常接近trp座位的染色体202区(>90%连接)。
实施例X
生物素生产失调的枯草芽胞杆菌宿主菌株的构建
XA.生物素类似物抗性菌株的构建
应用生物素类似物以选择生物素生产已失调的菌株。所找的突变是那些处于潜在的大肠杆菌birA基因的同源性的突变。然而,可期望对生物素类似物抗性的选择也可以产生含在birA的操纵基因位点或在编码负责将类似物转运入细胞的基因中突变的菌株。类似物抗性突变体也可含一个或多个编码抗抑制剂的酶的基因,所说抑制剂包括但不限于反馈抑制剂。由Nippon Roche KK(Kanagsua,Japan)获得生物素类似物(高生物素、α-脱氢生物素和5(2-噻吩)戊酸)。将枯草芽胞杆菌已突变细胞铺板于含有各生物素类似物晶体的TBAB(Difco Tryptose Blood Agar Base,cat.no.0232-01-9)板上。
用甲磺酸乙酯(EMS)使枯草芽胞杆菌PY79(一种来源于S.A.Zahler株CU1769(metB5,glnA 100;Youngman etal.1984同上)的经SPβ处理的原养型)突变以产生90%的杀灭。存活细胞生长过夜并将0.1ml培养物铺于TBAB板上。将两种生物素类似物的晶体铺于板上并于37℃温育过夜。α-脱氢生物素和5(2-噻吩)戊酸晶体抑制了枯草芽胞杆菌的生长并在晶体周围产生了透明带。透明带内出现了单个的菌落,提供了可能的生物素类似物抗性菌株的候选株。
从类似物α-脱氢生物素和5(2-噻吩)戊酸周围的透明带中取出几个菌落并且如果选自α-脱氢生物素带则命名为DB-1至D B-4,如果选自5(2-噻吩)戊酸带则命名为TP-1至TP-3。将分离的菌落划线接种于含不同量的各类似物的最低限度酪蛋白氨基酸平板上。所有的这些菌株均比在其各自类似物平板上的野生型细胞生长得更好(即产生更大的菌落)。
随后在相似平板中选择另外27个突变体,筛选其抗类似物高生物素(HB)和α-脱氢生物素(α-DB)的抗性。为了后一种选择,在两个独立的实验中,用EMS使枯草芽胞杆菌PY79培养物突变。第一个突变EMS1造成96%的细菌死亡,而第二个突变EMS2造成82%的细菌死亡。在富含培养基中生长的PY79、EMS1和EMS2的过夜培养物铺板于TBAB(富含)、BIOS(无生物素)或MIN(最低限度葡萄糖)平板上并将高生物素或α-脱氢生物素的晶体置于每个平板上。24小时后,观察到细菌已被杀死的区带,但所说区带中也含有一些抗性菌落生长。从高生物素平板或α-脱氢生物素平板中取出单个菌落并再划线接种于含有α-脱氢生物素或高生物素的BIOS平板上。
依其分泌可测水平的生物素的能力筛选潜在的阻遏物或操纵基因缺乏突变体。测定每个突变体株的生物素和生物素同效维生素的生产。每10个菌株在VY培养基中(5ml;20g/l Difco小牛输注肉汤和5g/l Difco酵母提取物)于37℃生产18-24小时,将上清液过滤除菌。然后将已过滤的上清液在无生物素培养基中系列稀释,并将系列稀释液用大肠杆菌株RY604(ΔbioH)和RY607(ΔbioABFCD)接种;前者可在生物素或生物素同效维生素中生长而后者只能在生物素中生长。用以生物素和脱硫生物素制得的标准曲线计算由不同的枯草芽胞杆菌生产的生物素和生物素同效维生素。收集物中的6个突变体可以生产约100μg/l的已分泌生物素,它们是同型生物素抗性突变体HB3、HB9和HB15,以及α-脱氢生物素抗性突变体α-DB9、α-DB16和α-DB17。其它的突变体或不生产生物素,或只生产10μg/l。可以预计用上述方法选择的其它突变体可以产生75μg/l、150μg/l或是至200μg/l、250μg/l或300μg/l。
XB.绘制生物素类似物抗性突变的图谱
实施例IX描述了枯草芽胞杆菌birA基绘制在正好在trpC 2下游的位置上。通过噬菌体转导检测这6个分泌生物素并有类似物抗性的突变体与trpC 2的连接,以确定是否它们位于birA样阻遏物中。将各候选菌株与枯草芽胞杆菌168(trpC 2)交联(crossed With),并将Trp+转导体补种于含或不含高生物素的基本平板上。结果表明6个类似物抗性突变体中的5个(HB3、HB9、HB15、α-DB16和α-DB17)与birA座位紧密地连接(trp+和类似物抗性的90-95%共转导)。BI421是168菌株的高生物素抗性(HBr)trp+转导体,含α-DB16的birA突变。
第6个含在α-DB9中的类似物抗性突变未连接至trpC,因此它不是在bir处的单一突变。通过在一相似的转导绘图实验中将α-DB9中的突变从α-DB9中转导入bioW::cat7株中(参见图9),表明了α-DB9中的突变未与生物素操纵子连接。因此α-DB9的突变体表型或是由于在远离birA和bioWAFDBI的第三座位处的突变,或是由于在不止1个座位处的突变,所说座位均为表达类似物抗性表型之所需。α-DB9突变能影响生物素透性酶、生物素外输泵或与生物素生物合成相关的酶。在不同座位(例如HB3和α-DB9的座位)处的类似物抗性突变可以借助标准链构建技术结合入单一菌株中,从而产生具有更大的生物素分泌能力的菌株。这些由上述方法分离和筛选的类似物抗性突变体或其它突变体可用作生物素超表达的宿主菌株。
将另外两个由α-DB12载有的生物素类似物抗性突变(如上所述依其对α-脱氢生物素的抗性分离的)和HB43(PY79(pBIO397cat)的一个自发高生物素抗性突变体)绘制至birA座位。
XC:枯草芽胞杆菌突变体DNA序列
可以在高生物素抗性菌株(如HB3)和α-脱氢生物素抗性菌株(如α-DB16)的birA基因中发现引起氨基酸改变的突变。为找到这种突变,可将野生型枯草芽胞杆菌birA基因的DNA序列与含有生物素类似物抗性突变的枯草芽胞杆菌birA基因之DNA序列相比较。可以通过测定pBIO113或pBIO114上的已克隆birA+基因序列获得野生型枯草芽胞杆菌birA基因序列。从所说基因的PCR拷贝可很容易地获得突变体birA基因序列。用得自各birA突变体的基因组DNA作为模板以及一对已知侧接于birA编码基因的引物可进行几个独立的PCR。然后可从两个独立PCR中分离DNA片段并将其克隆入大肠杆菌pUC21(Viera and Messing,Gene,100,189-194(1991)。用一系列内部引物可以对源于两个独立PCR的分离物测定其两者链的序列。任何由PCR导入的人工突变应只出现在两个独立PCR克隆中的一个内,而“真实”突变应在两上分离物中均出现。
通过与已知其三维结构的大肠杆菌birA蛋白[Wilson et al.Proc.Natl.Acad.Soi.USA.89,9257-9261(1992)]比较,可以确定突变的特征。例如,突变可以位于DNA接触螺旋(DNA-contacting helices)之一中,可用该种资料,构建其调节bio操纵子表达能力降低的枯草芽胞杆菌的改良的birA突变体株。例如,可用已熟知的位点直接诱变的方法将两个已测序的突变结合在一个基因中。另外,可以构建去除birA DNA结合部分但保留生物素连接酶活性的小的缺失。
实施例XI
第二代经遗传工程操作的枯草芽胞杆菌生物素生产菌株
在构建和确定第一代经遗传工程操作的枯草芽胞杆菌生物素生产菌株的特征的同时,本申请人观察到生物素调节系统的几个限制性步骤,对其的修饰可增加生物素的生产。例如,正如Southern印迹数据所示,SP01启动子驱动的生物素操纵子未扩增至与野生型生物素操纵子一样高的拷贝数。首先,在超量生产时对细胞有害的基因产物的鉴定以及该基因从已扩增盒中的缺失可以防止该问题的发生。其次,在生物素操纵子中存在两个mRNA合成的部分未成熟终止点。下面的实施例说明怎样将这些对生物素野生型调节系统用于使生物素生产达到最优。
XIA.为改善SP01启动子驱动的bio盒拷贝数的构建体
如前所示,由SP01启动子驱动的生物素操纵子比由野生型操纵子控制的生物素操纵子扩增得少。本申请人由此认为一个或多个bio基因的产物并不在高水平被耐受。用缺少所说特异性bio基因的生物素操纵子可以获得高水平的扩增。为确定这些基因中的那一个基因不在高水平被耐受,本申请人设计了下面的实验。
首先,为保证所有bio基因表达的某些组成性水平,在染色体中用SP01-15启动子替代生物素启动子。为此,将上游同源序列加至含SP01-15启动子的5′盒(pBIO168)。通过将源于正位于5′生物素盒上游的序列的1.8Kb PCR片段导入pBIO 168的SalI至NruI间隙中。用设计的导入上游端NruI位点和下游端SalI位点的引物产生1.8Kb PCR片段。所产生的质粒pBIO180含侧接有bio操纵子上游同源序列的1.8Kb和启动子下游0.7Kb的SP01-15启动子。用该质粒转化Δ::cat17(参见实施例III),Δ::cat17含有cat盒替代的生物素操纵子启动子区并且它为生物素营养缺陷型。双重的重组过程可使SP01-15启动子替代cat盒,产生所需的原养型株BI249Cms。
用标准技术可以在各bio基因中产生缺失。下面是在bioW中如何构建非极性缺失突变的一个实施例。
通过改变5′盒pBIO168产生bioW的缺失。产生含SP01-15启动子和在bioW的头三个密码子后接有BamHI位点的PCR片段(见图14)。将该PCR片段用遗传工程技术加工以便在替代了pBIO168的XhoI至BamHI片段后所产生的5′盒(pBIO178)形成一个与3′bio盒的连接的码内bioW缺失(见图14)。将该连接混合物转化至枯草芽胞杆菌BI294(见上文)以及Cmr整合体(BI294)的选择可使生物素操纵子在无扩增bioW的情况下得到扩增。bioW的染色体拷贝仍从SP01-15启动子转录。构建了含整合入BI294的完整SP01-15驱动的生物素操纵子的对照并称为BI295。与扩增的BI247相比,在两种情况下均降低(参见实施例VIICii)。这两种菌株扩增的比较提示biow并不是其产物在超量生产时有害的基因。
可用各bio基因重复该过程以鉴定在超量生产时有害的基因。
将缺乏已扩增bioW基因的BI296的生物素生产与含已扩增bioW基因的同源株BI295相比较所作的分析指出bioW的产物并不是生物素生物合成的限速酶(表15A)。BI296可比其不含已扩增bio盒的母本株BI294可生产多约10倍的生物素。而且,BI296与含完整SP01-bio操纵子的同源对照株BI295生产相近量的生物素。以每个bio基因中内部的、非极性缺失重复这些实验将鉴定出枯草芽胞杆菌中生物素生物合成的限速基因。
表15A.多种枯草芽胞杆菌株的生物素生产 |
菌株名 |
相关特征 |
生物素(μg/l)* |
生物素和同效维生素(μg/l)<sup>**</sup> |
PY79 |
原养型 |
4 |
10 |
PY79 |
原养型 |
6 |
10 |
DB16 |
birA |
46 |
140 |
BI294 |
SP01-bio/PY79 |
165 |
360 |
BI294 |
SP01-bio/PY79 |
125 |
450 |
BI295A |
已扩增的SP01-bio操纵子/BI294 |
1116 |
3150 |
BI295B |
已扩增的SP01-bio操纵子/BI294 |
1405 |
5000 |
BI296A |
ΔbioW已扩增的SP01-bio操纵子/BI294 |
1402 |
4000 |
BI296B |
ΔbioW已扩增的SP01-bio操纵子/BI294 |
1574 |
3950 |
*用胚芽乳杆菌str3测定<sup>**</sup>用酿酒酵母测定 |
XIB.除去可能的转录终止位点
在生物素操纵子中有两个内部终止位点。观察到一个约0.8Kb的mRNA片段,它相应于从启动子至bioW中某区的距离,所说的某区与作为枯草芽胞杆菌降解物阻遏序列(CRS)的共同序列有同源性。Northerns中所见的主要生物素转录本是5.2Kb。这相对应于启动子至bioB-bioI连接处的距离,在所说的连接处茎环结构后接有线状T残基。加工构建物以消除CRS并增加与操纵子末端连接bio-bioI连接至转录后水平。
XIBi:去除降解物阻遏序列
在枯草芽胞杆菌中,孢子形成和某些酶的合成是受降解物阻遏的(Chambliss,G.H.,in“Bacillus subtilis and Other Gram-Positive Bacteria”Sonenshein et al.,eds.Amer.Soc.Microbiology,Washington,D.C.PP.213-219(1993))。
两个潜在的降解物阻遏位点(CRS)位于bio操纵子中或在其周围。一个位于ORF3的推定的5′前导序列区。第二个降解物阻遏样序列位于bioW 3′末端内。该序列的位置与在Northem印迹中检测到的0.8Kb特异性转录本的3′末端巧合,这提示降解物阻遏可以部分控制生物素操纵子的表达。在该降解物阻遏样序列中还存在一短的AbrB调节序列(Stauch,M.A.,in“Bacillus Subtilisand Other Gram-Positive Bacteria”,Sonenshein et al.eds.Amer.Soc.Microbiology,Washington,D.C.PP 757-764(1993))。
在图17A中说明了编码BamHI位点和CRS的bioW部分。CRS从BamHI位点上游11bp开始。可将由CRS组成的序列中的四个密码子转化成另外的密码子而不改变氨基酸序列,通过在第三个位置上的改变。第三个位置的变化改变了CRS的四个最高度保守的残基(下划线)中的三个(图17A)。
如图17A所示,bioW中的CRS位点与AbrB共有结合位点有显著的同源性。在改变CRS的序列时所考虑的是AbrB结合位点在序列上相似且必须注意在破坏CRS时不产生强的AbrB结合位点。然而,导入以破坏CRS的改变也降低了与AbrB位点的同源性。为导入图17A所示的变化,设计PCR引物使之包括BamHI位点、含所需突变的CRS区以及用于引发的20个残基。适宜的下游引物可以产生能被BamHI和Bst 1107I消化的660bp片段。在质粒pBIO289中,BamHI和Bst 1107I限制酶均有唯一的位点。将BamHI和Bst 1107I切割的PCR产物克隆至BamHI和Bst 1107I切割的pBIO289中以获得质粒pBIO179。然后将得自pBIO179的BamHI到EcoRI片段克隆至pBIO146A中以产生新的3′盒质粒pBIO183。为改变bioW染色体拷贝的序列,采用了两步法。首先,在BI294(实施例XIA)bioW中的BamHI位点处(参见实施例III)导入cat基因,从而产生了营养缺陷型BI294::cat7。以线性pBIO179转化所说的营养型以及Bio+的选择产生了菌株BI297,它具有由SP01-15启动子驱动的、bioW序列的生物素操纵子的单一染色体拷贝,所说的bioW序列已被改变以破坏降解物阻遏序列。将5′盒(即pBIO168)与新3′盒pBIO183一起使用,在BI297中整合和扩增可保证经扩增修饰的bioW,并且可以减轻由于降解物阻遏产生的未成熟的终止。这个菌株是BI306。用这种方法产生了对降解物阻遏有较小敏感性的第二代生产菌株。
XIBii.去除或绕过bio后的终止位点
采用了两种策略以增加位于转录本终止内部位点下游的生物素基因的表达。第一种策略涉及终止子的缺失。第二种策略为在bioI前插入SP01-15启动子以使bioI和ORF2进行强转录。为使位于顺反子间区的终止子缺失(图17B),设计了适宜的PCR引物。将一个引物与位于一个BspEI位点上游的bioB杂交。第二引物互补PmlI位点、bioI的核糖体位点的第二个引物跳过51bp,然后互补于终止密码子和于bioB 3′末端的23bp(图17B)。以BspEI和PmlI消化产生了被用于替代pBIO289的BspEI至PmlI片段以获得pBIO181的209bp片段。用该质粒通过将BamHI至EcoRI片段克隆至pBIO146A中以获得pBIO185的方法产生新的3′盒。以两个步骤完成BI294中染色体生物素操纵子的改变以使位于bioB和bioI间的终止子缺失。首先,用与实施例III中描述的方法相似的策略,将cat基因导入bioB末端,从而产生了bio-、Cmr株BI300。当用线性质粒pBIO181转化BI300时,Bio+分离物含有所需的终止子缺失并且表示为BI303。通过用源于pBIO168和pBIO185已连接的BamHI至NotI片段转化BI303构建含终止子缺失的已整合和扩增过的生物素操纵子,且表示为BI307。
为保证bioI和ORF2最大程度的表达,将SP01-15启动子导入bio之前。通过PCR扩增源于pBIO168的SP01-15启动子在下游侧导入核糖体结合位点和bioI的起始密码子/PmlI位点,以及上侧导入StuI位点。所用的引物是:(1)5′-GGC CAT TCTACA CGT GAT TTT CTC CTT TCT GTC TAG AAC AGG CGG GGT TGC;和(2)5′-GGC CAG GCC TGG CTA TTG ACG ACA GCT ATG GTT。由于用StuI和PmlI消化DNA产生了平头末端,所以以PmlI消化pBIO289可以导入stuI/PmlI消化的PCR片段。PmlI位点以一种方向在bioI起始密码子处重新产生且SP01-15启动子指导bioI和ORF2的转录。具有该方向的质粒称为pBIO182。通过将pBIO182的BamHI至EcoRI片段克隆至pBIO146A中构建了新的3′盒(pBIO184)。该构建体有希望能够比通过消除bioB和bioI间终止而产生更多的bioI和ORF2的转录。
借助含线性pBIO182的转导BI300(见上文)并选择bio+,将SP01-15启动子驱动的bioI构建体导入BI294的染色体拷贝中产生BI304。整合和扩增产生BI308。
XIBiii.由单一拷贝终止子修饰的菌株的生产生物素
如实施例VIIIA中所描述,利用乳杆菌属和酵母属测定试管培养物中的生物素和同效维生素用BI294作为缺失了bioB和bioI间终止子的BI303和在bioI之前导入了SP01-15启动子的BI304的对照。如表15B所示,终止子的缺失或bioI之前SP01-15启动子的导入对生物素效价没有什么作用,但显著增加了生物素同效维生素的生产。
表15B.终止子修饰的菌株的生物素和同效维生素的测定 |
菌株 |
生物素座位 |
生物素μg/l |
同效维生素μg/l |
BI294C |
SP01-15bio |
126 |
481 |
BI294D |
|
315 |
528 |
BI303A |
SP01-15bioΔT |
313 |
838 |
BI303B |
|
200 |
790 |
BI304A |
SP01-15bio |
182 |
2800 |
BI304B |
SP01-15bioI |
179 |
3138 |
XIC:改变bio基因核糖体结合位点
通过改变核糖体结合位点使之更接近与含序列5′AGAAAGGAGGTGA3′的典型枯草芽胞杆菌核糖体结合位点,改善bio操纵子中基因的转译。通过合成编码适宜限制酶切位点、修饰的核糖体位点的DNA引物以及足够的下游DNA以保证引发PCR反应,可以导入这些变化。借助选择适宜的第二引物,本领域的技术人员能够合成含已修饰核糖体结合位点的PCR产物。然后借助与用于导入已修饰CRS序列(实施例XIBi中描述的)同样的方法将含已改变的核糖体结合位点的PCR片段导入经遗传工程方法加工的bio操纵子中。
实施例XII
枯草芽胞杆菌的壬二酸抗性(Azlr)突变体
壬二酸(一种直链C9二羧酸)是庚二酸的同系物,且被认为是由油酸至庚二酸转变的中间物(参见Ohsugi and lnoul Agric.Biol.Chem.45,2355-2356(1981))。1g/l的庚二酸可以刺激枯草芽胞杆菌中生物素同效维生素的生产,且30mg/l的庚二酸可以恢复野生型生长至PY79bioI::cat9营养徐缓型(见实施例III)水平。在支持PY79bioI::cat9生长方面,30mg/l的壬二酸不能取代庚二酸。事实上,30mg/l的壬二酸严重地抑制了PY79bioI::cat9的生长。更高浓度的壬二酸抑制野生型枯草芽胞杆菌的生产,通过加入1μg/l的生物素可逆转这种抑制。由这些结果,本申请人认为壬二酸是枯草芽胞杆菌中生物素生物合成的特异性抑制剂。
野生型大肠杆菌株MM294对壬二酸有相对抗性。含有pBIO403的大肠杆菌株PY604(ΔbioH)为生物素营养缺乏型,尽管30mg/l庚二酸能满足其生物素的需求,所说pBIO403只含有枯草芽胞杆菌的bioW基因。然而,在过量庚二酸(80mg/l)中生长的PY604/pBIO403对壬二酸的抑制敏感。因此,本申请人得出结论:壬二酸在庚二酰CoA合成酶(bioW)水平,或作为庚二酸的竞争性抑制剂,或通过掺入生物素类似物中或其它毒性中间物中起作用。
XIIA.分离枯草芽胞杆菌壬二酸抗性突变体
在基本琼脂上,2g/l(约10-2M)壬二酸严重地抑制PY79的生长,尽管它没有杀死或完全阻止生长。分离到七个于2g/l壬二酸中生长速度超过以PY79为背景的菌株的自发突变体。将一个以外所有突变体均具有对壬二酸抗性的稳定的特性(见下文)。将这七个突变体暂时命名为PA1-PA7(PY79壬二酸抗性的)。PA1至PA7均生长在含VY培养基的试管中,且用大肠杆菌指示剂菌株测定生物素生产(表15)。将突变体分成两类,一类是比PY79能生产更多的生物素(PA5、PA6)和另一类与PY79相似(PA1、2、3和7)。PA4似乎或不稳定或不是真正的突变体,所以将其从进一步的实验中撤出。本申请人也注意到这些突变体在含2g/l壬二酸的基本琼脂上依菌落大小分成两类,并且这两类突变体相当于两类生物素生产体(表11)。在上清液中有最多生物素的突变体产生小菌落。而生物素非分泌者(PA1、2、3和7)产生大菌落。PA1和PA3分泌一种于含2g/l壬二酸的基本平板上交叉饲喂PY79(即逆转PY79的壬二酸抑制作用)的化合物。
选出这两类壬二酸抗性突变体的代表物PA3和PA6进行进一步的特征描述。在含系列稀释的壬二酸的液体基本培养中,与其亲本PY79相比PA3和PA6显示了明显的壬二酸抗性(图18)。然而,PA3和PA6的剂量反应曲线互相远离。PA3比PA6显示出更大的抗性,且在低浓度壬二酸中PA6不能生长至与PA3或PY79同样的细胞密度。
XIIB:绘制壬二酸抗性突变体的图谱
为绘制PA3和PA6中壬二酸抗性突变的图谱,本申请入确定了是将突变绘制在birA还是在生物素操纵子处。在第一种情况下,将由PA3和PA6 PBS1转导裂解物用于菌株RL1(trpC2),且选择Trp+转导体。通过转导约90%的trpC2和birA座位被连接。然后借助补种至含2g/l壬二酸的基本琼脂上筛选有壬二酸抗性的Trp+转导体。没有Trp+转导体是壬二酸抗性,这证实不仅突变未被连接至trpC2,并因此没有birA突变。在两个转导(一个进入PY79 Pbio::cat17,另一个进入PY79 bioW::cat7)中表明PA3突变与bio的强连接,而PA6突变则没有。
XIIC.壬二酸抗性突变对生物素生产的影响
改变生物素调节的另一种方法是将壬二酸抗性突变与birA突变结合起来。
通过两步转导方法将HB3或α-DB16的birA突变导入PA3或PA6中。首先,通过用trpE::Tn 917 lac[Perkinsand Youngman,Proc.Natl.Acad.Sci.USA 83,140-144(1986)]的转导使PA3和PA6成为Trp-,选择红霉素抗性。从HB3或α-DB16中转导birA突变以选择Trp+。筛选有高生物素抗性和壬二酸抗性的亲本和Trp+转导体。PA6为高生物素敏感的,所有通过筛选高生物素抗性菌落可鉴定Trp+转导体中双重突变体。只有约60%的Trp+转导体也有高生物素抗性(这可能由于birA和trpE间图距的Tn917改变,通过转导正常情况下有90%的连接)。PA3对高生物素有抗性,所有直接鉴定双重突变体是不可能的。然而,正如由增加的生物素分泌所判断的,转导体的60%为双重突变体,见下文。
在VY试管培养物中检测亲本菌株、推定的PA3birA双重突变体和实际PA6birA突变体有关生物素和同效维生素的生产。如表18所示,衍生于PA3的双重突变体比其bir亲本生产多出4-6倍的同效维生素和多出1倍的生物素。衍生于PA6的双重突变体比其birA亲本生产相近量或仅稍高量的生物素和高维生素。很明显,PA3突变帮助了失调菌株的生物素生产。
XIID.另外的壬二酸抗性突变体。
除了由PA3和PA6所代表类型的壬二酸抗性突变体外,已从以PY79株为背景的菌株中分离出几种作为自发突变体的、代表至少两个新类别的其它壬二酸抗性突变。
按上述方法,借助转导部分绘出了11个另外的突变体的图谱,以确定壬二酸抗性突变是否与birA或bio操纵子连接。它们无一与trpC2连接,经推理认为它们也无一在birA座位处。另一方面,所试验的11个突变体中的8个与bio操纵子连接。这8个突变体中,有2个如PA3一样与bio启动子紧密连接,而其它6个与bio启动子的连接基本小于100%,这提示所说突变位于就在启动子下游的bio操纵子内。因此这后一组6个突变体代表了另一类区别于PA3和PA6的壬二酸抗性突变体。该组包括BI514、BI521、BI532、BI535、BI537和BI545。该组突变体可能包括已增加了生产或利用庚二酸能力的突变体,例如bioI或bioW突变体。
这些新突变体中的三个并未绘制在birA或bio操纵子处。该组包括BI523、BI544和BI549,并可能含有生产增加水平的庚二酸前体或能更有效地将多种生物素前体转变成生物素的突变体。这组中无一等于PA6,由于不象PA6,所以它们能够在缺乏壬二酸的基本培养基中生长至如PY79(野生型)的同样密度。
这些新突变体总结于表19中。虽然它们无一能够通过其自身显著增加生物素生产,但是这些突变在与其它生物素失调突变结合时可能增加生物素生长,正如PA3的情况。
本申请人在布达佩斯条约的条款和条件下于1994年5月4日在位于美国马里兰Rockville的美国典型微生物保藏中心(ATCC)保藏了菌株PA3、HB43、HB3、BI544、BI535、BI421、BI304、BI282和BI274,其保藏号分别为ATCC55567、55568、55569、55570、55571、55572、55573、55574和55575。
表17.试管培养物中壬二酸抗性突变体的生物素和同效维生素生产 |
菌株 |
2g/l壬二酸中菌落大小 |
生物素(μg/l) |
同效维生素(μg/l) |
PY79 |
极小 |
10 |
11 |
PA1 |
大 |
10 |
13 |
PA2 |
大 |
10 |
12 |
PA3 |
大 |
10 |
12 |
PA4 |
极小 |
10 |
11 |
PA7 |
大 |
10 |
12 |
PA5 |
小 |
30 |
60 |
PA6 |
小 |
30 |
60 |
VY培养基(无细胞) |
----- |
30 |
100 |
表18.birA/azl<sup>r</sup>双重突变体的生物素和同效维生素生产 |
亲本菌株 |
bir基因供者 |
分离物数 |
高生物素抗性/敏感性 |
生物素a(μg/l) |
同效生物素b(μg/l) |
VY培养基 |
---- |
|
---- |
22 |
25 |
PY79 |
---- |
|
S |
6 |
10 |
PA3 |
---- |
|
R |
5 |
9 |
PA3 |
HB3 |
1 |
R |
120 |
690 |
PA3 |
HB3 |
2 |
R |
100 |
440 |
PA3 |
α-DB16 |
1 |
R |
100 |
690 |
PA6 |
---- |
|
S |
11 |
16 |
PA6 |
HB3 |
2 |
R |
46 |
200 |
PA6 |
HB3 |
6 |
R |
50 |
120 |
PA6 |
α-DB16 |
8 |
R |
53 |
220 |
PA6 |
α-DB16 |
14 |
R |
56 |
200 |
HB3 |
---- |
|
R |
44 |
110 |
α-DB16 |
---- |
|
R |
46 |
140 |
a.用胚芽乳杆菌str3进行测定
b.用酿酒酵母进行测定
表19.另外的壬二酸抗性突变体 |
菌株名 |
连接至Pbioa |
BI 530 |
100 |
BI 533 |
100 |
BI 514 |
70 |
BI 521 |
90 |
BI 532 |
80 |
BI 535 |
40 |
BI 537 |
40 |
BI 545 |
90 |
BI 523 |
0 |
BI 544 |
0 |
BI 549 |
0 |
PA 3 |
100 |
PA 6 |
0 |
PY 79(野生型) |
- |
a依PBS1转导BIO+、壬二酸抗性入PY79Pbio::cat17的大致连接百分比
表20
序列表
(1)SEQ ID NO:1的信息:
(i)序列特征:
(A)长度:8478
(B)类型:核酸
(B)链数:双链
(D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:1:
CGCATCGGAG ATCCAAAGCC TGATCGCGCC GCGCCCGCAC CTTAGTCTTG TTGGTGTACA 60
CGATCGGTTA ACGCCGGCTG AGGGCGTGGA CAAAATCGAA AAAGAATTGA CAGCTGTCTA 120
TGCTGGACAG GGAGCTGCTG ATTGCTACCG AGTGGTCCGT TCTGCTTCGG GACATTTCGA 180
AACAGCAGTT ATAAGGCATG AAGCTGTCCG GTTTTTGCAA AAGTGGCTGT GACTGTAAAA 240
AGAAATCGAA AAAGACCGTT TTGTGTGAAA ACGGTCTTTT TGTTTCCTTT TAACCAACTG 300
CCATAAATCG ATCCTTTCTT CTATTGACAG AAACAGGAGA GAATAATATA TTCTAATTGT 360
TAACCTTTGA ATATAATTGG TTAACAATTT AGGTGAGAAG CGCTACACGT TCTTCAGTTA 420
TCAGTGAAAG GGCGAGAAAT GATGCAAGAA GAAACTTTTT ATAGTGTCAG AATGAGGGCT 480
TCAATGAATG GATCTCATGA AGACGGCGGA AAGCATATAT CCGGCGGAGA ACGGCTTATT 540
CCTTTCCATG AGATGAAGCA TACAGTCAAT GCTTTATTAG AAAAAGGGTT ATCCCATTCA 600
AGAGGAAAAC CTGATTTTAT GCAAATTCAA TTTGAAGAGG TACATGAATC GATAAAAACC 660
ATTCAGCCAT TGCCTGTGCA TACGAATGAA GTGAGCTGCC CGGAAGAAGG ACAAAAGCTT 720
GCCCGATTGT TATTGGAAAA AGAAGGCGTT TCACGAGACG TGATTGAAAA AGCATATGAA 780
CAAATCCCTG AATGGTCAGA TGTCAGGGGT GCGGTGTTGT TTGATATTCA TACA GCAAG 840
CGAATGGATC AAACAAAAGA AAAAGGGGTG CGGGTCTCCA GAATGGATTG GCCGGACGCT 900
AATTTTGAAA AATGGGCGCT TCACAGTCAC GTGCCAGCTC ATTCAAGAAT AAAAGAGGCC 960
CTTGCGCTCG CTTCAAAGGT AAGCCGGCAC CCGGCAGTCG TTGCAGAATT ATGCTGGTCG 1020
GACGATCCGG ATTACATAAC AGGCTATGTT GCGGGTAAGA AAATGGGCTA TCAGCGTATT 1080
ACAGCAATGA AAGAATACGG GACTGAAGAG GGCTGCCGAG TCTTTTTTAT TGATGGATCC 1140
AATGATGTAA ACACGTACAT ACATGACCTG GAGAAGCAGC CTATTTTAAT AGAGTGGGAG 1200
GAAGATCATG ACTCATGATT TGATAGAAAA AAGTAAAAAG CACCTCTGGC TGCCATTTAC 1260
CCAAATGAAA GATTATGATG AAAACCCCTT AATCATCGAA AGCGGGACTG GAATCAAAGT 1320
CAAAGACATA AACGGCAAGG AATACTATGA CGGTTTTTCA TCGGTTTGGC TTAATGTCCA 1380
CGGACACCGC AAAAAAGAAC TAGATGACGC CATAAAAAAA CAGCTCGGAA AAATTGCGCA 1440
CTCCACGTTA TTGGGCATGA CCAATGTTCC AGCAACCCAG CTTGCCGAAA CATTAATCGA 1500
CATCAGCCCA AAAAAGCTCA CGCGGGTCTT TTATTCAGAC AGCGGCGCAG AGGCGATGGA 1560
AATAGCCCTA AAAATGGCGT TTCAGTATTG GAAGAACATC GGGAAGCCCG AGAAACAAAA 1620
ATTCATCGCA ATGAAAAACG GGTATCACGG TGATACGATT GGCGCCGTCA GTGTCGGTTC 1680
AATTGAGCTT TTTCACCACG TATACGGCCC GTTGATGTTC GAGAGTTACA AGGCCCCGAT 1740
TCCTTATGTG TATCGTTCTG AAAGCGGTGA TCCTGATGAG TGCCGTGATC AGTGCCTCCG 1800
AGAGCTTGCA CAGCTGCTTG AGGAACATCA TGAGGAAATT GCCGCGCTTT CCATTGAATC 1860
AATGGTACAA GGCGCGTCCG GTATGATCGT GATGCCGGAA GGATATTTGG CAGGCGTGCG 1920
CGAGCTATGT ACAACATACG ATGTCTTAAT GATCGTTGAT GAAGTCGCTA CAGGCTTTGG 1980
CCGTACAGGA AAAATGTTTG CGTGCGAGCA CGAGAATGTC CAGCCTGATC TGATGGCTGC 2040
CGGTAAAGGC ATTACAGGAG GCTATTTGCC AATTGCCGTT ACGTTTGCCA CTGAAGACAT 2100
CTATAAGGCA TTCTATGATG ATTATGAAAA CCTAAAAACC TTTTTCCATG GCCATTCCTA 2160
TACAGGCAAT CAGCTTGGCT GTGCGGTTGC GCTTGAAAAT CTGGCATTAT TTGAATCTGA 2220
AAACATTGTG GAACAAGTAG CGGAAAAAAG TAAAAAGCTC CATTTTCTTC TTCAAGATCT 2280
GCACGCTCTT CCTCATGTTG GGGATATTCG GCAGCTTGGC TTTATGTGCG GTGCAGAGCT 2340
TGTACGATCA AAGGAAACTA AAGAACCTTA CCCGGCTGAT CGGCGGATTG GATACAAAGT 2400
TTCCTTAAAA ATGAGAGAGT TAGGAATGCT GACAAGACCG CTTGGGGACG TGATTGCATT 2460
TCTTCCTCCT CTTGCCAGCA CAGCTGAAGA GCTCTCGGAA ATGGTTGCCA TTATGAAACA 2520
AGCGATCCAC GAGGTTACGA GCCTTGAAGA TTGATTCCTG GTTAAACGAG CGGTTAGACA 2580
GAATGAAAGA AGCCGGCGTA CATCGTAACC TGCGGTCAAT GGATGGAGCG CCGGTTCCAG 2640
AGAGGAATAT TGATGGCGAA AATCAAACGG TCTGGTCCTC AAACAATTAT TTAGGGCTCG 2700
CAAGCGATAG ACGTTTGATC GATGCAGCCC AAACAGCATT GCAGCAATTT GGGACAGGAA 2760
GCAGCGGTTC ACGTTTAACG ACAGGCAATT CGGTCTGGCA TGAAAAGCTA GAAAAGAAGA 2820
TTGCCAGCTT TAAACTGACA GAAGCGGCCC TGCTGTTTTC GAGCGGTTAC TTGGCCAATG 2880
TCGGTGTCCT TTCATCCTTG CCAGAAAAGG AAGATGTCAT TTTAAGTGAC CAGCTCAATC 2940
ATGCAAGTAT GATCGACGGC TGCCGACTTT CTAAGGCTGA TACAGTTGTT TATCGGCATA 3000
TTGATATGAA TGATCTTGAA AACAAGCTGA ATGAAACACA GCGTTATCAG CGCCGTTTTA 3060
TCGTAACAGA CGGAGTATTC AGCATGGATG GCACAATCGC CCCTCTTGAT CAGATCATCT 3120
CACTTGCGAA ACGCTATCAT GCCTTCGTGG TCGTTGATGA TGCCCACGCA ACAGGAGTTT 3180
TGGGCGATTC GGGACAAGGA ACGAGTGAAT ACTTTGGTGT TTGTCCCGAC ATTGTTATCG 3240
GCACCTTAAG CAAAGCTGTT GGCGCGGAAG GAGGTTTTGC GGCAGGATCA GCGGTCTTCA 3300
TCGACTTTTT GCTGAACCAT GCCAGAACAT TTATCTTTCA AACCGCTATT CCGCCAGCCA 3360
GCTGTGCGGC TGCTCACGAG GCTTTCAACA TCATTGAAGC CAGCAGGGAA AAACGACAGC 3420
TTTTATTTTC TTATATCAGC ATGATCAGAA CCAGTCTGAA GAATATGGGT TATGTGGTGA 3480
AAGGAGATCA CACACCGATT ATTCCTGTAG TCATTGGCGA TGCCCATAAA ACGGTCCTAT 3540
TTGCTGAAAA ACTGCAGGGC AAGGGAATTT ATGCTCCTGC CATTCGGCCG CCAACCGTTG 3600
CGCCGGGTGA AAGCCGGATT CGAATTACAA TCACGTCTGA CCACAGTATG GGTGATATTG 3660
ATCATTTGCT GCAAACATTT CATTCAATCG GAAAGGAGCT GCACATCATT TGAGGGGTTT 3720
TTTTGTGACG GGAACTGATA CAGAAGTAGG GAAAACGGTT ATATCCAGCG GTCTTGCTGC 3780
CTTATTGAAA GACAATAATA GACATGTCGG GGTGTATAAA CCATTTTTAA GCGGGATATC 3840
GCGCCATCAT CCAGATAGTG ATACAAGTTT GCTGAAAGAT ATGTCGCAGA CCAGTCTTTC 3900
TCATGAAGAC ATTACGCCTT TTGCCTTCAA GGCGCCGCTT GCACCATACG TTGCAGGGAA 3960
ACTTGAGGGA AAGACTGTCA CCATGGAAGA GGTTTTAAGC CATTGGGGGC GGATTAGAGA 4020
AAAACATGAA TGCTTCATCG TAGAAGGTGC AGGCGGTATT TCTGTGCCAT TGGGAGAGGA 4080
CTATTTGGTC AGTCATGTCA TAAAAGCGTT GCAGCTTCCC ATGATTATTG TGGCGCGTCC 4140
TCGCCTTGGA ACCATTAATC ATACCTTTTT AACTGTCAAA TATGCAGAAA GCATGGGGCT 4200
TCCAATCGCC GGAATTATCA TCAATGGAAT CAGTGACTCT CCTGATGAAG ATGAAAAAAC 4260
CAATCCTGAG ATGATTGAGC GCTTATGCGG TGTGCCGATT TTAGGGGTTA CGCCAAAGCT 4320
TGCCAACGTG ACGAAAGAAA CGGTTCTACA TATGGTAAAA GACCATATCA ATCTATCATT 4380
ACTGATGAAT CAAGTGGGGG TATGAGAATG AATCAATGGA TGGAACTCGC AGACCGGGTG 4440
CTGGCTGGAG CAGAAGTGAC TGACGAAGAG GCGCTTTCAA TATTACATTG TCCTGATGAA 4500
GATATTTTGC TATTAATGCA CGGGGCTTTT CACATCAGAA AACACTTTTA CGGAAAAAAA 4560
GTAAAGCTCA ATATGATTAT GAATGCGAAA TCCGGGCTCT GCCCGGAAAA CTGCGGCTAT 4620
TGTTCACAGT CTGCGATTTC GAAAGCGCCG ATTGAGTCTT ACCGGATGGT GAATAAGGAA 4680
ACGCTGCTTG AAGGCGCGAA GCGGGCGCAC GATCTGAATA TCGGCACATA TTGTATCGTG 4740
GCAAGCGGCA GAGGTCCGTC TAACAGAGAA GTGGATCAGG TCGTAGATGC GGTTCAGGAA 4800
ATTAAAGAGA CGTATGGACT GAAGATTTGT GCATGTCTTG GACTGTTGAA GCCAGAGCAG 4860
GCGAAGCGGC TCAAAGATGC AGGAGTAGAC CGCTATAATC ATAATTTGAA TACGTCACAG 4920
AGAAACCATT CAAACATCAC AACCTCACAT ACATACGATG ACAGAGTCAA TACGGTTGAA 4980
ATCGCAAAAG AATCGGGGCT GTCTCCGTGT TCAGGCGCCA TTATCGGGAT GAAGGAGACG 5040
AAACAGGATG TCATTGACAT CGCCAAAAGC TTGAAGGCTC TTGACGCGGA TTCCATTCCT 5100
GTGAATTTTT TGCATGCAAT TGATGGCACG CCGTTAGAAG GCGTCAACGA ATTAAACCCG 5160
CTGTATTGTT TAAAAGTGCT GGCGCTGTTC CGTTTTATCA ATCCATCAAA AGAAATTCGC 5220
ATTTCCGGAG GAAGAGAGGT CAATCTCCGC ACATTGCAGC CATTAGGGCT TTACGCCGCA 5280
AACTCCATTT TTGTCGGAGA CTACTTAACA ACTGCCGGGC AAGAGGAGAC GGAGGATCAT 5340
AAAATGCTGA GTGATTTAGG CTTTGAAGTT GAATCAGTCG AAGAAATGAA GGCTAGTTTA 5400
AGTGCGAAAA GCTGAAAGAA TCAATAAAAG CAATCGGTAT GATGTCGATT GTTTTTATTT 5460
TTGAACAGAA AGGAGAAAAT CACGTGACAA TTGCATCGTC AACTGCATCT TCTGAGTTTT 5520
TGAAAAACCC ATATTCTTTT TACGACACAT TGCGAGCTGT TCATCCTATC TATAAAGGGA 5580
GTTTCTTAAA ATACCCGGGC TGGTATGTCA CAGGATATGA AGAAACGGCT GCTATTTTGA 5640
AAGATGCGAG ATTCAAAGTC CGCACCCCGC TGCCTGAGAG CTCAACCAAA TATCAGGACC 5700
TTTCACATGT GCAAAATCAA ATGATGCTGT TTCAGAACCA GCCTGATCAT AGACGATTGC 5760
GGACGCTTGC CAGCGGAGCG TTTACGCCGA GAACGACAGA GAGTTATCAG CCGTATATCA 5820
TTGAAACTGT CCATCATTTG CTTGATCAAG TGCAAGGTAA AAAAAAGATG GAGGTCATTT 5880
CGGACTTTGC TTTTCCTTTA GCAAGTTTTG TCATAGCTAA CATTATAGGT GTACCGGAGG 5940
AAGATAGGGA GCAATTAAAG GAGTGGGCTG CGAGTCTCAT TCAAACGATT GATTTTACCC 6000
GCTCAAGAAA GGCATTAACA GAGGGCAATA TTATGGCTGT GCAGGCTATG GCATATTTCA 6060
AAGAGCTGAT TCAAAAGAGA AAACGCCACC CTCAACAGGA TATGATCAGC ATGCTCTTGA 6120
AGGGGAGAGA AAAGGATAAG CTGACGGAAG AGGAGGCGGC ATCTACGTGC ATATTGCTGG 6180
CGATCGCCGG ACATGAGACA ACGGTCAATC TCATCAGCAA TTCAGTCCTT TGTCTGCTGC 6240
AGCATCCAGA ACAGCTTTTG AAACTGAGAG AAAATCCAGA TCTTATTGGT ACCGCAGTCG 6300
AGGAATGTTT ACGCTATGAA AGCCCCACGC AAATGACAGC CAGAGTTGCG TCAGAGGATA 6360
TTGACATCTG CGGGGTGACG ATCCGTCAAG GAGAACAAGT CTATCTTTTG TTAGGAGCGG 6420
CTAATCGAGA CCCTAGCATA TTCACGAACC CCGATGTCTT CGATATTACG AGAAGTCCTA 6480
ATCCGCATCT TTCATTCGGG CATGGCCATC ATGTTTGCTT AGGGTCCTCG CTGGCACGAT 6540
TAGAAGCGCA AATTGCGATT AACACTCTTC TGCAGCGAAT GCCCAGCCTT AATCTTGCGG 6600
ATTTTGAATG GCGGTATCGG CCGCTTTTTG GATTTCGGGC GCTTGAGGAG CTGCCGGTGA 6660
CTTTTGAATA AGCCTAAGAA TGTGAGTGCC AAAAAAGTGT CAGCCCCGCC GAAAATGGGC 6720
AATCTATAAA AAAGGGGAGT GAACATCGTG AAAAAAGTGC TGATCGCCGG CGGAAATGGT 6780
GTGATTGGGA GACTGCTTGC TGAAGGGCTT ATTTCAGACT ATGAAGTGAC TGTGCTTGAT 6840
AAAGATCATT TCGATGGCAA AGCCTCTTCC ATTCAGGCTG ACGCGGCAAA TTATGAGGAG 6900
CTGTTGAAGA AGATTCCAAA AGATACCGAT GCCATCTTGA ATTTACTCGC TGTGAAAATC 6960
AAATACGATA TTATGGACAT CGCTGAGTTT GAAAAAATGA CGGATGTTTT CTATAGGGCA 7020
AGCTATTATC TGTGCCGTGC GGCAGCGGAG CTCGGCATTC AAAAGCTCGT GTTCGCCAGC 7080
AGCAATCATG TCACAGATGT ATATGAAAAA GACGGGCGCT CGCTCTTAGG ACGGGAAATC 7140
ACAACAAGCG ATTATCCGCT GTCAAAAAAC TTGTACGGTG TATTAAAGCT GACCTCTGAA 7200
CAGATCGGCC ATTTGTTTTA TTTGGAAAAT AAGCTATCAG TAATCAACCT TCGAATCGGA 7260
ACAGTCGTGA CAGATGAAAT GGATACGCTG CATGAAAAAG AACGGACGAA AAAGACACTG 7320
CTTTCTCACC CCGATCTGCT GTCGATTTTC AAAGCCGCCA TTGAGACCAA CATCCGGTAT 7380
GGCACTTATT ACGCCGTCTC TGATAATCCG GGCCGGCCAT GGTCCATTGA ATCTGCCGTG 7440
AATGAACTTG GGTTTTCGCC ACAAATCAAT ACGGCTGAAC TTCTGAACGA GGAGGAGAAC 7500
GGAGCATAAT CATTTTCTAA GATTATGCTC TTTTTCTTTT GTTATCGGTC TCAATTCGCG 7560
GCAGCCCCCG CCCGGCCGGG GACACTGTTC AAATGATTAT AGACATGGCA ATCACAGATT 7620
TGCTACATTT TAGACACGAT ATCGTCACAT GCTGAGCTCG GTTTCCAAAA ATATGATAAC 7680
GCTTACAAAG GGAGGTGGGA GCTATCGCAC ATTCACTGAA AAACCGTCTG TTTGATATGT 7740
TGATTTATGG TTTCTTGCTG ATGTTCGCTT TAATATGCGT ACTTCCGTTC ATTCATGTTA 7800
TCGCAGCATC CTTTGCCACA GTAGAAGAAG TCGTGTCGAA AAAATTTATT TTAATACCGA 7860
CCACTTTTTC GCTAGATGCT TATCGCTACA TTTTTTCAAC AGATATTATT TATAAGAGTT 7920
TGCTTGTTTC TGTGTTTGTG ACAGTGATAG GCACTGCGGT CAGCATGTTT CTTTCGTCAC 7980
TGATGGCTTA CGGGTTATCC CGCCGTGATT TAATCGGCCG GCAGCCGCTC ATGTTTCTCG 8040
TCGTATTTAC GATGCTGTTT AGCGGCGGCA TGATTCCGAC TTTCCTTGTG GTCAAATCGC 8100
TTGGATTGCT CGATTCTTAC TGGGCGCTTA TTTTGCCGAC AGCCATTAAT GCCTTTAACC 8160
TGATCATTCT GAAAAACTTC TTTCAAAATA TCCCGTCAAG CCTGGAAGAG TCCGCGAAAA 8220
TTGACGGGTG CAATGATCTG GGCATATTCT TTAAAATTGT GCTGCCGCTG TCTCTTCCTG 8280
CGATCGCAAC GATTTCACTA TTTTATGCGG TCACGTATTG GAACACGTAT ATGACAGCGA 8340
TCTTGTACTT AAATGATTCA GCAAAATGGC CAATTCAGGT GCTTCTGCGC CAAATCGTCA 8400
TTGTATCAAG CGGTATGCAG GGGGATATGT CTGAAATGGG GTCGGGCAGC CCGCCGCCTG 8460
AGCAAACCAT NNNNNTGG 8478
(2)SEQ ID NO:2的信息:
(i)序列特征:
(A)长度:29
(B)类型:核酸
(B)链数:双链
(D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:2:
TTGACANNNN NNNNNNNNNN NNNTATATT29
(3)SEQ ID NO:3的信息:
(i)序列特征:
(A)长度:29
(B)类型:核酸
(B)链数:双链
(D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:3:
TTGACANNNN NNNNNNNNNN NNNTATAAT29
(4)SEQ ID NO:4的信息:
(i)序列特征:
(A)长度:30
(B)类型:核酸
(B)链数:双链
(D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:4:
TTGTAANNNN NNNNNNNNNN NNNNTAATAT30
(5)SEQ ID NO:5的信息:
(i)序列特征:
(A)长度:29
(B)类型:核酸
(B)链数:双链
(D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:5:
TTGATANNNN NNNNNNNNNN NNNAAAAGT29
(6)SEQ ID NO:6的信息:
(i)序列特征:
(A)长度:29
(B)类型:核酸
(B)链数:双链
(D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:6:
TTGAAANNNN NNNNNNNNNN NNNTCTTAT29
(7)SEQ ID NO:7的信息:
(i)序列特征:
(A)长度:300
(B)类型:核酸
(B)链数:双链
(D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:7:
AAGCTGTCCG GTTTTTGCAA AAGTGGCTGT GACTGTAAAA AGAAATCGAA AAAGACCGTT 60
TTGTGTGAAA ACGGTCTTTT TGTTTCCTTT TAACCAACTG CCATAAATCG ATCCTTTCTT 120
CTATTGACAG AAACAGGAGA GAATAATATA TTCTAATTGT TAACCTTTGA ATATAATTGG 180
TTAACAATTT AGGTGAGAAG CGCTACACGT TCTTCAGTTA TCAGTGAAAG GGCGAGAAAT 240
GATGCAAGAA GAAACTTTTT ATAGTGTCAG AATGAGGGCT TCAATGAATG GATCTCATGA 300
(8)SEQ ID NO:8的信息:
(i)序列特征:
(A)长度:36
(B)类型:核酸
(B)链数:双链
(D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:8:
AATGTGTTAA CTTAAAAACT ATAGTTGGTT AACTAA 36
(9)SEQ ID NO:9的信息:
(i)序列特征:
(A)长度:40
(B)类型:核酸
(B)链数:双链
(D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:9:
CTAATTGTTA ACCTTTGAAT ATAATTGGTT AACAATTTAG 40
(10)SEQ ID NO:10的信息:
(i)序列特征:
(A)长度:38
(B)类型:核酸
(B)链数:双链
(D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:10:
GGCCAAGCTT GTCGACCGAA ACAGCAGTTA TAAGGCAT 38
(11)SEQ ID NO:11的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(B)链数:双链
(D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:11:
GGCCCGTCTA GAGCTTCTCA CCTA 24
(12)SEQ ID NO:12的信息:
(i)序列特征:
(A)长度:35
(B)类型:核酸
(B)链数:双链
(D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:12:
GGCCGAGAAG CTCTAGACGT TCTTCAGTTA TCAGT 35
(13)SEQ ID NO:13的信息:
(i)序列特征:
(A)长度:24
(B)类型:核酸
(B)链数:双链
(D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:13:
CGCCAGGGTT TTCCCAGTCA CGAC24
(14)SEQ ID NO:14的信息:
(i)序列特征:
(A)长度:28
(B)类型:核酸
(B)链数:双链
(D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:14:
TAGAAGAAAG GCTCGAGTTA TGGCAGTT28
(15)SEQ ID NO:15的信息:
(i)序列特征:
(A)长度:28
(B)类型:核酸
(B)链数:双链
(D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:15:
AACTGCCATA ACTCGAGCCT TTCTTCTA28
(16)SEQ ID NO:16的信息:
(i)序列特征:
(A)长度:9
(B)类型:氨基酸
(B)链数:
(D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:16:
Ala Val Arg Phe Leu Gln Lys Trp Leu
1 5
(17)SEQ ID NO:17的信息:
(i)序列特征:
(A)长度:21
(B)类型:氨基酸
(B)链数:
(D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:17:
Met Met Gln Glu Glu Thr Phe Tyr ser Val Arg Met Arg Ala Ser Met
1 5 10 15
Asn Gly Ser His Glu
20