本发明的优选实施方案
本发明的超耐热蛋白酶基因可通过筛选超嗜热菌的基因文库而获得。作为超嗜热菌,可以使用属于热球菌属的细菌并且感兴趣的基因可通过筛选激烈热球菌基因组的粘粒文库而获得。
例如,激烈热球菌DSM 3638可用作激烈热球菌,并且该菌株可从德意志微生物保藏中心得到。
激烈热球菌基因组粘粒文库的一个实例可通过连接以限制性酶Sau3A1(由Takara Shuzo公司生产)部分消化激烈热球菌DSM 3638基因组DNA而获得的DNA片段与三股螺旋粘粒载体(由Stratagene生产),并且根据体外包装方法将连接产物包装进入λ噬菌体颗粒而获得。然后,将该文库导入合适的大肠杆菌,如,大肠杆菌DH5αMCR(由BRL生产)以获得转化子,接着通过培养它们,收集微生物细胞,将它们进行热处理(如,100℃ 10分钟),超声及再次热处理(如,100℃ 10分钟)。得到的裂解液中蛋白酶活性的有无可用含凝胶的SDS-聚丙烯酰胺凝胶电泳而筛选。
用这种方式,可获得含超耐热蛋白酶基因且表达对上述热处理具有抗性的蛋白酶的粘粒克隆。
此外,从这样获得的粘粒克隆制备的粘粒DNA可用适当的限制性酶切割成片段以获得具有每个插入片段的重组质粒。然后,以该质粒转化适当的微生物,并且可检测由得到的转化子表达的蛋白酶活性而获得含感兴趣的超耐热蛋白酶基因的重组质粒。
即,以NotI与PvuII(两者均由Takara Shuzo公司生产)酶切从上面的一个粘粒克隆制备的粘粒以得到一个约7.5kb的DNA片段,它可被分离并插入到导入有NotI接头(由Takara Shuzo公司生产)的PUC19质粒载体的NotI位点与SmaI位点之间。该质粒命名为质粒pTPR 12且以该质粒转化的大肠杆菌JM 109命名为大肠杆菌JM 109/pTPR 12并且保藏于国家生命科学与人类技衣研究所,Higashi,Tsukuba-shi 1-1-3号,Ibaraki-ken,日本,1994年5月24日(最初保藏日期)作为根据布达佩斯条约的保藏FERM BP-5103。
大肠杆菌JM 109/pTPR 12的裂解液与上面的粘粒克隆裂解液一样在含明胶的SDS-聚丙烯酰胺凝胶中表现出类似的蛋白酶活性。
源自激烈热球菌并被插入到质粒pTPR 12中的DNA片段的核苷酸序列可用传统方法测定,如,双脱氧方法。位于插入到质粒pTPR 12的DNA片段中且两侧带有2个DraI位点的4.8kb部分的核苷酸序列显示于序列表中的SEQ ID NO.7。从核苷酸序列推断的基因产物的氨基酸序列显示于序列表的SEQ ID NO.8。这样,一种源自激烈热球菌,其核苷酸序列和氨基酸序列均被揭示的超耐热蛋白酶被命名为蛋白酶PFUL。如序列表的SEQ ID NO.8所示,蛋白酶PFUL为由1398个氨基酸残基组成并且具有大于15万道尔顿的高分子量蛋白酶。
蛋白酶PFUL基因可用枯草芽孢杆菌作为宿主来表达。作为枯草芽孢杆菌,枯草芽孢杆菌DB 104可被使用且该菌株为在《基因》,83卷,215-233页(1989)描述过的已知菌株、作为克隆载体,质粒pUB 18
P43可被使用且该质粒由Calgary大学的Sui-Lam Wong博士惠馈。该质粒含有作为可选择标记的卡那霉素抗性基因。
有一种这样的质粒pUBP 13,其中的以DraI酶切质粒pTPR 13而获得的约4.8kb的DNA片段被插入到质粒载体pUB 18-P43的SmaI位点。在该质粒中,蛋白酶PFUL基因位于在枯草芽孢杆菌中起作用的P43启动子[生物化学杂志,259卷,8619-8625页(1984)]的下游。以该质粒转化的枯草芽孢杆菌DB 104命名为枯草芽孢杆菌DB 104/pUBP13。转化子的裂解物与大肠杆菌JM 109 pTPR 12的裂解物显示出类似的蛋白酶活性。
然而,在转化子的培养上清中仅检测到极少量的蛋白酶活性。这被认为是由于蛋白酶PFUL分子量过高且在枯草芽孢杆菌中没有有效地翻译。并且由蛋白酶PFUL基因编码的信号序列没有在枯草芽孢杆菌中很好地发挥功能。也存在蛋白酶PFUL为膜结合型蛋白酶的可能性,并且位于蛋白酶PFUL C-末端的肽链也许是结合到细胞膜上的区域。
图.1显示了激烈热球菌染色体上蛋白酶PFUL基因周围的限制性图谱,以及插入到质粒pTPR 12和质粒pUBP 13中的DNA片段。此外,图.1中的箭头表示编码蛋白酶PFUL的开放阅读框。
通过比较序列表中SEQ ID NO:8所代表的蛋白酶PFUL的氨基酸序列与源自已知微生物的蛋白酶的氨基酸序列,发现蛋白酶PFUL的前半部分氨基酸序列与一组代表枯草蛋白酶[蛋白质工程,4卷,719-737(1991)]的碱性丝氨酸蛋白酶的氨基酸序列具有同源性,并且在被认为是对蛋白酶催化活性重要的四个氨基酸残基的周围具有极高的同源性。
由于已证明普遍存在于源自适温菌的蛋白酶中的区域也存在于由超嗜热菌激烈热球菌产生的蛋白酶PFUL的氨基酸序列中,故预计这些区域也存在于除激烈热球菌之外的超耐热菌产生的相同种蛋白酶中。
即,具有适当长度的DNA可根据编码与枯草蛋白酶等序列具有高度同源性区域的氨基酸序列的部分的序列而制备,并且该DNA可用作杂交探针或作为如PCR等基因扩增的引物以在各种超嗜热菌中筛选出与本发明酶类似的超耐热蛋白酶基因。
在上述方法中,有时获得的是仅含感兴趣基因一部分的DNA片段,有鉴于此,检查得到DNA片段的核苷酸序列并证明它是感兴趣基因的一部分并且,之后,可用该DNA片段或其部分作为探针进行杂交或可用根据该DNA片段的核苷酸序列合成的引物进行PCR以获得整个感兴趣的基因。
上面的杂交可在以下条件中进行。即,固定有DNA的膜在含0.5%SDS,0.1%牛血清白蛋白(BSA),0.1%聚乙烯吡咯烷酮,0.1%Ficoll 400和0.01%变性鲑精DNA的6×SSC(1×SSC代表0.15MNaCl,0.015M柠檬酸钠,pH 7.0)中与适当标记的探针在50℃孵育12~20小时。孵育完成以后,洗膜,开始以含0.5%SDS的2×SSC37℃洗膜,改变SSC的浓度至0.1×且温度至50℃,直到杂交到固定DNA上的探针信号可与背景区分开来为止。
此外,对于本领域的技术人员还很明显,可根据这样获得的新超耐热基因制备探针和引物按照类似的方法获得其它超耐热蛋白酶基因。
图.2、3和4显示了在蛋白酶PFUL氨基酸序列区域的氨基酸序列之间的关系(它们与枯草蛋白酶等的氨基酸序列具有高度的同源性)、编码该区域蛋白酶PFUL基因的核苷酸序列、以及根据它们而合成的寡核苷酸PRO-1F,PRO-2F,PRO-2R和PRO-4R的核苷酸序列。此外,序列表中的SEQ ID NO.9、10、11和12显示寡核苷酸PRO-1F、PRO-2F、PRO-2F和PRO-4R的核苷酸序列。即,SEQ ID NO.9-12为用作筛选本发明超耐热蛋白酶基因寡核苷酸一个实施例的核苷酸序列。
通过使用寡核苷酸组合作为组合,蛋白酶基因可通过用各种超嗜热菌的染色体DNA作为模板的PCR来检测。
作为超嗜热菌,可使用属于热球菌属、热球菌属、葡萄嗜热菌属、栖热拟杆菌属等的细菌。例如作为属于热球菌属的细菌,速生热球菌DSM 2476可被使用且该菌株可从德意志菌种保藏中心获得。当用速生热球菌DSM 2476作为模板并且用寡核苷酸PRO-1F和PRO-2R的组合或寡核苷酸PRO-2F和PRO-4R的组合作为引物进行PCR时,观测到DNA片段的特异扩增并且蛋白酶基因的存在可被鉴定。此外,由DNA片段编码的氨基酸序列可通过将该DNA片段插入到合适的质粒载体以制备重组质粒并且,之后,用双脱氧方法测定插入DNA片段的核苷酸序列而被估计。
将用寡核苷酸PRO-1F与PRO-2R扩增的约150bp的DNA片段和用寡核苷酸PRO-2F和PRO-4R扩增的约550bp的DNA片段插入到质粒载体pUC 18(由Takara Shuzo公司生产)的HincII位点。重组的质粒分别命名为质粒p1F-2R(2)和质粒p2F-4R。序列表中的SEQ ID NO.13显示质粒p1F-2R(2)中插入DNA片段的核苷酸序列和由此推断的氨基酸序列并且序列表中的SEQ IDNO.14显示质粒p2F-4R中插入DNA片段的核苷酸序列和由此推断的氨基酸序列。在序列表的SEQ ID NO.13中,从第1到第21个核苷酸的核苷酸序列和第113到145个核苷酸的核苷酸序列与在序列表的SEQ ID NO.14中,从第1到第32个核苷酸的核苷酸序列和第532到第564个核苷酸的核苷酸序列是来自用作PCR引物(每个分别相应于寡核苷酸PRO-1F,PRO-2R,PRO-2F和PRO-4R)寡核苷酸的核苷酸序列。与蛋白酶PFUL及来自各种微生物的碱性丝氨酸蛋白酶的氨基酸序列具有同源性的氨基酸序列存在于由序列表的SEQID NO.13和SEQ ID NO.14所代表的氨基酸序列中,表明上面的PCR扩增的DNA片段是以该蛋白酶基因作为模板而扩增的。
质粒p2F-4R的限制性图谱显示于图.5。在图.5中,粗实线表示插入到质粒载体pUC 18中的DNA片段。
那么,超耐热蛋白酶基因,例如,通过速生热球菌产生的超耐热蛋白酶基因可用上面的寡核苷酸或通过上面的PCR而获得的扩增DNA片段作为探针通过筛选超耐热细菌的基因文库而获得。
有一个速生热球菌基因文库的实例,该文库是这样制备的,即以限制性酶Sau3AI部分酶切速生热球菌DSM 2476的染色体DNA以获得DNA片段,连接该片段与λGEM-11载体(由Promega生产)并用体外包装方法将其包装进入λ噬菌体颗粒。然后,该文库可转导入合适的大肠杆菌,例如,大肠杆菌LE 392(由Promega生产)以允许在平板上形成噬菌斑,并且可用上面的PCR获得的扩增DNA片段作为探针进行噬菌斑杂交以获得含有感兴趣基因的噬菌体克隆。
此外,从这样获得的噬菌体克隆制备的噬菌体DNA可以适当的限制酶酶切,并且可用上面的探针进行Southern杂交以检测含蛋白酶基因的DNA片段。
当从由噬菌斑杂交而获得的噬菌体克隆制备的噬菌体DNA以KpnI和BamHI(两者均由Takara Shuzo公司生产)酶切时,一个约5kb的DNA片段与探针杂交,并且该约5kb的DNA片段可被分离并插入到质粒载体pUC 119(由Takara Shuzo公司生产)的KpnI位点与BamHI位点之间以获得重组质粒。该质粒命名为质粒pTC 3且以该质粒转化的大肠杆菌JM 109命名为大肠杆菌JM 109/pTC 3。质粒pTC 3的限制性图谱显示于图6。在图6中,粗实线代表插入到质粒载体pUC 119中的DNA片段。
插入到质粒pTC 3中的DNA片段中不含蛋白酶基因的DNA片段可按下面的步骤加以去除。即,质粒pTC 3以SacI(Takara Shuzo公司生产)酶切后,根据上述的类似步骤进行southern杂交,并发现约1.9kb的DNA片段与探针杂交。然后 该约1.9kb的DNA片段可被分离并插入到质粒载体pUC 118(由Takara Shuzo公司生产)的SacI位点以制备重组载体。该质粒命名为质粒pTCS 6且以该质粒转化的大肠杆菌JMl09命名为大肠杆菌JM 109/pTCS 6。质粒pTCS 6的限制性图谱显示于图7。在图7中,粗实线代表插入到质粒载体pUC 118中的DNA片段。通过用双脱氧方法测定插入到质粒pTCS 6中DNA片段的核苷酸序列,可证实蛋白酶基因存在于该DNA片段中。
与这一样,源自速生热球菌,包含在质粒pTCS 6中的超耐热蛋白酶基因缺少其中的一部分。然而,对于本领域的技术人员来说已众所周知,包括全长超耐热蛋白酶基因的DNA片段可通过以下方法获得:(1)再次筛选基因文库,(2)用染色体DNA做southern杂交,或(3)用盒式(Cassette)和盒引物(Takara Shuzo公司,遗传工程产品指南,1994-1995年版,250-251页)通过PCR获得5′上游区的DNA片段。
本发明人选择了方法(3)。即,速生热球菌的染色体DNA以几种限制性酶完全消化,接着用相当于所用限制性酶的盒(由Takara Shuzo公司)连接。用该连接产物作为模板且以引物TCE6R(序列表的序列6显示出引物TCE6R的核苷酸序列)和盒式引物Cl(由Takara Shuzo公司生产)作为引物进行PCR。当上面的步骤用限制酶HindIII(由TakaraShuzo公司生产)来加以完成时,扩增出约一条约1.8kb的DNA片段,并且以HindIII和SacI酶切上面的扩增片段而获得的约1.5kb的DNA片段可插入到质粒载体pUC 119中的HindIII位点与SacI位点之间以获得重组质粒。该质粒命名为质粒pTC 4且以该质粒转化的大肠杆菌JM 109命名为大肠杆菌JM 109/pTC 4。质粒pTC 4的限制性图谱显示于图8。在图8中,粗实线代表插入到质粒载体pUC 119中的DNA片段。
通过双脱氧方法测定插入到质粒pTC 4中DNA片段的核苷酸序列,可以证实蛋白酶基因存在于该DNA片段中。序列表中的SEQ IDNO.17显示该片段的核苷酸序列。通过比较由该核苷酸序列推导的氨基酸序列与各种蛋白酶的氨基酸序列。发现插入到质粒pTC 4中的DNA片段包括质粒pTCS 6中缺乏的超耐热蛋白酶基因的5′区。通过连接该核苷酸序列与序列表中的SEQ ID NO.5所代表的插入到质粒pTCS 6中DNA片段,可鉴定到源自速生热球菌的全长超耐热基因的核苷酸序列。存在于获得核苷酸序列中开放阅读框的核苷酸序列显示于序列表的SEQ ID NO.2中且由该核苷酸序列推导的氨基酸序列显示于SEQID NO.1中。因此,源自速生热球菌的超耐热蛋白酶命名为蛋白酶TCES,编码它的核苷酸序列及其氨基酸已被揭示。通过连接质粒pTC 4中的插入DNA片段与质粒pTCS6中的插入DNA片段可重建全长的蛋白酶TCES基因。
本来以为通过从pTC 4与pTCS 6中含有的两个DNA片段重建全长的蛋白酶TCES基因,并且将其插入到质粒乳糖启动子的下游以得到导入大肠杆菌的表达质粒来确证由该基因表达的蛋白酶活性。然而,该方法没有得到导入有感兴趣表达载体的转化子。并且预示该基因表达产物的产物对大肠杆菌有害或致命。例如,在这种场合,认为用枯草芽孢杆菌作为宿主将蛋白酶进行细胞外分泌以证实其活性。
在枯草芽孢杆菌中作为表达蛋白酶TCES基因的宿主,枯草芽孢杆菌DB 104可被使用,作为克隆载体,质粒pUB 18-P43可被使用。
然而,由于大肠杆菌的宿主载体系统具有含有各种载体且转化可简单而高度有效地进行的优点,故如果可能的话,尽可能用大肠杆菌完成构建表达载体的步骤。即,在大肠杆菌中,含有终止密码子的任意核苷酸序列插入到源自质粒pTC 4与质粒pTCS 6的两个蛋白酶基因片段之间从而重建的不是全长的蛋白酶TCES基因,这样,使基因产物的表达不可能并且,因此,完成质粒的构建。然后,在最后阶段去除该插入序列以使列于图10的感兴趣的质粒pSTC 3表达。
下面解释显示于图9的构建质粒pSTC 3的步骤。
首先,将插入在质粒pTCS 6中的约1.8kb的HindIII-SspI片段插入到质粒载体pBR 322(由Takara Shuzo公司生产)的HindIII位点与EcoRV位点之间以制备重组质粒pBTC 5并且,在该质粒中,去除源自质粒载体pUC 118多克隆位点的HindIII位点与KpnI位点之间的DNA片段以及存在于质粒载体pBR 322的BamHI位点以制备质粒pBTC5HKB。
然后,根据蛋白酶TCES基因的核苷酸序列,合成能在蛋白酶TCES起始密码子前面引入EcoRI位点与BamHI位点的引物TCE 12,和能在仅含1个SacI位点的核苷酸序列的3′端引入ClaI位点和一终止密码子的引物TCE20R。序列表中的SEQ ID NO.18与19分别显示引物TCE12和引物TCE20R的核苷酸序列。
用速生热球菌染色体DNA作为模板且用这两条引物通过PCR而扩增到的约0.9kb的DNA片段以EcoRI和ClaI(由Takara Shuzo公司生产)酶切,并且插入到质粒pBTC5HKB的EcoRI位点与ClaI位点之间以获得质粒pBTC 6,该质粒具有一个突变基因,其中的包括终止密码子的69bp的核苷酸序列插入到蛋白酶TCES基因的SacI位点。
源自枯草芽孢杆菌P43启动子[生物化学杂志,259卷,第8019-8625页(1984)]的核糖体结合位点导入到质粒载体pUC 18的KpnI位点与BamHI位点之间以制备质粒pUC-P43。合成寡核苷酸BS1与BS2的核苷酸序列分别显示于序列表中的SEQ ID NO.20和21。然后,质粒pBTC 6以BamHI和SphI(两者均由Takara Shuzo公司生产)酶切以获得含蛋白酶TCES突变基因的约3kb长的DNA片段,并将其插入到质粒pUC-P43的BamHI位点与SphI位点之间以构建质粒pTC12。
所有上面用于构建质粒的步骤都可用大肠杆菌作为宿主来进行。
用于克隆进入枯草芽孢杆菌的质粒载体pUC 18-P43中的SacI位点被预先去除,并且获自pTC12的约3kb的KpnI-SphI DNA片段可插入到KpnI位点与SphI位点之间以制备用枯草芽孢杆菌DB 104作为宿主的质粒pSTC 2。该质粒含有蛋白酶TCES的突变基因,其5′端具有P43启动子和核糖体结合位点序列。质粒pSTC 2以SacI酶切以后,进行分子内连接以获得重组质粒,其中的在上面突变基因的SacI位点里的插入序列已被去除。该重组质粒命名为质粒pSTC 3,并且以该质粒转化的枯草芽孢杆菌DB 104命名为枯草芽孢杆菌DB 104/pSTC 3并且按照布达佩斯条约从1995年12月1日(最初保藏日期)以保藏于国家生命科学与人类技术研究所,Higashi 1-1-3,Tsukuba-shi,Ibaraki-ken,日本登记号FERM BP-5635。培养转化子,并且测试细胞培养上清和提取物的蛋白酶活性。结果,两样品中均发现耐热蛋白酶活性。
图10显示质粒pSTC 3的限制性图谱。在图l0中,粗实线代表插入到质粒载体pUB 18-P43中的DNA片段
当比较蛋白酶PFUL、蛋白酶TCES和枯草蛋白酶的氨基酸序列以使具有同源性的区域相互匹配,如图11与12所示,发现蛋白酶PFUL在其C-末端以及具有同源性的区域之间具有与蛋白酶TCES序列及枯草蛋白酶序列不同源的区域。从这一点认识到,除了蛋白酶PFUL以外,一种比蛋白酶PFUL具有更小分子量的蛋白酶,如蛋白酶TCES或枯草蛋白酶也许存在于激烈热球菌。为了寻找编码这样蛋白酶的基因,用从激烈热球菌制备的染色体DNA作为靶子,并且用含蛋白酶TCES基因里核苷酸序列的DNA片段(该片段编码在三种蛋白酶中非常保守的氨基酸序列,例如,插入在质粒p1F-2R(2)中约150bp的DNA片段)作为探针进行southern杂交。虽然,由于用作探针的DNA片段也与蛋白酶PFUL基因具有同源性,但依据杂交条件该基因片段仍被检测为信号,源自该基因的信号位置可预先根据用于切割染色体DNA的每个限制酶,蛋白酶PFUL基因的核苷酸序列信息及限制性图谱来估计。当用一些酶时,除了根据蛋白酶PFUL基因预言的位置以外,又几乎在相同水平检测到另一个信号,意味着除了蛋白酶PFUL以外,在激烈热球菌中至少存在一个蛋白酶的可能性。
对于分离相应于上面新信号的基因,首先克隆该基因的一部分以防止在如蛋白酶TCES情况中,由于基因产物表达对大肠杆菌有害或致命造成基因分离的失败。例如,当激烈、热球菌染色体DNA以限制酶SacI和SpeI(两者均由Takara Shuzo公司生产)酶切并且酶切产物用蛋白酶TCES基因的片段作为探针按上述用于进行southern杂交,发现从中观察到源自该新基因的相应于约0.6kb的新信号代替以在仅以SacI酶切情况中观察到的相应于约3kb的信号。这个约0.6kb SpeI-SacI的片段编码最多约200个残基的氨基酸序列并且不能预期表达具有活性的蛋白酶。将以SacI和SpeI酶切的激烈热球菌染色体DNA进行琼脂糖凝胶电泳以回收凝胶中相应于约0.6kb的DNA片段。
然后,该片段插入到质粒载体pBluescript SK(-)(由Stratagene生产)的SpeI位点与SacI位点之间并且得到的重组质粒用于转化大肠杆菌JM 109。对于该转化子,可通过用与用于上面的southern杂交相同的探针的菌落杂交而获得插入有感兴趣片段的克隆。包含在得到的克隆中的质粒是否具有编码蛋白酶的序列可用根据上面各种蛋白酶共有的氨基酸序列制备的引物lFP1,lFP2,2RP1及2RP2(引物lFP1,lFP2,2RP1及2RP2的核苷酸序列显示于序列表中的SEQ ID NO.22,23,24和25)进行PCR,或通过测定插入到由该克隆制备的质粒中的DNA片段的核苷酸序列来确证。用这种方式确证蛋白酶基因在其中存在的质粒命名为质粒pSS3。插入到该质粒中DNA片段的核苷酸序列,及由此推断的氨基酸序列显示于序列表中的SEQ ID NO.26。
由插入到质粒pSS 3中DNA片段的核苷酸序列推断的氨基酸序列显示出与枯草蛋白酶、蛋白酶PFUL、蛋白酶TCES等具有同源性。新近获自激烈热球菌且不同于蛋白酶PFUL的蛋白酶基因产物命名为蛋白酶PFUS。编码该蛋白酶N-末端部分的区域,即,SpeI位点的5′区域,和编码C-末端部分的区域,即,上面SacI位点基因片段的3′区可通过反向PCR方法获得。如果预先揭示出蛋白酶PFUS基因及其染色体附近的限制酶位点,可用适当的限制酶进行反向PCR。通过以各种限制酶切割激烈热球菌的染色体DNA,且用插入到质粒pSS 3中的DNA片段作为探针进行southern杂交来揭示限制酶位点。因而,显示出SacI位点位于SpeI位点5′一端约3kb的距离处且Xbal位点位于SacI位点3′一端约5kb的巨离处。
用于反向PCR的引物可设计成在包含在质粒pSS 3中SpeI-SacI片段的末端周围退火。设计在SacI位点周围退火的引物命名为NPF-1与NPF-2且设计在SpeI位点周围退火的引物命名为NPR-3。其核苷酸序列分别显示于序列表中的SEQ ID NO.27、28和29。
激烈热球菌染色体DNA分别以SacI或XbaI(两者均由TakaraShuzo公司生产)酶切,这将允许分子内连接,并且该反应混合物可用作反式PCR的模板。当以SacI酶切染色体DNA时,通过反式PCR扩增到一个约3kb的片段,将其插入到质粒载体pT7BlueT(由Novagen生产)以获得一个命名为质粒pS 322的重组质粒。另一方面,以XbaI酶切染色体DNA时,扩增到一个约9kb的片段。扩增到的片段以XbaI酶切以获得一个约5kb的片段,将其回收并插入到质粒载体pBluescript SK(-)以获得重组质粒,命名为质粒pSKX 5。通过结合用包含在质粒pSS 3中的SpeI-SacI片段作为探针而完成的Southern杂交结果,与用限制性酶对质粒pS 322与pSKX 5的分析结果,可获得蛋白酶PFUS基因及其在染色体中的附近区域的限制性图谱。该限制性图谱显示于图13。
此外,通过以从SpeI位点开始的5′方向分析插入到质粒pS 322的5′片段的核苷酸序列,可推断出由该区域编码的酶蛋白的氨基酸序列。得到的核苷酸序列及由此推断的氨基酸序列显示于序列表的SEQ IDNO.30。由于该区域的氨基酸序列与如枯草蛋白酶等的蛋白酶的氨基酸序列具有同源性,根据该同源性可推断出蛋白酶PFUS的起始密码子并且,因此,可设计出能在蛋白酶PFUS起始密码子之前导入BamHI位点的引物NPF-4。另一方面,通过用从XbaI位点开始的5′方向来分析插入到质粒pSKX 5中蛋白酶PFUS基因3′片段的核苷酸序列而测定的核苷酸序列显示于序列表中的SEQ ID NO.31。根据该核苷酸序列,可设计出能将SphI位点插入到XbaI位点附近区域的引物NPR-4。引物NPF-4与NPR-4的核苷酸序列分别显示于序列表中的SEQ IDNO.32和33。全长的蛋白酶PFUS基因可用这两对引物且用激烈热球菌的染色体DNA作为模板来加以扩增。
与蛋白酶TCES一样,蛋白酶PFUS可在枯草芽孢杆菌系统中表达。用于表达蛋白酶PFUS的质粒可根据用于蛋白酶TCES的表达质粒pSTC3构建。首先,含有可用PCR扩增的全长蛋白酶PFUS基因的DNA片段以BamHI和SacI酶切以回收编码该酶N-末端部分约0.8kb的片段。以质粒pSTC 3中也编码蛋白酶TCES N-末端部分的BamHI-SacI片段替代该片段。得到的编码蛋白酶TCES与蛋白酶PFUS基因杂交蛋白的表达质粒命名为质粒pSPT1。图14显示了质粒pSPT1的限制性图谱。
然后,上面的PCR-扩增的DNA片段以SpeI和SphI酶切以得到约5.7kb的片段,将其分离并代替以质粒pSPT1中编码蛋白酶TCES C-末端部分的SpeI-SphI片段。这样构建的表达质粒命名为质粒pSNP1,并且以该质粒转化的枯草芽孢杆菌DB 104命名为枯草芽孢杆菌DB 104/pSNP 1且保藏于国家生命科学与人类技术(NIBH)研究所,Higashi1-1-3,Tsukuba-shi,Ibaraki-ken,日本于1995年12月1日(最初保藏日期)根据布达佩斯条约保藏号为FERM BP-5634。图15显示质粒pSNP1的限制性图谱。
培养枯草芽孢杆菌DB 104/pSNP 1并且检测培养上清和细胞提取物的蛋白酶活性并且发现两个样品中均有耐热蛋白酶活性发现。
编码蛋白酶PFUS基因的核苷酸序列可通过以限制酶将插入到质粒pSNP 1中的DNA片段酶切成适当大小的片段,将该片段亚克隆进入适当的克隆载体,并且以该亚克隆片段作为模板进行的双脱氧方法加以测定。序列表的SEQ ID NO.34显示了存在于这样获得的核苷酸序列中开放阅读框的核苷酸序列。此外,序列表中的SEQ ID NO.35显示了由该核苷酸序列推断的蛋白酶PFUS的氨基酸序列。
此外,当也培养以质粒pSPT 1转化的枯草芽孢杆菌DB 104,即枯草芽孢杆菌DB 104/pSPT 1时,在培养上清和细胞提取物中均发现有蛋白酶活性。序列表的SEQ ID NO.6显示了编码蛋白酶TCES与蛋白酶PFUS杂交蛋白开放阅读框的核苷酸序列。此外,序列表的SEQ IDNO.5显示了由该核苷酸序列推断的杂交蛋白的氨基酸序列。
本发明的表达蛋白酶的产量可通过使用在枯草芽孢杆菌中高度表达的基因,尤其是分泌型蛋白的基因来提高、作为这样的基因,α-淀粉酶和各种细胞外蛋白酶的基因可被使用。例如,表达的蛋白酶PFUS的产量可通过使用枯草蛋白酶的启动子及信号序列来提高。即,通过连接全长蛋白酶PFUS基因到编码枯草蛋白酶基因信号序列区域的下游以使两个基因的翻译框架相互吻合,在枯草蛋白酶基因启动子的控制下蛋白酶PFUS可表达为融合蛋白。
作为枯草蛋白酶的启动子和信号序列,在《细菌学杂志》,171卷,2657-2665页(1988)中所描述的插入到质粒pKWZ中的枯草蛋白酶基因的启动子和信号序列可被使用。该基因的核苷酸序列分别在上面的文献中被描述成其5′上游区含有启动子序列和在《细菌学杂志》,158卷,411-418(1984)被描述成其编码枯草蛋白酶的区域。根据这些序列,分别合成在该基因启动子序列的上游引入EcoRI位点的引物SUB4,和在编码枯草蛋白酶信号序列区域的后面引入BamHI位点的引物BmRI。序列表的SEQ ID NO.36与37分别显示引物SUB 4与BmR1的核苷酸序列。通过使用引物SUB 4与BmR1,可用质粒pKWZ作为模板通过PCR扩增出一个含有编码枯草蛋白酶基因启动子到信号序列的区域的约0.3kb的DNA片段。
连接到该DNA片段下游的蛋白酶PFUS基因可用PCR方法取自激烈热球菌的染色体DNA。作为与该基因5′部分杂交的引物,引物NPF-4可被使用。此外,与3′部分杂交的引物可在该基因终止密码子下游的核苷酸序列被测定以后制备。即,测定质粒pSNPD中该部分的核苷酸序列(该核苷酸序列在序列表中的SEQ ID NO.38),该质粒通过亚克隆以BamHI酶切质粒pSNP1而制备的约O.6kb的片段进入质粒载体pUC 119的BamHI位点而获得。根据该序列,合成与蛋白酶PFUS基因3′部分杂交且能导入SphI位点的引物NPM-1。序列表中的SEQ IDNO.39显示了引物NPM-1的序列。
另外,当用Bam HI位点将蛋白酶PFUS基因连接到上面的0.3kb的DNA片段时,存在于该基因中的唯一一个BamHI位点成为该步骤的障碍。通过PCR-诱变方法去除该BamHI位点的引物mutRR和mutFR可根据列于序列表中的SEQ ID NO.34里蛋白酶PFUS基因的核苷酸序列而制备。引物mutRR与mutRF的核苷酸序列分别显示于SEO IDNO.40和41。此外,当用这些引物去除BamHI位点时,存在于序列表中SEQ ID NO.35里蛋白酶PFUS的氨基酸序列中560位置的甘氨酸由于导入到该位点的核苷酸替代而被缬氨酸所替代。
通过用这些引物,可获得连接到启动子至信号序列-枯草蛋白酶基因编码区的蛋白酶PFUS基因。即,用激烈热球菌的染色体DNA作为模板并且用引物mutRR与NPF-4,和引物mutFR与NPM-I的两种引物对进行2种PCR。此外,通过混合两种PCR扩增的DNA片段而形成的双链体分子作为模板并且用引物NPF-4与NPM-1再将进行PCR。这样,可扩增到不含BamHI位点的全长约2.4kb的蛋白酶PFUS基因。
分离以BamHI与SphI酶切上面PCR-扩增的DNA片段而获得约2.4kb的DNA片段,并且代替以含有质粒pSNP1中的蛋白酶PFUS基因的BamHI-SphI片段。这样构建的表达质粒命名为pPS1并且以该质粒转化的枯草芽孢杆菌DB 104命名为枯草芽孢杆菌DB 104/pPS1。当培养转化子时,在培养上清与细胞提取物中均发现有与使用质粒pSNP1时类似的蛋白酶活性,并且证实该氨基酸替代不影响酶活性。图16显示了质粒pPS1的限制性图谱。
含有枯草蛋白酶启动子至信号序列的约0.3kb的DNA片段以EcoRI与BamHI酶切,并且替代以含有质粒pPS1中P43启动子与核糖体结合位点的EcoRI-BamHI片段。这样构建的表达质粒命名为pNAPS1且以该质粒转化的枯草芽孢杆菌命名为枯草芽孢杆菌DB 104/pNAPS1。培养该转化子,检查培养上清与细胞提取物的蛋白酶活性发现两种样品均有蛋白酶活性。与枯草芽孢杆菌DB 104/pSN1相比表达的酶量更高。图17显示质粒pNAPS1的限制性图谱。
通过与蛋白酶TCES基因与蛋白酶PFUS基因类似的方法,可从除激烈热球菌与速生热球菌之外的超嗜热菌中获得与这些基因具有同源性的蛋白酶基因。然而,在用上面的寡核苷酸PRO-1F,PRO-2F,PRO
2R和PRO-4R作为引物并且用海葡萄嗜热菌DSM 3639的染色体DNA与解蛋白栖热拟杆菌DSM 5265的染色体DNA作为模板的PCR中,在速生热球菌中出现的DNA片段的扩增在此未被发现。
此外,已知通过PCR的基因扩增效率主要受引物3′末端与模板DNA退火效率的影响。即使用PCR的DNA扩增未被观察到,但可通过合成和使用与这次用的寡核苷酸具有不同的核苷酸序列但编码相同氨基酸序列的寡核苷酸来加以检测。可替代地,蛋白酶基因也可通过用染色体DNA和用上面的寡核苷酸或其它超耐热蛋白酶基因的一部分作为探针而进行的southern杂交来加以检测。
制备编码由序列表的SEQ ID NO.8代表的蛋白酶PFUL的氨基酸序列中第323个残基至第650个残基序列的约1kb的DNA片段,并且它可用作探针以进行用海葡萄嗜热菌DSM 3639染色体DNA与解蛋白栖热拟杆菌DSM 5265染色体DNA的基因组southern杂交。结果,当使用以PstI(由Takara Shuzo公司生产)酶切的海葡萄嗜热菌染色体DNA时,在约4.8kb的位置观察到一个信号。另一方面,当使用以XbaI酶切的解蛋白栖热拟杆菌染色体DNA时,在约3.5kb的位置观察到一个信号。
从这里揭示出与蛋白酶PFUL,蛋白酶PFUS及蛋白酶TCES具有同源性的序列也存在于海葡萄嗜热菌与解蛋白栖热拟杆菌的染色体DNA中。从这样检测到的DNA片段中,可用与分离和鉴定编码蛋白酶TCES或蛋白酶PFUS基因时相同的方法分离和鉴定编码存在于海葡萄嗜热菌或解蛋白栖热拟杆菌中的超耐热蛋白酶的基因。
通过在37℃含10μg/ml卡那霉素的LB培养基中培养,导入有蛋白酶TCES基因,即本发明的超耐热蛋白酶基因的转化子(枯草芽孢杆菌DB104/pSTC3)在培养基中表达超耐热蛋白酶。培养完成以后,离心培养物以收集上清从而获得粗酶制剂,并以硫酸铵盐析和透析。这样,获自枯草芽孢杆菌DB104/pSTC3的粗酶制剂命名为TC-3。
按照类似的步骤,可从导入有蛋白酶PFUS基因的转化子枯草芽孢杆菌DB101/pSNP1,或以导入有编码蛋白酶TCES和蛋白酶PFUS杂交蛋白酶基因的转化子枯草芽孢杆菌DB104/pSPT1中获得粗酶制剂。从枯草芽孢杆菌DB104/pSNP1与枯草芽孢杆菌DB104/pSPT1获得的粗酶制剂分别命名为NP-1和PT-1,
在常规条件下,例如,通过在37℃含10μg/ml卡那霉素的LB培养基中培养,导入有蛋白酶PFUS基因,即本发明的超耐热蛋白酶基因的转化子枯草芽孢杆菌DB104/pNPAPS1在细胞或培养液中表达超耐热蛋白酶。培养完成以后,通过离心分离细胞和培养上清,可用下面的步骤从这两者中任何一个获得蛋白酶PFUS的粗酶制剂。
当从细胞中纯化酶时,首先以溶菌酶裂解细胞,将裂解液热处理并离心以回收上清。该上清可用硫酸铵沉淀分级分离(fractionated)并进行疏水层析以获得纯化的酶。从枯草芽孢杆菌DB104/pNAPS1中这样获得的纯化酶制剂命名为NAPS-1。
另一方面,透析培养上清并进行阴离子层析。收集洗脱的活性部分,热处理,从硫酸铵沉淀分级分离。并进行疏水层析以获得纯化的蛋白酶PFUS。该纯化的酶制品命名为NAPS-1S。
当用这样获得的纯化产物NAPS-1与NAPS-1S进行SDS-聚丙烯酰胺凝胶电泳时,两种酶制制显示相应于约45 kDa分子量的单一带。这两种酶制剂实质上是相同的酶制剂,它们在纯化过程中通过热处理去除了前肽序列而转变为成熟形式(活性形式)的酶。
通过导入有由本发明获得的超耐热蛋白酶基因的转化子而制备的蛋白酶制剂,如TC-3,NP-1,PT-1,NAPS-1及NAPS-1S具有下面的酶学和理化特性。
(1)活性
本发明获得的酶水解明胶以制备短链多肽。此外,用这些酶水解酪蛋白以制备短链多肽。
此外,用本发明获得的酶水解琥珀酰-L-亮氨酰-L-亮氨酰L-缬氨酰-L-酪氨酸-4-甲基香豆素-7-酰胺(Suc-Leu-Leu-Val-Tyr-MCA)以制备荧光材料(7-氨基-4-甲基香豆素)。
此外,以本发明获得的酶水解琥珀酰-L-丙氨酰-L-丙氨酰-L-脯氨酰-L-苯丙氨酸 对-硝基苯胺(Suc-Ala-Ala-Pro-Phe-p-NA)以制备黄色材料(p 硝基苯胺)。
(2)测定酶活性的方法
由本发明获得的酶制剂的酶活性可用合成肽底物来加以测定。
由本发明获得的酶制剂TC-3的酶活性可用Suc-Leu-Leu-Val-Tyr-MCA(由肽实验室生产)作为底物来加以测定。即,要被检测酶活性的酶制剂作适当稀释,向20μl该溶液中加入80μl 0.1M含62.5μM Suc-Leu-Leu-Val-Tyr-MCA的磷酸钠缓冲液(pH 7.0),然后在75℃孵育30分钟。通过加入20μl 30%的醋酸终止反应以后,在355nm的激发波长与460nm的荧光波长处测量荧光密度以定量产生的7-氨基-4-甲基香豆素的量,并且将得到的数值与不加酶制剂时孵育所得的数值比较以检测酶的活性。在pH 7.0和75℃时由本发明获得的酶制剂TC-3具有Suc-Leu-Leu-Val-Tyr-MCA水解活性。
此外,酶制剂NP-1,PT-1,NAPS-1与NAPS-1S的酶活性可用Suc-Ala-Ala-Pro-Phe-p-NA(由Sigma生产)作为底物通过光度测量法加以测定。即,将要被进行酶活性检测的酶制剂适当稀释,向50μl的该溶液中加入含Suc-Ala-Ala-Pro-p-NA的50μl 0.1M磷酸钾缓冲液(pH 7.0)(Suc-Ala-Ala-Pro-Phe-p-NA溶液),接着在95℃孵育30分钟。在反应以冰冷却终止后,测量405nm处的吸收值以定量产生的p-硝基苯胺的量,并将得到的数值与未加酶制剂的孵育液测量所得的数值比较,从而检查该酶的活性。鉴于此,0.2M的Suc-Ala-Ala-Pro-Phe-p-NA溶液用于酶制剂NP-1和PT-1并且1M的溶液用于酶制剂NAPS-1和NAPS-1S。在pH 7.0且95℃测量时,由本发明获得的酶制剂NP-1,PT-1,NAPS-1及NAPS-1S具有Suc-Ala-Ala-Pro-Phe-p-NA水解活性。
(3)对各种底物活性的检测
本发明获得的酶制剂对人工肽底物的活性用上述(2)中描述的测量酶活性的方法加以确证。即,本发明获得的酶制剂TC-3具有Suc-Leu-Leu-Val-Tyr-MCA水解活性,并且酶制剂NP-1、PT-1、NAPS-1及NAPS-1A分别具有Suc-Ala-Ala-Pro-Phe-p-NA水解活性。此外,通过上述(2)中描述的用于酶制剂TC-3的酶活性测量方法检查酶制剂NP-1、PT-1、NAPS-1及NAPS-1S的Suc-Leu-Leu-Val-Tyr-MCA水解活性,并且显示出这些酶制利具有降解该底物的活性。此外,通过上面(2)描述的用于酶制剂NP-1和PT-1的酶活性测量方法检查酶制剂TC-3的Suc-Ala-Ala-Pro-Phe-p-NA水解活性,并且发现有降解该底物的活性。此外,由本发明获得的酶制剂对明胶的活性可通过酶在SDS-聚丙烯酰胺凝胶上的电泳来确定明胶的降解而被检测。即,要被检测酶活性的酶制剂作适当解释,向10μl的样品中加入2.5μl样品缓冲液(50mM Tris-HCl,pH7.5,5%SDS,5%2-巯基乙醇,0.005%溴酚蓝,50%的甘油),接着在100℃处理5分钟并用含0.05%明胶0.1%SDS-10%聚丙烯酰胺凝胶电泳。电泳完成以后,将凝胶浸入50mM磷酸钾缓冲液(pH7.0),并在95℃孵育3小时以完成酶反应。然后,以2.5%的考马斯亮蓝R-250,25%乙醇及10%醋酸染色30分钟,并转移至7%的醋酸中3至15小时以去除过多的染料。通过这样的事实来检测蛋白酶的活性,即明胶由蛋白酶水解成扩散到凝胶外的肽段,因此相应的凝胶部分未被考马斯亮蓝染色。由本发明获得的酶制剂TC-3,NP-1,PT-1,NAPS-1及NAPS-1S在95℃具有明胶水解活性。
此外,在上面活性测量方法中发现源自蛋白酶PFUS基因的酶制剂NP-1、NAPS-1及NAPS-1S几乎在凝胶中的相同位置具有明胶水解活性。从这一点,显示出在这些酶制剂中,从前体酶到成熟形式酶的加工以类似的方式发生。
另外,除了使用含0.05%酪蛋白的0.1%SDS-10%聚丙烯酰胺凝胶以外,对酪蛋白的水解活性可按照与用于检测对明胶活性相同的方法加以检测。由本发明获得的酶制剂TC-3、NP-1、PT-1、NAPS-1及NAPS-1S在95℃具有水解酪蛋白的活性。
同样地,由本发明获得的酶制剂TC-3、NP-1、NAPS-1及NAPS-1S的酪蛋白水解活性可用下面方法测定。100μl适当稀释的酶制剂加入到100μl含0.2%酪蛋白的0.1M的磷酸钾缓冲液中,于95℃孵育1小时,并反应通过加入100μl 15%的三氯乙酸终止。通过离心该反应混合物而获得的上清中含有的酸溶性短链多肽的量在280nm处测其吸收值并与不加酶制剂时孵育液测得的吸收值比较,以检查酶活性。由本发明获得的酶制剂TC-3、NP-1、NAPS-1及NAPS-1S在95℃具有酪蛋白水解活性。
(4)最适温度
除了改变温度外,由本发明获得的酶制剂TC-3的最适温度用上面(2)中所示的酶活性测量方法加以检测。如图18中所示,酶制剂TC-3在37至95℃的温度表现出活性并且其最适温度为70至80℃。即,图18为显示本发明获得的酶制剂TC-3的活性与温度关系的图,并且纵坐标显示对于最大活性(%)的相对活性且横坐标显示温度。
此外,由本发明获得的酶制剂NAPS-1的最适温度,除了改变温度之外,用上面(2)显示的酶活性测量方法测定。如图19所示,在pH7.0的测量条件下,酶制剂NAPS-1在40至110℃的温度下具有活性,并且最适温度为80至95℃。即,图19为显示本发明获得的酶制剂NAPS-1的活性与温度之间的关系,并且纵坐标显示对于最大活性(%)的相对活性且横坐标显示温度。
(5)最适pH
由本发明获得的酶制品TC-3的最适pH通过上面(2)中所示的酶活性测定方法测定。即,用具有各种pHs的缓冲液制备Suc-Leu-Leu-Val-Tyr-MCA溶液,并比较用这些溶液获得的酶活性。作为缓冲液,醋酸钠缓冲液在pH 3至6使用,磷酸钠缓冲液在pH 6至8,硼酸钠缓冲液在pH 8至9,且磷酸钠-氢氧化钠缓冲液在pH 10至11使用。如图20所示,酶制剂TC-3在pH 5.5~9时表现出活性,并且最适pH为7~8。即,图20为显示本发明获得的酶制剂TC-3的活性与pH关系的图,且纵坐标显示相对活性(%)而横座标显示pH。
此外,本发明获得的酶制剂NP-1的最适pH用上面(2)所示的酶活性测量方法测定。即,用具有各种pHs的缓冲液制备Suc-Ala-A1a-Pro-Phe-pNA溶液,并比较用这些溶液获得的酶活性。作为缓冲液,醋酸钠缓冲液在pH 4~6使用,磷酸钾在pH 6~8,硼酸钠缓冲液在pH 5~10,并且磷酸钠-氢氧化钠缓冲液在pH 10.5。如图21所示,酶制剂NP-1在pH 5~10显示活性,并且最适pH为pH 5.5~8。即,图21为显示本发明获得的酶制剂NP-1活性与pH之间关系的图,并且纵座标代表相对活性(%)且横坐标代表pH。
此外,本发明获得的酶制剂NAPS-1的最适pH用上面(2)中所示的酶活性测量方法测定。即,用具有各种pHs的缓冲液制备Suc-Ala-Ala-Pro-Phe-pNA溶液,并且比较用这些溶液获得的酶活性。作为缓冲液,醋酸钠缓冲液在pH 4~6使用,磷酸钾在pH 6~8,硼酸钠缓冲液在pH 8.5~10。如图22所示,酶制剂NAPS-1在pH 5~10显示出活性,并且最适pH为pH 6~8。即,图22为显示本发明获得的酶制剂NAPS-1活性与pH关系的图,且纵坐标代表相对活性(%)而横坐标代表pH。
(6)耐热性
检测本发明获得的酶制剂TC-3的耐热性。即,该酶制剂在20mMTris-HCl中,各段时间pH均为7.5-80℃孵育,取其适当量的样品通过上面(2)中所示的方法测其酶活性,并将该活性与没有热处理的酶活性作比较。如图23所示,本发明获得的酶制剂TC-3甚至在热处理3小时之后具有不少于90%的活性且,因而,在上面热处理中是稳定的。即,图23是显示本发明获得的酶制剂TC-3的耐热性的图,并且纵坐标表示热处理以后的残余活性(%)而横坐标表示时间。
此外,测定本发明获得的酶制剂NP-1的耐热性。即,该酶制剂在20mM Tris-HCl中95℃孵育,各时间段pH为7.5,取其适量等分样品按上面(2)所示的方法测定其酶活性,并比较该酶活性与没有热处理的酶活性。如图24所示,当95℃孵育时观察到本发明获得的酶制剂NP-1具有异常升高的酶活性。这被认为是由于作为前体而产生的蛋白酶在热处理过程中产生自我催化激活。此外,在长达3小时的热处理之后没有发现酶活性的降低。即,图24为显示本发明获得的酶制剂NP-1的耐热性的图,并且纵坐标代表热处理后残余的活性(%)且横坐标代表时间。
此外,测定上面经热处理而激活的酶制利NP-1的耐热性。即,该酶制剂NP-1通过95℃ 30分钟的热处理而激活,再以95℃孵育不同时间,并按上述测定酶活性以与没经热处理的酶活性相比较。同时,使用具有各种pHs(醋酸钠缓冲液在pH 5,磷酸钾缓冲液在pH 7,硼酸钠缓冲液在pH 9,磷酸钠-氢氧化钠缓冲液在pH 11,每种情况20mM)的缓冲液。如图25所示,当本发明获得的激活的酶制剂NP-1在pH为9的缓冲液中处理时,在经8小时的热处理之后其活性不少于90%并且甚至经24小时的热处理之后约有50%的酶活性,因此,对上面的热处理很稳定。即,图25为显示本发明获得的酶制剂NP-1耐热性的图,并且纵坐标表示经热处理之后残余的活性(%)且横坐标表示时间。
此外,测定本发明获得的酶制剂NAPS-1的耐热性。即,该酶制剂在20mM Tris-HCl中95℃处理,各时间段pH为7.5,取其适当等分样品按上面(2)所示的方法测定其酶活性以与未经热处理的酶活性相比较,如图26所示,本发明获得的酶制剂NAPS-1甚至在95℃热处理3小时以后仍具有不少于80%的活性并且,因此,对上面的热处理稳定。即,图26是显示本发明获得的酶制剂NAPS的耐热性的图,且纵坐标表示经热处理之后残余的活性(%)而横坐标表示时间。
(7)pH稳定性
本发明获得的酶制剂NP-1的pH稳定性按下面的步骤加以测定。含有通过95℃30分钟热处理而激活的酶制剂NP-1的50μl 20mM的各种pHs的缓冲液以95℃处理60分钟,并取其适当样品按上面(2)所示的方法测定其酶活性以与未经处理时的酶活性相比较。作为缓冲液,醋酸钠缓冲液可在pH 4~6时使用,磷酸钾缓冲液在pH 6~8,硼酸钠缓冲液在pH 9~10,磷酸钠-氢氧化钠缓冲液在pH 11。如图27所示,本发明获得的酶制剂NP-1甚至在5~11之间的pH经95℃60分钟处理以后仍保留有不少于95%的活性。即,图27是显示本发明获得的酶pH稳定性的图,并且纵坐标表示残余的活性(%)且横坐标表示pH。
(8)对去污剂的稳定性
本发明获得的酶制剂NP-1对去污剂的稳定剂用SDS作为去污剂加以检测。该酶制剂经95℃热处理30分钟而激活。制备50μl仅含该酶制剂的溶液及进一步含有终浓度0.1%或1%SDS的溶液。这些溶液在95℃孵育不同时间,取其适当量的样品通过上面(2)中描述的方法测定该酶的活性以与未经处理的酶活性比较。如图28所示,由本发明获得的激活的酶制剂NP-1经95℃热处理8小时以后仍具有不少于80%的活性且甚至不管SDS存在与否经24小时处理以后仍具有约50%的活性并且,因此,甚至在SDS存在下仍具有高的稳定性。即,图28是显示本发明获得的酶制剂NP-1对SDS的稳定性,并且纵坐标表示残余的活性(%)且横坐标表示时间
此外,本发明获得的酶制剂NAPS-1对去污剂的稳定性用SDS作为去污剂来测定。制备50μl仅含酶制剂NAPS-1的溶液及进一步含有终浓度为0.1%或1%SDS的溶液。这些溶液在95℃孵育不同时间,取适当量的样品按上面(2)中所述的方法测定其酶活性以与未经处理的酶活性相比较。如图29所示,本发明获得的酶制剂NAPS-1,不管SDS存在与否,经95℃热处理3小时以后仍具有约80%的活性。即,图29为显示本发明获得的激活的酶制剂NAPS-1对SDS稳定性的图,并且纵坐标表示残余的活性(%)而横坐标表示时间。
当比较上面的结果时,显示出与酶制剂NP-1相比,酶制剂NAPS-1具有异常降低的残余活性。然而,该现象不可认为是基于包含在两种制品中酶蛋白本身对SDS稳定性的差异。认为上面的现象是由下面的原因所致,即纯化的酶制品NAPS-1与NP-1相比具有较少的杂质蛋白,因此,由于自我酶切而失活更易发生。
(9)对有机溶剂的稳定性
本发明获得的酶制剂NAPS-1对有机溶剂的稳定性用乙腈来检测。含乙腈至终浓度25%或50%的每50μl酶制剂NAPS-1溶液在95℃孵育不同时间,取其适当量的样品按上面(2)中所述的方法测定其活性从而与未处理的酶活性比较。如图30所示,本发明获得的酶制剂NAPS-1甚至在50%乙腈存在下经95℃处理1小时以后,其活性不少于处理前活性的80%。即,图30是显示本发明获得的酶制剂NAPS-1对乙腈稳定性的图。
(10)对变性剂的稳定性
本发明获得的酶制剂NAPS-1对各种变性剂的稳定性用尿素和盐酸胍来测定。制备含终浓度为3.2M或6.4M尿素或终浓度为1M、3.2M或6.4M盐酸胍的每50μl的酶制剂NAPS-1溶液。这些溶液在95℃孵育不同时间,取其适当量的样品用上面(2)中所述的方法测定其活性从而与未经处理时的活性相比较。如图31所示,本发明获得的酶制剂NAPS-1甚至在6.4M尿素存在下经95℃处理1小时之后仍具有不少于处理前的70%的活性。即,图31是显示对尿素稳定性的图且图32是显示对盐酸胍稳定性的图,并且纵坐标表示残余的活性且横坐标表示时间。
(11)各种试剂的影响
各种试剂对本发明获得的酶制剂TCFS及NAPS-1的影响被测定。即,上面的酶制剂在各种试剂以0.1mM终浓度存在下37℃处理30分钟,取其一部分按上面(2)所述的方法测定其酶活性以与没加试剂时的活性相比较。结果显示于表1。表1
试剂 |
TCES |
NAPS-1 |
对照 |
100% |
100% |
EDTA |
103.5% |
36.1% |
PMSF |
8.1% |
0.1% |
抗蛋白酶 |
19.0% |
81.9% |
抑糜蛋白酶素(chymostatin) |
0% |
6.6% |
亮抑蛋白酶肽 |
104.5% |
89.3% |
胃酶抑制利 |
105.2% |
100.7% |
N-乙基马来酰亚胺(N-ethylmaleimide) |
82.6% |
102.6% |
如表1所示,当以PMSF(苯甲磺酰氟)及抑糜蛋白酶素处理时,两个酶制品均具有异常降低的活性。此外,当以antipam处理时,在TCES中观察到酶活性的降低,且当以EDTA处理时,在NAPS-1中观察到活性降低。用其它试剂时,没有观察到活性的较大下降。
(12)分子量
本发明获得的酶制剂NAPS-1的分子量用0.1%SDS-10%聚丙烯酰胺凝胶的SDS-PAGE测定。在SDS-PAGE上,酶制剂NAPS1表现出约45 kDa的分子量。另外,酶制剂NAPS-1S与酶制剂NAPS-1表现出相同的分子量。
(3)N-末端氨基酸序列
成熟蛋白酶PFUS的N-末端氨基酸序列用本发明获得的酶制剂NAPS-1来测定。电泳于0.1%SDS-10%聚丙烯酰胺凝胶上的酶制剂NAPS-1转移至PVDF膜上,并且膜上该酶的N-末端氨基酸序列用蛋白测序仪通过自动Edman降解来测定。这样测得的成熟型蛋白酶PFUS的N-末端氨基酸序列显示于序列表的SEQ ID NO.42。该序列与序列表中的SEQ ID NO.35所代表的蛋白酶PFUS氨基酸序列中氨基酸133~144的序列相一致,并且显示出成熟的蛋白酶PFUS是由包括在这部分的多肽所组成的酶。这样揭示的成熟蛋白酶PFUS的氨基酸序列列于序列表中的SEQ ID NO.3。此外,如上述,第428个氨基酸(相应于序列表中SEQ ID NO.35所代表的氨基酸序列中的第560个氨基酸)无论是甘氨酸还是缬氨酸都对蛋白酶PFUS的酶活性没有影响。此外,在序列表中的SEQ ID NO.34所代表的蛋白酶PFUS基因的核苷酸序列中,编码成熟型酶的核苷酸序列显示于SEQ IDNO.4。该序列中第1283个碱基可以是鸟嘌呤或胸腺嘧啶(thimine)。
在用PCR的体外基因扩增时,核苷酸的错误掺入可能在延伸反应过程中发生,导致得到DNA的序列中核苷酸的替代。这个频率主要依赖于用于PCR的酶的种类、反应混合物的组成,反应条件,待扩增DNA的核苷酸序列等。然而,当基因中某一区域仅按正常扩增时,该频率至多约每400个核苷酸中出现一个这样的核苷酸。在本发明中,PCR用于蛋白酶TCES或蛋白酶PFUS基因的分离或其表达质粒的构建。得到基因中的核苷酸序列里核苷酸替代的数目如果有的话,也是少许几个。考虑到由于翻译密码子的兼并,基因中核苷酸的替代不一定导致表达蛋白氨基酸的替代的事实,可能的氨基酸替代的数目可估计为至多整个残基中2~3个。不可否认蛋白酶TCES及蛋白酶PFUS基因的核苷酸序列及这里公开的蛋白酶的氨基酸序列与天然状态会有所不同。然而,本发明的目的是公开在高温中具有高活性的超耐热蛋白酶及编码相同酶的基因并且,因此,蛋白酶和基因不限于与天然状态相同的酶及编码相同酶的相同基因。对本领域技术人员来说很明显甚至具有可能核苷酸替代的基因能在严格的条件下与天然基因杂交。
此外,在本说明书中,用于获得感兴趣基因的方法已清楚地公开以致于(1)从超嗜热菌的染色体DNA中制备表达克隆的文库并且筛选出蛋白酶活性表达的克隆,(2)根据氨基酸序列的同源性用杂交或PCR分离可能表达超耐热蛋白酶的基因,并且用适当的微生物确证这些基因表达产物的酶的作用,即,超耐热蛋白酶的活性。因此,在用已知导入突变的方法将各种突变导入到本发明的超耐热蛋白酶基因中之后,容易通过上面的方法测定是否带有导入突变的基因序列编码超耐热蛋白酶。只要由于突变导入而获得的基因序列实质上表达与本发明超耐热蛋白酶活性相同的蛋白酶活性,待导入突变的种类不限于定义的哪几种。然而,为了使表达的蛋白保留蛋白酶活性,突变需要导入到除在丝氨酸蛋白酶中共同保守的四个区域以外的区域。
突变可随机导入编码超耐热蛋白酶基因的任何区域(随机诱变),或同样地,所需突变可导入到定义的预先规定的位置(定点诱变)。作为随机导入突变的方法,例如,有一种化学处理DNA的方法。在该方法中,制备质粒以使待导入突变的区域为部分单链,并用亚硫酸氢钠作用于该部分单链的区域以将胞嘧啶域基转变为尿嘧啶并且,因此,导入一个从C:G到T:A的突变。此外,在[α-S]dNTP存在下单链部分修复成双链过程中用于产生碱基替代的方法也为已知。这些方法的细节在《美国国家科学院院报》,79各,1408~1412页(1982),及《基因》,64卷,313~319页(1988)中描述。
随机突变也可通过在核苷酸掺入忠实性降低的条件下由PCR导入。尤其,向反应系统中加入锰是有效的方法且该方法的细节在《生化年刊》,224卷,347-355页(1995)中被描述。作为导入定点突变的方法,例如,有一种用将感兴趣基因制成单链的系统的方法,合成根据在该单链部分待导入的突变而设计的引物,并且该引物与该部分退火,将其导入仅导入有突变的链才被选择性复制的活体系统。该方法的细节在《酶学方法》,154卷,367页(1987)中被描述。例如,导入突变的试剂盒,可用Takara Shuzo公司生产的突变体(mutant)K。定点诱变也可用PCR来完成且其细节在《PCR技术方法》,61~70页(1989)中被描述,Ehlich编且由Takara Shuzo公司出版。可替代地,如,可用Takara Shuzo公司生产的用于体外诱变的试剂盒中的LAPCR。通过使用上面的方法,可导入替代、缺失及插入的突变。
这样,通过导入用本发明超耐热蛋白酶基因作为基础的突变可在宿主中制备与本发明超耐热蛋白酶具有类似的耐热性及最适温度但具有略微不同的,如,最适pH的酶。在这种情况,超耐热蛋白酶基因的碱基核苷酸序列不一定限于源自一个超耐热蛋白酶的序列。
通过交换同源序列,可通过重组两个或更多个相互具有同源序列的超耐热蛋白酶基因,如由本发明公开的这些基因,而制备杂合基因,并可在宿主中制备该基因编码的杂合酶,可通过测试基因产物的酶功能即,蛋白酶活性,而决定其是否为超耐热蛋白酶基因。例如,通过用上面的质粒pSPT1,可在枯草芽孢杆菌中制备其N-末端部分源自蛋白酶PFUS且C-末端部分源自蛋白酶TCES的杂合蛋白酶,并且该杂合蛋白酶在95℃具有蛋白酶活性。
预期该杂合酶同时具有2个或更多个基础酶的特性。例如,当比较这里公布的蛋白酶TCES与蛋白酶PFUS时,蛋白酶TCES在细胞外分泌效率方面更优越且蛋白酶PFUS在耐热性方面更优越。由于位于蛋白N-末端的信号序列对细胞外分必效率具有巨大影响,如果构建一个表达质粒以便,与pSPT1相对照,具有源自蛋白酶TCES N-末端部分和源自蛋白酶PFUS的C-末端部分的蛋白得以制备,与蛋白酶PFUS具有相同耐热性的超耐热蛋白酶可以与蛋白酶TCES相同的分泌效率分泌。此外,当酶进行细胞外分泌后信号序列要从酶中切除,但其对酶本身性质几乎没有影响。因此,当用适温菌制备超耐热蛋白酶时,其信号序列不必要源自超嗜热菌且只要感兴趣部分以更高效率细胞外分泌时,源自适温菌的信号序列也没有问题
尤其,当使用在宿主中高效表达的分泌蛋白的信号序列时,可期望更高效的分泌。
对于上面杂合基因的构建,重组不必要是定向完成。同样地,例如,通过混合两种或更多种超耐热蛋白酶基因的DNAs,(它们是杂合基因构建的原材料),从DNA降解酶断裂这些DNA并用DNA聚合酶重建这些片段来制备杂合基因。该方法的细节在《美国国家科学院院报》,91卷,10747-10751页(1994)中被描述。在这里,也可分离编码超耐热蛋白酶的基因序列并按上述通过检测表达蛋白的超耐热蛋白酶活性以从得到的杂合基因中鉴定出编码超耐热蛋白酶基因的序列。此外,预期编码丝氨酸蛋白酶共有的4个区域的序列在这样获得的基因中也得以保存。
因此,对于本领域的技术人员很明显,用适当的杂交条件,得到的杂合基因可与选自由具有序列表中的SEQ ID NO.9、10、11和12所代表的核苷酸序列的寡核苷酸PRO-1F、PRO-2F、PRO-2R和PRO-4R的DNA杂交。此外,也很明显通过上面的突变导入而获得的新的超耐热蛋白酶基因用适当的杂交条件可与具有选自由序列表中的SEQ ID NO.9、10、11和12所代表的核苷酸序列的DNA序列的基因杂交。
在该说明书中,我们集中描述了超耐热基因的获得。然而,编码既具有高度耐热性又具有其它性质的新的蛋白酶的基因可这样制备,即通过构建本发明超耐热蛋白酶基因和与本发明超耐热蛋白酶基因具有同源序列但没有耐热性的蛋白酶基因的杂合基因,例如,通过构建具有枯草蛋白酶基因的杂合基因以提高枯草蛋白酶的耐热性从而获得编码具有原先为枯草蛋白酶拥有的特性及更高耐热性的蛋白酶的基因。
在本发明中,为了检测基因编码的蛋白酶活性并制备酶制剂,我们用大肠杆菌和枯草芽孢杆菌作为待导入基因的宿主。然而,待导入基因的宿主不限于说明的种类。只要对该宿主的转化方法已建立,任何宿主可被使用,如短芽孢杆菌、乳杆菌属、酵母、霉菌、动物细胞、植物细胞、昆虫细胞等。时于这些,多肽的折叠以使表达的蛋白变为活性形式且这不会导致对宿主有害或致命作用是重要的。在上面列出的宿主中,除枯草芽孢杆菌之外,已知分泌其产物于培养基中的短芽孢杆菌,乳杆菌及霉菌可用作工业规模的感兴趣蛋白酶的批量生产。
实施例
下面的实施例更进一步详细描述本发明但又不限制其范围。
实施例1
(1)用于超耐热蛋白酶基因检测的寡核苷酸的制备
通过比较序列表中SEQ ID NO.8所代表的蛋白酶PFUL的氨基酸序列与源自已知细菌的碱性丝氨酸蛋白酶的氨基酸序列,证明它们中共同存在同源氨基酸序列。其中,选择三个区域并设计用于PCR引物的寡核苷酸以检测超耐热蛋白酶基因。
图2、3和4显示了相应于蛋白酶PFUL上面三个区域氨基酸序列,编码该区域蛋白酶PFUL基因的核苷酸序列,及据其合成的寡核苷酸PRO-1F、PRO-2F、PRO-2R及PRO-4R的核苷酸序列之间的关系。SEQ ID NO.9、10、11和12分别显示了寡核苷酸PRO-1F、PRO-2F、PRO-2R及PRO-4R的核苷酸序列。
(2)速生热球菌染色体DNA的制备
离心10ml获自德意志微生物保藏中心速生热球菌DSM 2476培养物以收集细胞并悬浮于pH8.0含25%蔗糖的100μl 50mM Tris-HCl中。向该悬液中加入20μl 0.5M EDTA和10μl 10mg/ml溶菌酶,并于20℃孵育1小时,再向其中加入800μl SET溶液(150mM NaCl,1mM EDTA,20mM Tris-HCl,pH 8.0),50μl 10%SDS及10μl 20mg/ml的蛋白酶K,并在37℃孵育1小时。通过酚-氯仿抽提终止反应并以乙醇沉淀以回收DNA,将其溶于50μl TE缓冲液(10mMTris-HCl,pH 8.0,0.1mM EDTA)以获得染色体DNA溶液。
(3)通过PCR对超耐热蛋白酶基因的检测
从上面速生热球菌染色体DNA和寡核苷酸PRO-1F与PRO2R,或PRO-2F与PRO-4R制备PCR反应混合物并进行35轮循环的反应,每轮循环由94℃1分钟-55℃1分钟-72℃1分钟所组成。当取这些反应混合物的一部分进行琼脂糖凝胶电泳时,观察到用寡核苷酸PRO-1F及PRO-2R时扩增出三个DNA片段,并且用寡核苷酸PRO-2F及PRO-4R时仅扩增出一个DNA片段。从凝胶中回收这些扩增片段,且其DNA末端用DNA补平试剂盒(由Takara Shuzo公司生产)补平并用T4多核苷酸激酶(由Takara Shuzo公司生产)磷酸化。然后,以HincII(由Takara Shuzo公司生产)酶切质粒载体pUC 19(由Takara Shuzo公司生产),得到的片段末端以碱性磷酸酶(由TakaraShuzo公司生产)脱磷酸化,与上面的PCR扩增DNA片段混合以让其连接,接着导入大肠杆菌JM 109从得到的转化子中提取质粒,并且选择插入有适当大小DNA片段的质粒,通过双脱氧方法对该插入片段测序。
这些质粒中,从含有用寡核苷酸PRO-1F及PRO-2R扩增的约150bp DNA片段的质粒p1F-2R(2)中核苷酸序列推断的氨基酸序列,及从含有用寡核苷酸PRO-2F及PRO-4R扩增的约550bp DNA片段的质粒p2F-4R中核苷酸序列推断的氨基酸序列含有与蛋白酶PFUL,枯草蛋白酶等氨基酸序列具有同源性的序列。序列表中的SEQID NO.13显示了质粒p1F-2R(2)中插入DNA片段的核苷酸序列以及由其推断的氨基酸序列并且序列表中的SEQ ID NO.14显示了质粒p2F-4R中插入DNA片段的核苷酸序列及由其推断的氨基酸序列。在序列表的SEQ ID NO.13所代表的核苷酸序列中,从第1~21个核苷酸的序列和第113~145个核苷酸的序列以及,在由序列表中的SEQ ID NO.14所代表的核苷酸序列中,第1~32个核苷酸的序列和第532~564个核苷酸的序列为用作PCR引物的寡核苷酸(分别相应于寡核苷酸PRO-1F、PRO-2R、PRO-2F和PRO-4R)的序列。
图5显示了质粒p2F-4R的限制性图谱。
(4)筛选源自速生热球菌蛋白酶基四
速生热球菌的染色体DNA以限制酶Sau3Al(由Takara Shuzo公司生产)部分酶切,接着在dATP及dGTP存在下用Klenow片段(由TakaraShuzo公司生产)对DNA末端做部分修复。将该DNA片段与λGEM11 XhoI Half-Site Arm载体(Vector)(由Promega生产)混和以让其连接,然后用Gigapack Gold(Stratagene生产)将其体外包装以制备含速生热球菌染色体DNA片段的λ噬菌体文库。部分该文库转化大肠杆菌LE 392(由Promega生产)以在平板上形成噬菌斑,并将噬菌斑转移至Hybond-N+膜(由Amersham生产)上。转移完以后,该膜以含1.5M NaCl的0.5N的NaOH处理,然后以pH 7.5,含3M的NaCl的0.5M Tris-HCl处理,以6×SSC洗膜,空气干燥,并以紫外透射仪(UV transilluminator)的紫外线照射以将噬菌体DNA固定至膜上。
另一方面,质粒p2F-4R以PmaCI及StuI(两者均由Takara Shuzo公司生产)酶切,然后进行1%琼脂糖凝胶电泳以回收分离的约0.5kb的DNA片段。通过用此片段作为模板并用随机引物DNA标记试剂盒Ver.2(由Takara Shuzo公司生产)及[α-32P]dCTP(由Amersham生产),制备31P-标记的DNA探针。
带有固定DNA的膜以杂交缓冲液(分0.5%SDS,0.1%BSA,0.1%聚乙烯吡咯烷酮,0.1% Ficoll 400,0.01%变性鲑精DNA)在50℃处理2小时,并转移至含32P-标记的DNA探针的相同缓冲液中,接着在50℃杂交15小时。杂交完成以后,以含0.5%SDS的2×SSC在室温下洗膜,然后以含0.5%SDS的1×SSC在50℃洗膜。进一步以1×SSC洗膜,空气干燥并用X-线光片在-80℃曝光6小时以获得放射自显影。筛选出约3,000个噬菌体克隆并且,结果,得到一个含蛋白酶基因的克隆。根据放射自显影的信号,找出该噬菌体的位置并且分离相应于用于转膜平板上的噬菌体至1ml含1%氯仿的SM缓冲液(50mMTris-HCl,pH 7.5,1M NaCl,8mM MgSO4,0.01%明胶)。
(5)含源自速生热球菌蛋白酶基因噬菌体DNA片段的检测
以上面的噬菌体克隆转导的大肠杆菌LE 392于NZCMY培养基(由Biolol生产)中37℃培养15小时以获得培养物,收集其中的上清以用QIAGEN-λ试剂盒(由QlAGEN生产)制备噬菌体DNA。得到的噬菌体DNAs分别以BamHI、EcoRI、EcoRV、HincII、KpnI、NcoI、PstI、SalI、SmaI及SphI(全部由Takara Shuzo公司生产)酶切,接着以琼脂糖凝胶电泳。然后,按照《分子克隆;实验指南》,(第2版(1986),T.Maniatis等编,冷泉港实验室出版)中所述的southern转印方法将DNA从凝胶转印至Hybond-N+膜上。
得到的膜在杂交缓冲液50℃处理4小时,并转移至用于实施例1-(4)的含32P-标记的DNA探针的相同缓冲液中,然后在50℃杂交18小时。杂交完成以后,以含0.5%SDS的1×SSC 50℃洗膜,然后以1×SSC冲洗并空气干燥。该膜以X光片在-80℃曝光6小时以获得放射自显影。放射自显影表明在以KpnI酶切的噬菌体DNA中一个约9kb的DNA片段含有蛋白酶基因。
然后,含有上面蛋白酶基因的噬菌体DNA以KpnI消化,并继尔进一步以BamHI、PstI及SphI酶切,接着用1%的琼脂糖凝胶电泳。按照上面所述的类似步骤,进行southern杂交并且表明一个约5kb的KpnI-BamHI片段含有蛋白酶基因
(6)含有源自速生热球菌蛋白酶基因DNA片段的克隆
含有上面蛋白酶基因的噬菌体DNA以KpnI和BamHI酶切,然后进行1%的琼脂糖凝胶电泳从而从凝胶中分离出约5kb的DNA片段。然后,然后以KpnI和BamHI酶切质粒载体pUC 119(由Takara Shuzo公司生产),并与上面约5kb的DNA片段混合以让其连接,接着导入大肠杆菌JM 109。从得到转化子中提取质粒,挑选含约5kb的DNA片段的质粒并命名为质粒pTC 3
图6显示了质粒pTC 3的限制性图谱。
(7)含源自速生热球菌蛋白酶基因的质粒pTCS 6的制备
以SacI酶切上面的质粒PTC 3,然后1%琼脂糖凝胶电泳,并按照与上面实施例1-(5)所述的用于检测含蛋白酶基因的噬菌体DNA片段相同的方式进行southern杂交。得到的放射自显影信号表明通过以SacI酶切质粒pCT3而获得的一个约1.9kb的DNA片段含有超耐热蛋白酶基因。
然后,以SacI酶切质粒pTC 3,然后以1%琼脂糖凝胶电泳以分离出约1.9kb的DNA片段。然后,以SacI酶切质粒载体pUC 118(由TakaraShuzo公司生产),以碱性磷酸酶去磷酸化并与约1.9kb的片段混合以让其连接,接着导入大肠杆菌JM 109。从得到的转化子中提取质粒,并挑选出仅含一个分子的约1.9kb的片段的质粒且命名为质粒pTCS 6。
图7显示质粒pTCS 6的限制性图谱。
(8)源自速生热球菌包含在质粒pTCS 6中DNA片段核苷酸序列的测定
为了测定源自速生热球菌插入在质粒pTCS 6中的蛋白酶基因的核苷酸序列,用Kilo序列缺失试剂盒(由Takara Shuzo公司生产)制备其中插入到质粒中的DNA片段部分以各种长度删除的缺失突变体。其中,挑选出具有适当缺失长度的几种突变体并用双脱氧方法测定每个插入DNA片段部分的核苷酸序列,并结合这些结果以决定包含在质粒pTCS 6中插入DNA片段的核苷酸序列。序列表中的SEQ ID NO.15显示得到的核苷酸序列
(9)用盒及试剂盒引物的PCR对源自速生热球菌蛋白酶基因的5′上游区的克隆
用LA PCR体外克隆试剂盒(由Iakara Shuzo公司生产)获得源自速生热球菌的蛋白酶基因5′上游区。
根据序列表中的SEQ ID NO.15代表的包含在质粒pTCS 6中插入DNA片段的核苷酸序列,合成用于试剂盒PCR的引物TCE6R。
然后,以HindIII(由Takara Shuzo公司生产)完全酶切速生热球菌的染色体DNA,并通过连接反应将该片段与HindIII盒(cassette)(由Takara Shuzo公司生产)连接。通过用此作为模板,制备含引物TCE6R及盒引物Cl(由Takara Shuzo公司生产)的PCR反应混合物,进行一系列反应:94℃1分钟的1个循环,94℃30秒-55℃1分钟-72℃3分钟的30个循环,以及72℃10分钟的一个循环。该反应混合物的一部分进行琼脂糖凝胶电泳并观察到扩增出的约1.8kb的片段。该扩增片段以HindIII和SacI酶切,并在琼脂糖凝胶电泳以后从凝胶中回收产生的约1.5kb的DNA片段。HindIII-SacI酶切的质粒载体pUC 119与上面约1.5kb的DNA片段混合以让其连接,接着导入大肠杆菌JM 109。检查得到转化子中带有的质粒,挑选出仅含一分子1.5kb插入片段的质粒并命名为质粒pTC 4。
图8显示质粒pTC 4的限制性图谱。
(10)包含在质粒pTC-4中及蛋白酶TCEs基因中源自速生热球菌DNA片段核苷酸序列的测定
为了测定插入到质粒pTC-4中源自速生热球菌蛋白酶基因的核苷酸序列,用Kilo序列缺失试制盒制备其中的插入到质粒中的DNA片段以各种长度删除的缺失突变体。其中,挑选出几种具有适当缺失长度的突变体并用双脱氧方法测定每个插入DNA片段的核苷酸序列,并且结合这些结果以决定包含在质粒pTCS 6中插入DNA片段的核苷酸序列。序列表中的SEQ ID NO.15显示得到的核苷酸序列。
通过结合该序列与实施例1-(8)中获得的包含在质粒pTCS 6中插入DNA片段的核苷酸序列,决定源自速生热球菌蛋白酶基因的全部核苷酸序列。序列表中的SEQ ID NO.1和2分别显示源自速生热球菌蛋白酶核苷酸序列中开放阅读框的核苷酸序列及由此推断的氨基酸序列。由该基因编码的源自速生热球菌的蛋白酶命名为蛋白酶TCES。
(11)含蛋白酶TCES基因的质粒pBTC6的制备
以HindIII和SspI(由Takara Shuzo公司生产)酶切质粒pTCS6,然后进行1%琼脂糖凝胶电泳以回收分离的约1.8kb的DNA片段。然后,质粒载体pBT 322(由Takara公司生产)以HindIII及EcoRV酶切,并将其与约1.8kb的DNA片段混和以让其连接,接着导入大肠杆菌JM109。从得到的转化子中提取质粒,挑选仅含一分子的约1.8kb片段的质粒并命名为pBTC 5。
然后,以HindIII和Kpnl完全酶切质粒pBTC5,补平末端并进行分子内连接,接着导入大肠杆菌JM 109。从得到的转化子中提取质粒,挑选出去除上面两个限制酶位点的质粒并命名为质粒pBTC5HK。
此外,以BamHI酶切质粒pBTC5HK,将末端补平,并进行分子内连接,接着导入大肠杆菌JM 109。从得到的转化子中提取质粒,挑选出去除BamHI位点的质粒并命名为质粒pBTC5HKB。
合成能在蛋白酶TCES基因起始密码子之前导入EcoRI位点和BamHI位点的引物TCE12,及与质粒pTCS6 SacI位点3′部分互补具有16bp-长核苷酸序列且能导入Clal位点及终止密码子的引物TCE20R。序列表中的SEQ ID NO.18及19分别显示引物TCE12及引物TCE20R的核苷酸序列。用这两个引物并用速生热球菌染色体DNA作为模板制备PCR反应混合物。进行25个循环反应,每个循环包括94℃30秒-55℃1分钟-72℃1分钟以扩增出在两端具有这两个寡核苷酸并含有部分蛋白酶TCES基因的约0.9kb的DNA片段。
以EcoRI及ClaI(由Takara Shuzo公司生产)酶切上面的约0.9kb的DNA片段,并与EcoRI-ClaI酶切的质粒pBTC5HKB混合以让其连接,接着导入大肠杆菌JM 109。从得到的转化子中提取质粒,并挑选出仅含一分子约0.9kb的片段的质粒并命名为质粒pBTC6。
(12)含有蛋白酶TCES基因的质粒pTC12的制备
以BamHI和SphI酶切质粒pBTC6,并进行1%琼脂糖凝胶电泳以回收分离的约3kb的DNA片段。然后,从BamHI和SphI酶切质粒pUC-P43SD,该质粒是在质粒载体pUC 18(由Takara Chuzo公司生产)的KpnI位点与BamHI位点之间导入源自枯草芽孢杆菌P43启动子核糖体结合位点序列而制备(用于序列导入的合成寡核苷酸BS1及BS2的核苷酸序列显示于序列表中的SEQ ID NO.20和21),将该酶切产物与前面回收的约3kb DNA片段混合以让其连接,接着导入大肠杆菌JM 109。从得到的转化子中提取质粒,挑选出仅含1分子上面约3kb的DNA片段的质粒并命名为质粒pTC12。
(13)用于转化枯草芽孢杆菌含有蛋白酶TCES基因的质粒的制备
以KpnI和SphI酶切上面的质粒pTC12,然后进行1%琼脂糖凝胶电泳以回收分离的约3kb的DNA片段。然后,以SacI酶切质粒载体pUB18-P43,补平末端并让其自我连接以得到SacI位点被去除的质粒载体pUB18-P43S。以KpnI和SphI消化该载体,并与前面回收的约3kb的DNA片段混合并让其连接,接着导入枯草芽孢杆菌DB104。从得到的卡那霉素抗性转化子中提取质粒,挑选出仅含1分子约3kb DNA片段的质粒并命名为质粒pSTC2
然后,以SacI酶切质粒pSTC2并进行分子内连接,接着导入枯草芽孢杆菌DB104。从得到的卡那霉素抗性转化子中提取质粒,挑选出仅含1个SacI位点的质粒并命名为质粒pSTC3
那么,具有质粒pSTC3的枯草芽孢杆菌DB104命名为枯草芽孢杆菌DB104/pSTC3。
图10显示质粒pSTC3的限制性图谱
实施例2
(1)激烈热球菌染色体DNA的制备
按下述培养激烈热球菌DMS3638。具有如下成分的培养基置于2升的培养瓶,其成分为1%的胰蛋白胨,0.5%酵母提取物,1%可溶性淀粉,3.5%Jamarin S.Solid(由Jamerin实验室制备),0.5%JamerinS.Liqmd(由Jamarin实验室制备),0.003%MgSO4,0.001%NaCl,0.0001% FeSO4·7H2O,0.0001% CoSO4,0.0001%CaCl2·7H2O,0.0001%ZnSO4,0.1ppm CuSO4·5H2O,0.1ppm H3BO3,0.1ppm KAl(SO4)2,0.1ppm Na2MoO4·2H2O,0.25ppmNiCl2·H2O,并于120℃灭菌20分钟,向培养基中充入氮气以排除溶解的氧气,并将上面的菌株接种入培养基,接着95℃静置培养16小时。培养完成以后,沉淀收集细胞。
然后,得到的细胞悬浮于含25%蔗糖的4ml 50mM Tris-HCl(pH 8.0),向该悬液中加入2ml 0.2M的EDTA和0.8ml的溶菌酶(5mg/ml)并于20℃孵育1小时,向其中加入24ml的SET溶液(150mMNaCl,1mM EDTA,20mM Tris-HCl,pH 8.0),4ml 5%SDS及400μl蛋白酶K(10mg/ml)并于37℃再孵育1小时。以酚-氯仿抽提以终止反应,接着以乙醇沉淀以获得约3.2mg的染色体DNA。
(2)激烈热球菌染色体DNA基因组southern杂交
激烈热球菌染色体DNA分别以SacI、NotI、XbaI、EcoRI及XhoI(所有均由Takara Shuzo公司生产)酶切。反应混合物的一部分进一步以SacI和EcoRI酶切,再进行1%琼脂糖凝胶电泳,接着用实施例1-(5)中所述的步骤进行southern杂交 用EcoRI和PstI酶切上面的质粒p1F-2R(2)而得到的约0.3kb的DNA片段作为模板并BcaBESTDNA标记试剂盒(由Takara Shuzo公司生产)及[α-32P]dCTP而制备的32P-标记的DNA用作探针,以含有终浓度为0.5%SDS的2×SSC在室温洗膜,以2×SSC冲洗并得到放射自显影。结果,观察到在以SacI酶切激烈热球菌染色体DNA而得到约5.4kb和约3.0kb的两个DNA片段中具有信号并且表明在各自片段中具有蛋白酶基因。当SacI酶切的片段进一步以SpeI(Takara Shuzo公司生产)酶切时,上面约5.4kb片段中的信号没表现出变化但在约3.0kb的片段中信号丢失,并在约0.6kb的片段中新观察到一个信号。由于SpeI位点在序列表中的SEQ IDNO.7所代表的蛋白酶PFUL基因中不存在,这标明由SacI及SpeI酶切而获得的约0.6kb片段中的信号是源自新的超耐热蛋白酶(此后称为“蛋白酶PFUS”)。此外,对于以XbaI酶切激烈热球菌染色体DNA的产物,在约3.3kb及约9.0kb两个DNA片段中观察到信号。从图1显示的蛋白酶PFUL基因的限制性图谱,认为约3.3kb的片段含有蛋白酶PFUL基因且约9.0kb的片段含有蛋白酶PFUS基因。当以XbaI及SacI酶切上面的染色体DNA时,在约2.0kb片段及约3.0kb片段中观察到信号。从序列表中SEQ ID NO.7所示存在于蛋白酶PFUL基因中SacI及XbaI位点的位置,认为蛋白酶PFUL基因存在于约2.0kb的SacI-XbaI片段。另一方面,认为蛋白酶PFUS基因存在于约3.0kb的片段。与SacI酶切结果相结合,发现仅以SacI酶切而获得的约3.0kb的DNA片段中没有XbaI位点存在。
(3)含有蛋白酶PFUS基因中0.6kb SpeI-SacI片段的克隆
以SacI和SpeI酶切激烈热球菌染色体DNA,然后进行1%琼脂糖凝胶电泳以从凝胶中回收相应于约0.6kb的DNA片段。然后,以SacI和SpeI酶切质粒pBluescript SK(-)(由Stratagene生产),并与上面约0.6kb DNA片段混合以让其连接,接着导入大肠杆菌JM 109以获得含染色体DNA片段的质粒文库。接种转化的大肠杆菌JM 109于平板以形成菌落,并将得到的菌落转到Hybond-N+膜,于新制的LB平板上37℃培养约2小时。以含1.5M NaCl的0.5N NaOH处理该膜,然后以含1.5M NaCl的0.5M Tris-HCl(pH 7.5)处理,以2×SSC处理,空气干燥并通过紫外交联仪的紫外线照射以将质粒DNA固定到膜上。该膜在杂交缓冲液中50℃处理2小时,并转移至含有用于实施例2-(2)中所述southern杂交的32P-标记DNA探针的相同缓冲液。杂交完成以后,以含0.5%SDS的2×SSC室温洗膜,并于37℃洗膜。此外,以2×SSC冲洗膜,空气干燥,与X-光片在-80℃曝光12小时以获得放射自显影。筛选出约500个克隆并且,结果,获得了3个含蛋白酶基因的克隆。根据放射自显影信号,检查这些克隆的位置并分离LB培养基中相应于用于转膜平板上的菌落
(4)通过PCR对蛋白酶PFUS基因的检测
根据蛋白酶PFUL基因中编码与源自已知微生物碱性丝氨酸蛋白酶氨基酸序列具有高度同源性两个区域的核苷酸序列设计用于通过PCR对超耐热蛋白酶基因检测探针的寡核苷酸。根据图2及图3所代表的蛋白酶PFUL的氨基酸序列,合成引物1FP1、1FP2、2RP1及2RP2。序列表中的SEQ ID NO.22、23、24及25显示寡核苷酸1FP1、1FP2、2RP1及2RP2的核苷酸序列。
制备含有从上面三个克隆得到的质粒以及寡核苷酸1FP1或2RP1、或1FP1和2RP2、或1FP2和2RP1、或1FP2及2RP2的PCR反应混合物,并进行30个循环的反应,每个循环由94℃30秒-37℃2分钟-72℃1分钟所组成。发现,当用部分这些反应混合物分别进行琼脂糖凝胶电泳时,当用引物1FP2和2RP2时在所有上面的3个质粒中均观察到约150bp DNA片段的扩增,表明蛋白酶基因在这些质粒中存在。
挑选出上面三个克隆中的一个并命名为质粒pSS3。
(5)包含在质粒pSS3中蛋白酶PFUS基因核苷酸序列的测定
用质粒pSS3作为模板及引物M4和引物RV(由Takara Shuzo公司生产)通过双脱氧方法测定质粒中插入DNA片段的核苷酸序列。序列表中的SEQ ID NO.26显示得到的核苷酸序列及推导的由该核苷酸编码的氨基酸序列。通过比较该氨基酸序列与蛋白酶PFUL、蛋白酶TCES及枯草蛋白酶的氨基酸序列,认为插入在质粒pSS3中的DNA片段编码与这些蛋白酶具有同源性的氨基酸。
(6)通过反向PCR方法对蛋白酶N-末端编码区及C-末端编码区的克隆
为了获得编码蛋白酶PFUS N-末端氨基酸序列及C-末端氨基酸序列的基因,进行反向PCR。用于反向PCR的引物根据质粒pSS3中插入DNA片段的核苷酸序列合成。序列表中的SEQ ID NO.27、28及29显示引物NPF-1、NPF-2及NPR-3的核苷酸序列。
以SacI及Xbal酶切激烈热球菌染色体DNA并进行分子内连接。制备含部分连接反应混合物及引物NPF-1与NPR-3,或NPF-2与NPR-3的PCR混合物并进行30轮循环的反应,每个循环由94℃30秒-67℃10分钟所组成。当该反应混合物的一部分进行琼脂糖凝胶电泳时,在用引物NPF-2与NPR-3的情况中观察到一个约3kb的扩增片段。从琼脂糖凝胶中回收扩增的片段,并与质粒载体pT7BlueT(由Novagen生产)以让其连接,接着导入到大肠杆菌JM 109。从得到的转化子中提取质粒,挑选出含有约3kb片段的质粒并命名为质粒ps322。
另一方面,在用引物NPF-1及NPR-3时,观察到一个约9kb的扩增片段。从琼脂糖凝胶中回收该扩增片段,用DNA补平试剂盒将DNA末端补平,接着以Xbal进一步酶切。将该片段与以XbaI及HincII酶切的质粒载体pBluescript SK(-)混合以让其连接,接着导入大肠杆菌JM109。从得到的转化子中提取质粒,挑选出含有一个约5kb DNA片段的质粒并命名为质粒pSKX5
(7)包含在质粒pS322和pSKX5中蛋白酶PFUS基因核苷酸序列的测定
用质粒pS322作为模板及引物NPR-3用双脱氧方法测定编码蛋白酶PFUS N-末端区域基因的核苷酸序列。序列表的SEQ IDNO.30显示部分得到的核苷酸序列及推断由该核苷酸序列编码的氨基酸序列。
此外,用质粒pSKX5作为模板及引物RV,通过双脱氧方法测定相当于蛋白酶PFUS基因3′部分区域的核苷酸序列。序列表中的SEQ IDNO.31显示部分得到的核苷酸序列。
(8)用于全长蛋白酶PFUS基因扩增的引物的合成
根据实施例2-(7)中获得的核苷酸序列,设计用于全长蛋白酶PFUS基因扩增的引物。根据显示于序列表中的SEQ ID NO.30且编码蛋白酶PFUS N-末端部分的核苷酸序列,合成能在蛋白酶PFUS基因起始密码子之前导入BamHI位点的引物NPF-4。序列表中的SEQID NO.32显示引物NPF-4的核苷酸序列。此外,根据序列表中的SEQ ID NO.31显示的蛋白酶PFUS 3′区域附近的核苷酸序列,合成与该核苷酸序列互补且具有一个SphI位点的引物NPR-4。序列表中的SEQ ID NO. 33显示引物NPR-4的核苷酸序列。
(9)含有源自激烈热球菌蛋白酶和蛋白酶TCES杂合基因,用于纯化枯草芽孢杆菌的质粒pSPT1的制备
通过用LA PCR试剂盒(由Takara Shuzo公司生产),制备含有引物NPF-4和NPR-4及激烈热球菌的染色体DNA的PCR反应混合物(从此以后用LA PCR试剂盒制备的PCR反应混合物称为“LA-PCR反应混合物”),并进行30轮循环的反应,每轮循环由94℃20秒-55℃1分钟-68℃7分钟所组成,以扩增出在其两端具有这两个引物且含有蛋白酶PFUS基因编码区的约6.0kb的DNA片段。
以BamHI和SacI酶切该约6kb的DNA片段,然后以1%琼脂糖凝胶电泳以回收分离的约0.8kb的DNA片段该片段与以BamHI和SacI酶切的质粒pSTC3酶切以让其连接,接着导入枯草芽孢杆菌DB104。从得到的卡那霉素抗性的转化子中提取质粒,且挑选出仅含一分子约0.8kb片段的质粒并命名为质粒pSPT1。
具有质粒pSPT1的枯草芽孢杆菌DB104命名为枯草芽孢杆菌DB104/pSPT1。
图14显示质粒pSPT1的限制性图谱。
(10)包含有蛋白酶PFUS基因用于转化枯草芽孢杆菌的质粒pSNP1的制备
以SpeI和SphI酶切实施例2-(9)中扩增的约6kb的DNA片段,然后进行1%琼脂糖凝胶电泳以回收分离的约5.7kb的DNA片段。将该片段与以SpeI和SphI酶切的质粒混合以让其连接,接着导入枯草芽孢杆菌DB104。从得到的卡那霉素抗性转化子中提取质粒,并且挑选出仅含1分子5.7kb片段的质粒并命名为质粒pSNP1。从质粒pSNP1转化的枯草芽孢杆菌命名为枯草芽孢杆菌DB104/pSNP1
图15显示质粒pSNPI的限制性图谱。
(11)包含在质粒pSNP1中蛋白酶PFUS基因核苷酸序列的测定
插入在质粒pSNP1中含有蛋白酶基因的约6kb的DNA片段以各种限制酶酶切成适当的大小,并将这些片段亚克隆进入质粒载体pUC 119或pBluescript SK(-)。用得到的重组质粒作为模板并用商业上可得到的通用引物通过双脱氧方法测定该核苷酸序列。考虑到有可能得不到具有适当大小片段的部分,运用了利用合成引物的引物步移方法(primerwalking method)。这样测定的存在于插入到质粒pSNP1中DNA片段核苷酸序列中开放阅读框的核苷酸序列,和由该核苷酸序列推断的源自激烈热球菌蛋白酶的氨基酸序列分别显示于序列34和35。
(12)用于蛋白酶PFUS基因扩增的引物的合成
为了设计用于全长蛋白酶PFUS基因扩增并与该基因3′部分杂交的引物,测定该基因3′部分的核苷酸序列。首先,通过以BamHI酶切质粒pSNP1而获得的含有蛋白酶PFUS基因3′区域约0.6kb的DNA片段与以BamHI酶切并以碱性磷酸酶脱磷酸化的质粒载体pUC 119连接。得到的重组质粒命名为质粒pSNPD并且相应于蛋白酶PFUS基因3′部分区域的核苷酸序列以该质粒作为模板通过双脱氧方法加以测定。序列表中的SEQ ID NO.38显示存在于该区域从BamHI位点至80bp上游核苷酸的核苷酸序列(互补链的序列)。然后,根据该序列,合成与蛋白酶PFUS基因3′部分杂交且含有SphI位点的引物NPM-1。序列表中的SEQ ID NO.39显示引物NPM-1的核苷酸序列。
此外,合成存在于蛋白酶PFUS基因中起始密码子下游约1.7kb处且用于去除BamHI位点的引物mutRR和mutFR。序列表中的SEQ IDNO.40和41分别显示引物mutRR和mutFR的核苷酸序列。
(13)含有全长蛋白酶PFUS基因的质粒pPS1的制备
制备含有激烈热球菌染色体DNA作为模板和引物NPF-4与mutRR组合或引物mutFR与NPM-1组合的两套LA-PCR反应混合物,并进行30轮循环反应,每轮循环由94℃30秒-55℃1分钟-68℃3分钟所组成。当用部分该反应混合物进行琼脂糖凝胶电泳时,当用引物NPF-4与mutRR时扩增出一个约1.8kb的DNA片段,并且用引物mutFR和NMP-1时扩增出一个约0.6kb的DNA片段。
从这两套PCR混合物中制备通过用SUPREC-02(由TakaraShuzo公司生产)而去除引物的每个扩增DNA片段。制备含有这两个扩增DNA片段而不含引物和LA Taq的LA-PCR反应混合物,对其94℃热变性10分钟,接着经30分钟冷却至30℃并在30℃维持15分钟以形成异质双螺旋。然后,向该反应混合物中,加入LA Taq并于72℃孵育3分钟,向其中加入引物NPF-4和NPM-1并进行25轮循环反应,每循环由94℃30秒-55℃1分钟-68℃3分钟所组成。在该反应混合物中观察到扩增出一个约2.4kb的DNA片段。
以BamHI和SphI酶切该约2.4kb的DNA片段,将该片段与实施例2-(11)中所述的其中的全长蛋白酶PFUS基因预先通过BamHI和SphI酶切而去除的质粒pSNP1混合以让其连接,接着导入枯草芽孢杆菌DB104。从得到卡那霉素抗性转化子中提取质粒,并挑选出仅含1分子约2.4kb插入片段的质粒并命名为质粒pPS1。以质粒DB104转化的枯草芽孢杆菌DB104命名为枯草芽孢杆菌DB104/pPS1。
图16显示质粒pPS1的限制性图谱。
(14)枯草蛋白酶基因启动子至信号序列区域DNA片段的扩增
合成用于获得枯草蛋白酶基因启动子至信号序列的引物。首先,参照《细菌学杂志》,171卷,2657-2665(1989)页中描述的枯草蛋白酶基因启动子区域的核苷酸序列,合成与该区域上游部分杂交且含有EcoRI位点的引物SUB4(序列表中的SEQ ID NO.36显示引物SUB4的核苷酸序列)。然后,参照《细菌学杂志》,158卷,411-418页(1984)描述的编码枯草蛋白酶区域的核苷酸序列,合成紧接在信号序列后面可导入BamHI位点的引物BmR1(序列表中的SEQ ID NO.37显示引物BmR1的核苷酸序列)
含有《细菌学杂志》,17卷,2657-2665页(1989)描述的枯草蛋白酶基因的质粒PKWZ用作模板以制备含有引物SUB4和BmR1的PCR反应混合物,并进行30轮循环反应,每轮循环由94℃30秒-55℃1分钟-68℃2分钟所组成。该反应混合物的一部分做琼脂糖凝胶电泳证实扩增出一个约0.3kb的DNA片段
(15)含有蛋白酶PFUS基因用于转化枯草芽孢杆菌的质粒pNAPS1的制备
以EcoRI和BamHI酶切该约0.3kb的DNA片段,并与实施例2-(13)中描述的预先以EcoRI和BamHI酶切的质粒混合以让其连接,接着导入枯草芽孢杆菌DB 104。以得到的卡那霉素抗性转化子提取质粒并挑选出仅含1分子约0.3kb片段的质粒并命名为质粒pNAPS1。此外,以质粒pNAPS1转化的枯草芽孢杆菌DB104命名为枯草芽孢杆菌DB104/pNAPS1。
图17显示质粒pNAPS1的限制性图谱
实施例3
(1)用于检测超耐热蛋白酶基因探针的制备
以BalI和HincII酶切含有蛋白酶PFUL基因的质粒pTPR12(两种酶均由Takara Shuzo公司生产),然后以1%琼脂糖凝胶电泳以回收分离的约1kb的DNA片段。用该DNA片段作为模板且用BcaBESTDNA标记试剂盒和[α-32P]dCTP制备32P-标记的DNA探针。
(2)存在于超嗜热菌海葡萄嗜热菌和解蛋白栖热拟杆菌中超耐热蛋白酶基因的检测
按照实施例1-(3)中描述的步骤从每10ml获自德意志微生物保藏中心的海葡萄嗜热菌DSM3639和解蛋白栖热拟杆菌DSM5265培养中制备染色体DNA。分别以EcoRI,PstI,HindIII,XbaI和SacI酶切两种染色体DNA,然后进行1%琼脂糖凝胶电泳,接着按实施例1(5)中描述的步骤进行southern杂交,作为探针,使用了在实施例3-(1)中制备的32P-标记DNA探针,以含0.5%终浓度SDS的2×SSC在37℃洗膜,以2×SSC冲洗,并获得放射自显影。从该放射自显影中,在以PstI消化的海葡萄嗜热菌染色体DNA中观察到一个约4.8kbDNA片段处的信号,并且在以XbaI酶切的解蛋白栖热拟杆菌染色体DNA中观察到一个约3.5kb DNA片段处的信号,因此,表明与蛋白酶PFUL基因杂交的超耐热蛋白酶基因存在于海葡萄嗜热菌和解蛋白栖热拟杆菌染色体DNA中。
实施例4
(1)蛋白酶PFUS和TCES粗酶制剂的制备
其中导入有含有本发明超耐热蛋白酶基因的质粒pSTC3的枯草芽孢杆菌DB104(枯草芽孢杆菌DB104/pSTC3)于37℃培养于5ml含10μg/ml卡那霉素的LB培养基(胰蛋白胨10g/升,酵母提取物5g/升,NaCl 5g/升,pH7.2)中8小时。制备250ml类似的培养基于1升的锥形瓶flask中,接种5ml上面的培养物从而于37℃培养16小时。将硫酸铵加入到通过离心培养物至75%饱和度而获得的上清中,并通过离心回收得到的沉淀。回收的沉淀悬浮于4ml 20mM pH 7.5的Tris-HCl中,并与相同缓冲液中透析,且得到的透析产物用作粗酶制剂(酶制剂TC-3)
按照上述步骤,从导入有含有本发明超耐热蛋白酶基因的质粒pSNP1的枯草芽孢杆菌DB104(枯草芽孢杆菌DB104/pSNP1)或导入有含有本发明超耐热蛋白酶基因的质粒pSPT1的枯草芽孢杆菌DB104中制备粗酶制剂,并且该酶制剂分别命名为NP-1和PT-1。
通过用含明胶的SDS-聚丙烯酰胺凝胶酶活性检测方法或其它酶活性检测方法检测这些酶制剂的蛋白酶活性
(2)纯化的蛋白酶PFUS酶制剂的序备
两管含有10μg/ml卡那霉素的5ml LB培养基中接种其中导入有含有实施例2-(18)中获得的本发明超耐热蛋白酶基因质粒pNAPS1的枯草芽孢杆菌DB104(枯草芽孢杆菌DB104/pNAPS1),接着于37℃振荡培养7小时。制备每瓶含120ml类似培养基的6个锥形瓶(瓶体积为500ml),并且每瓶接种1ml上面培养物,接着在37℃振荡培养17小时。离心培养物以获得细胞和培养上清。
将细胞悬浮于15ml 50mM的pH 7.5的Tris-HCl,且向其中加入30mg的溶菌酶(由Sigma生产),然后于37℃酶切1.5小时。95℃15分钟热处理酶切溶液,然后离心收集上清,向12ml得到的上清中加入4ml饱和的硫酸铵溶液,并以0.45μm过滤器(Sterivex HV,Millipore生产)过滤,并将过滤产物装入POROS pH柱(4.6mm×150mm:由PerSeptive Biosystems生产),该柱以pH 7.5,含25%饱和度硫酸铵的25mM Tris-HCl平衡。以用于平衡的缓冲液洗柱,通过降低硫酸铵浓度从25%饱和度至0%饱和度并且同时增加乙腈浓度从0%至20%进行梯度洗脱以洗脱出PFUS蛋白酶,以获得纯化的酶制剂NAPS-1。
750ml的培养上清于pH 8.0的25mM Tris-HCl中透析并吸附于以相同缓冲液平衡的Econo-Pack Q柱(由BioRad生产)。然后,吸附的酶以0~1.5M的NaCl做线性梯度洗脱。得到的活性部分于95℃热处理1小时,并向其中加入1/3体积的饱和硫酸铵。在用0.45μm的滤器(Sterivex HV)过滤以后,过滤产物装入POROS pH柱(4.6mm×150mm),该柱以pH 7.5,含25%饱和度的硫酸铵的25mMTris-HCl平衡。吸附于柱上的PFUS蛋白酶按照酶制剂NAPS-1的步骤进行洗脱以获得纯化的酶制剂NAPS-1
向适量的纯化酶制剂NAPS-1或NAPS-1S中加入三氯乙酸至8.3%的终浓度以沉淀酶制剂中的蛋白,通过离心回收蛋白。回收的沉淀蛋白溶于蒸馏水中,向其中加入1/4量的样品缓冲液(50mMTris-HCl,pH 7.5,5%SDS,5% 2-巯基乙醇,0.005%溴酚蓝,50%甘油),于100℃处理5分钟并用0.1%SDS-10%聚丙烯酰胺凝胶进行电泳。电泳完以后,凝胶以2.5%考马斯亮蓝R-250,25%乙醇,和10%的冰醋酸染色30分钟,转入25%的甲醇和7%的冰醋酸中且过多的染色经脱色3~15小时。两种酶制剂NAPS-1和NAPS-1S显示为单一的带,且从迁移距离推导的分子量约为4.5kDa。
(3)成熟蛋白酶PUFS N-末端的测序
实施例4-(2)中制备的纯化酶制剂NAPS-1用0.1%SDS10%聚丙烯酰胺凝胶进行电泳,并且凝胶中的蛋白用半干式印迹仪(由Nihon Eido生产)印迹至PVDF膜(由Millipore生产)上。印迹按照《电泳》,11卷,573-580页(1990)中描述的方法进行。印迹以后,该膜以1%考马斯亮蓝R 250,50%甲醇溶液染色,并以60%的甲醇溶液脱色。切下被染膜的一部分,然后用G1000A蛋白测序仪(由Hewlette Packard生产)通过自动的Edman降解法测定N-末端的氨基酸序列。SEQ ID NO.42显示得到的N-末端氨基酸序列。 序列表SEQ ID NO:1序列长度:659序列类型:氨基酸链型:单链拓扑学:线性分子类型:肽序列描述:Met Lys Arg Leu Gly Ala Val Val Leu Ala Leu Val Leu Val Gly
5 10 15Leu Leu Ala Gly Thr Ala Leu Ala Ala Pro Val Lys Pro Val Val
20 25 30Arg Asn Asn Ala Val Gln Gln Lys Asn Tyr Gly Leu Leu Thr Pro
35 40 45Gly Leu Phe Lys Lys Val Gln Arg Met Asn Trp Asn Gln Glu Val
50 55 60Asp Thr Val Ile Met Phe Gly Ser Tyr Gly Asp Arg Asp Arg Ala
65 70 75Val Lys Val Leu Arg Leu Met Gly Ala Gln Val Lys Tyr Ser Tyr
80 85 90Lys Ile Ile Pro Ala Val Ala Val Lys Ile Lys Ala Arg Asp Leu
95 100 105Leu Leu Ile Ala Gly Met Ile Asp Thr Gly Tyr Phe Gly Asn Thr
110 115 120Arg Val Ser Gly Ile Lys Phe Ile Gln Glu Asp Tyr Lys Val Gln
125 130 135Val Asp Asp Ala Thr Ser Val Ser Gln Ile Gly Ala Asp Thr Val
140 145 150Trp Asn Ser Leu Gly Tyr Asp Gly Ser Gly Val Val Val Ala Ile
155 160 165Val Asp Thr Gly Ile Asp Ala Asn His Pro Asp Leu Lys Gly Lys
170 175 180Val Ile Gly Trp Tyr Asp Ala Val ASn Gly Arg Ser Thr Pro Tyr
185 190 195Asp Asp Gln Gly His Gly Thr His Val Ala Gly Ile Val Ala Gly
200 205 210Thr Gly Ser Val Asn Ser Gln Tyr Ile Gly Val Ala Pro Gly Ala
215 220 225Lys Leu Val Gly Val Lys Val Leu Gly Ala Asp Gly Ser Gly Ser
230 235 240Val Ser Thr Ile Ile Ala Gly Val Asp Trp Val Val Gln Asn Lys
245 250 255Asp Lys Tyr Gly Ile Arg Val Ile Asn Leu Ser Leu Gly Ser Ser
260 265 270Gln Ser Ser Asp Gly Thr Asp Ser Leu Ser Gln Ala Val Asn Asn
275 280 285Ala Trp Asp Ala Gly Ile Val Val Cys Val Ala Ala Gly Asn Ser
290 295 300Gly Pro Asn Thr Tyr Thr Val Gly Ser Pro Ala Ala Ala Ser Lys
305 310 315Val Ile Thr Val Gly Ala Val Asp Ser Asn Asp Asn Ile Ala Ser
320 325 330Phe Ser Ser Arg Gly Pro Thr Ala Asp Gly Arg Leu Lys Pro Glu
335 340 345Val Val Ala Pro Gly Val Asp Ile Ile Ala Pro Arg Ala Ser Gly
350 355 360Thr Ser Met Gly Thr Pro Ile Asn Asp Tyr Tyr Thr Lys Ala Ser
365 370 375Gly Thr Ser Met Ala Thr Pro His Val Ser Gly Val Gly Ala Leu
380 385 390Ile Leu Gln Ala His Pro Ser Trp Thr Pro Asp Lys Val Lys Thr
395 400 405Ala Leu Ile Glu Thr Ala Asp Ile Val Ala Pro Lys Glu Ile Ala
410 415 420Asp Ile Ala Tyr Gly Ala Gly Arg Val Asn Val Tyr Lys Ala Ile
425 430 435Lys Tyr Asp Asp Tyr Ala Lys Leu Thr Phe Thr Gly Ser Val Ala
440 445 450Asp Lys Gly Ser Ala Thr His Thr Phe Asp Val Ser Gly Ala Thr
455 460 465Phe Val Thr Ala Thr Leu Tyr Trp Asp Thr Gly Ser Ser Asp Ile
470 475 480Asp Leu Tyr Leu Tyr Asp Pro Asn Gly Asn Glu Val Asp Tyr Ser
485 490 495Tyr Thr Ala Tyr Tyr Gly Phe Glu Lys Val Gly Tyr Tyr Asn Pro
500 505 510Thr Ala Gly Thr Trp Thr Val Lys Val Val Ser Tyr Lys Gly Ala
515 520 525Ala Asn Tyr Gln Val Asp Val Val Ser Asp Gly Ser Leu Ser Gln
530 535 540Ser Gly Gly Gly Asn Pro Asn Pro Asn Pro Asn Pro Asn Pro Thr
545 550 555Pro Thr Thr Asp Thr Gln Thr Phe Thr Gly Ser Val Asn Asp Tyr
560 565 570Trp Asp Thr Ser Asp Thr Phe Thr Met Asn Val Asn Ser Gly Ala
575 580 585Thr Lys Ile Thr Gly Asp Leu Thr Phe Asp Thr Ser Tyr Asn Asp
590 595 600Leu Asp Leu Tyr Leu Tyr Asp Pro Asn Gly Asn Leu Val Asp Arg
605 610 615Ser Thr Ser Ser Asn Ser Tyr Glu His Val Glu Tyr Ala Asn Pro
620 625 630Ala Pro Gly Thr Trp Thr Phe Leu Val Tyr Ala Tyr Ser Thr Tyr
635 640 645Gly Trp Ala Asp Tyr Gln Leu Lys Ala Val Val Tyr Tyr Gly
650 655SEQ ID NO:2序列长度:1977序列类型:核酸链型:双链拓扑学:线性分子类型:基因组DNA最初来源:速生热球菌菌株:DSM2476序列描述:ATGAAGAGGT TAGGTGCTGT GGTGCTGGCA CTGGTGCTCG TGGGTCTTCT GGCCGGAACG 60GCCCTTGCGG CACCCGTAAA ACCGGTTGTC AGGAACAACG CGGTTCAGCA GAAGAACTAC 120GGACTGCTGA CCCCGGGACT GTTCAAGAAA GTCCAGAGGA TGAACTGGAA CCAGGAAGTG 180GACACCGTCA TAATGTTCGG GAGCTACGGA GACAGGGACA GGGCGGTTAA GGTACTGAGG 240CTCATGGGCG CCCAGGTCAA GTACTCCTAC AAGATAATCC CTGCTGTCGC GGTTAAAATA 300AAGGCCAGGG ACCTTCTGCT GATCGCGGGC ATGATAGACA CGGGTTACTT CGGTAACACA 360AGGGTCTCGG GCATAAAGTT CATACAGGAG GATTACAAGG TTCAGGTTGA CGACGCCACT 420TCCGTCTCCC AGATAGGGGC CGATACCGTC TGGAACTCCC TCGGCTACGA CGGAAGCGGT 480GTGGTGGTTG CCATCGTCGA TACGGGTATA GACGCGAACC ACCCCGATCT GAAGGGCAAG 540GTCATAGGCT GGTACGACGC CGTCAACGGC AGGTCGACCC CCTACGATGA CCAGGGACAC 600GGAACCCACG TTGCGGGTAT CGTTGCCGGA ACCGGCAGCG TTAACTCCCA GTACATAGGC 660GTCGCCCCCG GCGCGAAGCT CGTCGGCGTC AAGGTTCTCG GTGCCGACGG TTCGGGAAGC 720GTCTCCACCA TCATCGCGGG TGTTGACTGG GTCGTCCAGA ACAAGGACAA GTACGGGATA 780AGGGTCATCA ACCTCTCCCT CGGCTCCTCC CAGAGCTCCG ACGGAACCGA CTCCCTCAGT 840CAGGCCGTCA ACAACGCCTG GGACGCCGGT ATAGTAGTCT GCGTCGCCGC CGGCAACAGC 900GGGCCGAACA CCTACACCGT CGGCTCACCC GCCGCCGCGA GCAAGGTCAT AACCGTCGGT 960GCAGTTGACA GCAACGACAA CATCGCCAGC TTCTCCAGCA GGGGACCGAC CGCGGACGGA 1020AGGCTCAAGC CGGAAGTCGT CGCCCCCGGC GTTGACATCA TAGCCCCGCG CGCCAGCGGA 1080ACCAGCATGG GCACCCCGAT AAACGACTAC TACACCAAGG CCTCTGGAAC CAGCATGGCC 1140ACCCCGCACG TTTCGGGCGT TGGCGCGCTC ATCCTCCAGG CCCACCCGAG CTGGACCCCG 1200GACAAGGTGA AGACCGCCCT CATCGAGACC GCCGACATAG TCGCCCCCAA GGAGATAGCG 1260GACATCGCCT ACGGTGCGGG TAGGGTGAAC GTCTACAAGG CCATCAAGTA CGACGACTAC 1320GCCAAGCTCA CCTTCACCGG CTCCGTCGCC GACAAGGGAA GCGCCACCCA CACCTTCGAC 1380GTCAGCGGCG CCACCTTCGT GACCGCCACC CTCTACTGGG ACACGGGCTC GAGCGACATC 1440GACCTCTACC TCTACGACCC CAACGGGAAC GAGGTTGACT ACTCCTACAC CGCCTACTAC 1500GGCTTCGAGA AGGTCGGCTA CTACAACCCG ACCGCCGGAA CCTGGACGGT CAAGGTCGTC 1560AGCTACAAGG GCGCGGCGAA CTACCAGGTC GACGTCGTCA GCGACGGGAG CCTCAGCCAG 1620TCCGGCGGCG GCAACCCGAA TCCAAACCCC AACCCGAACC CAACCCCGAC CACCGACACC 1680CAGACCTTCA CCGGTTCCGT TAACGACTAC TGGGACACCA GCGACACCTT CACCATGAAC 1740GTCAACAGCG GTGCCACCAA GATAACCGGT GACCTGACCT TCGATACTTC CTACAACGAC 1800CTCGACCTCT ACCTCTACGA CCCCAACGGC AACCTCGTTG ACAGGTCCAC GTCGAGCAAC 1860AGCTACGAGC ACGTCGAGTA CGCCAACCCC GCCCCGGGAA CCTGGACGTT CCTCGTCTAC 1920GCCTACAGCA CCTACGGCTG GGCGGACTAC CAGCTCAAGG CCGTCGTCTA CTACGGG 1977SEQ ID NO:3序列长度:522序列类型:氨基酸链型:单链拓扑学:线性分子类型:肽特征:428位的Xaa为Gly或Val。序列描述:Ala Glu Leu Glu Gly Leu Asp Glu Ser Ala Ala Gln Val Met Ala
5 10 151Thr Tyr Val Trp Asn Leu Gly Tyr Asp Gly Ser Gly Ile Thr Ile
20 25 30Gly Ile Ile Asp Thr Gly Ile Asp Ala Ser His Pro Asp Leu Gln
35 40 45Gly Lys Val Ile Gly Trp Val Asp Phe Val Asn Gly Arg Ser Tyr
50 55 60Pro Tyr Asp Asp His Gly His Gly Thr His Val Ala Ser Ile Ala
65 70 75Ala Gly Thr Gly Ala Ala Ser Asn Gly Lys Tyr Lys Gly Met Ala
80 85 90Pro Gly Ala Lys Leu Ala Gly Ile Lys Val Leu Gly Ala Asp Gly
95 100 105Ser Gly Ser Ile Ser Thr Ile Ile Lys Gly Val Glu Trp Ala Val
110 115 120Asp Asn Lys Asp Lys Tyr Gly Ile Lys Val Ile Asn Leu Ser Leu
125 130 135Gly Ser Ser Gln Ser Ser Asp Gly Thr Asp Ala Leu Ser Gln Ala
140 145 150Val Asn Ala Ala Trp Asp Ala Gly Leu Val Val Val Val Ala Ala
155 160 165Gly Asn Ser Gly Pro Asn Lys Tyr Thr Ile Gly Ser Pro Ala Ala
170 175 180Ala Ser Lys Val Ile Thr Val Gly Ala Val Asp Lys Tyr Asp Val
185 190 195Ile Thr Ser Phe Ser Ser Arg Gly Pro Thr Ala Asp Gly Arg Leu
200 205 210Lys Pro Glu Val Val Ala Pro Gly Asn Trp Ile Ile Ala Ala Arg
215 220 225Ala Ser Gly Thr Ser Met Gly Gln Pro Ile Asn Asp Tyr Tyr Thr
230 235 240Ala Ala Pro Gly Thr Ser Met Ala Thr Pro His Val Ala Gly Ile
245 250 255Ala Ala Leu Leu Leu Gln Ala His Pro Ser Trp Thr Pro Asp Lys
260 265 270Val Lys Thr Ala Leu Ile Glu Thr Ala Asp Ile Val Lys Pro Asp
275 280 285Glu Ile Ala Asp Ile Ala Tyr Gly Ala Gly Arg Val Asn Ala Tyr
290 295 300Lys Ala Ile Asn Tyr Asp Asn Tyr Ala Lys Leu Val Phe Thr Gly
305 310 315Tyr Val Ala Asn Lys Gly Ser Gln Thr His Gln Phe Val Ile Ser
320 325 330Gly Ala Ser Phe Val Thr Ala Thr Leu Tyr Trp Asp Asn Ala Asn
335 340 345Ser Asp Leu Asp Leu Tyr Leu Tyr Asp Pro Asn Gly Asn Gln Val
350 355 360Asp Tyr Ser Tyr Thr Ala Tyr Tyr Gly Phe Glu Lys Val Gly Tyr
365 370 375Tyr Asn Pro Thr Asp Gly Thr Trp Thr Ile Lys Val Val Ser Tyr
380 385 390Ser Gly Ser Ala Asn Tyr Gln Val Asp Val Val Ser Asp Gly Ser
395 400 405Leu Ser Gln Pro Gly Ser Ser Pro Ser Pro Gln Pro Glu Pro Thr
410 415 420Val Asp Ala Lys Thr Phe Gln Xaa Ser Asp His Tyr Tyr Tyr Asp
425 430 435Arg Ser Asp Thr Phe Thr Met Thr Val Asn Ser Gly Ala Thr Lys
440 445 450Ile Thr Gly Asp Leu Val Phe Asp Thr Ser Tyr His Asp Leu Asp
455 460 465Leu Tyr Leu Tyr Asp Pro Asn Gln Lys Leu Val Asp Arg Ser Glu
470 475 480Ser Pro Asn Ser Tyr Glu His Val Glu Tyr Leu Thr Pro Ala Pro
485 490 495Gly Thr Trp Tyr Phe Leu Val Tyr Ala Tyr Tyr Thr Tyr Gly Trp
500 505 510Ala Tyr Tyr Glu Leu Thr Ala Lys Val Tyr Tyr Gly
515 520SEQ ID NO:4序列长度:1568序列类型:核酸链型:双链拓扑学:线性分子类型:基因组DNA最初来源:激烈热球菌菌株:DSM3638特征:1283位的N为G或T序列描述:GCAGAATTAG AAGGACTGGA TGAGTCTGCA GCTCAAGTTA TGGCAACTTA CGTTTGGAAC 60TTGGGATATG ATGGTTCTGG AATCACAATA GGAATAATTG ACACTGGAAT TGACGCTTCT 120CATCCAGATC TCCAAGGAAA AGTAATTGGG TGGGTAGATT TTGTCAATGG TAGGAGTTAT 180CCATACGATG ACCATGGACA TGGAACTCAT GTAGCTTCAA TAGCAGCTGG TACTGGAGCA 240GCAAGTAATG GCAAGTACAA GGGAATGGCT CCAGGAGCTA AGCTGGCGGG AATTAAGGTT 300CTAGGTGCCG ATGGTTCTGG AAGCATATCT ACTATAATTA AGGGAGTTGA GTGGGCCGTT 360GATAACAAAG ATAAGTACGG AATTAAGGTC ATTAATCTTT CTCTTGGTTC AAGCCAGAGC 420TCAGATGGTA CTGACGCTCT AAGTCAGGCT GTTAATGCAG CGTGGGATGC TGGATTAGTT 480GTTGTGGTTG CCGCTGGAAA CAGTGGACCT AACAAGTATA CAATCGGTTC TCCAGCAGCT 540GCAAGCAAAG TTATTACAGT TGGAGCCGTT GACAAGTATG ATGTTATAAC AAGCTTCTCA 600AGCAGAGGGC CAACTGCAGA CGGCAGGCTT AAGCCTGAGG TTGTTGCTCC AGGAAACTGG 660ATAATTGCTG CCAGAGCAAG TGGAACTAGC ATGGGTCAAC CAATTAATGA CTATTACACA 720GCAGCTCCTG GGACATCAAT GGCAACTCCT CACGTAGCTG GTATTGCAGC CCTCTTGCTC 780CAAGCACACC CGAGCTGGAC TCCAGACAAA GTAAAAACAG CCCTCATAGA AACTGCTGAT 840ATCGTAAAGC CAGATGAAAT AGCCGATATA GCCTACGGTG CAGGTAGGGT TAATGCATAC 900AAGGCTATAA ACTACGATAA CTATGCAAAG CTAGTGTTCA CTGGATATGT TGCCAACAAA 960GGCAGCCAAA CTCACCAGTT CGTTATTAGC GGAGCTTCGT TCGTAACTGC CACATTATAC 1020TGGGACAATG CCAATAGCGA CCTTGATCTT TACCTCTACG ATCCCAATGG AAACCAGGTT 1080GACTACTCTT ACACCGCCTA CTATGGATTC GAAAAGGTTG GTTATTACAA CCCAACTGAT 1140GGAACATGGA CAATTAAGGT TGTAAGCTAC AGCGGAAGTG CAAACTATCA AGTAGATGTG 1200GTAAGTGATG GTTCCCTTTC ACAGCCTGGA AGTTCACCAT CTCCACAACC AGAACCAACA 1260GTAGACGCAA AGACGTTCCA AGNATCCGAT CACTACTACT ATGACAGGAG CGACACCTTT 1320ACAATGACCG TTAACTCTGG GGCTACAAAG ATTACTGGAG ACCTAGTGTT TGACACAAGC 1380TACCATGATC TTGACCTTTA CCTCTACGAT CCTAACCAGA AGCTTGTAGA TAGATCGGAG 1440AGTCCCAACA GCTACGAACA CGTAGAATAC TTAACCCCCG CCCCAGGAAC CTGGTACTTC 1500CTAGTATATG CCTACTACAC TTACGGTTGG GCTTACTACG AGCTGACGGC TAAAGTTTAT 1560TATGGC 1566SEQ ID NO:5序列长度:659序列类型:氨基酸链型:单链拓扑学:线性分子类型:肽序列描述:Met Lys Gly Leu Lys Ala Leu Ile Leu Val Ile Leu Val Leu Gly
5 10 15Leu Val Val Gly Ser Val Ala Ala Ala Pro Glu Lys Lys Val Glu
20 25 30Gln Val Arg Asn Val Glu Lys Asn Tyr Gly Leu Leu Thr Pro Gly
35 40 45Leu Phe Arg Lys Ile Gln Lys Leu Asn Pro Asn Glu Glu Ile Ser
50 55 60Thr Val Ile Val Phe Glu Asn His Arg Glu Lys Glu Ile Ala Val
65 70 75Arg Val Leu Glu Leu Met Gly Ala Lys Val Arg Tyr Val Tyr His
80 85 90Ile Ile Pro Ala lle Ala Ala Asp Leu Lys Val Arg Asp Leu Leu
95 100 105Val Ile Ser Gly Leu Thr Gly Gly Lys Ala Lys Leu Ser Gly Val
110 115 120Arg Phe Ile Gln Glu Asp Tyr Lys Val Thr Val Ser Ala Glu Leu
125 130 135Glu Gly Leu Asp Glu Ser Ala Ala Gln Val Met Ala Thr Tyr Val
140 145 150Trp Asn Leu Gly Tyr Asp Gly Ser Gly Ile Thr Ile Gly Ile Ile
155 160 165Asp Thr Gly Ile Asp Ala Ser His Pro Asp Leu Gln Gly Lys Val
170 175 180Ile Gly Trp Val Asp Phe Val Asn Gly Arg Ser Tyr Pro Tyr Asp
185 190 195Asp His Gly His Gly Thr His Val Ala Ser Ile Ala Ala Gly Thr
200 205 210Gly Ala Ala Ser Asn Gly Lys Tyr Lys Gly Met Ala Pro Gly Ala
215 220 225Lys Leu Ala Gly Ile Lys Val Leu Gly Ala Asp Gly Ser Gly Ser
230 235 240Ile Ser Thr Ile Ile Lys Gly Val Glu Trp Ala Val Asp Asn Lys
245 250 255Asp Lys Tyr Gly Ile Lys Val Ile Asn Leu Ser Leu Gly Ser Ser
260 265 270Gln Ser Ser Asp Gly Thr Asp Ser Leu Ser Gln Ala Val Asn Asn
275 280 285Ala Trp Asp Ala Gly Ile Val Val Cys Val Ala Ala Gly Asn Ser
290 295 300Gly Pro Asn Thr Tyr Thr Val Gly Ser Pro Ala Ala Ala Ser Lys
305 310 315Val Ile Thr Val Gly Ala Val Asp Ser Asn Asp Asn Ile Ala Ser
320 325 330Phe Ser Ser Arg Gly Pro Thr Ala Asp Gly Arg Leu Lys Pro Glu
335 340 345Val Val Ala Pro Gly Val Asp Ile Ile Ala Pro Arg Ala Ser Gly
350 355 360Thr Ser Met Gly Thr Pro Ile Asn Asp Tyr Tyr Thr Lys Ala Ser
365 370 375Gly Thr Ser Met Ala Thr Pro His Val Ser Gly Val Gly Ala Leu
380 385 390Ile Leu Gln Ala His Pro Ser Trp Thr Pro Asp Lys Val Lys Thr
395 400 405Ala Leu Ile Glu Thr Ala Asp Ile Val Ala Pro Lys Glu Ile Ala
410 415 420Asp Ile Ala Tyr Gly Ala Gly Arg Val Asn Val Tyr Lys Ala Ile
425 430 435Lys Tyr Asp Asp Tyr Ala Lys Leu Thr Phe Thr Gly Ser Val Ala
440 445 450Asp Lys Gly Ser Ala Thr His Thr Phe Asp Val Ser Gly Ala Thr
455 460 465Phe Val Thr Ala Thr Leu Tyr Trp Asp Thr Gly Ser Ser Asp Ile
470 475 480Asp Leu Tyr Leu Tyr Asp Pro Asn Gly Asn Glu Val Asp Tyr Ser
485 490 495Tyr Thr Ala Tyr Tyr Gly Phe Glu Lys Val Gly Tyr Tyr Asn Pro
500 505 510Thr Ala Gly Thr Trp Thr Val Lys Val Val Ser Tyr Lys Gly Ala
515 520 525Ala Asn Tyr Gln Val Asp Val Val Ser Asp Gly Ser Leu Ser Gln
530 535 540Ser Gly Gly Gly Asn Pro Asn Pro Asn Pro Asn Pro Asn Pro Thr
545 550 555Pro Thr Thr Asp Thr Gln Thr Phe Thr Gly Ser Val Asn Asp Tyr
560 565 570Trp Asp Thr Ser Asp Thr Phe Thr Met Asn Val Asn Ser Gly Ala
575 580 685Thr Lys Ile Thr Gly Asp Leu Thr Phe Asp Thr Ser Tyr Ash Asp
590 595 600Leu Asp Leu Tyr Leu Tyr Asp Pro Asn Gly Asn Leu Val Asp Arg
605 610 615Ser Thr Ser Ser Asn Ser Tyr Glu His Val Glu Tyr Ala Asn Pro
620 625 630Ala Pro Gly Thr Trp Thr Phe Leu Val Tyr Ala Tyr Ser Thr Tyr
635 640 645Gly Trp Ala Asp Tyr Gln Leu Lys Ala Val Val Tyr Tyr Gly
650 655SEQ ID NO:6序列长度:1977序列类型:核酸链型:双链拓扑学:线性分子类型:基因组DNA序列描述:ATGAAGGGGC TGAAAGCTCT CATATTAGTG ATTTTAGTTC TAGGTTTGGT AGTAGGGAGC 60GTAGCGGCAG CTCCAGAGAA GAAAGTTGAA CAAGTAAGAA ATGTTGAGAA GAACTATGGT 120CTGCTAACGC CAGGACTGTT CAGAAAAATT CAAAAATTGA ATCCTAACGA GGAAATCAGC 180ACAGTAATTG TATTTGAAAA CCATAGGGAA AAAGAAATTG CAGTAAGAGT TCTTGAGTTA 240ATGGGTGCAA AAGTTAGGTA TGTGTACCAT ATTATACCCG CAATAGCTGC CGATCTTAAG 300GTTAGAGACT TACTAGTCAT CTCAGGTTTA ACAGGGGGTA AAGCTAAGCT TTCAGGTGTT 360AGGTTTATCC AGGAAGACTA CAAAGTTACA GTTTCAGCAG AATTAGAAGG ACTGGATGAG 420TCTGCAGCTC AAGTTATGGC AACTTACGTT TGGAACTTGG GATATGATGG TTCTGGAATC 480ACAATAGGAA TAATTGACAC TGGAATTGAC GCTTCTCATC CAGATCTCCA AGGAAAAGTA 540ATTGGGTGGG TAGATTTTGT CAATGGTAGG AGTTATCCAT ACGATGACCA TGGACATGGA 600ACTCATGTAG CTTCAATAGC AGCTGGTACT GGAGCAGCAA GTAATGGCAA GTACAAGGGA 660ATGGCTCCAG GAGCTAAGCT GGCGGGAATT AAGGTTCTAG GTGCCGATGG TTCTGGAAGC 720ATATCTACTA TAATTAAGGG AGTTGAGTGG GCCGTTGATA ACAAAGATAA GTACGGAATT 780AAGGTCATTA ATCTTTCTCT TGGTTCAAGC CAGAGCTCCG ACGGAACCGA CTCCCTCAGT 840CAGGCCGTCA ACAACGCCTG GGACGCCGGT ATAGTAGTCT GCGTCGCCGC CGGCAACAGC 900GGGCCGAACA CCTACACCGT CGGCTCACCC GCCGCCGCGA GCAAGGTCAT AACCGTCGGT 960GCAGTTGACA GCAACGACAA CATCGCCAGC TTCTCCAGCA GGGGACCGAC CGCGGACGGA 1020AGGCTCAAGC CGGAAGTCGT CGCCCCCGGC GTTGACATCA TAGCCCCGCG CGCCAGCGGA 1080ACCAGCATGG GCACCCCGAT AAACGACTAC TACACCAAGG CCTCTGGAAC CAGCATGGCC 1140ACCCCGCACG TTTCGGGCGT TGGCGCGCTC ATCCTCCAGG CCCACCCGAG CTGGACCCCG 1200GACAAGGTGA AGACCGCCCT CATCGAGACC GCCGACATAG TCGCCCCCAA GGAGATAGCG 1260GACATCGCCT ACGGTGCGGG TAGGGTGAAC GTCTACAAGG CCATCAAGTA CGACGACTAC 1320GCCAAGCTCA CCTTCACCGG CTCCGTCGCC GACAAGGGAA GCGCCACCCA CACCTTCGAC 1380GTCAGCGGCG CCACCTTCGT GACCGCCACC CTCTACTGGG ACACGGGCTC GAGCGACATC 1440GACCTCTACC TCTACGACCC CAACGGGAAC GAGGTTGACT ACTCCTACAC CGCCTACTAC 1500GGCTTCGAGA AGGTCGGCTA CTACAACCCG ACCGCCGGAA CCTGGACGGT CAAGGTCGTC 1560AGCTACAAGG GCGCGGCGAA CTACCAGGTC GACGTCGTCA GCGACGGGAG CCTCAGCCAG 1620TCCGGCGGCG GCAACCCGAA TCCAAACCCC AACCCGAACC CAACCCCGAC CACCGACACC 1680CAGACCTTCA CCGGTTCCGT TAACGACTAC TGGGACACCA GCGACACCTT CACCATGAAC 1740GTCAACAGCG GTGCCACCAA GATAACCGGT GACCTGACCT TCGATACTTC CTACAACGAC 1800CTCGACCTCT ACCTCTACGA CCCCAACGGC AACCTCGTTG ACAGGTCCAC GTCGAGCAAC 1860AGCTACGAGC ACGTCGAGTA CGCCAACCCC GCCCCGGGAA CCTGGACGTT CCTCGTCTAC 1920GCCTACAGCA CCTACGGCTG GGCGGACTAC CAGCTCAAGG CCGTCGTCTA CTACGGG 1980SEQ ID NO:7序列长度:4765序列类型:核酸链型:双链拓扑学:线性分子类型:基因组DNA最初来源:激烈热球菌菌株:DSM3638序列描述:TTTAAATTAT AAGATATAAT CACTCCGAGT GATGAGTAAG ATACATCATT ACAGTCCCAA 60AATGTTTATA ATTGGAACGC AGTGAATATA CAAAATGAAT ATAACCTCGG AGGTGACTGT 120AGAATGAATA AGAAGGGACT TACTGTGCTA TTTATAGCGA TAATGCTCCT TTCAGTAGTT 180CCAGTGCACT TTGTGTCCGC AGAAACACCA CCGGTTAGTT CAGAAAATTC AACAACTTCT 240ATACTCCCTA ACCAACAAGT TGTGACAAAA GAAGTTTCAC AAGCGGCGCT TAATGCTATA 300ATGAAAGGAC AACCCAACAT GGTTCTTATA ATCAAGACTA AGGAAGGCAA ACTTGAAGAG 360GCAAAAACCG AGCTTGAAAA GCTAGGTGCA GAGATTCTTG ACGAAAATAG AGTTCTTAAC 420ATGTTGCTAG TTAAGATTAA GCCTGAGAAA GTTAAAGAGC TCAACTATAT CTCATCTCTT 480GAAAAAGCCT GGCTTAACAG AGAAGTTAAG CTTTCCCCTC CAATTGTCGA AAAGGACGTC 540AAGACTAAGG AGCCCTCCCT AGAACCAAAA ATGTATAACA GCACCTGGGT AATTAATGCT 600CTCCAGTTCA TCCAGGAATT TGGATATGAT GGTAGTGGTG TTGTTGTTGC AGTACTTGAC 660ACGGGAGTTG ATCCGAACCA TCCTTTCTTG AGCATAACTC CAGATGGACG CAGGAAAATT 720ATAGAATGGA AGGATTTTAC AGACGAGGGA TTCGTGGATA CATCATTCAG CTTTAGCAAG 780GTTGTAAATG GGACTCTTAT AATTAACACA ACATTCCAAG TGGCCTCAGG TCTCACGCTG 840AATGAATCGA CAGGACTTAT GGAATACGTT GTTAAGACTG TTTACGTGAG CAATGTGACC 900ATTGGAAATA TCACTTCTGC TAATGGCATC TATCACTTCG GCCTGCTCCC AGAAAGATAC 960TTCGACTTAA ACTTCGATGG TGATCAAGAG GACTTCTATC CTGTCTTATT AGTTAACTCC 1020ACTGGCAATG GTTATGACAT TGCATATGTG GATACTGACC TTGACTACGA CTTCACCGAC 1080GAAGTTCCAC TTGGCCAGTA CAACGTTACT TATGATGTTG CTGTTTTTAG CTACTACTAC 1140GGTCCTCTCA ACTACGTGCT TGCAGAAATA GATCCTAACG GAGAATATGC AGTATTTGGG 1200TGGGATGGTC ACGGTCACGG AACTCACGTA GCTGGAACTG TTGCTGGTTA CGACAGCAAC 1260AATGATGCTT GGGATTGGCT CAGTATGTAC TCTGGTGAAT GGGAAGTGTT CTCAAGACTC 1320TATGGTTGGG ATTATACGAA CGTTACCACA GACACCGTGC AGGGTGTTGC TCCAGGTGCC 1380CAAATAATGG CAATAAGAGT TCTTAGGAGT GATGGACGGG GTAGCATGTG GGATATTATA 1440GAAGGTATGA CATACGCAGC AACCCATGGT GCAGACGTTA TAAGCATGAG TCTCGGTGGA 1500AATGCTCCAT ACTTAGATGG TACTGATCCA GAAAGCGTTG CTGTGGATGA GCTTACCGAA 1560AAGTACGGTG TTGTATTCGT AATAGCTGCA GGAAATGAAG GTCCTGGCAT TAACATCGTT 1620GGAAGTCCTG GTGTTGCAAC AAAGGCAATA ACTGTTGGAG CTGCTGCAGT GCCCATTAAC 1680GTTGGAGTTT ATGTTTCCCA AGCACTTGGA TATCCTGATT ACTATGGATT CTATTACTTC 1740CCCGCCTACA CAAACGTTAG AATAGCATTC TTCTCAAGCA GAGGGCCGAG AATAGATGGT 1800GAAATAAAAC CCAATGTAGT GGCTCCAGGT TACGGAATTT ACTCATCCCT GCCGATGTGG 1860ATTGGCGGAG CTGACTTCAT GTCTGGAACT TCGATGGCTA CTCCACATGT CAGCGGTGTC 1920GTTGCACTCC TCATAAGCGG GGCAAAGGCC GAGGGAATAT ACTACAATCC AGATATAATT 1980AAGAAGGTTC TTGAGAGCGG TGCAACCTGG CTTGAGGGAG ATCCATATAC TGGGCAGAAG 2040TACACTGAGC TTGACCAAGG TCATGGTCTT GTTAACGTTA CCAAGTCCTG GGAAATCCTT 2100AAGGCTATAA ACGGCACCAC TCTCCCAATT GTTGATCACT GGGCAGACAA GTCCTACAGC 2160GACTTTGCGG AGTACTTGGG TGTGGACGTT ATAAGAGGTC TCTACGCAAG GAACTCTATA 2220CCTGACATTG TCGAGTGGCA CATTAAGTAC GTAGGGGACA CGGAGTACAG AACTTTTGAG 2280ATCTATGCAA CTGAGCCATG GATTAAGCCT TTTGTCAGTG GAAGTGTAAT TCTAGAGAAC 2340AATACCGAGT TTGTCCTTAG GGTGAAATAT GATGTAGAGG GTCTTGAGCC AGGTCTCTAT 2400GTTGGAAGGA TAATCATTGA TGATCCAACA ACGCCAGTTA TTGAAGACGA GATCTTGAAC 2460ACAATTGTTA TTCCCGAGAA GTTCACTCCT GAGAACAATT ACACCCTCAC CTGGTATGAT 2520ATTAATGGTC CAGAAATGGT GACTCACCAC TTCTTCACTG TGCCTGAGGG AGTGGACGTT 2580CTCTACGCGA TGACCACATA CTGGGACTAC GGTCTGTACA GACCAGATGG AATGTTTGTG 2640TTCCCATACC AGCTAGATTA TCTTCCCGCT GCAGTCTCAA ATCCAATGCC TGGAAACTGG 2700GAGCTAGTAT GGACTGGATT TAACTTTGCA CCCCTCTATG AGTCGGGCTT CCTTGTAAGG 2760ATTTACGGAG TAGAGATAAC TCCAAGCGTT TGGTACATTA ACAGGACATA CCTTGACACT 2820AACACTGAAT TCTCAATTGA ATTCAATATT ACTAACATCT ATGCCCCAAT TAATGCAACT 2880CTAATCCCCA TTGGCCTTGG AACCTACAAT GCGAGCGTTG AAAGCGTTGG TGATGGAGAG 2940TTCTTCATAA AGGGCATTGA AGTTCCTGAA GGCACCGCAG AGTTGAAGAT TAGGATAGGC 3000AACCCAAGTG TTCCGAATTC AGATCTAGAC TTGTACCTTT ATGACAGTAA AGGCAATTTA 3060GTGGCCTTAG ATGGAAACCC AACAGCAGAA GAAGAGGTTG TAGTTGAGTA TCCTAAGCCT 3120GGAGTTTATT CAATAGTAGT ACATGGTTAC AGCGTCAGGG ACGAAAATGG TAATCCAACG 3180ACAACCACCT TTGACTTAGT TGTTCAAATG ACCCTTGATA ATGGAAACAT AAAGCTTGAC 3240AAAGACTCGA TTATTCTTGG AAGCAATGAA AGCGTAGTTG TAACTGCAAA CATAACAATT 3300GATAGAGATC ATCCTACAGG AGTATACTCT GGTATCATAG AGATTAGAGA TAATGAGGTC 3360TACCAGGATA CAAATACTTC AATTGCGAAA ATACCCATAA CTTTGGTAAT TGACAAGGCG 3420GACTTTGCCG TTGGTCTCAC ACCAGCAGAG GGAGTACTTG GAGAGGCTAG AAATTACACT 3480CTAATTGTAA AGCATGCCCT AACACTAGAG CCTGTGCCAA ATGCTACAGT GATTATAGGA 3540AACTACACCT ACCTCACAGA CGAAAACGGT ACAGTGACAT TCACGTATGC TCCAACTAAG 3600TTAGGCAGTG ATGAAATCAC AGTCATAGTT AAGAAAGAGA ACTTCAACAC ATTAGAGAAG 3660ACCTTCCAAA TCACAGTATC AGAGCCTGAA ATAACTGAAG AGGACATAAA TGAGCCCAAG 3720CTTGCAATGT CATCACCAGA AGCAAATGCT ACCATAGTAT CAGTTGAGAT GGAGAGTGAG 3780GGTGGCGTTA AAAAGACAGT GACAGTGGAA ATAACTATAA ACGGAACCGC TAATGAGACT 3840GCAACAATAG TGGTTCCTGT TCCTAAGAAG GCCGAAAACA TCGAGGTAAG TGGAGACCAC 3900GTAATTTCCT ATAGTATAGA GGAAGGAGAG TACGCCAAGT ACGTTATAAT TACAGTGAAG 3910TTTGCATCAC CTGTAACAGT AACTGTTACT TACACTATCT ATGCTGGCCC AAGAGTCTCA 4020ATCTTGACAC TTAACTTCCT TGGCTACTCA TGGTACAGAC TATATTCACA GAAGTTTGAC 4080GAATTGTACC AAAAGGCCCT TGAATTGGGA GTGGACAACG AGACATTAGC TTTAGCCCTC 4140AGCTACCATG AAAAAGCCAA AGAGTACTAC GAAAAGGCCC TTGAGCTTAG CGAGGGTAAC 4200ATAATCCAAT ACCTTGGAGA CATAAGACTA TTACCTCCAT TAAGACAGGC ATACATCAAT 4260GAAATGAAGG CAGTTAAGAT ACTGGAAAAG GCCATAGAAG AATTAGAGGG TGAAGAGTAA 4320TCTCCAATTT TTCCCACTTT TTCTTTTATA ACATTCCAAG CCTTTTCTTA GCTTCTTCGC 4380TCATTCTATC AGGAGTCCAT GGAGGATCAA AGGTAAGTTC AACCTCCACA TCTCTTACTC 4440CTGGGATTTC GAGTACTTTC TCCTCTACAG CTCTAAGAAG CCAGAGAGTT AAAGGACACC 4500CAGGAGTTGT CATTGTCATC TTTATATATA CCGTTTTGTC AGGATTAATC TTTAGCTCAT 4560AAATTAATCC AAGGTTTACA ACATCCATCC CAATTTCTGG GTCGATAACC TCCTTTAGCT 4620TTTCCAGAAT CATTTCTTCA GTAATTTCAA GGTTCTCATC TTTGGTTTCT CTCACAAACC 4680CAATTTCAAC CTGCCTGATA CCTTCTAACT CCCTAAGCTT GTTATATATC TCCAAAAGAG 4740TGGCATCATC AATTTTCTCT TTAAA 3′ 4765SEQ ID NO:8序列长度:1398序列类型:氨基酸链型:单链拓扑学:线性分子类型:肽序列描述:Met Asn Lys Lys Gly Leu Thr Val Leu Phe Ile Ala Ile Met Leu
5 10 15Leu Ser Val Val Pro Val His Phe Val Ser Ala Glu Thr Pro Pro
20 25 30Val Ser Ser Glu Asn Ser Thr Thr Ser Ile Leu Pro Asn Gln Gln
35 40 45Val Val Thr Lys Glu Val Ser Gln Ala Ala Leu Asn Ala Ile Met
50 55 60Lys Gly Gln Pro Asn Met Val Leu Ile Ile Lys Thr Lys Glu Gly
65 70 75Lys Leu Glu Glu Ala Lys Thr Glu Leu Glu Lys Leu Gly Ala Glu
80 85 90Ile Leu Asp Glu Asn Arg Val Leu Asn Met Leu Leu Val Lys Ile
95 100 105Lys Pro Glu Lys Val Lys Glu Leu Asn Tyr Ile Ser Ser Leu Glu
110 115 120Lys Ala Trp Leu Asn Arg Glu Val Lys Leu Ser Pro Pro Ile Val
125 130 135Glu Lys Asp Val Lys Thr Lys Glu Pro Ser Leu Glu Pro Lys Met
140 145 150Tyr Asn Ser Thr Trp Val Ile Asn Ala Leu Gln Phe Ile Gln Glu
155 160 165Phe Gly Tyr Asp Gly Ser Gly Val Val Val Ala Val Leu Asp Thr
170 175 180Gly Val Asp Pro Asn His Pro Phe Leu Ser Ile Thr Pro Asp Gly
185 190 195Arg Arg Lys Ile Ile Glu Trp Lys Asp Phe Thr Asp Glu Gly Phe
200 205 210Val Asp Thr Ser Phe Ser Phe Ser Lys Val Val Asn Gly Thr Leu
215 220 225Ile Ile Asn Thr Thr Phe Gln Val Ala Ser Gly Leu Thr Leu Asn
230 235 240Glu Ser Thr Gly Leu Met Glu Tyr Val Val Lys Thr Val Tyr Val
245 250 255Ser Asn Val Thr Ile Gly Asn Ile Thr Ser Ala Asn Gly Ile Tyr
260 265 270His Phe Gly Leu Leu Pro Glu Arg Tyr Phe Asp Leu Asn Phe Asp
275 280 285Gly Asp Gln Glu Asp Phe Tyr Pro Val Leu Leu Val Asn Ser Thr
290 295 300Gly Ash Gly Tyr Asp Ile Ala Tyr Val Asp Thr Asp Leu Asp Tyr
305 310 315Asp Phe Thr Asp Glu Val Pro Leu Gly Gln Tyr Asn Val Thr Tyr
320 325 330Asp Val Ala Val Phe Ser Tyr Tyr Tyr Gly Pro Leu Asn Tyr Val
335 340 345Leu Ala Glu Ile Asp Pro Asn Gly Glu Tyr Ala Val Phe Gly Trp
350 355 360Asp Gly His Gly His Gly Thr His Val Ala Gly Thr Val Ala Gly
365 370 375Tyr Asp Ser Asn Asn Asp Ala Trp Asp Trp Leu Ser Met Tyr Ser
380 385 390Gly Glu Trp Glu Val Phe Ser Arg Leu Tyr Gly Trp Asp Tyr Thr
395 400 405Asn Val Thr Thr Asp Thr Val Gln Gly Val Ala Pro Gly Ala Gln
410 415 420Ile Met Ala Ile Arg Val Leu Arg Ser Asp Gly Arg Gly Ser Met
425 430 435Trp Asp Ile Ile Glu Gly Met Thr Tyr Ala Ala Thr His Gly Ala
440 445 450Asp Val Ile Ser Met Ser Leu Gly Gly Asn Ala Pro Tyr Leu Asp
455 460 465Gly Thr Asp Pro Glu Ser Val Ala Val Asp Glu Leu Thr Glu Lys
470 475 480Tyr Gly Val Val Phe Val Ile Ala Ala Gly Asn Glu Gly Pro Gly
485 490 495Ile Asn Ile Val Gly Ser Pro Gly Val Ala Thr Lys Ala Ile Thr
500 505 510Val Gly Ala Ala Ala Val Pro Ile Asn Val Gly Val Tyr Val Ser
515 520 525Gln Ala Leu Gly Tyr Pro Asp Tyr Tyr Gly Phe Tyr Tyr Phe Pro
530 535 540Ala Tyr Thr Asn Val Arg Ile Ala Phe Phe Ser Ser Arg Gly Pro
545 550 555Arg Ile Asp Gly Glu Ile Lys Pro Asn Val Val Ala Pro Gly Tyr
560 565 570Gly Ile Tyr Ser Ser Leu Pro Met Trp Ile Gly Gly Ala Asp Phe
575 580 585Met Ser Gly Thr Ser Met Ala Thr Pro His Val Ser Gly Val Val
590 595 600Ala Leu Leu Ile Ser Gly Ala Lys Ala Glu Gly Ile Tyr Tyr Asn
605 610 615Pro Asp Ile Ile Lys Lys Val Leu Glu Ser Gly Ala Thr Trp Leu
620 625 630Glu Gly Asp Pro Tyr Thr Gly Gln Lys Tyr Thr Glu Leu Asp Gln
635 640 645Gly His Gly Leu Val Asn Val Thr Lys Ser Trp Glu Ile Leu Lys
650 655 660Ala Ile Asn Gly Thr Thr Leu Pro Ile Val Asp His Trp Ala Asp
665 670 675Lys Ser Tyr Ser Asp Phe Ala Glu Tyr Leu Gly Val Asp Val Ile
680 685 690Arg Gly Leu Tyr Ala Arg Asn Ser Ile Pro Asp Ile Val Glu Trp
695 700 705His Ile Lys Tyr Val Gly Asp Thr Glu Tyr Arg Thr Phe Glu Ile
710 715 720Tyr Ala Thr Glu Pro Trp Ile Lys Pro Phe Val Ser Gly Ser Val
725 730 735Ile Leu Glu Asn Asn Thr Glu Phe Val Leu Arg Val Lys Tyr Asp
740 745 750Val Glu Gly Leu Glu Pro Gly Leu Tyr Val Gly Arg Ile Ile Ile
755 760 765Asp Asp Pro Thr Thr Pro Val Ile Glu Asp Glu Ile Leu Asn Thr
770 775 780Ile Val Ile Pro Glu Lys Phe Thr Pro Glu Asn Asn Tyr Thr Leu
785 790 795Thr Trp Tyr Asp Ile Asn Gly Pro Glu Met Val Thr His His Phe
800 805 810Phe Thr Val Pro Glu Gly Val Asp Val Leu Tyr Ala Met Thr Thr
815 820 825Tyr Trp Asp Tyr Gly Leu Tyr Arg Pro Asp Gly Met Phe Val Phe
830 835 840Pro Tyr Gln Leu Asp Tyr Leu Pro Ala Ala Val Ser Asn Pro Met
845 850 855Pro Gly Asn Trp Glu Leu Val Trp Thr Gly Phe Asn Phe Ala Pro
860 865 870Leu Tyr Glu Ser Gly Phe Leu Val Arg Ile Tyr Gly Val Glu Ile
875 880 885Thr Pro Ser Val Trp Tyr Ile Asn Arg Thr Tyr Leu Asp Thr Asn
890 895 900Thr Glu Phe Ser Ile Glu Phe Asn Ile Thr Asn Ile Tyr Ala Pro
905 910 915Ile Asn Ala Thr Leu Ile Pro Ile Gly Leu Gly Thr Tyr Asn Ala
920 925 930Ser Val Glu Ser Val Gly Asp Gly Glu Phe Phe Ile Lys Gly Ile
935 940 945Glu Val Pro Glu Gly Thr Ala Glu Leu Lys Ile Arg Ile Gly Asn
950 955 960Pro Ser Val Pro Asn Ser Asp Leu Asp Leu Tyr Leu Tyr Asp Ser
965 970 975Lys Gly Asn Leu Val Ala Leu Asp Gly Asn Pro Thr Ala Glu Glu
980 985 990Glu Val Val Val Glu Tyr Pro Lys Pro Gly Val Tyr Ser Ile Val
995 1000 1005Val His Gly Tyr Ser Val Arg Asp Glu Asn Gly Asn Pro Thr Thr
1010 1015 1020Thr Thr Phe Asp Leu Val Val Gln Met Thr Leu Asp Asn Gly Asn
1025 1030 1035Ile Lys Leu Asp Lys Asp Ser Ile Ile Leu Gly Ser Asn Glu Ser
1040 1045 1050Val Val Val Thr Ala Asn Ile Thr Ile Asp Arg Asp His Pro Thr
1055 1060 1065Gly Val Tyr Ser Gly Ile Ile Glu Ile Arg Asp Asn Glu Val Tyr
1070 1075 1080Gln Asp Thr Asn Thr Ser Ile Ala Lys Ile Pro Ile Thr Leu Val
1085 1090 1095Ile Asp Lys Ala Asp Phe Ala Val Gly Leu Thr Pro Ala Glu Gly
1100 1105 1110Val Leu Gly Glu Ala Arg Asn Tyr Thr Leu Ile Val Lys His Ala
1115 1120 1125Leu Thr Leu Glu Pro Val Pro Asn Ala Thr Val Ile Ile Gly ASn
1130 1135 1140Tyr Thr Tyr Leu Thr Asp Glu Asn Gly Thr Val Thr Phe Thr Tyr
1145 1150 1155Ala Pro Thr Lys Leu Gly Ser Asp Glu Ile Thr Val Ile Val Lys
1160 1165 1170Lys Glu Asn Phe Asn Thr Leu Glu Lys Thr Phe Gln Ile Thr Val
1175 1180 1185Ser Glu Pro Glu Ile Thr Glu Glu Asp Ile Asn Glu Pro Lys Leu
1190 1195 1200Ala Met Ser Ser Pro Glu Ala Asn Ala Thr Ile Val Ser Val Glu
1205 1210 1215Met Glu Ser Glu Gly Gly Val Lys Lys Thr Val Thr Val Glu Ile
1220 1225 1230Thr Ile Asn Gly Thr Ala Asn Glu Thr Ala Thr Ile Val Val Pro
1235 1240 1245Val Pro Lys Lys Ala Glu Asn Ile Glu Val Ser Gly Asp His Val
1250 1255 1260Ile Ser Tyr Ser Ile Glu Glu Gly Glu Tyr Ala Lys Tyr Val Ile
1265 1270 1275Ile Thr Val Lys Phe Ala Ser Pro Val Thr Val Thr Val Thr Tyr
1280 1285 1290Thr Ile Tyr Ala Gly Pro Arg Val Ser Ile Leu Thr Leu Asn Phe
1295 1300 1305Leu Gly Tyr Ser Trp Tyr Arg Leu Tyr Ser Gln Lys Phe Asp Glu
1310 1315 1320Leu Tyr Gln Lys Ala Leu Glu Leu Gly Val Asp Asn Glu Thr Leu
1325 1330 1335Ala Leu Ala Leu Ser Tyr His Glu Lys Ala Lys Glu Tyr Tyr Glu
1340 1345 1350Lys Ala Leu Glu Leu Ser Glu Gly Asn Ile Ile Gln Tyr Leu Gly
1355 1360 1365Asp Ile Arg Leu Leu Pro Pro Leu Arg Gln Ala Tyr Ile Asn Glu
1370 1375 1380Met Lys Ala Val Lys Ile Leu Glu Lys Ala Ile Glu Glu Leu Glu
1385 1390 1395Gly Glu GluSEQ ID NO:9序列长度:35序列类型:核酸链型:单链拓扑学:线性分子类型:其它核酸(合成DNA)序列描述:GGWWSDRRTG TTRRHGTHGC DGTDMTYGAC ACBGG 35SEQ ID NO:10序列长度:32序列类型:核酸链型:单链拓扑学:线性分子类型:其它核酸(合成DNA)序列描述:KSTCACGGAA CTCACGTDGC BGGMACDGTT GC 32SEQ ID NO:11序列长度:33序列类型:核酸链型:单链拓扑学:线性分子类型:其它核酸(合成DNA)序列描述:ASCMGCAACH GTKCCVGCHA CGTGAGTTCC GTG 33SEQ ID NO:12序列长度:34序列类型:核酸链型:单链拓扑学:线性分子类型:其它核酸(合成DNA)序列描述:CHCCGSYVAC RTGBGGAGWD GCCATBGAVG TDCC 34SEQ ID NO:13序列长度:145序列类型:核酸链型:双链拓扑学:线性分子类型:其它核酸(PCR片段)序列描述:A GTT GCG GTA ATT GAC ACG GGT ATA GAC GCG AAC CAC CCC GAT CTG 46Val Ala Val Ile Asp Thr Gly Ile Asp Ala Asn His Pro Asp Leu
5 10 15AAG GGC AAG GTC ATA GGC TGG TAC GAC GCC GTC AAC GGC AGG TCG 91Lys Gly Lys Val Ile Gly Trp Tyr Asp Ala Val Asn Gly Arg Ser
20 25 30ACC CCC TAC GAT GAC CAG GGA CAC GGA ACT CAC GTN GCN GGA ACN 136Thr Pro Tyr Asp Asp Gln Gly His Gly Thr His Val Ala Gly Thr
35 40 45GTT GCT GGT 145Val Ala GlySEQ ID NO:14序列长度:564序列类型:核酸链型:双链拓扑学:线性分子类型:其它核酸(PCR片段)序列描述:TCT CAC GGA ACT CAC GTG GCG GGA ACA GTT GCC GGA ACA GGC AGC 45Ser His Gly Thr His Val Ala Gly Thr Val Ala Gly Thr Gly Ser
5 10 15GTT AAC TCC CAG TAC ATA GGC GTC GCC CCC GGC GCG AAG CTC GTC 90Val Asn Ser Gln Tyr Ile GIy Val Ala Pro Gly Ala Lys Leu Val
20 25 30GGT GTC AAG GTT CTC GGT GCC GAC GGT TCG GGA AGC GTC TCC ACC 135GIy Val Lys Val Leu Gly Ala Asp Gly Ser Gly Ser Val Ser Thr
35 40 45ATC ATC GCG GGT GTT GAC TGG GTC GTC CAG AAC AAG GAT AAG TAC 180Ile Ile Ala Gly Val Asp Trp Val Val Gln Asn Lys Asp Lys Tyr
50 55 60GGG ATA AGG GTC ATC AAC CTC TCC CTC GGC TCC TCC CAG AGC TCC 225Gly Ile Arg Val Ile Asn Leu Ser Leu Gly Ser Ser Gln Ser Ser
65 70 75GAC GGA GCC GAC TCC CTC AGT CAG GCC GTC AAC AAC GCC TGG GAC 270Asp Gly Ala Asp Ser Leu Ser Gln Ala Val Asn Asn Ala Trp Asp
80 85 90GCC GGT ATA GTA GTC TGC GTC GCC GCC GGC AAC AGC GGG CCG AAC 315Ala Gly Ile Val Val Cys Val Ala Ala Gly Asn Ser Gly Pro Asn
95 100 105ACC TAC ACC GTC GGC TCA CCC GCC GCC GCG AGC AAG GTC ATA ACC 360Thr Tyr Thr Val Gly Ser Pro Ala Ala Ala Ser Lys Val Ile Thr
110 115 120GTC GGT GCA GTT GAC AGC AAC GAC AAC ATC GCC AGC TTC TCC AGC 405Val Gly Ala Val Asp Ser Asn Asp Asn Ile Ala Ser Phe Ser Ser
125 130 135AGG GGA CCG ACC GCG GAC GGA AGG CTC AAG CCG GAA GTC GTC GCC 450Arg Gly Pro Thr Ala Asp Gly Arg Leu Lys Pro Glu Val Val Ala
140 145 150CCC GGC GTT GAC ATC ATA GCC CCG CGC GCC AGC GGA ACC AGC ATG 495Pro Gly Val Asp Ile Ile Ala Pro Arg Ala Ser Gly Thr Ser Met
155 160 165GGC ACC CCG ATA AAC GAC TAC TAC ACC AAG GCC TCT GGA ACC TCA 540Gly Thr Pro Ile Asn Asp Tyr Tyr Thr Lys Ala Ser Gly Thr Ser
170 175 180ATG GCC ACT CCC CAT GTT ACC GGT 564Met Ala Thr Pro His Val Thr Gly
185SEQ ID NO:15序列长度:1859序列类型:核酸链型:双链拓扑学:线性分子类型:基因组DNA最初来源:速生执球菌菌株:DSM2476序列描述:GAGCTCCGAC GGAACCGACT CCCTCAGTCA GGCCGTCAAC AACGCCTGGG ACGCCGGTAT 60AGTAGTCTGC GTCGCCGCCG GCAACAGCGG GCCGAACACC TACACCGTCG GCTCACCCGC 120CGCCGCGAGC AAGGTCATAA CCGTCGGTGC AGTTGACAGC AACGACAACA TCGCCAGCTT 180CTCCAGCAGG GGACCGACCG CGGACGGAAG GCTCAAGCCG GAAGTCGTCG CCCCCGGCGT 240TGACATCATA GCCCCGCGCG CCAGCGGAAC CAGCATGGGC ACCCCGATAA ACGACTACTA 300CACCAAGGCC TCTGGAACCA GCATGGCCAC CCCGCACGTT TCGGGCGTTG GCGCGCTCAT 360CCTCCAGGCC CACCCGAGCT GGACCCCGGA CAAGGTGAAG ACCGCCCTCA TCGAGACCGC 420CGACATAGTC GCCCCCAAGG AGATAGCGGA CATCGCCTAC GGTGCGGGTA GGGTGAACGT 480CTACAAGGCC ATCAAGTACG ACGACTACGC CAAGCTCACC TTCACCGGCT CCGTCGCCGA 540CAAGGGAAGC GCCACCCACA CCTTCGACGT CAGCGGCGCC ACCTTCGTGA CCGCCACCCT 600CTACTGGGAC ACGGGCTCGA GCGACATCGA CCTCTACCTC TACGACCCCA ACGGGAACGA 660GGTTGACTAC TCCTACACCG CCTACTACGG CTTCGAGAAG GTCGGCTACT ACAACCCGAC 720CGCCGGAACC TGGACGGTCA AGGTCGTCAG CTACAAGGGC GCGGCGAACT ACCAGGTCGA 780CGTCGTCAGC GACGGGAGCC TCAGCCAGTC CGGCGGCGGC AACCCGAATC CAAACCCCAA 840CCCGAACCCA ACCCCGACCA CCGACACCCA GACCTTCACC GGTTCCGTTA ACGACTACTG 900GGACACCAGC GACACCTTCA CCATGAACGT CAACAGCGGT GCCACCAAGA TAACCGGTGA 960CCTGACCTTC GATACTTCCT ACAACGACCT CGACCTCTAC CTCTACGACC CCAACGGCAA 1020CCTCGTTGAC AGGTCCACGT CGAGCAACAG CTACGAGCAC GTCGAGTACG CCAACCCCGC 1080CCCGGGAACC TGGACGTTCC TCGTCTACGC CTACAGCACC TACGGCTGGG CGGACTACCA 1140GCTCAAGGCC GTCGTCTACT ACGGGTGAAG GTTTTTAATC CCCTTTTCTT TCCCCTTTTG 1200AGGTGGTTGG GATGAAGCGG GTTCTTGCGG CGATCCTTGT AATCATGCTC ATCGGATTAT 1260CATTCCCTGC CGGAAGTGCT AAAATCGAGC CCTACGTTTA CAGCCCCACC GTTCCGGATA 1320CCGCCTTCGC GGTTCTCACC CTGTACAGGA CCGGGGACTA CGCCCGGGTT CTCGAGGGAT 1380ACGAGTGGCT CCTCCAGATG AGAACTCCCA TCGATTCGTG GGGGGTTTCC CGCGGGGAAA 1440CGCACATGGC CAAGTACACG GCAATGGCGA TGCTGGCCCT CATGCGCGGC GAGAACGTGG 1500CGAGGGGGCG TTACAGGGAT GTTCTCAACG ACGCCGCGTA CTGGTTAATA TACAAACAGA 1560ACCCGGACGG CTCGTGGGAG GACTACACCG GAACGGCGCT GGCCGTCATC GCGCTCGGGG 1620AGTTCCTTAA GGGCGGGTAC ATCAACGCGA ACCTGACCGG CTTCAAAAAG CAGGTTAAAG 1680AGGCCGTAAA CCGCGGGGAA GGCTGGCTGA TGGATGCGGA CCCAAAAACG GACGCGGATA 1740GAATATTCGG CTACCTCGCC CTCGGTAAAA AGGACGAACT CAAAAAGATG AACCCTTCCG 1800GTGACCTGAA GGCCTACCGC GCCTTTGCAC TTGCCTACCT CGGGGAGAGG GTCGAGCTCü@ 1859SEQ ID NO:16序列长度:20序列类型:核酸链型:单链拓扑学:线性分子类型:其它核酸(合成DNA)序列描述:TGTAGTAGTC GTTTATCGGG 20SEQ ID NO:17序列长度:1464序列类型:核酸链型:双链拓扑学:线性分子类型:基因组DNA序列描述:AAGCTTAACA TCGAGCGCTC CACCTCTAAA GTAGGTGAGT GTGGATACGA AGGTTAGGGC 60CGCTATGACG ACCTTCAGGA TCCCAACGGC TTCTTTTATG GGGAGCCCGG CGAAGGTGAG 120AATTGAAAGG ATTACCATAC TCCCTCCGCT CATCATGGAG CCTATGAATC CCCCTCCAAA 180AGAGAGAAGT GCTATAAGGA GCGTCCTCAT GTTCCATGCT ATGTTTTGGT ATTTAATGCT 240TTTCCGCTTA ATGTTACACC TCCTCATGAC AATTTCGCGT TTAGGGATGG GGTTAATTGG 300ACCCCTCCGA GCCACGGGTT GATGTCCATT ATGTCGATAT TCACCATCTT ATCCCCAACT 360TTGTGGGTTT CAAACATTAC CCTACGTTAT ATTTTTATCG TCCTAATTAA CTGCTGAAAC 420GGGCGCTTAT CGTTCATCGT TGATGGTTTT GGGTGACCGG GCATTAAGGA ATTGTGTCGT 480TTGCTGAAAT TTATGAAACG GAGTTGGCTT CTTTATGTTA CATAAAGATG TACATTACTG 540TAATGTATAT AAATGGAAGA AACACTGTTG CGTAAACTTT TTAATGTATC CAATATCAGT 600ACTTCGATGT CCCGATATGG GACATGTTGG ATAGGAGGGT ACTGGAATGA AGAGGTTAGG 660TGCTGTGGTG CTGGCACTGG TGCTCGTGGG TCTTCTGGCC GGAACGGCCC TTGCGGCACC 720CGTAAAACCG GTTGTCAGGA ACAACGCGGT TCAGCAGAAG AACTACGGAC TGCTGACCCC 780GGGACTGTTC AAGAAAGTCC AGAGGATGAA CTGGAACCAG GAAGTGGACA CCGTCATAAT 840GTTCGGGAGC TACGGAGACA GGGACAGGGC GGTTAAGGTA CTGAGGCTCA TGGGCGCCCA 900GGTCAAGTAC TCCTACAAGA TAATCCCTGC TGTCGCGGTT AAAATAAAGG CCAGGGACCT 360TCTGCTGATC GCGGGCATGA TAGACACGGG TTACTTCGGT AACACAAGGG TCTCGGGCAT 1020AAAGTTCATA CAGGAGGATT ACAAGGTTCA GGTTGACGAC GCCACTTCCG TCTCCCAGAT 1080AGGGGCCGAT ACCGTCTGGA ACTCCCTCGG CTACGACGGA AGCGGTGTGG TGGTTGCCAT 1140CGTCGATACG GGTATAGACG CGAACCACCC CGATCTGAAG GGCAAGGTCA TAGGCTGGTA 1200CGACTCCGTC AACGGCAGGT CGACCCCCTA CGATGACCAG GGACACGGAA CCCACGTTGC 1260GGGTATCGTT GCCGGAACCG GGAGCGTTAA CTCCCAGTAC ATAGGCGTCG GCCCCGGCGC 1320GAAGCTCGTC GGCGTCAAGG TTCTCGGTTC CGACGGTTCG GGAAGCGTCT CCACCATCAT 1380CGCGGGTGTT GACTGGAACG TCCAGAACTA GGACAAGTAC GGGATAAGGG TCATCAACCT 1440CTCCCTCGGC TCCTCCCAGA GCTC 1464SEQ ID NO:18序列长度:33序列类型:核酸链型:单链拓扑学:线性分子类型:其它核酸(合成DNA)序列描述:AAAAGAATTC GGATCCATGA AGAGGTTAGG TGC 33SEQ ID NO:19序列长度:28序列类型:核酸链型:单链拓扑学:线性分子类型:其它核酸(合成DNA)序列描述:TTTTATCGAT CAGGCGTCCC AGGCGTTG 28SEQ ID NO:20序列长度:22序列类型:核酸链型:单链拓扑学:线性分子类型:其它核酸(合成DNA)序列描述:CATTATAGGT AAGAGAGGAA TG 22SEQ ID NO:21序列长度:30序列类型:核酸链型:单链拓扑学:线性分子类型:其它核酸(合成DNA)序列描述:GATCCATTCC TCTCTTACCT ATAATGGTAC 30SEQ ID NO:22序列长度:19序列类型:核酸链型:单链拓扑学:线性分子类型:其它核酸(合成DNA)序列描述:TAGCAGTAAT TGACACGGG 19SEQ ID NO:23序列长度:19序列类型:核酸链型:单链拓扑学:线性分子类型:其它核酸(合成DNA)序列描述:TAGCAGTAAT TGACACTGG 19SEQ ID NO:24序列长度:22序列类型:核酸链型:单链拓扑学:线性分子类型:其它核酸(合成DNA)序列描述:CTGTTCCAGC TACGTGAGTT CC 22SEQ ID NO:25序列长度:22序列类型:核酸链型:单链拓扑学:线性分子类型:其它核酸(合成DNA)序列描述:CTGTTCCAGC TACATGAGTT CC 22SEQ ID NO:26序列长度:507序列类型:核酸链型:双链拓扑学:线性分子类型:基因组DNA最初来源:激烈热球菌菌株:DSM3638序列描述:A CTA GTC ATC TCA GGT TTA ACA GGG GGT AAA GCT AAG CTT TCA GGT 46Leu Val Ile Ser Gly Leu Thr Gly Gly Lys Ala Lys Leu Ser G1y
5 10 15GTT AGG TTT ATC CAG GAA GAC TAC AAA GTT ACA GTT TCA GCA GAA 91Val Arg Phe Ile Gln Glu Asp Tyr Lys Val Thr Val Ser Ala Glu
20 25 30TTA GAA GGA CTG GAT GAG TCT GCA GCT CAA GTT ATG GCA ACT TAC 136Leu Glu Gly Leu Asp Glu Ser Ala Ala Gln Val Met Ala Thr Tyr
35 40 45GTT TGG AAC TTG GGA TAT GAT GGT TCT GGA ATC ACA ATA GGA ATA 181Val Trp Asn Leu GIy Tyr Asp GIy Ser Gly Ile Thr Ile Gly Ile 50
50 55 60ATT GAG ACT GGA ATT GAC GCT TCT CAT CCA GAT CTC CAA GGA AAA 226Ile Asp Thr Gly Ile Asp Ala Ser His Pro Asp Leu Gln Gly Lys 75
65 70 75GTA ATT GGG TGG GTA GAT TTT GTC AAT GGT AGG AGT TAT CCA TAC 271Val Ile Gly Trp Val Asp Phe Val Asn Gly Arg Ser Tyr Pro Tyr 90
80 85 90GAT GAC CAT GGA CAT GGA ACT CAT GTA GCT TCA ATA GCA GCT GGT 316Asp Asp His Gly His Gly Thr His Val Ala Ser Ile Ala Ala Gly 105
95 100 105ACT GGA GCA GCA AGT AAT GGC AAG TAC AAG GGA ATG GCT CCA GGA 361Thr Gly Ala Ala Ser Asn Gly Lys Tyr Lys Gly Met Ala Pro Gly 120
110 115 120GCT AAG CTG GCG GGA ATT AAG GTT CTA GGT GCC GAT GGT TCT GGA 406
83Ala Lys Leu Ala Gly Ile Lys Val Leu Gly Ala Asp Gly Ser Gly 135
125 130 135AGC ATA TCT ACT ATA ATT AAG GGA GTT GAG TGG GCC GTT GAT AAC 451Ser Ile Ser Thr Ile Ile Lys Gly Val Glu Trp Ala Val Asp Asn 150
140 145 150AAA GAT AAG TAC GGA ATT AAG GTC ATT AAT CTT TCT CTT GGT TCA 496Lys Asp Lys Tyr Gly Ile Lys Val Ile Asn Leu Ser Leu Gly Ser 165
155 160 165AGC CAG AGC TC 507Ser Gln Ser 168SEQ ID NO:27序列长度:30序列类型:核酸链型:单链拓扑学:线性分子类型:其它核酸(合成DNA)序列描述:TGACACTGGA ATTGACGCTT CTCATCCAGA 30SEQ ID NO:28序列长度:30序列类型:核酸链型:单链拓扑学:线性分子类型:其它核酸(合成DNA)序列描述:TCTCCAAGGA AAAGTAATTG GGTGGGTAGA 30SEQ ID NO:29序列长度:30序列类型:核酸链型:单链拓扑学:线性分子类型:其它核酸(合成DNA)序列描述:GTTGCCATAA CTTGAGCTGC AGACTCATCC 30SEQ ID NO:30序列长度:420序列类型:核酸链型:双链拓扑学:线性分子类型:其它核酸(PCR片段)序列描述:TTTATTAAGC ATAAAATAGC CATGCAACTT TGATCACTAA TGTGCGGTGG TGCAC ATG 59
MetAAG GGG CTG AAA GCT CTC ATA TTA GTG ATT TTA GTT CTA GGT TTG 104Lys Gly Leu Lys Ala Leu Ile Leu Val Ile Leu Val Leu Gly Leu
5 10 15GTA GTA GGG AGC GTA GCG GCA GCT CCA GAG AAG AAA GTT GTT CAA 149Val Val Gly Ser Val Ala Ala Ala Pro Glu Lys Lys Val Val Gln
20 25 30GTA AGA AAT GTT GAG AAG AAC TAT GGT CTG CTA ACG CCA GGA CTG 194Val Arg Asn Val Glu Lys Asn Tyr Gly Leu Leu Thr Pro GIy Leu
35 40 45TTC AGA AAA ATT CCC AAA TTG GAT CCT AAC GAG GGA ATC AGC ACA 239Phe Arg Lys Ile Pro Lys Leu Asp Pro Asn Glu Gly Ile Ser Thr
50 55 60GTA ATT GTA TTT GTT AAC CAT AGG GGA AAA GAA ATT GCA GTA AGA 284Val Ile Val Phe Val Asn His Arg Gly Lys Glu Ile Ala Val Arg
65 70 75GTT CTT GAG TTA ATG GGT GCC CAA GTT AGG TAT GTG TAC CAT ATT 329Val Leu Glu Leu Met Gly Ala Gln Val Arg Tyr Val Tyr His Ile
80 85 90ATA CCC CCA ATA GCT GCC GAT CTT AAG GTT AGA GAC TTA CTA GTC 374Ile Pro Pro Ile Ala Ala Asp Leu Lys Val Arg Asp Leu Leu Val
95 100 105ATC TCA GGT TTA ACA GGG GGT GAA ACT AAG CTT TCA GGT GTT AGG T 420Ile Ser Gly Leu Thr Gly Gly Glu Thr Lys Leu Ser Gly Val Arg
110 115 120SEQ ID NO:31序列长度:420序列类型:核酸链型:双链拓扑学:线性分子类型:其它核酸(PCR片段)序列描述:GCTCTAGACT CTGGGAGGAG TAGTTATACT TGATGAAGCC TATTCTGAGT TTTCGGGAAA 60AAGCTTCATA CCAAAAATCA GTGAGTATGA AAATTTAGTA ATTCTAAGGA CGTTTTCAAA 120GGCGTTTGGA CTTGCTGGAA TTAGATGTGG ATATATGATA GCAAATGAAA AGATTATAGA 180SEQ ID NO:32序列长度:28序列类型:核酸链型:单链拓扑学:线性分子类型:其它核酸(合成DNA)序列描述:AGAGGGATCC ATGAAGGGGC TGAAAGCT 28SEQ ID NO:33序列长度:28序列类型:核酸链型:单链拓扑学:线性分子类型:其它核酸(合成DNA)序列描述:AGAGGCATGC GCTCTAGACT CTGGGAGAGT 28SEQ ID NO:34序列长度:1962序列类型:核酸链型:双链拓扑学:线性分子类型:基因组DNA最初来源:激烈热球菌菌株:DSM3638序列描述:ATGAAGGGGC TGAAAGCTCT CATATTAGTG ATTTTAGTTC TAGGTTTGGT AGTAGGGAGC 60GTAGCGGCAG CTCCAGAGAA GAAAGTTGAA CAAGTAAGAA ATGTTGAGAA GAACTATGGT 120CTGCTAACGC CAGGACTGTT CAGAAAAATT CAAAAATTGA ATCCTAACGA GGAAATCAGC 180ACAGTAATTG TATTTGAAAA CCATAGGGAA AAAGAAATTG CAGTAAGAGT TCTTGAGTTA 240ATGGGTGCAA AAGTTAGGTA TGTGTACCAT ATTATACCCG CAATAGCTGC CGATCTTAAG 300GTTAGAGACT TACTAGTCAT CTCAGGTTTA ACAGGGGGTA AAGCTAAGCT TTCAGGTGTT 360AGGTTTATCC AGGAAGACTA CAAAGTTACA GTTTCAGCAG AATTAGAAGG ACTGGATGAG 420TCTGCAGCTC AAGTTATGGC AACTTACGTT TGGAACTTGG GATATGATGG TTCTGGAATC 480ACAATAGGAA TAATTGACAC TGGAATTGAC GCTTCTCATC CAGATCTCCA AGGAAAAGTA 540ATTGGGTGGG TAGATTTTGT CAATGGTAGG AGTTATCCAT ACGATGACCA TGGACATGGA 600ACTCATGTAG CTTCAATAGC AGCTGGTACT GGAGCAGCAA GTAATGGCAA GTACAAGGGA 660ATGGCTCCAG GAGCTAAGCT GGCGGGAATT AAGGTTCTAG GTGCCGATGG TTCTGGAAGC 720ATATCTACTA TAATTAAGGG AGTTGAGTGG GCCGTTGATA ACAAAGATAA GTACGGAATT 780AAGGTCATTA ATCTTTCTCT TGGTTCAAGC CAGAGCTCAG ATGGTACTGA CGCTCTAAGT 840CAGGCTGTTA ATGCAGCGTG GGATGCTGGA TTAGTTGTTG TGGTTGCCGC TGGAAACAGT 900GGACCTAACA AGTATACAAT CGGTTCTCCA GCAGCTGCAA GCAAAGTTAT TACAGTTGGA 960GCCGTTGACA AGTATGATGT TATAACAAGC TTCTCAAGCA GAGGGCCAAC TGCAGACGGC 1020AGGCTTAAGC CTGAGGTTGT TGCTCCAGGA AACTGGATAA TTGCTGCCAG AGCAAGTGGA 1080ACTAGCATGG GTCAACCAAT TAATGACTAT TACACAGCAG CTCCTGGGAC ATCAATGGCA 1140ACTCCTCACG TAGCTGGTAT TGCAGCCCTC TTGCTCCAAG CACACCCGAG CTGGACTCCA 1200GACAAAGTAA AAACAGCCCT CATAGAAACT GCTGATATCG TAAAGCCAGA TGAAATAGCC 1260GATATAGCCT ACGGTGCAGG TAGGGTTAAT GCATACAAGG CTATAAACTA CGATAACTAT 1320GCAAAGCTAG TGTTCACTGG ATATGTTGCC AACAAAGGCA GCCAAACTCA CCAGTTCGTT 1380ATTAGCGGAG CTTCGTTCGT AACTGCCACA TTATACTGGG ACAATGCCAA TAGCGACCTT 1440GATCTTTACC TCTACGATCC CAATGGAAAC CAGGTTGACT ACTCTTACAC CGCCTACTAT 1500GGATTCGAAA AGGTTGGTTA TTACAACCCA ACTGATGGAA CATGGACAAT TAAGGTTGTA 1560AGCTACAGCG GAAGTGCAAA CTATCAAGTA GATGTGGTAA GTGATGGTTC CCTTTCACAG 1620CCTGGAAGTT CACCATCTCC ACAACCAGAA CCAACAGTAG ACGCAAAGAC GTTCCAAGGA 1680TCCGATCACT ACTACTATGA CAGGAGCGAC ACCTTTACAA TGACCGTTAA CTCTGGGGCT 1740ACAAAGATTA CTGGAGACCT AGTGTTTGAC ACAAGCTACC ATGATCTTGA CCTTTACCTC 1800TACGATCCTA ACCAGAAGCT TGTAGATAGA TCGGAGAGTC CCAACAGCTA CGAACACGTA 1860GAATACTTAA CCCCCGCCCC AGGAACCTGG TACTTCCTAG TATATGCCTA CTACACTTAC 1920GGTTGGGCTT ACTACGAGCT GACGGCTAAA GTTTATTATG GC 1962SEQ ID NO:35序列长度:654序列类型:氨基酸链型:单链拓扑学:线性分子类型:肽序列描述:Met Lys Gly Leu Lys Ala Leu Ile Leu Val Ile Leu Val Leu Gly
5 10 15Leu Val Val Gly Ser Val Ala Ala Ala Pro Glu Lys Lys Val Glu
20 25 30Gln Val Arg Asn Val Glu Lys Asn Tyr Gly Leu Leu Thr Pro Gly
35 40 45Leu Phe Arg Lys Ile Gln Lys Leu Asn Pro Asn Glu Glu Ile Ser
50 55 60Thr Val Ile Val Phe Glu Asn His Arg Glu Lys Glu Ile Ala Val
65 70 75Arg Val Leu Glu Leu Met Gly Ala Lys Val Arg Tyr Val Tyr His
80 85 90Ile Ile Pro Ala Ile Ala Ala Asp Leu Lys Val Arg Asp Leu Leu
95 100 105Val Ile Ser Gly Leu Thr Gly Gly Lys Ala Lys Leu Ser Gly Val
110 115 120Arg Phe Ile Gln Glu Asp Tyr Lys Val Thr Val Ser Ala Glu Leu
125 130 135Glu Gly Leu Asp Glu Ser Ala Ala Gln Val Met Ala Thr Tyr Val
140 145 150Trp Asn Leu Gly Tyr Asp Gly Ser Gly Ile Thr Ile Gly Ile Ile
155 160 165Asp Thr Gly Ile Asp Ala Ser His Pro Asp Leu Gln Gly Lys Val
170 175 180Ile Gly Trp Val Asp Phe Val Asn Gly Arg Ser Tyr Pro Tyr Asp
185 190 195Asp His Gly His Gly Thr His Val Ala Ser Ile Ala Ala Gly Thr
200 205 210Gly Ala Ala Ser Asn Gly Lys Tyr Lys Gly Met Ala Pro Gly Ala
215 220 225Lys Leu Ala Gly Ile Lys Val Leu Gly Ala Asp Gly Ser Gly Ser
230 235 240Ile Ser Thr Ile Ile Lys Gly Val Glu Trp Ala Val Asp Asn Lys
245 250 255Asp Lys Tyr Gly Ile Lys Val Ile Asn Leu Ser Leu Gly Ser Ser
260 265 270Gln Ser Ser Asp Gly Thr Asp Ala Leu Ser Gln Ala Val Asn Ala
275 280 285Ala Trp Asp Ala Gly Leu Val Val Val Val Ala Ala Gly Asn Ser
290 295 300Gly Pro Asn Lys Tyr Thr Ile Gly Ser Pro Ala Ala Ala Ser Lys
305 310 315Val Ile Thr Val Gly Ala Val Asp Lys Tyr Asp Val Ile Thr Ser
320 325 330Phe Ser Ser Arg Gly Pro Thr Ala Asp Gly Arg Leu Lys Pro Glu
335 340 345Val Val Ala Pro Gly Asn Trp Ile Ile Ala Ala Arg Ala Ser Gly
350 355 360Thr Ser Met Gly Gln Pro Ile Asn Asp Tyr Tyr Thr Ala Ala Pro
365 370 375Gly Thr Ser Met Ala Thr Pro His Val Ala Gly Ile Ala Ala LeuAsp His Gly His Gly Thr His Val Ala Ser Ile Ala Ala Gly Thr
200 205 210Gly Ala Ala Ser Asn Gly Lys Tyr Lys Gly Met Ala Pro Gly Ala
215 220 225Lys Leu Ala Gly Ile Lys Val Leu Gly Ala Asp Gly Ser Gly Ser
230 235 240Ile Ser Thr Ile Ile Lys Gly Val Glu Trp Ala Val Asp Asn Lys
245 250 255Asp Lys Tyr Gly Ile Lys Val Ile Asn Leu Ser Leu Gly Ser Ser
260 265 270Gln Ser Ser Asp Gly Thr Asp Ala Leu Ser Gln Ala Val Asn Ala
275 280 285Ala Trp Asp Ala Gly Leu Val Val Val Val Ala Ala Gly Asn Ser
290 295 300Gly Pro Asn Lys Tyr Thr Ile Gly Ser Pro Ala Ala Ala Ser Lys
305 310 315Val Ile Thr Val Gly Ala Val Asp Lys Tyr Asp Val Ile Thr Ser
320 325 330Phe Ser Ser Arg Gly Pro Thr Ala Asp Gly Arg Leu Lys Pro Glu
335 340 345Val Val Ala Pro Gly Asn Trp Ile Ile Ala Ala Arg Ala Ser Gly
350 355 360Thr Ser Met Gly Gln Pro Ile Asn Asp Tyr Tyr Thr Ala Ala Pro
365 370 375Gly Thr Ser Met Ala Thr Pro His Val Ala Gly Ile Ala Ala Leu
380 385 390Leu Leu Gln Ala His Pro Ser Trp Thr Pro Asp Lys Val Lys Thr
395 400 405Ala Leu Ile Glu Thr Ala Asp Ile Val Lys Pro Asp Glu Ile Ala
10 415 420Asp Ile Ala Tyr Gly Ala Gly Arg Val Asn Ala Tyr Lys Ala Ile
425 430 435Asn Tyr Asp Asn Tyr Ala Lys Leu Val Phe Thr Gly Tyr Val Ala
440 445 450Asn Lys Gly Ser Gln Thr His Gln Phe Val Ile Ser Gly Ala Ser
455 460 465Phe Val Thr Ala Thr Leu Tyr Trp Asp Asn Ala Asn Ser Asp Leu
470 475 480Asp Leu Tyr Leu Tyr Asp Pro Asn Gly Asn Gln Val Asp Tyr Ser
485 490 495Tyr Thr Ala Tyr Tyr Gly Phe Glu Lys Val Gly Tyr Tyr Asn Pro
500 505 510Thr Asp Gly Thr Trp Thr Ile Lys Val Val Ser Tyr Ser Gly Ser
515 520 525Ala Asn Tyr Gln Val Asp Val Val Ser Asp Gly Ser Leu Ser Gln
530 535 540Pro Gly Ser Ser Pro Ser Pro Gln Pro Glu Pro Thr Val Asp Ala
545 550 555Lys Thr Phe Gln Gly Ser Asp His Tyr Tyr Tyr Asp Arg Ser Asp
560 565 570Thr Phe Thr Met Thr Val Asn Ser Gly Ala Thr Lys Ile Thr Gly
575 580 585Asp Leu Val Phe Asp Thr Ser Tyr His Asp Leu Asp Leu Tyr Leu
590 595 600Tyr Asp Pro Asn Gln Lys Leu Val Asp Arg Ser Glu Ser Pro Asn
605 610 615Ser Tyr Glu His Val Glu Tyr Leu Thr Pro Ala Pro Gly Thr Trp
620 625 630Tyr Phe Leu Val Tyr Ala Tyr Tyr Thr Tyr Gly Trp Ala Tyr Tyr
635 640 645Glu Leu Thr Ala Lys Val Tyr Tyr Gly
650SEQ ID NO:36序列长度:25序列类型:核酸链型:单链拓扑学:线性分子类型:其它核酸(合成DNA)序列描述:TCTGAATTCG TTCTTTTCTG TATGGü@ 25SEQ ID NO:37序列长度:25序列类型:核酸链型:单链拓扑学:线性分子类型:其它核酸(合成DNA)序列描述:TGTACTGCTG GATCCGGCAGü@ 20SEQ ID NO:38序列长度:80序列类型:核酸链型:双链拓扑学:线性分子类型:基因组DNA最初来源:激烈热球菌菌株:DSM3638序列描述:GGATCCATCA GATTTTTGAG TGTAGATCAA CCAGTATGCT GCATTTGTAA TTGTGAGATA 60ATATCTCCCG CGGGTAAGGT 80SEQ ID NO:39序列长度:30序列类型:核酸链型:单链拓扑学:线性分子类型:其它核酸(合成DNA)序列描述:AGAGGCATGC GTATCCATCA GATTTTTGAG 30SEQ ID NO:40序列长度:20序列类型:核酸链型:单链拓扑学:线性分子类型:其它核酸(合成DNA)序列描述:AGTGAACGGA TACTTGGAAC 20SEQ ID NO:41序列长度:20序列类型:核酸链型:单链拓扑学:线性分子类型:其它核酸(合成DNA)序列描述:GTTCCAAGTA TCCGTTCACT 20SEQ ID NO:42序列长度:12序列类型:氨基酸链型:单链拓扑学:线性分子类型:肽序列描述:Ala Glu Leu Glu Gly Leu Asp Glu Ser Ala Ala Gln
5 10