CN1190494C - 表达超热稳定蛋白酶的系统 - Google Patents

表达超热稳定蛋白酶的系统 Download PDF

Info

Publication number
CN1190494C
CN1190494C CNB988059908A CN98805990A CN1190494C CN 1190494 C CN1190494 C CN 1190494C CN B988059908 A CNB988059908 A CN B988059908A CN 98805990 A CN98805990 A CN 98805990A CN 1190494 C CN1190494 C CN 1190494C
Authority
CN
China
Prior art keywords
val
ala
gly
ser
thr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB988059908A
Other languages
English (en)
Other versions
CN1260002A (zh
Inventor
高蔵晃
森下美绪
下条智子
浅田起代蔵
加藤郁之进
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Takara Bio Inc
Original Assignee
Takara Bio Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Takara Bio Inc filed Critical Takara Bio Inc
Publication of CN1260002A publication Critical patent/CN1260002A/zh
Application granted granted Critical
Publication of CN1190494C publication Critical patent/CN1190494C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/75Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Bacillus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • C12N9/52Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from bacteria or Archaea
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/02Fusion polypeptide containing a localisation/targetting motif containing a signal sequence

Abstract

一种具有由序列表SEQ ID NO:1表示的氨基酸序列或经缺失、替换、插入或添加一个至几个氨基酸残基从其产生的序列的超热稳定蛋白酶,一种编码该超热稳定蛋白酶的基因和一种制备该蛋白酶的方法,目的是通过遗传工程技术提供一种有利于工业应用的超热稳定的蛋白酶。

Description

表达超热稳定蛋白酶的系统
技术领域
本发明涉及一种在工业应用中作为酶使用的超热稳定蛋白酶,编码该酶的基因以及通过遗传工程技术产生该酶的方法。
技术背景
蛋白酶是一种切割蛋白中肽键的酶。许多上述酶已在动物、植物和微生物中发现。蛋白酶可作为实验室使用的试剂和作为药物以及在工业领域,如作为添加剂用于去垢剂,用于处理食品及用于利用逆反应进行化学合成。因此,可以说该蛋白酶是工业上极其重要的酶。由于用于工业领域的蛋白酶需要高度的物理和化学稳定性,在其它酶类中热稳定酶是优选使用的。因为芽孢杆菌属的细菌产生的蛋白酶表现为相对高的热稳定性,它们主要作为工业用途的蛋白酶。然而,在寻找更为优异的酶中,想方设法从高温下生长的微生物中获得该酶,例如,从芽孢杆菌属的嗜热细菌或超嗜热菌中获得。
例如,熟知的超嗜热菌激烈热球菌产生一种蛋白酶(应用环境微生物学,56:1992-1998(1990);FEMS微生物学通讯,71:17-20(1990);遗传微生物学杂志,137:1193-1199(1991))。
此外,据报道嗜热菌热球菌属菌株KOD1产生一种硫醇基蛋白酶(半胱氨酸蛋白酶)(应用环境微生物学,60:4559-4566(1994))。也已知超嗜热菌热球菌属、葡萄嗜热菌属、栖热拟芽孢杆菌属产生蛋白酶(应用微生物学生物技术,34:715-719(1991))。
如上面描述的来自嗜热菌的蛋白酶具有高度热稳定性。因此,可预计它们可用于代替目前正使用的热稳定蛋白酶或用于还未考虑使用蛋白酶的领域。
然而,大部分产生这些酶的微生物仅在高温下生长。例如,激烈热球菌需要在90-100℃培养。在上述高温下培养从能量消耗的角度看是不利的。此外,来自超嗜热菌的蛋白酶生产力比常规微生物蛋白酶的生产力低。所以,工业上从超嗜热菌产生蛋白酶的方法存在问题。
另外,用遗传工程技术通过分离目的酶的基因并将其导入到容易培养的宿主微生物中产生该酶的方法,是本领域目前的常规方法。然而,该酶的基因导入到宿主中并不总是如预期的那样有效地表达。据信主要原因是导入基因的GC含量或密码子使用与宿主的基因不同。
因此,需要对导入的每个基因和/或每个宿主优化表达方法,以便达到符合设计用途的酶的合适生产力。
本发明的目的
本发明的目的是提供工业使用有利的来自超嗜热菌的蛋白酶,从该超嗜热菌中分离编码该蛋白酶的基因和提供利用该基因通过遗传工程技术产生超热稳定性蛋白酶的方法,以便解决上面所述的问题。
本发明概述
由超嗜热菌产生的蛋白酶中,一些种类根据其氨基酸序列的同源性分类为枯草杆菌蛋白酶型碱性蛋白酶。当编码该蛋白酶的基因被导入到枯草芽孢杆菌中时(枯草芽孢杆菌一般通过遗传工程技术用于生产),该酶的生产力比由枯草芽孢杆菌内源产生的蛋白的生产力更低。
本发明者经深入的研究并发现,通过把编码来源于枯草杆菌蛋白酶信号肽的基因(信号序列)置于来源于超嗜热菌待表达的蛋白酶基因的上游,然后修饰切割位点周围的氨基酸序列,该目的基因将在枯草芽孢杆菌中高效表达。此外,还发现通过把来源于目的超嗜热菌的蛋白酶基因中酶活性非必需的部分缺失、可增加所述的酶的表达水平。至此,完成了本发明。
本发明概括如下。本发明的第一个发明是一种具有由序列表SEQ IDNO:1给出的氨基酸序列的热稳定蛋白酶和一种具有如下氨基酸序列及热稳定蛋白酶活性的蛋白酶,在该氨基酸序列中,一个或几个氨基酸残基被缺失、替换、插入或添加到序列表SEQ ID NO:1给出的氨基酸序列中形成。
本发明的第二个发明是一种编码第一个发明的热稳定蛋白酶的基因和一种能与该基因杂交的热稳定蛋白酶基因。
本发明的第三个发明是通过遗传工程技术将来源于超嗜热菌的基因用于生产热稳定蛋白酶,其特征是该基因编码如通式I表示的氨基酸序列:
SIG-Ala-Gly-Gly-Asn-PRO       [I]
其中,SIG代表来源于枯草杆菌蛋白酶信号肽的氨基酸序列,PRO代表待表达的蛋白的氨基酸序列。优选地是,SIG是由序列表SEQ IDNO:3给出的氨基酸序列。优选地是,PRO是来源于超嗜热菌的超热稳定蛋白酶的氨基酸序列,更优选地是,来源于激烈热球菌的蛋白酶的氨基酸序列。
本发明的第四个发明涉及一种通过遗传工程技术产生蛋白质的方法,其特征在于该方法包括培养已导入第三个发明的基因的芽孢杆菌属细菌,然后从培养物中收集目的蛋白。
本发明的第五个发明是用于通过遗传工程技术生产蛋白的一种质粒,其特征在于第三个发明的基因已插入到质粒中。
在氨基酸序列中一个至几个氨基酸残基诸如缺失、替换、插入或添加的突变,可在天然产生的蛋白及由本发明披露的蛋白中产生。上述突变可能由于编码该蛋白的基因的多态性或突变产生,或者由于蛋白的体内修饰或合成后纯化过程中产生。不过,已知上述突变蛋白表现的生理学和生物学活性与未突变的蛋白相等。这可用于如下蛋白中,在该蛋白中上述突变已人为地导入到其氨基酸序列中,在该情况下,可能产生大量的各种突变。例如,众所周知的在人白介素-2(IL-2)的氨基酸序列中的半胱氨酸残基被丝氨酸残基替换的多肽仍保持白介素-2的活性(科学,224:1431(1984))。因此,具有在本发明披露的氨基酸序列中一个或几个氨基酸残基缺失、替换、插入或添加而形成的氨基酸序列及其蛋白酶活性与本发明的蛋白酶相等的蛋白酶也在本发明的范围之内。
至于本文所用的“(与特定的基因)杂交的基因”是一种具有的碱基序列与特定基因的序列相似的基因。有可能具有的碱基序列与特定基因的序列相似的基因编码一种具有氨基酸序列的蛋白,其功能与由特定基因编码的蛋白相似。基因碱基序列的相似性可通过在严格条件下确定基因或其部分互相之间是否形成杂交体(杂交)而检查出来。通过使用该方法,能获得所编码的蛋白与特定基因编码的蛋白具有相似功能的基因。这就是说具有与本发明的基因的碱基序列相似的基因可通过使用本发明获得的基因或其部分作为探针,按照熟知的方法进行杂交而获得。杂交可按如下方法进行,例如,T.Maniatis等编著,分子克隆:实验室手册第二版,冷泉港实验室出版,1989,书中所描述的方法。更具体而言,杂交在下列条件下进行。简言之,固定有DNAs的杂交膜在含有0.5%SDS,0.1%牛血清白蛋白(BSA),0.1%聚乙烯吡咯烷酮,0.1%Ficoll 400,0.01%变性鲑精DNA的6×SSC(1×SSC表示为0.15MNaCl,0.015M柠檬酸钠,pH7.0)中,和探针在50℃温育12-20小时。温育后,洗涤杂交膜直到固定的DNAs信号与背景能区别为止,开始洗涤在含0.5%SDS的2×SSC中37℃下进行,然后降低SSC浓度至0.1×和提高温度至50℃。
另外,作为杂交的替代方法,可应用基因扩增方法(如,PCR方法),该法用本发明获得的基因的部分碱基序列作为引物。因此所获得的基因是否编码具有目的功能的蛋白,能通过利用合适的宿主和合适的表达系统表达该基因,然后检查所得到蛋白的活性的方法确定。
附图简述
图1是质粒pSTC 3的限制性酶图谱。
图2比较了蛋白酶PFUS、蛋白酶TCES和枯草杆菌蛋白酶的氨基酸序列。
图3比较了蛋白酶PFUS、蛋白酶TCES和枯草杆菌蛋白酶的氨基酸序列。
图4比较了蛋白酶PFUS、蛋白酶TCES和枯草杆菌蛋白酶的氨基酸序列。
图5比较了蛋白酶PFUS、蛋白酶TCES和枯草杆菌蛋白酶的氨基酸序列。
图6是质粒pSNP 1的限制性酶切图谱。
图7是质粒pPS 1的限制性酶切图谱。
图8是质粒pNAPS 1的限制性酶切图谱。
发明详述
根据本发明的超热稳定蛋白酶包括来自各种超嗜热菌的蛋白酶。例如,WO 95/34645描述的来自激烈热球菌和速生热球菌的蛋白酶。
来自激烈热球菌DSM 3638的蛋白酶基因是从该菌株的基因组DNA文库中,根据表达热稳定蛋白酶活性而分离得到。含有该基因的质粒被命名为质粒pTPR 12。用该质粒转化的大肠杆菌JM 109被命名并且表示为大肠杆菌JM 109/pTPR 12,于1994年5月24日(最初保藏日期)根据布达佩斯条约保藏在日本茨城县筑波市东1丁目1番3号,通商产业省工业技术院生命工学和人体技术研究所,登记号FERM BP-5103。
该蛋白酶下文命名为蛋白酶PFUL。蛋白酶PFUL是一种具有高度热稳定性并且甚至在95℃下也表现蛋白酶活性的蛋白酶。
已经测定了来源于激烈热球菌插入到质粒pTPR 12的DNA片段的碱基序列。在该DNA片段中以2个DraI位点为边界大约4.8kb的部分碱基序列插入到质粒pTPR 12中,在序列表SEQ ID NO:5中显示。此外,根据碱基序列推导的基因产物的氨基酸序列在序列表SEQ IDNO:6中显示。换言之,在序列表SEQ ID NO:6中显示的氨基酸序列是蛋白酶PFUL的氨基酸序列。如在序列中显示的那样,蛋白酶PFUL由1398个氨基酸残基组成,是一种超过150,000的高分子量蛋白酶。
将序列表SEQ ID NO:6中显示的蛋白酶PFUL的氨基酸序列与熟知的来源于微生物的蛋白酶的氨基酸序列进行比较显示,蛋白酶PFUL的第一个半部分的氨基酸序列与以枯草杆菌蛋白酶为代表的系列碱性丝氨酸蛋白酶有同源性(蛋白工程,4:719-737(1991)),所存在的大约4个氨基酸残基的极其高度同源性据信对蛋白酶的催化活性是重要的。
如上所述,发现来源于嗜温菌的蛋白酶中的共同区域在由超嗜热菌激烈热球菌产生的蛋白酶PFUL的氨基酸序列中是保守的。因此,可预期由不是激烈热球菌的超嗜热菌产生的同源蛋白酶也具有该区域。
例如进行PCR能筛选出编码超热稳定蛋白酶的基因,用来自各种超嗜热菌的染色体DNA作为模板,寡核苷酸PRO-1F、PRO-2F、PRO-2R和PRO-4R的组合作为引物。根据在蛋白酶PFUL基因中编码显示为与枯草杆菌蛋白酶高度同源的区域的碱基序列或蛋白酶PFUL的氨基酸序列之间相似的序列,合成这些寡核苷酸。寡核苷酸PRO-1F、PRO-2F、PRO-2R和PRO-4R的碱基序列分别在序列表SEQ ID NOS:7、8、9和10中显示。
由于根据本发明的蛋白酶来源于超嗜热菌,能用属于激烈热球菌属、热球菌属、葡萄嗜热菌属、热拟芽孢杆菌属等细菌。至于属于热球菌属的细菌,例如能用速生热球菌DSM 2476。该菌株可从DeutscheSammlung Von Mikroorganismen und Zellkulturen GmbH得到。当用来源于速生热球菌DSM 2476的染色体DNA作为模板和寡核苷酸PRO-1F和PRO-2R或寡核苷酸PRO-2F和Pro-4R的组合作为引物进行PCR时,能扩增出特异的DNA片段,表明存在蛋白酶基因。此外,通过该DNA片段被插入到合适的质粒载体中创造重组质粒,然后用双脱氧法测定该插入DNA片段的碱基序列,能推导出由该片段编码的氨基酸序列。结果证明上述的DNA片段编码的氨基酸序列与蛋白酶PFUL和来自各种微生物的碱性丝氨酸蛋白酶的氨基酸序列同源,以及PCR扩增的DNA片段是从蛋白酶基因作为模板扩增的。
下一步,用该PCR-扩增的DNA片段或如上所述的寡核苷酸作为探针,筛选来自超嗜热菌的基因文库,能得到编码超热稳定蛋白酶的基因(例如,由速生热球菌产生的编码超热稳定蛋白酶的基因)。
例如,用PCR-扩增的DNA片段作为探针,针对文库进行噬菌斑杂交,能获得含有目的基因的噬菌体克隆。通过把λGEM-11载体(Promega)和来自速生热球菌DSM 2476用限制性酶Sau 3AI部分消化的染色体DNA的DNA片段连接起来,然后用体外包装方法将它们包装到λ噬菌体颗粒中,产生上述的文库。
通过分析由此获得的一个噬菌体克隆中含有的DNA片段,发现蛋白酶基因存在于大约1.9kb的SacI片段中。此外,还发现通过测定其碱基序列该片段缺乏蛋白酶基因的5′区。用盒和盒引物(Takara Shuzo基因技术产物指导,1994-1995,pp.250-251)用PCR能获得5′区。因此,能获得包括超热稳定蛋白酶5′区的DNA片段,在质粒pTCS 6中缺乏5′区。此外,来源于速生热球菌的整个超热稳定蛋白酶基因的碱基序列能从2个DNA片段的碱基序列确定。
在测定过的碱基序列中找到的可读框的碱基序列在序列表的SEOID NO:11中显示,并且从该碱基序列推导的氨基酸序列在序列表的SEQ ID NO:12中显示。因而确定了来源于速生热球菌编码超热稳定蛋白酶基因的碱基序列和该蛋白酶的氨基酸序列。该蛋白酶被命名为蛋白酶TCES。
可构建表达载体,在该载体中通过把2个DNA片段结合在一起重组整个蛋白酶TCES基因。然而,当用大肠杆菌作为宿主时,目的表达质粒导入其中的转化体没有得到,可能由于在细胞中来自基因表达的产物的产生对大肠杆菌可能是有害的或致死的。在上述情况下,例如,可用枯草芽孢杆菌作为宿主,使蛋白酶分泌到细胞外,然后测定其活性。
至于枯草芽孢杆菌菌株,可用枯草芽孢杆菌DB 104,它是在“基因”83:215-233(1989)描述过的熟知的菌株。至于克隆载体,用质粒pUB 18-P43,它由Calgary大学Sui-Lam Wong博士馈赠。该质粒含有的卡那霉素抗性基因作为选择标志。
在质粒载体pUB 18-P43中P43启动子的下游插入蛋白酶TCES基因所形成的重组质粒被命名为质粒pSTC 3。用该质粒转化的枯草芽孢杆菌DB 104被命名并表示为枯草芽孢杆菌DB 104/pST 3,于1995年12月1日(最初的保藏日期)根据布达佩斯条约保藏在通产省工业技术院生命工学和人体技术研究所,日本,茨城县筑波市东1丁目1番3号,登记号为FERM BP-5635。
质粒pSTC 3的限制性酶图谱在图1显示。在图1中,粗线表示插入到质粒载体pUB 18-P43中的DNA片段。
热稳定蛋白酶活性可在枯草芽孢杆菌DB 104/pSTC 3的培养物上清液中和细胞抽提液中找到。
从转化体培养物中得到的蛋白酶粗酶制备物的主要特性如下:
(1)作用:
降解酪蛋白和明胶而产生短链多肽。
水解琥珀酰-L-亮氨酰-L-亮氨酰-L-缬氨酰-L-酪氨酸-4-甲基香豆素-7-酰胺(Suc-Leu-Leu-Val-Tyr-MCA)产生荧光物质(7-氨基-4-甲基香豆素)。
水解琥珀酰-L-丙氨酰-L-丙氨酰-L-脯氨酰-L-苯丙氨酸-对-硝基酰苯胺(Suc-Ala-Ala-Pro-Phe-p-NA)产生黄色物质(对硝基苯胺)。
(2)最适温度:
在37-95℃下表现为酶活性,最适温度为70-80℃。
(3)最适pH:
在pH5.5-9下表现为酶活性,最适pH为pH7-8。
(4)热稳定性:
在80℃处理3小时后仍保持90%或更高的酶活性。
当把蛋白酶PFUL、蛋白酶TCES和枯草杆菌蛋白酶(枯草杆菌蛋白酶BNP′;核酸研究,11:7911-7925(1983))排列在一起,使同源区互相配对如在图2-5显示的那样时,发现蛋白酶PFUL的同源区之间和C-末端存在的序列,在蛋白酶TCES或枯草杆菌蛋白酶中未找到。根据这些结果,在激烈热球菌中,除了蛋白酶PFUL外可能存在具有的分子量比蛋白酶PFUL更低并与蛋白酶TCES或枯草杆菌蛋白酶相似的蛋白酶。
因此,用来自同源区的DNA探针进行针对从激烈热球菌制备的染色体DNA的Southern杂交,并观察到除蛋白酶PFUL基因外的信号,这表明存在另一种蛋白酶基因。
这种新型的蛋白酶基因通过下列方法分离。
例如,通过合适的限制性酶消化来自激烈热球菌的染色体DNA,然后按上面所述的方法对消化过的DNA进行Southern杂交,可获得含有编码新蛋白酶基因的DNA片段。测定该DNA片段的碱基序列,以确认该碱基序列编码的氨基酸序列与上面提到的蛋白酶同源。如果该DNA片段不含有整个目的基因,剩余的部分可通过逆向PCR法或相似的方法进一步获得。
例如,当用限制性酶SacI和SpeI(Takara Shuzo)消化来自激烈热球菌的染色体DNA然后用于Southern杂交时,观察到大小大约为0.6kb的信号。该大小的DNA片段被重新得到,插入到质粒载体pBluescriptSK(-)(Stratagene)中的SpeI-SacI位点之间,然后用产生的重组质粒转化大肠杆菌JM 109。用相同的探针,按上述Southern杂交所用的方法进行集落杂交,从转化体中能获得目的片段插入其中的克隆。从获得的克隆含有的质粒是否拥有编码所述的蛋白酶的序列,能用测定插入到质粒中的DNA片段的碱基序列确定。因而确认了在该质粒中存在蛋白酶基因。该质粒被命名为质粒pSS 3。
发现从插入到质粒pSS 3中的DNA片段的碱基序列推导的氨基酸序列与枯草杆菌蛋白酶、蛋白酶PFUL、蛋白酶TCES等的序列具有同源性。与蛋白酶PFUL基因不同的该蛋白酶基因的产物,其部分最近按上述的方法从激烈热球菌中得到,被命名为蛋白酶PFUS。编码该蛋白酶的N-末端和C-末端区的区域能用逆向PCR法获得。
用于逆向PCR的引物可根据插入在质粒pSS 3中的DNA片段的碱基序列制备。用合适的限制性酶消化来自激烈热球菌的染色体DNA,然后将产生的DNA片段进行分子内连接反应。通过用反应混合物作模板和上述提到的引物进行PCR,能获得在质粒pSS 3中含有的该蛋白酶基因片段侧翼区相应的DNA片段。由这些区域编码的酶蛋白的氨基酸序列可通过分析所获得的DNA片段的碱基序列而推导出来。此外,用来自激烈热球菌的染色体DNA为模板可制备能扩增整个蛋白酶PFUS基因的引物。可设计引物NPF-4和NPR-4。引物NPF-4拥有的碱基序列紧邻于蛋白酶PFUS基因的启动密码子上游处,能把BamHI 5′位点引入到该序列上。引物NPR-4拥有的序列与蛋白酶PFUS基因3′部分互补,可把SphI 5′位点引入到该序列上。
引物NPK-4和NPR-4的碱基序列在序列表的SEQ ID NOS:13和14中显示。用来自激烈热球菌的染色体DNA为模板,这2个引物可用于扩增整个蛋白酶PFUS的基因。
与蛋白酶TCES一样,蛋白酶PFUS能在作为宿主的枯草芽孢杆菌中表达。表达蛋白酶PFUS的质粒可按用于蛋白酶TCES的表达质粒pSTC 3构建。具体来说,通过把质粒pSTC 3中的蛋白酶TCES基因用含有整个蛋白酶PFUS基因的DNA片段取代,可构建表达蛋白酶PFUS的质粒,所述的DNA片段用上述的引物由PCR扩增得到。因而所构建的表达质粒被命名为质粒pSNP 1。用该质粒转化的枯草芽孢杆菌DB 104被命名为枯草芽孢杆菌DB 104/pSNP 1,并于1995年12月1日(最初保藏的日期)根据布达佩斯条约,保藏在通产省工业技术院生命工学和人体技术研究所,日本,茨城县筑波市东1丁目1番3号,登记号为FERMBP-5634。质粒pSNP 1的限制性酶图谱在图6显示。
在编码蛋白酶PFUS基因中与可读框相应的碱基序列以及从该碱基序列推导的蛋白酶PFUS的氨基酸序列分别在序列表的SEQ ID NOS:15和16中显示。
热稳定蛋白酶活性在来自枯草芽孢杆菌DB 104/pSNP 1培养物的上清液中和细胞抽提液中发现。即,部分表达的蛋白酶PFUS被分泌到培养物上清液中。
从转化体培养物中获得的蛋白酶的主要特性如下:
(1)作用:
降解酪蛋白和胶原以产生短链多肽。
水解琥珀酰-L-亮氨酰-L-亮氨酰-L-缬氨酰-L-酪氨酸-4-甲基香豆素-7-酰胺(Suc-Leu-Leu-Val-Tyr-MCA)产生荧光物质(7-氨基-4-甲基香豆素)。
水解琥珀酰-L-丙氨酰-L-丙氨酰-L-脯氨酰-L-苯丙氨酸-对-硝基酰替苯胺(Suc-Ala-Ala-Pro-Phe-p-NA)产生黄色物质(对硝基苯胺)。
(2)最适温度:
在41-110℃下表现为酶活性,最适温度为80-95℃。
(3)最适pH:
在pH5-10下表现酶活性,最适pH为pH6-8。
(4)热稳定性:
在95℃处理8小时后仍有90%或更高的酶活性。
(5)pH稳定性:
在pH5-11,95℃下处理60分钟后仍保持95%或更高的酶活性。
(6)分子量:
在SDS-PAGE上出现的分子量大约为45kDa。
使用获得蛋白酶TCES基因和蛋白酶PFUS基因相似的方法,与蛋白酶TCES基因和蛋白酶PFUS基因同源的蛋白酶基因能从不是激烈热球菌和速生热球菌的超嗜热菌中得到。
可制备大约1kb的DNA片段,该片段编码在序列表SEQ ID NO:6中显示的蛋白酶PFUL的氨基酸序列从残基323位至残基650的序列,用该片段作探针,针对来自海葡萄嗜热菌和解蛋白热拟杆菌DSM 5265的染色体DNAs进行基因组Southern杂交。结果,用PstI(TakaraShuzo)消化的来自海葡萄嗜热菌染色体DNA大约4.8kb的位置和用XbaI消化的来自解蛋白热拟杆菌染色体DNA大约3.5kb的位置观察到信号。
根据这些结果,证明从海葡萄嗜热菌和解蛋白热拟杆菌来的染色体DNAs存在编码蛋白酶PFUL、蛋白酶PFUS和蛋白酶TCES等基因同源的序列。用分离和鉴别编码蛋白酶TCES和蛋白酶PFUS基因相似的方法,检测DNA片段,可分离和鉴定在海葡萄嗜热菌和解蛋白热拟杆菌中编码超热稳定蛋白酶的基因。
一般来说,为了通过遗传工程技术大量制备蛋白,认为应用在宿主中有效地起作用的启动子而不用编码目的蛋白的基因内部结合的启动子是有利的。尽管用于构建蛋白酶TCES和蛋白酶PFUS表达系统的P43启动子是来自枯草芽孢杆菌的启动子,它不能足够有效地表达这2种蛋白酶。
因此,为了增加表达水平,可利用在枯草芽孢杆菌中高水平表达的基因,尤其是编码分泌蛋白的基因。可用编码α-淀粉酶或各种细胞外蛋白酶的基因。例如,可预期应用枯草杆菌蛋白酶基因的启动子和编码信号肽区可增加蛋白酶PFUS的表达水平。
具体而言,通过把整个蛋白酶PFUS基因置于编码枯草杆菌蛋白酶基因信号肽及包括启动子区的区域下游,这样2个基因的翻译框能互相匹配,在枯草杆菌蛋白酶的启动子控制下蛋白酶PFUS能作为融合蛋白表达。
例如,编码枯草杆菌蛋白酶E的基因能用作枯草杆菌蛋白酶基因,用在本发明中。可使用把枯草杆菌蛋白酶E基因的启动子和编码信号肽的区域插入到质粒pKW 2中,该质粒在“细菌学杂志”171:2657-2665(1989)中描述。包括启动子序列的5′上游区的碱基序列在该参考文献(同上)中描述而编码枯草杆菌蛋白酶区的碱基序列在“细菌学杂志”158:411-418(1984)中描述。
根据这些序列,合成引入EcoRI位点位于该基因启动子序列上游的引物SUB 4和引入BamHI位点位于编码枯草杆菌蛋白酶E的信号肽区下游的引物BmR1。引物SUB4和BmR1的碱基序列分别在序列表SEQID NOS:17和18中显示。用质粒pKWZ作模板,经PCR用引物SUB4和BmR1扩增出大约0.3kb的DNA片段,该片段含有枯草杆菌蛋白酶E基因的启动子和编码信号肽区。
置于该DNA片段下游的蛋白酶PFUS基因,可通过PCR法从激烈热球菌的染色体DNA中获得。引物NPF-4能用作和该基因5′区杂交的引物。根据该基因终止密码子下游的碱基序列设计的引物NPM-1拥有SphI位点,能用作和该基因3′区杂交的引物。引物NPM-1的序列在序列表的SEQ ID NO:19中显示。
存在于基因中的一个BamHI位点在所述的方法中会产生问题,在该方法中,BamHI位点是用于连接蛋白酶PFUS基因和0.3kb DNA片段。依据在序列表SEQ ID NO:15中显示的蛋白酶PFUS基因的碱基序列,能制备经PCR-诱变法消除BamHI位点的引物mutRR和mutFR。引物mutRR和mutFR的碱基序列分别在序列表SEQ ID NOS:20和21中显示。当用这些引物消除BamHI位点时,由该位点编码的氨基酸残基即甘氨酸,由于引入该位点的碱基替换,被缬氨酸所替换,所述的位点在序列表SEQ ID NO:16中显示的蛋白酶PFUS氨基酸序列中560位。
用这些引物能获得连接有枯草杆菌蛋白酶E的启动子和编码信号肽区的蛋白酶PFUS基因。具体而言,用来自激烈热球菌的染色体DNA作模板及配对引物mutRR和NPF-4或配对引物mutFR和NPM-1,进行2次PCRs。此外,用各自PCR扩增的DNA片段作模板和引物NPF-4和NPM-1混合形成异源双链,进行第二轮PCR。因此,能扩增出不含有内部BamHI位点大约2.4kb的整个蛋白酶PFUS基因。
分离用BamHI和SphI消化的PCR扩增的DNA片段获得大约2.4kb的一个DNA片段,用该片段取代含有蛋白酶PFUS基因的质粒pSNP 1中的BamHI-SphI片段。由此构建的表达载体被命名为质粒pPS 1。用该质粒转化的枯草芽孢杆菌DB 104命名为枯草芽孢杆菌DB 104/pPS1。观察含有质粒pSNP 1的转化体,发现在该转化体培养物的上清液和抽提液中相似的蛋白酶活性,这表明该氨基酸替换不影响酶活性。质粒pPS 1的限制性酶图谱在图7中显示。
含有枯草杆菌蛋白酶E基因的启动子和编码信号肽区的大约0.3kbDNA片段用EcoRI和BamHI消化,用于取代在质粒pPS 1中含有的P43启动子和核糖体结合位点的EcoRI-BamHI片段。由此构建的表达质粒被命名为pNAPS 1。用该质粒转化的枯草芽孢杆菌DB 104被命名为枯草芽孢杆菌DB 104/pNAPS 1。热稳定蛋白酶活性在该转化体培养物的上清液和细胞抽提液中找到,与枯草芽孢杆菌DB 104/pSNP 1相比较增加了表达水平。质粒pNAPS 1的限制性酶图谱在图8中显示。
从该转化体表达的蛋白酶表现的酶学特性与上述的由枯草芽孢杆菌DB 104/pSNP 1表达的蛋白酶的那些特性相等。纯化了由该转化体表达的蛋白酶。分析纯化蛋白酶N-末端氨基酸序列提出的氨基酸序列在序列表SEQ ID NO:22中显示。该序列与在序列表SEQ ID NO:15中显示的蛋白酶PFUS的氨基酸序列从133位至144位的序列相同,表明成熟的蛋白酶PFUS是从该部分开始的多肽所组成的酶。根据这些结果呈现的成熟蛋白酶PFUS的氨基酸序列在序列表SEQ ID NO:4中显示。
尽管与枯草芽孢杆菌DB 104/pSNP 1(FERM BP-5634)产生的蛋白酶量相比较,由枯草芽孢杆菌DB 104/pNAPS 1产生的蛋白酶量增加,仍需要更高的生产力。通过修饰枯草芽孢杆菌信号肽和蛋白酶PFUS之间由pNAPS 1编码的融合肽结合部分,以更有效地移去信号肽,预计能增加该蛋白酶的表达水平。在质粒pNAPS 1中,由3个氨基酸残基Ala-Gly-Ser组成的肽插入在序列表SEQ ID NO:3中显示的枯草杆菌蛋白酶E信号肽的C-末端氨基酸残基(Ala)和蛋白酶PFUS的N-末端氨基酸残基(Met)之间。通过把突变导入到质粒pNAPS 1中编码该肽的DNA中然后检查已导入突变质粒的转化体的蛋白酶生产性,能获得具有增加蛋白酶表达水平的转化体。
首先,制备突变质粒,其中在质粒pNAPS 1中编码融合蛋白,枯草杆菌蛋白酶E-蛋白酶PFUS的基因中3个氨基酸肽中编码Ser的部分被修饰,这样该部分的碱基序列编码随机的2个氨基酸残基。上述突变质粒可用PCR法产生。例如,具有用随机的6个碱基替换编码Ser密码子(TCC)-的序列的引物SPOFO和SPORO(引物SPOFO和SPORO的碱基序列分别在序列表SEQ ID NOS:24和25中显示)和根据该区周围的碱基序列制备的引物SUB 3和NPR-10,用于进行PCR以获得一个DNA片段,在与编码Ser密码子(Ser)相应的部位的定向突变已引入了该DNA片段中。由得到的片段取代在质粒pNAPS 1中相应的区域能获得含有导入突变的蛋白酶基因的突变质粒。
通过由此获得的突变质粒导入到合适的宿主如枯草芽孢杆菌DB 104中,然后测定由转化体表达的蛋白酶水平,那么就能获得具有增加表达水平的转化体。由测定所分离的转化体独立培养物中的活性确定蛋白酶的表达水平。另外,具有增加表达水平的转化体可用含基质的琼脂平板方便地选出。
具体来说,突变质粒导入其中的转化体生长在含有脱脂乳的琼脂平板上。然后,平板培养在蛋白酶PFUS能表现其活性的温度下,如在70℃下。在表达蛋白酶的转化体集落周围的脱脂乳被降解而变得清亮。蛋白酶的表达水平能从清亮区的大小估计出来。
与枯草芽孢杆菌DB 104/pNAPS 1相比较由此得到的一种表达高水平蛋白酶活性的转化体,被命名为枯草芽孢杆菌DB 104/pSPO 124。制备含有该转化体的质粒(该质粒被命名为pSPO 124)。分析该质粒的碱基序列显示编码Ser的部分转变成碱基序列GGGAAT,那就是说,由该质粒编码的是一种Ser已转变为Gly-Asn的蛋白。
因此,通过把由4个氨基酸残基Ala-Gly-Gly-Asn组成的肽置于枯草杆菌蛋白酶信号肽的下游,将其与目的蛋白的N-末端融合,然后表达融合蛋白,证明目的蛋白的表达水平能在作为宿主的芽孢杆菌属细胞中增加。除了用于本发明的枯草杆菌蛋白酶E(来自枯草芽孢杆菌)外,来自解淀粉枯草杆菌的枯草杆菌蛋白酶BPN′(核酸研究,11:7911-7925(1983))、来自地衣枯草杆菌的枯草杆菌蛋白酶Carlsberg(核酸研究,13:8913-8926(1985))等都是熟知的由芽孢杆菌属细菌产生的枯草杆菌蛋白酶。来自它们的信号肽能优选地用于本发明,尽管它们的氨基酸序列互相间稍有不同。在芽孢杆菌属细菌中起作用的各种启动子能用在本发明为控制表达所用的来自枯草杆菌蛋白酶E基因的启动子的部位。
关于被表达的蛋白没有限制。只要获得编码蛋白的基因就可应用本发明通过遗传工程技术高水平地表达该蛋白。根据分类学上与芽孢杆菌属细菌不同的激烈热球菌的蛋白可高水平表达的事实,显然本发明能用于表达不是本发明宿主的生物来源的蛋白。通过遗传工程技术,本发明优选地用于生产蛋白酶PFUL、蛋白酶TCES以及结构上与蛋白酶PFUS相似,来源于海葡萄嗜热菌和解蛋白热拟杆菌的蛋白酶。
依据和枯草杆菌蛋白酶的同源性,可考虑将蛋白酶PFUS表达为具有信号肽和前肽的前体蛋白,然后进行加工以产生成熟的酶。此外,根据成熟蛋白酶PFUS酶的N-末端氨基酸序列分析的结果,可以设定该成熟酶是一种在序列表SEQ ID NO:4中所示的氨基酸序列组成的酶。然而,纯化的成熟蛋白酶PFUS的分子量大约为45kDa,比根据氨基酸序列计算的分子量更小,表明也进行其C-末端肽的加工后,作为前肽表达的蛋白酶PFUS转变成成熟的蛋白酶。
如果由加工过程移去的C-末端肽对酶活性或酶蛋白折叠成合适的结构是非必需的,预期通过从该基因中缺失编码该部分的区域然后表达蛋白酶,也可增加蛋白酶PFUS的表达水平。
从枯草芽孢杆菌DB 104/pNAPS 1获得的成熟蛋白酶PFUS的分子量例如可用质子光谱仪精确地测定。根据测定的分子量和按上述方法确定的成熟蛋白酶PFUS的N-末端氨基酸序列,发现该蛋白酶是一种与序列表SEQ ID NO:15中所示的氨基酸序列133位Ala至552位Thr相应的肽。此外,通过把终止密码子导入到在质粒pNAPS 1含有的蛋白酶PFUS基因中编码552位Thr部分的附近区域,能构建表达缺乏对其酶活性非必需的多肽的蛋白酶PFUS的质粒。具体而言,用引物NPR 544和引物NPFE 81经PCR获得具有所设计的终止密码子引入其中的碱基序列的DNA片段,引物NPR 544是在质粒pNAPS 1中的蛋白酶PFUS基因从起始密码子至第544位氨基酸残基编码密码子的C-末端侧(Ser)导入一个终止密码子(TGA)(引物NPR 544的碱基序列在序列表的SEQ ID NO:28中显示),而引物NPFE 81拥有在该基因中从NspV位点上游区的碱基序列(引物NPFE 81的碱基序列在序列表的SEQ ID NO:29中显示)。然后用该片段取代质粒pNAPS 1的相应区域能获得含有目的突变导入蛋白酶基因中的突变质粒。该质粒命名为质粒pNAPSΔC。用该质粒转化的枯草芽孢杆菌DB 104被命名为枯草芽孢杆菌DB 104被命名为枯草芽孢杆菌DB 104/pNAPSΔC。
该转化体表达蛋白酶活性,具有的特性与蛋白酶PFUS相同,其表达水平比枯草芽孢杆菌DB 104/pNAPS 1更高。
因此,可以发现在质粒pNAPSΔC中含有的蛋白酶PFUS基因拥有表达该酶活性的足够区域。在质粒中存在的编码蛋白酶PFUS区的碱基序列在序列表的SEQ ID NO:2中显示。由该碱基序列编码的氨基酸序列在序列表的SEQ ID NO:2中显示。
此外,通过把在质粒pNAPSΔC中相似的突变导入到质粒pSPO124的蛋白酶PFUS基因中,能表达缺乏其C-末端肽的蛋白酶PFUS。
具体而言,通过用NspV和SphI消化质粒pNAPSΔC获得的大约13kb的DNA片段和已被NspV和SphI消化的质粒pSPO 124混合并连接,而构建该目的质粒。该质粒被命名为质粒pSO124ΔC。用该质粒转化的枯草芽孢杆菌DB 104被命名并表示为枯草芽孢杆菌DB104/pSO124ΔC,于1997年5月16日(最初的保藏日期)根据布达佩斯条约保藏在通产省工业技术院生命工学工业技术研究所,日本,茨城县筑波市东1丁目1番3号,登记号为FERM BP-6294。该转化体的蛋白酶表达水平与枯草芽孢杆菌DB 104/pNAPS 1相比增加。
由转化体枯草芽孢杆菌DB 104/pNAPSΔC和枯草芽孢杆菌DB104/pSPO124ΔC产生的蛋白酶的酶学特性以及物理和化学特性,似乎与由枯草芽孢杆菌DB 104/pSNP 1产生的蛋白酶的那些特性相同。从该2个转化体中的培养物中获得的蛋白酶的主要特性如下:
(1)作用:
降解酪蛋白和胶原产生短链多肽。
水解琥珀酰-L-亮氨酰-L-亮氨酰-L-缬氨酰-L-酪氨酸-4-甲基香豆素-7-酰胺(Suc-Leu-Leu-Val-Tyr-MCA)产生荧光物质(7-氨基-4-甲基香豆素)。
水解琥珀酰-L-丙氨酰-L-丙氨酰-L-脯氨酰-L-苯丙氨酸-对-硝基酰替苯胺(Suc-Ala-Ala-Pro-Phe-p-NA)产生黄色物质(对硝基苯胺)。
(2)最适温度:
在40-110℃下表现酶活性,最适温度为80-95℃。
(3)最适pH:
在pH5-10下表现酶活性,最适pH为pH6-8。
(4)热稳定性:
在95℃下处理8小时后保留90%或更高的酶活性。
(5)pH稳定性:
在95℃,pH5-11下处理60分钟后保留95%或更高的酶活性。
(6)分子量:
在SDS-PAGE上表现的分子量大约45kDa。
因此,提供了具有高热稳定性的蛋白酶和其基因。此外,本发明披露了表达蛋白的新系统,该系统使蛋白酶大量表达。用遗传工程技术将该表达系统用于生产本发明的蛋白酶及各种蛋白。
下列的实施例更详细地说明本发明,但不能解释为限制本发明的范围。
实施例1
(1)从激烈热球菌中制备染色体DNA
按下列条件培养激烈热球菌DSM 3638。
含有1%蛋白胨,0.5%酵母抽提物,1%可溶性淀粉,3.5%Jamarine S固体物(Jamarine实验室),3.5%Jamarine S液体物(Jamarine实验室),0.003%MgSO4,0.001%NaCl,0.0001%FeSO4·7H2O,0.0001%CoSO4,0.0001%CaCl2·7H2O,0.0001%ZnSO4,0.1ppm CuSO4·5H2O,0.1ppm H3BO3,0.1ppm KAl(SO4)2,0.1ppm Na2MoO4·2H2O,0.25ppmNiCl2·H2O的培养基放在2L的培养瓶中,120℃灭菌20分钟,用氮气充泡以移去溶解的氧气,然后将菌株接种到培养基中,在95℃下非振荡条件培养16小时。培养后,通过离心收集细胞。
然后得到的细胞悬浮在4ml含有25%蔗糖的50mM Tris-HCl(pH8.0)中。加2ml的0.2M EDTA和0.8ml溶菌酶(5mg/ml)到悬液中。混合液在20℃下温育1小时。然后往混合液中加入24ml的SET溶液(150mM NaCl,1mM EDTA,20mM Tris-HCl,pH8.0),4ml的5%SDS和400μl的蛋白酶K(10mg/ml)。继续在37℃下温育1小时。反应通过用苯酚-氯仿抽提混合物而终止。然后,进行乙醇沉淀获得大约3.2mg的染色体DNA。
实施例2
(1)为构建质粒pNSP 1的引物合成
为了合成用于扩增整个蛋白酶PFUS基因的引物,含有该整个基因的质粒pSNP 1从枯草芽孢杆菌DB 104/pSNP 1(FERM BP-5634)中分离,然后测定所获得区域的碱基序列。根据该碱基序列,合成引入BamHI位点紧邻于蛋白酶PFUS基因起始密码子上游的引物NPF-4和能与该基因3′区杂交并含有SphI识别位点的引物NPM-1。引物NPF-4和NPM-1的碱基序列分别在序列表SEQ ID NOS:13和19中显示。
也合成移去BamHI位点的引物mutRR和mutFR,该BamHI位点位于蛋白酶PFUS基因中自起始密码子下游大约1.7kb处。引物mutRR和mutFR的碱基序列分别在序列表的SEQ ID NOS:20和21中显示。
(2)制备质粒pPS 1
制备2套LA-PCR反应混合液,然后进行94℃30秒-55℃1分钟-68℃3分钟的30个循环反应,每套LA-PCR反应混合液含有来自激烈热球菌的染色体DNA为模板和引物NPF-4和mutRR的组合或引物mutFR和NPM-1的组合。用LA PCR试剂盒Ver.2(TakaraShuzo)制备LA-PCR反应混合液。等份的反应混合物进行琼脂糖凝胶电泳,分别观察到用引物NPF-4和mutRR扩增出一条大约1.8kb的DNA片段而用引物mutFR和NPM-1扩增出一条大约0.6kb的DNA片段。
用SUPREC-02(Takara Shuzo)从2套PCR反应混合液中移去引物以制备扩增的DNA片段。制备含有这2种扩增的DNA片段但不含有引物或LA Taq的LA-PCR反应混合液,94℃下热变性10分钟,在30分钟内冷却至30℃,然后在30℃温育15分钟以形成异源双链。接着,把LA Taq(Takara Shuzo)加到反应混合液中,72℃下反应30分钟。然后把引物NPF-4和NPM-1加到反应混合液中,然后该反应混合液进行94℃30分钟-55℃1分钟-68℃3分钟的25个循环反应。在反应混合液中观察到扩增出一条大约2.4kb的DNA片段。
大约2.4kb的该DNA片段用BamHI和SphI(两者均来自TakaraShuzo)消化。该片段和已被BamHI和SphI消化过移去整个蛋白酶PFUS基因的质粒pSNP 1混合并连接,然后导入到枯草芽孢杆菌DB 104中。从产生的卡那霉素抗性的转化体中制备质粒,选出其中仅大约2.4kb片段一个分子插入的质粒,并且命名为质粒pPS 1。用该质粒pPS 1转化的枯草芽孢杆菌DB 104被命名为枯草芽孢杆菌DB 104/pPS 1。
质粒pPS 1的限制性酶图谱在图7中显示。
(3)对枯草杆菌蛋白酶E基因的启动子-编码信号肽区扩增DNA片段
为获得枯草杆菌蛋白酶E基因的启动子-编码信号肽区而合成引物。首先,根据在细菌学杂志,171:2657-2665(1989)所描述的枯草杆菌蛋白酶E基因启动子区的碱基序列合成引物SUB 4,该引物能与该区上游序列杂交并含有1个EcoRI位点(引物SUB 4的碱基序列在序列表的SEQ ID NO:17中显示)。根据在细胞学杂志,158:411-418(1984)中所描述的枯草杆菌蛋白酶E基因的碱基序列,合成能引入1个BamHI位点紧邻于编码信号肽区下游的引物BmR1(引物BmR1的碱基序列在序列表的SEQ ID NO:18中显示)。
制备含有在细菌学杂志,171:2657-2665中所描述的枯草杆菌蛋白酶E基因的质粒pKWZ作模板及引物SUB 4和BmR1的PCR反应混合液,然后进行94℃30秒-55℃1分钟-68℃2分钟的30个循环反应。等份的反应混合液进行琼脂糖凝胶电泳,并观察到扩增出一条大约0.3kb的DNA片段。
(4)构建蛋白酶表达质粒pNAPS 1
用EcoRI(Takara Shuzo)和BamHI消化上述大约0.3kb的DNA片段,用实施例3中所述的方法已被EcoRI和BamHI消化的质粒pPS1与DNA片段混合并连接,然后导入到枯草芽孢杆菌DB 104中。从产生的卡那霉素抗性的转化体中制备质粒,然后挑选出仅大约0.3kb的片段一个分子插入的质粒,命名为质粒pNAPS 1。用该质粒pNAPS 1转化的枯草芽孢杆菌DB 104被命名为枯草芽孢杆菌DB 104/pNAPS 1。
质粒pNAPS 1的限制性酶图谱在图8中显示。
(5)构建质粒pSNP 2
为引入BamHI位点位于在上面提到的质粒pNAPS 1中的枯草杆菌蛋白酶E基因的编码信号肽区上游,合成引物SUB17R(引物SUB17R的碱基序列在序列表的SEQ ID NO:23中显示)。制备含有质粒pNAPS1作模板及引物SUB17R和SUB4的PCR反应混合液,进行94℃30秒-55℃1分钟-72℃1分钟的25个循环反应。用EcoRI和BamHI消化扩增的大约0.21kb的DNA片段,以获得一条大约0.2kb的DNA片段,该片段含有枯草杆菌蛋白酶E基因的启动子和SD序列。该片段和已被EcoRI和BamHI消化过的质粒pNAPS1混合并连接。用该反应混合液转化枯草芽孢杆菌DB 104。从产生的卡那霉素抗性的转化体中制备质粒,然后挑选出大约0.2kb的DNA片段插入的质粒,命名为质粒pSNP 2。
(6)产生高水平表达蛋白酶的突变质粒
为把位于质粒pNAPS 1中枯草杆菌蛋白酶E基因的编码信号肽区和蛋白酶PFUS基因的起始密码子之间的编码氨基酸残基Ser的序列(碱基序列:TCC)用编码2个随机氨基酸残基的序列替换,合成引物SPOFO和SPORO(引物SPOFO和SPORO的碱基序列分别在序列表的SEQ ID NOS:24和25中显示)。合成引入的BamHI位点紧邻于质粒pNAPS 1的枯草杆菌蛋白酶E基因中编码信号肽的上游的引物SUB3和在蛋白酶PFUS编码区中含有SpeI位点的引物NPR-10(引物SUB3和NPR-10的碱基序列分别在序列表的SEQ ID NOS:26和27中显示)。
制备PCR反应混合液,每种混合液含有以质粒pNAPS 1作模板和引物SPOFP和NPR-10组合或引物SUB3和SPORO的组合,将反应混合液进行94℃30秒-50℃1分钟-72℃1分钟的20个循环反应。在2个反应混合液中扩增出的大约0.13kb和大约0.35kb的DNA片段混合在一起,在94℃变性10分钟,逐渐冷却到37℃以形成异源双链。然后用Taq聚合酶(Takara Shuzo)的方法从异源双链产生双链DNA。制备含有由上获得的双链DNA作模板及引物SUB3和NPR-10的PCR反应混合液,进行94℃30秒-50℃1分钟-72℃1分钟的25个循环反应。用BamHI和SpeI消化扩增的大约0.43kb的DNA片段所获得的一条DNA片段和用BamHI和SpeI消化过的质粒pSNP 2混合并连接。用反应混合液转化枯草芽孢杆菌DB 104。
将产生的卡那霉素抗性的转化体接种在脱脂乳的平板上(用于高温培养的LB-琼脂培养基含有10μg/ml的卡那霉素和1%脱脂乳)以形成集落。接着,平板培养在70℃下,根据在集落周围的脱脂乳的降解程度,检查由各个转化体表达的蛋白酶活性。结果,分离到一个表达特别高活性的克隆,从该克隆制备命名为质粒pSPO 124的质粒。用该质粒转化的枯草芽孢杆菌DB 104被命名为枯草芽孢杆菌DB 104/pSPO 124。分析质粒pSPO 124的碱基序列,发现在质粒pNAPS 1中编码Ser的碱基序列被碱基序列GGGAAT所替换,那就是说所编码的蛋白中,Ser被转换为2个氨基酸残基Gly-Asn。另外,证明与蛋白酶PFUS基因的Pro(CCA)相应的从起始密码子计算的第25位密码子转变为编码Leu的密码子(CTA),这是与上面所述的突变同时发生的。
(7)构建蛋白酶表达质粒pNAPSΔC
1个终止密码子被导入在质粒pNAPS 1中从蛋白酶PFUS基因的起始密码子算起的第544位氨基酸残基的C-末端侧,以构建表达从该位点起缺乏下游区的蛋白酶的质粒。合成引物NPR 544,该引物在该基因中编码第544位氨基酸残基的密码子C-末端侧导入一个终止密码子(碱基序列:TGA)和有一个SphI位点(引物NPR 544的碱基序列在序列表的SEQ ID NO:28中显示)。此外,根据在该基因中从NspV位点上游部分的碱基序列,合成引物NPFE 81(引物NPFE 81的碱基序列在序列表的SEQ ID NO:29中显示)。
制备含有质粒pNAPS 1作模板及引物NPFE 81和NPR 544的PCR反应混合液,然后进行94℃30秒-50℃1分钟-72℃1分钟的20个循环反应。扩增出的大约0.61kb的DNA片段用NspV(Takara Shuzo)和SpeI消化,以获得一条含有终止密码子的大约0.13kb的DNA片段。该DNA片段和已被限制性酶NspV和SphI消化过的质粒pNAPS 1混合并连接。用反应混合液转化枯草芽孢杆菌DB 104。从产生的卡那霉素抗性的转化体中制备质粒,选出大约0.13kb的DNA片段插入其中的质粒,该质粒被命名为质粒pNAPSΔC。用该质粒pNAPSΔC转化的枯草芽孢杆菌DB 104被命名为枯草芽孢杆菌DB 104/pNAPSΔC。
(8)构建蛋白酶表达质粒pSPO124ΔC
用NspV和SphI消化质粒pNAPSΔC分离得到一条大约1.3kb的DNA片段,然后该片段与已被NspV和SphI消化过的质粒pSPO 124混合并连接。用反应混合液转化枯草芽孢杆菌DB 104。从产生的卡那霉素抗性转化体中制备质粒,挑选出大约1.3kb的DNA片段插入的质粒,并被命名为质粒pSPO124ΔC。用该质粒pSPO124ΔC转化的枯草芽孢杆菌DB 104被命名为枯草芽孢杆菌DB 104/pSPO124ΔC。
实施例3
(1)用含蛋白酶PFUS基因的质粒转化的枯草芽孢杆菌的培养和制备粗酶溶液
用实施例2所述的方法将含有蛋白酶PFUS基因的质粒pNAPS 1导入到枯草芽孢杆菌DB 104中出现的枯草芽孢杆菌DB 104/pNAPS 1,在2ml含有10μg/ml卡那霉素的LB培养基(蛋白胨10g/L,酵母抽提物5g/L,NaCl 5g/L,pH7.2)中,37℃下培养24小时。离心培养物以得到培养上清液(制备物1-S)和细胞。
把细胞悬浮在100μg的50mM Tris-HCl,pH7.5中,加2mg溶菌酶(Sigma)后37℃消化45分钟。消化过的样品在95℃热处理10分钟,然后通过离心收集上清液以获得无细胞的抽提液(制备物1-L)。
相似地,从含有质粒pSPO 124的枯草芽孢杆菌DB 104/pSPO 124、含有质粒pNAPSΔC的枯草芽孢杆菌DB 104/pNAPSΔC或含有质粒pSPO124ΔC的枯草芽孢杆菌DB 104/pSPO124ΔC中,获得培养物上清液和无细胞的抽提液。来自枯草芽孢杆菌DB 104/pSPO 124的培养物上清液和无细胞抽提液分别称为124-S和124-L。来自枯草芽孢杆菌DB 104/pNAPSΔC的培养物上清液和无细胞抽提液分别称为ΔC-S和ΔC-L。来自枯草芽孢杆菌DB 104/pSPO124ΔC的培养物上清液和无细胞抽提液分别称为124ΔC-S和124ΔC-L。用这些制备物测定蛋白酶活性并测定在每个制备物中含有的蛋白酶浓度。
(2)比较蛋白酶的生产力
用Suc-Ala-Ala-Pro-Phe-p-NA(Sigma)作底物光谱法测定酶水解反应中产生的p-硝基苯胺的量确定蛋白酶PFUS的活性。简言之,适当稀释待测定其酶活性的酶制备液。50μg在100mM磷酸盐缓冲液pH7.0中的1mM Suc-Ala-Ala-Pro-Phe-p-NA被加到50μl稀释过的样品溶液中。然后,使反应在95℃进行30分钟。通过在冰上冷却终止反应后,测定在405nm的吸收值以计算出产生的对硝基苯胺的量。该酶的一个单位被定义为95℃每1分钟产生1μmol对硝基苯胺的酶量。假定比活性为9.5单位/mg蛋白酶PFUS蛋白,根据所测定的酶活性计算在培养物上清液或细胞中表达的酶蛋白的量。
测定在实施例3-(1)制备的每种酶制备物的蛋白酶活性。根据测定结果计算的每种转化体每1L培养物的蛋白酶PFUS的生产力在表1显示。
在枯草芽孢杆菌DB 104/pSPO 124中,在细胞中的蛋白酶PFUS的生产力比枯草芽孢杆菌DB 104/pNAPS 1增加了3.6倍。在枯草芽孢杆菌DB 104/pNAPSΔC中,蛋白酶PFUS的生产力分别在培养物上清液中增加2.4倍而在细胞中增加2.2倍。此外,在枯草芽孢杆菌DB 104/pSPO124ΔC中,蛋白酶PFUS的生产力分别在培养物上清液中增加2倍而在细胞中增加2.4倍。每种细胞的生产力也增加。
在培养物上清液和细胞中产生的蛋白酶PFUS的总量,与枯草芽孢杆菌DB 104/pNAPS 1相比,分别在枯草芽孢杆菌DB 104/pSPO 124中增加2.1倍,在枯草芽孢杆菌DB 104/pNAPSΔC中增加2.1倍及在枯草芽孢杆菌DB 104/pSPO124ΔC中增加2.2倍。
                      表1
           蛋白酶PFUS的生产力(mg/L的培养物)
转化体(质粒) 培养物上清液     细胞 培养物上清液+细胞
pNAPS1     15.1     12.5     27.6
pSPO124     13.1     45.4     58.5
pNAPSΔC     35.5     28.1     63.6
pSPO124ΔC     30.5     30.1     60.6
实施例4
(1)制备纯化的成熟蛋白酶PFUS的酶制备物
按实施例2中所述的方法将编码本发明的超热稳定蛋白酶的基因导入枯草芽孢杆菌DB 104中出现的2种菌株,枯草芽孢杆菌DB 104/pNAPS 1和枯草芽孢杆菌DB 104/pSPO124ΔC,分别接种到含有10μg/ml卡那霉素的5ml LB培养基中,37℃振荡培养7小时。5ml的培养物接种到5L锥形瓶中500ml含10μg/ml卡那霉素的TM培养基(大豆粉末5g/L,聚胨10g/L,肉膏5g/L,酵母抽提物2g/L,葡萄糖10g/L,FeSO4·7H2O 10mg/L,MnSO4·4H2O 10mg/L,ZnSO4·7H2O 1mg/L,pH7.0)中,30℃振荡培养3天。超声处理所产生的培养物,在95℃热处理30分钟,然后离心收集上清液。加过硫酸铵到上清液中至25%的饱和度,然后由下一步离心获得的上清液上样到用含25%饱和过硫酸铵的25mM Tris-HCl缓冲液平衡过的微量制备甲基HIC柱(Bio-Rad)上。用相同的缓冲液洗涤凝胶后,吸附到柱上的蛋白酶PFUS用含40%乙醇的25mM Tris-HCl缓冲液(pH7.6)用分步洗脱法洗脱下来。由此获得的含有蛋白酶PFUS的级分用NAP-25柱进行凝胶过滤,该NAP-25柱预先用含20%乙腈的0.05%三氟乙酸平衡,在变性蛋白酶PFUS的同时脱盐,然后获得纯化的蛋白酶PFUS的制备物。从枯草芽孢杆菌DB 104/pNAPS 1和枯草芽孢杆菌DB 104/pSPO124ΔC中得到的制备物分别称为NAPS-1和SPO-124ΔC。
2种纯化的酶制备物在0.1%SDS-10%聚丙烯酰胺凝胶上电泳,然后用考马斯亮蓝R-250染色,结果显示2种纯化的酶制备物NAPS-1和SPO-124ΔC为单一的泳带,估测的分子量大约为45kDa。
(2)成熟蛋白酶PFUS的N-末端氨基酸序列的分析
用G1000A蛋白测序仪(Hewlett-Packard),通过自动Edman法分析纯化的酶制备物NAPS-1和SPO-124ΔC的N-末端氨基酸序列。2种纯化的酶制备物的2个N-末端氨基酸序列在序列表的SEQID NO:22中显示。该序列与在序列表的SEQ ID NO:15中所示的蛋白酶PFUS氨基酸序列从133位至144位的序列重合,表明NAPS-1和SPO-124ΔC二者是从该部分开始的多肽所组成的酶。
(3)成熟蛋白酶PFUS的质谱法分析
对纯化的酶制备物NAPS-1和SPO-124ΔC的质谱法分析用API300四极三质子分光仪(Perkin-Elmer Sciex)进行。根据NAPS-1的估测分子量,43,744Da,说明由枯草芽孢杆菌DB 104/pNAPS 1产生的成熟蛋白酶PFUS是一种在序列表SEQ ID NO:15中所示的蛋白酶氨基酸序列从133位Ala至552位Thr的多肽组成的酶。此外,根据SPO-124ΔC的估测分子量42,906Da,说明由枯草芽孢杆菌DB 104/pSPO124ΔC产生的成熟蛋白酶PFUS是一种由这样的一种多肽组成的酶,该多肽为在序列表SEQ ID NO:15中所示的蛋白酶PFUS从133位Ala至544位Ser的氨基酸序列,即是序列表SEQ ID NO:2中所示的氨基酸序列。
序列表
申请人名称:TAKARA SHUZO CO.,LTD
发明题目:表达超热稳定蛋白的系统
参考/摘要号:660782
目前申请号:
目前申请日:
在先申请号:151969/1997
在先申请日:1997,6月10日
序列数:29
SEQ ID NO:1的资料:
      长度:412
      类型:氨基酸
      链型:单链
      拓扑结构:线性
分子类型:肽
序列描述:
Ala Glu Leu Glu Gly Leu Asp Glu Ser Ala Ala Gln Val Met Ala
                  5                  10                  15
Thr Tyr Val Trp Asn Leu Gly Tyr Asp Gly Ser Gly Ile Thr Ile
                 20                  25                  30
Gly Ile Ile Asp Thr Gly Ile Asp Ala Ser His Pro Asp Leu Gln
                 35                  40                  45
Gly Lys Val Ile Gly Trp Val Asp Phe Val Asn Gly Arg Ser Tyr
                 50                  55                  60
Pro Tyr Asp Asp His Gly His Gly Thr His Val Ala Ser Ile Ala
                 65                  70                  75
Ala Gly Thr Gly Ala Ala Ser Asn Gly Lys Tyr Lys Gly Met Ala
                 80                  85                  90
Pro Gly Ala Lys Leu Ala Gly Ile Lys Val Leu Gly Ala Asp Gly
                 95                 100                 105
Ser Gly Ser Ile Ser Thr Ile Ile Lys Gly Val Glu Trp Ala Val
                110                 115                 120
Asp Asn Lys Asp Lys Tyr Gly Ile Lys Val Ile Asn Leu Ser Leu
                125                 130                 135
Gly Ser Ser Gln Ser Ser Asp Gly Thr Asp Ala Leu Ser Gln Ala
                140                 145                 150
Val Asn Ala Ala Trp Asp Ala Gly Leu Val Val Val Val Ala Ala
                155                 160                 165
Gly Asn Ser Gly Pro Asn Lys Tyr Thr Ile Gly Ser Pro Ala Ala
                170                 175                 180
Ala Ser Lys Val Ile Thr Val Gly Ala Val Asp Lys Tyr Asp Val
                185                 190                 195
Ile Thr Ser Phe Ser Ser Arg Gly Pro Thr Ala Asp Gly Arg Leu
                200                 205                 210
Lys Pro Glu Val Val Ala Pro Gly Asn Trp Ile Ile Ala Ala Arg
                215                 220                 225
Ala Ser Gly Thr Ser Met Gly Gln Pro Ile Asn Asp Tyr Tyr Thr
                230                 235                 240
Ala Ala Pro Gly Thr Ser Met Ala Thr Pro His Val Ala Gly Ile
                245                 250                 255
Ala Ala Leu Leu Leu Gln Ala His Pro Ser Trp Thr Pro Asp Lys
                260                 265                 270
Val Lys Thr Ala Leu Ile Glu Thr Ala Asp Ile Val Lys Pro Asp
                275                 280                 285
Glu Ile Ala Asp Ile Ala Tyr Gly Ala Gly Arg Val Asn Ala Tyr
                290                 295                 300
Lys Ala Ile Asn Tyr Asp Asn Tyr Ala Lys Leu Val Phe Thr Gly
                305                 310                 315
Tyr Val Ala Asn Lys Gly Ser Gln Thr His Gln Phe Val Ile Ser
                320                 325                 330
Gly Ala Ser Phe Val Thr Ala Thr Leu Tyr Trp Asp Asn Ala Asn
                335                 340                 345
Ser Asp Leu Asp Leu Tyr Leu Tyr Asp Pro Asn Gly Asn Gln Val
                350                 355                 360
Asp Tyr Ser Tyr Thr Ala Tyr Tyr Gly phe Glu Lys Val Gly Tyr
                365                 370                 375
Tyr Asn Pro Thr Asp Gly Thr Trp Thr Ile Lys Val Val Ser Tyr
                380                 385                 390
Ser Gly Ser Ala Asn Tyr Gln Val Asp Val Val Ser Asp Gly Ser
                395                 400                 405
Leu Ser Gln Pro Gly Ser Ser
                410
SEQ ID NO:2的资料:
      长度:1236
      类型:核酸
      链型:双链
      拓扑结构:线性
分子类型:基因组DNA
原始来源:
      生物:激烈热球菌
      菌株:DSM 3638
序列描述:
GCAGAATTAG AAGGACTGGA TGAGTCTGCA GCTCAAGTTA TGGCAACTTA CGTTTGGAAC     60
TTGGGATATG ATGGTTCTGG AATCACAATA GGAATAATTG ACACTGGAAT TGACGCTTCT    120
CATCCAGATC TCCAAGGAAA AGTAATTGGG TGGGTAGATT TTGTCAATGG TAGGAGTTAT    180
CCATACGATG ACCATGGACA TGGAACTCAT GTAGCTTCAA TAGCAGCTGG TACTGGAGCA    240
GCAAGTAATG GCAAGTACAA GGGAATGGCT CCAGGAGCTA AGCTGGCGGG AATTAAGGTT    300
CTAGGTGCCG ATGGTTCTGG AAGCATATCT ACTATAATTA AGGGAGTTGA GTGGGCCGTT    360
GATAACAAAG ATAAGTACGG AATTAAGGTC ATTAATCTTT CTCTTGGTTC AAGCCAGAGC    420
TCAGATGGTA CTGACGCTCT AAGTCAGGCT GTTAATGCAG CGTGGGATGC TGGATTAGTT    480
GTTGTGGTTG CCGCTGGAAA CAGTGGACCT AACAAGTATA CAATCGGTTC TCCAGCAGCT    540
GCAAGCAAAG TTATTACAGT TGGAGCCGTT GACAAGTATG ATGTTATAAC AAGCTTCTCA    600
AGCAGAGGGC CAACTGCAGA CGGCAGGCTT AAGCCTGAGG TTGTTGCTCC AGGAAACTGG    660
ATAATTGCTG CCAGAGCAAG TGGAACTAGC ATGGGTCAAC CAATTAATGA CTATTACACA    720
GCAGCTCCTG GGACATCAAT GGCAACTCCT CACGTAGCTG GTATTGCAGC CCTCTTGCTC    780
CAAGCACACC CGAGCTGGAC TCCAGACAAA GTAAAAACAG CCCTCATAGA AACTGCTGAT    840
ATCGTAAAGC CAGATGAAAT AGCCGATATA GCCTACGGTG CAGGTAGGGT TAATGCATAC    900
AAGGCTATAA ACTACGATAA CTATGCAAAG CTAGTGTTCA CTGGATATGT TGCCAACAAA    960
GGCAGCCAAA CTCACCAGTT CGTTATTAGC GGAGCTTCGT TCGTAACTGC CACATTATAC   1020
TGGGACAATG CCAATAGCGA CCTTGATCTT TACCTCTACG ATCCCAATGG AAACCAGGTT   1080
GACTACTCTT ACACCGCCTA CTATGGATTC GAAAAGGTTG GTTATTACAA CCCAACTGAT   1140
GGAACATGGA CAATTAAGGT TGTAAGCTAC AGCGGAAGTG CAAACTATCA AGTAGATGTG   1200
GTAAGTGATG GTTCCCTTTC ACAGCCTGGA AGTTCA                             1236
SEQ ID NO:3的资料:
      长度:29
      类型:氨基酸
      链型:单链
      拓扑结构:线性
分子类型:肽
序列描述:
Met Arg Ser Lys Lys Leu Trp Ile Ser Leu Leu Phe Ala Leu Thr
                  5                  10                  15
Leu Ile Phe Thr Met Ala Phe Ser Asn Met Ser Ala Gln Ala
                 20                  25
SEQ ID NO:4的资料:
      长度:522
      类型:氨基酸
      链型:单链
      拓扑结构:线性
分子类型:肽
特征:
      其它资料:在428位的Xaa是Gly或Val
序列描述:
Ala Glu Leu Glu Gly Leu Asp Glu Ser Ala Ala Gln Val Met Ala
                  5                  10                  15
Thr Tyr Val Trp Asn Leu Gly Tyr Asp Gly Ser Gly Ile Thr Ile
                 20                  25                  30
Gly Ile Ile Asp Thr Gly Ile Asp Ala Ser His Pro Asp Leu Gln
                 35                  40                  45
Gly Lys Val Ile Gly Trp Val Asp Phe Val Asn Gly Arg Ser Tyr
                 50                  55                  60
Pro Tyr Asp Asp His Gly His Gly Thr His Val Ala Ser Ile Ala
                 65                  70                  75
Ala Gly Thr Gly Ala Ala Ser Asn Gly Lys Tyr Lys Gly Met Ala
                 80                 85                  90
Pro Gly Ala Lys Leu Ala Gly Ile Lys Val Leu Gly Ala Asp Gly
                 95                 100                 105
Ser Gly Ser Ile Ser Thr Ile Ile Lys Gly Val Glu TrP Ala Val
                110                 115                 120
Asp Asn Lys Asp Lys Tyr Gly Ile Lys Val Ile Asn Ieu Ser Ieu
                125                 130                 135
Gly Ser Ser Gln Ser Ser Asp Gly Thr Asp Ala Leu Ser Gln Ala
                140                 145                 150
Val Asn Ala Ala Trp Asp Ala Gly Leu Val Val Val Val Ala Ala
                155                 160                 165
Gly Asn Ser Gly Pro Asn Lys Tyr Thr Ile Gly Ser Pro Ala Ala
                170                 175                 180
Ala Ser Lys Val Ile Thr Val Gly Ala Val Asp Lys Tyr Asp Val
                185                 190                 195
Ile Thr Ser Phe Ser Ser Arg Gly Pro Thr Ala Asp Gly Arg Leu
                200                 205                 210
Lys Pro Glu Val Val Ala Pro Gly Asn Trp Ile Ile Ala Ala Arg
                215                 220                 225
Ala Ser Gly Thr Ser Met Gly Gln Pro Ile Asn Asp Tyr Tyr Thr
                230                 235                 240
Ala Ala Pro Gly Thr Ser Met Ala Thr Pro His Val Ala Gly Ile
                245                 250                 255
Ala Ala Leu Leu Leu Gln Ala His Pro Ser Trp Thr Pro Asp Lys
                260                 265                 270
Val Lys Thr Ala Leu Ile Glu Thr Ala Asp Ile Val Lys Pro Asp
                275                 280                 285
Glu Ile Ala Asp Ile Ala Tyr Gly Ala Gly Arg Val Asn Ala Tyr
                290                 295                 300
Lys Ala Ile Asn Tyr Asp Asn Tyr Ala Lys Leu Val Phe Thr Gly
                305                 310                 315
Tyr Val Ala Asn Lys Gly Ser Gln Thr His Gln Phe Val Ile Ser
                320                 325                 330
Gly Ala Ser Phe Val Thr Ala Thr Leu Tyr Trp Asp Asn Ala Asn
                335                 340                 345
Ser Asp Leu Asp Leu Tyr Leu Tyr Asp Pro Asn Gly Asn Gln Val
                350                 355                 360
Asp Tyr Ser Tyr Thr Ala Tyr Tyr Gly Phe Glu Lys Val Gly Tyr
                365                 370                 375
Tyr Asn Pro Thr Asp Gly Thr Trp Thr Ile Lys Val Val Ser Tyr
                380                 385                 390
Ser Gly Ser Ala Asn Tyr Gln Val Asp Val Val Ser Asp Gly Ser
                395                 400                 405
Leu Ser Gln Pro Gly Ser Ser Pro Ser Pro Gln Pro Glu Pro Thr
                410                 415                 420
Val Asp Ala Lys Thr Phe Gln Xaa Ser Asp His Tyr Tyr Tyr Asp
                425                 430                 435
Arg Ser Asp Thr Phe Thr Met Thr Val Asn Ser Gly Ala Thr Lys
                440                 445                 450
Ile Thr Gly Asp Leu Val Phe Asp Thr Ser Tyr His Asp Leu Asp
                455                 460                 465
Leu Tlr Leu Tyr Asp Pro Asn Gln Lys Leu Val Asp Arg Ser Glu
                470                 475                 480
Ser Pro Asn Ser Tyr Glu His Val Glu Tyr Leu Thr Pro Ala Pro
                485                 490                 495
Gly Thr Trp Tyr Phe Leu Val Tyr Ala Tyr Tyr Thr Tyr Gly Trp
                500                 505                 510
Ala Tyr Tyr Glu Leu Thr Ala Lys Val Tyr Tyr Gly
                515                 520
SEQ ID NO:5的资料:
      长度:4765
      类型:核酸
      链型:双链
      拓扑结构:线性
分子类型:基因组DNA
原始来源:
      生物:激烈热球菌
      菌株:DSM 3638
序列描述:
TTTAAATTAT AAGATATAAT CACTCCGAGT GATGAGTAAG ATACATCATT ACAGTCCCAA     60
AATGTTTATA ATTGGAACGC AGTGAATATA CAAAATGAAT ATAACCTCGG AGGTGACTGT    120
AGAATGAATA AGAAGGGACT TACTGTGCTA TTTATAGCGA TAATGCTCCT TTCAGTAGTT    180
CCAGTGCACT TTGTGTCCGC AGAAACACCA CCGGTTAGTT CAGAAAATTC AACAACTTCT    240
ATACTCCCTA ACCAACAAGT TGTGACAAAA GAAGTTTCAC AAGCGGCGCT TAATGCTATA    300
ATGAAAGGAC AACCCAACAT GGTTCTTATA ATCAAGACTA AGGAAGGCAA ACTTGAAGAG    360
GCAAAAACCG AGCTTGAAAA GCTAGGTGCA GAGATTCTTG ACGAAAATAG AGTTCTTAAC    420
ATGTTGCTAG TTAAGATTAA GCCTGAGAAA GTTAAAGAGC TCAACTATAT CTCATCTCTT    480
GAAAAAGCCT GGCTTAACAG AGAAGTTAAG CTTTCCCCTC CAATTGTCGA AAAGGACGTC    540
AAGACTAAGG AGCCCTCCCT AGAACCAAAA ATGTATAACA GCACCTGGGT AATTAATGCT    600
CTCCAGTTCA TCCAGGAATT TGGATATGAT GGTAGTGGTG TTGTTGTTGC AGTACTTGAC    660
ACGGGAGTTG ATCCGAACCA TCCTTTCTTG AGCATAACTC CAGATGGACG CAGGAAAATT    720
ATAGAATGGA AGGATTTTAC AGACGAGGGA TTCGTGGATA CATCATTCAG CTTTAGCAAG    780
GTTGTAAATG GGACTCTTAT AATTAACACA ACATTCCAAG TGGCCTCAGG TCTCACGCTG    840
AATGAATCGA CAGGACTTAT GGAATACGTT GTTAAGACTG TTTACGTGAG CAATGTGACC    900
ATTGGAAATA TCACTTCTGC TAATGGCATC TATCACTTCG GCCTGCTCCC AGAAAGATAC    960
TTCGACTTAA ACTTCGATGG TGATCAAGAG GACTTCTATC CTGTCTTATT AGTTAACTCC   1020
ACTGGCAATG GTTATGACAT TGCATATGTG GATACTGACC TTGACTACGA CTTCACCGAC   1080
GAAGTTCCAC TTGGCCAGTA CAACGTTACT TATGATGTTG CTGTTTTTAG CTACTACTAC   1140
GGTCCTCTCA ACTACGTGCT TGCAGAAATA GATCCTAACG GAGAATATGC AGTATTTGGG   1200
TGGGATGGTC ACGGTCACGG AACTCACGTA GCTGGAACTG TTGCTGGTTA CGACAGCAAC   1260
AATGATGCTT GGGATTGGCT CAGTATGTAC TCTGGTGAAT GGGAAGTGTT CTCAAGACTC   1320
TATGGTTGGG ATTATACGAA CGTTACCACA GACACCGTGC AGGGTGTTGC TCCAGGTGCC   1380
CAAATAATGG CAATAAGAGT TCTTAGGAGT GATGGACGGG GTAGCATGTG GGATATTATA   1440
GAAGGTATGA CATACGCAGC AACCCATGGT GCAGACGTTA TAAGCATGAG TCTCGGTGGA   1500
AATGCTCCAT ACTTAGATGG TACTGATCCA GAAAGCGTTG CTGTGGATGA GCTTACCGAA   1560
AAGTACGGTG TTGTATTCGT AATAGCTGCA GGAAATGAAG GTCCTGGCAT TAACATCGTT   1620
GGAAGTCCTG GTGTTGCAAC AAAGGCAATA ACTGTTGGAG CTGCTGCAGT GCCCATTAAC   1680
GTTGGAGTTT ATGTTTCCCA AGCACTTGGA TATCCTGATT ACTATGGATT CTATTACTTC   1740
CCCGCCTACA CAAACGTTAG AATAGCATTC TTCTCAAGCA GAGGGCCGAG AATAGATGGT   1800
GAAATAAAAC CCAATGTAGT GGCTCCAGGT TACGGAATTT ACTCATCCCT GCCGATGTGG   1860
ATTGGCGGAG CTGACTTCAT GTCTGGAACT TCGATGGCTA CTCCACATGT CAGCGGTGTC   1920
GTTGCACTCC TCATAAGCGG GGCAAAGGCC GAGGGAATAT ACTACAATCC AGATATAATT   1980
AAGAAGGTTC TTGAGAGCGG TGCAACCTGG CTTGAGGGAG ATCCATATAC TGGGCAGAAG   2040
TACACTGAGC TTGACCAAGG TCATGGTCTT GTTAACGTTA CCAAGTCCTG GGAAATCCTT   2100
AAGGCTATAA ACGGCACCAC TCTCCCAATT GTTGATCACT GGGCAGACAA GTCCTACAGC   2160
GACTTTGCGG AGTACTTGGG TGTGGACGTT ATAAGAGGTC TCTACGCAAG GAACTCTATA   2220
CCTGACATTG TCGAGTGGCA CATTAAGTAC GTAGGGGACA CGGAGTACAG AACTTTTGAG   2280
ATCTATGCAA CTGAGCCATG GATTAAGCCT TTTGTCAGTG GAAGTGTAAT TCTAGAGAAC   2340
AATACCGAGT TTGTCCTTAG GGTGAAATAT GATGTAGAGG GTCTTGAGCC AGGTCTCTAT   2400
GTTGGAAGGA TAATCATTGA TGATCCAACA ACGCCAGTTA TTGAAGACGA GATCTTGAAC   2460
ACAATTGTTA TTCCCGAGAA GTTCACTCCT GAGAACAATT ACACCCTCAC CTGGTATGAT   2520
ATTAATGGTC CAGAAATGGT GACTCACCAC TTCTTCACTG TGCCTGAGGG AGTGGACGTT   2580
CTCTACGCGA TGACCACATA CTGGGACTAC GGTCTGTACA GACCAGATGG AATGTTTGTG   2640
TTCCCATACC AGCTAGATTA TCTTCCCGCT GCAGTCTCAA ATCCAATGCC TGGAAACTGG   2700
GAGCTAGTAT GGACTGGATT TAACTTTGCA CCCCTCTATG AGTCGGGCTT CCTTGTAAGG   2760
ATTTACGGAG TAGAGATAAC TCCAAGCGTT TGGTACATTA ACAGGACATA CCTTGACACT   2820
AACACTGAAT TCTCAATTGA ATTCAATATT ACTAACATCT ATGCCCCAAT TAATGCAACT   2880
CTAATCCCCA TTGGCCTTGG AACCTACAAT GCGAGCGTTG AAAGCGTTGG TGATGGAGAG   2940
TTCTTCATAA AGGGCATTGA AGTTCCTGAA GGCACCGCAG AGTTGAAGAT TAGGATAGGC   3000
AACCCAAGTG TTCCGAATTC AGATCTAGAC TTGTACCTTT ATGACAGTAA AGGCAATTTA   3060
GTGGCCTTAG ATGGAAACCC AACAGCAGAA GAAGAGGTTG TAGTTGAGTA TCCTAAGCCT   3120
GGAGTTTATT CAATAGTAGT ACATGGTTAC AGCGTCAGGG ACGAAAATGG TAATCCAACG   3180
ACAACCACCT TTGACTTAGT TGTTCAAATG ACCCTTGATA ATGGAAACAT AAAGCTTGAC   3240
AAAGACTCCA TTATTCTTGG AAGCAATGAA AGCGTAGTTG TAACTGCAAA CATAACAATT   3300
GATAGAGATC ATCCTACAGG AGTATACTCT GGTATCATAG AGATTAGAGA TAATGAGGTC   3360
TACCAGGATA CAAATACTTC AATTGCGAAA ATACCCATAA CTTTGGTAAT TGACAAGGCG   3420
GACTTTGCCG TTGGTCTCAC ACCAGCAGAG GGAGTACTTG GAGGGGCTAG AAATTACACT   3480
CTAATTGTAA AGCATGCCCT AACACTAGAG CCTGTGCCAA ATGCTACAGT GATTATAGGA   3540
AACTACACCT ACCTCACAGA CGAAAACGGT ACAGTGACAT TCACGTATGC TCCAACTAAG   3600
TTAGGCAGTG ATGAAATCAC AGTCATAGTT AAGAAAGAGA ACTTCAACAC ATTAGAGAAG   3660
ACCTTCCAAA TCACAGTATC AGAGCCTGAA ATAACTGAAG AGGACATAAA TGAGCCCAAG   3720
CTTGCAATGT CATCACCAGA AGCAAATGCT ACCATAGTAT CAGTTGAGAT GGAGAGTGAG   3780
GGTGGCGTTA AAAAGACAGT GACAGTGGAA ATAACTATAA ACGGAACCGC TAATGAGACT   3840
GCAACAATAG TGGTTCCTGT TCCTAAGAAG GCCGAAAACA TCGAGGTAAG TGGAGACCAC   3900
GTAATTTCCT ATAGTATAGA GGAAGGAGAG TACGCCAAGT ACGTTATAAT TACAGTGAAG   3960
TTTGCATCAC CTGTAACAGT AACTGTTACT TACACTATCT ATGCTGGCCC AAGAGTCTCA   4020
ATCTTGACAC TTAACTTCCT TGGCTACTCA TGGTACAGAC TATATTCACA GAAGTTTGAC   4080
GAATTGTACC AAAAGGCCCT TGAATTGGGA GTGGACAACG AGACATTAGC TTTAGCCCTC   4140
AGCTACCATG AAAAAGCCAA AGAGTACTAC GAAAAGGCCC TTGAGCTTAG CGAGGGTAAC   4200
ATAATCCAAT ACCTTGGAGA CATAAGACTA TTACCTCCAT TAAGACAGGC ATACATCAAT   4260
GAAATGAAGG CAGTTAAGAT ACTGGAAAAG GCCATAGAAG AATTAGAGGG TGAAGAGTAA   4320
TCTCCAATTT TTCCCACTTT TTCTTTTATA ACATTCCAAG CCTTTTCTTA GCTTCTTCGC   4380
TCATTCTATC AGGAGTCCAT GGAGGATCAA AGGTAAGTTC AACCTCCACA TCTCTTACTC   4440
CTGGGATTTC GAGTACTTTC TCCTCTACAG CTCTAAGAAG CCAGAGAGTT AAAGGACACC   4500
CAGGAGTTGT CATTGTCATC TTTATATATA CCGTTTTGTC AGGATTAATC TTTAGCTCAT   4560
AAATTAATCC AAGGTTTACA ACATCCATCC CAATTTCTGG GTCGATAACC TCCTTTAGCT   4620
TTTCCAGAAT CATTTCTTCA GTAATTTCAA GGTTCTCATC TTTGGTTTCT CTCACAAACC   4680
CAATTTCAAC CTGCCTGATA CCTTCTAACT CCCTAAGCTT GTTATATATC TCCAAAAGAG   4740
TGGCATCATC AATTTTCTCT TTAAA                                         4765
SEQ ID NO:6的资料:
      长度:1398
      类型:氨基酸
      链型:单链
      拓扑结构:线性
分子类型:肽
序列描述:
Met Asn Lys Lys Gly Leu Thr Val Leu Phe Ile Ala Ile Met Leu
                  5                  10                  15
Ieu Ser Val Val Pro Val His Phe Val Ser Ala Glu Thr Pro Pro
                 20                  25                  30
Val Ser Ser Glu Asn Ser Thr Thr Ser Ile Leu Pro Asn Gln Gln
                 35                  40                  45
Val Val Thr Lys Glu Val Ser Gln Ala Ala Leu Asn Ala Ile Met
                 50                  55                  60
Lys Gly Gln Pro Asn Met Val Leu Ile Ile Lys Thr Lys Glu Gly
                 65                  70                  75
Lys Leu Glu Glu Ala Lys Thr Glu Leu Glu Lys Leu Gly Ala Glu
                 80                  85                  90
Ile Leu Asp Glu Asn Arg Val Leu Asn Met Leu Leu Val Lys Ile
                 95                 100                 105
Lys Pro Glu Lys Val Lys Glu Leu Asn Tyr Ile Ser Ser Leu Glu
                110                 115                 120
Lys Ala Trp Leu Asn Arg Glu Val Lys Leu Ser Pro Pro Ile Val
                125                 130                 135
Glu Lys Asp Val Lys Thr Lys Glu Pro Ser Leu Glu Pro Lys Met
                140                 145                 150
Tyr Asn Ser Thr Trp Val Ile Asn Ala Leu Gln Phe Ile Gln Glu
                155                 160                 165
Phe Gly Tyr Asp Gly Ser Gly Val Val Val Ala Val Leu Asp Thr
                170                 175                 180
Gly Val Asp Pro Asn His Pro Phe Leu Ser Ile Thr Pro Asp Gly
                185                 190                 195
Arg Arg Lys Ile Ile Glu Trp Lys Asp Phe Thr Asp Glu Gly Phe
                200                 205                 210
Val Asp Thr Ser Phe Ser Phe Ser Lys Val Val Asn Gly Thr Leu
                215                 220                 225
Ile Ile Asn Thr Thr Phe Gln Val Ala Ser Gly Leu Thr Leu Asn
                230                 235                 240
Glu Ser Thr Gly Leu Met Glu Tyr Val Val Lys Thr Val Tyr Val
                245                 250                 255
Ser Asn Val Thr Ile Gly Asn Ile Thr Ser Ala Asn Gly Ile Tyr
                260                 265                 270
His Phe Gly Leu Leu Pro Glu Arg Tyr Phe Asp Leu Asn Phe Asp
                275                 280                 285
Gly Asp Gln Glu Asp Phe Tyr Pro Val Leu Leu Val Asn Ser Thr
                290                 295                 300
Gly Asn Gly Tyr Asp Ile Ala Tyr Val Asp Thr Asp Leu Asp Tyr
                305                 310                 315
Asp Phe Thr Asp Glu Val Pro Leu Gly Gln Tyr Asn Val Thr Tyr
                320                 325                 330
Asp Val Ala Val Phe Ser Tyr Tyr Tyr Gly Pro Leu Asn Tyr Val
                335                 340                 345
Leu Ala Glu Ile Asp Pro Asn Gly Glu Tyr Ala Val Phe Gly Trp
                350                 355                 360
Asp Gly His Gly His Gly Thr His Val Ala Gly Thr Val Ala Gly
                365                 370                 375
Tyr Asp Ser Asn Asn Asp Ala Trp Asp Trp Leu Ser Met Tyr Ser
                380                 385                 390
Gly Glu Trp Glu Val Phe Ser Arg Leu Tyr Gly Trp Asp Tyr Thr
                395                 400                 405
Asn Val Thr Thr Asp Thr Val Gln Gly Val Ala Pro Gly Ala Gln
                410                 415                 420
Ile Met Ala Ile Arg Val Leu Arg Ser Asp Gly Arg Gly Ser Met
                425                 430                 435
Trp Asp Ile Ile Glu Gly Met Thr Tyr Ala Ala Thr His Gly Ala
                440                 445                 450
Asp Val Ile Ser Met Ser Leu Gly Gly Asn Ala Pro Tyr Leu Asp
                455                 460                 465
Gly Thr Asp Pro Glu Ser Val Ala Val Asp Glu Leu Thr Glu Lys
                470                 475                 480
Tyr Gly Val Val Phe Val Ile Ala Ala Gly Asn Glu Gly Pro Gly
                485                 490                 495
Ile Asn Ile Val Gly Ser Pro Gly Val Ala Thr Lys Ala Ile Thr
                500                 505                 510
Val Gly Ala Ala Ala Val Pro Ile Asn Val Gly Val Tyr Val Ser
                515                 520                 525
Gln Ala Leu Gly Tyr Pro Asp Tyr Tyr Gly Phe Tyr Tyr Phe Pro
                530                 535                 540
Ala Tyr Thr Asn Val Arg Ile Ala Phe Phe Ser Ser Arg Gly Pro
                545                 550                 555
Arg Ile Asp Gly Glu Ile Lys Pro Asn Val Val Ala Pro Gly Tyr
                560                 565                 570
Gly Ile Tyr Ser Ser Leu Pro Met Trp Ile Gly Gly Ala Asp Phe
                575                 580                 585
Met Ser Gly Thr Ser Met Ala Thr Pro His Val Ser Gly Val Val
                590                 595                 600
Ala Leu Leu Ile Ser Gly Ala Lys Ala Glu Gly Ile Tyr Tyr Asn
                605                 610                 615
Pro Asp Ile Ile Lys Lys Val Leu Glu Ser Gly Ala Thr Trp Leu
                620                 625                 630
Glu Gly Asp Pro Tyr Thr Gly Gln Lys Tyr Thr Glu Leu Asp Gln
                635                 640                 645
Gly His Gly Leu Val Asn Val Thr Lys Ser Trp Glu Ile Leu Lys
                650                 655                 660
Ala Ile Asn Gly Thr Thr Leu Pro Ile Val Asp His Trp Ala Asp
                665                 670                 675
Lys Ser Tyr Ser Asp Phe Ala Glu Tyr Leu Gly Val Asp Val Ile
                680                 685                 690
Arg Gly Leu Tyr Ala Arg Asn Ser Ile Pro Asp Ile Val Glu Trp
                695                 700                 705
His Ile Lys Tyr Val Gly Asp Thr Glu Tyr Arg Thr Phe Glu Ile
                710                 715                 720
Tyr Ala Thr Glu Pro Trp Ile Lys Pro Phe Val Ser Gly Ser Val
                725                 730                 735
Ile Leu Glu Asn Asn Thr Glu Phe Val Leu Arg Val Lys Tyr Asp
                740                 745                 750
Val Glu Gly Leu Glu Pro Gly Leu Tyr Val Gly Arg Ile Ile Ile
                755                 760                 765
Asp Asp Pro Thr Thr Pro Val Ile Glu Asp Glu Ile Leu Asn Thr
                770                 775                 780
Ile Val Ile Pro Glu Lys Phe Thr Pro Glu Asn Asn Tyr Thr Leu
                785                 790                 795
Thr Trp Tyr Asp Ile Asn Gly Pro Glu Met Val Thr His His Phe
                800                 805                 810
Phe Thr Val Pro Glu Gly Val Asp Val Leu Tyr Ala Met Thr Thr
                815                 820                 825
Tyr Trp Asp Tyr Gly Leu Tyr Arg Pro Asp Gly Met Phe Val Phe
                830                 835                 840
Pro Tyr Gln Leu Asp Tyr Leu Pro Ala Ala Val Ser Asn Pro Met
                845                 850                 855
Pro Gly Asn Trp Glu Leu Val Trp Thr Gly Phe Asn Phe Ala Pro
                860                 865                 870
Leu Tyr Glu Ser Gly Phe Leu Val Arg Ile Tyr Gly Val Glu Ile
                875                 880                 885
Thr Pro Ser Val Trp Tyr Ile Asn Arg Thr Tyr Leu Asp Thr Asn
                890                 895                 900
Thr Glu Phe Ser Ile Glu Phe Asn Ile Thr Asn Ile Tyr Ala Pro
                905                 910                 915
Ile Asn Ala Thr Leu Ile Pro Ile Gly Leu Gly Thr Tyr Asn Ala
                920                 925                 930
Ser Val Glu Ser Val Gly Asp Gly Glu Phe Phe Ile Lys Gly Ile
                935                 940                 945
Glu Val Pro Glu Gly Thr Ala Glu Leu Lys Ile Arg Ile Gly Asn
                950                 955                 960
Pro Ser Val Pro Asn Ser Asp Leu Asp Leu Tyr Leu Tyr Asp Ser
                965                 970                 975
Iys Gly Asn Leu Val Ala Leu Asp Gly Asn Pro Thr Ala Glu Glu
                980                 985                 990
Glu Val Val Val Glu Tyr Pro Lys Pro Gly Val Tyr Ser Ile Val
                995                1000                1005
Val His Gly Tyr Ser Val Arg Asp Glu Asn Gly Asn Pro Thr Thr
               1010                1015                1020
Thr Thr Phe Asp Leu Val Val Gln Met Thr Leu Asp Asn Gly Asn
               1025                1030                1035
Ile Lys Leu Asp Lys Asp Ser Ile Ile Leu Gly Ser Asn Glu Ser
               1040                1045                1050
Val Val Val Thr Ala Asn Ile Thr Ile Asp Arg Asp His Pro Thr
               1055                1060                1065
Gly Val Tyr Ser Gly Ile Ile Glu Ile Arg Asp Asn Glu Val Tyr
               1070                1075                1080
Gln Asp Thr Asn Thr Ser Ile Ala Lys Ile Pro Ile Thr Leu Val
               1085                1090                1095
Ile Asp Lys Ala Asp Phe Ala Val Gly Leu Thr Pro Ala Glu Gly
               1100                1105                1110
Val Leu Gly Glu Ala Arg Asn Tyr Thr Leu Ile Val Lys His Ala
               1115                1120                1125
Ieu Thr Leu Glu Pro Va1 Pro Asn Ala Thr Val Ile Ile Gly Asn
               1130                1135                1140
Tyr Thr Tyr Leu Thr Asp Glu Asn Gly Thr Val Thr Phe Thr Tyr
               1145                1150                1155
Ala Pro Thr Lys Leu Gly Ser Asp Glu Ile Thr Val Ile Val Lys
               1160                1165                1170
Lys Glu Asn Phe Asn Thr Leu Glu Lys Thr Phe Gln Ile Thr Val
               1175                1180                1185
Ser Glu Pro Glu Ile Thr Glu Glu Asp Ile Asn Glu Pro Lys Leu
               1190                1195                1200
Ala Met Ser Ser Pro Glu Ala Asn Ala Thr Ile Val Ser Val Glu
               1205                1210                1215
Met Glu Ser Glu Gly Gly Val Lys Lys Thr Val Thr Val Glu Ile
               1220                1225                1230
Thr Ile Asn Gly Thr Ala Asn Glu Thr Ala Thr Ile Val Val Pro
               1235                1240                1245
Val Pro Lys Lys Ala Glu Asn Ile Glu Val Ser Gly Asp His Val
               1250                1255                1260
Ile Ser Tyr Ser Ile Glu Glu Gly Glu Tyr Ala Lys Tyr Val Ile
               1265                1270                1275
Ile Thr Val Lys Phe Ala Ser Pro Va1 Thr Val Thr Val Thr Tyr
               1280                1285                1290
Thr Ile Tyr Ala Gly Pro Arg Val Ser Ile Leu Thr Leu Asn Phe
               1295                1300                1305
Leu Gly Tyr Ser Trp Tyr Arg Leu Tyr Ser Gln Lys Phe Asp Glu
               1310                1315                1320
Ieu Tyr Gln Lys Ala Leu Glu Leu Gly Val Asp Asn Glu Thr Leu
               1325                1330                1335
Ala Leu Ala Leu Ser Tyr His Glu Lys Ala Lys Glu Tyr Tyr Glu
               1340                1345                1350
Lys Ala Leu Glu Leu Ser Glu Gly Asn Ile Ile Gln Tyr Leu Gly
               1355                1360                1365
Asp Ile Arg Leu Leu Pro Pro Leu Arg Gln Ala Tyr Ile Asn Glu
               1370                1375                1380
Met Lys Ala Val Lys Ile Leu Glu Lys Ala Ile Glu Glu Leu Glu
               1385                1390                1395
Gly Glu Glu
SEQ ID NO:7的资料:
      长度:35
      类型:核酸
      链型:单链
      拓扑结构:线性
分子类型:其它核酸(合成的DNA)
序列描述:
GGWWSDRRTG TTRRHGTHGC DGTDMTYGAC ACBG                              35
SEQ ID NO:8的资料:
       长度:32
       类型:核酸
       链型:单链
    拓扑结构:线性
分子类型:其它核酸(合成的DNA)
序列描述:
KSTCACGGAA CTCACGTGC BGGHACDGTT GC                                32
SEQ ID NO:9的资料:
    长度:33
    类型:核酸
    链型:单链
    拓扑结构:线性
分子类型:其它核酸(合成的DNA)
序列描述:
ASCMGCAACH GTKCCVGCHA CGTGAGTTCC GTG                                 33
SEQ ID NO:10的资料:
    长度:34
    类型:核酸
    链型:单链
    拓扑结构:线性
分子类型:其它核酸(合成的DNA)
序列描述:
CHCCGSYVAC RTGBGGAGWD GCCATBGAVG TDCC                                      34
SEQ ID NO:11的资料:
    长度:1977
    类型:核酸
    链型:双链
    拓扑结构:线性
分子类型:基因组DNA
原始来源:
    生物:速生热球菌
    菌株:DSM 2476
序列描述:
ATGAAGAGGT TAGGTGCTGT GGTGCTGGCA CTGGTGCTCG TGGGTCTTCT GGCCGGAACG     60
GCCCTTGCGG CACCCGTAAA ACCGGTTGTC AGGAACAACG CGGTTCAGCA GAAGAACTAC    120
GGACTGCTGA CCCCGGGACT GTTCAAGAAA GTCCAGAGGA TGAACTGGAA CCAGGAAGTG    180
GACACCGTCA TAATGTTCGG GAGCTACGGA GACAGGGACA GGGCGGTTAA GGTACTGAGG    240
CTCATGGGCG CCCAGGTCAA GTACTCCTAC AAGATAATCC CTGCTGTCGC GGTTAAAATA    300
AAGGCCAGGG ACCTTCTGCT GATCGCGGGC ATGATAGACA CGGGTTACTT CGGTAACACA    360
AGGGTCTCGG GCATAAAGTT CATACAGGAG GATTACAAGG TTCAGGTTGA CGACGCCACT    420
TCCGTCTCCC AGATAGGGGC CGATACCGTC TGGAACTCCC TCGGCTACGA CGGAAGCGGT    480
GTGGTGGTTG CCATCGTCGA TACGGGTATA GACGCGAACC ACCCCGATCT GAAGGGCAAG    540
GTCATAGGCT GGTACGACGC CGTCAACGGC AGGTCGACCC CCTACGATGA CCAGGGACAC    600
GGAACCCACG TTGCGGGTAT CGTTGCCGGA ACCGGCAGCG TTAACTCCCA GTACATAGGC    660
GTCGCCCCCG GCGCGAAGCT CGTCGGCGTC AAGGTTCTCG GTGCCGACGG TTCGGGAAGC    720
GTCTCCACCA TCATCGCGGG TGTTGACTGG GTCGTCCAGA ACAAGGACAA GTACGGGATA    780
AGGGTCATCA ACCTCTCCCT CGGCTCCTCC CAGAGCTCCG ACGGAACCGA CTCCCTCAGT    840
CAGGCCGTCA ACAACGCCTG GGACGCCGGT ATAGTAGTCT GCGTCGCCGC CGGCAACAGC    900
GGGCCGAACA CCTACACCGT CGGCTCACCC GCCGCCGCGA GCAAGGTCAT AACCGTCGGT    960
GCAGTTGACA GCAACGACAA CATCGCCAGC TTCTCCAGCA GGGGACCGAC CGCGGACGGA   1020
AGGCTCAAGC CGGAAGTCGT CGCCCCCGGC GTTGACATCA TAGCCCCGCG CGCCAGCGGA   1080
ACCAGCATGG GCACCCCGAT AAACGACTAC TACACCAAGG CCTCTGGAAC CAGCATGGCC   1140
ACCCCGCACG TTTCGGGCGT TGGCGCGCTC ATCCTCCAGG CCCACCCGAG CTGGACCCCG   1200
GACAAGGTGA AGACCGCCCT CATCGAGACC GCCGACATAG TCGCCCCCAA GGAGATAGCG   1260
GACATCGCCT ACGGTGCGGG TAGGGTGAAC GTCTACAAGG CCATCAAGTA CGACGACTAC   1320
GCCAAGCTCA CCTTCACCGG CTCCGTCGCC GACAAGGGAA GCGCCACCCA CACCTTCGAC   1380
GTCAGCGGCG CCACCTTCGT GACCGCCACC CTCTACTGGG ACACGGGCTC GAGCGACATC   1440
GACCTCTACC TCTACGACCC CAACGGGAAC GAGGTTGACT ACTCCTACAC CGCCTACTAC  1500
GGCTTCGAGA AGGTCGGCTA CTACAACCCG ACCGCCGGAA CCTGGACGGT CAAGGTCGTC  1560
AGCTACAAGG GCGCGGCGAA CTACCAGGTC GACGTCGTCA GCGACGGGAG CCTCAGCCAG  1620
TCCGGCGGCG GCAACCCGAA TCCAAACCCC AACCCGAACC CAACCCCGAC CACCGACACC  1680
CAGACCTTCA CCGGTTCCGT TAACGACTAC TGGGACACCA GCGACACCTT CACCATGAAC  1740
GTCAACAGCG GTGCCACCAA GATAACCGGT GACCTGACCT TCGATACTTC CTACAACGAC  1800
CTCGACCTCT ACCTCTACGA CCCCAACGGC AACCTCGTTG ACAGGTCCAC GTCGAGCAAC  1860
AGCTACGAGC ACGTCGAGTA CGCCAACCCC GCCCCGGGAA CCTGGACGTT CCTCGTCTAC  1920
GCCTACAGCA CCTACGGCTG GGCGGACTAC CAGCTCAAGG CCGTCGTCTA CTACGGG     1977
SEQ ID NO:12的资料:
      长度:659
      类型:氨基酸
      链型:单链
      拓扑结构:线性
分子类型:肽
序列描述:
Met Lys Arg Leu Gly Ala Val Val Leu Ala Leu Val Leu Val Gly
                  5                  10                  15
Leu Leu Ala Gly Thr Ala Leu Ala Ala Pro Val Lys Pro Val Val
                 20                  25                  30
Arg Asn Asn Ala Val Gln Gln Lys Asn Tyr Gly Leu Leu Thr Pro
                 35                  40                  45
Gly Leu Phe Lys Lys Val Gln Arg Met Asn Trp Asn Gln Glu Val
                 50                  55                  60
Asp Thr Val Ile Met Phe Gly Ser Tyr Gly Asp Arg Asp Arg Ala
                 65                  70                  75
Val Lys Val Leu Arg Leu Met Gly Ala Gln Val Lys Tyr Ser Tyr
                 80                  85                  90
Lys Ile Ile Pro Ala Val Ala Val Lys Ile Lys Ala Arg Asp Leu
                 95                 100                 105
Leu Leu Ile Ala Gly Met Ile Asp Thr Gly Tyr Phe Gly Asn Thr
                110                 115                 120
Arg Val Ser Gly Ile Lys Phe Ile Gln Glu Asp Tyr Lys Val Gln
                125                 130                 135
Val Asp Asp Ala Thr Ser Val Ser Gln Ile Gly Ala Asp Thr Val
                140                 145                 150
Trp Asn ser Leu Gly Tyr Asp Gly Ser Gly Val Val Val Ala Ile
                155                 160                 165
Val Asp Thr Gly Ile Asp Ala Asn His Pro Asp Leu Lys Gly Lys
                170                 175                 180
Val Ile Gly Trp Tyr Asp Ala Val Asn Gly Arg Ser Thr Pro Tyr
                185                 190                 195
Asp Asp Gln Gly His Gly Thr His Val Ala Gly Ile Val Ala Gly
                200                 205                 210
Thr Gly Ser Val Asn Ser Gln Tyr Ile Gly Val Ala Pro Gly Ala
                215                 220                 225
Lys Leu Val Gly Val Lys Val Leu Gly Ala Asp Gly Ser Gly Ser
                230                 235                 240
Val Ser Thr Ile Ile Ala Gly Val Asp Trp Val Val Gln Asn Lys
                245                 250                 255
Asp Lys Tyr Gly Ile Arg Val Ile Asn Leu Ser Leu Gly Ser Ser
                260                 265                 270
Gln Ser Ser Asp Gly Thr Asp Ser Leu Ser Gln Ala Val Asn Asn
                275                 280                 285
Ala Trp Asp Ala Gly Ile Val Val Cys Val Ala Ala Gly Asn Ser
                290                 295                 300
Gly Pro Asn Thr Tyr Thr Val Gly Ser Pro Ala Ala Ala Ser Lys
                305                 310                 315
Val Ile Thr Val Gly Ala Val Asp Ser Asn Asp Asn Ile Ala Ser
                320                 325                 330
Phe Ser Ser Arg Gly Pro Thr Ala Asp Gly Arg Leu Lys Pro Glu
                335                 340                 345
Val Val Ala Pro Gly Val Asp Ile Ile Ala Pro Arg Ala Ser Gly
                350                 355                 360
Thr Ser Met Gly Thr Pro Ile Asn Asp Tyr Tyr Thr Lys Ala Ser
                365                 370                 375
Gly Thr Ser Met Ala Thr Pro His Val Ser Gly Val Gly Ala Leu
                380                 385                 390
Ile Leu Gln Ala His Pro Ser Trp Thr Pro Asp Lys Val Lys Thr
                395                 400                 405
Ala Leu Ile Glu Thr Ala Asp Ile Val Ala Pro Lys Glu Ile Ala
                410                 415                 420
Asp Ile Ala Tyr Gly Ala Gly Arg Val Asn Val Tyr Lys Ala Ile
                425                 430                 435
Iys Tyr Asp Asp Tyr Ala Lys Leu Thr Phe Thr Gly Ser Val Ala
                440                 445                 450
Asp Lys Gly Ser Ala Thr His Thr Phe Asp Val Ser Gly Ala Thr
                455                 460                 465
Phe Val Thr Ala Thr Leu Tyr Trp Asp Thr Gly Ser Ser Asp Ile
                470                 475                 480
Asp Leu Tyr Leu Tyr Asp Pro Asn Gly Asn Glu Val Asp Tyr Ser
                485                 490                 495
Tyr Thr Ala Tyr Tyr Gly Phe Glu Lys Val Gly Tyr Tyr Asn Pro
                500                 505                 510
Thr Ala Gly Thr Trp Thr Val Lys Val Val Ser Tyr Lys Gly Ala
                515                 520                 525
Ala Asn Tyr Gln Val Asp Val Val Ser Asp Gly Ser Leu Ser Gln
                530                 535                 540
Ser Gly Gly Gly Asn Pro Asn Pro Asn Pro Asn Pro Asn Pro Thr
                545                 550                 555
Pro Thr Thr Asp Thr Gln Thr Phe Thr Gly Ser Val Asn Asp Tyr
                560                 565                 570
Trp Asp Thr Ser Asp Thr Phe Thr Met Asn Val Asn Ser Gly Ala
                575                 580                 585
Thr Lys Ile Thr Gly Asp Leu Thr Phe Asp Thr Ser Tyr Asn Asp
                590                 595                 600
Leu Asp Leu Tyr Leu Tyr Asp Pro Asn Gly Asn Leu Val Asp Arg
                605                 610                 615
Ser Thr Ser Ser Asn Ser Tyr Glu His Val Glu Tyr Ala Asn Pro
                620                 625                 630
Ala Pro Gly Thr Trp Thr Phe Leu Val Tyr Ala Tyr Ser Thr Tyr
                635                 640                 645
Gly Trp Ala Asp Tyr Gln Leu Lys Ala Val Val Tyr Tyr Gly
                650                 655
SEQ ID NO:13的资料:
      长度:28
      类型:核酸
      链型:单链
      拓扑结构:线性
分子类型:其它核酸(合成的DNA)
序列描述:
AGAGGGATCC ATGAAGGGGC TGAAAGCT                                           28
SEQ ID NO:14的资料:
      长度:28
      类型:核酸
      链型:单链
      拓扑结构:线性
分子类型:其它核酸(合成的DNA)
序列描述:
AGAGGCATGC GCTCTAGACT CTGGGAGAGT                                   28
SEQ ID NO:15的资料:
      长度:1962
      类型:核酸
      链型:双链
      拓扑结构:线性
分子类型:基因组DNA
原始来源:
      生物:激烈热球菌
      菌株:DSM 3638
序列描述:
ATGAAGGGGC TGAAAGCTCT CATATTAGTG ATTTTAGTTC TAGGTTTGGT AGTAGGGAGC     60
GTAGCGGCAG CTCCAGAGAA GAAAGTTGAA CAAGTAAGAA ATGTTGAGAA GAACTATGGT    120
CTGCTAACGC CAGGACTGTT CAGAAAAATT CAAAAATTGA ATCCTAACGA GGAAATCAGC     10
ACAGTAATTG TATTTGAAAA CCATAGGGAA AAAGAAATTG CAGTAAGAGT TCTTGAGTTA    240
ATGGGTGCAA AAGTTAGGTA TGTGTACCAT ATTATACCCG CAATAGCTGC CGATCTTAAG    300
GTTAGAGACT TACTAGTCAT CTCAGGTTTA ACAGGGGGTA AAGCTAAGCT TTCAGGTGTT    360
AGGTTTATCC AGGAAGACTA CAAAGTTACA GTTTCAGCAG AATTAGAAGG ACTGGATGAG    420
TCTGCAGCTC AAGTTATGGC AACTTACGTT TGGAACTTGG GATATGATGG TTCTGGAATC    480
ACAATAGGAA TAATTGACAC TGGAATTGAC GCTTCTCATC CAGATCTCCA AGGAAAAGTA    540
ATTGGGTGGG TAGATTTTGT CAATGGTAGG AGTTATCCAT ACGATGACCA TGGACATGGA    600
ACTCATGTAG CTTCAATAGC AGCTGGTACT GGAGCAGCAA GTAATGGCAA GTACAAGGGA    660
ATGGCTCCAG GAGCTAAGCT GGCGGGAATT AAGGTTCTAG GTGCCGATGG TTCTGGAAGC    720
ATATCTACTA TAATTAAGGG AGTTGAGTGG GCCGTTGATA ACAAAGATAA GTACGGAATT    780
AAGGTCATTA ATCTTTCTCT TGGTTCAAGC CAGAGCTCAG ATGGTACTGA CGCTCTAAGT    840
CAGGCTGTTA ATGCAGCGTG GGATGCTGGA TTAGTTGTTG TGGTTGCCGC TGGAAACAGT    900
GGACCTAACA AGTATACAAT CGGTTCTCCA GCAGCTGCAA GCAAAGTTAT TACAGTTGCA    960
GCCGTTGACA AGTATGATGT TATAACAAGC TTCTCAAGCA GAGGGCCAAC TGCAGACGGC   1020
AGGCTTAAGC CTGAGGTTGT TGCTCCAGGA AACTGGATAA TTGCTGCCAG AGCAAGTGGA   1080
ACTAGCATGG GTCAACCAAT TAATGACTAT TACACAGCAG CTCCTGGGAC ATCAATGGCA   1140
ACTCCTCACG TAGCTGGTAT TGCAGCCCTC TTGCTCCAAG CACACCCGAG CTGGACTCCA   1200
GACAAAGTAA AAACAGCCCT CATAGAAACT GCTGATATCG TAAAGCCAGA TGAAATAGCC   1260
GATATAGCCT ACGGTGCAGG TAGGGTTAAT GCATACAAGG CTATAAACTA CGATAACTAT   1320
GCAAAGCTAG TGTTCACTGG ATATGTTGCC AACAAAGGCA GCCAAACTCA CCAGTTCGTT   1380
ATTAGCGGAG CTTCGTTCGT AACTGCCACA TTATACTGGG ACAATGCCAA TAGCGACCTT   1440
GATCTTTACC TCTACGATCC CAATGGAAAC CAGGTTGACT ACTCTTACAC CGCCTACTAT   1500
GGATTCGAAA AGGTTGGTTA TTACAACCCA ACTGATGGAA CATGGACAAT TAAGGTTGTA     1560
AGCTACAGCG GAAGTGCAAA CTATCAAGTA GATGTGGTAA GTGATGGTTC CCTTTCACAG     1620
CCTGGAAGTT CACCATCTCC ACAACCAGAA CCAACAGTAG ACGCAAAGAC GTTCCAAGGA     1680
TCCGATCACT ACTACTATGA CAGGAGCGAC ACCTTTACAA TGACCGTTAA CTCTGGGGCT     1740
ACAAAGATTA CTGGAGACCT AGTGTTTGAC ACAAGCTACC ATGATCTTGA CCTTTACCTC     1800
TACGATCCTA ACCAGAAGCT TGTAGATAGA TCGGAGAGTC CCAACAGCTA CGAACACGTA     1860
GAATACTTAA CCCCCGCCCC AGGAACCTGG TACTTCCTAG TATATGCCTA CTACACTTAC     1920
GGTTGGGCTT ACTACGAGCT GACGGCTAAA GTTTATTATG GC                        1962
SEQ ID NO:16的资料:
      长度:654
      类型:氨基酸
      链型:单链
      拓扑结构:线性
分子类型:肽
序列描述:
Met Lys Gly Leu Lys Ala Leu Ile Leu Val Ile Leu Val Leu Gly
                  5                  10                  15
Ieu Val Val Gly Ser Val Ala Ala Ala Pro Glu Lys Lys Val Glu
                 20                  25                  30
Gln Val Arg Asn Val Glu Lys Asn Tyr Gly Leu Leu Thr Pro Gly
                 35                  40                  45
Leu Phe Arg Lys Ile Gln Lys Leu Asn Pro Asn Glu Glu Ile Ser
                 50                  55                  60
Thr Val Ile Val Phe Glu Asn His Arg Glu Lys Glu Ile Ala Val
                 65                  70                  75
Arg Val Leu Glu Leu Met Gly Ala Lys Val Arg Tyr Val Tyr His
                 80                  85                  90
Ile Ile Pro Ala Ile Ala Ala Asp Leu Lys Val Arg Asp Leu Leu
                 95                 100                 105
Val Ile Ser Gly Leu Thr Gly Gly Lys Ala Lys Leu Ser Gly Val
                110                 115                 120
Arg Phe Ile Gln Glu Asp Tyr Lys Val Thr Val Ser Ala Glu Leu
                125                 130                 135
Glu Gly Leu Asp Glu Ser Ala Ala Gln Val Met Ala Thr Tyr Val
                140                 145                 150
Trp Asn Leu Gly Tyr Asp Gly Ser Gly Ile Thr Ile Gly Ile Ile
                155                 160                 165
Asp Thr Gly Ile Asp Ala Ser His Pro Asp Leu Gln Gly Lys Val
                170                 175                 180
Ile Gly Trp Val Asp Phe Val Asn Gly Arg Ser Tyr Pro Tyr Asp
                185                 190                 195
Asp His Gly His Gly Thr His Val Ala Ser Ile Ala Ala Gly Thr
                200                 205                 210
Gly Ala Ala Ser Asn Gly Lys Tyr Lys Gly Met Ala Pro Gly Ala
                215                 220                 225
Lys Leu Ala Gly Ile Lys Val Leu Gly Ala Asp Gly Ser Gly Ser
                230                 235                 240
Ile Ser Thr Ile Ile Lys Gly Val Glu Trp Ala Val Asp Asn Lys
                245                 250                 255
Asp Lys Tyr Gly Ile Lys Val Ile Asn Leu Ser Leu Gly Ser Ser
                260                 265                 270
Gln Ser Ser Asp Gly Thr Asp Ala Leu Ser Gln Ala Val Asn Ala
                275                 280                 285
Ala Trp Asp Ala Gly Leu Val Val Val Val Ala Ala Gly Asn Ser
                290                 295                 300
Gly Pro Asn Lys Tyr Thr Ile Gly Ser Pro Ala Ala Ala Ser Lys
                305                 310                 315
Val Ile Thr Val Gly Ala Val Asp Lys Tyr Asp Val Ile Thr Ser
                320                 325                 330
Phe Ser Ser Arg Gly Pro Thr Ala Asp Gly Arg Leu Lys Pro Glu
                335                 340                 345
Val Val Ala Pro Gly Asn Trp Ile Ile Ala Ala Arg Ala Ser Gly
                350                 355                 360
Thr Ser Met Gly Gln Pro Ile Asn Asp Tyr Tyr Thr Ala Ala Pro
                365                 370                 375
Gly Thr Ser Met Ala Thr Pro His Val Ala Gly Ile Ala Ala Leu
                380                 385                 390
Leu Leu Gln Ala His Pro Ser Trp Thr Pro Asp Lys Val Lys Thr
                395                 400                 405
Ala Leu Ile Glu Thr Ala Asp Ile Val Lys Pro Asp Glu Ile Ala
                410                 415                 420
Asp Ile Ala Tyr Gly Ala Gly Arg Val Asn Ala Tyr Lys Ala Ile
                425                 430                 435
Asn Tyr Asp Asn Tyr Ala Lys Leu Val Phe Thr Gly Tyr Val Ala
                440                 445                 450
Asn Lys Gly Ser Gln Thr His Gln Phe Val Ile Ser Gly Ala Ser
                455                 460                 465
Phe Val Thr Ala Thr Leu Tyr Trp Asp Asn Ala Asn Ser Asp Leu
                470                 475                 480
Asp Leu Tyr Leu Tyr Asp Pro Asn Gly Asn Gln Val Asp Tyr Ser
                485                 490                 495
Tyr Thr Ala Tyr Tyr Gly Phe Glu Lys Val Gly Tyr Tyr Asn Pro
                500                 505                 510
Thr Asp Gly Thr Trp Thr Ile Lys Val Val Ser Tyr Ser Gly Ser
                515                 520                 525
Ala Asn Tyr Gln Val Asp Val Val Ser Asp Gly Ser Leu Ser Gln
                530                 535                 540
Pro Gly Ser Ser Pro Ser Pro Gln Pro Glu Pro Thr Val Asp Ala
                545                 550                 555
Lys Thr Phe Gln Gly Ser Asp His Tyr Tyr Tyr Asp Arg Ser Asp
                560                 565                 570
Thr Phe Thr Met Thr Val Asn Ser Gly Ala Thr Lys Ile Thr Gly
                575                 580                 585
Asp Leu Val Phe Asp Thr Ser Tyr His Asp Leu Asp Leu Tyr Leu
                590                 595                 600
Tyr Asp Pro Asn Gln Lys Leu Val Asp Arg Ser Glu Ser Pro Asn
                605                 610                 615
Ser Tyr Glu His Val Glu Tyr Leu Thr Pro Ala Pro Gly Thr Trp
                620                 625                 630
Tyr Phe Leu Val Tyr Ala Tyr Tyr Thr Tyr Gly Trp Ala Tyr Tyr
                635                 640                 645
Glu Leu Thr Ala Lys Val Tyr Tyr Gly
                650
SEQ ID NO:17的资料:
      长度:25
      类型:核酸
      链型:单链
      拓扑结构:线性
分子类型:其它核酸(合成的DNA)
序列描述:
TCTGAATTCG TTCTTTTCTG TATGG                                  25
SEQ ID NO:18的资料:
      长度:20
      类型:核酸
      链型:单链
      拓扑结构:线性
分子类型:其它核酸(合成的DNA)
序列描述:
TGTACTGCTG GATCCGGCAG                                        20
SEQ ID NO:19的资料:
      长度:25
      类型:核酸
      链型:单链
      拓扑结构:线性
分子类型:其它核酸(合成的DNA)
序列描述:
AGAGGCATGC GTATCCATCA GATTTTTGAG                                   30
SEQ ID NO:20的资料:
      长度:20
      类型:核酸
      链型:单链
      拓扑结构:线性
分子类型:其它核酸(合成的DNA)
序列描述:
AGTGAACGGA TACTTGGAAC                                    20
SEQ ID NO:21的资料:
      长度:20
      类型:核酸
      链型:单链
      拓扑结构:线性
分子类型:其它核酸(合成的DNA)
序列描述:
GTTCCAAGTA TCCGTTCACT                                                    20
SEQ ID NO:22的资料:
      长度:12
      类型:氨基酸
      链型:单链
      拓扑结构:线性
分子类型:肽
序列描述:
Ala Glu Leu Glu Gly Leu Asp Glu Ser Ala Ala Gln
                  5                  10
SEQ ID NO:23的资料:
      长度:24
      类型:核酸
      链型:单链
      拓扑结构:线性
分子类型:其它核酸(合成的DNA)
序列描述:
TCATGGATCC ACCCTCTCCT TTTA                                    24
SEQ ID NO:24的资料:
      长度:26
      类型:核酸
      链型:单链
      拓扑结构:线性
分子类型:其它核酸(合成的DNA)
序列描述:
GTCTGCGCAG GCTGCCGGAN NNNNNATGAA GGGGCTGAAA GCTCTC                    26
SEQ ID NO:25的资料:
      长度:29
      类型:核酸
      链型:单链
      拓扑结构:线性
分子类型:其它核酸(合成的DNA)
序列描述:
GAGAGCTTTC AGCCCCTTC TNNNNNNTCC GGCAGCCTGC GCAGACATG                29
SEQ ID NO:26的资料:
      长度:27
      类型:核酸
      链型:单链
      拓扑结构:线性
分子类型:其它核酸(合成的DNA)
序列描述:
AGAGGGGGAT CCGTGAGAAG CAAAAAA                                   27
SEQ ID NO:27的资料:
      长度:20
      类型:核酸
      链型:单链
      拓扑结构:线性
分子类型:其它核酸(合成的DNA)
序列描述:
GATGACAGT AAGTCTCTAA                                           20
SEQ ID NO:28的资料:
      长度:20
      类型:核酸
      链型:单链
      拓扑结构:线性
分子类型:其它核酸(合成的DNA)
序列描述:
AAGCCTGAGG TTGTTGCTCC                                   20
SEQ ID NO:29的资料:
      长度:29
      类型:核酸
      链型:单链
      拓扑结构:线性
分子类型:其它核酸(合成的DNA)
序列描述:
GGGCATGCTC ATGAACTTCC AGGCTGTGA                                         29

Claims (8)

1.一种由如下氨基酸序列组成并具有热稳定蛋白酶活性的蛋白酶,在该氨基酸序列中,一个或多个氨基酸残基从由序列表SEQ ID NO:4表示的氨基酸序列的C-末端缺失,其中所述蛋白酶含有由SEQ ID NO:1表示的氨基酸序列。
2.根据权利要求1的蛋白酶,它由序列表SEQ ID NO:1表示的氨基酸序列组成。
3.一种由如下氨基酸序列组成并具有热稳定蛋白酶活性的蛋白酶,在该氨基酸序列中,一至几个氨基酸残基被缺失、替换、插入或添加到由序列表SEQ ID NO:1表示的氨基酸序列中。
4.一种编码由如下氨基酸序列组成并具有热稳定蛋白酶活性的蛋白的基因,在该氨基酸序列中,从序列表SEQ ID NO:4表示的氨基酸序列的C-末端缺失一个或多个氨基酸残基,其中所述蛋白酶含有由SEQ ID NO:1表示的氨基酸序列。
5.根据权利要求4的蛋白酶基因,它编码由序列表SEQ ID NO:1表示的氨基酸序列。
6.根据权利要求5的蛋白酶基因,它由序列表SEQ ID NO:2表示的碱基序列组成。
7.一种编码由如下氨基酸序列组成并具有热稳定蛋白酶活性的蛋白的蛋白酶基因,在该氨基酸序列中,由序列表SEQ ID NO:1表示的氨基酸序列缺失、替换、插入或添加一个至几个氨基酸残基。
8.一种与根据权利要求6的蛋白酶基因在严格条件下杂交且编码具有热稳定蛋白酶活性的蛋白的蛋白酶基因。
CNB988059908A 1997-06-10 1998-06-04 表达超热稳定蛋白酶的系统 Expired - Fee Related CN1190494C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP15196997 1997-06-10
JP151969/1997 1997-06-10

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CNB200410101968XA Division CN1311075C (zh) 1997-06-10 1998-06-04 表达超热稳定蛋白的系统

Publications (2)

Publication Number Publication Date
CN1260002A CN1260002A (zh) 2000-07-12
CN1190494C true CN1190494C (zh) 2005-02-23

Family

ID=15530186

Family Applications (2)

Application Number Title Priority Date Filing Date
CNB200410101968XA Expired - Fee Related CN1311075C (zh) 1997-06-10 1998-06-04 表达超热稳定蛋白的系统
CNB988059908A Expired - Fee Related CN1190494C (zh) 1997-06-10 1998-06-04 表达超热稳定蛋白酶的系统

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CNB200410101968XA Expired - Fee Related CN1311075C (zh) 1997-06-10 1998-06-04 表达超热稳定蛋白的系统

Country Status (10)

Country Link
US (3) US6358726B1 (zh)
EP (1) EP0994191B1 (zh)
JP (1) JP3601835B2 (zh)
KR (1) KR100530598B1 (zh)
CN (2) CN1311075C (zh)
AT (1) ATE318913T1 (zh)
AU (1) AU7550098A (zh)
DE (1) DE69833652T2 (zh)
TW (1) TW530088B (zh)
WO (1) WO1998056926A1 (zh)

Families Citing this family (64)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU3455000A (en) * 1999-04-07 2000-11-14 Takara Shuzo Co., Ltd. Composition for decomposing protein
EP1990412A3 (en) 2001-03-14 2009-02-25 Takara Bio, Inc. Promoters
EP1578935A2 (en) * 2002-10-10 2005-09-28 Diversa Corporation Proteases, nucleic acids encoding them and methods for making and using them
DE10315640A1 (de) * 2003-04-04 2004-10-14 Ignatov, Konstantin Verfahren zur kontrollierten Freisetzung von Komponenten in eine Lösung
JP4880452B2 (ja) * 2003-06-19 2012-02-22 ノボザイムス アクティーゼルスカブ プロテアーゼ
GB2416352B (en) * 2004-07-21 2009-01-28 Bioline Ltd A method for performing the hot start of enzymatic reactions
EP2097519A2 (en) * 2006-12-21 2009-09-09 Danisco US, INC., Genencor Division Compositions and uses for an alpha-amylase polypeptide of bacillus species 195
DK2319921T3 (en) * 2008-07-31 2016-06-27 Univ Osaka New protease and use of this
AU2009307423B2 (en) * 2008-10-21 2014-05-08 Km Biologics Co., Ltd. Process for producing protein capable of forming inclusion body
US9617527B2 (en) 2010-04-14 2017-04-11 Novozymes A/S Polypeptides having glucoamylase activity and polynucleotides encoding same
EP2654567B1 (en) 2010-12-22 2018-04-04 Novozymes North America, Inc. Process for producing fermentation products from starch containing materials
WO2013055676A1 (en) 2011-10-11 2013-04-18 Novozymes North America, Inc. Processes for producing fermentation products
WO2013068309A1 (en) * 2011-11-08 2013-05-16 Novozymes A/S Methods for production of archeae protease in yeast
CN107267558A (zh) * 2011-12-02 2017-10-20 诺维信公司 用于制造发酵产物的方法
ES2935920T3 (es) 2012-03-30 2023-03-13 Novozymes North America Inc Procesos de elaboración de productos de fermentación
BR112015012968A2 (pt) 2012-12-07 2017-09-12 Danisco Us Inc composições e métodos de uso
DK2929022T3 (en) * 2012-12-07 2017-02-13 Danisco Us Inc COMPOSITIONS AND METHODS OF USE
US11939552B2 (en) 2013-06-24 2024-03-26 Novozymes A/S Process of recovering oil
CA2915063C (en) 2013-06-24 2023-08-15 Novozymes A/S Process of extracting oil from thin stillage
EP3013962B1 (en) * 2013-06-25 2018-10-10 Novozymes A/S Expression of natively secreted polypeptides without signal peptide
WO2015007639A1 (en) 2013-07-17 2015-01-22 Novozymes A/S Pullulanase chimeras and polynucleotides encoding same
CA2923934C (en) 2013-09-11 2023-09-26 Novozymes A/S Processes for producing fermentation products
WO2015110473A2 (en) 2014-01-22 2015-07-30 Novozymes A/S Pullulanase variants and polynucleotides encoding same
WO2015200659A1 (en) 2014-06-25 2015-12-30 Novozymes A/S Xylanase variants and polynucleotides encoding same
AR102419A1 (es) 2014-10-23 2017-03-01 Novozymes As Variantes de glucoamilasa y polinucleótidos que las codifican
WO2016087327A1 (en) 2014-12-01 2016-06-09 Novozymes A/S Polypeptides having pullulanase activity comprising the x25, x45 and cbm41 domains
US10308963B2 (en) 2015-02-27 2019-06-04 Novozymes A/S Processes of producing ethanol using a fermenting organism
CA2981342A1 (en) 2015-06-18 2016-12-22 Novozymes A/S Polypeptides having trehalase activity and the use thereof in process of producing fermentation products
WO2017015329A1 (en) 2015-07-23 2017-01-26 Novozymes A/S Alpha-amylase variants and polynucleotides encoding same
EP3362574B1 (en) 2015-10-14 2021-07-07 Novozymes A/S Glucoamylase variants and polynucleotides encoding same
US20190010470A1 (en) 2015-12-22 2019-01-10 Novozymes A/S Processes for producing fermentation products
EP3526336A1 (en) 2016-10-17 2019-08-21 Novozymes A/S Methods of reducing foam during ethanol fermentation
WO2018098381A1 (en) 2016-11-23 2018-05-31 Novozymes A/S Improved yeast for ethanol production
BR112019020772A2 (pt) 2017-04-03 2020-04-28 Novozymes As processo de recuperação
EP3610027A1 (en) 2017-04-11 2020-02-19 Novozymes A/S Glucoamylase variants and polynucleotides encoding same
EP3609631A1 (en) * 2017-04-14 2020-02-19 Novozymes A/S Processes for solubilizing municipal solid waste with enzyme compositions comprising protease and enzyme compositions thereof
BR112019025391A2 (pt) 2017-06-02 2020-07-07 Novozymes A/S levedura melhorada para a produção de etanol
MX2019014889A (es) 2017-06-28 2020-02-13 Novozymes As Polipeptidos que tienen actividad trehalasa y polinucleotidos que los codifican.
WO2019030165A1 (en) 2017-08-08 2019-02-14 Novozymes A/S POLYPEPTIDES HAVING TREHALASE ACTIVITY AND THEIR USE IN A PRODUCTION PROCESS OF FERMENTATION PRODUCTS
CA3070730A1 (en) 2017-09-15 2019-03-21 Novozymes A/S Enzyme blends and processes for improving the nutritional quality of animal feed
EP3701037A1 (en) 2017-10-23 2020-09-02 Novozymes A/S Processes for reducing lactic acid in a biofuel fermentation system
BR112020011278A2 (pt) 2017-12-08 2020-11-17 Novozymes A/S variante de alfa-amilase, composição, polinucleotídeo, construto de ácido nucleico, vetor de expressão, célula hospedeira, métodos para produção de uma variante de alfa-amilase e para aumento da estabilidade de uma alfa-amilase genitora, uso da variante, e, processo para produção de um xarope a partir de material contendo amido
WO2019113415A1 (en) 2017-12-08 2019-06-13 Novozymes A/S Alpha-amylase variants and polynucleotides encoding same
MX2020007914A (es) 2018-01-29 2020-10-28 Novozymes As Microorganismos con uso de nitrogeno mejorado para produccion de etanol.
EP3752626A1 (en) 2018-02-15 2020-12-23 Novozymes A/S Improved yeast for ethanol production
EP3775191A1 (en) 2018-04-09 2021-02-17 Novozymes A/S Polypeptides having alpha-amylase activity and polynucleotides encoding same
WO2019231944A2 (en) 2018-05-31 2019-12-05 Novozymes A/S Processes for enhancing yeast growth and productivity
CA3104881A1 (en) 2018-07-11 2020-01-16 Novozymes A/S Processes for producing fermentation products
CN112601818A (zh) 2018-07-25 2021-04-02 诺维信公司 用于生产乙醇的表达酶的酵母
BR112021006692A2 (pt) 2018-10-08 2021-08-10 Novozymes A/S levedura expressando enzimas para produção de etanol
CN113302294A (zh) 2019-01-31 2021-08-24 诺维信公司 具有木聚糖酶活性的多肽及其用于改善动物饲料营养质量的用途
BR112021018137A2 (pt) 2019-03-18 2022-01-25 Novozymes As Pululanase variante, variante, polinucleotídeo, construto de ácido nucleico ou vetor de expressão, célula hospedeira recombinante, composição, métodos de produção de uma pululanase variante e de produção de um mosto de cerveja, processos de produção de um xarope e de produção de produtos de fermentação, e, uso da célula hospedeira e da pululanase variante
WO2020206058A1 (en) 2019-04-02 2020-10-08 Novozymes A/S Process for producing a fermentation product
EP4004029A1 (en) 2019-07-26 2022-06-01 Novozymes A/S Microorganisms with improved nitrogen transport for ethanol production
WO2021026201A1 (en) 2019-08-05 2021-02-11 Novozymes A/S Enzyme blends and processes for producing a high protein feed ingredient from a whole stillage byproduct
CN114127124A (zh) 2019-08-06 2022-03-01 诺维信公司 用于提高酶表达的融合蛋白
EP4031661A1 (en) 2019-09-16 2022-07-27 Novozymes A/S Polypeptides having beta-glucanase activity and polynucleotides encoding same
AU2020402990A1 (en) 2019-12-10 2022-06-09 Novozymes A/S Microorganism for improved pentose fermentation
AR120775A1 (es) 2019-12-16 2022-03-16 Novozymes As Procesos para obtener productos de fermentación
WO2021163030A2 (en) 2020-02-10 2021-08-19 Novozymes A/S Polypeptides having alpha-amylase activity and polynucleotides encoding same
US20230142991A1 (en) 2020-02-10 2023-05-11 Novozymes A/S Alpha-amylase variants and polynucleotides encoding same
CN111876435A (zh) * 2020-07-31 2020-11-03 山东大学 一种海洋嗜热胶原蛋白酶a69及其编码基因与应用
CN116438309A (zh) 2020-11-02 2023-07-14 诺维信公司 葡糖淀粉酶变体和编码它们的多核苷酸
CN117795089A (zh) 2021-06-07 2024-03-29 诺维信公司 用于改善的乙醇发酵的工程化微生物

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IT1228925B (it) * 1987-08-07 1991-07-10 Eniricerche Spa Procedimento per la preparazione dell'ormone della crescita umano
US5756339A (en) * 1994-06-13 1998-05-26 Takara Shuzo Co., Ltd. Hyperthermostable protease gene
US6261822B1 (en) * 1995-12-12 2001-07-17 Takara Shuzo Co., Ltd. Ultrathermostable protease genes

Also Published As

Publication number Publication date
CN1657614A (zh) 2005-08-24
EP0994191A1 (en) 2000-04-19
ATE318913T1 (de) 2006-03-15
EP0994191A4 (en) 2003-04-23
WO1998056926A1 (fr) 1998-12-17
US20050084934A1 (en) 2005-04-21
KR100530598B1 (ko) 2005-11-23
TW530088B (en) 2003-05-01
DE69833652T2 (de) 2006-09-21
US7144719B2 (en) 2006-12-05
KR20010013540A (ko) 2001-02-26
US6358726B1 (en) 2002-03-19
JP3601835B2 (ja) 2004-12-15
CN1260002A (zh) 2000-07-12
DE69833652D1 (de) 2006-04-27
AU7550098A (en) 1998-12-30
EP0994191B1 (en) 2006-03-01
CN1311075C (zh) 2007-04-18
US20020132335A1 (en) 2002-09-19
US6783970B2 (en) 2004-08-31

Similar Documents

Publication Publication Date Title
CN1190494C (zh) 表达超热稳定蛋白酶的系统
CN1262639C (zh) 新的宿主细胞和生产蛋白质的方法
CN1263859C (zh) 具有蛋白酶活性的多肽的编码核酸
CN1231595C (zh) 通过分子伴侣的共分泌制备天然折叠的和分泌的蛋白质的方法
CN1250722C (zh) 分泌生产蛋白质的方法
CN1233287A (zh) 选定生物体的人工启动子文库和得自这种文库的启动子
CN1513057A (zh) 宿主微生物
CN1151252C (zh) 生产微生物转谷氨酰胺酶的方法
CN1198939C (zh) 来自绿色木霉的纤维素酶cbh1基因的调控序列以及利用该序列的蛋白质或多肽的大量生产体系
CN1759180A (zh) 微生物转谷氨酰胺酶的生产方法
CN1189188A (zh) 超耐热蛋白酶基因
CN1160465C (zh) 其中areA、pepC和/或pepE基因已被灭活的真菌
CN1269838C (zh) 用于由大肠杆菌向培养基中分泌来制备Leu-水蛭素的信号序列
CN1875106A (zh) 重组微生物
CN1592785A (zh) 酵母中来自Tritirachium album的重组蛋白酶K的表达
CN1264860C (zh) 在遗传载体上表面展示蛋白的方法
CN1153831C (zh) 编码神经酰胺糖内切酶激活物的基因
CN1930289A (zh) 变异芽孢杆菌属细菌
CN1086737C (zh) 超热稳定蛋白酶基因
CN1125181C (zh) 在酵母细胞中表达n-末端延伸蛋白质的载体
CN1250726C (zh) 耐热性核糖核酸酶h
CN1214105C (zh) Map激酶磷酸酶突变体
CN1213402A (zh) 表层蛋白的重组表达
CN1610740A (zh) 具有改变产物产量特性的真细菌rna聚合酶突变体
CN1279714A (zh) 环氧化物水解酶

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: TAKARA BIO INC.

Free format text: FORMER OWNER: BAO HOLDINGS LIMITED

Effective date: 20040910

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20040910

Address after: The Japanese city of Tianjin

Applicant after: Takara Bio Inc.

Address before: Kyoto City

Applicant before: Takara Holdings Inc.

C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20050223

Termination date: 20140604