CN101010424A - 生产异源蛋白酶的改进方法 - Google Patents

生产异源蛋白酶的改进方法 Download PDF

Info

Publication number
CN101010424A
CN101010424A CNA2005800282859A CN200580028285A CN101010424A CN 101010424 A CN101010424 A CN 101010424A CN A2005800282859 A CNA2005800282859 A CN A2005800282859A CN 200580028285 A CN200580028285 A CN 200580028285A CN 101010424 A CN101010424 A CN 101010424A
Authority
CN
China
Prior art keywords
gly
ala
val
thr
ser
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2005800282859A
Other languages
English (en)
Inventor
斯蒂恩·T·乔根森
尼尔斯·班克
莫根斯·沃普尔曼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Novo Nordisk AS
Original Assignee
Novo Nordisk AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novo Nordisk AS filed Critical Novo Nordisk AS
Publication of CN101010424A publication Critical patent/CN101010424A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins

Abstract

本发明提供在革兰氏阳性表达宿主细胞中生产S2A(或S1E)蛋白酶的改进方法,该方法包括以下步骤:(a)以补料分批发酵将包含至少一种编码异源S2A/S1E蛋白酶的多核苷酸的革兰氏阳性细胞在有益于生产蛋白酶的条件下进行培养,其中所述培养过程的至少20%发生在36.5℃以下的温度下;和(b)回收所述蛋白酶。

Description

生产异源蛋白酶的改进方法
发明领域
许多微生物来源的相关蛋白酶特别难于以工业相关的产量进行生产,它们可能倾向于各种类型的降解和/或不稳定性。本发明提供了在革兰氏阳性表达宿主细胞中生产S2A(或S1E)蛋白酶的改进方法。
背景
具有蛋白酶活性的多肽,或蛋白酶,有时也称作肽酶,蛋白质酶,肽水解酶,或蛋白水解酶。蛋白酶可以是外切型的,其在肽的两端上起始水解肽,或是内切型的,其在多肽链中内部起作用(内肽酶)。内肽酶显示对于N-和C-末端封闭的肽底物的活性,所述底物对于所研究蛋白酶的特异性相关。
蛋白酶是水解肽键的酶。它包括属于EC3.4酶族的任何酶(包括其十三种亚类中的每一种)。EC编号指来自NC-IUBMB的酶命名法(EnzymeNomenclature)1992,Academic Press,San Diego,California,Eur.J.Biochem.1994,223,1-5的公开出版的增刊1-5;Eur.J.Biochem.1995,232,1-6;Eur.J.Biochem.1996,237,1-5;Eur.J.Biochem.1997,250,1-6;和Eur.J.Biochem.1999,264,610-650。该命名法有规律地进行补充和升级;见例如国际互联网于 http://www.chem.qmw.ac.uk/iubmb/enzyme/index.html上。
基于它们的催化机制将蛋白酶分入下列各组:丝氨酸蛋白酶(S),半胱氨酸蛋白酶(C),天冬蛋白酶(A),金属蛋白酶(M),和未知的,或尚未分类的蛋白酶(U),见Handbook of Proteolytic Enzymes,A.J.Barrett,N.D.Rawlings,J.F.Woessner(eds),Academic Press(1998),特别是在综合介绍部分。
丝氨酸蛋白酶是普遍存在的,发现于病毒,细菌和真核生物中;它们包括外肽酶,内肽酶,寡肽酶和omega-肽酶活性。已经鉴定了超过20个家族(表示为S1-S27)的丝氨酸蛋白酶,基于结构相似性和功能证据,这些分成6个集群,表示为SA,SB,SC,SE,SF,和SG(Barrett等人1998.Handbook ofproteolytic enzymes)。对于至少四种所述集群来说结构是已知的(SA,SB,SC和SE),这些看起来完全不相关,提示丝氨酸肽酶的至少四种进化起源。α-裂解性内肽酶属于胰凝乳蛋白酶(chymotrypisin)(SA)集群(clan),其中它们被指定为S2家族(S2A)的A亚族。
蛋白水解酶的另一种分类系统是基于序列信息,并且因此在分子生物学领域更加常用;它在Rawlings,N.D.等人,2002,MEROPS:蛋白酶数据库.Nucleic Acids Res.30:343-346中得以描述。MEROPS数据库可以在http://www.merops.ac.uk上通过电子手段自由获得。根据MEROPS系统,在′The Handbook of Proteolytic Enzymes′中分类为S2A的蛋白水解酶,在MEROPS中被分类为′S1E′蛋白酶(Rawlings ND,Barrett AJ.(1993)Evolutionary families of peptidases,Biochem.J.290:205-218)。
许多源自各种拟诺卡氏菌属(Nocardiopsis)物种的工业上感兴趣的S2A/S1E蛋白酶难以在优选的工业化革兰氏阳性表达宿主细胞中通过重组生产进行大量生产。对于酶工业来说甚至这种蛋白质生产产量的递增的改善也是令人高度感兴趣的。本发明提供了在革兰氏阳性宿主细胞中生产S2A/S1E蛋白酶的改进方法,其带来较高的产量。
发明概述
本发明人发现降低发酵温度,对于发酵整个过程(时间(duration))或在发酵的部分中,低于革兰氏阳性微生物工业发酵通常所采用的37℃,导致显著的产量提高。
因此,在第一方面,本发明涉及在革兰氏阳性宿主细胞中生产异源S2A/S1E蛋白酶的方法,该方法包括以下步骤:
(a)以补料分批发酵将包含至少一个编码异源S2A/S1E蛋白酶的多核苷酸的革兰氏阳性细胞在有益于生产蛋白酶的条件下进行培养,其中所述培养过程的至少20%发生在低于36.5℃的温度下;和
(b)回收所述蛋白酶。
定义
根据本发明可以采用本领域技能之内的常规分子生物学,微生物,和重组DNA技术。这些技术在文献中得以充分解释。见,例如,Sambrook,Fritsch & Maniatis,Molecular Cloning:A Laboratory Manual,Second Edition(1989) Cold Spring Harbor Laboratory Press,Cold Spring Harbor,New York(herein“Sambrook等人,1989”)DNA Cloning:A Practical Approach,Volumes Iand II/D.N.Glover ed.1985);OligoNucleotide Synthesis(M.J.Gait ed.1984);核酸 杂交(B.D.Hames & S.J.Higgins eds(1985));Transcription AndTranslation(B.D.Hames & S.J.Higgins,eds.(1984));AnimalCell Culture(R.I.Freshney,ed.(1986));Immobilized Cell And Enzymes(IRL Press,(1986));B.Perbal,A Practical Guide To Molecular Cloning(1984)。
“多肽”是从5’向3’末端阅读的脱氧核糖核苷酸或核糖核苷酸的单链或双链多聚体。多核苷酸包括RNA和DNA,可以分离自天然来源,在体外合成,或由天然和合成性分子的组合而制备。
“核酸分子”或“核苷酸序列”指单链形式,或双链螺旋的核糖核苷(腺嘌呤核苷,鸟嘌呤核苷,尿嘧啶核苷或胞嘧啶核苷;“RNA分子”)或脱氧核糖核苷(脱氧腺嘌呤核苷,脱氧鸟嘌呤核苷,脱氧胸腺嘧啶核苷或脱氧胞嘧啶核苷;“DNA分子”)的磷酸酯聚合形式。双链DNA-DNA,DNA-RNA和RNA-RNA螺旋是可能的。术语核酸分子,特别是DNA或RNA分子,仅仅指分子的一级和二级结构,并不将它限制到任何特定的三级或四级形式。因而,这一术语包括特别是在线性或环状DNA分子(例如,限制性片段),质粒,和染色体中发现的双链DNA等。在讨论特定双链DNA分子的结构时,本文可以根据正常的惯例,即只给出DNA非转录链5’到3’方向上的序列(即,具有与mRNA同源的序列的链)。“重组DNA分子”是已经进行过分子生物学操作的DNA分子。
当核酸分子的单链形式能够在合适的温度和溶液离子强度条件下退火到其它核酸分子上时,核酸分子与另一个核酸分子“可杂交”(hybridizable),如cDNA,基因组DNA,或RNA(见Sambrook等人,同上)。温度和溶液离子强度条件决定了杂交的“严格性”。
为了本发明的目的,杂交表示核苷酸序列在极低到极高严格性条件下杂交到标记的多核苷酸探针上,所述探针与SEQ ID NO’s:3,5,9,13,17,19,21,23,25,27,29,31,33,35,37,或39中显示的核苷酸序列杂交。在这些条件下多核苷酸探针杂交的分子可以通过X线胶片或通过本领域已知的任何其它方法来检测。不论何时在本文中使用术语“多核苷酸探针”要理解这种探针包含至少15个核苷酸。
在一个令人感兴趣的实施方案中,多核苷酸探针是SEQ ID NO’s:3,5,9,13,17,19,21,23,25,27,29,31,33,35,37,或39其中之一的至少15个核苷酸的片段的互补链。在另一个令人感兴趣的实施方案中,多核苷酸探针是编码SEQ ID NO’s:2,12,14,16,18,20,22,24,或26的多肽的任何核苷酸序列的互补链的至少15个核苷酸的片段。在另一个令人感兴趣的实施方案中,多核苷酸探针是SEQ ID NO’s:3,5,9,13,17,19,21,23,25,27,29,31,33,35,37,或39的互补链。在又一个令人感兴趣的实施方案中,多核苷酸探针是SEQ ID NO’s:3,5,9,13,17,19,21,23,25,27,29,31,33,35,37,或39的成熟多肽编码区的互补链。
对于至少100个核苷酸长的长探针,极低到极高严格性的条件被定义为按照标准的Southern印迹操作,在42℃于5X SSPE,1.0%SDS,5XDenhardt’s溶液,100微克/ml经剪切和变性的鲑鱼精DNA中预杂交和杂交。优选地,至少100个核苷酸的长探针并不包含大于1000个核苷酸。对于至少100个核苷酸长的长探针,最后用2×SSC,0.1%SDS于42℃(极低严格性)将载体材料洗涤三次每次15分钟,优选用0.5×SSC,0.1%SDS于42℃(低严格性)将载体材料洗涤三次每次15分钟,更加优选用0.2×SSC,0.1%SDS于42℃(中等严格性)洗涤三次每次15分钟,还要更加优选用0.2×SSC,0.1%SDS于55℃(中等-高度严格性)洗涤三次每次15分钟,最优选用0.1×SSC,0.1%SDS于60℃(高度严格性)洗涤三次每次15分钟,特别是用0.1×SSC,0.1%SDS于68℃(极高度严格性)洗涤三次每次15分钟。
尽管并不特别优选,预期还可以使用较短的探针,例如长度为从大约15到99个核苷酸的探针,如从大约15到大约70个核苷酸。对于这些短探针,严格性条件被定义为按照标准的DNA印迹操作,在低于利用Bolton andMcCarthy(1962,Proceedings of the National Academy of Sciences USA48:1390)的计算而计算出的Tm5℃到10℃的温度下于0.9M NaCl,0.09MTris-HCl pH7.6,6mM EDTA,0.5%NP-40,1X Denhardt’s溶液,1mM焦磷酸钠,1mM磷酸二氢钠,0.1mM ATP,和0.2mg酶母RNA/ml中进行预杂交,杂交,和杂交后洗涤。
对于长度为大约15个核苷酸到99个核苷酸的短探针,在6X SCC加0.1%SDS中将载体材料洗涤一次15分钟并且利用6X SSC在低于计算的Tm5℃到10℃的温度下洗涤两次每次15分钟。
DNA“编码序列”或“开放阅读框(ORF)”是双链DNA序列,当被置于合适的调控序列下时,其在细胞中体外或体内被转录并被翻译为多肽。通过在5’(氨基)末端的起始密码子和在3’(羧基)末端上的翻译终止密码子来确定编码序列的边界。编码序列可以包括,但不限于,原核生物序列,来自真核生物mRNA的cDNA,来自真核生物(例如,哺乳动物)DNA的基因组DNA序列,甚至是合成性的DNA序列。如果欲将编码序列用于在真核细胞中表达,通常会将多腺苷信号和转录终止序列定位于编码序列的3’。
“表达载体”是线性或环状的DNA分子,其包含编码目标多肽的片段,所述片段可操作性地连接到提供其转录的其它片段上。这种其它的片段可以包括启动子和终止子序列,和任选的一个或多个复制起点,一个或多个可选择的标记,增强子,多腺苷化信号,等等。表达载体一般源自质粒或病毒DNA,或可以包含二者的元件。
转录和翻译控制序列是DNA调控序列,如启动子,增强子,终止子,等等,其提供宿主细胞中编码序列的表达。在真核细胞中,多腺苷化信号是控制序列。
“分泌信号序列”是编码多肽(“分泌性肽”)的DNA序列,其作为较大多肽的组分,导引较大多肽通过合成它的细胞的分泌途径。在通过分泌途径转运的过程中较大的多肽通常被切割以去除所述分泌性肽。对于本发明的目的来说优选的分泌信号是SEQ ID NO:2中所示的信号序列。
术语“启动子”对于其技术领域认可的意义是用来表示包含DNA序列的基因的部分,所述DNA序列提供RNA聚合酶的结合和转录的起始。启动子序列一般,但不总是在基因的5’非编码区中发现。
如果基因编码的多肽不再能够以功能性形式表达则染色体基因成为非功能性的。这种基因的非功能性可以由本领域已知的许多遗传操作进行诱导,其中一些在Sambrook等人(见上)中得以描述。如突变一样,在基因的ORF内的部分缺失经常将会致使基因成为非功能性的。
“可操作性连接的”,当提到DNA片段时,表示所述片段是这样排列的,即使得它们对于其所希望的目的而一致地起作用,例如转录在启动子中起始并穿过编码片段继续进行到终止子。
当RNA聚合酶将编码序列转录成mRNA时编码序列在细胞中的转录和翻译控制序列“控制之下”,其随后被trans-RNA剪切并翻译成由编码序列编码的蛋白质。
“异源”DNA指并非天然定位于细胞中,或在细胞染色体位点中的DNA。优选地,异源DNA包括所述细胞外来的基因。
本文所用的术语“核酸构建体”意欲表示cDNA,基因组DNA,合成性DNA或RNA起源的任何核酸分子。术语″构建体″意欲表示可以是单链或双链的核酸片段,并且其可以基于完全或部分天然发生的核苷酸序列,所述核苷酸序列编码目标多肽。所述构建体可以任选地包含其它核酸片段。
编码本发明的多肽的本发明的核酸构建体可以适当地为基因组或cDNA起源的,例如通过制备基因组或cDNA文库和筛选编码多肽的全部或部分的DNA获得的核苷酸构建体,所述筛选是通过根据标准技术利用合成性寡核苷酸探针的杂交进行的(cf.Sambrook等人,同上)。
编码本发明的多肽的本发明的核酸构建体可以适当地为基因组或cDNA起源的,例如通过制备基因组或cDNA文库并且通过杂交筛选编码全部或部分多肽的DNA序列而获得,所述杂交是按照标准技术(参见Sambrook等,同上)利用合成性寡核苷酸探针进行的。
编码本发明的多肽的本发明的核酸构建体还可以通过确立的标准方法,例如由Beaucage and Caruthers,Tetrahedron Letters 22(1981),1859-1869所述的phosphoamidite方法,或由Matthes等人,EMBO Journal 3(1984),801-805所述的方法而合成性地进行制备。根据phosphoamidite方法,例如在自动DNA合成仪中合成寡核苷酸,进行纯化,退火,连接并克隆在合适的载体中。
另外,核酸构建体可以是根据标准技术,通过连接合成性,基因组或cDNA起源(根据合适的)的片段而制备的混合的合成性和基因组,混合的合成性和cDNA或混合的基因组和cDNA起源的,所述片段对应于完整核酸构建体的各部分。还可以通过例如在US 4,683,202或Saiki等人,Science239(1988),487-491中所述的利用特异性引物进行的聚合酶链式反应而制备的核酸构建体。
当核酸构建体包含本发明的编码序列表达所必需的控制序列时,术语核酸构建体可以与术语“表达盒”同义。
术语“控制序列”在这里被定义为包括对于核酸序列的编码序列的表达所必需或有益的所有组分。每种控制序列都可以是对于编码多肽的核酸序列天然的或外来的。这些控制序列包括,但不限于,前导序列,多腺苷化序列,前肽序列,启动子,信号序列,和转录终止子。至少,所述控制序列包括启动子,和转录和翻译终止信号。为了导入有助于控制序列与编码多肽的核酸序列编码区的连接的特异性限制位点的目的,可以用接头来提供控制序列。
控制序列可以是合适的启动子序列,即被宿主细胞识别的核酸序列,以便核酸序列的表达。启动子序列包含介导多肽表达的转录和翻译控制序列。启动子可以是在选定宿主细胞中显示转录活性的任何核酸序列并且可以获自编码对于宿主细胞同源或异源的细胞外或细胞内多肽的基因。
控制序列还可以是合适的转录终止子序列,即被宿主细胞识别以终止转录的序列。终止子序列可操作性地连接到编码多肽的核酸序列的3’末端。在选定宿主细胞中起作用的任何终止子都可以用于本发明。
控制序列还可以是多腺苷化序列,即可操作性地连接到核酸序列的3’末端的序列,并且当其转录时,被宿主细胞作为信号识别以便向转录的mRNA中添加多腺苷残基。在选定宿主细胞中起作用的任何多腺苷化序列都可以用于本发明。
控制序列还可以是信号肽编码区,其编码连接到多肽氨基末端上的氨基酸序列,它能够导引表达的多肽进入宿主细胞的细胞分泌途径。核酸序列的编码序列的5’端可以固有地包含在翻译阅读框中与编码区片段天然相连接的信号肽编码区,所述编码区编码分泌的多肽。或者,编码序列的5’端可以包含信号肽编码区,所述信号肽编码区对于编码分泌多肽的编码序列部分来说是外源的。当编码序列未正常地包含信号肽编码区时,外源的信号肽编码区可能是必需的。或者,外源信号肽编码区可以简单地替换天然信号肽编码区以便相对于正常情况下与编码序列关联的天然信号肽编码区而获得增强的外蛋白(exo protein)的分泌。信号肽编码区可以获自来自曲霉属(Aspergillus)物种的葡糖淀粉酶或淀粉酶基因,来自根毛霉属(Rhizomucor)物种的脂酶或蛋白质酶基因,来自酿酒酵母(Saccharomycescerevisiae)的α-因子基因,来自芽孢杆菌属(Bacillus)物种的淀粉酶或蛋白酶基因,或小牛前凝乳酶原(preprochymosin)基因。不过,任何能够将表达多肽导引入选定宿主细胞的分泌途径中的信号肽编码区都可以用于本发明中。
控制序列还可以是前肽编码区,其编码位于多肽氨基末端上的氨基酸序列。得到的多肽称为前酶或前多肽(或在一些情况中称为酶原)。前多肽一般是无活性的并且能够由前多肽上进行前肽的催化或自身催化剪切而转变成成熟活性多肽。前肽编码区可以获自枯草芽孢杆菌(Bacillus subtilis)碱性蛋白酶基因(aprE),枯草芽孢杆菌中性蛋白酶基因(nprT),酿酒酵母α-因子基因,或Myceliophthora thermophilum漆酶基因(WO 95/33836)。
可能还需要添加调控序列,其允许相对于宿主细胞的生长调控多肽的表达。调控系统的例子是引起基因表达反应于化学或物理刺激而开启或闭合的那些,所述刺激包括调控性化合物的存在。在原核系统中的调控系统将包括lac,tac,和trp操纵基因系统。
用于指导本发明的特别是在细菌性宿主细胞中的基因转录的合适启动子的例子,是获自大肠杆菌(E.coli)lac操纵子,天蓝色链霉菌(Streptomyces coelicolor)琼脂酶基因(dagA),枯草芽孢杆菌果聚糖蔗糖酶基因(sacB),枯草芽孢杆菌碱性蛋白酶基因,地衣芽孢杆菌(Bacilluslicheniformis)α-淀粉酶基因(amyL),嗜热脂肪芽孢杆菌(Bacillusstearothermophilus)产麦芽糖(maltogenic)淀粉酶基因(amyM),解淀粉芽孢杆菌(Bacillus amyloliquefaciens)α-淀粉酶基因(amyQ),解淀粉芽孢杆菌BAN淀粉酶基因,地衣芽孢杆菌青霉素酶基因(penP),枯草芽孢杆菌xylA和xylB基因,和原核性β-内酰胺酶基因的启动子(Villa-Kamaroff等人,1978,Proceedings of the National Academy of Sciences USA 75:3727-3731),以及tac启动子(DeBoer等人,1983,Proceedings of the National Academy ofSciences USA 80:21-25)。其它的启动子描述在″Useful proteins fromrecombinant bacteria″in Scientific American,1980,242:74-94;和在Sambrook等人,1989,同上中。
对于细菌性宿主细胞有效的信号肽编码区是获自来自芽孢杆菌属NCIB 11837的产麦芽糖淀粉酶基因,嗜热脂肪芽孢杆菌α-淀粉酶基因,地衣芽孢杆菌枯草杆菌蛋白酶基因,地衣芽孢杆菌β-内酰胺酶基因,嗜热脂肪芽孢杆菌中性蛋白酶基因(nprT,nprS,nprM),和枯草芽孢杆菌PrsA基因的信号肽编码区。其它信号肽由Simonen和Palva,1993,MicrobiologicalReviews 57:109-137所描述。
本发明还涉及包含本发明的核酸序列,启动子,转录和翻译终止信号的重组表达载体。可以将上述各种核酸和控制序列连接在一起以产生重组表达载体,其可以包括一个或多个便利的限制性位点以便允许在这些位点上插入或取代编码多肽的核酸序列。或者,可以通过将核酸序列或包含所述序列的核酸构建体插入到合适的表达载体中来表达本发明的核酸序列。在生成表达载体的过程中,将编码序列定位于载体中从而使得编码序列与合适的控制序列可操作性地连接以便进行表达,和可能性的分泌。
重组表达载体可以是任何能够便利地进行重组DNA操作并且能够带来核酸序列的表达的载体(例如,质粒或病毒)。载体的选择一般将依赖于载体与载体要导入的宿主细胞的相容性。载体可以是线性的或闭合环状的质粒。载体可以是自主复制性载体,即作为染色体外实体存在的载体,它的复制独立于染色体复制,例如,质粒,染色体外元件,小染色体,或人工染色体。载体可以包含确保自身复制的任何手段。或者,载体可以是当导入宿主细胞中时整合到基因组中并与其整合入的染色体一起复制的载体。载体系统可以是单载体或质粒或两个或多个载体或质粒,其在一起包含要导入宿主细胞基因组的总DNA,或转座子。
本发明的载体优选包含一种或多种可选择的标记,其使得可以轻易选择转化的细胞。可选择的标记是这样一种基因,其产物提供了杀虫剂或病毒抗性,对于重金属的抗性,对于营养缺陷型的原养型,等等。
抗生素可选择标记赋予对于诸如氨苄青霉素,卡那霉素,氯霉素,四环素,新霉素,潮霉素或氨甲蝶呤的抗生素的抗性。对于酵母宿主细胞的合适标记是ADE2,HIS3,LEU2,LYS2,MET3,TRP1,和URA3。
本发明的载体优选地包含允许载体,或载体的较小部分稳定整合入宿主细胞基因组中,或载体在细胞中独立于细胞基因组的自主复制的元件。
当导入宿主细胞中时,载体,或载体的较小部分如本发明的扩增单位,可以整合入宿主细胞基因组中。对于染色体整合来说,载体可以依赖于编码多肽的核酸序列或任何其它载体元件,以便通过同源或异源重组将载体稳定整合入基因组中。
或者,载体可以包含其它核酸序列用于通过同源重组入宿主细胞的基因组中来指导整合。所述其它核酸序列能够使得载体在染色体中的准确位置上整合入宿主细胞基因组中。为了提高在准确位置上整合的可能性,整合元件应当优选地包含足够数目的核酸,如100到1,500个碱基对,优选400到1,500个碱基对,最优选800到1,500个碱基对,其与对应的靶序列高度同源以便提高同源重组的可能性。整合元件可以是与宿主细胞基因组中靶序列同源的任何序列。而且,整合元件可以是非编码性或编码性核酸序列;适于通过同源重组的位点特异性整合的具体例子在WO 02/00907(Novozymes,丹麦)中给出,特此将其全部并入作为参考。
另一方面,可以通过非同源性重组将载体整合入宿主细胞的基因组中。这些核酸序列可以是与宿主细胞的基因组中靶序列同源的任何序列,而且,可以是非编码性或编码性序列。载体,表达盒,扩增单位,基因或事实上任何定义的核苷酸序列的拷贝数是在任何时间存在于宿主细胞中的相同拷贝的数目。基因或另一个定义的染色体核苷酸序列可以一个,两个,或多个拷贝存在于染色体上。自主复制性载体可以一个,或几百个拷贝/宿主细胞存在。
本发明的扩增单位是能够整合入宿主细胞染色体中的核苷酸序列,其后它可以通过多次复制而增加染色体整合拷贝数目。该单位包含本文所定义的表达盒,其包含至少一个拷贝的目标基因和如本文所定义的宿主细胞的染色体基因的可表达拷贝。当扩增单位整合入宿主细胞的染色体中时,它被定义为染色体的特定区域,其倾向于在DNA的两个直接重复区域之间通过同源重组进行复制。因而对扩增单位相对于侧翼DNA的精确边界作功能性限定,因为复制过程事实上可以根据重复区域内重组的精确位点复制DNA的部分,其可以被导入染色体中以及内源性染色体本身的部分中。这种原理在Janniére等人(1985,Stable gene amplification in the chromosome ofBacillus subtilis.Gene,40:47-55)得以阐明,将其并入本文作为参考。
对于自主复制,载体可以进一步包含复制的起点,其使得载体能够在所研究的宿主细胞中自主复制。细菌复制起点的例子是质粒pBR322,pUC19,pACYC177,pACYC184,pUB110,pE194,pTA1060,和pAMbetal的复制起点。用于酵母宿主细胞中的复制起点的例子是复制的2micron起点,CEN6和ARS4的组合,和CEN3与ARS1的组合。复制起点可以是具有这样一种突变的起点,所述突变使得作用在宿主细胞中对于温度敏感(见,例如,Ehrlich,1978,Proceedings of the National Academy of Sciences USA 75:1433)。
本发明还涉及包含本发明的核酸序列的重组宿主细胞,其有利地用于多肽的重组生产中。术语″宿主细胞″包括亲本细胞的任何后代,其由于复制期间发生的突变与亲本细胞并不相同。
优选用包含本发明的核酸序列的载体来转化细胞,随后将载体整合入宿主染色体中。“转化”意指将包含本发明的核酸序列的载体导入宿主细胞中从而使得载体作为染色体整合部分或作为自身复制性的染色体外载体而维持。整合一般被认为是有利的,因为核酸序列更有可能稳定地维持在细胞中。载体整合入宿主染色体内可以通过如上所述的同源或非同源性重组而发生。
细菌宿主细胞的转化可以,例如,通过原生质体转化(参见,例如,Chang和Cohen,1979,Molecular General Genetics 168:111-115)、通过利用感受态的细胞(参见,例如,Young和Spizizin,1961,细菌学杂志,81:823-829,或Dubnar和Davidoff-Abelson,1971,Journal of Molecular Biology,56:209-221)、通过电穿孔(参见,例如,Shigekawa和Dower,1988,Biotechniques,6:742-751),或通过结合(conjugation)(参见,例如,Koehler和Thorne,1987,Journal of Bacteriology,169:5771-5278)起作用。
在允许表达所需多肽的条件下将上述经转化或转染的宿主细胞培养在合适的营养培养基中,其后从细胞,或培养肉汤(culture broth)中回收得到的多肽。
用来培养细胞的培养基可以是合适于生长宿主细胞的任何常规培养基,如包含合适添加剂的基本或复合培养基。合适的培养基可获自商业供应商或可以根据公布的制作法来制备(例如在美国典型培养物保藏中心的目录中)。利用本领域已知的方法来制备培养基(见,例如,细菌和酵母的参考文献;Bennett,J.W.和LaSure,L.,editors,More Gene Manipulations inFungi,Academic Press,CA,1991)。
根据所研究多肽的类型,通过常规方法,包括通过离心或过滤从培养基中分离宿主细胞,通过盐例如硫酸铵的方式沉淀上清液或过滤物的蛋白质组分,通过多种层析方法,例如离子交换层析,凝胶过滤层析,亲和层析,等等,来回收多肽。
可以利用本领域已知的对于多肽特异性的方法来检测所述多肽。这些检测方法可以包括使用特异性抗体,形成酶产物,或酶底物的消失。例如,可以利用酶测定试验测定多肽的活性。
可以通过本领域已知的多种方法来纯化本发明的多肽,包括,但不限于,层析(例如,离子交换,亲和,疏水,层析聚焦,和大小排阻),电泳方法(例如,制备型等电聚焦(IEF),差异溶解性(例如,硫酸铵沉淀),或提取(见,例如,Protein Purification,J.-C.Janson and Lars Ryden,editors,VCH Publishers,NewYork,1989)。
在本文中,术语“基本上纯的多肽”意指这样的多肽制品,其包含至多10%重量的其它多肽物质,它与所述其它多肽物质天然关联(优选更低百分比的其它多肽物质,例如至多8%重量,至多6%重量,至多5%重量,至多4%至多3%重量,至多2%重量,至多1%重量,和至多%重量)。因而,优选基本上纯的多肽为至少92%纯,即多肽由存在于制品中的至少92%重量比的总多肽物质组成,优选更高的百分比,如至少94%纯,至少95%纯,至少96%纯,至少96%纯,至少97%纯,至少98%纯,至少99%,和至多99.5%纯。本文公开的多肽优选是基本上纯的形式。特别地,优选本文公开的多肽是“基本上纯的形式”(essentially pure form),即多肽制品基本上不含它天然关联的其它多肽物质。这可以,例如,通过公知的重组方法来制备多肽而实现。这里,术语“基本上纯的多肽”与术语“分离的多肽”和“分离形式的多肽”同义。
在本文中,两种氨基酸序列或两种核苷酸序列之间的同源性通过参数“同一性”来描述。为了本发明的目的,可以使用完全Smith-Waterman比对来进行序列的比对和同源性分值的计算,所述比对可用于蛋白质和DNA比对。对于蛋白质和DNA比对分别使用默认的计分矩阵BLOSUM50和同一性矩阵。对于缺口(gap)中第一残基的罚分,蛋白质为-12而DNA为-16,而对于缺口中的其它残基的罚分,蛋白质为-2而DNA为-4。可以用FASTA包v20u6版(W.R.Pearson和D.J.Lipman(1988),″Improved Tools forBiological Sequence Analysis″,PNAS 85:2444-2448,和W.R.Pearson(1990)″Rapid and Sensitive Sequence Comparison with FASTP and FASTA″,Methods in Enzymology,183:63-98)来进行比对。
可以利用“ClustalW”(Thompson,J.D.,Higgins,D.G and Gibson,T.J.(1994)CLUSTAL W:improving the sensitvity of progressive multiple sequencealignment through sequence weighting,positions-specific gap penalties andweight matrix choice.Nucleic Acids Research,22:4673-4680)进行蛋白质序列的多重比对。可以利用蛋白质比对作为模板进行DNA序列的比对,用来自DNA序列的相应密码子来替换氨基酸。
在本文中,术语“等位基因变体”表示出现在相同染色体位置上基因的两个或多个选择性形式。等位基因变异通过突变天然出现,并且可以导致种群内的多态性。基因突变可以是沉默的(编码的多肽没有改变)或可以编码具有变化氨基酸序列的多肽。多肽的等位基因变体是由基因等位变体编码的多肽。等位基因变体包括在本文的功能性同源物的定义中。
S2A/S1E蛋白酶或其功能性同源物可以是由天然来源鉴定和分离的野生型蛋白质。这种野生型蛋白酶可以通过本领域已知的标准技术进行特异性筛选。另外,编码S2A/S1E蛋白酶,或其功能性同源物的基因,可以通过DNA改组技术来制备,如在J.E.Ness等人Nature Biotechnology 17,893-896(1999)中所述。而且,S2A/S1E蛋白酶,或其功能性同源物,可以是人工变体。这种人工变体可以通过本领域已知的标准技术来构建,如通过定点/随机突变。在本发明的一个实施方案中,氨基酸变化(在人工变体以及在野生型多肽中)是性质改变最小的,其是不显著影响蛋白质的折叠和/或活性的保守性氨基酸取代;小的缺失,一般为一个到大约30个氨基酸;小的氨基或羧基末端延伸,如氨基末端蛋氨酸残基;高达大约20-25个残基的小接头肽;或小的延伸,其通过改变静电或另一种功能,如多组氨酸通道(tract),抗原表位或结合结构域而有利于纯化。
保守性置换的实例限于碱性氨基酸(如精氨酸、赖氨酸和组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、极性氨基酸(谷氨酰胺和天冬酰胺)、疏水氨基酸(亮氨酸、异亮氨酸、缬氨酸和蛋氨酸)、芳香氨基酸(苯丙氨酸、色氨酸和酪氨酸),和小氨基酸(甘氨酸、丙氨酸、丝氨酸和苏氨酸)。通常不改变特异性活性的氨酸酸取代是本领域已知的并且由,例如H.Neurath和R.L.Hill,1979,In,The Proteins,Academic Press,New York所描述。最常发生的交换是Ala/Ser,Val/Ile,Asp/Glu,Thr/Ser,Ala/Gly,Ala/Thr,Ser/Asn,Ala/Val,Ser/Gly,Tyr/Phe,Ala/Pro,Iys/Arg,Asp/Asn,Leu/Ile,Leu/Val,Ala/Glu,和Asp/Gly以及逆向的这些。
对本领域技术人员而言显然可以在分子的关键功能区域之外进行这样的取代而仍可得到有活性的多肽。由本发明的核苷酸序列编码的多肽活性所必需的,和因此优选不进行修饰,如取代的氨基酸残基,可以按照诸如定点突为或丙氨酸扫描突变(alanine-scanning mutagenesis)的本领域已知的方法来确定(见,例如,Cunningham和Wells,1989,Science 244:1080-1085)。在后一种技术中,在分子中每一带正电的残基上均引入突变,测定所得的突变分子的活性从而确定对于分子活性关键的氨基酸残基。底物-酶相互作用的位点也可以通过诸如核磁共振分析、结晶学或光亲和标记(photoaffinitylabelling)等技术确定的三维结构的分析来确定(见,例如,de Vos等人,1992,Science 225:306-316;Smith等人,1992,Journal of Molecular Biology224:899-904;Wlodaver等人,1992,FEBSLetters 309:59-64)。
另外,编码本发明的多肽的核苷酸序列可以通过导入核苷酸取代而进行修饰,所述取代不会给出由所述核苷酸序列编码的多肽的另一种氨基酸序列,但其对应于欲生产酶的宿主生物的密码子用法。
向核苷酸序列中导入突变以便将一个核苷酸交换另一个核苷酸可以通过利用本领域已知的任何方法进行定点突变来实现。特别有用的是这样的方法,其利用超螺旋,带有目标插入片段的双链DNA载体和两条包含所需突变的合成性引物。分别与载体相反链互补的寡核苷酸引物,在使用PfuDNA聚合酶的温度循环期间延伸。在引物并入后,生成包含错列缺口(staggered nicks)的突变质粒。在温度循环后,用特异于甲基化和半甲基化DNA的DpnI处理产物以消化亲本DNA模板并选择包含突变的合成DNA。还可以使用本领域已知的其它方法。对核苷酸取代的一般性描述参见,例如,Ford等人,1991,Protein Expression and Purification 2:95-107。
详述
在特定的实施方案中,本发明的以及根据本发明使用的蛋白质选自:
(a)属于EC 3.4.-.-酶组的蛋白酶;
(b)属于以上手册的S组的丝氨酸蛋白酶;
(c1)肽酶家族S2A的丝氨酸蛋白酶;
(c2)在Biochem.J.290:205-218(1993)和在MEROPS蛋白酶数据库,版本(release)6.20,2003年3月24日,(www.merops.ac.uk)中描述的肽酶家族S1E的丝氨酸蛋白酶。该数据库描述于Rawlings,N.D.,O′Brien,E.A.&Barrett,A.J.(2002)MEROPS:the protease database.Nucleic Acids Res.30,343-346。
为了确定给定的蛋白酶是否是丝氨酸蛋白酶,和S2A家族蛋白酶,参考上面的手册和其中指出的原理。这种确定能够对于所有类型的蛋白酶来实施,它是天然发生的或野生型蛋白酶;或经过遗传工程设计的或合成性的蛋白酶。
蛋白酶活性可以利用任何测定法来进行测量,其中采用底物,其包括所研究蛋白酶特异性相关的肽键。测定-pH和测定-温度同样适合于所研究的蛋白酶。测定-pH-值的例子是pH 2,3,4,5,6,7,8,9,10,11,或12。测定-温度的例子是30,35,37,40,45,50,55,60,65,70,80,90,或95℃。
蛋白酶底物的例子是酪蛋白,如Azurine-交联的酪蛋白(AZCL-酪蛋白)。为了本发明的目的,优选利用PNA测定来测量S2A蛋白酶活性,如果不另外提及,所述PNA测定以琥珀酰-丙氨酸-丙氨酸-脯氨酸-苯丙氨酸-paranitroanilide作为底物。PNA测定的原理描述于Rothgeb,T.M.,Goodlander,B.D.,Garrison,PH.,和Smith,L.A.,Journal of the American Oil Chemists′Society,Vol.65(5)pp.806-810(1988)。
对于本发明的蛋白酶起源和/或根据本发明的应用没有限制。因而,术语蛋白酶不仅包括获自任何属的微生物的天然或野生型蛋白酶,还包括其显示蛋白酶活性的任何突变体,变异体,片段等,以及合成性蛋白酶,如改组(shuffled)蛋白酶,和共有(consensus)蛋白酶。这种经遗传设计的蛋白酶可以如本领域已知的,例如通过定点突变,通过PCR(在PCR反应中利用包含所需突变的PCR片段作为引物之一),或通过随机突变来制备。共有蛋白酶的制备描述于例如EP 897985中。
在具体的实施方案中,蛋白酶是低变应原性变体,当暴露于动物,包括人时,指定引起减弱的免疫反应。术语免疫反应要被理解为暴露于蛋白酶的动物的免疫系统的任何反应。一种类型的免疫反应是导致暴露动物中IgE水平提高的变态反应。低变应原性(allergenic)变体可以利用本领域已知的技术来制备。例如蛋白酶可以与聚合物部位屏蔽部分或参与免疫反应的蛋白酶的表位结合。与聚合物结合可以包括聚合物与蛋白酶体外化学偶联,例如在WO 96/17929,WO 98/30682,WO 98/35026,和/或WO 99/00489中所描述的。结合可以另外或备选地包括聚合物与蛋白酶的体内偶联。这种结合可以通过编码蛋白酶的核苷酸序列的遗传工程设计,在蛋白酶中插入编码其它糖基化作用位点的共有序列和在能够糖基化所述蛋白酶的宿主中表达该蛋白酶来实现,见例如WO 00/26354。另外一种提供低变应原性变体的方式是编码蛋白酶的核苷酸序列的遗传工程设计以便引起蛋白酶自身寡聚化,招致蛋白酶单体可能屏蔽其它蛋白酶单体的表位并且由此降低寡聚物的抗原性。这些产物及其制品描述于例如WO 96/16177中。参与免疫反应的表位可以通过各种方法如在WO 00/26230和WO 01/83559中描述的噬菌体展示法,或在EP 561907中描述的随机方法来鉴定。一旦鉴定了表位,就可以通过已知的基因操作技术如定点突变(见例如WO 00/26230,WO00/26354和/或WO 00/22103)改变它的氨基酸序列以产生蛋白酶改变的免疫学特性和/或在离聚合物表位足够近的地方进行聚合物的结合以屏蔽该表位。
在上面的概述中详述了本发明的第一方面,但是,它涉及通过使用包含至少一种编码至少一种S2A或S1E蛋白酶的多核苷酸的革兰氏阳性宿主细胞来生产异源S2A/S1E蛋白酶的方法,其中在至少一种多核苷酸的编码部分中密码子用法对应于芽孢杆菌属细胞中的平均密码子用法,并且其中通过用代替物替换富含G/C的密码子来调节G/C含量,同时维持接近于细胞的平均密码子用法。
可以使用来自WO 02/29113中公布的地衣芽孢杆菌ATCC 14580的序列信息来生成本文列出的对于在地衣芽孢杆菌中表达适合的密码用法表,将WO 02/29113并入本文作为参考。
对于在枯草芽孢杆菌中异源序列的增强表达,接近基于枯草芽孢杆菌染色体序列的密码子用法可能是有益的,所述用法是公众可以获得的(Kunst,F,等人,The Complete Genome Sequence of the Gram-positive...,1997,Nature,390,pp:249-256)。
密码子用法表可以基于(1)用于所有开放阅读框中的密码子,(2)选定的开放阅读框,(3)开放阅读框的片段,或(4)选定开放阅读框的片段,优选编码被编码多肽的N-末端氨基酸的片段,更加优选至少20个最开始的N-末端氨基酸。
可以对于每种氨基酸用最优选的密码子;对于每种氨基酸用多种共同的密码子;或用在选择表中发现的相同或相似的密码子用法统计学平均频率来设计合成性基因。
合成性基因可以利用任何方法,如定点突变或PCR生成的突变根据本领域已知的方法进行构建。尽管,在理论上,修饰可以在体内进行,即,直接在表达待修饰核苷酸序列的细胞上进行,但优选在体外进行修饰。
利用本文所述的方法通过将合成性基因可操作地连接到一种或多种控制序列上而进一步修饰合成性基因,所述控制序列在与控制序列相容的条件下指导编码序列在合适宿主细胞中的表达。利用本文所述的方法也可以制备包含所述合成性基因的核酸构建体,重组表达载体,和重组宿主细胞。
在下列实施例中通过同源重组将所有表达的基因整合在芽孢杆菌属宿主细胞基因组上。在三联体启动子系统(如WO 99/43835中所述)的控制之下表达基因,所述三联体启动子系统由来自地衣芽孢杆菌α-淀粉酶基因(amyL),解淀粉芽孢杆菌α-淀粉酶基因(amyQ),和包括稳定序列的苏云金芽孢杆菌(Bacillus thuringiensis)cryIIIA启动子的启动子组成。将编码氯霉素乙酰基转移酶的基因用作标记。(描述在例如,Diderichsen,B.;Poulsen,G.B.;Joergensen,S.T.;A useful cloning vector for Bacillus subtilis.Plasmid 30:312(1993)中)。
本发明的第一方面涉及在革兰氏阳性宿主细胞中生产异源S2A/S1E蛋白酶的方法,该方法包括以下步骤:
(a)在有益于蛋白酶生产的条件下于补料分批发酵(fed-batchfermentation)中培养包含至少一种编码异源S2A/S1E蛋白酶的多核苷酸的革兰氏阳性细胞,其中至少20%,更加优选至少50%的所述培养步骤过程发生在36.5℃以下的温度;优选在低于36℃以下的温度;更加优选在35℃以下的温度,还要更加优选在33℃以下的温度,或最优选在31℃以下的温度;和
(b)回收蛋白酶。
本发明人发现这样在某种程度上是有益的,即如果本发明方法中的培养步骤在通常的37℃被“kick-started持续bried时期,直到革兰氏阳性宿主细胞活跃生长,因此它们降低了剩余发酵的温度以实现提高的S2A/S1E蛋白酶产量。这种温度转换策略的非限制性例子在下面的实施例部分提供。
因此,优选的实施方案涉及本发明的方法,其中所述培养步骤过程(duration)的开始的(first)50%或更少发生于31℃以上的温度;优选所述培养步骤过程的开始40%或更少;更加优选开始30%或更少;或最优选所述培养步骤过程的开始20%或更少发生于31℃以上的温度;优选于33℃以上的温度;更加优选于35℃以上的温度;或最优选于36℃以上的温度。
在优选的实施方案中革兰氏阳性细胞为芽孢杆菌属细胞,优选选自嗜碱性芽孢杆菌(Bacillus alkalophilus),解淀粉芽孢杆菌,短芽孢杆菌(Bacillus brevis),环状芽孢杆菌(Bacillus circulans),Bacillus clausii,凝结芽孢杆菌(Bacillus coagulans),灿烂芽孢杆菌(Bacillus lautus),迟缓芽孢杆菌(Bacillus lentus),地衣芽孢杆菌,巨大芽孢杆菌(Bacillus megaterium),嗜热脂肪芽孢杆菌,枯草芽孢杆菌,和苏云金芽孢杆菌(Bacillusthuringiensis)。
本文在SEQ ID NO’s:3,35,37,和39中提供了编码S2A/S1E蛋白酶的第一方面的四种具体的合成性多核苷酸。
因此,优选的实施方案涉及本发明的多核苷酸,其包含与SEQ ID NO’s:3,35,37,或39的577-1140位置中所示核苷酸序列具有至少70%,75%,80%,优选85%,更加优选90%,还要更加优选95%,更加优选97%,更加优选98%,还要更加优选99%,和最优选99.5%同一性的核苷酸序列。
另一个优选的实施方案涉及本发明的多核苷酸,其包含与SEQ ID NO:3的位置577-1140中;SEQ ID NO:5的位置526-1089中;SEQ ID NO:9的位置508-1083中;SEQ ID NO:13的位置519一1085中;SEQ ID NO:17的位置568-1143中;SEQ ID NO:19的位置574-1149中;SEQ ID NO:21的位置574-1149中;SEQ ID NO:23的位置586-1152中;SEQ ID NO:25的位置5 86-1149中;SEQ ID NO:27的位置586-1152中;SEQ ID NO:29的位置502-1065中;SEQ ID NO:31的位置496-1059中;SEQ ID NO:33的位置499-1062中;SEQ ID NO:35的位置577-1140中;SEQ ID NO:37的位置577-1140中;或SEQ ID NO:39的位置577-1140中所示的核苷酸序列具有至少70%,75%,80%,优选85%,更加优选90%,还要更加优选95%,更加优选97%,更加优选98%,还要更加优选99%,和最优选99.5%同一性的核苷酸序列。
在SEQ ID NO’s:4,6,10,14,18,20,22,24,26,28,30,32,和34中提供本发明的优选的S2A/S1E蛋白酶。所以,优选的S2A/S1E蛋白酶包含与SEQ ID NO’s:4,6,10,14,18,20,22,24,26,28,30,32,或34中所示多肽的成熟部分的氨基酸序列具有至少70%,75%,80%,优选85%,更加优选90%,还要更加优选95%,更加优选97%,更加优选98%,还要更加优选99%,和最优选99.5%同一性的氨基酸序列。
本发明的其它优选S2A或S1E蛋白酶源自一种或多种选自拟诺卡氏菌属(Nocardiopsis)sp.NRRL 18262,达松维尔拟诺卡氏菌(Nocardiopsisdassonvillei)subsp.dassonvillei DSM 43235,Nocardiopsis Alba DSM 15647,Nocardiopsis prasina DSM 15648,Nocardiopsis prasina DSM 15649,Nocardiopsis prasina(早先为alba)DSM 14010,拟诺卡氏菌属sp.DSM16424,Nocardiopsis alkaliphila DSM 44657,和卢森坦类诺卡氏菌(Nocardiopsis lucentensis)DSM 44048的拟诺卡氏菌属物种。
如上所述,地衣芽孢杆菌和枯草芽孢杆菌的基因组序列对于本发明人来说是可获得的,并且它们都用于构建密码子用法数据。
在优选的实施方案中,在本发明的至少一种编码性多核苷酸中的密码子用法对应于芽孢杆菌属细胞中的平均密码子用法,优选地衣芽孢杆菌或枯草芽孢杆菌细胞,更加优选地衣芽孢杆菌ATCC 14580细胞。
优选的实施方案涉及本发明的多核苷酸,其中密码子用法对应于编码一种或多种革兰氏阳性杆菌属细胞内源性分泌多肽的一种或多种多核苷酸中的平均密码子用法;优选对应于编码一种或多种芽孢杆菌属细胞内源性分泌多肽的一种或多种多核苷酸的至少最初的(first)5个,优选10个,更加优选15个,还要更加优选20个,和最优选至少开始25个密码子三联体;优选编码十种或更多芽孢杆菌属细胞内源性分泌多肽的十种或更多种多核苷酸中的密码子三联体中的平均密码子用法。
生物材料的保藏
下列生物材料已经由DSMZ(Deutsche Sammlung von Mikroorganismenund Zellkulturen GmbH,Mascheroder Weg 1b,D-38124 Braunschweig,Germany)按照布达佩斯条约进行了保藏,给出下列编号:
保藏物                               编号                 保藏日期
拟诺卡氏菌属sp.                      DSM16424             2004-05-24
Nocardiopsis prasina                 DSM15649             2003-05-30
Nocardiopsis prasina(早先为alba)     DSM14010             2001-01-20
该菌株于下述条件下保藏:确保在本专利申请未决期间,由专利与商标委员依据37C.F.R.§1.14和35u.S.C.§122授权的人能够获得该培养物。该保藏物为所保藏菌株的基本上纯的培养物。在提交了该申请的副本,或其后续文本的国家,依据该外国专利法律的要求,可以获得该保藏物。然而,应当理解,保藏物的获得并不构成对实施本发明的许可,实施本发明是对政府行为所授予的专利权的侵犯。
菌株DSM 15649于2001分离自丹麦的土壤样品中。
公众可由DSMZ获得下列菌株:
达松维尔拟诺卡氏菌达松维尔亚种(subsp.dassonvillei) DSM 43235
Nocardiopsis alkaliphila   DSM 44657
Nocardiopsis lucentensis   DSM 44048
达松维尔拟诺卡氏菌达松维尔亚种菌株DSM 43235还在其它保藏机构中保藏如下:ATCC 23219,IMRU 1250,NCTC 10489。
本文所描述和要求保护的发明并不限于由本文公开的具体实施方案的范围,因为这些实施方案意欲作为本发明几个方面的说明。任何等同的实施方案都将在本发明的范围之内。事实上,除了本文所显示和描述的那些之外,由在前描述对于本领域技术人员来说本发明的各种改进将是显而易见的。这些改进也将落入随附的权利要求的范围之内。在出现抵触的情况下,以包括定义的本说明书公开调控。
本文所描述和要求保护的发明并不限于由本文公开的具体实施方案的范围,包括下列实施例,因为这些实施方案意欲作为本发明几个方面的说明。任何等同的实施方案都将在本发明的范围之内。事实上,除了本文所显示和描述的那些之外,由在前描述对于本领域技术人员来说本发明的各种改进将是显而易见的。这些改进也将落入随附的权利要求的范围之内。在出现抵触的情况下,以包括定义的本说明书的公开来调控。
本文引用了多种参考文献,将其全部内容并入作为参考。
实施例
实施例1
菌株的构建
使用的菌株:枯草芽孢杆菌MB 1053(WO200395658)
使用的培养基:TY:(如在Ausubel,F.M.等人(eds.)“Current protocolsin Molecular Biology”.John Wiley and Sons,1995中所述)。
通过同源重组将所有表达基因整合在枯草芽孢杆菌MB1053宿主细胞基因组上(WO200395658)。所述基因在三联体启动子系统的控制之下表达(如在WO 99/43835中所述的),所述三联体启动子系统由来自地衣芽孢杆菌α-淀粉酶基因(amyL),解淀粉芽孢杆菌α-淀粉酶基因(amyQ),和包括稳定序列的苏云金芽孢杆菌cryIIIA启动子的启动子组成。将编码氯霉素乙酰基转移酶的基因用作标记(描述在例如,Diderichsen,B.;Poulsen,GB.;Joergensen,S.T.;A useful cloning vector for Bacillus subtilis.Plasmid 30:312(1993)中)。
枯草芽孢杆菌菌株Sav-10RS,Sav-L2,Sav-L1和Sav-L3的构建
由拟诺卡氏菌属sp.NRRL 18262(WO 01/58276)构建编码S2A(或S1E)蛋白酶的合成性10R基因(10RS),称作10R。通过框内PCR将这种合成性基因与编码来自SAVINASETM的信号肽(显示于SEQ ID NO:2中)的DNA(显示于SEQ ID NO:1中)融合,产生编码序列Sav-10RS,其显示于SEQID NO:3中,所述SAVINASETM是源自Bacillus clausii的公知性商业蛋白酶(Novozymes,丹麦)。将融合序列整合入枯草芽孢杆菌宿主细胞中并将得到的菌株称作Sav-10RS。
用编码来自达松维尔类诺卡菌达松维尔亚种DSM 43235的S1E蛋白酶的前体形式的DNA,表示为L2,制备类似的枯草芽孢杆菌菌株,所述L2通过框内PCR融合到编码来自SAVINASETM(Novozymes)的信号肽的DNA上,得到的菌株称作枯草芽孢杆菌Sav-L2。包括融合了前体成熟L2蛋白酶编码区的部分Savinase信号的DNA序列显示在SEQ ID NO:5中,用引物1423(SEQ ID NO:7)和1475(SEQ ID NO:8)进行扩增。
1423(SEQ ID NO:7):gcttttagttcatcgatcgcatcggctgctccggcccccgtcccccag
1475(SEQ ID NO:8):ggagcggattgaacatgcgattaggtccggatcctgacaccccag
用编码来自达松维尔类诺卡菌达松维尔亚种DSM43235的S1E蛋白酶的前体形式的DNA,表示为L1,制备枯草芽孢杆菌菌株,所述L1通过框内PCR融合到编码来自SAVINASETM(Novozymes,丹麦)的信号肽的DNA上,得到的菌株称作枯草芽孢杆菌Sav-L1。包括融合了前体成熟L1蛋白酶编码区的部分Savinase信号的DNA序列显示在SEQ ID NO:9中,用引物1485(SEQ ID NO:11)和1424(SEQ ID NO:12)进行扩增。
1485(SEQ ID NO:11):ggagcggatgaacatgcgattactaaccggtcaccagggacagc
1424(SEQ ID NO:12):ggagcggatgaacatgcgattactaaccggtcaccagggacagc
用编码来自拟诺卡氏菌属菌种DSM16424的S1E蛋白酶的前体形式的DNA,表示为L3,制备枯草芽孢杆菌菌株,所述L3通过框内PCR融合到编码来自SAVINASETM(Novozymes,丹麦)的信号肽的DNA上,得到的菌株称作枯草芽孢杆菌Sav-L3。包括融合了前体成熟L3蛋白酶编码区的部分Savinase信号的DNA序列显示在SEQ ID NO:13中,用引物1718(SEQID NO:15)和1720(SEQ ID NO:16)进行扩增。
1718(SEQ ID NO:15):agttcatcgatcgcatcggctgcgcccggccccgtcccccag
1720(SEQ ID NO:16):ggagcggattgaacatgcgatcagctggtgcggatgcgaac
通过同源重组将Sav-10RS,Sav-L1,Sav-L2和Sav-L3基因整合到枯草芽孢杆菌MB1053宿主细胞基因组上。在1%脱脂乳LB-PG琼脂糖板上(添加了6μg/ml的氯霉素)对氯霉素抗性转化子检查蛋白酶活性。通过插入片段的DNA测序进一步分析一些蛋白酶阳性菌落以确认正确的DNA序列,并对每种构建体选择一个菌株。
在包含添加了6mg/L氯霉素的100ml TY的500ml挡板式Erlenmeyer瓶中于旋转摇动工作台上对四种选定的枯草芽孢杆菌菌株Sav-10RS,Sav-L2,Sav-L1,和Sav-L3进行发酵。对于四种枯草芽孢杆菌菌株每种都并行对四个Erlenmeyer瓶进行发酵。将四个Erlenmeyer瓶中的两个在37℃(250rpm)温育,两个在30℃(250rpm)温育。在第1,2和3天从每个摇瓶中取样品并分析蛋白水解活性。相对于样品第一天于37℃的平均值,对于每个菌株将每组两个样品的平均值呈现在下表中。
表1.相对于第一天于37℃ Sav-10RS的蛋白水解酶活性
第1天 第2天 第3天
 Sav-10RS37℃ 1.0 0.9 0.9
 Sav-10RS30℃ 6.8 5.9 5.4
表2.相对于第一天于37℃ Sav-L1的蛋白水解酶活性
第1天 第2天 第3天
 Sav-L137℃ 1.0 1.3 0.9
 Sav-L130℃ 1.4 1.7 1.8
表3.相对于第一天于37℃ Sav-L2的蛋白水解酶活性
第1天 第2天 第3天
 Sav-10L237℃ 1.0 1.0 0.8
 Sav-10L230℃ 1.4 1.7 1.5
表4.相对于第一天于37℃ Sav-L3的蛋白水解酶活性
第1天 第2天 第3天
 Sav-L3 37℃ 1.0 0.7 0.6
 Sav-L330℃ 1.5 1.3 1.2
如由表1-4可见,当与37℃相比时,30℃的较低发酵温度提高了所有四种测试S2A/S1E拟诺卡氏属菌种蛋白酶的表达水平。
编码适于通过本发明的方法表达和生产的S2A/S1E蛋白酶的非限制性例子提供在SEQ ID NO’s:17,19,21,23,25,27,29,31,和33中;编码蛋白酶的氨基酸序列相应地提供在SEQ ID NO’s:18,20,22,24,26,28,30,32,和34中。
实施例2
利用温度降低表达合成性10蛋白酶基因
设计编码给定氨基酸序列的合成性DNA序列的一种策略称为随机化。起始点是蛋白质序列,或编码所述蛋白质序列的野生型DNA序列,和密码子表。所述密码子表是利用所有或序列亚组,由选自生产宿主或相关物种的基因组的编码性DNA序列来制成的。在此实施例中,随后通过去除最少使用的密码子和一些具有高G-C含量的稀少使用的密码子来对密码子表进行改进。
在本文中采用密码子表意味着总共所有可能的64种密码子和频率的列表,所述频率给出了在选定的DNA序列亚组中,一种给定密码子相对于编码相同氨基酸的其它密码子的相对使用的频率。
随后将密码子表和蛋白质序列用于生成如下的合成性DNA序列。对于任何给定的氨基酸都以密码子表中给出的频率给出的可能性来选择密码子。密码子优化方法的综述在Claes Gustafsson,Sridhar Govindarajan andJeremy Minshull:Codon bias and heterologous protein expression,article inpress(可由 www.sciencedirect.com获得),Trends in Biotechnology中给出。
用于设计编码给定蛋白质序列的合成性DNA序列的另一种策略称作严格优化(strict optimization)。在严格优化中的起点也是蛋白质序列,或编码蛋白质序列的DNA序列,以及密码子表。进行严格优化,只将密码子表中具有最高频率的密码子用来编码给定的氨基酸。
随机化方法将易于生成大量的合成性DNA序列,全部都编码相同的蛋白质并且全部都具有大约相同的密码子统计学,如在所用密码子表中所列出的。许多标准可以用来选择基因的最终候选物。
我们由拟诺卡氏菌属菌种NRRL18262生成了许多编码S2A(或S1E)蛋白酶的合成性修饰基因(显示于SEQ ID NO’s:35,37,和39中)。对于每种基因都利用来自Nucleic Acids Res.31:3429-3431(2003)中所述Vienna软件包的RNAfold程序来计算折叠自由能和最小能量构象(conformation)。选择基因(SEQ ID NO:35)并且以精确相同构建(construction)中的单一拷贝并入芽孢杆菌属宿主细胞的基因组中,如在表达相同10R蛋白酶但来自野生型基因的可比较菌株那样。通过完整表达盒的DNA测序来确证每个染色体整合子的完整性。
在24小时剧烈摇动下于37℃利用富营养培养基将两个整合子在多个摇瓶中发酵多达6天,随后在26℃孵育(37/26)。在指定温度下孵育指定的时间后,通过离心收集1ml上清液样品并对样品分析蛋白质。相对于在精确相同条件下发酵的具有野生型蛋白酶基因的菌株,对于具有合成性蛋白酶基因的菌株在表5中给出结果。
10R合成性基因在37/26℃表达导致蛋白酶活性水平以1.5和13之间的系数(factor)提高。观察到表达的非常大量的变化,其部分归因于在发酵过程中在pH上缺少控制。不过毫无疑问合成性基因导致蛋白酶表达平均大约5倍的提高。
表5.相对于wt基因由使用合成性蛋白酶基因得到的表达产量
 发酵时间 菌株  Rel.活性
 4天 蛋白酶2-5a  1.6
 4天 蛋白酶2-8a  3.7
 5天 蛋白酶2-5a  1.5
 5天 蛋白酶2-8a  3.6
 6天 蛋白酶2-5a  2.3
 6天 蛋白酶2-8a  5.6
 5天 蛋白酶2-8a  5.8
 6天 蛋白酶2-8a  4.1
 5天 蛋白酶2-8a  5.8
 6天 蛋白酶2-8a  9.6
 5天 蛋白酶A1-8  10.6
 6天 蛋白酶A1-8  13.3
序列表
<110>诺维信公司(Novozymes A/S)
<120>生产异源蛋白酶的改进方法
<130>10592.204-WO
<160>40
<170>PatentIn version 3.2
<210>1
<211>81
<212>DNA
<213>Bacillus clausii
<220>
<221>CDS
<222>(1)..(81)
<220>
<221>sig_peptide
<222>(1)..(81)
<400>1
atg aag aaa ccg ttg ggg aaa att gtc gca agc acc gca cta ctc att                 48
Met Lys Lys Pro Leu Gly Lys Ile Val Ala Ser Thr Ala Leu Leu Ile
1               5                   10                  15
tct gtt gct ttt agt tca tcg atc gca tcg gct                                      81
Ser Val Ala Phe Ser Ser Ser Ile Ala Ser Ala
            20                  25
<210>2
<211>27
<212>PRT
<213>Bacillus clausii
<400>2
Met Lys Lys Pro Leu Gly Lys Ile Val Ala Ser Thr Ala Leu Leu Ile
1               5                   10                  15
Ser Val Ala Phe Ser Ser Ser Ile Ala Ser Ala
            20                  25
<210>3
<211>1143
<212>DNA
<213>人工序列
<220>
<223>Savinase信号与合成的S2A蛋白酶的融合
<220>
<221>CDS
<222>(1)..(1140)
<220>
<221>sig_peptide
<222>(1)..(81)
<223>Sayinase信号
<220>
<221>mat_peptide
<222>(577)..(1140)
<400>3
atg aag aaa ccg ttg ggg aaa att gtc gca agc acc gca cta ctc                      45
Met Lys Lys Pro Leu Gly Lys Ile Val Ala Ser Thr Ala Leu Leu
        -190                -185                -180
att tct gtt gct ttt agt tca tcg atc gca tcg gct gct act gga                      90
Ile Ser Val Ala Phe Ser Ser Ser Ile Ala Ser Ala Ala Thr Gly
        -175                -170                -165
gca tta cct cag tct cct aca cct gaa gca gat gca gta tcg atg                     135
Ala Leu Pro Gln Ser Pro Thr Pro Glu Ala Asp Ala Val Ser Met
        -160                -155                -150
caa gaa gca tta caa cgt gat ctt gat ctt aca tca gct gaa gct                     180
Gln Glu Ala Leu Gln Arg Asp Leu Asp Leu Thr Ser Ala Glu Ala
        -145                -140                -135
gag gaa tta ctt gct gca caa gat aca gcc ttt gaa gtt gat gaa                     225
Glu Glu Leu Leu Ala Ala Gln Asp Thr Ala Phe Glu Val Asp Glu
        -130                -125                -120
gct gcc gct gaa gca gct ggt gat gca tat ggt ggt tca gta ttc                     270
Ala Ala Ala Glu Ala Ala Gly Asp Ala Tyr Gly Gly Ser Val Phe
        -115                -110                -105
gat act gaa tca ctc gaa ctt act gta cta gtg acc gat gca gca gct                 318
Asp Thr Glu Ser Leu Glu Leu Thr Val Leu Val Thr Asp Ala Ala Ala
        -100                -95                 -90
gtt gaa gct gtt gaa gcc aca ggt gca ggt aca gag ctc gta tct tat                 366
Val Glu Ala Val Glu Ala Thr Gly Ala Gly Thr Glu Leu Val Ser Tyr
    -85                 -80                 -75
ggt att gat gga tta gat gag atc gta caa gag ctt aat gca gct gat                 414
Gly Ile Asp Gly Leu Asp Glu Ile Val Gln Glu Leu Asn Ala Ala Asp
-70                 -65                 -60                 -55
gcc gtt cea ggt gta gtt gga tgg tat cct gat gta gca ggt gat act                 462
Ala Val Pro Gly Val Val Gly Trp Tyr Pro Asp Val Ala Gly Asp Thr
                -50                 -45                 -40
gtt gtc tta gaa gtt ctt gaa ggc tct gga gct gat gtt tct gga ctt                 510
Val Val Leu Glu Val Leu Glu Gly Ser Gly Ala Asp Val Ser Gly Leu
            -35                 -30                 -25
tta gca gac gca gga gtc gat gca tcc gcg gtt gaa gtg acc acg tca                 558
Leu Ala Asp Ala Gly Val Asp Ala Ser Ala Val Glu Val Thr Thr Ser
        -20                 -15                 -10
gat cag cct gaa ctc tat gcc gat atc att gga ggc cta gcg tac aca                 606
Asp Gln Pro Glu Leu Tyr Ala Asp Ile Ile Gly Gly Leu Ala Tyr Thr
    -5              -1  1               5                   10
atg ggt ggt cgc tgc agc gta gga ttt gca gcc aca aat gca gct gga                 654
Met Gly Gly Arg Cys Ser Val Gly Phe Ala Ala Thr Asn Ala Ala Gly
                15                  20                  25
caa cct ggc ttc gtg aca gct gga cat tgc ggc cgc gtc ggt aca cag                 702
Gln Pro Gly Phe Val Thr Ala Gly His Cys Gly Arg Val Gly Thr Gln
            30                  35                  40
gtt act atc ggc aat gga aga ggt gtc ttt gag caa agc gta ttt ccc                 750
Val Thr Ile Gly Asn Gly Arg Gly Val Phe Glu Gln Ser Val Phe Pro
        45                  50                  55
ggg aat gat gct gcc ttc gtt aga ggt acg tcc aac ttt acg ctt act                 798
Gly Asn Asp Ala Ala Phe Val Arg Gly Thr Ser Asn Phe Thr Leu Thr
    60                  65                  70
aac tta gta tct aga tac aac act ggc gga tat gca act gta gca ggt                 846
Asn Leu Val Ser Arg Tyr Asn Thr Gly Gly Tyr Ala Thr Val Ala Gly
75                  80                  85                  90
cac aat caa gca cct att ggc tct agc gtc tgc cgc tca ggg tcg act                 894
His Asn Gln Ala Pro Ile Gly Ser Ser Val Cys Arg Ser Gly Ser Thr
                95                  100                 105
aca gga tgg cat tgt gga acc att caa gct aga ggt cag agc gtg agc                 942
Thr Gly Trp His Cys Gly Thr Ile Gln Ala Arg Gly Gln Ser Val Ser
            110                 115                 120
tat cct gaa ggt acc gta acg aac atg act cgt acg act gta tgt gca                 990
Tyr Pro Glu Gly Thr Val Thr Asn Met Thr Arg Thr Thr Val Cys Ala
        125                 130                 135
gaa cca ggt gac tct gga ggt tca tat atc agc ggt acg caa gcg caa                1038
Glu Pro Gly Asp Ser Gly Gly Ser Tyr Ile Ser Gly Thr Gln Ala Gln
    140                 145                 150
ggc gtt acc tca ggt gga tcc ggt aac tgt agg aca ggt ggc aca acg                1086
Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Arg Thr Gly Gly Thr Thr
155                 160                 165                 170
ttc tac cag gaa gtg aca ccg atg gtg aac tct tgg gga gtt aga ctc                1134
Phe Tyr Gln Glu Val Thr Pro Met Val Asn Ser Trp Gly Val Arg Leu
                175                 180                 185
cgt aca taa                                                                    1143
Arg Thr
<210>4
<211>380
<212>PRT
<213>人工序列
<220>
<223>合成构建体
<400>4
Met Lys Lys Pro Leu Gly Lys Ile Val Ala Ser Thr Ala Leu Leu
        -190                -185                -180
Ile Ser Val Ala Phe Ser Ser Ser Ile Ala Ser Ala Ala Thr Gly
        -175                -170                -165
Ala Leu Pro Gln Ser Pro Thr Pro Glu Ala Asp Ala Val Ser Met
        -160                -155                -150
Gln Glu Ala Leu Gln Arg Asp Leu Asp Leu Thr Ser Ala Glu Ala
        -145                -140                -135
Glu Glu Leu Leu Ala Ala Gln Asp Thr Ala Phe Glu Val Asp Glu
        -130                -125                -120
Ala Ala Ala Glu Ala Ala Gly Asp Ala Tyr Gly Gly Ser Val Phe
        -115                -110                -105
Asp Thr Glu Ser Leu Glu Leu Thr Val Leu Val Thr Asp Ala Ala Ala
        -100                -95                 -90
Val Glu Ala Val Glu Ala Thr Gly Ala Gly Thr Glu Leu Val Ser Tyr
    -85                 -80                 -75
Gly Ile Asp Gly Leu Asp Glu Ile Val Gln Glu Leu Asn Ala Ala Asp
-70                 -65                 -60                 -55
Ala Val Pro Gly Val Val Gly Trp Tyr Pro Asp Val Ala Gly Asp Thr
                -50                 -45                 -40
Val Val Leu Glu Val Leu Glu Gly Ser Gly Ala Asp Val Ser Gly Leu
            -35                 -30                 -25
Leu Ala Asp Ala Gly Val Asp Ala Ser Ala Val Glu Val Thr Thr Ser
        -20                 -15                 -10
Asp Gln Pro Glu Leu Tyr Ala Asp Ile Ile Gly Gly Leu Ala Tyr Thr
    -5              -1  1               5                   10
Met Gly Gly Arg Cys Ser Val Gly Phe Ala Ala Thr Asn Ala Ala Gly
                15                  20                  25
Gln Pro Gly Phe Val Thr Ala Gly His Cys Gly Arg Val Gly Thr Gln
            30                  35                  40
Val Thr Ile Gly Asn Gly Arg Gly Val Phe Glu Gln Ser Val Phe Pro
        45                  50                  55
Gly Asn Asp Ala Ala Phe Val Arg Gly Thr Ser Asn Phe Thr Leu Thr
    60                  65                  70
Asn Leu Val Ser Arg Tyr Asn Thr Gly Gly Tyr Ala Thr Val Ala Gly
75                  80                  85                  90
His Asn Gln Ala Pro Ile Gly Ser Ser Val Cys Arg Ser Gly Ser Thr
                95                  100                 105
Thr Gly Trp His Cys Gly Thr Ile Gln Ala Arg Gly Gln Ser Val Ser
            110                 115                 120
Tyr Pro Glu Gly Thr Val Thr Asn Met Thr Arg Thr Thr Val Cys Ala
        125                 130                 135
Glu Pro Gly Asp Ser Gly Gly Ser Tyr Ile Ser Gly Thr Gln Ala Gln
    140                 145                 150
Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Arg Thr Gly Gly Thr Thr
155                 160                 165                 170
Phe Tyr Gln Glu Val Thr Pro Met Val Asn Ser Trp Gly Val Arg Leu
                175                 180                 185
Arg Thr
<210>5
<211>1112
<212>DNA
<213>人工序列
<220>
<223>Savinase信号与S2A蛋白酶基因的融合
<220>
<221>CDS
<222>(1)..(1089)
<220>
<221>sig_peptide
<222>(1)..(27)
<223>部分Savinase信号肽
<220>
<221>mat_peptide
<222>(526)..(1089)
<400>5
gct ttt agt tca tcg atc gca tcg gct gct ccg gcc ccc gtc ccc                      45
Ala Phe Ser Ser Ser Ile Ala Ser Ala Ala Pro Ala Pro Val Pro
-175                -170                -165
cag acc ccc gtc gcc gac gac agc gcc gcc agc atg acc gag gcg                      90
Gln Thr Pro Val Ala Asp Asp Ser Ala Ala Ser Met Thr Glu Ala
-160                -155                -150
ctc aag cgc gac ctc gac ctc acc tcg gcc gag gcc gag gag ctt                     135
Leu Lys Arg Asp Leu Asp Leu Thr Ser Ala Glu Ala Glu Glu Leu
-145                -140                -135
ctc tcg gcg cag gaa gcc gcc atc gag acc gac gcc gag gcc acc                     180
Leu Ser Ala Gln Glu Ala Ala Ile Glu Thr Asp Ala Glu Ala Thr
-130                -125                -120
gag gcc gcg ggc gag gcc tac ggc ggc tca ctg ttc gac acc gag                     225
Glu Ala Ala Gly Glu Ala Tyr Gly Gly Ser Leu Phe Asp Thr Glu
-115                -110                -105
acc ctc gaa ctc acc gtg ctg gtc acc gac gcc tcc gcc gtc gag gcg                 273
Thr Leu Glu Leu Thr Val Leu Val Thr Asp Ala Ser Ala Val Glu Ala
-100                -95                 -90                 -85
gtc gag gcc acc gga gcc cag gcc acc gtc gtc tcc cac ggc acc gag                 321
Val Glu Ala Thr Gly Ala Gln Ala Thr Val Val Ser His Gly Thr Glu
                -80                 -75                 -70
ggc ctg acc gag gtc gtg gag gac ctc aac ggc gcc gag gtt ccc gag                 369
Gly Leu Thr Glu Val Val Glu Asp Leu Asn Gly Ala Glu Val Pro Glu
            -65                 -60                 -55
agc gtc ctc ggc tgg tac ccg gac gtg gag agc gac acc gtc gtg gtc                 417
Ser Val Leu Gly Trp Tyr Pro Asp Val Glu Ser Asp Thr Val Val Val
        -50                 -45                 -40
gag gtg ctg gag ggc tcc gac gcc gac gtc gcc gcc ctg ctc gcc gac                 465
Glu Val Leu Glu Gly Ser Asp Ala Asp Val Ala Ala Leu Leu Ala Asp
    -35                 -30                 -25
gcc ggt gtg gac tcc tcc tcg gtc cgg gtg gag gag gcc gag gag gcc                 513
Ala Gly Val Asp Ser Ser Ser Val Arg Val Glu Glu Ala Glu Glu Ala
-20                 -15                 -10                 -5
ccg cag gtc tac gcc gac atc atc ggc ggc ctg gcc tac tac atg ggc                 561
Pro Gln Val Tyr Ala Asp Ile Ile Gly Gly Leu Ala Tyr Tyr Met Gly
            -1  1               5                   10
ggc cgc tgc tcc gtc ggc ttc gcc gcg acc aac agc gcc ggt cag ccc                 609
Gly Arg Cys Ser Val Gly Phe Ala Ala Thr Asn Ser Ala Gly Gln Pro
        15                  20                  25
ggt ttc gtc acc gcc ggc cac tgc ggc acc gtc ggc acc ggc gtg acc                 657
Gly Phe Val Thr Ala Gly His Cys Gly Thr Val Gly Thr Gly Val Thr
    30                  35                  40
atc ggc aac ggc acc ggc acc ttc cag aac tcg gtc ttc ccc ggc aac                 705
Ile Gly Asn Gly Thr Gly Thr Phe Gln Asn Ser Val Phe Pro Gly Asn
45                  50                  55                  60
gac gcc gcc ttc gtc cgc ggc acc tcc aac ttc acc ctg acc aac ctg                 753
Asp Ala Ala Phe Val Arg Gly Thr Ser Asn Phe Thr Leu Thr Asn Leu
                65                  70                  75
gtc tcg cgc tac aac tcc ggc ggc tac cag tcg gtg acc ggt acc agc                 801
Val Ser Arg Tyr Asn Ser Gly Gly Tyr Gln Ser Val Thr Gly Thr Ser
            80                  85                  90
cag gcc ccg gcc ggc tcg gcc gtg tgc cgc tcc ggc tcc acc acc ggc                 849
Gln Ala Pro Ala Gly Ser Ala Val Cys Arg Ser Gly Ser Thr Thr Gly
        95                  100                 105
tgg cac tgc ggc acc atc cag gcc cgc aac cag acc gtg cgc tac ccg                 897
Trp His Cys Gly Thr Ile Gln Ala Arg Asn Gln Thr Val Arg Tyr Pro
    110                 115                 120
cag ggc acc gtc tac tcg ctc acc cgc acc aac gtg tgc gcc gag ccc                 945
Gln Gly Thr Val Tyr Ser Leu Thr Arg Thr Asn Val Cys Ala Glu Pro
125                 130                 135                 140
ggc gac tcc ggc ggt tcg ttc atc tcc ggc tcg cag gcc cag ggc gtc                 993
Gly Asp Ser Gly Gly Ser Phe Ile Ser Gly Ser Gln Ala Gln Gly Val
                145                 150                 155
acc tcc ggc ggc tcc ggc aac tgc tcc gtc ggc ggc acg acc tac tac                1041
Thr Ser Gly Gly Ser Gly Asn Cys Ser Val Gly Gly Thr Thr Tyr Tyr
            160                 165                 170
cag gag gtc acc ccg atg atc aac tcc tgg ggt gtc agg atc cgg acc                1089
Gln Glu Val Thr Pro Met Ile Asn Ser Trp Gly Val Arg Ile Arg Thr
        175                 180                 185
taatcgcatg ttcaatccgc tcc                                                      1112
<210>6
<211>363
<212>PRT
<213>人工序列
<220>
<223>合成构建体
<400>6
Ala Phe Ser Ser Ser Ile Ala Ser Ala Ala Pro Ala Pro Val Pro
-175                -170                -165
Gln Thr Pro Val Ala Asp Asp Ser Ala Ala Ser Met Thr Glu Ala
-160                -155                -150
Leu Lys Arg Asp Leu Asp Leu Thr Ser Ala Glu Ala Glu Glu Leu
-145                -140                -135
Leu Ser Ala Gln Glu Ala Ala Ile Glu Thr Asp Ala Glu Ala Thr
-130                -125                -120
Glu Ala Ala Gly Glu Ala Tyr Gly Gly Ser Leu Phe Asp Thr Glu
-115                -110                -105
Thr Leu Glu Leu Thr Val Leu Val Thr Asp Ala Ser Ala Val Glu Ala
-100                -95                 -90                 -85
Val Glu Ala Thr Gly Ala Gln Ala Thr Val Val Ser His Gly Thr Glu
                -80                 -75                 -70
Gly Leu Thr Glu Val Val Glu Asp Leu Asn Gly Ala Glu Val Pro Glu
            -65                 -60                 -55
Ser Val Leu Gly Trp Tyr Pro Asp Val Glu Ser Asp Thr Val Val Val
        -50                 -45                 -40
Glu Val Leu Glu Gly Ser Asp Ala Asp Val Ala Ala Leu Leu Ala Asp
    -35                 -30                 -25
Ala Gly Val Asp Ser Ser Ser Val Arg Val Glu Glu Ala Glu Glu Ala
-20                 -15                 -10                 -5
Pro Gln Val Tyr Ala Asp Ile Ile Gly Gly Leu Ala Tyr Tyr Met Gly
            -1  1               5                   10
Gly Arg Cys Ser Val Gly Phe Ala Ala Thr Asn Ser Ala Gly Gln Pro
        15                  20                  25
Gly Phe Val Thr Ala Gly His Cys Gly Thr Val Gly Thr Gly Val Thr
    30                  35                  40
Ile Gly Asn Gly Thr Gly Thr Phe Gln Asn Ser Val Phe Pro Gly Asn
45                  50                  55                  60
Asp Ala Ala Phe Val Arg Gly Thr Ser Asn Phe Thr Leu Thr Asn Leu
                65                  70                  75
Val Ser Arg Tyr Asn Ser Gly Gly Tyr Gln Ser Val Thr Gly Thr Ser
            80                  85                  90
Gln Ala Pro Ala Gly Ser Ala Val Cys Arg Ser Gly Ser Thr Thr Gly
        95                  100                 105
Trp His Cys Gly Thr Ile Gln Ala Arg Asn Gln Thr Val Arg Tyr Pro
    110                 115                 120
Gln Gly Thr Val Tyr Ser Leu Thr Arg Thr Asn Val Cys Ala Glu Pro
125                 130                 135                 140
Gly Asp Ser Gly Gly Ser Phe Ile Ser Gly Ser Gln Ala Gln Gly Val
                145                 150                 155
Thr Ser Gly Gly Ser Gly Asn Cys Ser Val Gly Gly Thr Thr Tyr Tyr
            160                 165                 170
Gln Glu Val Thr Pro Met Ile Asn Ser Trp Gly Val Arg Ile Arg Thr
        175                 180                 185
<210>7
<211>48
<212>DNA
<213>人工序列
<220>
<223>引物1423
<400>7
gcttttagtt catcgatcgc atcggctgct ccggcccccg tcccccag                             48
<210>8
<211>45
<212>DNA
<213>人工序列
<220>
<223>引物1475
<400>8
ggagcggatt gaacatgcga ttaggtccgg atcctgacac cccag                                45
<210>9
<211>1108
<212>DNA
<213>人工序列
<220>
<223>Savinase信号与S2A蛋白酶基因的融合
<220>
<221>CDS
<222>(1)..(1083)
<220>
<221>sig_peptide
<222>(1)..(27)
<223>部分Savinase信号
<220>
<221>mat_peptide
<222>(508)..(1083)
<400>9
gct ttt agt tca tcg atc gca tcg gct gcg acc gta ccg gcc gag                      45
Ala Phe Ser Ser Ser Ile Ala Ser Ala Ala Thr Val Pro Ala Glu
                -165                -160                -155
cca gcg agc gag gcc cag acg atg atg gaa gcg ctg cag aga gac                      90
Pro Ala Ser Glu Ala Gln Thr Met Met Glu Ala Leu Gln Arg Asp
                -150                -145                -140
ctc ggc ctc acc ccg ctc ggg gcc gag gag ctg ctc tcg gcg cag                     135
Leu Gly Leu Thr Pro Leu Gly Ala Glu Glu Leu Leu Ser Ala Gln
                -135                -130                -125
gaa gag gcg atc gag acc gac gcc gag gcc acc gag gcc gcg gga                     180
Glu Glu Ala Ile Glu Thr Asp Ala Glu Ala Thr Glu Ala Ala Gly
                -120                -115                -110
gcg tcc tac ggc ggc tcc ctg ttc gac acc gag acc ctc cag ctc acc                 228
Ala Ser Tyr Gly Gly Ser Leu Phe Asp Thr Glu Thr Leu Gln Leu Thr
                -105                -100                -95
gtg ctg gtg acc gac gcc tcg gcc gtc gag gcg gtg gag gcc acc ggc                 276
Val Leu Val Thr Asp Ala Ser Ala Val Glu Ala Val Glu Ala Thr Gly
            -90                 -85                 -80
gcc gag gcc acc gtg gtc tca cac ggc gca gag ggc ctg gcc gag gtg                 324
Ala Glu Ala Thr Val Val Ser His Gly Ala Glu Gly Leu Ala Glu Val
        -75                 -70                 -65
gtc gac gcg ctc gac gag acc ggc ggc cgg gaa ggg gtc gtc ggc tgg                 372
Val Asp Ala Leu Asp Glu Thr Gly Gly Arg Glu Gly Val Val Gly Trp
    -60                 -55                 -50
tac ccg gac gtg gag agc gac acc gtc gtg gtc cag gtc gcc gag ggc                 420
Tyr Pro Asp Val Glu Ser Asp Thr Val Val Val Gln Val Ala Glu Gly
-45                 -40                 -35                 -30
gcc agc gcc gac ggc ctc atc gag gcc gcg ggc gtg gac ccc tcc gcc                 468
Ala Ser Ala Asp Gly Leu Ile Glu Ala Ala Gly Val Asp Pro Ser Ala
                -25                 -20                 -15
gtc cgg gtg gag gag acc agt gag act ccg cgc ctg tac gcc gac atc                 516
Val Arg Val Glu Glu Thr Ser Glu Thr Pro Arg Leu Tyr Ala Asp Ile
            -10                 -5              -1  1
gtc ggc ggc gag gcg tac tac atg ggc ggc gga cgc tgc tcg gtc ggg                 564
Val Gly Gly Glu Ala Tyr Tyr Met Gly Gly Gly Arg Cys Ser Val Gly
    5                   10                  15
ttc gcc gtg acc gac ggc tcc ggc gcg ggc ggc ttc gtg acg gcg ggc                 612
Phe Ala Val Thr Asp Gly Ser Gly Ala Gly Gly Phe Val Thr Ala Gly
20                  25                  30                  35
cac tgc ggc acc gtc ggc acc ggc gcc gag agc tcc gac ggc agc ggc                 660
His Cys Gly Thr Val Gly Thr Gly Ala Glu Ser Ser Asp Gly Ser Gly
                40                  45                  50
tcc gga acc ttc cag gag tcc gtc ttc ccg ggc agc gac ggc gcc ttc                 708
Ser Gly Thr Phe Gln Glu Ser Val Phe Pro Gly Ser Asp Gly Ala Phe
            55                  60                  65
gtc gcg gcc acc tcc aac tgg aac gtg acc aac ctg gtc agc cgg tac                 756
Val Ala Ala Thr Ser Asn Trp Asn Val Thr Asn Leu Val Ser Arg Tyr
        70                  75                  80
gac tcc ggc agc ccc cag gcg gtg tcg ggt tcc agc cag gcc ccg gag                 804
Asp Ser Gly Ser Pro Gln Ala Val Ser Gly Ser Ser Gln Ala Pro Glu
    85                  90                  95
ggc tcg gcg gtg tgc cgc tcc ggc tcc acc acc ggc tgg cac tgc ggg                 852
Gly Ser Ala Val Cys Arg Ser Gly Ser Thr Thr Gly Trp His Cys Gly
100                 105                 110                 115
acc atc gag gcc cgc ggc cag acg gtg aac tac ccg cag ggc acg gtc                 900
Thr Ile Glu Ala Arg Gly Gln Thr Val Asn Tyr Pro Gln Gly Thr Val
                120                 125                 130
cag gac ctg acc cgg acg gac gtg tgc gcc gag ccc ggt gac tcc ggc                 948
Gln Asp Leu Thr Arg Thr Asp Val Cys Ala Glu Pro Gly Asp Ser Gly
            135                 140                 145
ggc tcg ttc atc gcc ggt tcg cag gcc cag ggc gtc acc tcc ggc ggc                 996
Gly Ser Phe Ile Ala Gly Ser Gln Ala Gln Gly Val Thr Ser Gly Gly
        150                 155                 160
tcg ggc aac tgc acc tcc ggc ggc acg acc tac tac cag gag gtc act                1044
Ser Gly Asn Cys Thr Ser Gly Gly Thr Thr Tyr Tyr Gln Glu Val Thr
    165                 170                 175
ccc ctg ctg agc agc tgg ggg ctg tcc ctg gtg acc ggt tagtaatcgc                1093
Pro Leu Leu Ser Ser Trp Gly Leu Ser Leu Val Thr Gly
180                 185                 190
atgttcatcc gctcc                                                               1108
<210>10
<211>361
<212>PRT
<213>人工序列
<220>
<223>合成构建体
<400>10
Ala Phe Ser Ser Ser Ile Ala Ser Ala Ala Thr Val Pro Ala Glu
                -165                -160                -155
Pro Ala Ser Glu Ala Gln Thr Met Met Glu Ala Leu Gln Arg Asp
                -150                -145                -140
Leu Gly Leu Thr Pro Leu Gly Ala Glu Glu Leu Leu Ser Ala Gln
                -135                -130                -125
Glu Glu Ala Ile Glu Thr Asp Ala Glu Ala Thr Glu Ala Ala Gly
                -120                -115                -110
Ala Ser Tyr Gly Gly Ser Leu Phe Asp Thr Glu Thr Leu Gln Leu Thr
                -105                -100                -95
Val Leu Val Thr Asp Ala Ser Ala Val Glu Ala Val Glu Ala Thr Gly
            -90                 -85                 -80
Ala Glu Ala Thr Val Val Ser His Gly Ala Glu Gly Leu Ala Glu Val
        -75                 -70                 -65
Val Asp Ala Leu Asp Glu Thr Gly Gly Arg Glu Gly Val Val Gly Trp
    -60                 -55                 -50
Tyr Pro Asp Val Glu Ser Asp Thr Val Val Val Gln Val Ala Glu Gly
-45                 -40                 -35                 -30
Ala Ser Ala Asp Gly Leu Ile Glu Ala Ala Gly Val Asp Pro Ser Ala
                -25                 -20                 -15
Val Arg Val Glu Glu Thr Ser Glu Thr Pro Arg Leu Tyr Ala Asp Ile
            -10                 -5              -1  1
Val Gly Gly Glu Ala Tyr Tyr Met Gly Gly Gly Arg Cys Ser Val Gly
    5                   10                  15
Phe Ala Val Thr Asp Gly Ser Gly Ala Gly Gly Phe Val Thr Ala Gly
20                  25                  30                  35
His Cys Gly Thr Val Gly Thr Gly Ala Glu Ser Ser Asp Gly Ser Gly
                40                  45                  50
Ser Gly Thr Phe Gln Glu Ser Val Phe Pro Gly Ser Asp Gly Ala Phe
            55                  60                  65
Val Ala Ala Thr Ser Asn Trp Asn Val Thr Asn Leu Val Ser Arg Tyr
        70                  75                  80
Asp Ser Gly Ser Pro Gln Ala Val Ser Gly Ser Ser Gln Ala Pro Glu
    85                  90                  95
Gly Ser Ala Val Cys Arg Ser Gly Ser Thr Thr Gly Trp His Cys Gly
100                 105                 110                 115
Thr Ile Glu Ala Arg Gly Gln Thr Val Asn Tyr Pro Gln Gly Thr Val
                120                 125                 130
Gln Asp Leu Thr Arg Thr Asp Val Cys Ala Glu Pro Gly Asp Ser Gly
            135                 140                 145
Gly Ser Phe Ile Ala Gly Ser Gln Ala Gln Gly Val Thr Ser Gly Gly
        150                 155                 160
Ser Gly Asn Cys Thr Ser Gly Gly Thr Thr Tyr Tyr Gln Glu Val Thr
    165                 170                 175
Pro Leu Leu Ser Ser Trp Gly Leu Ser Leu Val Thr Gly
180                 185                 190
<210>11
<211>44
<212>DNA
<213>人工序列
<220>
<223>引物1485
<400>11
ggagcggatg aacatgcgat tactaaccgg tcaccaggga cagc                                 44
<210>12
<211>44
<212>DNA
<213>人工序列
<220>
<223>引物1424
<400>12
ggagcggatg aacatgcgat tactaaccgg tcaccaggga cagc                                 44
<210>13
<211>1109
<212>DNA
<213>人工序列
<220>
<223>Savinase信号与S2A蛋白酶的融合
<220>
<221>CDS
<222>(1)..(1086)
<220>
<221>sig_peptide
<222>(1)..(21)
<223>部分Savinase信号
<220>
<221>mat_peptide
<222>(520)..(1086)
<400>13
agt tca tcg atc gca tcg gct gcg ccc ggc ccc gtc ccc cag acc                      45
Ser Ser Ser Ile Ala Ser Ala Ala Pro Gly Pro Val Pro Gln Thr
            -170                -165                -160
ccc gtc gcc gac gac agc gcc gcc agc atg acc gaa gcg ctc aag                      90
Pro Val Ala Asp Asp Ser Ala Ala Ser Met Thr Glu Ala Leu Lys
            -155                -150                -145
cgt gac ctc aac ctc tcc tcg gcc gag gcc gag gag ctg ctc tcg                     135
Arg Asp Leu Asn Leu Ser Ser Ala Glu Ala Glu Glu Leu Leu Ser
            -140                -135                -130
gcg cag gaa gcc gcg atc gag acc gac gcc gag gcc gcc gag gcc                     180
Ala Gln Glu Ala Ala Ile Glu Thr Asp Ala Glu Ala Ala Glu Ala
            -125                -120                -115
gcg gga gag gcc tac ggc ggc tcc ctg ttc gac acc gaa acc ctc                     225
Ala Gly Glu Ala Tyr Gly Gly Ser Leu Phe Asp Thr Glu Thr Leu
            -110                -105                -100
gaa ctc acc gtg ctg gtg acc gac acc acg gcc gtc gac gcg gtc gag                 273
Glu Leu Thr Val Leu Val Thr Asp Thr Thr Ala Val Asp Ala Val Glu
            -95                 -90                 -85
gcc acc gga gcc gag gcc acc gtg gtc acc cac ggc acc gac ggc ctg                 321
Ala Thr Gly Ala Glu Ala Thr Val Val Thr His Gly Thr Asp Gly Leu
        -80                 -75                 -70
gcc gag gtc gtg gag gac ctc aac agc gcc gac gcc ccg gcg ggc gtc                 369
Ala Glu Val Val Glu Asp Leu Asn Ser Ala Asp Ala Pro Ala Gly Val
    -65                 -60                 -55
ctc ggc tgg tac ccc gac atg gag agc gac acc gtg gtg gtc gag gtg                 417
Leu Gly Trp Tyr Pro Asp Met Glu Ser Asp Thr Val Val Val Glu Val
-50                 -45                 -40                 -35
ctg gag ggc tcc gac gcc gac gtc gcc gcc ctg ctc gcc gac gcc ggc                 465
Leu Glu Gly Ser Asp Ala Asp Val Ala Ala Leu Leu Ala Asp Ala Gly
                -30                 -25                 -20
gtg gac gcc tcc gcc gtc cgg gtg gag gag gcg gag gag gtc ccg cag                 513
Val Asp Ala Ser Ala Val Arg Val Glu Glu Ala Glu Glu Val Pro Gln
            -15                 -10                 -5
gtc tac gcc aac atc atc ggc ggc ctg gcc tac acc atg ggc gga cgc                 561
Val Tyr Ala Asn Ile Ile Gly Gly Leu Ala Tyr Thr Met Gly Gly Arg
    -1  1               5                   10
tgc tcc gtc ggc ttc gcg gcg acc aae agc gcc gga cag ccc ggt ttc                 609
Cys Ser Val Gly Phe Ala Ala Thr Asn Ser Ala Gly Gln Pro Gly Phe
15                  20                  25                  30
gtg acg gcg ggc cac tgc ggc acc gtc ggc acc gcc gtg acc atc ggc                 657
Val Thr Ala Gly His Cys Gly Thr Val Gly Thr Ala Val Thr Ile Gly
                35                  40                  45
gac ggc cgc ggc gtc ttc gag cgc tcg gtc ttc ccc ggc aac gac gcc                 705
Asp Gly Arg Gly Val Phe Glu Arg Ser Val Phe Pro Gly Asn Asp Ala
            50                  55                  60
gcc ttc gtc cgc ggc acc tcc aac ttc acc ctg acc aac ctg gtc tcc                 753
Ala Phe Val Arg Gly Thr Ser Asn Phe Thr Leu Thr Asn Leu Val Ser
        65                  70                  75
cgc tac aac tcc ggc ggc cac cag gcg gtg acc ggc acc agc cag gcc                 801
Arg Tyr Asn Ser Gly Gly His Gln Ala Val Thr Gly Thr Ser Gln Ala
    80                  85                  90
ccg gcc ggc tcg gcc gtc tgc cgc tcc ggc tcc acc acc ggc tgg cac           849
Pro Ala Gly Ser Ala Val Cys Arg Ser Gly Ser Thr Thr Gly Trp His
95                  100                 105                 110
tgc ggc acc atc cag gcc cgc aac cag acc gtg cgc tac ccg cag ggc           897
Cys Gly Thr Ile Gln Ala Arg Asn Gln Thr Val Arg Tyr Pro Gln Gly
                115                 120                 125
acc gtc aac gcg ctc acc cgc acc aac gtg tgc gcc gag ccc ggt gac           945
Thr Val Asn Ala Leu Thr Arg Thr Asn Val Cys Ala Glu Pro Gly Asp
            130                 135                 140
tcc ggc ggc tcg ttc atc tcc ggc tcg cag gcc cag ggc gtc acc tcc           993
Ser Gly Gly Ser Phe Ile Ser Gly Ser Gln Ala Gln Gly Val Thr Ser
        145                 150                 155
ggc ggc tcc ggc aac tgc tcc ttc ggc ggc acg acc tac tac cag gag          1041
Gly Gly Ser Gly Asn Cys Ser Phe Gly Gly Thr Thr Tyr Tyr Gln Glu
    160                 165                 170
gtc gcc ccg atg atc aac tcc tgg ggc gtt cgc atc cgc acc agc              1086
Val Ala Pro Met Ile Asn Ser Trp Gly Val Arg Ile Arg Thr Ser
175                 180                 185
tgatcgcatg ttcaatccgc tcc                                                1109
<210>14
<211>362
<212>PRT
<213>人工序列
<220>
<223>合成构建体
<400>14
Ser Ser Ser Ile Ala Ser Ala Ala Pro Gly Pro Val Pro Gln Thr
            -170                -165                -160
Pro Val Ala Asp Asp Ser Ala Ala Ser Met Thr Glu Ala Leu Lys
            -155                -150                -145
Arg Asp Leu Asn Leu Ser Ser Ala Glu Ala Glu Glu Leu Leu Ser
            -140                -135                -130
Ala Gln Glu Ala Ala Ile Glu Thr Asp Ala Glu Ala Ala Glu Ala
            -125                -120                -115
Ala Gly Glu Ala Tyr Gly Gly Ser Leu Phe Asp Thr Glu Thr Leu
            -110                -105                -100
Glu Leu Thr Val Leu Val Thr Asp Thr Thr Ala Val Asp Ala Val Glu
            -95                 -90                 -85
Ala Thr Gly Ala Glu Ala Thr Val Val Thr His Gly Thr Asp Gly Leu
        -80                 -75                 -70
Ala Glu Val Val Glu Asp Leu Asn Ser Ala Asp Ala Pro Ala Gly Val
    -65                 -60                 -55
Leu Gly Trp Tyr Pro Asp Met Glu Ser Asp Thr Val Val Val Glu Val
-50                 -45                 -40                 -35
Leu Glu Gly Ser Asp Ala Asp Val Ala Ala Leu Leu Ala Asp Ala Gly
                -30                 -25                 -20
Val Asp Ala Ser Ala Val Arg Val Glu Glu Ala Glu Glu Val Pro Gln
            -15                 -10                 -5
Val Tyr Ala Asn Ile Ile Gly Gly Leu Ala Tyr Thr Met Gly Gly Arg
    -1  1               5                   10
Cys Ser Val Gly Phe Ala Ala Thr Asn Ser Ala Gly Gln Pro Gly Phe
15                  20                  25                  30
Val Thr Ala Gly His Cys Gly Thr Val Gly Thr Ala Val Thr Ile Gly
                35                  40                  45
Asp Gly Arg Gly Val Phe Glu Arg Ser Val Phe Pro Gly Asn Asp Ala
            50                  55                  60
Ala Phe Val Arg Gly Thr Ser Asn Phe Thr Leu Thr Asn Leu Val Ser
        65                  70                  75
Arg Tyr Asn Ser Gly Gly His Gln Ala Val Thr Gly Thr Ser Gln Ala
    80                  85                  90
Pro Ala Gly Ser Ala Val Cys Arg Ser Gly Ser Thr Thr Gly Trp His
95                  100                 105                 110
Cys Gly Thr Ile Gln Ala Arg Asn Gln Thr Val Arg Tyr Pro Gln Gly
                115                 120                 125
Thr Val Asn Ala Leu Thr Arg Thr Asn Val Cys Ala Glu Pro Gly Asp
            130                 135                 140
Ser Gly Gly Ser Phe Ile Ser Gly Ser Gln Ala Gln Gly Val Thr Ser
        145                 150                 155
Gly Gly Ser Gly Asn Cys Ser Phe Gly Gly Thr Thr Tyr Tyr Gln Glu
    160                 165                 170
Val Ala Pro Met Ile Asn Ser Trp Gly Val Arg Ile Arg Thr Ser
175                 180                 185
<210>15
<211>42
<212>DNA
<213>人工序列
<220>
<223>引物1718
<400>15
agttcatcga tcgcatcggc tgcgcccggc cccgtccccc ag                             42
<210>16
<211>41
<212>DNA
<213>人工序列
<220>
<223>引物1720
<400>16
ggagcggatt gaacatgcga tcagctggtg cggatgcgaa c                              41
<210>17
<211>1146
<212>DNA
<213>达松维尔拟诺卡氏菌达松维尔亚种(Nocardiopsis dassonvillei subsp.
dassonvillei) DSM 43235
<220>
<221>CDS
<222>(1)..(1143)
<220>
<221>sig-peptide
<222>(1)..(87)
<220>
<221>mat_peptide
<222>(568)..(1143)
<400>17
atg cga ccc tcc ccc gct atc tcc gct atc ggc acc ggc gca ctc                45
Met Arg Pro Ser Pro Ala Ile Ser Ala Ile Gly Thr Gly Ala Leu
                -185                -180                -175
gcg ttc ggt ctg gcg ttc tcc gtg acg ccg ggc gcc agt gcg gcg                90
Ala Phe Gly Leu Ala Phe Ser Val Thr Pro Gly Ala Ser Ala Ala
                -170                -165                -160
acc gta ccg gcc gag cca gcg agc gag gcc cag acg atg atg gaa               135
Thr Val Pro Ala Glu Pro Ala Ser Glu Ala Gln Thr Met Met Glu
                -155                -150                -145
gcg ctg cag aga gac ctc ggc ctc acc ccg ctc ggg gcc gag gag               180
Ala Leu Gln Arg Asp Leu Gly Leu Thr Pro Leu Gly Ala Glu Glu
                -140                -135                -130
ctg ctc tcg gcg cag gaa gag gcg atc gag acc gac gcc gag gcc               225
Leu Leu Ser Ala Gln Glu Glu Ala Ile Glu Thr Asp Ala Glu Ala
                -125                -120                -115
acc gag gcc gcg gga gcg tcc tac ggc ggc tcc ctg ttc gac acc               270
Thr Glu Ala Ala Gly Ala Ser Tyr Gly Gly Ser Leu Phe Asp Thr
                -110                -105                -100
gag acc ctc cag ctc acc gtg ctg gtg acc gac gcc tcg gcc gtc gag           318
Glu Thr Leu Gln Leu Thr Val Leu Val Thr Asp Ala Ser Ala Val Glu
                -95                 -90                 -85
gcg gtg gag gcc acc ggc gcc gag gcc acc gtg gtc tca cac ggc gca           366
Ala Val Glu Ala Thr Gly Ala Glu Ala Thr Val Val Ser His Gly Ala
            -80                 -75                 -70
gag ggc ctg gcc gag gtg gtc gac gcg ctc gac gag acc ggc ggc cgg           414
Glu Gly Leu Ala Glu Val Val Asp Ala Leu Asp Glu Thr Gly Gly Arg
        -65                 -60                 -55
gaa ggg gtc gtc ggc tgg tac ccg gac gtg gag agc gac acc gtc gtg           462
Glu Gly Val Val Gly Trp Tyr Pro Asp Val Glu Ser Asp Thr Val Val
    -50                 -45                 -40
gtc cag gtc gcc gag ggc gcc agc gcc gac ggc ctc atc gag gcc gcg           510
Val Gln Val Ala Glu Gly Ala Ser Ala Asp Gly Leu Ile Glu Ala Ala
-35                 -30                 -25                 -20
ggc gtg gac ccc tcc gcc gtc cgg gtg gag gag acc agt gag act ccg           558
Gly Val Asp Pro Ser Ala Val Arg Val Glu Glu Thr Ser Glu Thr Pro
                -15                 -10                 -5
cgc ctg tac gcc gac atc gtc ggc ggc gag gcg tac tac atg ggc ggc           606
Arg Leu Tyr Ala Asp Ile Val Gly Gly Glu Ala Tyr Tyr Met Gly Gly
        -1  1               5                   10
gga cgc tgc tcg gtc ggg ttc gcc gtg acc gac ggc tcc ggc gcg ggc           654
Gly Arg Cys Ser Val Gly Phe Ala Val Thr Asp Gly Ser Gly Ala Gly
    15                  20                  25
ggc ttc gtg acg gcg ggc cac tgc ggc acc gtc ggc acc ggc gcc gag           702
Gly Phe Val Thr Ala Gly His Cys Gly Thr Val Gly Thr Gly Ala Glu
30                  35                  40                  45
agc tcc gac ggc agc ggc tcc gga acc ttc cag gag tcc gtc ttc ccg           750
Ser Ser Asp Gly Ser Gly Ser Gly Thr Phe Gln Glu Ser Val Phe Pro
                50                  55                  60
ggc agc gac ggc gcc ttc gtc gcg gcc acc tcc aac tgg aac gtg acc           798
Gly Ser Asp Gly Ala Phe Val Ala Ala Thr Ser Asn Trp Asn Val Thr
            65                  70                  75
aac ctg gtc agc cgg tac gac tcc ggc age ccc cag gcg gtg tcg ggt           846
Asn Leu Val Ser Arg Tyr Asp Ser Gly Ser Pro Gln Ala Val Ser Gly
        80                  85                  90
tcc agc cag gcc ccg gag ggc tcg gcg gtg tgc cgc tcc ggc tcc acc           894
Ser Ser Gln Ala Pro Glu Gly Ser Ala Val Cys Arg Ser Gly Ser Thr
    95                  100                 105
acc ggc tgg cac tgc ggg acc atc gag gcc cgc ggc cag acg gtg aac           942
Thr Gly Trp His Cys Gly Thr Ile Glu Ala Arg Gly Gln Thr Val Asn
110                 115                 120                 125
tac ccg cag ggc acg gtc cag gac ctg acc cgg acg gac gtg tgc gcc           990
Tyr Pro Gln Gly Thr Val Gln Asp Leu Thr Arg Thr Asp Val Cys Ala
                130                 135                 140
gag ccc ggt gac tcc ggc ggc tcg ttc atc gcc ggt tcg cag gcc cag          1038
Glu Pro Gly Asp Ser Gly Gly Ser Phe Ile Ala Gly Ser Gln Ala Gln
            145                 150                 155
ggc gtc acc tcc ggc ggc tcg ggc aac tgc acc tcc ggc ggc acg acc          1086
Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Thr Ser Gly Gly Thr Thr
        160                 165                 170
tac tac cag gag gtc act ccc ctg ctg agc agc tgg ggg ctg tcc ctg          1134
Tyr Tyr Gln Glu Val Thr Pro Leu Leu Ser Ser Trp Gly Leu Ser Leu
    175                 180                 185
gtg acc ggt tag                                                          1146
Val Thr Gly
190
<210>18
<211>381
<212>PRT
<213>达松维尔拟诺卡氏菌达松维尔亚种DSM 43235
<400>18
Met Arg Pro Ser Pro Ala Ile Ser Ala Ile Gly Thr Gly Ala Leu
                -185                -180                -175
Ala Phe Gly Leu Ala Phe Ser Val Thr Pro Gly Ala Ser Ala Ala
                -170                -165                -160
Thr Val Pro Ala Glu Pro Ala Ser Glu Ala Gln Thr Met Met Glu
                -155                -150                -145
Ala Leu Gln Arg Asp Leu Gly Leu Thr Pro Leu Gly Ala Glu Glu
                -140                -135                -130
Leu Leu Ser Ala Gln Glu Glu Ala Ile Glu Thr Asp Ala Glu Ala
                -125                -120                -115
Thr Glu Ala Ala Gly Ala Ser Tyr Gly Gly Ser Leu Phe Asp Thr
                -110                -105                -100
Glu Thr Leu Gln Leu Thr Val Leu Val Thr Asp Ala Ser Ala Val Glu
                -95                 -90                 -85
Ala Val Glu Ala Thr Gly Ala Glu Ala Thr Val Val Ser His Gly Ala
            -80                 -75                 -70
Glu Gly Leu Ala Glu Val Val Asp Ala Leu Asp Glu Thr Gly Gly Arg
        -65                 -60                 -55
Glu Gly Val Val Gly Trp Tyr Pro Asp Val Glu Ser Asp Thr Val Val
    -50                 -45                 -40
Val Gln Val Ala Glu Gly Ala Ser Ala Asp Gly Leu Ile Glu Ala Ala
-35                 -30                 -25                 -20
Gly Val Asp Pro Ser Ala Val Arg Val Glu Glu Thr Ser Glu Thr Pro
                -15                 -10                 -5
Arg Leu Tyr Ala Asp Ile Val Gly Gly Glu Ala Tyr Tyr Met Gly Gly
        -1  1               5                   10
Gly Arg Cys Ser Val Gly Phe Ala Val Thr Asp Gly Ser Gly Ala Gly
    15                  20                  25
Gly Phe Val Thr Ala Gly His Cys Gly Thr Val Gly Thr Gly Ala Glu
30                  35                  40                  45
Ser Ser Asp Gly Ser Gly Ser Gly Thr Phe Gln Glu Ser Val Phe Pro
                50                  55                  60
Gly Ser Asp Gly Ala Phe Val Ala Ala Thr Ser Asn Trp Asn Val Thr
            65                  70                  75
Asn Leu Val Ser Arg Tyr Asp Ser Gly Ser Pro Gln Ala Val Ser Gly
        80                  85                  90
Ser Ser Gln Ala Pro Glu Gly Ser Ala Val Cys Arg Ser Gly Ser Thr
    95                  100                 105
Thr Gly Trp His Cys Gly Thr Ile Glu Ala Arg Gly Gln Thr Val Asn
110                 115                 120                 125
Tyr Pro Gln Gly Thr Val Gln Asp Leu Thr Arg Thr Asp Val Cys Ala
                130                 135                 140
Glu Pro Gly Asp Ser Gly Gly Ser Phe Ile Ala Gly Ser Gln Ala Gln
            145                 150                 155
Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Thr Ser Gly Gly Thr Thr
        160                 165                 170
Tyr Tyr Gln Glu Val Thr Pro Leu Leu Ser Ser Trp Gly Leu Ser Leu
    175                 180                 185
Val Thr Gly
190
<210>19
<211>1152
<212>DNA
<213>Nocardiopsis prasina DSM 15649
<220>
<221>CDS
<222>(1)..(1149)
<220>
<221>sig_peptide
<222>(1)..(87)
<220>
<221>mat_peptide
<222>(574)..(1149)
<400>19
atg cga ccc tcc ccc gtc atc tcc gcg atc ggc acg gga gca ctg                45
Met Arg Pro Ser Pro Val Ile Ser Ala Ile Gly Thr Gly Ala Leu
    -190                -185                -180
gcc ttc ggg ctc gcg ctc tcg gtc gcg ccc ggc gcc tcc gcc gtc                90
Ala Phe Gly Leu Ala Leu Ser Val Ala Pro Gly Ala Ser Ala Val
    -175                -170                -165
acc gca ccc acc gag ccc gcg ccc cag ggc gag gcg gcc acc atg               135
Thr Ala Pro Thr Glu Pro Ala Pro Gln Gly Glu Ala Ala Thr Met
    -160                -155                -150
cag gaa gcg ctt gag agg gac ttc ggc ctc acc ccg ttc gag gcc               180
Gln Glu Ala Leu Glu Arg Asp Phe Gly Leu Thr Pro Phe Glu Ala
    -145                -140                -135
gaa gac ctg ctc gaa gcc cag aat gac gct ctc ggg atc gac acg               225
Glu Asp Leu Leu Glu Ala Gln Asn Asp Ala Leu Gly Ile Asp Thr
    -130                -125                -120
gcg gcg gcc aag gcc gcc ggt gac gcc tac gcg ggc tcc gtg ttc               270
Ala Ala Ala Lys Ala Ala Gly Asp Ala Tyr Ala Gly Ser Val Phe
    -115                -110                -105
gac acc gac acc ctg gaa ctg acc gtc ctg ctc acg gac gcc gga gcc           318
Asp Thr Asp Thr Leu Glu Leu Thr Val Leu Leu Thr Asp Ala Gly Ala
    -100                -95                 -90
gtg tcg gac gtc gag gcc acc ggc gcc ggg acc gaa ctg gtc tcg tac           366
Val Ser Asp Val Glu Ala Thr Gly Ala Gly Thr Glu Leu Val Ser Tyr
-85                 -80                 -75                 -70
ggc acc gag ggc ctg gcg gag atc atg gac gag ctc gac gca gcc ggc           414
Gly Thr Glu Gly Leu Ala Glu Ile Met Asp Glu Leu Asp Ala Ala Gly
                -65                 -60                 -55
gcc cag ccg ggt gtc gtc ggc tgg tac ccg gac ctc gcc ggc gac acc           462
Ala Gln Pro Gly Val Val Gly Trp Tyr Pro Asp Leu Ala Gly Asp Thr
            -50                 -45                 -40
gtc gtc atc gag gcc acc gac acc tcc gag gcc cag agc ttc gtc gag           510
Val Val Ile Glu Ala Thr Asp Thr Ser Glu Ala Gln Ser Phe Val Glu
        -35                 -30                 -25
gcc gcg ggc gtg gac tcc tcc gcc gtc cag gtg gag cag acc gac gag           558
Ala Ala Gly Val Asp Ser Ser Ala Val Gln Val Glu Gln Thr Asp Glu
    -20                 -15                 -10
gcg ccg cag ctg tac gcc gac atc gtc ggc ggt gac gcc tac tac atg           606
Ala Pro Gln Leu Tyr Ala Asp Ile Val Gly Gly Asp Ala Tyr Tyr Met
-5              -1  1               5                   10
ggc ggc ggg cgc tgc tcg gtc gga ttc gcg gtc acc gac agt tcc ggc           654
Gly Gly Gly Arg Cys Ser Val Gly Phe Ala Val Thr Asp Ser Ser Gly
            15                  20                  25
aac gac gga ttc gtg acg gcc ggc cac tgc ggc acg gtc ggc acc tcc           702
Asn Asp Gly Phe Val Thr Ala Gly His Cys Gly Thr Val Gly Thr Ser
        30                  35                  40
gcc gac agc gag gac ggc agc ggc tcc ggt gtg ttc gag gag tcc atc           750
Ala Asp Ser Glu Asp Gly Ser Gly Ser Gly Val Phe Glu Glu Ser Ile
    45                  50                  55
ttc ccg ggc aac gac gcg gcc ttc gtc agt tcg acg tcc aac tgg acc           798
Phe Pro Gly Asn Asp Ala Ala Phe Val Ser Ser Thr Ser Asn Trp Thr
60                  65                  70                  75
gtc acc aac ctg gtc aac atg tac agc tcg ggt ggc acc cag tcc gtc           846
Val Thr Asn Leu Val Asn Met Tyr Ser Ser Gly Gly Thr Gln Ser Val
                80                  85                  90
ggc ggc tcc agc cag gcc ccg gtc ggc gcg gcc gtc tgc cgt tcc ggc           894
Gly Gly Ser Ser Gln Ala Pro Val Gly Ala Ala Val Cys Arg Ser Gly
            95                  100                 105
tcc acc acg ggc tgg cac tgc ggg tcc atc gag gcc cgc ggg cag tcg           942
Ser Thr Thr Gly Trp His Cys Gly Ser Ile Glu Ala Arg Gly Gln Ser
        110                 115                 120
gtg agc tac ccg gag ggc acc gtc acc gac atg acc cgt acc gac gtg           990
Val Ser Tyr Pro Glu Gly Thr Val Thr Asp Met Thr Arg Thr Asp Val
    125                 130                 135
tgc gcc gag ccc ggc gac tcc ggc ggt tcg ttc atc gcc gac gac cag          1038
Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Phe Ile Ala Asp Asp Gln
140                 145                 150                 155
gcc cag ggc atg acc tcg ggc ggc tcc ggc aac tgc tcc tcc ggt ggt          1086
Ala Gln Gly Met Thr Ser Gly Gly Ser Gly Asn Cys Ser Ser Gly Gly
                160                 165                 170
acc acg tac tac cag gag gtc ggc ccg gcg ctg agc acc tgg aac ctc          1134
Thr Thr Tyr Tyr Gln Glu Val Gly Pro Ala Leu Ser Thr Trp Asn Leu
            175                 180                 185
agc ctc gtc acc agc tag                                                  1152
Ser Leu Val Thr Ser
        190
<210>20
<211>383
<212>PRT
<213>Nocardiopsis prasina DSM 15649
<400>20
Met Arg Pro Ser Pro Val Ile Ser Ala Ile Gly Thr Gly Ala Leu
    -190                -185                -180
Ala Phe Gly Leu Ala Leu Ser Val Ala Pro Gly Ala Ser Ala Val
    -175                -170                -165
Thr Ala Pro Thr Glu Pro Ala Pro Gln Gly Glu Ala Ala Thr Met
    -160                -155                -150
Gln Glu Ala Leu Glu Arg Asp Phe Gly Leu Thr Pro Phe Glu Ala
    -145                -140                -135
Glu Asp Leu Leu Glu Ala Gln Asn Asp Ala Leu Gly Ile Asp Thr
    -130                -125                -120
Ala Ala Ala Lys Ala Ala Gly Asp Ala Tyr Ala Gly Ser Val Phe
    -115                -110                -105
Asp Thr Asp Thr Leu Glu Leu Thr Val Leu Leu Thr Asp Ala Gly Ala
    -100                -95                 -90
Val Ser Asp Val Glu Ala Thr Gly Ala Gly Thr Glu Leu Val Ser Tyr
-85                 -80                 -75                 -70
Gly Thr Glu Gly Leu Ala Glu Ile Met Asp Glu Leu Asp Ala Ala Gly
                -65                 -60                 -55
Ala Gln Pro Gly Val Val Gly Trp Tyr Pro Asp Leu Ala Gly Asp Thr
            -50                 -45                 -40
Val Val Ile Glu Ala Thr Asp Thr Ser Glu Ala Gln Ser Phe Val Glu
        -35                 -30                 -25
Ala Ala Gly Val Asp Ser Ser Ala Val Gln Val Glu Gln Thr Asp Glu
    -20                 -15                 -10
Ala Pro Gln Leu Tyr Ala Asp Ile Val Gly Gly Asp Ala Tyr Tyr Met
-5              -1  1               5                   10
Gly Gly Gly Arg Cys Ser Val Gly Phe Ala Val Thr Asp Ser Ser Gly
            15                  20                  25
Asn Asp Gly Phe Val Thr Ala Gly His Cys Gly Thr Val Gly Thr Ser
        30                  35                  40
Ala Asp Ser Glu Asp Gly Ser Gly Ser Gly Val Phe Glu Glu Ser Ile
    45                  50                  55
Phe Pro Gly Asn Asp Ala Ala Phe Val Ser Ser Thr Ser Asn Trp Thr
60                  65                  70                  75
Val Thr Asn Leu Val Asn Met Tyr Ser Ser Gly Gly Thr Gln Ser Val
                80                  85                  90
Gly Gly Ser Ser Gln Ala Pro Val Gly Ala Ala Val Cys Arg Ser Gly
            95                  100                 105
Ser Thr Thr Gly Trp His Cys Gly Ser Ile Glu Ala Arg Gly Gln Ser
        110                 115                 120
Val Ser Tyr Pro Glu Gly Thr Val Thr Asp Met Thr Arg Thr Asp Val
    125                 130                 135
Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Phe Ile Ala Asp Asp Gln
140                 145                 150                 155
Ala Gln Gly Met Thr Ser Gly Gly Ser Gly Asn Cys Ser Ser Gly Gly
                160                 165                 170
Thr Thr Tyr Tyr Gln Glu Val Gly Pro Ala Leu Ser Thr Trp Asn Leu
            175                 180                 185
Ser Leu Val Thr Ser
        190
<210>21
<211>1152
<212>DNA
<213>Nocardiopsis prasina DSM 14010
<220>
<221>CDS
<222>(1)..(1149)
<220>
<221>sig peptide
<222>(1)..(87)
<220>
<221>mat-peptide
<222>(574)..(1149)
<400>21
atg cga ccc tcc ccc gtc atc tcc gcg atc ggc acg gga gcg ctg                45
Met Arg Pro Ser Pro Val Ile Ser Ala Ile Gly Thr Gly Ala Leu
    -190                -185                -180
gcc ttc ggg ctc gcg ctc tcg gtc gct ccc ggc gcc tcc gcc gtg                90
Ala Phe Gly Leu Ala Leu Ser Val Ala Pro Gly Ala Ser Ala Val
    -175                -170                -165
acc gcc ccc gcc gag ccc tcg ccc cag ggc gag gcg acc acc atg               135
Thr Ala Pro Ala Glu Pro Ser Pro Gln Gly Glu Ala Thr Thr Met
    -160                -155                -150
cag gaa gcg ctt gag agg gac ttc ggc ctc acc ccg ttc gag gcc               180
Gln Glu Ala Leu Glu Arg Asp Phe Gly Leu Thr Pro Phe Glu Ala
    -145                -140                -135
gac gac ctg ctc gaa gcc cag aag gag gcc ctc ggg atc gac acg               225
Asp Asp Leu Leu Glu Ala Gln Lys Glu Ala Leu Gly Ile Asp Thr
    -130                -125                -120
gcg gcg gcc gag gcc gcc ggc gac gcc tac gcg ggc tcc gtg ttc               270
Ala Ala Ala Glu Ala Ala Gly Asp Ala Tyr Ala Gly Ser Val Phe
    -115                -110                -105
gac acc gac acc ctg gaa ctg acc gtc ctg ctc acg gac ggc ggc ccg           318
Asp Thr Asp Thr Leu Glu Leu Thr Val Leu Leu Thr Asp Gly Gly Pro
    -100                -95                 -90
gcg tcg gac gtc gag gcc gcc ggc gcc gag acc tcg gtg gtc tcc cac           366
Ala Ser Asp Val Glu Ala Ala Gly Ala Glu Thr Ser Val Val Ser His
-85                 -80                 -75                 -70
ggc acc gac ggc ctg gcg gcg atc atg gac gag ctc gac gcg gtc ggc           414
Gly Thr Asp Gly Leu Ala Ala Ile Met Asp Glu Leu Asp Ala Val Gly
                -65                 -60                 -55
gcc cag ccg ggt gtc gtc ggc tgg tac ccc gac ctc gcc agc gac acg           462
Ala Gln Pro Gly Val Val Gly Trp Tyr Pro Asp Leu Ala Ser Asp Thr
            -50                 -45                 -40
gtg gtc gtc gag gcc acc gac gcg tcc gac gcc cag ggc ttc atc gag           510
Val Val Val Glu Ala Thr Asp Ala Ser Asp Ala Gln Gly Phe Ile Glu
        -35                 -30                 -25
gcc gcc ggc gtg gac tcc tcc gcc gtc cag gtg gag gag acc gac gag           558
Ala Ala Gly Val Asp Ser Ser Ala Val Gln Val Glu Glu Thr Asp Glu
    -20                 -15                 -10
tcg ccc gag ctg tac gcc gac atc gtc ggc ggc gac gcc tac tac atg           606
Ser Pro Glu Leu Tyr Ala Asp Ile Val Gly Gly Asp Ala Tyr Tyr Met
-5              -1  1               5                   10
ggc ggc gga cgc tgc tcg gtg ggc ttc gcg gcc acc gac agc gcg ggc           654
Gly Gly Gly Arg Cys Ser Val Gly Phe Ala Ala Thr Asp Ser Ala Gly
            15                  20                  25
aac gac gga ttc gtg acg gcc ggc cac tgc ggc acc gtc ggc acc tcc           702
Asn Asp Gly Phe Val Thr Ala Gly His Cys Gly Thr Val Gly Thr Ser
        30                  35                  40
gcc gac agc gag gac ggc agc ggc tcc ggt gtg ttc gag gag tcg atc           750
Ala Asp Ser Glu Asp Gly Ser Gly Ser Gly Val Phe Glu Glu Ser Ile
    45                  50                  55
ttc ccg ggc aac gac gcc gcc ttc gtc cgg tcc acg tcc aac tgg acc           798
Phe Pro Gly Asn Asp Ala Ala Phe Val Arg Ser Thr Ser Asn Trp Thr
60                  65                  70                  75
gtc acc aac ctg gtc aac atg tac agc tcc ggc ggc acc cag tcc gtc           846
Val Thr Asn Leu Val Asn Met Tyr Ser Ser Gly Gly Thr Gln Ser Val
                80                  85                  90
ggc ggc tcc acc cag gcc ccg gtc ggc gcg gcc gtg tgc cgc tcc ggt           894
Gly Gly Ser Thr Gln Ala Pro Val Gly Ala Ala Val Cys Arg Ser Gly
            95                  100                 105
tcc acc acg ggc tgg cac tgc ggc acc atc gag gcc cga ggc cag tcg           942
Ser Thr Thr Gly Trp His Cys Gly Thr Ile Glu Ala Arg Gly Gln Ser
        110                 115                 120
gtg agc tac ccg gag ggc acc gtc aac gac atg acc cgg acc aac gtg           990
Val Ser Tyr Pro Glu Gly Thr Val Asn Asp Met Thr Arg Thr Asn Val
    125                 130                 135
tgc gcc gag ccc ggc gac tcc ggc ggt tcg ttc atc tcc gac gac cag          1038
Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Phe Ile Ser Asp Asp Gln
140                 145                 150                 155
gcc cag ggc atg acc tcg ggc ggc tcc ggc aac tgc acc tcc ggt ggt          1086
Ala Gln Gly Met Thr Ser Gly Gly Ser Gly Asn Cys Thr Ser Gly Gly
                160                 165                 170
acg acg tac tac cag gag gtc ggc ccg gcg ctg agc acc tgg aac ctc          1134
Thr Thr Tyr Tyr Gln Glu Val Gly Pro Ala Leu Ser Thr Trp Asn Leu
            175                 180                 185
agc ctc gtc acg agc tag                                                  1152
Ser Leu Val Thr Ser
        190
<210>22
<211>383
<212>PRT
<213>Nocardiopsis prasina DSM 14010
<400>22
Met Arg Pro Ser Pro Val Ile Ser Ala Ile Gly Thr Gly Ala Leu
    -190                -185                -180
Ala Phe Gly Leu Ala Leu Ser Val Ala Pro Gly Ala Ser Ala Val
    -175                -170                -165
Thr Ala Pro Ala Glu Pro Ser Pro Gln Gly Glu Ala Thr Thr Met
    -160                -155                -150
Gln Glu Ala Leu Glu Arg Asp Phe Gly Leu Thr Pro Phe Glu Ala
    -145                -140                -135
Asp Asp Leu Leu Glu Ala Gln Lys Glu Ala Leu Gly Ile Asp Thr
    -130                -125                -120
Ala Ala Ala Glu Ala Ala Gly Asp Ala Tyr Ala Gly Ser Val Phe
    -115                -110                -105
Asp Thr Asp Thr Leu Glu Leu Thr Val Leu Leu Thr Asp Gly Gly Pro
    -100                -95                 -90
Ala Ser Asp Val Glu Ala Ala Gly Ala Glu Thr Ser Val Val Ser His
-85                 -80                 -75                 -70
Gly Thr Asp Gly Leu Ala Ala Ile Met Asp Glu Leu Asp Ala Val Gly
                -65                 -60                 -55
Ala Gln Pro Gly Val Val Gly Trp Tyr Pro Asp Leu Ala Ser Asp Thr
            -50                 -45                 -40
Val Val Val Glu Ala Thr Asp Ala Ser Asp Ala Gln Gly Phe Ile Glu
        -35                 -30                 -25
Ala Ala Gly Val Asp Ser Ser Ala Val Gln Val Glu Glu Thr Asp Glu
    -20                 -15                 -10
Ser Pro Glu Leu Tyr Ala Asp Ile Val Gly Gly Asp Ala Tyr Tyr Met
-5              -1  1               5                   10
Gly Gly Gly Arg Cys Ser Val Gly Phe Ala Ala Thr Asp Ser Ala Gly
            15                  20                  25
Asn Asp Gly Phe Val Thr Ala Gly His Cys Gly Thr Val Gly Thr Ser
        30                  35                  40
Ala Asp Ser Glu Asp Gly Ser Gly Ser Gly Val Phe Glu Glu Ser Ile
    45                  50                  55
Phe Pro Gly Asn Asp Ala Ala Phe Val Arg Ser Thr Ser Asn Trp Thr
60                  65                  70                  75
Val Thr Asn Leu Val Asn Met Tyr Ser Ser Gly Gly Thr Gln Ser Val
                80                  85                  90
Gly Gly Ser Thr Gln Ala Pro Val Gly Ala Ala Val Cys Arg Ser Gly
            95                  100                 105
Ser Thr Thr Gly Trp His Cys Gly Thr Ile Glu Ala Arg Gly Gln Ser
        110                 115                 120
Val Ser Tyr Pro Glu Gly Thr Val Asn Asp Met Thr Arg Thr Asn Val
    125                 130                 135
Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Phe Ile Ser Asp Asp Gln
140                 145                 150                 155
Ala Gln Gly Met Thr Ser Gly Gly Ser Gly Asn Cys Thr Ser Gly Gly
                160                 165                 170
Thr Thr Tyr Tyr Gln Glu Val Gly Pro Ala Leu Ser Thr Trp Asn Leu
            175                 180                 185
Ser Leu Val Thr Ser
        190
<210>23
<211>1155
<212>DNA
<213>拟诺卡氏菌属菌种(Nocardiopsis sp.) DSM 16424
<220>
<221>CDS
<222>(1)..(1152)
<220>
<221>sig_peptide
<222>(1)..(87)
<220>
<221>mat_peptide
<222>(586)..(1152)
<400>23
atg aga ccc tcc acc atc gcc tcc gcc gtc ggc aca gga gca ctg                 45
Met Arg Pro Ser Thr Ile Ala Ser Ala Val Gly Thr Gly Ala Leu
-195                -190                -185
gcc ttc ggt ctg gca ctg tcc atg gcc ccc gga gcc ctc gcg gcg                 90
Ala Phe Gly Leu Ala Leu Ser Met Ala Pro Gly Ala Leu Ala Ala
-180                -175                -170
ccc ggc ccc gtc ccc cag acc ccc gtc gcc gac gac agc gcc gcc                135
Pro Gly Pro Val Pro Gln Thr Pro Val Ala Asp Asp Ser Ala Ala
-165                -160                -155
agc atg acc gaa gcg ctc aag cgt gac ctc aac ctc tcc tcg gcc                180
Set Met Thr Glu Ala Leu Lys Arg Asp Leu Asn Leu Ser Ser Ala
-150                -145                -140
gag gcc gag gag ctg ctc tcg gcg cag gaa gcc gcg atc gag acc                225
Glu Ala Glu Glu Leu Leu Ser Ala Gln Glu Ala Ala Ile Glu Thr
-135                -130                -125
gac gcc gag gcc gcc gag gcc gcg gga gag gcc tac ggc ggc tcc                270
Asp Ala Glu Ala Ala Glu Ala Ala Gly Glu Ala Tyr Gly Gly Ser
-120                -115                -110
ctg ttc gac acc gaa acc ctc gaa ctc acc gtg ctg gtg acc gac acc            318
Leu Phe Asp Thr Glu Thr Leu Glu Leu Thr Val Leu Val Thr Asp Thr
-105                -100                -95                 -90
acg gcc gtc gac gcg gtc gag gcc acc gga gcc gag gcc acc gtg gtc            366
Thr Ala Val Asp Ala Val Glu Ala Thr Gly Ala Glu Ala Thr Val Val
                -85                 -80                 -75
acc cac ggc acc gac ggc ctg gcc gag gtc gtg gag gac ctc aac agc           414
Thr His Gly Thr Asp Gly Leu Ala Glu Val Val Glu Asp Leu Asn Ser
            -70                 -65                 -60
gcc gac gcc ccg gcg ggc gtc ctc ggc tgg tac ccc gac atg gag agc           462
Ala Asp Ala Pro Ala Gly Val Leu Gly Trp Tyr Pro Asp Met Glu Ser
        -55                 -50                 -45
gac acc gtg gtg gtc gag gtg ctg gag ggc tcc gac gcc gac gtc gcc           510
Asp Thr Val Val Val Glu Val Leu Glu Gly Ser Asp Ala Asp Val Ala
    -40                 -35                 -30
gcc ctg ctc gcc gac gcc ggc gtg gac gcc tcc gcc gtc cgg gtg gag           558
Ala Leu Leu Ala Asp Ala Gly Val Asp Ala Ser Ala Val Arg Val Glu
-25                 -20                 -15                 -10
gag gcg gag gag gtc ccg cag gtc tac gcc aac atc atc ggc ggc ctg           606
Glu Ala Glu Glu Val Pro Gln Val Tyr Ala Asn Ile Ile Gly Gly Leu
                -5              -1  1               5
gcc tac acc atg ggc gga cgc tgc tcc gtc ggc ttc gcg gcg acc aac           654
Ala Tyr Thr Met Gly Gly Arg Cys Ser Val Gly Phe Ala Ala Thr Asn
        10                  15                  20
agc gcc gga cag ccc ggt ttc gtg acg gcg ggc cac tgc ggc acc gtc           702
Ser Ala Gly Gln Pro Gly Phe Val Thr Ala Gly His Cys Gly Thr Val
    25                  30                  35
ggc acc gcc gtg acc atc ggc gac ggc cgc ggc gtc ttc gag cgc tcg           750
Gly Thr Ala Val Thr Ile Gly Asp Gly Arg Gly Val Phe Glu Arg Ser
40                  45                  50                  55
gtc ttc ccc ggc aac gac gcc gcc ttc gtc cgc ggc acc tcc aac ttc           798
Val Phe Pro Gly Asn Asp Ala Ala Phe Val Arg Gly Thr Ser Asn Phe
                60                  65                  70
acc ctg acc aac ctg gtc tcc cgc tac aac tcc ggc ggc cac cag gcg           846
Thr Leu Thr Asn Leu Val Ser Arg Tyr Asn Ser Gly Gly His Gln Ala
            75                  80                  85
gtg acc ggc acc agc cag gcc ccg gcc ggc tcg gcc gtc tgc cgc tcc           894
Val Thr Gly Thr Ser Gln Ala Pro Ala Gly Ser Ala Val Cys Arg Ser
        90                  95                  100
ggc tcc acc acc ggc tgg cac tgc ggc acc atc cag gcc cgc aac cag           942
Gly Ser Thr Thr Gly Trp His Cys Gly Thr Ile Gln Ala Arg Asn Gln
    105                 110                 115
acc gtg cgc tac ccg cag ggc acc gtc aac gcg ctc acc cgc acc aac           990
Thr Val Arg Tyr Pro Gln Gly Thr Val Asn Ala Leu Thr Arg Thr Asn
120                 125                 130                 135
gtg tgc gcc gag ccc ggt gac tcc ggc ggc tcg ttc atc tcc ggc tcg          1038
Val Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Phe Ile Ser Gly Ser
                140                 145                 150
cag gcc cag ggc gtc acc tcc ggc ggc tcc ggc aac tgc tcc ttc ggc          1086
Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Ser Phe Gly
            155                 160                 165
ggc acg acc tac tac cag gag gtc gcc ccg atg atc aac tcc tgg ggc          1134
Gly Thr Thr Tyr Tyr Gln Glu Val Ala Pro Met Ile Asn Ser Trp Gly
        170                 175                 180
gtt cgc atc cgc acc agc tga                                              1155
Val Arg Ile Arg Thr Ser
    185
<210>24
<211>384
<212>PRT
<213>拟诺卡氏菌属菌种DSM 16424
<400>24
Met Arg Pro Ser Thr Ile Ala Ser Ala Val Gly Thr Gly Ala Leu
-195                -190                -185
Ala Phe Gly Leu Ala Leu Ser Met Ala Pro Gly Ala Leu Ala Ala
-180                -175                -170
Pro Gly Pro Val Pro Gln Thr Pro Val Ala Asp Asp Ser Ala Ala
-165                -160                -155
Ser Met Thr Glu Ala Leu Lys Arg Asp Leu Asn Leu Ser Ser Ala
-150                -145                -140
Glu Ala Glu Glu Leu Leu Ser Ala Gln Glu Ala Ala Ile Glu Thr
-135                -130                -125
Asp Ala Glu Ala Ala Glu Ala Ala Gly Glu Ala Tyr Gly Gly Ser
-120                -115                -110
Leu Phe Asp Thr Glu Thr Leu Glu Leu Thr Val Leu Val Thr Asp Thr
-105                -100                -95                 -90
Thr Ala Val Asp Ala Val Glu Ala Thr Gly Ala Glu Ala Thr Val Val
                -85                 -80                 -75
Thr His Gly Thr Asp Gly Leu Ala Glu Val Val Glu Asp Leu Asn Ser
            -70                 -65                 -60
Ala Asp Ala Pro Ala Gly Val Leu Gly Trp Tyr Pro Asp Met Glu Ser
        -55                 -50                 -45
Asp Thr Val Val Val Glu Val Leu Glu Gly Ser Asp Ala Asp Val Ala
    -40                 -35                 -30
Ala Leu Leu Ala Asp Ala Gly Val Asp Ala Ser Ala Val Arg Val Glu
-25                 -20                 -15                 -10
Glu Ala Glu Glu Val Pro Gln Val Tyr Ala Asn Ile Ile Gly Gly Leu
                -5              -1  1               5
Ala Tyr Thr Met Gly Gly Arg Cys Ser Val Gly Phe Ala Ala Thr Asn
        10                  15                  20
Ser Ala Gly Gln Pro Gly Phe Val Thr Ala Gly His Cys Gly Thr Val
    25                  30                  35
Gly Thr Ala Val Thr Ile Gly Asp Gly Arg Gly Val Phe Glu Arg Ser
40                  45                  50                  55
Val Phe Pro Gly Asn Asp Ala Ala Phe Val Arg Gly Thr Ser Asn Phe
                60                  65                  70
Thr Leu Thr Asn Leu Val Ser Arg Tyr Asn Ser Gly Gly His Gln Ala
            75                  80                  85
Val Thr Gly Thr Ser Gln Ala Pro Ala Gly Ser Ala Val Cys Arg Ser
        90                  95                  100
Gly Ser Thr Thr Gly Trp His Cys Gly Thr Ile Gln Ala Arg Asn Gln
    105                 110                 115
Thr Val Arg Tyr Pro Gln Gly Thr Val Asn Ala Leu Thr Arg Thr Asn
120                 125                 130                 135
Val Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Phe Ile Ser Gly Ser
                140                 145                 150
Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Ser Phe Gly
            155                 160                 165
Gly Thr Thr Tyr Tyr Gln Glu Val Ala Pro Met Ile Asn Ser Trp Gly
        170                 175                 180
Val Arg Ile Arg Thr Ser
    185
<210>25
<211>1152
<212>DNA
<213>Nocardiopsis alkaliphila DSM 44657
<220>
<221>CDS
<222>(1)..(1149)
<220>
<221>sig_peptide
<222>(1)..(87)
<220>
<221>mat_peptide
<222>(586)..(1149)
<400>25
atg cga ccc tcc ccc gtt gtc tcc gcc ata ggt aca gga gcc ttg                45
Met Arg Pro Ser Pro Val Val Ser Ala Ile Gly Thr Gly Ala Leu
-195                -190                -185
gcc ttc ggc ctg gct ctg ggc act tcc ccc gcg gcc atc gcc gcc                90
Ala Phe Gly Leu Ala Leu Gly Thr Ser Pro Ala Ala Ile Ala Ala
-180                -175                -170
ccc gcc ccc cag tcc ccc gac acc gaa acg cag gcc gag gcc gtc               135
Pro Ala Pro Gln Ser Pro Asp Thr Glu Thr Gln Ala Glu Ala Val
-165                -160                -155
acc atg gcc gaa gcc ctc caa cgc gat ctc ggt ctg tcc tcc tcc               180
Thr Met Ala Glu Ala Leu Gln Arg Asp Leu Gly Leu Ser Ser Ser
-150                -145                -140
gag gcc acc gaa ctc ctc gcc gca cag gcc gag gcg ttc gag gtc               225
Glu Ala Thr Glu Leu Leu Ala Ala Gln Ala Glu Ala Phe Glu Val
-135                -130                -125
gac gag gcc gcc acc gag gcc gcc gcc gac gcc tac ggc ggc tcc               270
Asp Glu Ala Ala Thr Glu Ala Ala Ala Asp Ala Tyr Gly Gly Ser
-120                -115                -110
ctc ttc gac acc gac agc ctc gaa ctg acc gtg ctg gtc acc gac agc           318
Leu Phe Asp Thr Asp Ser Leu Glu Leu Thr Val Leu Val Thr Asp Ser
-105                -100                -95                 -90
gcc gcc gtc gac gcg gtc gag gcc acc ggc gcc aag gcc gag gtc gtc           366
Ala Ala Val Asp Ala Val Glu Ala Thr Gly Ala Lys Ala Glu Val Val
                -85                 -80                 -75
gac cac ggt atc gag ggc ctc gag gag atc gtc gac gaa ctc aac gag           414
Asp His Gly Ile Glu Gly Leu Glu Glu Ile Val Asp Glu Leu Asn Glu
            -70                 -65                 -60
tcc aac gcc aag tcg ggc gtc gtc ggt tgg tac ccc gac gtg gcc ggt           462
Ser Asn Ala Lys Ser Gly Val Val Gly Trp Tyr Pro Asp Val Ala Gly
        -55                 -50                 -45
gac acg gtc gtc ctg gag gtc atg gaa ggc tcc gag gcc gac gtg gac           510
Asp Thr Val Val Leu Glu Val Met Glu Gly Ser Glu Ala Asp Val Asp
    -40                 -35                 -30
gcc ctg ctc gcc gag acc ggg gtc gac gcc gcc gac gtc acg gtg gag           558
Ala Leu Leu Ala Glu Thr Gly Val Asp Ala Ala Asp Val Thr Val Glu
-25                 -20                 -15                 -10
acc acc acc gag cag ccc gag ctc tac gcc gac atc atc ggt ggc ctg           606
Thr Thr Thr Glu Gln Pro Glu Leu Tyr Ala Asp Ile Ile Gly Gly Leu
                -5              -1  1               5
gcc tac acc atg ggc gga cgt tgc tcg gtc ggc ttc gcc gcc acc aac           654
Ala Tyr Thr Met Gly Gly Arg Cys Ser Val Gly Phe Ala Ala Thr Asn
        10                  15                  20
tcc tcc ggc cag ccc gga ttc gtc acc gcc ggc cac tgc ggc agt gtc           702
Ser Ser Gly Gln Pro Gly Phe Val Thr Ala Gly His Cys Gly Ser Val
    25                  30                  35
ggc acc ggc gtc acc atc ggt aac ggc cgg ggc gtc ttc gag cgt tcc           750
Gly Thr Gly Val Thr Ile Gly Asn Gly Arg Gly Val Phe Glu Arg Ser
40                  45                  50                  55
atc ttc ccg ggc aac gac gcc gcc ttc gtc cgt ggc acg tcc aac ttc           798
Ile Phe Pro Gly Asn Asp Ala Ala Phe Val Arg Gly Thr Ser Asn Phe
                60                  65                  70
acc ctg acc aac ctg gtc agc cgc tac aac tcc ggc ggc tac gcc acg           846
Thr Leu Thr Asn Leu Val Ser Arg Tyr Asn Ser Gly Gly Tyr Ala Thr
            75                  80                  85
gtg tcc ggg tcc tcc gcg gcc ccg atc ggc tcc cag gtg tgc cgc tcc           894
Val Ser Gly Ser Ser Ala Ala Pro Ile Gly Ser Gln Val Cys Arg Ser
        90                  95                  100
ggc tcc acc acc ggc tgg cac tgc ggc acc atc cag gcc cgc aac cag           942
Gly Ser Thr Thr Gly Trp His Cys Gly Thr Ile Gln Ala Arg Asn Gln
    105                 110                 115
acg gtg cgc tac ccg cag ggc acc gtc cag gcc ctg acc cgc acc agc           990
Thr Val Arg Tyr Pro Gln Gly Thr Val Gln Ala Leu Thr Arg Thr Ser
120                 125                 130                 135
gtg tgc gcc gag ccc ggt gac tcc ggt ggt tcc ttc atc tcc ggc agc          1038
Val Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Phe Ile Ser Gly Ser
                140                 145                 150
cag gcc cag ggc gtc acc tcc ggt ggc tcg ggc aac tgc cgc acc ggt          1086
Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Arg Thr Gly
            155                 160                 165
ggc acg acc tac tac cag gag gtc aac ccc atg ctc aac agc tgg ggc          1134
Gly Thr Thr Tyr Tyr Gln Glu Val Asn Pro Met Leu Asn Ser Trp Gly
        170                 175                 180
ctg cgt ctg cgc acc tga                                                  1152
Leu Arg Leu Arg Thr
    185
<210>26
<211>383
<212>PRT
<213>Nocardiopsis alkaliphila DSM 44657
<400>26
Met Arg Pro Ser Pro Val Val Ser Ala Ile Gly Thr Gly Ala Leu
-195                -190                -185
Ala Phe Gly Leu Ala Leu Gly Thr Ser Pro Ala Ala Ile Ala Ala
-180                -175                -170
Pro Ala Pro Gln Ser Pro Asp Thr Glu Thr Gln Ala Glu Ala Val
-165                -160                -155
Thr Met Ala Glu Ala Leu Gln Arg Asp Leu Gly Leu Ser Ser Ser
-150                -145                -140
Glu Ala Thr Glu Leu Leu Ala Ala Gln Ala Glu Ala Phe Glu Val
-135                -130                -125
Asp Glu Ala Ala Thr Glu Ala Ala Ala Asp Ala Tyr Gly Gly Ser
-120                -115                -110
Leu Phe Asp Thr Asp Ser Leu Glu Leu Thr Val Leu Val Thr Asp Ser
-105                -100                -95                 -90
Ala Ala Val Asp Ala Val Glu Ala Thr Gly Ala Lys Ala Glu Val Val
                -85                 -80                 -75
Asp His Gly Ile Glu Gly Leu Glu Glu Ile Val Asp Glu Leu Asn Glu
            -70                 -65                 -60
Ser Asn Ala Lys Ser Gly Val Val Gly Trp Tyr Pro Asp Val Ala Gly
        -55                 -50                 -45
Asp Thr Val Val Leu Glu Val Met Glu Gly Ser Glu Ala Asp Val Asp
    -40                 -35                 -30
Ala Leu Leu Ala Glu Thr Gly Val Asp Ala Ala Asp Val Thr Val Glu
-25                 -20                 -15                 -10
Thr Thr Thr Glu Gln Pro Glu Leu Tyr Ala Asp Ile Ile Gly Gly Leu
                -5              -1  1               5
Ala Tyr Thr Met Gly Gly Arg Cys Ser Val Gly Phe Ala Ala Thr Asn
        10                  15                  20
Ser Ser Gly Gln Pro Gly Phe Val Thr Ala Gly His Cys Gly Ser Val
    25                  30                  35
Gly Thr Gly Val Thr Ile Gly Asn Gly Arg Gly Val Phe Glu Arg Ser
40                  45                  50                  55
Ile Phe Pro Gly Asn Asp Ala Ala Phe Val Arg Gly Thr Ser Asn Phe
                60                  65                  70
Thr Leu Thr Asn Leu Val Ser Arg Tyr Asn Ser Gly Gly Tyr Ala Thr
            75                  80                  85
Val Ser Gly Ser Ser Ala Ala Pro Ile Gly Ser Gln Val Cys Arg Ser
        90                  95                  100
Gly Ser Thr Thr Gly Trp His Cys Gly Thr Ile Gln Ala Arg Asn Gln
    105                 110                 115
Thr Val Arg Tyr Pro Gln Gly Thr Val Gln Ala Leu Thr Arg Thr Ser
120                 125                 130                 135
Val Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Phe Ile Ser Gly Ser
                140                 145                 150
Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Arg Thr Gly
            155                 160                 165
Gly Thr Thr Tyr Tyr Gln Glu Val Asn Pro Met Leu Asn Ser Trp Gly
        170                 175                 180
Leu Arg Leu Arg Thr
    185
<210>27
<211>1155
<212>DNA
<213>Nocardiopsis lucentis DSM 44048
<220>
<221>CDS
<222>(1)..(1152)
<220>
<221>sig_peptide
<222>(1)..(87)
<220>
<221>mat_peptide
<222>(586)..(1152)
<400>27
atg cga ccc tcc ccc gtt atc tcc gcc cta gga acc ggc gcc ctc                45
Met Arg Pro Ser Pro Val Ile Ser Ala Leu Gly Thr Gly Ala Leu
-195                -190                -185
gcc ttc gga ctg gtc atc acc atg gcc ccg ggc gtg aac gcc gga                90
Ala Phe Gly Leu Val Ile Thr Met Ala Pro Gly Val Asn Ala Gly
-180                -175                -170
acc gta ccc acc ccc cag gcc ccc gtc ccc gac gac gag gcc acc               135
Thr Val Pro Thr Pro Gln Ala Pro Val Pro Asp Asp Glu Ala Thr
-165                -160                -155
acc atg ctc gaa gcc atg gag agg gat ctc gac ctc acc ccg ttc               180
Thr Met Leu Glu Ala Met Glu Arg Asp Leu Asp Leu Thr Pro Phe
-150                -145                -140
gag gcc gag gaa ctc ttc gag gca cag gaa gag gcc atc gac ctc               225
Glu Ala Glu Glu Leu Phe Glu Ala Gln Glu Glu Ala Ile Asp Leu
-135                -130                -125
gac gag gag gcc acc gaa gcg gcc ggt gcg gcc tac ggc ggt tcg               270
Asp Glu Glu Ala Thr Glu Ala Ala Gly Ala Ala Tyr Gly Gly Ser
-120                -115                -110
ctc ttc gac acc gaa acc cac gaa ctc acc gtc ctg gtg acc gac gtc           318
Leu Phe Asp Thr Glu Thr His Glu Leu Thr Val Leu Val Thr Asp Val
-105                -100                -95                 -90
gac gcg gtc gag gce gtg gag gcc acc gga gcc gcc gcc gag gtc gtc           366
Asp Ala Val Glu Ala Val Glu Ala Thr Gly Ala Ala Ala Glu Val Val
                -85                 -80                 -75
tcc cac ggc tcc gac ggt ctg gcc gac atc gtc gag gac ctc aac gcc           414
Ser His Gly Ser Asp Gly Leu Ala Asp Ile Val Glu Asp Leu Asn Ala
            -70                 -65                 -60
acc gac gcc ggc agc gag gtc gtg ggc tgg tac ccc gac gtc acc agc           462
Thr Asp Ala Gly Ser Glu Val Val Gly Trp Tyr Pro Asp Val Thr Ser
        -55                 -50                 -45
gac agc gtg gtc gtc gag gtg gtc gag ggc tcc gac gtc gac gtc gac           510
Asp Ser Val Val Val Glu Val Val Glu Gly Ser Asp Val Asp Val Asp
    -40                 -35                 -30
tcc atc gtc gag ggc acg ggc gtc gac ccg gcg gtc atc gag gtc cag           558
Ser Ile Val Glu Gly Thr Gly Val Asp Pro Ala Val Ile Glu Val Gln
-25                 -20                 -15                 -10
gag gtc tcc gaa cag cct cag acc tac gcc aac atc atc ggc ggc ctg           606
Glu Val Ser Glu Gln Pro Gln Thr Tyr Ala Asn Ile Ile Gly Gly Leu
                -5              -1  1               5
gcc tac tac atg agc tcg ggc ggc cgc tgc tcg gtc ggc ttc ccc gcc           654
Ala Tyr Tyr Met Ser Ser Gly Gly Arg Cys Ser Val Gly Phe Pro Ala
        10                  15                  20
acc aac agc tcc ggc cag ccg ggc ttc gtc acg gcg ggc cac tgc ggc           702
Thr Asn Ser Ser Gly Gln Pro Gly Phe Val Thr Ala Gly His Cys Gly
    25                  30                  35
acc gtc ggc acc ggc gtc acc atc ggc aac ggc cgc ggc acc ttc gag           750
Thr Val Gly Thr Gly Val Thr Ile Gly Asn Gly Arg Gly Thr Phe Glu
40                  45                  50                  55
cgc tcc gtg ttc ccc ggc aac gac gcc gcc ttc gtc cga ggc acg tcc           798
Arg Ser Val Phe Pro Gly Asn Asp Ala Ala Phe Val Arg Gly Thr Ser
                60                  65                  70
aac ttc acg ctg tac aac ctc gtc tac cgc tac agc ggc tac cag acc           846
Asn Phe Thr Leu Tyr Asn Leu Val Tyr Arg Tyr Ser Gly Tyr Gln Thr
            75                  80                  85
gtg acg ggc agc aac gcc gcc ccg atc ggc tcg tcc atc tgc cgt tcc           894
Val Thr Gly Ser Asn Ala Ala Pro Ile Gly Ser Ser Ile Cys Arg Ser
        90                  95                  100
ggt tcc acc acc ggc tgg cac tgc ggc acc atc cag gcc cgc aac cag           942
Gly Ser Thr Thr Gly Trp His Cys Gly Thr Ile Gln Ala Arg Asn Gln
    105                 110                 115
acc gtc cgg tac ecg cag ggc acc gtc tac tac ctg acc cgt acc aac           990
Thr Val Arg Tyr Pro Gln Gly Thr Val Tyr Tyr Leu Thr Arg Thr Asn
120                 125                 130                 135
gtg tgc gcc gag ccc ggc gac tcc gga ggc tcc ttc atc tcc gga acg          1038
Val Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Phe Ile Ser Gly Thr
                140                 145                 150
cag gcc cag ggc atg acc tcc ggc ggc tcc ggc aac tgc agc agc ggt          1086
Gln Ala Gln Gly Met Thr Ser Gly Gly Ser Gly Asn Cys Ser Ser Gly
            155                 160                 165
ggc acc acc ttc tac cag gag gtg gac ccg gtg gag agc gcc tgg ggc          1134
Gly Thr Thr Phe Tyr Gln Glu Val Asp Pro Val Glu Ser Ala Trp Gly
        170                 175                 180
gtg cga ctg cgc acc agc tag                                              1155
Val Arg Leu Arg Thr Ser
    185
<210>28
<211>384
<212>PRT
<213>Nocardiopsis lucentis DSM 44048
<400>28
Met Arg Pro Ser Pro Val Ile Ser Ala Leu Gly Thr Gly Ala Leu
-195                -190                -185
Ala Phe Gly Leu Val Ile Thr Met Ala Pro Gly Val Asn Ala Gly
-180                -175                -170
Thr Val Pro Thr Pro Gln Ala Pro Val Pr0 Asp Asp Glu Ala Thr
-165                -160                -155
Thr Met Leu Glu Ala Met Glu Arg Asp Leu Asp Leu Thr Pro Phe
-150                -145                -140
Glu Ala Glu Glu Leu Phe Glu Ala Gln Glu Glu Ala I1e Asp Leu
-135                -130                -125
Asp Glu Glu Ala Thr Glu Ala Ala Gly Ala Ala Tyr Gly Gly Ser
-120                -115                -110
Leu Phe Asp Thr Glu Thr His Glu Leu Thr Val Leu Val Thr Asp Val
-105                -100                -95                 -90
Asp Ala Val Glu Ala Val Glu Ala Thr Gly Ala Ala Ala Glu Val Val
                -85                 -80                 -75
Ser His Gly Ser Asp Gly Leu Ala Asp Ile Val Glu Asp Leu Asn Ala
            -70                 -65                 -60
Thr Asp Ala Gly Ser Glu Val Val Gly Trp Tyr Pro Asp Val Thr Ser
        -55                 -50                 -45
Asp Ser Val Val Val Glu Val Val Glu Gly Ser Asp Val Asp Val Asp
    -40                 -35                 -30
Ser Ile Val Glu Gly Thr Gly Val Asp Pro Ala Val Ile Glu Val Gln
-25                 -20                 -15                 -10
Glu Val Ser Glu Gln Pro Gln Thr Tyr Ala Asn Ile Ile Gly Gly Leu
                -5              -1  1               5
Ala Tyr Tyr Met Ser Ser Gly Gly Arg Cys Ser Val Gly Phe Pro Ala
        10                  15                  20
Thr Asn Ser Ser Gly Gln Pro Gly Phe Val Thr Ala Gly His Cys Gly
    25                  30                  35
Thr VaI Gly Thr Gly Val Thr Ile Gly Asn Gly Arg Gly Thr Phe Glu
40                  45                  50                  55
Arg Ser Val Phe Pro Gly Asn Asp Ala Ala Phe Val Arg Gly Thr Ser
                60                  65                  70
Asn Phe Thr Leu Tyr Asn Leu Val Tyr Arg Tyr Ser Gly Tyr Gln Thr
            75                  80                  85
Val Thr Gly Ser Asn Ala Ala Pro Ile Gly Ser Ser Ile Cys Arg Ser
        90                  95                  100
Gly Ser Thr Thr Gly Trp His Cys Gly Thr Ile Gln Ala Arg Asn Gln
    105                 110                 115
Thr Val Arg Tyr Pro Gln Gly Thr Val Tyr Tyr Leu Thr Arg Thr Asn
120                 125                 130                 135
Val Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Phe Ile Ser Gly Thr
                140                 145                 150
Gln Ala Gln Gly Met Thr Ser Gly Gly Ser Gly Asn Cys Ser Ser Gly
            155                 160                 165
Gly Thr Thr Phe Tyr Gln Glu Val Asp Pro Val Glu Ser Ala Trp Gly
        170                 175                 180
Val Arg Leu Arg Thr Ser
    185
<210>29
<211>1068
<212>DNA
<213>Nocardiopsis alba DSM 15647
<220>
<221>CDS
<222>(1)..(1065)
<220>
<221>mat_peptide
<222>(502)..(1065)
<400>29
gcg acc ggc ccc ctc ccc cag tcc ccc acc ccg gat gaa gcc gag                45
Ala Thr Gly Pro Leu Pro Gln Ser Pro Thr Pro Asp Glu Ala Glu
        -165                -160                -155
gcc acc acc atg gtc gag gcc ctc cag cgc gac ctc ggc ctg tcc                90
Ala Thr Thr Met Val Glu Ala Leu Gln Arg Asp Leu Gly Leu Ser
        -150                -145                -140
ccc tct cag gcc gac gag ctc ctc gag gcg cag gcc gag tcc ttc               135
Pro Ser Gln Ala Asp Glu Leu Leu Glu Ala Gln Ala Glu Ser Phe
        -135                -130                -125
gag atc gac gag gcc gcc acc gcg gcc gca gcc gac tcc tac ggc               180
Glu Ile Asp Glu Ala Ala Thr Ala Ala Ala Ala Asp Ser Tyr Gly
        -120                -115                -110
ggc tcc atc ttc gac acc gac agc ctc acc ctg acc gtc ctg gtc acc           228
Gly Ser Ile Phe Asp Thr Asp Ser Leu Thr Leu Thr Val Leu Val Thr
        -105                -100                -95
gac gcc tcc gcc gtc gag gcg gtc gag gcc gcc ggc gcc gag gcc aag           276
Asp Ala Ser Ala Val Glu Ala Val Glu Ala Ala Gly Ala Glu Ala Lys
    -90                 -85                 -80
gtg gtc tcg cac ggc atg gag ggc ctg gag gag atc gtc gcc gac ctg           324
Val Val Ser His Gly Met Glu Gly Leu Glu Glu Ile Val Ala Asp Leu
-75                 -70                 -65                 -60
aac gcg gcc gac gct cag ccc ggc gtc gtg ggc tgg tac ccc gac atc           372
Asn Ala Ala Asp Ala Gln Pro Gly Val Val Gly Trp Tyr Pro Asp Ile
                -55                 -50                 -45
cac tcc gac acg gtc gtc ctc gag gtc ctc gag ggc tcc ggt gcc gac           420
His Ser Asp Thr Val Val Leu Glu Val Leu Glu Gly Ser Gly Ala Asp
            -40                 -35                 -30
gtg gac tcc ctg ctc gcc gac gcc ggt gtg gac acc gcc gac gtc aag           468
Val Asp Ser Leu Leu Ala Asp Ala Gly Val Asp Thr Ala Asp Val Lys
        -25                 -20                 -15
gtg gag agc acc acc gag cag ccc gag ctg tac gcc gac atc atc ggc           516
Val Glu Ser Thr Thr Glu Gln Pro Glu Leu Tyr Ala Asp Ile Ile Gly
    -10                 -5              -1  1               5
ggt ctc gcc tac acc atg ggt ggg cgc tgc tcg gtc ggc ttc gcg gcc           564
Gly Leu Ala Tyr Thr Met Gly Gly Arg Cys Ser Val Gly Phe Ala Ala
                10                  15                  20
acc aac gcc tcc ggc cag ccc ggg ttc gtc acc gcc ggc cac tgc ggc           612
Thr Asn Ala Ser Gly Gln Pro Gly Phe Val Thr Ala Gly His Cys Gly
            25                  30                  35
acc gtc ggc acc ccg gtc agc atc ggc aac ggc cag ggc gtc ttc gag           660
Thr Val Gly Thr Pro Val Ser Ile Gly Asn Gly Gln Gly Val Phe Glu
        40                  45                  50
cgt tcc gtc ttc ccc ggc aac gac tcc gcc ttc gtc cgc ggc acc tcg           708
Arg Ser Val Phe Pro Gly Asn Asp Ser Ala Phe Val Arg Gly Thr Ser
    55                  60                  65
aac ttc acc ctg acc aac ctg gtc agc cgc tac aac acc ggt ggt tac           756
Asn Phe Thr Leu Thr Asn Leu Val Ser Arg Tyr Asn Thr Gly Gly Tyr
70                  75                  80                  85
gcg acc gtc tcc ggc tcc tcg cag gcg gcg atc ggc tcg cag atc tgc           804
Ala Thr Val Ser Gly Ser Ser Gln Ala Ala Ile Gly Ser Gln Ile Cys
                90                  95                  100
cgt tcc ggc tcc acc acc ggc tgg cac tgc ggc acc gtc cag gcc cgc           852
Arg Ser Gly Ser Thr Thr Gly Trp His Cys Gly Thr Val Gln Ala Arg
            105                 110                 115
ggc cag acg gtg agc tac ccc cag ggc acc gtg cag aac ctg acc cgc           900
Gly Gln Thr Val Ser Tyr Pro Gln Gly Thr Val Gln Asn Leu Thr Arg
        120                 125                 130
acc aac gtc tgc gcc gag ccc ggt gac tcc ggc ggc tcc ttc atc tcc           948
Thr Asn Val Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Phe Ile Ser
    135                 140                 145
ggc agc cag gcc cag ggc gtc acc tcc ggt ggc tcc ggc aac tgc tcc           996
Gly Ser Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Ser
150                 155                 160                 165
ttc ggt ggc acc acc tac tac cag gag gtc aac ccg atg ctg agc agc          1044
Phe Gly Gly Thr Thr Tyr Tyr Gln Glu Val Asn Pro Met Leu Ser Ser
                170                 175                 180
tgg ggt ctg acc ctg cgc acc tga                                          1068
Trp Gly Leu Thr Leu Arg Thr
            185
<210>30
<211>355
<212>PRT
<213>Nocardiopsis alba DSM 15647
<400>30
Ala Thr Gly Pro Leu Pro Gln Ser Pro Thr Pro Asp Glu Ala Glu
        -165                -160                -155
Ala Thr Thr Met Val Glu Ala Leu Gln Arg Asp Leu Gly Leu Ser
        -150                -145                -140
Pro Ser Gln Ala Asp Glu Leu Leu Glu Ala Gln Ala Glu Ser Phe
        -135                -130                -125
Glu Ile Asp Glu Ala Ala Thr Ala Ala Ala Ala Asp Ser Tyr Gly
        -120                -115                -110
Gly Ser Ile Phe Asp Thr Asp Ser Leu Thr Leu Thr Val Leu Val Thr
        -105                -100                -95
Asp Ala Ser Ala Val Glu Ala Val Glu Ala Ala Gly Ala Glu Ala Lys
    -90                 -85                 -80
Val Val Ser His Gly Met Glu Gly Leu Glu Glu Ile Val Ala Asp Leu
-75                 -70                 -65                 -60
Asn Ala Ala Asp Ala Gln Pro Gly Val Val Gly Trp Tyr Pro Asp Ile
                -55                 -50                 -45
His Ser Asp Thr Val Val Leu Glu Val Leu Glu Gly Ser Gly Ala Asp
            -40                 -35                 -30
Val Asp Ser Leu Leu Ala Asp Ala Gly Val Asp Thr Ala Asp Val Lys
        -25                 -20                 -15
Val Glu Ser Thr Thr Glu Gln Pro Glu Leu Tyr Ala Asp Ile Ile Gly
    -10                 -5              -1  1               5
Gly Leu Ala Tyr Thr Met Gly Gly Arg Cys Ser Val Cly Phe Ala Ala
                10                  15                  20
Thr Asn Ala Ser Gly Gln Pro Gly Phe Val Thr Ala Gly His Cys Gly
            25                  30                  35
Thr Val Gly Thr Pro Val Ser Ile Gly Asn Gly Gln Gly Val Phe Glu
        40                  45                  50
Arg Ser Val Phe Pro Gly Asn Asp Ser Ala Phe Val Arg Gly Thr Ser
    55                  60                  65
Asn Phe Thr Leu Thr Asn Leu Val Ser Arg Tyr Asn Thr Gly Gly Tyr
70                  75                  80                  85
Ala Thr Val Ser Gly Ser Ser Gln Ala Ala Ile Gly Ser Gln Ile Cys
                90                  95                  100
Arg Ser Gly Ser Thr Thr Gly Trp His Cys Gly Thr Val Gln Ala Arg
            105                 110                 115
Gly Gln Thr Val Ser Tyr Pro Gln Gly Thr Val Gln Asn Leu Thr Arg
        120                 125                 130
Thr Asn Val Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Phe Ile Ser
    135                 140                 145
Gly Ser Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Ser
150                 155                 160                 165
Phe Gly Gly Thr Thr Tyr Tyr Gln Glu Val Asn Pro Met Leu Ser Ser
                170                 175                 180
Trp Gly Leu Thr Leu Arg Thr
            185
<210>31
<211>1062
<212>DNA
<213>Nocardiopsis prasina DSM 15648
<220>
<221>CDS
<222>(1)..(1059)
<220>
<221>mat_peptide
<222>(496)..(1059)
<400>31
gcc acc gga ccg ctc ccc cag tca ccc acc ccg gag gcc gac gcc                45
Ala Thr Gly Pro Leu Pro Gln Ser Pro Thr Pro Glu Ala Asp Ala
-165                -160                -155
gtc tcc atg cag gag gcg ctc cag cgc gac ctc ggc ctg acc ccg                90
Val Ser Met Gln Glu Ala Leu Gln Arg Asp Leu Gly Leu Thr Pro
-150                -145                -140
ctt gag gcc gat gaa ctg ctg gcc gcc cag gac acc gcc ttc gag               135
Leu Glu Ala Asp Glu Leu Leu Ala Ala Gln Asp Thr Ala Phe Glu
-135                -130                -125
gtc gac gag gcc gcg gcc gcg gcc gcc ggg gac gcc tac ggc ggc               180
Val Asp Glu Ala Ala Ala Ala Ala Ala Gly Asp Ala Tyr Gly Gly
-120                -115                -110
tcc gtc ttc gac acc gag acc ctg gaa ctg acc gtc ctg gtc acc gac           228
Ser Val Phe Asp Thr Glu Thr Leu Glu Leu Thr Val Leu Val Thr Asp
-105                -100                -95                 -90
gcc gcc tcg gtc gag gct gtg gag gcc acc ggc gcg ggt acc gaa ctc           276
Ala Ala Ser Val Glu Ala Val Glu Ala Thr Gly Ala Gly Thr Glu Leu
                -85                 -80                 -75
gtc tcc tac ggc atc gag ggc ctc gac gag atc atc cag gat ctc aac           324
Val Ser Tyr Gly Ile Glu Gly Leu Asp Glu Ile Ile Gln Asp Leu Asn
            -70                 -65                 -60
gcc gcc gac gcc gtc ccc ggc gtg gtc ggc tgg tac ccg gac gtg gcg           372
Ala Ala Asp Ala Val Pro Gly Val Val Gly Trp Tyr Pro Asp Val Ala
        -55                 -50                 -45
ggt gac acc gtc gtc ctg gag gtc ctg gag ggt tcc gga gcc gac gtg           420
Gly Asp Thr Val Val Leu Glu Val Leu Glu Gly Ser Gly Ala Asp Val
    -40                 -35                 -30
agc ggc ctg ctc gcc gac gcc ggc gtg gac gcc tcg gcc gtc gag gtg           468
Ser Gly Leu Leu Ala Asp Ala Gly Val Asp Ala Ser Ala Val Glu Val
-25                 -20                 -15                 -10
acc agc agt gcg cag ccc gag ctc tac gcc gac atc atc ggc ggt ctg           516
Thr Ser Ser Ala Gln Pro Glu Leu Tyr Ala Asp Ile Ile Gly Gly Leu
                -5              -1  1               5
gcc tac acc atg ggc ggc cgc tgt tcg gtc gga ttc gcg gcc acc aac           564
Ala Tyr Thr Met Gly Gly Arg Cys Ser Val Gly Phe Ala Ala Thr Asn
        10                  15                  20
gcc gcc ggt cag ccc gga ttc gtc acc gcc ggt cac tgt ggc cgc gtg           612
Ala Ala Gly Gln Pro Gly Phe Val Thr Ala Gly His Cys Gly Arg Val
    25                  30                  35
ggc acc cag gtg agc atc ggc aac ggc cag ggc gtc ttc gag cag tcc           660
Gly Thr Gln Val Ser Ile Gly Asn Gly Gln Gly Val Phe Glu Gln Ser
40                  45                  50                  55
atc ttc ccg ggc aac gac gcc gcc ttc gtc cgc ggc acg tcc aac ttc           708
Ile Phe Pro Gly Asn Asp Ala Ala Phe Val Arg Gly Thr Ser Asn Phe
                60                  65                  70
acg ctg acc aac ctg gtc agc cgc tac aac acc ggc ggt tac gcc acc           756
Thr Leu Thr Asn Leu Val Ser Arg Tyr Asn Thr Gly Gly Tyr Ala Thr
            75                  80                  85
gtc gcc ggc cac aac cag gcg ccc atc ggc tcc tcc gtc tgc cgc tcc           804
Val Ala Gly His Asn Gln Ala Pro Ile Gly Ser Ser Val Cys Arg Ser
        90                  95                  100
ggc tcc acc acc ggc tgg cac tgc ggc acc atc cag gcc cgc ggc cag           852
Gly Ser Thr Thr Gly Trp His Cys Gly Thr Ile Gln Ala Arg Gly Gln
    105                 110                 115
tcg gtg agc tac ccc gag ggc acc gtc acc aac atg acc cgg acc acc           900
Ser Val Ser Tyr Pro Glu Gly Thr Val Thr Asn Met Thr Arg Thr Thr
120                 125                 130                 135
gtg tgc gcc gag ccc ggc gac tcc ggc ggc tcc tac atc tcc ggc aac           948
Val Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Tyr Ile Ser Gly Asn
                140                 145                 150
cag gcc cag ggc gtc acc tcc ggc ggc tcc ggc aac tgc cgc acc ggc           996
Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Arg Thr Gly
            155                 160                 165
ggg acc acc ttc tac cag gag gtc acc ccc atg gtg aac tcc tgg ggc          1044
Gly Thr Thr Phe Tyr Gln Glu Val Thr Pro Met Val Asn Ser Trp Gly
        170                 175                 180
gtc cgt ctc cgg acc taa                                                  1062
Val Arg Leu Arg Thr
    185
<210>32
<211>353
<212>PRT
<213>Nocardiopsis prasina DSM 15648
<400>32
Ala Thr Gly Pro Leu Pro Gln Ser Pro Thr Pro Glu Ala Asp Ala
-165                -160                -155
Val Ser Met Gln Glu Ala Leu Gln Arg Asp Leu Gly Leu Thr Pro
-150                -145                -140
Leu Glu Ala Asp Glu Leu Leu Ala Ala Gln Asp Thr Ala Phe Glu
-135                -130                -125
Val Asp Glu Ala Ala Ala Ala Ala Ala Gly Asp Ala Tyr Gly Gly
-120                -115                -110
Ser Val Phe Asp Thr Glu Thr Leu Glu Leu Thr Val Leu Val Thr Asp
-105                -100                -95                 -90
Ala Ala Ser Val Glu Ala Val Glu Ala Thr Gly Ala Gly Thr Glu Leu
                -85                 -80                 -75
Val Ser Tyr Gly Ile Glu Gly Leu Asp Glu Ile Ile Gln Asp Leu Asn
            -70                 -65                 -60
Ala Ala Asp Ala Val Pro Gly Val Val Gly Trp Tyr Pro Asp Val Ala
        -55                 -50                 -45
Gly Asp Thr Val Val Leu Glu Val Leu Glu Gly Ser Gly Ala Asp Val
    -40                 -35                 -30
Ser Gly Leu Leu Ala Asp Ala Gly Val Asp Ala Ser Ala Val Glu Val
-25                 -20                 -15                 -10
Thr Ser Ser Ala Gln Pro Glu Leu Tyr Ala Asp Ile Ile Gly Gly Leu
                -5              -1  1               5
Ala Tyr Thr Met Gly Gly Arg Cys Ser Val Gly Phe Ala Ala Thr Asn
        10                  15                  20
Ala Ala Gly Gln Pro Gly Phe Val Thr Ala Gly His Cys Gly Arg Val
    25                  30                  35
Gly Thr Gln Val Ser Ile Gly Asn Gly Gln Gly Val Phe Glu Gln Ser
40                  45                  50                  55
Ile Phe Pro Gly Asn Asp Ala Ala Phe Val Arg Gly Thr Ser Asn Phe
                60                  65                  70
Thr Leu Thr Asn Leu Val Ser Arg Tyr Asn Thr Gly Gly Tyr Ala Thr
            75                  80                  85
Val Ala Gly His Asn Gln Ala Pro Ile Gly Ser Ser Val Cys Arg Ser
        90                  95                  100
Gly Ser Thr Thr Gly Trp His Cys Gly Thr Ile Gln Ala Arg Gly Gln
    105                 110                 115
Ser Val Ser Tyr Pro Glu Gly Thr Val Thr Asn Met Thr Arg Thr Thr
120                 125                 130                 135
Val Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Tyr Ile Ser Gly Asn
                140                 145                 150
Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Arg Thr Gly
            155                 160                 165
Gly Thr Thr Phe Tyr Gln Glu Val Thr Pro Met Val Asn Ser Trp Gly
        170                 175                 180
Val Arg Leu Arg Thr
    185
<210>33
<211>1065
<212>DNA
<213>达松维尔拟诺卡氏菌达松维尔亚种DSM 43235
<220>
<221>CDS
<222>(1)..(1062)
<220>
<221>mat_peptide
<222>(499)..(1062)
<400>33
gct ccg gcc ccc gtc ccc cag acc ccc gtc gcc gac gac agc gcc                45
Ala Pro Ala Pro Val Pro Gln Thr Pro Val Ala Asp Asp Ser Ala
    -165                -160                -155
gcc agc atg acc gag gcg ctc aag cgc gac ctc gac ctc acc tcg                90
Ala Ser Met Thr Glu Ala Leu Lys Arg Asp Leu Asp Leu Thr Ser
    -150                -145                -140
gcc gag gcc gag gag ctt ctc tcg gcg cag gaa gcc gcc atc gag               135
Ala Glu Ala Glu Glu Leu Leu Set Ala Gln Glu Ala Ala Ile Glu
    -135                -130                -125
acc gac gcc gag gcc acc gag gcc gcg ggc gag gcc tac ggc ggc               180
Thr Asp Ala Glu Ala Thr Glu Ala Ala Gly Glu Ala Tyr Gly Gly
    -120                -115                -110
tca ctg ttc gac acc gag acc ctc gaa ctc acc gtg ctg gtc acc gac           228
Ser Leu Phe Asp Thr Glu Thr Leu Glu Leu Thr Val Leu Val Thr Asp
    -105                -100                -95
gcc tcc gcc gtc gag gcg gtc gag gcc acc gga gcc cag gcc acc gtc           276
Ala Ser Ala Val Glu Ala Val Glu Ala Thr Gly Ala Gln Ala Thr Val
-90                 -85                 -80                 -75
gtc tcc cac ggc acc gag ggc ctg acc gag gtc gtg gag gac ctc aac           324
Val Ser His Gly Thr Glu Gly Leu Thr Glu Val Val Glu Asp Leu Asn
                -70                 -65                 -60
ggc gcc gag gtt ccc gag agc gtc ctc ggc tgg tac ccg gac gtg gag           372
Gly Ala Glu Val Pro Glu Ser Val Leu Gly Trp Tyr Pro Asp Val Glu
            -55                 -50                 -45
agc gac acc gtc gtg gtc gag gtg ctg gag ggc tcc gac gcc gac gtc           420
Ser Asp Thr Val Val Val Glu Val Leu Glu Gly Ser Asp Ala Asp Val
        -40                 -35                 -30
gcc gcc ctg ctc gcc gac gcc ggt gtg gac tcc tcc tcg gtc cgg gtg           468
Ala Ala Leu Leu Ala Asp Ala Gly Val Asp Ser Ser Ser Val Arg Val
    -25                 -20                 -15
gag gag gcc gag gag gcc ccg cag gtc tac gcc gac atc atc ggc ggc           516
Glu Glu Ala Glu Glu Ala Pro Gln Val Tyr Ala Asp Ile Ile Gly Gly
-10                 -5              -1  1               5
ctg gcc tac tac atg ggc ggc cgc tgc tcc gtc ggc ttc gcc gcg acc           564
Leu Ala Tyr Tyr Met Gly Gly Arg Cys Ser Val Gly Phe Ala Ala Thr
            10                  15                  20
aac agc gcc ggt cag ccc ggt ttc gtc acc gcc ggc cac tgc ggc acc           612
Asn Ser Ala Gly Gln Pro Gly Phe Val Thr Ala Gly His Cys Gly Thr
        25                  30                  35
gtc ggc acc ggc gtg acc atc ggc aac ggc acc ggc acc ttc cag aac           660
Val Gly Thr Gly Val Thr Ile Gly Asn Gly Thr Gly Thr Phe Gln Asn
    40                  45                  50
tcg gtc ttc ccc ggc aac gac gcc gcc ttc gtc cgc ggc acc tcc aac           708
Ser Val Phe Pro Gly Asn Asp Ala Ala Phe Val Arg Gly Thr Ser Asn
55                  60                  65                  70
ttc acc ctg acc aac ctg gtc tcg cgc tac aac tcc ggc ggc tac cag           756
Phe Thr Leu Thr Asn Leu Val Ser Arg Tyr Asn Ser Gly Gly Tyr Gln
                75                  80                  85
tcg gtg acc ggt acc agc cag gcc ccg gcc ggc tcg gcc gtg tgc cgc           804
Ser Val Thr Gly Thr Ser Gln Ala Pro Ala Gly Ser Ala Val Cys Arg
            90                  95                  100
tcc ggc tcc acc acc ggc tgg cac tgc ggc acc atc cag gcc cgc aac           852
Ser Gly Ser Thr Thr Gly Trp His Cys Gly Thr Ile Gln Ala Arg Asn
        105                 110                 115
cag acc gtg cgc tac ccg cag ggc acc gtc tac tcg ctc acc cgc acc           900
Gln Thr Val Arg Tyr Pro Gln Gly Thr Val Tyr Ser Leu Thr Arg Thr
    120                 125                 130
aac gtg tgc gcc gag ccc ggc gac tcc ggc ggt tcg ttc atc tcc ggc           948
Asn Val Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Phe Ile Ser Gly
135                 140                 145                 150
tcg cag gcc cag ggc gtc acc tcc ggc ggc tcc ggc aac tgc tcc gtc           996
Ser Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Ser Val
                155                 160                 165
ggc ggc acg acc tac tac cag gag gtc acc ccg atg atc aac tcc tgg          1044
Gly Gly Thr Thr Tyr Tyr Gln Glu Val Thr Pro Met Ile Asn Ser Trp
            170                 175                 180
ggt gtc agg atc cgg acc taa                                              1065
Gly Val Arg Ile Arg Thr
        185
<210>34
<211>354
<212>PRT
<213>达松维尔拟诺卡氏菌达松维尔亚种DSM 43235
<400>34
Ala Pro Ala Pro Val Pro Gln Thr Pro Val Ala Asp Asp Ser Ala
    -165                -160                -155
Ala Ser Met Thr Glu Ala Leu Lys Arg Asp Leu Asp Leu Thr Ser
    -150                -145                -140
Ala Glu Ala Glu Glu Leu Leu Ser Ala Gln Glu Ala Ala Ile Glu
    -135                -130                -125
Thr Asp Ala Glu Ala Thr Glu Ala Ala Gly Glu Ala Tyr Gly Gly
    -120                -115                -110
Ser Leu Phe Asp Thr Glu Thr Leu Glu Leu Thr Val Leu Val Thr Asp
    -105                -100                -95
Ala Ser Ala Val Glu Ala Val Glu Ala Thr Gly Ala Gln Ala Thr Val
-90                 -85                 -80                 -75
Val Ser His Gly Thr Glu Gly Leu Thr Glu Val Val Glu Asp Leu Asn
                -70                 -65                 -60
Gly Ala Glu Val Pro Glu Ser Val Leu Gly Trp Tyr Pro Asp Val Glu
            -55                 -50                 -45
Ser Asp Thr Val Val Val Glu Val Leu Glu Gly Ser Asp Ala Asp Val
        -40                 -35                 -30
Ala Ala Leu Leu Ala Asp Ala Gly Val Asp Ser Ser Ser Val Arg Val
    -25                 -20                 -15
Glu Glu Ala Glu Glu Ala Pro Gln Val Tyr Ala Asp Ile Ile Gly Gly
-10                 -5              -1  1               5
Leu Ala Tyr Tyr Met Gly Gly Arg Cys Ser Val Gly Phe Ala Ala Thr
            10                  15                  20
Asn Ser Ala Gly Gln Pro Gly Phe Val Thr Ala Gly His Cys Gly Thr
        25                  30                  35
Val Gly Thr Gly Val Thr Ile Gly Asn Gly Thr Gly Thr Phe Gln Asn
    40                  45                  50
Ser Val Phe Pro Gly Asn Asp Ala Ala Phe Val Arg Gly Thr Ser Asn
55                  60                  65                  70
Phe Thr Leu Thr Asn Leu Val Ser Arg Tyr Asn Ser Gly Gly Tyr Gln
                75                  80                  85
Ser Val Thr Gly Thr Set Gln Ala Pro Ala Gly Ser Ala Val Cys Arg
            90                  95                  100
Ser Gly Ser Thr Thr Gly Trp His Cys Gly Thr Ile Gln Ala Arg Asn
        105                 110                 115
Gln Thr Val Arg Tyr Pro Gln Gly Thr Val Tyr Ser Leu Thr Arg Thr
    120                 125                 130
Asn Val Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Phe Ile Ser Gly
135                 140                 145                 150
Ser Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Ser Val
                155                 160                 165
Gly Gly Thr Thr Tyr Tyr Gln Glu Val Thr Pro Met Ile Asn Ser Trp
            170                 175                 180
Gly Val Arg Ile Arg Thr
        185
<210>35
<211>1143
<212>DNA
<213>人工序列
<220>
<223>改良的合成蛋白酶基因
<220>
<221>CDS
<222>(1)..(1140)
<223>蛋白酶
<220>
<221>sig_peptide
<222>(1)..(81)
<220>
<221>mat_peptide
<222>(577)..(1140)
<400>35
atg aaa aaa ccg ctg gga aaa att gtc gca agc aca gca ctt ctt                45
Met Lys Lys Pro Leu Gly Lys Ile Val Ala Ser Thr Ala Leu Leu
        -190                -185                -180
att tca gtg gca ttt agc tca tct att gca tca gct gct acg gga                90
Ile Ser Val Ala Phe Ser Ser Ser Ile Ala Ser Ala Ala Thr Gly
        -175                -170                -165
gct tta ccg cag tct ccg aca ccg gaa gca gat gca gtg tca atg               135
Ala Leu Pro Gln Ser Pro Thr Pro Glu Ala Asp Ala Val Ser Met
        -160                -155                -150
caa gaa gca ctg caa aga gat ctt gat ctt aca tca gca gaa gca               180
Gln Glu Ala Leu Gln Arg Asp Leu Asp Leu Thr Ser Ala Glu Ala
        -145                -140                -135
gaa gaa ctt ctt gct gca caa gat aca gca ttt gaa gtg gat gaa               225
Glu Glu Leu Leu Ala Ala Gln Asp Thr Ala Phe Glu Val Asp Glu
        -130                -125                -120
gca gcg gca gaa gca gca gga gat gca tat ggc ggc tca gtt ttt               270
Ala Ala Ala Glu Ala Ala Gly Asp Ala Tyr Gly Gly Ser Val Phe
        -115                -110                -105
gat aca gaa tca ctt gaa ctt acg gtt ctt gtt aca gat gca gca gca           318
Asp Thr Glu Ser Leu Glu Leu Thr Val Leu Val Thr Asp Ala Ala Ala
        -100                -95                 -90
gtt gaa gca gtt gaa gca aca ggt gca gga aca gaa ctt gtt tca tat           366
Val Glu Ala Val Glu Ala Thr Gly Ala Gly Thr Glu Leu Val Ser Tyr
    -85                 -80                 -75
gga att gat ggc ctt gat gaa att gtt caa gaa ctg aat gca gct gat           414
Gly Ile Asp Gly Leu Asp Glu Ile Val Gln Glu Leu Asn Ala Ala Asp
-70                 -65                 -60                 -55
gct gtt ccg ggc gtt gtc ggc tgg tat ccg gat gtt gct gga gat aca           462
Ala Val Pro Gly Val Val Gly Trp Tyr Pro Asp Val Ala Gly Asp Thr
                -50                 -45                 -40
gtt gtc ctt gaa gtt ctt gaa gga tca ggc gca gat gtt tca ggc ctg           510
Val Val Leu Glu Val Leu Glu Gly Ser Gly Ala Asp Val Ser Gly Leu
            -35                 -30                 -25
ctg gca gat gca gga gtc gat gca tca gca gtt gaa gtt aca aca tca           558
Leu Ala Asp Ala Gly Val Asp Ala Ser Ala Val Glu Val Thr Thr Ser
        -20                 -15                 -10
gat caa ccg gaa ctt tat gca gat att att ggc ggc ctg gca tat aca           606
Asp Gln Pro Glu Leu Tyr Ala Asp Ile Ile Gly Gly Leu Ala Tyr Thr
    -5              -1  1               5                   10
atg ggc ggc aga tgc agc gtt ggc ttt gca gca aca aat gca gca ggc           654
Met Gly Gly Arg Cys Ser Val Gly Phe Ala Ala Thr Asn Ala Ala Gly
                15                  20                  25
caa ccg ggc ttt gtt aca gca ggc cat tgc ggc aga gtt ggc aca cag           702
Gln Pro Gly Phe Val Thr Ala Gly His Cys Gly Arg Val Gly Thr Gln
            30                  35                  40
gtt aca att ggc aat ggc aga ggc gtt ttt gaa caa agc gtt ttt ccg           750
Val Thr Ile Gly Asn Gly Arg Gly Val Phe Glu Gln Ser Val Phe Pro
        45                  50                  55
ggc aat gat gca gca ttt gtt aga ggc aca tca aat ttt aca ctt aca           798
Gly Asn Asp Ala Ala Phe Val Arg Gly Thr Ser Asn Phe Thr Leu Thr
    60                  65                  70
aat ctg gtt tca aga tat aat aca ggc ggc tat gca aca gtt gca ggc           846
Asn Leu Val Ser Arg Tyr Asn Thr Gly Gly Tyr Ala Thr Val Ala Gly
75                  80                  85                  90
cat aat caa gca ccg att ggc tca tca gtt tgc aga tca ggc tca aca           894
His Asn Gln Ala Pro Ile Gly Ser Ser Val Cys Arg Ser Gly Ser Thr
                95                  100                 105
aca ggc tgg cat tgc ggc aca att caa gca aga ggc caa agc gtt agc           942
Thr Gly Trp His Cys Gly Thr Ile Gln Ala Arg Gly Gln Ser Val Ser
            110                 115                 120
tat ccg gaa ggc aca gtt aca aat atg aca aga aca aca gtt tgt gca           990
Tyr Pro Glu Gly Thr Val Thr Asn Met Thr Arg Thr Thr Val Cys Ala
        125                 130                 135
gaa ccg ggc gat tca ggc ggc tca tat att agc ggc aca caa gca caa          1038
Glu Pro Gly Asp Ser Gly Gly Ser Tyr Ile Ser Gly Thr Gln Ala Gln
    140                 145                 150
ggc gtt aca tca ggc ggc tca ggc aat tgc aga aca ggc ggc aca aca          1086
Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Arg Thr Gly Gly Thr Thr
155                 160                 165                 170
ttt tac caa gaa gtt aca ccg atg gtt aat tca tgg ggc gtt aga ctt          1134
Phe Tyr Gln Glu Val Thr Pro Met Val Asn Ser Trp Gly Val Arg Leu
                175                 180                 185
aga aca taa                                                              1143
Arg Thr
<210>
<211>380
<212>PRT
<213>人工序列
<220>
<223>合成构建体
<400>36
Met Lys Lys Pro Leu Gly Lys Ile Val Ala Ser Thr Ala Leu Leu
        -190                -185                -180
Ile Ser Val Ala Phe Ser Ser Ser Ile Ala Ser Ala Ala Thr Gly
        -175                -170                -165
Ala Leu Pro Gln Ser Pro Thr Pro Glu Ala Asp Ala Val Ser Met
        -160                -155                -150
Gln Glu Ala Leu Gln Arg Asp Leu Asp Leu Thr Ser Ala Glu Ala
        -145                -140                -135
Glu Glu Leu Leu Ala Ala Gln Asp Thr Ala Phe Glu Val Asp Glu
        -130                -125                -120
Ala Ala Ala Glu Ala Ala Gly Asp Ala Tyr Gly Gly Ser Val Phe
        -115                -110                -105
Asp Thr Glu Ser Leu Glu Leu Thr Val Leu Val Thr Asp Ala Ala Ala
        -100                -95                 -90
Val Glu Ala Val Glu Ala Thr Gly Ala Gly Thr Glu Leu Val Ser Tyr
    -85                 -80                 -75
Gly Ile Asp Gly Leu Asp Glu Ile Val Gln Glu Leu Asn Ala Ala Asp
-70                 -65                 -60                 -55
Ala Val Pro Gly Val Val Gly Trp Tyr Pro Asp Val Ala Gly Asp Thr
                -50                 -45                 -40
Val Val Leu Glu Val Leu Glu Gly Ser Gly Ala Asp Val Ser Gly Leu
            -35                 -30                 -25
Leu Ala Asp Ala Gly Val Asp Ala Ser Ala Val Glu Val Thr Thr Ser
        -20                 -15                 -10
Asp Gln Pro Glu Leu Tyr Ala Asp Ile Ile Gly Gly Leu Ala Tyr Thr
    -5              -1  1               5                   10
Met Gly Gly Arg Cys Ser Val Gly Phe Ala Ala Thr Asn Ala Ala Gly
                15                  20                  25
Gln Pro Gly Phe Val Thr Ala Gly His Cys Gly Arg Val Gly Thr Gln
            30                  35                  40
Val Thr Ile Gly Asn Gly Arg Gly Val Phe Glu Gln Ser Val Phe Pro
        45                  50                  55
Gly Asn Asp Ala Ala Phe Val Arg Gly Thr Ser Asn Phe Thr Leu Thr
    60                  65                  70
Asn Leu Val Ser Arg Tyr Asn Thr Gly Gly Tyr Ala Thr Val Ala Gly
75                  80                  85                  90
His Asn Gln Ala Pro Ile Gly Ser Ser Val Cys Arg Ser Gly Ser Thr
                95                  100                 105
Thr Gly Trp His Cys Gly Thr Ile Gln Ala Arg Gly Gln Ser Val Ser
            110                 115                 120
Tyr Pro Glu Gly Thr Val Thr Asn Met Thr Arg Thr Thr Val Cys Ala
        125                 130                 135
Glu Pro Gly Asp Ser Gly Gly Ser Tyr Ile Ser Gly Thr Gln Ala Gln
    140                 145                 150
Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Arg Thr Gly Gly Thr Thr
155                 160                 165                 170
Phe Tyr Gln Glu Val Thr Pro Met Val Asn Ser Trp Gly Val Arg Leu
                175                 180                 185
Arg Thr
<210>37
<211>1143
<212>DNA
<213>人工序列
<220>
<223>优化的合成蛋白酶基因
<220>
<221>CDS
<222>(1)..(1140)
<223>蛋白酶
<220>
<221>sig_peptide
<222>(1)..(81)
<220>
<221>mat_peptide
<222>(577)..(1140)
<400>37
atg aaa aaa ccg ctg gga aaa att gtc gca agc aca gca ctt ctt                45
Met Lys Lys Pro Leu Gly Lys Ile Val Ala Ser Thr Ala Leu Leu
        -190                -185                -180
att tca gtg gca ttt agc tcc agc att gca tca gct gct acg gga                90
Ile Ser Val Ala Phe Ser Ser Ser Ile Ala Ser Ala Ala Thr Gly
        -175                -170                -165
gct tta ccg cag tct ccg aca ccg gaa gca gat gca gtg tca atg               135
Ala Leu Pro Gln Ser Pro Thr Pro Glu Ala Asp Ala Val Ser Met
        -160                -155                -150
caa gaa gca ctg caa aga gat ctt gat ctt aca tca gca gaa gca               180
Gln Glu Ala Leu Gln Arg Asp Leu Asp Leu Thr Ser Ala Glu Ala
        -145                -140                -135
gaa gaa ctt ctt gct gca caa gat aca gca ttt gaa gtg gat gaa               225
Glu Glu Leu Leu Ala Ala Gln Asp Thr Ala Phe Glu Val Asp Glu
        -130                -125                -120
gca gcg gca gaa gca gca gga gat gca tat ggc ggc tca gtt ttt               270
Ala Ala Ala Glu Ala Ala Gly Asp Ala Tyr Gly Gly Ser Val Phe
        -115                -110                -105
gat aca gaa tca ctt gaa ctt acg gtt ctt gtt aca gat gca gca gca           318
Asp Thr Glu Ser Leu Glu Leu Thr Val Leu Val Thr Asp Ala Ala Ala
        -100                -95                 -90
gtt gaa gca gtt gaa gca aca ggt gca gga aca gaa ctt gtt tca tat           366
Val Glu Ala Val Glu Ala Thr Gly Ala Gly Thr Glu Leu Val Ser Tyr
    -85                 -80                 -75
gga att gat ggc ctt gat gaa att gtt caa gaa ctg aat gca gct gat           414
Gly Ile Asp Gly Leu Asp Glu Ile Val Gln Glu Leu Asn Ala Ala Asp
-70                 -65                 -60                 -55
gct gtt ccg ggc gtt gtc ggc tgg tat ccg gat gtt gct gga gat aca           462
Ala Val Pro Gly Val Val Gly Trp Tyr Pro Asp Val Ala Gly Asp Thr
                -50                 -45                 -40
gtt gtc ctt gaa gtt ctt gaa gga tca ggc gca gat gtt tca ggc ctg           510
Val Val Leu Glu Val Leu Glu Gly Ser Gly Ala Asp Val Ser Gly Leu
            -35                 -30                 -25
ctg gca gat gca gga gtc gat gca tca gca gtt gaa gtt aca aca tca           558
Leu Ala Asp Ala Gly Val Asp Ala Ser Ala Val Glu Val Thr Thr Ser
        -20                 -15                 -10
gat caa ccg gaa ctt tat gca gat att att ggc ggc ctg gca tat aca           606
Asp Gln Pro Glu Leu Tyr Ala Asp Ile Ile Gly Gly Leu Ala Tyr Thr
    -5              -1  1               5                   10
atg ggc ggc aga tgc agc gtt ggc ttt gca gca aca aat gca gca ggc           654
Met Gly Gly Arg Cys Ser Val Gly Phe Ala Ala Thr Asn Ala Ala Gly
                15                  20                  25
caa ccg ggc ttt gtt aca gca ggc cat tgc ggc aga gtt ggc aca cag           702
Gln Pro Gly Phe Val Thr Ala Gly His Cys Gly Arg Val Gly Thr Gln
            30                  35                  40
gtt aca att ggc aat ggc aga ggc gtt ttt gaa caa agc gtt ttt ccg           750
Val Thr Ile Gly Asn Gly Arg Gly Val Phe Glu Gln Ser Val Phe Pro
        45                  50                  55
ggc aat gat gca gca ttt gtt aga ggc aca rca aat ttt aca ctt aca           798
Gly Asn Asp Ala Ala Phe Val Arg Gly Thr Ser Asn Phe Thr Leu Thr
    60                  65                  70
aat ctg gtt tca aga tat aat aca ggc ggc tat gca aca gtt gca ggc           846
Asn Leu Val Ser Arg Tyr Asn Thr Gly Gly Tyr Ala Thr Val Ala Gly
75                  80                  85                  90
cat aat caa gca ccg att ggc rca tca gtt tgc aga tca ggc tca aca           894
His Asn Gln Ala Pro Ile Gly Ser Ser Val Cys Arg Ser Gly Ser Thr
                95                  100                 105
aca ggc tgg cat tgc ggc aca att caa gca aga ggc caa agc gtt agc           942
Thr Gly Trp His Cys Gly Thr Ile Gln Ala Arg Gly Gln Ser Val Ser
            110                 115                 120
tat ccg gaa ggc aca gtt aca aat atg aca aga aca aca gtt tgt gca           990
Tyr Pro Glu Gly Thr Val Thr Asn Met Thr Arg Thr Thr Val Cys Ala
        125                 130                 135
gaa ccg ggc gat tca ggc ggc tca tat att agc ggc aca caa gca caa          1038
Glu Pro Gly Asp Ser Gly Gly Ser Tyr Ile Ser Gly Thr Gln Ala Gln
    140                 145                 150
ggc gtt aca tca ggc ggc tca ggc aat tgc aga aca ggc ggc aca aca          1086
Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Arg Thr Gly Gly Thr Thr
155                 160                 165                 170
ttt tac caa gaa gtt aca ccg atg gtt aat tca tgg ggc gtg cgc ctt          1134
Phe Tyr Gln Glu Val Thr Pro Met Val Asn Ser Trp Gly Val Arg Leu
                175                 180                 185
cgc aca taa                                                              1143
Arg Thr
<210>38
<211>380
<212>PRT
<213>人工序列
<220>
<223>合成构建体
<400>38
Met Lys Lys Pro Leu Gly Lys Ile Val Ala Ser Thr Ala Leu Leu
        -190                -185                -180
Ile Ser Val Ala Phe Ser Ser Ser Ile Ala Ser Ala Ala Thr Gly
        -175                -170                -165
Ala Leu Pro Gln Ser Pro Thr Pro Glu Ala Asp Ala Val Ser Met
        -160                -155                -150
Gln Glu Ala Leu Gln Arg Asp Leu Asp Leu Thr Ser Ala Glu Ala
        -145                -140                -135
Glu Glu Leu Leu Ala Ala Gln Asp Thr Ala Phe Glu Val Asp Glu
        -130                -125                -120
Ala Ala Ala Glu Ala Ala Gly Asp Ala Tyr Gly Gly Ser Val Phe
        -115                -110                -105
Asp Thr Glu Ser Leu Glu Leu Thr Val Leu Val Thr Asp Ala Ala Ala
        -100                -95                 -90
Val Glu Ala Val Glu Ala Thr Gly Ala Gly Thr Glu Leu Val Ser Tyr
    -85                 -80                 -75
Gly Ile Asp Gly Leu Asp Glu Ile Val Gln Glu Leu Asn Ala Ala Asp
-70                 -65                 -60                 -55
Ala Val Pro Gly Val Val Gly Trp Tyr Pro Asp Val Ala Gly Asp Thr
                -50                 -45                 -40
Val Val Leu Glu Val Leu Glu Gly Ser Gly Ala Asp Val Ser Gly Leu
            -35                 -30                 -25
Leu Ala Asp Ala Gly Val Asp Ala Ser Ala Val Glu Val Thr Thr Ser
        -20                 -15                 -10
Asp Gln Pro Glu Leu Tyr Ala Asp Ile Ile Gly Gly Leu Ala Tyr Thr
    -5              -1  1               5                   10
Met Gly Gly Arg Cys Ser Val Gly Phe Ala Ala Thr Asn Ala Ala Gly
                15                  20                  25
Gln Pro Gly Phe Val Thr Ala Gly His Cys Gly Arg Val Gly Thr Gln
            30                  35                  40
Val Thr Ile Gly Asn Gly Arg Gly Val Phe Glu Gln Ser Val Phe Pro
        45                  50                  55
Gly Asn Asp Ala Ala Phe Val Arg Gly Thr Ser Asn Phe Thr Leu Thr
    60                  65                  70
Asn Leu Val Ser Arg Tyr Asn Thr Gly Gly Tyr Ala Thr Val Ala Gly
75                  80                  85                  90
His Asn Gln Ala Pro Ile Gly Ser Ser Val Cys Arg Ser Gly Ser Thr
                95                  100                 105
Thr Gly Trp His Cys Gly Thr Ile Gln Ala Arg Gly Gln Ser Val Ser
            110                 115                 120
Tyr Pro Glu Gly Thr Val Thr Asn Met Thr Arg Thr Thr Val Cys Ala
        125                 130                 135
Glu Pro Gly Asp Ser Gly Gly Ser Tyr Ile Ser Gly Thr Gln Ala Gln
    140                 145                 150
Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Arg Thr Gly Gly Thr Thr
155                 160                 165                 170
Phe Tyr Gln Glu Val Thr Pro Met Val Asn Ser Trp Gly Val Arg Leu
                175                 180                 185
Arg Thr
<210>39
<211>1143
<212>DNA
<213>人工序列
<220>
<223>优化的合成蛋白酶基因
<220>
<221>CDS
<222>(1)..(1140)
<223>蛋白酶
<220>
<221>sig_peptide
<222>(1)..(81)
<220>
<221>mat_peptide
<222>(577)..(1140)
<400>39
atg aaa aaa ccg ctg gga aaa att gtc gca agc aca gca ctt ctt                45
Met Lys Lys Pro Leu Gly Lys Ile Val Ala Ser Thr Ala Leu Leu
        -190                -185                -180
att tca gtg gca ttt agc tca tct att gca tca gca gct aca gga                90
Ile Ser Val Ala Phe Ser Ser Ser Ile Ala Ser Ala Ala Thr Gly
        -175                -170                -165
gca tta ccg cag tct ccg aca ccg gaa gca gat gca gtc tca atg               135
Ala Leu Pro Gln Ser Pro Thr Pro Glu Ala Asp Ala Val Ser Met
        -160                -155                -150
caa gaa gca ctg caa aga gat ctt gat ctt aca tca gca gaa gca               180
Gln Glu Ala Leu Gln Arg Asp Leu Asp Leu Thr Ser Ala Glu Ala
        -145                -140                -135
gaa gaa ctt ctt gct gca caa gat aca gca ttt gaa gtg gat gaa               225
Glu Glu Leu Leu Ala Ala Gln Asp Thr Ala Phe Glu Val Asp Glu
        -130                -125                -120
gca gcg gca gaa gca gca gga gat gca tat ggc ggc tca gtt ttt               270
Ala Ala Ala Glu Ala Ala Gly Asp Ala Tyr Gly Gly Ser Val Phe
        -115                -110                -105
gat aca gaa tca ctt gaa ctt acg gtt ctt gtt aca gat gca gca gca           318
Asp Thr Glu Ser Leu Glu Leu Thr Val Leu Val Thr Asp Ala Ala Ala
        -100                -95                 -90
gtt gaa gca gtt gaa gca aca gga gca gga aca gaa ctt gtt tca tat           366
Val Glu Ala Val Glu Ala Thr Gly Ala Gly Thr Glu Leu Val Ser Tyr
    -85                 -80                 -75
gga att gat ggc ctt gat gaa att gtt caa gaa ctg aat gca gct gat           414
Gly Ile Asp Gly Leu Asp Glu Ile Val Gln Glu Leu Asn Ala Ala Asp
-70                 -65                 -60                 -55
gct gtt ccg ggc gtt gtt ggc tgg tat ccg gat gtt gct gga gat aca           462
Ala Val Pro Gly Val Val Gly Trp Tyr Pro Asp Val Ala Gly Asp Thr
                -50                 -45                 -40
gtt gtc ctt gaa gtt ctt gaa gga tca ggc gca gat gtt tca ggc ctg           510
Val Val Leu Glu Val Leu Glu Gly Ser Gly Ala Asp Val Ser Gly Leu
            -35                 -30                 -25
ctg gca gat gca gga gtc gat gca tca gca gtt gaa gtt aca aca tca           558
Leu Ala Asp Ala Gly Val Asp Ala Ser Ala Val Glu Val Thr Thr Ser
        -20                 -15                 -10
gat caa ccg gaa ctt tat gca gat att att ggc ggc ctg gca tat aca           606
Asp Gln Pro Glu Leu Tyr Ala Asp Ile Ile Gly Gly Leu Ala Tyr Thr
    -5              -1  1               5                   10
atg ggc ggc aga tgc agc gtt ggc ttt gct gca aca aat gca gca ggc           654
Met Gly Gly Arg Cys Ser Val Gly Phe Ala Ala Thr Asn Ala Ala Gly
                15                  20                  25
caa ccg ggc ttt gtt aca gca ggc cat tgc ggc aga gtt ggc aca cag           702
Gln Pro Gly Phe Val Thr Ala Gly His Cys Gly Arg Val Gly Thr Gln
            30                  35                  40
gtt aca att ggc aat ggc aga ggc gtt ttt gaa caa agc gtt ttt ccg           750
Val Thr Ile Gly Asn Gly Arg Gly Val Phe Glu Gln Ser Val Phe Pro
        45                  50                  55
ggc aat gat gca gca ttt gtt aga ggc aca tca aat ttt aca ctt aca           798
Gly Asn Asp Ala Ala Phe Val Arg Gly Thr Ser Asn Phe Thr Leu Thr
    60                  65                  70
aac ctg gtt tca aga tat aat aca ggc ggc tat gca aca gtt gca ggc           846
Asn Leu Val Ser Arg Tyr Asn Thr Gly Gly Tyr Ala Thr Val Ala Gly
75                  80                  85                  90
cat aat caa gca ccg att ggc tca tca gtt tgc aga tca ggc tca aca           894
His Asn Gln Ala Pro Ile Gly Ser Ser Val Cys Arg Ser Gly Ser Thr
                95                  100                 105
aca ggc tgg cat tgc ggc aca att caa gca aga ggc caa agc gtt agc           942
Thr Gly Trp His Cys Gly Thr Ile Gln Ala Arg Gly Gln Ser Val Ser
            110                 115                 120
tat ccg gaa ggc aca gtt aca aat atg aca aga aca aca gtc tgt gcc           990
Tyr Pro Glu Gly Thr Val Thr Asn Met Thr Arg Thr Thr Val Cys Ala
        125                 130                 135
gaa ccg ggc gat tca ggc ggc tca tat att agc ggc acg cag gcg caa          1038
Glu Pro Gly Asp Ser Gly Gly Ser Tyr Ile Ser Gly Thr Gln Ala Gln
    140                 145                 150
ggc gtt aca tca ggc ggc tca ggc aat tgc aga aca ggc ggc act aca          1086
Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Arg Thr Gly Gly Thr Thr
155                 160                 165                 170
ttt tac caa gaa gtt aca ccg atg gta aat tca tgg ggc gtg cgc ctt          1134
Phe Tyr Gln Glu Val Thr Pro Met Val Asn Ser Trp Gly Val Arg Leu
                175                 180                 185
cgc aca taa                                                              1143
Arg Thr
<210>40
<211>380
<212>PRT
<213>人工序列
<220>
<223>合成构建体
<400>40
Met Lys Lys Pro Leu Gly Lys Ile Val Ala Ser Thr Ala Leu Leu
        -190                -185                -180
Ile Ser Val Ala Phe Ser Ser Ser Ile Ala Ser Ala Ala Thr Gly
        -175                -170                -165
Ala Leu Pro Gln Ser Pro Thr Pro Glu Ala Asp Ala Val Ser Met
        -160                -155                -150
Gln Glu Ala Leu Gln Arg Asp Leu Asp Leu Thr Ser Ala Glu Ala
        -145                -140                -135
Glu Glu Leu Leu Ala Ala Gln Asp Thr Ala Phe Glu Val Asp Glu
        -130                -125                -120
Ala Ala Ala Glu Ala Ala Gly Asp Ala Tyr Gly Gly Ser Val Phe
        -115                -110                -105
Asp Thr Glu Ser Leu Glu Leu Thr Val Leu Val Thr Asp Ala Ala Ala
        -100                -95                 -90
Val Glu Ala Val Glu Ala Thr Gly Ala Gly Thr Glu Leu Val Ser Tyr
    -85                 -80                 -75
Gly Ile Asp Gly Leu Asp Glu Ile Val Gln Glu Leu Asn Ala Ala Asp
-70                 -65                 -60                 -55
Ala Val Pro Gly Val Val Gly Trp Tyr Pro Asp Val Ala Gly Asp Thr
                -50                 -45                 -40
Val Val Leu Glu Val Leu Glu Gly Ser Gly Ala Asp Val Ser Gly Leu
            -35                 -30                 -25
Leu Ala Asp Ala Gly Val Asp Ala Ser Ala Val Glu Val Thr Thr Ser
        -20                 -15                 -10
Asp Gln Pro Glu Leu Tyr Ala Asp Ile Ile Gly Gly Leu Ala Tyr Thr
    -5              -1  1               5                   10
Met Gly Gly Arg Cys Ser Val Gly Phe Ala Ala Thr Asn Ala Ala Gly
                15                  20                  25
Gln Pro Gly Phe Val Thr Ala Gly His Cys Gly Arg Val Gly Thr Gln
            30                  35                  40
Val Thr Ile Gly Asn Gly Arg Gly Val Phe Glu Gln Ser Val Phe Pro
        45                  50                  55
Gly Asn Asp Ala Ala Phe Val Arg Gly Thr Ser Asn Phe Thr Leu Thr
    60                  65                  70
Asn Leu Val Ser Arg Tyr Asn Thr Gly Gly Tyr Ala Thr Val Ala Gly
75                  80                  85                  90
His Asn Gln Ala Pro Ile Gly Ser Ser Val Cys Arg Ser Gly Ser Thr
                95                  100                 105
Thr Gly Trp His Cys Gly Thr Ile Gln Ala Arg Gly Gln Ser Val Ser
            110                 115                 120
Tyr Pro Glu Gly Thr Val Thr Asn Met Thr Arg Thr Thr Val Cys Ala
        125                 130                 135
Glu Pro Gly Asp Ser Gly Gly Ser Tyr Ile Ser Gly Thr Gln Ala Gln
    140                 145                 150
Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Arg Thr Gly Gly Thr Thr
155                 160                 165                 170
Phe Tyr Gln Glu Val Thr Pro Met Val Asn Ser Trp Gly Val Arg Leu
                175                 180                 185
Arg Thr

Claims (10)

1.在革兰氏阳性宿主细胞中生产异源S2A/S1E蛋白酶的方法,该方法包括以下步骤:
(a)以补料分批发酵将包含至少一种编码异源S2A/S1E蛋白酶的多核苷酸的革兰氏阳性细胞在有益于生产所述蛋白酶的条件下进行培养,其中所述培养的时间的至少20%发生在36.5℃以下的温度;和
(b)回收所述蛋白酶。
2.根据权利要求1的方法,其中所述革兰氏阳性宿主细胞是芽孢杆菌属细胞。
3.根据权利要求1或2的方法,其中革兰氏阳性宿主细胞是选自嗜碱性芽孢杆菌,解淀粉芽孢杆菌,短芽孢杆菌,环状芽孢杆菌,Bacillus clausii,凝结芽孢杆菌,灿烂芽孢杆菌,迟缓芽孢杆菌,地衣芽孢杆菌,巨大芽孢杆菌,嗜热脂肪芽孢杆菌,枯草芽孢杆菌,和苏云金芽孢杆菌的芽孢杆菌属的菌种。
4.根据权利要求1-3任一项的方法,其中S2A/S1E蛋白酶包含与SEQID NO:4,SEQ ID NO:6,SEQ ID NO:10,SEQ ID NO:14,SEQ ID NO:18;SEQ ID NO:20;SEQ ID NO:22;SEQ ID NO:24;SEQ ID NO:26;SEQ ID NO:28;SEQ ID NO:30;SEQ ID NO:32;或SEQ ID NO:34中所示多肽的成熟部分的氨基酸序列具有至少70%同一性的氨基酸序列。
5.根据权利要求1-4任一项的方法,其中S2A/S1E蛋白酶源自一种或多种选自拟诺卡氏菌属菌种NRRL 18262,达松维尔拟诺卡氏菌达松维尔亚种DSM 43235,Nocardiopsis Alba DSM 15647,Nocardiopsis prasina DSM15648,Nocardiopsis prasina DSM 15649,Nocardiopsis prasina(早先为alba)DSM 14010,拟诺卡氏菌属菌种DSM 16424,Nocardiopsis alkaliphila DSM44657,和卢森坦类诺卡氏菌DSM 44048中的拟诺卡氏菌属菌种。
6.根据权利要求1-5任一项的方法,其中至少一种多核苷酸包含与SEQ ID NO:3的位置577-1140中;SEQ ID NO:5的位置526-1089中;SEQID NO:9的位置508-1083中;SEQ ID NO:13的位置519-1085中;SEQ IDNO:17的位置568-1143中;SEQ ID NO:19的位置574-1149中;SEQ ID NO:21的位置574-1149中;SEQ ID NO:23的位置586-1152中;SEQ ID NO:25的位置586-1149中;SEQ ID NO:27的位置586-1152中;SEQ ID NO:29的位置502-1065中;SEQ ID NO:31的位置496-1059中;SEQ ID NO:33的位置499-1062中;SEQ ID NO:35的位置577-1140中;SEQ ID NO:37的位置577-1140中;或SEQ ID NO:39的位置577-1140中所示的核苷酸序列具有至少70%同一性的核苷酸序列。
7.根据权利要求1-6任一项的方法,其中在至少一种多核苷酸中的密码子用法对应于芽孢杆菌属细胞中的平均密码子用法;优选地衣芽孢杆菌或枯草芽孢杆菌细胞;更加优选地衣芽孢杆菌ATCC 14580细胞。
8.根据权利要求1-7任一项的方法,其中所述培养步骤的至少50%的时间发生在36.5℃以下的温度;优选在36℃以下的温度;更加优选在35℃以下的温度,还更加优选在33℃以下,或最优选在31℃以下的温度。
9.根据权利要求1-8任一项的方法,其中所述培养步骤的最初的50%或更少的时间发生于31℃以上的温度;优选所述培养步骤的最初的40%或更少的时间;更加优选最初的30%或更少;或最优选所述培养步骤的最初的20%或更少的时间发生于31℃以上的温度。
10.权利要求9的方法,其中最初的50%或更少,40%或更少,30%或更少,或20%或更少的培养步骤的时间发生在33℃以上的温度;优选35℃以上;或最优选36℃以上的温度。
CNA2005800282859A 2004-06-21 2005-06-20 生产异源蛋白酶的改进方法 Pending CN101010424A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DKPA200400973 2004-06-21
DKPA200400973 2004-06-21

Publications (1)

Publication Number Publication Date
CN101010424A true CN101010424A (zh) 2007-08-01

Family

ID=34970463

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2005800282859A Pending CN101010424A (zh) 2004-06-21 2005-06-20 生产异源蛋白酶的改进方法

Country Status (4)

Country Link
US (1) US20070259404A1 (zh)
EP (1) EP1766000A1 (zh)
CN (1) CN101010424A (zh)
WO (1) WO2005123914A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103509776B (zh) * 2003-06-19 2016-10-12 诺维信公司 蛋白酶
CN113366113A (zh) * 2019-01-30 2021-09-07 诺维信公司 同源折叠酶共表达

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE602004007766T2 (de) * 2003-02-07 2008-06-05 Novozymes A/S Proteasen
CA2539693A1 (en) 2003-10-10 2005-04-21 Novozymes A/S Protease variants
CA2591858C (en) 2004-06-21 2015-05-05 Novozymes A/S Proteases derived from norcardiopsis
WO2005123915A1 (en) * 2004-06-21 2005-12-29 Novozymes A/S Stably maintained multiple copies of at least two orf in the same orientation
WO2012022777A1 (en) 2010-08-19 2012-02-23 Novozymes A/S Induced sporulation screening method
CN112375132B (zh) * 2020-11-19 2022-05-24 苏州大学 太湖白鱼来源的抗菌肽及其应用
WO2023225459A2 (en) 2022-05-14 2023-11-23 Novozymes A/S Compositions and methods for preventing, treating, supressing and/or eliminating phytopathogenic infestations and infections

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1303633A (zh) * 1969-04-18 1973-01-17
EP0211241A3 (de) * 1985-07-06 1989-06-28 Forschungszentrum Jülich Gmbh Verfahren zur Exoenzymgewinnung durch Bakterienkultur
DK564086A (da) * 1986-11-25 1988-06-17 Novo Industri As Enzymatisk detergent-additiv
CA2003078A1 (en) * 1988-11-18 1990-05-18 Alan Sloma Protease deletion
US5623059A (en) * 1992-03-09 1997-04-22 Novo Nordisk A/S Method for protection of proteolysis-susceptible protein during protein production in a fluid medium
US6855548B2 (en) * 2000-02-08 2005-02-15 F. Hoffman-La Roche Ag Use of acid-stable proteases in animal feed
DK1639104T3 (da) * 2003-06-19 2010-07-26 Novozymes As Forbedrede proteaser og fremgangsmåder til fremstilling af disse

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103509776B (zh) * 2003-06-19 2016-10-12 诺维信公司 蛋白酶
CN113366113A (zh) * 2019-01-30 2021-09-07 诺维信公司 同源折叠酶共表达

Also Published As

Publication number Publication date
EP1766000A1 (en) 2007-03-28
US20070259404A1 (en) 2007-11-08
WO2005123914A1 (en) 2005-12-29

Similar Documents

Publication Publication Date Title
CN101010424A (zh) 生产异源蛋白酶的改进方法
CN108473986A (zh) 芽孢杆菌宿主细胞的基因组编辑
DK2267007T3 (en) New gene products that form or degrade polyaminoacids, of Bacillus licheniformis and end supporting improved biotechnological production methods
Vujaklija et al. A novel streptomycete lipase: cloning, sequencing and high-level expression of the Streptomyces rimosus GDS (L)-lipase gene
CN101495625A (zh) 地衣芽孢杆菌中的氯霉素抗性选择
CN111334494A (zh) 新型高稳定性碱性蛋白酶突变体的筛选
AU696418B2 (en) DNA encoding the (bacillus licheniformis) PWD-1 keratinase
CN103608457A (zh) 表达方法
EP1639107B1 (en) Improved proteases and methods for producing them
CN113166231A (zh) 胰凝乳蛋白酶抑制剂变体及其用途
US8759065B2 (en) Protein and DNA sequence encoding a cold adapted subtilisin-like activity
CN101978056B (zh) 质粒载体
CN101851599A (zh) 具有改变产物产量特性的真细菌rna聚合酶突变体
US8535911B2 (en) Cell with improved secretion mediated by MrgA protein or homologue
EP1735451B1 (en) Mutated prokaryotic cells with high secretion-levels
CN117535273A (zh) 温敏型碱性蛋白酶变体及其应用
WO2024086880A1 (en) Novel thermostable enzymes
CN116555222A (zh) 2-羟乙基对苯二甲酸二酯水解酶突变体及编码基因、重组载体、重组菌株、酶制剂和应用
WO1999035274A2 (en) Nucleic acids encoding thermostable pullulanases
JP2005287442A (ja) アルカリプロテアーゼ
JPH02257881A (ja) カプロラクトン加水分解酵素

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
AD01 Patent right deemed abandoned

Effective date of abandoning: 20070801

C20 Patent right or utility model deemed to be abandoned or is abandoned