CN1836036A

CN1836036A - 改进的蛋白酶及其制备方法

Info

Publication number: CN1836036A
Application number: CNA2004800236184A
Authority: CN
Inventors: 索伦·F·拉森
Original assignee: Novo Nordisk AS
Current assignee: Novo Nordisk AS
Priority date: 2003-06-19
Filing date: 2004-06-21
Publication date: 2006-09-20

Abstract

衍生自S2A或S1E蛋白酶的分泌的成熟多肽，当其成熟后具有蛋白酶活性，该多肽在其被表达时和成熟之前含有异源前－区。

Description

改进的蛋白酶及其制备方法

发明领域

多种由微生物衍生的相关蛋白酶很难以工业化规模大量生产，这些蛋白酶倾向于以多种形式被降解和/或具有不稳定性。本发明提供了通过将其表达成含有异源前-序列的蛋白酶来生产所述蛋白酶的方法。本发明还提供了所获得的含有所述异源前序列的蛋白酶。

本发明涉及分离的多肽，其具有与拟诺卡氏菌蛋白酶相关的蛋白酶活性，还涉及分离的编码所述蛋白酶的核酸序列。本发明还涉及含有这些核酸序列的核酸构建体，载体和宿主细胞，以及制备和使用(尤其在动物饲料中)所述蛋白酶的方法。

背景

具有蛋白酶活性的多肽或蛋白酶有时也被称为肽酶或肽水解酶。蛋白酶可以是始于任一端水解肽的外切型蛋白酶或在多肽链内部发挥作用的内切型蛋白酶(内肽酶)。内肽酶对N-和C-末端被封闭的肽底物显示出活性，所述底物与该蛋白酶的特异性有关。

本文将术语“蛋白酶”定义为水解肽键的酶。它包括任何属于EC 3.4组的酶(包括其13个亚类中的每一个)。EC编号可参照源自NC-IUBMB，Academic Press，San Diego，California的Enzyme Nomenclature 1992，包括分别公开于Eur.J.Biochem.1994，223，1-5；Eur.J.Biochem.1995，232，1-6；Eur.J.Biochem.1996，237，1-5；Eur.J.Biochem.1997，250，1-6和Eur.J.Biochem.1999，264，610-650的增补本1-5。命名会定期得以增补和更新；参见例如网址 http：//www.chem.qmw.ac.uk/iubmb/enzyme/index.html)。

美国专利公开号2002/0182672A1公开了下述内容：如果多肽C-末端最后两个氨基酸中的一个或两个是带电的极性氨基酸：D或E(带负电)或者K，R或H(带正电)，可以认为尾部是极性带电的，这使得多肽能够抵抗识别分泌蛋白质之非-极性C-末端尾的蛋白酶亚类的降解。

另有文献报道：新生多肽链C-末端的脯氨酸残基导致多肽降解(2002.Prolin residues at the C terminus of nascent chains induce SsrA tagging duringtranslation termination.J.Biol.Chem.277：33825-33823)。

发明简述

在表达具有蛋白酶解活性的多肽的技术中，一个众所周知的问题是：此类多肽大多具有内在的不稳定性，它们可能会遭受自我蛋白酶解，或者成为在其制备过程中已经形成的其它蛋白酶降解的目标，导致产量较低。多种其它因素也可能会导致其不稳定性，目前尚未完全了解所有因素。重要的是提供稳定性有所增强的蛋白酶多肽，从而以较高产量制备这些多肽。

归类为S2A和/或S1E的分泌蛋白酶常具有前-区，该前区从蛋白酶上被裂解下来，产生蛋白酶的成熟部分。本发明人发现：与生产未经改变的野生型蛋白酶相比，以融合多肽的形式生产含有异源前-区的S2A和/或S1E蛋白酶，会导致产量有较大提高。

因此，第一方面，本发明涉及分泌的成熟多肽，其成熟后具有蛋白酶活性，该多肽在被表达时和成熟前含有异源前-区，该多肽：

(a)含有与SEQ ID NO：28；SEQ ID NO：33；SEQ ID NO：37；SEQ ID NO：41；SEQ ID NO：43或SEQ ID NO：45所示多肽成熟部分的氨基酸序列至少70％相同，或优选75％，80％，85％，86％，87％，88％，89％，90％，91％，92％，93％，94％，95％，96％，97％，98％或99％相同的氨基酸序列；

(b)含有与SEQ ID NO：1；SEQ ID NO：2；SEQ ID NO：25；SEQ ID NO：31；SEQ ID NO：32；SEQ ID NO：36；SEQ ID NO：40或SEQ ID NO：44所示多核苷酸编码的多肽的成熟部分的氨基酸序列至少70％相同，或优选75％，80％，85％，86％，87％，88％，89％，90％，91％，92％，93％，94％，95％，96％，97％，98％或99％相同的氨基酸序列；

(c)含有成熟部分，该部分是具有SEQ ID NO：28；SEQ ID NO：33；SEQID NO：37；SEQ ID NO：41；SEQ ID NO：43或SEQ ID NO：45所示氨基酸序列的多肽的成熟部分的变体，该区段含有一个或多个氨基酸取代，缺失，延伸和/或插入；

(d)由在很低，低，中-低，中，中-高，高或很高严紧度的条件下，能与下列序列杂交的核酸序列编码：

(I)编码蛋白酶成熟部分的多核苷酸，所述多核苷酸可使用引物SEQ IDNO：26和27获自达松维尔拟诺卡氏菌达松维尔亚种(Nocardiopsisdassonvillei subsp.dassonvillei)DSM 43235的基因组DNA；使用引物SEQ IDNO：34和35获自白拟诺卡氏菌(Nocardiopsis Alba)DSM 15647的基因组DNA；使用引物SEQ ID NO：38和39获自葱绿拟诺卡氏菌(Nocardiopsisprasina)DSM 15648的基因组DNA；或使用引物SEQ ID NO：42和39获自葱绿拟诺卡氏菌DSM 15649的基因组DNA；

(II)SEQ ID NO：1；SEQ ID NO：2；SEQ ID NO：25；SEQ ID NO：31；SEQID NO：32；SEQ ID NO：36；SEQ ID NO：40或SEQ ID NO：44的多核苷酸；

(III)为(I)或(II)的至少500个核苷酸，优选400，300，200或100个核苷酸的亚序列，或

(IV)为(I)，(II)或(III)的互补链；

(e)是(a)，(b)，(c)或(d)的等位基因变体；或

(f)是(a)，(b)，(c)，(d)或(e)的片段。，

第二方面，本发明涉及分离的编码第一方面所限定多肽的多核苷酸；或分离的编码融合多肽的多核苷酸，所述融合多肽成熟后具有蛋白酶活性，成熟前含有异源前-区，所述多肽：

(I)编码蛋白酶成熟部分的多核苷酸，所述多核苷酸可使用引物SEQ IDNO：26和27获自达松维尔拟诺卡氏菌达松维尔亚种DSM 43235的基因组DNA；使用引物SEQ ID NO：34和35获自白拟诺卡氏菌DSM 15647的基因组DNA；使用引物SEQ ID NO：38和39获自葱绿拟诺卡氏菌DSM 15648的基因组DNA；或使用引物SEQ ID NO：42和39获自葱绿拟诺卡氏菌DSM15649的基因组DNA；

(IV)为(I)，(II)或(III)的互补链；

(e)是(a)，(b)，(c)或(d)的等位基因变体；或

(f)是(a)，(b)，(c)，(d)或(e)的片段。

第三方面，本发明涉及含有第二方面所限定的多核苷酸的重组表达载体或多核苷酸构建体。

第四方面，本发明涉及含有第二方面所限定的多核苷酸，或第三方面所限定的表达载体或多核苷酸构建体的重组宿主细胞。

第五方面，本发明还涉及含有第二方面所限定的多核苷酸，或第三方面所限定的表达载体或多核苷酸构建体的转基因植物或植物部分。

第六方面，本发明涉及含有第二方面所限定的多核苷酸，或第三方面所限定的表达载体或多核苷酸构建体的转基因非人动物，或其产物或元件。

第七方面，本发明涉及制备第一方面所限定的多肽的方法，所述方法包括：(a)培养第四方面所限定的重组宿主细胞，或第五或第六方面所限定的转基因植物或动物，以产生含有多肽的上清液，和任选(b)回收多肽。

在其它方面，本发明涉及：动物饲料添加剂，其含有至少一种第一方面所限定的多肽；和

(a)至少一种脂溶性维生素，和/或

(b)至少一种水溶性维生素，和/或

(c)至少一种痕量矿物质；

动物饲料组合物，其中的粗蛋白含量为50至800g/kg，并且含有至少一种第一方面所限定的多肽，或至少一种前一方面所限定的饲料添加剂；

组合物，其含有至少一种第一方面所限定的多肽，以及至少一种选自下列的其它酶：植酸酶(EC 3.1.3.8或3.1.3.26)；木聚糖酶(EC 3.2.1.8)；半乳聚糖酶(EC 3.2.1.89)；α-半乳糖苷酶(EC 3.2.1.22)；蛋白酶(EC 3.4.-.-)；磷脂酶A1(EC 3.1.1.32)；磷脂酶A2(EC 3.1.1.4)；溶血磷脂酶(EC 3.1.1.5)；磷脂酶C(3.1.4.3)；磷脂酶D(EC 3.1.4.4)和/或β-葡聚糖酶(EC 3.2.1.4或EC3.2.1.6)；

使用至少一种第一方面所限定的多肽改善动物饲料的营养价值，增加动物饮食中可消化和/或可溶的蛋白质，增加动物饮食中蛋白质的水解程度，和/或处理植物蛋白质的方法，所述方法包括使动物饲料和/或用于动物饲料的组合物中包含多肽。

使用至少一种第一方面所限定的多肽的方法，包括使清洁剂配方中包含多肽。

发明详述

根据蛋白酶的催化机理将其分为下列几组：丝氨酸蛋白酶(S)，半胱氨酸蛋白酶(C)，天冬氨酸蛋白酶(A)，金属蛋白酶(M)和未知的或仍未分类的蛋白酶(U)，参见Handbook of Proteolytic Enzymes，A.J.Barrett，N.D.Rawlings，J.F.Woessner(eds)，Academic Press(1998)，尤其是其概括性的导言部分。

丝氨酸蛋白酶是普遍存在的，在病毒，细菌和真核生物中已发现此酶；它们包括外切肽酶，内肽酶，寡肽酶和ω-肽酶活性。已鉴定出20多个丝氨酸蛋白酶家族(表示为S1-S27)，根据结构相似性和功能证据将它们分为6个族，表示为SA，SB，SC，SE，SF和SG(Barrett et al.1998.Handbook ofproteolytic enzymes)。其中至少4个族(SA，SB，SC和SE)的结构是已知的，这些结构似乎完全不相关，这表明丝氨酸蛋白酶至少有4个进化起源。α-裂解内肽酶属于胰凝乳蛋白酶(SA)族，在该族中，它被指定为S2家族的A亚族(S2A)。

蛋白酶的另一个分类系统基于序列信息，因此更常用于分子生物学技术；它描述于Rawlings，N.D.et al.，2002，MEROPS：The protease database.Nucleic Acids Res.30：343-346。MEROPS电子数据库可免费获自http：//www.merops.ac.uk。根据MEROPS系统，在′蛋白酶手册′中被分类为S2A的蛋白酶在MEROPS中被分类为′S1E′蛋白酶(Rawlings ND，Barrett AJ.(1993)Evolutionary families of peptidases，Biochem.J.290：205-218)。

在具体实施方案中，本发明和根据本发明使用的蛋白酶选自：

(a)属于EC3.4.-.-酶组的蛋白酶；

(b)属于上述手册中的S组的丝氨酸蛋白酶；

(c1)S2A肽酶家族的丝氨酸蛋白酶；

(c2)描述于Biochem.J.290：205-218(1993)和MEROPS蛋白酶数据库，release 6.20，March 24，2003，(www.merops.ac.uk)的S1E肽酶家族的丝氨酸蛋白酶。该数据库描述于Rawlings，N.D.，O′Brien，E.A.& Barrett，A.J.(2002)MEROPS：the protease database.Nucleic Acids Res.30，343-346。

为了测定给定蛋白酶是否为丝氨酸蛋白酶和S2A家族的蛋白酶，可参考上述手册和其中述及的原理。可对所有蛋白酶类型进行测定，而不论其是天然或野生型蛋白酶；还是经基因工程改造或合成的蛋白酶。

可使用任何测定法测定蛋白酶活性，在所述方法中使用底物，该底物包括与所述蛋白酶的特异性相关的肽键。使检测-pH和检测-温度同样地适合所述蛋白酶。检测-pH值的例子为pH 2，3，4，5，6，7，8，9，10，11或12。检测-温度的例子为30，35，37，40，45，50，55，60，65，70，80，90或95℃。

蛋白酶底物的例子为酪蛋白，如Azurine-Crosslinked Casein(AZCL-酪蛋白)。本文实施例2中描述了两种蛋白酶测定法，可使用其中的任一种测定蛋白酶活性。本发明优选所谓的pNA测定法。

对本发明和/或本发明使用的蛋白酶的来源没有限制。因此，术语蛋白酶不仅包括得自任何微生物属的天然或野生型蛋白酶，还包括其表现出蛋白酶活性的任何突变体，变体，片段等，以及合成的蛋白酶，如经改组的蛋白酶和共有蛋白酶。可按照本技术领域公知的方法，如通过定点诱变，PCR(在PCR反应中使用含有所需突变的PCR片段作为引物之一)，或随机诱变制备经基因工程改造的蛋白酶。共有蛋白质的制备描述于例如EP897985。本文所用的与给定来源有关的术语“得自”应该指：通过该来源或通过其中存在有得自该来源的核酸序列的细胞产生由核酸序列编码的多肽。在优选实施方案中，多肽被分泌至细胞外。

在具体实施方案中，蛋白酶是低-变应原性变体，它被设计成当暴露于包括人的动物时，引发降低的免疫反应。术语免疫反应可被理解成暴露于蛋白酶的动物的免疫系统所作出的任何反应。一种类型的免疫反应是导致暴露动物IgE水平升高的变应性反应。可使用本领域已知技术制备低-变应原性变体。例如，蛋白酶可与聚合物组成成分保护部分或参与免疫反应的蛋白酶表位偶联。与聚合物偶联包括在体外使聚合物与蛋白酶进行化学偶联，参见例如WO 96/17929，WO 98/30682，WO 98/35026和/或WO 99/00489。偶联另外还包括或可选择地包括在体内使聚合物与蛋白酶偶联。所述偶联可通过下述方法获得：对编码蛋白酶的核苷酸序列进行基因工程改造，在蛋白酶中插入编码额外糖基化位点的共有序列，并在能糖基化蛋白酶的宿主中表达蛋白酶，参见例如WO 00/26354。另一种提供低-变应原性变体的方法是对编码蛋白酶的核苷酸序列进行基因工程改造，从而导致蛋白酶自我-寡聚化，以便蛋白酶单体可保护其它蛋白酶单体的表位，从而降低寡聚体的抗原性。所述产物及其制备描述于例如WO 96/16177。通过多种方法，如WO 00/26230和WO 01/83559所述的噬菌体展示法，或者EP 561907所述的随机法，可以鉴定出参与免疫反应的表位。一旦鉴定出表位，可通过已知的基因操作技术，如定点诱变(参见例如WO 00/26230，WO 00/26354和/或WO 00/22103)改变其氨基酸序列以使蛋白酶的免疫特性发生改变，和/或以足够近的距离使聚合物与表位偶联，以使聚合物能保护表位。

第一方面，本发明涉及分泌的成熟多肽，其成熟后具有蛋白酶活性，该多肽在被表达时和成熟前含有异源前-区，该多肽：

(b)含有与SEQ ID NO：1；SEQ ID NO：2；SEQ ID NO：25；SEQ ID NO：31；SEQ ID NO：32；SEQ ID NO：36；SEQ ID NO：40或SEQ ID NO：44所示多核苷酸编码的多肽的成熟部分的氨基酸序列至少70％相同，或优选75％，80％，85％，86％，87％，88％，89％，90％，9 1％，92％，93％，94％，95％，96％，97％，98％或99％相同的氨基酸序列；

(IV)为(I)，(II)或(III)的互补链；

(e)是(a)，(b)，(c)或(d)的等位基因变体；或

(f)是(a)，(b)，(c)，(d)或(e)的片段。

在本发明中，通过程序″align″测定两个氨基酸序列之间以及两个核苷酸序列之间的同一性程度，所述程序是Needleman-Wunsch比对(即全面比对)。使用该程序进行多肽以及核苷酸序列的比对。使用缺省评分矩阵BLOSUM50进行多肽比对，使用缺省同一性矩阵进行核苷酸比对。对多肽而言，缺口第一个残基的罚分为-12，对核苷酸而言该罚分为-16。对多肽而言，缺口更远残基的罚分为-2，对核苷酸而言该罚分为-4。

″Align″是v20u6版FASTA程序包的一部分(参见W.R.Pearson and D.J.Lipman(1988)，″Improved Tools for Biological Sequence Analysis″，PNAS85：2444-2448和W.R.Pearson(1990)″Rapid and Sensitive SequenceComparison with FASTP and FASTA，″Methods in Enzymology 183：63-98)。FASTA蛋白质比对使用Smith-Waterman算法，该算法对缺口大小没有限制(参见″Smith-Waterman algorithm″，T.F.Smith and M.S.Waterman(1981)J.Mol.Biol.147：195-197)。

也可通过Clustal法(Higgins，1989，CABIOS 5：151-153)测定两个氨基酸序列之间的同一性程度，该方法使用具有同一性桌面和下列成组比对参数的LASERGENE^TM MEGALIGN^TM软件(DNASTAR，Inc.，Madison，WI)：缺口罚分为10，缺口长度罚分为10。成对的比对参数是：Ktuple＝1，缺口罚分＝3，窗口＝5和对角线＝5。可使用具有下列设置的与上述相同的算法和软件包测定两个核苷酸序列之间的同一性程度：缺口罚分为10，缺口长度罚分为10。成对的比对参数是：Ktuple＝3，缺口罚分＝3和窗口＝20。

本发明编码多核苷酸序列之一的片段是编码多肽的多核苷酸，与全长氨基酸序列相比，该多肽的氨基和/或羧基末端缺失了一个或多个氨基酸。在一个实施方案中，片段编码至少75个氨基酸残基，或至少100个氨基酸残基，或至少125个氨基酸残基，或至少150个氨基酸残基，或至少160个氨基酸残基，或至少165个氨基酸残基，或至少170个氨基酸残基，或至少175个氨基酸残基。

等位基因变体表示占据相同染色体基因座之基因的任意两个或多个可替换形式。等位基因变体可通过突变天然产生，也可由种群中的多态性引起。基因突变可以是沉默的(其编码的多肽没有变化)，或者编码具有经改变的氨基酸序列的多肽。多肽的等位基因变体是由基因的等位基因变体编码的多肽。

本发明还涉及分离的具有蛋白酶活性的多肽，该多肽由在很低，低，中-低，中，中-高，高或很高严紧度的条件下，能与核酸探针杂交的核酸序列编码，所述探针能在相同条件下与下列多核苷酸杂交：(I)编码蛋白酶成熟部分的多核苷酸，所述多核苷酸可使用引物SEQ ID NO：26和27获自达松维尔拟诺卡氏菌达松维尔亚种DSM 43235的基因组DNA；使用引物SEQID NO：34和35获自白拟诺卡氏菌DSM 15647的基因组DNA；使用引物SEQ ID NO：38和39获自葱绿拟诺卡氏菌DSM 15648的基因组DNA；或使用引物SEQ ID NO：42和39获自葱绿拟诺卡氏菌DSM 15649的基因组DNA；(II)SEQ ID NO：1；SEQ ID NO：2；SEQ ID NO：25；SEQ ID NO：31；SEQ ID NO：32；SEQ ID NO：36；SEQ ID NO：40或SEQ ID NO：44的多核苷酸；(III)(I)或(II)的至少500个核苷酸，优选400，300，200或100个核苷酸的亚序列，或(IV)(I)，(II)或(III)的互补链(J.Sambrook，E.F.Fritsch，and T.Maniatis，1989，Molecular Cloning，A Laboratory Manual，2nd edition，ColdSpring Harbor，New York)。在一个具体的实施方案中，核酸探针选自上文(a)，(b)或(c)的核酸序列。优选的探针是对应于SEQ ID NO：1，SEQ ID NO：25，SEQ ID NO：31，SEQ ID NO：32，SEQ ID NO：36，SEQ ID NO：40或SEQ IDNO：44的成熟肽编码部分的多核苷酸。

可根据本领域众所周知的方法，使用SEQ ID NO：1，SEQ ID NO：25，SEQ ID NO：31，SEQ ID NO：32，SEQ ID NO：36，SEQ ID NO：40或SEQ IDNO：44的核酸序列或其亚序列以及SEQ ID NO：28，SEQ ID NO：30，SEQ IDNO：33，SEQ ID NO：37，SEQ ID NO：41，SEQ ID NO：43或SEQ ID NO：45的氨基酸序列或其片段，甚至是可使用引物SEQ ID NO：26和27获自达松维尔拟诺卡氏菌达松维尔亚种DSM 43235的基因组DNA；使用引物SEQ IDNO：34和35获自白拟诺卡氏菌DSM 15647的基因组DNA；使用引物SEQID NO：38和39获自葱绿拟诺卡氏菌DSM 15648的基因组DNA；或使用引物SEQ ID NO：42和39获自葱绿拟诺卡氏菌DSM 15649的基因组DNA的编码蛋白酶的基因组多核苷酸或其亚序列设计核酸探针，以从不同属或种的菌株中鉴定和克隆出编码具有蛋白酶活性的多肽的DNA。具体地说，可根据标准的Southern印迹法，使用该探针与感兴趣的属或种的基因组或cDNA杂交，以从中鉴定和分离出相应的基因。该探针可以比完整的序列短很多，但其长度应该是至少15，优选至少25，更优选至少35个核苷酸。也可使用较长的探针。可使用DNA和RNA探针。一般需标记探针以检测相应的基因(例如，用³²P，³H，³⁵S，生物素或亲和素)。本发明包括所述探针。

因此，可从制备自其它生物体的基因组DNA或cDNA文库中筛选出与上述探针杂交的DNA，所述DNA编码具有蛋白酶活性的多肽。通过琼脂糖或聚丙烯酰胺凝胶电泳或其它分离技术，可从其它生物体中分离基因组或其它DNA。可将得自文库的DNA或分离的DNA转移至和固定在硝酸纤维素或其它适当的载体材料上。为了鉴定出与SEQ ID NO：1或其亚序列同源的克隆或DNA，在Southern印迹中使用载体材料。在本发明中，杂交表示在很低至很高的严紧条件下，核酸序列能与对应于SEQ ID NO：1所示核酸序列，其互补链或其亚序列的经标记核酸探针杂交。可使用X-射线胶片检测能在这些条件下与核酸探针杂交的分子。

对于长度至少为100个核苷酸的长探针而言，根据标准的Southern印迹法，很低至很高的严紧度条件被定义为于42℃在5×SSPE，0.3％SDS，200μg/ml经剪切和变性的鲑精DNA，和25％甲酰胺(很低和低严紧度)，或35％甲酰胺(中和中-高严紧度)，或50％甲酰胺(高和很高严紧度)中进行预杂交和杂交。

对于长度至少为100个核苷酸的长探针而言，最终用0.2×SSC，0.2％SDS，20％甲酰胺将载体材料洗涤3次，每次15分钟，洗涤温度优选至少为45℃(很低严紧度)，更优选至少为50℃(低严紧度)，更优选至少为55℃(中严紧度)，更优选至少为60℃(中-高严紧度)，甚至更优选至少为65℃(高严紧度)，最优选至少为70℃(很高严紧度)。

对于长度约为15个核苷酸至约70个核苷酸的短探针而言，根据标准的Southern印迹法，严紧条件被定义为：在比用Bolton和McCarthy算法(1962，Proceedings of the National Academy of Sciences USA 48：1390)算出的T_m低5℃至10℃的温度下，在0.9M NaCl，0.09M Tris-HCl pH 7.6，6mM EDTA，0.5％NP-40，1×Denhardt′s溶液，1mM焦磷酸钠，1mM磷酸二氢钠，0.1mMATP和0.2mg酵母RNA/ml中进行预杂交，杂交和洗涤后的杂交。

对于长度约为15个核苷酸至约70个核苷酸的短探针而言，在比计算出的T_m低5℃至10℃的温度下，用6×SSC加上0.1％SDS将载体材料洗涤一次，时间为15分钟，用6×SSC洗涤两次，每次15分钟。

本发明还涉及本发明多肽的变体，其含有一个或多个氨基酸的取代，缺失和/或插入。

在具体实施方案中，氨基酸变化的性质是次要的，它是不会显著影响蛋白质折叠和/或活性的保守氨基酸取代；一般为1至约30个氨基酸的小缺失；小的氨基-或羧基-末端延伸，如氨基-末端的甲硫氨酸残基；多达约20-25个残基的小肽；或便于通过改变净电荷或另一种功能进行纯化的小延伸，如聚-组氨酸序列，抗原表位或结合结构域。

保守取代在如下所述的各组氨基酸内部进行：碱性氨基酸(精氨酸，赖氨酸和组氨酸)，酸性氨基酸(谷氨酸和天冬氨酸)，极性氨基酸(谷氨酰胺和天冬酰胺)，疏水氨基酸(亮氨酸，异亮氨酸和缬氨酸)，芳香族氨基酸(苯丙氨酸，色氨酸和酪氨酸)，和小氨基酸(甘氨酸，丙氨酸，丝氨酸，苏氨酸和甲硫氨酸)。本领域已知通常不会改变比活性的氨基酸取代，其描述于例如H.Neurath and R.L.Hill，1979，In，The Proteins，Academic Press，New York。最常发生的交换是Ala/Ser，Val/Ile，Asp/Glu，Thr/Ser，Ala/Gly，Ala/Thr，Ser/Asn，Ala/Val，Ser/Gly，Tyr/Phe，Ala/Pro，Lys/Arg，Asp/Asn，Leu/Ile，Leu/Val，Ala/Glu和Asp/Gly及其逆交换。

在具体实施方案中，本发明的以及本发明所用的多肽具有酸-稳定性。在本发明中，术语酸-稳定性指的是：与在pH 9.0和5℃保温2小时后相应样品的残留活性相比，在pH 3.0和37℃保温2小时后的残留活性至少为50％。在具体实施方案中，残留活性至少为60％，70％，80％或至少为90％。

在具体实施方案中，本发明的多肽是：i)细菌蛋白酶；ii)放线菌门的蛋白酶；iii)放线菌纲的蛋白酶；iv)放线菌目的蛋白酶；v)拟诺卡氏菌科的蛋白酶；vi)拟诺卡氏菌属的蛋白酶；和/或得自vii)拟诺卡氏菌，如白拟诺卡氏菌，南极拟诺卡氏菌，葱绿拟诺卡氏菌，Nocardiopsis composta，Nocardiopsis exhalans，嗜盐拟诺卡氏菌，耐盐拟诺卡氏菌，Nocardiopsiskunsanensis，李氏拟诺卡氏菌，卢森坦拟诺卡氏菌，Nocardiopsis metallicus，线团拟诺卡氏菌，海藻糖拟诺卡氏菌，Nocardiopsis tropica，Nocardiopsisumidischolae，Nocardiopsis xinjiangensis或达松维尔拟诺卡氏菌，例如，达松维尔拟诺卡氏菌DSM 43235的蛋白酶。

上述分类学根据的是G.M.Garrity & J.G.Holt的著作“系统细菌学伯捷氏手册”，2001，第二版，第1卷，David R.Bone，Richard W.Castenholz中的章节“The road map to the Manual”。

应理解对上述种而言，本发明包括其完美和不完美的状态以及其它分类学等同物，如无性型，而不论其为人所知的是什么种名。本领域熟练技术人员可以容易地认识到适当等同物的特性。

在多个培养物保藏中心，如美国典型培养物保藏中心(ATCC)，DeutscheSammlung von Mikroorganismen und Zellkulturen GmbH (DSM)，Centraalbureau Voor Schimmelcultures(CBS)和Agricultural Research ServicePatent Culture Collection，Northern Regional Research Center(NRRL)，公众可以容易地获得这些种的菌株。例如公众可从DSMZ(Deutsche Sammlung vonMIkroorganismen und Zellkulturen GmbH，Braunschweig，Germany)获得达松维尔拟诺卡氏菌达松维尔亚种DSM 43235。其它保藏机构也保藏了该菌株，它们的保藏号如下：ATCC 23219，IMRU 1250，NCTC 10489。

另外，可使用上述探针由其它来源，包括从自然界(如土壤，堆肥，水等)分离的微生物中鉴定和获得多肽。从自然生活环境分离微生物的技术是本领域众所周知的。然后，通过类似地筛选另一种微生物的基因组或cDNA文库即可获得核酸序列。一旦用探针检测到编码多肽的核酸序列，通过利用本领域普通技术人员已知的技术即可分离或克隆该序列(参见例如Sambrook et al.，1989，文献同上)。

本文所限定的“分离的”多肽是经SDS-PAGE测定，实质上不含其它多肽的多肽，例如至少约20％纯，优选至少约40％纯，更优选约60％纯，甚至更优选约80％纯，最优选约90％纯，甚至最优选约95％纯。

由本发明的核酸序列编码的多肽还包括融合多肽或可裂解的融合多肽，其中另一种多肽与多肽或其片段的N-末端或C-末端融合。通过使编码另一种多肽的核酸序列(或其部分)与本发明的核酸序列(或其部分)融合即可产生融合多肽。产生融合多肽的技术是本领域已知的，例如PCR，或连接编码多肽的编码序列，使得它们在框内，且融合多肽的表达在相同启动子和终止子的控制之下。

在本文上下文中，非-极性氨基酸是G，A，V，L，I，M，P，F或W；不带电的极性氨基酸是S，T，N，Q，Y或C。当用于描述多肽中的氨基酸时，术语“非-极性”和“不带电的极性”一般被本领域技术人员认为是氨基酸的侧链特征。因此，例如，当测定氨基酸是非-极性的还是不带电的极性氨基酸时，不考虑多肽C-末端氨基酸的游离羧酸。

优选实施方案涉及第一方面的多肽，其成熟部分是野生型多肽；野生型多肽的人工变体，与野生型相比，所述变体的C-末端添加了一个或多个氨基酸，优选一个或多个添加的氨基酸是非-极性或不带电的，甚至更优选一个或多个添加的氨基酸是Q，S，V，A或P中的一个或多个；经改组的多肽；或蛋白质-经改造的多肽。

另一个优选实施方案涉及第一方面的多肽，该多肽在其C-末端的最后4个氨基酸中含有至少3个非-极性或不带电的极性氨基酸。

另一个优选实施方案涉及第一方面的多肽，其中一个或多个添加的氨基酸选自QSHVQSAP，QSAP，QP，TL，TT， QL，TP，LP，TI，IQ，QP，PI，LT，TQ，IT，QQ和PQ。

如下文实施例所示，本发明人测定：当本发明多肽以与异源前-区融合和/或与异源分泌信号肽融合的成熟蛋白酶形式被表达时，即可以更高的产量制备所述多肽。

因此，优选实施方案涉及第一方面的多肽，当其被表达时和成熟前，含有异源分泌信号-肽，当多肽被分泌时，该信号肽从多肽上裂解下来，优选异源分泌信号肽得自异源蛋白酶，优选异源分泌信号肽含有与SEQ IDNO：2或SEQ ID NO：44的多核苷酸1-81所编码氨基酸序列的序列同一性至少为70％，或优选为75％，80％，85％，86％，87％，88％，89％，90％，91％，92％，93％，94％，95％，96％，97％，98％或99％的氨基酸序列。

因此，优选实施方案涉及第一方面的多肽，当其被表达和成熟前，含有蛋白酶的异源前-区；优选前-区得自S2A或S1E蛋白酶，更优选前-区由下述多核苷酸编码，所述多核苷酸能在很低，低，中-低，中，中-高，高或很高严紧度的条件下，与编码前-区的多核苷酸杂交，所述前-区示于SEQ IDNO：28的第-166至-1位，SEQ ID NO：30的第1-166位，SEQ ID NO：33的第-167至-1位，SEQ ID NO：37的第-165至-1位，SEQ ID NO：41的第-165至-1位，SEQ ID NO：43的第-165至-1位，SEQ ID NO：45的第-165至-1位，SEQ ID NO：46的第1-165位，SEQ ID NO：47的第1-166位，SEQ ID NO：48的第1-166位，SEQ ID NO：49的第1-166位，SEQ ID NO：50的第1-166位，SEQ ID NO：51的第1-165位，SEQ ID NO：52的第1-166位或SEQ ID NO：53的第1-166位；最优选它与示于SEQ ID NO：28的第-166至-1位，SEQ ID NO：30的第1-166位，SEQ ID NO：33的第-167至-1位，SEQ ID NO：37的第-165至-1位，SEQ ID NO：41的第-165至-1位，SEQ ID NO：43的第-165至-1位，SEQ ID NO：45的第-165至-1位，SEQ ID NO：46的第1-165位，SEQ ID NO：47的第1-166位，SEQ ID NO：48的第1-166位，SEQ ID NO：49的第1-166位，SEQ ID NO：50的第1-166位，SEQ ID NO：51的第1-165位，SEQ ID NO：52的第1-166位或SEQ ID NO：53的第1-166位的前-区至少70％相同，或优选75％，80％，85％，86％，87％，88％，89％，90％，91％，92％，93％，94％，95％，96％，97％，98％或99％相同。

核酸序列

本发明还涉及分离的编码本发明多肽的核酸序列。本发明的具体核酸序列是SEQ ID NO：1，SEQ ID NO：2，SEQ ID NO：25，SEQ ID NO：31，SEQID NO：32，SEQ ID NO：36，SEQ ID NO：40或SEQ ID NO：44的多核苷酸。本发明的另一种具体核酸序列是可得自达松维尔拟诺卡氏菌达松维尔亚种DSM 43235基因组DNA的序列，优选的是其成熟多肽编码区序列。本发明还包括编码多肽的核酸序列，所述多肽具有SEQ ID NO：43的第1至188位或第-165至188位所示氨基酸的氨基酸序列，由于遗传密码的简并性，所述核酸序列与SEQ ID NO：1的对应部分有所不同。本发明还涉及上述多核苷酸的亚序列，其编码具有蛋白酶活性的多肽片段。

多核苷酸的亚序列是5′和/或3′末端缺失一个或多个核苷酸的核酸序列。优选亚序列含有至少225个核苷酸，更优选至少300个氨基酸，甚至更优选至少375，450，500，531，600，700，800，900或1000个核苷酸。本发明还涉及与SEQ ID NO：1，SEQ ID NO：2，SEQ ID NO：25，SEQ ID NO：31，SEQID NO：32，SEQ ID NO：36，SEQ ID NO：40或SEQ ID NO：44所示多核苷酸的同一性水平至少为85％，86，87，88，89，90，91，92，93，94，95，96，97，98或至少为99％的核苷酸序列。

本领域已知分离或克隆编码多肽的核酸序列的技术，其包括从基因组DNA中分离，由cDNA制备或其组合。例如，通过使用众所周知的聚合酶链反应(PCR)或用抗体筛选表达文库以检测出具有共用结构特征的克隆DNA片段，即可从基因组DNA中克隆出本发明的核酸序列。参见例如Inniset al.，1990，PCR：A Guide to Methods and Application，Academic Press，NewYork。也可使用其它核酸扩增法，如连接酶链反应(LCR)，连接激活转录(LAT)和基于核酸序列的扩增(NASBA)。核酸序列可克隆自拟诺卡氏菌属的菌株或另一种或相关生物体，因此，所述核酸序列可以是核酸序列的多肽编码区的等位基因变体或种变体。

本文所用术语“分离的核酸序列”指的是：通过琼脂糖电泳测定，实质上不含其它核酸序列的核酸序列，例如至少约20％纯，优选至少约40％纯，更优选至少约60％纯，甚至更优选至少约80％纯，最优选至少约90％纯。例如，通过基因工程中所用的将核酸序列从其天然位置重新定位至复制它的不同位点的标准克隆方法，即可获得分离的核酸序列。克隆方法包括切割和分离合乎需要的含有编码多肽的核酸序列的核酸片段，将所述片段插入载体分子，并将重组载体掺入复制多拷贝或多克隆核酸序列的宿主细胞。核酸序列可以源于基因组，cDNA，RNA，半合成，合成或其任意组合。

为了合成与本发明的多肽基本上类似的多肽，必须修饰编码本发明多肽的核酸序列。术语与多肽“基本上类似”指的是非-天然形式的多肽。这些多肽以一些经改造的方式区别于分离自其天然来源的多肽，例如比活，热稳定性，最适pH，变应原性等有所不同的变体。变体序列的构建可基于表现为本发明多核苷酸的多肽编码部分，例如其亚序列的核酸序列，和/或通过导入不会导致核酸序列所编码多肽的氨基酸序列发生变化，但对应于欲制备蛋白酶的宿主生物体的密码子偏好性的核苷酸取代，或通过导入可产生不同氨基酸序列的核苷酸取代来进行。有关核苷酸取代的一般性描述可参见例如Ford et al.，1991，Protein Expression and Purification 2：95-107。可按上文所述制备低-变应原性多肽。

本领域技术人员清楚地知道：所述取代可在对分子功能至关重要的区域外部进行，此时仍会产生活性多肽。可根据本领域已知的方法，如定点诱变或丙氨酸-扫描诱变(参见例如Cunningham and Wells，1989，Science 244：1081-1085)，鉴定出对于本发明分离的核酸序列所编码多肽的活性而言为必需的，因此优选不被取代的氨基酸残基。在后一技术中，在分子中的每一个带正电的残基处导入突变，检测所得突变分子的蛋白酶活性以鉴定出对分子活性至关重要的氨基酸残基。也可通过诸如核磁共振分析，晶体学或光亲和标记的技术(参见例如de Vos et al.，1992，Science 255：306-312；Smithet al.，1992，Journal of Molecular Biology 224：899-904；Wlodaver et al.，1992，FEBS Letters 309：59-64)测定三维结构，通过分析三维结构测定底物-蛋白酶相互作用的位点。

本发明还涉及分离的编码本发明多肽的核酸序列，在很低严紧度的条件下，优选在低严紧度的条件下，更优选在中严紧度的条件下，更优选在中-高严紧度的条件下，甚至更优选在高严紧度的条件下，最优选在很高严紧度的条件下，所述核酸序列能与核酸探针杂交，所述核酸探针能在相同条件下与本文所限定的本发明的核酸序列或其互补链；或其等位基因变体和亚序列杂交(Sambrook et al.，1989，出处同上)。

本发明还涉及通过下述方法产生的分离的核酸序列：(a)在很低，低，中，中-高，高或很高严紧度的条件下，使DNA与(i)本发明的多核苷酸，(ii)(i)的亚序列，或(iii)(i)或(ii)的互补链杂交；和(b)分离核酸序列。优选亚序列是至少为100个核苷酸的序列，例如编码具有蛋白酶活性的多肽片段的序列。

通过使用任何本领域已知的方法进行定点诱变，可将突变导入核酸序列以用一个核苷酸替换另一个核苷酸。特别有用的方法利用了具有重要插入物的超螺旋双链DNA载体和两个含有所需突变的合成引物。在利用PfuDNA聚合酶进行的循环变温过程中，各自与载体的相反链互补的寡核苷酸引物延伸。通过引物的掺入，产生含有交错切口的突变质粒。循环变温之后，用特异于甲基化和半甲基化DNA的DpnI处理产物，以消化亲代DNA模板并选择出含突变的合成DNA。也可使用本领域已知的其它方法。本发明还涉及分离的编码第一方面所限定多肽的多核苷酸。

核酸构建体

本发明还涉及含有本发明的核酸序列的核酸构建体，所述核酸序列与一个或多个控制序列可操作相连，在与控制序列相容的条件下，所述控制序列能介导编码序列在适当宿主细胞中表达。应理解表达包括任何与多肽产生有关的步骤，包括但不限于转录，转录后修饰，翻译，翻译后修饰和分泌。

本文将“核酸构建体”定义为单链或双链核酸分子，所述分子分离自天然基因或经修饰后含有以自然界中可能不会存在的方式联合和并列的核酸区段。当核酸构建体含有表达本发明的编码序列所需的全部控制序列时，术语核酸构建体与表达盒是同义词。本文将术语“编码序列”定义为直接指定其蛋白质产物的氨基酸序列的核酸序列。一般通过核糖体结合位点(原核生物)或紧接mRNA 5’末端开放阅读框上游的ATG起始密码子(真核生物)以及紧接mRNA 3’末端开放阅读框下游的转录终止序列来测定编码序列的边界。编码序列包括但不限于DNA，cDNA和重组核酸序列。

可用多种方法处理分离的编码本发明多肽的核酸序列以提供多肽表达。根据表达载体的不同，在将核酸序列插入载体之前可能需要或必须对其进行处理。利用重组DNA法修饰核酸序列的技术是本领域众所周知的。

本文将术语“控制序列”定义为包括所有为表达本发明多肽所必需或对其有利的组件。对编码多肽的核酸序列而言，每个控制序列可以是天然的或外源的。所述控制序列包括但不限于前导序列，聚腺苷酸化序列，前肽序列，启动子，信号肽序列和转录终止子。控制序列至少包括启动子以及转录和翻译终止信号。为了导入特异性限制性位点，可以接头的形式提供控制序列，所述位点便于连接控制序列与编码多肽的核酸序列的编码区。本文将术语“可操作地相连”定义为一种构型，其中相对于DNA序列的编码序列而言，控制序列被安放于适当的位置，使得控制序列能介导多肽表达。

控制序列可以是适当的启动子序列(一种由宿主细胞识别以表达核酸序列的核酸序列)。启动子序列含有介导多肽表达的转录控制序列。启动子可以是任何在选定宿主细胞中显示出转录活性的核酸序列，包括突变的，截短的和杂合的启动子，启动子可得自对宿主细胞而言为同源或异源的编码细胞外或细胞内多肽的基因。

介导本发明的核酸构建体转录，特别是在细菌宿主细胞中转录的适当启动子的例子有：得自大肠杆菌lac操纵子，天蓝色链霉菌琼脂糖酶基因(dagA)，枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)，地衣芽孢杆菌α-淀粉酶基因(amyL)，嗜热脂肪芽孢杆菌产麦芽糖淀粉酶基因(amyM)，解淀粉芽孢杆菌α-淀粉酶基因(amyQ)，地衣芽孢杆菌青霉素酶基因(penP)，枯草芽孢杆菌xylA和xylB基因和原核生物β-内酰胺酶基因(Villa-Kamaroff et al.，1978，Proceedings of the National Academy of Sciences USA 75：3727-3731)的启动子，以及tac启动子(DeBoer et al.，1983，Proceedings of the National Academyof Sciences USA 80：21-25)。其它启动子描述于″Useful proteins fromrecombinant bacteria″in Scientific American，1980，242：74-94以及Sambrooket al.，1989，文献同上。

介导本发明的核酸构建体在丝状真菌宿主细胞中转录的适当启动子的例子有：得自米曲霉TAKA淀粉酶，米赫根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶，黑曲霉中性α-淀粉酶，黑曲霉酸稳定性α-淀粉酶，黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)，米赫根毛霉脂肪酶，米曲霉碱性蛋白酶，米曲霉丙糖磷酸异构酶，构巢曲霉乙酰胺酶和尖孢镰孢胰蛋白酶-样蛋白酶(WO96/00787)基因的启动子，以及NA2-tpi启动子(得自黑曲霉中性α-淀粉酶基因与米曲霉丙糖磷酸异构酶基因的启动子的杂合体)，及其突变的，截短的和杂合的启动子。

在酵母宿主中，有用的启动子得自酿酒酵母烯醇化酶(ENO-1)，酿酒酵母半乳糖激酶(GAL1)，酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)和酿酒酵母3-磷酸甘油酸激酶的基因。其它对酵母宿主细胞有用的启动子描述于Romanos et al.，1992，Yeast 8：423-488。

控制序列也可以是适当的转录终止序列(一种由宿主细胞识别以终止转录的序列)。终止序列与编码多肽的核酸序列的3’末端可操作相连。本发明可以使用任何能在选定宿主细胞中起作用的终止子。

对于丝状真菌宿主细胞而言，优选的终止子得自米曲霉TAKA淀粉酶，黑曲霉葡糖淀粉酶，构巢曲霉邻氨基苯甲酸合酶，黑曲霉α-葡糖苷酶和尖孢镰孢胰蛋白酶-样蛋白酶的基因。

对于酵母宿主细胞而言，优选的终止子得自酿酒酵母烯醇化酶，酿酒酵母细胞色素C(CYC1)和酿酒酵母甘油醛-3-磷酸脱氢酶的基因。其它对酵母宿主细胞有用的终止子描述于Romanos et al.，1992，文献同上。

对于细菌宿主细胞，如芽孢杆菌属宿主细胞而言，优选的终止子是得自地衣芽孢杆菌α-淀粉酶基因(amyL)，嗜热脂肪芽孢杆菌产麦芽糖淀粉酶基因(amyM)或解淀粉芽孢杆菌α-淀粉酶基因(amyQ)的终止子。

控制序列也可以是适当的前导序列(一种对宿主细胞翻译至关重要的mRNA的非翻译区)。前导序列与编码多肽的核酸序列的5’末端可操作相连。本发明可以使用任何能在选定宿主细胞中起作用的前导序列。

对于丝状真菌宿主细胞而言，优选的前导序列得自米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶的基因。

对于酵母宿主细胞而言，适当的前导序列得自酿酒酵母烯醇化酶(ENO-1)，酿酒酵母3-磷酸甘油酸激酶，酿酒酵母α-因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)的基因。

控制序列也可以是聚腺苷酸化序列(一种与核酸序列的3’末端可操作相连的序列，当其被转录时，作为信号被宿主细胞识别以在被转录的mRNA中添加聚腺苷残基)。本发明可以使用任何能在选定宿主细胞中起作用的聚腺苷酸化序列。

对于丝状真菌宿主细胞而言，优选的聚腺苷酸化序列得自米曲霉TAKA淀粉酶，黑曲霉葡糖淀粉酶，构巢曲霉邻氨基苯甲酸合酶，尖孢镰孢胰蛋白酶-样蛋白酶和黑曲霉α-葡糖苷酶的基因。

对于酵母宿主细胞而言，有用的聚腺苷酸化序列描述于Guo andSherman，1995，Molecular Cellular Biology 15：5983-5990。

控制序列也可以是信号肽编码区，该编码区编码与多肽的氨基末端相连的氨基酸序列，并介导编码的多肽进入细胞分泌途径。核酸序列的编码序列的5’末端可内在含有在翻译读框内与编码分泌多肽的编码区区段天然相连的信号肽编码区。或者，编码序列的5’末端可含有对编码序列而言为外源的信号肽编码区。当编码序列不天然含有信号肽编码区时，就需要外源的信号肽编码区。或者，为了增强多肽的分泌，可简单地用外源信号肽编码区置换天然信号肽编码区。然而，本发明可使用任何能介导表达的多肽进入选定宿主细胞的分泌途径的信号肽编码区。

对于细菌宿主细胞而言，有效的信号肽编码区是得自芽孢杆菌NCIB11837产麦芽糖淀粉酶，嗜热脂肪芽孢杆菌α-淀粉酶，地衣芽孢杆菌枯草蛋白酶，地衣芽孢杆菌α-淀粉酶，嗜热脂肪芽孢杆菌中性蛋白酶(nprT，nprS，nprM)和枯草芽孢杆菌prsA的基因的信号肽编码区。其它信号肽描述于Simonen and Palva，1993，Microbiological Reviews 57：109-137。

对于丝状真菌宿主细胞而言，有效的信号肽编码区是得自米曲霉TAKA淀粉酶，黑曲霉中性淀粉酶，黑曲霉葡糖淀粉酶，米赫根毛霉天冬氨酸蛋白酶，Humicola insolens纤维素酶和Humicola lanuginosa脂肪酶的基因的信号肽编码区。

对于酵母宿主细胞而言，有用的信号肽得自酿酒酵母α-因子和酿酒酵母转化酶的基因。其它有用的信号肽编码区描述于Romanos et al.，1992，文献同上。

控制序列也可以是编码位于多肽氨基末端的氨基酸序列的前肽编码区。已知所得多肽是酶原或多肽原。多肽原一般是无活性的，通过前肽的催化或自催化，可由多肽原转变为成熟的活性多肽。前肽编码区可得自枯草芽孢杆菌碱性蛋白酶(aprE)，枯草芽孢杆菌中性蛋白酶(nprT)，酿酒酵母α-因子，米赫根毛霉天冬氨酸蛋白酶和Myceliophthora thermophila漆酶(WO95/33836)的基因。

当多肽的氨基末端同时存在信号肽和前肽区时，前肽区紧接多肽的氨基末端，而信号肽区紧接前肽区的氨基末端。

还需要添加相对于宿主细胞的生长而言能调节多肽表达的调节序列。调节系统的例子是那些能导致基因表达对化学或物理刺激物，包括调节化合物的存在作出反应而被开启或关闭的系统。原核系统的调节系统包括lac，tac和trp操纵系统。在酵母中，可使用ADH2系统或GAL1系统。在丝状真菌中，可将TAKAα-淀粉酶启动子，黑曲霉葡糖淀粉酶启动子和米曲霉葡糖淀粉酶启动子用作调节序列。其它调节序列的例子是允许基因扩增的序列。在真核系统中，它们包括在氨甲蝶呤的存在下可扩增的二氢叶酸还原酶基因和在重金属存在下可扩增的金属硫蛋白基因。在这些情况下，编码多肽的核酸序列与调节序列可操作相连。

表达载体

本发明还涉及重组表达载体，其含有本发明的核酸序列，启动子以及转录和翻译终止信号。可将上述的多种核酸和控制序列连接在一起以产生重组表达载体，该载体可包括一个或多个便利的限制性位点，以允许在该位点插入或取代编码多肽的核酸序列。或者，可通过将核酸序列或含有该序列的核酸构建体插入适当的表达载体来表达本发明的核酸序列。在产生表达载体时，编码序列位于载体中，以使编码序列与表达所需的适当控制序列可操作相连。

重组表达载体可以是任何能方便地经受重组DNA程序并能致使核酸序列表达的载体(如质粒或病毒)。对载体的选择一般取决于载体与欲导入该载体的宿主细胞之间的相容性。载体可以是线型或封闭环状质粒。

载体可以是自主复制型载体，即作为染色体外的实体存在，其复制不依赖于染色体复制的载体，例如质粒，染色体外元件，微型染色体或人工染色体。载体可含有任何能确保自我复制的元件。或者，载体是当导入宿主细胞时，能整合至基因组并同与其整合的染色体一起复制的载体。另外，可使用单个载体或质粒，或两个或多个合起来含有欲导入宿主细胞基因组的总DNA的载体或质粒，或者转座子。

本发明的载体优选含有一个或多个能容易地选择转化细胞的选择标记。选择标记是一种基因，其产物可提供抗微生物剂或病毒抗性，对重金属的抗性，针对营养缺陷型的原养型等。细菌选择标记的例子是枯草芽孢杆菌或地衣芽孢杆菌的dal基因。针对酵母宿主细胞的适当标记是ADE2，HIS3，LEU2，LYS2，MET3，TRP1和URA3。用于丝状真菌宿主细胞的选择标记包括但不限于amdS(乙酰胺酶)，argB(鸟氨酸转氨甲酰酶)，bar(膦丝菌素乙酰转移酶)，hygB(潮霉素磷酸转移酶)，niaD(硝酸盐还原酶)，pyrG(乳清苷-5’-磷酸脱羧酶)，sC(硫酸盐腺苷酸转移酶)，trpC(邻氨基苯甲酸合酶)及其等同物。优选用于曲霉细胞的选择标记是构巢曲霉或米曲霉的amdS和pyrG基因以及吸水链霉菌的bar基因。

本发明的载体优选含有允许载体稳定整合至宿主细胞基因组，或在细胞中不依赖于基因组而自主复制载体的元件。

为了整合至宿主细胞基因组中，载体可依靠编码多肽的核酸序列或载体的任何其它元件以通过同源或非同源重组将载体稳定整合至基因组中。或者，载体可含有额外的核酸序列以通过同源重组介导对宿主细胞基因组的整合。这些额外的核酸序列能使载体在精确的染色体位置处整合至宿主细胞基因组。为了增加在精确位置整合的可能性，整合元件应优选含有足够数目的核酸，如100至1,500个碱基对，优选400至1,500个碱基对，最优选800至1,500个碱基对，所述核酸与相应的靶序列高度同源以增加同源重组的可能性。整合元件可以是任何与宿主细胞基因组中的靶序列同源的序列。另外，整合元件可以是非-编码或编码核酸序列。另一方面，可通过非-同源重组将载体整合至宿主细胞基因组。

为了进行自主复制，载体还可含有能使载体在所述宿主细胞中自主复制的复制起点。细菌复制起点的例子是允许在大肠杆菌中复制的质粒pBR322，pUC19，pACYC177和pACYC184的复制起点，以及允许在芽孢杆菌中复制的pUB110，pE194，pTA1060和pAMβ1的复制起点。用于酵母宿主细胞的复制起点的例子是2微米复制起点，ARS1，ARS4，ARS1和CEN3的组合以及ARS4和CEN6的组合。复制起点可以具有突变，所述突变使其在宿主细胞中的功能为温度敏感型(参见例如Ehrlich，1978，Proceedings ofthe National Academy of Sciences USA 75：1433)。

可将多于1拷贝的本发明的核酸序列插入宿主细胞以提高基因产物的产量。通过将至少一个额外拷贝的序列整合至宿主细胞基因组，或通过将核酸序列与可扩增的选择标记基因包括在一起，在适当选择试剂的存在下培养细胞，选择出含有扩增的选择标记基因拷贝因而含有额外的核酸序列拷贝的细胞，即可使核酸序列的拷贝数增加。

用于连接上述元件以构建本发明的重组表达载体的方法是本领域技术人员众所周知的(参见例如Sambrook et al.，1989，文献同上)。

蛋白酶也可与至少一种对动物饲料较为重要的其它酶一起被共表达，例如植酸酶(EC 3.1.3.8或3.1.3.26)；木聚糖酶(EC 3.2.1.8)；半乳聚糖酶(EC3.2.1.89)；α-半乳糖苷酶(EC 3.2.1.22)；蛋白酶(EC 3.4.-.-)；磷脂酶A1(EC3.1.1.32)；磷脂酶A2(EC 3.1.1.4)；溶血磷脂酶(EC 3.1.1.5)；磷脂酶C(3.1.4.3)；磷脂酶D(EC 3.1.4.4)和/或β-葡聚糖酶(EC 3.2.1.4或EC 3.2.1.6)。

可由不同载体，一个载体或混合使用这两项技术共表达酶。当使用不同载体时，载体可具有不同的选择标记和不同的复制起点。当仅使用一个载体时，可由一个或多个启动子表达基因。如果在一个启动子(双-或多-顺反子)的调节下进行克隆，基因被克隆的次序会影响蛋白质的表达水平。也可将蛋白酶表达为融合蛋白，即编码蛋白酶的基因在框内与编码另一种蛋白质的基因融合。该蛋白质可以是另一种酶或另一种酶的功能结构域。

因此，本发明还涉及重组表达载体或含有本发明的多核苷酸的多核苷酸构建体。

宿主细胞

本发明还涉及含有本发明的核酸序列的重组宿主细胞，该细胞可有利地用于重组制备多肽。将含有本发明的核酸序列的载体导入宿主细胞，从而以如上所述的染色体整合体或自我-复制的染色体外载体的形式维持载体。术语“宿主细胞”包括亲代细胞的任何后代，所述后代因复制过程中发生的突变而与亲代细胞不同。宿主细胞的选择在很大程度上取决于编码多肽的基因及其来源。宿主细胞可以是单细胞微生物，如原核生物，也可以是非-单细胞微生物，如真核生物。

有用的单细胞细胞是细菌细胞，如革兰氏阳性细菌，包括但不限于芽孢杆菌属细胞或链霉菌属细胞或乳酸菌细胞；或革兰氏阴性细菌，如大肠杆菌和假单胞菌属的菌种。乳酸菌包括但不限于下列属的种：乳球菌，乳杆菌，明串珠菌，链球菌，片球菌和肠球菌。有用的单细胞细胞是细菌细胞，如革兰氏阳性细菌，包括但不限于芽孢杆菌属细胞，如嗜碱芽孢杆菌，解淀粉芽孢杆菌，短芽孢杆菌，环状芽孢杆菌，克劳氏芽孢杆菌，凝结芽孢杆菌，灿烂芽孢杆菌，迟缓芽孢杆菌，地衣芽孢杆菌，巨大芽孢杆菌，嗜热脂肪芽孢杆菌，枯草芽孢杆菌和苏云金芽孢杆菌；或链霉菌属细胞，如浅青紫链霉菌或鼠灰链霉菌，或革兰氏阴性细菌，如大肠杆菌和假单胞菌属的菌种。在优选实施方案中，细菌宿主细胞是迟缓芽孢杆菌，地衣芽孢杆菌，嗜热脂肪芽孢杆菌或枯草芽孢杆菌细胞。在另一个优选实施方案中，芽孢杆菌属细胞是嗜碱的芽孢杆菌。

通过使用下述方法可将载体导入细菌宿主细胞，所述方法如原生质体转化(参见例如Chang and Cohen，1979，Molecular General Genetics 168：111-115)，使用感受态细胞(参见例如Young and Spizizin，1961，Journal ofBacteriology 81：823-829，or Dubnau and Davidoff-Abelson，1971，Journal ofMolecular Biology 56：209-221)，电穿孔(参见例如Shigekawa and Dower，1988，Biotechniques 6：742-751)或接合(参见例如Koehler and Thorne，1987，Journalof Bacteriology 169：5771-5278)。宿主细胞可以是真核生物，如非-人动物细胞，昆虫细胞，植物细胞或真菌细胞。在一个具体实施方案中，宿主细胞是真菌细胞。本文所用“真菌”包括子囊菌门(Ascomycota)，担子菌门(Basidiomycota)，壶菌门(Chytridiomycota)和接合菌门(Zygomycota)(如Hawksworth et al.，In，Ainsworth and Bisy’s Dictionary of The Fungi，8thedition，1995，CAB International，University Press，Cambridge，UK所定义)以及卵菌门(Oomycota)(如Hawksworth et al.，1995，文献同上，page 171所提及)和所有有丝分裂孢子真菌(Hawksworth et al.，1995，文献同上)。

在另一个具体实施方案中，真菌宿主细胞是酵母细胞。本文所用“酵母”包括产子囊酵母(Endomycetales)，产担孢子酵母和属于半知菌类的酵母(酵母菌)。由于将来酵母的分类可能会发生变化，为了本发明的目的，应该如Biology and Activities of Yeast(Skinner，F.A.，Passmore，S.M.，and Davenport，R.R.，eds，Soc.App.Bacteriol.Symposium Series No.9，1980)所述定义酵母。

酵母宿主细胞可以是假丝酵母属，汉逊氏酵母属，克鲁维氏酵母属，毕赤氏酵母属，酿酒酵母属，裂殖糖酵母属或Yarrowia细胞。

真菌宿主细胞可以是丝状真菌细胞。“丝状真菌”包括真菌亚门和卵菌门(定义于Hawksworth et al.，1995，文献同上)的所有丝状形式。丝状真菌的特征在于其菌丝壁由壳多糖，纤维素，葡聚糖，壳聚糖，甘露聚糖和其它复杂的多糖组成。营养生长通过菌丝延长来进行，碳分解代谢是专性需氧的。与之形成对照的是，诸如酿酒酵母的酵母的营养生长通过单细胞菌体芽殖来进行，碳分解代谢可以是发酵的。

丝状真菌宿主细胞的例子是包括但不限于下述属的菌种细胞：支顶孢属，曲霉属，镰孢属，腐质霉属，毛霉属，毁丝霉属，链孢霉属，青霉属，草根霉属，Tolypocladium或木霉属。

以本来已知的方式，通过包括原生质体形成，原生质体转化和细胞壁再生的方法转化真菌细胞。转化曲霉属宿主细胞的适当方法描述于EP 238023和Yelton et al.，1984，Proceedings of the National Academy of Sciences USA81：1470-1474。转化镰孢属菌种的适当方法描述于Malardier et al.，1989，Gene 78：147-156和WO 96/00787。可使用Becker and Guarente，In Abelson，J.N.and Simon，M.I.，editors，Guide to Yeast Genetics and Molecular Biology，Methods in Enzymology，Volume 194，pp 182-187，Academic Press，Inc.，NewYork；Ito et al.，1983，Journal of Bacteriology 153：163；和Hinnen et al.，1978，Proceedings of the National Academy of Sciences USA 75：1920中所述的方法转化酵母。

本发明涉及含有本发明的多核苷酸，或本发明的表达载体或多核苷酸构建体的重组宿主细胞。在优选实施方案中，重组宿主细胞是芽孢杆菌属细胞。

植物

本发明还涉及被编码本发明多肽的核酸序列转化，从而能以可回收的量表达和产生多肽的转基因植物，植物部分或植物细胞，其中所述多肽具有蛋白酶活性。可从植物或植物部分中回收多肽。或者，可使用含有重组多肽的植物或植物部分改善食品或饲料的品质，例如改善营养价值，适口性和流变学特性，或破坏抗营养因子。

在具体实施方案中，多肽靶向种子的胚乳贮存液泡。通过将其合成为具有适当信号肽的前体即可达到此目的，参见Horvath et al in PNAS，Feb.15，2000，vol.97，no.4，p.1914-1919。

转基因植物可以是双子叶的(双子叶植物)或单子叶的(单子叶植物)或其经改造的变体。单子叶植物的例子是草，如草地草(早熟禾)，草料草，如羊茅属，黑麦草属，temperate草，如剪股颖属和谷物，如小麦，燕麦，黑麦，大麦，水稻，高粱和玉米。双子叶植物的例子是烟草，豆类，如羽扇豆，马铃薯，糖甜菜，豌豆，蚕豆和大豆，以及十字花科植物(Brassicaceae科)，如花椰菜，油菜和密切相关的模式生物拟南芥。经改造的植物的例子是美国专利号5,689,054和6,111,168中所述的低-植酸植物。

植物部分的例子是茎，愈伤组织，叶，根，果实，种子和块茎。特殊的植物组织，如叶绿体，质外体，线粒体，液泡，过氧化物酶体和细胞质也被认为是植物部分。另外，不论其组织来源如何，任何植物细胞都被看成是植物部分。

本发明的范围内还包括所述植物，植物部分和植物细胞的后代。

可根据本领域已知的方法构建表达本发明多肽的转基因植物或植物细胞。简单地说，通过将一个或多个编码本发明多肽的表达构建体掺入植物宿主基因组，并将所得经修饰的植物或植物细胞繁殖成转基因植物或植物细胞，即可构建植物或植物细胞。

为了便利起见，表达构建体是核酸构建体，其含有编码本发明多肽的核酸序列，所述序列与在选定植物或植物部分中表达核酸序列所需的适当调节序列可操作相连。另外，表达构建体可含有用于鉴定整合了表达构建体的宿主细胞的选择标记和将构建体导入所述植物所需的DNA序列(后者取决于所用的DNA导入法)。

例如，可根据需要表达多肽的时机，地点和方式来选择调节序列，如启动子，终止序列以及非强制地选择信号或转运序列。例如，编码本发明多肽的基因的表达可以是组成型或诱导型的，或者可以是发育，时期或组织特异性的，基因产物可以靶向特定的组织或植物部分，如种子或叶。调节序列描述于例如Tague et al.，1988，Plant Physiology 86：506。

为了进行组成型表达，可使用35S-CaMV启动子(Franck et al.，1980，Cell21：285-294)。器官-特异性启动子可以是例如得自贮藏库组织，如种子，马铃薯块茎和果实(Edwards & Coruzzi，1990，Ann.Rev.Genet.24：275-303)的启动子，或是得自代谢库组织，如分生组织的启动子(Ito et al.，1994，Plant Mol.Biol.24：863-878)，种子特异性启动子，如水稻的麦谷蛋白，谷醇溶蛋白，球蛋白或白蛋白启动子(Wu et al.，1998，Plant and Cell Physiology 39：885-889)，蚕豆的豆球蛋白B4和未知种子蛋白基因的Vicia faba启动子(Conrad et al.，1998，Journal of Plant Physiology 152：708-711)，种子油体蛋白的启动子(Chen et al.，1998，Plant and Cell Physiology 39：935-941)，欧洲油菜的贮存蛋白napA启动子或者本领域已知的任何其它种子特异性启动子，例如，WO 91/14772中描述的那些启动子。另外，启动子可以是叶特异性启动子，如水稻或番茄的rbcs启动子(Kyozuka et al.，1993，Plant Physiology 102：991-1000)，小球藻病毒腺嘌呤甲基转移酶基因启动子(Mitra and Higgins，1994，Plant Molecular Biology 26：85-93)或水稻aldP基因启动子(Kagaya etal.，1995，Molecular and General Genetics 248：668-674)或创伤诱导型启动子，如马铃薯pin2启动子(Xu et al.，1993，Plant Molecular Biology 22：573-588)。

也可以使用启动子增强子元件在植物中获得较高的蛋白酶表达量。例如，启动子增强子元件可以是位于启动子和编码本发明多肽的核苷酸序列之间的内含子。例如，Xu et al.，1993，文献同上公开了使用水稻肌动蛋白1基因的第一个内含子来增强表达。

此外，可针对所述植物物种使密码子的使用最优化以改进表达(参见Horvath et al，文献同上)。

选择标记基因和表达构建体的任何其它部分都是本领域已知的。

根据本领域已知的常规技术将核酸构建体掺入植物基因组，所述技术包括农杆菌-介导的转化，病毒-介导的转化，微量注射，颗粒轰击，biolistic转化和电穿孔(Gasser et al.，1990，Science 244：1293；Potrykus，1990，Bio/Technology 8：535；Shimamoto et al.，1989，Nature 338：274)。

目前，根瘤农杆菌-介导的基因转移是产生转基因双子叶植物所选择的方法(综述参见Hooykas and Schilperoort，1992，Plant Molecular Biology 19：15-38)。然而，该方法也可用于转化单子叶植物，但是，单子叶植物一般优选其它转化方法。目前，产生转基因单子叶植物所选择的方法是用颗粒轰击(用转化DNA包被的金粒子或钨颗粒)胚愈伤组织或发育中的胚(Christou，1992，Plant Journal 2：275-281；Shimamoto，1994，Current OpinionBiotechnology 5：158-162；Vasil et al.，1992，Bio/Technology 10：667-674)。另一种可选择的转化单子叶植物的方法基于Omirulleh et al.，1993，PlantMolecular Biology 21：415-428所述的原生质体转化。

转化之后，根据本领域众所周知的方法选择其中掺入了表达构建体的转化体，并将其再生为完整的植株。

本发明还涉及制备本发明多肽的方法，其包括(a)在有助于制备多肽的条件下培养含有编码本发明多肽的核酸序列的转基因植物或植物细胞，其中所述多肽具有蛋白酶活性；和(b)回收多肽。本发明涉及含有权利要求8所限定的多核苷酸，或本发明的表达载体或多核苷酸构建体的转基因植物或植物部分。

动物

本发明还涉及转基因的非人动物及其产物或其组件，例如体液，如乳汁和血液，器官，肉和动物细胞。在例如哺乳动物细胞中表达蛋白质的技术是本领域已知的，参见例如手册Protein Expression：A Practical Approach，Higgins and Hames(eds)，Oxford University Press(1999)和该系列的其它三本与基因转录，RNA加工和翻译后加工有关的手册。一般说来，为了制备转基因动物，需用编码本发明多肽的核酸序列转化选定动物的选定细胞以表达和制备多肽，其中所述多肽具有蛋白酶活性。可从动物，例如从雌性动物的乳汁中回收多肽，或者为了动物自身的利益而表达多肽，例如有助于动物的消化。在下文标题为“动物饲料”的章节中提到了动物的例子。

为了以从动物乳汁中回收蛋白酶为目的而产生转基因动物，可使用转基因表达载体将编码蛋白酶的基因插入所述动物的受精卵中，其中所述载体含有适当的乳汁蛋白启动子和编码蛋白酶的基因。将转基因表达载体微量注射至受精卵，优选使其永久地整合至染色体。一旦受精卵开始生长和分裂，即将有潜力的胚植入代孕母体，并鉴定携有转基因的动物。然后通过常规饲养繁殖所得动物。可从动物的乳汁中纯化多肽，参见例如Meade，H.M.et al(1999)：Expression of recombinant proteins in the milk of transgenicanimals，Gene expression systems：Using nature for the art of expression.J.M.Fernandez and J.P.Hoeffler(eds.)，Academic Press。

在另一个可替代的技术方案中，为了产生在其体细胞和/或生殖细胞的基因组中携有核酸序列的转基因非人动物，可使转基因与WO 2000064247中公开的首选用于在唾液腺中特异性表达蛋白酶的调节序列可操作相连，其中所述核酸序列包括异源转基因构建体，所述构建体包括编码蛋白酶的转基因。

本发明还涉及含有本发明的多核苷酸或表达载体或多核苷酸构建体的转基因非人动物或其产物或组件。

制备方法

本发明还涉及制备本发明多肽的方法，其包括(a)在有助于在上清液中产生多肽的条件下培养宿主细胞或转基因植物或动物；和任选(b)回收多肽。

在本发明的制备方法中，使用本领域已知的方法在适于制备多肽的营养培养基中培养细胞。例如，可通过在允许多肽被表达和/或分离的条件下于适当培养基中进行的摇瓶培养，实验室或工业发酵罐中的小规模或大规模发酵(包括连续，分批，补料分批或固体状态的发酵)来培养细胞。使用本领域已知的方法，在含有碳和氮源以及无机盐的适当营养培养基中进行培养。适当的培养基可以商购或可根据已公开的组成(例如美国典型培养物保藏中心的目录)来制备。如果多肽分泌至营养培养基中，可直接从培养基中回收多肽。如果多肽是不分泌的，可从细胞裂解物中回收多肽。

可使用本领域已知的特异于多肽的方法检测多肽。这些检测方法包括使用特异性抗体，形成产物或使底物消失。例如，可使用蛋白酶试验测定本文所述多肽的活性。

可通过本领域已知的方法回收所得多肽。例如，可通过包括但不限于离心，过滤，提取，喷雾干燥，蒸发或沉淀的常规方法，从营养培养基中回收多肽。

可通过本领域已知的多种方法纯化本发明的多肽，所述方法包括但不限于层析(如离子交换，亲和，疏水，层析聚焦和大小排阻层析)，电泳法(如制备性等电聚焦电泳)，差异溶解性(如硫酸铵沉淀)，SDS-PAGE或提取(参见例如Protein Purification，J.-C.Janson and Lars Ryden，editors，VCHPublishers，New York，1989)。

组合物

另一方面，本发明涉及含有本发明多肽的组合物。可根据本领域已知的方法制备多肽组合物，组合物可以是液体形式或是干燥组合物。例如，多肽组合物可以是颗粒或微粒形式。可根据本领域已知的方法使组合物中包括的多肽稳定化。下文给出了本发明多肽或多肽组合物的优选用途的例子。

动物饲料

本发明还涉及在动物饲料中使用本发明多肽的方法，以及含有本发明多肽的饲料组合物和饲料添加剂。术语动物包括所有动物，包括人。动物的例子有非-反刍动物和反刍动物，如牛，羊和马。在具体实施方案中，动物是非-反刍动物。非-反刍动物包括单胃动物，如猪(包括但不限于小猪，生长中的猪和大母猪)；家禽，如火鸡，鸭和鸡(包括但不限于适于烤焙的小鸡，蛋鸡)；小牛；和鱼(包括但不限于鲑鱼，鳟鱼，罗非鱼，鲶鱼和鲤鱼)；和甲壳类动物(包括但不限于河虾和对虾)。

术语饲料或饲料组合物指的是适于或欲让动物摄取的任何化合物，制品，混合物或组合物。

在根据本发明的用途中，可在饮食之前，之后或同时给动物饲喂蛋白酶。优选后者。

在具体实施方案中，适当限定了往饲料中添加的蛋白酶或包括在饲料添加剂中的蛋白酶。适当限定指的是经大小排阻层析(参见WO 01/58275的实施例12)测定，蛋白酶制品至少为50％纯。在其它具体实施方案中，经此方法测定，蛋白酶制品至少为60，70，80，85，88，90，92，94或至少为95％纯。适当限定的蛋白酶制品是有利的。例如，对于实质上不受其它蛋白酶干扰或污染的蛋白酶而言，更容易确定它在饲料中的正确剂量。术语确定正确剂量具体指的是以获得一致和不变的结果为目的，基于所需效果最优化剂量的能力。

然而，为了在动物饲料中使用，蛋白酶不必那么纯；可以例如包括其它酶，此时可将其称为蛋白酶制品。蛋白酶制品可以(a)直接添加至饲料中(或直接用于植物蛋白质的处理过程)，或(b)可用于制备一种或多种随后被添加至饲料中(或用于处理过程)的中间组合物，如饲料添加剂或预混物。不论是否根据上述(a)或(b)来使用，上文所述的纯度指的都是原始蛋白酶制品的纯度。

具体地说，使用重组制备方法即可获得纯度为上述数量级的蛋白酶制品，然而，当通过传统的发酵方法制备蛋白酶时，要想获得所述蛋白酶制品却并非易事，而且，批次与批次之间会有较高的差异。所述蛋白酶制品当然可以与其它蛋白酶混合。

在具体实施方案中，用于本发明的蛋白酶能溶解植物蛋白质。实施例11公开了测定溶解蛋白质的适当测定法。

本文所用术语植物蛋白质指的是包括至少一种衍生自或源自植物的蛋白质，包括修饰的蛋白质和蛋白质-衍生物的任何化合物，组合物，制品或混合物。在具体实施方案中，植物蛋白质的蛋白质含量至少为10，20，30，40，50或60％(w/w)。植物蛋白质可以衍生自植物蛋白质来源，如豆类和谷类，例如得自Fabaceae(豆科)，十字花科，藜科和早熟禾科植物的材料，如大豆粉，羽扇豆粉和油菜籽粉。在具体实施方案中，植物蛋白质来源是得自Fabaceae科的一种或多种植物，如大豆，羽扇豆，豌豆或蚕豆的材料。

在另一个具体实施方案中，植物蛋白质来源是得自藜科的一种或多种植物，如甜菜，糖甜菜，菠菜或奎奴亚藜的材料。植物蛋白质来源的其它例子是油菜和甘蓝。大豆是优选的植物蛋白质来源。植物蛋白质来源的其它例子是谷类，如大麦，小麦，黑麦，燕麦，玉米，水稻和高粱。

根据本发明用至少一种本发明的蛋白酶处理植物蛋白质导致植物蛋白质的溶解增加。以下是在单胃体外模型中使用本发明的蛋白酶可获得的溶解蛋白质百分比的例子：相对于空白对照而言至少为102％，103％，104％，105％，106％或至少为107％。使用实施例11的单胃体外模型测定溶解蛋白质的百分比。术语蛋白质的溶解基本上指的是使蛋白质进入溶液中。所述溶解可能是由于在蛋白酶的介导下，蛋白质与通常复合而成的天然组合物，如饲料的其它组分分离而被释放出来所致。

在另一个具体实施方案中，用于本发明的蛋白酶能增加可消化植物蛋白质的量。以下是在单胃体外模型中使用本发明的蛋白酶可获得的已消化或可消化蛋白质百分比的例子：相对于空白对照而言至少为104％，105％，106％，107％，108％，109％或至少为110％。使用实施例11的体外模型测定已消化或可消化蛋白质的百分比。

以下是在水产动物体外模型中使用本发明的蛋白酶可获得的已消化或可消化蛋白质百分比的例子：相对于空白对照而言至少为103％，104％，105％，106％，107％，108％，109％或至少为110％。使用实施例12的水产动物体外模型测定已消化或可消化蛋白质的百分比。

在另一个具体实施方案中，用于本发明的蛋白酶能增加植物蛋白质的水解程度(DH)。以下是在单胃体外模型中可获得的水解程度增加的例子：相对于空白对照而言至少为102％，103％，104％，105％，106％或至少为107％。使用实施例11的单胃体外模型测定DH。以下是在水产动物体外模型中可获得的水解程度增加的例子：相对于空白对照而言至少为102％，103％，104％，105％，106％或至少为107％。使用实施例12的水产动物体外模型测定DH。

在本发明(预-)处理过程的具体实施方案中，所述蛋白酶影响植物蛋白质或蛋白质来源(或对其发挥作用或施加溶解影响)。为了达到此目的，一般将植物蛋白质或蛋白质来源悬浮于溶剂，例如含水溶剂，如水中，并适当关注所用酶的特征，以此调节pH和温度值。例如，可在能使实际蛋白酶的活性至少为40％，50％，60％，70％，80％或至少为90％的pH值下进行处理。类似地，例如，可在能使实际蛋白酶的活性至少为40％，50％，60％，70％，80％或至少为90％的温度下进行处理。上述活性百分比指示是相对于最大活性而言的。持续进行酶解反应直至获得所需结果，然后可以通过例如热-处理步骤灭活酶来终止反应，或者也可以不终止反应。

在本发明处理过程的另一个具体实施方案中，蛋白酶作用被维持，这意味着例如将蛋白酶加入植物蛋白质或蛋白质来源，但其溶解影响可以说尚未开启，直到后来当有此需求时，一旦建立了适当的溶解条件，或一旦灭活了任何酶抑制剂，或不论使用何种其它方式延迟了酶的作用，才会开启其溶解影响。

在一个实施方案中，处理是预-处理动物饲料或用于动物饲料的植物蛋白质。

术语改善动物饲料的营养价值指的是改善蛋白质的可利用性和/或可消化程度，从而导致从饮食组分中提取的蛋白质增加，较高的蛋白质产量，增加的蛋白质降解和/或改善的蛋白质利用。因此，饲料的营养价值得以增加，动物的表现，如生长速度和/或体重增加量和/或动物的饲料转化率(即相对于体重增加量的饲料摄取量)也得以改善。

在具体实施方案中，饲料转化率增加至少1％，2％，3％，4％，5％，6％，7％，8％，9％或至少10％。在另一个具体实施方案中，体重增加量增加至少2％，3％，4％，5％，6％，7％，8％，9％，10％或至少11％。这些数据是相对于未添加蛋白酶的对照实验而言的。

可按EEC(1986)：Directive de la Commission du 9 avril 1986 fixant laméthode de calcul de la valeur énérgetique des aliments composés destinés àlavolaille.Journal Officiel des Communautés Européennes，L130，53-54所述计算饲料转化率(FCR)和体重增加量。

可将任何形式的蛋白酶添加至饲料中，所述形式有：作为相对纯的蛋白酶，或与欲添加至动物饲料的其它组分的混合物，即动物饲料添加剂，如所谓的动物饲料预混物。

另一方面，本发明涉及用于动物饲料的组合物，如动物饲料和动物饲料添加剂，如预混物。

除了本发明的蛋白酶外，本发明的动物饲料添加剂含有至少一种脂溶性维生素和/或至少一种水溶性维生素和/或至少一种痕量矿物质。饲料添加剂也可含有至少一种巨量矿物质。

另外，任选的饲料-添加剂成份是着色剂，香味化合物，稳定剂，抗菌肽，包括抗真菌多肽，和/或至少一种选自下列的其它酶：植酸酶(EC 3.1.3.8或3.1.3.26)；木聚糖酶(EC 3.2.1.8)；半乳聚糖酶(EC 3.2.1.89)；α-半乳糖苷酶(EC 3.2.1.22)；蛋白酶(EC 3.4.-.-)；磷脂酶A1(EC 3.1.1.32)；磷脂酶A2(EC3.1.1.4)；溶血磷脂酶(EC 3.1.1.5)；磷脂酶C(3.1.4.3)；磷脂酶D(EC 3.1.4.4)和/或β-葡聚糖酶(EC 3.2.1.4或EC 3.2.1.6)。

在具体实施方案中，这些其它酶是被适当限定的(上文提及蛋白酶制品时已定义过)。

抗菌肽(AMP)的例子有：CAP18，Leucocin A，Tritrpticin，Protegrin-1，Thanatin，防卫素，Lactoferrin，Lactoferricin和Ovispirin，如Novispirin(RobertLehrer，2000)，Plectasins和Statins，包括PCT/DK02/00781和PCT/DK02/00812中公开的化合物和多肽以及保留了抗菌活性的上述物质的变体或片段。

抗真菌多肽(AFP)的例子有WO 94/01459和WO 02/090384中公开的巨大曲霉和黑曲霉肽，及其保留了抗真菌活性的变体或片段。

通常，脂溶性和水溶性维生素以及痕量矿物质形成欲添加至饲料的所谓预混物的一部分，而通常在饲料中单独添加巨量矿物质。本发明的动物饲料添加剂的一个例子是富含本发明蛋白酶的预混物。

在具体实施方案中，动物饮食或饲料中欲以0.01至10.0％；更具体地为0.05至5.0％或0.2至1.0％的水平包括(或按规定不得不包括)本发明的动物饲料添加剂(％指的是每100g饲料中添加剂的g数)。具体地说，对预混物也是如此。

下文列出了这些组分的非-排他性例子：

脂溶性维生素的例子有：维生素A，维生素D3，维生素E和维生素K，如维生素K3。

水溶性维生素的例子有维生素B12，生物素和胆碱，维生素B1，维生素B2，维生素B6，烟酸，叶酸和泛酸，如Ca-D-泛酸。

痕量矿物质的例子有锰，锌，铁，铜，碘，硒和钴。

宏量矿物质的例子有钙，磷和钠。

这些成分的营养需求(以家禽和小猪/猪举例)列于WO 01/58275中的表A。营养需求指的是应在饮食中以所示浓度提供这些组分。

在可替代的实施方案中，本发明的动物饲料添加剂含有WO 01/58275中的表A所详细说明的单个组分中的至少一种。至少一种指的是一种或两种或三种或四种等直至所有十三种单个组分中的一种或多种，或直至所有15种单个组分。更具体地，本发明的添加剂包括至少一种单个组分，其含量能使其在饲料中的浓度落入表A第4或第5或第6栏所示的范围。

本发明还涉及动物饲料组合物。动物饲料组合物或饮食具有相对较高的蛋白质含量。家禽和猪饮食的特征如WO 01/58275，表B第2-3栏所示。鱼食的特征如表B第4栏所示。另外，所述鱼食通常具有的粗脂肪含量为200-310g/kg。WO 01/58275相当于US 09/779334，被列入本文作为参考。

本发明的动物饲料组合物具有的粗蛋白含量为50-800g/kg，此外还含有至少一种本文所要求的蛋白酶。

另外，或在可替代(上述粗蛋白含量)的实施方案中，本发明的动物饲料组合物具有的可代谢能量的含量为10-30MJ/kg；和/或钙含量为0.1-200g/kg；和/或可利用的磷含量为0.1-200g/kg；和/或甲硫氨酸含量为0.1-100g/kg；和/或甲硫氨酸加半胱氨酸的含量为0.1-150g/kg；和/或赖氨酸的含量为0.5-50g/kg。

在具体实施方案中，可代谢能量，粗蛋白，钙，磷，甲硫氨酸，甲硫氨酸加半胱氨酸和/或赖氨酸的含量落入WO 01/58275，表B，范围2，3，4或5中的任何一个中(R.2-5)。

粗蛋白被计算为氮(N)乘以因数6.25，即粗蛋白(g/kg)＝N(g/kg)×6.25。通过Kjeldahl法(A.O.A.C.，1984，Official Methods of Analysis 14th ed.，Association of Official Analytical Chemists，Washington DC)测定氮含量。

可根据NRC出版物Nutrient requirements in swine，ninth revised edition1988，subcommittee on swine nutrition，committee on animal nutrition，board ofagriculture，national research council.National Academy Press，Washington，D.C.，pp.2-6以及European Table of Energy Values for Poultry Feed-stuffs，Spelderholt centre for poultry research and extension，7361 DA Beekbergen，TheNetherlands.Grafisch bedrijf Ponsen & looijen bv，Wageningen.ISBN90-71463-12-5计算可代谢的能量。

可根据饲料表，如Veevoedertabel 1997，gegevens over chemischesamenstelling，verteerbaarheid en voederwaarde van voedermiddelen，CentralVeevoederbureau，Runderweg 6，8219 pk Lelystad.ISBN 90-72839-13-7计算完全动物饮食中钙，可利用的磷和氨基酸的饮食含量。

在具体实施方案中，本发明的动物饲料组合物含有至少一种如上文所限定的植物蛋白质或蛋白质来源。

在另一个具体实施方案中，本发明的动物饲料组合物含有0-80％玉米；和/或0-80％高粱；和/或0-70％小麦；和/或0-70％大麦；和/或0-30％燕麦；和/或0-40％大豆粉；和/或0-10％鱼粉；和/或0-20％乳清。

可将动物饮食制备成例如糊状饲料(非小球形)或小球形饲料。一般将碾碎的饲料原料混合，再根据所针对动物物种的规格加入足够量的必需维生素和矿物质。以固体或液体酶制剂的形式加入酶。例如，一般在混合步骤之前或在混合的同时加入固体酶制剂；一般在造粒步骤之后加入液体酶制品。也可以将酶掺入饲料添加剂或预混物。

饮食中最终的酶浓度范围为0.01-200mg酶蛋白质/kg饮食，例如0.5-25mg酶蛋白质/kg动物饮食。

当然，应该以有效量，即足以改善饲料的溶解和/或营养价值的量使用蛋白酶。目前期望以下述量(剂量范围)中的一种或多种施用酶：0.01-200；0.01-100；0.5-100；1-50；5-100；10-100；0.05-50或0.10-10-所有范围都是每kg饲料中蛋白酶蛋白质的mg数(ppm)。

为了测定每kg饲料中酶蛋白质的mg数，从饲料组合物中纯化蛋白酶，使用相关试验(参见蛋白酶活性，底物和试验)测定纯化蛋白酶的比活性。使用相同试验测定所述饲料组合物的蛋白酶活性，在这两次测定的基础上计算出以每kg饲料中酶蛋白质的mg数计的剂量。

使用相同的原理测定饲料添加剂中的酶蛋白质mg数。当然，如果可获得制备饲料添加剂或饲料所用蛋白酶的样品，可由该样品测定比活性(无需从饲料组合物或添加剂中纯化蛋白酶)。

下文的实施例进一步描述了本发明，不应将其理解为对本发明范围的限制。

清洁剂组合物

可在清洁剂组合物中添加本发明的蛋白酶，因此所述蛋白酶成为清洁剂组合物的组分。例如，可将本发明的清洁剂组合物配制成手洗或机洗清洁剂组合物，包括适于预处理带有污渍的织物的洗衣用添加剂组合物和漂洗中添加的织物柔顺剂组合物，或配制成用于一般性的家中难清洁表面的清洗操作的清洁剂组合物，或配制成手或机器洗碗盘操作所用的清洁剂组合物。

在具体的方面，本发明提供了含有本发明的蛋白酶的清洁剂添加剂。清洁剂添加剂以及清洁剂组合物含有一种或多种其它酶，如另一种蛋白酶，如得自芽孢杆菌的碱性蛋白酶，脂肪酶，角质酶，淀粉酶，糖酶，纤维素酶，果胶酶，甘露聚糖酶，阿拉伯聚糖酶，半乳聚糖酶，木聚糖酶，氧化酶，例如漆酶和/或过氧化物酶。

一般说来，选定酶的特性应与选定清洁剂相容(即最适pH，与其它酶和非酶成分的相容性等)，酶应以有效量存在。

适当的脂肪酶包括来源于细菌或真菌的脂肪酶。包括经化学修饰或蛋白质工程改造的突变体。有用脂肪酶的例子包括腐质霉属(Thermomyces的同义词)的脂肪酶，例如EP 258068和EP 305216所述的得自H.lanuginosa(T.lanuginosus)的脂肪酶，或WO 96/13580所述的得自H.insolens的脂肪酶，假单胞菌属的脂肪酶，如得自产碱假单胞菌或类产碱假单胞菌(EP 218272)，葱头假单胞菌(EP 331376)，司徒茨氏假单胞菌(GB 1,372,034)，荧光假单胞菌，假单胞菌菌株SD 705(WO 95/06720和WO 96/27002)，P.wisconsinensis(WO 96/12012)的脂肪酶，芽孢杆菌属的脂肪酶，例如得自枯草芽孢杆菌(Dartois et al.(1993)，Biochemica et Biophysica Acta，1131，253-360)，嗜热脂肪芽孢杆菌(JP 64/744992)或短小芽孢杆菌(WO 91/16422)的脂肪酶。其它例子是如WO 92/05249，WO 94/01541，EP 407225，EP 260105，WO 95/35381，WO 96/00292，WO 95/30744，WO 94/25578，WO 95/14783，WO 95/22615，WO 97/04079和WO 97/07202中所述的脂肪酶变体。优选的商购脂肪酶包括Lipolase^TM和Lipolase Ultra^TM(Novozymes A/S)。

适当的淀粉酶(α-和/或β-淀粉酶)包括来源于细菌或真菌的淀粉酶。包括经化学修饰或蛋白质工程改造的突变体。淀粉酶包括例如得自芽孢杆菌属的α-淀粉酶，如GB 1,296,839中详细描述的地衣芽孢杆菌特定菌株的α-淀粉酶。有用淀粉酶的例子是WO 94/02597，WO 94/18314，WO 96/23873和WO 97/43424中所述的变体，特别是在下述的一个或多个位置中具有取代的变体：15，23，105，106，124，128，133，154，156，181，188，190，197，202，208，209，243，264，304，305，391，408和444。可商购的淀粉酶是Duramyl^TM，Termamyl^TM，Fungamyl^TM和BAN^TM(Novozymes A/S)，Rapidase^TM和Purastar^TM(购自Genencor International Inc.)。

适当的纤维素酶包括来源于细菌或真菌的纤维素酶。包括经化学修饰或蛋白质工程改造的突变体。适当的纤维素酶包括得自芽孢杆菌属，假单胞菌属，腐质霉属，镰孢属，草根霉属，支顶孢属的纤维素酶，例如US4,435,307，US 5,648,263，US 5,691,178，US 5,776,757和WO 89/09259中公开的由Humicola insolens，Myceliophthora thermophila和尖孢镰孢产生的真菌纤维素酶。特别合适的纤维素酶是碱性或中性纤维素酶，它们的好处在于能保护颜色。所述纤维素酶的例子是EP 0 495257，EP 531372，WO96/11262，WO 96/29397，WO 98/08940中描述的纤维素酶。其它例子是如WO 94/07998，EP 0 531 315，US 5,457,046，US 5,686,593，US 5,763,254，WO 95/24471，WO 98/12307和WO 99/01544所述的纤维素酶变体。可商购的纤维素酶包括Celluzyme^TM和Carezyme^TM(Novozymes A/S)，Clazinase^TM和Puradax HA^TM(Genencor International Inc.)以及KAC-500(B)^TM(KaoCorporation)。

适当过氧化物酶/氧化酶来源包括植物，细菌或真菌。包括经化学修饰或蛋白质工程改造的突变体。有用过氧化酶的例子包括得自Coprinus的过氧化物酶，例如WO 93/24618，WO 95/10602和WO 98/15257中所述的得自C.cinereus的过氧化物酶及其变体。可商购的过氧化物酶包括Guardzyme^TM(Novozymes)。

通过分开加入各含一种或多种酶的添加剂，或通过加入含有所有这些酶的混合添加剂，使清洁剂组合物中包括清洁剂酶。可将本发明的清洁剂添加剂，即各自分开的添加剂或混合添加剂配制成例如颗粒，液体，浆液等。优选的清洁剂添加剂剂型是颗粒(特别是不带粉尘的颗粒)，液体(特别是稳定的液体)或浆液。

不带粉尘的颗粒可按照例如US 4,106,991和4,661,452所公开的方法制备，并任选通过本领域已知的方法对其进行包被。光滑的包被材料的例子有平均分子量为1000至20000的聚(环氧乙烷)产品(聚乙二醇，PEG)；具有16至50个环氧乙烷单位的乙氧基化壬基酚；具有15至80个环氧乙烷单位的乙氧基化脂肪族醇，其中醇含有12至20个碳原子；脂肪族醇；脂肪酸以及脂肪酸的单酸甘油酯，甘油二酯和甘油三酯。GB 1483591给出了适用于流体床技术的可形成薄膜的包被材料的例子。例如，可根据已建立的方法，通过加入如丙二醇的多羟基化合物，糖或糖醇，乳酸或硼酸来稳定液体酶制品。可根据EP 238216中公开的方法制备受保护的酶。

本发明的清洁剂组合物可以是任何便利的形式，如条状，片状，粉末，颗粒，糊状或液体。液体清洁剂可以是含水的，一般含有高达70％的水和0-30％有机溶剂，或者也可以是不含水的。

清洁剂组合物含有一种或多种表面活性剂，所述表面活性剂可以是包括半-极性表面活性剂的非离子型表面活性剂和/或阴离子型和/或阳离子型和/或两性离子型表面活性剂。表面活性剂一般以占重量0.1％至60％的水平存在。

当包括于其中时，清洁剂通常含有约1％至约40％的阴离子型表面活性剂，如直链烷基苯磺酸盐，α-烯属磺酸酯，烷基硫酸酯(脂肪族醇的硫酸酯)，脂肪醇乙氧基硫酸盐，仲链烷磺酸盐，α-磺基脂肪酸甲基酯，烷基或烯基琥珀酸或肥皂。

当包括于其中时，清洁剂通常含有约0.2％至约40％的非离子型表面活性剂，如醇乙氧基化物，壬基酚乙氧基化物，烷基聚苷，烷基二甲基氧化胺，乙氧基化脂肪酸单乙醇氨化物，脂肪酸单乙醇氨化物，多羟基烷基脂肪酸氨化物或葡萄糖胺的N-酰基N-烷基衍生物(“glucamides”)。

清洁剂可含有0-65％的清洁剂增洁剂或配位剂，如沸石，二磷酸盐，三磷酸盐，膦酸盐，碳酸盐，柠檬酸盐，次氮基三乙酸，乙二胺四乙酸，二乙三胺五乙酸，烷基或烯基琥珀酸，可溶的硅酸盐或分层的硅酸盐(如得自Hoechst的SKS-6)。

清洁剂可含有一种或多种聚合物，例如羧甲基纤维素，聚(乙烯吡咯烷酮)，聚(乙二醇)，聚(乙烯醇)，聚(乙烯嘧啶-N-氧化物)，聚(乙烯咪唑)，聚羧酸酯，如聚丙烯酸酯，马来酸/丙烯酸共聚物和月桂基异丁烯酸/丙烯酸共聚物。

清洁剂可含有漂白体系，该体系可含有H₂O₂来源，如过硼酸盐或过碳酸盐，所述来源可与形成过酸的漂白催化剂，如四乙酰乙二胺或壬酰羟苯磺酸盐混合。或者，漂白体系可含有例如酰胺，酰亚胺或砜类的过氧酸。

可使用常规的稳定剂稳定化本发明清洁剂组合物中的酶，所述稳定剂是例如如丙二醇或甘油的多羟基化合物，糖或糖醇，乳酸，硼酸或如芳香硼酸酯的硼酸衍生物，或如4-甲酰基苯基硼酸的苯基硼酸衍生物，可按照例如WO 92/19709和WO 92/19708中所述的方法配制组合物。

清洁剂也可含有其它常规的清洁剂组分，例如包括粘土的织物调节剂，泡沫增强剂，泡沫抑制剂，抗侵蚀剂，污物悬浮剂，抗污物再沉淀剂，染料，杀菌剂，光亮剂，助水溶物，光泽度保持剂或香味剂。

目前期望在清洁剂组合物中加入任何酶，特别是本发明的酶，加入量相当于每升洗涤液加0.01-100mg酶蛋白质，优选每升洗涤液加0.05-5mg酶蛋白质，特别优选每升洗涤液加0.1-1mg酶蛋白质。

另外，可在WO 97/07202公开的清洁剂制剂中掺入本发明的酶。

本文描述和要求权利的发明的保护范围不受本文公开的具体实施方案限制，因为提供这些实施方案只是为了阐明本发明的几个方面。任何等效的实施方案都落入本发明的范围。实际上，除了本文所示和描述的内容以外，对本发明的多种修饰对阅读了上文的本领域熟练技术人员而言都是显而易见的。所述修饰也落入所附权利要求书的保护范围之内。当出现冲突时，本发明中包括定义的公开内容将会控制局面。

本文提及的多篇参考文献的全部内容皆列入本文作为参考。

实施例

材料和方法

菌株：

枯草芽孢杆菌PL1801(Diderichsen，B et al.1990.编码α-乙酰乳酸脱羧酶的aldB克隆，所述酶是短芽孢杆菌(Bacillus brevis)的胞外酶(exoenzyme)，J.Bacteriol.，172，4315-4321)

枯草芽孢杆菌MB1053

枯草芽孢杆菌PL3598-37

枯草芽孢杆菌MB1510

枯草芽孢杆菌PL2306。该菌株是apr和npr基因被破坏的枯草芽孢杆菌DN1885(Diderichsen，B.，Wedsted，U.，Hedegaard，L.，Jensen，B.R.，Sjholm，C.(1990)编码α-乙酰乳酸脱羧酶的aldB克隆，所述酶是短芽孢杆菌的胞外酶，J.Bacteriol.，172，4315-4321)，其已知的枯草芽孢杆菌纤维素酶基因的转录单位也被破坏，使其成为纤维素酶阴性细胞。所述破坏实质上按照(Eds.A.L.Sonenshein，J.A.Hoch and Richard Losick(1993)Bacillus subtilis andother Gram-Positive Bacteria，American Society for microbiology，p.618)所述的方法进行。

分离基因组DNA的方法

收集1.5ml培养物并将其重悬浮于100μl TEL。在37℃放置30分钟。

加入500μl硫氰酸盐缓冲液，在室温下放置10分钟。

加入250μl NH₄Ac并在冰上放置10分钟。

加入500μl CIA并混合。

转移至微量离心管中，全速离心10分钟。

将上清液转移至新的Eppendorf管并加入0.54倍体积冰冷的异丙醇。充分混合。

离心并用70％EtOH洗涤DNA沉淀。

将基因组DNA重悬浮于100μl TER。

TE： 10mM Tris-HCl，pH 7.4

1mM EDTA，pH 8.0

TEL：含50mg/ml溶菌酶的TE-缓冲液

硫氰酸盐： 5M硫氰酸胍

100mM EDTA

0.6％w/v N-月桂基肌氨酸，钠盐

60g硫氰酸盐，20ml 0.5M EDTA，pH 8.0，20ml H₂O，

于65℃溶解。冷却至室温并加入0.6g N-月桂基肌氨酸。

加入H₂O至100ml并通过0.2μ经消毒的滤器过滤。

NH₄Ac： 7.5M CH3COONH4

TER：含1μg/ml Rnase A的TE-缓冲液

CIA：氯仿/异戊醇24∶1

纯化PCR带和DNA测序

根据厂商说明，使用GFX^TM PCR DNA和Gel Band^TM纯化试剂盒(Pharmacia Biotech)纯化PCR片段。使用50-100ng模板，Taq脱氧-末端循环测序试剂盒(Perkin Elmer，USA)，经荧光标记的终止子和5pmol选定的测序引物，在ABI PRISM^TM 3700 DNA分析仪(Perkin Elmer，USA)上测定扩增PCR片段的核苷酸序列。

培养基

TY：(描述于Ausubel，F.M.et al.(eds.)“Current protocols in MolecularBiology”.John Wiley and Sons，1995)。

LB琼脂：(描述于Ausubel，F.M.et al.(eds.)“Current protocols inMolecular Biology”.John Wiley and Sons，1995)。

LB-PG琼脂：添加有0.5％葡萄糖和0.05M磷酸钾，pH 7.0的LB琼脂。

蛋白酶活性

除非另有说明，使用以琥珀酰-丙氨酸-丙氨酸-脯氨酸-苯丙氨酸-对硝基苯胺(paranitroanilide)为底物的PNA试验测定S2A蛋白酶活性。PNA试验的原理描述于Rothgeb，T.M.，Goodlander，B.D.，Garrison，P.H.，and Smith，L.A.，Joumal of the American Oil Chemists′Society，Vol.65(5)pp.806-810(1988)。

枯草芽孢杆菌宿主中的基因表达

通过同源重组将下述实施例中所有的表达基因整合至枯草芽孢杆菌宿主细胞基因组。在三联启动子系统(如WO 99/43835中所述)的控制下表达基因，所述启动子系统由地衣芽孢杆菌α-淀粉酶基因启动子(amyL)，解淀粉芽孢杆菌α-淀粉酶基因启动子(amyQ)和包括稳定化序列的苏云金芽孢杆菌cryIIIA启动子组成。将编码氯霉素乙酰转移酶的基因用作标记。(描述于例如Diderichsen，B.；Poulsen，G.B.；Joergensen，S.T.；A useful cloning vector forBacillus subtilis.Plasmid 30：312(1993))。

实施例1.构建具有Savinase信号的合成的10R尾-变体基因

构建合成的10R基因(10RS)，其编码拟诺卡氏菌NRRL 18262被称为10R的S2A蛋白酶(WO 01/58276)，所述基因具有SEQ ID NO：1所示的核苷酸序列。通过PCR使该合成基因与编码SAVINASE^TM(Novozymes)的信号肽的DNA在框内融合，产生SEQ ID NO：2所示的编码序列Sav-10RS。制备该构建体的几个尾-变体。与SEQ ID NO：2编码的Sav-10RS蛋白酶相比，尾变体构建体Sav-10RS HV0被构建成在C-末端具有8个额外的氨基酸：QSHVQSAP(SEQ ID NO：3)，它由插入SEQ ID NO：2的TAA终止密码子之前的下述DNA序列延伸编码：

(SEQ ID NO：4)：caatcgcatgttcaatccgctcca

尾变体Sav-10RS HV1被构建成在C-末端具有4个额外的氨基酸：QSAP(SEQ ID NO：5)，在TAA终止密码子之前插入了下述DNA序列延伸：

(SEQ ID NO：6)：caatcggctcct

尾变体Sav-10RS HV3被构建成在C-末端具有2个额外的氨基酸：QP(SEQ ID NO：7)，在TAA终止密码子之前插入了下述DNA序列延伸：

(SEQ ID NO：8)：caacca

尾变体Sav-10RS HV2被构建成在C-末端具有1个额外的氨基酸：P(SEQ ID NO：9)，在TAA终止密码子之前插入了下述DNA序列延伸：

(SEQ ID NO：10)：cca

通过同源重组将10RS基因和4个编码尾-变体的基因整合至枯草芽孢杆菌MB1053宿主细胞基因组。在1％脱脂乳LB-PG琼脂平板(添加有6μg/ml氯霉素)上检查氯霉素抗性转化子的蛋白酶活性。通过对插入物进行DNA测序，进一步分析一些蛋白酶阳性菌落以确保正确的基因DNA序列，选出5个各含有上述构建体之一的菌株，分别将它们称为：枯草芽孢杆菌Sav-10RS，枯草芽孢杆菌Sav-10RS HV0，枯草芽孢杆菌Sav-10RS HV1，枯草芽孢杆菌Sav-10RS HV2和枯草芽孢杆菌Sav-10RS HV3。

实施例2.具有Savinase信号的10R尾-变体的发酵产量

在回转式摇床上的500ml带挡板Erlenmeyer烧瓶中进行发酵以产生本发明的尾-变体酶，所述烧瓶各含有100ml添加有6mg/l氯霉素的TY。

对得自实施例1的5个枯草芽孢杆菌菌株中的每一个，平行地在6个Erlenmeyer烧瓶中进行发酵。6个Erlenmeyer烧瓶中的2个在37℃(250rpm)保温，2个在30℃(250rpm)保温，最后2个在26℃(250rpm)保温。在第1，2和3天对每个摇瓶取样，分析其蛋白酶活性。结果示于表1-3。从表1-3可以看出，通过培养物肉汤中的活性测定，尾的作用是令人惊奇地大大改善了蛋白酶的表达水平。26℃和30℃时作用最显著，但37℃时作用也很明显，在发酵早期观察到的作用尤其如此。

表1：37℃时的相对蛋白酶活性

	第1天	第2天	第3天
	第1天	第2天	第3天	Sav-10RS	1,0	1,0	1,0
Sav-10RS HV0	3,3	0,7	0,8	Sav-10RS	1,0	1,0	1,0
Sav-10RS HV0	3,3	0,7	0,8	Sav-10RS HV1	4,7	1,3	1,2
Sav-10RS HV2	2,2	0,6	0,4	Sav-10RS HV1	4,7	1,3	1,2
Sav-10RS HV2	2,2	0,6	0,4	Sav-10RS HV3	5,3	1,4	1,7

表2：30℃时的相对蛋白酶活性

第1天

第2天

第3天

Sav-10RS	1,0	1,0	1,0
Sav-10RS	1,0	1,0	1,0	Sav-10RS HV0	1,7	2,2	2,9
Sav-10RS HV1	4,6	3,1	4,9	Sav-10RS HV0	1,7	2,2	2,9
Sav-10RS HV1	4,6	3,1	4,9	Sav-10RS HV2	2,4	1,9	2,3
Sav-10RS HV3	4,8	3,0	4,4	Sav-10RS HV2	2,4	1,9	2,3

表3：26℃时的相对蛋白酶活性

	第1天	第2天	第3天
	第1天	第2天	第3天	Sav-10RS	1,0	1,0	1.0
Sav-10RS HV0	1,8	2,5	3,1	Sav-10RS	1,0	1,0	1.0
Sav-10RS HV0	1,8	2,5	3,1	Sav-10RS HV1	2,5	3,6	4,3
Sav-10RS HV2	1,8	2,6	2,8	Sav-10RS HV1	2,5	3,6	4,3
Sav-10RS HV2	1,8	2,6	2,8	Sav-10RS HV3	2,6	3,5	4,6

实施例3.尾-变体基因的染色体整合

使用下述构建体将编码尾-变体的基因整合至染色体。将众所周知的枯草杆菌蛋白酶BPN′蛋白酶的编码序列与三联启动子可操作相连，使标记基因与之融合(被解离酶res-位点包围的壮观霉素抗性基因)，使编码枯草芽孢杆菌果胶酸盐裂合酶的基因作为侧翼区段与构建体融合，所述区段分别含有编码尾-变体的多核苷酸上游的5’多核苷酸区域[yfmD-ytmC-yfmB-yfmA-Pel-start]和下游的3’多核苷酸区域[Pel-end-yflS-citS(start)]。通过将几个不同的PCR片段连接在一起制备出整合盒。最终的PCR反应之后，用PCR产物转化天然感受态枯草芽孢杆菌细胞。选择一个被称为PL3598-37的克隆，通过测序证实其含有正确的构建体。

因此PL3598-37克隆含有下述元件：

1.与枯草芽孢杆菌基因组区域100％同源的侧翼区(表现为上游片段yfmD-ytmC-yfmB-yfmA-Pelstart和下游片段Pel-end-yflS-citS(start))。

2.侧翼有解离酶位点(res)的壮观霉素抗性基因。

3.三联启动子区域加CryIIIA mRNA稳定化前导序列。

4.BPN’开放阅读框。

构建三联启动子BPN′盒

构建含有BPN’文库整合盒的PCR片段，由此使三联启动子(如WO99/43835所述；Novozymes)与芽孢杆菌属菌株的BPN’表达盒可操作相连。三联启动子是得自最优化的芽孢杆菌amyL的启动子(如WO 93/10249所示；Novozymes)与两个启动子scBAN和cryIIIA的融合物，其中第一个是解淀粉芽孢杆菌淀粉酶BAN启动子的共有版本，后者包括mRNA-稳定化序列(如WO 99/43835所述；Novozymes)。适当的引物可得自公众可获得的序列(Vasantha，N.et al.Genes for alkaline protease and neutral protease fromBacillus amyloliquefaciens contain a large open reading frame between theregions coding for signal sequence and mature protein.J.Bacteriol.159：811(1984)EMBL：accession No.K02496)。使用下述引物在每一末端导入侧翼于PCR片段的KpnI和SalI限制性位点：

#252639(SEQ ID NO：11)：catgtgcatgtgggtaccgcaacgttcgcagatgctgctgaagag

#251992(SEQ ID NO：12)：catgtgcatgtggtcgaccgattatggagcggattgaacatgcg

随后，使用PCR片段中的KpnI和SalI限制性位点将片段克隆至经KpnI-SalI消化的Pecl-Spec PCR片段。Pecl-Spec片段含有插入枯草芽孢杆菌果胶酸盐裂合酶基因中间的壮观霉素抗性基因，加上约2.3kb的上游基因组DNA和约1.7kb的下游基因组DNA。通过使用下述引物PCR扩增枯草芽孢杆菌菌株MB1053的基因组DNA以产生Pecl-Spec片段：

#179541(SEQ ID NO：13)：gcgttgagacgcgcggccgcgagcgccgtttggctgaatgatac

#179542(SEQ ID NO：14)：gcgttgagacagctcgagcagggaaaaatggaaccgctttttc

构建MB1053

通过将PCR产物整合至野生型枯草芽孢杆菌模式菌株的基因组以缺失果胶酸盐裂合酶(Pel)基因，从而构建出MB1053枯草芽孢杆菌菌株。通过PCR扩增直接位于枯草芽孢杆菌果胶酸盐裂合酶基因下游和上游的基因组DNA，即可达到此目的。

通过使用引物插入与编码标记基因的第三PCR片段的末端所限定的DNA序列100％同源的序列，即可延长直接位于Pel基因之前并起始Pel基因的基因组DNA的末端，其中所述标记基因被解离酶(Res)位点包围。在这一特定的情况下，标记基因(Spec)赋予对壮观霉素的抗性，该基因位于全部存在于质粒pSJ3358(描述于美国专利号5,882,888)上的两个Res位点之间。最初产生了3个不同的PCR片段。

片段1：该片段覆盖yfmD基因至Pel基因中间部位，并在Pel基因的Res-Spec-Res盒中导入突出端。片段1的大小是2.8kb。通过使用下述引物PCR扩增枯草芽孢杆菌菌株PL2306的染色体DNA即可产生片段1：

#179541(SEQ ID NO：13)，和

在#179154 Spec引物上加上突出端的#179539(SEQ ID NO：15)：

ccatttgatcagaattcactggccgtcgttttacaaccattgcggaaaatagtcataggcatcc

片段2：该片段覆盖Pel基因中间部位至CitS基因末端之后，并在位于Pel基因中间的Res-Spec-Res盒中导入突出端。片段2的大小是2.3kb。通过使用下述引物PCR扩增枯草芽孢杆菌菌株PL2306的染色体DNA即可产生片段2：

#179542(SEQ ID NO：14)，和

在#179153 Spec引物上加上突出端的#179540(SEQ ID NO：16)：

ggatccagatctggtacccgggtctagagtcgacgcggcggttcgcgtccggacagcaca

片段3：该片段含有被Res位点包围的壮观霉素基因，并在末端含有与PCR片段1和2重叠的DNA序列。片段3的大小是1.6kb。通过使用下述引物PCR扩增质粒pSJ3358即可产生片段3：

#179154(SEQ ID NO：17)：gttgtaaaacgacggccagtgaattctgatcaaatgg

#179153(SEQ ID NO：18)：ccgcgtcgacactagacacgggtacctgatctagatc

PCR反应的标准条件

为了PCR扩增片段1-3，使用HiFi Expand^TM PCR系统(Roche)以及下述循环方案：

5μl缓冲液2

14μldNTP(各1.25mM)

2.5ud20μM引物1

2.5μl20μM引物2

xμl水

在此混合物中加入3μl DNA(约100ng)和0.75μl酶混合物(使用热启动)。

总体积为50μl。

循环线路如下：

94℃ 120秒1个循环

暂停。

94℃ 15秒，60℃ 60秒，72℃ 240秒，10个循环。

94℃ 15秒，60℃ 60秒，20个循环(72℃ 180秒每个循环加20秒)。

68℃ 600秒1个循环。

制备这3个PCR片段，并在随后的JOINING-PCR反应中将它们连接在一起。这3个PCR片段是单个线条分明的带，不需要凝胶纯化。在下述JOINING-PCR之前仅需进行Qiagen^TM PCR纯化。

连接片段1+3(连接片段2+3的方法相同)：

5μl缓冲液2

8μldNTP(各1.25mM)

5.0μl片段3

5.0μl片段1

9.25μl水

94℃ 120秒1个循环

暂停。加入酶

94℃ 15秒，60℃ 60秒，72℃ 240秒，10个循环。

暂停。加入引物

94℃ 15秒，60℃ 60秒，15个循环(72℃ 180秒每个循环加20秒)。

68℃ 600秒1个循环。

在94℃ 120秒的第一个循环之后有一个暂停，此时加入0.75μl酶混合物。

总体积目前是45.0μl。

在最初的10个循环之后，在循环中还有一个暂停，针对片段1+3；加入2.5μl(20μM#179541)和2.5μl(20μM#179153)，针对片段2+3：加入2.5μl(20μM#179542)和2.5μl(20μM#179154)，再继续进行15个循环。

然后对PCR产物进行凝胶纯化：片段1+3的大小应为3.4kb，片段2+3的大小应为3.4kb。在最后的PCR反应(Expand^TM long system，Roche)中将这两个片段连接在一起：

5μl缓冲液1

14μldNTP(各1.25mM)

5.0μl片段1+3

5.0μl片段2+3

17.75μl水

总体积目前是45.0μl。

在最初的10个循环之后，在循环中还有一个暂停，加入2.5μl(20μM#179541)和2.5μl(20μM#179542)，再继续进行15个循环。

94℃ 120秒1个循环

暂停。加入酶

94℃ 15秒，60℃ 60秒，68℃ 240秒，10个循环。

暂停。加入引物

94℃ 15秒，60℃ 60秒，68℃ 180秒每个循环加20秒，15个循环。

68℃ 600秒1个循环。

连接在一起的PCR片段的大小为6.8kb。使用Qiagen^TM PCR纯化试剂盒纯化该PCR片段，将50μl经洗脱DNA中的5μl用于转化标准的枯草芽孢杆菌菌株。转化之后，将细胞铺于LBPG-120μg/ml壮观霉素上。第二天，可发现1000多个菌落。使用最后一次JOINING PCR扩增所用的PCR引物检查其中8个菌落，如果未发生缺失，会产生6.8kb而不是预期的5.2kb的PCR片段。另外，用Mancini免疫测定法检查克隆的果胶酸盐裂合酶活性，它对果胶酸盐裂合酶活性未显示出反应性。和Spec抗性合起来考虑，我们认为已经发生缺失。选择一个这样的克隆，并称之为MB1053。

将与res-spec-res邻接的BPN′表达盒插入MB1053

在使用PCR引物#179541和#179542的PCR扩增中，将经消化的PCR扩增的三联启动子BPN’表达盒与经KpnI-Sal消化的Pecl-Spec PCR片段的连接混合物用作模板。这会产生约9kb的PCR片段，使用该片段转化枯草芽孢杆菌PL1801(Diderichsen，B et al.1990.Cloning of aldB，which encodesalpha-acetolactate decarboxylase，an exoenzyme from Bacillus brevis.J.Bacteriol.，172，4315-4321)感受态细胞。将经转化的细胞铺于含脱脂乳的LB-120μg/ml壮观霉素琼脂平板。将具有大的脱脂乳清亮带的壮观霉素抗性菌落重新划线于壮观霉素琼脂平板，并使用引物#179541(SEQ ID NO：13)和#179542(SEQ ID NO：14)进行PCR，以分析PCR片段的整合。

出现9kb的片段表示PCR片段已整合至宿主细胞基因组。对几个这样的克隆进行测序以进一步证实表达盒的整合，选择一个这样的克隆，将其称为PL3598-37。

实施例4.构建携有质粒的染色体整合盒

可在体内构建携有大肠杆菌质粒的文库整合盒。用于本发明方法的整合盒可存在于大肠杆菌质粒(仅能在大肠杆菌中复制，不能在枯草芽孢杆菌中复制)上，所述质粒含有：

i)编码通常已知为Savinase的枯草杆菌蛋白酶的前-原-结构域的DNA序列，在其之前并与其可操作相连的

ii)含有mRNA稳定化区段的DNA序列，在这一特定情况下，所述区段得自CryIIIa基因；

iii)标记基因(氯霉素抗性基因)，和

iv)分别作为5′和3′侧翼区段的枯草芽孢杆菌基因组DNA：多核苷酸上游的同源5’多核苷酸区域[yfmD-ytmC-yfmB-yfmA-Pel-start]，和多核苷酸下游的3’多核苷酸区域[Pel-end-yflS-citS(start)]。

通过几个克隆步骤制备盒，所述步骤包括在常用质粒pUC19中具有的对几个不同PCR片段都合适的限制性内切核酸酶位点处消化pUC19质粒和PCR片段。每次将PCR片段连接至质粒之后，将连接混合物转化至按厂商(BIO-RAD)描述制备的电感受态DH5α大肠杆菌细胞，转化是通过按厂商的描述，使用购自BIO-RAD的Gene Pulser^TM电穿孔仪电穿孔而进行的。通过测序证实一个最终的质粒构建体含有上文所述的正确构建体，将其称为pMB1508。

因此，pMB1508质粒含有下述元件：

i)包括核糖体结合序列(RBS)的CryIIIA mRNA稳定化前导序列，与其可操作相连的

ii)编码通常已知为Savinase的枯草杆菌蛋白酶的前-原-结构域的DNA，其包括KpnI和NotI位点以用于克隆；

iii)氯霉素抗性操纵子；

iv)与枯草芽孢杆菌区域99-100％同源的3′下游侧翼区域[Pel-end-yflS-citS(start)]。

将上述的4个元件克隆至pUC19载体(分离自大肠杆菌ATCC 37254；Vieira J，Messing J.The pUC plasmids，an M13mp7-derived system for insertionmutagenesis and sequencing with synthetic universal primers.Gene 19：259-268，1982.)的EcoRI和SalI位点，获得pMB1508。为了使所得质粒高效整合至枯草芽孢杆菌基因组的特定位点，建立了新的菌株。新菌株是枯草芽孢杆菌168 BGSC，登记号：1A1 168 trpC2的衍生物。按上文所述使该菌株成为感受态并对其进行转化。使用上文所述PL3598-37克隆的元件，建立被称为MB1510的新整合菌株，其特征在于含有得自PL3598-37的下述元件：

i)三联启动子和mRNA稳定化元件。

ii)侧翼区段，其含有下述同源的位于三联启动子上游的多核苷酸区域[yfmD-ytmC-yfmB-yfmA-Pel-start]，和位于mRNA稳定化元件下游的多核苷酸区域[Pel-end-yflS-citS(start)]。

因此，当使用MB1510感受态细胞时，pMB1508(或其衍生物)可直接整合至MB1510基因组中，所述基因组中设有与三联启动子和mRNA稳定化元件融合的两个侧翼区，从而构建出pMB1508 DNA的引入PrePro编码DNA与三联启动子，mRNA稳定化元件和RBS一起整合至正确阅读框的构建体。由此导致MB1510基因组中已存在的启动子元件所引发的整合基因的高表达。

建立用大肠杆菌制备质粒pMB1508转化的枯草芽孢杆菌菌株MB1510的转化效率。为了进一步检测使用该方法的潜力，使用两个PCR引物PCR扩增Bacillus clausii的Savinase编码基因：

引物#317(SEQ ID NO：19)tggcgcaatcggtaccatgggg

引物#139 NotI(SEQ ID NO：20)catgtgcatgcggccgcattaacgcgttgccgcttctgcg

用KpnI和NotI消化所得的～0.8kb Savinase片段和pMB1508质粒，然后通过琼脂糖凝胶电泳纯化所得片段。连接这两个片段，使用连接混合物转化感受态大肠杆菌细胞，然后将所述细胞铺于LB-琼脂平板或置于液体培养基中，37℃生长过夜；两种培养基都含有50-100μg/ml氨苄青霉素。保温之后，由液体培养物制备质粒制品。用纯化的质粒转化MB1510感受态细胞(每次转化使用100-10.000ng质粒)。将经转化的细胞铺于含2％脱脂乳和6μg/ml氯霉素的TY培养基上以进行选择。37℃保温过夜之后，在整合盒适当整合至细胞中的那些菌落周围出现了清亮区，这表明Savinase的高表达。

该方法也可用于制备任何可在枯草芽孢杆菌中表达的有价值基因的高多样性文库，其中不只是编码一种酶的基因，任何可表达的多核苷酸皆可插入质粒pMB1508并整合至MB1510菌株供随后筛选。

质粒pMB1508的序列(SEO ID NO：21)

质粒pMB1508具有以碱基对位置表示的下述组分：

BP 5186-395：大肠杆菌克隆ATCC 37254的pUC19序列，Vieira J，Messing J.The pUC plasmids，an M13mp7-derived system for insertionmutagenesis and sequencing with synthetic universal primers.Gene 19：259-268，1982。

BP396-1021：EcoRI克隆位点(BP396-401)和CryIIIA mRNA稳定化元件(描述于WO 9634963-A1)。

BP 1022-1412：编码Savinase的Pre-Pro序列和NotI克隆位点。(Pre-Pro部分描述于例如WO 9623073-A1，通过PCR引物导入NotI位点以及Pre-Pro和NotI之间的间隔)。

BP 1413-2512：Bgl II克隆位点(BP1413-1418)和pDN1050的氯霉素乙酰转移酶操纵子(描述于例如Diderichsen，B.；Poulsen，GB.；Joergensen，S.T.；Auseful cloning vector for Bacillus subtilis.P1asmid 30：312(1993))。

BP2513-5185：枯草芽孢杆菌基因组的pelB基因座下游的多核苷酸区域[Pel-end-yflS-citS(start)]。(描述于下述文献和相应的数据库：F.Kunst，N.Ogasawara，I.Moszer，<146 other authors>，H.Yoshikawa，A.Danchin.″Thecomplete genome sequence of the Gram-positive bacterium Bacillus subtilis″Nature(1997)390：249-256)。

枯草芽孢杆菌菌株MB1510

MB1510在pelB基因座及其周围具有下述特征：

i)三联启动子和包括RBS(核糖体结合序列)的mRNA稳定化元件。

ii)侧翼区段，其含有下述同源的位于三联启动子上游的多核苷酸区域[yfmD-ytmC-yfmB-yfmA-Pel-start]，和位于mRNA稳定化序列下游的多核苷酸区域[Pel-end-yflS-citS(start)]。

MB1510基因组整合区域的序列(SEQ ID NO：22)

BP1-2873：对应于枯草芽孢杆菌基因组yfmD-ytmC-yfmB-yfmA-Pel-start的序列(描述于下述文献和相应的数据库：F.Kunst et al.″The complete genome sequence of the Gram-positive bacteriumBacillus subtilis″Nature(1997)390：249-256)。

BP3102-4082：三联启动子和CryIIIA mRNA稳定化元件加RBS。(描述于上文的PL3598-37构建体)。

BP4083-5718：枯草芽孢杆菌基因组的pelB基因座末端和下游的多核苷酸区域[Pel-end-yflS-citS(start)](描述于下述文献和相应的数据库：F.Kunst，N.Ogasawara，I.Moszer，<146 other authors>，H.Yoshikawa，A.Danchin.″Thecomplete genome sequence of the Gram-positive bacterium Bacillus subtils″Nature(1997)390：249-256)。

实施例5.构建2氨基酸尾-变体文库

本实施例显示了尾-变体文库的构建。在此文库中，在10R蛋白的C-末端导入了两个氨基酸。可使用上述方法，在以枯草芽孢杆菌10RS的基因组DNA为模板的PCR反应中使用下述PCR引物制备所述尾-文库：

1605(SEQ ID NO：23)：gacggccagtgaattcgataaaagtgc

1606(SEQ ID NO：24)：ccagatctctatnktnktgtacggagtctaactccccaagag

其中N＝A，C，G或T；K＝T或G。

用EcoR I和Bgl 11消化所得PCR产物，并连接至经EcoR I和Bgl 11消化的pMB1508。随后根据上文所述的原理进行操作。

通过自动化菌落挑选仪从生物测定平板上挑选氯霉素抗性枯草芽孢杆菌转化子，并将其转移至含有添加了6mg/l氯霉素的0.05×TY的384孔微滴板(MTP)(60μl/孔)。于26℃将MTP保温72小时。保温之后分析每个孔的蛋白酶活性。

选择30个具有最高蛋白酶活性的枯草芽孢杆菌转化子，以通过DNA测序测定每个转化子中的两个尾氨基酸，测序结果简述于表4和表5。

AA尾	转化子数目
AA尾	转化子数目	TL	4
TT	4	TL	4
TT	4	QL	3
TP	3	QL	3
TP	3	LP	3
TI	2	LP	3
TI	2	IQ	2
QP	2	IQ	2
QP	2	PI	2
LT	1	PI	2
LT	1	TQ	1
IT	1	TQ	1
IT	1	QQ	1
PQ	1	QQ	1
PQ	1	总计	30

表4：第1栏显示出尾的氨基酸序列，第2栏显示出经测序具有该特定氨基酸尾序列的枯草芽孢杆菌转化子的数目。

位置1的可能性	结果	位置2的可能性	结果
位置1的可能性	结果	位置2的可能性	结果	K	0	K	0
R	0	R	0	K	0	K	0
R	0	R	0	T	14	T	6
I	3	I	4	T	14	T	6
I	3	I	4	Q	6	Q	5
P	3	P	8	Q	6	Q	5
P	3	P	8	L	4	L	7
总计	30	总计	30	L	4	L	7

表5：此表显示出可由构建文库所用引物导入的氨基酸和通过对分离自筛选过程的30个菌落进行DNA测序而发现的实际情况。

实施例6.构建枯草芽孢杆菌菌株L2，L2 HV0和L2 HV1

按照与构建枯草芽孢杆菌菌株10RS类似的方法，通过PCR使编码达松维尔拟诺卡氏菌达松维尔亚种DSM 43235的S2A蛋白酶原-型(被称为L2)的DNA在框内与编码SAVINASE^TM(众所周知可得自Bacillus clausii的商用蛋白酶，可购自Novozymes，Denmark)信号肽的DNA融合以制备枯草芽孢杆菌菌株，将所得菌株称为枯草芽孢杆菌Say-L2。

用引物1423和1475扩增的，包括达松维尔拟诺卡氏菌达松维尔亚种DSM 43235的前成熟S2A蛋白酶编码区的DNA序列示于SEQ ID NO：25。相应编码的L2蛋白酶原-型氨基酸序列示于SEQ ID NO：28。

1423(SEQ ID NO：26)：gcttttagttcatcgatcgcatcggctgctccggcccccgtcccccag

1475(SEQ ID NO：27)：ggagcggattgaacatgcgattaggtccggatcctgacaccccag

还制备了该构建体的两个尾-变体。通过使用在TAA终止密码子之前插入的SEQ ID NO：4所示DNA序列延伸，将尾变体Sav-L2 HV0构建成C-末端具有8个额外的氨基酸：QSHVQSAP(SEQ ID NO：3)。通过使用在TAA终止密码子之前插入的SEQ ID NO：6所示DNA序列延伸，将尾变体Sav-L2HV1构建成C-末端具有4个额外的氨基酸：QSAP(SEQ ID NO：5)。就象在Sav--L2中一样，这两个尾变体都具有与前成熟编码序列在框内融合的SAVINASE^TM信号肽编码序列。

如上文所述，通过同源重组将Sav-L2基因和两个尾变体Sav-L2 HV0和Sav-L2 HV1整合至枯草芽孢杆菌MB1053宿主细胞基因组。在1％脱脂乳LB-PG琼脂平板(添加有6μg/ml氯霉素)上检查氯霉素抗性转化子的蛋白酶活性。通过对插入物进行DNA测序，进一步分析一些蛋白酶阳性菌落以证实正确的DNA序列，针对每个构建体选择一个菌株，分别称之为枯草芽孢杆菌Sav-L2，枯草芽孢杆菌Sav-L2 HV0和枯草芽孢杆菌Sav-L2 HV1。

实施例7.实施例6的芽孢杆菌菌株的发酵产量

在回转式摇床上的500ml带挡板Erlenmeyer烧瓶中发酵实施例6的3个枯草芽孢杆菌菌株，所述烧瓶各含有100ml添加有6mg/l氯霉素的TY。对3个枯草芽孢杆菌菌株中的每一个，平行地在6个Erlenmeyer烧瓶中进行发酵。6个Erlenmeyer烧瓶中的2个在37℃(250rpm)保温，2个在30℃(250rpm)保温，最后2个在26℃(250rpm)保温。在第1，2和3天对每个摇瓶取样，分析其蛋白酶活性。结果示于表6-8。从表6-8可以看出，当在枯草芽孢杆菌中表达时，尾的作用也能增加达松维尔拟诺卡氏菌达松维尔亚种DSM 43235的Sav-L2蛋白酶的表达水平。在此实验中观察到高达40％的增加，但在所有3个测试温度下，皆观察到这两个尾-变体的全面改善。

表6.37℃时的相对蛋白酶活性

	第1天	第2天	第3天
	第1天	第2天	第3天	Sav-L2	1,0	1,0	1,0
Sav-L2 HV1	1,4	1,3	1,2	Sav-L2	1,0	1,0	1,0
Sav-L2 HV1	1,4	1,3	1,2	Sav-L2 HV0	1,3	1,1	1,4

表7.30℃时的相对蛋白酶活性

	第1天	第2天	第3天
	第1天	第2天	第3天	Sav-L2	1,0	1,0	1,0
Sav-L2 HV1	1,0	1,2	1,4	Sav-L2	1,0	1,0	1,0
Sav-L2 HV1	1,0	1,2	1,4	Sav-L2 HV0	1,1	1,3	1,3

表8.26℃时的相对蛋白酶活性

	第1天	第2天	第3天
	第1天	第2天	第3天	Sav-L2	1,0	1,0	1,0
Sav-L2 HV1	1,3	1,1	1,1	Sav-L2	1,0	1,0	1,0
Sav-L2 HV1	1,3	1,1	1,1	Sav-L2 HV0	0,2	1,1	1,1

实施例8.芽孢杆菌中具有异源前-区的10R尾变体

编码达松维尔拟诺卡氏菌达松维尔亚种DSM 43235的L2蛋白酶前-区的DNA序列示于SEQ ID NO：29，对应的氨基酸序列示于SEQ ID NO：30。制备被称为L210R的枯草芽孢杆菌菌株，该菌株类似于枯草芽孢杆菌菌株10RS，但用编码L2前-区的DNA替代了编码10RS前-区的DNA。包括L2前-区的完整L210R蛋白酶编码序列示于SEQ ID NO：31。

还制备了上述构建体的两个尾-变体。通过使用在编码序列的TAA终止密码子之前插入的SEQ ID NO：4所示DNA，将尾变体HV0构建成C-末端具有8个额外的氨基酸：QSHVQSAP(SEQ ID NO：3)。通过使用在编码序列的TAA终止密码子之前插入的SEQ ID NO：6所示DNA序列，将尾变体HV1构建成C-末端具有4个额外的氨基酸：QSAP(SEQ ID NO：5)。

通过同源重组将10RL2构建体和两个尾变体整合至枯草芽孢杆菌MB1053宿主细胞基因组。在1％脱脂乳LB-PG琼脂平板(添加有6μg/ml氯霉素)上检查氯霉素抗性转化子的蛋白酶活性。通过对插入物进行DNA测序，进一步分析一些蛋白酶阳性菌落以证实正确的DNA序列，针对每个构建体选择一个菌株，分别称之为枯草芽孢杆菌L210R，枯草芽孢杆菌L210RHV0和枯草芽孢杆菌L210R HV1。

实施例9.具有异源前-区的10R尾变体的发酵产量

在回转式摇床上的500ml带挡板Erlenmeyer烧瓶中发酵6个枯草芽孢杆菌菌株10RS，10RS HV0，10RS HV1，L210R，L210R HV0和L210R HV1，所述烧瓶各含有100ml添加有6mg/l氯霉素的TY。对枯草芽孢杆菌菌株中的每一个，平行地在6个Erlenmeyer烧瓶中进行发酵。6个Erlenmeyer烧瓶中的2个在37℃(250rpm)保温，2个在30℃(250rpm)保温，最后2个在26℃(250rpm)保温。在第1，2和3天对每个摇瓶取样，分析其蛋白酶活性。结果示于图1和表9-11。从结果中可以看出，通过37℃时培养物肉汤中的蛋白酶活性测定，用L2蛋白酶的前区替换10R前区的效果导致10R蛋白酶的表达水平令人惊奇地大有改善。两个尾变体中的效果最为显著。

表9.37℃时的相对蛋白酶活性

	第1天	第2天	第3天
	第1天	第2天	第3天	10RS	1,0	1,0	1,0
10RS HV0	3,7	8,9	3,5	10RS	1,0	1,0	1,0
10RS HV0	3,7	8,9	3,5	10RS HV1	3,9	8,5	4,3
L210R	1.9	2,3	1,6	10RS HV1	3,9	8,5	4,3
L210R	1.9	2,3	1,6	L210R HV0	5,3	14,4	7,3
L210R HV1	9,1	20,9	7,6	L210R HV0	5,3	14,4	7,3

表10.30℃时的相对蛋白酶活性

	第1天	第2天	第3天
	第1天	第2天	第3天	10RS	1,0	1,0	1,0
10RS HV0	2,8	3,1	4,3	10RS	1,0	1,0	1,0
10RS HV0	2,8	3,1	4,3	10RS HV1	3,6	3,6	4,9
L210R	0,6	0,4	0,9	10RS HV1	3,6	3,6	4,9
L210R	0,6	0,4	0,9	L210R HV0	3,5	3,2	4,5
L210R HV1	3,7	3,2	4,5	L210R HV0	3,5	3,2	4,5

表11.26℃时的相对蛋白酶活性

	第1天	第2天	第3天
	第1天	第2天	第3天	10RS	1,0	1,0	1,0
10RS HV0	2,6	3,0	2,8	10RS	1,0	1,0	1,0
10RS HV0	2,6	3,0	2,8	10RS HV1	3,7	3,3	3,1
L210R	0,4	0,7	0,4	10RS HV1	3,7	3,3	3,1
L210R	0,4	0,7	0,4	L210R HV0	2,3	2,1	1,9
L210R HV1	2,2	1,7	1,7	L210R HV0	2,3	2,1	1,9

实施例10.用其它10R-样蛋白酶重复实施例1-9

完全类似于上文实施例1至9，用下述拟诺卡氏菌属菌株的蛋白酶进行类似的实验：

(a)WO 88/03947中描述的达松维尔拟诺卡氏菌NRRL 18133；

(b)WO 88/03947中描述的拟诺卡氏菌NRRL 18262，得自拟诺卡氏菌NRRL 18262的蛋白酶的DNA和氨基酸序列示于DK专利申请号199600013，WO 01/58276描述了与得自拟诺卡氏菌NRRL 18262的蛋白酶相关的酸-稳定性蛋白酶在动物饲料中的用途；

(c)白拟诺卡氏菌DSM 15647；该蛋白酶的氨基酸序列是SEQ ID NO：33，编码核苷酸序列是SEQ ID NO：32；使用下述两个引物进行PCR扩增从该菌株的基因组DNA中分离基因：

1421(SEQ ID NO：34)：gttcatcgatcgcatcggctgcgaccggccccctcccccagtc

1604(SEQ ID NO：35)：gcggatcctatcaggtgcgcagggtcagacc。

(d)葱绿拟诺卡氏菌DSM 15648；该蛋白酶的氨基酸序列是SEQID NO：37，编码核苷酸序列是SEQ ID NO：36；使用下述两个引物进行PCR扩增从该菌株的基因组DNA中分离基因：

1346(SEQ ID NO：38)：gttcatcgatcgcatcggctgccaccggaccgctcccccagtc

1602(SEQ ID NO：39)：gcggatcctattaggtccggagacggacgccccaggag。

(e)葱绿拟诺卡氏菌DSM 15649；该蛋白酶的氨基酸序列是SEQ ID NO：41，编码核苷酸序列是SEQ ID NO：40；使用下述两个引物进行PCR扩增从该菌株的基因组DNA中分离基因：

1603(SEQ ID NO：42)：gttcatcgatcgcatcggctgccaccggaccactcccccagtc和1602(SEQ ID NO：39)。

实施例11.得自DSM 43235的10R-样蛋白酶的体内单胃表现

在单胃体外消化模型中测定达松维尔拟诺卡氏菌达松维尔亚种DSM43235蛋白酶的表现。在单胃动物刺激消化的体外模型中检测SEQ ID NO：28所示蛋白酶成熟部分的纯化制品(按上文所述制备)的表现。具体检测蛋白酶改善玉米/-SBM(玉米/-大豆粉)蛋白质的溶解和消化状况的能力。在下表中，该蛋白酶被称为“本发明的蛋白酶”。

体外系统由15个瓶组成，其中最初使玉米/-SBM底物与HCl/胃蛋白酶一起保温-刺激胃消化-随后与胰酶制剂一起保温以刺激肠消化。在胃阶段开始时，在10个瓶中加入一定剂量的蛋白酶，而将其余瓶用作空白对照。在肠保温阶段结束时，取出体外消化物样品并分析已溶解和消化的蛋白质。

表12：体外消化程序概要

加入的组分	pH	温度	时间进程	刺激的消化阶段
加入的组分	pH	温度	时间进程	刺激的消化阶段	10g玉米/-SBM底物(6∶4)，41ml HCl(0.105M)	3.0	40℃	t＝0分钟	混合
5ml HCl(0.105M)/胃蛋白酶(3000U/g底物)，1mL本发明的蛋白酶	3.0	40℃	t＝30分钟	胃消化	10g玉米/-SBM底物(6∶4)，41ml HCl(0.105M)	3.0	40℃	t＝0分钟	混合
5ml HCl(0.105M)/胃蛋白酶(3000U/g底物)，1mL本发明的蛋白酶	3.0	40℃	t＝30分钟	胃消化	16ml H₂O	3.0	40℃	t＝1.0小时	胃消化
7ml NaOH(0,39M)	6.8	40℃	t＝1.5小时	肠消化	16ml H₂O	3.0	40℃	t＝1.0小时	胃消化
7ml NaOH(0,39M)	6.8	40℃	t＝1.5小时	肠消化	5ml NaHCO₃(1M)/胰酶制剂(8mg/g饮食)	6.8	40℃	t＝2.0小时	肠消化
终止保温	7.0	40℃	t＝6.0小时		5ml NaHCO₃(1M)/胰酶制剂(8mg/g饮食)	6.8	40℃	t＝2.0小时	肠消化

条件

底物： 4g SBM，6g玉米(预混的)

pH： 3.0胃阶段/6.8-7.0肠阶段

HCl： 0.105M，1.5小时(即30分钟HCl-底物预混)

胃蛋白酶： 3000U/g饮食，1小时

胰酶制剂： 8mg/g饮食，4小时

温度： 40℃

重复次数： 5

溶液

0.39MNaOH

0.105MHCl

0.105MHCl，每5ml含有6000U胃蛋白酶

1MNaHCO₃，每ml含有16mg胰酶制剂

125mM NaAc-缓冲液，pH6.0

酶蛋白酶测定

使用S.C.Gill & P.H.von Hippel，Analytical Biochemistry 182，319-326，(1989)中概述的原理，根据A₂₈₀值和氨基酸序列(氨基酸组成)计算蛋白酶酶蛋白质的量(下文将酶蛋白质简称为EP)。

体外模型的实验方法

实验方法根据的是上文所述的内容，在1，2.5和5.5小时的时间点测定pH。6小时后终止保温，取出30ml样品，置于冰上，然后离心(10000×g，10分钟，4℃)。取出上清液储存于-20℃。

分析

用OPA法分析所有样品的蛋白质水平百分比，并用凝胶过滤分析所有样品中被溶解和消化的蛋白质含量。

通过OPA-法测定DH

使用基于半自动化微滴板的比色法(Nielsen，P.M.；Petersen，D.；Dambmann，C.Improved method for determining food protein degree ofhydrolysis.J.Food Sci.2001，66，642-646)测定不同样品中蛋白质的水解程度(DH)。按下述制备OPA试剂：将7.620g四硼酸二钠十水合物和200mg十二烷基硫酸钠(SDS)溶解于150ml去离子水中。在继续之前将试剂完全溶解。将160mg o-邻苯二醛97％(OPA)溶解于4ml乙醇中。通过用去离子水冲洗将OPA溶液定量转移至上述溶液。在溶液中加入176mg二硫苏糖醇99％(DTT)，用去离子水使体积达到200ml。通过将50mg丝氨酸(Merck，Germany)溶解于500ml去离子水中，制备出丝氨酸标准(0.9516meqv/l)。

将每个样品稀释至光吸收度(280nm)约为0.5以制备出样品溶液。一般使用自动化Tecan稀释站(Mnnedorf，Switzerland)稀释上清液(100×)。使用去离子水作为对照，在340nm下进行所有其它分光光度计的读数。使25 μl样品(标准样品和盲试样品)散布于微滴板中。将微滴板插入iEMS MF读出器(Labsystems，Finland)，自动分散200μl OPA试剂。振动微滴板(2分钟；700rpm)，然后测定光吸收值。最后计算出DH。对所有样品进行8次测定。

估计经溶解和消化的蛋白质

通过使用凝胶过滤HPLC定量粗蛋白(CP)来估计体外消化样品的上清液中溶解蛋白质的含量。使上清液解冻，通过0.45μm聚碳酸酯滤器过滤并用H₂O稀释(1∶50，v/v)。使用Superdex Peptide PE(7.5×300mm)凝胶过滤柱(Global)进行HPLC以层析经稀释的样品。用于等度洗脱的洗脱液是含有150mM NaCl的50mM磷酸钠缓冲液(pH7.0)。每次洗脱时所用洗脱液的总体积是26ml，流速是0.4ml/分钟。记录214nm下的洗脱分布图，通过积分法测定分布图下的总面积。为了由积分的面积估计蛋白质含量，由具有已知总蛋白质含量的，经成倍稀释的体外消化玉米/-SBM参照样品绘制校正曲线(R²＝0.9993)。使用Kjeldahl法(测定氮的百分比；A.O.A.C.(1984)Official Methods of Analysis 14th ed.，Washington DC)进行参照样品中的蛋白质测定。

通过对与分子量为1500道尔顿或以下的肽和氨基酸相对应的层析图面积进行积分，估计出经消化蛋白质的含量(Savoie，L.；Gauthier，S.F.DialysisCell For The In-vitro Measurement Of Protein Digestibility.J.Food Sci.1986，51，494-498；Babinszky，L.；Van，D.M.J.M.；Boer，H.；Den，H.L.A.An In-vitroMethod for Prediction of The Digestible Crude Protein Content in Pig Feeds.J.Sci.Food Agr.1990，50，173-178；Boisen，S.；Eggum，B.O.Critical Evaluation ofIn-vitro Methods for Estimating Digestibility in Simple-Stomach Animals.Nutrition Research Reviews 1991，4，141-162)。为了确定1500道尔顿的区分线，使用细胞色素C(Boehringer，Germany)，抑蛋白酶肽，胃泌素I和P物质(Sigma Aldrich，USA)作为分子量标准校正凝胶过滤柱。

结果

下文表13和14所示的结果表明蛋白酶显著增加了水解程度(DH)以及可溶和可消化的蛋白质。

表13：水解程度(DH)，绝对值和相对值

酶(以mg EP计的剂量/kg饲料)	n	占总蛋白质的百分比			相对于空白对照的百分比
		占总蛋白质的百分比			相对于空白对照的百分比			％DH		SD	％DH		％CV
		空白对照	5	26.84	a	0.69	100.0	％DH		SD	％DH		％CV	a	2.57
本发明的蛋白酶(100)	5	空白对照	5	26.84	a	0.69	100.0	28.21	b	0.35	105.1	b	1.25	a	2.57

相同栏内的不同字母表示显著差异(1-way ANOVA，Tukey-Kramer试验，P＜0.05)。SD＝标准差，％CV＝变异系数＝(SD/平均值)×100％。

表14：通过KTA HPLC测定的经溶解和消化的粗蛋白

酶(以mgEP计的剂量/kg饲料)	n	占总蛋白质的百分比						相对于空白对照的百分比
		占总蛋白质的百分比						相对于空白对照的百分比						％经消化CP		SD	％经溶解CP		SD	％经消化CP		CV％	％经溶解CP		CV％
		空白对照	5	54.1	a	1.1	90.1	a	1.1	100.0	a	2.0	100.0	％经消化CP		SD	％经溶解CP		SD	％经消化CP		CV％	％经溶解CP		CV％	a	1.2
本发明的蛋白酶(50)	5	空白对照	5	54.1	a	1.1	90.1	a	1.1	100.0	a	2.0	100.0	57.7	b	1.1	93.2	b	1.4	106.7	b	1.9	103.4	b	1.5	a	1.2
本发明的蛋白酶(50)	5	(100)	5	58.9	b	0.8	94.8	b	0.9	108.9	b	1.3	105.2	57.7	b	1.1	93.2	b	1.4	106.7	b	1.9	103.4	b	1.5	b	0.9

实施例12.得自DSM 43235的10R-样蛋白酶的体外水产动物表现

在水产动物体外模型中测定达松维尔拟诺卡氏菌达松维尔亚种DSM43235蛋白酶的表现。在冷水性鱼类刺激消化的水产动物体外模型中检测实施例3所述蛋白酶制品。体外系统由15个瓶组成，其中最初使SBM底物与HCl/胃蛋白酶一起保温-刺激胃消化-随后与胰酶制剂一起保温以刺激肠消化。在胃阶段开始时，在10个瓶中加入一定剂量的蛋白酶，而将其余5个瓶用作空白对照。在肠保温阶段结束时，取出体外消化物样品并分析已溶解和消化的蛋白质。

表15：水产动物体外消化程序概要

加入的组分	pH	温度	时间进程	刺激的消化阶段
加入的组分	pH	温度	时间进程	刺激的消化阶段	10g挤压出的SBM底物，62mL HCl(0.155M)/胃蛋白酶(4000U/g底物)，1mL本发明的蛋白酶	3.0	15℃	t＝0分钟	胃消化
7mL NaOH(1.1M)	6.8	15℃	t＝6小时	肠消化	10g挤压出的SBM底物，62mL HCl(0.155M)/胃蛋白酶(4000U/g底物)，1mL本发明的蛋白酶	3.0	15℃	t＝0分钟	胃消化
7mL NaOH(1.1M)	6.8	15℃	t＝6小时	肠消化	5mL NaHCO₃(1M)/胰酶制剂(8mg/g饮食)	6.8	15℃	t＝7小时	肠消化
终止保温	7.0	15℃	t＝24小时		5mL NaHCO₃(1M)/胰酶制剂(8mg/g饮食)	6.8	15℃	t＝7小时	肠消化

条件

底物： 10g挤压出的SBM

pH： 3.0胃阶段/6.8-7.0肠阶段

HCl： 0.155M，6小时

胃蛋白酶：4000U/g饮食，6小时

胰酶制剂：8mg/g饮食，17小时

温度： 15℃

重复次数：5

溶液

1.1M NaOH

0.155M HCl/胃蛋白酶(4000U/g饮食)

1M NaHCO₃，其中含有16mg胰酶制剂/mL

125mM NaAc-缓冲液，pH6.0

水产动物体外模型的实验方法

实验方法根据的是上文所述的内容，在1，5，8和23小时的时间点测定pH。24小时后终止保温，取出30ml样品，置于冰上，然后离心(13000×g，10分钟，0℃)。取出上清液储存于-20℃。

分析

用OPA法分析所有上清液(水解程度的百分比)，并通过KTA HPLC测定被溶解和消化的蛋白质(参见单胃实施例)。

用EASY SPE柱预处理体外上清液

在KTAHPLC上分析之前，使用固相样品纯化技术预处理得自体外系统的上清液。这样做的目的是为了改善层析，从而防止不稳定的洗脱分布图和基线。用于提取的柱是固相提取柱(Chromabond EASY SPE Columns，Macherey-Nagel)。通过使用真空室(真空0.15×100kPa)使2mL milliQ水穿过柱被洗脱出来。随后将3mL体外样品分散到柱上并洗脱(真空0.1×100kPa)，弃去前面mL洗脱样品，在柱下放置干净的管，然后洗脱其余样品，留作进一步稀释。

结果

下文表16和17所示的结果表明蛋白酶显著增加了水解程度和蛋白质的可消化性。

表16：通过OPA法测定的水解程度(DH)，绝对值和相对值

酶(mg EP/kg饮食)	n	占总蛋白质的百分比			相对于空白对照的百分比
		占总蛋白质的百分比			相对于空白对照的百分比			％DH		SD	％DH		％CV
		空白对照	5	21.30	a	0.52	100.0	％DH		SD	％DH		％CV	a	2.42
本发明的蛋白酶(50)	5	空白对照	5	21.30	a	0.52	100.0	21.98	b	0.22	103.2	b	1.00	a	2.42

表17：通过KTA HPLC测定的经溶解和消化的粗蛋白，绝对值和相对值

酶(mg EP/kg饮食)	N	占总蛋白质的百分比						相对于空白对照的百分比
		占总蛋白质的百分比						相对于空白对照的百分比						％经消化的CP		SD	％经溶解的CP		SD	％经消化的CP		％CV	％经溶解的CP		％CV
		空白对照	5	50.0	a	2.2	89.9	a	3.2	100.0	a	4.5	100.0	％经消化的CP		SD	％经溶解的CP		SD	％经消化的CP		％CV	％经溶解的CP		％CV	a	3.5
本发明的蛋白酶(50)	5	空白对照	5	50.0	a	2.2	89.9	a	3.2	100.0	a	4.5	100.0	52.3	b	1.1	91.4	a	1.5	104.8	b	2.1	101.7	a	1.6	a	3.5
本发明的蛋白酶(50)	5	(100)	5	53.4	b	0.4	91.6	a	1.0	107.0	b	0.7	101.9	52.3	b	1.1	91.4	a	1.5	104.8	b	2.1	101.7	a	1.6	a	1.1

实施例13.具有Savinase信号的10R尾-变体TQ和TP的发酵和活性

在回转式摇床上的500ml带挡板Erlenmeyer烧瓶中发酵实施例5中的2个枯草芽孢杆菌菌株，即具有氨基酸尾-变体TQ的菌株209和具有尾-变体TP的菌株211以及枯草芽孢杆菌Sav-10RS，所述烧瓶各含有100ml添加有6mg/l氯霉素的TY。对这3个枯草芽孢杆菌菌株中的每一个，平行地在12个Erlenmeyer烧瓶中进行发酵。12个Erlenmeyer烧瓶中的4个在37℃(250rpm)保温，4个在30℃(250rpm)保温，最后4个在26℃(250rpm)保温。在第1，2和3天对每个摇瓶取样，分析其蛋白酶活性。结果示于下文表18-20。

从下表中可以看出，经培养物肉汤中的活性测定，2氨基酸尾的作用是令人惊奇地大大改善了蛋白酶的产量。2氨基酸尾的作用与实施例1中用Sav-10RS HV1和Sav-10RS HV3观察到的作用差不多。

表18：37℃时的相对蛋白酶活性

	1	2	3
	1	2	3	10R synt-15	1,0	1,0	1,0
209	7,0	7,0	6,0	10R synt-15	1,0	1,0	1,0
209	7,0	7,0	6,0	211	7,2	7,7	4,9

表19：30℃时的相对蛋白酶活性

	1	2	3
	1	2	3	10R synt-15	1,0	1,0	1,0
209	4,5	3,6	4,9	10R synt-15	1,0	1,0	1,0
209	4,5	3,6	4,9	211	4,0	4,1	5,0

表20：26℃时的相对蛋白酶活性

	1	2	3
	1	2	3	10R synt-15	1,0	1,0	1,0
209	6,4	4,3	4,0	10R synt-15	1,0	1,0	1,0
209	6,4	4,3	4,0	211	3,7	4,1	4,2

实施例14.合成的具有信号的经改组10R-样蛋白酶尾-变体

用信号肽和SEQ ID NO：3的8氨基酸C-末端尾构建另一个合成的尾变体10R蛋白酶编码基因(被称为G-MAT-22)，并将所述基因导入枯草芽孢杆菌宿主以进行表达。令人惊奇地获得了高产量的蛋白酶(数据未显示)。G-MAT-22的完整编码DNA序列示于SEQ ID NO：44，编码的前-原-蛋白酶示于SEQ ID NO：45。G-mat-22蛋白酶是α-裂解蛋白酶-样酶(肽酶家族S1E-旧称：S2A)。如图1所示，该蛋白酶比10R蛋白酶的最适温度更高(在pH9时)。

实施例15：10R-样蛋白酶经改组的前-序列

按Ness，J.E.et al 2002[Nature Biotechnology，Vol.20(12)，pp.1251-1255，2002]所述，通过合成改组，可不受亲代特定序列的支配，独立完成蛋白酶基因的重组。设计合成的寡核苷酸，其DNA序列是简并的，从而提供在该套亲代蛋白酶中出现所有氨基酸的可能性，根据参考文献装配基因。可对全长序列进行改组，或仅对部分序列进行改组，然后与基因的其余部分组合产生全长序列。

在此实施例中，SEQ ID NO：28；SEQ ID NO：33；SEQ ID NO：37；SEQID NO：41；SEQ ID NO：43或SEQ ID NO：45给出的亲代蛋白酶前-肽部分的氨基酸序列由一套寡核苷酸编码，将所得经改组的基因片段组合至全长蛋白酶基因的上下文中，此时所述基因由编码信号序列，(经改组的)前-肽和(在这种情况下)10R蛋白酶的成熟蛋白质的DNA组成。经改组的前-肽序列的例子示于SEQ ID NO：46(O-2.19)，SEQ ID NO：47(G-2.73)，SEQ ID NO：48(G-1.43)，SEQ ID NO：49(G-2.6)，SEQ ID NO：50(G-2.5)，SEQ ID NO：51(G-2.3)，SEQ ID NO：52(G-1.4)和SEQ ID NO：53(G-1.2)。

通过上文所述的同源重组将完整的蛋白酶编码基因插入枯草芽孢杆菌基因组，使用富含营养的培养基在摇瓶中表达蛋白酶。在30℃发酵5天，离心分离上清液，然后测定蛋白酶活性。作为对照，在相同条件下发酵由相同构建方法构建的，表达得自拟诺卡氏菌NRRL 18262的野生型蛋白酶10R的枯草芽孢杆菌克隆。计算蛋白酶活性，下表描述了相对于野生型10R蛋白酶活性的蛋白酶活性。显然，异源前-区提供了超越10R蛋白酶天然前-区的优点。

	相对活性
	相对活性	10RG-1.2G-1.4G-2.3G-2.4G-2.5G-2.6G-2.7	1,02,91,41,63,43,04,21,6

表21：用异源经改组的前-肽表达的10R蛋白酶的相对活性。

实施例16.尾-变体10R-HV1的体内单胃表现

本实施例描述了在单胃体外模型中，使用10，25，50和100mg EP/kg，以10R蛋白酶作为基准或对照，用10R蛋白酶的4氨基酸尾变体HV1进行的剂量/反应研究。如上所述，尾变体10R-HV1被构建成C-末端具有4个额外的氨基酸：QSAP(SEQ ID NO：5)。

体外条件：

底物： 4g SBM，6g玉米(预混的)

pH： 3.0胃阶段/6.8-7.0肠阶段

HCl： 0.105M，1.5小时(即30分钟，HCl-底物预混)

胃蛋白酶：3000U/g饮食，1小时

胰酶制剂：8mg/g饮食，4小时

保温： 40℃

重复次数：5

酶：

10R蛋白酶：FFE-2003-00047；批号PPA21400；154mg EP/g产品

冻干的10R-HV1 FFE-2003-00077；370mg EP/g产品

溶液A：10R，100mg EP/kg饮食：

100mg EP/kg饮食～1mg EP/瓶1mg EP/mL

(1mg EP/mL*10mL)/154mg EP/g产品＝0.0649g

制备10mL：将0.0649g酶溶解于10mL NaAc缓冲液

溶液C：10R-HV1，100mg EP/kg饮食：

100mg EP/kg饮食～1mgEP/瓶1mg EP/mL

(1mg EP/mL*20mL)/370mg EP/g产品＝0.05405g

制备20mL：将0.0541g酶溶解于20mL NaAc缓冲液

溶液D：10R-HV1，50mg EP/kg饮食：

50mg EP/kg饮食～0.50mg EP/1ml瓶＝0.50mg EP/ml

制备10mL：将C稀释2倍：5ml溶液C+5ml 125mM NaAc-缓冲液

溶液E：10R-HV1，25mg EP/kg饮食：

25mg EP/kg饮食～0.25mg EP/1ml瓶＝0.25mg EP/ml

制备12mL：将C稀释4倍：3ml溶液C+9ml 125mM NaAc-缓冲液

溶液F：10R-HV1，10mg EP/kg饮食：

25mg EP/kg饮食～0.25mg EP/1ml瓶＝0.25mg EP/ml

制备10mL：将C稀释10倍：1ml溶液C+9ml 125mM NaAc-缓冲液

底物：

预混物(40％SBM/60％玉米)，FFS-2002-00121

10g样品含有6g玉米和4g SBM，经计算，蛋白质含量为23.48％蛋白质(～2.35g/瓶)。

化学制品

4.005M HCl，AT-1-00061/29

4.007M NaOH，AT-1-00002/36

胰酶制剂FFE-2002-00052，8xUSP

胃蛋白酶FFE-2003-00048，471U/mg

NaOH 0.39M：

制备500mL：

48.97mL 3.982M NaOH，用milliQ补加至500mL。

HCl1溶液0.105M

制备2000mL：

52.43mL 4.005 HCl，用milliQ补加至2000mL。

HCL2(HCl/胃蛋白酶)溶液：0.105M，含有30000U胃蛋白酶/5mL

制备250mL：

从HCl-溶液中取出约150mL，加入3.18g胃蛋白酶，用HCl溶液补加至250mL。

125mM NaAc-缓冲液，pH6.0：

制备自2M NaAc-缓冲液(KLu 04-07-2003/实验室书籍14169，第104页)→12.5mL 2M NaAc-缓冲液，用milliQ补加至200mL。

溶解于1M NaHCO₃的胰酶制剂，含有8mg胰酶制剂/g饮食：

预先制备NaHCO₃-胰酶制剂，分成小份并冷冻。制备29-04-2003并冷冻，使其在冰箱中缓慢解冻过夜。贮存物的制备描述于实验室书籍14165的第068页。

流程图：

在预混阶段(t＝0)，10g底物与41ml HCl1混合；然后在胃阶段(t＝30分钟)加入5ml HCl-2(HCl/胃蛋白酶)+1ml酶(或缓冲液)，随后(t＝1小时)测定pH并加入16ml水；然后在肠阶段(t＝1小时30分钟)加入7ml 0.39 NaOH，随后(t＝2小时)加入5ml NaHCO₃/胰酶制剂，再度两次测定pH(t＝2小时30分钟&t＝5小时30分钟)；最后(t＝6小时)取出30ml悬浮液样品以进行离心。立即并小心地将每个离心管中的上清液取出并移入玻璃管。将上清液分成两个等份试样以供进一步分析。结果示于表22。

表22：在单胃体外模型中处理样品

样品	酶溶液	酶	pH	酶剂量/kg饮食：	胃蛋白酶U/g饮食：	胰酶制剂mg/g饮食：
样品	酶溶液	酶	pH	酶剂量/kg饮食：	胃蛋白酶U/g饮食：	胰酶制剂mg/g饮食：	1-5	1ml缓冲液	空白对照	3.0	0mg EP	3000	8.0
6-10	1ml溶液A	10R(FFE-2003-00047)	3.0	100mgEP	3000	8.0	1-5	1ml缓冲液	空白对照	3.0	0mg EP	3000	8.0
6-10	1ml溶液A	10R(FFE-2003-00047)	3.0	100mgEP	3000	8.0	11-15	1ml溶液C	10R-HV1(PPA22873)	3.0	100mgEP	3000	8.0
16-20	1ml溶液D	10R-HV1(PPA22873)	3.0	50mg EP	3000	8.0	11-15	1ml溶液C	10R-HV1(PPA22873)	3.0	100mgEP	3000	8.0
16-20	1ml溶液D	10R-HV1(PPA22873)	3.0	50mg EP	3000	8.0	21-25	1ml溶液E	10R-HV1(PPA22873)	3.0	25mg EP	3000	8.0
26-30	1ml溶液F	10R-HV1(PPA22873)	3.0	10mg EP	3000	8.0	21-25	1ml溶液E	10R-HV1(PPA22873)	3.0	25mg EP	3000	8.0

可溶和可消化的蛋白质：

使用KTA HPLC(Superdex 30肽柱)测定水解产物的可溶相中可溶和可消化粗蛋白水平的改变。结果示于表23。

当10R-HV1的剂量为100mg EP/kg饮食时，与空白对照相比，可消化的蛋白质水平显著增加9.8％。对照10R显示出7.7％的相对改善。在较低的酶浓度(50，25和10mg EP/kg饮食)下，可消化蛋白质的相对改善分别为5.7％，3.3％和0.7％。

表23：10R-HV1和10R的HPLC结果，相对于空白对照而言，可消化CP(％dig.CP)和可溶CP(％sol.CP)的百分比有所改变。上标的不同字母表示显著差异(1-ANOVA，Tukey，95％)。

MoFi030043，第2日酶[mg EP/kg]	n	占总蛋白质的百分比				相对于空白对照的百分比
		占总蛋白质的百分比				相对于空白对照的百分比				％dig.CP	SD	％sol.CP	SD	％dig.CP	CV％	％sol.CP	CV％
		Blank10RHV1[100]10RHV1[50]10RHV1[25]10RHV1[10]10R[100]	1155555	54,860,258,056,755,259,1	1,20,80,60,81,30,8	83,988,386,986,384,387,1	1,61,10,81,01,91,9	100,0^a109,8^e105,7^cd103,3^bc100,7^ab107,7^de	2,31,31,11,42,41,4	％dig.CP	SD	％sol.CP	SD	％dig.CP	CV％	％sol.CP	CV％	100,0^a105,3^c103,6^bc102,9^bc100,5^ab103,9^bc	1,91,30,91,22,22,2

原始的10R[100mg 10R[100mg EP/kg饮食]将可溶蛋白质的水平提高了约4％。10R-HV1的作用稍高(相对增加为5.3％)并且较显著。当剂量为50和25mg EP/kg饮食时，相对改善分别为3.6％和2.9％并且较为显著。当剂量为10mg EP/kg饮食时，相对改善为0.5％。

水解程度：

使用OPA法测定水解程度(DH)。结果示于表24。

酶[mgEP/kg]	n	占总蛋白质的百分比			相对于空白对照的百分比
		占总蛋白质的百分比			相对于空白对照的百分比			％DH		SD	％DH		SD
		空白对照	5	25,89	a	0,43	100,0	％DH		SD	％DH		SD	a	1,65
10R(FFE-2003-00047)[100]	5	空白对照	5	25,89	a	0,43	100,0	27,19	bc	0,67	105,0	bc	2,46	a	1,65
10R(FFE-2003-00047)[100]	5	10R_HV1[100]	5	27,89	c	0,36	107,7	27,19	bc	0,67	105,0	bc	2,46	c	1,29
10R_HV1[50]	5	10R_HV1[100]	5	27,89	c	0,36	107,7	27,34	bc	0,57	105,6	bc	2,08	c	1,29
10R_HV1[50]	5	10R_HV1[25]	5	26,42	ab	0,57	102,0	27,34	bc	0,57	105,6	bc	2,08	ab	2,16
10R_HV1[10]	5	10R_HV1[25]	5	26,42	ab	0,57	102,0	25,52	a	0,96	98,6	S	3,76	ab	2,16

表24：通过OPA法测定的水解程度(DH)。表中显示出绝对值和相对值。不同字母表示显著差异(1-way ANOVA，Tukey 95％)。

与空白对照相比，尾-变体10R-HV1将DH改善了7.7％。对较低剂量(50和25mg EP/kg饮食)的蛋白酶而言，改善幅度分别为5.6-2.0％，这与以前的发现一致。当剂量最低[10mg EP/kg饮食]时，未发现有什么作用。相对于空白对照而言，原始10R[100mg EP/kg饮食]显示出5％的改善。

HLPC KTA分析和DH测定的结果清楚地表明给10R加上4氨基酸(SEQ ID NO：5)长尾不会在任何显著的程度上影响10R蛋白酶的表现。

序列表

<110>诺维信公司(Novozymes A/S)

<120>改进的蛋白酶及其制备方法

<130>10495.204-WO

<160>53

<170>PatentIn version 3.2

<210>1

<211>1062

<212>DNA

<213>拟诺卡氏菌(Nocardiopsis sp.)NRRL 18262

<220>

<221>misc_feature

<222>(1)..(495)

<223>编码位于SEQ ID NO：43中第-165位至第-1位的前-区

<220>

<221>misc_feature

<222>(496)..(1059)

<223>编码位于SEQ ID NO：43中第1位至第188位的成熟区

<400>1

gctactggag cattacctca gtctcctaca cctgaagcag atgcagtatc gatgcaagaa 60

gcattacaac gtgatcttga tcttacatca gctgaagctg aggaattact tgctgcacaa 120

gatacagcct ttgaagttga tgaagctgcc gctgaagcag ctggtgatgc atatggtggt 180

tcagtattcg atactgaatc actcgaactt actgtactag tgaccgatgc agcagctgtt 240

gaagctgttg aagccacagg tgcaggtaca gagctcgtat cttatggtat tgatggatta 300

gatgagatcg tacaagagct taatgcagct gatgccgttc caggtgtagt tggatggtat 360

cctgatgtag caggtgatac tgttgtctta gaagttcttg aaggctctgg agctgatgtt 420

tctggacttt tagcagacgc aggagtcgat gcatccgcgg ttgaagtgac cacgtcagat 480

cagcctgaac tctatgccga tatcattgga ggcctagcgt acacaatggg tggtcgctgc 540

agcgtaggat ttgcagccac aaatgcagct ggacaacctg gcttcgtgac agctggacat 600

tgcggccgcg tcggtacaca ggttactatc ggcaatggaa gaggtgtctt tgagcaaagc 660

gtatttcccg ggaatgatgc tgccttcgtt agaggtacgt ccaactttac gcttactaac 720

ttagtatcta gatacaacac tggcggatat gcaactgtag caggtcacaa tcaagcacct 780

attggctcta gcgtctgccg ctcagggtcg actacaggat ggcattgtgg aaccattcaa 840

gctagaggtc agagcgtgag ctatcctgaa ggtaccgtaa cgaacatgac tcgtacgact 900

gtatgtgcag aaccaggtga ctctggaggt tcatatatca gcggtacgca agcgcaaggc 960

gttacctcag gtggatccgg taactgtagg acaggtggca caacgttcta ccaggaagtg 1020

acaccgatgg tgaactcttg gggagttaga ctccgtacat aa 1062

<210>2

<211>1143

<212>DNA

<213>人工序列

<220>

<223>合成的10R基因(10Rsynt-15)，其编码被称为″10R″的S2A蛋白酶，通过PCR使该合成基因与异源蛋白酶Savinase的信号肽编码序列在框内融合。

<400>2

atgaagaaac cgttggggaa aattgtcgca agcaccgcac tactcatttc tgttgctttt 60

agttcatcga tcgcatcggc tgctactgga gcattacctc agtctcctac acctgaagca 120

gatgcagtat cgatgcaaga agcattacaa cgtgatcttg atcttacatc agctgaagct 180

gaggaattac ttgctgcaca agatacagcc tttgaagttg atgaagctgc cgctgaagca 240

gctggtgatg catatggtgg ttcagtattc gatactgaat cactcgaact tactgtacta 300

gtgaccgatg cagcagctgt tgaagctgtt gaagccacag gtgcaggtac agagctcgta 360

tcttatggta ttgatggatt agatgagatc gtacaagagc ttaatgcagc tgatgccgtt 420

ccaggtgtag ttggatggta tcctgatgta gcaggtgata ctgttgtctt agaagttctt 480

gaaggctctg gagctgatgt ttctggactt ttagcagacg caggagtcga tgcatccgcg 540

gttgaagtga ccacgtcaga tcagcctgaa ctctatgccg atatcattgg aggcctagcg 600

tacacaatgg gtggtcgctg cagcgtagga tttgcagcca caaatgcagc tggacaacct 660

ggcttcgtga cagctggaca ttgcggccgc gtcggtacac aggttactat cggcaatgga 720

agaggtgtct ttgagcaaag cgtatttccc gggaatgatg ctgccttcgt tagaggtacg 780

tccaacttta cgcttactaa cttagtatct agatacaaca ctggcggata tgcaactgta 840

gcaggtcaca atcaagcacc tattggctct agcgtctgcc gctcagggtc gactacagga 900

tggcattgtg gaaccattca agctagaggt cagagcgtga gctatcctga aggtaccgta 960

acgaacatga ctcgtacgac tgtatgtgca gaaccaggtg actctggagg ttcatatatc 1020

agcggtacgc aagcgcaagg cgttacctca ggtggatccg gtaactgtag gacaggtggc 1080

acaacgttct accaggaagt gacaccgatg gtgaactctt ggggagttag actccgtaca 1140

taa 1143

<210>3

<211>8

<212>PRT

<213>人工序列

<220>

<223>C-末端氨基酸尾，表达为与本发明蛋白酶的融合蛋白

<400>3

Gln Ser His Val Gln Ser Ala Pro

1 5

<210>4

<211>24

<212>DNA

<213>人工序列

<220>

<223>编码C-末端氨基酸尾的多核苷酸，所述尾表达为与本发明蛋白酶的融合蛋白

<400>4

caatcgcatg ttcaatccgc tcca 24

<210>5

<211>4

<212>PRT

<213>人工序列

<220>

<223>C-末端氨基酸尾，表达为与本发明蛋白酶的融合蛋白

<400>5

Gln Ser Ala Pro

1

<210>6

<211>12

<212>DNA

<213>人工序列

<220>

<400>6

caatcggctc ct 12

<210>7

<211>2

<212>PRT

<213>人工序列

<220>

<223>C-末端氨基酸尾，表达为与本发明蛋白酶的融合蛋白

<400>7

Gln Pro

1

<210>8

<211>6

<212>DNA

<213>人工序列

<220>

<400>8

caacca 6

<210>9

<211>1

<212>PRT

<213>人工序列

<220>

<223>C-末端氨基酸尾，表达为与本发明蛋白酶的融合蛋白

<400>9

Pro

1

<210>10

<211>3

<212>DNA

<213>人工序列

<220>

<400>10

cca 3

<210>11

<211>45

<212>DNA

<213>人工序列

<220>

<223>引物 #252639

<400>11

catgtgcatg tgggtaccgc aacgttcgca gatgctgctg aagag 45

<210>12

<211>44

<212>DNA

<213>人工序列

<220>

<223>引物 #251992

<400>12

catgtgcatg tggtcgaccg attatggagc ggattgaaca tgcg 44

<210>13

<211>44

<212>DNA

<213>人工序列

<220>

<223>引物 #179541

<400>13

gcgttgagac gcgcggccgc gagcgccgtt tggctgaatg atac 44

<210>14

<211>43

<212>DNA

<213>人工序列

<220>

<223>引物 #179542

<400>14

gcgttgagac agctcgagca gggaaaaatg gaaccgcttt ttc 43

<210>15

<211>64

<212>DNA

<213>人工序列

<220>

<223>引物 #179539

<400>15

ccatttgatc agaattcact ggccgtcgtt ttacaaccat tgcggaaaat agtcataggc 60

atcc 64

<210>16

<211>60

<212>DNA

<213>人工序列

<220>

<223>引物 #179540

<400>16

ggatccagat ctggtacccg ggtctagagt cgacgcggcg gttcgcgtcc ggacagcaca 60

<210>17

<211>37

<212>DNA

<213>人工序列

<220>

<223>引物 #179154

<400>17

gttgtaaaac gacggccagt gaattctgat caaatgg 37

<210>18

<211>37

<212>DNA

<213>人工序列

<220>

<223>引物 #179153

<400>18

ccgcgtcgac actagacacg ggtacctgat ctagatc 37

<210>19

<211>22

<212>DNA

<213>人工序列

<220>

<223>引物 #317

<400>19

tggcgcaatc ggtaccatgg gg 22

<210>20

<211>40

<212>DNA

<213>人工序列

<220>

<223>引物 #139 NotI

<400>20

catgtgcatg cggccgcatt aacgcgttgc cgcttctgcg 40

<210>21

<211>7443

<212>DNA

<213>人工序列

<220>

<223>质粒pMB1508的序列

<400>21

tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60

cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120

ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180

accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240

attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300

tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360

tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt cgataaaagt gctttttttg 420

ttgcaattga agaattatta atgttaagct taattaaaga taatatcttt gaattgtaac 480

gcccctcaaa agtaagaact acaaaaaaag aatacgttat atagaaatat gtttgaacct 540

tcttcagatt acaaatatat tcggacggac tctacctcaa atgcttatct aactatagaa 600

tgacatacaa gcacaacctt gaaaatttga aaatataact accaatgaac ttgttcatgt 660

gaattatcgc tgtatttaat tttctcaatt caatatataa tatgccaata cattgttaca 720

agtagaaatt aagacaccct tgatagcctt actataccta acatgatgta gtattaaatg 780

aatatgtaaa tatatttatg ataagaagcg acttatttat aatcattaca tatttttcta 840

ttggaatgat taagattcca atagaatagt gtataaatta tttatcttga aaggagggat 900

gcctaaaaac gaagaacatt aaaaacatat atttgcaccg tctaatggat ttatgaaaaa 960

tcattttatc agtttgaaaa ttatgtatta tggagctctg aaaaaaagga gaggataaag 1020

aatgaagaaa ccgttgggga aaattgtcgc aagcaccgca ctactcattt ctgttgcttt 1080

tagttcatcg atcgcatcgg ctgctgaaga agcaaaagaa aaatatttaa ttggctttaa 1140

tgagcaggaa gctgtcagtg agtttgtaga acaagtagag gcaaatgacg aggtcgccat 1200

tctctctgag gaagaggaag tcgaaattga attgcttcat gaatttgaaa cgattcctgt 1260

tttatccgtt gagttaagcc cagaagatgt ggacgcgctt gaactcgatc cagcgatttc 1320

ttatattgaa gaggatgcag aagtaacgac aatggcgcaa tcggtaccat ggggtatatc 1380

aacgcgttaa tccgcggata tatagcggcc gcagatctgg gaccaataat aatgactaga 1440

gaagaaagaa tgaagattgt tcatgaaatt aaggaacgaa tattggataa agtgggatat 1500

ttttaaaata tatatttatg ttacagtaat attgactttt aaaaaaggat tgattctaat 1560

gaagaaagca gacaagtaag cctcctaaat tcactttaga taaaaattta ggaggcatat 1620

caaatgaact ttaataaaat tgatttagac aattggaaga gaaaagagat atttaatcat 1680

tatttgaacc aacaaacgac ttttagtata accacagaaa ttgatattag tgttttatac 1740

cgaaacataa aacaagaagg atataaattt taccctgcat ttattttctt agtgacaagg 1800

gtgataaact caaatacagc ttttagaact ggttacaata gcgacggaga gttaggttat 1860

tgggataagt tagagccact ttatacaatt tttgatggtg tatctaaaac attctctggt 1920

atttggactc ctgtaaagaa tgacttcaaa gagttttatg atttatacct ttctgatgta 1980

gagaaatata atggttcggg gaaattgttt cccaaaacac ctatacctga aaatgctttt 2040

tctctttcta ttattccatg gacttcattt actgggttta acttaaatat caataataat 2100

agtaattacc ttctacccat tattacagca ggaaaattca ttaataaagg taattcaata 2160

tatttaccgc tatctttaca ggtacatcat tctgtttgtg atggttatca tgcaggattg 2220

tttatgaact ctattcagga attgtcagat aggcctaatg actggctttt ataatatgag 2280

ataatgccga ctgtactttt tacagtcggt tttctaacga tacattaata ggtacgaaaa 2340

agcaactttt tttgcgctta aaaccagtca taccaataac ttaagggtaa ctagcctcgc 2400

cggaaagagc gaaaatgcct cacatttgtg ccacctaaaa aggagcgatt tacatatgag 2460

ttatgcagtt tgtagaatgc aaaaagtgaa atcagctgga ctaaaagggg ccgcagagta 2520

gaatggaaaa ggggatcgga aaacaagtat ataggaggag acctatttat ggcttcagaa 2580

aaagacgcag gaaaacagtc agcagtaaag cttgttccat tgcttattac tgtcgctgtg 2640

ggactaatca tctggtttat tcccgctccg tccggacttg aacctaaagc ttggcatttg 2700

tttgcgattt ttgtcgcaac aattatcggc tttatctcca agcccttgcc aatgggtgca 2760

attgcaattt ttgcattggc ggttactgca ctaactggaa cactatcaat tgaggataca 2820

ttaagcggat tcgggaataa gaccatttgg cttatcgtta tcgcattctt tatttcccgg 2880

ggatttatca aaaccggtct cggtgcgaga atttcgtatg tattcgttca gaaattcgga 2940

aaaaaaaccc ttggactttc ttattcactg ctattcagtg atttaatact ttcacctgct 3000

attccaagta atacggcgcg tgcaggaggc attatatttc ctattatcag atcattatcc 3060

gaaacattcg gatcaagccc ggcaaatgga acagagagaa aaatcggtgc attcttatta 3120

aaaaccggtt ttcaggggaa tctgatcaca tctgctatgt tcctgacagc gatggcggcg 3180

aacccgctga ttgccaagct ggcccatgat gtcgcagggg tggacttaac atggacaagc 3240

tgggcaattg ccgcgattgt accgggactt gtaagcttaa tcatcacgcc gcttgtgatt 3300

tacaaactgt atccgccgga aatcaaagaa acaccggatg cggcgaaaat cgcaacagaa 3360

aaactgaaag aaatgggacc gttcaaaaaa tcggagcttt ccatggttat cgtgtttctt 3420

ttggtgcttg tgctgtggat ttttggcggc agcttcaaca tcgacgctac cacaaccgca 3480

ttgatcggtt tggccgttct cttattatca caagttctga cttgggatga tatcaagaaa 3540

gaacagggcg cttgggatac gctcacttgg tttgcggcgc ttgtcatgct cgccaacttc 3600

ttgaatgaat taggcatggt gtcttggttc agtaatgcca tgaaatcatc cgtatcaggg 3660

ttctcttgga ttgtggcatt catcatttta attgttgtgt attattactc tcactatttc 3720

tttgcaagtg cgacagccca catcagtgcg atgtattcag catttttggc tgtcgtcgtg 3780

gcagcgggcg caccgccgct tttagcagcg ctgagcctcg cgttcatcag caacctgttc 3840

gggtcaacga ctcactacgg ttctggagcg gctccggtct tcttcggagc aggctacatc 3900

ccgcaaggca aatggtggtc catcggattt atcctgtcga ttgttcatat catcgtatgg 3960

cttgtgatcg gcggattatg gtggaaagta ctaggaatat ggtagaaaga aaaaggcaga 4020

cgcggtctgc ctttttttat tttcactcct tcgtaagaaa atggattttg aaaaatgaga 4080

aaattccctg tgaaaaatgg tatgatctag gtagaaagga cggctggtgc tgtggtgaaa 4140

aagcggttcc atttttccct gcaaacaaaa ataatggggc tgattgcggc tctgctggtc 4200

tttgtcattg gtgtgctgac cattacgtta gccgttcagc atacacaggg agaacggaga 4260

caggcagagc agctggcggt tcaaacggcg agaaccattt cctatatgcc gccggttaaa 4320

gagctcattg agagaaaaga cggacatgcg gctcagacgc aagaggtcat tgaacaaatg 4380

aaagaacaga ctggtgcgtt tgccatttat gttttgaacg aaaaaggaga cattcgcagc 4440

gcctctggaa aaagcggatt aaagaaactg gagcgcagca gagaaatttt gtttggcggt 4500

tcgcatgttt ctgaaacaaa agcggatgga cgaagagtga tcagagggag cgcgccgatt 4560

ataaaagaac agaagggata cagccaagtg atcggcagcg tgtctgttga ttttctgcaa 4620

acggagacag agcaaagcat caaaaagcat ttgagaaatt tgagtgtgat tgctgtgctt 4680

gtactgctgc tcggatttat tggcgccgcc gtgctggcga aaagcatcag aaaggatacg 4740

ctcgggcttg aaccgcatga gatcgcggct ctatatcgtg agaggaacgc aatgcttttc 4800

gcgattcgag aagggattat tgccaccaat cgtgaaggcg tcgtcaccat gatgaacgta 4860

tcggcggccg agatgctgaa gctgcccgag cctgtgatcc atcttcctat agatgacgtc 4920

atgccgggag cagggctgat gtctgtgctt gaaaaaggag aaatgctgcc gaaccaggaa 4980

gtaagcgtca acgatcaagt gtttattatc aatacgaaag tgatgaatca aggcgggcag 5040

gcgtatggga ttgtcgtcag cttcagggag aaaacagagc tgaagaagct gatcgacaca 5100

ttgacagagg ttcgcaaata ttcagaggat ctcagggcgc agactcatga attttcaaat 5160

aagctttatg cgattttagg gctgcgtcga cctgcaggca tgcaagcttg gcgtaatcat 5220

ggtcatagct gtttcctgtg tgaaattgtt atccgctcac aattccacac aacatacgag 5280

ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt gagctaactc acattaattg 5340

cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa 5400

tcggccaacg cgcggggaga ggcggtttgc gtattgggcg ctcttccgct tcctcgctca 5460

ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg 5520

taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc 5580

agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc 5640

cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac 5700

tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc 5760

tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata 5820

gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc 5880

acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca 5940

acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag 6000

cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta 6060

gaaggacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg 6120

gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc 6180

agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt 6240

ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa 6300

ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat 6360

atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga 6420

tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac 6480

gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg 6540

caccggattt atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg 6600

caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt 6660

cgccagttaa tagtttgcgc aacgttgttg ccattgctac aggcatcgtg gtgtcacgct 6720

cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat 6780

cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta 6840

agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca 6900

tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat 6960

agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat acgggataat accgcgccac 7020

atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa 7080

ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt 7140

cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg 7200

caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc ctttttcaat 7260

attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt 7320

agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca cctgacgtct 7380

aagaaaccat tattatcatg acattaacct ataaaaatag gcgtatcacg aggccctttc 7440

gtc 7443

<210>22

<211>5718

<212>DNA

<213>人工序列

<220>

<223>MB1510基因组整合区的序列

<400>22

gagcgccgtt tggctgaatg atacaacagt ctcacttcct tactgcgtct ggttgcaaaa 60

acgaagaagc aaggattccc ctcgcttctc atttgtccta tttattatac acttttttaa 120

gcacatcttt ggcgcttgtt tcactagact tgatgcctct gaatcttgtc caagtgtcac 180

ggtccgcatc atagacttgt ccatttttca ccgctttgag atttttccag agcgggttcg 240

ttttccactc atctacaatg gttttgcctt cgttggctga gatgaacaaa atatcaggat 300

cgattttgct caattgctca aggctgacct cttgataggc gttatctgac ttcacagcgt 360

gtgtaaagcc tagcatttta aagatttctc cgtcatagga tgatgatgta tgaagctgga 420

aggaatccgc tcttgcaacg ccgagaacga tgttgcggtt ttcatctttc ggaagttcgg 480

cttttagatc gttgatgact tttttgtgct cggcaagctt ttcttttcct tcatcttctt 540

tatttaatgc tttagcaatg gtcgtaaagc tgtcgatcgt ttcgtcatat gtcgcttcac 600

ggctttttaa ttcaatcgtc ggggcgattt ttttcagctg tttataaatg tttttatggc 660

gctcagcgtc agcgatgatt aaatcaggct tcaaggaact gatgacctca agattgggtt 720

cgctgcgtgt gcctacagat gtgtaatcaa tggagctgcc gacaagcttt ttaatcatat 780

cttttttgtt gtcatctgcg atgcccaccg gcgtaatgcc gagattgtga acggcatcca 840

agaatgaaag ctcaagcaca accacccgct taggtgtgcc gcttactgtc gtttttcctt 900

cttcgtcatg gatcactctg gaatccttag actcgctttt gccgcttccg ttgttattct 960

ggcttgatga acagccggat acaatgaggc aggcgagcaa taaaacactc atgatggcaa 1020

tcaacttgtt agaataggtg cgcatgtcat tcttcctttt ttcagattta gtaatgagaa 1080

tcattatcac atgtaacact ataatagcat ggcttatcat gtcaatattt ttttagtaaa 1140

gaaagctgcg tttttactgc tttctcatga aagcatcatc agacacaaat aagtggtatg 1200

cagcgttacc gtgtcttcga gacaaaaacg catgggcgtt ggctttagag gtttcgaaca 1260

tatcagcagt gacataagga aggagagtgc tgagataacc ggacaatttc ttttctattt 1320

catctgttag tgcaaattca atgtcgccga tattcatgat aatcgagaaa acaaagtcga 1380

tatcgatatg aaaatgttcc tcggcaaaaa ccgcaagctc gtgaattcct ggtgaacatc 1440

cggcacgctt atggaaaatc tgtttgacta aatcactcac aatccaagca ttgtattgct 1500

gttctggtga aaagtattgc attagacata cctcctgctc gtacggataa aggcagcgtt 1560

tcatggtcgt gtgctccgtg cagcggcttc tccttaattt tgatttttct gaaaataggt 1620

cccgttccta tcactttacc atggacggaa aacaaatagc tactaccatt cctcctgttt 1680

ttctcttcaa tgttctggaa tctgtttcag gtacagacga tcgggtatga aagaaatata 1740

gaaaacatga aggaggaata tcgacatgaa accagttgta aaagagtata caaatgacga 1800

acagctcatg aaagatgtag aggaattgca gaaaatgggt gttgcgaaag aggatgtata 1860

cgtcttagct cacgacgatg acagaacgga acgcctggct gacaacacga acgccaacac 1920

gatcggagcc aaagaaacag gtttcaagca cgcggtggga aatatcttca ataaaaaagg 1980

agacgagctc cgcaataaaa ttcacgaaat cggtttttct gaagatgaag ccgctcaatt 2040

tgaaaaacgc ttagatgaag gaaaagtgct tctctttgtg acagataacg aaaaagtgaa 2100

agcttgggca taaagcaagg aaaaaaccaa aaggccaatg tcggcctttt ggtttttttg 2160

cggtctttgc ggtgggattt tgcagaatgc cgcaatagga tagcggaaca ttttcggttc 2220

tgaatgtccc tcaatttgct attatatttt tgtgataaat tggaataaaa tctcacaaaa 2280

tagaaaatgg gggtacatag tggatgaaaa aagtgatgtt agctacggct ttgtttttag 2340

gattgactcc agctggcgcg aacgcagctg atttaggcca ccagacgttg ggatccaatg 2400

atggctgggg cgcgtactcg accggcacga caggcggatc aaaagcatcc tcctcaaatg 2460

tgtataccgt cagcaacaga aaccagcttg tctcggcatt agggaaggaa acgaacacaa 2520

cgccaaaaat catttatatc aagggaacga ttgacatgaa cgtggatgac aatctgaagc 2580

cgcttggcct aaatgactat aaagatccgg agtatgattt ggacaaatat ttgaaagcct 2640

atgatcctag cacatggggc aaaaaagagc cgtcgggaac acaagaagaa gcgagagcac 2700

gctctcagaa aaaccaaaaa gcacgggtca tggtggatat ccctgcaaac acgacgatcg 2760

tcggttcagg gactaacgct aaagtcgtgg gaggaaactt ccaaatcaag agtgataacg 2820

tcattattcg caacattgaa ttccaggatg cctatgacta ttttccgcaa tggttgtaaa 2880

acgacggcca gtgaattctg atcaaatggt tcagtgagag cgaagcgaac acttgatttt 2940

ttaattttct atcttttata ggtcattaga gtatacttat ttgtcctata aactatttag 3000

cagcataata gatttattga ataggtcatt taagttgagc atattagagg aggaaaatct 3060

tggagaaata tttgaagaac ccgagatcta gatcaggtac cgcaacgttc gcagatgctg 3120

ctgaagagat tattaaaaag ctgaaagcaa aaggctatca attggtaact gtatctcagc 3180

ttgaagaagt gaagaagcag agaggctatt gaataaatga gtagaaagcg ccatatcggc 3240

gcttttcttt tggaagaaaa tatagggaaa atggtacttg ttaaaaattc ggaatattta 3300

tacaatatca tatgtatcac attgaaagga ggggcctgct gtccagactg tccgctgtgt 3360

aaaaataagg aataaagggg ggttgacatt attttactga tatgtataat ataatttgta 3420

taagaaaatg gaggggccct cgaaacgtaa gatgaaacct tagataaaag tgcttttttt 3480

gttgcaattg aagaattatt aatgttaagc ttaattaaag ataatatctt tgaattgtaa 3540

cgcccctcaa aagtaagaac tacaaaaaaa gaatacgtta tatagaaata tgtttgaacc 3600

ttcttcagat tacaaatata ttcggacgga ctctacctca aatgcttatc taactataga 3660

atgacataca agcacaacct tgaaaatttg aaaatataac taccaatgaa cttgttcatg 3720

tgaattatcg ctgtatttaa ttttctcaat tcaatatata atatgccaat acattgttac 3780

aagtagaaat taagacaccc ttgatagcct tactatacct aacatgatgt agtattaaat 3840

gaatatgtaa atatatttat gataagaagc gacttattta taatcattac atatttttct 3900

attggaatga ttaagattcc aatagaatag tgtataaatt atttatcttg aaaggaggga 3960

tgcctaaaaa cgaagaacat taaaaacata tatttgcacc gtctaatgga tttatgaaaa 4020

atcattttat cagtttgaaa attatgtatt atggagctct gaaaaaaagg agaggataaa 4080

gagaaaaggg gatcggaaaa caagtatata ggaggagacc tatttatggc ttcagaaaaa 4140

gacgcaggaa aacagtcagc agtaaagctt gttccattgc ttattactgt cgctgtggga 4200

ctaatcatct ggtttattcc cgctccgtcc ggacttgaac ctaaagcttg gcatttgttt 4260

gcgatttttg tcgcaacaat tatcggcttt atctccaagc ccttgccaat gggtgcaatt 4320

gcaatttttg cattggcggt tactgcacta actggaacac tatcaattga ggatacatta 4380

agcggattcg ggaataagac catttggctt atcgttatcg cattctttat ttcccgggga 4440

tttatcaaaa ccggtctcgg tgcgagaatt tcgtatgtat tcgttcagaa attcggaaaa 4500

aaaacccttg gactttctta ttcactgcta ttcagtgatt taatactttc acctgctatt 4560

ccaagtaata cggcgcgtgc aggaggcatt atatttccta ttatcagatc attatccgaa 4620

acattcggat caagcccggc aaatggaaca gagagaaaaa tcggtgcatt cttattaaaa 4680

accggttttc aggggaatct gatcacatct gctatgttcc tgacagcgat ggcggcgaac 4740

ccgctgattg ccaagctggc ccatgatgtc gcaggggtgg acttaacatg gacaagctgg 4800

gcaattgccg cgattgtacc gggacttgta agcttaatca tcacgccgct tgtgatttac 4860

aaactgtatc cgccggaaat caaagaaaca ccggatgcgg cgaaaatcgc aacagaaaaa 4920

ctgaaagaaa tgggaccgtt caaaaaatcg gagctttcca tggttatcgt gtttcttttg 4980

gtgcttgtgc tgtggatttt tggcggcagc ttcaacatcg acgctaccac aaccgcattg 5040

atcggtttgg ccgttctctt attatcacaa gttctgactt gggatgatat caagaaagaa 5100

cagggcgctt gggatacgct cacttggttt gcggcgcttg tcatgctcgc caacttcttg 5160

aatgaattag gcatggtgtc ttggttcagt aatgccatga aatcatccgt atcagggttc 5220

tcttggattg tggcattcat cattttaatt gttgtgtatt attactctca ctatttcttt 5280

gcaagtgcga cagcccacat cagtgcgatg tattcagcat ttttggctgt cgtcgtggca 5340

gcgggcgcac cgccgctttt agcagcgctg agcctcgcgt tcatcagcaa cctgttcggg 5400

tcaacgactc actacggttc tggagcggct ccggtcttct tcggagcagg ctacatcccg 5460

caaggcaaat ggtggtccat cggatttatc ctgtcgattg ttcatatcat cgtatggctt 5520

gtgatcggcg gattatggtg gaaagtacta ggaatatggt agaaagaaaa aggcagacgc 5580

ggtctgcctt tttttatttt cactccttcg taagaaaatg gattttgaaa aatgagaaaa 5640

ttccctgtga aaaatggtat gatctaggta gaaaggacgg ctggtgctgt ggtgaaaaag 5700

cggttccatt tttccctg 5718

<210>23

<211>27

<212>DNA

<213>人工序列

<220>

<223>引物 1605

<400>23

gacggccagt gaattcgata aaagtgc 27

<210>24

<211>42

<212>DNA

<213>人工序列

<220>

<223>引物 1606

<220>

<221>misc_feature

<222>(13)..(13)

<223>n是a，c，g或t

<220>

<221>misc_feature

<222>(16)..(16)

<223>n是a，c，g或t

<400>24

ccagatctct atnktnktgt acggagtcta actccccaag ag 42

<210>25

<211>1112

<212>DNA

<213>达松维尔拟诺卡氏菌(Nocardiopsis dassonvillei)DSM 43235

<400>25

gcttttagtt catcgatcgc atcggctgct ccggcccccg tcccccagac ccccgtcgcc 60

gacgacagcg ccgccagcat gaccgaggcg ctcaagcgcg acctcgacct cacctcggcc 120

gaggccgagg agcttctctc ggcgcaggaa gccgccatcg agaccgacgc cgaggccacc 180

gaggccgcgg gcgaggccta cggcggctca ctgttcgaca ccgagaccct cgaactcacc 240

gtgctggtca ccgacgcctc cgccgtcgag gcggtcgagg ccaccggagc ccaggccacc 300

gtcgtctccc acggcaccga gggcctgacc gaggtcgtgg aggacctcaa cggcgccgag 360

gttcccgaga gcgtcctcgg ctggtacccg gacgtggaga gcgacaccgt cgtggtcgag 420

gtgctggagg gctccgacgc cgacgtcgcc gccctgctcg ccgacgccgg tgtggactcc 480

tcctcggtcc gggtggagga ggccgaggag gccccgcagg tctacgccga catcatcggc 540

ggcctggcct actacatggg cggccgctgc tccgtcggct tcgccgcgac caacagcgcc 600

ggtcagcccg gtttcgtcac cgccggccac tgcggcaccg tcggcaccgg cgtgaccatc 660

ggcaacggca ccggcacctt ccagaactcg gtcttccccg gcaacgacgc cgccttcgtc 720

cgcggcacct ccaacttcac cctgaccaac ctggtctcgc gctacaactc cggcggctac 780

cagtcggtga ccggtaccag ccaggccccg gccggctcgg ccgtgtgccg ctccggctcc 840

accaccggct ggcactgcgg caccatccag gcccgcaacc agaccgtgcg ctacccgcag 900

ggcaccgtct actcgctcac ccgcaccaac gtgtgcgccg agcccggcga ctccggcggt 960

tcgttcatct ccggctcgca ggcccagggc gtcacctccg gcggctccgg caactgctcc 1020

gtcggcggca cgacctacta ccaggaggtc accccgatga tcaactcctg gggtgtcagg 1080

atccggacct aatcgcatgt tcaatccgct cc 1112

<210>26

<211>48

<212>DNA

<213>人工序列

<220>

<223>引物1423

<400>26

gcttttagtt catcgatcgc atcggctgct ccggcccccg tcccccag 48

<210>27

<211>45

<212>DNA

<213>人工序列

<220>

<223>引物1475

<400>27

ggagcggatt gaacatgcga ttaggtccgg atcctgacac cccag 45

<210>28

<211>354

<212>PRT

<213>达松维尔拟诺卡氏菌(Nocardiopsis dassonvillei)DSM 43235

<220>

<221>PROPEP

<222>(1)..(166)

<220>

<221>mat_peptide

<222>(167)..(354)

<400>28

Ala Pro Ala Pro Val Pro Gln Thr Pro Val Ala Asp Asp Ser Ala

-165 -160 -155

Ala Ser Met Thr Glu Ala Leu Lys Arg Asp Leu Asp Leu Thr Ser

-150 -145 -140

Ala Glu Ala Glu Glu Leu Leu Ser Ala Gln Glu Ala Ala Ile Glu

-135 -130 -125

Thr Asp Ala Glu Ala Thr Glu Ala Ala Gly Glu Ala Tyr Gly Gly

-120 -115 -110

Ser Leu Phe Asp Thr Glu Thr Leu Glu Leu Thr Val Leu Val Thr Asp

-105 -100 -95

Ala Ser Ala Val Glu Ala Val Glu Ala Thr Gly Ala Gln Ala Thr Val

-90 -85 -80 -75

Val Ser His Gly Thr Glu Gly Leu Thr Glu Val Val Glu Asp Leu Asn

-70 -65 -60Gly Ala Glu Val Pro Glu Ser Val Leu Gly Trp Tyr Pro Asp Val Glu

-55 -50 -45Ser Asp Thr Val Val Val Glu Val Leu Glu Gly Ser Asp Ala Asp Val

-40 -35 -30Ala Ala Leu Leu Ala Asp Ala Gly Val Asp Ser Ser Ser Val Arg Val

-25 -20 -15

Glu Glu Ala Glu Glu Ala Pro Gln Val Tyr Ala Asp Ile Ile Gly Gly

-10 -5 -1 1 5

Leu Ala Tyr Tyr Met Gly Gly Arg Cys Ser Val Gly Phe Ala Ala Thr

10 15 20

Asn Ser Ala Gly Gln Pro Gly Phe Val Thr Ala Gly His Cys Gly Thr

25 30 35

Val Gly Thr Gly Val Thr Ile Gly Asn Gly Thr Gly Thr Phe Gln Asn

40 45 50

Ser Val Phe Pro Gly Asn Asp Ala Ala Phe Val Arg Gly Thr Ser Asn

55 60 65 70

Phe Thr Leu Thr Asn Leu Val Ser Arg Tyr Asn Ser Gly Gly Tyr Gln

75 80 85

Ser Val Thr Gly Thr Ser Gln Ala Pro Ala Gly Ser Ala Val Cys Arg

90 95 100

Ser Gly Ser Thr Thr Gly Trp His Cys Gly Thr Ile Gln Ala Arg Asn

105 110 115

Gln Thr Val Arg Tyr Pro Gln Gly Thr Val Tyr Ser Leu Thr Arg Thr

120 125 130

Asn Val Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Phe Ile Ser Gly

135 140 145 150

Ser Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Ser Val

155 160 165

Gly Gly Thr Thr Tyr Tyr Gln Glu Val Thr Pro Met Ile Asn Ser Trp

170 175 180

Gly Val Arg Ile Arg Thr

185

<210>29

<211>498

<212>DNA

<213>达松维尔拟诺卡氏菌(Nocardiopsis dassonvillei)DSM 43235

<400>29

gctccggccc ccgtccccca gacccccgtc gccgacgaca gcgccgccag catgaccgag 60

gcgctcaagc gcgacctcga cctcacctcg gccgaggccg aggagcttct ctcggcgcag 120

gaagccgcca tcgagaccga cgccgaggcc accgaggccg cgggcgaggc ctacggcggc l80

tcactgttcg acaccgagac cctcgaactc accgtgctgg tcaccgacgc ctccgccgtc 240

gaggcggtcg aggccaccgg agcccaggcc accgtcgtct cccacggcac cgagggcctg 300

accgaggtcg tggaggacct caacggcgcc gaggttcccg agagcgtcct cggctggtac 360

ccggacgtgg agagcgacac cgtcgtggtc gaggtgctgg agggctccga cgccgacgtc 420

gccgccctgc tcgccgacgc cggtgtggac tcctcctcgg tccgggtgga ggaggccgag 480

gaggccccgc aggtctac 498

<210>30

<211>166

<212>PRT

<213>达松维尔拟诺卡氏菌(Nocardiopsis das sonvillei)DSM 43235

<400>30

Ala Pro Ala Pro Val Pro Gln Thr Pro Val Ala Asp Asp Ser Ala Ala

1 5 10 15

Ser Met Thr Glu Ala Leu Lys Arg Asp Leu Asp Leu Thr Ser Ala Glu

20 25 30

Ala Glu Glu Leu Leu Ser Ala Gln Glu Ala Ala Ile Glu Thr Asp Ala

35 40 45

Glu Ala Thr Glu Ala Ala Gly Glu Ala Tyr Gly Gly Ser Leu Phe Asp

50 55 60

Thr Glu Thr Leu Glu Leu Thr Val Leu Val Thr Asp Ala Ser Ala Val

65 70 75 80

Glu Ala Val Glu Ala Thr Gly Ala Gln Ala Thr Val Val Ser His Gly

85 90 95

Thr Glu Gly Leu Thr Glu Val Val Glu Asp Leu Asn Gly Ala Glu Val

100 105 110

Pro Glu Ser Val Leu Gly Trp Tyr Pro Asp Val Glu Ser Asp Thr Val

115 120 125

Val Val Glu Val Leu Glu Gly Ser Asp Ala Asp Val Ala Ala Leu Leu

130 135 140

Ala Asp Ala Gly Val Asp Ser Ser Ser Val Arg Val Glu Glu Ala Glu

145 150 155 160

Glu Ala Pro Gln Val Tyr

165

<210>31

<211>1146

<212>DNA

<213>人工序列

<220>

<223>编码与A1918L2蛋白酶尾-变体编码基因融合在框内的SEQ ID NO：29前-区的DNA

序列；完整构建体：10R(proA1918L2)。

<400>31

atgaagaaac cgttggggaa aattgtcgca agcaccgcac tactcatttc tgttgctttt 60

agttcatcga tcgcatcggc tgctccggcc cccgtccccc agacccccgt cgccgacgac 120

agcgccgcca gcatgaccga ggcgctcaag cgcgacctcg acctcacctc ggccgaggcc 180

gaggagcttc tctcggcgca ggaagccgcc atcgagaccg acgccgaggc caccgaggcc 240

gcgggcgagg cctacggcgg ctcactgttc gacaccgaga ccctcgaact caccgtgctg 300

gtcaccgacg cctccgccgt cgaggcggtc gaggccaccg gagcccaggc caccgtcgtc 360

tcccacggca ccgagggcct gaccgaggtc gtggaggacc tcaacggcgc cgaggttccc 420

gagagcgtcc tcggctggta cccggacgtg gagagcgaca ccgtcgtggt cgaggtgctg 480

gagggctccg acgccgacgt cgccgccctg ctcgccgacg ccggtgtgga ctcctcctcg 540

gtccgggtgg aggaggccga ggaggccccg caggtctatg ccgatatcat tggaggccta 600

gcgtacacaa tgggtggtcg ctgcagcgta ggatttgcag ccacaaatgc agctggacaa 660

cctggcttcg tgacagctgg acattgcggc cgcgtcggta cacaggttac tatcggcaat 720

ggaagaggtg tctttgagca aagcgtattt cccgggaatg atgctgcctt cgttagaggt 780

acgtccaact ttacgcttac taacttagta tctagataca acactggcgg atatgcaact 840

gtagcaggtc acaatcaagc acctattggc tctagcgtct gccgctcagg gtcgactaca 900

ggatggcatt gtggaaccat tcaagctaga ggtcagagcg tgagctatcc tgaaggtacc 960

gtaacgaaca tgactcgtac gactgtatgt gcagaaccag gtgactctgg aggttcatat 1020

atcagcggta cgcaagcgca aggcgttacc tcaggtggat ccggtaactg taggacaggt 1080

ggcacaacgt tctaccagga agtgacaccg atggtgaact cttggggagt tagactccgt 1140

acataa 1146

<210>32

<211>1068

<212>DNA

<213>白拟诺卡氏菌(Nocardiopsis Alba)DSM 15647

<400>32

gcgaccggcc ccctccccca gtcccccacc ccggatgaag ccgaggccac caccatggtc 60

gaggccctcc agcgcgacct cggcctgtcc ccctctcagg ccgacgagct cctcgaggcg 120

caggccgagt ccttcgagat cgacgaggcc gccaccgcgg ccgcagccga ctcctacggc 180

ggctccatct tcgacaccga cagcctcacc ctgaccgtcc tggtcaccga cgcctccgcc 240

gtcgaggcgg tcgaggccgc cggcgccgag gccaaggtgg tctcgcacgg catggagggc 300

ctggaggaga tcgtcgccga cctgaacgcg gccgacgctc agcccggcgt cgtgggctgg 360

taccccgaca tccactccga cacggtcgtc ctcgaggtcc tcgagggctc cggtgccgac 420

gtggactccc tgctcgccga cgccggtgtg gacaccgccg acgtcaaggt ggagagcacc 480

accgagcagc ccgagctgta cgccgacatc atcggcggtc tcgcctacac catgggtggg 540

cgctgctcgg tcggcttcgc ggccaccaac gcctccggcc agcccgggtt cgtcaccgcc 600

ggccactgcg gcaccgtcgg caccccggtc agcatcggca acggccaggg cgtcttcgag 660

cgttccgtct tccccggcaa cgactccgcc ttcgtccgcg gcacctcgaa cttcaccctg 720

accaacctgg tcagccgcta caacaccggt ggttacgcga ccgtctccgg ctcctcgcag 780

gcggcgatcg gctcgcagat ctgccgttcc ggctccacca ccggctggca ctgcggcacc 840

gtccaggccc gcggccagac ggtgagctac ccccagggca ccgtgcagaa cctgacccgc 900

accaacgtct gcgccgagcc cggtgactcc ggcggctcct tcatctccgg cagccaggcc 960

cagggcgtca cctccggtgg ctccggcaac tgctccttcg gtggcaccac ctactaccag 1020

gaggtcaacc cgatgctgag cagctggggt ctgaccctgc gcacctga 1068

<210>33

<211>355

<212>PRT

<213>白拟诺卡氏菌(Nocardiopsis Alba)DSM 15647

<220>

<221>PROPEP

<222>(1)..(167)

<220>

<221>mat_peptide

<222>(168)..(355)

<400>33

Ala Thr Gly Pro Leu Pro Gln Ser Pro Thr Pro Asp Glu Ala Glu

-165 -160 -155

Ala Thr Thr Met Val Glu Ala Leu Gln Arg Asp Leu Gly Leu Ser

-150 -145 -140

Pro Ser Gln Ala Asp Glu Leu Leu Glu Ala Gln Ala Glu Ser Phe

-135 -130 -125

Glu Ile Asp Glu Ala Ala Thr Ala Ala Ala Ala Asp Ser Tyr Gly

-120 -115 -110

Gly Ser Ile Phe Asp Thr Asp Ser Leu Thr Leu Thr Val Leu Val Thr

-105 -100 -95

Asp Ala Ser Ala Val Glu Ala Val Glu Ala Ala Gly Ala Glu Ala Lys

-90 -85 -80

Val Val Ser His Gly Met Glu Gly Leu Glu Glu Ile Val Ala Asp Leu

-75 -70 -65 -60

Asn Ala Ala Asp Ala Gln Pro Gly Val Val Gly Trp Tyr Pro Asp Ile

-55 -50 -45

His Ser Asp Thr Val Val Leu Glu Val Leu Glu Gly Ser Gly Ala Asp

-40 -35 -30

Val Asp Ser Leu Leu Ala Asp Ala Gly Val Asp Thr Ala Asp Val Lys

-25 -20 -15

Val Glu Ser Thr Thr Glu Gln Pro Glu Leu Tyr Ala Asp Ile Ile Gly

-10 -5 -1 1 5

Gly Leu Ala Tyr Thr Met Gly Gly Arg Cys Ser Val Gly Phe Ala Ala

10 15 20

Thr Asn Ala Ser Gly Gln Pro Gly Phe Val Thr Ala Gly His Cys Gly

25 30 35

Thr Val Gly Thr Pro Val Ser Ile Gly Asn Gly Gln Gly Val Phe Glu

40 45 50

Arg Ser Val Phe Pro Gly Asn Asp Ser Ala Phe Val Arg Gly Thr Ser

55 60 65

Asn Phe Thr Leu Thr Asn Leu Val Ser Arg Tyr Asn Thr Gly Gly Tyr

70 75 80 85

Ala Thr Val Ser Gly Ser Ser Gln Ala Ala Ile Gly Ser Gln Ile Cys

90 95 100

Arg Ser Gly Ser Thr Thr Gly Trp His Cys Gly Thr Val Gln Ala Arg

105 110 115

Gly Gln Thr Val Ser Tyr Pro Gln Gly Thr Val Gln Asn Leu Thr Arg

120 125 130

Thr Asn Val Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Phe Ile Ser

135 140 145

Gly Ser Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Ser

150 155 160 165

Phe Gly Gly Thr Thr Tyr Tyr Gln Glu Val Asn Pro Met Leu Ser Ser

170 175 180

Trp Gly Leu Thr Leu Arg Thr

185

<210>34

<211>43

<212>DNA

<213>人工序列

<220>

<223>引物1421

<400>34

gttcatcgat cgcatcggct gcgaccggcc ccctccccca gtc 43

<210>35

<211>31

<212>DNA

<213>人工序列

<220>

<223>引物1604

<400>35

gcggatccta tcaggtgcgc agggtcagac c 31

<210>36

<211>1062

<212>DNA

<213>葱绿拟诺卡氏菌(Nocardiopsis prasina)DSM 15648

<400>36

gccaccggac cgctccccca gtcacccacc ccggaggccg acgccgtctc catgcaggag 60

gcgctccagc gcgacctcgg cctgaccccg cttgaggccg atgaactgct ggccgcccag 120

gacaccgcct tcgaggtcga cgaggccgcg gccgcggccg ccggggacgc ctacggcggc 180

tccgtcttcg acaccgagac cctggaactg accgtcctgg tcaccgacgc cgcctcggtc 240

gaggctgtgg aggccaccgg cgcgggtacc gaactcgtct cctacggcat cgagggcctc 300

gacgagatca tccaggatct caacgccgcc gacgccgtcc ccggcgtggt cggctggtac 360

ccggacgtgg cgggtgacac cgtcgtcctg gaggtcctgg agggttccgg agccgacgtg 420

agcggcctgc tcgccgacgc cggcgtggac gcctcggccg tcgaggtgac cagcagtgcg 480

cagcccgagc tctacgccga catcatcggc ggtctggcct acaccatggg cggccgctgt 540

tcggtcggat tcgcggccac caacgccgcc ggtcagcccg gattcgtcac cgccggtcac 600

tgtggccgcg tgggcaccca ggtgagcatc ggcaacggcc agggcgtctt cgagcagtcc 660

atcttcccgg gcaacgacgc cgccttcgtc cgcggcacgt ccaacttcac gctgaccaac 720

ctggtcagcc gctacaacac cggcggttac gccaccgtcg ccggccacaa ccaggcgccc 780

atcggctcct ccgtctgccg ctccggctcc accaccggct ggcactgcgg caccatccag 840

gcccgcggcc agtcggtgag ctaccccgag ggcaccgtca ccaacatgac ccggaccacc 900

gtgtgcgccg agcccggcga ctccggcggc tcctacatct ccggcaacca ggcccagggc 960

gtcacctccg gcggctccgg caactgccgc accggcggga ccaccttcta ccaggaggtc 1020

acccccatgg tgaactcctg gggcgtccgt ctccggacct aa 1062

<210>37

<211>353

<212>PRT

<213>葱绿拟诺卡氏菌(Nocardiopsis prasina)DSM 15648

<220>

<221>PROPEP

<222>(1)..(165)

<220>

<221>mat_peptide

<222>(166)..(353)

<400>37

Ala Thr Gly Pro Leu Pro Gln Ser Pro Thr Pro Glu Ala Asp Ala

-165 -160 -155

Val Ser Met Gln Glu Ala Leu Gln Arg Asp Leu Gly Leu Thr Pro

-150 -145 -140

Leu Glu Ala Asp Glu Leu Leu Ala Ala Gln Asp Thr Ala Phe Glu

-135 -130 -125

Val Asp Glu Ala Ala Ala Ala Ala Ala Gly Asp Ala Tyr Gly Gly

-120 -115 -110

Ser Val Phe Asp Thr Glu Thr Leu Glu Leu Thr Val Leu Val Thr Asp

-105 -100 -95 -90

Ala Ala Ser Val Glu Ala Val Glu Ala Thr Gly Ala Gly Thr Glu Leu

-85 -80 -75

Val Ser Tyr Gly Ile Glu Gly Leu Asp Glu Ile Ile Gln Asp Leu Asn

-70 -65 -60

Ala Ala Asp Ala Val Pro Gly Val Val Gly Trp Tyr Pro Asp Val Ala

-55 -50 -45

Gly Asp Thr Val Val Leu Glu Val Leu Glu Gly Ser Gly Ala Asp Val

-40 -35 -30

Ser Gly Leu Leu Ala Asp Ala Gly Val Asp Ala Ser Ala Val Glu Val

-25 -20 -15 -10

Thr Ser Ser Ala Gln Pro Glu Leu Tyr Ala Asp Ile Ile Gly Gly Leu

-5 -1 1 5

Ala Tyr Thr Met Gly Gly Arg Cys Ser Val Gly Phe Ala Ala Thr Asn

10 15 20

Ala Ala Gly Gln Pro Gly Phe Val Thr Ala Gly His Cys Gly Arg Val

25 30 35

Gly Thr Gln Val Ser Ile Gly Asn Gly Gln Gly Val Phe Glu Gln Ser

40 45 50 55

Ile Phe Pro Gly Asn Asp Ala Ala Phe Val Arg Gly Thr Ser Asn Phe

60 65 70

Thr Leu Thr Asn Leu Val Ser Arg Tyr Asn Thr Gly Gly Tyr Ala Thr

75 80 85

Val Ala Gly His Asn Gln Ala Pro Ile Gly Ser Ser Val Cys Arg Ser

90 95 100

Gly Ser Thr Thr Gly Trp His Cys Gly Thr Ile Gln Ala Arg Gly Gln

105 110 115

Ser Val Ser Tyr Pro Glu Gly Thr Val Thr Asn Met Thr Arg Thr Thr

120 125 130 135

Val Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Tyr Ile Sec Gly Asn

140 145 150

Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Arg Thr Gly

155 160 165

Gly Thr Thr Phe Tyr Gln Glu Val Thr Pro Met Val Asn Ser Trp Gly

170 175 180

Val Arg Leu Arg Thr

185

<210>38

<211>43

<212>DNA

<213>人工序列

<220>

<223>引物1346

<400>38

gttcatcgat cgcatcggct gccaccggac cgctccccca gtc 43

<210>39

<211>38

<212>DNA

<213>人工序列

<220>

<223>引物1602

<400>39

gcggatccta ttaggtccgg agacggacgc cccaggag 38

<210>40

<211>1062

<212>DNA

<213>葱绿拟诺卡氏菌(Nocardiopsis prasina)DSM 15649

<400>40

gccaccggac cactccccca gtcacccacc ccggaggccg acgccgtctc catgcaggag 60

gcgctccagc gcgacctcgg cctgaccccg cttgaggccg atgaactgct ggccgcccag 120

gacaccgcct tcgaggtcga cgaggccgcg gccgaggccg ccggtgacgc ctacggcggc 180

tccgtcttcg acaccgagac cctggaactg accgtcctgg tcaccgactc cgccgcggtc 240

gaggcggtgg aggccaccgg cgccgggacc gaactggtct cctacggcat cacgggcctc 300

gacgagatcg tcgaggagct caacgccgcc gacgccgttc ccggcgtggt cggctggtac 360

ccggacgtcg cgggtgacac cgtcgtgctg gaggtcctgg agggttccgg cgccgacgtg 420

ggcggcctgc tcgccgacgc cggcgtggac gcctcggcgg tcgaggtgac caccaccgag 480

cagcccgagc tgtacgccga catcatcggc ggtctggcct acaccatggg cggccgctgt 540

tcggtcggct tcgcggccac caacgccgcc ggtcagcccg ggttcgtcac cgccggtcac 600

tgtggccgcg tgggcaccca ggtgaccatc ggcaacggcc ggggcgtctt cgagcagtcc 660

atcttcccgg gcaacgacgc cgccttcgtc cgcggaacgt ccaacttcac gctgaccaac 720

ctggtcagcc gctacaacac cggcggctac gccaccgtcg ccggtcacaa ccaggcgccc 780

atcggctcct ccgtctgccg ctccggctcc accaccggtt ggcactgcgg caccatccag 840

gcccgcggcc agtcggtgag ctaccccgag ggcaccgtca ccaacatgac gcggaccacc 900

gtgtgcgccg agcccggcga ctccggcggc tcctacatct ccggcaacca ggcccagggc 960

gtcacctccg gcggctccgg caactgccgc accggcggga ccaccttcta ccaggaggtc 1020

acccccatgg tgaactcctg gggcgtccgt ctccggacct aa 1062

<210>41

<211>353

<212>PRT

<213>葱绿拟诺卡氏菌(Nocardiopsis prasina)DSM 15649

<220>

<221>PROPEP

<222>(1)..(165)

<220>

<221>mat_peptide

<222>(166)..(353)

<400>41

Ala Thr Gly Pro Leu Pro Gln Ser Pro Thr Pro Glu Ala Asp Ala

-165 -160 -155

Val Ser Met Gln Glu Ala Leu Gln Arg Asp Leu Gly Leu Thr Pro

-150 -145 -140

Leu Glu Ala Asp Glu Leu Leu Ala Ala Gln Asp Thr Ala Phe Glu

-135 -130 -125

Val Asp Glu Ala Ala Ala Glu Ala Ala Gly Asp Ala Tyr Gly Gly

-120 -115 -110

Ser Val Phe Asp Thr Glu Thr Leu Glu Leu Thr Val Leu Val Thr Asp

-105 -100 -95 -90

Ser Ala Ala Val Glu Ala Val Glu Ala Thr Gly Ala Gly Thr Glu Leu

-85 -80 -75

Val Ser Tyr Gly Ile Thr Gly Leu Asp Glu Ile Val Glu Glu Leu Asn

-70 -65 -60

Ala Ala Asp Ala Val Pro Gly Val Val Gly Trp Tyr Pro Asp Val Ala

-55 -50 -45

Gly Asp Thr Val Val Leu Glu Val Leu Glu Gly Ser Gly Ala Asp Val

-40 -35 -30

Gly Gly Leu Leu Ala Asp Ala Gly Val Asp Ala Ser Ala Val Glu Val

-25 -20 -15 -10

Thr Thr Thr Glu Gln Pro Glu Leu Tyr Ala Asp Ile Ile Gly Gly Leu

-5 -1 1 5

Ala Tyr Thr Met Gly Gly Arg Cys Ser Val Gly Phe Ala Ala Thr Asn

10 15 20

Ala Ala Gly Gln Pro Gly Phe Val Thr Ala Gly His Cys Gly Arg Val

25 30 35

Gly Thr Gln Val Thr Ile Gly Asn Gly Arg Gly Val Phe Glu Gln Ser

40 45 50 55

Ile Phe Pro Gly Asn Asp Ala Ala Phe Val Arg Gly Thr Ser Asn Phe

60 65 70

Thr Leu Thr Asn Leu Val Ser Arg Tyr Asn Thr Gly Gly Tyr Ala Thr

75 80 85

Val Ala Gly His Asn Gln Ala Pro Ile Gly Ser Ser Val Cys Arg Ser

90 95 100

Gly Ser Thr Thr Gly Trp His Cys Gly Thr Ile Gln Ala Arg Gly Gln

105 110 115

Ser Val Ser Tyr Pro Glu Gly Thr Val Thr Asn Met Thr Arg Thr Thr

120 125 130 135

Val Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Tyr Ile Ser Gly Asn

140 145 150

Gln Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Arg Thr Gly

155 160 165

Gly Thr Thr Phe Tyr Gln Glu Val Thr Pro Met Val Asn Ser Trp Gly

170 175 180

Val Arg Leu Arg Thr

185

<210>42

<211>43

<212>DNA

<213>人工序列

<220>

<223>引物1603

<400>42

gttcatcgat cgcatcggct gccaccggac cactccccca gtc 43

<210>43

<211>353

<212>PRT

<213>拟诺卡氏菌(Nocardiopsis sp.)NRRL 18262

<220>

<221>PROPEP

<222>(1)..(165)

<220>

<221>mat_peptide

<222>(166)..(1059)

<400>43

Ala Thr Gly Ala Leu Pro Gln Ser Pro Thr Pro Glu Ala Asp Ala

-165 -160 -155

Val Ser Met Gln Glu Ala Leu Gln Arg Asp Leu Asp Leu Thr Ser

-150 -145 -140

Ala Glu Ala Glu Glu Leu Leu Ala Ala Gln Asp Thr Ala Phe Glu

-135 -130 -125

Val Asp Glu Ala Ala Ala Glu Ala Ala Gly Asp Ala Tyr Gly Gly

-120 -115 -110

Ser Val Phe Asp Thr Glu Ser Leu Glu Leu Thr Val Leu Val Thr Asp

-105 -100 -95 -90

Ala Ala Ala Val Glu Ala Val Glu Ala Thr Gly Ala Gly Thr Glu Leu

-85 -80 -75

Val Ser Tyr Gly Ile Asp Gly Leu Asp Glu Ile Val Gln Glu Leu Asn

-70 -65 -60

Ala Ala Asp Ala Val Pro Gly Val Val Gly Trp Tyr Pro Asp Val Ala

-55 -50 -45

Gly Asp Thr Val Val Leu Glu Val Leu Glu Gly Ser Gly Ala Asp Val

-40 -35 -30

Ser Gly Leu Leu Ala Asp Ala Gly Val Asp Ala Ser Ala Val Glu Val

-25 -20 -15 -10

Thr Thr Ser Asp Gln Pro Glu Leu Tyr Ala Asp Ile Ile Gly Gly Leu

-5 -1 1 5

Ala Tyr Thr Met Gly Gly Arg Cys Ser Val Gly Phe Ala Ala Thr Asn

10 15 20

Ala Ala Gly Gln Pro Gly Phe Val Thr Ala Gly His Cys Gly Arg Val

25 30 35

Gly Thr Gln Val Thr Ile Gly Asn Gly Arg Gly Val Phe Glu Gln Ser

40 45 50 55

Val Phe Pro Gly Asn Asp Ala Ala Phe Val Arg Gly Thr Ser Asn Phe

60 65 70

Thr Leu Thr Asn Leu Val Ser Arg Tyr Asn Thr Gly Gly Tyr Ala Thr

75 80 85

Val Ala Gly His Asn Gln Ala Pro Ile Gly Ser Ser Val Cys Arg Ser

90 95 100

Gly Ser Thr Thr Gly Trp His Cys Gly Thr Ile Gln Ala Arg Gly Gln

105 110 115

Ser Val Ser Tyr Pro Glu Gly Thr Val Thr Asn Met Thr Arg Thr Thr

120 125 130 135

Val Cys Ala Glu Pro Gly Asp Ser Gly Gly Ser Tyr Ile Ser Gly Thr

140 145 150

Gin Ala Gln Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Arg Thr Gly

155 160 165

Gly Thr Thr Phe Tyr Gln Glu Val Thr Pro Met Val Asn Ser Trp Gly

170 175 180

Val Arg Leu Arg Thr

185

<210>44

<211>1164

<212>DNA

<213>人工序列

<220>

<223>合成性蛋白酶编码基因

<220>

<221>CDS

<222>(1)..(1164)

<223>全长蛋白酶

<220>

<221>sig_peptide

<222>(1)..(81)

<220>

<221>misc_feature

<222>(82)..(1164)

<223>前肽

<220>

<221>mat_peptide

<222>(577)..(1164)

<400>44

atg aaa aaa ccg ctg gga aaa att gtc gca agc aca gca ctt ctt 45

Met Lys Lys Pro Leu Gly Lys Ile Val Ala Ser Thr Ala Leu Leu

-190 -185 -180

att tca gtg gca ttt agc tca tct att gca tca gca gct aca gga 90

Ile Ser Val Ala Phe Ser Ser Ser Ile Ala Ser Ala Ala Thr Gly

-175 -170 -165

gca tta ccg cag tct ccg aca ccg gaa gca gat gca gtc tca atg 135

Ala Leu Pro Gln Ser Pro Thr Pro Glu Ala Asp Ala Val Ser Met

-160 -155 -150

caa gaa gca ctg caa aga gat ctt gat ctt aca tca gca gaa gca 180

Gln Glu Ala Leu Gln Arg Asp Leu Asp Leu Thr Ser Ala Glu Ala

-145 -140 -135

gaa gaa ctt ctt gct gca caa gat aca gca ttt gaa gtg gat gaa 225

Glu Glu Leu Leu Ala Ala Gln Asp Thr Ala Phe Glu Val Asp Glu

-130 -125 -120

gca gcg gca gaa gca gca gga gat gca tat ggc ggc tca gtt ttt 270

Ala Ala Ala Glu Ala Ala Gly Asp Ala Tyr Gly Gly Ser Val Phe

-115 -110 -105

gat aca gaa tca ctt gaa ctt aca gtt ctt gtt aca gat gca gca gca 318

Asp Thr Glu Ser Leu Glu Leu Thr Val Leu Val Thr Asp Ala Ala Ala

-100 -95 -90

gtt gaa gca gtt gaa gca aca gga gca gga aca gta ctt gtt tca tat 366

Val Glu Ala Val Glu Ala Thr Gly Ala Gly Thr Val Leu Val Ser Tyr

-85 -80 -75

gga att gat ggc ctt gat gaa att gtt caa gaa ctg aat gca gct gat 414

Gly Ile Asp Gly Leu Asp Glu Ile Val Gln Glu Leu Asn Ala Ala Asp

-70 -65 -60 -55

gct gtt ccg ggc gtt gtt ggc tgg tat ccg gat gtt gct gga gat aca 462

Ala Val Pro Gly Val Val Gly Trp Tyr Pro Asp Val Ala Gly Asp Thr

-50 -45 -40

gtt gtc ctt gaa gtt ctt gaa gga tca ggc gca gat gtt tca ggc ctg 510

Val Val Leu Glu Val Leu Glu Gly Ser Gly Ala Asp Val Ser Gly Leu

-35 -30 -25

ctg gca gac gca gga gtc gat gca tca gca gtt gaa gtt aca aca tca 558

Leu Ala Asp Ala Gly Val Asp Ala Ser Ala Val Glu Val Thr Thr Ser

-20 -15 -10

gat caa ccg gaa ctt tat gca gat att att ggc ggc ctg gca tat tat 606

Asp Gln Pro Glu Leu Tyr Ala Asp Ile Ile Gly Gly Leu Ala Tyr Tyr

-5 -1 1 5 10

atg ggc ggc aga tgc agc gtt ggc ttt gca gca aca aat gca tca ggc 654

Met Gly Gly Arg Cys Ser Val Gly Phe Ala Ala Thr Asn Ala Ser Gly

15 20 25

caa ccg ggc ttt gtt aca gca ggc cat tgc ggc aca gtt ggc aca cca 702

Gln Pro Gly Phe Val Thr Ala Gly His Cys Gly Thr Val Gly Thr Pro

30 35 40

gtt tca att ggc aat ggc aaa ggc gtt ttt gaa cga agc att ttt ccg 750

Val Ser Ile Gly Asn Gly Lys Gly Val Phe Glu Arg Ser Ile Phe Pro

45 50 55

ggc aat gat tca gca ttt gtt aga ggc aca tca aat ttt aca ctt aca 798

Gly Asn Asp Ser Ala Phe Val Arg Gly Thr Ser Asn Phe Thr Leu Thr

60 65 70

aat ctg gtt tca aga tat aat tca ggc ggc tat gca aca gtt gca ggc 846

Asn Leu Val Ser Arg Tyr Asn Ser Gly Gly Tyr Ala Thr Val Ala Gly

75 80 85 90

cat aat caa gca ccg att ggc tca gca gtt tgc aga tca ggc tca aca 894

His Asn Gln Ala Pro Ile Gly Ser Ala Val Cys Arg Ser Gly Ser Thr

95 100 105

aca ggc tgg cat tgc ggc aca att caa gca aga aat caa aca gtt agg 942

Thr Gly Trp His Cys Gly Thr Ile Gln Ala Arg Asn Gln Thr Val Arg

110 115 120

tat ccg caa ggc aca gtt tat agt ctg aca aga aca aca gtt tgt gca 990

Tyr Pro Gln Gly Thr Val Tyr Ser Leu Thr Arg Thr Thr Val Cys Ala

125 130 135

gaa ccg ggc gat tca ggc ggc tca tat att agc ggc act caa gca caa 1038

Glu Pro Gly Asp Ser Gly Gly Ser Tyr Ile Ser Gly Thr Gln Ala Gln

140 145 150

ggc gtt aca tca ggc ggc tca ggc aat tgc agt gct ggc ggc aca aca 1086

Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Ser Ala Gly Gly Thr Thr

155 160 165 170

tat tac caa gaa gtt aat ccg atg ctt agt tca tgg ggc ctt aca ctt 1134

Tyr Tyr Gln Glu Val Asn Pro Met Leu Ser Ser Trp Gly Leu Thr Leu

175 180 185

aga aca caa tcg cat gtt caa tcc gct cca 1164

Arg Thr Gln Ser His Val Gln Ser Ala Pro

190 195

<210>45

<211>388

<212>PRT

<213>人工序列

<220>

<223>合成的构建体

<400>45

Met Lys Lys Pro Leu Gly Lys Ile Val Ala Ser Thr Ala Leu Leu

-190 -185 -180

Ile Ser Val Ala Phe Ser Ser Ser Ile Ala Ser Ala Ala Thr Gly

-175 -170 -165

Ala Leu Pro Gln Ser Pro Thr Pro Glu Ala Asp Ala Val Ser Met

-160 -155 -150

Gln Glu Ala Leu Gln Arg Asp Leu Asp Leu Thr Ser Ala Glu Ala

-145 -140 -135

Glu Glu Leu Leu Ala Ala Gln Asp Thr Ala Phe Glu Val Asp Glu

-130 -125 -120

Ala Ala Ala Glu Ala Ala Gly Asp Ala Tyr Gly Gly Ser Val Phe

-115 -110 -105

Asp Thr Glu Ser Leu Glu Leu Thr Val Leu Val Thr Asp Ala Ala Ala

-100 -95 -90

Val Glu Ala Val Glu Ala Thr Gly Ala Gly Thr Val Leu Val Ser Tyr

-85 -80 -75

Gly Ile Asp Gly Leu Asp Glu Ile Val Gln Glu Leu Asn Ala Ala Asp

-70 -65 -60 -55

Ala Val Pro Gly Val Val Gly Trp Tyr Pro Asp Val Ala Gly Asp Thr

-50 -45 -40

Val Val Leu Glu Val Leu Glu Gly Ser Gly Ala Asp Val Ser Gly Leu

-35 -30 -25

Leu Ala Asp Ala Gly Val Asp Ala Ser Ala Val Glu Val Thr Thr Ser

-20 -15 -10

Asp Gln Pro Glu Leu Tyr Ala Asp Ile Ile Gly Gly Leu Ala Tyr Tyr

-5 -1 1 5 10

Met Gly Gly Arg Cys Ser Val Gly Phe Ala Ala Thr Asn Ala Ser Gly

15 20 25

Gln Pro Gly Phe Val Thr Ala Gly His Cys Gly Thr Val Gly Thr Pro

30 35 40

Val Ser Ile Gly Asn Gly Lys Gly Val Phe Glu Arg Ser Ile Phe Pro

45 50 55

Gly Asn Asp Ser Ala Phe Val Arg Gly Thr Ser Asn Phe Thr Leu Thr

60 65 70

Asn Leu Val Ser Arg Tyr Asn Ser Gly Gly Tyr Ala Thr Val Ala Gly

75 80 85 90

His Asn Gln Ala Pro Ile Gly Ser Ala Val Cys Arg Ser Gly Ser Thr

95 100 105

Thr Gly Trp His Cys Gly Thr Ile Gln Ala Arg Asn Gln Thr Val Arg

110 115 120

Tyr Pro Gln Gly Thr Val Tyr Ser Leu Thr Arg Thr Thr Val Cys Ala

125 130 135

Glu Pro Gly Asp Ser Gly Gly Ser Tyr Ile Ser Gly Thr Gln Ala Gln

140 145 150

Gly Val Thr Ser Gly Gly Ser Gly Asn Cys Ser Ala Gly Gly Thr Thr

155 160 165 170

Tyr Tyr Gln Glu Val Asn Pro Met Leu Ser Ser Trp Gly Leu Thr Leu

175 180 185

Arg Thr Gln Ser His Val Gln Ser Ala Pro

190 195

<210>46

<211>165

<212>PRT

<213>人工序列

<220>

<223>改组的前肽0-2.19

<220>

<221>PROPEP

<222>(1)..(165)

<400>46

Ala Thr Gly Ala Leu Pro Gln Ser Pro Thr Pro Glu Ala Asp Ala Val

1 5 10 15

Ser Met Gln Glu Ala Leu Gln Arg Asp Leu Asp Leu Thr Ser Ala Glu

20 25 30

Ala Glu Glu Leu Leu Ala Ala Gln Asp Thr Ala Phe Glu Val Asp Glu

35 40 45

Ala Ala Ala Ala Ala Ala Gly Asp Ala Tyr Gly Gly Ser Val Phe Asp

50 55 60

Thr Glu Ser Leu Thr Leu Thr Val Leu Val Thr Asp Ala Ser Ala Val

65 70 75 80

Glu Ala Val Glu Ala Ala Gly Ala Glu Ala Lys Val Val Ser His Gly

85 90 95

Met Glu Gly Leu Glu Glu Ile Val Ala Asp Leu Asn Ala Ala Asp Ala

100 105 110

Gln Pro Gly Val Val Gly Trp Tyr Pro Asp Ile His Ser Asp Thr Val

115 120 125

Val Leu Glu Val Leu Glu Gly Ser Gly Ala Asp Val Asp Ser Leu Leu

130 135 140

Ala Asp Ala Gly Val Asp Ala Ser Ala Val Glu Val Thr Thr Ser Asp

145 150 155 160

Gln Pro Glu Leu Tyr

165

<210>47

<211>166

<212>PRT

<213>人工序列

<220>

<223>改组的前肽G-2.73

<220>

<221>PROPEP

<222>(1)..(166)

<400>47

Ala Thr Gly Ala Leu Pro Gln Ser Pro Thr Pro Glu Ala Asp Ala Val

1 5 10 15

Ser Met Gln Glu Ala Leu Gln Arg Asp Leu Asp Leu Ser Ser Ala Glu

20 25 30

Ala Glu Glu Leu Leu Ala Ala Gln Asp Thr Ala Phe Glu Val Asp Glu

35 40 45

Ala Ala Ala Gly Ala Ala Gly Asp Ala Tyr Gly Gly Ser Val Phe Asp

50 55 60

Thr Glu Thr Leu Glu Leu Thr Val Leu Val Thr Asp Ala Ser Ala Val

65 70 75 80

Glu Ala Val Glu Ala Ala Gly Ala Glu Ala Lys Val Val Ser His Gly

85 90 95

Met Glu Gly Leu Glu Glu Ile Val Ala Asp Leu Asn Ala Ala Asp Ala

100 105 110

Gln Pro Gly Val Val Gly Trp Tyr Pro Asp Ile His Ser Asp Thr Val

115 120 125

Val Val Glu Val Leu Glu Gly Ser Gly Ala Asp Val Asp Ser Leu Leu

130 135 140

Ala Asp Ala Gly Val Asp Thr Ala Asp Val Lys Val Glu Ser Thr Thr

145 150 155 160

Glu Gln Pro Glu Leu Tyr

165

<210>48

<211>166

<212>PRT

<213>人工序列

<220>

<223>改组的前肽G-1.43

<220>

<221>PROPEP

<222>(1)..(166)

<400>48

Ala Thr Gly Ala Leu Pro Gln Ser Pro Thr Pro Glu Ala Asp Ala Val

1 5 10 15

Ser Met Gln Glu Ala Leu Gln Arg Asp Leu Gly Leu Ser Ser Ser Gln

20 25 30

Ala Glu Glu Leu Leu Asp Ala Gln Ala Glu Ser Phe Glu Ile Asp Glu

35 40 45

Ala Ala Ala Ala Ala Ala Gly Asp Ala Tyr Gly Gly Ser Ile Phe Asp

50 55 60

Thr Asp Ser Leu Thr Leu Thr Val Leu Val Thr Asp Ala Ser Ala Val

65 70 75 80

Glu Ala Val Glu Ala Ala Gly Ala Glu Ala Lys Val Val Ser His Gly

85 90 95

Met Glu Gly Leu Glu Glu Ile Val Ala Asp Leu Asn Ala Ala Asp Ala

100 105 110

Gln Pro Gly Val Val Gly Trp Tyr Pro Asp Ile His Ser Asp Thr Val

115 120 125

Val Leu Glu Val Leu Glu Gly Ser Gly Ala Asp Val Asp Ser Leu Leu

130 135 140

Ala Asp Ala Gly Val Asp Thr Ala Asp Val Lys Val Glu Ser Thr Thr

145 150 155 160

Glu Gln Pro Glu Leu Tyr

165

<210>49

<211>166

<212>PRT

<213>人工序列

<220>

<223>改组的前肽G-2.6

<220>

<221>PROPEP

<222>(1)..(166)

<400>49

Ala Thr Gly Ala Leu Pro Gln Ser Pro Thr Pro Glu Ala Asp Ala Val

1 5 10 15

Ser Met Gln Glu Ala Leu Gln Arg Asp Leu Asp Leu Thr Ser Ala Glu

20 25 30

Ala Glu Glu Leu Leu Ala Ala Gln Asp Thr Ala Phe Glu Val Asp Glu

35 40 45

Ala Ala Ala Ala Ala Ala Gly Asp Ala Tyr Gly Gly Ser Ile Phe Asp

50 55 60

Thr Glu Thr Leu Glu Leu Thr Val Leu Val Thr Asp Ser Ser Ser Val

65 70 75 80

Glu Ala Val Glu Ala Ala Gly Ala Glu Ala Lys Val Val Ser His Gly

85 90 95

Met Glu Gly Leu Glu Glu Ile Val Ala Asp Leu Asn Ala Ala Asp Ala

100 105 110

Gln Pro Gly Val Val Gly Trp Tyr Pro Asp Ile His Ser Asp Thr Val

115 120 125

Val Leu Glu Val Leu Glu Gly Ser Gly Ala Asp Val Asp Ser Leu Leu

130 135 140

Ala Gly Ala Gly Val Asp Thr Ala Asp Val Lys Val Glu Ser Thr Thr

145 150 155 160

Glu Gln Pro Glu Leu Tyr

165

<210>50

<211>165

<212>PRT

<213>人工序列

<220>

<223>改组的前肽G-2.5

<220>

<221>PROPEP

<222>(1)..(165)

<400>50

Ala Thr Gly Ala Leu Pro Gln Ser Pro Thr Pro Glu Ala Asp Ala Val

1 5 10 15

Ser Met Gln Glu Ala Leu Gln Arg Asp Leu Gly Leu Thr Pro Leu Glu

20 25 30

Ala Glu Glu Leu Leu Ala Ala Gln Asp Thr Ala Phe Glu Val Asp Glu

35 40 45

Ala Ala Ala Glu Ala Ala Gly Asp Ala Tyr Gly Gly Ser Val Phe Asp

50 55 60

Thr Glu Thr Leu Glu Leu Thr Val Leu Val Thr Asp Ala Ser Ala Val

65 70 75 80

Glu Ala Val Glu Ala Ala Gly Ala Glu Ala Lys Val Val Ser His Gly

85 90 95

Met Glu Gly Leu Glu Glu Ile Val Ala Asp Leu Asn Ala Ala Asp Ala

100 105 110

Gln Pro Gly Val Val Gly Trp Tyr Pro Asp Ile His Ser Asp Thr Val

115 120 125

Val Leu Glu Val Leu Glu Gly Ser Gly Ala Asp Val Asp Ser Leu Leu

130 135 140

Ala Asp Ala Gly Val Asp Ala Ser Ala Val Glu Val Thr Pro Ala Ala

145 150 155 160

Arg Pro Glu Leu Tyr

165

<210>51

<211>166

<212>PRT

<213>人工序列

<220>

<223>改组的前肽G-2.3

<220>

<221>PROPEP

<222>(1)..(166)

<400>51

Ala Thr Gly Ala Leu Pro Gln Ser Pro Thr Pro Asp Gly Ala Glu Ala

1 5 10 15

Thr Thr Met Val Glu Ala Leu Gln Arg Asp Leu Gly Leu Thr Pro Ala

20 25 30

Glu Ala Glu Glu Leu Leu Ala Ala Gln Asp Thr Ala Phe Glu Val Asp

35 40 45

Glu Ala Ala Ala Ala Ala Ala Gly Asp Ala Tyr Gly Gly Ser Ile Phe

50 55 60

Asp Thr Asp Ser Leu Thr Leu Thr Val Leu Val Thr Asp Ala Ala Ala

65 70 75 80

Val Glu Ala Val Glu Ala Ala Gly Ala Glu Ala Lys Val Val Ser His

85 90 95

Gly Met Glu Gly Leu Glu Glu Ile Val Ala Asp Leu Asn Ala Ala Asp

100 105 110

Ala Val Pro Gly Val Val Gly Trp Tyr Pro Asp Val Ala Gly Asp Thr

115 120 125

Val Val Leu Glu Val Leu Glu Gly Ser Gly Ala Asp Val Tyr Ser Leu

130 135 140

Leu Ala Asp Ala Gly Val Asp Ala Ser Ala Val Glu Val Thr Pro Ala

145 150 155 160

Ala Gln Pro Glu Leu Tyr

165

<210>52

<211>166

<212>PRT

<213>人工序列

<220>

<223>改组的前肽G-1.4

<220>

<221>PROPEP

<222>(1)..(166)

<400>52

Ala Thr Gly Ala Leu Pro Gln Ser Pro Thr Pro Glu Ala Asp Ala Val

1 5 10 15

Ser Met Gln Glu Ala Leu Gln Arg Asp Leu Gly Leu Ser Ser Ser Gln

20 25 30

Ala Glu Glu Leu Leu Asp Ala Gln Ala Glu Ser Phe Glu Ile Asp Glu

35 40 45

Ala Ala Ala Ala Ala Ala Ala Asp Ser Tyr Gly Gly Ser Ile Phe Asp

50 55 60

Thr Asp Ser Leu Thr Leu Thr Val Leu Val Thr Asp Ala Ser Ala Val

65 70 75 80

Glu Ala Val Glu Ala Ala Gly Ala Glu Ala Lys Val Val Ser His Gly

85 90 95

Met Glu Gly Leu Glu Glu Ile Val Ala Asp Leu Asn Ala Ala Asp Ala

100 105 110

Gln Pro Gly Val Val Gly Trp Tyr Pro Asp Ile His Ser Asp Thr Val

115 120 125

Val Leu Glu Val Leu Glu Gly Ser Gly Ala Asp Val Asp Ser Leu Leu

130 135 140

Ala Asp Ala Gly Val Asp Thr Ala Asp Val Lys Val Glu Ser Thr Thr

145 150 155 160

Glu Gln Pro Glu Leu Tyr

165

<210>53

<211>166

<212>PRT

<213>人工序列

<220>

<223>改组的前肽G-1.2

<220>

<221>PROPEP

<222>(1)..(166)

<400>53

Ala Thr Gly Ala Leu Pro Gln Ser Pro Thr Pro Glu Ala Asp Ala Val

1 5 10 15

Ser Met Gln Glu Ala Leu Gln Arg Asp Leu Asp Leu Thr Ser Ala Glu

20 25 30

Ala Glu Glu Leu Leu Ala Ala Gln Asp Thr Ala Phe Glu Val Asp Glu

35 40 45

Ala Ala Ala Ala Ala Ala Gly Asp Ala Tyr Gly Gly Ser Ile Phe Asp

50 55 60

Thr Glu Thr Leu Glu Leu Thr Val Leu Val Thr Asp Ser Ser Ser Val

65 70 75 80

Glu Ala Val Glu Ala Ala Gly Ala Glu Ala Lys Val Val Ser His Gly

85 90 95

Met Glu Gly Leu Glu Glu Ile Val Ala Asp Leu Asn Ala Ala Asp Ala

100 105 110

Gln Pro Gly Val Val Gly Trp Tyr Pro Asp Ile His Ser Asp Thr Val

115 120 125

Val Leu Glu Val Leu Glu Gly Ser Gly Ala Asp Val Asp Ser Leu Leu

130 135 140

Ala Gly Ala Gly Val Asp Thr Ala Asp Val Lys Val Glu Ser Thr Thr

145 150 155 160

Glu Gln Pro Glu Leu Tyr

165

Claims

1.分泌的成熟多肽，其成熟后具有蛋白酶活性，该多肽在被表达时和成熟前含有异源前-区，该多肽：

(a)含有与SEQ ID NO：28；SEQ ID NO：33；SEQ ID NO：37；SEQ ID NO：41；SEQ ID NO：43或SEQ ID NO：45所示多肽成熟部分的氨基酸序列至少70％相同的氨基酸序列；

(b)含有与SEQ ID NO：1；SEQ ID NO：2；SEQ ID NO：25；SEQ ID NO：31；SEQ ID NO：32；SEQ ID NO：36；SEQ ID NO：40或SEQ ID NO：44所示多核苷酸编码的多肽的成熟部分的氨基酸序列至少70％相同的氨基酸序列；

(d)是(a)，(b)或(c)的等位基因变体；

(e)是(a)，(b)，(c)或(d)的片段。

2.根据权利要求1的多肽，其中异源前-区得自蛋白酶，优选前-区得自S2A或S1E蛋白酶，最优选它与SEQ ID NO：28，SEQ ID NO：30，SEQ ID NO：33，SEQ ID NO：37，SEQ ID NO：41，SEQ ID NO：43，SEQ ID NO：45，SEQ IDNO：47，SEQ ID NO：48，SEQ ID NO：49，SEQ ID NO：50，SEQ ID NO：51，SEQ ID NO：52或SEQ ID NO：53所示的前-区至少70％相同。

3.根据权利要求1或2的多肽，它是野生型多肽，野生型多肽的人工变体，经改组的多肽或蛋白质-经改造的多肽，其中与野生型相比，所述变体在C-末端添加了一个或多个氨基酸。

4.根据权利要求1-3中任一项的多肽，其中多肽C-末端的最后4个氨基酸中含有至少3个非-极性的或不带电的极性氨基酸。

5.根据权利要求3的多肽，其中一个或多个添加的氨基酸是非-极性的或不带电的。

6.根据权利要求5的多肽，其中一个或多个添加的氨基酸是Q，S，V， A或P中的一个或多个。

7.根据权利要求3的多肽，其中一个或多个添加的氨基酸选自：QSHVQSAP，QSAP，QP，TL，TT，QL，TP，LP，TI，IQ，QP，PI，LT，TQ，IT，QQ和PQ。

8.根据权利要求1-7中任一项的多肽，当其被表达和成熟前，含有异源分泌信号肽，当多肽被分泌时，所述信号肽从多肽上被裂解下来，优选异源分泌信号肽得自异源蛋白酶。

9.根据权利要求8的多肽，其中异源分泌信号肽含有与SEQ ID NO：2或SEQ ID NO：44的多核苷酸1-81所编码氨基酸序列的序列同一性至少为70％的氨基酸序列。

10.分离的多核苷酸，其编码权利要求1-9中任一项所限定的多肽。

11.重组表达载体或多核苷酸构建体，其含有权利要求10所限定的多核苷酸。

12.重组宿主细胞，其含有权利要求10所限定的多核苷酸，或权利要求11所限定的表达载体或多核苷酸构建体。

13.根据权利要求12的重组宿主细胞，其为芽孢杆菌属细胞。

14.转基因植物或植物部分，其含有权利要求10所限定的多核苷酸，或权利要求11所限定的表达载体或多核苷酸构建体。

15.转基因的非-人动物或其产物或其组件，其含有权利要求10所限定的多核苷酸，或权利要求11所限定的表达载体或多核苷酸构建体。

16.制备权利要求1-9中任一项所限定的多肽的方法，所述方法包括：(a)培养权利要求12或13所限定的重组宿主细胞，或权利要求14或15所限定的转基因植物或动物，以产生含有多肽的上清液，和任选(b)回收多肽。

17.动物饲料添加剂，其含有至少一种由权利要求1-9中任一项所限定的多肽；和

(a)至少一种脂溶性维生素，和/或

(b)至少一种水溶性维生素，和/或

(c)至少一种痕量矿物质。

18.动物饲料组合物，其粗蛋白含量为50至800g/kg，并含有至少一种由权利要求1-9中任一项所限定的多肽，或至少一种权利要求17所述的饲料添加剂。

19.组合物，其含有至少一种由权利要求1-9中任一项所限定的多肽，以及至少一种选自植酸酶(EC 3.1.3.8或3.1.3.26)；木聚糖酶(EC 3.2.1.8)；半乳聚糖酶(EC 3.2.1.89)；α-半乳糖苷酶(EC 3.2.1.22)；蛋白酶(EC 3.4.-.-)；磷脂酶A1(EC 3.1.1.32)；磷脂酶A2(EC 3.1.1.4)；溶血磷脂酶(EC 3.1.1.5)；磷脂酶C(3.1.4.3)；磷脂酶D(EC 3.1.4.4)和/或β-葡聚糖酶(EC 3.2.1.4或EC3.2.1.6)的其它酶。

20.使用至少一种由权利要求1-9中任一项所限定的多肽改善动物饲料的营养价值，增加动物饮食中可消化和/或可溶的蛋白质，增加动物饮食中蛋白质的水解程度，和/或处理植物蛋白质的方法，所述方法包括使动物饲料和/或用于动物饲料的组合物中包含多肽。

21.使用至少一种由权利要求1-9中任一项所限定的多肽的方法，所述方法包括使清洁剂配方中包含多肽。