CN1624122A

CN1624122A - 重组表达的羧肽酶b及其纯化

Info

Publication number: CN1624122A
Application number: CNA2004100980275A
Authority: CN
Inventors: S·格拉瑟; F·盖佩尔; T·柯施鲍姆; B·雷克塞尔; J·-P·塔尔霍菲; R·米勒; C·吉塞尔; H·埃克施泰因; E·沃尔夫
Original assignee: F Hoffmann La Roche AG
Current assignee: F Hoffmann La Roche AG; Roche Diagnostics GmbH
Priority date: 2003-12-05
Filing date: 2004-12-03
Publication date: 2005-06-08
Anticipated expiration: 2024-12-03
Also published as: DE602004025192D1; CN1311074C; JP2005168501A; CA2486195C; JP4411192B2; ATE455849T1; JP4964284B2; US20050142633A1; ES2337684T3; JP2010046074A; CA2486195A1

Abstract

本发明提供了一种生产来源于非动物宿主有机体的，具有来自前羧肽酶B酶原的羧肽酶B活性的蛋白的制备方法。在非变性条件下，由酶原活化得到羧肽酶B。尤其是，该活化是在避免前肽与活化的羧肽酶B酶的不必要的非共价结合的条件下进行的。

Description

重组表达的羧肽酶B及其纯化

技术领域

本发明涉及生物技术领域。更特别地，本发明涉及一种具有羧肽酶B活性的蛋白的无酶活性前体的生产和进一步加工。本发明一方面涉及一种具有羧肽酶B活性的蛋白的活化以及伴随的纯化。

背景技术

羧肽酶是一种水解C-末端肽键的酶。羧肽酶家族包括金属、丝氨酸、和半胱氨酸羧肽酶。根据其底物特异性，这些酶被称为羧肽酶A(裂解脂肪族残基)或羧肽酶B(裂解碱性氨基酸残基)。羧肽酶B(EC3.4.17.2)是一种催化从多肽的C-末端位置水解碱性氨基酸、赖氨酸、精氨酸、和鸟氨酸的酶：

羧肽酶B的前体为一种存在于绝大多数脊椎动物胰腺中的酶原或前酶原(参见Folk J.综述的Carboxypeptidase B，in：The Enzymes3，P.Boyer，Academic Press，NY，57，1971)。羧肽酶B可在胰蛋白酶消化产物的进一步降解中发挥功效，其对该底物的特异性作用非常相似于羧肽酶A对于胰凝乳蛋白酶产物的特异作用。羧肽酶B同样具有酯酶活性，这与酶的金属含量有关(Folk J.&Gladner，J.：BiochimBiophys Acta(1961)48，139-47；Zisapel，N.&Sokolovsky，M，Eur J Biochem(1975)54，541-7)。

“酶原”是指酶的无活性前体。换句话说，酶原是一种具有酶活性的蛋白，比如一种具有羧肽酶B活性的蛋白的无活性前体。许多具有酶活性的蛋白是以这种无活性前体的方式合成，并随后通过剪切掉一个或一些特定肽键来活化的。通过特定蛋白水解引发的酶和其他蛋白的活化常常发生在生物系统中。例如：(a)存在于皮肤和骨骼中的纤维蛋白胶原衍生于可溶性前体前胶原。(b)一些蛋白激素以无活性前体的形式合成。例如，胰岛素是通过蛋白水解除去肽段的方式而衍生于前胰岛素的。(c)水解蛋白的消化酶在胃和胰腺中是以酶原的形式合成和分泌的。(d)血液凝集是通过级联的蛋白水解活化来介导的，这保证了对损伤的快速而放大的应答。

在体内，羧肽酶B的酶原，也就是“前羧肽酶B”，在胰腺细胞内以前体蛋白的形式被翻译，该前体蛋白被命名为“前原羧肽酶B”。

前原羧肽酶B包括一种位于其N-末端的信号肽。前原羧肽酶B的氨基酸序列描述了初级翻译产物。所述的信号肽引导前原羧肽酶B多肽进入胰腺细胞的分泌途径。在分泌过程中，所述的引导肽通过蛋白水解的方式被切除，从而将前原羧肽酶B转化成前羧肽酶B。

前羧肽酶B缺乏酶活性。通常在小肠内发生体内活化。胰蛋白酶剪切前羧肽酶B，从而产生无酶活性的前肽和具有蛋白水解活性的羧肽酶B酶。

作为前原羧肽酶的一个例子，如Clauser E.等，J.Biol.Chem.1988，Vol.263，17837-45中所公开的那样，SEQ ID NO：1描述了鼠前原羧肽酶B的氨基酸序列。相应地，前原羧肽酶B的前13个氨基酸表示信号肽，并且随后的95个氨基酸构成了前肽。其活化产物，也就是活化的鼠羧肽酶B酶含有307个氨基酸，其计算分子量为35228Da。

也可采用胰蛋白酶在体外将前羧肽酶B活化形成羧肽酶B。通过分析方法，如SDS凝胶电泳和Ventura等在J.Biol.Chem.(1999)274(28)，19925-33中记载的反相HPLC，证实了前肽和酶部分的共形成。

在各种条件下的体外活化实验表明，虽然具有蛋白酶活性的羧肽酶B酶易于产生，但在非变性条件下所述前肽仍然以非共价的方式结合至大量的羧肽酶B分子上。当对前肽和酶的复合体采用变性条件时可观察到这种情况。因此，迄今为止，非变性纯化方法，特别是阴离子交换色谱不能为从羧肽酶B酶的分子上分离非共价结合的前肽提供有效的途径。

由于其对C-末端碱性氨基酸的高度特异性，已经发现羧肽酶B具有广泛的用途，例如在末端基团分析中用于序列确定。不过，最主要的经济重要性为涉及蛋白水解加工的工业应用。尤其是，羧肽酶B用于涉及蛋白水解酶切前胰岛素以及产生用于医药用途的胰岛素的生产过程。

考虑到胰岛素作为一种药物产品，由于以非共价方式结合至羧肽酶B酶的羧肽酶B前肽的特性从而引起了一特殊的问题。在所述胰岛素的生产过程中，在蛋白水解酶切前胰岛素之后，胰岛素片段在变性条件下被纯化。作为一种结果，很有可能羧肽酶B的前肽与胰岛素一起被共同纯化。在这种情况下，从胰岛素分子中分离羧肽酶B的前肽可能成为一项繁重的工作从而同时有可能减少纯化的胰岛素的终产量。

从猪胰腺中纯化的商业化的羧肽酶B有可能不完全地丧失其他蛋白水解酶的活性。此外，如同大多数动物来源的产物的情况那样，猪羧肽酶B可能含有感染物质，如病毒、朊病毒、或其他具有损害人体健康潜能的生物活性组分。因此，理想的是从其他来源获得羧肽酶B。此外，理想的是其他来源的羧肽酶B实质上不含前肽。

本领域已知，可以通过重组方式在转化的宿主有机体中产生羧肽酶B并对其进行纯化(例如，Ventura等J.Biol.Chem.(1999)274(28)，19925-33)。

WO0151624公开了在甲基营养酵母Pichia pastoris中猪前羧肽酶B的重组表达。随后通过胰蛋白酶酶切的方式活化酶原，第一步纯化步骤包括疏水层析。随后添加大豆胰蛋白酶抑制剂，通过Q-琼脂糖凝胶层析进一步纯化活化的酶。WO0151624的纯化方法涉及多个步骤并伴随着羧肽酶B产物的损失。此外，还需从产物中分离大豆胰蛋白酶抑制剂和羧肽酶B前肽。

DE19915938公开了在甲基营养巴氏毕赤酵母(Pichia pastoris)中组氨酸标记的人前羧肽酶B的重组表达。利用亲和层析凭借组氨酸标记的优点来纯化该产物。随后，利用胰蛋白酶活化前羧肽酶B并通过添加大豆胰蛋白酶抑制剂来终止该活化反应。通过能除去颗粒大小超过约30000Da的膜的过滤，将羧肽酶B与胰蛋白酶、前肽、抑制剂以及在纯化过程中产生的其他片段分开。不过，由于羧肽酶B酶的分子量为约37000Da，可预见到依赖于所采用膜上的孔的大小分布，过滤步骤可造成一定的损耗。此外，由于活化步骤施用于溶解的酶原，因此需要进一步将前肽与羧肽酶B酶分开。

WO9623064中公开了在E.coli中的鼠前羧肽酶B的重组表达。产生了非溶解性的前羧肽酶B的包涵体。该酶原被复性并随后被进一步纯化。针对溶解的酶原进行活化步骤，因此需要进一步将前肽与羧肽酶B酶分开。由于变性/复性步骤，采用这种方法获得的羧肽酶B酶的产量也相对较低。

根据本发明人所掌握的现有知识，目前没有已知的区分活化的羧肽酶B和非活化形式的特定方法。

发明内容

本发明要解决的问题之一是提供一种从酶原中生产具有羧肽酶B活性的蛋白的替代方法，其中避免了前肽以非共价的方式结合于具有羧肽酶B活性的蛋白上。本发明要解决的另一问题是在活化步骤之后，提供一种在非变性条件下将具有羧肽酶B活性的蛋白与前肽和残基酶原分离的替代方法。

根据本发明，提供了一种生产具有羧肽酶B活性的蛋白的方法，其包括如下步骤：(a)提供一种含有编码由N-末端与组氨酸标记融合的大鼠前羧肽酶B和一信号肽构成的前体蛋白的核苷酸序列的载体，由此任选地在组氨酸标记和信号肽之间或在组氨酸标记和大鼠羧肽酶B之间插入一间隔序列；(b)采用该载体转化一种微生物宿主有机体；(c)在含有营养物和碳源的生长培养基中培养该微生物宿主有机体，由此微生物宿主有机体表达前体蛋白并将组氨酸标记的前羧肽酶B分泌至生长培养基中；(d)把在步骤(c)的生长培养基中的分泌的组氨酸标记的前羧肽酶B固定在能结合组氨酸标记的颗粒状的金属螯合物亲和基质上，并冲洗颗粒状的金属螯合物亲和基质，从而组氨酸标记的前羧肽酶B被固定；(e)在一种含有胰蛋白酶的缓冲液中温育步骤(d)中的带有固定化的组氨酸标记的前羧肽酶B的颗粒状的金属螯合物亲和基质，从而通过蛋白水解方式酶切前羧肽酶B部分并释放具有羧肽酶B活性的蛋白至液相中，其中组氨酸标记的前肽部分被固定；(f)从颗粒状的金属螯合物基质中分离含有具有羧肽酶B活性的蛋白的液相，由此组氨酸标记的前肽部分被固定；和(g)从步骤(f)的液相中纯化具有羧肽酶B活性的蛋白。

在本发明的说明书中，某些术语采用了其特定的含义，或首次被定义。为了本发明的目的，在存在这种定义的情况下，并且排除了当这些定义与如下定义相矛盾或部分矛盾的情况下，如下术语采用了其本领域通用的定义。在定义相矛盾的情况下，术语的含义首先采用如下的定义。

氨基酸的识别采用三字母缩写和氨基酸的单字母表，例如，Asp D表示天门冬氨酸，Ile表示异亮氨酸，Thr T表示苏氨酸，Leu L表示亮氨酸，Ser S表示苏氨酸，Tyr Y表示酪氨酸，Glu E表示谷氨酸，Phe F表示苯丙氨酸，Pro P表示脯氨酸，His H表示组氨酸，Gly G表示苷氨酸，Lys K表示赖氨酸，Ala A表示丙氨酸，Arg R表示精氨酸，Cys C表示半胱氨酸，Trp W表示色氨酸，Val V表示缬氨酸，GlnQ表示谷氨酰氨，Met M表示蛋氨酸，Asn N表示天门冬酰胺。在一氨基酸序列中的特定位点的氨基酸由其三字母缩写和编号来表示。例如，参考天然大鼠前原羧肽酶B的氨基酸序列SEQ ID NO：1，“His 14”表示位于氨基酸位置14的组氨酸残基。

本发明的说明书和权利要求书中所采用的术语“包括”表示“包括，但不必局限于”。

术语“前体蛋白”是指包括其位于N-末端的信号肽的初级翻译产物。在本发明的上下文中，“前体蛋白”为酶原的前体，即前羧肽酶B。前体酶是由前体蛋白的翻译后加工而产生的。

“信号肽”是一种存在于来源于可分泌蛋白的前体蛋白形式中的可切除的氨基酸信号序列。蛋白转运穿过细胞膜，即“分泌”，一般具有一约15至30个氨基酸长度的富含疏水氨基酸的N-末端序列。有时，在穿过细胞膜的过程中，该信号序列被信号肽酶酶切(Alberts，B.，Johnson，A.，Lewis，J.，Raff，M.，Roberts，K.，Walter，P.(eds)，Molecular Biology of the Cell，第四版，20002，GarlandScience Publishing)。

本领域熟练技术人员已知信号肽的许多来源，其可以包括，例如，来源于啤酒酵母或其类似物的α-因子信号肽的氨基酸序列。一般地基本上任何分泌蛋白的前体蛋白的N-末端都可以为适合于本发明所用的信号肽的潜在来源。一信号肽也可以是包括两个信号肽的二分体，其引导前体蛋白到达第一个和第二个细胞区域。在分泌途径中，二分的信号肽被逐步地剪切。为此，一优选的例子是来源于啤酒酵母的α-因子的前导肽(Waters等，J.Biol.Chem.263(1988)6209-14)。一更优选的例子为由SEQ ID NO：3的1至255位核苷酸序列编码的氨基酸序列。

具有分泌的N-末端信号肽的前体蛋白被引导进入“分泌途径”。分泌途径包括翻译后的加工过程并最终导致前羧肽酶B的分泌。在本发明中应当理解由甲基营养酵母菌株分泌的蛋白已经通过了分泌途径。

术语“翻译后加工”表示为了在细胞内或细胞外区域获得蛋白，使前体蛋白所经受的修饰步骤。在本发明的上下文中，前原羧肽酶B的翻译后加工产生了分泌的前羧肽酶B。

前羧肽酶B的蛋白水解酶切，如被胰蛋白酶酶切，则被称为“活化”。本领域熟练技术人员已知根据蛋白水解作用分子作用导致了活化。胰蛋白酶酶切前羧肽酶B，从而产生了无酶活性的“前肽”或“前肽部分”和蛋白水解酶活性的“酶部分”，也就是羧肽酶B。举例说明，鼠前羧肽酶B的酶部分，也就是鼠前羧肽酶B多肽的“前羧肽酶B部分”为SEQ ID NO：4的191至497位的氨基酸序列的多肽。

前羧肽酶B的前肽一般包括95个氨基酸。同时已知通过胰蛋白酶对前羧肽酶B的蛋白水解酶切不仅活化了羧肽酶B还形成了羧肽酶B的胰蛋白酶片段。

“甲基营养酵母”被定义为能利用甲醇作为其碳源的酵母。该术语还包括其实验室菌株。在甲基营养酵母菌株为营养缺陷型，并且因此需要补充辅助的含碳物质，例如在该甲基营养酵母菌株无法合成足够量的组氨酸而需要补充组氨酸的情况下，这种辅助物质被看作是营养物质而非碳源。

“载体”被定义为可可包括，例如携带和保持本发明的DNA片段的DNA，其包括如噬菌体和质粒。遗传工程领域的熟练技术人员应当能理解这些术语的含义。术语“表达盒”是指编码前体蛋白的核苷酸序列，它与一启动子和一终止子可操纵地相连接。对于含有表达盒载体来说，术语“载体”和“表达载体”是同义词。

“转化”是指将DNA导入有机体使得该DNA作为染色体外的元件是可复制的或通过染色体整合的方式是可复制的。

术语“游离体”是指由一系列的基因组成的一种遗传物质单位，其有时独立地存在于宿主细胞之中，有时被整合至细胞染色体，与染色体一起进行自我复制。一种游离体的例子为图1的载体。

术语“表达”和其动词“表达”表示DNA序列的转录和/或转录的mRNA在宿主有机体中的翻译从而产生前体蛋白，即不包括翻译后的步骤。

当至少一部分核苷酸序列，或其互补序列可被直接翻译来提供肽或蛋白的氨基酸序列时，或当分离的核苷酸序列可以单独使用或作为表达载体的一部分使用，在原核宿主细胞或真核宿主细胞中用于体外表达肽或蛋白时，一种核苷酸序列“编码”了一种肽或蛋白。

所有的核苷酸序列均以从5’端(表示起始处)到3’端的方向书写，也称为从5’至3’的方向。

“启动子”为刺激转录的调节核苷酸序列。遗传工程领域的熟练技术人员应当可以理解这些术语的含义。如同启动子一样，一“启动子元件”调控转录不过组成了一个较大的启动子序列的亚片段。

术语“可操纵地连接的”是指在一个单一的载体上的两个或多个核酸片段的联系从而一个片段的功能受到另一个片段的影响。例如，一个启动子可操纵地与一编码序列连接，也就是一种编码一种蛋白或一种前体蛋白的核苷酸序列，当它能影响编码序列的表达时，即该编码序列在该启动子的转录调控之下。

“肽键”是介于两个氨基酸之间的共价键，其中一个氨基酸的α-氨基基团与另一个氨基酸的α-羧基基团键合。

发明详述

本发明的第一个实施方案为一种生产具有羧肽酶B活性的蛋白的方法，包括如下步骤：a)提供一种含有编码由N-末端与组氨酸标记融合的大鼠前羧肽酶B和一信号肽构成的前体蛋白的核苷酸序列的载体，由此任选地在组氨酸标记和信号肽之间或在组氨酸标记和大鼠羧肽酶B之间插入一间隔序列；(b)采用该载体转化一种微生物宿主有机体；(c)在含有营养物和碳源的生长培养基中培养该微生物宿主有机体，其中微生物宿主有机体表达前体蛋白并将组氨酸标记的前羧肽酶B分泌至生长培养基中；(d)把步骤(c)的生长培养基中的分泌的组氨酸标记的前羧肽酶B固定在能结合组氨酸标记的颗粒状的金属螯合物亲和基质上，并冲洗颗粒状的金属螯合物亲和基质，从而将组氨酸标记的前羧肽酶B固定；(e)在一种含有胰蛋白酶的缓冲液中温育步骤(d)中的带有固定化的组氨酸标记的前羧肽酶B的颗粒状的金属螯合物亲和基质，从而通过蛋白水解方式酶切前羧肽酶B部分并释放具有羧肽酶B活性的蛋白至液相中，由此组氨酸标记的前肽部分被固定；(f)从颗粒状的金属螯合物基质中分离含有具有羧肽酶B活性的蛋白的液相，由此组氨酸标记的前肽部分被固定；和(g)从步骤(f)的液相中纯化具有羧肽酶B活性的蛋白。

当构建用于转化微生物宿主菌株，如甲基营养酵母菌株的载体时，一些分子克隆技术将需要把连接或间隔序列添加至编码前体蛋白功能元件的核苷酸序列中。例如当包括前体蛋白的功能元件的编码序列的DNA片段被限制性内切酶从克隆载体上切下，产生一长于编码序列的片段时，也可以产生间隔序列。为什么连接或间隔核苷酸序列会出现的其他原因也是可能的。基于这种考虑，编码前体蛋白的功能元件的核苷酸序列编码(a)信号肽，(b)组氨酸标记和(c)前羧肽酶B部分。因此，由于这种连接核苷酸序列的存在，另外的氨基酸，即“间隔序列”，可以被插入前体蛋白的任意两个功能元件的连接点处。一为此的实施例是在SEQ ID NO：3和SEQ ID NO：4的86和87氨基酸位置处由丝氨酸残基和丙氨酸残基组成的间隔序列。在本发明的前体蛋白中优选的是由不超过4个氨基酸残基组成的间隔序列，更优选为由两个氨基酸残基组成的间隔序列。编码间隔序列的连接核苷酸序列的插入在某种意义上是“任选的”，这基于所述的插入将有助于分离的编码两个功能元件的核苷酸序列的连接，形成编码前体蛋白或其前体的核苷酸序列。

组氨酸标记是一种优选含有6个连续的组氨酸的氨基酸序列。由于组氨酸代表了基本的部分，还有极少的另外的氨基酸包含在组氨酸标记部分中。重要的是，本发明中采用的组氨酸标记不给分泌蛋白增加另外的相关的胰蛋白酶酶切位点。因此，在固定化的组氨酸标记的前羧肽酶B的柱上活化期间的条件下，酶原的胰蛋白酶酶切位点仍然是优选的酶切位点。在固定化的组氨酸标记的前羧肽酶B的柱上活化后，该前肽仍然通过组氨酸标记结合于颗粒状的金属螯合物基质上。

利用固定化的金属亲和层析有助于分泌的组氨酸标记的前羧肽酶B的纯化。该方法是用于纯化含有由组氨酸残基构成的短亲和标记(组氨酸标记)的重组蛋白的一种广泛采用的方法。固定化的金属亲和层析(记载于Porath，J.等，Nature 258(1975)598-599)基于固定在颗粒状的金属螯合物亲和基质上的过渡金属离子(Co²⁺，Ni²⁺，Cu²⁺，Zn²⁺)与特定氨基酸侧链的相互反应。组氨酸是一种显示出与固定化的金属离子基质之间有最强相互反应的氨基酸，因为组氨酸咪唑环上的电子供体基团很容易与固定化的过渡金属形成配位键。含有连续的组氨酸残基序列的肽能有效地保留于螯合颗粒状金属的亲和柱上。在冲洗基质材料后，含组氨酸序列如组氨酸标记的肽可很容易地通过调整柱缓冲液的低pH(酸性)或通过加入游离的咪唑来洗脱。

纯化带有组氨酸残基的蛋白的方法首次在Hochuli，E.等，J.Chromatogr.411(1987)177-184中记载。该文献记载了一种用于金属螯合物亲和层析的次氮基三乙酸吸附剂(NTA)。NTA树脂形成了四配位体螯合物，并且特别适用于具有6个配位键数目的金属离子，因为其中两价保留用于对生物高分子的可逆结合。具有组氨酸标记的二氢叶酸还原酶可以采用如Houchuli，E.等，Bio/Technology 6(1988)1321-1325中所述的Ni²⁺-NTA基质成功地进行纯化。该系统的纯化效率取决于组氨酸标记的长度和溶剂系统。当该系统在变性条件下能有效地对His6-标记的蛋白进行工作时，在生理条件下His3-标记的蛋白可被有效地纯化。不过，His6-标记的蛋白可在低或高盐缓冲液中在非变性条件下与Ni²⁺-NTA基质结合。在结合后，可以通过梯度为0.8至250mM的咪唑来洗脱靶蛋白。采用低浓度的咪唑(如0.8mM)洗脱可用于降低宿主蛋白与组氨酸的非特异性结合。

在本发明中，固定化步骤优选地在存在咪唑的条件下进行。在这些条件下，发现其他含组氨酸的蛋白的非特异性结合减少了。基于这种考虑，优选的咪唑的浓度在0.01mM至1mM范围内。

用于纯化组氨酸标记的蛋白的另一种开发的材料是TALON。其含有与固相载体树脂偶联的羧甲基天冬氨酸盐(Co²⁺-CMA)。据报道，TALON比Ni²⁺-NTA树脂显示出更少的非特异性的蛋白结合，从而导致了更高的洗脱产物纯度(Chaga，G.等，Biotechnol.Appl.Biochem.29(1999)19-24；Chaga，G.Et al.，J.Chromatogr.A 864(1999)257-256)。

组氨酸标记通常位于重组蛋白的N-或C-末端。标记的最理想的位置是蛋白特异性的。采用组氨酸标记的纯化已在许多表达系统中被成功地实施了，这些系统包括细菌(Chen，B.P.&Hai，T.，Gene 139(1994)73-75；Rank，K.B.等，Protein Expr.Purif.22(2001)258-266)、酵母(Borsing，L.等，Biochem.Biophys.Res.Commun.240(1997)586-590；Kaslow，D.C.&Shiloach，J.，Bio/Technology 12(1994)494-499)，哺乳动物细胞(Janknecht，R.等，Proc.Natl.Acad.Sci.USA 88(1991)8972-8976；Janknecht，R.&Nordheim，A.，Gene 121(1992)321-324)，和病毒感染的昆虫细胞(Kuusinen，A.等，Eur.J.Biochem.233(1995)720-726；Schmidt，M.等ProteinExpr.Purif.12(1998)323-330)。有超过100个组氨酸标记的蛋白结构被保藏于蛋白质数据库中。将其镶嵌现象和衍射与天然蛋白的相比较，携带有组氨酸标记的蛋白仅稍有不同(Hakansson，K.等ActaCrystallogr.D Biol.Crystallogr.56(2000)924-926)。原则上，不排出组氨酸标记干涉蛋白活性的可能(Wu，J.&Filutowicz，M.，Acta Biochim.Pol.46(1999)591-599)，但是组氨酸标记的相对小的尺寸和电荷保证了蛋白活性几乎不受影响。将组氨酸标记移至相对的末端(Halliwell，C.M.等，Anal Biochem.295(2001)257-261)或在变性条件下进行纯化常常可以解决这种问题。

在生长培养基中分泌的组氨酸标记的前羧肽酶B被固定于能结合组氨酸标记的颗粒状的金属螯合物亲和基质上。例如，组氨酸标记的前羧肽酶B可被吸附至固定于螯合金属的树脂上的金属颗粒上。如上文所述，这种树脂是本领域技术人员所公知的。一种优选的颗粒状的金属螯合物亲和基质为覆盖有镍-次氮基三乙酸(Ni-NTA)的层析材料。基于这种考虑，本领域的熟练技术人员知道EP0253303、EP0282042、EP1069131。Qiagen使QIA表达纯化系统商业化，其可用于固定化步骤。该家公司还提供了一种可用于生产组氨酸标记的融合多肽的表达载体(pQE)。基于这种考虑，本领域的熟练技术人员同样也知道US5284933和US5310663。

具有金属中心的蛋白的纯化可能需要特别适应的纯化方法，因为该金属可以被NTA吸附。在厌氧条件下的纯化也需要特别适应的纯化方法，因为Ni²⁺-NTA被还原了。虽然如此，具有组氨酸标记的前体蛋白的纯化是目前最常采用的方法之一。

羧肽酶B含有Zn²⁺作为辅因子。由于这种原因，除了采用Ni²⁺-NTA作为层析纯化的基质之外，优选采用负载了Zn²⁺的螯合金属的亲和基质。从而可以避免任何偶然的和不希望的Ni²⁺替代Zn²⁺辅因子现象的发生。

因此更优选的颗粒状的金属螯合物亲和基质是负载了Zn²⁺的(即固定了Zn²⁺离子的)StreamlineTM螯合吸附剂(AmershamBioscences)。StreamlineTM螯合吸附剂是以琼脂糖为基础的。高度交联的琼脂糖基质的大孔结构对大分子物质，如蛋白质有非常好的结合能力，并具有很高的化学和机械稳定性。高的机械稳定性是基质的一种非常重要的特性，其可用于膨胀床层析柱中以减少当颗粒在膨胀床中自由移动时的摩擦效应。仅由有机材料制成的颗粒只有有限的密度，因此为了达到所需的高沉降速度颗粒必须具有很大的直径。这种大的颗粒直径导致了长扩散的路径长度，这导致了相当大的质量迁移阻力，从而降低了生产率。因此，StreamlineTM吸附剂以含有比有机材料密度更大的内核物质的复合颗粒为基材。可以设计这种颗粒从而在合理的颗粒大小时其沉降速度仍然很高。

膨胀床吸附是一种简单的通过操作，其中理想的蛋白从粗的含颗粒的原料中被纯化得到，并且无须对原料进行澄清、浓缩和初步纯化。吸附床的膨胀在吸附剂颗粒间产生了一定距离，也就是增加了床中的空隙率(空隙体积部分)，其允许细胞、细胞碎片和其他颗粒在原料加样过程中无障碍地通过。

通过向柱中施加向上的液体流来膨胀和平衡颗粒状的金属螯合物亲和基质(如StreamlineTM)吸附剂。由于在颗粒的沉积速度和向上的液体流动速度之间达到平衡，当吸附剂颗粒悬浮于平衡液中时，一种稳定的流化床就形成了。在这期间柱衔接头位于柱的上部分。粗的、未澄清的原料，即含有分泌的组氨酸标记的前羧肽酶B和微生物宿主有机体的培养基被加样于具有如膨胀和平衡期间所采用的相同的向上液流的膨胀床中。通过组氨酸标记与吸附剂的结合使组氨酸标记的前羧肽酶B被固定，而细胞碎片、细胞、颗粒和污染物则无障碍地通过。利用向上的液流将弱结合的物质，如残留的细胞、细胞碎片和其他类型的颗粒物质从膨胀床中冲洗出来。当弱结合的物质被从床中冲洗出来后，通过利用胰蛋白酶对组氨酸标记的前羧肽酶B进行柱上酶切而活化，从而保持了向上的液流模式。羧肽酶B被释放并从柱中洗脱下来。流通物中含有浓度增加、澄清、部分纯化的靶蛋白，并备用于填充床以进行进一步的纯化。

如何使用优选的颗粒状的金属螯合物亲和基质，如StreamlineTM螯合吸附剂(Amersham Biosciences)和如何设定、优化和操作膨胀床层析在Pharmacia Biotech手册“ Expanded bed adsorption，principles and methods”中(ISBN 91-630-5519-8)进行了进一步的详细描述。其中也记载了如何进行柱再生的常规方法。

大量的微生物宿主有机体可用于本发明。主要的要求是所述的微生物宿主有机体经工程改造和培养使得它可以分泌组氨酸标记的前羧肽酶B至生长培养基中。在一优选的实施方式中，所述的微生物宿主有机体为原核生物。基于这种考虑，本领域的熟练技术人员熟知各种用于基于细菌如大肠杆菌、芽孢杆菌、葡萄球菌的重组表达和分泌的商业上可购得的细菌系统。在一更优选的实施方式中，微生物宿主有机体是一种微生物真核生物。非常优选的是酵母物质。在一更加优选的实施例中，所述的微生物有机体为甲基营养酵母菌株。

因此，在本发明的另一实施方式中，组氨酸标记的大鼠前羧肽酶B是通过采用甲基营养酵母作为非动物宿主有机体的重组方式来生产的。甲基营养酵母具有甲醇利用所必需的生物化学途径，并根据细胞形态核生长特性将其分为4个属：Hansenula，Pichia，Candida，和Torulopsis。最高度发展的甲基营养酵母系统利用巴氏毕赤酵母Pichia pastoris(Komagataella pastoris)和多形汉逊酵母Hansenulapolymorpha(Pichia angusta)。

酵母中异源蛋白的表达记载于US5618676、US5854018、US5856123和US5919651中。

酵母有机体产生了许多在细胞内合成但在细胞外表现功能的蛋白。这种胞外蛋白被称为分泌蛋白。最初这种分泌蛋白在细胞内以前体和含N-末端信号肽的前体蛋白形式在细胞内表达，所述的信号肽保证有效地引导表达的产物进入细胞分泌途径，穿过内质网膜。所述的信号肽通常在易位过程中从目的产物中切下。通过信号肽酶以蛋白水解方式有效地进行酶切。信号肽酶识别和酶切信号肽的一种特定的氨基酸亚序列。这种亚序列被称为信号肽酶切位点。一旦进入分泌途径，所述的蛋白被转运至高尔基体上。所述蛋白从高尔基体上被分配至质膜、溶酶体和分泌泡中。

与胞内蛋白相比，分泌的蛋白面对了各种不同的环境条件。分泌途径的部分步骤是稳定变性的胞外蛋白。因此，通过了酵母的分泌途径的前体蛋白经历了特定的翻译后加工步骤。例如，所述的加工可以包括二硫键的产生从而形成分子内交联。此外，蛋白的特定氨基酸可以被糖基化。

许多的方法已经被建议用于在酵母中表达和分泌酵母的异源蛋白。EP0116201记载了一种方法，通过该方法酵母的异源蛋白经装载有编码目的蛋白的DNA、一种信号肽和一表现为信号肽酶切位点的肽的表达载体来转化。制备转化的有机体培养物并进行培养，并从培养基中回收蛋白。为了在酵母细胞中应用，一种合适的信号肽被发现为来源于酿酒酵母(Saccharomyces cerevisiae)的α-因子信号肽(US4870008)。

在分泌过程中，酵母酶KEX-2是识别赖氨酸-精氨酸序列作为其前体蛋白的酶切位点的信号肽酶。KEX-2在目的蛋白序列的连接处进行酶切。结果是，目的基因产物被释放并不含引导部分，即前体蛋白的信号肽。KEX-2内切蛋白酶原始来源于酿酒酵母，在其中它特异性地作用于配对型α-因子的前体和一种杀伤因子(Julius，D.等，Cell37(1984)1075-1089)。甲基营养酵母菌株如巴氏毕赤酵母具有与酿酒酵母相同的KEX-2型蛋白酶(类似的作用和功能)(Werten，M.W.等，Yeast 15(1999)1087-1096)。

一作为高水平重组蛋白表达的宿主、以实施例方式记载的良好构建的甲基营养酵母菌株为巴氏毕赤酵母(US4683293、US4808537、US4812405、US4818700、US4837148、US4855231、US4857467、US4879231、US4882279、US4885242、US4895800、US4929555、US5002876、US5004688、US5032516、US5122465、US5135868、US5166329、WO0056903)。在缺乏葡萄糖的条件下，巴氏毕赤酵母采用甲醇作为碳源，这同时也是甲基营养有机体的一种证明。以SEQ IDNO：5表示的乙醇氧化酶(AOX1)启动子调控了乙醇氧化酶的表达，这催化了甲醇代谢的第一步。典型的，在甲醇诱导的细胞中，可溶性蛋白总数的30％为乙醇氧化酶。好几种毕赤酵母表达载体携带了AOX1启动子并采用甲醇来诱导目的异源蛋白的高水平表达。表达构建体同样被整合至巴氏毕赤酵母的基因组中，从而产生了转化的遗传稳定的宿主。

采用编码包括信号肽或具有信号肽酶切位点的信号肽和目的蛋白的异源前体蛋白的表达载体，甲基营养酵母菌株，如巴氏毕赤酵母菌株可以被操作从而可以分泌目的蛋白产品至生长培养基中，从培养基中可以纯化该分泌蛋白。其可有助于生产编码拥有实质上不同的密码子应用的前体蛋白的核苷酸序列。

就编码的前羧肽酶B多肽来说，包括于SEQ ID NO：3中的核苷酸序列不同于以前公开的核苷酸序列如SEQ ID NO：1，这是由于遗传密码子的简并性造成的。SEQ ID NO：3的286至1497位核苷酸序列编码了与SEQ ID NO：1的40至1248位核酸所编码的相同的多肽。不过，SEQ ID NO：3掺入了两个氨基酸的交换，即Lys201Asn和Arg329Asp。这些氨基酸的交换同样也记载于WO9623064中。术语“简并密码”表示在遗传密码中一种特定的氨基酸可采用两种或更多的不同密码子来编码。简并性的发生是由于有64种可能的碱基三联体，其中3种用于编码终止信号，而剩下的61种用于编码仅有的20种不同的氨基酸的这样一个事实。

从而，可以根据宿主所采用的特定密码子的频率选择密码子来增加其中发生在特定酵母表达宿主的前体蛋白的表达比率。作为实质上改变编码前体蛋白的核苷酸序列，而不改变编码的氨基酸序列的核苷酸序列的其它原因，包括RNA转录子的产生，其中所述的转录子比天然存在的序列产生的转录子具有更理想的特性如更长的半衰期。SEQ IDNO：3的核苷酸序列是一种采用这种方式优化的编码序列的例子。

采用一种编码前体蛋白的有能力表达的载体，即可操纵地与一启动子或启动子元件和终止子或终止子元件相连的，以及和有效翻译所需的序列相连的，采用该载体转化所述的宿主有机体并挑选转化体。随后根据分泌至培养基中的重组蛋白的产量来分析转化体。挑选分泌最多量的重组蛋白的转化体。因此筛选得到分泌最多量的组氨酸标记的前羧肽酶B的转化体。

另一方面，表达的产量还依赖于目的产物的正确靶向，也就是说通过信号肽将前体蛋白靶向酵母的分泌途径。一信号肽的例子为在SEQID NO：3中的1至255位编码的来源于酿酒酵母的α-因子信号肽。另外，可通过增加编码目的蛋白的基因的量来增加表达产量，如扩大宿主有机体中的表达构建体的拷贝数目。实现这个目标的一种方法是多倍转化编码目的产物的表达载体。向宿主有机体中导入编码目的蛋白的基因的方式是采用第一和第二表达载体，其中第二表达载体是基于与第一表达载体所采用的选择性标记不同的选择性标记。当宿主有机体已携带了第一表达载体的多个拷贝时，编码相同目的产物的第二表达载体仍可导入宿主中(US5324639；Thill，G.P.，等，Positive andNegative Effects of Multi-Copy Integrated Expression in Pichiapastoris，International Symposium on the Genentics ofMicroorganisms 2(1990)，pp.477-490；Vedvick，T.，等，J.Ind.Microbiol.7(1991)197-201；Werten，M.W.，等，Yeast15(1999)1087-1096)。

前羧肽酶B的分泌引导融合蛋白至细胞质外区域，从那里它扩散到培养基中。因此，在本发明一种优选实施方式中，甲基营养酵母在液体培养基中生长并分泌前羧肽酶B至液体生长培养基中，也就是液体培养基中。这允许通过，如膨胀床色谱技术非常有效地将酵母的生物质与重组蛋白分开。其结果是，从酵母来源的有机体中纯化得到的前羧肽酶B可以有效地排除其他不理想的酶活性。

就在优选实施例中甲基营养酵母菌株转化的载体来说，本领域熟练技术人员熟知各种能允许携带含有一种被称作“组氨酸标记”、“(多聚)组氨酸标记”、或“组氨酸-标记”的融合多肽构建体的表达载体。在本发明的优选蛋白中，一种氨酸标记融合至前羧肽酶B多肽的N-末端。该组氨酸标记总共包括六个连续的组氨酸残基。基于此，本领域的熟练技术人员将注意到前羧肽酶B多肽的N-末端氨基酸也是组氨酸。因此，在标注的编码前体蛋白的核苷酸序列中，存在着融合的编码序列中的重叠，其中组氨酸标记的最后一个组氨酸的密码子也代表前羧肽酶B部分的第一个组氨酸。

在活化后，即胰蛋白酶对固定化的组氨酸标记的前羧肽酶B的酶切，组氨酸标记的多肽部分保持与颗粒状的金属螯合物亲和基质的结合。活化的羧肽酶B被释放并在步骤(f)中被从颗粒状的金属螯合物亲和基质上分离下来。因此，从液相中分离的颗粒状的金属螯合物亲和基质同时也使前肽与羧肽酶B酶分离。通过这种方法，也避免了前肽与羧肽酶B的非共价结合。

优选地，载体包括一种编码由大鼠前羧肽酶B和信号肽构成的前体蛋白的核苷酸序列，其中所述的前羧肽酶B的N-末端与组氨酸标记融合，由此任选地将一间隔序列插入组氨酸标记和信号肽之间。更优选的大鼠前羧肽酶B的氨基酸序列为SEQ ID NO：3的第14至415位的氨基酸序列。同时还优选，所述的信号肽含有一信号肽酶的酶切位点，其位于组氨酸标记附近或间隔序列附近。非常优选所述的表达前体蛋白的氨基酸序列为SEQ ID NO：4的氨基酸序列。更优选编码大鼠前羧肽酶B的核苷酸序列为SEQ ID NO：3的第286至1497位的核苷酸序列。进一步优选编码前体蛋白的核苷酸序列是在SEQ ID NO：3中的核苷酸序列。更加优选编码前体蛋白的核苷酸序列与启动子或启动子元件可操纵地连接。

为了能够使编码前体蛋白的核苷酸序列转录，优选编码前体蛋白的核苷酸序列与启动子或启动子元件可操纵地连接。非常优选来源于巴氏毕赤酵母的启动子或启动子元件，更优选如SEQ ID NO：5所示的巴氏毕赤酵母的AOX1启动子。此外还优选，在甲基营养酵母中，编码前体蛋白的核苷酸序列与指导转录终止的终止序列可操纵地连接。非常优选的是来源于巴氏毕赤酵母的终止子，更优选巴氏毕赤酵母的AOX1终止子。

进一步优选所述载体为能在甲基营养酵母菌株中以游离体形式复制的质粒。因此，优选的质粒为包括指导游离体在甲基营养酵母菌株中复制的复制起点的环状核酸分子。此外，所述的质粒包括能在甲基营养酵母菌株中表达的选择性标记，由此所述的选择性标记能选择质粒是否在甲基营养酵母菌株中存在。一种非常优选的选择性标记为Zeocin^TM抗性基因，这是来源于来自Streptoalloteichushindustanus的天然的Sh ble基因或其经遗传工程改造的变体(Drocourt，D.，等，Nucleic Acids Res.18(1990)4009；Carmels，T.，等，Curr.Genet.20(1991)309-314)。另一中非常优选的选择性标记具有抗氨基糖苷类抗生素如潮霉素和G418的抗性(Southern，P.J.，&Berg，P.，J.Mol.Appl.Genet.1(1982)327-341)。

一种这种选择性标记的例子为氨基糖苷类磷酸转移酶基因。

进一步优选能在甲基营养酵母菌株中复制的人工染色体含有所述的载体。因此，优选的人工染色体为线状的核酸分子，其包括至少一个转录起点、一个着丝粒和末端端粒，从而调控人工染色体在甲基营养酵母菌株中的复制、整合和有丝分裂/减数分裂分布。此外，包括在人工染色体中的载体包含一种在甲基营养酵母菌株中表达的选择性标记并用于筛选在甲基营养酵母菌株中复制的人工染色体的载体的存在与否。一种非常优选的选择性标记为Zeocin^TM抗性基因，这是来源于印度斯坦链异壁菌(Streptoalloteichus hindustanus)的天然的Sh ble基因或其经遗传工程改造的变体。另一非常优选的选择性标记具有抗氨基糖苷类抗生素如潮霉素和G418的抗性。一种这种选择性标记的例子为氨基糖苷类磷酸转移酶基因。

甚至更优选甲基营养酵母菌株的染色体含有所述的载体。非常优选所述的载体具有与染色体序列相同的核苷酸序列，从而所述的载体能通过位点特异性重组的方式整合至宿主染色体上。为此目的，巴氏毕赤酵母的AOX1的位置甚至更优选的作为通过点特异性重组整合至宿主染色体中的位置。同时非常优选的是，所述的载体包括一种能在甲基营养酵母中表达的选择性标记并允许选择所述载体在甲基营养酵母菌株中的存在与否。一种非常优选的选择性标记为Zeocin^TM抗性基因，这是来源于印度斯坦链异壁菌的天然的Sh ble基因或其经遗传工程改造的变体。另一非常优选的选择性标记具有抗氨基糖苷类抗生素如潮霉素和G418的抗性。一种这种选择性标记的例子为氨基糖苷类磷酸转移酶基因。

本领域熟练技术人员知晓如下事实：当编码前体蛋白的核苷酸序列的拷贝数目增加时，来源于生长培养基，如液体生长培养基的分泌的组氨酸标记的前羧肽酶B的产量会增加。因此，当甲基营养酵母菌株基因组中的载体拷贝数目增加时，来源于生长培养基中的分泌的组氨酸标记的前羧肽酶B分子的产量也增加。例如，可以通过重复转化所述载体至甲基营养酵母菌株和通过增加包括在载体中的抗性的选择性标记所抗的选择性试剂的浓度来重复筛选从而增加载体的拷贝数目(US5324639，Thill，G.P.，等，Positive and Negative Effects ofMulti-Copy Integrated Expression in Pichia pastoris，International Symposium on the Genentics of Microorganisms 2(1990)，pp.477-490；Vedvick，T.，等，J.Ind.Microbiol.7(1991)197-201)。

本领域熟练技术人员还知晓如下事实：采用一个以上的载体可进行重复的转化。例如，采用第一或第二载体可实现重复转化，其中第一和第二载体编码相同的前体蛋白，其中在第一和第二载体中编码前体蛋白的核苷酸序列可操纵地与启动子或启动子元件相连，其中相同的前体蛋白被表达并且组氨酸标记的前羧肽酶B被分泌，其中第一和第二载体具有对第一和第二选择性标记的抗性。

第一选择性标记的一个例子为Sh ble基因，即Zeocin^TM抗性基因(Drocourt，D.，等，Nucleic Acids Res.18(1990)4009；Carmels，T.，等，Curr.Genet.20(1991)309-314)。由Sh ble基因编码的蛋白与Zeocin^TM化学定量的结合并具有较强的亲和力。Zeocin^TM的结合抑制了其毒性活性从而选择了含有Sh ble基因的转化体。本领域熟练技术人员已知增加培养基中作为筛选试剂的Zeocin^TM浓度，可以筛选表达Sh ble基因的载体的拷贝数目的增加。因此，通过采用携带Sh ble基因作为选择性标记的载体非常有利于重复转化含有多个载体拷贝的酿酒酵母菌株的多重转化体。更有利的是，不断重复地转化并且也不断重复地筛选更具抗性的转化体直到对于转化的甲基营养酵母菌株来说，没有获得Zeocin^TM抗性水平的进一步的增加，或在选择培养基中没有进一步增加Zeocin^TM浓度的可能性。

在采用第一和第二载体的情况下，第二选择性标记的一个例子是抗氨基糖苷类抗生素的抗性(Southern，P.J.，&Berg，P.，J.Mol.Appl.Genet.1(1982)327-341)，如G418。因此第二载体的一个实例表达了一具有抗G418的抗性基因。例如，本领域已知许多氨基糖苷类磷酸转移酶具有抗氨基糖苷类抗生素的抗性(van Treeck，U.，等，Antimicrob Agents Chemother.19(1981)371-380；Beck，E.，等，Gene 19(1982)327-336)。氨基糖苷类磷酸转移酶I(APH-I)酶具有失活抗体G418的能力并且是酵母中一种已经建立的选择性标记(Chen，X.J.，&Fukuhara，H.，Gene，Vol.69(1988)181-192)。

因此，为了进一步增加编码前体蛋白的核苷酸序列的量，第二载体非常有利地用于进一步轮次的转化和筛选，其中在这种情况下一种优选的选择性试剂为G418并且因此采用了被第一载体转化的甲基营养酵母菌株。

进一步优选的甲基营养酵母菌株为汉逊酵母、毕赤酵母、假丝酵母、光滑球拟酵母菌株。在本发明的一非常优选的实施方式中，甲基营养酵母菌株选自：巴氏毕赤酵母(Pichia pastoris)、多形汉逊酵母(Hansenula polymorpha)、波氏假丝酵母(Candida boidinii)、光滑球拟酵母(Torulopsis glabrata)。

更优选的巴氏毕赤酵母菌株被保藏在美国典型培养物保藏中心(ATCC)，其入藏号为201178、201949、204162、204163、204164、204165、204414、204415、204416、204417、20864、28485、34614、60372、66390、66391、66392、66393、66394、66395、76273、76274、和90925。

不过，更优选的甲基营养酵母菌株为美国典型培养物保藏中心编号为76273的巴氏毕赤酵母菌株或其衍生物。

更优选的多形汉逊酵母菌株被保藏在美国典型培养物保藏中心，入藏号为14754、200499、200500、200501、200502、200503、200504、200505、200506、200507、200508、200509、200510、200511、200512、200513、200838、200839、201322、204205、22023、26012、34438、36669、38626、44954、44955、46059、48180、58401、62809、64209、66057、76722、76723、76760、90438、96694、96695、MYA-335、MYA-336、MYA-337、MYA-338、MYA-339、和MYA-340。

更优选的波氏假丝酵母菌株被保藏在美国典型培养物保藏中心，入藏号为18810、201209、20432、26175、32195、32929、36351、38256、38257、44637、46498、48180、56294、56507、56897、60364、62807、90439、90441、96315、和96926。

更优选的光滑球拟酵母菌株被保藏在美国典型培养物保藏中心，入藏号为15126、15545、2001、22019、26512、28226、28290、32312、32554、32936、34147、34449、36909、38326、4135、46433、48435、58561、66032、750、和90030。

本发明的另一实施例为采用含有载体的染色体转化的氏毕赤酵母菌株，其中所述载体包括一种编码前体蛋白的核苷酸序列，所述的前体蛋白由N-末端与组氨酸标记融合的前羧肽酶B和信号肽组成，所述的核苷酸序列与如SEQ ID NO：5所示的氏毕赤酵母菌株AOX1启动子或其启动子元件可操纵地连接，其中编码前体蛋白的核苷酸序列为SEQID NO：3的核苷酸序列。还优选包括编码前体蛋白的核苷酸序列的载体，所述的前体蛋白由N-末端与组氨酸标记融合的前羧肽酶B和信号肽组成，由此任选地在组氨酸标记和信号肽之间插入一间隔序列。

本发明的另一实施例为来源于如本发明所述的方法的具有羧肽酶B活性的蛋白，其基本上不含有羧肽酶B的前肽。术语“基本上不含”表示采用质谱检测方式测得的所述前肽的量在检测水平以下。实施例8记载了一示例性的分析。

如实施例8所示，具有羧肽酶B活性的纯化蛋白绝大多数缺乏C-末端酪氨酸(SEQ ID NO：4中的Tyr497)。只有非常少的一小部分纯化蛋白仍含有该氨基酸。因此，根据本发明，基本上不含羧肽酶B的前肽的具有羧肽酶B活性的蛋白具有SEQ ID NO：4的191至496位的氨基酸序列。

实施例9显示，在经过如实施例7所示的第一次纯化步骤后，收集的库中含有几乎等量的具有C-末端酪氨酸的产物和不具有C-末端酪氨酸的产物的产物。在加工过程中末端酪氨酸残基被逐步除去。在第二次层析纯化步骤后，绝大多数蛋白类物质几乎全部缺失了C-末端酪氨酸。因此一种可能的但未经证实的解释是用于表达和分泌产物的宿主有机体产生了具有羧肽酶Y活性的蛋白。羧肽酶Y是已知的来源于啤酒酵母的具有广泛特异性的切除C-末端氨基酸的能力。虽然羧肽酶Y已知是一种空泡酶(Kato，M.等，Eur.J.Biochem 270(2003)4587-4593)，但是裂解的酵母细胞可显著提高发酵培养基中的羧肽酶Y的活性。不过，既然除去C-末端酪氨酸并未改变具有羧肽酶B活性的蛋白的总体上的酶学特性，并且既然在C-末端没有进一步的氨基酸被除去，假定的羧肽酶Y活性的失活或另外的分离不被认为是一定必需的。

不过本发明的另一实施方式涉及应用如本发明所述的基本上不含羧肽酶B前肽的具有羧肽酶B活性的蛋白用于蛋白水解酶切肽键。优选的是肽键的酶切受来源于多肽中C-末端处的碱性氨基酸、赖氨酸、精氨酸和鸟氨酸的催化水解的影响。更优选的是所述的具有羧肽酶B活性的蛋白的氨基酸序列为SEQ ID NO：4第191至第496位的氨基酸序列。

非常优选的是如本发明所述的基本上不含羧肽酶B前肽的具有羧肽酶B活性的蛋白的应用的特点在于胰岛素前肽键被切除。因此操作过程记载于，如EP0264250和EP0195691。因此，胰岛素前体通过胰蛋白酶和具有羧肽酶B活性的蛋白来进行蛋白水解酶切。更优选，具有羧肽酶B活性的蛋白催化了来源于胰岛素前体胰蛋白酶蛋白水解产物的C-末端处的碱性氨基酸：赖氨酸、精氨酸和鸟氨酸的水解酶切。

不过，本发明的另一实施例为一种含有如本发明所述的基本上不含羧肽酶B前肽的具有羧肽酶B活性的蛋白的试剂溶液。优选的试剂溶液中的具有羧肽酶B活性的蛋白能催化来源于肽或前肽C-末端处的碱性氨基酸：赖氨酸、精氨酸和鸟氨酸的水解酶切。更优选的是试剂溶液中具有羧肽酶B活性的蛋白的氨基酸序列为SEQ ID NO：4的191位至496位的氨基酸序列。一种含有具有羧肽酶B活性的蛋白的试剂溶液通常为另外还含有缓冲盐的水溶液。不过，其他成分也是可以的并且为本领域熟练技术人员所公知。其他成分的一个例子为胰蛋白酶。

提供如下的实施例、参考文献、序列表和图有助于进一步理解本发明，本发明实际要保护的范围由所附的权利要求书所限定。应当理解在不背离本发明的主旨的情况下可以对其中所述的方法进行各种改进。

附图简述

图1载体Pcpb-1的图解表示。该载体含有一种编码前体蛋白的核苷酸序列，该前体蛋白是一种包括来源于啤酒酵母的α-因子信号肽(命名为“α-Faktor-SS”)和组氨酸标记的前羧肽酶B的融合蛋白。编码前体蛋白的核苷酸序列受到AOX1启动子(命名为“AOX1-启动子”)和AOX1终止子(命名为“AOX1-TT”)的转录调控。所述载体具有抗Zeocin的抗性。

图2a表示对按照实施例8的羧肽酶B制剂进行的示例性的质谱分析结果的图表。其中X-轴表示m/z值(m＝离子质谱；z＝离子电荷)。星号标明相应于个别的羧肽酶B二聚物的峰。

图2b表示对按照实施例8的羧肽酶B制剂进行的示例性的质谱分析结果的图表。其中X-轴表示以[Da]表示的离子分子量。

图3(a)部分显示了假设的m/z值和相应于羧肽酶B前肽，也被称作12132Da肽的峰。被命名为(b)的部分显示了如图1a的光谱的相应的削波。其中部分(a)和(b)的X-轴对齐，并具有相同的标度。

图4(a)部分显示了假设的m/z值和相应于羧肽酶B前肽，也被称作10746Da肽的峰值。被命名为(b)的部分显示了如图1a的光谱的相应的削波。其中部分(a)和(b)的X-轴对齐，并具有相同的标度。

图5用按照实施例8的酶制剂所获得的光谱削波。

图6表示对产物羧肽酶B制剂所作的质谱分析结果的图表。分析针对如实施例9所述的膨胀床层析后取样的样品进行。其中(a)部分的X-轴表示m/z值(m＝离子质谱；z＝离子电荷)。(b)部分的X-轴表示以[Da]表示的离子分子量。

图7表示对羧肽酶B制剂所作的质谱分析结果的图表。分析针对如实施例9所述的Q-Sepharose ff^TM层析后取样的样品进行。其中(a)部分的X-轴表示m/z值(m＝离子质谱；z＝离子电荷)。(b)部分的X-轴表示以[Da]表示的离子分子量。

图8表示对羧肽酶B制剂所作的质谱分析结果的图表。所述的分析针对如实施例9所述的纯化步骤的终产物进行。其中(a)部分的X-轴表示m/z值(m＝离子质谱；z＝离子电荷)。(b)部分的X-轴表示以[Da]表示的离子分子量。

实施例1

编码前体蛋白的基因的合成

根据标准的操作方案来进行DNA操作技术(Sambrook，Fritsh&Maniatis，Molecular Cloning，A Laboratory Manual，3^rd Edition，CSHL Press，2001)。分子生物学实验中采用的试剂按制造商的建议来使用。

重新合成一种如SEQ ID NO：3所示的编码人工前原羧肽酶B基因的核苷酸序列。将核苷酸序列的几个部分合成为24个长度介于54至90个核苷酸的单链DNA寡核苷酸。该单链寡核苷酸表示SEQ ID NO：3的先导链和滞后链的一种以交替方式重叠的部分。设计每一寡核苷酸使得其5’和3’端与邻近的寡核苷酸重叠。作为例外，表示SEQ ID NO：3的5’和3’末端的寡核苷酸仅分别与其邻近的寡核苷酸的5’和3’端相重叠。选择重叠的序列，使得在退火反应中避免了非特异性的退火。表示SEQ ID NO：3的5’和3’末端的寡核苷酸另外还含有识别限制性酶切位点的连接序列，从而有助于进一步的分子克隆，如向表达载体中插入人工编码的序列。表示SEQ ID NO：3的5’末端的寡核苷酸的优选的限制性酶切位点为XhoI。表示SEQ ID NO：3的3’末端的寡核苷酸的优选的限制性酶切位点为NotI。

一种包含如SEQ ID NO：3所述的核苷酸序列的核酸分子是通过PCR方式(聚合酶链反应)逐步地合成的。在原理上，首先向PCR反应混合物中加入两段表示先导链和滞后链的邻近的和部分重叠的部分的寡核苷酸。随后进行几轮PCR循环，获得了一种表示先导链和滞后链的相邻的双链片段。任选地纯化双链片段，并与连续的相邻和部分重叠的单链寡核苷酸重叠并进行进一步轮次的PCR循环。

采用如上文所述的步骤，独立地合成了如SEQ ID NO：3所示的3段较大的核苷酸序列片段。每一片段均可在副产物的混合物中存在。因此，将片段在琼脂糖凝胶上进行凝胶电泳并根据其大小来鉴定。切下含有目的片段的凝胶块，并通过QiaQuick凝胶提取试剂盒(Qiagen)来分离DNA片段。其他的提取方法也是可行的。

在3个片段中，第二个片段的5’端有一个序列与第一个片段的3’端重叠，并且第二个片段的3’端有一个序列与第三个片段的5’端重叠。再一次通过逐级的方式合成了如SEQ ID NO：3所示的全长序列。在PCR反应混合物中连接了该三个片段。考虑具有最低熔点的重叠序列来选择退火温度。进行了5轮PCR循环，随后加入了与目的全长产物的5’端和3’端互补的另外的引物对。采用一针对新加入的具有较低熔点的引物的退火温度而选择的退火温度，进一步进行25个循环的PCR反应，获得了包括SEQ ID NO：3的核苷酸序列的全长片段。将全长片段(即包括带有限制性内切酶酶切位点的连接序列的全长前体蛋白的编码DNA)插入载体中并在转化的宿主有机体中增殖。用于增殖目的的一种优选的宿主有机体为E.coli。

通过测序来验证包括SEQ ID NO：4所示的编码前体蛋白的序列的全长DNA序列的核苷酸序列。最终的全长产物通过PCR来进行扩增。

实施例2

载体的构建、转化、表达

针对表达载体的构建、转化、前体蛋白的表达和组氨酸标记的前羧肽酶B在生长培养基中的分泌，采用了记载于Invitrogen手册的“Pichia酵母表达试剂盒”型号M 011102 25-0043，“pPICZ A，B，和C”型号D 110801 25-0148，“pPECZα A，B，和C”型号E 01030225-0150，和“pPIC9K”型号E030402 25-0106中的方法来进行实验。同时也参考了在此提到的其他载体、酵母菌株和培养基。同时也采用如Sambrook，Fritsh&Maniatis，Molecular Cloning，A LaboratoryManual，3^rd Edition，CSHL Press，2001所述的基本的分子生物学方法。

结果是，获得了许多载体，其中在甲基营养酵母菌株中的每一株均包括一个含有能表达如SEQ ID NO：4所示的前体蛋白的表达盒。一种优选的酵母菌株为巴氏毕赤酵母菌株。此外，每一载体还包括，在其他的遗传元件中，一种能使载体在甲基营养酵母细胞中自主复制的复制起点。此外，设计所述的载体从而使其能整合至宿主细胞的基因组中。在每一载体上均含有的另一遗传元件为表达选择性标记的其它表达盒。

重复进行巴氏毕赤酵母菌株的转化从而增加分泌的组氨酸标记的前羧肽酶B的产量。

实施例3

蛋白定量分析

通过利用宽度为1cm的比色杯在280nm处测量吸收值的方法来进行纯化的大鼠羧肽酶B的定量分析。根据如下公式来确定其浓度：

实施例4

蛋白活性

在25℃下采用溶于100mM的Tris pH7.8中的的1.5M马尿酰-L-精氨酸(Bachem G-2265)和宽度为0.5cm的比色杯来测定羧肽酶B的活性。

实施例5

HPLC分析

通过HPLC(高压液相色谱)和凝胶过滤分离(Superdex 75 HR10/30，Amersham Biosciences)的方法来检测来源于组氨酸标记的前羧肽酶B的羧肽酶B的活性。层析缓冲液为0.1M Tris pH7.5，0.3M NaCl。流速为0.5ml/min。

羧肽酶B和组氨酸标记的前羧肽酶B的保留时间明显不同(1.2ml)，从而有助于其在洗脱图谱上的识别。

实施例6

发酵

根据文献的记载采用常用方法(Methods in Molecular BiologyVol.103中的Higgins，D.R.，Cregg，J.M.(1998)的Pichia Protocols.，全文不过尤其是第107-120页；Pichia fermentation Guidelines，Invitrogen中的Stratton，J.，Chiruvolu，V.，Meagher，M.(1998))。

转化的能表达SEQ ID NO：4所示的前体蛋白巴氏毕赤酵母菌株的预培养在不含有氨基酸的酵母氮源基础培养基(DIFCO)中在30℃下进行。将预培养物接种至发酵培养基中。该发酵培养基含有矿物质，即H₃PO₄、CaSO₄×2H₂O、K₂SO₄、MgSO₄×7H₂O、KOH、NaOH，微量元素CuSO₄×5H₂O、KI、MnSO₄×H₂O、Na₂MoO₄×2H₂O、H₃BO₄、ZnCl₂、CoCl₂×6H₂O和FeSO₄×7H₂O。发酵培养基还含有生物素和甘油。将pH值调节至pH5.0，并通过NH₃来保持pH值，同时NH₃还作为氮源使用。

当作为第一碳源的甘油消耗尽时，加入甲醇，从而诱导受AOX1启动子调控的前体蛋白的表达。

实施例7

纯化

通过加入含20mM Tris pH7.5、1M NaCl和1mM咪唑的缓冲液，将发酵培养基的液体物质部分调节到5-13％。使稀释的发酵液通过装有颗粒状的金属螯合物亲和基质的纯化柱。优选的颗粒状的金属螯合物亲和基质为加Zn²⁺的Streamline^TM螯合柱(AmershamBiosciences)。通过膨胀床层析技术采用组氨酸标记的前羧肽酶B装载颗粒状的金属螯合物亲和基质。在上文所述的条件下，稀释的发酵培养基中的组氨酸标记的前羧肽酶B结合，即吸附于颗粒状的金属螯合物亲和基质上。

在结合步骤后，采用含20mM Tris pH7.5、1M NaCl和1mM咪唑的洗涤缓冲液来冲洗柱中的颗粒状的金属螯合物亲和基质(仍在膨胀)。在允许组氨酸标记的前羧肽酶B保持与颗粒状的金属螯合物亲和基质结合的条件下，进行数步(至少两步)的洗涤步骤。采用额外加入含有11％甘油[体积/体积]的洗涤缓冲液来进行首次洗涤步骤。

采用不含有甘油的洗涤缓冲液来进行另外的洗涤步骤。

羧肽酶B活性的影响受到采用胰蛋白酶进行的柱上酶切的影响。在洗涤步骤后，一种含胰蛋白酶(13-20U/ml)的缓冲液(20mM TrispH7.5，1M NaCl和1mM咪唑)被泵送通过纯化柱，其中从柱中流出的缓冲液被重新循环加入柱中。经150-300分钟后，另外含有活化的羧肽酶B的缓冲液被除去。采用洗涤缓冲液以向上流动的方式来洗涤纯化柱(2到3步的洗涤步骤)，从而收集流通的液体。现在将另外含有活化的羧肽酶B的缓冲液和通过洗涤步骤得到的流通的液体混合。通过加入苯甲脒盐酸盐至终浓度为1mM来终止胰蛋白酶活性。

过滤含有活化的羧肽酶B和胰蛋白酶的缓冲液从而除去残留生物量的最后痕量。通过切向液流过滤对过滤的缓冲液进行渗滤。使用含有浓度为60-100mM的Tris pH8.3和进一步含有1mM苯甲脒盐酸盐、0.1mM的ZnCl₂的渗析缓冲液。渗滤导致了缓冲液的交换，在缓冲液中存在活化的羧肽酶。

随后的步骤为Q-Sepharose ff^TM层析。将其中存在活化的羧肽酶的缓冲液加样至含Q-Sepharose ff^TM的纯化柱中。采用60-100mM的Tris pH8.3和1mM苯甲脒盐酸盐、0.1mM的ZnCl₂进行洗涤步骤。在洗涤步骤后，采用一种扩展至125mM NaCl的梯度来洗脱柱。收集馏分。汇合含羧肽酶B的馏分。

实施例8

纯化的羧肽酶B的质谱

按照实施例7的方法纯化羧肽酶B。在进行质谱分析前，采用配有自动加样器(Gilson 234)的微量HPLC装置(ABI-120A)使酶制剂脱盐。采用的柱子是配有适当安全夹的Vydac Protein C4桶(Vydac目录号.214GD51)。将含有50μg-100μg蛋白的等量酶制剂加样于柱中，并采用洗脱缓冲液A(3.5％的溶于HPLC级水[Baker]中的“蛋白分析”级的HCOOH[甲酸])和缓冲液B(80％HPLC级的乙腈，5％溶于HPLC级水[Baker]中的HPLC级的甲酸)的梯度来进行洗脱。通过在第一个5分钟采用5％的缓冲液B，95％缓冲液A洗脱，随后再采用3分钟的100％的缓冲液B洗脱来形成梯度。在HPLC过程中，柱温度保持在35℃。在280nm下检测酶纯度。发现在t5_min至t8_min之间酶被洗脱下来。收集蛋白峰(从30mAU-40mAU；最大峰值＞800mAU)。

在配有纳喷洒接口的Q-Tof2^TM上(Waters Micromass，Manchester，UK)进行质谱分析。该装置能选择具有200-2000m/z的肽或蛋白离子以及具有800-2000m/z的蛋白离子。喷雾毛细管来源于Proxeon(“中号”，目录号ES 387)。采用涉及毛细管电压、锥电压、和MS轮廓等变量参数进行测量。考虑到测量范围，调整每一待检测样品的参数。为了进行分析，采用软件MassLynx 4.0^TM和MaxEnt 1^TM工具包(Waters)。采用适用于质谱数据MaxEnt 1^TM的最大熵处理有助于通过允许对蛋白质混合物分析产生的重叠多倍负荷的光谱的去叠合来增强复合光谱。小于10000Da的指示物为单同位素标记，等于或高于10000Da的指示物质为平均质量。

通过质谱分析显示，酶制剂也就是纯化的羧肽酶B基本上产生了3个不同的峰：(1)相应于35015Da质量(平均值)的主峰[在图2b中命名为A]，表示缺失C-末端酪氨酸的羧肽酶B；(2)同时还发现了一个相应于约70026Da质量的小峰(未标明)，其表示缺乏C-末端酪氨酸的羧肽酶B的二聚体；(3)一个相应于约35176Da质量的小峰，表示包括C-末端酪氨酸的羧肽酶B。

理论上，相应于组氨酸标记的前肽的峰应当反映一个由105个氨基酸组成的大小为12132Da的肽，其通过SEQ ID NO：4的氨基酸序列经(a)KEX-2信号肽酶在Arg85和Ser86位间的酶切(b)在Arg190和Ala191间的胰蛋白酶酶切来产生。同样地可以假设推定的组氨酸标记的前肽片段。这些片段包括由从Ser86至Arg178位的氨基酸组成的10746Da的肽和由从Asn179至Arg190位的氨基酸组成的1404Da的肽。图3和4的“a”部分表示理论峰，如果12132Da和10746Da的肽存在于酶制剂中则预计可出现该峰。“b”部表示如图2a中所示的光谱的扩大的削波。可以观察到，在理论峰的位置并没有检测到酶制剂的光谱，图5显示了一个来自于酶制剂的光谱削波。可预计理论上的1404Da的肽将在m/z＝702.8([M+2H]2+)和m/z＝468.9([M+3H]3+)处产生峰。不过，没有能指示前肽存在的显著的峰出现。

此外，测定了相应于主峰的多肽的N-末端氨基酸序列。该15个N-末端氨基酸的序列为“A S G H S Y T K Y N N W E T I”。这与SEQID NO：4的191至205位的氨基酸序列相一致，也就是其代表了活化的羧肽酶B酶的N-末端序列。

实施例9

C-末端酪氨酸的除去

按照如实施例7的方式纯化了羧肽酶B。从汇合的含羧肽酶B的馏分和洗涤溶液中取样。按照如实施例8所述的方法进行质谱分析。结果示于图6中所示。图7显示了经Q-sepharose ff^TM层析后的样品的结果，而图8显示了终产物的结果。很明显，开始时有约50％或更多的羧肽酶B含有C-末端胰蛋白酶。在第二次色谱后，绝大多数的蛋白种类均已经缺乏了C-末端的酪蛋白。不过，C-末端降解仅限于C-末端酪蛋白。

参考文献目录

Alberts，B.，Johnson，A.，Lewis，J.，Raff，M.，Roberts，K.，Walter，P.(eds)，Molecular

Biology of the Cell，fourth edition，2002，Garland Science Publishing

Beck，E.，et al.，Gene 19(1982)327-336

Borsing，L.et al.Biochem.Biophys.Res.Commun.240(1997)586-590

Carmels，T.，et al.，Curr.Genet.20(1991)309-314

Chaga，G.et al.，Biotechnol.Appl.Biochem.29(1999)19-24

Chaga，G.et al.，J.Chromatogr.A 864(1999)257-256

Chen，B.P.and Hai，T.，Gene 139(1994)73-75

Chen，X.J.，and Fukuhara，H.，Gene，Vol.69(1988)181-192

Clauser E.et al.，J.Biol.Chem.1988，Vol.263，17837-45

DE 19 915 938

Drocourt，D.，et al.，Nucleic Acids Res.18(1990)4009

EP 0 116 201

EP 0 195 691

EP 0 253 303

EP 0 264 250

EP 0 282 042

EP 1 069 131

Folk J.Carboxypeptidase B，in：The Enzymes 3，P.Boyer，Academic Press，NY，57，

1971

Folk，J.，and Gladner，J.：Biochim Biophys Acta(1961)48，139-47

Hakansson，K.et al.Acta Crystallogr.D Biol.Crystallogr.56(2000)924-926

Halliwell，C.M.et al.，Anal Biochem.295(2001)257-261

Higgins，D.R.，Cregg，J.M.(1998)Pichia Protocols.In：Methods in Molecular

Biology Vol.103，the whole document but in particular pp 107-120

Hochuli，E.et al.，Bio/Technology 6(1988)1321-1325

Hochuli，E.et al.，J.Chromatogr.411(1987)177-184

Janknecht，R.and Nordheim，A.，Gene 121(1992)321-324

Janknecht，R.et al.Proc.Natl.Acad.Sci.USA 88(1991)8972-8976

Julius，D.，et al.，Cell 37(1984)1075-1089

Kaslow，D.C.and Shiloach，J.，Bio/Technology 12(1994)494-499

Kato，M.et al.Eur.J.Biochem 270(2003)4587-4593

Kuusinen，A.et al.，Eur.J.Biochem.233(1995)720-726

Pharmacia Biotech manual“Expanded bed adsorption，principles and methods”.

ISBN 91-630-5519-8

Porath，J.et al.，Nature 258(1975)598-599

Rank，K.B.et al.，Protein Expr.Purif.22(2001)258-266

Sambrook，Fritsch & Maniatis，Molecular Cloning，A Laboratory Manual，3rd

edition，CSHL Press，2001

Schmidt，M.et al.Protein Expr.Purif.12(1998)323-330

Southern，P.J.，and Berg，P.，J.Mol.Appl.Genet.1(1982)327-341

Stratton，J.，Chiruvolu，V.，Meagher，M.(1998)High cell-density fermentation.In：

Pichia Fermentation Guidelines，Invitrogen

Thill，G.P.，et al.，Positive and Negative Effects ofMulti-Copy Integrated Expression

in Pichia pastoris，International Symposium on the Genentics of

Microorganisms 2(1990)，pp.477-490

US 4,683,293

US 4,808,537

US 4,812,405

US 4,818,700

US 4,837,148

US 4,855,231

US 4,857,467

US 4,870,008

US 4,879,231

US 4,882,279

US 4,885,242

US 4,895,800

US 4,929,555

US 5,002,876

US 5,004,688

US 5,032,516

US 5,122,465

US 5,135,868

US 5,166,329

US 5,284,933

US 5,310,663

US 5,324,639

US 5,618,676

US 5,854,018

US 5,856,123

US 5,919,651

van Treeck，U.，et al.，Antimicrob Agents Chemother.19(1981)371-380

Vedvick，T.，et al.，J.Ind.Microbiol.7(1991)197-201

Ventura et al.J.Biol.Chem.(1999)274(28)，19925-33

Waters et al.，J.Biol.Chem.263(1988)6209-14

Werten，M.W.，et al.，Yeast 15(1999)1087-1096

WO 00/56903

WO 01/51624

WO 96/23064

Wu，J.and Filutowicz，M.，Acta Biochim.Pol.46(1999)591-599

Zisapel，N.and Sokolovsky，M，Eur J Biochem(1975)54，541-7

序列表

<110>F.Hoffmann-La Roche AG

<120>重组表达的羧肽酶B及其纯化

<130>22225

<150>EP 03028101.8

<151>2003-12-05

<160>5

<170>PatentIn version 3.2

<210>1

<211>1248

<212>DNA

<213>大鼠

<220>

<221>混杂的特征

<223>大鼠羧肽酶B1(Cpb1)，如“Clauser，E.等(1988)J.Biol.Chem.263

(33)，17837-17845”所述的编码前原酶的序列

<220>

<221>CDS

<222>(1)..(1248)

<223>包括终止密码子的编码序列

<220>

<221>信号肽

<222>(1)..(39)

<223>编码信号肽部分

<220>

<221>混杂的特征

<222>(40)..(1248)

<223>编码前羧肽酶B(酶原)部分

<220>

<221>混杂的特征

<222>(325)..(1248)

<223>编码活化的羧肽酶B片段

<400>1

atg ttg ctg cta ctg gcc ctg gtg agt gtg gcc ttg gct cat gct tcc 48

Met Leu Leu Leu Leu Ala Leu Val Ser Val Ala Leu Ala His Ala Ser

1 5 10 15

gag gag cac ttt gat ggc aac cgg gtg tac cgt gtc agt gta cat ggt 96

Glu Glu His Phe Asp Gly Asn Arg Val Tyr Arg Val Ser Val His Gly

20 25 30

gaa gat cac gtc aac tta att cag gag cta gcc aac acc aaa gag att 144

Glu Asp His Val Asn Leu Ile Gln Glu Leu Ala Asn Thr Lys Glu Ile

35 40 45

gat ttc tgg aaa cca gat tct gct aca caa gtg aag cct ctc act aca 192

Asp Phe Trp Lys Pro Asp Ser Ala Thr Gln Val Lys Pro Leu Thr Thr

50 55 60

gtt gac ttt cat gtt aaa gca gaa gat gtt gct gat gtg gag aac ttt 240

Val Asp Phe His Val Lys Ala Glu Asp Val Ala Asp Val Glu Asn Phe

65 70 75 80

ctg gag gag aat gaa gtt cac tat gag gta ctg ata agc aac gtg aga 288

Leu Glu Glu Asn Glu Val His Tyr Glu Val Leu Ile Ser Asn Val Arg

85 90 95

aat gct ctg gaa tcc cag ttt gat agc cac acc cgt gca agt gga cac 336

Asn Ala Leu Glu Ser Gln Phe Asp Ser His Thr Arg Ala Ser Gly His

100 105 110

agc tac acc aag tac aac aag tgg gaa acg att gag gcg tgg att caa 384

Ser Tyr Thr Lys Tyr Asn Lys Trp Glu Thr Ile Glu Ala Trp Ile Gln

115 120 125

caa gtt gcc act gat aat cca gac ctt gtc act cag agc gtc att gga 432

Gln Val Ala Thr Asp Asn Pro Asp Leu Val Thr Gln Ser Val Ile Gly

130 135 140

acc aca ttt gaa gga cgt aac atg tat gtc ctc aag att ggc aaa act 480

Thr Thr Phe Glu Gly Arg Asn Met Tyr Val Leu Lys Ile Gly Lys Thr

145 150 155 160

aga ccg aat aag cct gcc atc ttc atc gat tgt ggt ttc cat gca aga 528

Arg Pro Asn Lys Pro Ala Ile Phe Ile Asp Cys Gly Phe His Ala Arg

165 170 175

gag tgg att tct cct gca ttc tgt cag tgg ttt gtg aga gag gct gtc 576

Glu Trp Ile Ser Pro Ala Phe Cys Gln Trp Phe Val Arg Glu Ala Val

180 185 190

cgt acc tat aat caa gag atc cac atg aaa cag ctt cta gat gaa ctg 624

Arg Thr Tyr Asn Gln Glu Ile His Met Lys Gln Leu Leu Asp Glu Leu

195 200 205

gat ttc tat gtt ctg cct gtg gtc aac att gat ggc tat gtc tac acc 672

Asp Phe Tyr Val Leu Pro Val Val Asn Ile Asp Gly Tyr Val Tyr Thr

210 215 220

tgg act aag gac aga atg tgg aga aaa acc cgc tct act atg gct gga 720

Trp Thr Lys Asp Arg Met Trp Arg Lys Thr Arg Ser Thr Met Ala Gly

225 230 235 240

agt tcc tgc ttg ggt gta aga ccc aac agg aat ttt aat gct ggc tgg 768

Ser Ser Cys Leu Gly Val Arg Pro Asn Arg Asn Phe Asn Ala Gly Trp

245 250 255

tgt gaa gtg gga gct tct cgg agt ccc tgc tct gaa act tac tgt gga 816

Cys Glu Val Gly Ala Ser Arg Ser Pro Cys Ser Glu Thr Tyr Cys Gly

260 265 270

cca gcc cca gag tct gaa aaa gag aca aag gcc ctg gca gat ttc atc 864

Pro Ala Pro Glu Ser Glu Lys Glu Thr Lys Ala Leu Ala Asp Phe Ile

275 280 285

cgc aac aac ctc tcc acc atc aag gcc tac ctg acc atc cac tca tac 912

Arg Asn Asn Leu Ser Thr Ile Lys Ala Tyr Leu Thr Ile His Ser Tyr

290 295 300

tca cag atg atg ctc tac cct tac tcc tat gac tac aaa ctg cct gag 960

Ser Gln Met Met Leu Tyr Pro Tyr Ser Tyr Asp Tyr Lys Leu Pro Glu

305 310 315 320

aac tat gag gaa ttg aat gcc ctg gtg aaa ggt gcg gca aag gag ctt 1008

Asn Tyr Glu Glu Leu Asn Ala Leu Val Lys Gly Ala Ala Lys Glu Leu

325 330 335

gcc act ctg cat ggc acc aag tac aca tat ggc cca gga gct aca aca 1056

Ala Thr Leu His Gly Thr Lys Tyr Thr Tyr Gly Pro Gly Ala Thr Thr

340 345 350

atc tat cct gct gct ggg gga tct gac gac tgg tct tat gat cag gga 1104

Ile Tyr Pro Ala Ala Gly Gly Ser Asp Asp Trp Ser Tyr Asp Gln Gly

355 360 365

atc aaa tat tca ttt acc ttt gaa ctc cgg gat aca ggc ttc ttt ggc 1152

Ile Lys Tyr Ser Phe Thr Phe Glu Leu Arg Asp Thr Gly Phe Phe Gly

370 375 380

ttt ctc ctt cct gag tct cag atc cgc cag acc tgt gag gag aca atg 1200

Phe Leu Leu Pro Glu Ser Gln Ile Arg Gln Thr Cys Glu Glu Thr Met

385 390 395 400

ctt gca gtc aag tac att gcc aat tat gtc cga gaa cat cta tat tag 1248

Leu Ala Val Lys Tyr Ile Ala Asn Tyr Val Arg Glu His Leu Tyr

405 410 415

<210>2

<211>415

<212>PRT

<213>大鼠

<400>2

Met Leu Leu Leu Leu Ala Leu Val Ser Val Ala Leu Ala His Ala Ser

1 5 10 15

Glu Glu His Phe Asp Gly Asn Arg Val Tyr Arg Val Ser Val His Gly

20 25 30

Glu Asp His Val Asn Leu Ile Gln Glu Leu Ala Asn Thr Lys Glu Ile

35 40 45

Asp Phe Trp Lys Pro Asp Ser Ala Thr Gln Val Lys Pro Leu Thr Thr

50 55 60

Val Asp Phe His Val Lys Ala Glu Asp Val Ala Asp Val Glu Asn Phe

65 70 75 80

Leu Glu Glu Asn Glu Val His Tyr Glu Val Leu Ile Ser Asn Val Arg

85 90 95

Asn Ala Leu Glu Ser Gln Phe Asp Ser His Thr Arg Ala Ser Gly His

100 105 110

Ser Tyr Thr Lys Tyr Asn Lys Trp Glu Thr Ile Glu Ala Trp Ile Gln

115 120 125

Gln Val Ala Thr Asp Asn Pro Asp Leu Val Thr Gln Ser Val Ile Gly

130 135 140

Thr Thr Phe Glu Gly Arg Asn Met Tyr Val Leu Lys Ile Gly Lys Thr

145 150 155 160

Arg Pro Asn Lys Pro Ala Ile Phe Ile Asp Cys Gly Phe His Ala Arg

165 170 175

Glu Trp Ile Ser Pro Ala Phe Cys Gln Trp Phe Val Arg Glu Ala Val

180 185 190

Arg Thr Tyr Asn Gln Glu Ile His Met Lys Gln Leu Leu Asp Glu Leu

195 200 205

Asp Phe Tyr Val Leu Pro Val Val Asn Ile Asp Gly Tyr Val Tyr Thr

210 215 220

Trp Thr Lys Asp Arg Met Trp Arg Lys Thr Arg Ser Thr Met Ala Gly

225 230 235 240

Ser Ser Cys Leu Gly Val Arg Pro Asn Arg Asn Phe Asn Ala Gly Trp

245 250 255

Cys Glu Val Gly Ala Ser Arg Ser Pro Cys Ser Glu Thr Tyr Cys Gly

260 265 270

Pro Ala Pro Glu Ser Glu Lys Glu Thr Lys Ala Leu Ala Asp Phe Ile

275 280 285

Arg Asn Asn Leu Ser Thr Ile Lys Ala Tyr Leu Thr Ile His Ser Tyr

290 295 300

Ser Gln Met Met Leu Tyr Pro Tyr Ser Tyr Asp Tyr Lys Leu Pro Glu

305 310 315 320

Asn Tyr Glu Glu Leu Asn Ala Leu Val Lys Gly Ala Ala Lys Glu Leu

325 330 335

Ala Thr Leu His Gly Thr Lys Tyr Thr Tyr Gly Pro Gly Ala Thr Thr

340 345 350

Ile Tyr Pro Ala Ala Gly Gly Ser Asp Asp Trp Ser Tyr Asp Gln Gly

355 360 365

Ile Lys Tyr Ser Phe Thr Phe Glu Leu Arg Asp Thr Gly Phe Phe Gly

370 375 380

Phe Leu Leu Pro Glu Ser Gln Ile Arg Gln Thr Cys Glu Glu Thr Met

385 390 395 400

Leu Ala Val Lys Tyr Ile Ala Asn Tyr Val Arg Glu His Leu Tyr

405 410 415

<210>3

<211>1497

<212>DNA

<213>人工的

<220>

<223>优化的用于在甲基营养酵母中表达的编码前原羧肽酶B多肽的人工序列。

<220>

<221>CDS

<222>(1)..(1497)

<223>包括终止密码子的编码序列

<220>

<221>信号肽

<222>(1)..(255)

<223>编码含有信号肽酶切位点的啤酒酵母α-因子信号肽序列的序列。

<220>

<221>混杂的特征

<222>(256)..(261)

<223>编码间隔子的序列

<220>

<221>混杂的特征

<222>(262)..(288)

<223>编码组氨酸标记的序列，RGSHHHHHH.

<220>

<221>混杂的特征

<222>(286)..(570)

<223>编码大鼠羧肽酶B前肽的序列；第一个密码子同时也是组氨酸标记

的一部分。该序列中整合了WO 96/23064中的氨基酸互换Lys14Asn和

Arg142Asp。

<220>

<221>混杂的特征

<222>(571)..(1497)

<223>编码大鼠羧肽酶B的酶部分的序列

<400>3

atg aga ttt cct tca att ttt act gct gtt tta ttc gca gca tcc tcc 48

Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser

1 5 10 15

gca tta gct gct cca gtc aac act aca aca gaa gat gaa acg gca caa 96

Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln

20 25 30

att ccg gct gaa gct gtc atc ggt tac tca gat tta gaa ggg gat ttc 144

Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp Phe

35 40 45

gat gtt gct gtt ttg cca ttt tcc aac agc aca aat aac ggg tta ttg 192

Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu

50 55 60

ttt ata aat act act att gcc agc att gct gct aaa gaa gaa ggg gta 240

Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val

65 70 75 80

tct ctc gag aag aga tcc gct aga ggt tct cac cac cat cac cat cac 288

Ser Leu Glu Lys Arg Ser Ala Arg Gly Ser His His His His His His

85 90 95

gct tct gag gag cac ttc gac ggt aac aga gtt tac aga gtt tct gtt 336

Ala Ser Glu Glu His Phe Asp Gly Asn Arg Val Tyr Arg Val Ser Val

100 105 110

cac ggt gag gac cac gtt aac ttg att caa gag ttg gct aac act aag 384

His Gly Glu Asp His Val Asn Leu Ile Gln Glu Leu Ala Asn Thr Lys

115 120 125

gag att gac ttc tgg aag cca gac tct gct act caa gtt aag cca ttg 432

Glu Ile Asp Phe Trp Lys Pro Asp Ser Ala Thr Gln Val Lys Pro Leu

130 135 140

act act gtt gac ttc cac gtt aag gct gag gac gtt gcc gat gtt gaa 480

Thr Thr Val Asp Phe His Val Lys Ala Glu Asp Val Ala Asp Val Glu

145 150 155 160

aac ttc ttg gag gag aac gag gtt cac tac gaa gtt ttg atc tct aac 528

Asn Phe Leu Glu Glu Asn Glu Val His Tyr Glu Val Leu Ile Ser Asn

165 170 175

gtt cgt aac gct ttg gaa tcc caa ttc gac tct cac act aga gct tct 576

Val Arg Asn Ala Leu Glu Ser Gln Phe Asp Ser His Thr Arg Ala Ser

180 185 190

ggt cac tct tac act aag tac aac aac tgg gag act att gag gct tgg 624

Gly His Ser Tyr Thr Lys Tyr Asn Asn Trp Glu Thr Ile Glu Ala Trp

195 200 205

att caa caa gtt gct act gac aac cca gac ttg gtt act caa tct gtt 672

Ile Gln Gln Val Ala Thr Asp Asn Pro Asp Leu Val Thr Gln Ser Val

210 215 220

att ggt act act ttc gag ggt aga aac atg tac gtt ttg aag att ggt 720

Ile Gly Thr Thr Phe Glu Gly Arg Asn Met Tyr Val Leu Lys Ile Gly

225 230 235 240

aag act aga cca aac aag cca gct att ttc att gac tgt ggt ttc cac 768

Lys Thr Arg Pro Asn Lys Pro Ala Ile Phe Ile Asp Cys Gly Phe His

245 250 255

gct aga gaa tgg att tcc cca gct ttc tgt caa tgg ttc gtt aga gag 816

Ala Arg Glu Trp Ile Ser Pro Ala Phe Cys Gln Trp Phe Val Arg Glu

260 265 270

gct gtt aga act tac aac caa gag att cac atg aag caa ttg ttg gac 864

Ala Val Arg Thr Tyr Asn Gln Glu Ile His Met Lys Gln Leu Leu Asp

275 280 285

gag ttg gac ttc tac gtt ttg cca gtt gtt aac att gac ggt tac gtt 912

Glu Leu Asp Phe Tyr Val Leu Pro Val Val Asn Ile Asp Gly Tyr Val

290 295 300

tac act tgg act aag gac aga atg tgg aga aag act cgt tcc act atg 960

Tyr Thr Trp Thr Lys Asp Arg Met Trp Arg Lys Thr Arg Ser Thr Met

305 310 315 320

gct ggt tct tct tgc ctt ggt gtc gat cca aat aga aac ttt aac gct 1008

Ala Gly Ser Ser Cys Leu Gly Val Asp Pro Asn Arg Asn Phe Asn Ala

325 330 335

ggt tgg tgt gag gtc ggt gct tct aga tcc cca tgc tct gaa act tac 1056

Gly Trp Cys Glu Val Gly Ala Ser Arg Ser Pro Cys Ser Glu Thr Tyr

340 345 350

tgt ggt cct gct cct gaa tct gaa aag gag act aag gct ttg gct gac 1104

Cys Gly Pro Ala Pro Glu Ser Glu Lys Glu Thr Lys Ala Leu Ala Asp

355 360 365

ttc att aga aac aac ttg tct act att aag gct tac ttg act att cac 1152

Phe Ile Arg Asn Asn Leu Ser Thr Ile Lys Ala Tyr Leu Thr Ile His

370 375 380

tct tac tct caa atg atg ttg tac cca tac tct tac gac tac aag ttg 1200

Ser Tyr Ser Gln Met Met Leu Tyr Pro Tyr Ser Tyr Asp Tyr Lys Leu

385 390 395 400

cca gaa aac tac gag gag ttg aac gct ttg gtt aag ggt gct gct aaa 1248

Pro Glu Asn Tyr Glu Glu Leu Asn Ala Leu Val Lys Gly Ala Ala Lys

405 410 415

gaa ttg gct act ttg cac ggt act aaa tac act tac ggt cca ggt gct 1296

Glu Leu Ala Thr Leu His Gly Thr Lys Tyr Thr Tyr Gly Pro Gly Ala

420 425 430

act act att tac cca gct gct ggt ggt tct gac gac tgg tct tac gac 1344

Thr Thr Ile Tyr Pro Ala Ala Gly Gly Ser Asp Asp Trp Ser Tyr Asp

435 440 445

caa ggt att aag tac tct ttc act ttc gag ttg aga gat act ggt ttc 1392

Gln Gly Ile Lys Tyr Ser Phe Thr Phe Glu Leu Arg Asp Thr Gly Phe

450 455 460

ttc ggt ttc ttg ttg cct gag tcc caa att aga caa act tgt gag gaa 1440

Phe Gly Phe Leu Leu Pro Glu Ser Gln Ile Arg Gln Thr Cys Glu Glu

465 470 475 480

acc atg ttg gct gtt aag tac att gct aac tac gtt aga gag cac ttg 1488

Thr Met Leu Ala Val Lys Tyr Ile Ala Asn Tyr Val Arg Glu His Leu

485 490 495

tac taa taa 1497

Tyr

<210>4

<211>497

<212>PRT

<213>人工的

<220>

<400>4

Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser

1 5 10 15

Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln

20 25 30

Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp Phe

35 40 45

Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu

50 55 60

Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val

65 70 75 80

Ser Leu Glu Lys Arg Ser Ala Arg Gly Ser His His His His His His

85 90 95

Ala Ser Glu Glu His Phe Asp Gly Asn Arg ValTyr Arg Val Ser Val

100 105 110

His Gly Glu Asp His Val Asn Leu Ile Gln Glu Leu Ala Asn Thr Lys

115 120 125

Glu Ile Asp Phe Trp Lys Pro Asp Ser Ala Thr Gln Val Lys Pro Leu

130 135 140

Thr Thr Val Asp Phe His Val Lys Ala Glu Asp Val Ala Asp Val Glu

145 150 155 160

Asn Phe Leu Glu Glu Asn Glu Val His Tyr Glu Val Leu Ile Ser Asn

165 170 175

Val Arg Asn Ala Leu Glu Ser Gln Phe Asp Ser His Thr Arg Ala Ser

180 185 190

Gly His Ser Tyr Thr Lys Tyr Asn Asn Trp Glu Thr Ile Glu Ala Trp

195 200 205

Ile Gln Gln Val Ala Thr Asp Asn Pro Asp Leu Val Thr Gln Ser Val

210 215 220

Ile Gly Thr Thr Phe Glu Gly Arg Asn Met Tyr Val Leu Lys Ile Gly

225 230 235 240

Lys Thr Arg Pro Asn Lys Pro Ala Ile Phe Ile Asp Cys Gly Phe His

245 250 255

Ala Arg Glu Trp Ile Ser Pro Ala Phe Cys Gln Trp Phe Val Arg Glu

260 265 270

Ala Val Arg Thr Tyr Asn Gln Glu Ile His Met Lys Gln Leu Leu Asp

275 280 285

Glu Leu Asp Phe Tyr Val Leu Pro Val Val Asn Ile Asp Gly Tyr Val

290 295 300

Tyr Thr Trp Thr Lys Asp Arg Met Trp Arg Lys Thr Arg Ser Thr Met

305 310 315 320

Ala Gly Ser Ser Cys Leu Gly Val Asp Pro Asn Arg Asn Phe Asn Ala

325 330 335

Gly Trp Cys Glu Val Gly Ala Ser Arg Ser Pro Cys Ser Glu Thr Tyr

340 345 350

Cys Gly Pro Ala Pro Glu Ser Glu Lys Glu Thr Lys Ala Leu Ala Asp

355 360 365

Phe Ile Arg Asn Asn Leu Ser Thr Ile Lys Ala Tyr Leu Thr Ile His

370 375 380

Ser Tyr Ser Gln Met Met Leu Tyr Pro Tyr Ser Tyr Asp Tyr Lys Leu

385 390 395 400

Pro Glu Asn Tyr Glu Glu Leu Asn Ala Leu Val Lys Gly Ala Ala Lys

405 410 415

Glu Leu Ala Thr Leu His Gly Thr Lys Tyr Thr Tyr Gly Pro Gly Ala

420 425 430

Thr Thr Ile Tyr Pro Ala Ala Gly Gly Ser Asp Asp Trp Ser Tyr Asp

435 440 445

Gln Gly Ile Lys Tyr Ser Phe Thr Phe Glu Leu Arg Asp Thr Gly Phe

450 455 460

Phe Gly Phe Leu Leu Pro Glu Ser Gln Ile Arg Gln Thr Cys Glu Glu

465 470 475 480

Thr Met Leu Ala Val Lys Tyr Ile Ala Asn Tyr Val Arg Glu His Leu

485 490 495

Tyr

<210>5

<211>938

<212>DNA

<213>巴氏毕赤酵母

<220>

<221>启动子

<222>(1)..(938)

<223>巴氏毕赤酵母的AOX启动子

<400>5

agatctaaca tccaaagacg aaaggttgaa tgaaaccttt ttgccatccg acatccacag 60

gtccattctc acacataagt gccaaacgca acaggagggg atacactagc agcagaccgt 120

tgcaaacgca ggacctccac tcctcttctc ctcaacaccc acttttgcca tcgaaaaacc 180

agcccagtta ttgggcttga ttggagctcg ctcattccaa ttccttctat taggctacta 240

acaccatgac tttattagcc tgtctatcct ggcccccctg gcgaggttca tgtttgttta 300

tttccgaatg caacaagctc cgcattacac ccgaacatca ctccagatga gggctttctg 360

agtgtggggt caaatagttt catgttcccc aaatggccca aaactgacag tttaaacgct 420

gtcttggaac ctaatatgac aaaagcgtga tctcayccaa gatgaactaa gtttggttcg 480

ttgaaatgct aacggccagt tggtcaaaaa gaaacttcca aaagtcggca taccgtttgt 540

cttgtttggt attgattgac gaatgctcaa aaataatctc attaatgctt agcgcagtct 600

ctctatcgct tctgaacccc ggtgcacctg tgccgaaacg caaatgggga aacacccgct 660

ttttggatga ttatgcattg tctccacatt gtatgcttcc aagattctgg tgggaatact 720

gctgatagcc taacgttcat gatcaaaatt taactgttct aacccctact tgacagcaat 780

atataaacag aaggaagctg ccctgtctta aacctttttt tttatcatca ttattagctt 840

actttcataa ttgcgactgg ttccaattga caagcttttg attttaacga cttttaacga 900

caacttgaga agatcaaaaa acaactaatt attcgaaa 938

Claims

1.一种生产具有羧肽酶B活性的蛋白的方法，包括如下步骤：

a)提供一种含有编码由N-末端与组氨酸标记融合的大鼠前羧肽酶B和信号肽构成的前体蛋白的核苷酸序列的载体，

由此任选地在组氨酸标记和信号肽之间或在组氨酸标记和大鼠羧肽酶B之间插入一种间隔序列；

(b)采用该载体转化一种微生物宿主有机体；

(c)在含有营养物和碳源的生长培养基中培养该微生物宿主有机体，其中微生物宿主有机体表达前体蛋白并将组氨酸标记的前羧肽酶B分泌至生长培养基中；

(d)把步骤(c)的生长培养基中的分泌的组氨酸标记的前羧肽酶B固定在能结合组氨酸标记的颗粒状的金属螯合物亲和基质上，并冲洗颗粒状的金属螯合物亲和基质，从而将组氨酸标记的前羧肽酶B固定；

(e)在一种含有胰蛋白酶的缓冲液中温育步骤(d)中的带有固定化的组氨酸标记的前羧肽酶B的颗粒状的金属螯合物亲和基质，由此通过蛋白水解方式酶切前羧肽酶B部分并将具有羧肽酶B活性的蛋白释放到液相中，由此组氨酸标记的前肽部分被固定；

(f)从颗粒状的金属螯合物基质中分离含有具有羧肽酶B活性的蛋白的液相，由此组氨酸标记的前肽部分被固定；和

(g)从步骤(f)的液相中纯化具有羧肽酶B活性的蛋白。

2.根据权利要求1的方法，其特征在于所述的微生物宿主菌株是甲基营养酵母菌株。

3.根据权利要求1或2中任意一项的方法，其特征在于大鼠前羧肽酶B的氨基酸序列为SEQ ID NO：3中的14至415位的氨基酸序列。

4.根据权利要求1至3中任意一项的方法，其特征在于所述的信号肽含有邻近组氨酸标记或邻近间隔序列的信号肽酶切位点。

5.根据权利要求1至4中任意一项的方法，其特征在于所述的表达前体蛋白的氨基酸序列为SEQ ID NO：4的氨基酸序列。

6.根据权利要求1至5中任意一项的方法，其特征在于编码大鼠前羧肽酶B的核苷酸序列为SEQ ID NO：3中的286至1497位的氨基酸序列。

7.根据权利要求1至6中任意一项的方法，其特征在于编码所述的前体蛋白的核苷酸序列为SEQ ID NO：3中的核苷酸序列。

8.一种通过权利要求1至7中任意一项所述的方法制备的基本上不含有羧肽酶B的前肽并具有羧肽酶B活性的蛋白。

9.如权利要求8所述的基本上不含有羧肽酶B的前肽并具有羧肽酶B活性的蛋白在蛋白水解酶切肽键中的应用。

10.一种含有如权利要求8所述的基本上不含有羧肽酶B的前肽并具有羧肽酶B活性的蛋白的试剂溶液。