CN1555412A

CN1555412A - 氨肽酶

Info

Publication number: CN1555412A
Application number: CNA028179846A
Authority: CN
Inventors: Լ��C��; 约翰·C·乔利
Original assignee: Genentech Inc
Current assignee: Genentech Inc
Priority date: 2001-09-13
Filing date: 2002-09-12
Publication date: 2004-12-15
Anticipated expiration: 2022-09-12
Also published as: HUP0401869A2; ZA200401752B; JP2011177189A; CY1109903T1; JP2005502359A; KR100956907B1; NZ531516A; DK1432793T3; WO2003023030A2; KR20090018142A; EP1432793B1; JP4831932B2; EP1432793A2; DE60233417D1; CA2460309A1; KR20040041611A; HU0600309D0; JP5372061B2; IL160658A; PT1432793E

Abstract

本发明涉及一种革兰氏阴性细菌细胞，该细胞在存在于此类细胞野生型的一个染色体基因中有缺陷，该基因与天然序列yfcK基因有至少80％的序列同一性，并且编码氨肽酶。本发明还涉及一种革兰氏阴性细菌细胞，在存在于此类细胞野生型的一个染色体基因中有缺陷，该基因编码氨肽酶，其与天然序列氨肽酶b2324有至少80％的序列同一性。这些类型中的任一个细胞，当其包含编码异源多肽的核酸时，产生N末端未剪切的多肽，该细胞进行培养并回收多肽后，基本上不产生N末端剪切的多肽这种杂质。相反地，本发明提供一种方法，用于从多肽N末端切去一个氨基酸，包括将此多肽与氨肽酶接触，该氨肽酶与天然序列氨肽酶b2324有至少80％的序列同一性。

Description

氨肽酶

发明背景

1.发明领域

本发明涉及到一种新的细菌性氨肽酶的发现。更具体而言，本发明针对的是一种重要的酶活性，细菌中缺失或过表达该酶，将导致细菌中未剪切或已剪切的多肽(如重组多肽)的回收率增加。

2.相关技术说明

某些蛋白在革兰氏阴性菌和古细菌如大肠杆菌中产生时，由于这些细胞中氨肽酶的存在，其N端氨基酸残基会被剪切掉。结果，与野生型多肽紧密相关的杂质就会同时或是在随后的细胞裂解(作为产物纯化过程的一部分)中，进入细胞培养物。如果制备的是用于治疗的蛋白，这种杂质必须从野生型多肽中除去。一个实例是人生长激素(hGH)，当其在大肠杆菌中生产时会将N端的苯丙氨酸残基切除。这种通过细胞裂解产生的hGH变体(脱苯丙氨酸hGH，des-phe hGH)与未剪切的hGH(天然hGH)形成混合物，难于从混合物中去除。这种去除需要对混合物进行疏水相互作用层析。最好能避免此类额外的纯化步骤。

此外，在某些情况下，希望得到切除链N端氨基酸残基的多肽，并且使这种多肽的量相对于其天然序列对应物的量大大增加，以获得更纯的剪切物。

数种已知的大肠杆菌氨肽酶有广谱特异性并且能够剪切N端的多种残基，如pepA、pepB和pepN(大肠杆菌和沙门氏菌，Frederick C.Neidhardt(Ed)，ASM Press.Chapter 62 by Charles Miller-Protein Degradation and ProteolyticModification，pp 938-954(1996)；Gonzales and Robert-Baudouy， FEMS Microbiology Reviews. 18(4)：319-44(1996))。大肠杆菌K12菌株中发现的yfcK基因编码的b2324被大肠杆菌基因组测序计划(Blattner等， Science， 277：1453-62(1997))在GenBank数据库中列为“假定的肽酶”(登录号AE000321)，但未提供其酶活性的进一步信息。大肠杆菌O157:H7菌株中的同系物与K12菌株中的yfcK基因相同。本领域需要鉴定能通过操作获得更纯的未剪切或已剪切多肽的细菌氨肽酶。

发明概述

yfcK基因编码的b2324酶现已被鉴定为一种氨肽酶，即，一种负责从多肽中剪切N端的酶。在此鉴定的基础上，本发明提出专利申请。

在实施方案中，通过对染色体的遗传性破坏，将编码与该酶同源的氨肽酶的基因，包括编码氨肽酶b2324的yfcK基因，从革兰氏阴性菌株中去除，从而不再产生显著量的经剪切的杂质。因此排除了将已剪切的杂质除去的额外纯化步骤。至少已发现一个这样获得的菌株能够产生与母体菌株相同量的未剪切多肽。

具体地，本发明提供革兰氏阴性菌细胞，其染色体基因有缺陷，所述基因与以下分子有至少80％的序列同一性且编码氨肽酶：(a)编码具有SEQID NO：2中氨基酸残基1～688的天然序列氨肽酶b2324的DNA分子；或(b)DNA分子(a)的互补体。这些细胞的天然等效细胞包含所述染色体基因，但本发明的细胞表现了一种对野生型细胞的处理方法，通常是通过遗传手段，但也可通过任何可行的手段来去除这一基因或使其丧失功能，使得该基因不再编码氨肽酶。

一方面，本发明提供了革兰氏阴性菌细胞，其染色体基因有缺陷，所述基因包括：(a)编码多肽的DNA，所述多肽与SEQ ID NO：2中氨基酸残基1～688所示序列进行比对时阳性得分至少是80％，或(b)DNA分子(a)的互补体，所编码的多肽是氨肽酶。

又一方面，本发明提供了在染色体基因中有缺陷的革兰氏阴性菌细胞，所述基因与具有SEQ ID NO：1中核苷酸1～2067所示序列的yfcK基因天然序列有至少80％的序列同一性，而且编码氨肽酶。

在另一个实施方案中，本发明提供了一种大肠杆菌细胞，它在染色体天然序列yfcK基因中有缺陷。

优选上述细胞在至少一种蛋白酶编码基因(如degP或fhuA)中有缺陷。此外，这些细胞可包含编码该细胞异源多肽的核酸，优选真核生物的，更优选哺乳动物的，而最优选人类的多肽，如人生长激素。

在另一实施方案中，本发明提供了一种产生异源多肽的方法，该方法包括(a)培养上述细胞以及(b)从所述细胞中回收该多肽。优选在发酵罐中进行细胞培养。在另一优选的实施方案中，多肽是从细胞周质或培养基中回收的。在更优选的实施方案中，通过细胞破碎形成裂解物进行回收，并且优选从裂解物中纯化完整多肽。更优选其中的裂解物在纯化步骤前经过温育。

在另一方面，本发明提供了一种防止从多肽N端剪切氨基酸残基的方法，包括培养上述细胞，其中所说的细胞含有编码该多肽的核酸，培养要在该核酸能够表达的条件下进行。优选从这些细胞中回收多肽。此外，优选对这些细胞而言异源的多肽，更优选真核生物的，更优选哺乳动物的，而最优选人类的多肽。这些细胞优选大肠杆菌细胞。

在另一方面，本发明提供了一种从分离自细胞的多肽中剪切N端氨基酸的方法，该方法包括将多肽与核酸编码的氨肽酶接触，所述核酸与以下分子有至少80％的序列同一性：(a)编码具有SEQ ID NO：2中氨基酸残基1～688的天然序列氨肽酶b2324的DNA分子；或(b)DNA分子(a)的互补体。优选将多肽与氨肽酶一起温育。

另一方面，本发明提供了一种从分离自细胞的多肽中剪切N端氨基酸的方法，该方法包括将多肽与氨肽酶相接触，该氨肽酶与具有SEQ ID NO：2中氨基酸残基1～688所示序列的天然序列氨肽酶b2324有至少80％的序列同一性。

在一个具体的方面，本发明提供了一种从多肽N端切去一个氨基酸的方法，该方法包括将多肽与天然序列氨肽酶b2324相接触。

在另一实施方案中，本发明涉及产生经剪切的多肽的方法，包括，培养含有一种核酸的革兰氏阴性菌细胞，所述核酸与以下分子有至少80％的序列同一性且编码氨肽酶：(a)编码具有SEQ ID NO：2中氨基酸残基1～688的天然序列氨肽酶b2324的DNA分子；或(b)DNA分子(a)的互补体；所述细胞包含编码相应未剪切多肽的核酸，该多肽在其N末端有附加的氨基酸，其中所用的培养条件使该基因表达或过表达并使编码未剪切多肽的核酸表达，如果未剪切多肽和氨肽酶在表达以后不接触，则使所述未剪切多肽与氨肽酶接触，以产生经剪切的多肽。在优选方面，多肽对细胞是异源的，更优选真核生物的，甚至更优选哺乳动物的，而最优选人类的多肽。

在另一方面，本发明提供了一种产生经剪切的多肽的方法，包括培养革兰氏阴性细菌细胞，该细胞携有编码氨肽酶的核酸，该核酸与具有SEQ IDNO：1中核苷酸1～2067所示序列的yfcK基因天然序列有至少80％的序列同一性，所述细胞包含编码相应未剪切多肽的核酸，该多肽在其N末端有附加的氨基酸，其中所用的培养条件使该基因表达或过表达并使编码未剪切多肽的核酸表达，如果未剪切多肽和氨肽酶在表达以后不接触，可使所述未剪切多肽与氨肽酶接触，以产生经剪切的多肽。

在另一方面，本发明提供了一种产生经剪切的多肽的方法，该方法包括培养含有天然序列yfcK基因的大肠杆菌细胞，所述细胞包含编码相应未剪切多肽的核酸，该多肽在其N末端有附加的氨基酸，其中所用的培养条件使yfcK基因表达或过表达并使编码未剪切多肽的核酸表达，如果未剪切多肽和yfcK基因编码的天然序列氨肽酶b2324在表达以后不接触，可使所述未剪切多肽与天然序列氨肽酶b2324接触，以产生经剪切的多肽。

在产生经剪切的多肽的以上方法中，优选方面包括，所述细胞在至少一个编码蛋白酶的基因中有缺陷，和/或培养条件使yfcK基因(天然序列和同系物)过量表达，和/或接触通过温育进行。yfcK基因(天然序列和同系物)可以是细菌细胞天然具有的或者可以是被引入细菌细胞的。培养优选在发酵罐中进行。未剪切的多肽优选在与氨肽酶接触之前从细胞中回收，其中可从细胞周质或培养基中回收或者通过细胞裂解形成裂解物来回收，优选从该裂解物中纯化出经剪切的多肽。在纯化步骤前也可温育裂解物。裂解物优选在约20-40℃，更优选约30-40℃，温育至少约1小时，更优选约2-50小时。

附图说明

图1描述了大肠杆菌细胞61G3的衍生途径，该细胞是缺失yfcK基因(编码b2324)的宿主菌。

图2展示了室温下温育0，15，24和42小时的对照菌株16C9中，rhGH抽提物的面积百分比(液相层析/质谱；LC/MS)柱状图，天然hGH，脱苯丙氨酸hGH，以及脱苯丙氨酸-脯氨酸hGH的含量以不同的阴影显示。

图3展示了含有缺陷基因的于室温下温育0，15，24和42小时的菌株61G3中，rhGH的面积百分比(LC/MS)柱状图，天然hGH，脱苯丙氨酸hGH，以及脱苯丙氨酸-脯氨酸hGH的含量以不同的阴影显示。

图4展示了于37℃下温育0，15和24小时的对照菌株16C9中，rhGH抽提物的面积百分比(液相层析/质谱；LC/MS)柱状图，天然hGH，脱苯丙氨酸hGH，以及脱苯丙氨酸-脯氨酸hGH的含量以不同的阴影显示。

图5展示了含有缺陷基因的于37℃下温育0，15和24小时的菌株61G3中，rhGH的面积百分比(LC/MS)柱状图，天然hGH，脱苯丙氨酸hGH，以及脱苯丙氨酸-脯氨酸hGH的含量以不同的阴影显示。

优选实施方案详述

定义

正如这里使用的，“细胞”、“细胞系”、“菌株”以及“细胞培养物”这些表述可互换使用，而且所有这些名称都包括后代。因此，单词“转化体”和“转化细胞”包括原代受试者细胞以及从其得来的培养物，而不考虑转移次数。还应理解，由于有准备的或意外的突变，不一定所有的后代在DNA内容上都完全相同。那些筛选出来的与原初转化细胞具有同样功能或生物活性的突变体后代，也包括在内。不同的名称可以从上下文中清楚其意思。

这里使用的“细菌”是指革兰氏阴性细菌。一种优选的细菌类型是肠杆菌科。属于肠杆菌科细菌的例子包括埃希氏菌属、肠杆菌属、欧文氏菌属、克雷伯氏菌、变形菌属、沙门氏菌属、沙雷氏菌属以及志贺氏菌属。其它合适的细菌类型包括，固氮菌属、假单胞菌属、根瘤菌属、透明颤菌属以及副球菌属。合适的大肠杆菌宿主包括大肠杆菌W3110(ATCC27,325)、大肠杆菌294(ATCC31,446)、大肠杆菌B以及大肠杆菌X1776(ATCC31,537)。这些例子是用来说明而不是局限于此，而且W3110是优选的。上述任一种细菌的突变体细胞也可以使用。当然，选择合适的细菌时必须考虑细菌细胞中复制子的复制能力。例如，当使用众所周知的质粒如pBR322、pBR325、pACYC177或pKN410提供复制子时，大肠杆菌、沙雷氏菌或沙门氏菌等种类适于用作宿主。

“染色体yfcK基因”是指编码蛋白b2324的基因，该蛋白被大肠杆菌基因组测序计划(Blattner等，上已述及)作为“假定的肽酶”列在GenBank数据库中(登录号AE000321)。该蛋白有Dayhoff登录号B65005和SwissProt登录号P77182，该基因位于大肠杆菌染色体52.59′位置，其碱基对位置＝左端：2439784bp右端：2441790bp。该基因序列是：

TTGCGCAGCCTTACACACATCGCTAAGATCGAGCCACCGCCTGTAAGACGAGTAACTTAC

GTGAAACACTACTCCATACAACCTGCCAACCTCGAATTTAATGCTGAGGGTACACCTGTT

TCCCGAGATTTTGACGATGTCTATTTTTCCAACGATAACGGGCTGGAAGAGACGCGTTAT

GTTTTTCTGGGAGGCAACCAATTAGAGGTACGCTTTCCTGAGCATCCACATCCTCTGTTT

GTGGTAGCAGAGAGCGGCTTCGGCACCGGATTAAACTTCCTGACGCTATGGCAGGCATTT

GATCAGTTTCGCGAAGCGCATCCGCAAGCGCAATTACAACGCTTACATTTCATTAGTTTT

GAGAAATTTCCCCTCACCCGTGCGGATTTAGCCTTAGCGCATCAACACTGGCCGGAACTG

GCTCCGTGGGCAGAACAACTTCAGGCGCAGTGGCCAATGCCCTTGCCCGGTTGCCATCGT

TTATTGCTCGATGAAGGCCGCGTGACGCTGGATTTATGGTTTGGCGATATTAACGAACTG

ACCAGCCAACTGGACGATTCGCTAAATCAAAAAGTAGATGCCTGGTTTCTGGACGGCTTT

GCGCCAGCGAAAAACCCGGATATGTGGACGCAAAATCTGTTTAACGCCATGGCAAGGTTG

GCGCGTCCGGGCGGCACGCTGGCGACATTTACGTCTGCCGGTTTTGTCCGCCGCGGTTTG

CAGGACGCCGGATTCACGATGCAAAAACGTAAGGGCTTTGGGCGCAAACGGGAAATGCTT

TGCGGGGTGATGGAACAGACATTACCGCTCCCCTGCTCCGCGCCGTGGTTTAACCGCACG

GGCAGCAGCAAACGGGAAGCGGCGATTATCGGCGGTGGTATTGCCAGCGCGTTGTTGTCG

CTGGCGCTATTACGGCGCGGCTGGCAGGTAACGCTTTATTGCGCGGATGAGGCCCCCGCA

CTGGGTGCTTCCGGCAATCGCCAGGGGGCGCTGTATCCGTTATTAAGCAAACACGATGAG

GCGCTAAACCGCTTTTTCTCTAATGCGTTTACTTTTGCTCGTCGGTTTTACGACCAATTA

CCCGTTAAATTTGATCATGACTGGTGCGGCGTCACGCAGTTAGGCTGGGATGAGAAAAGC

CAGCATAAAATCGCACAGATGTTGTCAATGGATTTACCCGCAGAACTGGCTGTAGCCGTT

GAGGCAAATGCGGTTGAACAAATTACGGGCGTTGCGACAAATTGCAGCGGCATTACTTAT

CCGCAAGGTGGTTGGCTGTGCCCAGCAGAACTGACCCGTAATGTGCTGGAACTGGCGCAA

CAGCAGGGTTTGCAGATTTATTATCAATATCAGTTACAGAATTTATCCCGTAAGGATGAC

TGTTGGTTGTTGAATTTTGCAGGAGATCAGCAAGCAACACACAGCGTAGTGGTACTGGCG

AACGGGCATCAAATCAGCCGATTCAGCCAAACGTCGACTCTCCCGGTGTATTCGGTTGCC

GGGCAGGTCAGCCATATTCCGACAACGCCGGAATTGGCAGAGCTGAAGCAGGTGCTGTGC

TATGACGGTTATCTCACGCCACAAAATCCGGCGAATCAACATCATTGTATTGGTGCCAGT

TATCATCGCGGCAGCGAAGATACGGCGTACAGTGAGGACGATCAGCAGCAGAATCGCCAGCGGTTG

ATTGATTGTTTCCCGCAGGCACAGTGGGCAAAAGAGGTTGATGTCAGTGATAAAGAGGCGCGCTGCG

GTGTGCGTTGTGCCACCCGCGATCATCTGCCAATGGTAGGCAATGTTCCCGATTATGAGGCAACACT

CGTGGAATATGCGTCGTTGGCGGAGCAGAAAGATGAGGCGGTAAGCGCGCCGGTTTTTGACGATCTC

TTTATGTTTGCGGCTTTAGGTTCTCGCGGTTTG

TGTTCTGCCCCGCTGTGTGCCGAGATTCTGGCGGCGCAGATGAGCGACGAACCGATTCCG

ATGGATGCCAGTACGCTGGCGGCGTTAAACCCGAATCGGTTATGGGTGCGGAAATTGTTG

AAGGGTAAAGCGGTTAAGGCGGGGTAA(SEQ ID NO：1)

其编码的蛋白的序列为：

MRSLTHIAKIEPPPVRRVTYVKHYSIQPANLEFNAEGTPVSRDFDDVYFSNDNGLEETRYVFLGGNQLEV

RFPEHPHPLFVVAESGFGTGLNFLTLWQAFDQFREAHPQAQLQRLHFISFEKFPLTRADLALAHQHWPEL

APWAEQLQAQWPMPLPGCHRLLLDEGRVTLDLWFGDINELTSQLDDSLNQKVDAWFLDGFAPAKNPD

MWTQNLFNAMARLARPGGTLATFTSAGFVRRGLQDAGFTMQKRKGFGRKREMLCGVMEQTLPLPCSA

PWFNRTGSSKREAAIIGGGIASALLSLALLRRGWQVTLYCADEAPALGASGNRQGALYPLLSKHDEALNR

FFSNAFTFARRFYDQLPVKFDHDWCGVTQLGWDEKSQHKIAQMLSMDLPAELAVAVEANAVEQITGVA

TNCSGITYPQGGWLCPAELTRNVLELAQQQGLQIYYQYQLQNLSRKDDCWLLNFAGDQQATHSVVVLA

NGHQISRFSQTSTIPVYSVAGQVSHIPTTPELAELKQVLCYDGYLTPQNPANQHHCIGASYHRGSEDTAYS

EDDQQQNRQRLIDCFPQAQWAKEVDVSDKEARCGVRCATRDHLPMVGNVPDYEATLVEYASLAEQKD

EAVSAPVFDDLFMFAALGSRGLCSAPLCAEILAAQMSDEPIPMDASTLAALNpNRLWVRKLLKGKAVKA

G(SEQ ID NO：2).

基因或核酸中的“缺陷”是指细胞中目标基因缺失、失活或丧失能力等，导致不能产生其编码的蛋白。例如，在编码b2324的染色体基因yfcK中有缺陷的细胞，在培养时不能产生该基因的产物。同样，在编码蛋白酶的基因中有缺陷的细胞在培养时不能产生该具体的蛋白酶。

正如这里使用的，“多肽”一般是指来自任何细胞来源的含十个以上氨基酸的肽和蛋白。“异源”多肽是那些对所用细胞来说外来的多肽，如大肠杆菌产生的人类蛋白。尽管异源多肽可以是原核或真核的，优选真核的，更优选哺乳动物的，最优选人类的。

哺乳动物多肽的实例包括以下分子，例如，肾素；生长激素，包括人生长激素和牛生长激素；生长激素释放因子；甲状旁腺素；甲状腺刺激素；脂蛋白；1-抗胰蛋白酶；胰岛素A-链；胰岛素B-链；前胰岛素；血小板生成素；卵泡刺激素；降钙素；黄体生成素；胰高血糖素；凝血因子如凝血因子VIIIC，凝血因子IX，组织因子，和von Willebrands因子；抗-凝血因子，如蛋白C；心房利钠因子(atrial naturietic factor)；肺表面活性物质；纤溶酶原激活剂，例如尿激酶或人尿或组织型纤溶酶原激活剂(t-PA)；蛙皮素(bombesin)；凝血酶；造血生长因子；肿瘤坏死因子α和β；脑啡肽酶；血清白蛋白，例如人血清白蛋白；Muellerian抑制物质；松弛素A链；松弛素B链；前松弛素；小鼠绒毛膜促性腺激素相关肽；微生物蛋白，例如β内酰胺酶；DNase；抑制素；激活素；血管内皮生长因子(VEGF)；激素或生长因子的受体；整联蛋白；蛋白A或D；类风湿因子；神经营养因子，例如脑衍生的神经营养因子(BDNF)，神经营养蛋白-3、-4、-5或6(NT-3、NT-4、NT-5或NT-6)或神经生长因子NGF；心营养蛋白(cardiotrophin)(心肥大因子)如心营养因子-1(CT-1)；血小板衍生生长因子(PDGF)；成纤维细胞生长因子，例如aFGF和bFGF；表皮生长因子(EGF)；转化生长因子(TGF)，例如TGF-α和TGF-β，包括TGF-1、TGF-2、TGF-3、TGF-4或TGF-5；胰岛素样生长因子I和II(IGF-I和IGF-II)；des(1-3)-IGF-I(脑IGF-I)，胰岛素样生长因子结合蛋白；CD蛋白，例如CD3、CD4、CD8、和CD19；促红细胞生成素；骨诱导因子；免疫毒素；骨形态发生(morphogenetic)蛋白(BMP)；干扰素，例如干扰素-α、-β和γ；血清白蛋白，例如人血清白蛋白(HSA)或牛血清白蛋白(BSA)；集落刺激因子(CSF)，例如M-CSF、GM-CSF和G-CSF；白细胞介素(IL)，例如IL-1到IL-10；抗-HER-2抗体；超氧化物歧化酶；T细胞受体；表面膜蛋白；衰变(decay)加速因子；病毒抗原，例如AIDS包膜的一部分；转运蛋白；归巢受体；粘着素(adderssin)；调节蛋白；抗体；以及上述任何多肽的片段。一组优选的目的多肽是具有N-末端苯丙氨酸的那些，如hGH。另一组优选的目的多肽是产生在细菌的周质或细胞培养基中的那些，如hGH。

术语“控制序列”是指在具体宿主生物中表达可操作连接的编码序列所必需的DNA序列。适宜于细菌的控制序列包括启动子，任选地操纵子序列，和核糖体结合位点。

当核酸处于与另一个核酸序列有功能关系的位置上时，该核酸是“可操作相连的”。例如，前序列或分泌前导序列被表达为参与多肽分泌的前蛋白时，编码前序列或分泌前导序列的DNA与编码该多肽的DNA是可操作相连的；启动子影响编码序列的转录时，其与该编码序列是可操作相连的；核糖体结合位点处在促进翻译的位置上时，它与编码序列是可操作相连的。通常，“可操作相连”是指相连的DNA是邻接的，而且，在分泌前导序列的情况中，是邻接并处在同一个阅读框中的。连接可通过，例如，在便利的限制性位点连接来完成的。如果不存在这类位点，可根据常规实践使用合成的寡核苷酸接头或连接区。

关于基因或核酸的术语“过表达”，是指具体蛋白的合成量超过了该细胞在未经人为诱导该合成时通常所产生的量，如利用启动子的方法。

术语多肽的“回收”通常是指从产生该多肽的细胞中获得该多肽的释放。

术语“氨肽酶b2324多肽”、“氨肽酶b2324蛋白”以及“氨肽酶b2324”在这里使用时，包含天然氨肽酶b2324和氨肽酶b2324同系物(其在这里有更进一步的说明)。根据上下文，氨肽酶b2324多肽可以从多种来源分离得到，例如从细菌细胞得到，或通过重组方法和/或合成方法来制备。

“天然序列氨肽酶b2324”包括与天然产生的氨肽酶b2324具有同样的氨基酸序列的多肽。此类天然序列氨肽酶b2324可以从自然界分离，也可以用重组方法和/或合成方法产生。术语“天然序列氨肽酶b2324”具体包括，天然产生的截短形式或分泌形式(例如，胞外区序列)、天然产生的变异体形式(例如，选择性剪接形式)以及天然产生的氨肽酶b2324等位基因变异体。在本发明的一个实施方案中，天然序列氨肽酶b2324是包含SEQ IDNO：2中氨基酸1～688的成熟或全长天然序列氨肽酶b2324。

“氨肽酶b2324同系物”是指与具有SEQ ID NO：2中氨基酸残基1～688所示序列的氨肽酶b2324有至少80％序列同一性的氨肽酶。此类氨肽酶b2324同系物包括，在SEQ ID NO：2序列的N-或C-末端以及在一个或多个内部结构域中，添加或删除了一个或多个氨基酸残基的氨肽酶b2324多肽。优选氨肽酶b2324同系物与SEQ ID NO：2的残基1～688所示氨基酸序列有至少85％的氨基酸序列同一性，更优选至少90％，甚至更优选至少95％。同系物不包括该天然序列。

yfcK基因是指，与以下分子有至少80％的序列同一性且编码氨肽酶的基因：(a)编码具有SEQ ID NO：2中氨基酸残基1～688的天然序列氨肽酶b2324的DNA分子；或(b)DNA分子(a)的互补体；还指与具有SEQ ID NO：1完整序列的染色体yfcK基因有至少80％的序列同一性并编码氨肽酶的基因。此类yfcK基因包括，例如染色体yfcK基因，其在SEQ ID NO：1序列的5’-或3’-端以及内部区域中，添加或删除了一个或多个核苷酸残基。优选yfcK基因与SEQ ID NO：1的核苷酸1～2067所示序列有至少85％的核酸序列同一性，更优选至少90％，甚至更优选至少95％。该术语包括天然序列yfcK基因(即染色体yfcK基因)。

就这里确定的氨肽酶b2324序列而言，“氨基酸序列同一性百分数(％)”定义为，经序列比对以及必要时引入缺口以达到最大序列同一性百分数，而且将任何保守取代都不作为序列同一性来考虑时，候选序列与氨肽酶b2324序列中相同的氨基酸残基的百分数。这里用到的％同一性值可通过WU-BLAST-2产生，WU-BLAST-2可从(Altschul等， Methods in Enzymology， 266：460-480(1996)； http：//blast.wustl/edu/blast/README.html)获得。WU-BLAST-2使用数个搜索参数，其中大多数设定为默认值。可调整的参数用下列值来设定：重叠跨度(overlap span)＝1，重叠分数(overlapfraction)＝0.125，搜索单词分数阈值(word threshold)(T)＝11。HSP S和HSP S2参数是动态值，是程序本身依据具体序列组成和用以搜索目标序列的具体数据库组成来建立的；不过，可调整这些值以提高灵敏度。氨基酸序列同一性％值用相同残基的数目除以比对区域中“较长”序列的残基总数来确定。“较长”序列是比对区域中具有最真实残基的序列(忽略WU-Blast-2为使比对分数最大化而引入的缺口)。

在如上述进行序列比较的上下文中，术语“阳性”包括经比较的序列中那些不相同但有相似性质的残基(例如是保守取代的结果)。阳性的％值是用在BLOSUM 62矩阵中得正分的残基部分，除以如上述定义的较长序列的残基总数来确定的。

以类似的方式，就这里确定的氨肽酶b2324多肽编码序列而言，“核苷酸序列同一性百分数(％)”定义为，在候选序列中与该氨肽酶b2324多肽编码序列中相同的核苷酸残基的百分数。这里用到的同一性值可以通过WU-BLAST-2的BLASTN模块来产生，使用默认参数，其中重叠跨度和重叠分数分别设定为1和0.125。

“分离的”，当用于描述本文公开的各种多肽时，是指已从其天然环境组分中鉴定和分离和/或收获的多肽。肽的天然环境中的污染成分，是通常将干扰该多肽的诊断和治疗应用的物质，可包括酶、激素和其它蛋白性或非-蛋白性溶质。在优选的实施方案中，多肽经过纯化可以达到以下程度：(1)经转杯式测序仪(spinning cup sequenaor)测出N-末端或内部氨基酸序列的至少15个残基，或者(2)经过非-还原或还原条件下的SDS-PAGE和考马斯蓝或优选银染色测出为均相。分离的多肽包括在重组细胞内的原位多肽，因为氨肽酶b2324天然环境的至少一种组分是不存在的。然而，通常用至少一个纯化步骤来制备分离的多肽。

编码氨肽酶b2324多肽的“分离的”核酸分子，是从氨肽酶b2324编码核酸的天然来源中鉴定出并与该来源中通常与其相关的至少一种核酸分子污染物分离的核酸分子。分离的氨肽酶b2324编码核酸分子在形式或框架上与其在天然中发现的不同。分离的核酸分子由此与氨肽酶b2324编码核酸分子在天然细胞中的形式区别开来。但编码氨肽酶b2324多肽的分离的核酸分子还包括，在通常表达氨肽酶b2324、但该核酸分子的染色体位置不同于天然细胞中位置的那些细胞中所含有的编码氨肽酶b2324的核酸分子。

具体实施方式

在一个方面，本发明涉及细菌性宿主细胞株，该细胞株缺乏氨肽酶(即，剪切多肽N端氨基酸残基的酶，例如在N末端苯丙氨酸和另一个紧挨着它的氨基酸之间进行剪切的酶)，因此允许对多肽进一步纯化。

具体地，本发明这一方面提供了一种革兰氏阴性菌细胞，该细胞在染色体基因中有缺陷(这一基因在这些细胞的野生型中并无缺陷)，所述基因与以下分子有至少80％的序列同一性且编码氨肽酶：(a)编码具有SEQ IDNO：2中氨基酸残基1～688的天然序列氨肽酶b2324的DNA分子；或(b)DNA分子(a)的互补体。即，所述基因与yfcK基因共享至少80％的序列同一性。优选地，该基因与yfcK基因(编码天然序列氨肽酶b2324)共享至少约85％的序列同一性，更优选至少约90％，还更优选至少约95％，最优选100％的序列同一性。

在另一方面，所述革兰氏阴性菌细胞在编码氨肽酶的染色体基因中有缺陷(这一基因在这些细胞的野生型中并无缺陷)，该基因与具有SEQ IDNO：2中氨基酸1～688的天然序列氨肽酶b2324有至少80％的序列同一性。优选地，所述氨肽酶有至少约85％，更优选至少约90％，还更优选至少约95％的序列同一性。这包括在染色体yfcK基因天然序列中有缺陷的细胞。

在第三个方面，所述革兰氏阴性菌细胞在染色体基因中有缺陷(这一基因在这些细胞的野生型中并无缺陷)，所述基因包括：(a)编码多肽的DNA，所述多肽与跨越SEQ ID NO：2中氨基酸残基1～688的天然序列氨肽酶b2324进行比对时阳性得分至少是80％，或(b)DNA分子(a)的互补体，所述多肽是氨肽酶。这包括与天然序列氨肽酶b2324的阳性比对得分为100％的细胞。

本发明这一方面的研究对象是革兰氏阴性菌细胞，例如基因组已测序的细菌，如沙门氏菌属、耶尔森氏菌属、嗜血菌属、柄杆菌属、琼脂杆菌属(Agrobacterium)、弧菌属等，其中预计有yfcK同系物。更优选沙门氏菌属或肠杆菌科的细胞，还更优选大肠杆菌，最优选W3110。

细胞可在一个或多个其它的染色体基因中有进一步的缺失，所述基因是这些细胞的野生型中存在的基因，例如那些编码细菌性蛋白酶的基因。蛋白酶基因有缺陷或控制对蛋白酶的调节的基因中有缺陷的大肠杆菌菌株是已知的(Beckwith and Strauch，WO 88/05821 published August 11，1988；Chaudhury and Smith， J.Bacteriol.， 160：788-791(1984)；Elish等.， J.Gen. Microbiol.，134：1355-1364(1988)；Baneyx and Georgiou，“Expression ofproteolytically sensitive polypeptides in Escherichia coli，”In： Stability of Protein Pharmaceuticals，Vol.3：Chemical and Physical Pathways of Protein Degradation，Ahern and Manning，eds.(Plenum Press，New York，1992)，p.69-108)。

这些蛋白酶缺陷菌株中的一些已用于尝试有效产生对蛋白水解作用敏感的多肽，特别是那些有潜在医药或商业价值的多肽。美国专利5,508,192(Georgiou等)描述了许多蛋白酶缺陷型和/或热休克蛋白缺陷型细菌宿主的构建。这些宿主包括单一、双重、三重或四重蛋白酶缺陷的细菌和在rpoH基因中也带有突变的单一蛋白酶细菌。已公开的蛋白酶基因的例子包括degP ompT ptr3，prc(tsp)和degP rpoH株，据报道，其可在大肠杆菌中产生大量重组蛋白。Park等， Biotechnol.Prog.， 15：164-167(1999)报道缺失两种细胞外膜蛋白酶(degP prc)的菌株(HM114)与有更多蛋白酶缺失的其它菌株相比，生长稍快并且产生更多的融合蛋白。本文的细胞可缺失任何一个或多个这样的蛋白酶，所述蛋白酶优选为染色体ptr3编码的蛋白酶III，染色体ompT编码的蛋白酶OmpT，和/或染色体degP编码的蛋白酶DegP。这些菌株也可在tonA(fhuA)，phoA，和/或deoC中有缺陷。优选在degP和/或fhuA中有缺陷的细胞。最优选具有基因型W3110ΔfhuAΔ(arg-F-lac)169phoAΔE15 deoC2 degP∷kanR ilvG2096ΔyfcK的细胞。

在另一实施方案中，细胞中包含编码对细胞而言是异源的多肽的核酸。该核酸可通过任何方式引入细胞，但是优选使用转化该核酸的方式，诸如通过使用重组表达载体或通过同源重组方式，最优选通过载体引入。

合适的异源多肽例如以上定义的那些，并包括以甲硫氨酸残基起始而且第二个残基是苯丙氨酸的蛋白和多肽，以及以苯丙氨酸起始的蛋白(即，那些在成熟形态中以苯丙氨酸起始或经进一步蛋白水解化处理以去除起始甲硫氨酸的蛋白，和那些切除了信号肽、剩下苯丙氨酸作为成熟蛋白N末端残基的前蛋白，例如人生长激素)。因此，任何对其生产细菌细胞而言是异源的、并且其成熟产物或终产物的氨基端是苯丙氨酸的那些多肽，都将为了这一目的而包括在本文中。

符合苯丙氨酸这一位置要求的人类多肽的例子包括胶原蛋白α2链前体、T细胞表面糖蛋白cd3δ链前体、胰岛素前体、整联蛋白α-3前体、整联蛋白α-5前体、整联蛋白α-6前体、整联蛋白α-7前体、整联蛋白α-e前体、整联蛋白α-m前体、整联蛋白α-v前体、整联蛋白α-x前体、磷脂酰胆碱-甾醇酰基转移酶前体、淋巴细胞功能相关抗原3前体、间质胶原酶前体、中性胶原酶前体、胃动素前体、neuropilin-1前体、血小板激活因子乙酰水解酶前体、骨唾液蛋白ii前体、生长激素变体前体(Seeburg，DNA 1：239-249(1982))、促生长激素前体、小分子诱导型细胞因子a13前体、小分子诱导型细胞因子a27前体、小分子诱导型细胞因子b11前体、肿瘤坏死因子受体超家族成员8前体、促甲状腺素β链前体、血管内皮生长因子c前体、前原胰岛素(BE885196-A)、人生长激素变体HGH-V(EP89666-A)、人原胰岛素(US4431740)、pAP-1(EP177343-A)编码的AP信号肽以及人生长激素(hGH)、人生长激素(hGF)前体(EP245138-A)、人BMP(EP409472-A)人LFA-3(CD58)蛋白(DE4008354-A)、人II型白细胞介素-1受体(EP460846-A)、肾毒性减弱的抑酶肽类似物#6(WO9206111-A)、肾毒性减弱的抑酶肽类似物#7(WO9206111-A)、肾毒性减弱的抑酶肽类似物#8(WO9206111-A)、肾毒性减弱的抑酶肽类似物#10(WO9206111-A)、肾毒性减弱的抑酶肽类似物#9(WO9206111-A)、肾毒性减弱的抑酶肽类似物#11(WO9206111-A)、肾毒性减弱的抑酶肽类似物#12(WO9206111-A)、肾毒性减弱的抑酶肽类似物#13(WO9206111-A)、肾毒性减弱的抑酶肽类似物#14(WO9206111-A)、α6A整联蛋白亚基(WO9219647-A)、α6B整联蛋白亚基(WO9219647-A)、人LFA-3蛋白(EP517174-A)、人血浆羧肽酶B(US5206161-A)、类淋巴母细胞源的IL-1R(WO9319777-A)、人LFA-3(JP06157334-A)、由淋巴细胞激活(ILA)诱导的人类受体(CA2108401-A)、内皮细胞蛋白受体(WO9605303-A1)、人卵磷脂-胆固醇酰基转移酶(LCAT)(WO9717434-A2)，人的可溶性CD30抗原(DE9219038-U1)、人的小分子CCN样生长因子(WO9639486-A1)、人血浆羧肽酶B(US5593674-A)、人生长激素(WO9820035-A1)、由质粒pKFN-864片段编码的胰岛素类似物(EP861851-A1)、灵长类CXC趋化因子“IBICK”多肽(WO9832858-A2)、人的小分子CCN样生长因子(US5780263-A)、人血浆透明质酸酶(hpHAse)的氨基酸序列(WO9816655-A1)、人II型IL-1R蛋白(US5767064-A)、人(homo sapiens)克隆CC365_40蛋白(WO9807859-A2)、人生长激素(US5955346-A)、人可溶性生长激素受体(US5955346-A)、人CD30抗原蛋白(WO9940187-A1)、人neuropilin-1(WO9929858-A1)、人脑组织来源的多肽(克隆OMB096)(WO9933873-A1)、人Toll蛋白PRO285(WO9920756-A2)、人分泌肽的氨基酸序列(WO9911293-A1)、人分泌肽的氨基酸序列(WO9911293-A1)、人分泌肽的氨基酸序列(WO9911293-A1)、人分泌肽的氨基酸序列(WO9911293-A1)、人分泌蛋白的氨基酸序列(WO9907891-A1)、人分泌蛋白的氨基酸序列(WO9907891-A1)、人分泌蛋白的氨基酸序列(WO9907891-A1)、人血浆羧肽酶B(PCPB)thr147(WO9855645-A1)、人趋化因子MIG-β蛋白(EP887409-A1)、人分泌蛋白的氨基酸序列(WO200052151-A2)、由质粒pWRG1630编码的人hGH/EGF融合蛋白(US6090790-A)、由cDNA克隆3470865编码的人分泌蛋白(WO200037634-A2)、人单核细胞来源的蛋白FDF03DeltaTM(WO200040721-A1)、人单核细胞来源的蛋白FDF03-S1(WO200040721-A1)、人单核细胞来源的蛋白FDF03-M14(WO200040721-A1)、人单核细胞来源的蛋白FDF03-S2(WO200040721-A1)、人分泌蛋白#2(EP1033401-A2)、人前原-血管内皮生长因子C(WO200021560-A1)、人膜转运蛋白MTRP-15(WO200026245-A2)、人血管内皮生长因子(VEGF)-C蛋白(WO200024412-A2)、人TANGO191(WO200018800-A1)、干扰素受体-HKAEF92(WO9962934-A1)、人整联蛋白亚基α-10(WO9951639-A1)、人整联蛋白亚基α-10剪接变体(WO9951639-A1)、人δ1-吡咯啉-5-羧酸酯还原酶同系物(P5CRH)(US6268192-B1)、人生长/分化因子-6-样蛋白AMF10(WO200174897-A2)、人转运蛋白和离子通道-6(TRICH-6)蛋白(WO200162923-A2)、人转运蛋白和离子通道-7(TRICH-7)蛋白(WO200162923-A2)、人基质金属蛋白酶-1(MMP-1)蛋白(WO200166766-A2)、人基质金属蛋白酶-8(MMP-8)蛋白(WO200166766-A2)、人基质金属蛋白酶-18P(MMP-18P)蛋白(WO200166766-A2)、人G蛋白偶联受体6(GPCR6)蛋白(WO200181378-A2)、人Zlec1蛋白(WO200166749-A2)、人基质金属蛋白酶(MMP)-样蛋白(WO200157255-A1)、人基因15编码的分泌蛋白HFXDI56(WO200154708-A1)、人基因9编码的分泌蛋白HTEGF16(WO200154708-A1)、人分泌蛋白(SECP)#4(WO200151636-A2)、人基因20编码的分泌蛋白HUSIB13(WO200151504-A1)、人基因28编码的分泌蛋白HISAQ04(WO200151504-A1)、人基因35编码的分泌蛋白HCNAH57(WO200151504-A1)、人基因17编码的分泌蛋白HBMCF37(WO200151504-A1)、人肿瘤坏死因子(TNF)刺激d基因-6(TSG-6)蛋白(US6210905-B1)、FCTR10(WO200146231-A2)、人基因18编码的分泌蛋白HFKHW50(WO200136440-A1)、人基因18编码的分泌蛋白HFKHW50(WO200136440-A1)、人基因13编码的分泌蛋白HE8FC45(WO200077022-A1)、人基因32编码的分泌蛋白HTLIF12(WO200077022-A1)、人基因4编码的分泌蛋白HCRPV17(WO200134643-A1)、人基因23编码的分泌蛋白HE8OK73(WO200134643-A1)、人基因4编码的分泌蛋白HCRPV17(WO200134643-A1)、人基因22编码的分泌蛋白HMSFK67(WO200132676-A1)、人基因22编码的分泌蛋白HMSFK67(WO200132676-A1)、人基因22编码的分泌蛋白HMSFK67(WO200132676-A1)、人基因19编码的分泌蛋白HCRNF14(WO200134800-A1)、人基因6编码的分泌蛋白HNEEB45(WO200132687-A1)、人基因6编码的分泌蛋白HNEEB45(WO200132687-A1)、人基因9编码的分泌蛋白HHPDV90(WO200132675-A1)、人基因1编码的分泌蛋白B7-H6(WO200134768-A2)、人基因3编码的分泌蛋白HDPMS12(WO200134768-A2)、人基因13编码的分泌蛋白HRABS65(WO200134768-A2)、人基因1编码的分泌蛋白HDPAP35(WO200134768-A2)、人基因3编码的分泌蛋白HDPMS12(WO200134768-A2)、人基因17编码的分泌蛋白HACCL63(WO200134769-A2)、人基因17编码的分泌蛋白HACCL63(WO200134769-A2)、人基因10编码的分泌蛋白HHEPJ23(WO200134629-A1)、人基因10编码的分泌蛋白HHEPJ23(WO200134629-A1)、人基因5编码的分泌蛋白HE9QN39(WO200134626-A1)、人基因14编码的分泌蛋白HCRNO87(SEQ 104)(WO200134626-A1)、人基因5编码的分泌蛋白HE9QN39(WO200134626-A1)、人基因14编码的分泌蛋白HCRNO87((SEQ 145)(WO200134626-A1)、人基因4编码的分泌蛋白HSODE04(WO200134623-A1)、人基因6编码的分泌蛋白HMZMF54(WO200134623-A1)、人基因18编码的分泌蛋白HPJAP43(WO200134623-A1)、人基因27编码的分泌蛋白HNTSL47(WO200134623-A1)、人基因4编码的分泌蛋白HSODE04(WO200134623-A1)、人基因6编码的分泌蛋白HMZMF54(WO200134623-A1)、人基因18编码的分泌蛋白HPJAP43(WO200134623-A1)、人基因27编码的分泌蛋白HNTSL47(WO200134623-A1)、人基因21编码的分泌蛋白HLJEA01(WO200134767-A2)、人基因25编码的分泌蛋白HTJNX29(SEQ 115)(WO200134627-A1)、人基因25编码的分泌蛋白HTJNX29(SEQ 165)(WO200134627-A1)、人TANGO509氨基酸序列(WO200121631-A2)、人TANGO210蛋白(WO200118016-A1)、人癌症相关蛋白12(WO200118014-A1)、人癌症相关蛋白18(WO200118014-A1)、人B7-4分泌型(B7-4S)蛋白(WO200114557-A1)、人B7-4膜蛋白(B7-4M)(WO200114557-A1)、人B7-4分泌型(B7-4S)蛋白(WO200114556-A1)、人B7-4膜(B7-4M)蛋白(WO200114556-A1)、人白细胞介素DNAX80变体(WO200109176-A2)、人卵磷脂-胆固醇酰基转移酶(LCAT)(WO200105943-A2)、人多肽PRO1419的氨基酸序列(WO200077037-A2)、人α11整联蛋白链的氨基酸序列(WO200075187-A1)、人A259(WO200073339-A1)、人骨髓来源的肽(WO200166558-A1)、人肿瘤相关抗原靶-169(TAT169)蛋白(WO200216602-A2)、人基因3编码的分泌蛋白HKZAO35ID(WO200218411-A1)、人基因3编码的分泌蛋白HKZAO35(WO200218411-A1)、人基因11编码的分泌蛋白HLYCK27(WO200218435-A1)、人INTG-1蛋白(WO200212339-A2)、人基因15编码的分泌蛋白HFPHA80，SEQ 70(WO200216390-A1)、人基因15编码的分泌蛋白HFPHA80，SEQ 94(WO200216390-A1)、人基因2编码的分泌蛋白HDQFU73，SEQ 69(WO200224719-A1)、人基因8编码的分泌蛋白HDPTC31，SEQ 75(WO200224719-A1)、人基因2编码的分泌蛋白HDQFU73，SEQ 90(WO200224719-A1)、人基因6编码的分泌蛋白HDPRJ60，SEQ 95(WO200224719-A1)、人基因8编码的分泌蛋白HDPTC31，SEQ 99(WO200224719-A1)、人基因8编码的分泌蛋白HDPTC31，SEQ 100(WO200224719-A1)、人原胰岛素类似物(WO200204481-A2)、肿瘤相关抗原靶蛋白TAT136(WO200216429-A2)、肿瘤相关抗原靶多肽(TAT)136(WO200216581-A2)、人CD30蛋白序列(WO200211767-A2)、人白细胞介素1R2(IL-1R2)蛋白序列(WO200211767-A2)、人G蛋白偶联的受体-7(GPCR-7)蛋白(WO200206342-A2)、人G蛋白偶联的受体(GPCR6a)(WO200208289-A2)、人G蛋白偶联的受体(GPCR6b)(WO200208289-A2)、人II型白细胞介素-1受体(WO200187328-A2)、人A259多肽(WO200181414-A2)、人血管细胞粘附分子VCAM1(US6307025-B1)、人血管细胞粘附分子VCAM1b(US6307025-B1)、人转运蛋白和离子通道(TRICH)-6(WO200177174-A2)以及人蛋白修饰和维持分子-8(PMMM-8)(WO200202603-A2)。

在另一方面上，本发明提供了一种产生异源多肽的方法，该方法包括(a)培养携有编码异源多肽的核酸的细胞，以及(b)从该细胞中回收此多肽。可从细胞质、细胞周质或细胞培养基中进行回收，优选从细胞周质或细胞培养基中回收多肽。优选在发酵罐中进行培养。按照传统方式使用培养参数和获得多肽产物，例如以下描述的那些方法。

当所需多肽在细胞质中产生时，不必在细胞裂解之前或之后进行温育，尽管这样可以提高剪切物形成的效率。当所需多肽分泌到细胞周质或细胞培养基中时，则优选和推荐一个至少约0.5小时的温育步骤。为了回收生成在周质中的多肽，优选方法是裂解或破碎细胞，体积较大时采用，例如，匀浆器、弗氏细胞压碎器和微流化器(microfluidizer)，体积较小时采用超声破碎仪。从破碎的细胞中得到裂解物，然后从中纯化出完整的多肽。优选在纯化步骤前温育上述裂解物。温育可在任何适宜的温度下操作，但优选在室温或以下温度温育至少约1小时，更优选约2-50小时。多肽和细胞类型优选如上所述。

此外，本发明提供了一种防止从多肽N端剪切氨基酸残基的方法，该方法包括培养细胞，所述细胞包含编码多肽的核酸，所用培养条件使该核酸表达。这些培养条件是常规的并且是本领域技术人员已知的。优选从所述细胞回收多肽。优选的多肽和细胞类型如上所述。

或者相反，从视为杂质的未剪切多肽中纯化经剪切的多肽。在这个方面，本发明提供了一种从多肽中剪切N端氨基酸的方法，该方法包括将多肽与氨肽酶b2324蛋白按以上所描述进行接触，其中优选通过与氨肽酶b2324蛋白共同温育进行接触。产生剪切多肽的更进一步的方法包括培养含有yfcK基因的细菌细胞(无论该基因对细胞来讲是内源的或异源的)，所述细胞还包含编码相应未剪切多肽的核酸，该多肽在其N端有附加氨基酸，其中的培养条件使yfcK基因表达或过表达并使编码未剪切多肽的核酸表达，并且如果未剪切多肽和氨肽酶b2324蛋白在表达后并不接触，将未剪切多肽与氨肽酶b2324蛋白相接触以便产生经剪切的多肽。

优选地，所述多肽对细胞而言是异源的，并且更优选是上文列出的一种多肽。优选地，细胞的类型选自上文所述，除了未缺失yfcK基因的细胞以外的类型。yfcK基因可由载体导入或对宿主细胞而言是内源的，并且优选相对于编码多肽的核酸的表达而言被过表达，以便有助于酶切反应。

在另一优选方面，未剪切的多肽在与氨肽酶b2324蛋白接触前从细胞中回收。在回收中，优选破碎(采用上述技术)并且随后裂解细胞。裂解后，优选将未剪切的多肽与氨肽酶b2324蛋白温育以剪切掉氨基末端，并且从温育后的裂解物中纯化剪切的多肽。裂解物优选在约20-40℃温育至少约1小时，更优选在约30-40℃温育约2-50小时。

I.未剪切的多肽的生产和回收

A.将核酸分子插入复制载体

编码目的多肽的核酸分子可以是任何来源的cDNA或基因组DNA，只要该分子编码目的多肽。

异源核酸(例如cDNA或基因组DNA)可以插入能在细菌中表达的复制载体并处于合适的启动子控制下。很多载体可用于此目的，选择合适的载体主要根据将插入该载体的核酸的大小以及将用该载体转化的具体宿主细胞。每一种载体多种与具体宿主细胞相容的组分。根据具体宿主类型，载体组分通常包括，但不仅限于，下面的一个或更多：信号序列、复制起点、一个或更多的标记基因、启动子以及转录终止序列。

通常，将含有起源于与宿主细胞相容种类的复制子和控制序列的质粒载体与大肠杆菌宿主联合使用。载体通常携带复制位点，以及能够在转化细胞中提供表型选择的标记序列。例如，大肠杆菌通常用pBR322转化，这是一种来源于大肠杆菌种类的质粒(见如Bolivar等，Gene，2：95(1977))。pBR322包含氨苄青霉素和四环素抗性基因，提供了用于鉴定转化细胞的便利手段。pBR322质粒或其它细菌质粒或噬菌体，一般还包含，或经修饰后包含那些可由大肠杆菌宿主用来表达可选择标记基因的启动子。

(i)信号序列组分

编码本文目的多肽的DNA可以直接表达，也可以与另一多肽一起作为融合蛋白，该另一多肽优选信号序列或其它在成熟多肽N末端具有特异性切割位点的多肽。通常，信号序列可以是载体的一种成份，或是插入载体的多肽DNA的一部分。所选的异源信号序列应该是可被宿主细胞识别和加工的(即被信号肽酶切割)。

对于不识别和加工天然的或真核多肽的信号序列的细菌宿主细胞，可以将信号序列替换为合适的原核信号序列，后者例如选自碱性磷酸酶、青霉素酶、lpp或热稳定肠毒素II前导序列等。

(ii)复制起点组分

表达载体含有能够使该载体在一个或更多选定的宿主细胞中复制的核酸序列。已经熟知用于多种细菌的此类序列。质粒pBR322的复制起点适合于大多数革兰氏阴性细菌如大肠杆菌。

(iii)选择基因组分

表达载体通常包括一个选择基因，也称为选择标记。该基因编码转化宿主细胞在选择性培养基中存活或生长所必需的蛋白质。没有用含有该选择基因的质粒转化的宿主细胞将不能在该培养基中存活。此可选择的标记是不同于本发明使用和定义的遗传标记的。典型的选择基因编码具有以下特性的蛋白：(a)赋予对抗生素或其它毒素，如氨苄青霉素、新霉素、氨甲蝶呤或四环素的抗性，或(b)弥补并非由遗传标记的存在而引起的营养缺陷，或(c)补充无法从合成培养基中获得的关键营养，如编码细菌D-丙氨酸消旋酶的基因。

选择方案的一个例子是利用药物使宿主细胞生长停滞。在该例中，那些成功地用目的核酸转化的细胞，产生赋予抗药性的多肽，从而在选择中存活下来。这种显性选择的例子利用了药物新霉素(Southern等，J.Molec.Appl.Genet.，1：327(1982))、麦考酚酸(Mulligan等，Science，209：1422(1980))或潮霉素(Sugden等，Mol.Cell.Biol.，5：410-413(1985))。上面给出的三个例子分别利用在真核控制下的细菌基因，来赋予对相应药物G418或新霉素(geneticin)、xgpt(麦考酚酸)、或潮霉素的抗性。

(iv)启动子组分

用于产生目的多肽的表达载体包括合适的启动子，其可被宿主生物识别而且与编码目的多肽的核酸可操作相连。适于原核宿主使用的启动子包括β-内酰胺酶和乳糖启动子系统(Chang等，Nature，275：615(1978)；Goeddel等，Nature，281：544(1979))、阿拉伯糖启动子系统(Guzman等，J.Bacteriol.，174：7716-7728(1992))、碱性磷酸酶、色氨酸(trp)启动子系统(Goeddel，Nucleic Acids Res.，8：4057(1980)and EP 36,776)以及杂合启动子诸如tac启动子(deBoer等，Proc.Natl.Acad.Sci.USA，80：21-25(1983))。不过，其它已知细菌启动子也是合适的。它们的核苷酸序列已公开，因而本领域技术人员能利用连接区或接头，将它们与编码目的多肽的DNA连接，以便提供任何所需的限制酶切位点(Siebenlist等，Cell，20：269(1980))。

用于细菌系统的启动子通常还包含Shine-Dalgarno(S.D.)序列，也是与编码目的多肽的DNA可操作相连。启动子可以通过限制酶消化从细菌DNA中取出，并插入包含所需DNA的载体。

(v)载体的构建和分析

构建包含一个或更多上述组分的合适载体使用标准的连接技术。将分离的质粒或DNA片断切割、修饰(tailor)并重新连接成所希望的形式，从而产生要求的质粒。

为分析确定所构建质粒中的正确序列，用连接混合物转化大肠杆菌K12菌株294(ATCC31,446)或其它菌株，成功的转化子通过相应氨苄青霉素或四环素抗性来选择。制备来自转化子的质粒，通过限制性内切酶消化进行分析和/或用Sanger等，Proc.Natl.Acad.Sci.USA，74：5463-5467(1977)或Messing等，Nucleic Acids Res.，9：309(1981)的方法，或用Maxam等，Methods in Enzymology，65：499(1980)的方法测序。

B.宿主细胞的选择和转化

如上所定义的，很多类型的革兰氏阴性细菌细胞可以用于具有缺陷型yfcK基因的目的，而且上面所提及的那些都是此类例子。大肠杆菌菌株W3110是优选的亲本菌株，因为它是重组DNA产物发酵常用的菌株。优选宿主细胞分泌最少量的蛋白水解酶。例如，菌株W3110可经修饰以便使编码蛋白的基因内产生遗传突变，这类大肠杆菌宿主的例子并同它们的基因型见下表：

菌株	基因型
菌株	基因型	W3110	K-12F-lambda-IN(rrnD-rrnE)1
1A2	W3110ΔfhuA或W3110tonAΔ	W3110	K-12F-lambda-IN(rrnD-rrnE)1
1A2	W3110ΔfhuA或W3110tonAΔ	7C1	W3110ΔfhuAΔ(arg-F-lac)169phoAΔE15
9E4	W3110ΔfhuA ptr3	7C1	W3110ΔfhuAΔ(arg-F-lac)169phoAΔE15
9E4	W3110ΔfhuA ptr3	16C9	W3110ΔfhuAΔ(arg-F-lac)169phoAΔE15 deoC2
23E3	W3110ΔfhuAΔ(arg-F-lac)169phoAΔE15 deoC2 degP∷kanR	16C9	W3110ΔfhuAΔ(arg-F-lac)169phoAΔE15 deoC2
23E3	W3110ΔfhuAΔ(arg-F-lac)169phoAΔE15 deoC2 degP∷kanR	27A7	W3110ΔfhuA ptr3 phiΔE15Δ(argF-lac)169
27C6	W3110ΔfhuA ptr3 phoAΔE15Δ(argF-lac)169ΔompT	27A7	W3110ΔfhuA ptr3 phiΔE15Δ(argF-lac)169
27C6	W3110ΔfhuA ptr3 phoAΔE15Δ(argF-lac)169ΔompT	27C7	W3110ΔfhuA ptr3 phoAΔE15Δ(argF-lac)169ΔompT degP41(ΔpstI-kan^R)
33B6	W3110ΔfhuAΔ(arg-F-lac)169phoAΔE15 deoC2 degP∷kanR ilvG2096	27C7
33B6	W3110ΔfhuAΔ(arg-F-lac)169phoAΔE15 deoC2 degP∷kanR ilvG2096	33D3	W3110ΔfhuA ptr3 lacIq lacL8ΔompT degP41(ΔpstI-kan^R)
36F8	W3110ΔfhuA phoAΔE15Δ(argF-lac)169ptr3 degP41(ΔpstI-kan^R)ilvG2096R	33D3	W3110ΔfhuA ptr3 lacIq lacL8ΔompT degP41(ΔpstI-kan^R)
36F8		37D6	W3110 tonAΔptr3 phoAΔE15Δ(argF-lac)169 ompTΔ degP41kan^r rbs7ΔilvG
40B4	菌株37D6，但带有非-卡那霉素抗性degP缺失突变	37D6
40B4	菌株37D6，但带有非-卡那霉素抗性degP缺失突变	40G3	W3110tonAΔphoAΔE15Δ(argF-lac)169 deoCΔompT degP41(ΔPstI-kan^r)ilvG2096^Rphn(EcoB)
43D3	W3110ΔfhuA ptr3 phoAΔE15Δ(argF-lac)169ΔompT degP41(ΔPst1-kan^R)ilvG2096^R	40G3
43D3		43E7	W3110ΔfhuAΔ(argF-lac)169ΔompT ptr3 phoAΔE15 degP41(ΔPst1-kan^S)ilvG2096^R
44D6	W3110ΔfhuA ptr3Δ(argF-lac)169degP41(Δpst1-kan^S)ΔompT ilvG2096R	43E7
44D6		45F8	W3110ΔfhuA ptr3Δ(argF-lac)169degP41(Δpst1-kan^S)ΔompT phoS^*(T10Y)ilvG2096^R
45F9	W3110ΔfhuA ptr3Δ(argF-lac)169degP41(Δpst1-kan^S)ΔompT ilvG2096^RphoS^*(T10Y)Δcyo∷kan^R	45F8

同样适合的是制备菌株36F8的中间体，即27B4(美国专利5,304,472)和35E7(生长好于27B4的自发性温度抗性菌落分离物)。另一个合适的菌株是具有突变的细胞周质蛋白酶的大肠杆菌菌株，参见1990年8月7日授权的美国专利4,946,783。

本发明的突变体细胞可通过将yfcK基因染色体整合到亲本细胞中，或通过其它技术，包括下文实施例中所述技术来产生。

编码多肽的核酸插入宿主细胞。该核酸用任何适当的方法，包括用编码该多肽的载体转化来导入合适的细菌细胞。转化是指将DNA导入生物体以使该DNA可以作为染色体外元件或通过染色体整合而复制。根据所用的宿主细胞，转化用适合于此类细胞的标准技术完成。如Sambrook等，Molecular Cloning：A Laboratory Manual(New York：Cold Spring HarborLaboratory Press，1989)1.82节中所述的利用氯化钙进行钙处理，一般用于原核细胞或其它包含坚固的细胞壁屏障的细胞。另一种转化的方法使用聚乙二醇/DMSO，如Chung and Miller，Nucleic Acids Res.，16：3580(1988)描述的。还有另一种方法是利用称作电穿孔的技术。

一个通过将编码多肽的基因插入大肠杆菌宿主基因组来转化的实例，涉及在转化载体中包含与大肠杆菌基因组DNA中发现的序列互补的DNA序列。用该载体转染大肠杆菌导致与基因组发生同源重组，以及插入编码该多肽的基因。优选用上述表达载体转化宿主细胞，在经改变适于诱导各种启动子的传统营养培养基中进行培养，从而插入所述核酸。

C.培养宿主细胞

用于产生本发明目的多肽的细菌细胞，在例如Sambrook等出处同上中一般性描述的适宜培养基中培养。

为了分泌表达或过表达的基因产物，宿主细胞培养在足以分泌该基因产物的条件下。这种条件包括，如温度、养分以及细胞密度等能够允许细胞分泌的条件。此外，这种条件使细胞可以运行基本的细胞功能如转录、翻译以及从一个细胞区域到另一个区域的蛋白运输过程，正如那些对此技术非常熟练的人已知的。

在使用碱性磷酸酶启动子的情况中，用于产生本发明目的多肽的大肠杆菌细胞培养在适宜的培养基中，其中的碱性磷酸酶启动子可以按照Sambrook等出处同上所一般性描述的方法进行部分或完全诱导。该培养必需不在缺乏无机磷酸盐或为磷酸盐饥饿水平时进行。首先，培养基所含无机磷酸盐的量高于诱导蛋白合成的水平，并且足够用于细菌生长。随着细胞生长并利用磷酸盐，它们降低了培养基中磷酸盐的水平，因而导致诱导该多肽的合成。

任何除碳、氮和无机磷酸盐来源以外的其它必需培养基组分，也可以按适当浓度包括在内，可以单独引入或作为与另一组分或培养基的混合物引入，如复合氮源。培养基的pH可以是大约5-9的任何pH，主要取决于宿主生物。

如果启动子是诱导型启动子，为了进行诱导，通常用高细胞密度方法，将细胞培养到一定光学密度，如A₅₅₀值约为2.00，在该时刻诱导开始(如通过添加诱导剂、耗尽培养基组分等等)，从而诱导编码目的多肽的核酸表达。

D.检测表达

核酸表达可以在样品中直接检测，例如，根据该多肽的序列选用适当标记的探针，通过传统的Southern印迹、定量mRNA转录的Northern印迹(Thomas， Proc.Natl.Acad.Sci.USA， 77：5201-5205(1980))、dot印迹(DNA分析)或原位杂交来进行检测。可以使用各种标记，最常用放射性同位素，特别是³²P。然而，也可使用其它技术如用生物素修饰核苷以引入多核苷酸中。然后将生物素作为抗生物素蛋白或抗体结合的位点，后者可以用多种标记物，如放射性核素、荧光剂、酶等进行标记。或者可通过分析或凝胶检测蛋白。

用于观测表达或过表达的基因产物是否分泌的方法对于本领域技术人员来说是很容易获得的。一旦通过如经离心或过滤将培养基与宿主细胞分离，就可利用基因产物的已知特性，从无细胞培养基中检出该基因产物。所述特性包括该基因产物特有的免疫学、酶学或物理学性质。

举例来说，如果一种过表达的基因产物具有独特的酶活性，可在宿主细胞使用的培养基中进行针对该活性的检测。而且，当可获得与给定基因产物产生反应的抗体时，此类抗体可用来以任何已知的免疫检测方法检测该基因产物(例如，Harlowe等， Antibodies：A Laboratory Manual，ColdSpring Harbor Laboratory Press，New York，1988)。

分泌的基因产物还可以采用根据特征性物理性质如分子量来区分多肽的实验来检测。为检测该基因产物的物理性质，所有由宿主细胞新合成的多肽都可以用，例如放射性同位素标记物来标记。可用于标记在宿主细胞内合成的多肽的常用放射性同位素包括，氚(³H)、碳-14(¹⁴C)、硫-35(³⁵S)诸如此类。举例来说，宿主细胞可生长于³⁵S-甲硫氨酸或³⁵S-半胱氨酸培养基中，而且大量的³⁵S标记将优先插入任何新合成的多肽中，包括过表达的异源多肽。继而除去含³⁵S的培养基，洗涤细胞并将之放入新鲜的无放射性培养基中。细胞在新鲜培养基中维持，所用的时间和条件足以使带有³⁵S放射性标记并已表达的异源多肽分泌，收集培养基并与宿主细胞分离。培养基中已分泌并标记的多肽的分子量可以用已知方法如聚丙烯酰胺凝胶电泳来确定。此类方法和/或其它用于检测分泌基因产物的方法，参见Goeddel，D.V.(ed.)1990，Gene Expression Technology， Methods in Enzymology，Vol.185(Academic Press)以及Sambrook等，出处同上中。

E.回收/纯化

产生多肽以后，可以通过任何适当方式从细胞中回收，所述方式取决于，例如从细胞的哪个部位进行回收。多肽可以从细胞质、细胞周质或细胞培养基回收。目的多肽优选作为分泌多肽从细胞周质或培养基中回收。目的多肽从重组细胞蛋白或多肽中纯化，以获得基本均一的目的多肽制品。第一步，将培养基或裂解物离心除去颗粒状细胞碎片。需要时可进一步分离膜和可溶性蛋白部分。然后根据所述多肽为膜结合型、可溶型、还是聚集形式，可以将该多肽从可溶性蛋白部分和从培养裂解物的膜部分中纯化出来。然后将所述多肽溶解并重新折叠，必要时，从污染的可溶性蛋白和多肽中纯化出来。任何从混合物中除去剪切型多肽杂质的典型步骤都可以从纯化方案中去掉，因为已不再存在氨肽酶。在一个优选实施方案中，将聚集的多肽分离，然后同时进行溶解和再折叠步骤，如美国专利5,288,931中所述。

一个特别优选的实施方案中，从细胞周质中进行回收，具体是通过细胞破坏(利用如上述方法)以形成裂解物，接着从该裂解物中纯化出完整的未剪切多肽。优选裂解物在纯化前温育。更优选裂解物在大约20～25℃温育至少约1小时，还更优选在室温左右温育约2～50小时，还更优选在室温左右温育约5～45小时，最优选在室温左右温育约20～30小时。

下面的步骤是合适纯化步骤的范例：在免疫亲和或离子交换柱中分级分离；乙醇沉淀；反相HPLC；在硅或阳离子交换树脂如DEAE上进行层析分析；层析聚焦；SDS-PAGE；硫酸铵沉淀；以及用如SEPHADEX G-75^TM柱进行凝胶过滤。

II.经剪切的多肽的生产和回收

在此备选方法中，多肽与氨肽酶b2323多肽直接相接触，使其被剪切。这可以通过几种手段来完成，包括在大约20～40℃，优选30～40℃温育最多50小时，优选至少约1～45小时。在此接触方法的一个优选方面，本发明提供一种产生剪切多肽的方法，该方法包括培养细菌细胞，该细胞携有yfcK基因并包含编码相应的未切割多肽的核酸，该多肽在其N末端有附加的氨基酸。所用培养条件使yfcK基因表达或过表达并使编码未剪切多肽的核酸表达，而且如果未剪切多肽和氨肽酶b2324蛋白在表达以后没有接触，还可以将未剪切多肽与氨肽酶b2324蛋白接触，以产生经剪切的多肽。优选这种接触是在前面或下面提出的条件下温育，而且该培养在发酵罐中进行。

在一个优选的方面中该多肽对细胞是异源多肽，更优选真核多肽，还更优选哺乳动物尤其是人的多肽。优选的细胞是沙门氏菌或肠杆菌科细胞，还更优选大肠杆菌细胞，最优选W3110。还优选至少在一种编码蛋白酶的基因，如degP或fhuA或两者中有缺陷的细胞。

在一个优选的方面中，该培养条件能使yfcK基因过表达。yfcK基因可以是细菌细胞天然具有的或是通过，例如，用携有该基因的载体转化而导入该细胞的。

在另一个优选的方面中，未剪切的多肽是在与该氨肽酶b2324蛋白接触前从细胞中回收的，而且未剪切的多肽是从细胞周质或培养基中回收的。在一个实施方案中，回收是通过细胞破坏(如上述)以形成裂解物，添加氨肽酶，然后从裂解物中纯化经剪切的多肽。此例中优选裂解物在纯化步骤开始前与氨肽酶温育。更优选裂解物在大约20～40℃温育至少约1小时，还更优选在30-40℃左右温育约2～50小时，还更优选在30-40℃左右温育约5～45小时，最优选在纯化步骤之前在35-38℃左右温育约20～30小时。

当剪切多肽是通过重组产生的时，亲本菌株、培养条件、表达的检测、回收/纯化、以及基本技术都总体上如上文所述。然而，为了在培养的菌株中过表达，通常使相对于宿主细胞而言内源(在染色体上)或外源的yfcK基因与诱导型启动子可操作相连，从而使该基因在启动子被诱导时可以过表达。该培养优选在诱导yfcK基因表达优先于诱导编码该多肽的核酸表达的条件下进行。用于过表达本文所用基因的适宜技术包括那些由Joly等， Proc. Natl.Acad.Sci.USA， 95，2773-2777(1998)；US Pat.Nos.5,789,199和5,639,635；Knappik等， Bio/Technology， 11(1)：77-83(1993)；以及Wulfing和Pluckthun， Journal of Molecular Biology. 242(5)：655-69(1994)所描述的。

通过参考下面的实施例，可以更全面了解本发明。但是，它们不应被解释为对本发明范围的限定。所有在这里引用的文献和专利都以参考文献插入。

实施例1

材料和方法

经PCR扩增获得编码b2324的yfcK基因的上游和下游DNA序列，该基因是由基因组测序计划(来自上述Blattner等的GenBank列表)鉴定的。然后这些融合序列经P1转导重组在W3110菌株的染色体上，并用PCR筛选缺失(Metcalf等， Gene， 138：1-7(1994))以产生菌株61G3，其基因型为W3110ΔfhuAΔ(arg-F-lac)169phoAΔE15 deoC2 degP∷kanR ilvG2096ΔyfcK。

具体地，本菌株构建分几个步骤来完成，采用的技术包括用来源于P1(J.Miller， Experiments in Molecular Genetics，Cold Spring Harbor，NY，ColdSpring Harbor Laboratory，1972)的噬菌体P1kc转导，以及转座子遗传(Kleckner等， J.Mol.Biol.， 116：125-159(1977))。使用的起始宿主是大肠杆菌K-12 W3110，是F^-λ^-型K-12菌株(Bachmann， Bact.Rev.， 36：525-557(1972)；Bachmann，″Derivations and Genotypes of Some Mutant Derivatives ofEscherichia coli K-12，″p.1190-1219，in F.C.Neidhardt等，ed.， Escherichia coli and Salmonella typhimurium：Cellular and Molecular Biology，vol.2，AmericanSociety for Microbiology，Washington，D.C.，1987)。在基因组中导入tonA(fhuA)突变，方法详见1994年4月19日授权的美国专利5,304,472。Tn10插入ilv基因是通过P1转导来介导的。利用生长在携有ilvG2096^R突变(Lawther等，Proc.Natl.Acad.Sci.USA， 78：922-925(1981))的菌株中的P1噬菌体，将异亮氨酸/缬氨酸营养缺陷型转换为原养型，在其中修复了造成野生型大肠杆菌K-12对缬氨酸敏感的移码突变。degP41kan^r突变描述于美国专利5,304,472。ilvG2096^R座位可以通过33B6宿主对40μg/ml缬氨酸(0.3mM)的抗性来确定。两个缺失突变phoAΔE15和Δ(argF-lac)169描述于美国专利5,304,472。deoC2突变描述于Mark等， Mol.Gen.Genet. 155：145-152(1977)。61G3菌株的完整来历示于图1。

此菌株然后用名为hGH4R的表达质粒转化，该质粒在摇瓶和10-L发酵罐中表达并分泌hGH(具有N末端苯丙氨酸)。phGH4R的构建详述于Chang等， Gene， 55：189-196(1987)中。此转化产生了JJGH1菌株。细胞培养见Andersen等， Biotechnology and Bioengineering， 75(2)，212-218(2001)。生产hGH之后，用超声破碎细胞，制备粗制裂解物，然后该裂解物在37℃温育0～24小时，在室温下0～40小时。使用较高的温度是为了提高通过检验方法检测des-phe和des-phe-pro hGH的能力，但不优选用于hGH的纯化。正常情况下，hGH的纯化在冷条件下完成，以降低那些剪切形式的量。

用经过phGH4R转化的亲本菌株(具有基因型W3110ΔfhuAΔ(arg-F-lac)169phoAΔE15 deoC2的16C9)作为对照来进行同样的试验。此菌株适合该用途，因为菌株61G3中的degP和ilvG突变对氨肽酶活性没有影响。

然后将对照样品和试验样品离心除去颗粒物，可溶相通过LC-MS(液相层析、质谱分析)进行分析。检测到大量完整的、des-phe和des-phe-pro形式的hGH。

结果

图2和图4分别显示用对照菌株(16C9/phGH4R)在室温和37℃温育的结果，而图3和图5分别显示用JJGH1在室温和37℃温育的结果，其中的氨肽酶基因已经敲除掉了。这四个图的实际数目显示于下表1中(在Temp＝37℃和Temp＝RT)。可以看到在37℃温育15小时后，基本上没有切除苯丙氨酸后形成的杂质，而且即使不经温育，杂质的量也减少。还可以看到即使在室温温育，与对照相比，在温育的任何时间，JJGH1细胞系中缺失N末端苯丙氨酸的突变多肽的量都减少了。对该完整多肽的纯化可以通过常用或已知的层析方法容易地完成。

表1

Temp＝37℃
Temp＝37℃										面积			面积％
样品	时间	des-phe	天然的	des-phe-pro	des-phe	天然的	des-phe-pro			面积			面积％
样品	时间	des-phe	天然的	des-phe-pro	des-phe	天然的	des-phe-pro	Control	0	16159.80	4486460.00	19642.70	0.36	99.21	0.43
JJGH1	0	11927.90	3376380.00	7637.14	0.35	99.42	0.22	Control	0	16159.80	4486460.00	19642.70	0.36	99.21	0.43
JJGH1	0	11927.90	3376380.00	7637.14	0.35	99.42	0.22	Control	15	14372.30	1097210.00	976760.00	46.77	52.53	0.69
JJGH1	15	27163.70	2674010.00	16357.80	1.00	98.40	0.60	Control	15	14372.30	1097210.00	976760.00	46.77	52.53	0.69
JJGH1	15	27163.70	2674010.00	16357.80	1.00	98.40	0.60	Control	24	1058950.00	839418.00	17580.50	55.27	43.81	0.92
JJGH1	24	29409.90	2306690.00	11999.30	1.25	98.23	0.51	Control	24	1058950.00	839418.00	17580.50	55.27	43.81	0.92
JJGH1	24	29409.90	2306690.00	11999.30	1.25	98.23	0.51
Temp＝RT
Temp＝RT										面积			面积％
样品	时间	des-phe	天然的	des-phe-pro	des-phe	天然的	des-phe-pro			面积			面积％
样品	时间	des-phe	天然的	des-phe-pro	des-phe	天然的	des-phe-pro	Control	0	16159.80	4486460.00	19642.70	0.36	99.21	0.43
JJGH1	0	11927.90	3376380.00	7637.14	0.35	99.42	0.22	Control	0	16159.80	4486460.00	19642.70	0.36	99.21	0.43
JJGH1	0	11927.90	3376380.00	7637.14	0.35	99.42	0.22	Control	15	46158.20	364234.00	7950.57	1.24	98.53	0.21
JJGH1	15	183740.00	19431400.00	39130.00	0.94	99.06	0.20	Control	15	46158.20	364234.00	7950.57	1.24	98.53	0.21
JJGH1	15	183740.00	19431400.00	39130.00	0.94	99.06	0.20	Control	24	100774.00	4561070.00	19501.10	2.15	97.43	0.42
JJGH1	24	160737.00	19711600.00	98221.60	0.80	98.70	0.49	Control	24	100774.00	4561070.00	19501.10	2.15	97.43	0.42
JJGH1	24	160737.00	19711600.00	98221.60	0.80	98.70	0.49	Control	42	122177.00	3933770.00	19246.40	3.00	96.53	0.47
JJGH1	42	213143.00	18242500.00	91090.90	1.15	98.36	0.49	Control	42	122177.00	3933770.00	19246.40	3.00	96.53	0.47

此结果显示，ΔyfcK菌株可用来防止多肽的N末端剪切。

Claims

1.一种革兰氏阴性细菌细胞，其染色体基因有缺陷，所述基因与以下分子有至少80％的序列同一性且编码氨肽酶：(a)编码具有SEQ ID NO：2中氨基酸残基1～688的天然序列氨肽酶b2324的DNA分子；或(b)DNA分子(a)的互补体。

2.一种革兰氏阴性细菌细胞，其染色体基因有缺陷，所述基因包括：(a)编码多肽的DNA，所述多肽与SEQ ID NO：2中氨基酸残基1～688所示序列进行比对时阳性得分至少是80％，或(b)DNA分子(a)的互补体，所述多肽是氨肽酶。

3.一种革兰氏阴性细菌细胞，其染色体基因有缺陷，所述基因与具有SEQ ID NO：1中核苷酸1～2067所示序列的yfcK基因天然序列有至少80％的序列同一性，而且编码氨肽酶。

4.权利要求1～3之一的细胞，是沙门氏菌属或肠杆菌科的细胞。

5.权利要求4的细胞，是大肠杆菌。

6.权利要求5的细胞，至少在一个编码蛋白酶的基因中有缺陷。

7.权利要求5的细胞，在天然序列yfcK基因中有缺陷。

8.权利要求1～7之一的细胞，包括编码该细胞的异源多肽的核酸。

9.权利要求8的细胞，其中所述多肽是哺乳动物多肽。

10.权利要求9的细胞，其中所述多肽是人的多肽。

11.权利要求10的细胞，其中所述多肽是人生长激素。

12.一种用来生产异源多肽的方法，包括(a)培养权利要求8～11之一的细胞，以及(b)从该细胞中回收该多肽。

13.权利要求12的方法，其中的培养在发酵罐中进行，其中所述多肽从该细胞的周质或培养基中回收。

14.权利要求12或13的方法，其中的回收是将细胞破坏以形成裂解物，而其中所述完整多肽是从裂解物中纯化的。

15.权利要求14中的方法，其中的裂解物在纯化步骤之前温育。

16.一种防止从多肽N末端切去氨基酸残基的方法，包括培养权利要求1～11之一的细胞，其中所述细胞包含编码该多肽的核酸，所用的培养条件使该核酸表达。

17.权利要求16的方法，其中所述多肽是从该细胞中回收的。

18.一种从分离自细胞的多肽的N末端切去氨基酸的方法，包括使该多肽与氨肽酶接触，编码该酶的核酸与以下分子有至少80％的序列同一性：(a)编码具有SEQ ID NO：2中氨基酸残基1～688的天然序列氨肽酶b2324的DNA分子；或(b)DNA分子(a)的互补体。

19.一种从分离自细胞的多肽的N末端切去氨基酸的方法，包括使该多肽与氨肽酶接触，该酶与具有SEQ ID NO：2中氨基酸残基1～688所示序列的天然序列氨肽酶b2324有至少80％的序列同一性。

20.权利要求18或19的方法，其中使所述多肽与氨肽酶一起温育。

21.权利要求18～20之一的方法，其中使所述多肽与天然序列氨肽酶b2324接触。

22.一种产生经剪切的多肽的方法，包括培养革兰氏阴性细菌细胞，该细胞携有与以下分子有至少80％的序列同一性且编码氨肽酶的核酸：(a)编码具有SEQ ID NO：2中氨基酸残基1～688的天然序列氨肽酶b2324的DNA分子；或(b)DNA分子(a)的互补体，所述细胞包含编码相应未剪切多肽的核酸，该未剪切多肽在其N末端有附加的氨基酸，其中所用的培养条件使该基因表达或过表达并使编码未剪切多肽的核酸表达，在未剪切多肽和氨肽酶于表达以后不接触的情况下，可使所述未剪切多肽与氨肽酶接触，以产生经剪切的多肽。

23.一种产生经剪切的多肽的方法，包括培养革兰氏阴性细菌细胞，该细胞携有编码氨肽酶的核酸，该核酸与具有SEQ ID NO：1中核苷酸1～2067所示序列的yfcK基因天然序列有至少80％的序列同一性，所述细胞包含编码相应未剪切多肽的核酸，该未剪切多肽在其N末端有附加的氨基酸，其中所用的培养条件使该基因表达或过表达并使编码未剪切多肽的核酸表达，在未剪切多肽和氨肽酶于表达以后不接触的情况下，可使所述未剪切多肽与氨肽酶接触，以产生经剪切的多肽。

24.权利要求22或23的方法，其中对携有天然序列yfcK基因的大肠杆菌细胞进行培养，并使未剪切的多肽与天然序列氨肽酶b2324相接触。

25.权利要求22～24之一的方法，其中所述多肽对所述细胞而言是异源的。

26.权利要求22～24之一的方法，其中所述多肽是哺乳动物多肽。

27.权利要求22或23的方法，其中所述细胞至少在一种编码蛋白酶的基因中有缺陷。

28.权利要求22或23的方法，其中所述培养条件使编码该氨肽酶的核酸过表达。

29.权利要求22或23的方法，其中的接触通过温育来进行。

30.权利要求22或23的方法，其中编码氨肽酶的核酸是该细菌细胞天然具有的。

31.权利要求22或23的方法，其中编码氨肽酶的核酸是导入该细菌细胞的。

32.权利要求22或23的方法，其中的培养在发酵罐中进行，而且其中的未剪切多肽是在与氨肽酶接触前从细胞回收的。

33.权利要求32的方法，其中所述多肽是从细胞的周质或培养基中回收的。

34.权利要求32或33的方法，其中的回收是将细胞破坏以形成裂解物，而且其中的剪切多肽是从裂解物中纯化的。

35.权利要求34的方法，其中的裂解物在纯化步骤之前温育。

36.权利要求34或35的方法，其中的裂解物在约20～40℃温育至少约1小时。