CN109863247A

CN109863247A - 用于改善的蛋白质的分泌的信号多肽

Info

Publication number: CN109863247A
Application number: CN201780065537.8A
Authority: CN
Inventors: S.韩; R.肖纳
Original assignee: MedImmune Vaccines Inc
Current assignee: MedImmune LLC; MedImmune Vaccines Inc
Priority date: 2016-10-27
Filing date: 2017-10-26
Publication date: 2019-06-07
Also published as: EP3532618A1; US20190271022A1; WO2018081350A1; JP2019532656A; WO2018081350A8; EP3532618A4

Abstract

本发明涉及用于改善异源多肽排泄产生的信号多肽、包含信号多肽的蛋白质、编码信号多肽的核酸及其使用方法。

Description

用于改善的蛋白质的分泌的信号多肽

序列表

本申请含有已以ASCII格式以电子方式提交且特此以引用的方式整体并入的序列表。所述ASCII副本创建于2017年10月19日，名称为NSP4-100-WO-PCT-SequenceListing并且大小为17,021字节。

技术领域

本发明涉及用于改善异源多肽排泄产生的信号多肽、包含信号多肽的蛋白质、编码信号多肽的核酸及其产生方法。示例性实施例包括附接至α毒素连接的改善的信号多肽，以及产生和分离α毒素的方法。

背景技术

细菌中的表达可以是药物和工业蛋白质的商业生产的选择的方法。将商业上重要的异源重组蛋白质分泌到大肠杆菌的周质或培养基中，在商业上重要的重组蛋白质的生产中提供了若干个优点，包括节省成本和时间、减少内毒素、在廉价碳源上生长、快速生物量积累、适应高细胞密度发酵和简单的工艺规模扩大。(Mergulhao等人,Biotech Advances[生物技术进展]23:177-202(2005)；Gottesman等人,Annu.Rev.Genet[遗传学年评]30:465-506(1996))。由于这些原因，已经进行了许多研究，例如信号肽修饰和分子伴侣的共表达，以改善重组蛋白在大肠杆菌表达系统中的分泌效率。(Baneyx等人,NatureBiotech[自然生物技术]22:1399-1408(2004)；Choi等人,Appl.MicrobiolBiotechnol[应用微生物学及生物科技]64:625-635(2004)；Cornelis等人,Curr Opinion in Biotech[现代生物技术评论]11:450-454(2000)；Klatt等人,Microbiol CellFactories[微生物细胞工厂]11:97-106(2012))。

在大肠杆菌分泌途径中，信号多肽在分泌过程期间在重组蛋白的易位和分泌中起关键作用。已经研究了许多信号多肽以改善大肠杆菌系统中重组蛋白的分泌。(Humphreys等人,Protein Expression andPurification[蛋白质表达和纯化]20:252-264(2000)；Velaithan等人,Ann Microbiol[微生物学年鉴]64:543-550(2014)；Jonet等人,JMolMicrobiol Biotechnol[分子微生物学与生物技术杂志]22:48-58(2012)；Ismail等人,Biotech letters[生物技术书信]33:999-1005(2011)；Low等人,Bioengineered[生物工程化]3:334-338(2011)；Nagano等人,Biochem Biophys Res Commun[生物化学与生物物理研究通讯]447:655-659(2014))。总体上，重组蛋白质通过细胞质膜分泌到周质间隙中，并且信号肽在输出期间被信号肽酶切割。通常，分泌的重组蛋白质通过外膜从周质间隙胞外释放到培养基中。

信号多肽位于重组蛋白前体的n-末端区，当新生多肽链在分泌途径中从核糖体中出现时，其被信号识别颗粒(SPR)识别。信号多肽具有20-30个氨基酸残基的长度和三个可区分的结构特征。这三个区由具有净正电荷的氨基末端区(n-区)、随后是疏水区(h-区)、并且然后是对于相对于切割位点的-3(P3)和-1(P1)位置的小残基具有优先的蛋白酶识别序列(c-区)构成。(Mergulhao等人,Biotechnology Adv[生物技术进展]23:177-202(2005)；Paetzel等人,Biochmica et Biophysica Acta[生物化学与生物物理学报生物能学]1843:1497-1508(2014)；Paetzel等人,Pharmacology&Therapeutics[药理学和治疗学]87:27-49(2000))。特别是，h-区是分泌过程期间穿过细菌细胞质膜的蛋白质易位的重要区，因为易位效率随着h-区的长度和疏水性而增加，并且功能需要最小的疏水性(Wang等人,J.Biol.Chem[生物化学杂志]275:10154-10159(2000))。许多公开文献已经显示，信号多肽的修饰改善了大肠杆菌表达系统中异源蛋白质的分泌(Humphreys等人,ProteinExpression and Purification[蛋白质表达和纯化]20:252-264(2000)；Velaithan等人,Ann Microbiol[微生物学年鉴]64:543-550(2014)；Jonet等人,JMolMicrobiolBiotechnol[分子微生物学与生物技术杂志]22:48-58(2012)；Ismail等人,Biotechletters[生物技术书信]33:999-1005(2011)；Low等人,Bioengineered[生物工程化]3:334-338(2011)；Nagano等人,Biochem Biophys Res Commun[生物化学与生物物理研究通讯]447:655-659(2014))。

发明内容

本披露内容涉及信号多肽，该信号多肽包含与SEQ ID NO:1具有至少90％序列同一性的氨基酸序列。在一些实施例中，该信号多肽包含与SEQ ID NO:1具有至少95％序列同一性的氨基酸序列。在一些实施例中，该信号多肽包含SEQ ID NO:1的氨基酸序列。

本披露还涉及蛋白质，该蛋白质包含(i)信号多肽，该信号多肽包含与SEQ ID NO:1具有至少90％序列同一性的氨基酸序列，和(ii)异源多肽。在一些实施例中，该蛋白质包含(i)信号多肽，该信号多肽与SEQ ID NO:1具有至少95％序列同一性的氨基酸序列，和(ii)异源多肽。在一些实施例中，该蛋白质包含(i)信号多肽，该多肽包含SEQ ID NO:1的氨基酸序列，和(ii)异源多肽。

各种异源多肽可用于本发明。在一些实施例中，异源多肽包含大于20个氨基酸。在一些实施例中，异源多肽具有25kDa至50kDa的分子量。在一些实施例中，异源多肽具有30kDa至35kDa的分子量。在一些实施例中，异源多肽选自下组，该组由以下组成：酶、毒素、抗体、抗体片段、抗原、治疗性蛋白质及其组合。在一些实施例中，异源多肽包含α毒素(AT)。在一些实施例中，异源多肽包含来自金黄色葡萄球菌(Staphylococcus aureus)的α毒素。在一些实施例中，α毒素在对应于H35的氨基酸位置包含取代。在一些实施例中，取代是H35L取代。

在一些实施例中，本披露涉及包含SEQ ID NO:2的氨基酸序列的蛋白质。在一些实施例中，本披露涉及包含如本文所述的信号多肽或蛋白质的组合物。

在一些实施例中，本披露涉及编码如本文所述的信号多肽(例如SEQ ID NO:1)的核酸，或包含如本文所述的信号多肽的蛋白质。在一些实施例中，核酸(1)编码如本文所述的信号多肽，和(2)包含一个或多个限制性内切酶位点。

在一些实施例中，本披露涉及包含如本文所述的核酸的载体。在一些实施例中，载体进一步包含复制起点。在一些实施例中，载体进一步包含与核酸可操作地连接的启动子序列。在一些实施例中，启动子序列在原核生物中是可操作的。在一些实施例中，载体是质粒、转座子或病毒载体。

在一些实施例中，本披露涉及工程化以表达包含信号多肽的本文所述蛋白质的重组细胞。在一些实施例中，重组细胞是原核生物细胞。在一些实施例中，原核生物细胞是埃希氏杆菌属(Escherichia)。在一些实施例中，原核生物细胞是大肠杆菌(Escherichiacoli)。

在一些实施例中，本披露涉及用如本文所述的载体转化的宿主细胞。在一些实施例中，宿主细胞是原核生物细胞。在一些实施例中，原核生物细胞是埃希氏杆菌属(Escherichia)。在一些实施例中，原核生物细胞是大肠杆菌。

在一些实施例中，本披露涉及产生如本文所述的蛋白质的方法，该方法包括在表达蛋白质的条件下，培养工程化以表达蛋白质的重组细胞，或用编码蛋白质的载体转化的宿主细胞。在一些实施例中，本发明的方法包括从细胞培养物中回收蛋白质。在一些实施例中，回收蛋白质包括离心以去除细胞和/或细胞碎片。在一些实施例中，回收蛋白质包括过滤以去除细胞和/或细胞碎片。

在一些实施例中，重组细胞或宿主细胞在细胞培养物中在蛋白质从重组细胞或宿主细胞分泌的条件下培养。在一些实施例中，重组细胞或宿主细胞在细胞培养物中在将信号多肽从蛋白质切割的条件下培养。

在一些实施例中，本披露涉及增加蛋白质从细胞分泌的速率的方法，该方法包括：(a)在细胞培养物中培养宿主细胞，该宿主细胞包含编码蛋白质的如本文所述的核酸或载体，(b)诱导蛋白质的表达，以及(c)回收分泌到细胞培养物的上清液中的蛋白质，其中将蛋白质的分泌速率与具有dsbA信号多肽的蛋白质的蛋白质分泌速率进行比较。在一些实施例中，(c)的回收发生在诱导(b)后8和12小时之间。在一些实施例中，蛋白质分泌速率每小时增加大于20％。

在一些实施例中，本披露涉及增加蛋白质从细胞分泌的量的方法，该方法包括：(a)在细胞培养物中培养宿主细胞，该宿主细胞包含编码如本文所述蛋白质的核酸或载体，(b)诱导蛋白质的表达，以及(c)回收分泌到细胞培养物的上清液中的蛋白质，其中将分泌的蛋白质的量与具有dsbA信号多肽的蛋白质进行比较。在一些实施例中，与具有dsbA信号多肽的蛋白质相比，从细胞分泌的蛋白质的量增加大于20％。在一些实施例中，与具有dsbA信号多肽的蛋白质相比，从细胞分泌的蛋白质的量增加大于100％。

在一些实施例中，本披露涉及制备蛋白质的方法，所述方法包括a)培养包含如本文所述的核酸或载体的宿主细胞，使得表达该核酸，由此当核酸或载体在宿主细胞中表达时，由核酸或载体编码的蛋白质从细胞分泌到上清液中；以及b)从上清液中分离分泌的蛋白质。在一些实施例中，宿主细胞或重组细胞是大肠杆菌。在一些实施例中，宿主细胞在细胞培养物中在信号多肽从蛋白质切割的条件下培养。在一些实施例中，分离分泌的蛋白质包括离心以去除细胞和/或细胞碎片。在一些实施例中，分离分泌的蛋白质包括过滤以去除细胞和/或细胞碎片。

在一些实施例中，本披露涉及通过本文所述的任何方法制备的蛋白质。

附图说明

图1：在Micro24生物反应器补料分批过程中筛选与AT_H35L缀合的细菌信号多肽。收获样品并在用0.5mM IPTG诱导后14小时离心。将上清液加载到SDS-PAGE变性凝胶上，并使用针对AT_H35L的单克隆抗体通过蛋白质印迹定量。箭头表示培养基中分泌的AT_H35L蛋白质，并加载纯化的AT_H35L作为参考。

图2.本研究中使用的新颖信号多肽构建的示意图。该图说明了与AT_H35L缀合的新颖信号多肽的不同结构组合。与AT_H35L缀合的使用的信号多肽描述于每个构建体的左侧。(图2A)通过修饰dsbAss和pelBss产生组I新颖信号多肽NSP1至NSP6。(图2B)通过氨基酸改组或用NSP4的h-区中的亮氨酸或丙氨酸替代氨基酸产生组II新颖信号多肽NSP4a至NSP4c。(图2C)通过NSP3的h-区中氨基酸改组产生组III新颖信号多肽NSP3a至NSP3d。h-区中每个氨基酸旁边的数字表示h-区中氨基酸的位置。(图A、B和C)。D-N、D-H和D-C分别代表dsbAss的n-区、h-区和c-区。P-N、P-H和P-C分别代表pelBss的n-区、h-区和c-区。

图3.通过在1L补料分批培养中组I新颖信号多肽AT_H35L的分泌效率。图3A和B.通过在变性条件下电泳评估培养基中分泌的AT_H35L。箭头表示分泌的AT_H35L蛋白质。图3C.通过定制的Octet测定定量培养基中分泌的AT_H35L。NSP2、NSP4和NSP6在其结构中共享同一h-区。有趣的是，NSP 2和NSP4增强了AT_H35L的分泌效率，同时通过NSP6降低了AT_H35L的分泌效率。

图4.通过在1L补料分批培养中组II新颖信号多肽AT_H35L的分泌效率。通过在变性条件下电泳和定制的Octet测定分别进行分泌的AT_H35L的评估和定量。在h-区中氨基酸改组影响AT_H35L(NSP4a)的分泌效率。尽管NSP4b的h-区仅含有如聚亮氨酸的强疏水性氨基酸，但AT_H35L的分泌效率降低。

图5.通过在1L补料分批培养中，在组III新颖信号多肽的h-区中氨基酸改组的AT_H35L的分泌效率。通过氨基酸改组改变的疏水性显著影响AT_H35L的分泌效率。

图6.优化诱导长度用于1L补料分批培养中胞外AT_H35L的生产率。图6A和B.星号表示由于细胞过度生长而从死细胞释放的AT_H35L前蛋白质。箭头表示在分泌过程期间适当分泌的成熟AT_H35L。图6C.通过定制的Octet测定测量AT_H35L的定量。

图7.密码子优化的AT_H35L核苷酸序列(SEQ ID NO:5)(图7A)、AT氨基酸序列(SEQID NO:3)(图7B)、AT_H35L氨基酸序列(SEQ ID NO:4)(图7C)和NSP4ss+ATH35L(SEQ ID NO:2)(图7D)。

具体实施方式

本发明涉及信号多肽和包含信号多肽和异源多肽的蛋白质，其中该信号多肽提供改善的异源多肽的分泌。

当在权利要求和/或说明书中与词语“包含(comprising)”结合使用时，使用词语“一个(a或an)”可以意指“一个”，但它也与“一个或多个”、“至少一个”和“一个或多于一个”的含义一致。

在整个本申请中，术语“约”用于表示值包括被采用以确定值的方法/装置的误差的固有变化，或者研究受试者之间存在的变化。典型地，该术语意指涵盖大约或小于1％、2％、3％、4％、5％、6％、7％、8％、9％、10％、11％、12％、13％、14％、15％、16％、17％、18％、19％或20％变化，这取决于具体情况。

权利要求中使用术语“或”用于意指“和/或”，除非明确指示仅指替代方案或替代方案是相互排斥的，尽管本披露支持仅是指替代方案和“和/或”的定义。

如在本说明书和一项和多项权利要求中所使用的，词语“包含(comprising)”(和任何形式的包含，例如“包含(comprise和comprises)”)，“具有”(和任何形式的具有，例如“具有(have和has)”)，“包括(including)”(以及任何形式的包括，例如“包括(includes和include)”)或“含有(containing)”(以及任何形式的含有，例如“含有(contains和contain)”)是包扩性的或开放性的，并且不排除另外的未列举的元素或方法步骤。考虑到本说明书中讨论的任何实施例可以相对于本披露的任何方法或多肽、蛋白质、核酸和载体实施，并且反之亦然。此外，本披露的多肽、蛋白质、核酸和载体可用于实现本披露的方法。

易位系统

提供了新颖信号多肽，其促进可操作地连接的目的多肽靶向周质或进入胞外环境。出于本发明的目的，术语“信号多肽”，“分泌信号”，“分泌信号多肽”，“信号多肽”或“前导序列”旨在包括肽序列，该肽序列可用于将可操作地连接的目的多肽靶向周质或进入胞外空间。

本发明的信号多肽改善了细菌中重组蛋白质的之前的生产方法。本文的信号多肽可以通过增加蛋白质从胞内环境中的分泌来增加蛋白质的产生(收获)。分泌到周质间隙中也具有促进适当的二硫键形成的众所周知的效果(Manoil等人,Methods in Enzymol.[酶学方法]326:35-47(2000))。分泌重组蛋白质的其他益处包括更有效地分离蛋白质；转基因蛋白质的正确折叠和二硫键形成，导致活性形式的蛋白质百分比增加；减少包涵体的形成，并且降低对宿主细胞的毒性；并且可溶性形式的重组蛋白的百分比增加。将目的蛋白质排泄到培养基中的潜力还可能潜在地促进蛋白质生产的连续而非分批培养。

在革兰氏阴性细菌中，从细胞质分泌的蛋白质可以终止于周质间隙、附接至外膜或进入胞外培养液中。本文的信号多肽可通过增加蛋白质从胞内环境分泌到周质间隙、附接至外膜或进入胞外培养液中来增加蛋白质的产生。在一些实施例中，本发明的方法还可以减少和/或消除由聚集的蛋白质组成的包涵体。

原核生物，例如革兰氏阳性细菌和革兰氏阴性细菌，已经进化出许多系统，用于蛋白质穿过其膜的主动输出。革兰氏阴性细菌中的分泌途径包括例如：ABC(I型)途径，Path/Fla(III型)途径和Path％Vir(IV型)途径，用于穿过血浆和外膜两者的一步易位；Sec(II型)、Tat、MscL和Holins途径，用于穿过质膜的易位；以及Sec-加-菌毛引导孔蛋白(FUP)、Sec-加-自转运蛋白(AT)、Sec-加-两配偶体分泌(TPS)，Sec-加-主终端分支(MTB)和Tat-加-MTB途径，用于穿过血浆和外膜的两步易位。并非所有细菌都具有所有这些分泌途径。因此，在一些实施例中，本发明涉及使用如本文所述的信号多肽的使用ABC(I型)、Path/Fla(III型)、Path％Vir(IV型)；Sec(II型)、Tat、MscL、Holins、Sec-加-菌毛引导孔蛋白(FUP)、Sec-加-自转运蛋白(AT)、Sec-加-两配偶体分泌(TPS)，Sec-加-主终端分支(MTB)和Tat-加-MTB途径增加蛋白质穿过膜的易位的方法。

在一些实施例中，如本文所述的信号多肽利用Sec分泌系统。据报道，Sec系统负责输出具有穿过细胞质膜的N-末端信号多肽的蛋白质(参见，Agarraberes和Dice,BiochimBiophys Acta.[生物化学与生物物理学报]1513:1-24(2001)；Muller等人,Prog NucleicAcid Res Mol.Biol.[核酸研究前沿分子生物学]66:107-157(2001))，其各自通过引用以其全文并入本文。Sec家族的蛋白质复合物普遍发现于原核生物和真核生物中。细菌Sec系统由转运蛋白质、分子伴侣蛋白质(SecB)或信号识别颗粒(SRP)和信号肽酶(SPase I和SPase II)组成。大肠杆菌中的Sec转运复合物由三个完整的内膜蛋白质(SecY、SecE和SecG)以及细胞质ATP酶(SecA)组成。SecA招募SecY/E/G复合物以形成有活性的易位通道。分子伴侣蛋白SecB与新生多肽链结合以防止其折叠并将其靶向SecA。随后将线性多肽链通过SecYEG通道转运，并且在切割信号多肽后，将蛋白质折叠在周质中。三种辅助蛋白质(SecD、SecF和YajC)形成复合物，该复合物对于分泌不是必需的，但在许多条件下刺激分泌高达十倍，特别是在低温下。

转运到周质中的蛋白质，即通过II型分泌系统，也可以在另外的步骤中输出到胞外培养基中。这些机制通常通过自转运蛋白，两配偶体分泌系统，主要终端分支系统或菌毛引导孔蛋白。在一些实施例中，本发明涉及使用II型分泌系统增加包含本文所述信号多肽的蛋白质穿过膜的易位的方法。

信号多肽与分泌系统的蛋白质相互作用，使细胞正确地将蛋白质引导至其适当的目的地。八种已知的基于信号多肽的分泌系统中的五种是涉及Sec系统的分泌系统。这五种被称为涉及Sec依赖性细胞质膜易位，并且其中可操作的信号多肽可称为Sec依赖性信号多肽。开发合适的分泌信号的一个问题是确保信号被适当地表达并从表达的蛋白质上切割下来。

Sec途径的信号多肽通常由以下三个结构域组成：(i)带正电的n-区，(ii)疏水性的h-区和(iii)不带电但极性的c-区。信号肽酶的切割位点位于c-区。然而，信号多肽保守程度和长度以及切割位点位置在不同蛋白质之间可以变化。

Sec依赖性蛋白质输出的特征是在输出蛋白质中存在短的(约30个氨基酸)、主要是疏水性氨基末端信号多肽。信号多肽有助于蛋白质输出，并在输出的蛋白质到达周质时被周质信号肽酶切割掉。典型的N-末端Sec信号多肽含有具有至少一个精氨酸或赖氨酸残基的N-结构域，随后是含有一段疏水性残基的结构域，和含有用于信号肽酶的切割位点的C-结构域。

信号多肽

在本发明的一些实施例中，提供了信号多肽，其中该信号多肽是新颖分泌信号多肽，其可用于将可操作地连接的目的蛋白质或目的多肽靶向(革兰氏阴性细菌的)周质或到胞外空间中。在一些实施例中，本发明的信号多肽包含DsbAss N-末端结构域和C-末端结构域，以及PelBss H-结构域。在一些实施例中，本发明的信号多肽包含SEQ ID NO:1的氨基酸序列。在一些实施例中，信号多肽是分离的多肽。在优选的实施例中，信号多肽附接在目的异源多肽的N-末端。

本发明的信号多肽证明了信号多肽的疏水性区(h-区)，并且h-区氨基酸的位置显著影响大肠杆菌中蛋白质的分泌效率。例如，如本文发现的实例中所证明的，附接至本发明的信号多肽的α毒素(AT_H35L蛋白)相对于包含dsbAss或pelBss信号多肽的α毒素具有增加的分泌效率。另外，本发明的信号多肽证明，没有多态性的h-区氨基酸的位置的位移改变了蛋白质的分泌效率。

在一些实施例中，该信号多肽是MKKITAAAGLLLLAAQPAMA(SEQ ID NO:1)。在一些实施例中，该信号多肽包含与SEQ ID NO:1约70％、75％、80％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％相同的氨基酸序列。在一些实施例中，该信号多肽包含与SEQ ID NO:1约90％相同的氨基酸序列。在一些实施例中，该信号多肽包含与SEQ ID NO:1约95％相同的氨基酸序列。

在一些实施例中，信号多肽与SEQ ID NO:1基本上同源或基本上相似。“基本上同源的”或“基本上相似的”是指与使用标准参数使用本文所述的比对程序之一的参考序列相比，具有至少约60％或65％的序列同一性、约70％或75％的序列同一性、约80％或85％的序列同一性、约90％、约91％、约92％、约93％、约94％、约95％、约96％、约97％、约98％、或约99％或更高的序列同一性的氨基酸。

在一些实施例中，信号多肽包含SEQ ID NO:1的片段，其从氨基末端或羧基末端截短1、2、3或4个氨基酸，优选地1或2个氨基酸，但保留生物学活性，即分泌信号活性。在一些实施例中，信号多肽包含缺失自SEQ ID NO:1的氨基酸序列的内部氨基酸，其中缺失1、2、3或4个氨基酸，优选地1或2个氨基酸。在一些实施例中，信号多肽包含插入SEQ ID NO:1的氨基酸序列的内部或外部氨基酸，其中插入了1、2、3或4个氨基酸。

在一些实施例中，信号多肽包含SEQ ID NO:1的片段，其中1、2、3或4个氨基酸，优选地1或2个氨基酸被不同的氨基酸替代，即被取代。在一些实施例中，被替代的氨基酸是保守取代、高度保守的取代或非常高度保守的取代。“保守的氨基酸取代”是其中用具有类似侧链的氨基酸残基替代该氨基酸残基的取代。保守的、高度保守的和非常高度保守的氨基酸取代的实例见于表1。

表1

在一些实施例中，缺失、取代或插入维持信号多肽的类似的疏水性。例如，在一些实施例中，SEQ ID NO:1的信号多肽在信号多肽的H-结构域中具有类似的(或在一些情况下相同的)疏水性。

在一些情况下，SEQ ID NO:1的1、2、3或4个氨基酸彼此改变位置。在一些实施例中，SEQ ID NO:1的信号多肽的缺失、取代或插入保留了原始多肽的所希望的功能，即，信号多肽能够促进附接的蛋白质从胞内环境分泌到周质间隙、附接至外膜上或进入胞外培养液中。

异源多肽

在一些实施例中，本发明涉及蛋白质，其包含(i)信号多肽，该信号多肽包含与SEQID NO:1具有至少90％序列同一性的氨基酸序列，和(ii)异源多肽。在一些实施例中，本发明涉及蛋白质，其包含(i)信号多肽，该信号多肽包含与SEQ ID NO:1具有至少95％序列同一性的氨基酸序列，和(ii)异源多肽。在一些实施例中，本发明涉及蛋白质，其包含(i)信号多肽，该信号多肽包含SEQ ID NO:1的氨基酸序列，和(ii)异源多肽。

如本文所用，“异源多肽”，“所希望的多肽”，“异源多肽/蛋白质”或“目的多肽”可以是任何多肽或蛋白质，包括天然存在的和非天然存在的多肽或蛋白质。如本文所用，术语“蛋白质”和“多肽”是同义的，然而，为方便起见，在一些情况下，术语“蛋白质”用于指“异源多肽”，其包含未被切割的信号多肽。异源多肽可以指完整或部分蛋白质，以及功能性和非功能性蛋白质两者。“肽”定义为多肽的片段或部分，优选具有至少一种功能活性的片段或部分作为完整的多肽序列。

针对异源多肽如本文所用，“多肽”包括长度为至少三个氨基酸残基的肽。在一些实施例中，多肽具有至少约10个氨基酸残基的长度，例如至少10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、60、70、80、90、或100个氨基酸残基，包括任何两个所列值之间的范围。在一些实施例中，异源多肽包含大于20个氨基酸残基、大于30个氨基酸残基、大于40个氨基酸残基、大于50个氨基酸残基、大于60个氨基酸残基、大于70个氨基酸残基、大于80个氨基酸残基、大于90个氨基酸残基、大于100个氨基酸残基、大于120个氨基酸残基、大于150个氨基酸残基、大于200个氨基酸残基、大于250个氨基酸残基、大于300个氨基酸残基。在一些实施例中，异源多肽包含大于20个氨基酸。

在一些实施例中，异源多肽包含少于20个氨基酸残基、少于30个氨基酸残基、少于40个氨基酸残基、少于50个氨基酸残基、少于60个氨基酸残基、少于70个氨基酸残基、少于80个氨基酸残基、少于90个氨基酸残基、少于100个氨基酸残基、少于120个氨基酸残基、少于150个氨基酸残基、少于200个氨基酸残基、少于250个氨基酸残基、少于300个氨基酸残基、少于400个氨基酸残基、或少于500个氨基酸残基。在一些实施例中，异源多肽包含少于50个氨基酸。

在一些实施例中，异源多肽包含10和300个之间的氨基酸残基、10和200个之间的氨基酸残基、10和100个之间的氨基酸残基、10和50个之间的氨基酸残基、15和40个之间的氨基酸残基、20和40个之间的氨基酸、25和50个之间的氨基酸。在一些实施例中，异源多肽包含25和40个之间的氨基酸。

在一些实施例中，异源多肽具有5kDa至200kDa、10kDa至150kDa、15kDa至120kDa、20kDa至100kDa、25kDa至75kDa、25kDa至50kDa、30kDa至40kDa或30kDa至35kDa的分子量。在一些实施例中，异源多肽具有25kDa至50kDa或30kDa至35kDa的分子量。术语“多肽”进一步包括蛋白质。

在一些实施例中，可以分离异源多肽。“分离的”蛋白质或多肽是纯化至超出它们存在于细胞中的状态的蛋白质或多肽。在某些实施例中，它们可以是至少10％纯；在其他实施例中，它们可以基本上纯化至80％或90％纯度或更高。分离的蛋白质或多肽包括基本上纯的蛋白质或多肽，通过化学合成或通过生物和化学方法的组合产生的蛋白质或多肽，以及分离的重组蛋白质或多肽。本文称为“重组”的蛋白质或多肽是通过表达重组核酸产生的蛋白质或多肽。

本发明的异源多肽可以是天然存在的多肽。可替代地，异源多肽可包括最多一定整数数量的氨基酸改变。此类蛋白质或多肽变体保留功能性，并且包括通过添加、缺失或取代一个或多个氨基酸残基而不同的突变体，或包含一个或多个修饰残基的修饰的多肽和突变体。变体可具有一个或多个保守的变化，其中取代的氨基酸具有相似的结构或化学性质(例如，用异亮氨酸替代亮氨酸)。改变可以发生在参考多肽序列的氨基末端位置或羧基末端位置或这些末端位置之间的任何位置，单独地散布在参考序列中的氨基酸之间，或是以一个或多个连续组散布于参考序列内。

在某些实施例中，变体多肽可以与其天然存在的多肽至少约80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％相同的。可以使用计算机程序(例如可从NCBI和其他来源公开获得的BLASTP和TBLASTN程序)或直接序列比较来计算序列同一性百分比。可以使用本领域已知的技术产生多肽变体，这些技术包括直接修饰分离的多肽、直接合成或使用例如重组DNA技术修饰编码多肽的核酸序列。

本文还考虑了修饰的异源多肽，包括具有翻译后修饰的多肽。分离的多肽可以通过例如磷酸化、甲基化、法尼基化、羧甲基化、香叶基香叶基化、糖基化、乙酰化、豆蔻酰化、异戊烯化、棕榈酰化、酰胺化、硫酸化、酰化或其他蛋白质修饰来修饰。它们还可以用能够直接或间接提供可检测信号的标记进行修饰，包括但不限于放射性同位素和荧光化合物。多肽可用作通过标准方法制备抗体的抗原。

根据本披露，这些异源多肽可以与信号多肽融合(使用例如重组技术)以指导异源多肽从宿主细胞的分泌。在一些实施例中，异源多肽可以与信号多肽融合，但在信号多肽和异源多肽之间具有间隔子多肽。信号多肽与异源多肽的融合可以通过本领域技术人员已知的方法(例如使用重组技术)完成。在本上下文中，异源多肽一旦被转运至周质或胞外环境就被称为“分泌的多肽”，并且可包括完整多肽或多肽的功能结构域。希望从宿主细胞分泌的任何异源多肽(例如，酶或药学上有活性的蛋白质等)适合与本文所述的信号多肽一起使用。信号多肽典型地与分泌的多肽的氨基末端融合。融合多肽可以通过培养用融合核酸分子转染的重组细胞来产生，该融合核酸分子编码附接至分泌的多肽或其结构域的氨基末端的信号多肽。在某些实施例中，融合信号多肽除了指导其分泌外，还可以增加分泌的异源多肽的表达。

如本文所用，“分泌的”等是指如下多肽：该多肽由细胞产生，穿过膜或通过膜转运，并由该细胞输出到表达其的细胞的周质、外膜或胞外环境。在一些实施例中，“分泌的”蛋白质包括但不限于从表达它们的细胞中完全分泌的蛋白质(例如，可溶性蛋白质)。在一些实施例中，多肽不稳定地附接至细胞。在一些实施例中，分泌的异源多肽可溶于胞外环境。在一些实施例中，分泌的异源多肽不包括锚。

可通过本领域已知的任何测定来检测分泌的蛋白质的胞外存在以检测目的蛋白。实例包括酶活性测定，用特异性抗体检测(免疫印迹法，ELISA等)和其他合适的检测技术。

在一些实施例中，本发明包含蛋白质，其包含(i)多肽，该多肽包含与SEQ ID NO:1具有至少90％、95％或100％序列同一性的氨基酸，和(ii)异源多肽。在一些实施例中，本发明涵盖的蛋白质具有生物活性，即它们在附接或不附接信号多肽的情况下继续具有异源多肽的所希望的生物活性。“保留活性”是指蛋白质将具有至少约30％、至少约50％、至少约70％、至少约80％、约90％、约95％、约100％、约110％、约125％、约150％、至少约200％或更高活性的异源多肽。

在一些实施例中，异源多肽/蛋白质以活性形式产生。术语“活性”意指存在生物活性，其中生物活性与相应的天然蛋白质或多肽的生物活性可比较的或基本地对应。在蛋白质的上下文中，这典型地意指与使用标准参数的相应天然蛋白质或多肽相比较，多肽包含具有至少约20％，约50％，优选地至少约60％-80％，并且最优选至少约90％-95％活性的生物学功能或效果。可以利用针对特定蛋白质或多肽的相应标准、靶向比较生物学测定来进行蛋白质或多肽活性的确定。目的蛋白质或多肽保持生物活性的一个指示是该多肽与天然多肽在免疫学上交叉反应。

本发明的方法和组合物可用于在细胞表达系统中产生高水平的适当加工的目的异源多肽/蛋白质。目的蛋白质或多肽可以是任何种类和任何大小的蛋白质或多肽。然而，在某些实施例中，异源多肽/蛋白质是治疗上有用的蛋白质或多肽。在一些实施例中，异源多肽/蛋白质可以是哺乳动物蛋白质，例如人类蛋白质，并且可以是例如生长因子、细胞因子、趋化因子或血液蛋白质。可以以与天然蛋白质或多肽类似的方式处理异源多肽/蛋白质。在某些实施例中，异源多肽与信号多肽融合。在一些实施例中，如本文所述的蛋白质包括信号多肽。

本发明的异源多肽可包括有利地易位至周质或胞外环境的任何多肽。在一些实施例中，异源多肽是商业上重要的多肽。在一些实施例中，异源多肽选自下组，该组由以下组成：酶、毒素、抗体、抗体片段、抗原、治疗性蛋白质及其组合。所希望的异源多肽/蛋白质的另外的实例包括但不限于萤光素酶；荧光蛋白(例如GFP)；生长激素(GH)及其变体；胰岛素样生长因子(IGF)及其变体；粒细胞集落刺激因子(G-CSF)及其变体；促红细胞生成素(EPO)及其变体；胰岛素，例如胰岛素原、前胰岛素原、胰岛素、胰岛素类似物等；抗体及其变体，例如杂合抗体、嵌合抗体、人源化抗体、单克隆抗体；抗体的抗原结合片段(Fab片段)，抗体的单链可变片段(scFV片段)；肌营养不良蛋白及其变体；凝血因子及其变体；囊性纤维化跨膜传导调节子(CFTR)及其变体；和干扰素及其变体等。在一些实施例中，异源多肽是疫苗中使用的抗原。

根据本发明的异源多肽/蛋白质的实例可包括分子，例如肾素，生长激素、包括人类生长激素；牛生长激素；生长激素释放因子；甲状旁腺激素；促甲状腺激素；脂蛋白；α-1-抗胰蛋白酶；胰岛素A-链；胰岛素B-链；胰岛素原；促血小板生成素；促卵泡激素；降钙素；黄体生成素；胰高血糖素；凝血因子，例如因子VIIIC、因子IX、组织因子和血管性假血友病因子(von Willebrands factor)；抗凝血因子，例如蛋白质C；心房钠尿因子；肺表面活性物质；纤溶酶原活化剂，例如尿激酶或人尿或组织型纤溶酶原活化剂(t-PA)；铃蟾肽；凝血酶；造血生长因子；肿瘤坏死因子-α和肿瘤坏死因子-β；脑啡肽酶；血清白蛋白，例如人血清白蛋白；缪勒管激素(Muellerian)-抑制物质；松弛素A-链；松弛素B-链；松弛素原(prorelaxin)；小鼠促性腺激素相关多肽；微生物蛋白质，例如β-内酰胺酶；DNA酶；抑制素；激活素；血管内皮生长因子(VEGF)；激素或生长因子的受体；整合素；蛋白质A或D；类风湿因子；神经营养因子例如脑源性神经营养因子(BDNF)，神经营养蛋白-3、-4、-5或-6(NT-3、NT-4、NT-5或NT-6)，或神经生长因子例如NGF-13；心肌营养因子(心脏肥大因子)例如心肌营养因子-1(CT-1)；血小板源性生长因子(PDGF)；成纤维细胞生长因子例如aFGF和bFGF；表皮生长因子(EGF)；转化生长因子(TGF)例如TGF-α和TGF-β，包括TGF-β1、TGF-β2、TGF-β3、TGF-β4、或TGF-β5；胰岛素样生长因子-I和-II(IGF-I和IGF-II)；des(1-3)-IGF-I(脑IGF-I)、胰岛素样生长因子结合蛋白质；CD蛋白质例如CD-3、CD-4、CD-8、和CD-19；促红细胞生成素；骨诱导因子；免疫毒素；骨形态发生蛋白(BMP)；干扰素例如干扰素-α、-β、和-γ；集落刺激因子(CSF)，例如M-CSF、GM-CSF、和G-CSF；白细胞介素(IL)，例如IL-1至IL-10；抗HER-2抗体；超氧化物歧化酶；T-细胞受体；表面膜蛋白；衰变加速因子；病毒抗原例如像AIDS包膜的部分；运输蛋白；归巢受体；地址素；调节蛋白；抗体；和任何以上列出的多肽的片段。

在某些实施例中，异源多肽/蛋白质可选自IL-1、IL-1a、IL-1b、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、IL-11、IL-12、IL-12elasti、IL-13、IL-15、IL-16、IL-18、IL-18BPa、IL-23、IL-24、VIP、促红细胞生成素、GM-CSF、G-CSF、M-CSF、血小板源性生长因子(PDGF)、MSF、FLT-3配体、EGF、成纤维细胞生长因子(FGF；例如α-FGF(FGF-1)、β-FGF(FGF-2)、FGF-3、FGF-4、FGF-5、FGF-6、或FGF-7)、胰岛素样生长因子(例如IGF-1，IGF-2)；肿瘤坏死因子(例如TNF，淋巴毒素)、神经生长因子(例如NGF)、血管内皮生长因子(VEGF)；干扰素(例如IFN-α、IFNβ、IFN-γ)；白血病抑制因子(LIF)；睫状神经营养因子(CNTF)；制癌蛋白M；干细胞因子(SCF)；转化生长因子(例如TGF-α、TGF-β1、TGF-β2、TGF-γ)；TNF超家族(例如LIGHT/TNFSF14、STALL-1/TNFSF13B(BLy5、BAFF、THANK)、TNFα/TNFSF2和TWEAK/TNFSF12)；或趋化因子(BCA-1/BLC-1、BRAK/Kec、CXCL16、CXCR3、ENA-78/LIX、嗜酸性粒细胞趋化因子-1、嗜酸性粒细胞趋化因子-2/MPIF-2、Exodus-2/SLC、不规则趋化因子/神经趋化因子、GROα/MGSA、HCC-1、I-TAC、淋巴细胞趋化因子/ATAC/SCM、MCP-11MCAF、MCP-3、MCP-4、MDC/STCP-1/ABCD-1、MIP-4/PARC/DC-CK1、PF-4、RANTES、SDF1、TARC、或TECK)。

在本发明的一些实施例中，异源多肽/蛋白质可以是多亚基蛋白质或多肽的全部或部分。可以表达的多亚基蛋白质包括同聚蛋白质和异聚蛋白质。多亚基蛋白质可包括两个或更多个亚基，它们可以相同或不同。例如，异源多肽/蛋白质可以是包含2、3、4、5、6、7、8、9、10、11、12或更多个亚单位的同聚蛋白质。异源多肽/蛋白质也可以是包括2、3、4、5、6、7、8、9、10、11、12或更多个亚单位的异聚蛋白质。示例性多亚基蛋白包括：受体(包括离子通道受体)；胞外基质蛋白(包括软骨素)；胶原；免疫调节剂(包括MHC蛋白质，全链抗体和抗体片段)；酶(包括RNA聚合酶和DNA聚合酶)；和膜蛋白质。

在另一个实施例中，异源多肽/蛋白质可以是血液蛋白质。在该实施例中表达的血液蛋白质包括但不限于载体蛋白质，例如白蛋白(包括人类和牛白蛋白)、转铁蛋白、重组转铁蛋白半分子、触珠蛋白、纤维蛋白原和其他凝血因子、补体组分、免疫球蛋白、酶抑制剂、物质例如血管紧张素和缓激肽的前体、胰岛素、内皮素、和球蛋白(包括α、β和γ-球蛋白)，以及主要在哺乳动物血液中发现的其他类型的蛋白质、多肽和其片段。已经报道了许多血液蛋白质的氨基酸序列(参见，S.S.Baldwin(1993)Comp.Biochem Physiol.[比较生物化学和生理学]106b:203-218)，包括人类血清白蛋白的氨基酸序列(Lawn,L.M.等人,NucleicAcids Research[核酸研究]9:6103-6114(1981))和人类血清转铁蛋白(Yang,F.等人,Proc.Natl.Acad.Sci.USA[美国科学院院报]81:2752-2756(1984))。

在另一个实施例中，异源多肽/蛋白质可以是重组酶或辅因子。在该实施例中表达的酶和辅因子包括但不限于醛缩酶、胺氧化酶、氨基酸氧化酶、天冬氨酸酶、B12依赖性酶、羧肽酶、羧基酯酶、羧基裂解酶、胰凝乳蛋白酶、需要酶的辅酶A、氰醇合成酶、胱硫醚合成酶、脱羧酶、脱氢酶、醇脱氢酶、脱水酶、心肌黄酶、双加氧酶、烯酸还原酶、环氧物水合酶、富马酸酶、半乳糖氧化酶、葡糖异构酶、葡萄糖氧化酶、糖基转移酶、甲基转移酶、腈水化酶、核苷磷酸化酶、氧化还原酶、氧腈酶、肽酶、糖基转移酶、过氧化物酶、融合至治疗活性多肽的酶、组织纤溶酶原活化剂；尿激酶、蛇毒凝血酶、链激酶；过氧化氢酶、超氧化物歧化酶；DNA酶、氨基酸水解酶(例如天冬酰胺酶，氨基水解酶)；羧肽酶；蛋白酶、胰蛋白酶、胃蛋白酶、胰凝乳蛋白酶、木瓜蛋白酶、菠萝蛋白酶、胶原酶；神经氨酸苷酶；乳糖酶、麦芽糖酶、蔗糖酶和阿拉伯呋喃糖苷酶。

在另一个实施例中，异源多肽/蛋白质可以是单链、Fab片段和/或全链抗体或其片段或部分。单链抗体可以包括在单个稳定折叠的多肽链上抗体的抗原结合区。Fab片段可以是特定抗体的一段。Fab片段可含有抗原结合位点。Fab片段可含有2个链：轻链和重链片段。这些片段可以经由接头或二硫键连接。

在另一个实施例中，异源多肽/蛋白质可以是疫苗中使用的抗原，例如可商购的疫苗。例如，在一些实施例中，异源多肽/蛋白质是在白喉、梭菌、破伤风、百日咳、脊髓灰质炎、乙型肝炎、b型流感嗜血杆菌、甲型肝炎、轮状病毒、肺炎球菌、腮腺炎、麻疹、风疹、水痘、人乳头瘤病毒、脑膜炎球菌、4型腺病毒、7型腺病毒、炭疽、脊髓灰质炎、脑膜炎球菌、狂犬病、轮状病毒、黄热病、带状疱疹和/或流感疫苗中发现的主要抗原。

在一些实施例中，异源多肽/蛋白质是成孔α-溶血素，也称为α-毒素(AT)(Natale等人,Biochimica et Biophysica Acta[生物化学与生物物理学学报]1778:1735-1756(2008))。AT由大多数金黄色葡萄球菌(Staphylococcus aureus)(S.aureus)产生并分泌为水溶性单体。处理AT多肽以产生重大约33kDa的293个氨基酸的成熟胞外蛋白质(Berube等人,Toxins[毒素]5:1140-1166(2013))，这是最充分表征的毒力因子之一。该蛋白质能够在宿主细胞膜上结合并寡聚成七聚体结构，但是它通过用亮氨酸(AT_H35L)取代组氨酸35而在体外丧失溶血活性并在腹膜内鼠模型中丧失致死性(Menzies等人,Infect Immun[感染与免疫]62:1843-1847(1994))。由于没有可用于预防金黄色葡萄球菌感染的疫苗，已经研究了部分减弱的α毒素蛋白(AT_H35L)作为预防金黄色葡萄球菌感染的疫苗靶标。(Adhikari等人,PLoS ONE[公共科学图书馆·综合]7:e38567(2012)；Menzies等人,InfectImmun[感染与免疫]64:1839-1842(1996)；Ragle等人,InfectImmun[感染与免疫]77:2712-2718(2009))。在一些实施例中，异源多肽/蛋白质包含来自金黄色葡萄球菌的α毒素，例如SEQID NO:3。在一些实施例中，α毒素在对应于H35的氨基酸位置包含取代。在一些实施例中，α毒素包含H35L取代(AT_H35L)，例如SEQ ID NO:4。在一些实施例中，异源多肽/蛋白质包含AT_H35L和本发明的信号多肽，例如SEQ ID NO:2。

在某些实施例中，异源多肽是天然蛋白质(例如天然哺乳动物或人类蛋白质)或与其基本上同源。在这些实施例中，蛋白质不是以多联体形式发现，而是仅与信号多肽以及任选地标签序列连接以进行纯化和/或识别。

在一些实施例中，本发明涉及包含如本文所述的信号多肽和异源多肽的组合物。在一些实施例中，该组合物是药物或治疗剂。在一些实施例中，该组合物是治疗有效的。在一些实施例中，该组合物是药学上可接受的。

核酸

如本文所用的“核酸”或“多核苷酸”是指任何长度的含有嘌呤和嘧啶的聚合物，多核糖核苷酸或多脱氧核糖核苷酸或混合的多核糖核苷酸-多脱氧核糖核苷酸。这包括单链分子和双链分子(即DNA-DNA、DNA-RNA和RNA-RNA杂合体)。这还包括含有修饰的碱基的核酸。

本文中称为“分离的”的核酸是已从其天然环境中除去或与其起源来源的基因组DNA或细胞RNA的核酸分离的核酸(例如，它存在于细胞或核酸(例如文库)的混合物中)，并且可能已经过进一步处理。分离的核酸包括通过本文所述的方法获得的核酸，类似的方法或其他合适的方法，包括基本上纯的核酸，通过化学合成、通过生物和化学方法的组合产生的核酸，以及分离的重组核酸。在一些实施例中，可以分离本文所述的任何核酸。

本文中称为“重组”的核酸是通过重组DNA方法产生的核酸，包括通过依赖人工复制方法(例如聚合酶链反应(PCR)和/或或使用限制性内切酶克隆到载体中)的程序产生的那些核酸。重组核酸还包括由通过细胞的天然机制发生的重组事件产生的那些，但是在引入被设计为允许或可能发生所希望的重组事件的核酸的细胞之后进行选择。在一些实施例中，本文所述的核酸可以是重组核酸。

核酸可以从其天然来源分离或使用重组DNA技术(例如，聚合酶链反应(PCR)扩增，克隆)或化学合成产生。核酸分子可包括，例如，基因、基因的天然等位基因变体、编码区或其部分、以及以某种方式通过核苷酸插入、缺失、取代和/或倒位修饰的编码和/或调节区，使得这些修饰基本上不会干扰核酸分子编码多肽或在严格条件下与天然基因分离株形成稳定杂合体的能力。核酸分子可包括简并性。如本文所用，核苷酸简并性是指一种氨基酸可由不同核苷酸密码子编码的现象。因此，编码蛋白质或多肽的核酸分子的核酸序列可以由于简并性而变化。

不需要核酸分子来编码具有蛋白质活性的多肽或蛋白质。例如，核酸分子可以编码截短的、突变的或无活性的蛋白质。

核酸可以衍生自各种来源，包括DNA、cDNA、合成DNA、合成RNA或其组合。此类序列可包含基因组DNA，其可包括或可不包括天然存在的内含子。序列、基因组DNA或cDNA可以以若干种方式中的任何一种获得。可以通过本领域熟知的方法从合适的细胞中提取和纯化基因组DNA。可替代地，可以将mRNA从细胞中分离并用于通过逆转录或其他方法产生cDNA。

在一些实施例中，本发明还包括具有编码新颖信号多肽的序列的核酸，该述信号多肽可用于将可操作地连接的目的异源多肽靶向(革兰氏阴性细菌的)周质或进入胞外空间。在一些实施例中，核酸编码信号多肽，该信号多肽包含与SEQ ID NO:1具有至少90％、95％或100％序列同一性的氨基酸序列。在另一个实施例中，核酸序列编码信号多肽，该多肽包含与SEQ ID NO:1的序列具有至少约90％、91％、92％、93％、94％、95％、96％、97％、98％或99％同一性的氨基酸序列。

在一些实施例中，本发明包括具有编码本文所述的新颖信号多肽的序列的分离的核酸，该信号多肽可操作地连接至AT_H35L(SEQ ID NO:2)，其将AT_H35L易位至(革兰氏阴性细菌的)周质或进入胞外空间。在一些实施例中，核酸编码多肽，该多肽包含与SEQ ID NO:2具有至少90％、95％或100％序列同一性的氨基酸序列。在另一个实施例中，核酸编码多肽，该多肽包含与SEQ ID NO:2的序列具有至少约90％、91％、92％、93％、94％、95％、96％、97％、98％或99％序列同一性的氨基酸序列。

在一些实施例中，核酸包含本文所述的信号多肽，和一种或多种有助于将核酸克隆到载体中的特征。在一些实施例中，核酸包含一个或多个限制性内切酶位点。

技术人员将理解，可以通过突变将变化引入本发明的核苷酸序列中，而不会导致编码的信号多肽的变化。在一些实施例中，技术人员可以通过突变引入本发明的核苷酸序列，其导致编码的信号多肽的氨基酸序列的改变，而不改变信号多肽的生物学活性。因此，可以通过将一个或多个核苷酸取代、添加或缺失引入本文披露的相应核苷酸序列中来产生变体分离的核酸分子，使得将一个或多个氨基酸取代、添加或缺失引入编码的蛋白质中。突变可通过标准技术、如定点诱变和PCR介导的诱变来引入。这些变体核苷酸序列也涵盖在本发明中。

本发明的“变体”多核苷酸包括天然存在的多核苷酸以及化学上改变的多核苷酸。本发明的天然存在的多核苷酸变体是如下那些，这些(i)在自然界中，例如在相关的病毒和非病毒物种中发现，(ii)通过如本文所述的化学相似性与本发明的多核苷酸相关以及(iii)编码如本文所述的编码的多肽连接的多肽。在一些实施例中，核酸可包含一种或多种变体多核苷酸。

可以基于宿主生物的密码子使用来调整本文披露的核酸。密码子使用或密码子偏倚在本领域中是熟知的。可以通过改变其遗传密码来修饰所选择的编码序列以匹配细菌宿主细胞所采用的编码序列，并且可以增强其密码子序列以更好地近似宿主所采用的密码子序列。遗传密码选择和密码子频率增强可以根据本领域普通技术人员已知的任何各种方法(例如寡核苷酸定点诱变)进行。有助于此方法的有用的在线InterNet资源包括，例如：(1)Kazusa DNA研究所的密码子使用数据库(2-6-7Kazusa-kamatari，木更津，千叶市292-0818日本)并且可在www.kazusa.orjp/codon获得；和(2)遗传密码表可从NCBI分类数据库www.ncbi.nln.nih.gov/-Taxonomy/Utils/wprintgc.cgi？mode＝c.获得。应认识到，可以调整信号多肽，本文其他地方所述的目的异源多肽或两者的编码序列以用于密码子使用。

表达载体

本文还披露了载体(包括表达载体)，该载体含有本发明的信号多肽和异源多肽。“载体”或“重组载体”是用作用于操作选择的核酸序列或将这种核酸序列引入宿主细胞的工具的核酸分子。重组载体可适用于克隆、测序或以其他方式操纵所选择的核酸序列，例如通过将选择的核酸序列表达或递送到宿主细胞中以形成重组细胞。这种载体典型地含有不与选择的核酸序列邻近的天然存在的异源核酸序列，尽管载体还可含有调节核酸序列(例如，启动子，非翻译区)，该调节核酸序列天然存在于邻近所选择的核酸序列或可用于表达核酸分子。

“载体”或“表达载体”是复制子，例如质粒、噬菌体、病毒、转座子、噬菌粒或粘粒，向其上可以附接另一个DNA区段，即“插入片段”，以便产生在细胞中附接的DNA区段的复制。“载体”包括游离型(例如，质粒)和非游离型载体。在本披露的一些实施例中，该载体是游离型载体。在一些实施例中，该载体是质粒。通常，载体可含有在至少一种生物中有功能的复制起点，方便的限制性内切核酸酶位点和宿主细胞的可选择标记。

载体可以是RNA或DNA。载体可以作为染色体外元件(例如质粒)保持，或者可以将它整合到重组宿主细胞的染色体中。整个载体可以保留在宿主细胞内的位置，或者在某些条件下，质粒DNA可以被删除，留下选择的核酸分子。整合的核酸分子可以在染色体启动子控制下、在天然或质粒启动子控制下、或在若干种启动子控制的组合下。核酸分子的单个或多个拷贝可以整合到染色体中。重组载体可含有至少一种可选择标记。

术语“表达载体”是指能够在插入宿主细胞或其他(例如，无细胞)表达系统后指导已克隆到载体中的核酸序列的表达的载体。当核酸序列被转录以产生mRNA序列时，“表达”核酸序列。在本发明的大多数情况下，可以翻译该转录物以产生氨基酸序列，例如本发明的异源多肽/蛋白质。克隆的基因通常置于表达控制序列的控制下(即，可操作地连接)。短语“可操作地连接”是指以某种方式将核酸分子与表达控制序列连接，使得当引入(即，转化、转导、转染、缀合或导入)宿主细胞时可以表达分子。

重组载体和表达载体可含有一种或多种调节序列或表达控制序列。调节序列广泛地涵盖表达控制序列(例如，转录控制序列或翻译控制序列)，以及允许载体在宿主细胞中复制的序列。转录控制序列是控制转录的起始、延伸、或终止的序列。合适的调节序列包括可以引入重组核酸分子的宿主细胞或生物中起作用的任何序列，包括控制转录起始的那些，例如启动子、增强子、终止子、操纵子和阻遏子序列。另外的调节序列包括翻译调节序列、复制起点和与重组细胞相容的其他调节序列(参见例如，D.V.Goeddel,MethodsEnzymol.[酶学方法]185:3-7)。

表达载体可含有允许一种或多种目的蛋白质的组成型表达或可诱导表达的元件。如本文所用的，“启动子”，“启动子序列”或“启动子区”是指能够结合RNA聚合酶并涉及起始下游编码或非编码序列的转录的DNA调节区/序列。在本披露的一些实例中，启动子序列包括转录起始位点并向上游延伸以包括以高于背景可检测水平起始转录所必需的最少数量的碱基或元件。在一些实施例中，启动子序列包括转录起始位点，以及负责RNA聚合酶结合的蛋白质结合结构域。各种启动子，包括诱导型启动子，可用于驱动本发明的各种载体。

许多诱导型和组成型表达系统是本领域已知的。例如，表达控制序列如启动子区可选自任何所希望的基因。细菌启动子可包括lacI、lacZ、T3、T7、gpt、λPR、Ptac16、Ptac17、PtacII、PlacUV5、T7lac启动子和trc。在一些实施例中，包含Ptac启动子的载体允许在不存在lad基因的情况下组成型表达，但是当载体还含有lad基因时，可以通过添加异丙基-β-D-硫代半乳糖苷(IPTG)来诱导表达。选择适当的启动子完全在本领域普通技术水平之内。

根据本发明使用的启动子可以是组成型启动子或调节的启动子。在一些实施例中，启动子不衍生自宿主细胞生物。在某些实施例中，启动子衍生自大肠杆菌生物。

可用于根据本发明的表达系统中的非lac型启动子的常见实例是本领域技术人员已知的。参见例如，J.Sanchez-Romero和V.De Lorenzo(1999)Genetic Engineering ofNonpathogenic Pseudomonas strains as Biocatalysts for Industrial andEnvironmental Processes[非致病性假单胞菌菌株的基因工程作为工业和环境方法的生物催化剂],在Manual of Industrial Microbiology and Biotechnology[工业微生物学和生物技术手册]中(A.Demain和J.Davies编辑)第460-74页(ASM出版社，华盛顿哥伦比亚特区)；H.Schweizer(2001)Vectors to express foreign genes and techniques tomonitor gene expression for Pseudomonads[用于表达外源基因的载体和监测假单胞菌的基因表达的技术],Current Opinion in Biotechnology[生物技术新见],12:439-445；和R.Slater和R.Williams(2000)The Expression of Foreign DNA in Bacteria[外源DNA在细菌中的表达],(J.Walker和R.Rapley编辑)第125-54页(The Royal Society ofChemistry[皇家化学学会]，剑桥，英国)。具有所选择的细菌宿主细胞天然启动子核苷酸序列的启动子也可用于控制编码靶标多肽的转基因的表达，例如，假单胞菌属邻氨基苯甲酸盐或苯甲酸盐操纵子启动子(Pant，Pben)。也可以使用串联启动子，其中一个以上的启动子与另一个启动子共价附接，无论序列相同或不同，例如Pant-Pben串联启动子(启动子间杂合体)或Plac-Plac串联启动子，或者是否衍生自相同或不同的生物。

调节的启动子利用启动子调节蛋白，以便控制启动子作为一部分的基因的转录。在本文使用调节的启动子的情况下，相应的启动子调节蛋白也是根据本发明的表达系统的一部分。启动子调节蛋白的实例包括：激活子蛋白质，例如大肠杆菌分解代谢物激活子蛋白质、MalT蛋白质；AraC家族转录激活子；阻遏子蛋白质，例如大肠杆菌LacI蛋白质；和双功能调节蛋白，例如大肠杆菌NagC蛋白。许多调节的启动子/启动子调节蛋白质是本领域已知的。

启动子调节蛋白与效应子化合物相互作用，即可逆地或不可逆地与调节蛋白结合的化合物，以使蛋白质能够释放或结合至启动子的控制下的基因的至少一个DNA转录调节区，从而允许或阻断转录酶在起始基因转录中的作用。效应子化合物被分类为诱导物或辅阻遏物，并且这些化合物包括天然效应化合物和安慰诱导物化合物。许多调节的启动子/启动子-调节-蛋白质/效应子-化合物三重体是本领域已知的。虽然效应子化合物可以在整个细胞培养或发酵中使用，但在使用调节的启动子的优选的实施例中，在所希望的数量或密度的宿主细胞生物量生长后，将适当的效应子化合物直接地或间接地添加至培养物中导致编码目的蛋白质或多肽的所希望的一个或多个基因的表达。

通过举例的方式，在利用lac家族启动子的情况下，lacI基因也可以存在于系统中。lacI基因(通常地)是组成型表达的基因，编码Lac阻遏子蛋白质(LacD蛋白质)，该Lac阻遏子蛋白质与这些启动子的lac操纵子结合。因此，在利用lac家族启动子的情况下，lacI基因也可以包括在表达系统中并在表达系统中表达。在lac启动子家族成员例如tac启动子的情况下，效应子化合物是诱导物，优选地安慰诱导物例如IPTG(异丙基-D-1-硫代半乳糖苷，也称为“异丙基硫代半乳糖苷”)。

在一些实施例中，使用pET表达系统。pET表达系统提供高水平的蛋白质产生。从强T7lac启动子诱导表达。该系统利用噬菌体T7RNA聚合酶的高活性和特异性用于高水平转录目的基因。位于启动子区的lac操纵子提供比传统的基于T7的载体更严格的调节，改善质粒稳定性和细胞活力(Studier和Moffatt,J Molecular Biology[分子生物学杂志]189(1):113-30(1986)；Rosenberg等人,Gene[基因]56(1):125-35(1987))。T7表达系统使用T7启动子和T7 RNA聚合酶(T7 RNAP)用于目的基因的高水平转录。在T7表达系统中实现高水平表达，因为T7RNAP比天然大肠杆菌RNAP更持续并且致力于目的基因的转录。通过在宿主细胞中提供T7RNAP的源来诱导所鉴定基因的表达。这通过使用含有T7RNAP基因的染色体拷贝的BL21大肠杆菌宿主来实现。T7 RNAP基因在lacUV5启动子的控制下，这可以通过IPTG诱导。T7RNAP在诱导后表达并转录目的基因。

在一些实施例中，使用pBAD表达系统。pBAD表达系统通过特定碳源例如葡萄糖、甘油和阿拉伯糖的存在允许目的蛋白质或多肽的严格控制的，可滴定的表达(Guzman等人,JBacteriology[细菌学杂志]177(14):4121-30(1995))。pBAD载体经过独特设计以精确控制表达水平。来自pBAD载体的异源基因表达在araBAD启动子处起始。启动子受araC基因产物的正调节和负调节。AraC是一种转录调节子，与L-阿拉伯糖形成复合物。在没有L-阿拉伯糖的情况下，AraC二聚体阻断转录。为了最大转录激活，需要两个事件：(i.)L-阿拉伯糖与AraC结合，允许转录开始。(ii.)cAMP激活子蛋白质(CAP)-cAMP复合物与DNA结合并刺激AraC与启动子区的正确位置的结合。

在一些实施例中，使用trc表达系统。trc表达系统允许来自trc启动子的大肠杆菌中的高水平、调节的表达。已经优化了trc表达载体以在大肠杆菌中表达真核基因。trc启动子是衍生自色氨酸(trp)和乳糖(lac)启动子的强杂合启动子。它通过lacO操纵子和lacIQ基因产物的调节(Brosius,J.,Gene[基因]27:161-72(1984))。

在一些实施例中，使用pJ411表达系统(DNA2.0门洛帕克公司(Inc.,Menlo Park)，加利福尼亚州，美国)。表达包括T7启动子和卡那霉素抗性标记。

在另一个实施例中，表达载体进一步包含与信号多肽的编码序列邻近的标签序列或与目的异源多肽/蛋白质的编码序列邻近的标签序列。在一些实施例中，该标签序列允许蛋白质的鉴定、分开、纯化和/或分离。标签序列可以是亲和标签，例如六聚组氨酸亲和标签。在另一个实施例中，亲和标签可以是谷胱甘肽-S-转移酶分子。标签也可以是荧光分子，例如YFP或GFP，或这种荧光蛋白质的类似物。标签也可以是抗体分子的一部分，或用于已知的用于纯化的结合配偶体的已知抗原或配体。因此，在一些实施例中，载体可包含编码包含信号多肽、异源多肽和标签序列的蛋白质的核酸序列。

其他调节元件可以包括在载体中(也称为“表达构建体”)。这些元件包括但不限于，例如，转录增强子序列、翻译增强子序列、其他启动子、激活子、翻译起始和终止信号、转录终止子、顺反子调节子和多顺反子调节子。

典型地，载体包括与一种或多种表达控制序列(例如转录控制序列或翻译控制序列)可操作地连接的至少一种编码信号多肽和异源多肽的核酸分子。在一个方面，表达载体可包含如下核酸，该核酸编码信号多肽，如本文所述，与编码待表达的异源多肽/蛋白质的核酸融合，并且可操作地连接至至少一种调节序列。示例性的实施例包括表达载体，这些表达载体包含编码与AT_H35L(SEQ ID NO:2)融合的如本文所述的信号多肽的核酸。应当理解的是，表达载体的设计可以取决于这样的因素，如将要转化的宿主细胞的选择和/或待表达的多肽的类型。

通常，载体将包括复制起点和可选择标记，其允许鉴定和分离转化的宿主细胞，例如大肠杆菌的氨苄青霉素抗性基因，和衍生的启动子以指导下游结构序列的转录。异源结构序列在适当的阶段与翻译起始和终止序列组装，并且可以包括如本文所述的能够指导翻译的蛋白质分泌到周质间隙或胞外介质中的信号多肽。通过将编码信号多肽和异源多肽的结构DNA序列与具有功能性启动子的可操作的阅读状态中的合适的翻译起始和终止信号一起插入，构建用于细菌用途的有用表达载体。载体可包含一种或多种表型可选择标记和复制起点，以确保载体的维持，并且如果希望，可在宿主内提供扩增。

除蛋白质编码序列外，根据本发明的载体可包括核糖体结合位点(RBS)、转录终止子、翻译起始和终止信号。有用的RBS可以从在根据本发明的表达系统中用作宿主细胞的任何物种中获得，优选地从选择的宿主细胞中获得。已知许多特定和各种共有RBS，例如D.Frishman等人描述和引用的那些，Starts of bacterial genes:estimating thereliability of computer predictions[细菌基因的开始：估计计算机预测的可靠性],Gene[基因]234(2):257-65(1999年7月8日)；和B.E.Suzek等人,A probabilistic methodfor identifying start codons in bacterial genomes[一种用于鉴定细菌基因组中起始密码子的概率方法],Bioinformatics[生物信息学]17(12):1123-30(2001年12月)。另外，可以使用天然或合成的RBS，例如，在EP 0207459(合成RBS)中描述的那些；O.Ikehata等人,Eur.J.Biochem.[欧洲生物化学杂志]181(3):563-70(1989)(AAGGAAG的天然RBS序列)。方法、载体、翻译和转录元件以及本发明中有用的其他元件的另外实例描述于例如：Gilroy的美国专利号5,055,294和Gilroy等人的美国专利号5,128,130；Rammler等人的美国专利号5,281,532；Barnes等人的美国专利号4,695,455和4,861,595；Gray等人的美国专利号4,755,465；以及Wilcox的美国专利号5,169,760。

通过将增强子序列插入载体或质粒中来增加编码如本文所述的蛋白质和异源多肽的DNA的转录。典型的增强子是DNA的顺式作用元件，通常大小约为从10至300bp，其作用于启动子以增加其转录。实例包括各种大肠杆菌增强子。

通常，载体将包括复制起点和允许转化宿主细胞的可选择标记和衍生自高表达基因的启动子以指导下游结构序列的转录。这些启动子可以衍生自编码酶(例如3-磷酸甘油酸激酶(PGK)、酸性磷酸酶或热休克蛋白质等)的操纵子。异源结构序列在适当的阶段与翻译起始和终止序列组装，并且优选地，信号多肽能够指导翻译的多肽的分泌。任选地，异源序列可以编码融合多肽，包括赋予所希望的特征的N-末端识别多肽，例如表达的重组产物的稳定化或简化的纯化。

载体可含有可选择标记，编码用载体转化的宿主细胞存活或生长所必需的蛋白质的基因。当在适当的选择性培养基中生长时，该基因的存在仅允许表达载体的那些宿主细胞生长。典型的选择基因编码赋予抗生素或其他有毒物质抗性，补充营养缺陷型缺陷，或提供从特定培养基无法获得的关键营养物的蛋白质。标记可以是诱导型或非诱导型基因，并且通常允许阳性选择。可选择标记的非限制性实例包括氨苄青霉素抗性标记(即β-内酰胺酶)、四环素抗性标记、新霉素/卡那霉素抗性标记(即新霉素磷酸转移酶)、二氢叶酸还原酶、谷氨酰胺合成酶等。在一些实施例中，可选择标记基因是例如原养型恢复基因，其中载体用于对相应性状(例如生物催化性状，例如氨基酸生物合成或核苷酸生物合成性状，或碳源利用性状)是营养缺陷型的宿主细胞。如本领域技术人员所理解的，适当可选择标记的选择将取决于宿主细胞和不同宿主的适当标记。

大量合适的载体(其中许多包括内源调节DNA元件)是本领域技术人员已知的并且是可商购的或可以衍生自可商购的载体。作为代表性但非限制性的实例，用于细菌的有用载体可包含可选择标记和细菌复制起点，该起点衍生自包含众所周知的克隆载体pBR322(ATCC 37017)的遗传元件的可商购的质粒。这些商业载体包括，例如，pKK223-3(玛法西亚精细化学品公司(Pharmacia Fine Chemicals)，乌普萨拉(Uppsala)，瑞典)和GEM 1(普罗米加生物技术公司(Promega Biotech)，麦迪逊(Madison)，威斯康星州，美国)。这些pBR322“骨架”部分与适当的启动子和待表达的结构序列组合。其他示例性的细菌载体包括，例如，pBs、phagescript、PsiX174、pBluescript SK、pBs KS、pNH8a、pNH16a、pNH18a、pNH46a(斯特拉塔根公司(Stratagene))；pTrc99A、pKK223-3、pKK233-3、pDR540和pRIT5(法玛西亚(Pharmacia))。在将合适的宿主菌株转化并使宿主菌株生长至合适的细胞密度后，通过适当的方法(例如温度转换或化学诱导)诱导或去阻遏选择的启动子，并将细胞再培养一段时间。

有用的质粒载体的其他实例包括但不限于由如下描述的载体，例如：N.Hayase,在Appl.Envir.Microbiol.[应用与环境微生物学]60(9):3336-42(1994年9月)中；A.A.Lushnikov等人,在Basic Life Sci.[基础生命科学]30:657-62(1985)中；S.Graupner和W.Wackemagel,在Biomolec.Eng.[生物分子工程]17(1):11-16.(2000年10月)中；H.P.Schweizer,在Curr.Opin.Biotech.[生物技术的最新观点]12(5):439-45(2001年10月)中；M.Bagdasarian和K.N.Timmis,在Curr.Topics Microbiol.Immunol.[微生物学与免疫学的当前课题]96:47-67(1982)中；T.Ishii等人,在FEMS Microbiol.Lett.[欧洲微生物学通讯]116(3):307-13(1994年3月1日)中；I.N.Olekhnovich和Y.K.Fomichev,在Gene[基因]140(1):63-65(1994年3月11日)中；M.Tsuda和T.Nakazawa,在Gene[基因]136(1-2):257-62(1993年12月22日)中；C.Nieto等人,在Gene[基因]87(1):145-49(1990年3月1日)中；J.D.Jones和N.Gutterson,在Gene[基因]61(3):299-306(1987)中；M.Bagdasarian等人,在Gene[基因]16(1-3):237-47(1981年12月)中；H.P.Schweizer等人,在Genet.Eng.[基因工程](纽约州)23:69-81(2001)中；P.Mukhopadhyay等人,在J.Bact.[细菌学杂志]172(1):477-80(1990年1月)中；D.O.Wood等人,在J.Bact.[细菌学杂志]145(3):1448-51(1981年3月)中；以及R.Holtwick等人,在Microbiology[微生物学]147(Pt 2):337-44(2001年2月)中。

宿主细胞

本发明提供基因工程化以表达如本文所述的信号多肽和异源多肽蛋白质的宿主细胞，其中编码信号多肽和异源多肽蛋白的核酸包含与信号多肽和/或异源多肽/蛋白可操作地连接的启动子，该启动子驱动细胞中多核苷酸的表达。宿主细胞可以是原核宿主细胞，例如革兰氏阳性或革兰氏阴性细菌细胞。在一些实施例中，启动子序列在原核生物中是可操作的。

在一些实施例中，本发明涉及工程化以表达本文所述的蛋白质、异源多肽和/或信号多肽的重组细胞。术语“重组细胞”是指包含如本文所述的核酸序列的宿主细胞，其中核酸编码如本文所述的信号多肽。在一些实施例中，编码信号多肽的核酸在一种或多种载体上。在一些实施例中，编码信号多肽的核酸可以掺入宿主细胞的基因组中。在一些实施例中，重组细胞是原核生物细胞。在一些实施例中，重组细胞属于埃希氏菌属。在一些实施例中，重组原核生物细胞是大肠杆菌。

在一些实施例中，本发明涉及用可操作地编码如本文所述的信号多肽的任何载体转化的宿主细胞。用本文披露的一个或多个载体转化宿主细胞可以使用本领域已知的任何转化方法进行，并且细菌宿主细胞可以作为完整细胞或原生质体(即包括胞质体)转化。示例性的转化方法包括穿孔方法(例如电穿孔)、原生质体融合、细菌缀合、和二价阳离子处理(例如氯化钙处理或CaCl/Mg2+处理)或本领域其他熟知的方法。参见例如，Morrison,J.Bact.[细菌学杂志],132:349-351(1977)；Clark-Curtiss和Curtiss,Methods inEnzymology[酶学方法],101:347-362(Wu等人，编辑，1983),Sambrook等人,MolecularCloning,A Laboratory Manual[分子克隆：实验室手册](第2版1989)；Kriegler,GeneTransfer and Expression:A Laboratory Manual[基因转移和表达：实验室手册](1990)；和Current Protocols in Molecular Biology[当前分子生物学方法](Ausubel等人，编辑，1994)。

例如，这种宿主细胞可以含有使用已知的转化，转染或感染方法引入宿主细胞的本发明的核酸。术语“转化”是指将DNA引入合适的宿主细胞中，使得DNA可作为染色体外元件或通过染色体整合而可复制。如本文所用的术语“转染”是指表达载体由合适的宿主细胞摄取，无论是否实际表达任何编码序列。术语“感染”是指通过使用病毒或病毒载体将核酸引入合适的宿主细胞中。将重组构建体引入宿主细胞可以通过磷酸钙转染、DEAE葡聚糖介导的转染或电穿孔来实现(Davis,L.等人,Basic Methods in Molecular Biology[分子生物学基本方法](1986))。

宿主细胞可以通过任何合适的方法(包括电穿孔，氯化钙-、氯化锂-、醋酸锂/聚乙二醇-、磷酸钙-、DEAE-葡聚糖-、脂质体-介导的DNA摄取，原生质球，注射，显微注射，微粒轰击，噬菌体感染，病毒感染或其他建立的方法)进行转化、转染或适当的感染。示例性的实施例包括表达一种或多种本文所述的核酸分子或表达载体的宿主细胞或细胞群(例如，基因修饰的微生物)。已经如上所述引入核酸的细胞还包括这些细胞的后代。

携带如本文所述的载体的宿主细胞(即转化体或克隆)可以使用标记进行选择，这些标记取决于载体构建的模式。标记可以在相同或不同的DNA分子上。在原核宿主中，可以例如通过对氨苄青霉素、四环素或其他抗生素的抗性来选择转化体。基于温度敏感性的特定产物的生产也可以用作适当的标记。

宿主细胞可以在适当的培养基中培养。适当的或有效的培养基是指培养时宿主细胞(包括基因修饰的微生物)能够生长和/或表达本发明的异源多肽/蛋白质的任何培养基。这种介质典型地是包含碳、氮和磷酸盐源的含水介质，但也可包括适当的盐、矿物质、金属和其他营养物。微生物和其他细胞可以在常规生物反应器中和通过任何方法培养，包括分批、补料分批、细胞再循环和连续发酵。将培养基的pH调节至适于特定生物的生长和蛋白质产生的pH。可以对生长室进行通气，以便提供用于生长所需的氧气并且避免二氧化碳的过度积累。用于各种宿主细胞的培养基和条件是本领域已知的。

在一些实施例中，宿主细胞是原核生物细胞。在一些实施例中，原核生物是革兰氏阴性细菌，例如埃希氏菌属、假单胞菌属、奈瑟氏菌属、耶尔森菌属、沙门氏菌属、志贺氏菌属、莫拉菌属、螺杆菌属、寡养单胞菌属、芽胞杆菌属、葡萄球菌属、链霉菌属、蛭弧菌属、军团杆菌属、蓝细菌、螺旋体、绿色硫细菌、克雷白氏杆菌属或沙雷氏菌属的细菌。在一些实施例中，革兰氏阴性细菌属于埃希氏菌属，例如大肠杆菌。

在一些实施例中，宿主细胞可以是能够产生目的蛋白质或多肽的任何细胞，包括如上所述的任何一种革兰氏阴性原核生物。产生目的蛋白质或多肽的最常用系统包括某些细菌细胞，特别是大肠杆菌，因为它们相对便宜的生长要求和在大批量培养物中产生蛋白质的潜在能力。这些系统被充分表征，提供通常可接受的总蛋白质表达水平，并且相对快速且便宜。典型的细菌细胞描述于例如“Biological Diversity:Bacteria and Archaeans[生物多样性：细菌和古生菌]”，在线生物学书的一章，由美国亚利桑那州埃斯特雷亚山社区学院的M J Farabee博士在www.emc.maricotpa.edu/faculty/farabee/BIOBK/BioBookDiversity网站上提供。在某些实施例中，宿主细胞可以是埃希氏菌属细胞，并且典型地可以是大肠杆菌细胞。

在一些实施例中，宿主细胞可以是任何细菌分类单元的成员。例如，细胞可以是任何真细物种的成员。宿主可以是任何一个分类的成员：酸杆菌门、放线菌门、产水菌门、拟杆菌门、绿菌门、衣原体门、绿弯菌门、产金菌门、蓝藻门、脱铁杆菌门、异常球菌门、网团菌门、纤维杆菌门、厚壁菌门、梭杆菌门、芽单胞菌门、黏胶球形菌门、硝化螺旋菌门、浮霉菌门、变形菌门、螺旋体门、热脱硫杆菌门、热微菌门、热袍菌门、栖热菌门(栖热菌目)、或疣微菌门。在真细菌宿主细胞的实施例中，细胞可以是任何真细物种的成员。

细菌宿主也可以是任何变形菌门的成员。变形菌门宿主细胞可以是如下任何一个分类的成员：α-变形菌纲、β-变形菌纲、γ-变形菌纲、δ-变形菌纲、或ε-变形菌纲。此外，宿主可以是如下任何一个分类的成员：α-变形菌纲、β-变形菌纲、或γ-变形菌纲，和γ-变形菌纲的任何物种的成员。

在γ变形杆菌宿主的一些实施例中，宿主将是如下任何一个分类的成员：气单胞菌目、交替单胞菌目、肠杆菌目、假单胞菌目、或黄色单胞菌目；或肠杆菌目或假单胞菌目的任何物种的成员。在一些实施例中，宿主细胞可以是肠杆菌目，宿主细胞将是肠杆菌科的成员，或者可以是欧文菌属、埃希氏菌属或沙雷氏菌属中的任何一个的成员；或埃希氏菌属的成员。在宿主细胞是假单胞菌目的情况下，宿主细胞可以是假单胞菌科的成员，包括假单胞菌属。γ变形杆菌宿主包括物种大肠杆菌的成员和物种荧光假单胞菌(Pseudomonasfluorescens)的成员。

产生分泌的异源蛋白质的方法

本发明的方法提供了包含如本文所述的信号多肽的融合蛋白的表达。在一些实施例中，该方法包括表达与本发明的信号多肽连接的目的异源多肽的宿主细胞。该方法包括提供宿主细胞，例如大肠杆菌宿主细胞，其包含编码重组蛋白的载体，该重组蛋白包含与本文披露的信号多肽可操作地连接的目的蛋白质或多肽，并且在导致蛋白质或多肽表达的条件下培养细胞。可替代地，使用鉴定的信号多肽表达蛋白质或多肽的方法可用于任何给定的宿主系统，包括其他原核起源的宿主细胞。载体可以具有上述任何特征。在一些实施例中，宿主细胞包含载体，该载体包含编码本文披露为SEQ ID NO:1的信号多肽的核苷酸序列，或其变体和片段。在另一个实施例中，载体包含编码SEQ ID NO:2的蛋白质的核苷酸序列，或其变体和片段。

在一些实施例中，本发明涉及产生蛋白质(例如本发明的异源多肽)的方法，该方法包括培养工程化以表达蛋白质的重组细胞，或在表达蛋白质的条件下用编码该蛋白质的载体转化宿主细胞。在一些实施例中，重组细胞或宿主细胞在细胞培养物中在蛋白质从重组细胞或宿主细胞分泌的条件下培养。在一些实施例中，重组细胞或宿主细胞在细胞培养物中在将信号多肽从蛋白质切割的条件下培养。

在另一个实施例中，宿主细胞具有周质，并且信号多肽的表达导致基本上所有目的异源多肽靶向细胞周质。已经认识到在周质中表达的一小部分蛋白质可能实际上可以通过细胞膜泄漏到胞外空间中；然而，大多数靶向多肽将保留在周质间隙内。

本文所述的用于宿主细胞的细胞生长条件可包括促进目的蛋白质表达的细胞生长条件，和/或促进表达的目的蛋白质发酵的细胞生长条件。如本文所用，术语“发酵”包括采用直接发酵(literal fermentation)的实施例和采用其他非发酵培养模式的实施例。在一些实施例中，发酵培养基可选自丰富培养基、基本培养基和矿物盐培养基；可以使用丰富培养基，但优选地避免使用。在另一个实施例中，选择基本培养基或矿物盐培养基。在仍另一个实施例中，选择基本培养基。在又另一个实施例中，选择无机盐培养基。矿物盐培养基是特别优选的。

根据本发明的表达系统可以是以任何发酵形式培养。例如，本文可采用分批、补料分批、半连续和连续发酵模式。其中蛋白质被排泄到胞外培养基中，优选连续发酵。

发酵可以任何规模进行。因此，例如，可以使用微升规模、厘升规模和分升规模的发酵体积；并且可以使用1升规模和更大的发酵体积。在一些实施例中，发酵体积将为1升或高于1升。在另一个实施例中，发酵体积将为或高于5升、10升、15升、20升、25升、50升、75升、100升、200升、500升、1,000升、2,000升、5,000升、10,000升、或50,000升。

在本发明中，转化的宿主细胞的生长、培养、和/或发酵在允许宿主细胞存活的温度范围内进行，优选地温度在约4℃至约55℃的范围内，包括端值。因此，例如，术语“生长(growth)”(和“生长(grow，growing)”)，“培养(culturing)”(和“培养(culture)”)，和“发酵(fermentation)”(和“发酵(ferment，fermenting)”)，如本文所用，关于本发明的宿主细胞，本质上意指“生长”、“培养”和“发酵”，在约4℃至约55℃的温度范围内，包括端值。此外，“生长”用于指示活性细胞分裂和/或扩大的生物学状态，以及非分裂和/或非扩大细胞正在代谢持续的生物状态两者，后者使用术语“生长”与术语“维持”同义。

信号多肽可以以与异源多肽连接的方式表达，并且信号连接的多肽可以从细胞中纯化。因此，在一些实施例中，该分离的异源多肽是信号多肽和目的异源多肽的融合蛋白。然而，当异源多肽靶向周质时，信号多肽也可以从异源多肽上切割下来。在一些实施例中，修饰信号多肽和异源蛋白质或多肽之间的连接以增加信号多肽的切割。

该表达可导致胞外异源多肽的产生。该方法还可包括从周质或从胞外培养基中纯化目的异源多肽的步骤。在一些实施例中，本发明包括产生蛋白质，例如异源多肽，并且然后从细胞培养物中回收蛋白质。在一些实施例中，回收蛋白质包括离心以去除细胞和/或细胞碎片。在一些实施例中，回收蛋白质包括过滤以去除细胞和/或细胞碎片。

短语“回收蛋白质”是指收集含有蛋白质的完整培养基，并且不需要暗示额外的分离或纯化步骤。蛋白质可使用各种标准蛋白质纯化技术纯化，这些纯化技术例如亲和色谱、离子交换色谱、过滤、电泳、疏水相互作用色谱、凝胶过滤色谱、反相色谱、伴刀豆球蛋白A色谱、聚焦色谱、差别溶解度、制备型圆盘-凝胶电泳、等电聚焦、HPLC、反相HPLC或逆流分布。多肽可含有促进检测或纯化的额外的蛋白质或表位标签，例如c-myc、血细胞凝集素(HA)、聚组氨酸、GLU-GLU、FLAG-标签、谷胱甘肽-S-转移酶(GST)、绿色荧光蛋白(GFP)、或麦芽糖结合蛋白(MBP)。在回收多肽后可以除去这些标签。

本发明的方法还可以导致宿主细胞内目的蛋白质或多肽的产生增加。增加的产量可替代地可以是每克产生的蛋白质或每克宿主蛋白质的适当加工的蛋白质或多肽的水平增加。增加的产量还可以是每克重组体或每克宿主细胞蛋白质产生的可回收蛋白质或多肽的水平增加。增加的产量还可以是总蛋白质水平增加、适当加工的蛋白质水平增加或活性或可溶性蛋白质水平增加的任何组合。在该实施例中，术语“增加的”是相对于当在没有本发明的信号多肽的细胞中表达目的蛋白质或多肽时产生的，适当加工的，可溶性和/或可回收的蛋白质或多肽的水平，或当用dsbA信号多肽表达目的蛋白质或多肽时产生的，适当加工的，可溶性和/或可回收的蛋白质或多肽水平。

异源目的多肽的改善的表达也可以是指多肽溶解度的增加。可以从宿主细胞的细胞质、周质或胞外培养基中产生的和回收的目的异源多肽。异源多肽可以是不溶性的或可溶性的。如上所讨论的，异源多肽可包括一个或多个序列以辅助纯化。

本文所用的术语“可溶性”意指当在生理条件下在缓冲液中旋转10-30分钟时，异源多肽不会在大约5,000X和20,000X重力之间通过离心沉淀。可溶性蛋白质不是包涵体或其他沉淀物质的部分。类似地，“不溶性”意指当在生理条件下在缓冲液中旋转10-30分钟时，可以通过在5,000X和20,000X重力之间离心来沉淀蛋白质或多肽。不溶性蛋白质或多肽可以是包涵体或其他沉淀物质的部分。术语“包涵体”意指包括胞内含有的任何胞内体，其中蛋白质或多肽的聚集体已被螯合。

本发明的方法可以产生定位于宿主细胞周质的异源多肽。在一些实施例中，该方法在细胞中产生适当加工的目的异源多肽。在另一个实施例中，信号多肽的表达可以在细胞中产生目的活性异源多肽。与异源多肽在没有本发明的信号多肽的情况下表达时相比，或与异源多肽用dsbA信号多肽表达时相比，本发明的方法还可以导致目的异源多肽的产量增加。

在一些实施例中，该方法在周质区室中产生至少0.1g/L蛋白质。在另一个实施例中，该方法在细胞中产生0.1至10g/L的周质蛋白质，或至少约0.2、约0.3、约0.4、约0.5、约0.6、约0.7、约0.8、约0.9或至少约1.0g/L周质蛋白质。在一些实施例中，产生的总目的蛋白质或多肽是至少1.0g/L、至少约2g/L、至少约3g/L、约4g/L、约5g/L、约6g/L、约7g/L、约8g/L、约10g/L、约15g/L、约20g/L、至少约25g/L或更高。在一些实施例中，产生的周质蛋白质的量为产生的总目的异源多肽的至少约5％、约10％、约15％、约20％、约25％、约30％、约40％、约50％、约60％、约70％、约80％、约90％、约95％、约96％、约97％、约98％、约99％或更多。

在一些实施例中，该方法产生至少0.1g/L正确加工的异源多肽。正确加工的异源多肽具有天然蛋白质的氨基末端。在一些实施例中，至少50％的目的异源多肽包含天然氨基末端。在另一个实施例中，异源多肽的至少60％、至少70％、至少80％、至少90％或更多具有天然蛋白质的氨基末端。在各种实施例中，该方法在细胞中产生0.1至10g/L正确加工的异源多肽，包括至少约0.2、约0.3、约0.4、约0.5、约0.6、约0.7、约0.8、约0.9或至少约1.0g/L正确加工的蛋白质。在另一个实施例中，产生的总正确加工的目的异源多肽为至少1.0g/L、至少约2g/L、至少约3g/L、约4g/L、约5g/L、约6g/L、约7g/L、约8g/L、约10g/L、约15g/L、约20g/L、约25g/L、约30g/L、约35g/l、约40g/l、约45g/l、至少约50g/L、或更高。在一些实施例中，产生的正确加工的异源多肽的量为正确加工形式的总重组蛋白的至少约5％、约10％、约15％、约20％、约25％、约30％、约40％、约50％、约60％、约70％、约80％、约90％、约95％、约96％、约97％、约98％、至少约99％、或更高。

本发明的方法还可以导致目的异源多肽的产量增加。在一些实施例中，该方法产生目的异源多肽，该异源多肽为总细胞蛋白质(tcp)的至少约5％、至少约10％、约15％、约20％、约25％、约30％、约40％、约45％、约50％、约55％、约60％、约65％、约70％、约75％或更高。“总细胞蛋白质百分比”是宿主细胞中异源多肽的量占聚集细胞蛋白质的百分比。总细胞蛋白质百分比的确定是本领域熟知的。

在一个具体的实施例中，当生长时(即在约4℃至约55℃的温度范围内，包括约10℃、约15℃、约20℃、约25℃、约30℃、约35℃、约40℃、约45℃和约50℃)，宿主细胞可具有至少1％tcp的表达水平和至少40g/L的细胞密度的异源多肽或其片段。

在一些实施例中，本发明涉及增加从宿主细胞分泌异源多肽的速率。在一些情况下，分泌速率可有利地减少生产时间，从而降低成本并提高效率。在一些实施例中，本发明涉及增加蛋白质从细胞分泌的速率的方法，该方法包括：(a)在细胞培养物中培养宿主细胞，该宿主细胞包含如本文所述的编码包含信号多肽的蛋白质的核酸或载体，(b)诱导蛋白质的表达，和(c)回收蛋白质，该蛋白质包含分泌到细胞培养物的上清液中的信号多肽，其中将蛋白质分泌速率与具有dsbA信号多肽的蛋白质的蛋白质分泌速率进行比较。蛋白质分泌速率可以通过测量随时间分泌到胞外环境(即细胞培养物的上清液)中蛋白质的量来测量。

在一些实施例中，蛋白质分泌速率减少了产生所希望的量的蛋白质所需的时间量。例如，在一些实施例中，包含分泌到细胞培养物的上清液中的信号多肽的蛋白质的回收发生在诱导蛋白质表达后6和15小时之间、7和12小时之间、或8和10小时之间。在一些实施例中，当将蛋白质分泌速率与具有dsbA信号多肽的蛋白质的蛋白质分泌速率进行比较时，蛋白质分泌速率每小时增加大于10％、20％、30％、40％、50％、60％、70％、80％、90％或100％。

在一些实施例中，本发明涉及增加蛋白质从细胞分泌的量的方法，该方法包括：(a)在细胞培养物中培养宿主细胞，该宿主细胞包含编码如本文所述的信号多肽的核酸或载体，(b)诱导蛋白质的表达，以及(c)回收分泌到细胞培养物的上清液中的蛋白质，其中将分泌的蛋白质的量与具有dsbA信号多肽的蛋白质进行比较。在一些实施例中，与具有dsbA信号多肽的蛋白质相比，从细胞分泌的蛋白质的量增加大于20％。在一些实施例中，与具有dsbA信号多肽的蛋白质相比，从细胞分泌的蛋白质的量增加大于100％。

在一些实施例中，本发明涉及制备蛋白质的方法，所述方法包括：(a)培养包含编码本披露的信号多肽的如本文所述的核酸或载体的宿主细胞，使得表达该核酸或载体，由此当核酸或载体在宿主细胞中表达时，由核酸或载体编码的蛋白质从细胞分泌到上清液中；以及(b)从上清液中分离分泌的蛋白质。在一些实施例中，宿主细胞或重组细胞是大肠杆菌。在一些实施例中，宿主细胞在细胞培养物中在信号多肽从蛋白质切割的条件下培养。在一些实施例中，本发明的方法包括分离分泌的蛋白质，包括离心以去除细胞和/或细胞碎片。在一些实施例中，本发明的方法包括分离分泌的蛋白质，包括过滤以去除细胞和/或细胞碎片。本发明可以涉及通过如本文所述方法制备的任何蛋白质。

在实践中，通常在胞外环境中发现靶向周质的异源蛋白质，可能是因为外细胞膜的损伤或流动性增加。通过使用透化外细胞膜的各种机制，可以增加这种“被动”分泌的速度：大肠杆菌素(Miksch等人(1997)Arch.Microbiol.[微生物学文献集]167:143-150)；生长速率(Shokri等人(2002)App Miocrobiol Biotechnol[应用微生物学及生物科技]58:386-392)；TolIII过表达(Wan和Baneyx(1998)Protein Expression Purif.[蛋白表达纯化]14:13-22)；细菌素释放蛋白质(Hsiung等人(1989)Bio/Technology[生物/科技]7:267-71)，大肠杆菌素A裂解蛋白质(Lloubes等人(1993)Biochimie[生物化学]75:451-8)突变体泄漏周质蛋白质(Furlong和Sundstrom(1989)Developments in Indus.Microbio.[工业微生物学进展]30:141-8)；融合配偶体(Jeong和Lee(2002)Appl.Environ.Microbio.[应用与环境微生物学]68:4979-4985)；通过渗透压休克回收(Taguchi等人(1990)BiochimicaBiophysica Acta[生物化学与生物物理学学报]1049:278-85)。将工程化蛋白质运输到周质间隙并随后在培养液中定位已被用于在大肠杆菌中产生适当折叠的和活性的蛋白质(Wan和Baneyx,Protein Expression Purif.[蛋白表达纯化]14:13-22(1998)；Simmons等人,J.Immun.Meth.[免疫法杂志]263:133-147(2002)；Lundell等人,J.Indust.Microbio.[工业微生物学杂志]5:215-27(1990))。

本发明还可以改善“活性”异源多肽/蛋白质的回收。活性蛋白质的比活性可以是序列衍生的天然蛋白质或多肽的比活性的至少约20％、至少约30％、至少约40％、约50％、约60％、至少约70％、约80％、约90％、或至少约95％。此外，底物特异性(k_cat/K_m)任选地基本上类似于天然蛋白质或多肽。典型地，k_cat/K_m为至少约30％、约40％、约50％、约60％、约70％、约80％、至少约90％、至少约95％或更高。测定和定量蛋白质和多肽活性和底物特异性(k_cat/K_m)的测量的方法是本领域技术人员熟知的。

还可以将异源多肽/蛋白质的活性与之前建立的天然蛋白质或多肽标准活性进行比较。可替代地，异源多肽/蛋白质的活性可以在与天然蛋白质或多肽的同时、或基本上同时的比较测定中确定。例如，体外测定可用于确定目的蛋白质或多肽与靶标之间的任何可检测的相互作用，例如，表达的酶和底物之间、表达的激素和激素受体之间、表达的抗体和抗原之间等。这种检测可包括比色变化、增殖变化、细胞死亡、细胞排斥、放射活性变化、溶解度变化、通过凝胶电泳和/或凝胶排阻方法测量的分子量变化、磷酸化能力的测量，抗体特异性测定例如ELISA测定等。通常，任何体外或体内测定可用于确定目的蛋白质或多肽的活性性质，其允许对天然蛋白质或多肽进行比较分析，只要这种活性是可测定的。可替代地，可以测定本发明中产生的异源多肽/蛋白质刺激或抑制蛋白质或多肽与分子之间相互作用的能力，该分子通常与蛋白质或多肽相互作用，例如天然蛋白质通常相互作用的底物或信号途径的组分。此类测定典型地可包括在允许蛋白质或多肽与靶标分子相互作用的条件下将蛋白质与底物分子组合的步骤，以及检测与蛋白质和靶标分子相互作用的生物化学结果。

为了测量目的蛋白质的产量、溶解度、构象和/或活性，可能希望从宿主细胞和/或胞外培养基中分离蛋白质。分离可以是粗分离，半-粗分离或纯分离，这取决于用于进行适当测量的测定的要求。为了从周质释放靶标蛋白质，已经使用了涉及化学制剂例如氯仿(Ames等人(1984)J.Bacteriol.[细菌学杂志],160:1181-1183)、盐酸胍、和Triton X-100(Naglak和Wang(1990)Enzyme Microb.Technol.[酶与微生物技术],12:603-611)的处理。然而，这些化学物质不是惰性的并且可能对许多重组蛋白质产物或随后的纯化程序具有有害效果。已经报道，大肠杆菌细胞的甘氨酸处理导致外膜透化，以释放周质内容物(Ariga等人(1989)J.Ferm.Bioeng.[发酵与生物工程杂志],68:243-246)。最广泛使用的重组蛋白质的周质释放的方法是渗透压休克(Nosal和Heppel(1966)J.Biol.Chem.[生物化学杂志],241:3055-3062；Neu和Heppel(1965)J.Biol.Chem.[生物化学杂志],240:3685-3692)，鸡蛋清(HEW)-溶菌酶/乙二胺四乙酸(EDTA)处理(Neu和Heppel(1964)J.Biol.Chem.[生物化学杂志],239:3893-3900；Witholt等人(1976)Biochim.Biophys.Acta[生物化学与生物物理学学报],443:534-544；Pierce等人(1995)ICheme Research.Event[ICheme研究事件],2:995-997)，和组合的HEW-溶菌酶/渗透压休克处理(French等人(1996)EnzymeandMicrob.Tech.[酶与微生物技术],19:332-338)。法国方法涉及将细胞重新悬浮在分级缓冲液中，随然后回收周质级分，其中渗透压休克在溶菌酶处理后立即进行。

典型地，这些程序包括在渗透稳定培养基中的初始破坏，随后在非稳定培养基中选择性释放。这些培养基的组成(pH，保护剂)和所用的破坏方法(氯仿、HEW-溶菌酶、EDTA、超声处理)在报道的具体方法中有所不同。Stabel等人(1994)Veterinary Microbiol.[兽医微生物学],38:307-314讨论了使用偶极离子洗涤剂代替EDTA的HEW-溶菌酶/EDTA处理的变化。关于使用胞内裂解酶系统破坏大肠杆菌的一般综述，参见，Dabora和Cooney(1990)在Advances in Biochemical Engineering/Biotechnology[生物化学工程/生物技术进展],第43卷,A.Fiechter编辑(施普林格出版社(Springer-Verlag)：柏林，第11-30页中。

美国专利号4,595,658披露了一种用于促进运输到大肠杆菌周质间隙的蛋白质外化的方法。该方法允许选择性分离位于周质中的蛋白质，而不需要细胞的溶菌酶处理、机械研磨或渗透压休克处理。美国专利号4,637,980披露了通过用直接地或间接地编码产物的DNA分子转化温度敏感性溶源体，在允许条件下培养转化体以在胞内表达基因产物，并且通过升高温度使产物外化以诱导噬菌体编码的功能。Asami等人(1997)J.Ferment.andBioeng.[发酵与生物工程杂志],83:511-516披露了通过T4噬菌体感染同步破坏大肠杆菌细胞，以及Tanji等人(1998)J.Ferment.and Bioeng.[发酵与生物工程杂志],85:74-78披露了T4噬菌体中编码的裂解基因的受控制的表达，用于温和破坏大肠杆菌细胞。

可以通过本领域熟知的标准技术分离和纯化本发明的蛋白质至基本纯度，这些标准技术包括但不限于硫酸铵或乙醇沉淀、酸提取、阴离子或阳离子交换色谱、磷酸纤维素色谱、疏水相互作用色谱、亲和色谱、镍色谱、羟基磷灰石色谱、反相色谱、凝集素色谱、制备型电泳、洗涤剂溶解、用柱色谱等物质选择性沉淀、免疫纯化方法等。例如，具有建立的分子粘附特性的蛋白质可以与配体可逆地融合。使用适当的配体，可以将蛋白质选择性地吸附到纯化柱上，并且然后以相对纯的形式从柱除去。然后通过酶活性除去融合蛋白。此外，可以使用免疫亲和柱或Ni-NTA柱纯化蛋白质。通用技术进一步描述于例如，R.Scopes,ProteinPurification:Principles and Practice[蛋白质纯化：原理与实践],施普林格出版社(Springer-Verlag)：纽约州(1982)；Deutscher,Guide to Protein Purification[蛋白质纯化指南],Academic Press[学术出版社](1990)；美国专利号4,511,503；S.Roe,ProteinPurification Techniques:A Practical Approach(Practical Approach Series)[蛋白质纯化技术：实用方法(实用方法系列)],牛津大学出版社(Oxford Press)(2001)；D.Bollag等人,Protein Methods[蛋白质方法],Wiley-Lisa公司(Wiley-Lisa,Inc.)(1996)；A KPatra等人,Protein ExprPurif[蛋白质表达与纯化],18(2):第182-92页(2000)；以及R.Mukhija等人,Gene[基因]165(2):第303-6页(1995)。还参见，例如Ausubel等人(1987和周期性的增刊)；Deutscher(1990)“Guide to Protein Purification[蛋白质纯化指南],”Methods in Enzymology[酶学方法]第182卷，和本系列的其他卷；Coligan等人(1996和周期性的增刊)Current Protocols in Protein Science[蛋白质科学现代方案]威利/格林(Wiley/Greene)，纽约州；和关于蛋白质纯化产物使用的制造商的文献例如，法玛西亚公司(Pharmacia)，皮斯卡塔韦，新泽西州，或伯乐公司(Bio-Rad)，列治文，加利福尼亚州。与重组技术的组合允许融合至适当的区段，例如融合至FLAG序列或可经由蛋白酶可去除序列融合的等效物。还参见，例如Hochuli(1989)Chemische Industrie[化学工业]12:69-70；Hochuli(1990)“Purification ofRecombinant Proteins with Metal ChelateAbsorbent[用金属螯合物吸收剂纯化重组蛋白质]”在Setlow(编辑)Genetic Engineering[基因工程],Principle and Methods[原理和方法]12:87-98，Plenum出版社，纽约州中；以及Crowe等人(1992)QIAexpress:The High Level Expression&Protein PurificationSystem[高水平表达和蛋白质纯化系统]凯杰公司(QUIAGEN,Inc.)，查茨沃思，加利福尼亚州。

通过本领域已知的方法实现表达的蛋白质的检测，并且包括例如放射免疫测定、蛋白印迹法技术或免疫沉淀。

存在于上清液中的异源多肽可通过本领域技术人员熟知的标准分离技术从宿主蛋白质分离。例如，初始盐分级可以将许多不想要的宿主细胞蛋白质(或衍生自细胞培养基的蛋白质)从目的异源多肽分离。一个这样的实例可以是硫酸铵。硫酸铵通过有效减少蛋白质混合物中水的量来沉淀蛋白质。然后蛋白质基于其溶解度沉淀。蛋白质越疏水，在较低硫酸铵浓度下沉淀的可能性越大。典型的方案包括将饱和硫酸铵添加至蛋白质溶液中，使得所得硫酸铵浓度为20％-30％之间。该浓度将使最疏水的蛋白质沉淀。然后弃去沉淀物(除非目的蛋白质是疏水的)并将硫酸铵添加至上清液中至已知沉淀目的蛋白质的浓度。然后将沉淀物溶解在缓冲液中，并且如果需要，通过透析或渗滤除去过量的盐。依赖于蛋白质溶解度的其他方法，例如冷乙醇沉淀，是本领域技术人员熟知的，并且可用于分级复杂的蛋白质混合物。

目的异源多肽的分子量可用于通过不同孔径的膜(例如，Amicon或密理博(Millipore)膜)使用超滤，从较大和较小尺寸的蛋白质中分离。作为第一步骤，蛋白质混合物可以通过膜进行超滤，该膜的孔径具有比目的蛋白质的分子量更低的分子量截留。然后可以将超滤的滞留物对着膜进行超滤，该膜的分子截留大于目的蛋白质的分子量。目的异源多肽将通过膜进入滤液。然后可以如下所述对滤液进行色谱分离。

分泌的目的异源多肽也可以基于其大小，净表面电荷，疏水性和对配体的亲和力与其他蛋白质分离。另外，针对蛋白质产生的抗体可以与柱基质和免疫纯化的蛋白质缀合。所有这些方法都是本领域熟知的。对于技术人员将是明显的是，色谱技术可以以任何规模并使用来自许多不同制造商(例如玛法西亚生物技术公司(Pharmacia Biotech))的设备进行。

在本发明的一些实施例中，包含所产生的信号多肽的超过50％的表达的异源多肽或蛋白质可以在宿主细胞中以可复性的形式产生。在另一个实施例中，约60％、70％、75％、80％、85％、90％、95％的表达蛋白质以活性形式获得或可以复性成活性形式。

实例1

试图改善培养基中胞外AT_H35L的水平，设计了一系列通过修饰dsbA和pelB信号多肽的新颖信号多肽。在BL21Star(DE3)中筛选与AT_H35L的n-末端连接的合成的新颖信号多肽，并且使用Octet测定法定量培养基中的胞外AT_H35L，并通过凝胶电泳分析。

材料和方法

大肠杆菌菌株和生长条件

选择大肠杆菌BL21(DE3)[fhuA2[lon]ompT gal(λsBamHIoΔEcoRI-B int::(lacI::PlacUV5::T7gene1)i21Δnin5)[dcm]ΔhsdS]和BL21Star^TM(DE3)[F^-ompT hsdS_B(r_B ^-,m_B ^-)galdcmrne131(DE3)]作为用于表达在本研究中构建的质粒的宿主。在种子培养基(20g/L酵母提取物)中培养重组细胞用于接种细胞并且丰富的生长培养基(20.3g/L酵母提取物，10.1g/L无水硫酸钠和7g/L K₂HPO₄)补充有50μg/mL卡那霉素用于在30℃下表达重组AT_H35L蛋白质。

表达质粒的构建

由DNA 2.0公司(门洛帕克公司(Menlo Park)，加利福尼亚州，美国)提供的pJ411表达载体用作T7启动子驱动的表达载体-表达与AT_H35L基因连接的信号多肽。卡那霉素基因用作表达质粒中的选择标记。通过DNA 2.0公司进行含有与AT_H35L连接的信号多肽的所有表达质粒的基因合成和用于确认合成的质粒的DNA测序分析。用于该研究的信号多肽和重组质粒的概述列于表2中。

表2.使用的细菌的和新颖信号多肽的氨基酸序列。

*数字指示在h-区中氨基酸的位置。

切割位点在c-区中加下划线。

微补料分批培养方法

在具有3mL工作体积的Micro 24生物反应器(Applikon biotechnology公司，福斯特市，加利福尼亚州)中进行小体积补料分批培养。补料培养基和其他补充剂通过高压灭菌或用0.22-μm孔径过滤器过滤灭菌，而分别地将丰富的生长培养基(20.3g/L酵母提取物，10.1g/L无水硫酸钠和7g/L K₂HPO₄)高压灭菌，并且之后在无菌条件下添加。将具有2.8％的培养物体积的培养物接种到含有50μg/mL的卡那霉素、7.6g/L的痕量金属混合物溶液(Trace metal cocktail solution)(55g/L柠檬酸钠脱水物、27g/L FeCl₃·6H₂O、0.5g/LCoCl₂·6H₂O、0.5g/L Na₂MoO₄·2H₂O、0.95g/L CuSO₄·5H₂O、1.6g/L MnCl₂·4H₂O、1.3g/LZnCl₂和2g/L CaCl₂)和15.8g/L的甘油PSA的丰富的生长培养基中。在补料分批培养期间，叶轮速度初始设定为800rpm，并且之后控制以使溶解的氧水平(DO)保持在60％饱和。在补料分批操作模式中，使用55％v/v的甘油和33％w/v的酵母提取物溶液作为补料培养基溶液。当细胞达到光学细胞密度(OD)₆₀₀的10时，通过添加0.5mM异丙基-β-D1-硫代半乳糖苷(IPTG)诱导重组AT_H35L基因表达，并且在30℃的补料分批模式条件下进一步孵育14h。在诱导后14h收集培养的细胞，并且通过以14,000rpm离心5min从收获样品中收集培养基的上清液，用于胞外AT_H35L的分析和定量。使用PeriPreps^TMPeriplasting试剂盒从收获样品的细胞裂解物制备周质和细胞质样品(恩皮森特公司(Epicentre),麦迪逊(Madison)，威斯康辛州，美国)。

发酵罐补料分批培养方法

在具有1L工作体积的DasGip发酵罐(萨尼苏尔公司(SaniSure Inc)，穆尔帕克，加利福尼亚州，美国)中进行大体积补料分批培养。如之前在小体积补料分批培养方法中所述制备补料/培养基和其他补充物。将具有2.8％的培养物体积的培养物接种到含有50μg/ml的卡那霉素、7.6g/L的痕量金属混合物溶液(Trace metal cocktail solution)、15.8g/L的甘油PSA和1％v/v的P2000消泡溶液的制备的培养基中。气室速度为1vvm，并且温度维持在30℃。使用氢氧化铵(23.5％v/v)和冰乙酸(50％v/v)溶液维持pH。在批量实验期间，叶轮速度初始设定为1,200rpm，并且之后控制以使溶解的氧水平(DO)保持在60％饱和。在补料分批操作模式中，使用55％v/v的甘油和33％w/v的酵母提取物溶液作为补料培养基溶液。在补料期间，叶轮速度维持恒定在1200rpm，而DO饱和度自动保持在60％。当细胞达到OD₆₀₀的80时，通过添加0.5mM IPTG诱导重组AT_H35L基因表达，并且在30℃的补料分批模式条件下进一步孵育12h。在诱导后的不同时间点收集培养的细胞，以确定分泌的AT_H35L蛋白质生产率、渗透压以及培养基中甘油和乙酸盐浓度的特性。

分析

SDS-PAGE变性凝胶电泳

使用10％预制Bis-Tris NuPAGE SDS凝胶(生命技术公司(Life Technology)，弗雷德里克，马里兰州，美国)在迷你凝胶罐上进行SDS-PAGE变性凝胶电泳。在MOPS运行缓冲液中，电泳的运行条件为恒定的200V，持续45分钟(生命技术公司(Life Technology)，弗雷德里克，马里兰州，美国)。通过用简单蓝安全染色(Simple blue safe stain)溶液(生命技术公司(Life Technology)，弗雷德里克，马里兰州，美国)染色使分离的蛋白质条带可视化。

通过蛋白质印迹法检测AT_H35L蛋白质

在变性的条件下在SDS-PAGE上分离收获的样品，并使用iblot转移试剂盒(生命技术公司(Life Technology)，弗雷德里克，马里兰州，美国)转移到硝酸纤维素膜上。将膜在封闭缓冲液(在0.1％TTBS缓冲液中的5％脱脂奶)中在室温下封闭1h–1h 30min。然后将膜与在0.1％TTBS缓冲液中的1μg/mL的小鼠抗葡萄球菌α溶血素毒素mAb(LC10)(米迪缪尼公司(MedImmune)，马里兰州，美国)在室温下孵育1h或在4℃下孵育过夜。在室温下用0.1％TTBS三次洗涤膜10min后，在室温下将它们用在0.1％TTBS中的1μg/mL的HRP缀合的山羊抗小鼠Ab(贝瑟尔实验室(Bethyl laboratories)，蒙哥马利(Montgomery)，德克萨斯州，美国)孵育1h。用SuperSignal West Pico化学发光底物(皮尔斯公司(Pierce)，罗克福德，伊利诺伊州，美国)可视化所有膜，并在ChemiDoc XRS^TM系统(伯乐公司(Biorad)，武仙座(Hercules)，加利福尼亚州，美国)上扫描。

胞外AT_H35L蛋白质的定量

通过定制的Octet测定法确定培养基中的胞外AT_H35L浓度。该测定在Octet QKe(ForteBio公司，门洛帕克(MenloPark)，加利福尼亚州，美国)上进行，并且LC10mAb(米迪缪尼公司(MedImmune)，马里兰州，美国)用于在培养基中捕获AT_H35L蛋白质。所有样品用动力学缓冲液(ForteBio公司，门洛帕克(MenloPark)，加利福尼亚州，美国)在96孔板(康宁公司(Corning)，图克斯伯里(Tewksbury)，马萨诸塞州，美国，)中以1:10和1:20的比例稀释。对于Octet测定的方法，LC10mAb以300rpm结合至蛋白质A生物传感器(ForteBio公司，门洛帕克(MenloPark)，加利福尼亚州，美国)300秒，随后在动力学缓冲液中以300rpm进行基线步骤60秒，样品结合步骤在300rpm下持续150秒，并且在基本动力学模式中动力学缓冲液中的解离步骤在300rpm下持续60秒。记录个体的样品的实验曲线，并使用Octet数据分析软件7.0(FortéBio)处理和分析数据。最后，通过与亲和-纯化的AT_H35L蛋白质的连续稀释产生的标准曲线比对来定量样品。在1:10和1:20稀释的样品之间的标准偏差值低于10％。

从培养基中纯化AT_H35L

对于N-末端肽序列分析，使用硫酸铵沉淀和Poros XS阳离子交换色谱(生命科技公司(Life Technologies)，格兰德岛，美国)的组合纯化培养基中的胞外AT_H35L。简言之，通过在850g离心30min收获AT_H35L培养物以收集培养基。用1M乙酸将收获的AT_H35L培养基调节至pH 5.2，并以9,500g离心15min以除去沉淀物。然后使用硫酸铵沉淀纯化上清液，随后使用Poros XS阳离子交换树脂用于进一步的纯化。

N-末端多肽测序

通过SDS-PAGE分级纯化的AT_H35L，并且然后使用iblot转移试剂盒(生命科技公司(Life Technologies)，弗雷德里克，马里兰州，美国)转移到硝酸纤维素膜上。使用自动蛋白质/肽测序系统，通过Covance(格林菲尔德，印第安纳州，美国)进行分离的AT_H35L样品的N-末端氨基酸测序分析。

结果

筛选同源和异源信号肽用于大肠杆菌中增强的AT_H35L分泌

由于信号肽的选择对在大肠杆菌系统中的重组蛋白质分泌具有主要影响(Sjostrom等人1987)，因此筛选各种大肠杆菌信号肽以鉴定用于有效AT_H35L分泌的信号肽。已选择用于Sec途径的大肠杆菌信号多肽的DsbA信号序列(dsbAss)、pelB信号序列(pelBss)和phoA信号序列(phoAss)来筛选AT_H35L分泌。此外，尽管来自胞外蛋白质的信号肽的结构元件在金黄色葡萄球菌和大肠杆菌之间作为革兰氏阳性细菌和革兰氏阴性细菌不同，但我们还评估了AT的天然信号肽(NTss)，因为一些蛋白质是在异源表达系统中使用其天然信号肽成功分泌的(Shahhoseini等人2003)。筛选的信号肽的概述示于表2中。使用micro24生物反应器系统在补料分批培养中评价含有不同信号肽-AT_H35L融合构建体的重组细胞菌株。处理信号多肽连接的AT_H35L以在大肠杆菌表达系统中产生大约33kDa的分泌蛋白质。由于信号多肽由20-26个氨基酸组成，可以通过大小差异在变性凝胶上分离成熟的AT_H35L和AT_H35L前蛋白。证实培养基中的胞外分泌的AT_H35L，并使用蛋白质印迹法进行相对地定量(图1)。蛋白质印迹法分析证实AT_H35L在从细胞质空间输出AT_H35L后分泌到胞外环境(培养基)(图1)以及周质间隙(数据未示出)中。此外，通过蛋白质印迹法对胞外的AT_H35L相对定量显示dsbAss在其他信号多肽中显示出胞外AT_H35L产物的最高效率，而NTss显示胞外AT_H35L产物的最低效率。大肠杆菌信号多肽和NTss之间的氨基酸序列相似性非常低(数据未示出)，并且该观察结果暗示AT的天然信号多肽可能不能有效地引导大肠杆菌中AT_H35L的易位。与dsbAss相比，PelBss连接的AT_H35L显示出更低的胞外AT_H35L生产率(图1)。数据表明各种大肠杆菌信号多肽不同地影响AT_H35L的分泌效率，尽管dsbAss、pelBss和phoAss具有氨基酸序列的高度相似性并且使用SEC途径在大肠杆菌中分泌重组蛋白质(Natale等人,Biochimica et Biophysica Acta[生物化学与生物物理学学报]1778:1735-1756(2008))。具体地，dsbAss和pelBss之间的氨基酸序列的同一性是45％。本数据表明，信号多肽的选择对于大肠杆菌中AT_H35L的分泌是至关重要的，尽管信号多肽具有氨基酸序列比对的非常高的相似性。此外，与金黄色葡萄球菌不同，AT_H35L分泌不能通过其天然信号多肽在大肠杆菌中有效地进行。

筛选关于AT_H35L分泌的选择的细菌信号多肽显示AT_H35L的分泌在dsbAss和pelBss之间具有不同的影响(图1)，尽管它们展示出氨基酸序列的高度相似性(45％同一性)。结果表明，个体信号多肽影响AT_H35L的分泌过程，并且可能与信号多肽中各区的功能相关。大多数信号多肽享有一些共同的结构特征；它们由N-末端极性区(n-区)和随后的疏水核心区(h-区)和极性切割区(c-区)组成。碱性n-区是2-5个氨基酸长，并且具有净正电荷。h-区通常含有6和15个之间的氨基酸残基，并且已经发现它是信号多肽用于易位和靶向跨膜的最至关重要的部分(Sjostrom等人1987；Choi等人2004)。数据表明，通过两个不同信号多肽之间的轻扫区(swiping region)，信号多肽的结构变化可以影响分泌效率。通过结构上轻扫两个信号多肽的结构域来研究AT_H35L的分泌效率，这导致胞外AT_H35L的产量提高。用于该研究的新颖信号多肽和新颖信号多肽构建体的示意图分别在表2和图2中表示。

通过新颖信号多肽提高胞外AT_H35L的产量

通过轻扫dsbAss和pelBss的n-区、h-区和c-区产生组I新颖信号多肽(表2和图2A)。关于组I新颖信号多肽，通过轻扫dsbAss和pelBss(NSP1至NSP6)和NSP1至NSP6的每个区并将所得信号多肽与AT_H35L连接，产生六种新颖信号多肽(质粒149153至149158)(图2)。含有新颖信号多肽连接的AT_H35L的重组质粒在1L规模的补料分批条件下培养用于筛选。

当细胞密度达到OD₆₀₀为80时，通过添加0.5mM IPTG诱导重组AT_H35L基因表达，随后在30℃以补料分批模式孵育另外12h。在补料分批过程结束时OD₆₀₀的值达到120-140，其中活力≥90％(数据未示出)。为了分析胞外AT_H35L，通过在诱导后10h离心从收获的培养物样品中收集培养基的上清液。通过Octet测定确定胞外AT_H35L的浓度，并通过SDS-PAGE验证培养基中加工的成熟AT_H35L的大小(图3)。数据显示，与dsbAss(0.15g/L)相比，NSP2和NSP4分别使培养基中分泌的AT_H35L的产量增加2.5倍(0.4g/L)和5倍(0.8g/L)。有趣的是，这两种新颖信号肽在其结构中共享dsbAss的n-区和pelBss的h-区，仅有c-区不同(表1)。NSP2和NSP4的c-区尚未通过氨基酸的添加或截短而突变，因此信号肽酶(SP)切割位点未被修饰，并且因此不影响通过SP的切割过程。观察到的分泌改善表明疏水区之后的氨基酸可能影响信号肽中h-区的结构形成和AT_H35L跨细胞质膜的易位。

此外，与dsbAss(0.15g/L)相比，分泌的AT_H35L的生产率在NSP6(0.02g/L)中降低。除了n-区结构域之外，NSP2和NSP6在它们的结构中共享相同的h-区和c-区结构域。本数据表明dsbAss的n-区是AT_H35L易位至易于进入细胞质膜的有利区(图3)。此外，NSP3不能提高分泌AT_H35L的产量(0.15g/L)，而NSP4使得AT_H35L分泌生产率最高(0.8g/L)，尽管它们在除了h-区之外的信号多肽结构中共享dsbAss的n-区结构域和pelBss的c-区结构域。

基于该结果，数据表明h-区后的氨基酸显著影响信号多肽结构的构象，以使得AT_H35L进入细胞质膜可行。此外，dsbAss的n-区和pelBss的h-区的缀合结构域是对在分泌过程中AT_H35L易位的有利结构结构域。

改变在h-区结构域中氨基酸的位置

组I新颖信号多肽筛选的结果显示，对NSP3和NSP4之间的AT_H35L分泌效率有不同的影响，它们具有不同的疏水区(图3)。由于h-区在重组蛋白质易位至细胞质膜中起重要作用(Hikita等人,J Biol Chem[生物化学杂志]267:4882-4888(1992)；Chou等人,J Biol Chem[生物化学杂志]265:2873-2880(1990)；MacFarlane等人,Eur J Biochem[欧洲生物化学杂志]233:766-771(1995)；Phoenix等人,J Biol Chem[生物化学杂志]268:17069-18073(1993)；Fekkes等人,Microbiol and Molec Biol Review[微生物学与分子生物学评论]63:161-173(1999))，通过修饰NSP3和NSP4的h-区中氨基酸的位置，产生了几组新颖信号多肽，并且研究了在h-区中氨基酸位置的修饰是否影响了AT_H35L蛋白质的分泌效率。在NSP3和NSP4结构中，NSP3的h-区结构域由亮氨酸和缬氨酸组成，亮氨酸和缬氨酸为强疏水性氨基酸，而NSP4的h-区结构域主要由聚亮氨酸和聚丙氨酸组成。在除NSP4b和NSP4c之外的NSP3和NSP4突变体的产生中，由于仅氨基酸位置被改变，h-区中的总疏水性和残基长度没有改变。

关于NSP4的工程化，创建了三个突变体以改变h-区的疏水性(组II信号多肽)：i)在h-区(NSP4a)中聚亮氨酸段的位置和聚丙氨酸段的位置轻扫，ii)在h-区中的所有残基被聚亮氨酸残基替代，以产生一段强疏水性氨基酸(NSP4b)，iii)在h-区中的所有残基被聚丙氨酸残基替代，以产生一段弱疏水性氨基酸(NSP4c)(图2b)。图4表明NSP4突变体信号多肽降低了整体AT_H35L分泌水平。NSP4在培养基中产生0.9g/L的分泌AT_H35L，但当NSP4a与AT_H35L缀合时，分泌AT_H35L的产量减少0.28g/L。NSP4a在NSP4的h-区结构域中具有聚亮氨酸和聚丙氨酸的可替代的位置。注意的是在h-区中没有总疏水性或残基长度变化。在h-区结构域中疏水性氨基酸的位置改变显著影响AT_H35L蛋白质的易位。此外，在NSP4b AT_H35L和NSP4c AT_H35L两者中分泌AT_H35L的产量显着降低0.04g/L。尽管NSP4b的h-区仅由通过聚亮氨酸替代的强疏水性氨基酸组成，但强疏水区在分泌过程中显示出较低的AT_H35L易位效率(0.04g/L)。不出意料的是，由于NSP4c的h-区结构域仅由作为较弱的疏水性氨基酸聚丙氨酸构成，因此通过蛋白质印迹法没有检测到在NSP4c中的分泌AT_H35L。尽管通过定量测定检测到0.04g/L的AT_H35L，但是该量的AT_H35L代表由于细胞死亡而从胞内空间释放的AT_H35L前体。在补料分批培养期间，NSP4突变体改变了细胞生长的特征。具体地，NSP4c AT_H35L的细胞生长速率低于其他突变体构建体。由于细胞凋亡的起始，诱导后10h在OD₆₀₀下NSP4c AT_H35L的细胞生长速率降低(数据未示出)。此外，未检测到在诱导后12h或较早诱导时间点的NSP4c中的分泌AT_H35L。诱导后在AT_H35L表达期间在NSP4c AT_H35L的培养中细胞凋亡迅速发生，这导致在培养基中分泌AT_H35L的减少。

基于组I信号多肽筛选的结果，即使NSP3含有与NSP4相同的n-区和c-区结构域，NSP3也不能改善AT_H35L的分泌(图2a和3)。此外，当NSP4a与具有聚亮氨酸和丙氨酸残基的改变的位置的AT_H35L连接时，分泌AT_H35L的产量已经显著改变(图2b和4)。因此，数据表明在h-区中的疏水性区域(plot)具有AT_H35L的易位的重要因素。通过改变在h-区结构域中氨基酸残基的位置来产生4个NSP3突变体，以产生h-区的各种疏水性区域(图2c)。在h-区结构域中氨基酸的位置变化显著影响AT_H35L的分泌效率(图5)。与NSP3(0.18g/L)相比，NSP3b使分泌AT_H35L的产量提高2倍(0.48g/L)。相反，NSP3a和NSP3d分别将分泌的AT_H35L产量降低0.1g/L和0.14g/L(图5)。在NSP3b的h-区中，通过改变残基的位置，强的疏水性氨基酸残基例如亮氨酸和缬氨酸位于h-区的中心。在其他的NSP3突变体信号多肽中，强疏水性残基的位置位于接近n-区或c-区，这与NSP3b不同。之前的若干研究示出，总疏水性和疏水结构域长度是重组蛋白质易位以及在通过参与分泌机制的一个或多个因子的识别中的底物特异性的重要因素(Bankaitis等人Cell[细胞]37:243-252(1984)；Emr等人,Nature[自然]285:82-85(1980)；Hikita等人,J Biol Chem[生物化学杂志]267:4882-4888(1992))。然而，结果表明疏水性氨基酸残基的定位也是蛋白质易位的重要因素。尽管总疏水性和疏水结构域的长度没有变化，但在h-区结构域中氨基酸残基的可替代的位置对AT_H35L易位产生影响。在细胞生长的特征中，所有突变构建体的细胞生长速率在补料分批培养过程期间是不同的。目前的工作表明，h-区结构域的疏水性区域显著影响AT_H35L蛋白质的易位过程和在大肠杆菌中AT_H35L表达和分泌期间的细胞生长。(图4和5)。此外，h-区的总疏水性对于AT_H35L蛋白质的分泌是必不可少的(图4)，如之前的研究示出的(Emr等人1980；Hikita等人1992)。

NSP4对AT_H35L分泌的进一步表征本研究证明，与诱导后10h的dsbAss相比，NSP4使培养基中分泌AT_H35L的产量提高≥5倍(图3)。在补料分批培养期间，示出了诱导后含有NSP4AT_H35L的细胞的表特征已经改变。为了优化NSP4 AT_H35L的诱导时间长度，我们比较了在各种诱导时间点NSP4和dsbAss之间分泌AT_H35L的产量，并通过凝胶电泳验证了AT_H35L前体污染。

在1L发酵罐中在30℃，pH 7和0.5mM IPTG下进行补料分批培养的生长，用于AT_H35L基因诱导。在该研究中描述了重组AT_H35L基因表达的补料分批培养条件的细节。诱导后每2h收集dsbAss_AT_H35L和NSP4_AT_H35L两者的培养样品，并通过离心从培养样品中分离含有分泌AT_H35L的培养基以定量分泌AT_H35L。通过凝胶电泳和蛋白质印迹法进行分泌AT_H35L和AT_H35L前体的验证(图6a，b)。当诱导后8h收获样品时，NSP4_AT_H35L和dsbAss_AT_H35L分别产生0.7g/L和0.12g/L的分泌AT_H35L。在诱导后12h，在NSP4情况下，分泌AT_H35L产量增加至1g/L，并且在dsbAss情况下，分泌AT_H35L产量增加至0.2g/L(图6a，b)。定量数据显示在诱导后长达12h在dsbAss_AT_H35L和NSP4_AT_H35L两者中，在培养基中分泌AT_H35L的产量增加。然而，通过电泳的分析数据揭示，由于细胞凋亡，NSP4_AT_H35L的AT_H35L前体从诱导后12h从胞内空间泄漏到培养基中。诱导后12h dsbAss_AT_H35L的细胞活力≥90％，而NSP4_AT_H35L的细胞活力起始下降至≤90％(数据未示出)。细胞活力结果与凝胶电泳分析相关(图6a，b)。这些数据表明NSP4对AT_H35L的易位非常有效，并且与诱导后6h的dsbAss相比，分泌AT_H35L的生产率提高了6倍(图6)。此外，NSP4在缩短诱导时间内释放成熟的AT_H35L。减少重组蛋白质生产的培养加工时间对于节省加工时间的商业活动将是非常有益的。

在重组蛋白质的分泌过程中，通过信号肽酶对信号多肽的切割是跨膜的蛋白质易位的重要且有用的标准，以将成熟蛋白质适当地释放到周质间隙和胞外环境中。通常，大肠杆菌信号多肽具有Ala-X-Ala特异性基序(A-X-A结构域)作为c-区中的切割识别位点，并且该研究中的所有新颖信号多肽在其c-区中含有A-X-A结构域。为了验证AT_H35L从信号多肽的切割，如本研究中所述纯化在培养基中的分泌AT_H35L，并纯化的AT_H35L蛋白质通过适当的剪接方法使用N-末端肽测序分析证实成熟AT_H35L的分泌。我们使用N-末端肽测序分析证实，该研究中的新颖信号多肽从AT_H35L前体中正确切割而不中断切割过程(表3)。

表3.培养基中分泌的AT_H35L的N-末端肽测序分析。

讨论

信号多肽连接的AT_H35L在大肠杆菌表达系统中作为可溶性蛋白质表达并分泌(Menzies等人,InfectImmun[感染与免疫]64:1839-1841(1994))。在本研究中，我们筛选了在AT_H35L蛋白质分泌到培养基中时的AT(NTss)、DsbAss、pelBss和phoAss的天然信号多肽。DsbAss、pelBss和phoAss大肠杆菌信号多肽通常用于在大肠杆菌的SEC系统中分泌重组蛋白质。在筛选中，与AT_H35L连接的信号多肽从周质间隙胞外地分泌到培养基中。尽管一些可溶性AT_H35L仍然作为可溶性蛋白质留在细胞质空间中(数据未示出)，但30％表达的AT_H35L蛋白质分泌到周质间隙和培养基中。具体地，dsbAss连接的AT_H35L在所选择的信号多肽中具有最佳分泌效率，并且pelBss连接的AT_H35L在大肠杆菌信号多肽中显示出最低的AT_H35L分泌效率(图2)。尽管大肠杆菌信号多肽之间的氨基酸序列具有高度相似性，但由于信号多肽在分泌过程期间各个区域的各种功能，它们对AT_H35L蛋白质的分泌显示出不同的效率(Hikita等人(1992),Ismail等人,Biotech Lett[生物技术通讯]33:999-1005(2011),Velaithan等人,Ann Microbiol[微生物学年鉴]64:543-550(2014))。有趣的是，pelBss和dsbAss之间的氨基酸序列比对显示出具有45％同一性的高度相似性，但与dsbAss不同，pelBss连接的AT_H35L无法有效地将分泌AT_H35L分泌到培养基中(图2)。

研究了使用新的新颖信号多肽改善胞外AT_H35L分泌产物，特别是观察了个体信号多肽区对胞外AT_H35L分泌的影响。在研究期间，发现在AT_H35L分泌时新产生的新颖信号多肽，NSP1、NSP5和NSP6在诱导后10h与dsbAss相比降低了分泌AT_H35L的产量，而NSP2和NSP4使分泌AT_H35L的产量分别增加3倍和5倍(图3)。在组I信号多肽的结构中，这些信号多肽之间的巨大差异是NSP2和NSP4含有dsbAss的n-区，而NSP1、NSP5和NSP6含有pelBss的n-区。结果暗示，在AT_H35L蛋白质翻译后，dsbAss的n-区在通过新生信号多肽识别粒子(SRP)识别n-区方面比pelBss的n-区域具有更好的效率。许多研究显示信号多肽通过定点诱变突变，以增加h-区的总疏水性或改变信号多肽的段长度以改善重组蛋白质的分泌(Chou等人,J BiolChem[生物化学杂志]265:2873-2880(1990),Hikita等人1992,Jonet等人2012,Klatt等人,Microbial.Cell Factories[微生物细胞工厂]11:97-106(2012))。该研究调查了由具有高相似性的两种不同大肠杆菌信号多肽的交叉跃迁产生的新颖信号多肽，并且这些新颖信号多肽有助于提高分泌AT_H35L的产量。

在分泌途径中，许多组分参与分泌过程。在分泌过程起始时，具有信号多肽的碱性氨基酸的n-区被SRP识别以进入细胞质膜。NSP4结构由dsbAss的n区构成，其与pelBss的n-区相比含有更多碱性氨基酸残基，例如聚赖氨酸。它使NSP4更容易进入细胞质膜。h-区也是易位重组蛋白质的重要因子，并且该研究证明重组蛋白质的分泌效率取决于h-区中疏水性氨基酸残基的定位而改变，而不管总疏水性。NSP2和NSP4两者都增加了分泌AT_H35L的产量，并且这两种信号多肽含有dsbAss的n-区和pelBss的h-区。然而，在相同量的细胞中，NSP4比NSP2产生更好量的分泌AT_H35L。两种信号多肽都具有Ala-X-Ala特异性位点作为剪接过程的切割识别位点。尽管如此，pelBss的h-区和c-区在AT_H35L的易位和释放上显示出比dsbAss的h-区和c-区更好的效率。数据表明，pelBss的c-区在切割过程中可能比dsbAss的c-区更有效，因为两个信号多肽之间的总AT_H35L蛋白质表达没有差异。可替代地，c-区中的一些氨基酸可能影响h-区结构域的结构构象，这导致影响AT_H35L的易位效率。

有趣的是，NSP3连接的AT_H35L没有显著提高AT_H35L的分泌，尽管NSP3除了h-区之外含有相同的NSP4的n-区和c-区(图2和3)。因此，数据表明pelBss的h-区在AT_H35L的易位和分泌中起关键作用。当重组蛋白质进入细胞质膜进行易位时，h-区结构域的总疏水性是一个重要因素。出于这个原因，已经通过添加或截短氨基酸来研究信号多肽的h-区以改变总疏水性，用于改善大肠杆菌中的重组蛋白质分泌。(Jonet等人(2012)；Low等人,Bioengineered[生物工程化]3:334-338(2011)；Phoenix等人1993；Sjostrom等人1987；Velaithan等人2014)。在目前的研究中，NSP3和NSP4的突变体是通过改变这两种信号多肽的h-区中的氨基酸位置而产生的，因为这两种信号多肽具有不同的疏水区但具有相同的n-区和c-区(图2b和c)。

通常，h区由弱和强疏水性氨基酸残基组成。因此，研究了仅具有强疏水性残基的h-区如何影响AT_H35L分泌(NSP4b)。为了比较NSP4b，仅用聚丙氨酸产生另一种突变体以破坏信号多肽结构(NSP4c)中的疏水性。有趣的是，NSP4b和NSP4c也已经显著降低了AT_H35L的分泌效率(图4)。许多研究已示出，增加信号多肽的疏水性可增强重组蛋白质的分泌效率(Bankaitis等人,Cell[细胞]37:243-252(1984)；Emr等人(1980)；Hikita等人(1992))。然而，仅强疏水性残基的组成不能增强AT_H35L的易位。本数据表明，h-区需要强和弱疏水性氨基酸残基的适当组合，用于疏水性的平衡。

尽管NSP3和NSP4突变体中的总疏水性或一段h-区没有改变，但AT_H35L分泌的效率通过氨基酸位置的改变在这些突变体中显示出明显的差异(图4和5)。在h-区中氨基酸的位置显著影响重组AT_H35L蛋白质在分泌过程中的易位。本研究是一项新发现，即通过改变在h-区结构域中的氨基酸位置可以提高重组蛋白质的分泌效率。

信号多肽突变体也在诱导AT_H35L基因表达后影响细胞生长的特征。在补料分批培养期间，数据表明对NSP4的优化的培养过程时间是在诱导后10h，用于控制AT_H35L产物质量。相比之下，对于dsbAss的优化的培养过程时间是诱导后12h，以达到最大分泌AT_H35L产量。实现了来自NSP4比dsbAss高出5倍的分泌AT_H35L的产量图6)。数据表明NSP4在缩短培养处理时间对AT_H35L分泌的改善具有主要影响，表明该信号多肽对于大肠杆菌表达系统中分泌AT_H35L产物的商业水平非常有用。

总之，数据显示与未修饰的信号多肽相比，一些合成信号多肽改善了AT_H35L的分泌效率。具体地，NSP4在补料分批发酵过程中将分泌的AT_H35L的产量提高了4倍。在该工作中，本发现表明通过修饰信号多肽的h-区显着提高了AT_H35L的分泌效率，并且在h-区中残基的位置也影响分泌效率。这些新的新颖信号多肽可用于提高异源蛋白质在大肠杆菌中的分泌效率。

总之，这里的数据证明，i)与pelBss的n-区相比，包括额外的碱性氨基酸残基的dsbAss的n-区是有利的结构域，ii)h-区的疏水性对于重组蛋白质易位到细胞质膜是至关重要的，iii)h-区适当地需要弱和强氨基酸残基两者用于有效易位重组蛋白质，iv)在h-区中的疏水氨基酸残基的改组显着影响重组蛋白质的易位，v)特别地，NSP4在缩短培养过程中显著影响AT_H35L分泌的改善。我们相信本研究中设计的新颖信号肽可用于提高重组蛋白在大肠杆菌表达平台中的分泌效率。

除非另外定义，否则本文使用的所有技术和科学术语以及任何首字母缩略词具有与本发明领域的普通技术人员通常理解的相同的含义。用于传递与本文描述的那些类似或等效的信息的任何多肽或核酸序列、蛋白质、载体、组合物、细胞、方法和手段可用于实践本发明。

本文引用的所有参考文献在法律允许的全范围内通过引用并入本文。对这些参考文献的讨论旨在仅是为了概述其作者所作的断言。不承认任何参考(或任何参考文献的一部分)是相关的现有技术。申请人保留质疑任何引用的参考文献的准确性和针对性的权利。

Claims

1.一种信号多肽，其包含与SEQ ID NO:1或10至21中的任一个具有至少90％序列同一性的氨基酸序列。

2.如权利要求1所述的信号多肽，其包含与SEQ ID NO:1或10至21中的任一个具有至少95％序列同一性的氨基酸序列。

3.如权利要求1所述的信号多肽，其包含SEQ ID NO:1或10至21中的任一个的氨基酸序列。

4.一种蛋白质，其包含(i)信号多肽，该信号多肽包含与SEQ ID NO:1或10至21中的任一个具有至少90％序列同一性的氨基酸序列，和(ii)异源多肽。

5.如权利要求4所述的蛋白质，其中该蛋白质包含(i)信号多肽，该信号多肽包含与SEQID NO:1或10至21中的任一个具有至少95％序列同一性的氨基酸序列，和(ii)异源多肽。

6.如权利要求4所述的蛋白质，其中该蛋白质包含(i)信号多肽，该信号多肽包含SEQID NO:1或10至21中的任一个的氨基酸序列，和(ii)异源多肽。

7.如权利要求4至6中任一项所述的蛋白质，其中该异源多肽包含大于20个氨基酸。

8.如权利要求4至7中任一项所述的蛋白质，其中该异源多肽具有25kDa至50kDa的分子量。

9.如权利要求4至8中任一项所述的蛋白质，其中该异源多肽具有30kDa至35kDa的分子量。

10.如权利要求4至9中任一项所述的蛋白质，其中该异源多肽选自下组，该组由以下组成：酶、毒素、抗体、抗体片段、抗原、治疗性蛋白质及其组合。

11.一种信号多肽，其包含与SEQ ID NO:1具有至少90％序列同一性的氨基酸序列。

12.如权利要求11所述的信号多肽，其包含与SEQ ID NO:1具有至少95％序列同一性的氨基酸序列。

13.如权利要求11所述的信号多肽，其包含SEQ ID NO:1的氨基酸序列。

14.一种蛋白质，其包含(i)信号多肽，该信号多肽包含与SEQ ID NO:1具有至少90％序列同一性的氨基酸序列，和(ii)异源多肽。

15.如权利要求14所述的蛋白质，其中该蛋白质包含(i)信号多肽，该信号多肽包含与SEQ ID NO:1具有至少95％序列同一性的氨基酸序列，和(ii)异源多肽。

16.如权利要求14所述的蛋白质，其中该蛋白质包含(i)信号多肽，该信号多肽包含SEQID NO:1的氨基酸序列，和(ii)异源多肽。

17.如权利要求14至16中任一项所述的蛋白质，其中该异源多肽包含大于20个氨基酸。

18.如权利要求14至17中任一项所述的蛋白质，其中该异源多肽具有25kDa至50kDa的分子量。

19.如权利要求14至18中任一项所述的蛋白质，其中该异源多肽具有30kDa至35kDa的分子量。

20.如权利要求14至19中任一项所述的蛋白质，其中该异源多肽选自下组，该组由以下组成：酶、毒素、抗体、抗体片段、抗原、治疗性蛋白质及其组合。

21.如权利要求14至20中任一项所述的蛋白质，其中该异源多肽包含α毒素(AT)。

22.如权利要求14至21中任一项所述的蛋白质，其中该异源多肽包含来自金黄色葡萄球菌(Staphylococcus aureus)的α毒素。

23.如权利要求21至22中任一项所述的蛋白质，其中该α毒素在对应于H35的氨基酸位置包含取代。

24.如权利要求23所述的蛋白质，其中该取代是H35L取代。

25.一种蛋白质，其包含SEQ ID NO:2的氨基酸序列。

26.一种组合物，其包含根据权利要求1至3或11至13中任一项所述的信号多肽，或根据权利要求4至10或14至25所述的蛋白质。

27.一种核酸，其编码如权利要求1至3或11至13中任一项所述的信号多肽，或如权利要求4至10或14至25中所述的蛋白质。

28.一种核酸，其(1)编码如权利要求1至3或11至13中任一项所述的信号多肽，以及(2)包含一个或多个限制性内切酶位点。

29.一种载体，其包含如权利要求27或权利要求28所述的核酸。

30.如权利要求29所述的载体，其进一步包含复制起点。

31.如权利要求29或30所述的载体，其进一步包含与该核酸可操作地连接的启动子序列。

32.如权利要求29至31中任一项所述的载体，其中该启动子序列在原核生物中是可操作的。

33.如权利要求29至32中任一项所述的载体，其中该载体是质粒、转座子或病毒载体。

34.一种重组细胞，其被工程化以表达如权利要求4至10或14至25中任一项所述的蛋白质。

35.如权利要求34所述的重组细胞，其是原核生物细胞。

36.如权利要求34至35中任一项所述的重组细胞，其中该原核生物细胞是埃希氏杆菌属(Escherichia)。

37.如权利要求34至36中任一项所述的重组细胞，其中该原核生物细胞是大肠杆菌(Escherichia coli)。

38.一种宿主细胞，其用如权利要求29至33中任一项所述的载体转化。

39.如权利要求38所述的宿主细胞，其中该细胞是原核生物细胞。

40.如权利要求38或权利要求39所述的宿主细胞，其中该原核生物细胞是埃希氏杆菌属。

41.如权利要求38至40中任一项所述的宿主细胞，其中该原核生物细胞是大肠杆菌。

42.一种产生如权利要求4至10或14至25中任一项所述的蛋白质的方法，该方法包括在表达该蛋白质的条件下，培养工程化以表达该蛋白质的重组细胞，或用编码该蛋白质的载体转化的宿主细胞。

43.如权利要求42所述的方法，其中该重组细胞或宿主细胞在细胞培养物中在该蛋白质从该重组细胞或宿主细胞分泌的条件下培养。

44.如权利要求42或权利要求43所述的方法，其中该重组细胞或宿主细胞在细胞培养物中在将该信号多肽从该蛋白质切割的条件下培养。

45.如权利要求42至44中任一项所述的方法，该方法进一步包括从该细胞培养物中回收该蛋白质。

46.如权利要求45所述的方法，其中回收该蛋白质包括离心以去除细胞和/或细胞碎片。

47.如权利要求45或权利要求46所述的方法，其中回收该蛋白质包括过滤以去除细胞和/或细胞碎片。

48.一种增加蛋白质从细胞分泌的速率的方法，该方法包括：(a)在细胞培养物中培养宿主细胞，该宿主细胞包含如权利要求27所述的核酸或如权利要求29至33中任一项所述的载体，该载体编码该蛋白质，(b)诱导该蛋白质的表达，以及(c)回收分泌到该细胞培养物的上清液中的该蛋白质，其中将该蛋白质的分泌速率与具有dsbA信号多肽的该蛋白质的蛋白质分泌速率进行比较。

49.如权利要求48所述的方法，其中(c)的回收发生在诱导(b)后8和12小时之间。

50.如权利要求48或权利要求49所述的方法，其中该蛋白质分泌的速率每小时增加大于20％。

51.一种增加蛋白质从细胞分泌的量的方法，该方法包括：(a)在细胞培养物中培养宿主细胞，该宿主细胞包含如权利要求27所述的核酸或如权利要求29至33中任一项所述的载体，该载体编码该蛋白质，(b)诱导该蛋白质的表达，以及(c)回收分泌到该细胞培养物的上清液中的该蛋白质，其中将分泌的蛋白质的量与具有dsbA信号多肽的蛋白质进行比较。

52.如权利要求51所述的方法，其中与具有dsbA信号多肽的蛋白质相比，从该细胞分泌的该蛋白质的量增加大于20％。

53.如权利要求51所述的方法，其中与具有dsbA信号多肽的蛋白质相比，从该细胞分泌的该蛋白质的量增加大于100％。

54.一种制备蛋白质的方法，所述方法包括：

a.培养宿主细胞，该宿主细胞包含如权利要求27所述的核酸或如权利要求29至33中任一项所述的载体，使得表达该核酸，由此当该核酸或载体在该宿主细胞中表达时，由该核酸或载体编码的蛋白质从该细胞分泌到上该清液中；以及

b.从该上清液中分离该分泌的蛋白质。

55.如权利要求41至54中任一项所述的方法，其中该宿主细胞或重组细胞是大肠杆菌。

56.如权利要求54或权利要求55所述的方法，其中该宿主细胞在细胞培养物中在将该信号多肽从该蛋白质切割的条件下培养。

57.如权利要求54至56中任一项所述的方法，其中分离该分泌的蛋白质包括离心以去除细胞和/或细胞碎片。

58.如权利要求54至56中任一项所述的方法，其中分离该分泌的蛋白质包括过滤以去除细胞和/或细胞碎片。

59.一种蛋白质，其通过如权利要求42至58中任一项所述的方法制备。