CN101374949A

CN101374949A - 通过信号序列和分泌增强子生产可溶的天然形式的重组蛋白质

Info

Publication number: CN101374949A
Application number: CNA2007800038789A
Authority: CN
Inventors: 李相俊; 金英玉; 南宝惠
Original assignee: BEXCORE Inc; National Fisheries Research and Development Institute
Current assignee: BEXCORE Inc; National Fisheries Research and Development Institute
Priority date: 2006-01-31
Filing date: 2007-01-30
Publication date: 2009-02-25

Abstract

本发明涉及使用由修饰的信号序列组成的分泌增强子提高异源蛋白的分泌效率的方法，所述修饰的信号序列包括信号序列的N－区和/或包括所述N－区的所述信号序列的疏水片段和/或亲水多肽。本发明的方法不但可以通过抑制不溶的沉淀并提高所述重组蛋白向周质中或胞外流体中的分泌效率用于生产重组的异源蛋白，并且还通过使用强分泌增强子提高所述重组蛋白的膜渗透性而用于治疗性蛋白的转导。

Description

通过信号序列和分泌增强子生产可溶的天然形式的重组蛋白质

技术领域

本发明涉及通过定向信号(信号序列的一部分)、分泌增强子和蛋白酶识别位点而生产可溶的天然形式的重组蛋白质的方法。

背景技术

现代生物技术的一个最重要的应用是重组蛋白的生产，特别是可溶的天然形式的重组蛋白的生产。可溶蛋白在活性形式的蛋白的生产和回收、用于功能研究的结晶及其工业化中起重要作用。由于大肠杆菌(E.coli)可以容易地进行操作，具有快速生长速率，保证稳定的表达，是经济型的，并且易于使其规模化，所以已经在大肠杆菌中表达重组蛋白。

然而，当大肠杆菌用于表达异源重组蛋白时，缺乏适当的翻译后蛋白伴侣或翻译后加工可以导致所表达的蛋白错误折叠，并且聚集形成内含体(Baneyx，Curr.Opin.Biotechnol.(现代生物技术观点)10:411-421，1999)。

研究已经证实大肠杆菌的信号序列将外源多肽导向大肠杆菌的周质(Inouye和Halegoua，CRC Crit.Rev.Biochem.7:339-371，1980)，并且氨基端碱性区域(Lehnhardt等，J.Biol.Chem.(生物的化学杂志)263:10300-10303，1988)，疏水区域(Goldstein等，J.Bacteriol.(细菌学杂志)172:1225-1231，1990)和分裂区域(Duffaud和Inouye，J.Biol.Chem.(生物的化学杂志)263:10224-10228，1988)都参与信号肽的结构和功能。已经开发了一些来自大肠杆菌含有信号序列的载体，用于生产可溶蛋白质(ompA:Ghrayeb等，EMBO J.3:2437-2442，1984；Duffaud等，Methods Enzymol.(酶学方法)153:492-507，1987；Delrue等，Nucleic Acids Res.(核酸研究)16:8726，1988；phoA:Dodt等，FEBS Lett.202:373-377，1986；Kohl等，Nucleic Acids Res.(核酸研究)18:1069，1990；eltA:Morika-Fujimoto等，J.Biol.Chem.(生物的化学杂志)266:1728-1732，1991；bla:Oka等，Agric Biol.Chem.(农业生物的化学)51:1099-1104，1987；eltIIb-B:Jobling等，Plasmid(质粒)38:158-173，1997)。

然而，目前可以用于表达载体的所有的信号序列只具有指导可溶蛋白表达的有限的能力，并且使用这些载体导致具有信号肽酶分解区域的重组融合蛋白的产生，这表明很难生产天然形式的重组体。

为什么很难使用信号序列生产重组蛋白的原因在于，1)生产以可溶形式的蛋白的预测是不可能的，以致许多研究者已经假设可溶形式的重组蛋白的表达固有地取决于氨基酸序列的物理性质；和2)存在太多的作用为信号序列的序列，但是还没有研发出关于这样的信号序列的功能的直接分析方法(Triplett等，J.Biol.Chem.(生物的化学杂志)276:19648-19655，2001)。

因此，本发明人研究了能够提高蛋白分泌效率的分泌增强子，并且通过证实包括连接到含有单独的碱性N-区或碱性N-区和中间特征性疏水区的信号序列上的亲水氨基酸的肽可以作为分泌增强子，而进一步完成了本发明。

发明内容

技术问题

本发明的一个目的是提供用于由异源基因有效地生产可溶的重组融合蛋白的方法，和用于回收所述天然形式的蛋白的方法。

技术方案

为了实现上述目的，本发明提供一种包含基因构建体的表达载体，所述基因构建体由下列各项组成：编码修饰的信号序列的多核苷酸，所述修饰的信号序列由包含所述信号序列的N-区的多肽片段或包含所述信号序列的N-区和中间特征性疏水区的疏水片段组成；和/或与所述信号序列的N-区片段和/或疏水片段连接的亲水增强序列，作为分泌增强子。

本发明还提供用于生产含有所述修饰的信号序列和异源基因的融合蛋白的重组表达载体。

本发明还提供通过用上述表达载体或所述重组表达载体转化宿主细胞而制备的转化体。

本发明还提供通过使用上述转化体提高重组蛋白的分泌效率的方法。

本发明还提供生产重组融合蛋白的方法。

本发明还提供通过上述方法生产的重组融合蛋白。

本发明还提供生产异源蛋白的方法。

本发明还提供所述重组融合蛋白的药用用途。

在下文中提供本发明所用的术语的描述。

“异源蛋白”或“目标异源蛋白”表示本领域的技术人员目的要进行大量生产的蛋白质，确切地是能够通过含有编码所述目标蛋白的多核苷酸的重组表达载体在转化体中表达的任何蛋白质。

“融合蛋白”表示在天然异源蛋白的N端或C端加上另一种蛋白或另一种氨基酸序列的蛋白。

“信号序列”表示参与通过辅助蛋白穿过细胞质膜而将在病毒、原核细胞或真核细胞中表达的异源蛋白有效导向细胞周质或细胞外的序列。所述信号序列由带正电荷的N-区、中间特征性疏水区和带有裂解位点的C-区组成。用于本发明的信号序列片段表示所述带正电荷的N-区、所述中间特征性疏水区和所述带有裂解位点的C-区中任一种的一部分，或整个信号序列。

“多肽”在本文中表示其中至少两个氨基酸通过肽键连接的多聚体分子，并且蛋白也认为是一种多肽。

“多肽片段”表示保持所述多肽功能的最小长度或更长的多肽序列。如果没有另外提及，所述多肽片段在本文中不包括全长的多肽。例如，本发明“包含信号序列的N-区的多肽片段”表示作用为信号序列的缩短的信号序列而不是完整的信号序列。

“多核苷酸”表示其中至少两个核酸通过磷酸二酯键连接的多聚体分子，并且包括DNA和RNA。

“分泌增强子”表示由增加所述信号序列的亲水性的亲水氨基酸组成的亲水多肽。

“N-区”表示位于N端的强碱性序列，其很好地保存在一般信号序列中，并且取决于信号序列，由3～10个氨基酸组成。

“中间特异性疏水区”表示在所述一般信号序列结构中邻接N-区的区域，其包括多个疏水氨基酸是高度疏水性的。

“修饰的信号序列”表示不是完整的信号序列，而是其N-区或在N-区连接分泌增强子的多肽，或包括N-区和中间特异性疏水区的剪截的疏水信号肽，或除了上述之外带有蛋白酶识别位点的多肽。

“信号序列片段”或“剪截的信号序列”表示信号序列的一部分。如果在本文中没有另外提及，该片段表示从信号序列排除C-端区域的片段。

如果没有另外提及的话，“限制酶位点”表示由DNA限制酶识别并且消化的多核苷酸序列。

“蛋白酶的识别位点”表示由蛋白酶识别并且消化的氨基酸序列。

“两亲性结构域”表示具有疏水和亲水区域的结构域，其是具有跨膜结构域样结构的区域。因此，在本发明中，所述两亲性结构域理解为“跨膜样结构域”。

“跨膜样结构域”表示从氨基酸序列预测的区域，预测其具有与膜蛋白的跨膜结构域相似的结构(Brasseur等，Biochim.Biophys.Acta1029(2):267-273，1990)。通常，通过各种预测跨膜结构域的计算机软件容易地预测所述跨膜样结构域。并且所述软件例如TMpred(//www.ch.embnet.org/software/TMPRED_form.html)，HMMTOP(//www.enzim.hu/hmmtop/html/submit.html)，TBBpred(//www.imtech.res.in/raghava/tbbpred/)，DAS-TMfilter(://www.enzim.hu/DAS/DAS.html)，等。所述“跨膜样结构域”包括被鉴定为具有实际的膜电位的跨膜结构域。

“表达载体”表示线性或环形的DNA分子，其包括编码目的多肽的片段，该片段与提供所述表达载体的转录的另外的片段可操作性地连接。所述另外的片段包括启动子和终止密码子。所述表达载体包括一个或多个复制起点，一个或多个选择标记，增强子，多腺苷酸信号等。所述表达载体通常来自于质粒或病毒DNA或二者。

“可操作性连接”表示片段按照目的需要排列并且连接以进行操纵，例如，转录在启动子起始，并且在终止密码子终止。

“启动子”表示RNA聚合酶与之结合而起始mRNA合成的基因部分。

“宿主细胞”表示由基因载体如病毒或质粒载体感染以生产重组蛋白或异源蛋白的细胞。

“血脑屏障”表示中断特异性物质从血液侵入到脑中的功能性屏障。所述血脑屏障的主要结构推测是毛细管内皮细胞中的紧密连接(闭锁小带)。

在下文中，详细描述本发明。

本发明人首先构建了表达可溶形式的融合蛋白的载体，以使用信号序列生产黏附蛋白Mefp1(Waite等，Biochemistry(生物化学)24:5010-5014，1985)，确切地是基于His标记的pET载体，通过PCR将异源mefp1基因与作为信号序列的完整和部分OmpA信号肽(OmpASP)的编码序列连接，然后通过将异源基因连接到具有OmpASP_tr-因子Xa cleabage的修饰的信号序列连接，其中所述剪截的OmpASP(OmpASP_tr)和因子Xa识别位点连接，而构建载体，以获得可溶形式的Mefp1蛋白的天然N-端形式。最后，本发明人在用因子Xa蛋白酶处理裂解掉所述修饰的信号序列后而生产天然形式的Mefp1蛋白。本发明人进一步证实完整的或/和部分OmpASP具有常规的pI值，并且这一pI值在表达可溶蛋白中非常重要。

在表达实验中，牙鲆(olive flounder)Hepcidin I不能使用OmpASP_tr表达为可溶的融合蛋白。因此，在异源蛋白没有通过所述信号序列表达为可溶形式的情形中，将编码具有高pI和亲水性的这样的氨基酸如Arg和Lys的序列插入到信号序列的C端区作为分泌增强子，通过PCR导致蛋白酶识别位点的编码序列与异源基因的融合。在构建上述载体后，本发明人生产可溶蛋白。在此时，所述异源基因的上游称为“修饰的信号序列区域”。

所述修饰的信号序列以OmpASP_tr-SmaI-Xa(在Mefp1的情形中)或OmpASP_tr-()-Xa(在牙鲆(Paralichthys olivaceus)Hepcidin I的情形中)形式设计，并且选择与pI和疏水性/亲水性相关的6个不同的氨基酸，并通过每个氨基酸6个的6个同源氨基酸序列插入到SmaI或-()-区域，形成克隆的构建。然后，研究表达。结果，在插入了与具有高pI值和亲水性的Arg和Lys相对应的序列的克隆中，可溶蛋白的表达增加。在可溶性Mefp1的情形中，可溶蛋白的表达稍微增加，而在可溶牙鲆Hepcidin I的情形中，表达显著增加，这表明插入的氨基酸Arg和Lys作用为分泌增强子。总之，在C端插入碱性氨基酸Arg和Lys增加信号序列的pI值和亲水性，并且由此增加可溶蛋白的表达。

还证实针对在C端具有高pI值和亲水性的Arg和Lys的量信号序列的N端序列越短，观察到所述信号序列的亲水性越高和可溶目的蛋白的表达越多。因此，在所述修饰的信号序列区域中的高pI值和亲水性是表达可溶蛋白的关键因素，并且亲水(hydropathy)性能可能是次要因素。如果信号序列被设计成比特定长度更长，那么该序列将具有这样的跨膜样结构域结构，其具有比一般跨膜结构域或跨膜样结构域的亲水性更高的亲水性，并且这种结构能够表达可溶的蛋白。

研究了所述可溶克隆的所述信号序列区域的亲水性模式。结果，这样的克隆的信号序列具有这样的跨膜样结构域，其具有与在牙鲆Hepcidin I中的两亲性结构域或跨膜样结构域相似或更高的亲水性模式。这一结果表明信号序列需要具有更高亲水性的跨膜样结构域，以表达含有两亲性结构域的异源蛋白如牙鲆Hepcidin I分子。

因此，已经证明信号序列的疏水性/亲水性平均值是表达可溶蛋白的关键因素。可以预测所述修饰的信号序列的疏水性/亲水性平均值(Hopp和Woods等级)，并且所述亲水性模式可以通过计算机程序DNASIS^TM(日立(Hitachi)，日本，1997)最优化，以致可以设计具有亲水性比目的异源蛋白更高的跨膜样结构域的序列，以表达可溶的蛋白。

在下文中更详细地描述本发明。

本发明人使用在图2所示的模板通过PCR构建了pET-22b(+)[ompASP₍₎-7×mefp1^*]克隆，其通过将编码具有诱导在大肠杆菌中分泌的信号序列OmpA的部分的OmpASP_1-3区域的编码序列的异源蛋白的7×mefp1的5’-端与OmpASP_1-23的完整编码序列融合(参见表1)而构建。将所构建的载体克隆转化到大肠杆菌BL21(DE3)中，并且使用IPTG诱导目的蛋白表达3小时。结果，上述构建的克隆都在大肠杆菌中表达可溶的重组MefpI(参见表1和图3)。

信号序列具有从Met起始的带正电荷N-区、中间特征性疏水区和以裂解位点结束的C区的排列。所述信号序列调控前体蛋白的折叠，并且在蛋白分泌过程中起主要作用(Izard等，Biochemistry(生物化学)34:9904-9912，1995；Wickner等，Annu.Rev.Biochem.(生物化学综述年刊)60:101-124，1991)。

到目前为止，已知pI值、疏水性、分子量和完整蛋白的稳定性是影响重组蛋白以可溶形式表达的关键因素。本发明人制备了修饰的信号序列，并且研究了从完整的和部分信号序列OmpASP的pI值，其是从OmpASP_1-3到完整的OmpASP_1-23。结果，它们的pI值都是10.55，与它们的长度无关(表2)。将所有的克隆用IPTG处理3小时，以诱导可溶目的蛋白的表达，并且结果表明它们都生产可溶的Mefp1，而与OmpASP的长度无关(参见图3)。上述结果表明，不是疏水性而是高pI值作用为不但在部分OmpASP而且在完整的OmpASP中表达可溶的Mefp1的定向信号。这一结果还表明，单独的带正电荷的N-区可以表达可溶形式的新生的多肽链，其是本发明人最先发现的令人惊异的发现。信号序列的N-区恰巧包含谷氨酸或天冬氨酸而不是带正电荷的碱性氨基酸，并且在这种情形中，pI值可能达到4。即使这样，所述N-区仍可以用作定向信号序列。所述修饰的信号序列的优选pI值是至少8，并且更优选地至少9，并且最优选地是至少10。

在本发明中，使用大肠杆菌起始的OmpA信号序列，但是也可以使用具有OmpA信号序列样结构的信号序列，如CT-B(霍乱毒素亚基B)信号序列，LT II b-B(大肠杆菌热不稳定的肠毒素B亚基)信号序列，BAP(细菌碱性磷酸酶)信号序列(Izard和Kendall，Mol.Microbiol.(分子微生物学)13:765-773，1994)，酵母(Yeast)羧肽酶Y信号序列(Blachly-Dyson和Stevens，J.Cell.Biol.(细胞生物学杂志)104:1183-1191，1987)，乳酸克鲁维酵母(Kluyveromyces lactis)杀伤毒素γ亚基信号序列(Stark和Boyd.，EMBOJ.5(8):1995-2002，1986)，牛生长激素信号序列(Lewin，B.(Ed)，GENES V(基因V)，第290页.牛津大学出版社，1994)，流感神经氨酸酶信号锚定(Lewin，B.(Ed)，GENES V(基因V)，第297页.牛津大学出版社，1994)，易位子-相关蛋白亚基α(TRAP-α)(Prehn等，Eur.J.Biochem.(欧洲生物化学杂志)188(2):439-445，1990)信号序列和双精氨酸易位(Tat)信号序列(Robisnon，Biol.Chem.(生物化学)381(2):89-93，2000)。另外，可以使用任何其它具有与上述相似的结构的病毒、原核生物和真核生物的信号序列和前导序列。所有上述序列具有高疏水性。

为了生产重组的融合蛋白，具有蛋白酶识别位点的所述修饰的信号序列区域的C端提供用于融合异源蛋白的位点。当表达重组蛋白时，将其用蛋白酶处理，导致回收天然形式的异源蛋白。基于上述结果，本发明人设计将用于切割识别的C端末端的因子Xa蛋白酶的识别位点与OmpASP_1-8融合，并且使用7×mefp1作为模板(图2)通过PCR构建pET-22b(+)(ompASP_1-8-Xa-7×mefp1^*)克隆，并且研究所述克隆在大肠杆菌中的表达(表1)。结果，所述克隆生产可溶的蛋白。进一步证实，用作定向信号序列的修饰的信号序列通过用蛋白酶因子Xa处理而消除，并且获得天然形式的Mefp1(参见图4)。

用于本发明的因子Xa蛋白酶的识别位点优选地具有序列Ile-Glu-Gly-Arg。本发明的蛋白酶的识别位点优选地选自由因子Xa蛋白酶、肠激酶(Asp-Asp-Asp-Asp-Lys)，genenase I(His-Tyr)和弗林蛋白酶(Arg-X-X-Arg)组成的组。

本发明人研究了从所述表达的重组体回收的天然形式的蛋白的功能。检测了重组Mefp1的黏附性质。结果，与对照BSA相比，所述重组的Mefp1具有极好的黏附性质(参见图5)。因此，证实本发明生产重组蛋白的方法有效生产可溶的天然形式的异源蛋白而不损害其功能。

为了研究除了OmpASP片段外任何其它区域中的修饰的信号序列对可溶Mefp1表达的作用，本发明人选择SmaI位点用于便利地克隆平端DNA片段，将该信号序列设计为OmpASP_1-8-SmaI-Xa，并且使用PCR构建pET-22b(+)(ompASP_1-8-SmaI-Xa-7×mefp1^*)克隆(参见表1)。还构建了在所述SmaI位点插入具有高pI和亲水性的氨基酸如Arg或Lys的克隆。包含具有高pI和亲水性的氨基酸的克隆也被证实表达重组的Mefp1，并且事实上它的分泌稍微增加。

在另一个实验实施方案中，牙鲆Hepcidin I没有通过OmpASP_tr表达为可溶的融合蛋白(参见表3)。

为了筛选分泌增强子，本发明人设计了如OmpASP_1-10-()-Xa的信号序列区，并且在所述()位点插入多达6个所选择的影响pI值和疏水性/亲水性的氨基酸的同源序列，其为6×Arg，6×Lys，6×Glu，6×Asp，6×Tyr，6×Phe，6×Trp(参见表4)。使用牙鲆Hepcidin I基因(Kim等，Biosci.Biotechnol.Biochem.(生物科学，生物技术和生物化学)69:1411-1414，2005)作为模板进行PCR，以构建pET-22b(+)[ompASP_1-10-()-Xa-ofhepcidinI^**]克隆(参见表3)。在大肠杆菌中检测所述克隆。这些具有高pI和亲水性的6×Arg和6×Lys的克隆非常强地表达可溶的牙鲆Hepcidin I，而插入其它氨基酸的其它克隆非常弱地表达可溶的牙鲆Hepcidin I(参见图6)。上述结果表明，可溶的牙鲆Hepcidin I的表达与高pI值和亲水氨基酸Arg和Lys相关，并且因此证明插入到信号序列的C端的Arg和Lys作用为分泌增强子(参见表4)。

本发明人还研究了在N端具有不同长度的OmpASP片段和在C端具有不同形式的-()-Xa的修饰的信号序列区对亲水性的作用。首先，制备各种长度的N端信号序列OmpASP，将其附着到C端-6×Arg-Xa上，然后通过PCR构建pET-22b(+)[ompASP₍₎-6×Arg-Xa-ofhepcidinI^**](参见表3)。在大肠杆菌中检测所述克隆。结果，随着OmpASP序列长度的减少，亲水性通过Hopp和Woods等级增加(实施例6)，并且可溶的目的蛋白的产量增加(参见图7)。所述Hopp和Woods等级亲水性模式还揭示与最短的OmpASP_1-6N-区序列连接的OmpASP_1-6-6×Arg-Xa表现出唯一的亲水曲线。当比OmpASP_1-8更长的信号序列连接到-6×Arg-Xa上时，所得到的信号序列表现出在N端的疏水曲线，和在C端的亲水曲线，其与一般的跨膜样结构域相似。从上述结果证实，向由碱性N-区和中间的特征性疏水区组成的疏水片段的C端加入具有强亲水性的氨基酸导致跨膜样的结构域结构，并且当在所述信号序列区C端的亲水性比新生目的多肽链的跨膜结构域或跨膜样结构域或两亲性结构域的亲水性更大时，所述新生目的多肽链能够以可溶形式表达。这一发现最先由本发明人发现，其是令人惊异的结果。基于本发明的方法，现在，这些通常不以可溶形式表达的蛋白如膜蛋白可以以可溶形式表达，其可以进一步有助于提高用作具有增加药物递送的生物试剂的各种蛋白的膜渗透性。除了药物递送之外，所述常规蛋白药物具有不通过血脑屏障的常见缺点。但是，按照本发明的方法，这一缺点可以克服，这表明实现有效的药物递送。即，用于各种脑病的治疗蛋白质(例如，抗-β-淀粉状蛋白抗体)可以通过血管直接注射，而不是直接注射到脑室。

本发明人设定在N端的信号序列的长度为OmpASP_1-10，在-()-Xa区域的C端连接2～10个亲水氨基酸，然后通过PCR构建通用克隆pET-22b(+)[ompASP_1-10-()-Xa-ofhepcidinI^**](参见表3)。将所构建的克隆在大肠杆菌中表达。随着连接到所述信号序列区C端的亲水氨基酸的数目(所述修饰的信号序列)，Hopp和Woods等级亲水性增加(实施例6)，其与增加的可溶目的蛋白的产量相当(参见图8)。按照Hopp和Woods等级亲水性模式，表达可溶形式的蛋白的每种信号序列表现出在N端区域的疏水曲线和在C端区域的亲水曲线，这表明形成了跨膜样结构域结构。

因此，所述修饰的信号序列增加亲水性，并且由此能够在上述两种情形中表达可溶形式的目的蛋白，这表明Hopp和Woods等级亲水性可以用作目的蛋白的可溶表达的指标。起始于信号序列的N-区的OmpASP片段的pI值密切参与定向信号，并且C端的-()-Xa的亲水性水平对于确定分泌增强子的作用很重要。如果N端区域的长度设定为OmpASP_1-10，并且修饰C端区域，那么表达可溶蛋白的每种信号序列将表现出在N端区域的疏水曲线，和在C端区域的亲水曲线，其是一种跨膜结构域样双曲线。因此，按照Hopp和Woods等级的亲水性模式可以用作二级指标。

牙鲆Hepcidin I(无^**区)的亲水性模式和其通过Hopp和Woods等级的信号序列通过使用计算机程序模拟(参见图9)。对照牙鲆Hepcidin I分子具有两亲性结构域(图9A)，而假设的信号序列----牙鲆Hepcidin I融合蛋白包括两个跨膜样结构域；一个在信号序列中，另一个在牙鲆HepcidinI区(图9B，9C和9D)。以可溶形式强烈表达的重组牙鲆Hepcidin I在所述信号序列中包含比Hepcidin I的两亲性结构域更高的亲水性的跨膜样结构域(图9D)。与图9D的融合蛋白相对应的克隆pET-22b(+)[ompASP_1-10-6×Arg-Xa-ofhepcidinI^**]以可溶形式表达(参见图8泳道4)。因此，证实需要具有亲水性高于目的分子的一般跨膜样结构域的跨膜样结构域的信号序列，来以可溶的形式表达具有一个或多个跨膜结构域、跨膜样结构域或两亲性结构域的这样分子，从而克服所述障碍。为了预测可溶的目的蛋白的表达，可以使用Hopp和Woods等级疏水性/亲水性和亲水性模式作为指标。

因此，本发明的方法可以有效地用于生产具有天然N端形式的可溶的异源蛋白。

附图描述

参考附图最好理解本发明优选实施方案的应用，在附图中：

图1是举例说明本发明的表达载体的各种示例性实施方案的示意图。

图2是举例说明所克隆的mefp1克隆，pBluescriptIISK(+)-La-7×mefp1-Ra的序列：

La(左侧衔接头):下划线的BamHI/EcoRI/SmaI区；

接头:接头DNA(TACAAA)；

AlaLysProSerTyrProProThrTyrLys:碱性Mefp1单位；和

Ra(右侧衔接头):下划线的Arg/HindIII/SalI/XhoI区域。

图3是举例说明重组Mefp1融合蛋白的表达的图，其从pET-22b(+)[ompASP₍₎-7×mefp1^*](^*:Ra-6×His)克隆诱导，在可溶的上清中，并且使用抗-His标记抗血清检测由在3’-端包含His标记的编码序列的pET-22b(+)生产的重组Mefp1：

(A)SDS-PAGE；

(B)蛋白质印迹；

右上箭头：重组的Mefp1；

右下箭头：带有OmpA信号序列(OmpASP)裂解的Mefp1(通过OmpA信号肽酶OmpASP_1-21裂解的成熟形式)；

泳道1:OmpASP_1-3-7×Mefp1^*；

泳道2:OmpASP_1-5-7×Mefp1^*；

泳道3:OmpASP_1-7-7×Mefp1^*；

泳道4:OmpASP_1-9-7×Mefp1^*；

泳道5:OmpASP_1-11-7×Mefp1^*；

泳道6:OmpASP_1-13-7×Mefp1^*；

泳道7:OmpASP_1-15-7×Mefp1^*；

泳道8:OmpASP_1-21-7×Mefp1^*(由于OmpA信号序列连接到Mefp1序列上，所述序列的一些不存在，所以一半OmpASP_1-21由OmpA信号肽酶裂解，但是另一半不是由OmpA信号肽酶裂解；和

泳道9:OmpASP_1-23-7×Mefp1^*(由于OmpA信号序列完全保留，所以OmpASP_1-21完全由OmpA信号肽酶裂解)。

图4是举例说明从克隆pET-22b(+)(ompASP_1-8-Xa-7×mefp1^*)(^*:Ra-6×His)生产的可溶的重组Mefp1蛋白和具有天然形式的氨基酸末端的7×Mefp1^*的表达的图：

(A)SDS-PAGE；

(B)蛋白质印迹；

右上箭头：重组Mefp1(OmpASP_1-8-Xa-7×Mefp1^*)；^-

右下箭头:天然形式的Mefp1(7×Mefp1^*)；

泳道1:未诱导3小时的完整细胞；

泳道2:诱导表达3小时的完整细胞；

泳道3:诱导表达3小时的可溶的上清级分；和

泳道4:具有天然N端区域的Mefp1，其通过用因子Xa蛋白酶处理诱导表达的可溶的上清级分3小时而产生。

图5是举例说明重组蛋白Mefp1在载玻片上的涂层的图。+:蛋白用酪氨酸酶处理；和

-:蛋白不用酪氨酸酶处理。

图6举例说明分泌增强子OmpASP_tr-()-Xa，其用于从pET22b(+)[ompASP_1-10-()-Xa-ofhepcidinI^**](^**:Glu/HindIII/Sal I/Xho I-6×His)克隆表达重组的牙鲆(Paralichthys olivaceus)Hepcidin I(ofHepcidinI)。如在表4中所示，pI值和疏水性/亲水性值与插入到OmpASP_1-10-()-Xa的括号中的氨基酸相关：

(A)SDS-PAGE；

(B)蛋白质印迹；

箭头:重组的ofHepcidin I；

M:标记；

泳道1:对照；

泳道2:6×Arg；

泳道3:6×Lys；

泳道4:6×Glu；

泳道5:6×Asp；

泳道6:6×Tyr；和

泳道7:6×Trp。

图7是举例说明作为定向信号的OmpASP的长度对ofHepcidin I以可溶形式表达的影响的图。将可溶的上清级分用IPTG诱导3小时。如在图3所述进行蛋白质印迹：

(A)SDS-PAGE；

(B)蛋白质印迹；

箭头:重组的ofHepcidin I；

M:标记；

泳道1:pET22b(+)[ompASP_(1-6)-6×Arg-Xa-ofhepcidinI^**]；

泳道2:pET22b(+)[ompASP_(1-8)-6×Arg-Xa-ofhepcidinI^**]；

泳道3:pET22b(+)[ompASP_(1-10)-6×Arg-Xa-ofhepcidinI^**]；

泳道4:pET22b(+)[ompASP_(1-12)-6×Arg-Xa-ofhepcidinI^**]；和

泳道5:pET22b(+)[ompASP_(1-14)-6×Arg-Xa-ofhepcidinI^**]。

图8是举例说明信号序列中的高pI值和亲水氨基酸对ofHepcidin I的表达的影响的图。将可溶的上清级分用IPTG诱导3小时。如在图3所述进行蛋白质印迹：

(A)SDS-PAGE；

(B)蛋白质印迹；

箭头:重组的ofHepcidin I；

M:标记；

泳道1:对照；pET22b(+)[ompASP_1-10-Xa-ofhepcidinI^**]；

泳道2:pET22b(+)[ompASP_1-10-(LysArg)-Xa-ofhepcidinI^**]；

泳道3:pET22b(+)[ompASP_1-10-(4×Arg)-Xa-ofhepcidinI^**]；

泳道4:pET22b(+)[ompASP_1-10-(6×Arg)-Xa-ofhepcidinI^**]；

泳道5:pET22b(+)[ompASP_1-10-(8×Arg)-Xa-ofhepcidinI^**]；和

泳道6:pET22b(+)[ompASP_1-10-(10×Arg)-Xa-ofhepcidinI^**]。

图9举例说明使用计算机程序在ofHepcidin I及其在OmpASP_1-10-()-Xa中包含亲水氨基酸的变体的Hopp和Woods等级的模拟亲水性模式：

(A)ofHepcidin I(26aa，Av-0.21)；

(B)OmpASP_1-10-Xa-ofHepcidinI(40aa，Av-0.19)；

(C)OmpASP_1-10-LysArg-Xa-ofHepcidinI(42aa，Av-0.04)；

(D)OmpASP_1-10-6×Arg-Xa-ofHepcidinI(46aa，Av0.22)；

aa:氨基酸数目；和

Av:疏水性/亲水性平均值。

发明实施方式

下文详细描述本发明的优选实施方案。

本发明提供用于提高异源蛋白的分泌效率的表达载体，其包括由下列各项组成的基因构建体：(i)启动子，和(ii)编码信号序列的N-区的多核苷酸，其与所述启动子可操作性地连接(参见图1(a))。

此处，所述启动子优选地是病毒启动子、原核启动子或真核启动子。所述病毒启动子优选地是下列启动子中的一种：巨细胞病毒(CMV)启动子，多瘤病毒启动子，禽痘病毒启动子，腺病毒启动子，牛乳头瘤病毒启动子，劳斯肉瘤病毒启动子，反转录病毒启动子，乙型肝炎病毒启动子，单纯疱疹病毒胸苷激酶启动子和猿猴病毒40(SV40)启动子，但不总是限于这些。所述原核启动子优选地是下列启动子中的一种：T7启动子，SP6启动子，热激蛋白70启动子，β-内酰胺酶，乳糖启动子，碱性磷酸酶启动子，色氨酸启动子和tac启动子，但不总是限于这些。所述真核启动子优选的是酵母启动子、植物启动子或动物启动子。所述酵母启动子在此处优选地选自由下列各项组成的组：3-磷酸甘油酸激酶启动子，烯醇化酶启动子，甘油醛-3-磷酸脱氢酶启动子，己糖激酶启动子，丙酮酸二羧化酶启动子，果糖磷酸激酶启动子，葡萄糖-6-磷酸异构酶启动子，3-磷酸甘油酸变位酶启动子，丙酮酸激酶启动子，丙糖磷酸异构酶启动子，磷酸葡萄糖异构酶启动子，葡糖激酶启动子，醇脱氢酶2启动子，异细胞色素C启动子，酸性磷酸酶启动子，酿酒酵母(Saccharomyces cerevisiae)GAL1启动子，酿酒酵母GAL7启动子，酿酒酵母GAL10启动子和巴斯德毕赤酵母(Pichia pastoris)AOX1启动子，但不总限于这些。所述动物启动子优选地选自由热激蛋白启动子、肌动蛋白前体启动子和免疫球蛋白启动子组成的组，但不总限于这些。在本发明中，所述启动子可以是能够在宿主细胞中正常表达外源基因的任何启动子。

本文的信号序列优选地是病毒、原核或真核信号序列或前导序列，其以下列各项为例：OmpA信号序列，CT-B(霍乱毒素亚基B)信号序列，LT II b-B(大肠杆菌热不稳定的肠毒素B亚基)信号序列，BAP(细菌碱性磷酸酶)信号序列(Izard和Kendall，Mol.Microbiol.(分子微生物学)13:765-773，1994)，酵母羧肽酶Y信号序列(Blachly-Dyson和Stevens，J.Cell.Biol.(细胞生物学杂志)104:1183-1191，1987)，乳酸克鲁维酵母(Kluyveromyces lactis)杀伤毒素γ亚基信号序列(Stark和Boyd.EMBO J.5(8):1995-2002，1986)，牛生长激素信号序列(Lewin，B.(Ed)，GENES V(基因V)，第290页.牛津大学出版社，1994)，流感神经氨酸酶信号-锚定(Lewin，B.(Ed)，GENES V(基因V)，第297页.牛津大学出版社，1994)，易位子-相关蛋白亚基α(TRAP-α)(Prehn等，Eur.J.Biochem.(欧洲生物化学杂志)188(2):439-445，1990)信号序列和双精氨酸易位(Tat)信号序列(Robisnon，Biol.Chem.(生物化学)381(2):89-93.2000)，但不总是限于这些，并且可以包括任何携带高碱性N-区的信号序列。

含有所述N-区的多肽片段优选地由具有从3到21个氨基酸的不同长度的肽组成，必要时包括信号序列的第1-第3个氨基酸，并且所述片段的长度可以通过考虑本发明的信号序列的N-区的pI值和亲水性模式而确定。按照本发明的一个优选的实施方案，含有信号序列N-区的多肽片段的pI值至少为8，并且更优选地至少9，并且最优选地至少10。所述N-区包含至少2个碱性氨基酸，其选自带正电荷的氨基酸如赖氨酸或精氨酸和带负电荷的氨基酸如天冬氨酸或谷氨酸，并且带正电荷的氨基酸的pI值优选地至少8，以及带负电荷的氨基酸的pI值达到4。表现出至少8的N-区pI值的每一种信号序列可以用作表达载体的多肽片段，但不总限于这些。

信号序列N-区的一个或多个氨基酸可以用其它碱性氨基酸如精氨酸和赖氨酸取代。如果具有高pI值的一个或多个氨基酸如精氨酸和赖氨酸存在所述N-区，分泌效率将提高。并且这种取代方法已经是本领域的技术人员公知的(Sambrook等，1989.″Molecular Cloning:A Laboratory Manual(分子克隆：实验室手册)″，第2版.Cold Spring Harbor Laboratory Press(冷泉港实验室出版社)，冷泉港，纽约)。

编码分泌增强子的多核苷酸可以可操作性地与编码包含本发明的载体的N-区的多肽片段的另一种多核苷酸连接(参见图1(c))。分泌增强子包括高pI值和亲水氨基酸，因此它可以增加信号序列的亲水性，以加快将异源蛋白定向到周质中。所述分泌增强子是由至少60％的亲水氨基酸组成的亲水肽。因此，对于分泌增强子优选地包含至少60％的亲水氨基酸，更优选地至少70％，并且长度没有限制，但是通常为2-50个氨基酸长，并且更优选地4-25个氨基酸长，并且最优选地6-15个氨基酸长。最优选地，分泌增强子由6个亲水氨基酸重复组成。分泌增强子的pI值没有限制，但优选至少10。

在本发明的一个优选的实施方案中，编码蛋白酶识别位点的多核苷酸可操作性地与编码包含本发明的表达载体的N-区的多肽的另一种多核苷酸连接(参见图1(d))。本文的蛋白酶识别位点可以是下列各项中的一种：因子Xa识别位点、肠激酶识别位点、genenase I识别位点和弗林蛋白酶识别位点，或两个或多个识别位点逐步连接。并且如果使用因子Xa蛋白酶，那么优选识别位点，Ile-Glu-Gly-Arg。

在本发明的另一个优选的实施方案中，将编码分泌增强子的多核苷酸插入到表达载体中的编码含有所述N-区的多肽片段的多核苷酸和编码蛋白酶识别位点的多核苷酸之间(参见图1(e))。这种插入优选地使用由产生平端的限制酶如SmaI切割的限制酶位点进行。所述蛋白酶识别位点是选自由因子Xa识别位点、肠激酶识别位点、genenase I识别位点和弗林蛋白酶识别位点组成的组的一种或多种。

在本发明的另一个优选实施方案中，本发明的表达载体另外包括限制酶位点，用于插入编码异源蛋白的基因(参见图1(b)和(f))。这一限制酶位点紧邻编码含有信号序列的N-区的多肽片段的多核苷酸插入(图1(b))。如果所述载体包括编码分泌增强子的多核苷酸，那么所述限制酶位点紧邻所述多核苷酸插入(图1(f))。如果表达载体包括编码蛋白酶识别位点的多核苷酸，那么限制酶位点可以插入或可以不插入，并且事实上克隆编码异源蛋白的基因以通过利用限制酶位点而获得天然形式是不需要的。

同时，编码异源蛋白的基因可以插入到上述一种或多种载体中。此时，所述异源蛋白不限于具体的蛋白，并且可以使用本领域的技术人员视为可接受的任何蛋白。例如，选自由抗原、抗体、细胞受体、酶、结构蛋白、血清和细胞蛋白组成的组的蛋白可以作为重组融合蛋白进行表达。所述异源蛋白优选地在内部不包含跨膜结构域、跨膜样结构域或两亲性结构域。不带有跨膜结构域、跨膜样结构域或两亲性结构域的蛋白是没有限制的，但是优选Mefp1多聚体。

本发明提供用于增加异源蛋白的分泌效率的表达载体，所述表达载体含有由下列各项组成的基因构建体：(i)启动子，(ii)与启动子可操作性连接的编码疏水片段的多核苷酸，所述疏水片段包括信号序列的N-区和中间特征性疏水区，和(iii)与(ii)的多核苷酸可操作性连接的编码分泌增强子的多核苷酸(参见图1(g))。

用于本发明的表达载体的启动子优选地选自由病毒启动子、原核启动子和真核启动子组成的组，但不总是限于这些。所述病毒启动子在本文中优选地选自由下列启动子组成的组：巨细胞病毒(CMV)启动子，多瘤病毒启动子，禽痘病毒启动子，腺病毒启动子，牛乳头瘤病毒启动子，劳斯肉瘤病毒启动子，反转录病毒启动子，乙型肝炎病毒启动子，单纯疱疹病毒胸苷激酶启动子和猿猴病毒40(SV40)启动子，但不总是限于这些。所述原核启动子优选地选自由下列各项组成的组：T7启动子，SP6启动子，热激蛋白70启动子，β-内酰胺酶，乳糖启动子，碱性磷酸酶启动子，色氨酸启动子和tac启动子，但不总是限于这些。所述真核启动子优选的是酵母启动子、植物启动子或动物启动子。所述酵母启动子在此处优选地选自由下列各项组成的组：3-磷酸甘油酸激酶启动子，烯醇化酶启动子，甘油醛-3-磷酸脱氢酶启动子，己糖激酶启动子，丙酮酸二羧化酶启动子，果糖磷酸激酶启动子，葡萄糖-6-磷酸异构酶启动子，3-磷酸甘油酸变位酶启动子，丙酮酸激酶启动子，丙糖磷酸异构酶启动子，磷酸葡萄糖异构酶启动子，葡糖激酶启动子，醇脱氢酶2启动子，异细胞色素C启动子，酸性磷酸酶启动子，酿酒酵母GAL1启动子，酿酒酵母GAL7启动子，酿酒酵母GAL10启动子和巴斯德毕赤酵母AOX1启动子，但不总限于这些。所述动物启动子优选地选自由热激蛋白启动子、肌动蛋白前体启动子和免疫球蛋白启动子组成的组，但不总限于这些。

包含在本发明的表达载体中的信号序列优选地是病毒、原核或真核的信号序列或前导序列，其以下列各项为例：OmpA信号序列，CT-B(霍乱毒素亚基B)信号序列，LT II b-B(大肠杆菌热不稳定的肠毒素B亚基)信号序列，BAP(细菌碱性磷酸酶)信号序列(Izard和Kendall，Mol.Microbiol.(分子微生物学)13:765-773，1994)，酵母羧肽酶Y信号序列(Blachly-Dyson和Stevens，J.Cell.Biol.(细胞生物学杂志)104:1183-1191，1987)，乳酸克鲁维酵母杀伤毒素γ亚基信号序列(Stark和Boyd.EMBO J.5(8):1995-2002，1986)，牛生长激素信号序列(Lewin，B.(Ed)，GENES V(基因V)，第290页.牛津大学出版社，1994)，流感神经氨酸酶信号-锚定(Lewin，B.(Ed)，GENES V(基因V)，第297页.牛津大学出版社，1994)，易位子-相关蛋白亚基α(TRAP-α)(Prehn等，Eur.J.Biochem.(欧洲生物化学杂志)188(2):439-445，1990)信号序列和双精氨酸易位(Tat)信号序列(Robisnon，Biol.Chem.(生物化学)381(2):89-93.2000)，但不总是限于这些，并且可以包括任何携带高碱性N-区的信号序列。

所述信号序列的疏水片段优选地是由6-21个氨基酸组成的肽，其包含所述信号序列的第1-第6个氨基酸，但不总限于这些。

如上述，如果一个或多个具有高pI值的氨基酸如精氨酸和赖氨酸位于所述N-区，那么分泌效率将提高。氨基酸的取代是本领域的技术人员早已公知的(Sambrook等，1989.″Molecular Cloning:A Laboratory Manual(分子克隆：实验室手册)″，第2版.冷泉港实验室出版社，冷泉港，纽约)。在所述中间特征性疏水区的突变可以使用或不使用N-区诱变进行诱导。用另一种疏水氨基酸(例如，苯丙氨酸、酪氨酸、色氨酸、亮氨酸、缬氨酸、异亮氨酸、苏氨酸和丙氨酸)取代在所述中间特征性疏水区的一个或多个氨基酸是本领域技术人员公知的，并且本领域技术人员还充分理解，如果取代或诱变导致的所述修饰的信号序列的亲水性模式与本发明的信号序列相似，那么它可以表现出与本发明的信号序列相似的作用。

所述分泌增强子是编码亲水多肽的多核苷酸，所述亲水多肽由至少60％的亲水氨基酸组成，更优选地至少70％的亲水氨基酸组成。所述多核苷酸的长度没有限制，但是优选编码包括2-50个氨基酸的多肽的多核苷酸，并且更优选编码包括4-25个氨基酸的多肽的多核苷酸。此时，形成用于增强子的多肽的氨基酸的最优选数目是6-15，并且编码具有6个氨基酸重复结构的多肽的多核苷酸是最优选作为分泌增强子的。所述亲水氨基酸优选地是天冬酰胺、谷氨酰胺、丝氨酸、赖氨酸、精氨酸、天冬氨酸或谷氨酸，但不总限于这些，并且更优选赖氨酸或精氨酸，并且最优选编码包括6个强亲水氨基酸如赖氨酸或精氨酸的重复序列的多肽的多核苷酸。由上述分泌增强子编码的多肽的优选pI值是至少8，并且更优选地至少9，并且最优选地至少10。

在本发明的另一个优选实施方案中，本发明的表达载体包括编码蛋白酶识别位点的另一种多核苷酸，其与编码所述分泌增强子的多核苷酸可操作性地连接(参见图1(i))。所述蛋白酶识别位点在本文是下列各项中一种：因子Xa蛋白酶识别位点、肠激酶识别位点、genenase I识别位点或弗林蛋白酶识别位点，或两个或多个识别位点逐步连接。并且如果使用因子Xa蛋白酶，那么优选识别位点Ile-Glu-Gly-Arg。

在本发明的另一个优选的实施方案中，编码所述分泌增强子的多核苷酸可以通过与编码信号序列的疏水片段的多核苷酸可操作性连接的SmaI限制酶位点插入(OmpASP片段-SmaI-Xa)，或者通过使用包含与所述修饰的信号序列相对应的完整多核苷酸序列的引物进行PCR而插入，所述修饰的信号序列包含甚至完整的分泌增强子。编码目的氨基酸序列的多核苷酸可以通过利用SmaI限制酶位点而插入到分泌增强子中。

在本发明的一个优选的实施方案中，本发明的表达载体另外包括与编码分泌增强子的多核苷酸连接的限制酶位点，并且通过这一限制酶位点，可以容易地克隆编码异源蛋白的基因(参见图1(h))。

在本发明的另一个优选的实施方案中，本发明的表达载体另外包括编码异源蛋白的基因，其与上述基因构建体可操作性地连接。所述外源基因可以通过限制酶区而被克隆，并且如果内部存在编码蛋白酶识别位点的多核苷酸，那么该基因与所述多核苷酸符合阅读框地连接，以便分泌所述异源蛋白，并且用蛋白酶消化，然后生产异源蛋白的天然或类似形式。

所述异源蛋白在本文没有限制，并且包括任何在内部含有一个或多个跨膜结构域、跨膜样结构域或两亲性结构域的蛋白。在这样的包含一个或多个跨膜结构域、跨膜样结构域或两亲性结构域的异源蛋白中，带正电荷的区域将连接到所述膜的脂双层上，因此得到的跨膜样结构作用为一种中断周质或胞外分泌的锚定。本发明的表达载体对于这些很难分泌到周质中的蛋白的周质分泌非常有效。携带本发明的分泌增强子的表达载体不但有效产生具有一种或多个跨膜结构域、跨膜样结构域或两亲性结构域的蛋白，而且提高不含跨膜结构域、跨膜样结构域或两亲性结构域的其它蛋白的分泌效率。因此，通过使用本发明含有分泌增强子的表达载体，可以生产任何可溶形式的蛋白。如本文所阐释那样，本发明的表达载体对于生产可溶形式的具有一个或多个跨膜结构域、跨膜样结构域或两亲性结构域的蛋白非常有用，其似乎是这样，原因在于当所述定向信号存在于所述信号序列的N-端，并且本发明的修饰的信号序列的亲水性高于异源蛋白的内部结构域的亲水性时，融合形式的新生多肽容易地被引向周质。即，所述修饰的信号序列的定向性和亲水性如此高于所述目的分子的内部结构域的能力，以连接到所述脂双层上，以便促进分泌。

具有一个或多个跨膜结构域、跨膜样结构域或两亲性结构域的异源蛋白没有限制，但是优选使用牙鲆Hepcidin I。如果通过亲水性模式证实蛋白在内部具有跨膜样结构域或具有在由多个疏水氨基酸组成的序列之后包括连续的多个亲水氨基酸的序列，那么判断这种蛋白应该是具有一个或多个跨膜结构域、跨膜样结构域或两亲性结构域的蛋白，以便它可以适用于本发明的表达系统。并且对于这样的判断，可以使用这样的计算机软件如DNASIS^TM，DOMpro(Cheng等，Knowledge Discovery and Data Mining(知识发现和数据采集)，13(1):1-20，2006，//www.ics.uci.edu/～baldig/dompro.html)，TMpred(//www.ch.embnet.org/software/TMPRED_form.html)，HMMTOP(//www.enzim.hu/hmmtop/html/submit.html)，TBBpred(// www.imtech.res.in/raghava/tbbpred/)，DAS-TMfilter(//www.enzim.hu/DAS/DAS.html)，等。

本发明还提供通过用上述表达载体中的一种转化宿主细胞而制备的非人转化体。

所述宿主细胞在本文中没有限制，但是优选原核细胞或真核细胞。所述原核细胞优选地选自由病毒、大肠杆菌和杆菌属(Bacillus)组成的组，但不总限于这些。所述真核细胞优选地选自哺乳动物细胞、昆虫细胞、酵母和植物细胞，但不总限于这些。

本发明还提供用于提高异源蛋白的分泌效率的方法，该方法包括下述步骤：

1)分析异源蛋白的亲水性模式；

2)判断在步骤1)中分析的异源蛋白内部是否含有一个或多个跨膜结构域、跨膜样结构域或两亲性结构域；

3)(a)当所述异源蛋白在步骤2)中被证实不包含跨膜结构域、跨膜样结构域或两亲性结构域时，构建由多核苷酸组成的基因构建体，所述多核苷酸编码这样的融合蛋白，其中所述异源蛋白与含有信号序列N-区的多肽片段组合，或者所述多核苷酸编码这样的融合蛋白，其中所述异源蛋白与含有信号序列N-区的多肽片段和蛋白酶识别位点组合，和

(b)当所述异源蛋白在步骤2)中被证实具有一个或多个跨膜结构域、跨膜样结构域和两亲性结构域时，构建由多核苷酸组成的基因构建体，所述多核苷酸编码这样的融合蛋白，所述融合蛋白顺序地含有包括信号序列N-区和中间特征性疏水区的疏水片段、分泌增强子和所述异源蛋白，或者所述多核苷酸编码这样的融合蛋白，所述融合蛋白顺序地包含包含信号序列N-区和中间特征性疏水区的疏水片段、分泌增强子、蛋白酶识别位点和所述异源蛋白；

4)通过将在步骤3)中制备的基因构建体可操作性地插入到表达载体中而构建重组表达载体；

5)通过用步骤4)所述的重组表达载体转化宿主细胞而构建转化体；和

6)培养步骤5)的转化体。

在本发明中，所述异源蛋白没有限制，并且可以使用本领域技术人员接受的任何蛋白。例如，优选选自由抗原、抗体、细胞受体、酶、结构蛋白、血清和细胞蛋白组成的组的蛋白，并且更优选以不可溶形式表达的蛋白。在本发明的一个优选的实施方案中，将Mefp1多聚体和牙鲆HepcidinI用作异源蛋白，但不总限于这些。

所述亲水性模式在本文优选通过计算机软件或基于网络的关于亲水性模式分析的应用程序进行分析，但不总限于这些。并且用于所述分析的计算机软件选自由DNASIS^TM(日立(Hitachi)，日本)，Visual OMP(DNA软件，美国)，Lasergene(DNASTAR，美国)，pDRAW32(美国)和NetSupportDNA(NetSupport公司.美国)组成的组，并且其中DNASIS^TM(日立(Hitachi)，日本)是更优选的。

所述分泌增强子优选地是含有至少60％、并且更优选地至少70％的亲水氨基酸的亲水多肽，但不限于这些。所述多肽的长度没有限制，但是优选2-50个氨基酸长，并且更优选地4-25个氨基酸，并且最优选地6-15个氨基酸长。特别地，所述多肽最优选地由6个氨基酸重复序列组成。所述用作分泌增强子的亲水多肽的优选的pI值是至少8，更优选的pI值是至少9，并且最优选的pI值是至少10，但不总限于这些。

上文所述的亲水氨基酸没有限制，但是优选天冬酰胺、谷氨酰胺、丝氨酸、赖氨酸、精氨酸、天冬氨酸或谷氨酸，并且更优选赖氨酸或精氨酸。

在本发明的一个优选的实施方案中，蛋白酶识别位点另外插入到分泌增强子和异源蛋白之间。

本发明的宿主细胞没有限制，但是优选原核或真核细胞。所述原核细胞没有限制，但是优选地选自由病毒、大肠杆菌和杆菌组成的组。所述真核细胞没有限制，但是优选地选自由哺乳动物细胞、昆虫细胞、酵母和植物细胞组成的组。

本发明还提供用于制备融合异源蛋白的方法，所述方法包括下述步骤：

1)分析异源蛋白的亲水性模式；

3)(a)当所述异源蛋白在步骤2)中被证实不包含跨膜结构域、跨膜样结构域或两亲性结构域时，构建由多核苷酸组成的基因构建体，所述多核苷酸编码这样的融合蛋白，其中所述异源蛋白与含有信号序列N-区的多肽片段和蛋白酶识别位点组合，和

(b)当所述异源蛋白在步骤2)中被证实具有一个或多个跨膜结构域、跨膜样结构域或两亲性结构域时，构建由多核苷酸组成的基因构建体，所述多核苷酸编码这样的融合异源蛋白，即，所述融合异源蛋白顺序地含有包括信号序列N-区和中间特征性疏水区的疏水片段、分泌增强子，蛋白酶识别位点和异源蛋白；

5)通过用步骤4)所述的重组表达载体转化宿主细胞而构建转化体；

6)培养步骤5)的转化体；和

7)从步骤6)的培养溶液分离融合的异源蛋白。

在本发明中，所述异源蛋白没有限制，并且可以包括本领域技术人员接受的任何蛋白，其优选选自由抗原、抗体、细胞受体、酶、结构蛋白、血清和细胞蛋白组成的组的蛋白，并且特别地，更优选以不可溶形式表达的蛋白。在本发明的一个优选的实施方案中，将Mefp1多聚体和牙鲆Hepcidin I用作异源蛋白，但不总限于这些。

所述分泌增强子优选地是含有至少60％、并且更优选地至少70％的亲水氨基酸的亲水多肽，但不限于这些。所述多肽的长度没有限制，但是优选2-50个氨基酸长，并且更优选地4-25个氨基酸，并且最优选地6-15个氨基酸长。特别地，所述多肽最优选地由6个亲水氨基酸重复序列组成。所述用作分泌增强子的亲水多肽的优选的pI值是至少8，更优选的pI值是至少9，并且最优选的pI值是至少10，但不总限于这些。

回收在用所述表达载体转化的转化体中表达的蛋白，导致目的融合蛋白的产生。回收通过本领域技术人员公知的常规方法进行。

如果靶向脑病的治疗性蛋白质，例如，β-淀粉状蛋白特异的scFv(单链可变片段)在本发明中用作异源蛋白，那么所得到的本发明的修饰信号序列和所插入的异源蛋白的融合蛋白可以通过血脑屏障，以直接在大脑中起效用，这是常规蛋白所不能期望的。因此，本发明的方法极大地有助于药物递送系统，特别用于脑病的治疗。不但通过血脑屏障，当口服施用时，本发明的重组融合异源蛋白还可以在分解之前穿过胃壁，或者当通过喷雾或贴片使用时，其可以通过皮肤，以便在体内安全递送。因此，本发明的融合蛋白克服了常规方法受限于施用途径(静脉内注射、肌内注射、皮下注射或鼻施用)的问题，并且进一步促进更简单和舒服的施用，其包括口服施用和透皮施用。

本发明还提供按照上述方法的重组融合异源蛋白。

所述异源蛋白在本发明中没有限制，但是优选是靶向脑病的治疗性蛋白质。通过上述方法制备的重组融合蛋白可以具有跨膜区，由于其包含本发明的修饰的信号序列，故通过所述跨膜区其可以穿过血脑屏障。

本发明还提供一种药物组合物，其包含通过上述方法制备的由所述修饰的信号序列和异源蛋白组成的融合蛋白和药用载体。所述药物组合物可以用于治疗脑病，但不总限于这些。

本发明还提供用于制备天然形式的异源蛋白的方法，所述方法包括下述步骤：

1)分析异源蛋白的亲水性模式；

3)(a)当所述异源蛋白在步骤2)中被证实不包含跨膜结构域、跨膜样结构域或两亲性结构域时，构建由多核苷酸组成的基因构建体，所述多核苷酸编码这样的融合蛋白，即，其中所述异源蛋白与含有信号序列N-区的多肽片段和蛋白酶识别位点组合，和

(b)当所述异源蛋白在步骤2)中被证实具有一个或多个跨膜结构域、跨膜样结构域和两亲性结构域时，构建由多核苷酸组成的基因构建体，所述多核苷酸编码这样的融合异源蛋白，即，所述融合异源蛋白顺序地含有包括信号序列N-区和中间特征性疏水区的疏水片段、分泌增强子，蛋白酶识别位点和异源蛋白；

6)培养步骤5)的转化体；和

7)从步骤6)的培养溶液分离融合的异源蛋白；和

8)在用蛋白酶消化所述蛋白酶识别位点后，从在步骤7)中分离的所述融合蛋白分离天然形式的异源蛋白。

所述亲水性模式在本文优选通过计算机软件或基于网络的关于亲水性模式分析的应用程序进行分析，但不总限于这些。并且用于所述分析的计算机软件选自由DNASIS^TM(日立(Hitachi)，日本)，Visual OMP(DNA软件，美国)，Lasergene(DNASTAR，美国)，pDRAW32(美国)和NetSupportDNA(NetSupport公司.美国)组成的组，并且其中DNASIS^TM(日立(Hitachi)，日本)是更优选的。作为基于网络的应用程序，可以使用由Innovagen公司.(瑞典)通过其主页(//www.innovagen.se/custom-peptide-synthesis/peptide-property-calculator/peptide-property-calculator.asp)提供的一种应用程序。

在本发明的另一个优选的实施方案中，蛋白酶识别位点另外插入到分泌增强子和异源蛋白之间。

回收在用所述表达载体转化的转化体中表达的蛋白，导致目的融合蛋白的产生。回收通过本领域技术人员公知的常规方法进行。天然形式的异源蛋白可以通过用促进将所插入的蛋白酶识别位点从所述融合异源蛋白上切下的蛋白酶处理而从所述融合蛋白分离。所述蛋白酶在本发明中优选地是因子Xa、肠激酶、genenase I和弗林蛋白酶，但不总限于这些。同时，如果使用因子Xa蛋白酶，那么氨基酸序列的识别位点优选地是Ile-Glu-Gly-Arg。

在本发明的一个优选的实施方案中，本发明提供用于提高分泌效率的方法，所述方法包括下述步骤：

1)通过将编码异源蛋白的基因可操作性地连接到本发明的表达载体的限制酶位点上，而构建重组表达载体；

2)通过用步骤1)的重组表达载体转化宿主细胞而产生转化体；和

3)培养步骤2)的转化体。

在本文中，所述宿主细胞没有限制，但是优选原核或真核细胞。所述原核细胞没有限制，但是优选地选自由病毒、大肠杆菌和杆菌组成的组。所述真核细胞没有限制，但是优选地选自由哺乳动物细胞、昆虫细胞、酵母和植物细胞组成的组。

本发明还提供关于提高异源蛋白的分泌的分泌增强子的筛选方法，所述方法包括下述步骤：

1)构建包含基因构建体的表达载体，其中启动子、编码包含信号序列的N-区的多肽片段或包含信号序列的N-区和中间特征性疏水区的疏水片段的多核苷酸、用于插入分泌增强子候选物的限制酶位点和编码异源蛋白的多核苷酸的彼此之间可操作地连接；

2)通过将编码包含亲水氨基酸的分泌增强子候选序列的多核苷酸插入到所述表达载体的限制酶位点，而构建重组表达载体；

3)通过用步骤2)的重组表达载体转化宿主细胞而产生转化体；

4)培养步骤3)的转化体；

5)测量所述异源蛋白在用步骤1)的表达载体转化的转化体(对照)和在步骤4)的转化体的可溶级分或培养溶液中的表达水平；和

6)选择与对照相比，显著增加所插入的异源蛋白的表达水平的分泌增强子。

最佳方案

本发明的实用和目前优选的实施方案是举例说明性的，如在下述实施例中显示。

然而，应该理解，考虑到这些内容，本领域技术人员可以进行在本发明的精神和范围内的修改和改进。

实施例1：克隆黏附蛋白基因DNA多聚体盒

基于由SEQ.ID.NO:1(Ala Lys Pro Ser Tyr Pro Pro Thr Tyr Lys)表示的Mefp1氨基酸序列的基本单位，通过使用由SEQ.ID.NO:2(5′-TACAAA GCT AAG CCG TCT TAT CCG CCA ACC-3′)所示的正向引物和由SEQ.ID.NO:3(5′-TTT GTA GGT TGG CGG ATA AGA CGG CTTAGC-3′)所示的反向引物，本发明人制备了合成的mefp1 DNA。对于左侧衔接头(下文称为“La”)合成的DNA(包含BamHI/EcoRI/SmaI)，使用由SEQ.ID.NO:4(5′-GAT CCG AAT TCC CCGGG-3′)所示的正向引物和由SEQ.ID.NO:5(5′-TTT GTA CCC GGG GAATTC G-3′)所示的反向引物。对于右侧衔接头(下文称为“Ra”)合成的DNA(包含Arg/HindIII/SalI/XhoI)，使用由SEQ.ID.NO:6(5′-TAC AAA CGT AAG CTT GTC GAC C-3′)所示的正向引物和由SEQ.ID.NO:7(5′-TCG AGG TCG ACA AGC TTA CG-3′)所示的反向引物。此后，通过在韩国专利号379,025中所述的方法构建mefp1DNA多聚体，然后将其克隆到载体pBluescriptIISK(+)(Stratagene，美国)中。进行筛选选择产生包含所述左侧衔接头(La)序列、7个mefp1 DNA重复序列和所述Ra序列的构建体的转化体，并且将筛选的构建体命名为pBluescriptIISK(+)La-7×mefp1-Ra(图2)。

表1

引物、质粒克隆和重组的Mefp1的表达

CAT被延长以保护NdeI位点。

粗体斜体字母：表示不同大小的所述完整的和部分OmpASP的寡核苷酸。

粗体字母：SmaI位点的寡核苷酸。

下划线的粗体字母：因子Xa识别位点的寡核苷酸。

普通字母：在图2所示的Mefp1区域的寡核苷酸。

反向引物：与在图2所示的Ra(右侧衔接头；Arg/HindIII/SalI/XhoI)互补的寡核苷酸序列。

OmpA信号肽(OmpASP)由23个氨基酸残基组成(MKKTAIAIAVALAGFATVAQAAP:SEQ.ID.NO:46)(Movva等，J.Biol.Chem.(生物的化学杂志)255，27-29，1980)。

^*:Ra和His标记(6×His)的盈余序列。

mefp1:Mefp1基因

缩写：T-总蛋白；S-可溶级分；和P-周质级分。

重组Mefp1蛋白的表达：“-”：无表达；“+”：表达。

表2

依据OmpASP的长度可溶重组Mefp1蛋白的pI值、疏水平均值和表达

OmpASP及其不同长度的片段	pI	Hopp和woods等级疏水性	可溶重组Mefp1的表达
OmpASP及其不同长度的片段	pI	Hopp和woods等级疏水性	可溶重组Mefp1的表达	OmpASP₁	5.70	-	NT
OmpASP_1-2	9.90	-	NT	OmpASP₁	5.70	-	NT
OmpASP_1-2	9.90	-	NT	OmpASP_1-3	10.55	-	+
OmpASP_1-4	10.55	-	+	OmpASP_1-3	10.55	-	+
OmpASP_1-4	10.55	-	+	OmpASP_1-5	10.55	-	+
OmpASP_1-6	10.55	-0.03	+	OmpASP_1-5	10.55	-	+

OmpASP_1-7	10.55	-0.09	+
OmpASP_1-7	10.55	-0.09	+	OmpASP_1-8	10.55	-0.31	+
OmpASP_1-9	10.55	-0.33	+	OmpASP_1-8	10.55	-0.31	+
OmpASP_1-9	10.55	-0.33	+	OmpASP_1-10	10.55	-0.44	+
OmpASP_1-11	10.55	-0.45	+	OmpASP_1-10	10.55	-0.44	+
OmpASP_1-11	10.55	-0.45	+	OmpASP_1-12	10.55	-0.56	NT
OmpASP_1-12	10.55	-0.56	+	OmpASP_1-12	10.55	-0.56	NT
OmpASP_1-12	10.55	-0.56	+	OmpASP_1-14	10.55	-0.52	NT
OmpASP_1-15	10.55	-0.65	+	OmpASP_1-14	10.55	-0.52	NT
OmpASP_1-15	10.55	-0.65	+	OmpASP_1-21	10.55	-0.61	+
OmpASP_1-23	10.55	-0.58	+	OmpASP_1-21	10.55	-0.61	+

OmpASP长度依赖性pI值和疏水性(具有窗口大小的Hopp和Woods等级:6和阈值线:0.00)通过DNASIS^TM计算。所述Hopp和Woods等级疏水性表示，‘-’表示无值，而‘-值’表示疏水性。随着绝对值增加，疏水性增加。重组Mefp1蛋白的表达：‘NT’；未检测到，‘+’；表达。

实施例2：黏附蛋白mefp1的表达

在先前的研究中，当将Met-Mefp1用作前导序列时，Mefp1表达为不可溶的内含体(Kitamura等，J Polym.Sci.Ser.A 37:729-736，1999)。本发明人引入信号序列OmpASP(OmpA信号肽)以诱导目的蛋白以可溶形式表达，对于其使用图2的mefp1序列作为模板进行PCR，以构建携带不同大小的ompASP和mefp1盒的克隆(表1)。

在30℃在50μg/ml的氨苄青霉素的存在下，将通过使用包含在表1所示的信号序列的表达载体产生的大肠杆菌BL21(DE3)转化体在LB培养基(胰蛋白胨20g，酵母提取物5.0g，NaCl 0.5g，KCl 1.86mg/l)中培养16小时。将培养溶液用LB培养基稀释200倍。将所稀释的培养物溶液温育达到OD₆₀₀ 0.3，然后加入IPTG至终浓度1mM。将所述培养溶液继续温育3小时进行表达。然后，将1ml的培养溶液在4℃4,000×g离心30分钟，并且将沉淀再重悬在100-200μl的样品缓冲液(0.05M Tris-HCl，pH6.8，0.1M DTT，2％ SDS，1％甘油，0.1％溴酚蓝)中。将所述混悬液通过使用100次3-s脉冲的超声处理分解，以释放总蛋白，并且通过在4℃ 16,000rpm离心30分钟消除细胞碎片而分离不可溶的级分。为了制备周质级分，将诱导的细胞进行渗透休克(Nossal和Heppel，J.Biol.Chem.(生物的化学杂志)241:3055-3062，1966)。将总蛋白的裂解物、可溶级分和周质级分使用16％ SDS-PAGE分离(Laemmli，Nature(自然)227:680-685，1970)，并且使用考马斯亮蓝(西格玛(Sigma)，美国)染色而显现。将从SDS-PAGE获得的凝胶转移到硝酸纤维素膜(罗氏(Roche)，美国)上。在用5％脱脂牛奶(Difco，美国)封闭后，将所述膜在含有0.4μg/ml抗-His6单克隆抗体(Santa Cruz Biotechnology，美国)的溶液中在37℃温育2小时。辣根过氧化物酶(HRP)缀合的兔抗-小鼠IgG(Santa Cruz Biotechnology，美国)用作二抗，并且3，3’-二氨基联苯胺四盐酸(DAB，西格玛，美国)用作染色底物。

结果，在本发明中检测的从前导序列OmpASP_1-3到OmpASP_1-23的所有OmpA信号肽成功地指导可溶周质Mefp1的表达(表1和图3)。还证实指导Mefp1以可溶形式表达的不是全长OmpASP₁-23，而是片段OmpASP_1-3，只是OmpASP_1-3是将Mefp1前体定向到周质所必需的。表达水平与前导序列的长度无关，并且在所述中间特征性疏水区(OmpASP_7-14)和以裂解位点结束的C-区(OmpASP_15-23)中没有发现存在分泌增强子的任何证据。分析了不同长度的OmpASP信号序列的pI值与Hopp和Woods等级疏水性。结果，从OmpASP_1-3到OmpASP_1-23的所有序列都具有相等的pI值，其为10.55，但是Hopp和Woods等级疏水性值不同(表2)。恒定的pI值是OmpASP片段作用为可溶蛋白表达的指导信号的最重要的因素。

实施例3：天然形式的黏附蛋白Mefp1的生产

为了生产具有其天然N-端的Mefp1，基于通过缩短的OmpASP(表1)进行的可溶表达的结果，本发明人使用pBluescriptIISK(+)-La-7×mefp1-Ra(图2)作为模板和合成的编码含有用于裂解所述C-端末端的因子Xa裂解位点的OmpASP_1-8-Xa-Mefp1的寡核苷酸作为正向引物进行PCR，以构建pET-22b(+)(ompASP_1-8-Xa-7×mefp1^*)(^*:Ra-6×His，Ra源自右侧衔接头；6×His源自His标记)克隆。通过如实施例2所述的转化和蛋白质印迹，检测所构建的载体的表达。

结果，这一克隆产生可溶的蛋白OmpASP_1-8-Xa-7×Mefp1^*。此外，具有天然氨基酸末端的7×Mefp1^*蛋白通过用因子Xa蛋白酶去除OmpASP_1-8-Xa序列而获得(图4)。

为了便利地修饰上述克隆的信号序列区，本发明人向所述信号序列中引入SmaI位点，以通过PCR构建pET-22b(+)(ompASP_1-8-SmaI-Xa-7×mefp1^*)克隆(表1)，从而保持目的基因盒的相同拷贝数，以对抗通常通过PCR从重复的mefp1模板获得的不同的mefp1拷贝。将得到的OmpASP_1-8-Sma I-Xa-7×Mefp1^*用因子Xa蛋白酶消化，以切除OmpASP_1-8-Sma I-Xa，并且获得的蛋白证实是具有天然氨基端的7×Mefp1^*。通过在pET-22b(+)(ompASP_1-8-Sma I-Xa-7×mefp1^*)的SmaI位点插入多达6个同源的氨基酸密码子，证实亲水氨基酸Arg和Lys稍微增加了表达水平。

实施例4：黏附蛋白Mefp1功能的研究

将从pET-22b(+)(ompASP_1-8-Xa-7×mefp1^*)克隆表达的Mefp1分离如下。将诱导的细胞在4℃ 4,000×g离心30分钟。去除上清，并且将沉淀洗涤并在-70℃冷冻或者悬浮在PBS(pH 8.0)中，然后使用超声仪超声处理。将裂解的细胞在4℃ 12,000×g离心30分钟。将上清用蛋白酶因子Xa(纽英伦(New England Biolabs)，美国)处理，以切除信号序列OmpASP_1-8-Xa，其然后通过0.45μm注射器滤器过滤。天然Mefp1蛋白(7×Mefp1^*)通过His标记纯化试剂盒(Qiagen，美国)按照供应商的指示进行纯化。将1ml Ni²⁺螯合树脂用5ml蒸馏水，3ml 50mM NiSO₄，和5ml 1×结合缓冲液(50mM NaCl，20mM Tris-HCl，5mM咪唑，pH 7.9)平衡。将所述上清上样到柱上，并且用10ml 1×结合缓冲液和6ml洗涤缓冲液(60mM咪唑，在PBS中)洗涤。目的蛋白用6ml洗脱缓冲液(1,000mM咪唑，在PBS中)洗脱，并且所洗脱的级分通过12％ SDS-PAGE进行分析。

研究了具有天然氨基末端的重组Mefp1的功能。将蛋白样品溶解在5％乙酸缓冲液中(Hwang等，Appl.Environ.Microbiol.(应用环境微生物学)70:3352-3359，2004)，并且使用酪氨酸酶(酪氨酸酶；西格玛，美国)将酪氨酸转化为DOPA。在黏附测定之前，将1mg/ml的蛋白用10U的酪氨酸酶在室温下摇动修饰6小时。将在5％乙酸缓冲液中的BSA用作非黏附蛋白对照。

结果，与用作对照的BSA相比，所述具有天然氨基端的重组Mefp1蛋白(7×Mefp1^*)表现出显著的黏附性(图5)。因此，所述通过本发明方法生产的可溶重组Mefp1蛋白证实具有正确的结构和原始的蛋白功能。

实施例5：筛选表达可溶牙鲆Hepcidin 1的分泌增强子

如上述实施例2，本发明人使用与用于表达Mefp1相同的方式作为与不同长度的OmpASP的融合蛋白而表达牙鲆Hepcidin I(Kim等，Biosci.Biotechnol.Biochem.(生物科学生物技术和生物化学)69，1411-1414，2005)，但是该融合蛋白不以可溶形式表达(表3)。牙鲆Hepcidin I的序列如下(SEQ.ID.NO:47):

His Ile Ser His Ile Ser Met Cys Arg Trp Cys Cys Asn Cys Cys Lys AlaLys Gly Cys Gly Pro Cys Cys Lys Phe。

本发明人假定在牙鲆Hepcidin I中存在的4个二硫键和一个两亲性结构域是所述融合蛋白OmpASP_tr-牙鲆Hepcidin I不能与具有普通结构的Mefp1(pI:10.03；疏水性:-0.05)一样有效地以可溶形式表达的原因。

为了筛选用于可溶蛋白表达的分泌增强子，本发明人构建了pET-22b(+)[ompASP_1-10-()-Xa-ofhepcidinI^**](表3)，其通过将所述信号序列修饰为OmpASP_1-10-()-Xa的形式而构建，其中所述信号序列的N-端区域被设定为OmpASP_1-10，并且在-()-中加入6个相同的影响pI值和疏水性/亲水性值的6个氨基酸的序列，所述氨基酸如精氨酸、赖氨酸、谷氨酸、天冬氨酸、酪氨酸、苯丙氨酸和色氨酸，以改变C-端-()-Xa区域(表4)，然后研究可溶牙鲆Hepcidin I的表达。结果，所述亲水氨基酸Arg和Lys增加了可溶Hepcidin I的表达水平，但是没有这些氨基酸的克隆表现出可溶Hepcidin I的微弱表达(图6)。上述结果表明，由于它们的高pI和亲水性，这些连接在所述信号肽部分的C-端的氨基酸精氨酸和赖氨酸作用为强的分泌增强子，而其它氨基酸作用为比较微弱的分泌增强子(图6和表4)。因此，由于所添加的氨基酸的高pI和亲水性，添加到所述修饰的信号序列的C-端的氨基酸增加了分泌效率。

表3

牙鲆Hepcidin I的引物、质粒克隆和表达

CAT被延长以保持NdeI位点。

斜体字母：表示不同大小的OmpASP片段的寡核苷酸。

粗体斜体字母：涉及pI和疏水性/亲水性平均值的氨基酸的寡核苷酸。

粗体字母：hepcidin I的寡核苷酸。

ofhepI:ofHepcidin I基因。

反向引物：与包含ofHepcidin I的C-端和Glu/Hind III/Sal I/Xho I区域的序列互补的寡核苷酸序列。

下划线粗体字母：因子Xa识别位点的寡核苷酸。

^**:Glu/Hind III/Sal I/Xho I-6×His(来源于反向引物设计的Glu/HindIII/Sal I/Xho I和来源于His标记的6×His。)。

缩写：T-总蛋白；S-可溶级分；和P-周质级分。

重组ofHep I^**的表达：“-”：无表达；“+/-”：弱表达；“+”：表达。

表4

在()区插入具有不同pI和疏水性/亲水性值的氨基酸的OmpASP_1-10-()-Xa信号序列的疏水性/亲水性值，和可溶牙鲆Hepcidin I在图6和表3中的pET22b(+)ompASP_1-10-()-Xa-ofHepI^**克隆中的表达

	插入的氨基酸	所插入氨基酸的pI值	所插入氨基酸的Hopp和Woods等级疏水性/亲水性	信号肽的形式	所得到的信号肽的Hopp和Woods等级疏水性/亲水性	在图6和表3中的Hepcidin I的表达
	插入的氨基酸	所插入氨基酸的pI值	所插入氨基酸的Hopp和Woods等级疏水性/亲水性	信号肽的形式	所得到的信号肽的Hopp和Woods等级疏水性/亲水性	在图6和表3中的Hepcidin I的表达	对照	-	-	-	OmpASP_1-10-()-Xa	-0.02	+/-
1	6×Arg	13.20	1.75	OmpASP_1-10-(6×Arg)-Xa	0.88	+	对照	-	-	-	OmpASP_1-10-()-Xa	-0.02	+/-
1	6×Arg	13.20	1.75	OmpASP_1-10-(6×Arg)-Xa	0.88	+	2	6×Lys	11.20	1.75	OmpASP_1-10-(6×Lys)-Xa	0.88	+
3	6×Glu	2.82	1.75	OmpASP_1-10-(6×Glu)-Xa	0.88	+/-	2	6×Lys	11.20	1.75	OmpASP_1-10-(6×Lys)-Xa	0.88	+
3	6×Glu	2.82	1.75	OmpASP_1-10-(6×Glu)-Xa	0.88	+/-	4	6×Asp	2.56	1.75	OmpASP_1-10-(6×Asp)-Xa	0.88	+/-
5	6×Tyr	5.55	-1.33	OmpASP_1-10-(6×Tyr)-Xa	-0.70	+/-	4	6×Asp	2.56	1.75	OmpASP_1-10-(6×Asp)-Xa	0.88	+/-
5	6×Tyr	5.55	-1.33	OmpASP_1-10-(6×Tyr)-Xa	-0.70	+/-	6	6×Phe	5.70	-1.45	OmpASP_1-10-(6×Phe)-Xa	-0.76	+/-
7	6×Trp	5.90	-1.98	OmpASP_1-10-(6×Trp)-Xa	-1.03	+/-	6	6×Phe	5.70	-1.45	OmpASP_1-10-(6×Phe)-Xa	-0.76	+/-

pI值和疏水性/亲水性(具有窗口大小的Hopp和Woods等级:6和阈值线:0.00)通过DNASIS^TM计算。Hopp和Woods等级疏水性/亲水性指数的‘+值’表示所插入的肽是亲水性的，而‘-值’表示疏水性。随着绝对值增加，疏水性/亲水性增加。重组ofHep I^**的表达：“+/-”；微弱表达，和‘+’；表达。

实施例6:依据信号序列的疏水性/亲水性的改变的牙鲆Hepcidin I的表达

为了研究牙鲆Hepcidin I关于所述修饰的信号序列的疏水性/亲水性的表达，本发明人检验了作为定向信号的OmpASP片段的N-端的作用。为了这样做，设计具有不同长度的各种OmpASP₍₎-6×Arg-Xa，并且检测它们相对应的克隆的表达。(表3和图7)。OmpASP_1-6-6×Arg-Xa，OmpASP_1-8-6×Arg-Xa，OmpASP_1-10-6×Arg-Xa，OmpASP_1-12-6×Arg-Xa和OmpASP_1-14-6×Arg-Xa的修饰的信号序列的Hopp和Woods疏水性/亲水性值分别为1.37，1.09，0.88，0.69和0.62。具有至少0.62的Hopp和Woods等级亲水性值的信号序列全部以可溶形式表达。所述信号序列越短，亲水性越高，并且观察到更多的可溶形式表达。上述具有大于0.62的平均亲水性的所有序列(OmpASP_1-6到OmpASP_1-14)定向可溶的重组Hepcidin I的周质表达。随着所述信号序列的长度减少，所述亲水性增加，并且可溶Hepcidin I的产量增加。将最短的信号序列(OmpASP_1-6；疏水性-0.03)与6×Arg-Xa序列(亲水性1.47)连接，构建得到的OmpASP_1-6-6×Arg-Xa(亲水性1.37)，其在亲水性模式中表现出延长的亲水区，缺少在N-端的疏水曲线，而其余信号序列(OmpASP_1-8，OmpASP_1-10，OmpASP_1-12，OmpASP_1-14)(疏水性，参见表2)比OmpASP_1-6更加疏水，并且所得到的信号序列在所述模式中具有疏水-亲水曲线的典型的跨膜样结构域的不对称双曲线。因此，这表明，为了具有表现出疏水-亲水曲线的跨膜样亲水性，所述信号序列的最优选的大小是至少OmpASP_1-8。

本发明人还研究了所述分泌增强子在所述修饰的信号序列的C-端的功能。将信号序列OmpASP_1-10设定为定向信号，并且将OmpASP_1-10-()-Xa设计成在-()-区包括具有不同长度的亲水氨基酸，并且测量其表达(表3和图8)。OmpASP_1-10-Xa，OmpASP_1-10-LysArg-Xa，OmpASP_1-10-4×Arg-Xa，OmpASP_1-10-6×Arg-Xa，OmpASP_1-10-8×Arg-Xa和OmpASP_1-10-10×Arg-Xa的修饰的信号序列的Hopp和Wood等级疏水性/亲水性值分别为-0.02，0.35，0.64，0.88，1.07和1.23。综上所述，具有≤0.35的Hopp和Woods等级亲水性值的信号序列太弱而不能定向可溶形式的表达，而具有≥0.64的Hopp和Woods等级亲水性值的信号序列能够定向可溶形式的表达(图8)。随着所述亲水氨基酸长度延长，亲水性和可溶表达增加。进一步研究了诱导可溶表达的每种信号序列的Hopp和Wood等级亲水性模式。结果，上述每种信号序列具有跨膜样亲水性模式，其在N-端表现出疏水曲线，并且在C-端表现出亲水曲线。

从上述结果判断出，由Hopp和Woods等级确定的信号序列区域的疏水性/亲水性值可以是牙鲆Hepcidin I可溶表达的分泌增强子的标准，并且由此按照Hopp和Wood等级的亲水性模式可以是分泌增强子的次级标准。

实施例7:在按照信号序列的Hopp和Woods等级的亲水性模式和牙鲆 Hepcidin I的表达之间的关系

在实施例6中证明了Hopp和Wood等级疏水性/亲水性值是关于牙鲆Hepcidin I以可溶形式表达的可靠标准。因此，研究了Hopp和Wood等级亲水性模式作为分泌增强子的标准的可用性。本发明人通过计算机程序使用ofHepcidin I作为对照模拟了牙鲆Hepcidin I的融合蛋白的亲水性模式。研究了ofHepcidinI，OmpASP_1-10-Xa-ofHepcidinI，OmpASP_1-10-LysArg-Xa-ofHepcidinI，和OmpASP_1-10-6×Arg-Xa-ofHepcidinI(图9)。结果，所模拟的牙鲆Hepcidin I具有中间两亲性结构域，而所模拟的OmpASP_1-10-Xa-ofHepcidinI和OmpASP_1-10-LysArg-ofHepcidinI具有相似大小的两个跨膜样结构域；其中一个来源于信号序列，另一个来源于牙鲆Hepcidin I的两亲性结构域。与所模拟的OmpASP_1-10-Xa-ofHepcidinI和OmpASP_1-10-LysArg-ofHepcidinI融合蛋白相对应的重组OmpASP_1-10-Xa-ofHepcidinI^**和OmpASP_1-10-LysArg-ofHepcidinI^**以非常低的水平以可溶形式表达(表3和图8)。然而，所模拟的OmpASP_1-10-6×Arg-Xa-ofHepcidinI的Hopp和Woods等级亲水性模式揭示其具有两个跨膜样结构域，一个在信号序列中，另一个在牙鲆Hepcidin I中。在所述信号序列区的跨膜样结构域比在所述牙鲆Hepcidin I中的两亲性结构域更大。相对应的克隆生产具有提高的可溶性的某种形式的OmpASP_1-10-6×Arg-Xa-ofHepcidinI^**(图8)，并且表达水平与跨膜样亲水性模式的大小一致。

因此，结论是可溶的目的蛋白在这种系统中的表达需要前导序列，以具有与比所述目的蛋白的两亲性结构域更大的跨膜样结构域相对应的亲水性模式。

本发明人最初假定由于牙鲆Hepcidin I具有4个二硫键和一个两亲性结构域，故当与OmpASP片段融合时，它将不如Mefp1那样有效地表达。然而，上述实验表明跨膜样结构域将是最大的障碍。当新生多肽链分泌到周质中时，所述周质是存在二硫化物异构酶如DsbA的氧化环境，形成二硫键(Bardwell等，Cell(细胞)67，581-589，1991；Kamitani等，EMBO J.11，57-62，1992)。作为潜在的折叠辅助的DsbA的共表达不影响活性目的蛋白的产量(Beck和Burtscher，Protein Expr.Purif.(蛋白质实验和纯化)5，192-197，1994)。因此，本发明人假定新生的Hepcidin I多肽分泌到周质中，没有形成任何二硫键，或者至少它没有遇到由二硫键引起的任何结构障碍。

工业适用性

如上述所阐释，本发明的方法通过防止产生不溶的沉淀和提高分泌到周质的效率而有效用于生产重组的异源蛋白。另外，通过使用强分泌增强子而增加膜渗透性，本发明的方法可以有效用于转导治疗性蛋白。

本领域技术人员应该理解，在上述描述中公开的观念和具体实施方案可以很容易的用作修改或设计实施本发明的相同目的的其它实施方案的基础。本领域的技术人员还应该理解这样等价的实施方案不背离在后附的权利要求中描述的本发明的精神和范围。

序列表

Claims

1.一种用于提高异源蛋白的分泌效率的表达载体，其包括由下列各项组成的基因构建体：(i)启动子，和(ii)与上述启动子可操作性连接的编码含有信号序列的N-区的多肽片段的多核苷酸。

2.按照权利要求1所述的表达载体，其中所述启动子是病毒启动子、原核启动子或真核启动子。

3.按照权利要求2所述的表达载体，其中所述病毒启动子选自由下列各项组成的组：巨细胞病毒(CMV)启动子，多瘤病毒启动子，禽痘病毒启动子，腺病毒启动子，牛乳头瘤病毒启动子，劳斯肉瘤病毒启动子，反转录病毒启动子，乙型肝炎病毒启动子，单纯疱疹病毒胸苷激酶启动子和猿猴病毒40(SV40)启动子。

4.按照权利要求2所述的表达载体，其中所述原核启动子选自由下列各项组成的组：T7启动子，SP6启动子，热激蛋白70启动子，β-内酰胺酶，乳糖启动子，碱性磷酸酶启动子，色氨酸启动子和tac启动子。

5.按照权利要求2所述的表达载体，其中所述真核启动子是酵母启动子、植物启动子或动物启动子。

6.按照权利要求5所述的表达载体，其中所述酵母启动子选自由下列各项组成的组：3-磷酸甘油酸激酶启动子，烯醇化酶启动子，甘油醛-3-磷酸脱氢酶启动子，己糖激酶启动子，丙酮酸二羧化酶启动子，果糖磷酸激酶启动子，葡萄糖-6-磷酸异构酶启动子，3-磷酸甘油酸变位酶启动子，丙酮酸激酶启动子，丙糖磷酸异构酶启动子，磷酸葡萄糖异构酶启动子，葡糖激酶启动子，醇脱氢酶2启动子，异细胞色素C启动子，酸性磷酸酶启动子，酿酒酵母(Saccharomyces cerevisiae)GAL1启动子，酿酒酵母GAL7启动子，酿酒酵母GAL10启动子和巴斯德毕赤酵母(Pichia pastoris)AOX1启动子。

7.按照权利要求5所述的表达载体，其中所述动物启动子选自由热激蛋白启动子、肌动蛋白前体启动子和免疫球蛋白启动子组成的组。

8.按照权利要求1所述的表达载体，其中所述信号序列是病毒、原核细胞或真核细胞的信号序列或前导序列。

9.按照权利要求1所述的表达载体，其中所述信号序列选自由下列各项组成的组：OmpA信号序列，CT-B(霍乱毒素亚基B)信号序列，LT II b-B(大肠杆菌(E.coli)热不稳定的肠毒素B亚基)信号序列，BAP(细菌碱性磷酸酶)信号序列，酵母羧肽酶Y信号序列，乳酸克鲁维酵母(Kluyveromyces lactis)杀伤毒素γ亚基信号序列，牛生长激素信号序列，流感神经氨酸酶信号-锚定，易位子-相关蛋白亚基α信号序列和双精氨酸易位(Tat)信号序列。

10.按照权利要求1所述的表达载体，其中所述含有N-区的多肽片段特征在于由包含所述信号序列的第1-第3个氨基酸的3-21个氨基酸组成的肽。

11.按照权利要求1所述的表达载体，其中所述含有N-区的多肽片段的pI值是至少8。

12.按照权利要求1所述的表达载体，其中编码含有N-区的多肽片段的多核苷酸另外包含可操作连接的分泌增强子。

13.按照权利要求12所述的表达载体，其中所述分泌增强子是编码由2-50个氨基酸组成的亲水肽的多核苷酸，所述氨基酸中至少60％是亲水氨基酸。

14.按照权利要求1所述的表达载体，其中还另外包括与编码含有所述N-区的多肽的核苷酸可操作性连接的编码蛋白酶识别位点的核苷酸。

15.按照权利要求14所述的表达载体，其中所述蛋白酶识别位点选自由独立的或以融合形式存在的因子Xa识别位点、肠激酶识别位点、genenase I识别位点和弗林蛋白酶识别位点组成的组。

16.按照权利要求12所述的表达载体，其中编码分泌增强子的核苷酸与编码蛋白酶识别位点的核苷酸可操作性地连接。

17.按照权利要求16所述的表达载体，其中所述蛋白酶识别位点选自由独立的或以融合形式存在的因子Xa识别位点、肠激酶识别位点、genenase I识别位点和弗林蛋白酶识别位点组成的组。

18.按照权利要求1或权利要求12所述的表达载体，其中还包括限制酶位点以引入编码异源蛋白的基因。

19.按照权利要求18所述的表达载体，其中所述异源蛋白不具有一个或多个跨膜结构域、跨膜样结构域或两亲性结构域。

20.按照权利要求18所述的表达载体，其中所述异源蛋白是不具有内部跨膜结构域、跨膜样结构域或两亲性结构域的Mefp1。

21.按照权利要求1所述的表达载体，其中所述基因构建体与编码异源蛋白的多核苷酸可操作性地连接。

22.一种用于提高异源蛋白的分泌效率的表达载体，其包括由下列各项组成的基因构建体：

(i)启动子，

(ii)与所述启动子可操作性连接的编码含有信号序列的N-区和中间特征性疏水区的疏水片段的多核苷酸，和

(iii)与上述多核苷酸可操作性连接的分泌增强子。

23.按照权利要求22所述的表达载体，其中所述启动子是病毒启动子、原核启动子或真核启动子。

24.按照权利要求23所述的表达载体，其中所述病毒启动子选自由下列各项组成的组：巨细胞病毒(CMV)启动子，多瘤病毒启动子，禽痘病毒启动子，腺病毒启动子，牛乳头瘤病毒启动子，劳斯肉瘤病毒启动子，反转录病毒启动子，乙型肝炎病毒启动子，单纯疱疹病毒胸苷激酶启动子和猿猴病毒40(SV40)启动子。

25.按照权利要求23所述的表达载体，其中所述原核启动子选自由下列各项组成的组：T7启动子，SP6启动子，热激蛋白70启动子，β-内酰胺酶，乳糖启动子，碱性磷酸酶启动子，色氨酸启动子和tac启动子。

26.按照权利要求23所述的表达载体，其中所述真核启动子是酵母启动子、植物启动子或动物启动子。

27.按照权利要求26所述的表达载体，其中所述酵母启动子选自由下列各项组成的组：3-磷酸甘油酸激酶启动子，烯醇化酶启动子，甘油醛-3-磷酸脱氢酶启动子，己糖激酶启动子，丙酮酸二羧化酶启动子，果糖磷酸激酶启动子，葡萄糖-6-磷酸异构酶启动子，3-磷酸甘油酸变位酶启动子，丙酮酸激酶启动子，丙糖磷酸异构酶启动子，磷酸葡萄糖异构酶启动子，葡糖激酶启动子，醇脱氢酶2启动子，异细胞色素C启动子，酸性磷酸酶启动子，酿酒酵母GAL1启动子，酿酒酵母GAL7启动子，酿酒酵母GAL10启动子和巴斯德毕赤酵母AOX1启动子。

28.按照权利要求26所述的表达载体，其中所述动物启动子选自由热激蛋白启动子、肌动蛋白前体启动子和免疫球蛋白启动子组成的组。

29.按照权利要求22所述的表达载体，其中所述信号序列是病毒、原核细胞或真核细胞的信号序列或前导序列。

30.按照权利要求22所述的表达载体，其中所述信号序列选自由下列各项组成的组：OmpA信号序列，CT-B(霍乱毒素亚基B)信号序列，LT II b-B(大肠杆菌热不稳定的肠毒素B亚基)信号序列，BAP(细菌碱性磷酸酶)信号序列，酵母羧肽酶Y信号序列，乳酸克鲁维酵母杀伤毒素γ亚基信号序列，牛生长激素信号序列，流感神经氨酸酶信号-锚定，易位子-相关蛋白亚基α信号序列和双精氨酸易位(Tat)信号序列。

31.按照权利要求22所述的表达载体，其中所述信号序列的疏水片段是由包含所述信号序列的第1-第6个氨基酸的6-21个氨基酸组成的肽。

32.按照权利要求22所述的表达载体，其中所述分泌增强子是编码由2-50个氨基酸组成的肽的多核苷酸，所述氨基酸中至少60％是亲水氨基酸。

33.按照权利要求22所述的表达载体，其中所述分泌增强子是编码具有至少10的pI值的亲水肽的多核苷酸。

34.按照权利要求32所述的表达载体，其中所述亲水氨基酸是赖氨酸或精氨酸。

35.按照权利要求22所述的表达载体，其中所述分泌增强子是编码具有6个亲水氨基酸重复的肽的多核苷酸。

36.按照权利要求22所述的表达载体，其中所述编码蛋白酶识别位点的多核苷酸还与编码所述分泌增强子的多核苷酸可操作性地连接。

37.按照权利要求22所述的表达载体，其中用于插入外源基因的限制酶位点还与所述编码分泌增强子的多核苷酸连接。

38.按照权利要求22所述的表达载体，其中所述编码异源蛋白的多核苷酸还与所述基因构建体可操作性地连接。

39.按照权利要求37或权利要求38所述的表达载体，其中所述异源蛋白是具有一个或多个内部跨膜结构域、跨膜样结构域或两亲性结构域的蛋白。

40.按照权利要求39所述的表达载体，其中所述具有一个或多个内部跨膜结构域、跨膜样结构域或两亲性结构域的蛋白是牙鲆(olive flounder)Hepcidin I。

41.一种通过用权利要求1到权利要求22中的一种表达载体转化宿主细胞制备的非人转化体。

42.一种用于提高异源蛋白的分泌效率的方法，其包括下述步骤：

1)分析异源蛋白的亲水性模式；

3)(a)当所述异源蛋白在步骤2)中被证实不包含跨膜结构域、跨膜样结构域或两亲性结构域时，构建由多核苷酸组成的基因构建体，所述多核苷酸编码这样的融合蛋白，其中所述异源蛋白与含有信号序列N-区的多肽片段组合，或者所述多核苷酸编码这样的融合蛋白，其中所述异源蛋白与含有信号序列N-区和蛋白酶识别位点的多肽片段组合，和

(b)当所述异源蛋白在步骤2)中被证实具有一个或多个跨膜结构域、跨膜样结构域或两亲性结构域时，构建由多核苷酸组成的基因构建体，所述多核苷酸编码这样的融合蛋白，所述融合蛋白顺序地含有包括信号序列N-区和中间特征性疏水区的疏水片段、分泌增强子和所述异源蛋白，或者所述多核苷酸编码这样的融合蛋白，所述融合蛋白顺序地包含含有信号序列N-区和中间特征性疏水区的疏水片段、分泌增强子、蛋白酶识别位点和所述异源蛋白；

6)培养步骤5)的转化体。

43.按照权利要求42所述的方法，其中所述异源蛋白是不可溶蛋白。

44.按照权利要求42所述的方法，其中所述亲水性模式通过计算机软件或基于网络的亲水性模式分析应用程序而进行分析。

45.按照权利要求44所述的方法，其中所述计算机软件选自由DNASIS^TM，Visual OMP，Lasergene，pDRAW32和NetSupport组成的组。

46.按照权利要求42所述的方法，其中所述分泌增强子是由2-50个氨基酸组成的多肽，其中所述氨基酸中至少60％是亲水氨基酸。

47.按照权利要求42所述的方法，其中所述分泌增强子是具有至少10的pI值的亲水肽。

48.按照权利要求46所述的方法，其中所述亲水氨基酸是赖氨酸或精氨酸。

49.一种用于制备融合异源蛋白的方法，其包括下述步骤：

1)分析异源蛋白的亲水性模式；

(b)当所述异源蛋白在步骤2)中被证实具有一个或多个跨膜结构域、跨膜样结构域和两亲性结构域时，构建由多核苷酸组成的基因构建体，所述多核苷酸编码这样的融合异源蛋白，所述融合异源蛋白顺序地包含含有信号序列N-区和中间特征性疏水区的疏水片段、分泌增强子、蛋白酶识别位点和异源蛋白；

6)培养步骤5)的转化体；和

7)从步骤6)的培养溶液分离融合的异源蛋白。

50.一种用于制备天然形式的异源蛋白的方法，其包括下述步骤：

1)分析异源蛋白的亲水性模式；

3)(a)当所述异源蛋白在步骤2)中被证实不包含跨膜结构域、跨膜样结构域或两亲性结构域时，构建由多核苷酸组成的基因构建体，所述多核苷酸编码这样的融合蛋白，其中所述异源蛋白与含有信号序列N-区的多肽片段和蛋白酶识别位点组合和

(b)当所述异源蛋白在步骤2)中被证实具有一个或多个跨膜结构域、跨膜样结构域和两亲性结构域时，构建由多核苷酸组成的基因构建体，所述多核苷酸编码这样的融合异源蛋白，所述融合异源蛋白顺序地含有信号序列N-区和中间特征性疏水区的疏水片段、分泌增强子，蛋白酶识别位点和异源蛋白；

6)培养步骤5)的转化体；

7)从步骤6)的培养溶液分离融合的异源蛋白；和

51.一种用于提高异源蛋白的分泌效率的方法，其包括下述步骤：

1)通过将编码异源蛋白的多核苷酸可操作性地连接到权利要求18的表达载体的限制酶位点上，而构建重组表达载体；

3)培养步骤2)的转化体。

52.一种提高异源蛋白的分泌效率的方法，所述方法包括下列步骤：

1)通过将编码异源蛋白的基因可操作性地连接到权利要求37的表达载体的限制酶位点上，而构建重组表达载体；

3)培养步骤2)的转化体。

53.一种用于制备天然形式的异源蛋白的方法，其包括下述步骤：

1)通过用权利要求38的表达载体转化宿主细胞而产生转化体；

2)培养步骤1)的转化体；

3)从所述培养溶液分离异源蛋白；和

4)通过用蛋白酶处理从所述分离的异源蛋白分离天然形式的异源蛋白。

54.按照权利要求52所述的方法，其中所述异源蛋白是靶向大脑的治疗性蛋白。

55.一种重组异源蛋白，其通过权利要求54的方法制备，具有促进穿过血脑屏障的跨膜区。

56.一种包含权利要求55的蛋白和药用载体的药物组合物。

57.按照权利要求56所述的药物组合物，其用于治疗脑病。

58.按照权利要求41所述的转化体，其中所述宿主细胞是原核细胞或真核细胞。

59.按照权利要求58所述的转化体，其中所述原核细胞选自由病毒、大肠杆菌和杆菌属(Bacillus)组成的组。

60.按照权利要求58所述的转化体，其中所述真核细胞选自由哺乳动物细胞、昆虫细胞、酵母细胞和植物细胞组成的组。

61.一种关于提高异源蛋白的分泌效率的分泌增强子的筛选方法，所述方法包括下述步骤：

1)构建包含基因构建体的表达载体，其中启动子、编码包含信号序列的N-区的多肽片段或包含信号序列的N-区和中间特征性疏水区的疏水片段的多核苷酸、用于插入分泌增强子候选物的限制酶位点和编码异源蛋白的多核苷酸彼此之间可操作地连接；

3)通过用步骤2)的重组表达载体转化宿主细胞而产生转化体；

4)培养步骤3)的转化体；

5)测量所述异源蛋白在用步骤1)的表达载体转化的转化体(对照)和步骤4)的转化体二者的培养溶液中的表达水平；和