CN102844437A

CN102844437A - 蛋白质和多肽的制备

Info

Publication number: CN102844437A
Application number: CN2010800655484A
Authority: CN
Inventors: 扬·约翰松; 安娜·里辛; 麦·赫德哈马尔; 谢斯廷·努德林
Original assignee: Spiber Technologies AB
Current assignee: Spiber Technologies AB
Priority date: 2010-03-18
Filing date: 2010-10-27
Publication date: 2012-12-26
Anticipated expiration: 2030-10-27
Also published as: AU2010348409A1; US9644012B2; CA2792476A1; EP2547771A1; EP3168229B1; JP2013521801A; JP5726282B2; ES2608673T3; US20170283474A1; DK3168229T3; US20130065278A1; CA2792476C; WO2011115538A1; AU2010348409B2; DK2547771T3; EP2547771B1; EP3168229A1; EP2547771A4; EP2547771B8; US10604550B2

Abstract

一种制备期望的非拖丝蛋白的蛋白质或多肽的方法包含以下步骤：在合适的宿主中表达融合蛋白，获得包含该融合蛋白的混合物，并任选地分离该融合蛋白。该融合蛋白包含衍生自蜘蛛丝蛋白的N端(NT)片段的至少一个溶解度增强部分。其还包含是期望的非拖丝蛋白的蛋白质或多肽的至少一个部分。每个溶解度增强部分与所述期望的蛋白质或多肽部分直接或间接连接。

Description

蛋白质和多肽的制备

发明的技术领域

本发明涉及制备蛋白质和多肽，且更具体地涉及制备蜘蛛丝蛋白(拖丝蛋白)和其他非拖丝蛋白的蛋白质和多肽的领域。本发明提供了制备期望的蛋白质的方法，该期望的蛋白质可以是拖丝蛋白的蛋白质/多肽或非拖丝蛋白的蛋白质/多肽。还提供了用于制备期望的蛋白质和多肽的新型融合蛋白中间体以及编码这些中间体的多核酸(polynucleic acid)分子。

发明背景

由DNA制备蛋白质和多肽可在多种宿主中实现，但常见的问题是不溶性蛋白质/多肽聚集体的形成。这可严重地妨碍或甚至阻止功能性蛋白质/多肽的产生。针对该问题的一个解决方案是将期望的蛋白质或多肽与提供所需要的溶解度的蛋白质或多肽表达成融合蛋白。该融合蛋白可被裂解，从而分离期望的蛋白质。

对于低溶解度蛋白质和多肽例如膜相关蛋白质和多肽，该问题通常加重。例如，肺表面活性蛋白C(SP-C；表6)是由肺泡II型细胞产生的跨膜蛋白并且是防止肺泡在呼气结束时萎陷所需要的表面活性物质的成分。新生儿经常因表面活性物质的量不足而患呼吸窘迫。如今，用从动物的肺部提取的表面活性物质制剂治疗该病症。SP-C-33是SP-C的变体，其中跨膜螺旋中的残基(通常主要是缬氨酸)被换成亮氨酸。SP-C-33保留了天然SP-C的功能，包括在膜中的适当插入，但是不太易于聚集且因此大量生产用于开发合成的表面活性物质制剂是可行的。因为迄今为止由DNA制备SP-C-33是不可能的，所以如今通过化学合成来制造。

当由重组DNA表达时遇到困难的蛋白质和多肽的其他实例是Aβ-肽、IAPP、PrP、α-突触核蛋白、降钙素、催乳素、半胱氨酸蛋白酶抑制剂、ATF和肌动蛋白；SP-B、α-防卫素和β-防卫素；A-H类载脂蛋白；LL-37、SP-C、SP-C33Leu、Brichos、GFP、神经丝抑蛋白；激素，包括EPO和GH，及生长因子包括IGF-I和IGF-II；亲和素和链霉亲和素；和蛋白酶3C。

发明概述

本发明的目的是提供用于制备蛋白质和多肽，且特别是非拖丝蛋白的蛋白质和多肽的新型手段和方法。

提供用于制备在水中具有低的溶解度的蛋白质和多肽，且特别是非拖丝蛋白的蛋白质和多肽，例如当由重组DNA产生时易于聚集的蛋白质和多肽、膜蛋白和多肽及淀粉样形态(amyloid-forming)的蛋白质和多肽的新型手段和方法也是本发明的目的。

本发明的另一个目的是提供用于制备蛋白质或多肽药物及药靶的替代手段和方法。

本发明的目的是提供用于制备含二硫键的蛋白质和多肽的新型手段和方法。

提供用于制备载脂蛋白的新型手段和方法也是本发明的目的。

为了这些目的和从以下说明书中将明显的其他目的，本发明提供了根据第一方面的在生产期望的蛋白质或多肽的方法中有用的融合蛋白。融合蛋白本身可能是有用的，或其可被裂解以获得分离形式的期望的蛋白质或多肽。根据本发明的融合蛋白包含(i)衍生自蜘蛛丝蛋白的N端(NT)片段的至少一个溶解度增强部分；和(ii)是期望的蛋白质或多肽的至少一个部分；其中每个溶解度增强部分与期望的蛋白质或多肽部分直接或间接连接。

在融合蛋白的某些实施方式中，每个溶解度增强部分与SEQ ID NO 6具有至少80％的同一性或与SEQ ID NO 8具有至少50％的同一性。在融合蛋白的特定实施方式中，每个溶解度增强部分包含100至160个氨基酸残基。

在一个实施方式中，融合蛋白受制于如下条件：当融合蛋白包含衍生自蜘蛛丝蛋白的N端(NT)片段的单一溶解度增强部分时，则期望的蛋白质或多肽是非拖丝蛋白的蛋白质或多肽。

在优选的实施方式中，期望的蛋白质或多肽是非拖丝蛋白的蛋白质或多肽。在一些实施方式中，期望的蛋白质或多肽与SEQ ID NO：6-10中的任何一个具有小于30％的同一性。

在某些实施方式中，融合蛋白包含至少两个溶解度增强部分，所述溶解度增强部分的每一个衍生自蜘蛛丝蛋白的N端(NT)片段。在特定实施方式中，融合蛋白包含至少两个连续的溶解度增强部分，所述溶解度增强部分的每一个衍生自蜘蛛丝蛋白的N端(NT)片段。

在融合蛋白的一些实施方式中，至少一个溶解度增强部分与至少一个期望的蛋白质或多肽部分的氨基末端或羧基末端直接或间接连接。在特定实施方式中，至少一个溶解度增强部分构成融合蛋白的氨基末端和/或羧基末端。

在一个实施方式中，融合蛋白还包含(iii)设置在至少一个期望的蛋白质或多肽部分与至少一个溶解度增强部分之间的至少一个裂解位点。

在融合蛋白的某些实施方式中，期望的蛋白质或多肽衍生自海绵动物(sponges)、栉水母(comb jellies)、水母(jellyfishes)、珊瑚(corals)、海葵(anemones)、扁虫(flatworms)、轮虫(rotifers)、蛔虫(roundworms)、纽虫(ribbon worms)、蛤(clams)、蜗牛(snails)、章鱼(octopuses)、节肢虫(segmented worm)、甲壳动物(crustaceans)、昆虫、苔藓动物(bryozoans)、腕足动物(brachiopods)、帚虫类(phoronids)、海星(seastars)、海胆(sea urchins)、被囊动物(tunicates)、文昌鱼(lancelets)、包括人类的脊椎动物、植物、真菌、酵母、细菌、古细菌或病毒或是人工蛋白质或多肽。在特定实施方式中、期望的蛋白质或多肽衍生自软体动物、昆虫、包括人类的脊椎动物、植物、真菌、酵母、细菌、古细菌或病毒或是人工蛋白质或多肽。在另外的特定实施方式中，期望的蛋白质或多肽衍生自包括人类的脊椎动物、植物、真菌、酵母、细菌、古细菌或病毒或是人工蛋白质或多肽。

在融合蛋白的一些实施方式中，期望的蛋白质或多肽选自由淀粉样形态的蛋白质和多肽、含二硫键的蛋白质和多肽、载脂蛋白、膜蛋白和多肽、蛋白质和多肽药物与药靶、易于聚集的蛋白质和多肽、及蛋白酶组成的组。在融合蛋白的特定实施方式中，期望的蛋白质或多肽选自由以下组成的组：Aβ-肽、IAPP、PrP、α-突触核蛋白、降钙素、催乳素、半胱氨酸蛋白酶抑制剂、ATF和肌动蛋白；SP-B、α-防卫素和β-防卫素；A-H类载脂蛋白；LL-37、SP-C、SP-C33、SP-C33Leu、Brichos、GFP、神经丝抑蛋白；激素，包括EPO和GH，及生长因子，包括IGF-I和IGF-II；亲和素和链霉亲和素；和蛋白酶3C。

融合蛋白的优选实施方式选自由SEQ ID NO 26、28、30、34、37、39、42和47和与这些蛋白质中的任何一种具有至少80％，优选地至少90％，更优选地至少95％的同一性的蛋白质组成的组。

根据特定的方面，期望的蛋白质或多肽是拖丝蛋白的蛋白质或多肽。优选的期望的拖丝蛋白的蛋白质包含：70至300个氨基酸残基的重复片段，该片段衍生自蜘蛛丝蛋白的重复片段；和70至120个氨基酸残基的C端片段，该片段衍生自蜘蛛丝蛋白的C端片段，和任选地100至160个氨基酸残基的N端片段，该片段衍生自蜘蛛丝蛋白的N端片段。

另外优选的期望拖丝蛋白的蛋白质选自由式REP-CT和NT-REP-CT定义的蛋白质的组，其中NT是具有100至160个氨基酸残基的蛋白质片段，该片段是衍生自蜘蛛丝蛋白的N端片段；REP是具有70至300个氨基酸残基的蛋白质片段，其中所述片段选自L(AG)_nL、L(AG)_nAL、L(GA)_nL、L(GA)_nGL的组，其中n是从2至10的整数；每个单独的A区段是8至18个氨基酸残基的氨基酸序列，其中这些氨基酸残基中的0至3个不是Ala，且剩余的氨基酸残基是Ala；每个单独的G区段是12至30个氨基酸残基的氨基酸序列，其中至少40％的氨基酸残基是Gly；且每个单独的L区段是0至20个氨基酸残基的接头氨基酸序列；且CT是具有70至120个氨基酸残基的蛋白质片段，该片段是衍生自蜘蛛丝蛋白的C端片段。

根据另一方面，本发明提供了编码根据本发明的融合蛋白的分离的多核酸。分离的多核酸的优选实施方式选自由编码选自由SEQ ID NO 26、28、30、34、37、39、42和47组成的组的融合蛋白和与这些蛋白质中的任何一种具有至少80％，优选地至少90％，更优选地至少95％的同一性的蛋白质的核酸组成的组；以及由SEQ ID NO 27、29、31、38、40、43和48组成的核酸的组。

根据一个方面，本发明提供了衍生自蜘蛛丝蛋白的N端(NT)片段的至少一个部分作为融合蛋白中的溶解度增强部分用于制备期望的蛋白质或多肽的新型用途。在优选的实施方式中，期望的蛋白质或多肽是非拖丝蛋白的蛋白质或多肽。在一个实施方式中，融合蛋白受制于如下条件：当融合蛋白包含衍生自蜘蛛丝蛋白的N端(NT)片段的单一溶解度增强部分时，则期望的蛋白质或多肽是非拖丝蛋白的蛋白质或多肽。在特定的实施方式中，期望的蛋白质或多肽是拖丝蛋白的蛋白质或多肽。

根据另一方面，本发明提供了制备融合蛋白的方法，所述方法包括以下步骤：a)在合适的宿主中表达根据本发明的融合蛋白；和b)获得包含该融合蛋白的混合物并任选地分离该融合蛋白。

根据有关的方面，本发明提供了制备期望的蛋白质或多肽的方法，该方法包括以下步骤：a)在合适的宿主中表达根据本发明的融合蛋白；和b)获得包含该融合蛋白或多肽的混合物，并任选地分离该融合蛋白或多肽。在某些实施方式中，该方法还包括以下步骤：c)裂解融合蛋白以提供期望的蛋白质或多肽；和d)分离期望的蛋白质或多肽；其中所述融合蛋白包含：(iii)设置在至少一个期望的蛋白质或多肽部分与至少一个溶解度增强部分之间的至少一个裂解位点。

在这些方法的某些实施方式中，步骤b)还包括在具有固定的NT部分的亲和介质上和/或在阴离子交换介质上纯化融合蛋白。在特定实施方式中，通过结合6.3或更低的pH下的具有固定的NT部分的亲和介质，然后用期望的离解介质从亲和介质上离解，进行融合蛋白在亲和介质上的纯化。在另外的特定实施方式中，离解介质具有6.4或更高的pH、4.1或更低的pH和/或具有高的离子强度。在一些实施方式中，通过结合6.4或更高的pH下的阴离子交换介质，然后用具有高离子强度的离解介质从阴离子交换介质上离解，进行融合蛋白在阴离子交换介质上的纯化。在这些方法的一些实施方式中，步骤b)中的融合蛋白的纯化发生在柱中、具有官能化表面的磁珠上或具有官能化表面的滤器上。

所附序列列表

SEQ ID NO

1 4Rep

2 4RepCT

3 NT4Rep

4 NT5Rep

5 NT4RepCTHis

6 NT

7 CT

8 共有NT序列

9 共有CT序列

10 来自Euprosthenops australis MaSp1的重复序列

11 共有G区段序列1

12 共有G区段序列2

13 共有G区段序列3

14 NT4Rep(DNA)

15 NT4RepCT(DNA)

16 NT5Rep(DNA)

17 NT4RepCTHis 2

18 NT4RepCTHis 2(DNA)

19 ZbasicNT4RepCT

20 NT4RepCT

21 HisTrxHisThrNT4RepCT

22 NT4RepCT 2

23 HisNTNT4RepCT

24 HisNTNT4RepCT(DNA)

25 NT8RepCT

26 HisNTMetSP-C33Leu

27 HisNTMetSP-C33Leu(DNA)

28 HisNTNTMetSP-C33Leu

29 HisNTNTMetSP-C33Leu(DNA)

30 HisNTNTMetLL37

31 HisNTNTMetLL37(DNA)

32 NTHis

33 HisNTNT8RepCT

34 HisNTNTBrichos

35 HisTrxHisSP-C33Leu

36 HisTrxHisSP-C33Leu(DNA)

37 HisTrxNtSP-C33Leu

38 HisTrxNtSP-C33Leu(DNA)

39 2HisNtNtQGBrichos

40 2HisNtNtQGBrichos(DNA)

41 Brichos

42 2HisNtNtQGGFP

43 2HisNtNtQGGFP(DNA)

44 GFP(绿色荧光蛋白)

45 ZbGFP

46 HisABPGFP

47 2HisNtNtQGNS

48 2HisNtNtQGNS(DNA)

49 NS(神经丝抑蛋白)

附图简述

图1示出了拖丝蛋白N端结构域的序列比对。

图2示出了拖丝蛋白C端结构域的序列比对。

图3示出了融合蛋白的电泳凝胶。

图4示出了从融合蛋白获得的SP-C33Leu蛋白的电泳凝胶。

图5示出了包含从融合蛋白获得的SP-C33Leu的表面活性物质悬浮液的体外表面活性。

图6示出了SP-C33Leu融合蛋白的电泳凝胶。

图7示出了Brichos融合蛋白的电泳凝胶。

图8示出了GFP融合蛋白和从该融合蛋白获得的GFP的电泳凝胶。

图9示出了神经丝抑蛋白融合蛋白和从该融合蛋白获得的神经丝抑蛋白的电泳凝胶。

发明详述

本发明涉及蛋白质和多肽，且特别是非拖丝蛋白的蛋白质和多肽的制备。取决于该制备的目的，终产物可变化。例如可能期望获得插入在脂质膜中、在溶液中或与其他生物分子结合的蛋白质或多肽。还应认识到还可能非常期望获得作为融合蛋白的一部分的期望蛋白质或多肽，该融合蛋白可提供用于纯化和检测的合适工具和/或提供期望的性质例如稳定性和溶解度。

本发明总体上基于对蜘蛛丝蛋白的N端(NT)片段在由重组DNA产生的融合蛋白中作为溶解度增强部分的有用性的洞察。因此，本发明提供了根据第一方面的融合蛋白，其包含(i)衍生自蜘蛛丝蛋白的NT片段的至少一个溶解度增强部分；和(ii)是期望的蛋白质或多肽的至少一个部分。在优选的实施方式中，融合蛋白由以下组成：(i)衍生自蜘蛛丝蛋白的NT片段的至少一个溶解度增强部分；和(ii)是期望的蛋白质或多肽的至少一个部分，任选地包括本文公开的其他优选的特征，例如，溶解度增强部分与期望的蛋白质或多肽之间的接头肽和/或裂解位点。在实验中，已在大肠杆菌(E.coli)中实现了不同融合蛋白的令人惊奇地高的收率。融合蛋白本身作为分离的形式可能是有用的，例如，用于以可溶解形式研究本来聚集或可溶性差的蛋白质，或用在与X-射线晶体学有关的结晶作用中。融合蛋白还可被裂解以释放期望的蛋白质。

术语“融合蛋白”此处指通过由重组核酸，即通过组合正常情况下不会一起出现的两个或更多个核酸序列而人工创造的DNA或RNA表达而制备的蛋白质(遗传工程)。根据本发明的融合蛋白是重组蛋白，且因此其不同于天然存在的蛋白质。特别地，因为野生型拖丝蛋白不是由以上列出的重组核酸表达的，所以其不是根据本发明的融合蛋白。组合的核酸序列编码具有特定功能特性的不同蛋白质、部分蛋白质或多肽。所得的融合蛋白或重组融合蛋白是具有衍生自原始蛋白质、部分蛋白质或多肽中的每一种的功能特性的单一蛋白质。

在某些实施方式中，根据本发明的任何蛋白和相应的基因是嵌合的，即，该蛋白质/基因片段衍生自至少两种不同的种类。溶解度增强部分衍生自蜘蛛丝蛋白的N端片段。根据该方面，优选期望的蛋白质或多肽是非拖丝蛋白的蛋白质。这意味着期望的蛋白质或多肽不衍生自蜘蛛丝蛋白的C端片段、重复片段或N端片段。

根据本发明的融合蛋白还可包含一个或多个接头肽。接头肽可设置在溶解度增强部分与期望的蛋白质或多肽部分之间，或可设置在溶解度增强部分和期望的蛋白质或多肽部分的任何一端。如果融合蛋白包含两个或更多个溶解度增强部分，接头肽还可设置在两个溶解度增强部分之间。接头可在融合蛋白的功能单元之间提供间隔区，而且还可构成用于鉴定和纯化该融合蛋白的工具，例如，His和/或Trx标签。如果融合蛋白包含用于鉴定和纯化融合蛋白的两个或更多个接头肽，优选它们被间隔序列隔开，例如His₆-间隔区-His₆-。接头还可构成将融合蛋白指导到膜和/或致使融合蛋白从宿主细胞分泌到周围介质中的信号肽，例如信号识别颗粒。融合蛋白还可在其氨基酸序列中包括允许裂解并去除接头和/或一个或多个溶解度增强部分的裂解位点。各种裂解位点是本领域技术人员已知的，例如，针对化学剂的裂解位点，例如Met残基之后的CNBr裂解位点和Asn-Gly残基之间的羟胺裂解位点，针对蛋白酶例如凝血酶或蛋白酶3C的裂解位点，和自我剪接序列，例如内含肽(intein)自我剪接序列。

每个溶解度增强部分与期望的蛋白质或多肽部分直接或间接连接。直接连接指两个部分之间的直接共价结合而无间插序列例如接头。间接连接也是指两个部分通过共价键连接，但是存在间插序列，例如接头和/或一个或多个另外的溶解度增强部分。

至少一个溶解度增强部分可设置在期望的蛋白质或多肽的任何一端，即，设置在C端或设置在N端。优选至少一个溶解度增强部分设置在期望的蛋白质或多肽的N末端。如果融合蛋白包含用于鉴定和纯化融合蛋白的一个或多个接头肽，例如，His或Trx标签，优选地其被设置在融合蛋白的N末端。至少一个溶解度增强部分还可整合到期望的蛋白质或多肽内，例如在期望的蛋白质的结构域或部分之间。在优选的实施方式中，至少一个溶解度增强部分构成融合蛋白的N末端和/或C末端，即，无接头肽或其他序列存在于溶解度增强部分的末端。根据本发明的典型融合蛋白可包含1-6个，例如1-4个，例如1-2个溶解度增强部分。

在优选的实施方式中，融合蛋白包含至少两个溶解度增强部分，所述溶解度增强部分的每一个衍生自蜘蛛丝蛋白的N端(NT)片段。溶解度增强部分，优选地两个溶解度增强部分可连续地设置在期望的蛋白质或多肽的任何一端，即，设置在C端或设置在N端。连续设置的溶解度增强部分还可整合到期望的蛋白质或多肽内，例如在期望的蛋白质的结构域或部分之间。溶解度增强部分还可不连续地设置，位于期望的蛋白质或多肽部分的每个末端，即设置在C端和N端，或位于期望的蛋白质或多肽的一个末端和整合到期望的蛋白质或多肽内。根据本发明的典型的优选融合蛋白可包含2-6个，例如2-4个溶解度增强部分。

在优选的实施方式中，根据本发明的融合蛋白具有设置在至少一个期望的蛋白质或多肽部分与至少一个溶解度增强部分之间的至少一个裂解位点。这允许融合蛋白的裂解和期望的蛋白质的纯化。然而应注意可能期望获得作为融合蛋白的一部分的期望的蛋白质或多肽，该融合蛋白可提供用于纯化和检测的合适工具和/或提供期望的性质例如稳定性和溶解度。在这种情况下，可省略裂解位点，或可包括裂解位点而省略裂解步骤。

优选的融合蛋白具有设置在N端的溶解度增强部分通过1-30个氨基酸残基，例如1-10个氨基酸残基的接头肽偶联到设置在C端的期望的蛋白质或多肽的形式。接头肽可包含裂解位点。任选地，融合蛋白具有可包含纯化标签例如His标签和裂解位点的N端或C端接头肽。

另一种优选的融合蛋白具有设置在N端的溶解度增强部分直接偶联到设置在C端的期望的蛋白质或多肽的形式。任选地，融合蛋白具有可包含纯化标签例如His标签和裂解位点的N端或C端接头肽。

一种优选的融合蛋白具有两个连续的设置在N端的溶解度增强部分通过1-30个氨基酸残基，例如1-10个氨基酸残基的接头肽偶联到设置在C端的期望的蛋白质或多肽的形式。接头肽可包含裂解位点。任选地，融合蛋白具有可包含纯化标签例如His标签和裂解位点的N端或C端接头肽。

另一种优选的融合蛋白具有两个连续的设置在N端的溶解度增强部分直接偶联到设置在C端的期望的蛋白质或多肽的形式。任选地，融合蛋白具有可包含纯化标签例如His标签和裂解位点的N端或C端接头肽。

溶解度增强部分衍生自蜘蛛丝蛋白或拖丝蛋白的NT片段。虽然实例必然地涉及特定的NT片段，在这种情况下，为衍生自来自Euprosthenopsaustralis的主要拖丝蛋白1(major spidroin 1，MaSp1)，但认为本文公开的方法适用于任何相似的蛋白质部分。术语“拖丝蛋白(spidroin)”和“蜘蛛丝蛋白(spider silk protein)”遍及说明书互换地使用并包括所有已知的蜘蛛丝蛋白，包括通常缩写为“MaSp”或在十字园蛛(Araneus diadematus)的情形中缩写为“ADF”的大壶状蜘蛛丝蛋白(major ampullate spider silkprotein)。这些大壶状蜘蛛丝蛋白通常具有1和2两种类型。此外，这些术语包括如所附权利要求和逐条列举的实施方式中定义的根据本发明的新型NT蛋白质片段和与已知的蜘蛛丝NT蛋白质片段具有高度的同一性和/或相似性的其他非天然蛋白质。

溶解度增强部分与蜘蛛丝蛋白的N端(NT)氨基酸序列具有高度的相似性。如图1所示，在多个物种和蜘蛛丝蛋白，包括MaSp1和MaSp2之间，该氨基酸序列相当保守。在图1中，比对了以GenBank登记条目表示(如果合适的话)的下列拖丝蛋白NT片段：

表1-拖丝蛋白NT片段

仅示出了对于每个序列的对应于N端结构域的部分，省略了信号肽。Nc flag和Nim flag是根据Rising A.等人Biomacromolecules 7，3120-3124(2006)翻译和编辑的。

只要溶解度增强部分未完全缺失，哪种特定的溶解度增强部分存在于根据本发明的融合蛋白中不是关键的。因此，根据本发明的溶解度增强部分可选自图1中示出的氨基酸序列或具有高度相似性的序列中的任何一种。各种各样的溶解度增强序列可用于根据本发明的融合蛋白中。基于图1的同源序列，下列序列构成共有溶解度增强氨基酸序列：QANTPWSSPNLADAFINSF(M/L)SA(A/I)SSSGAFSADQLDDMSTIG(D/N/Q)TLMSAMD(N/S/K)MGRSG(K/R)STKSKLQALNMAFASSMAEIAAAESGG(G/Q)SVGVKTNAISDALSSAFYQTTGSVNPQFV(N/S)EIRSLI(G/N)M(F/L)(A/S)QASANEV(SEQ ID NO 8)。

根据本发明的溶解度增强部分的序列与基于图1的氨基酸序列的共有氨基酸序列SEQ ID NO 8具有至少50％的同一性，优选地至少60％的同一性。在优选的实施方式中，根据本发明的溶解度增强部分的序列与共有氨基酸序列SEQ ID NO 8具有至少65％的同一性，优选地至少70％的同一性。此外，在优选的实施方式中，根据本发明的溶解度增强部分与共有氨基酸序列SEQ ID NO 8具有70％，优选80％的相似性。

根据本发明的代表性的溶解度增强部分是Euprosthenops australis序列SEQ ID NO 6。根据本发明的优选实施方式，溶解度增强部分与SEQ IDNO 6或图1中的任何单独的氨基酸序列具有至少80％的同一性。在本发明的优选实施方式中，溶解度增强部分与SEQ ID NO 6或图1中任何单独的氨基酸序列具有至少90％，例如至少95％的同一性。在本发明的优选实施方式中，溶解度增强部分与SEQ ID NO 6或图1中任何单独的氨基酸序列，特别是与Ea MaSp1相同。

如下计算遍布说明书和所附权利要求使用的术语“％同一性”。使用CLUSTAL W算法(Thompson，J.D.，Higgins，D.G.和Gibson，T.J.，NucleicAcids Research，22：4673-4680(1994))比对查询序列与靶序列。在对应所比对的序列中的最短序列的窗口上进行对比。对比每个位置的氨基酸残基，并将在靶序列中具有相同对应位置的查询序列中的位置的百分比报告为％同一性。

按对“％同一性”所描述的计算遍布说明书和所附权利要求使用的术语“％相似性”，但以下除外：疏水残基Ala、Val、Phe、Pro、Leu、Ile、Trp、Met和Cys是相似的，碱性残基Lys、Arg和His是相似的；酸性残基Glu和Asp是相似的；且亲水性的、不带电荷的残基Gln、Asn、Ser、Thr和Tyr是相似的之外。在该上下文中剩余的天然氨基酸Gly不与任何其他氨基酸相似。

遍布本说明书，根据本发明的替代实施方式实现了相应百分比的相似性，而不是指定百分比的同一性。其他替代实施方式实现了指定百分比的同一性以及选自对于每个序列的优选百分比的同一性的组的另一个较高百分比的相似性。例如，某序列可能与另一序列70％相似；或其可能与另一序列70％相同；或其可能与另一序列70％相同且90％相似。

溶解度增强部分包含100至160个氨基酸残基。优选溶解度增强部分包含至少100，或多于110，优选地多于120个氨基酸残基。还优选溶解度增强部分包含至多160，或少于140个氨基酸残基。典型的溶解度增强部分包含约130-140个氨基酸残基。

在本发明的某些实施方式中，期望的蛋白质或多肽是拖丝蛋白的蛋白质或多肽。根据本发明的期望的拖丝蛋白的蛋白质或多肽的序列与本文公开的任一种拖丝蛋白氨基酸序列具有至少50％的同一性，例如至少60％的同一性，优选地至少70％的同一性。在优选的实施方式中，根据本发明的期望的拖丝蛋白的蛋白质或多肽的序列与本文公开的任一种拖丝蛋白氨基酸序列具有至少80％的同一性，优选地至少90％的同一性。

在优选的实施方式中，期望的拖丝蛋白的蛋白质包含：70至300个氨基酸残基的重复片段，其衍生自蜘蛛丝蛋白的重复片段；和70至120个氨基酸残基的C端片段，该片段衍生自蜘蛛丝蛋白的C端片段。任选地，期望的拖丝蛋白的蛋白质包含衍生自蜘蛛丝蛋白的N端片段的100至160个氨基酸残基的N端片段。期望的拖丝蛋白的蛋白质由170至600个氨基酸残基，优选地280至600个氨基酸残基，例如300至400个氨基酸残基，更优选地340至380个氨基酸残基组成。小的尺寸是有利的，因为较长的蜘蛛丝蛋白往往形成无定形的聚集体，要求使用苛刻溶剂(harshsolvent)来增溶和聚合。蛋白质片段通常经肽键共价偶联。

在特定的优选实施方式中，期望的拖丝蛋白的蛋白质选自由式NT₂-REP-CT(或NT-NT-REP-CT)、NT-REP-CT和REP-CT定义的蛋白质的组。

NT片段与蜘蛛丝蛋白的N端氨基酸序列具有高度的相似性。如图1所示，该氨基酸序列在多个物种和蜘蛛丝蛋白，包括MaSp1和MaSp2之间相当保守，再参见表1：

哪种特定的NT片段存在于根据本发明的期望的拖丝蛋白的蛋白质中不是关键的。因此，根据本发明的NT片段可选自图1示出的氨基酸序列或具有高度相似性的序列中的任何一种。各种各样的N端序列可用于根据本发明的期望的拖丝蛋白的蛋白质中。基于图1的同源序列，下列序列构成共有NT氨基酸序列：QANTPWSSPNLADAFINSF(M/L)SA(A/I)SSSGAFSADQLDDMSTIG(D/N/Q)TLMSAMD(N/S/K)MGRSG(K/R)STKSKLQALNMAFASSMAEIAAAESGG(G/Q)SVGVKTNAISDALSSAFYQTTGSVNPQFV(N/S)EIRSLI(G/N)M(F/L)(A/S)QASANEV(SEQ ID NO：8)。

根据本发明的NT片段的序列与基于图1的氨基酸序列的共有氨基酸序列SEQ ID NO：8具有至少50％的同一性，优选地至少60％的同一性。在优选的实施方式中，根据本发明的NT片段的序列与共有氨基酸序列SEQ ID NO：8具有至少65％的同一性，优选地至少70％的同一性。此外，在优选的实施方式中，根据本发明的NT片段与共有氨基酸序列SEQ IDNO：8具有70％，优选地80％的相似性。

根据本发明的代表性的NT片段是Euprosthenops australis序列SEQID NO：6。根据本发明的优选实施方式，NT片段与SEQ ID NO：6或图1中任何单独的氨基酸序列具有至少80％的同一性。在本发明的优选实施方式中，NT片段与SEQ ID NO：6或图1中任何单独的氨基酸序列具有至少90％，例如至少95％的同一性。在本发明的优选实施方式中，NT片段与SEQ ID NO：6或图1中任何单独的氨基酸序列，特别是与Ea MaSp1相同。

NT片段包含100至160个氨基酸残基。优选NT片段包含至少100，或多于110，优选地多于120个氨基酸残基。还优选NT片段包含至多160，或少于140个氨基酸残基。典型的NT片段包含约130-140个氨基酸残基。

REP片段具有在富含丙氨酸的延伸序列(stretches)和富含甘氨酸的延伸序列之间交替的重复性特征。如以下将更详细地解释的，REP片段通常包含多于70，例如多于140且少于300，优选地少于240，例如少于200个氨基酸残基，且自身可分成几个L(接头)区段、A(富含丙氨酸)区段和G(富含甘氨酸)区段。通常，所述接头区段位于REP片段末端，而剩余的区段依次是富含丙氨酸和富含甘氨酸的，所述接头区段为任选的。因此，REP片段通常可具有以下结构中的任何一种，其中n是整数：

L(AG)_nL，例如LA₁G₁A₂G₂A₃G₃A₄G₄A₅G₅L；

L(AG)_nAL，例如LA₁G₁A₂G₂A₃G₃A₄G₄A₅G₅A₆L；

L(GA)_nL，例如LG₁A₁G₂A₂G₃A₃G₄A₄G₅A₅L；或

L(GA)_nGL，例如LG₁A₁G₂A₂G₃A₃G₄A₄G₅A₅G₆L。

其遵循富含丙氨酸或富含甘氨酸的区段是否与N端或C端接头区段相邻不是关键的。优选n是2至10，优选地2至8，还优选地4至8，更优选地4至6，即n＝4、n＝5或n＝6的整数。

在优选的实施方式中，根据本发明的REP片段的丙氨酸含量高于20％，优选地高于25％，更优选地高于30％且低于50％，优选地低于40％，更优选地低于35％。这是有利的，因为设想更高的丙氨酸含量提供更硬和/或更强和/或不太可延伸的纤维。

在某些实施方式中，REP片段不含脯氨酸残基，即REP片段中不存在Pro残基。

现在转向构成根据本发明的REP片段的区段，应强调的是每个区段是单独的，即，特定REP片段的任何两个A区段、任何两个G区段或任何两个L区段可以是相同的或可以是不相同的。因此，每种类型的区段在特定REP片段内是相同的不是本发明的一般特征。而且，以下公开内容为技术人员提供了如何设计单独的区段并将其聚集成是根据本发明的功能性蜘蛛丝蛋白的一部分的REP片段的指南。

每个单独的A区段是具有8至18个氨基酸残基的氨基酸序列。优选每个单独的A区段包含13至15个氨基酸残基。大多数，或两个以上的A区段包含13至15个氨基酸残基，且少数例如一或两个A区段包含8至18个氨基酸残基例如8-12或16-18个氨基酸残基也是可能的。这些氨基酸残基中的绝大多数是丙氨酸残基。更特别地，这些氨基酸残基中的0至3个不是丙氨酸残基，且剩余的氨基酸残基是丙氨酸残基。因此，每个单独的A区段中的所有氨基酸残基毫无例外地或除了一、二或三个氨基酸残基可以是任何氨基酸以外，都是丙氨酸残基。优选取代丙氨酸的氨基酸是天然氨基酸，优选地单独选自丝氨酸、谷氨酸、半胱氨酸和甘氨酸的组，更优选地是丝氨酸。当然，A区段中的一个或多个是全丙氨酸区段，而剩余的A区段包含1-3个非丙氨酸的残基，例如丝氨酸、谷氨酸、半胱氨酸或甘氨酸是可能的。

在优选的实施方式中，每个A区段包含13-15个氨基酸残基，包括10-15个丙氨酸残基和0-3个上述非丙氨酸的残基。在更优选的实施方式中，每个A区段包含13-15个氨基酸残基，包括12-15个丙氨酸残基和0-1个上述非丙氨酸的残基。

优选每个单独的A区段与选自SEQ ID NO：10的氨基酸残基7-19、43-56、71-83、107-120、135-147、171-183、198-211、235-248、266-279、294-306、330-342、357-370、394-406、421-434、458-470、489-502、517-529、553-566、581-594、618-630、648-661、676-688、712-725、740-752、776-789、804-816、840-853、868-880、904-917、932-945、969-981、999-1013、1028-1042和1060-1073的组的氨基酸序列具有至少80％，优选地至少90％，更优选地95％，最优选地100％的同一性。该组的每个序列对应于Euprosthenops australis MaSp1蛋白质的天然存在的序列的区段，该天然存在的序列经过克隆相应的cDNA推断得来，参见WO 2007/078239。可选择地，每个单独的A区段与选自SEQ ID NO：3的氨基酸残基143-152、174-186、204-218、233-247和265-278的组的氨基酸序列具有至少80％，优选地至少90％，更优选地95％，最优选地100％的同一性。该组的每个序列对应于根据本发明的表达的、非天然蜘蛛丝蛋白的区段，这些蛋白具有在合适的条件下形成丝纤维的能力。因此，在根据本发明的某些实施方式中，每个单独的A区段与选自上述氨基酸区段的氨基酸序列相同。不期望被任何具体的理论束缚，设想根据本发明的A区段形成螺旋结构或β折叠。

此外，已从实验数据推断出每个单独的G区段是12至30个氨基酸残基的氨基酸序列。优选每个单独的G区段由14至23个氨基酸残基组成。每个G区段的至少40％的氨基酸残基是甘氨酸残基。通常，每个单独的G区段的甘氨酸含量在40-60％的范围内。

优选每个单独的G区段与选自SEQ ID NO：10的氨基酸残基20-42、57-70、84-106、121-134、148-170、184-197、212-234、249-265、280-293、307-329、343-356、371-393、407-420、435-457、471-488、503-516、530-552、567-580、595-617、631-647、662-675、689-711、726-739、753-775、790-803、817-839、854-867、881-903、918-931、946-968、982-998、1014-1027、1043-1059和1074-1092的组的氨基酸序列具有至少80％，优选地至少90％，更优选地95％，最优选地100％的同一性。该组的每个序列对应于Euprosthenops australis MaSp1蛋白质的天然存在的序列的区段，该天然存在的序列经过克隆相应的cDNA推断得来，参见WO 2007/078239。可选择地，每个单独的G区段与选自SEQ ID NO：3的氨基酸残基153-173、187-203、219-232、248-264和279-296的组的氨基酸序列具有至少80％，优选地至少90％，更优选地95％，最优选地100％的同一性。该组的每个序列对应于根据本发明的表达的、非天然蜘蛛丝蛋白的区段，这些蛋白具有在合适的条件下形成丝纤维的能力。因此，在根据本发明的某些实施方式中，每个单独的G区段与选自上述氨基酸区段的氨基酸序列相同。

在某些实施方式中，根据本发明的每个G区段的前两个氨基酸残基不是-Gln-Gln-。

存在根据本发明的G区段的三种亚型。该分类基于对Euprosthenopsaustralis MaSp1蛋白质序列(WO 2007/078239)的仔细分析，并已在构建新型、非天然蜘蛛丝蛋白中使用并验证了该信息。

根据本发明的G区段的第一种亚型由一字母氨基酸共有序列GQG(G/S)QGG(Q/Y)GG(L/Q)GQGGYGQGAGSS(SEQ ID NO：11)代表。该第一种且通常不是最长的G区段亚型通常包含23个氨基酸残基，但是可包含少至17个氨基酸残基，且缺少带电荷的残基或包含一个带电荷的残基。因此，优选该第一种G区段亚型包含17-23个氨基酸残基，但设想其可包含少至12个或多至30个氨基酸残基。不期望被任何具体的理论束缚，设想该亚型形成卷曲结构或3₁-螺旋结构。该第一种亚型的代表性G区段是SEQ ID NO：10的氨基酸残基20-42、84-106、148-170、212-234、307-329、371-393、435-457、530-552、595-617、689-711、753-775、817-839、881-903、946-968、1043-1059和1074-1092。在某些实施方式中，根据本发明的该第一种亚型的每个G区段的前两个氨基酸残基不是-Gln-Gln-。

根据本发明的G区段的第二种亚型由一字母氨基酸共有序列：GQGGQGQG(G/R)Y GQG(A/S)G(S/G)S(SEQ ID NO：12)代表。该第二种通常中间尺寸的G区段亚型通常包含17个氨基酸残基且缺少带电荷的残基或包含一个带电荷的残基。优选该第二种G区段亚型包含14-20个氨基酸残基，但设想其可包含少至12个或多至30个氨基酸残基。不期望被任何具体的理论束缚，设想该亚型形成卷曲结构。该第二种亚型的代表性G区段是SEQ ID NO：10的氨基酸残基249-265、471-488、631-647和982-998；及SEQ ID NO：3的氨基酸残基187-203。

根据本发明的G区段的第三种亚型由一字母氨基酸共有序列：G(R/Q)GQG(G/R)YGQG(A/S/V)GGN(SEQ ID NO：13)代表。该第三种G区段亚型通常包含14个氨基酸残基，且通常是根据本发明的G区段亚型中最短的。优选该第三种G区段亚型包含12-17个氨基酸残基，但设想其可包含多至23个氨基酸残基。不期望被任何具体的理论束缚，设想该亚型形成转角结构。该第三种亚型的代表性G区段是SEQ ID NO：10的氨基酸残基57-70、121-134、184-197、280-293、343-356、407-420、503-516、567-580、662-675、726-739、790-803、854-867、918-931、1014-1027；及SEQ ID NO：3的氨基酸残基219-232。

因此，在优选的实施方式中，每个单独的G区段与选自SEQ IDNO：11、SEQ ID NO：12和SEQ ID NO：13的氨基酸序列具有至少80％，优选地90％，更优选95％的同一性。

在REP片段的A和G区段的交替序列的优选实施方式中，每隔一个G区段具有第一种亚型，而剩余的G区段具有第三种亚型，例如...A₁G_短A₂G_长A₃G_短A₄G_长A₅G_短...在REP片段的另一个优选的实施方式中，第二种亚型的一个G区段通过插入中断G区段的规律性，例如...A₁G_短A₂G_长A₃G_中A₄G_短A₅G_长...

每个单独的L区段代表可包含0至20个氨基酸残基，例如0至10个氨基酸残基的任选的接头氨基酸序列。虽然该区段是任选的且在功能上对于蜘蛛丝蛋白不是关键的，但是其存在仍允许完全功能性的蜘蛛丝蛋白，形成根据本发明的蜘蛛丝纤维。在来自Euprosthenops australis的MaSp1蛋白质的推断氨基酸序列的重复部分(SEQ ID NO：10)中也存在接头氨基酸序列。特别地，接头区段的氨基酸序列可能与所描述的A或G区段的任何一种相似，但是通常不足以满足本文对其定义的标准。

如WO 2007/078239中表明的，设置在REP片段的C端部分的接头区段可由富含丙氨酸的一字母氨基酸共有序列ASASAAASAASTVANSVS和ASAASAAA代表。实际上，第二序列可被认为是根据本发明的A区段，而第一序列与根据本发明的A区段具有高度的相似性。根据本发明的接头区段的另一实例具有富含甘氨酸的一字母氨基酸序列GSAMGQGS并与根据本发明的G区段具有高度的相似性。接头区段的另一实例是SASAG。

代表性L区段是SEQ ID NO：10的氨基酸残基1-6和1093-1110；及SEQ ID NO：3的氨基酸残基138-142，但是本领域技术人员将易于认识到存在用于这些区段的许多合适的替代氨基酸序列。在根据本发明的REP片段的一个实施方式中，L区段中的一个包含0个氨基酸，即缺少L区段中的一个。在根据本发明的REP片段的另一个实施方式中，两个L区段都包含0个氨基酸，即不含这两个L区段。因此，根据本发明的REP片段的这些实施方式可示意性地表示如下：(AG)_nL、(AG)_nAL、(GA)_nL、(GA)_nGL；L(AG)_n、L(AG)_nA、L(GA)_n、L(GA)_nG；和(AG)_n、(AG)_nA、(GA)_n、(GA)_nG。这些REP片段中的任何一种适合用于以下定义的任何CT片段。

期望的拖丝蛋白的蛋白质的CT片段与蜘蛛丝蛋白的C端氨基酸序列具有高度的相似性。如WO 2007/078239中所示，该氨基酸序列在多个物种和蜘蛛丝蛋白，包括MaSp1和MaSp2之间相当保守。以SEQ ID NO：9提供了MaSp1和MaSp2的C端区域的共有序列。在图2中，比对了以GenBank登记条目(如果合适的话)表示的下列MaSp蛋白质：

表2-拖丝蛋白CT片段

哪种特定的CT片段(若有的话)存在于根据本发明的蜘蛛丝蛋白中不是关键的。因此，根据本发明的CT片段可选自图2和表2中示出的氨基酸序列或具有高度相似性的序列中的任何一种。各种各样的C端序列可用于根据本发明的蜘蛛丝蛋白中。

根据本发明的CT片段的序列与基于图2的氨基酸序列的共有氨基酸序列SEQ ID NO：9具有至少50％的同一性，优选地至少60％，更优选地至少65％的同一性，或甚至至少70％的同一性。

根据本发明的代表性的CT片段是Euprosthenops australis序列SEQID NO：7。因此，根据本发明的优选的方面，CT片段与SEQ ID NO：7或图2和表2中的任何单独的氨基酸序列具有至少80％，优选地至少90％，例如至少95％的同一性。在本发明的优选的方面，CT片段与SEQ ID NO：7或图2和表2中的任何单独的氨基酸序列相同。

CT片段通常由70至120个氨基酸残基组成。优选CT片段包含至少70，或多于80，优选地多于90个氨基酸残基。还优选CT片段包含至多120，或少于110个氨基酸残基。典型的CT片段包含约100个氨基酸残基。

根据另一方面，当融合蛋白包含衍生自蜘蛛丝蛋白的N端(NT)片段的单一溶解度增强部分时，根据本发明的期望的蛋白质或多肽是非拖丝蛋白的蛋白质或多肽。在优选的实施方式中，期望的蛋白质或多肽是非拖丝蛋白的蛋白质或多肽。根据本发明的期望的非拖丝蛋白的蛋白质或多肽的序列与本文公开的拖丝蛋白的氨基酸序列且特别地与SEQ ID NO：6-10中的任一种优选地具有小于30％的同一性，例如小于20％的同一性，优选地小于10％的同一性。

在优选的实施方式中，期望的非拖丝蛋白的蛋白质或多肽衍生自海绵动物、栉水母、水母、珊瑚、海葵、扁虫、轮虫、蛔虫、纽虫、蛤、蜗牛、章鱼、节肢虫、甲壳动物、昆虫、苔藓动物、腕足动物、帚虫类、海星、海胆、被囊动物、文昌鱼、包括人类的脊椎动物、植物、真菌、酵母、细菌、古细菌或病毒或是人工蛋白质或多肽。“衍生”是指根据本发明的期望的非拖丝蛋白的蛋白质或多肽的序列与相应的天然存在的蛋白质具有优选地至少50％的同一性，优选地至少60％，优选地至少70％，更优选地至少80％的同一性，或甚至至少90％的同一性，例如95-100％的同一性并具有被保持的功能。在一个优选的实施方式中，期望的非拖丝蛋白的蛋白质或多肽衍生自软体动物、昆虫、包括人类的脊椎动物、植物、真菌、酵母、细菌、古细菌或病毒或是人工蛋白质或多肽。在优选的实施方式中，期望的非拖丝蛋白的蛋白质或多肽衍生自包括人类的脊椎动物、植物、真菌、酵母、细菌、古细菌或病毒或是人工蛋白质或多肽。

在优选的实施方式中，期望的非拖丝蛋白的蛋白质或多肽选自由淀粉样形态的蛋白质和多肽、含二硫键的蛋白质和多肽、载脂蛋白、膜蛋白和多肽、蛋白质和多肽药物及药靶、易于聚集的蛋白质和多肽及蛋白酶组成的组。

根据本发明的淀粉样形态的蛋白质和多肽包括与疾病和功能性淀粉样蛋白有关的蛋白质和多肽。淀粉样形态的蛋白质和多肽的实例包括淀粉状蛋白β肽(Aβ-肽)、胰岛淀粉样多肽(胰淀素或IAPP)、朊病毒蛋白(PrP)、α-突触核蛋白、降钙素、催乳素、半胱氨酸蛋白酶抑制剂、心房钠尿肽(ATF)和肌动蛋白。表3中列出了根据本发明的淀粉样形态的蛋白质和多肽的实例。

表3-淀粉样形态的蛋白质和多肽

蛋白质	Uniprot ID
		Aβ1-42	P05067
载脂蛋白SAA	P02735
		半胱氨酸蛋白酶抑制剂C	P01034
运甲状腺素蛋白	P02766
		溶菌酶	P61626
α-突触核蛋白	P37840
		朊病毒蛋白	P04156
ODAM	A1E959
		乳粘着蛋白	Q08431
Tau	P10636
		凝溶胶蛋白	P06396
ABri，ADan	Q9Y287
		胰岛素	P01308
载脂蛋白A-II	P02652
		载脂蛋白A-IV	P06727
精胶蛋白I	P04279
		角膜上皮蛋白	Q15582
乳运铁蛋白	P02788
		血纤蛋白原α链	P02671
ANF	P01160
		IAPP	P10997

蛋白质	Uniprot ID
		β2-微球蛋白	P61769
降钙素	P01258
		催乳素	P01236
载脂蛋白A-I	P02647
		CsgA	P28307
Sup35	C7GN25
		PmeI17	P40967
HET-s	A8HR89
		Ure2p	Q8NIE6

含二硫键的蛋白质和多肽的实例包括表面活性蛋白B(SP-B)和其变体，例如Mini-B、Mini-B27、Mini-BLeu、α-防卫素和β-防卫素。不被任何具体的理论限制，设想溶解度增强部分促进防卫素和其他含二硫键的蛋白质和多肽中期望的链内二硫键的形成胜于链间二硫键的形成。表4中列出了根据本发明的含二硫键的蛋白质和多肽的实例。

表4-含二硫键的蛋白质和多肽

载脂蛋白的实例包括A-H类载脂蛋白。表5中列出了根据本发明的载脂蛋白的实例。

表5-载脂蛋白

蛋白质	序列/Uniprot ID
		载脂蛋白B-100	P04114
载脂蛋白C-1	P02654
		载脂蛋白D	P05090
载脂蛋白E	P02649

膜蛋白和多肽的实例包括膜相关受体，包括细胞因子受体、KL4、LL-37、表面活性蛋白C(SP-C)和其变体例如SP-C(Leu)、SP-C33、SP-C30和SP-C33Leu。其他具体实例包括任选地通过接头例如Gly_n、Leu_n、Gly-Ala_n或类似接头与Mini-B、Mini-Bleu、1a AA、1b AA、0AAAA、1aLL、1b LL、0LLLL或SP-B蛋白融合的SP-C33Leu。SP-C33Leu可设置在Mini-B、Mini-Bleu、1aAA、1b AA、0AAAA、1a LL、1b LL、0LLLL或SP-B蛋白的N端，或优选地C端。表6中列出了根据本发明的膜蛋白和多肽的实例。

表6-膜蛋白和多肽

蛋白质和多肽药物及药靶的实例包括重组产生的激素，包括肽和蛋白质激素，例如红细胞生成素(EPO)和生长激素(GH)、细胞因子、生长因子，例如胰岛素样生长因子(IGF-I和IGF-II)、KL4、LL-37、表面活性蛋白C(SP-C)和其变体，例如SP-C(Leu)、SP-C33、SP-C30和SP-C33Leu。其他具体实例包括通过接头例如，Gly_n、Leu_n、Gly-Ala_n或类似接头与Mini-B、Mini-Bleu、1a AA、1b AA、0AAAA、1a LL、1b LL、0LLLL或SP-B蛋白融合的SP-C33Leu。SP-C33Leu可设置在Mini-B、Mini-Bleu、1a AA、1b AA、0AAAA、1a LL、1b LL、0LLLL或SP-B蛋白的N端，或优选地C端。表7中列出了根据本发明的蛋白质和多肽药物及药靶的实例。

表7-蛋白质和多肽药物及药靶

蛋白质	序列/Uniprot ID
		胰岛素样生长因子IA	P01243
胰岛素样生长因子IB	P05019
		生长激素1，变体1	Q6IYF1
生长激素1，变体2	Q6IYF0
		生长激素2，变体2	B1A4H7
胰岛素	P01308
		红细胞生成素	P01588
凝结因子VIII	P00451
		凝结因子IX	P00740
凝血酶原	P00734
		血清白蛋白	P02768
抗凝血酶III	P01008
		干扰素α	P01563
促生长素	P01241
		主要花粉过敏原Betv 1-A	P15494
OspA (鲑鱼立克次氏体(Piscirickettsia salmonis))	Q5BMB7
		17kDa的OspA (鲑鱼立克次氏体)抗原变体	Q9F9K8
转化生长因子β-1	P01137
		转化生长因子β-2	P61812
转化生长因子β-3	P10600
		白介素1β	P01584
白介素1α	P01583
		白介素2	P60568
白介素3	P08700
		白介素4	P05112
白介素5	P05113
		白介素6	P05231

易于聚集的蛋白质和多肽的实例包括亲和素、链霉亲和素和细胞因子受体的细胞外配体结合部分。表8中列出了根据本发明的易于聚集的蛋白质和多肽的实例。

表8-易于聚集的蛋白质和多肽

蛋白酶的实例包括来自柯萨奇病毒或人鼻病毒的蛋白酶3C。表9中列出了根据本发明的蛋白酶的另外的实例。

表9-蛋白酶

蛋白酶	类型	登记号
			胰蛋白酶(牛)	丝氨酸	P00760
胰凝乳蛋白酶(牛)	丝氨酸	P00766
			弹性蛋白酶(猪)	丝氨酸	P00772
内切蛋白酶Arg-C(小鼠颌下腺)	丝氨酸
			内切蛋白酶Glu-C(V8蛋白酶)	丝氨酸	P04188

在本发明的优选实施方式中，期望的非拖丝蛋白的蛋白质选自表面活性蛋白B(SP-B)和其变体例如Mini-B、Mini-B27、Mini-Bleu、KL4、LL-37和表面活性蛋白C(SP-C)和其变体例如SP-C(Leu)、SP-C33、SP-C30和SP-C33Leu。根据本发明的其他优选的非拖丝蛋白的蛋白质是神经丝抑蛋白、GFP和1a AA、1b AA、0AAAA、1a LL、1b LL及0LLLL蛋白质。

在本发明的某些优选的实施方式中，融合蛋白选自由SEQ ID NO 26、28、30、34、37、39、42和47；和与这些蛋白质中的任何一种具有至少80％，优选地至少90％，更优选地至少95％的同一性的蛋白质组成的组。

根据另一方面，本发明提供了编码根据本发明的融合蛋白的分离的多核酸。在优选的实施方式中，分离的多核酸选自由SEQ ID NO 27、29、31、38、40、43和48组成的组。在另一个优选的实施方式中，分离的多核酸选自由SEQ ID NO 14-16、18和24组成的组。

根据一个方面，本发明提供了衍生自蜘蛛丝蛋白的N端(NT)片段的至少一个部分作为融合蛋白中的溶解度增强部分用于制备期望的蛋白质或多肽的新型用途。在优选的实施方式中，期望的蛋白质或多肽是拖丝蛋白的蛋白质或多肽。当融合蛋白包含衍生自蜘蛛丝蛋白的N端(NT)片段的单一溶解度增强部分时，则期望的蛋白质是非拖丝蛋白的蛋白质或多肽是一种优选的替代方案。在一个优选的实施方式中，期望的蛋白质或多肽是非拖丝蛋白的蛋白质或多肽。

根据另一方面，本发明提供了制备融合蛋白的方法。第一步骤包括在合适宿主中表达根据本发明的融合蛋白。合适的宿主是本领域技术人员熟知的且包括，例如细菌和真核细胞，例如酵母、昆虫细胞系和哺乳动物细胞系。通常，该步骤包括在大肠杆菌中表达编码该融合蛋白的多核酸分子。

方法的第二步骤包括获得包含该融合蛋白的混合物。混合物可例如通过裂解或机械破坏宿主细胞获得。如果宿主细胞分泌融合蛋白，还可通过收集细胞培养基获得混合物。可使用标准方法分离由此获得的蛋白质。如需要的话，该混合物可进行离心，并收集合适的部分(沉淀或上清液)。包含融合蛋白的混合物还可进行凝胶过滤、层析例如阴离子交换层析、透析、相分离或过滤以导致分离。任选地，脂多糖和其他热原在该阶段被有效地去除。如需要的话，可在该步骤中通过裂解去除接头肽。

在优选的实施方式中，所获得的混合物包含溶解在液体介质，通常是盐缓冲液或细胞培养基中的融合蛋白。在一个优选的实施方式中，混合物具有低于6.3，且优选地低于6的pH，该pH促进可溶性NT结构域的组装。在另一个优选的实施方式中，混合物具有高于6.4，且优选地高于7的pH，该pH阻止或减弱了可溶性NT结构域的组装。高于6.4，例如高于7的pH对于提高根据本发明的融合蛋白的溶解度可能是特别有用的，其中期望的蛋白质/多肽衍生自拖丝蛋白的蛋白质或其中期望的蛋白质/多肽是淀粉样形态或易于聚集的蛋白质/多肽。

根据相关的方面，本发明提供了制备期望的蛋白质或多肽的方法。第一步骤包括在合适宿主中表达根据本发明的融合蛋白。合适的宿主是本领域技术人员熟知的且包括例如细菌和真核细胞，例如酵母、昆虫细胞系和哺乳动物细胞系。通常，该步骤包括在大肠杆菌中表达编码该融合蛋白的多核酸分子。

方法的第二步骤包括获得包含该融合蛋白的混合物。混合物可例如通过裂解或机械破坏，例如超声破碎宿主细胞获得。如果宿主细胞分泌融合蛋白，还可通过收集细胞培养基获得混合物。可使用标准方法分离由此获得的蛋白质。如需要的话，该混合物可进行离心，并收集合适的部分(沉淀或上清液)。包含融合蛋白的混合物还可进行凝胶过滤、层析例如阴离子交换层析、透析、相分离或过滤以导致分离。任选地，脂多糖和其他热原在该阶段被有效地去除。如需要的话，可在该步骤中通过裂解去除接头肽。如以上列出的，这可能是期望的蛋白质或多肽的最合适的形式，即作为融合蛋白的一部分。其可提供用于纯化和检测的合适工具和/或提供期望的性质，例如稳定性且特别是溶解度。

在优选的实施方式中，该方法还可包括裂解融合蛋白以提供期望的蛋白质或多肽的步骤。在该实施方式中，融合蛋白包含设置在至少一个期望的蛋白质或多肽部分与至少一个溶解度增强部分之间的至少一个裂解位点。在典型的融合蛋白中，这意味着在一个或多个溶解度增强部分与期望的蛋白质或多肽之间的单一裂解位点的存在。裂解可使用标准方法实现，例如，通过Met残基后的溴化氰(CNBr)裂解，通过Asn和Gly残基之间的羟胺裂解，通过-XLETLFQGX-位点的Gln和Gly残基之间的蛋白质3C裂解和在本领域技术人员熟知的各种其他蛋白酶位点裂解。

由此获得的期望的蛋白质或多肽可使用标准方法分离。如需要的话，该混合物可进行离心，并收集合适的部分(沉淀或上清液)。包含期望的蛋白质或多肽的混合物还可进行凝胶过滤、层析、透析、相分离或过滤以导致分离。任选地，脂多糖和其他热原在该阶段被有效地去除。如需要的话，可在该步骤中通过裂解去除接头肽。

在优选的实施方式中，所获得的混合物包含溶解在液体介质，通常是盐缓冲液或细胞培养基中的融合蛋白。在一个优选的实施方式中，混合物具有低于6.3，且优选地低于6，例如在区间4.2-6.3或4.2-6内的pH，该pH促进可溶性NT结构域的组装。在另一个优选的实施方式中，混合物具有高于6.4，且优选地高于7的pH，该pH阻止或减弱了可溶性NT结构域的组装。高于6.4，例如高于7的pH对于提高根据本发明的融合蛋白的溶解度可能是特别有用的，其中期望的蛋白质/多肽衍生自拖丝蛋白的蛋白质或其中期望的蛋白质/多肽是淀粉样形态或易于聚集的蛋白质/多肽。

因此，融合蛋白通常作为液体介质中的溶液获得。术语“可溶性的”和“在溶液中”是指融合蛋白在60 000×g下不可见地聚集且不从溶剂中沉淀出来。液体介质可以是任何合适的介质，例如含水介质，优选地生理介质，通常是缓冲的含水介质，例如10-50mM Tris-HCl缓冲液或磷酸盐缓冲液。液体介质优选地具有6.4或更高，例如7或更高的pH，和/或阻止溶解度增强部分聚合的离子组成。也就是说，液体介质通常具有6.4或更高的pH，例如7或更高的pH，和/或阻止溶解度增强部分聚合的离子组成，或具有两者。

技术人员可容易地制备阻止溶解度增强部分聚合的离子组成。阻止溶解度增强部分聚合的优选离子组成具有大于300mM的离子强度。阻止溶解度增强部分聚合的离子组成的具体实例包括高于300mM的NaCl、100mM的磷酸盐和对溶解度增强部分的聚合具有期望的阻止作用的这些离子的组合，例如10mM磷酸盐和300mM NaCl的组合。

已令人惊奇地发现，溶解度增强部分的存在在这些条件下提高了溶液的稳定性并阻止了聚合物的形成。当立即聚合可能不令人期望时，例如在蛋白纯化期间，在大批量制备时或当需要优化其他条件时，这可能是有利的。优选将液体介质的pH调节至6.7或更高，例如7.0或更高以实现融合蛋白的高的溶解度。将液体介质的pH调节至6.4-6.8的范围也可能是有利的，该pH提供了足够的蜘蛛丝蛋白溶解度并有利于随后将pH调节至6.3或更低。

本发明的另一方面基于一种洞察，即当pH从约7降至6，或更特别地从高于6.4降至低于6.3时，NT结构域将形成大的可溶性组装体。这种组装最有效地发生在高于4.2，即，4.2-6.3例如4.2-6的范围内的pH下。例如，如果NT被固定在柱上的话，该性质可用于亲和纯化。因为组装体在pH从约6升至7时将分解，该方法通过pH在生理相关区间内的变化允许释放结合的蛋白质。

在根据本发明的方法的优选实施方式中，分离融合蛋白的步骤包括在具有固定的NT部分的亲和介质，例如亲和柱上和/或在阴离子交换介质例如阴离子交换柱上纯化融合蛋白。优选通过结合6.3或更低，优选地在4.2-6.3的范围内的pH下的具有固定的NT部分的亲和介质，然后用例如具有6.4或更高的pH，4.1或更低的pH和/或具有高离子强度的期望的离解介质从亲和介质上离解，进行所述融合蛋白在亲和介质上的纯化。优选通过结合6.4或更高的pH下的阴离子交换介质，然后用具有高离子强度的离解介质从阴离子交换介质上离解，进行所述融合蛋白在阴离子交换介质上的纯化。如需要的话，在具有固定的NT部分的亲和介质例如亲和柱上纯化融合蛋白可与在阴离子交换介质例如阴离子交换柱上的纯化组合。具有高离子强度的离解介质通常具有大于300mM的离子强度，例如高于300mM的NaCl。

这两种基于亲和力的方法利用了根据本发明的溶解度增强部分的固有性质。特别感兴趣的是拖丝蛋白NT蛋白质片段在低于6.3，特别是在4.2-6.3的范围内的pH下结合的强烈倾向。这可被有利地用作有力的亲和纯化工具，允许从复杂混合物中一步纯化根据本发明的融合蛋白。虽然层析是优选的，但是显然可采用除了层析以外的其他基于亲和力的纯化方法，例如具有官能化表面的磁珠或具有官能化表面的滤器。

这种洞察，即当pH从约7降至6，或更特别地从高于6.4降至低于6.3，优选地在4.2-6.3，例如4.2-6的范围内时，NT结构域将形成大的可溶性组装体，在期望促进包含NT的蛋白质的组装时，例如在制备肉眼可见的聚合物，例如具有蜘蛛丝蛋白例如本文公开的那些蜘蛛丝蛋白的纤维、膜、泡沫、网或网孔(mesh)的方法中也是有用的。制备分离的蜘蛛丝蛋白的聚合物的优选方法包含下列步骤：

(i)提供由170至600个氨基酸残基组成且包含下列片段的蜘蛛丝蛋白：

100至160个氨基酸残基的N端片段，该片段衍生自蜘蛛丝蛋白的N端片段；和

70至300个氨基酸残基的重复片段，该片段衍生自拖丝蛋白的重复片段；和任选地

70至120个氨基酸残基的C端片段，该片段衍生自蜘蛛丝蛋白的C端片段；

(ii)提供所述蜘蛛丝蛋白在6.4或更高的pH和/或阻止所述蜘蛛丝蛋白聚合的离子组成下的液体介质中的溶液，任选地包括去除脂多糖和其他热原；

(iii)将所述液体介质的性质调节成6.3或更低，例如4.2-6.3的pH，和允许所述蜘蛛丝蛋白聚合的离子组成；

(iv)允许蜘蛛丝蛋白在液体介质中形成固态的聚合物，所述液体介质具有6.3或更低，例如4.2-6.3的pH，和允许所述蜘蛛丝蛋白聚合的离子组成；和

(v)从所述液体介质中分离固态的蜘蛛丝蛋白聚合物。

以下将通过下列非限制性实例进一步说明本发明。

实施例

实施例1-SP-C33Leu融合蛋白的制备

构建包含编码作为His₆的融合体(fusion)(SEQ ID NO：26-27)的NT-MetSP-C33Leu的基因的表达载体。使用该载体转化大肠杆菌(Escherichia coli)BL21(DE3)细胞(Merck Biosciences)，在30℃下在包含卡那霉素的LB培养基中生长至OD₆₀₀为0.9-1，用异丙基-β-D-硫代半乳糖苷(IPTG)诱导，并在25℃下进一步孵育3小时。通过离心收集细胞并重悬在pH 8的20mM Tris-HCl中。

加入溶菌酶，并在冰上孵育细胞30min。加入吐温至终浓度为0.7％。通过冰上超声破坏细胞，交替开2秒钟和关2秒钟地持续5min。在20000×g下离心细胞裂解液30min。将上清液上样到用包含0.7％吐温的20mM Tris-HCl，pH 8的缓冲液平衡过的Ni-NTA琼脂糖柱上。用包含0.7％吐温的20mM Tris-HCl，pH 8的缓冲液洗涤柱子，并用包含0.7％吐温的20mM Tris-HCl pH 8，300mM的咪唑缓冲液洗脱已结合的蛋白质。

在还原条件下在12％Tris-甘氨酸凝胶上对洗脱液进行SDS-PAGE。图3A中通过箭头指出了对应于融合蛋白的主带。通过来自生长至OD₆₀₀为1的1升摇瓶培养物的纯化的蛋白质mg数确定收率。收率为64mg/l。得出结论：在去污剂的存在下，包含单一的NT部分的融合蛋白在细胞裂解液中产生令人惊奇地高的收率。

实施例2-SP-C33Leu融合蛋白的制备

构建包含编码作为His₆的融合体(SEQ ID NO：28-29)的NT₂-MetSP-C33Leu (即NTNT-MetSP-C33Leu)的基因的表达载体。使用该载体转化大肠杆菌BL21(DE3)细胞(Merck Biosciences)，在30℃下在包含卡那霉素的LB培养基中生长至OD₆₀₀为0.9-1，用异丙基-β-D-硫代半乳糖苷(IPTG)诱导，并在25℃下进一步孵育3小时。通过离心收集细胞并重悬在pH 8的20mM Tris-HCl中。

加入溶菌酶，并在冰上孵育细胞30min。不加入吐温或加入吐温至终浓度为0.7％。通过冰上超声破坏细胞，交替开2秒钟和关2秒钟地持续5min。在20000×g下离心细胞裂解液30min。将上清液上样到用20mMTris-HCl，pH 8的缓冲液±0.7％吐温平衡过的Ni-NTA琼脂糖柱上。用20mM Tris-HCl，pH 8的缓冲液±0.7％吐温洗涤柱子，并用20mM Tris-HClpH 8，300mM咪唑缓冲液±0.7％吐温洗脱已结合的蛋白质。

在还原条件下在12％Tris-甘氨酸凝胶上对洗脱液进行SDS-PAGE。图3B中通过箭头指出了对应于融合蛋白的主带。通过来自生长至OD₆₀₀为1的1升摇瓶培养物的纯化的蛋白质mg数确定收率。无吐温存在下的收率是40mg/l，且0.7％吐温存在下的收率是68mg/l。得出结论：在无去污剂存在下，包含两个连续的NT部分的融合蛋白在细胞裂解液中产生令人惊奇地高的收率，且在去污剂存在下在细胞裂解液中产生甚至进一步增加的收率。

实施例3-SP-C33Leu融合蛋白的制备

构建分别包含编码NT-MetSP-C33Leu、NT₂-MetSP-C33Leu和NT-MetSP-C33Leu-NT的基因的表达载体。使用这些载体转化大肠杆菌BL21(DE3)细胞(Merck Biosciences)，在30℃下在包含卡那霉素的LB培养基中生长至OD₆₀₀为0.9-1，用异丙基-β-D-硫代半乳糖苷(IPTG)诱导，并在25℃下进一步孵育3小时。通过离心收集细胞并重悬在pH 8的20mM Tris-HCl中。

加入溶菌酶，并在冰上孵育细胞30min。不加入吐温或加入吐温至终浓度为0.7％。通过冰上超声破坏细胞，交替开2秒钟和关2秒钟地持续5min。将细胞裂解液在20000×g下离心30min。

实施例4-NT-琼脂糖的产生

使用CysHis₆NT构建体转化大肠杆菌BL21(DE3)细胞(MerckBiosciences)。使细胞在30℃下在包含卡那霉素的LB培养基中生长至OD₆₀₀为0.8-1，用异丙基-β-D-硫代半乳糖苷(IPTG)诱导，并在室温下进一步孵育多达4小时。此后，收集细胞并重悬在补充有溶菌酶和DNA酶I的pH 8的20mM Tris-HCl中。完全裂解后，将15000g上清液上样到装载有Ni琼脂糖的柱(GE Healthcare)上。充分地洗涤柱子，并然后用100-300mM的咪唑洗脱已结合的蛋白质。收集包含靶蛋白的部分并对pH 8.0的20mM Tris-HCl透析。使用标准方案将纯化的Cys-His₆-NT蛋白偶联到活化的巯基琼脂糖上(GE Healthcare)。

实施例5-使用NT琼脂糖纯化融合蛋白

将来自实施例3的细胞裂解液上样到装载有NT琼脂糖的用pH 6的20mM NaPi预平衡的柱上。用pH 6的20mM NaPi充分地洗涤柱子，并然后用pH 7的20mM NaPi洗脱已结合的蛋白质。收集包含靶蛋白的部分。在SDS-PAGE凝胶上分离蛋白质样品并然后用考马斯亮蓝R-250染色。由280nm处的吸光度确定蛋白质含量。

实施例6-在阴离子交换器(anion exchanger)上纯化融合蛋白

将来自实施例3的细胞裂解液上样到用pH 6.5的20mM NaP预平衡的HiTrap Q FF柱(GE Healthcare)上。充分地洗涤柱子，并然后用高达1M的NaCl的线性梯度洗脱已结合的蛋白质。收集包含靶蛋白的部分。在SDS-PAGE凝胶上分离蛋白质样品并然后用考马斯亮蓝R-250染色。由280nm处的吸光度确定蛋白质含量。

实施例7-期望的蛋白质的裂解和分离

将实施例3、5和6的融合蛋白溶解在补充有0.1g/ml的CNBr的70％的甲酸水溶液中并在室温下静置24小时。此后，干燥混合物，并在以体积计8∶4∶3的两相体系氯仿/甲醇/水中分离。在有机相中发现SP-C33Leu，且此后可任选地使用C18柱通过反相HPLC进一步纯化。如在例如J.Johansson等人，J.Appl.Physiol.95，2055-2063(2003)中所述的，可体外或体内测试与合成的磷脂混合的SP-C33Leu的活性。

实施例8-LL-37融合蛋白的制备

构建包含编码作为His₆的融合体(SEQ ID NO：30-31)的NT₂-LL37(即，NTNT-LL37)的基因的表达载体。使用该载体转化大肠杆菌BL21(DE3)细胞(Merck Biosciences)，在30℃下在包含卡那霉素的LB培养基中生长至OD₆₀₀为0.9-1，用异丙基-β-D-硫代半乳糖苷(IPTG)诱导，并在25℃下进一步孵育3小时。通过离心收集细胞并重悬在pH 8的20mM Tris-HCl中。

加入溶菌酶，并在冰上孵育细胞30min。通过冰上超声破坏细胞，交替开2秒钟和关2秒钟地持续5min。在20000×g下离心细胞裂解液30min。将上清液上样到用20mM Tris-HCl，pH 8，250mM NaCl缓冲液平衡过的Ni-NTA琼脂糖柱上。用20mM Tris-HCl，pH 8，250mM NaCl缓冲液洗涤柱子，并用20mM Tris-HCl pH 8，300mM咪唑缓冲液洗脱已结合的蛋白质。

实施例9-NT-REP ₄ -CT的制备

构建表达载体以产生作为His₆的N端融合体(SEQ ID NO 17-18)的NT-REP₄-CT。使用该载体转化大肠杆菌BL21(DE3)细胞(MerckBiosciences)，在30℃下在包含卡那霉素的LB培养基中生长至OD₆₀₀为～1，用异丙基-β-D-硫代半乳糖苷(IPTG)诱导，并在室温下进一步孵育多达4小时。此后，收集细胞并重悬在补充有溶菌酶和DNA酶I的20mMTris-HCl(pH 8)中。

完全裂解后，将15000g上清液上样到装载有Ni琼脂糖的柱(GEHealthcare，Uppsala，Sweden)上。在用300mM咪唑洗脱已结合的蛋白质之前充分地洗涤柱子。收集包含靶蛋白的部分并对20mM Tris-HCl(pH8)透析。

经SDS-PAGE分离蛋白质样品并然后用考马斯亮蓝R-250染色。使用5kDa分子量截留纤维素滤器(Millipore)通过超滤浓缩所得的NT-REP₄-CT蛋白。

实施例10-NT-REP ₄ -CT的制备

构建表达载体以产生作为与Zbasic的C端融合体(SEQ ID NO 19)的NT-REP₄-CT。使用该载体转化大肠杆菌BL21(DE3)细胞(MerckBiosciences)，在30℃下在包含卡那霉素的LB培养基中生长至OD₆₀₀为～1，用异丙基-β-D-硫代半乳糖苷(IPTG)诱导，并在室温下进一步孵育多达2-4小时。此后，收集细胞并重悬在补充有溶菌酶和DNA酶I的pH8的50mMNa磷酸盐(pH 7.5)中。

完全裂解后，将15000g上清液上样到阳离子交换器(HiTrap S，GEHealthcare，Uppsala，Sweden)上。在用相对于500mM NaCl的梯度洗脱已结合的蛋白质之前充分地洗涤柱子。收集包含靶蛋白的部分并对50mM Na磷酸盐(pH 7.5)透析。通过使用蛋白酶3C：融合蛋白的比例为1∶50(w/w)在4℃下过夜蛋白酶裂解，NT-REP₄-CT蛋白(SEQ ID NO 20)从Zbasic标签上释放。为去除释放的Zbasic标签，将裂解混合物上样到第二阳离子交换器上，并收集流出液。

实施例11-NT-REP ₄ -CT的制备

构建表达载体以产生作为HisTrxHis的C端融合体(SEQ ID NO 21)的NT-REP₄-CT。使用该载体转化大肠杆菌BL21(DE3)细胞(MerckBiosciences)，在30℃下在包含卡那霉素的LB培养基中生长至OD₆₀₀为～1，用异丙基-β-D-硫代半乳糖苷(IPTG)诱导，并在室温下进一步孵育多达2-4小时。此后，收集细胞并重悬在补充有溶菌酶和DNA酶I的20mM Tris-HCl(pH 8.0)中。

完全裂解后，将15000g上清液上样到装载有Ni琼脂糖的柱(GEHealthcare，Uppsala，Sweden)上。在用相对于500mM NaCl的梯度洗脱已结合的蛋白质之前充分地洗涤柱子。收集包含靶蛋白的部分并对20mM Tris-HCl(pH 8.0)透析。使用凝血酶∶融合蛋白的比例为1∶1000(w/w)在4℃下过夜蛋白酶裂解，NT-REP₄-CT蛋白(SEQ ID NO 22)从HisTrxHis标签上释放。为去除释放的HisTrxHis标签，将裂解混合物上样到第二Ni琼脂糖柱上，并收集流出液。

实施例12-NT ₂ -RFP ₄ -CT的产生

构建包含编码作为His₆的融合体(SEQ ID NO：23-24)的NT₂-REP₄-CT(即NTNT-REP₄-CT)的基因的表达载体。使用该载体转化大肠杆菌BL21(DE3)细胞(Merck Biosciences)，在30℃下在包含卡那霉素的LB培养基中生长至OD₆₀₀为0.9-1，用异丙基-β-D-硫代半乳糖苷(IPTG)诱导，并在25℃下进一步孵育3小时。通过离心收集细胞并重悬在pH 8的20mM Tris-HCl中。

加入溶菌酶和DNA酶，并在冰上孵育细胞30min。在20000×g下离心细胞裂解液30min。将上清液上样到用20mM Tris-HCl，pH 8的缓冲液平衡过的Ni-NTA琼脂糖柱上。用20mM Tris-HCl，pH 8的缓冲液洗涤柱子，并用20mM Tris-HCl pH 8，300mM咪唑缓冲液洗脱已结合的蛋白质。

在还原条件下在12％Tris-甘氨酸凝胶上对洗脱液进行SDS-PAGE。图3C中通过箭头指出了对应于融合蛋白的主带。通过来自生长至OD₆₀₀为1的1升摇瓶培养物的纯化的蛋白质mg数确定收率。收率为30mg/l。得出结论：拖丝蛋白微型蛋白质可被有利地表达成具有两个NT部分的融合体。

实施例13-NT-RFP ₄ -CT、NT ₂ -RFP ₄ -CT和NT-RFP ₈ -CT的制备

构建分别包含编码NT-REP₄-CT(SEQ ID NO 20和22)、NT₂-REP₄-CT(SEQ ID NO 23)和NT-REP₈-CT(SEQ ID NO：25)的基因的表达载体。使用这些载体转化大肠杆菌BL21(DE3)细胞(Merck Biosciences)，在30℃下在包含卡那霉素的LB培养基中生长至OD₆₀₀为0.9-1，用异丙基-β-D-硫代半乳糖苷(IPTG)诱导，并在25℃下进一步孵育3小时。通过离心收集细胞并重悬在pH 8的20mM Tris-HCl中。

加入溶菌酶，并在冰上孵育细胞30min。不加入吐温或加入吐温至终浓度为0.7％。将细胞裂解液在20000×g下离心30min。将一部分的上清液根据实施例6上样到阴离子交换柱上。

如实施例4中所述制备NT亲和介质。将另一部分的上清液根据实施例5上样到NT亲和柱上。

对来自阴离子交换柱和NT亲和柱的洗脱液进行凝胶电泳。

实施例14-NTHis、NT ₂ -RFP ₈ -CT和NT ₂ -Brichos的制备

A)NTHis

构建表达载体以产生作为His₆的N端融合体(SEQ ID NO 32)的NT。使用该载体转化大肠杆菌BL21(DE3)细胞(Merck Biosciences)，在30℃下在包含卡那霉素的LB培养基中生长至OD₆₀₀为～1，用异丙基-β-D-硫代半乳糖苷(IPTG)诱导，并在室温下进一步孵育多达4小时。此后，收集细胞并重悬在补充有溶菌酶和DNA酶I的20mM Tris-HCl(pH 8.0)中。

完全裂解后，将15000g上清液上样到装载有Ni琼脂糖的柱(GEHealthcare，Uppsala，Sweden)上。在用300mM咪唑洗脱已结合的蛋白质之前充分地洗涤柱子。收集包含靶蛋白的部分并对20mM Tris-HCl(pH8.0)透析。经SDS-PAGE分离蛋白质样品并然后用考马斯亮蓝R-250染色。使用5kDa分子量截留纤维素滤器(Millipore)通过超滤浓缩所得的NT蛋白质(SEQ ID NO 32)。收率为112mg/升生长至OD₆₀₀为1的摇瓶培养物。

B)NT ₂ -R EP ₈ -CT

构建表达载体以产生作为His₆的N端融合体(SEQ ID NO 33)的NT₂-REP₈-CT(NTNT8REPCT)。使用该载体转化大肠杆菌BL21(DE3)细胞(Merck Biosciences)，在30℃下在包含卡那霉素的LB培养基中生长至OD₆₀₀为～1，用异丙基-β-D-硫代半乳糖苷(IPTG)诱导，并在室温下进一步孵育多达4小时。此后，收集细胞并重悬在补充有溶菌酶和DNA酶I的20mM Tris-HCl(pH 8.0)中。经SDS-PAGE分离蛋白质样品并然后用考马斯亮蓝R-250染色以证实蛋白质表达。

完全裂解后，将15000g上清液上样到装载有Ni琼脂糖的柱(GEHealthcare，Uppsala，Sweden)上。在用300mM的咪唑洗脱已结合的蛋白质之前充分地洗涤柱子。收集包含靶蛋白的部分并对20mM Tris-HCl(pH 8.0)透析。经SDS-PAGE分离蛋白质样品并然后用考马斯亮蓝R-250染色。

C)NT ₂ -Brichos

构建表达载体以产生作为His₆的N端融合体(SEQ ID NO 34)的NT₂-Brichos(NT-NT-Brichos)。使用该载体转化大肠杆菌BL21(DE3)细胞(Merck Biosciences)，在30℃下在包含卡那霉素的LB培养基中生长至OD₆₀₀为～1的，用异丙基-β-D-硫代半乳糖苷(IPTG)诱导，并在室温下进一步孵育多达4小时。此后，收集细胞并重悬在补充有溶菌酶和DNA酶I的20mM Tris-HCl(pH 8.0)中。通过冰上超声进一步破坏细胞，交替开2秒钟和关2秒钟地持续5分钟。

完全裂解后，将15000g上清液上样到装载有Ni琼脂糖的柱(GEHealthcare，Uppsala，Sweden)上。在用300mM咪唑洗脱已结合的蛋白质之前充分地洗涤柱子。收集包含靶蛋白的部分并对20mM Tris-HCl(pH8.0)透析。经SDS-PAGE分离蛋白质样品并然后用考马斯亮蓝R-250染色。使用5kDa分子量截留纤维素滤器(Millipore)通过超滤浓缩所得的NT₂-Brichos蛋白(SEQ ID NO 34)。收率为20mg/升生长至OD₆₀₀为1的摇瓶培养物。

实施例15-用于pH依赖性可逆捕捉的NT

目的：使用共价固定的NT(和NTNT)可逆地捕捉NT融合蛋白。

策略：研究NT(和NTNT)融合蛋白与具有共价连接的NT(和NTNT)的纤维(和膜)的pH依赖性组装。无NT的纤维和膜用作对照。

A)纤维

将NT-REP₄-CT(SEQ ID NO 20)、NT₂-REP₄-CT(SEQ ID NO 23)和REP₄-CT(SEQ ID NO 2，对照)的纤维(～0.5cm长，～50μg)浸没在pH 8的5mg/ml可溶性NTHis(SEQ ID NO 32)或NT₂-Brichos(SEQID NO 34)的100μl溶液中10分钟。通过加入400μl磷酸钠缓冲液(NaP)将pH降至pH 6并孵育10分钟以允许可溶性NT与纤维的组装。将纤维转移到pH 6的500μl NaP中并洗涤两次。最后，将纤维转移到pH 7的500μl NaP中并孵育10分钟以允许可溶性NT的释放。在300mM NaCl存在下在所有pH 6的NaP缓冲液中进行同样操作。在SDS-PAGE上分析来自不同溶液的样品。

使用NT₂-REP₄-CT和NT-REP₄-CT纤维在pH 6下捕捉NTHis和NT₂-Brichos。pH升至pH 7后，NTHis和NT₂-Brichos再次被释放并可在SDS-PAGE上检测到。300mM NaCl的加入减少了pH 6下的捕捉。

B)膜：

通过将50μl的3mg/ml的蛋白质溶液投入到塑料孔中制备NT-REP₄-CT(SEQ ID NO 20)和REP₄-CT(SEQ ID NO 2，对照)的膜并静置以过夜干燥。第二天，将pH 8的100μl的5mg/ml可溶性NTHis(SEQ ID NO 32)的溶液加入到带有膜的孔中，并静置10分钟。然后通过加入400μl的NaP将pH降至pH 6并孵育10分钟以允许可溶性NT与膜的组装。然后用pH 6的500μl NaP洗涤膜两次。为释放可溶性NTHis，加入500μl pH 7的NaP并孵育10分钟。在300mM NaCl存在下在所有pH 6的NaP缓冲液中进行同样操作。在SDS-PAGE上分析来自不同溶液的样品。

在SDS-PAGE上的分析表明NT-REP₄-CT膜允许NTHis在pH 6下被捕捉并在pH升至7以后被再次释放。

实施例16-用于融合蛋白的pH依赖性可逆组装的NT

目的：使用NT作为允许分析蛋白质部分之间的相互作用的可逆标签，例如分析Brichos与具有β折叠结构的靶，例如表面活性蛋白C(SP-C)的相互作用。

在pH 8下将NT₂-Brichos(SEQ ID NO 34)与NT₂-MetSP-C33Leu(SEQID NO 28)或NTHis(SEQ ID NO 32)混合至总体积100μl。加入NaP缓冲液(400μl)以提供最终pH为6，并孵育混合物20分钟以允许NT组装。然后再将pH升至pH 7以允许NT组装的逆转。在非变性凝胶和尺寸排阻层析(SEC)上分析来自不同溶液的样品。

实施例17-NT-MetSP-C33Leu的裂解和SP-C33Leu的分离

将实施例1中获得的约58mg的冻干的HisNT-MetSP-C33Leu(SEQID NOS：26)通过漩涡混合和超声溶解在3ml的70％甲酸水溶液中。向该溶液中加入200μl的在乙腈中的5M CNBr并在室温下孵育该混合物24h。此后在氮蒸汽下蒸发溶剂，并通过在70％的甲酸水溶液中增溶洗涤残留物三次并在氮气下干燥。

然后向干燥的残留物中加入4.56ml的氯仿/甲醇/水(以体积计8∶4∶3)，此后漩涡混合并离心混合物。去除上层相，并向下层相中加入1ml的氯仿/甲醇/水(以体积计8∶4∶3)并重复漩涡混合、离心和去除上层相。混合两个上层相并在真空下干燥。在氮气下干燥下层相。

通过SDS-PAGE分析了下层相(左泳道)和上层相(右泳道)的含量(图4)。这显示下层相包含一条具有完全符合SP-C33Leu的估算分子量的主带。通过ESI质谱和氨基酸测序证实了SP-C33Leu的身份，其显示出3594.6Da的单种同位素质量(计算为3594.4Da)和预期的氨基酸序列。

实施例18-SP-C33Leu/磷脂混合物的表面活性分析

将1，2-二棕榈酰基-sn-甘油-3-磷酸胆碱(DPPC)/1-棕榈酰基-2-油酰基-sn-甘油-3-磷酸甘油(POPG)(68∶31，w/w)溶解在氯仿∶甲醇(1∶1，v/v)中并在相同的溶剂中与SP-C33Leu(实施例17中获得的)混合。相对于磷脂的重量，该制剂中的肽含量为2％。用氮蒸发溶剂，并通过在37℃下缓慢旋转将制剂重悬在盐水中至最终磷脂浓度为10mg/ml。

通过泡沫捕捉表面张力计(CBS)一式三份地测量肺泡中的表面张力(Schurch S等人，J.Appl.Physiol.67：2389-2396，1989)。在CBS中，表面活性物质和表示肺泡的气泡存在于气密性封闭腔中。为评价动态环境下的表面活性，对腔进行压缩并通过研究气泡的形状和高/宽比计算表面张力。

在该实验中，将2μl的SP-C33Leu表面活性物质制剂(10mg/ml)插入到蔗糖填充的测试腔中。插入后，气泡产生并在5分钟的吸附期间测量表面张力。在以下准静态循环实验中，从初始体积逐步地压缩气泡直到达到小于5mN/m的表面张力，可选择地压缩至50％的最大面积压缩(maximum area compression)并然后在5个循环期间膨胀。

图5中图示了结果，其中示出了来自一个代表性实施例的三次测量的第一和第五个循环。SP-C33Leu/DPPC/POPG混合物的表面活性(图5)与相同的磷脂混合物中的合成SP-C33的表面活性非常相似，参见例如Johansson等人，J.Appl.Physiol，95：2055-2063(2003)。

实施例19-SP-C33Leu融合蛋白的产生

A)无NT(对比实施例)

构建包含编码作为2xHis₆的融合体(SEQ ID NO：35-36)的硫氧还蛋白(TRX)-SP-C33Leu的基因的表达载体。使用该载体转化大肠杆菌BL21(DE3)细胞(Merck Biosciences)，在30℃下在包含卡那霉素的LB培养基中生长至OD₆₀₀为0.9-1，用IPTG诱导，并在25℃下进一步孵育3小时。收集细胞并重悬在20mM Tris-HCl(pH 8.0)中。

加入溶菌酶，并在冰上孵育细胞30min。加入吐温至终浓度为0.7％。通过冰上超声破坏细胞，交替开2秒钟和关2秒钟地持续5min。在20000×g下离心细胞裂解液30min。将上清液上样到装载有Ni-琼脂糖的用20mM Tris-HCl(pH 8.0)+0.7％吐温平衡过的柱(GE Healthcare，Uppsala，Sweden)上。在用300mM咪唑+0.7％吐温洗脱已结合的蛋白质之前充分地洗涤柱子。

用300mM的咪唑+0.7％吐温洗脱靶蛋白并通过SDS-PAGE分析(图6A)。洗脱液包含少量且不纯的靶蛋白。

B)具有NT

构建包含编码作为2xHis6的融合体(SEQ ID NO：37-38)的TRX-NT-SP-C33Leu的基因的表达载体。使用该载体转化大肠杆菌BL21(DE3)细胞(Merck Biosciences)，在30℃下在包含卡那霉素的LB培养基中生长至OD₆₀₀为0.9-1，用IPTG诱导，并在25℃下进一步孵育3小时。收集细胞并重悬在20mM Tris-HCl(pH 8.0)中。

加入溶菌酶，并在冰上孵育细胞30min。加入吐温至终浓度为0.7％。通过冰上超声破坏细胞，交替开2秒钟和关2秒钟地持续5min。在20000×g下离心细胞裂解液30min。将上清液上样到装载有Ni-琼脂糖的用20mM Tris-HCl(pH 8.0)+0.7％吐温平衡的柱(GE Healthcare，Uppsala，Sweden)上。在用300mM咪唑+0.7％吐温洗脱已结合的蛋白质之前充分地洗涤柱子。收集包含融合蛋白的部分并对去离子水透析。

在还原条件下在12％Tris-甘氨酸凝胶上对洗脱液进行SDS-PAGE。图6B中通过箭头指出了对应于该蛋白的主带。通过来自生长至OD₆₀₀为1的1升摇瓶培养物的纯化的蛋白质mg数确定收率。收率为30mg/l。

实施例20-Rrichos的制备

构建包含编码作为His₆LinkHis₆的融合体(SEQ ID NO：39-40)的NT₂-Brichos(即NTNT-Brichos)的基因的表达载体。使用该载体转化大肠杆菌BL21(DE3)细胞(Merck Biosciences)，在30℃下在包含卡那霉素的LB培养基中生长至OD₆₀₀为0.9-1，用IPTG诱导，并在25℃下进一步孵育3小时。收集细胞并重悬在20mM Tris-HCl(pH 8.0)中。

加入溶菌酶，并在冰上孵育细胞30min。通过冰上超声破坏细胞，交替开2秒钟和关2秒钟地持续5min。在20000×g下离心细胞裂解液30min。将上清液上样到装载有Ni-琼脂糖的柱(GE Healthcare，Uppsala，Sweden)上。在用300mM咪唑洗脱已结合的蛋白质之前充分地洗涤柱子。收集包含融合蛋白的部分并对20mM Tris-HCl(pH 8.0)透析。

在还原条件下在12％Tris-甘氨酸凝胶上对洗脱液进行SDS-PAGE。图7中通过箭头指出了对应于融合蛋白的主带。通过来自生长至OD₆₀₀为1的1升摇瓶培养物的纯化的蛋白质mg数确定收率。收率是28mg/l的融合蛋白。

通过使用蛋白酶3C∶融合蛋白的比例为1∶100(w/w)在4℃下蛋白酶裂解，Brichos蛋白质(SEQ ID NO：41)从2His₆NT₂标签上释放。为去除释放的2His₆NT₂标签，将裂解混合物上样到第二Ni-琼脂糖上并收集流出液。

实施例21-绿色荧光蛋白(GFP)的制备

该实施例中使用的GFP是S147P变体，参见Kimata，Y等人，Biochem.Biophys.Res.Commun.232：69-73(1997)。

A)具有NT

构建包含编码作为His₆LinkHis₆的融合体(SEQ ID NO：42-43)的NT₂-GFP(即NTNT-GFP)的基因的表达载体。使用该载体转化大肠杆菌BL21(DE3)细胞(Merck Biosciences)，在30℃下在包含卡那霉素的LB培养基中生长至OD₆₀₀为0.9-1，用IPTG诱导，并在25℃下进一步孵育3小时。收集细胞并重悬在20mM Tris-HCl(pH 8.0)中。

加入溶菌酶，并在冰上孵育细胞30min。通过冰上超声破坏细胞，交替开2秒钟和关2秒钟地持续5min。在20000×g下离心细胞裂解液30min。将上清液上样到装载有Ni-琼脂糖的柱(GE Healthcare，Uppsala，Sweden)上。在用300mM咪唑洗脱已结合的蛋白质之前充分地洗涤柱子。收集包含融合蛋白的部分并对20mM Tris-HCl(pH 8.0)透析。通过使用蛋白酶3C∶融合蛋白的比例为1∶100(w/w)在4℃下蛋白酶裂解，GFP蛋白质(SEQ ID NO：44)从2His₆NT₂标签上释放。为去除释放的2His₆NT₂标签，将裂解混合物上样到第二Ni-琼脂糖上并收集流出液。

在还原条件下在12％Tris-甘氨酸凝胶上对洗脱液进行SDS-PAGE(图8)。图8中通过箭头指出了对应于融合蛋白(第一洗脱液，左泳道)和靶蛋白(第二洗脱液，右泳道)的主带。通过来自生长至OD₆₀₀为1的1升摇瓶培养物的纯化的蛋白质mg数确定收率。收率是44mg/l的融合蛋白和16mg/l的靶蛋白。

纯化的GFP是高度荧光的，确认了专门用于自催化形成生色团的正确折叠(具有连接性α螺旋的β桶)。

B)带有其他纯化标签：Zb和His ₆ ABP(对比实施例)

在37℃下在补充有卡那霉素的胰蛋白酶大豆肉汤培养基中过夜培养携带载体(pT7ZbGFP、pT7His6ABPGFP)的BL21(DE3)细胞。第二天早上，将培养物接种到1升摇瓶的100ml新鲜培养基中并培养直至达到OD₆₀₀为1。然后通过加入IPTG至最终浓度为1mM诱导蛋白质产生并持续产生18h。收集细胞并重悬在50mM磷酸钠缓冲液(pH 7.5)中。通过冰上超声破坏细胞，交替开1秒钟和关1秒钟地持续3min。在10000×g下离心细胞裂解液20min。将上清液上样到柱上。

在1ml HiTrap S HP柱上在pH 7.5的50mM磷酸钠中纯化ZbGFP(SEQ ID NO：45)融合蛋白并用补充有160mM NaCl的相同缓冲液洗脱。

在1ml的Talon柱上在pH 8的50mM磷酸钠中纯化His₆ABPGFP(SEQ ID NO：46)融合蛋白并用补充有30mM乙酸和70mM乙酸钠的提供5.0的pH的相同缓冲液洗脱。

在还原条件下在10-20％梯度凝胶上对洗脱液进行SDS-PAGE。通过纯化的蛋白质mg数/1升生长至OD₆₀₀为1的摇瓶培养物确定收率。对于ZbGFP收率是10mg/l且对于His₆ABPGFP是7mg/l。

实施例22-神经丝抑蛋白的制备

构建包含编码作为His₆LinkHis₆的融合体(SEQ ID NO：47-48)的NT₂-神经丝抑蛋白(即，NTNT-神经丝抑蛋白)的基因的表达载体。使用该载体转化大肠杆菌BL21(DE3)细胞(Merck Biosciences)，在30℃下在包含卡那霉素的LB培养基中生长至OD₆₀₀为0.9-1，用IPTG诱导，并在25℃下进一步孵育3小时。收集细胞并重悬在20mM Tris-HCl(pH 8.0)中。

加入溶菌酶，并在冰上孵育细胞30min。通过冰上超声进一步破坏细胞，交替开2秒钟和关2秒钟地持续5min。在20000×g下离心细胞裂解液30min。将上清液上样到装载有Ni-琼脂糖的柱(GE Healthcare，Uppsala，Sweden)上。在用300mM的咪唑洗脱已结合的蛋白质之前充分地洗涤柱子。收集包含融合蛋白的部分并对20mM Tris-HCl(pH 8.0)透析。

通过使用蛋白酶3C∶融合蛋白的比例为1∶100(w/w)在4℃下蛋白酶裂解，神经丝抑蛋白(SEQ ID NO：49)从2His₆NT₂标签上释放。为去除释放的2His₆NT₂标签，将裂解混合物上样到第二Ni-琼脂糖上并收集流出液。

在还原条件下在12％Tris-甘氨酸凝胶上对洗脱液进行SDS-PAGE(图9)。图9中通过箭头指出了对应于融合蛋白(第一洗脱液，左泳道)和靶蛋白(第二洗脱液，右泳道)的主带。通过来自生长至OD₆₀₀为1的1升摇瓶培养物的纯化的蛋白质mg数确定收率。收率是8mg/l的融合蛋白和4mg/l的靶蛋白。作为对比，带有His₆标签的神经丝抑蛋白的表达收率是1.7mg/l(Belorgey等人Eur J Biochem.271(16)：3360-3367(2004))。

所表达的神经丝抑蛋白对tPa(组织纤溶酶原激活物)的抑制率经测定与早期发表的相同(Belorgey等人J.Biol.Chem.277，17367-17373(2002))。

实施例23-蛋白酶3C融合蛋白的制备

构建分别包含编码His₆NT-3C和His₆LinkHis₆NTNT3C的基因的表达载体(T.等人，Protein Expr Purif 9(1)：125-132(1997)；CordingleyMG.等人，J.Virol.63(12)：5037-5045(1989))。使用这些载体转化大肠杆菌BL21(DE3)细胞(Merck Biosciences)，在30℃下在包含卡那霉素的LB培养基中生长至OD₆₀₀为0.9-1，用IPTG诱导，并在25℃下进一步孵育3小时。收集细胞并重悬在20mM Tris-HCl(pH 8.0)中。

加入溶菌酶和DNA酶，并在冰上孵育细胞30min。通过冰上超声破坏细胞，交替开1秒钟和关1秒钟地持续3min。在15000×g下离心细胞裂解液30min。将上清液上样到装载有Ni-琼脂糖的用20mM Tris-HCl(pH8.0)平衡的柱(GE Healthcare，Uppsala，Sweden)上。在用300mM咪唑洗脱已结合的蛋白质之前充分地洗涤柱子。收集包含融合蛋白的部分并对去离子水透析。在还原条件下对洗脱液进行SDS-PAGE。通过来自生长至OD₆₀₀为1的1升摇瓶培养物的纯化的蛋白质mg数确定收率。

Claims

1.一种融合蛋白，包含：

(i)衍生自蜘蛛丝蛋白的N端(NT)片段的至少一个溶解度增强部分；和

(ii)是期望的非拖丝蛋白的蛋白质或多肽的至少一个部分，

其中每个溶解度增强部分与所述期望的蛋白质或多肽部分直接或间接连接。

2.根据权利要求1所述的融合蛋白，其中每个溶解度增强部分与SEQID NO 6具有至少80％的同一性或与SEQ ID NO 8具有至少50％的同一性。

3.根据任一项前述权利要求所述的融合蛋白，其中每个溶解度增强部分包含100至160个氨基酸残基。

4.根据任一项前述权利要求所述的融合蛋白，其中所述融合蛋白包含至少两个溶解度增强部分，所述溶解度增强部分的每一个衍生自蜘蛛丝蛋白的N端(NT)片段。

5.根据权利要求4所述的融合蛋白，其中所述融合蛋白包含至少两个连续的溶解度增强部分，所述溶解度增强部分的每一个衍生自蜘蛛丝蛋白的N端(NT)片段。

6.根据任一项前述权利要求所述的融合蛋白，其中至少一个溶解度增强部分与至少一个期望的蛋白质或多肽部分的氨基末端或羧基末端直接或间接连接。

7.根据权利要求6所述的融合蛋白，其中至少一个溶解度增强部分构成所述融合蛋白的氨基末端和/或羧基末端。

8.根据任一项前述权利要求所述的融合蛋白，还包含：

(iii)设置在至少一个期望的蛋白质或多肽部分与至少一个溶解度增强部分之间的至少一个裂解位点。

9.根据任一项前述权利要求所述的融合蛋白，其中所述期望的蛋白质或多肽与SEQ ID NO：6-10中的任何一个具有小于30％的同一性。

10.根据权利要求9所述的融合蛋白，其中所述期望的蛋白质或多肽衍生自海绵动物、栉水母、水母、珊瑚、海葵、扁虫、轮虫、蛔虫、纽虫、蛤、蜗牛、章鱼、节肢虫、甲壳动物、昆虫、苔藓动物、腕足动物、帚虫类、海星、海胆、被囊动物、文昌鱼、包括人类的脊椎动物、植物、真菌、酵母、细菌、古细菌或病毒或是人工蛋白质或多肽。

11.根据权利要求10所述的融合蛋白，其中所述期望的蛋白质或多肽衍生自软体动物、昆虫、包括人类的脊椎动物、植物、真菌、酵母、细菌、古细菌或病毒或是人工蛋白质或多肽。

12.根据权利要求11所述的融合蛋白，其中所述期望的蛋白质或多肽衍生自包括人类的脊椎动物、植物、真菌、酵母、细菌、古细菌或病毒或是人工蛋白质或多肽。

13.根据权利要求9-12中任一项所述的融合蛋白，其中所述期望的蛋白质或多肽选自由淀粉样形态的蛋白质和多肽、含二硫键的蛋白质和多肽、载脂蛋白、膜蛋白和多肽、蛋白质和多肽药物及药靶、易于聚集的蛋白质和多肽及蛋白酶组成的组。

14.根据权利要求13所述的融合蛋白，其中所述期望的蛋白质或多肽选自由以下组成的组：Aβ-肽、IAPP、PrP、α-突触核蛋白、降钙素、催乳素、半胱氨酸蛋白酶抑制剂、ATF和肌动蛋白；SP-B、α-防卫素和β-防卫素；A-H类载脂蛋白；LL-37、SP-C、SP-C33、SP-C33Leu、Brichos、GFP、神经丝抑蛋白；激素，包括EPO和GH，及生长因子，包括IGF-I和IGF-II；亲和素和链霉亲和素；和蛋白酶3C。

15.根据任一项前述权利要求所述的融合蛋白，选自由以下组成的组：SEQ ID NO 26、28、30、34、37、39、42和47；和与这些蛋白质中的任何一种具有至少80％同一性的蛋白质。

16.一种编码根据任一项前述权利要求所述的融合蛋白的分离的多核酸。

17.根据权利要求16所述的分离的多核酸，选自由编码根据权利要求15所述的融合蛋白的核酸组成的组和由SEQ ID NO 27、29、31、38、40、43和48组成的组。

18.衍生自蜘蛛丝蛋白的N端(NT)片段的至少一个部分作为融合蛋白中的溶解度增强部分用于制备期望的非拖丝蛋白的蛋白质或多肽的用途。

19.一种制备融合蛋白的方法，所述方法包括以下步骤：

a)在合适的宿主中表达根据权利要求1-15中任一项所述的融合蛋白；和

b)获得包含所述融合蛋白的混合物，并任选地分离所述融合蛋白。

20.一种制备期望的蛋白质或多肽的方法，所述方法包含下列步骤：

b)获得包含所述融合蛋白或多肽的混合物，并任选地分离所述融合蛋白或多肽。

21.根据权利要求20所述的方法，还包括以下步骤：

c)裂解所述融合蛋白以提供所述期望的蛋白质或多肽；和

d)分离所述期望的蛋白质或多肽；

其中所述融合蛋白包含：

22.根据权利要求19-21中任一项所述的方法，其中步骤b)还包括在具有固定的NT部分的亲和介质上和/或在阴离子交换介质上纯化所述融合蛋白。

23.根据权利要求22所述的方法，其中通过结合4.2-6.3的pH下的具有固定的NT部分的亲和介质，然后用期望的离解介质从所述亲和介质上离解，进行所述融合蛋白在亲和介质上的纯化。

24.根据权利要求23所述的方法，其中所述离解介质具有6.4或更高的pH、4.1或更低的pH和/或具有高的离子强度。

25.根据权利要求22-24中任一项所述的方法，其中所述融合蛋白在亲和介质上的纯化是通过结合6.4或更高的pH下的阴离子交换介质，然后用具有高离子强度的离解介质从所述阴离子交换介质上离解而进行。

26.根据权利要求22-25中任一项所述的方法，其中步骤b)中的所述融合蛋白的纯化发生在柱中、具有官能化表面的磁珠上或具有官能化表面的滤器上。