CN103360471A

CN103360471A - 非结构化重组聚合物和其应用

Info

Publication number: CN103360471A
Application number: CN2013102482771A
Authority: CN
Inventors: V·斯切利伯格; W·P·施特默尔; C·-W·王; M·D·肖尔勒; M·波普克弗; N·C·戈登; A·克拉默
Original assignee: Amunix Inc
Current assignee: Amunix Inc
Priority date: 2006-03-06
Filing date: 2007-03-06
Publication date: 2013-10-23
Anticipated expiration: 2027-03-06
Also published as: HK1203624A1; DK1996220T3; EP2402754B9; ES2529315T5; CN103360471B; ES2529315T9; JP6175030B2; EP2402754A3; JP2016185990A; DK1996220T4; FI1996220T4; EP2402754B1; JP2015006202A; FI2402754T4; EP2402754B2; JP2014198050A; ES2417153T3; ES2529315T3; ES2417153T5; EP2402754A2

Abstract

本发明提供了非结构化重组聚合物(URP)以及含有一个或多个URP的蛋白质。本发明也提供微生物蛋白、毒素和其它相关蛋白实体，以及展示这些实体的遗传包。本发明也提供包含编码主题蛋白实体的载体的重组多肽，以及包含该载体的宿主细胞。主题组合物具有各种应用，包括一系列药物应用。

Description

非结构化重组聚合物和其应用

本申请是申请日为2007年3月6日、申请号为200780015899.2、发明名称为“非结构化重组聚合物和其应用”的发明专利申请的分案申请。

交叉参考

本申请要求2006年3月6日提交美国临时申请号60/743,410的优先权，将该申请纳入本文作为参考。本申请是2006年9月27日提交的11/528,927和11/528,950的部分继续申请，它们要求9/27/2005提交的临时申请序列号60/721,270、60/721,188以及03/21/06提交的60/743,622的优先权，将它们的全文纳入本文作为参考。

发明背景

已有文献报道可通过将亲水聚合物与蛋白连接可改进蛋白某些性质，特别是血浆清除率及免疫原性(Kochendoerfer，G.(2003)Expert Opin Biol Ther，3：1253-61)，(Greenwald，R.B.等(2003)Adv Drug Deliv Rev，55：217-50)，(Harris，J.M.等(2003)Nat Rev Drug Discov，2：214-21)。被FDA批准用于治疗病人的聚合物修饰蛋白的例子是阿达金(Adagen)、昂卡斯帕(Oncaspar)、PEG-内含子、派罗欣(Pegasys)、索马沃(Somavert)以及纽拉思塔(Neulasta)。更多的聚合物修饰蛋白正处于临床试验中。这些聚合物通过增加修饰蛋白相对于未修饰蛋白的流体动力学半径(也称作斯托克斯半径)而降低肾滤过清除率，从而发挥效能(Yang，K.等(2003)Protein Eng，16：761-70)。此外，聚合物连接能减少修饰蛋白与其它蛋白、细胞或表面的相互作用。具体说，聚合物连接能减少修饰蛋白与免疫系统的抗体和其它组分相互作用从而降低宿主对修饰蛋白的免疫应答。尤感兴趣的是通过PEG化，即连接线性或分枝聚乙二醇聚合物来修饰蛋白。PEG化降低免疫原性的例子如苯丙氨酸解氨酶(Gamez，A.等(2005)Mol Ther，11：986-9)、抗体(Deckert，P.M.等(2000)Int J Cancer，87：382-90.)、葡激酶(Collen，D.等(2000)Circulation，102：1766-72)和血红蛋白(Jin，C.等(2004)ProteinPept Lett，11：353-60)。一般地，在纯化未修饰蛋白后，通过化学修饰步骤将此类聚合物与感兴趣蛋白连接。

可将多种聚合物与蛋白连接。尤感兴趣的是具有可变构象并在水溶液中很好水合的亲水聚合物。常用的聚合物是聚乙二醇(PEG)。相对其分子量，这些聚合物趋于具有较大的流体动力学半径(Kubetzko，S.等(2005)MolPharmacol，68：1439-54)。所连接的聚合物与其连接的蛋白趋于具有有限相互作用，因此聚合物修饰蛋白能保持其相关功能。

聚合物与蛋白质的化学偶联需要复杂的多步过程。典型地，蛋白组分须在化学偶联步骤之前产生并纯化。偶联步骤可导致产生需要分离的产物混合物，在分离时会引起产物显著损失。或者，此类混合物可用作最终药物产品。目前上市的一些例子包括以混合物形式使用的PEG化干扰素-α产品(Wang，B.L.等(1998)JSubmicrosc Cytol Pathol，30：503-9；Dhalluin，C.等(2005)BioconjugChem，16：504-17)。此类混合物难以生产鉴定，并且包含降低或无治疗活性的异构体。

已描述过允许位点特异性增加聚合物如PEG的方法。例子如靶蛋独特糖基化位点的选择性PEG化或对工程构建入靶蛋白的非天然氨基酸的选择性PEG化。在一些情况下可通过仔细控制反应条件选择性PEG化蛋白质N末端而避免靶蛋白赖氨酸侧链的PEG化。而另一靶蛋白位点特异性PEG化的方法是引入可选择性偶联的半胱氨酸残基。所有这些方法都有明显的局限性。N末端的选择性PEG化需要仔细的过程控制并难以消除副反应。引入用于PEG化的半胱氨酸可干扰蛋白质生产和/或纯化。特异性引入非天然氨基酸需要特定宿主生物体用于蛋白质生产。PEG化的另一局限性是通常PEG以聚合物混合物形式生产，这些混合物长度相似但不一致。其它化学聚合物也具有同一局限性。

利用多功能聚合物的化学偶联允许合成具有多个蛋白模块的产物，这种偶联比聚合物与单一蛋白结构域偶联更为复杂。

近来观察到病原生物体的一些蛋白质含有重复肽序列，这些序列似乎导致包含这些序列的蛋白质血清半衰期相对较长(Alvarez，P.等(2004)J Biol Chem，279：3375-81)。也表明将基于此类病原体衍生重复序列的寡聚序列与其它蛋白融合可引起血清半衰期增加。然而，这些病原体来源的寡聚体有一些缺陷。病原体来源的序列趋于有免疫原性。也有描述称修饰这些序列可减少其免疫原性。然而，尚未有报道尝试从参与免疫反应形成的序列中移除T细胞表位。而且，药学应用中要求序列具有好的可溶性及对其它靶蛋白的非常低的亲合力，而尚未根据此种药学应用对抗原来源的序列进行优化。

因此，亟需能够允许将多个聚合物模块和多个蛋白质模块组合成所定义的多结构域产物的组合物和方法。

发明概述

本发明提供含有至少40个毗连氨基酸的非结构化重组聚合物(URP)，其中所述URP基本不能与血清蛋白非特异性结合，并且其中(a)URP包含的甘氨酸(G)、天冬氨酸(D)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、谷氨酸(E)和脯氨酸(P)残基总量超过URP氨基酸总量的约80％；和/或(b)Chou-Fasman算法测定至少50％氨基酸缺少二级结构。在相关实施方式中，本发明提供一种包含至少40个毗连氨基酸的非结构化重组聚合物(URP)，其中所述URP的体外血清降解半衰期长于约24小时，并且其中(a)URP中所包含的甘氨酸(G)、天冬氨酸(D)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、谷氨酸(E)和脯氨酸(P)残基的总量超过URP氨基酸总量的约80％；和/或(b)Chou-Fasman算法测定至少50％氨基酸缺少二级结构。主题URP可包含非天然氨基酸序列。所期望的是，选择URP用于掺入异源蛋白质，一旦URP掺入异源蛋白质后，与未掺入所述URP的对应蛋白质相比，所述异源蛋白质表现出较长的血清分泌半衰期和/或较高的溶解性。半衰期可延长2倍、3倍、5倍、10倍或更长。在一些例子中，URP掺入异源蛋白质引起经体积排阻色谱估测的表观分子量提高至少2倍、3倍、4倍、5倍或更多。在一些例子中，URP的T表位评分小于-3.5(如，-4或更低，-5或更低)。在一些例子中，URP可主要包含亲水残基。所期望的是，Chou-Fasman算法测定至少50％氨基酸缺少二级结构。URP中包含的甘氨酸残基占URP所包含总氨基酸的至少50％。在一些例子中，包含于URP中选自甘氨酸(G)、天冬酰胺(D)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、谷氨酸(E)或脯氨酸(P)的任一类型氨基酸独自占URP总氨基酸的含量大于约20％、30％、40％、50％、60％或更高。在一些例子中，URP包含大于约100、150、200或更多个毗连氨基酸。

本发明也提供含有一个或多个主题URP的蛋白质，其中主题URP与蛋白质为异源。聚集URP总长度可超过约40、50、60、100、150、200或更多个氨基酸。该蛋白可包含一个或多个功能模块，功能模块可选自效应模块、结合模块、N末端模块、C末端模块或其任意组合。所期望的是，主题蛋白含有多个结合模块，其中单个结合模块对于同一或不同靶点具有结合特异性。结合模块可包含由支架内半胱氨酸配对形成的含二硫化物的支架。结合模块可与选自细胞表面蛋白、分泌蛋白、胞浆蛋白或核蛋白的靶分子结合。靶点可为离子通道和/或GPCR。所期望是的，效应模块可为毒素。含有主题URP的蛋白的半衰期通常比不含所述URP的对应蛋白长2、3、4、5、10或更多倍。

在独立的实施方案中，本发明提供包含至少3个氨基酸序列重复单位的非天然产生的蛋白质，每一重复单位包含至少6个氨基酸，其中一种或多种天然人蛋白中存在包含至少三个重复单位的约6-15个毗连氨基酸的多个区段。在一方面，一种或多种天然人蛋白中存在多个区段或每一在重复单位内含有约9-15个毗连氨基酸的区段。该区段可包含约9-15个氨基酸。三个重复单位可具有显著序列同源性，如当比对时序列同一性大于约50％、60％、70％、80％、90％或100％。该非天然蛋白也可包含一种或多种选自结合模块、效应模块、多聚化模块、C末端模块或N末端模块的模块。所期望的是，非天然蛋白质可包含具有主题非结构化重组聚合物(URP)的单个重复单位。

本发明也提供包含编码主题URP、含URP的蛋白质、微生物蛋白和毒素的重组多核苷酸。本发明也提供含有主题多核苷酸的载体、携带该载体的宿主细胞、展示主题URP的遗传包、含URP的蛋白质、毒素或本文公开的其它任意蛋白实体。本文还提供本发明表达载体的选择性文库。

本发明也提供了产生包含非结构化重组聚合物(URP)的方法。所述方法包括(i)提供含有编码所述蛋白的重组多核苷酸的宿主细胞，所述蛋白含有一个或多个URP，所述URP含有至少40个毗连氨基酸，其中所述URP基本不能与血清蛋白非特异性结合，并且其中(a)URP中所含甘氨酸(G)、天冬氨酸(D)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、谷氨酸(E)和脯氨酸(P)残基的总量超过URP总氨基酸量的约80％；和/或(b)Chou-Fasman算法测定至少50％氨基酸缺少二级结构；和(ii)在合适条件下，合适培养基中培养所述宿主细胞，以便由所述多核苷酸表达所述蛋白。合适宿主细胞是真核(如CHO细胞)和原核细胞。

本发明也提供延长蛋白质血清分泌半衰期的方法，包括：将所述蛋白质与一个或多个非结构化重组聚合物(URP)融合，其中，URP包含至少40个毗连氨基酸，其中(a)URP中所含甘氨酸(G)、天冬氨酸(D)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、谷氨酸(E)和脯氨酸(P)残基的总量超过URP总氨基酸量的约80％；和/或(b)Chou-Fasman算法测定至少50％氨基酸缺少二级结构；所述URP基本不能与血清蛋白非特异性结合。

本发明也提供检测遗传包展示的外源性蛋白和靶点之间是否存在特异性互相作用的方法，其中所述蛋白包含一个或多个非结构化重组聚合物(URP)，所述方法包括：(a)提供展示包含一个或多个非结构化重组聚合物(URP)的蛋白的遗传包；(b)在适合产生稳定的蛋白-靶点复合物的条件下使遗传包与靶点相接触；和(c)检测遗传包上稳定蛋白-靶点复合物的形成，从而检测特异性互相作用的存在。所述方法还可包括获得来自遗传包的编码外源性蛋白的核苷酸序列。在一些例子中，在URP和包含血清蛋白的靶点间存在或不存在特异性相互作用。在一些例子中，在URP和包含血清蛋白酶的靶点间存在或不存在特异性相互作用。

本发明还包括展示微生物蛋白的遗传包，其中所述微生物蛋白保持与其天然靶点的结合能力。在一些方面，微生物蛋白展示与至少一个离子通道家族的结合能力，所述离子通道家族选自钠、钾、乙酰胆碱或氯通道。所期望的是，所述微生物蛋白是离子通道结合微生物蛋白，并且被修饰以(a)与对应的未修饰的微生物蛋白比，能够结合不同通道家族；(b)与对应的未修饰的微生物蛋白比，所述微生物蛋白与同一通道家族的不同亚家族结合；(c)与对应的未修饰的微生物蛋白比，所述微生物蛋白与同一通道亚家族的不同种类结合；(d)与对应的未修饰的微生物蛋白比，所述微生物蛋白与同一通道的不同位点结合；和/或(e)与对应的未修饰的微生物蛋白比，所述微生物蛋白与同一通道的同一位点结合，但产生不同的生物学效应。在某些方面，所述微生物蛋白是毒素。本发明也提供展示主题微生物蛋白和/或毒素的遗传包文库。所期望的是，所述遗传包展示保持部分或全部毒性谱的蛋白毒素。该毒素可来源于单个毒素蛋白，或衍生自毒素家族。本发明也提供了一种遗传包文库，其中所述文库展示毒素家族，其中所述家族保持部分或全部的天然毒性谱。

本发明还提供了包含多个离子通道结合域的蛋白，其中单个结构域为微生物蛋白结构域，该微生物蛋白结构域被修饰以(a)与对应的未修饰的微生物蛋白结构域比，能够结合不同通道家族；(b)与对应的未修饰的微生物蛋白结构域比，所述微生物蛋白结构域与同一通道家族的不同亚家族结合；(c)与对应的未修饰的微生物蛋白结构域比，所述微生物蛋白结构域与同一通道亚家族的不同种类结合；(d)与对应的未修饰的微生物蛋白结构域比，所述微生物蛋白结构域与同一通道的不同位点结合；(e)与对应的未修饰的微生物蛋白结构域比，所述微生物蛋白结构域与同一通道的同一位点结合，但产生不同的生物学效应；和/或(f)与对应的未修饰的微生物蛋白结构域比，所述微生物蛋白结构域与同一通道的同一位点结合并产生相同生物学效应。

本发明也涉及获取具有所需性质的微生物蛋白的方法，所述方法包括(a)提供主题文库；和(b)筛选选择性文库以获取至少一种展示具有所需性质的微生物蛋白的噬菌体。也提供任一所公开方法中使用的多核苷酸、载体、遗传包和宿主细胞。

具体地，本发明涉及以下各项：

1.一种非结构化重组聚合物(URP)，其含有至少40个毗连氨基酸，所述URP基本不能非特异性结合血清蛋白，其中：

(a)所述URP中所含的甘氨酸(G)、天冬氨酸(D)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、谷氨酸(E)和脯氨酸(P)残基之和占所述URP中全部氨基酸的约80％以上；和/或

(b)经Chou-Fasman算法测定至少50％的所述氨基酸缺少二级结构。

2.一种非结构化重组聚合物(URP)，其含有至少40个毗连氨基酸，所述URP的体外血清降解半衰期大于约24小时，其中：

(b)经Chou-Fasman算法测定至少50％的所述氨基酸缺少二级结构。

3.如第1或2项所述的URP，其特征在于，所述URP包含非天然氨基酸序列。

4.如第1或2项所述的URP，其特征在于，选择所述URP掺入异源蛋白质中，将所述URP掺入异源蛋白质后，与不含所述URP的相应蛋白质相比，所述异源蛋白质的血清半衰期较长和/或溶解度较高。

5.如第1或2项所述的URP，其特征在于，将所述URP掺入异源蛋白质后，所述异源蛋白质的血清分泌半衰期比不含所述URP的相应蛋白质长至少2倍。

6.如第1或2项所述的URP，其特征在于，将所述URP掺入异源蛋白质导致该蛋白经大小排阻色谱估算的表观分子量增加至少2倍。

7.如第1或2项所述的URP，其特征在于，所述URP的T表位评分小于-4。

8.如第1或2项所述的URP，其特征在于，所述氨基酸主要是亲水性残基。

9.如第1或2项所述的URP，其特征在于，经Chou-Fasman算法测定所述URP中至少50％氨基酸缺少二级结构。

10.如第1或2项所述的URP，其特征在于，所述URP中甘氨酸残基占所述URP中全部氨基酸的至少约50％。

11.如第1或2项所述的URP，其特征在于，选自甘氨酸(G)、天冬氨酸(D)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、谷氨酸(E)或脯氨酸(P)的任何一种类型的氨基酸单独占所述URP中全部氨基酸的约20％以上。

12.如第1或2项所述的URP，其特征在于，选自甘氨酸(G)、天冬氨酸(D)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、谷氨酸(E)或脯氨酸(P)的任何一种类型的氨基酸单独占所述URP中全部氨基酸的约40％以上。

13.如第1或2项所述的URP，其特征在于，所述URP包含约100个以上的毗连氨基酸。

14.如第1或2项所述的URP，其特征在于，所述URP包含约200个以上的毗连氨基酸。

15.如第1或2项所述的URP，其含有重复序列。

16.如第1或2项所述的URP，其特征在于，选自甘氨酸(G)、天冬氨酸(D)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、谷氨酸(E)或脯氨酸(P)的任何一种类型的氨基酸单独占所述URP中全部氨基酸的50％以上。

17.一种含有第1或2项所述一个或多个URP的蛋白质，其中所述一个或多个URP与该蛋白质异源。

18.如第17项所述的蛋白质，其特征在于，其包含效应模块。

19.如第17项所述的蛋白质，其特征在于，其包含结合模块。

20.如第17项所述的蛋白质，其特征在于，其包含效应模块和结合模块。

21.如第17项所述的蛋白质，其特征在于，其包含多个结合模块，其中单个结合模块对相同或不同靶点有结合特异性。

22.如第17项所述的蛋白质，其特征在于，聚集URP总长度超过约150个氨基酸。

23.如第17项所述的蛋白质，其特征在于，其包含一个或多个结合模块，所述结合模块包含通过支架内半胱氨酸配对形成的含二硫键的支架。

24.如第17项所述的蛋白质，其特征在于，其包含具有细胞毒性的效应模块。

25.如第17项所述的蛋白质，其特征在于，其包含靶分子特异性结合模块，其中所述靶点选自细胞表面蛋白、分泌蛋白、胞浆蛋白或核蛋白。

26.如第17项所述的蛋白质，其特征在于，其包含靶分子特异性结合模块，其中所述靶点是离子通道。

27.如第17项所述的蛋白质，与不含所述URP的相应蛋白质相比，其血清分泌半衰期延长至少2倍。

28.一种含有至少3个氨基酸序列重复单元的非天然产生的蛋白质，各重复单元含有至少6个氨基酸，其中含有所述至少3个重复单元中约6-15个毗连氨基酸的大部分区段出现在一种或多种天然人蛋白中。

29.如第28项所述的蛋白质，其特征在于，含有所述重复单元中约9-15个毗连氨基酸的大部分区段出现在一种或多种天然人蛋白中。

30.如第28项所述的蛋白质，其特征在于，所述蛋白质中含有约6-15个毗连氨基酸的各区段出现在至少一种天然人蛋白中。

31.如第28项所述的蛋白质，其特征在于，所述蛋白质中含有约9-15个毗连氨基酸的各区段出现在至少一种天然人蛋白中。

32.如第28项所述的蛋白质，其特征在于，所述至少3个重复单元的序列相同性大于约80％。

33.如第28项所述的蛋白质，其特征在于，所述重复单元各自包含约6-15个毗连氨基酸。

34.如第28项所述的蛋白质，其特征在于，所述重复单元各自包含约9个毗连氨基酸。

35.如第28项所述的蛋白质，其包含一个或多个选自下组的模块：结合模块、效应模块、多聚化模块、C末端模块和N末端模块。

36.如第28项所述的蛋白质，单独重复单元包含非结构化重组聚合物(URP)。

37.如第36项所述的蛋白质，其特征在于，所述URP包含至少40个毗连氨基酸，所述URP基本不能非特异性结合血清蛋白，其中：

(b)经Chou-Fasman算法测定至少50％的所述氨基酸缺少二级结构。

38.如第36项所述的蛋白质，其特征在于，所述URP包含至少40个毗连氨基酸，所述URP的体外血清降解半衰期长于约24小时，其中：

(b)经Chou-Fasman算法测定至少50％的所述氨基酸缺少二级结构。

39.一种重组多核苷酸，其包含编码第1或2项所述URP的编码序列。

40.一种重组多核苷酸，其包含编码第17项所述蛋白质的编码序列。

41.一种重组多核苷酸，其包含编码第28项所述蛋白质的编码序列。

42.一种宿主细胞，其包含第40项所述的重组多核苷酸。

43.一种宿主细胞，其包含第41项所述的重组多核苷酸。

44.一种载体，其包含第40项所述的重组多核苷酸。

45.一种载体，其包含第41项所述的重组多核苷酸。

46.一种表达载体的可选择文库，其包含第44项所述的一种以上载体。

47.一种表达载体的可选择文库，其包含第45项所述的一种以上载体。

48.一种遗传包，其展示第46项所述的文库。

49.一种遗传包，其展示第47项所述的文库。

50.一种产生含有非结构化重组聚合物(URP)的蛋白质的方法，所述方法包括：

(i)提供含有编码所述蛋白质的重组多核苷酸的宿主细胞，所述蛋白质含有一个或多个URP，所述URP含有至少40个毗连氨基酸，所述URP基本不能与血清蛋白非特异性结合，其中

(b)经Chou-Fasman算法测定至少50％的所述氨基酸缺少二级结构；

(ii)在合适条件下，合适培养基中培养所述宿主细胞，以便由所述多核苷酸表达所述蛋白质。

51.如第50项所述的方法，其特征在于，所述URP的体外血清降解半衰期长于约24小时。

52.如第50项所述的方法，其特征在于，所述宿主细胞是真核细胞。

53.如第50项所述的方法，其特征在于，所述宿主细胞是CHO细胞。

54.如第50项所述的方法，其特征在于，所述宿主细胞是原核细胞。

55.一种延长蛋白质血清分泌半衰期的方法，所述方法包括：

将所述蛋白质与一个或多个非结构化重组聚合物(URP)融合，所述URP包含约40个毗连氨基酸，其中：

(b)经Chou-Fasman算法测定至少50％的所述氨基酸缺少二级结构；

其中所述URP基本不能非特异性结合血清蛋白。

56.如第55项所述的方法，其特征在于，所述蛋白质的血清分泌半衰期延长至少2倍。

57.一种检测靶点和遗传包上展示的外源蛋白质之间是否存在特异性相互作用的方法，所述蛋白质包含一个或多个非结构化重组聚合物(URP)，所述方法包括：

(a)提供展示包含一个或多个非结构化重组聚合物(URP)的蛋白质的遗传包；

(b)在适合产生稳定的蛋白质-靶点复合物的条件下使所述遗传包与所述靶点相接触；和

(c)检测所述遗传包上所述稳定的蛋白质-靶点复合物的形成，从而检测是否存在特异性相互作用。

58.如第57项所述的方法，还包括由编码所述外源蛋白质的遗传报获得核苷酸序列。

59.如第57项所述的方法，其特征在于，在URP和含有血清蛋白的靶点之间是否存在特异性相互作用。

60.如第57项所述的方法，其特征在于，在URP和含有血清蛋白酶的靶点之间是否存在特异性相互作用。

61.如第57项所述的方法，其特征在于，所述靶点或所述蛋白质选自细胞表面蛋白、分泌蛋白、胞浆蛋白或核蛋白。

62.如第57项所述的方法，其特征在于，所述遗传包是噬菌体。

63.如第57项所述的方法，其特征在于，所述URP包含至少40个毗连氨基酸，所述URP基本不能非特异性结合血清蛋白，其中：

(b)经Chou-Fasman算法测定至少50％的所述氨基酸缺少二级结构。

64.如第57项所述的方法，其特征在于，所述URP包含至少40个毗连氨基酸，所述URP的体外血清降解半衰期长于约24小时。

65.如第50、55或57项所述的方法，其特征在于，所述URP包含非天然氨基酸序列。

66.如第50、55或57项所述的方法，其特征在于，所述URP的T表位评分小于等于-4。

67.如第50、55或57项所述的方法，其特征在于，经Chou-Fasman算法测定所述URP缺少二级结构。

68.如第50、55或57项所述的方法，其特征在于，所述URP中所含的甘氨酸残基占所述URP中全部氨基酸残基的至少约50％。

69.如第50、55或57项所述的方法，其特征在于，所述URP中所含的甘氨酸(G)、天冬氨酸(D)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、谷氨酸(E)和脯氨酸(P)残基之和占所述URP中全部氨基酸的约60％以上。

70.如第50或51项所述的URP，其特征在于，选自甘氨酸(G)、天冬氨酸(D)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、谷氨酸(E)或脯氨酸(P)的一种类型的氨基酸占所述URP中全部氨基酸的50％以上。

71.如第50、55或57项所述的方法，其特征在于，所述URP包含超过100个毗连氨基酸。

72.如第50、55或57项所述的方法，其特征在于，所述URP包含重复序列。

73.如第50、55或57项所述的方法，其特征在于，所述蛋白质是治疗性蛋白质。

74.如第50、55或57项所述的方法，其特征在于，所述蛋白质包含一个或多个选自下组的模块：结合模块、效应模块、多聚化模块、C末端模块和N末端模块。

纳入本文作参考

将本说明提及的所有发表物和专利申请纳入本文作参考，就如特别且单独地将各篇发表物或专利申请纳入本文作参考那样。

附图简要说明

本发明的新特征由所附权利要求书具体列出。下述详细描述列出的使用本发明原理的说明性实施方式和附图将使读者对本发明的特点和优势有更好的理解，附图如下：

图1显示MURP的模块组件。结合模块、效应模块以及多聚化模块以圆圈表示。URP模块、N末端和C末端模块以矩形表示。

图2显示MURP模块结构示例。一个MURP中的结合模块(BM)可具有相同或不同的靶点特异性。

图3显示基于人序列的重复蛋白可包含新氨基酸序列，该序列可包含T细胞表位。这些新序列在相邻重复单元的连接处形成。

图4展示基于三个人供体序列D1、D2和D3的重复蛋白的URP序列设计。选择此URP的重复单元，使跨越相邻单元连接的均匀(even)9-聚体序列可在至少一种人供体序列中找到。

图5是作为基于三个人蛋白序列的重复蛋白的URP序列的例子。图下方显示URP中所有9-聚体亚序列至少出现在一种人供体蛋白中。

图6基于人POU结构域残基146-182的URP序列的例子。

图7显示通过在序列间插入URP模块分隔含有富信息序列的模块的优点。左图显示直接将模块A和B融合在连接区域得到新序列。这些连接序列可为表位。右图显示在模块A和B间插入URP模块能防止形成包含来自模块A和B的部分序列的此类连接序列。取而代之的是，模块A和B的末端产生包含URP序列的连接序列，因此预测其具有低的免疫原性。

图8显示基于URP的药物递送构建物。六边形表示的药物分子与MURP化学偶联。

图9显示包含蛋白酶敏感位点的MURP。设计URP模块使其阻断效应模块功能。蛋白酶切割移除URP模块的一部分并导致效应子功能活性提高。

图10显示URP模块如何在结合模块和效应模块间作为接头。结合模块可与靶点结合并在靶点附近引起效应模块的局部浓度升高。

图11显示从短URP模块文库构建编码URP序列的基因的过程。可将URP模块文库插入到含有绿色荧光蛋白(GFP)的填充载体中，绿色荧光蛋白(GFP)作为报道物有利于高表达URP序列的识别。如图所示可通过反复二聚化构建长URP序列的编码基因。

图12显示含有多个死亡受体结合模块的MURP。三聚化触发死亡受体，因此，含有一个死亡受体的至少三个结合原件的MURP能够尤其有效的诱导细胞死亡。图的下方显示可通过加入一个或多个肿瘤组织特异性结合模块来提高MURP对于患病组织的特异性。

图13显示含有四个肿瘤抗原特异性结合模块(矩形)，和效应模块如白介素2的MURP。

图14显示构建含288个残基的URP模块的流程图。构建URP模块与GFP的融合蛋白。首先构建含36个氨基酸的URP模块文库，接着通过反复二聚化产生288个氨基酸的URP模块(rPEG_H288和rPEG_J288)。

图15288个氨基酸的URP模块(rPEG_J288)的氨基酸和核苷酸序列。

图16288个氨基酸的URP模块(rPEG_H288)的氨基酸和核苷酸序列。

图17人牙本质涎磷蛋白的富丝氨酸序列区域的氨基酸序列。

图18显示MURP衍生物储库。蛋白质包含两个能形成弱SS桥的半胱氨酸残基。加工该蛋白，保持SS桥完整。配制制剂并以还原态注射给病人。注射后它会在注射位点附近氧化并形成扩散很有限的高分子量聚合物。通过有限制的蛋白酶解或有限制的SS交联键还原，使活性MURP从注射位点缓慢滤出。

图19显示MURP的储库形式。在注射位点MURP扩散很有限，通过有限制的蛋白酶解可使其从注射位点释放。

图20显示含富组氨酸序列的MURP的储库形式。将MURP与含固化镍的不溶性珠配制在一起注射。在注射位点MURP与镍珠结合并缓慢释放进入循环。

图21显示包含多聚化模块的MURP。上图显示包含一个二聚化序列的MURP。结果是它形成有效倍增其分子量的二聚体。中图显示包含两个多聚化序列的三个MURP的设计。此MURP能形成具有非常高有效分子量的多聚体。下图显示包含多个RGD序列的MURP，已知RGD序列能够结合细胞表面受体，从而延长半衰期。

图22显示设计用于阻断或调节离子通道功能的多种MURP。圆圈表示对离子通道特异性的结合模块。这些结合模块起源于或与天然毒素相同，具有对离子通道受体亲和力。如图所示可在离子通道特异性结合模块任一侧加上其它结合域，从而提高MURP对某一细胞类型的功效或特异性。

图23显示延长半衰期的几种MURP设计。可通过增加链长(A)、化学多聚化(B)、在分子中加入非结合位点分隔开的多拷贝的结合模块(C)，构建类似C的化学多聚体(D，E)，包括多聚化序列(F)增加有效分子量。

图24显示可通过将结合模块与重组URP序列化学偶联形成的MURP。设计该URP序列，以包含多个赖氨酸残基(K)作为偶联位点。

图25显示2SS结合模块文库的设计。该序列中间包含恒定的1SS序列，1SS序列与距1SS核心不同距离的含半胱氨酸的随机序列侧接。

图26显示2SS结合模块文库的设计。该序列中间包含恒定的1SS序列，1SS序列与距1SS核心不同距离的含半胱氨酸的随机序列侧接。

图27显示1SS结合模块二聚体文库的设计。首先，通过两次PCR反应扩增1SS结合模块的集合。合并得到的PCR产物并在后续PCR步骤中产生二聚体。

图28显示在50％小鼠血清中孵育至多三天后，含288个氨基酸URP序列rPEG_J288的融合蛋白的Western分析。

图29显示对抗288个氨基酸的URP序列的预存抗体的结合检测试验结果。

图30显示包含一个(单体)、两个(二聚体)、四个(四聚体)或无(rPEG36)结合模块的MURP与包被于微量滴定板上的VEGF的特异性结合。

图31显示对EpCAM有特异性的MURP的氨基酸序列。该序列包含对EpCAM有亲和力的四个结合模块(下划线)。该序列包含全部序列中仅有的两个赖氨酸的N末端Flag序列。

图32显示1SS附加文库的设计。可将随机1SS模块加入预选结合模块的N或C末端或同时加入两个末端。

图33显示三指状毒素相关序列的比对。该图也显示NMR解析的3D结构。

图34显示基于三指状毒素的文库设计。X为随机残基。标明每一随机位置的密码子选择。

图35显示plexin相关序列的比对。

图36显示基于plexin的文库设计。X为随机残基。标明每一随机位置的密码子选择。

图37显示对DR4、ErbB2和HGFR有特异性的pexin相关结合模块的序列。

图38显示对VEGF有特异性的基于微生物蛋白的结合域的结合试验。

图39显示对VEGF有特异性的分离自构建(buildup)文库的2SS和3SS结合模块序列。上图显示热解纯化的蛋白质的PAGE胶分析。

图40显示构建URP序列rPEG_J72的克隆步骤。

图41显示构建具有称作rPEG_J36的36个氨基酸的URP模块文库。将三个编码rPEG_J12的较短区段及终止模块连接组装成为rPEG_J36编码区域。

图42显示填充载体pCW0051的核苷酸序列和翻译。填充区域侧接于BsaI和BbsI位点，且包含多个终止密码子。

图43显示与GFP融合的URP rPEG_J288的纯化的PAGE胶。泳道2为细胞裂解物；泳道3：IMAC纯化产物；泳道4：抗-Flag纯化产物。

图44rPEG_J288与人效应子结构域干扰素α、G-CSF和人生长激素的融合蛋白的氨基酸序列。

图45显示rPEG_J288和人生长激素(泳道1和2)、干扰素α(泳道3和4)和GFP(泳道5和6)的融合蛋白表达的Western分析。分析每一蛋白的可溶性和不溶性材料。

图46显示基于毒素OSK1的MURP的设计。如图所示可在OSK1任一侧加上URP序列和/或结合模块。

图47描述了含有主题URP的示例性产物形式。

发明详述

尽管本文描述了本发明的优选实施方式，但本领域熟练技术人员应当清楚此类实施方式仅提供作为举例说明。本领域技术人员可在不背离本发明的前提下做出不同的变化、更改和替代。应理解，在实施本发明当中可使用多种本文所述实施方式的另选方案。本文意在利用所附权利要求书定义本发明的范围，在这些权利要求范围内的方法和结构以及其等价形式也因此被覆盖。

一般技术：

除非另有标明，本发明实施采用常规免疫学、生物化学、化学、分子生物学、微生物学、细胞生物学、基因组学以及重组DNA技术，这些均在本领域人员技能范围之内。参见Sambrook，Fritsch和Maniatis，MOLECULARCLONING：A LABORATORY MANUAL(分子克隆：实验室手册)，第二版(1989)；CURRENT PROTOCOLS IN MOLECULAR BIOLOGY(新编分子生物学方法)(F.M.Ausubel等编，(1987))；METHODS IN ENZYMOLOGY(酶学方法丛书)(学术出版社(Academic Press))：PCR2：A PRACTICAL APPROACH(PCR2：实践方法)(M.J.MacPherson，B.D.Hames和G.R.Taylor编(1995))，Harlow和Lane，编(1988)ANTIBODY，A LABORATORY MANUAL(抗体，实验室手册)和ANIMAL CELL CULTURE(动物细胞培养)(R.I.Freshney，编(1987))。

定义：

在说明书和权利要求书中所使用单数形式“一个”、“一种”和“一”包括其复数形式，除非上下文另有指示。例如，术语“一个细胞”包括细胞的复数形式，及其混合物。

本文中术语“多肽”、“肽”、“氨基酸序列”和“蛋白质”可互换使用，指任意长度氨基酸的聚合物。该聚合物可为线性或分枝，可包含修饰氨基酸，也可被非氨基酸打断。该术语也涵盖修饰的氨基酸聚合物，例如，形成二硫键、糖基化、脂化、乙酰化、磷酸化或其它任何操作，如与标记组分偶联的聚合物。本文所用术语“氨基酸”指天然和/或非天然或合成的氨基酸，包括但不限于甘氨酸和D或L光学异构体，氨基酸类似物和肽模拟物。使用标准单或三字母编码表示氨基酸。

“重复序列”是可被描述为重复肽序列、形成直接重复或反向重复，或多种序列基序交替重复的寡聚体。这些重复的寡聚序列彼此相同或同源，但也可有多种重复基序。重复序列的特征是信息含量极低。重复序列并非URP所需的特点，在某些情况下优选非重复序列。

可根据氨基酸的疏水性表征氨基酸。已发展数个尺度范围。一个尺度范围的例子由Levitt，M等开发的(参见Levitt，M(1976)J Mol Biol104，59，#3233，列在Hopp，TP等(1981)Proc Natl Acad Sci U S A78，3824，#3232)。“亲水性氨基酸”的例子为精氨酸、赖氨酸、苏氨酸、丙氨酸、天冬酰胺和谷胺酰胺。尤感兴趣的亲水性氨基酸是天冬氨酸、谷氨酸、丝氨酸和甘氨酸。“疏水性氨基酸”的例子为色氨酸、酪氨酸、苯丙氨酸、甲硫氨酸、亮氨酸、异亮氨酸和缬氨酸。

术语“变性构象”描述肽在溶液中的一种状态，其特征是肽主链的构象自由度很大。大多数肽和蛋白质在高浓度变性剂或升高温度时转变为变性构象。处于变性构象的肽具有特征CD谱，通常的特征在于如NMR检测时缺少长范围的相互作用。变性构象和未折叠构象为同义词。

本文中术语“非结构化蛋白质(UNP)序列”和“非结构化重组聚合物”(URP)可互换使用。这两个术语指共有变性肽序列，如在本文详述的生理条件下具有类似变性肽序列的典型行为的氨基酸序列。URP序列没有确定的三级结构，并且经Chou-Fasman算法检测具有有限的二级结构或无二级结构。

本文所用术语“细胞表面蛋白”指细胞的质膜组分，涵盖组成质膜的整合的和外围的膜蛋白、糖蛋白、多糖和脂质。整合膜蛋白为跨越细胞质膜脂质双层延伸的跨膜蛋白。一个典型的整合膜蛋白包含至少一个含疏水氨基酸残基的跨膜片段。外围膜蛋白不延伸进入脂质双层疏水内部，通过与其它膜组分的共价或非共价相互作用直接或间接结合于膜表面。

应用于细胞蛋白的术语“膜”、“细胞质”、“细胞核”和“分泌”特指该细胞蛋白最多的、主要的或优选的胞外和/或亚细胞定位。

“细胞表面受体”代表能够与其各自配体结合的膜蛋白的一个亚组。细胞表面受体是锚定于细胞质膜上或插入细胞质膜中的分子。它们组成了一个大的蛋白、糖蛋白、多糖和脂质家族，它们不仅作为质膜的结构组分，也作为管理多种生物学功能的调控元件。

术语“模块”指蛋白的一个部分，该部分在物理上或功能上区别于该蛋白或肽的其它部分。一个模块可包含一个或多个结构域。通常，模块或结构域可为无关尺寸的单一稳定三维结构。典型结构域的三级结构在溶液里保持稳定并在分离或与其它结构域共价融合时保持不变。通常，结构域具有由二级结构空间关系(如β-片层、α-螺旋和非结构化环)形成的特定的三级结构。在微生物蛋白家族结构域中，二硫桥通常是决定三级结构的主要元件。在一些例子中，结构域是能够产生某些特定功能活性，如亲合力(对同一靶点的多个结合位点)、多特异性(对不同靶点的结合位点)、半衰期(使用一个结构域、环肽或线性肽)、与血清蛋白如人血清白蛋白(HSA)或IgG(hIgG1、2、3或4)或血红细胞结合的模块。功能确定结构域具有独特的生物学功能。例如，受体的配体结合域是结合配体的结构域。抗原结合域指抗原结合单元的部分或者结合抗原的抗体。功能确定结构域无需由毗连氨基酸序列编码。功能确定结构域可包含一个或多个物理确定的结构域。例如，受体通常分为胞外配体结合域、跨膜结构域和胞内效应结构域。“膜锚定结构域”指介导膜结合的蛋白部分。通常，膜锚定结构域由疏水氨基酸残基组成。或者，膜锚定结构域可包含修饰氨基酸，如与脂肪酸链连接的氨基酸，进而将该蛋白锚定到膜上。

用于蛋白的“非天然产生的”指包含至少一个不同于对应野生型或天然蛋白的氨基酸的蛋白。执行BLAST搜索检测非天然序列，例如当比较窗口是感兴趣序列(查询序列)的长度且使用BLAST2.0与Genbank非冗余(“nr”)数据库比较时使用最低最小概率和执行BLAST搜索。Altschul等在(1990)J.Mol.Biol.215：403-410中分别描述了BLAST2.0算法。国家生物技术信息中心(National Center for Biotechnology Information)向公众提供执行BLAST分析的软件。

“宿主细胞”包括可以是或已经成为主题载体接受体的细胞个体或细胞培养物。宿主细胞包括单个宿主细胞的后代。因为天然、意外或故意的突变，所述后代不一定与原始亲本细胞完全相同(形态上或总DNA基因组上)。宿主细胞包括利用本发明载体体内转染的细胞。

本文所用术语“分离”指从细胞或其它组分中分离天然状态下向关联的多核苷酸、肽、多肽、蛋白质、抗体或其片段。本领域技术人员明了非天然产生的多核苷酸、肽、多肽、蛋白质、抗体及其片段无需通过“分离”来与其天然产生的对应物加以区分。此外，“浓缩的”、“分离的”或“稀释的”多核苷酸、肽、多肽、蛋白质、抗体或其片段可与其天然产生的对应物加以区分，因为其每体积的浓度或分子数大于“浓缩的”或小于“分离的”其天然产生的对应物。

本文中“连接的”和“融合的”或“融合”可互换使用。这些术语指通过任意方式包括化学偶联或重组方式将两个以上的化学元件或组分连接在一起。“框内融合”指两个或多个开放阅读框(OFR)以保持原始OFR正确阅读框的方式连接形成一个连续较长的OFR。因此，所得到的重组融合蛋白是一个包含对应原始OFR编码多肽的两个或多个区段(通常在天然情况下这些区段并不如此连接)的蛋白。

当上下文为多肽时，“线性序列”或“序列”指在多肽中氨基到羧基末端的方向的氨基酸顺序，序列中彼此相邻的残基是该多肽一级结构的毗连序列。“部分序列”指已知在一个或两个方向含有额外残基的多肽部分的线性序列。

“异源”指与该实体其余部分相比，衍生自不同基因型的实体。例如，将一段富甘氨酸序列从其天然编码序列中移除并将其与除该天然编码序列外的编码序列操作性连接则得到异源富甘氨酸序列。应用于多核苷酸、多肽的术语“异源”指与该实体其余部分相比，该多核苷酸或多肽衍生自不同基因型的实体。

术语“多核苷酸”、“核酸”、“核苷酸”和“寡核苷酸”可互换使用。它们指任意长度的核苷酸，或脱氧核糖核苷酸、核糖核酸或其类似物的聚合形式。多核苷酸可具有任意三维结构，并且可执行已知或未知的任意功能。下列为多核苷酸的非限制性例子：基因或基因片段的编码或非编码区、连锁分析定义的基因座、外显子、内含子、信使RNA(mRNA)、转运RNA、核糖体RNA、核酶、eDNA、重组多核苷酸、分支多核苷酸、质粒、载体、分离的任意序列的DNA、分离的任意序列的RNA、核酸探针和引物。多核苷酸可包含修饰的核苷酸，如甲基核苷酸和核苷酸类似物。如果存在，可在聚合物组装前或组装后修饰核苷酸。非核苷酸组分可打断核苷酸序列。可在聚合后进一步修饰多核苷酸，如与标记组分偶联。

应用于多核苷酸的“重组”指多核苷酸是各种克隆、限制性酶切和/或连接步骤及其它步骤的组合产物，这些步骤产生区别于自然界中找到的多核苷酸的构建物。

本文中术语“基因”或“基因片段”可互换使用。它们指含有至少一个开放阅读框的在转录和翻译后可编码特定蛋白的多核苷酸。只要多核苷酸包含至少一个覆盖整个编码区或其片段的开放阅读框，则该基因或基因片段可以是基因组DNA或cDNA。“融合基因”是一个包含至少两个连接在一起的异源性多核苷酸的基因。

“载体”是将插入核酸分子转运到宿主细胞中或至宿主细胞之间的优选自我复制的核酸分子。该术语包括主要功能为将DNA或RNA插入细胞的载体、主要功能为DNA或RNA复制的复制载体和主要功能为DNA或RNA转录和/或翻译的表达载体。也包括提供一种以上上述功能的载体。“表达载体”是引入合适宿主细胞时可被转录和翻译成多肽的多核苷酸。“表达系统”通常指可用于产生所需表达产物的包含表达载体的合适宿主细胞。

上下文为MURP时，“靶点”是结合模块或URP连接结合模块可结合，并且结合事件引发所需的生物学活性的化学分子或结构。靶点可以是被该蛋白抑制、激活或启动的蛋白配体或受体。靶点的例子为激素、细胞因子、抗体或抗体片段、细胞表面受体、激酶、生长因子和其它具有生物学活性的化学结构。

“功能模块”可为蛋白产物中任意非URP。因此功能模块可以是结合模块(BM)、效应模块(EM)、多聚化模块(MM)、C末端模块(CM)、或N末端模块(NM)。通常，功能模块的特征是其氨基酸序列的高信息含量，即它们包含许多不同的氨基酸并且这些氨基酸中很多对于功能模块的功能重要。功能模块通常具有二级和三级结构，可以是一个折叠蛋白结构域并可包含1、2、3、4、5或更多个二硫键。

术语“微生物蛋白”指SCOP数据库中的分类。微生物蛋白通常是具有固定结构的最小蛋白，通常但不绝对含有少至15个氨基酸及两个二硫键，或多至200个氨基酸及多于10个二硫键。微生物蛋白可含一个或多个微生物蛋白结构域。不同的二硫键类型造成一些微生物蛋白结构域或结构域家族可具有多个稳定性不同和多个相似性不同的结构，因此以相对方式使用术语稳定来区分微生物蛋白与多肽和非微生物蛋白结构域。大多数微生物蛋白毒素由单一结构域构成，但细胞表面受体微生物蛋白常常具有多个结构域。微生物蛋白可如此之小，因为借助二硫键和/或离子如钙、镁、锰、铜、锌、铁或多种其它多价离子，而非通常的疏水核心使其折叠稳定。

术语“支架”指在构建蛋白文库时用作保守共有序列的最小多肽“框架”或“序列基序”。可变和超变位置处于支架的固定或保守残基/位置之间。在固定支架之间的可变区提供大量不同的氨基酸用以提供与靶分子的特异性结合。支架通常通过在序列相关蛋白家族比对时观察到的保守残基来限定。折叠或结构也许需要固定残基，特别是当比对蛋白的功能不同时。对于一个微生物蛋白支架的描述可包含数量、位置或间距，半胱氨酸的结合模式，以及环中任一固定残基的位置和种类，包括离子如钙的结合位点。

微生物蛋白的“折叠”很大程度上由二硫键连接模式(即1-4、2-6和3-5)定义。这种模式是拓扑学恒定的，并且在没有断开和重连二硫键(如通过还原和氧化(氧化还原剂))时通常不易转化为另外的模式。通常，具有相关序列的天然蛋白采用相同的二硫成键模式。主要决定簇是半胱氨酸距离模式(CDP)和一些固定的非cys残基以及金属结合位点(如果存在)。在很少的例子中，蛋白折叠也受周围序列(即前肽)的影响，在一些例子中通过残基化学衍生化(即γ-羧基化)使蛋白与二价金属离子(即钙)结合帮助其折叠。对绝大多数微生物蛋白来说，此类折叠帮助是不必要的。

然而，基于环的长度和组成的不同，这些具有相同成键模式的蛋白也可包含多个折叠，所述环足够大，以赋予该蛋白完全不同的结构。一个例子是芋螺毒素、环毒素(cyclotoxin)和anato结构域家族，它们具有相同的DBP但CDP明显不同，被认为是不同的折叠。蛋白折叠的决定因素是相对于不同折叠极大改变结构，如半胱氨酸的数量和成键模式、半胱氨酸的间距、半胱氨酸间环的序列基序的不同(特别是折叠所需的固定环残基或钙(或其它金属或辅因子)结合位点的位置或组成)的任何属性。

术语“二硫键成键模式”或“DBP”指半胱氨酸的连接模式，以1-n从蛋白质的N末端到C末端进行编号。二硫键成键模式是拓扑学恒定的，意味着利用如氧化还原条件解开一个或多个二硫键才可以对其进行改变。0048-0075段列出可能的2-、3-和4-二硫键成键模式。

术语“半胱氨酸距离模式”或“CDP”指在线性蛋白链上分隔半胱氨酸的非半胱氨酸的数目。使用多种符号：C5C0C3C等于C5CC3C等于CxxxxxCCxxxC。

术语“位置n6”或“n7＝4”指半胱氨酸间环，“n6”指C6和C7间的环；“n7＝4”指C7和C8间的环长度为4个氨基酸(不计半胱氨酸)。

血清降解抗性-可通过在血液中降解消除蛋白质，该降解通常涉及血清或血浆中的蛋白酶。通过将蛋白和人(或合适的小鼠、大鼠、猴)的血清或血浆在37℃下混和不同天数(即0.25、0.5、1、2、4、8、16天)来检测血清降解抗性。然后，用Western实验电泳这些时间点的样品并利用抗体检测蛋白。抗体可以是蛋白标签的抗体。如果蛋白在western上显示与注入蛋白大小相同的单一条带，则无降解发生。Western检测50％蛋白降解的时间点即为该蛋白的血清降解半衰期。

血清蛋白结合-虽然MURP通常含有数个与细胞表面靶点和/或血清蛋白结合的模块，但我们期望URP基本没有非期望的活性。应设计URP最小化避免与血清蛋白，包括抗体的互相作用(结合)。利用ELISA筛选不同的URP设计与血清蛋白的结合，固定血清蛋白然后加入URP，孵育，洗涤后检测结合的URP的量。一种方法是利用识别已加入URP的标签的抗体检测URP，一种不同的方法是固定URP(如通过与GFP融合)，加入人血清，孵育，洗涤后利用第二抗体如山羊抗人IgG检测仍结合于URP的人抗体量。利用这些方法我们设计的URP显示出非常低水平的血清蛋白结合。然而，在一些应用中，需要与血清蛋白或血清接触蛋白结合，例如，因为可以进一步延长分泌半衰期。在这种情况下，可使用相同实验来设计与血清蛋白或血清接触蛋白如HSA或IgG结合的URP。在另一些情况下，可将包含经设计与血清蛋白或血清接触蛋白如HSA或IgG结合的肽的结合模块置入MURP中。

非结构化重组聚合物(URP)：

本发明的一个方面是非结构化重组聚合物(URP)的设计。在产生具有治疗和/或诊断价值的重组蛋白时，主题URP尤其有用。主题URP展示下列一种或多种特点。

主题URP含有通常在生理条件下与变性肽序列具有共性的氨基酸序列。URP序列在生理条件下通常与变性肽序列行为类似。在生理条件下，URP序列缺少良好限定的二级和三级结构。本领域已建立多种方法来确定给定多肽的二级和三级结构。例如，利用“远UV”谱区(190-250nm)的CD光谱来检测多肽的二级结构。α-螺旋、β-折叠和随机卷曲结构各自形成CD谱的特征峰和宽度。同样可通过某些计算机程序和算法，如Chou-Fasman算法(Chou，P.Y.等(1974)Biochemistry，13：222-45)确定二级结构。对于一个给定的URP序列，该算法能预测是否存在一些或根本不存在二级结构。通常，因为低程度的二级和三级结构，URP序列通常具有类似变性序列的谱。所期望的是能够设计URP使其在生理条件下具有明显变性的构象。URP序列通常在生理条件下具有很高程度的构象弹性，与相近分子量的球蛋白相比，它们趋于形成大的流体动力学半径(Stokes半径)。本文所用生理条件指一系列模拟活体状况的条件，包括温度、盐浓度、pH。建立了许多体外实验使用的生理相关条件。通常，生理缓冲液包含生理浓度的盐并调整至中性pH范围约6.5-7.8，优选约7.0-7.5。Sambrook等(1989)之前列举过数种生理缓冲液，在此不再赘述。生理相关温度范围从约25℃-38℃，优选约30℃-37℃。

主题URP可为低免疫原性序列。低免疫原性是URP序列构象弹性的直接结果。许多抗体识别蛋白抗原中的所谓构象表位。构象表位由含有蛋白抗原的多个不连续氨基酸序列的蛋白表面区域形成。蛋白的精确折叠使这些序列成为能被抗体识别的明确的特殊构型。设计优选的URP以避免形成构象表位。例如，尤其感兴趣的是在水溶液中很少趋于形成致密折叠构象的URP序列。具体说，通过选择在抗原递呈细胞中抵抗抗原加工的序列，选择不与MHC良好结合的序列和/或选择衍生自人序列的序列获得低免疫原性。

主题URP可为具有高度蛋白酶抗性的序列。蛋白酶抗性也可为URP序列构象弹性的结果。可通过避免已知的蛋白酶识别位点设计蛋白酶抗性。或者，可利用噬菌体展示或相关技术从随机或半随机序列文库中选择蛋白酶抗性序列。需要用于特殊应用，如从蛋白质储库中缓慢释放时，可将血清蛋白酶切割位点构建到URP中。尤其感兴趣的是在血液中高度稳定(如长血清半衰期、不易被体液中的蛋白酶切割)的URP。

主题URP的特征也在于，当掺入蛋白时，与无URP的对应蛋白相比，该蛋白显示较长的半衰期和/或更高的溶解性。[确定血清半衰期的方法为本领域所知(参见如Alvarez.P.等(2004)J Biol Chem，279：3375-81)。通过实施本领域任意可用方法或本文列举方法，易于测定与未修饰蛋白相比得到的蛋白是否具有较长的血清半衰期。

主题URP可为(a)延长含URP蛋白的血清半衰期；(b)提高所得到蛋白的溶解性；(c)提高蛋白酶抗性；和/或(d)降低所得到的含URP蛋白的免疫原性所需的任何长度。通常，主题URP含有约30、40、50、60、70、80、90、100、150、200、300、400或更多个毗连的氨基酸。当掺入蛋白时，可将URP片段化使所得到的蛋白包含多个URP或多个URP片段。一些或所有的单独URP序列可短于40个氨基酸，只要所得蛋白的所有URP序列的总长度至少为40个氨基酸。所得蛋白质中的URP序列总长度优选超过40、50、60、70、80、90、100、150、200或更多个氨基酸。

URP的等电点可以为1.0、1.5、2.0、2.5、3.0、3.5、4.0、4.5、5.0、5.5、6.0、6.5、7.0、7.5、8.0、8.5、9.0、9.5、10.0、10.5、11.0、11.5、12.0、12.5或甚至13.0。

通常，URP序列富含亲水性氨基酸并包含低百分率的疏水或芳香族氨基酸。合适的亲水性残基包括但不限于甘氨酸、丝氨酸、天冬氨酸、谷氨酸、赖氨酸、精氨酸和苏氨酸。构建URP时较不优选的疏水性残基包括色氨酸、苯丙氨酸、酪氨酸、亮氨酸、异亮氨酸、缬氨酸和甲硫氨酸。URP序列可富含甘氨酸，但也可富含谷氨酸、天冬氨酸、丝氨酸、苏氨酸、丙氨酸或脯氨酸。因此主要氨基酸可为G、E、D、S、T、A或P。包含脯氨酸残基趋于降低对蛋白酶解的敏感性。

包含亲水性残基通常会增加URP在生理条件下在水和水性介质中的溶解度。因为其氨基酸组成，URP序列在水性制剂中形成聚集的倾向低，URP序列和其它蛋白或肽的融合体趋于提高其溶解度并降低形成聚集体的倾向，这是降低免疫原性的单独机制。

设计URP序列以避免会使蛋白产生不良性质的某些氨基酸。例如，可设计URP序列以包含少量或不含下列氨基酸：半胱氨酸(避免二硫键形成和氧化)、甲硫氨酸(避免氧化)、天冬酰胺和谷胺酰胺(避免脱氨基)。

富甘氨酸URP：

在一个实施方式中，主题URP包含富甘氨酸序列(GRS)。例如，主要出现甘氨酸，因此它是感兴趣序列中最普遍的残基。在另一个例子中，设计URP序列使甘氨酸残基至少占总氨基酸的约30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、100％。URP也可含100％甘氨酸。在另一例子中，URP含至少30％甘氨酸，并且色氨酸、苯丙氨酸、酪氨酸、缬氨酸、亮氨酸和异亮氨酸的总浓度少于20％。在另一例子中，URP含有至少40％甘氨酸，并且色氨酸、苯丙氨酸、酪氨酸、缬氨酸、亮氨酸和异亮氨酸的总浓度少于10％。在另一例子中，URP含有至少50％甘氨酸，并且色氨酸、苯丙氨酸、酪氨酸、缬氨酸、亮氨酸和异亮氨酸的总浓度少于5％。

GRS长度可以是约5-200个氨基酸或更多个氨基酸。例如，单个毗连GRS可含5、10、15、20、25、30、35、40、45、50、55、60、70、80、90，100、120、140、160、180、200、240、280、320或400或更多个氨基酸。GRS两端均可含甘氨酸。

GRS也可含有显著含量的其它氨基酸，例如Ser、Thr、Ala或Pro。GRS可含有显著含量的带负电氨基酸，包括但不限于：Asp和Glu。GRS可含有显著含量的带正电氨基酸，包括但不限于：Arg或Lys。所期望的是，设计URP仅包含单一类型的氨基酸(即Gly或Glu)，有时仅含几种类型的氨基酸，如2-5种氨基酸(如选自G、E、D、S、T、A或P)，相反，一般蛋白和一般接头通常由二十种氨基酸的大多数组成。URP可包含30、25、20、15、12、10、9、8、7、6、5、4、3、2或1％氨基酸位置的带负电氨基酸(Asp，Glu)。

通常，含GRS的主题URP具有约30、40、50、60、70、80、90、100、或更多个毗连氨基酸。当掺入蛋白时，URP可被片段化，以使所得蛋白包含多个URP或多个URP片段。一些或所有的单独URP序列可短于40个氨基酸，只要所得蛋白的所有URP序列的总长度至少为30个氨基酸。所得蛋白质中的URP序列总长度优选超过40、50、60、70、80、90、100或更多个氨基酸。

尤其对含GRS的URP感兴趣，部分因为含甘氨酸肽的构象自由度增加。溶液中的变性肽具有高度的构象自由度。所述肽与靶点如受体、抗体或蛋白酶的结合使大部分构象自由度丧失。这种熵的丧失需要肽及其靶点间互相作用的能量来补偿。变性肽构象自由程度由其氨基酸序列决定。与较大侧链氨基酸组成的肽相比，含有许多小侧链氨基酸的肽趋于具有更高的构象自由度。含有甘氨酸的肽具有特别大的自由度。预计在溶液中，含甘氨酸的肽键的熵比含丙氨酸的相应序列高3.4倍(D′Aquino，J.A.等(1996)Proteins，25：143-56)。这个因素随着序列中甘氨酸残基的数目而增加。结果是此类肽在结合靶点时趋于丧失更多的熵，因此减弱了与其它蛋白作用的总体能力以及它们采用确定三维结构的能力。当分析蛋白结构的罗摩占陀罗印图(Ramachandra plots)时，甘氨酸肽键的大构象弹性也很明显，甘氨酸肽键占据的区域极少被其它肽键所占据(Venkatachalam，C.M.等(1969)Annu Rev Biochem，38：45-82)。Stites等研究了来自61个非同源高分辨率晶体结构的12,320个残基的数据库以检测20个氨基酸各自的

ψ构象偏好。假定在天然状态蛋白中观察到的分布也反应了变性状态中的分布。使用该分布来估算各残基的能面，以便计算每一残基相对于甘氨酸的相对构象熵。最极端的情况下，用脯氨酸代替甘氨酸，20℃时-0.82+/-0.08kcal/mol的构象熵变使得与变性状态相比稳定了天然状态(Stites，W.E.等(1995)Proteins，22：132)。这些观察确认了甘氨酸在20个天然氨基酸中的特殊作用。

设计主题URP时可使用天然的或非天然的序列。例如，表1、2、3、4提供了许多高甘氨酸含量的天然序列。本领域技术人员可采用任一序列作为URP或修饰该序列达到期望性质。当对宿主对象的免疫原性感兴趣时，优选根据衍生自宿主的富甘氨酸序列设计含GRS的URR。含GRS的URP的序列优选来自人蛋白或与参考人蛋白相应的富甘氨酸序列有显著同源性的序列。

表1.含富甘氨酸序列的蛋白质的结构分析

PDB文件	蛋白质功能	富甘氨酸序列
			1K3V	猪细小病毒衣壳	sgggggggggrgagg
1FPV	猫全白细胞减少症病毒	tgsgngsgggggggsgg
			1IJS	CpV D毒株，突变A300d	tgsgngsgggggggsgg
1MVM	Mvm(I毒株)病毒	ggsggggsgggg

表2：编码含300个或更多甘氨酸残基的GRS的开放阅读框

表3.人GRS的例子

表4.人GRS的附加例

POU结构域，4类，转录因子1[智人(Homo sapiens)]

GPGGGGGPGGGGGPGGGGPGGGGGGGPGGGGGGPGGG

含2的酵母结构域[智人]

GGSGAGGGGGGGGGGGSGSGGGGSTGGGGGTAGGG

富AT交互结构域1B(SWI1样)同种型3；BRG1结合蛋白ELD/OSA1；Eld(眼皮)/Osa蛋白[智人]

GAGGGGGGGGGGGGGSGGGGGGGGAGAGGAGAG

富AT交互结构域1B(SWI1样)同种型2；BRG1结合蛋白ELD/OSA1；Eld(眼皮)/Osa蛋白[智人]

GAGGGGGGGGGGGGGSGGGGGGGGAGAGGAGAG

富AT交互结构域1B(SWI1样)同种型1；BRG1结合蛋白ELD/OSA1；Eld(眼皮)/Osa蛋白[智人]

GAGGGGGGGGGGGGGSGGGGGGGGAGAGGAGAG

富嘌呤元件结合蛋白A；富嘌呤单链DNA结合蛋白α；转录激活蛋白PUR-α[智人]

GHPGSGSGSGGGGGGGGGGGGSGGGGGGAPGG

调节因子X1；顺式调节因子1；增强因子C；MHC II类调节因子RFX[智人]

GGGGSGGGGGGGGGGGGGGSGSTGGGGSGAG

白血病破坏的含镇静域(bromo domain)蛋白[智人]

GGRGRGGRGRGSRGRGGGGTRGRGRGRGGRG

未知蛋白[智人]

GSGGSGGSGGGPGPGPGGGGGPSGSGSGPG

预测：假拟蛋白XP_059256[智人]

GGGGGGGGGGGRGGGGRGGGRGGGGEGGG

锌指蛋白281；ZNP-99转录因子[智人]

GGGGTGSSGGSGSGGGGSGGGGGGGSSG

RNA结合蛋白(自身抗原性，致死黄色相关hnRNP)短同种型；RNA结合蛋白(自身抗原性)；RNA结合蛋白(自身抗原性，致死黄色相关hnRNP)[智人]

GDGGGAGGGGGGGGSGGGGSGGGGGGG

信号识别颗粒68kDa[智人]

GGGGGGGSGGGGGSGGGGSGGGRGAGG

KIAA0265蛋白[智人]

GGGAAGAGGGGSGAGGGSGGSGGRGTG

锯齿状同源物2；锯齿状-2[智人]

GAGGGRGGGAGGEGGASGAEGGGGAGG

RNA结合蛋白(自身抗原性，致死黄色相关hnRNP)长同种型；RNA结合蛋白(自身抗原性)；RNA结合蛋白(自身抗原性，致死黄色相关hnRNP)[智人]

GDGGGAGGGGGGGGSGGGGSGGGGGGG

雄激素受体；二氢睾酮受体[智人]

GGGGGGGGGGGGGGGGGGGGGGGEAG

同源框D11；同源框4F；Hox-4.6，小鼠，同源物；同源框蛋白Hox-D11[智人]

GGGGGGSAGGGSSGGGPGGGGGGAGG

卷曲蛋白8；卷曲蛋白(果蝇)同源物8[智人]

GGGGGPGGGGGGGPGGGGGPGGGGG

眼发育相关基因[智人]

GRGGAGSGGAGSGAAGGTGSSGGGG

同源框B3；同源框2G；同源框蛋白Hox-B3[智人]

GGGGGGGGGGGSGGSGGGGGGGGGG

染色体2开放阅读框29[智人]

GGSGGGRGGASGPGSGSGGPGGPAG

DKFZP564F0522蛋白[智人]

GGHHGDRGGGRGGRGGRGGRGGRAG

预测：与同源框跳过偶数的(even-skipped)同源蛋白2(EVX-2)相似[智人]

GSRGGGGGGGGGGGGGGGGAGAGGG

ras同源基因家族，U成员；Ryu GTP酶；Wnt-1反应性Cdc42同源物；2310026M05Rik；GTP结合蛋白1；CDC42样GTP酶[智人]

GGRGGRGPGEPGGRGRAGGAEGRG

抓挠(scratch)2蛋白；转录抑制子抓挠2；抓挠(果蝇同源物)2，锌指蛋白[智人]

GGGGGDAGGSGDAGGAGGRAGRAG

核仁蛋白家族A，成员1；GAR1蛋白[智人]

GGGRGGRGGGRGGGGRGGGRGGG

角蛋白1；角蛋白-1；细胞角蛋白1；毛发α蛋白[智人]

GGSGGGGGGSSGGRGSGGGSSGG

假拟蛋白FLJ31413[智人]

GSGPGTGGGGSGSGGGGGGSGGG

单切(one cut)结构域，家族成员2；单切2[智人]

GARGGGSGGGGGGGGGGGGGGPG

POU结构域，3类，转录因子2[智人]

GGGGGGGGGGGGGGGGGGGGGDG

预测：与THO复合物亚基4(Tho4)(RNA和输出因子结合蛋白1)(REF1-I)(AML-1和LEF-1的联盟)(Aly/REF)相似[智人]

GGTRGGTRGGTRGGDRGRGRGAG

预测：与THO复合物亚基4(Tho4)(RNA和输出因子结合蛋白1)(REF1-I)(AML-1和LEF-1的联盟)(Aly/REF)[智人]

GGTRGGTRGGTRGGDRGRGRGAG

POU结构域，3类，转录因子3[智人]

GAGGGGGGGGGGGGGGAGGGGGG

核仁蛋白家族A，成员1；GAR1蛋白[智人]

GGGRGGRGGGRGGGGRGGGRGGG

核仁纤维蛋白；34-kD核仁硬皮病抗原；RNA，U3小核仁相互作用蛋白质1[智人]

GRGRGGGGGGGGGGGGGRGGGG

锌指蛋白579[智人]

GRGRGRGRGRGRGRGRGRGGAG

钙蛋白酶，小亚基1；钙激活中性蛋白酶；钙蛋白酶，小多肽；钙蛋白酶4，小亚基(30K)；钙依赖性蛋白酶，小亚基[智人]

GAGGGGGGGGGGGGGGGGGGGG

角蛋白9[智人]

GGGSGGGHSGGSGGGHSGGSGG

叉头(forkhead)框D1；叉头框相关激活物4；叉头蛋白，果蝇，同源物样8；叉头蛋白(果蝇)样8[智人]

GAGAGGGGGGGGAGGGGSAGSG

预测：与RIKEN cDNA C230094B15相似[智人]

GGPGTGSGGGGAGTGGGAGGPG

GGGGGGGGGAGGAGGAGSAGGG

钙粘着蛋白22前体；大鼠PB-钙粘着蛋白直向同源物[智人]

GGDGGGSAGGGAGGGSGGGAG

AT结合转录因子1；AT基序结合因子1[智人]

GGGGGGSGGGGGGGGGGGGGG

脱中胚蛋白；t盒，脑，2；脱中胚蛋白(非洲爪蟾(Xenopus laevis))同源物[智人]

GPGAGAGSGAGGSSGGGGGPG

磷脂酰肌醇转运蛋白，膜结合2；PYK2N末端结构域-相互作用受体3；视网膜变性Bα2(果蝇)[智人]

GGGGGGGGGGGSSGGGGSSGG

精子相关抗原8同种型2；精子膜蛋白1[智人]

GSGSGPGPGSGPGSGPGHGSG

预测：RNA结合基序蛋白27[智人]

GPGPGPGPGPGPGPGPGPGPG

AP1γ亚基结合蛋白1同种型1；γ-synergin；衔接子相关蛋白复合物1γ亚基结合蛋白1[智人]

GAGSGGGGAAGAGAGSAGGGG

AP1γ亚基结合蛋白1同种型2；γ-synergin；衔接子相关蛋白复合物1γ亚基结合蛋白1[智人]

GAGSGGGGAAGAGAGSAGGGG

包含1的锚定蛋白重复和贫瘠(sterile)α基序结构域；包含1的锚定蛋白重复和SAM结构域[智人]

GGGGGGGSGGGGGGSGGGGGG

甲基-CpG结合域蛋白2同种型1[智人]

GRGRGRGRGRGRGRGRGRGRG

三功能结构域(PTPRF相互作用)[智人]

GGGGGGGSGGSGGGGGSGGGG

叉头蛋白盒D3[智人]

GGEEGGASGGGPGAGSGSAGG

精子相关抗原8同种型1；精子膜蛋白1[智人]

GSGSGPGPGSGPGSGPGHGSG

甲基-CpG结合域蛋白质2睾丸特异性同种型[智人]

GRGRGRGRGRGRGRGRGRGRG

细胞死亡调节坑(aven)；程序性细胞死亡12[智人]

GGGGGGGGDGGGRRGRGRGRG

无义转录物调节子1；δ解旋酶；向上移码突变1同源物(酿酒酵母(S.cerevisiae))；无义mRNA还原因子1；酵母Upflp同源物[智人]

GGPGGPGGGGAGGPGGAGAG

小电导钙激活钾通道蛋白2同种型a；蜂毒明肽敏感型小电导Ca2+激活的钾通道[智人]

GTGGGGSTGGGGGGGGSGHG

SRY(性别决定区Y)-盒1；SRY相关性HMG-盒基因1[智人]

GPAGAGGGGGGGGGGGGGGG

转录因子20同种型2；基质溶素-1血小板衍生生长因子响应元件结合蛋白；基质溶素1PDGF响应元件结合蛋白；SPRE结合蛋白；核因子SPBP[智人]

GGTGGSSGSSGSGSGGGRRG

转录因子20同种型1；基质溶素-1血小板衍生生长因子响应元件结合蛋白；基质溶素1PDGF响应元件结合蛋白；SPRE结合蛋白；核因子SPBP[智人]

GGTGGSSGSSGSGSGGGRRG

Ras相互作用蛋白1[智人]

GSGTGTTGSSGAGGPGTPGG

BMP-2诱导型激酶同种型b[智人]

GGSGGGAAGGGAGGAGAGAG

BMP-2诱导型激酶同种型a[智人]

GGSGGGAAGGGAGGAGAGAG

叉头蛋白盒C1；叉头蛋白相关激活物3；叉头蛋白，果蝇，同源物样7；叉头蛋白(果蝇)样7；虹膜发育不全(iridogoniodysgenesis)1型[智人]

GSSGGGGGGAGAAGGAGGAG

剪接因子p54；富精氨酸的54kDa核蛋白[智人]

GPGPSGGPGGGGGGGGGGGG

v-maf肌肉腱膜纤维肉瘤癌基因同源物；禽肌肉腱膜纤维肉瘤(MAF)原癌基因；v-maf肌肉腱膜纤维肉瘤(禽类)癌基因同源物[智人]

GGGGGGGGGGGGGGAAGAGG

小核核蛋白D1多肽16kDa；snRNP核心蛋白D1；Sm-D自身抗原；小核核蛋白D1多肽(16kD)[智人]

GRGRGRGRGRGRGRGRGRGG

假拟蛋白H41[智人]

GSAGGSSGAAGAAGGGAGAG

_______________________________________________________

含非甘氨酸残基的URP(NGR)：

选择这些HRS中的非甘氨酸序列以优化URP和含有所需URP的蛋白的性质。例如，可优化URP序列以提高所得到蛋白对于特定组织、特定细胞类型或细胞谱系的选择性。例如，可掺入并非广泛表达但在一种或多种身体组织和患有疾病的所选组织中差异表达的蛋白序列，这些身体组织包括心脏、肝脏、前列腺、肺、肾、骨髓、血液、皮肤、膀胱、脑、肌肉、神经和所选择的组织，这些疾病包括感染性疾病、自身免疫病、肾病、神经病、心脏病和癌症等。可使用代表特定发育起源的序列，如多细胞生物体中在胚胎、成体的外胚层、内胚层和中胚层形成时表达的序列。也可利用涉及特定生物学过程，包括但不限于细胞周期调节、细胞分化、凋亡、趋化、细胞运动和细胞骨架重排的序列。也可利用其它非广泛表达的蛋白序列引导所得到的蛋白到达特定的亚细胞位置：胞外基质、细胞核、胞质、细胞骨架、胞浆和/或胞内膜结构，包括但不限于包被小窝、高尔基体、内质网、胞内体、溶酶体和线粒体。

已知多种组织特异性、细胞类型特异性、亚细胞定位特异性序列并可从数种蛋白数据库中获取。通过产生随机或半随机URP序列文库、将其注射入动物或病人并检测组织样本中具有所需组织选择性的序列来获取选择性URP序列。可用质谱检测序列。使用类似方法可选择利于口服、含服、肠道、鼻腔、鞘内、腹膜、直肠或皮肤摄取的URP序列。

尤感兴趣的是有助于细胞摄取或穿膜转运的含相对富含带正电精氨酸或赖氨酸区域的URP序列。可设计URP序列使其含有一个或多个蛋白酶敏感序列。一旦本发明产品到达其靶位置，即可切割掉这种URP序列。这种切割可触发药学活性结构域的效能(前药活化)或增强切割产物与受体的结合。可设计URP序列通过引入天冬氨酸或谷氨酸残基使其带过多负电荷。尤其感兴趣的是含有多于5％、多于6％、7％、8％、9％、10％、15％、30％或更多谷氨酸且少于2％赖氨酸或精氨酸的URP。此类URP携带过多负电荷，由于该肽单个负电荷之间的静电排斥作用使其趋于采取开放构象。此种过多负电荷引起其流体力学半径有效增加并因此降低此类分子的肾脏清除率。因此，可通过控制URP序列中带负电氨基酸的频率及分布来调解URP序列的有效净电荷及流体力学半径。人或动物的多数组织及表面带过多负电荷。通过设计带过多负电荷的URP，可将含URP的所得蛋白和不同表面如血管、健康组织或不同受体之间的非特异性相互作用减至最小。

URP可含有(基序)_x形式的重复氨基酸序列，其中序列基序形成直接重复(即ABCABCABCABC)或反向重复(ABCCBAABCCBA)，并且这些重复的次数可为2、3、4、5、6、7、8、9、10、12、14、16、18、20、22、24、26、28、30、35、40、50或更多。URP或URP内部的重复经常仅包含1、2、3、4、5或6种不同类型的氨基酸。URP通常由长度为4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、22、24、26、28、30、32、34、36或更多个氨基酸的人氨基酸序列重复组成，但URP也可由长度为20、22、24、26、28、30、32、34、36、3840、42、44、46、48、50个氨基酸的非人氨基酸序列组成。

衍生自人序列的URP：

URP可衍生自人序列。人基因组包含很多富含特定氨基酸的亚序列。尤其感兴趣的是富含亲水性氨基酸如丝氨酸、苏氨酸、谷氨酸、天冬氨酸、或甘氨酸的此类氨基酸序列。尤其感兴趣的是几乎不含疏水性氨基酸的此类亚序列。预计此类亚序列为非结构化并在水性溶液中高度可溶。可修饰此类人亚序列以进一步改进其实用性。图17显示富丝氨酸的示例性人序列，可分离作为主题URP。示例性的牙本质涎磷蛋白含670个氨基酸的亚序列，其中64％的残基为丝氨酸，并且多数其它位置为亲水性氨基酸，如天冬氨酸、天冬酰胺和谷氨酸。该序列极度重复因此信息含量低。可直接利用此类人蛋白的亚序列。所期望的是，以保留其总体特点但使其更适合药物应用的方式修饰该序列。与牙本质涎磷蛋白相关的序列例子为(SSD)_n、(SSDSSN)_n、(SSE)_n，其中n为约4-200。

在设计人个体免疫原性降低的URP时尤其希望使用来自人蛋白的序列。引发对于外来蛋白免疫应答的关键步骤是MHC2类受体递呈所述蛋白的肽片段。这些MHC II结合片段可被T细胞受体检测，触发T辅助细胞的增殖并启动免疫应答。从药物蛋白上减少T细胞表位被认为是减少引发免疫应答风险的方法(Stickler，M.等(2003)J Immunol Methods，281：95-108)。MHC II受体通常与具有如9个氨基酸的区域展示肽的表位相互作用。因此，若所有或多数可能的9聚体亚序列能从人蛋白中找到，这些序列和序列的重复不会被病人认作外源序列，便可减少在病人体内引发对蛋白的免疫应答的风险。通过寡聚化或连接具有合适氨基酸组成的人序列，可将人序列掺入URP设计。它们可为直接重复或反向重复或不同重复的混合。例如可将表2所示序列寡聚化。此类寡聚物具有低的免疫原风险。然而，单体单元的连接序列仍可包含触发免疫反应的T细胞表位，如图3所示。通过设计基于多重交叠人序列的URP可进一步降低引发免疫应答的风险。该方法如图4所示。图2中URP序列的设计为基于多重人序列设计的寡聚体，因此寡聚体中每一9聚体亚序列可在人蛋白中找到。在这些设计中，每一9聚体亚序列为人序列。图5显示基于三个人序列的URP的例子。也可基于单个人序列设计URP序列，因此寡聚URP序列中所有可能的9聚体亚序列均出现在同一人蛋白中。图6显示了基于富甘氨酸和脯氨酸的POU结构域的例子。图6显示URP序列中重复单体仅为人蛋白的一个片段，其侧接序列与重复单位相同。同样可根据人蛋白设计非寡聚化URP序列。首要条件是所有9聚体亚序列可在人序列中找到。序列的氨基酸组成优选几乎不含疏水性残基。尤其感兴趣的是基于人序列设计的并包含大量甘氨酸残基的URP序列。

利用这个或相似的方案，可设计包含对感兴趣宿主具有低免疫原性重复序列的一类URP。感兴趣的宿主可为任意动物，包括脊椎动物和无脊椎动物。优选宿主为哺乳动物，如灵长类(如黑猩猩和人)、鲸类(如鲸和海豚)、翼手类(如蝙蝠)、奇蹄类(如马和犀牛)、啮齿类(如大鼠)和某些食虫类如地鼠、鼹鼠和刺猬。当选择人作为宿主时，URP通常含有多个拷贝的重复序列或单元，其中包含约6-15个毗连氨基酸的区段多数出现于一种或多种天然人蛋白中。也可设计包含约9-15个毗连氨基酸的区段多数出现于一种或多种天然人蛋白中。本文所使用的大部分区段指多于约50％、优选60％、优选70％、优选80％、优选90％、优选100％的区段。期望重复单元内的每一约6-15氨基酸，优选约9-15氨基酸的可能区段均出现在一种或多种天然人蛋白中。URP能包含多个重复单元或序列，例如具有2、3、4、5、6、7、8、9、10活更多个重复单元。

基本不含入T细胞表位的URP设计：

_________________________________________________________

可设计URP序列使其基本不含能被人T细胞识别的表位。例如，可合成含有有助于形成变性的非结构化构象的氨基酸组成的一系列半随机序列，并评价这些序列中是否存在人T细胞表位以及它们是否为人序列。已描述用于人T细胞表位的实验(Stickler，M.等(2003)J Immunol Methods，281：95-108)。尤其感兴趣的是可在不产生T细胞表位和非人序列的情况下寡聚化的肽序列。通过检测这些序列直接重复中是否存在T细胞表位和非人6-15聚体，特别是9聚体亚序列，来实现上述目的。另一种方法是利用前述人序列组装章节组装为重复单元的多个肽序列。另一备选方案是设计利用表位预测算法如T表位(TEPITOPE)低评分的URP序列(Stumiolo，T.等(1999)Nat Biotechnol，17：555-61)。另一避免T细胞表位的方法是避免在MHC上肽展示当中用作锚定残基的氨基酸，如M、I、L、V、F。疏水性氨基酸和带正电氨基酸经常可作为此类锚定残基，最大程度降低其在URP序列中的频率减少T细胞表位产生的机会及因此引发的免疫反应。通常所选URP包含至少在一种人蛋白中找到的亚序列，并包含较低含量的疏水性氨基酸。

设计URP序列以优化蛋白生产，可通过避免和最大程度降低编码DNA的重复性达到此目的。URP序列如多聚甘氨酸可具有非常良好的药物特性，但是编码GRS的DNA序列中高GC含量以及存在可导致重组的重复DNA序列引起制造的困难。

如上所述，可设计在氨基酸水平高度重复的URP序列。因此URP序列具有很低的信息含量并且可降低引发免疫反应的风险。

包含重复氨基酸的URP的非限制性例子为：多聚甘氨酸、多聚谷氨酸、多聚天冬氨酸、多聚丝氨酸、多聚苏氨酸、(GX)_n，其中G是甘氨酸且X是丝氨酸、天冬氨酸、谷氨酸、苏氨酸或脯氨酸，n至少为20；(GGX)_n，其中X是丝氨酸、天冬氨酸、谷氨酸、苏氨酸或脯氨酸，n至少为13；(GGGX)_n，其中X是丝氨酸、天冬氨酸、谷氨酸、苏氨酸或脯氨酸，n至少为10；(GGGGX)_n，其中X是丝氨酸、天冬氨酸、谷氨酸、苏氨酸或脯氨酸，n至少为8；(G_zX)_n，其中X是丝氨酸、天冬氨酸、谷氨酸、苏氨酸或脯氨酸，n至少为15，并且z是1-20。

这些重复的数目可为10-100的任意数字。本发明产品可包含半随机序列的URP序列。例子可为包含至少30、40、50、60或70％甘氨酸的半随机序列，其中甘氨酸分散良好且色氨酸、苯丙氨酸、酪氨酸、缬氨酸、亮氨酸和异亮氨酸的组合总浓度小于70、60、50、40、30、20或10％。优选半随机URP序列包含至少40％甘氨酸并且色氨酸、苯丙氨酸、酪氨酸、缬氨酸、亮氨酸和异亮氨酸的总浓度少于10％。更优选的随机URP序列包含至少50％甘氨酸并且色氨酸、苯丙氨酸、酪氨酸、缬氨酸、亮氨酸和异亮氨酸的总浓度小于5％。可通过将两个或多个短URP序列或URP序列片段合并来设计URP序列。这种合并能够更好的调节含URP序列产品的药物特性并减少编码URP序列的DNA序列的重复性，从而提高URP编码序列的表达并减少其重组。

设计并选择具有如下期望特性的URP序列：a)编码序列在生产宿主中的高度遗传稳定性；b)表达水平高；c)低(预测的/计算的)免疫原性；d)在血清蛋白酶和/或其它蛋白酶中具有高稳定性；e)生理条件下流体动力学半径大。一个获得符合多个标准的URP序列的示范性方法是构建候选序列的文库并从文库中鉴定合适的亚序列。文库可包含随机和/或半随机的序列。特别有用的是密码子文库，这是包含相同氨基酸残基多种密码子的DNA分子文库。应用密码子随机化选择某种类型的或多数的或所有的氨基酸位置。真密码子文库仅编码单一氨基酸序列，但易于与氨基酸文库合并，形成在同样残基位置编码(相关或无关)氨基酸混合物的DNA分子群体。用密码子文库可以鉴定在DNA水平低重复性但编码高重复性氨基酸序列的基因。这点非常有用，因为重复DNA序列趋于重组，引起不稳定性。也可构建编码有限氨基酸多样性的密码子文库。此类文库允许在序列的某些位置引入有限数量的氨基酸，然而其它位置允许密码子变化，但所有密码子编码同一氨基酸。在寡核苷酸合成时可通过在同一位置掺入核苷酸混合物合成部分随机寡核苷酸。此类部分随机寡核苷酸可通过交叠PCR或基于连接的方法融合。具体说，可多聚化编码富甘氨酸序列的半随机寡核苷酸。这些寡核苷酸在长度、序列和密码子使用上不同。结果是，可获得候选URP序列的文库。另一个产生文库的方法是合成起始序列后再将所述序列部分随机化。可通过在突变株中培育编码URP序列的基因或通过在诱变环境中扩增编码基因实现(Leung，D.等(1989)Technique，1：11-15)。利用数种方法从文库中鉴定具有所需性质的URP序列。在生产宿主中培育该文库富集具有高度遗传稳定性的序列。不稳定的序列会累计突变，可通过DNA测序鉴定。可使用本领域熟练技术人员所知道的方法筛选或选择，以鉴定可高水平表达的URP序列变体。例如可从培育多个文库分离物并比较其表达水平。通过凝胶分析、分析色谱或多种基于ELISA的方法测定表达水平。将候选URP序列文库与诸如myc标签、His标签、HA标签的序列标签融合有利于测定每种序列变体的表达水平。另一方法是将文库与酶或其他报告蛋白如绿色荧光蛋白融合。尤其感兴趣的是将文库与选择性标记如β-内酰胺酶或卡那霉素-酰基转移酶融合。可利用抗生素选择来富集表达水平高且遗传稳定性好的变体。与蛋白酶孵育后筛选完整序列以鉴定具有良好蛋白酶抗性的变体。有效鉴定蛋白酶抗性URP序列的途径是噬菌体展示或相关展示方法。已经描述了可通过噬菌体展示富集发生快速蛋白酶解的序列的多种系统。容易采用这些方法来富集蛋白酶抗性序列。例如，可在亲和标签和M13噬菌体pIII蛋白之间克隆候选URP序列文库。然后使该文库接触蛋白酶或含蛋白酶的生物样品如血液或溶酶体制备物。蛋白酶作用后可通过与亲和标签结合捕获含有蛋白酶抗性序列的噬菌体。尤其感兴趣的是能够抵抗溶酶体制备物降解的序列，因为溶酶体降解是树突细胞和其他抗原递呈细胞在抗原递呈中的关键步骤。可使用噬菌体展示鉴定不与特定免疫血清结合的候选URP序列，以鉴定具有低免疫原性的URP序列。可利用候选URP序列或URP序列文库免疫动物以产生抗文库中URP序列的抗体。将所得血清用于噬菌体淘选以移除或鉴定被所得免疫血清中抗体识别的序列。也可利用其它方法如细菌展示、酵母展示、核糖体展示识别具有所需特性的URP序列变体。另一方法是利用质谱鉴定感兴趣的URP序列。例如，将候选URP序列文库与感兴趣的蛋白酶或生物样品孵育并利用质谱鉴定抗降解的序列。可利用相似的方法鉴定利于口服摄取的URP序列。可将候选URP序列的混合物饲喂动物或人，并利用质谱鉴定跨组织屏障(即皮肤等)转运或摄取效率最高的变体。以相似的方式，鉴定利于其它摄取机制如经肺、鼻内、直肠、透皮递送的URP序列。也可鉴定利于细胞摄取的URP序列或抗细胞摄取的URP序列。

可通过合并上述方法设计的任意URP序列或URP序列的片段来设计URP序列。此外，可应用半随机方法对基于上述规则设计的序列进行优化。尤其感兴趣的是出于提高增强蛋白的表达及提高编码基因在生产宿主中的遗传稳定性的目的而进行的密码子优化。对于富含甘氨酸或氨基酸序列重复性非常高的URP序列，密码子优化非常重要。可利用计算机程序进行密码子优化(Gustafsson，C.等(2004)Trends Biotechnol，22：346-53)，其中一些能最大程度降低核糖体间歇(Coda Genomics Inc.)(考达基因组学公司)。当设计URP序列时可考虑一些性质。可最大程度降低编码DNA序列的重复性。此外，可避免或最大程度降低使用生产宿主中很少用到的密码子(即AGG和AGA精氨酸密码子和大肠杆菌(E.coli)中的一个亮氨酸密码子)。具有高水平甘氨酸的DNA序列趋于高GC含量，可导致不稳定性和表达水平低。因此，可能时优先选择使URP编码序列的GC含量适合用于制造URP的生产有机体的密码子。

可通过全合成或合成加上酶加工，如限制性酶介导的克隆、PCR和交叠延伸，利用一步或多步来制造URP编码基因。构建URP模块使URP模块编码基因具有低重复性而编码的氨基酸序列具有高度重复性。图11显示该方法。第一步，构建相对短的URP序列文库。这可以是纯密码子文库，每一文库成员具有相同的氨基酸序列但可能有许多种不同的编码序列。将该文库与报告蛋白融合有利于鉴定良好表达的文库成员。合适报道基因的例子有绿色荧光蛋白、萤光素酶、碱性磷酸酶、β-半乳糖苷酶。通过筛选可鉴定能在所选宿主有机体中高浓度表达的短URP序列。然后，生成随机URP二聚体文库并重复筛选高水平表达。通过连接、交叠延伸或类似克隆技术来进行二聚化。可重复数次二聚化过程和后续的筛选直至所得URP序列达到所需长度。可选地，对文库内克隆进行测序以消除含有非所需序列的分离物。短URP序列初始文库允许氨基酸序列变化。例如，可将一些密码子随机化使一些亲水氨基酸出现在所述位置。在反复多聚化的过程中，除对高水平表达进行筛选外，还可对文库内成员的其它特性进行筛选，如溶解度、蛋白酶抗性。除了二聚化URP序列外，还可产生更长的多聚物。这能够更快的增加URP模块的长度。

许多URP序列富含特定氨基酸。因为编码基因可能含有易受重组的重复序列，因此利用重组技术难以产生此类序列。而且，因为在生产宿主中各自装载的tRNA有限，所以高频出现特定密码子的基因可限制表达。一个例子是GRS的重组生产。4种三连体编码甘氨酸残基，它们是：GGG、GGC、GGA和GGT。结果是编码GRS的基因趋于具有高GC含量并且重复性特别高。生产宿主的密码子偏好是另一个挑战。当(生产宿主为)大肠杆菌时，两个甘氨酸密码子GGA和GGG很少被用于高表达蛋白质。因此非常需要对编码URP序列的基因进行密码子优化。可使用考虑密生产宿主码子偏好的计算机程序优化密码子使用(Gustafsson，C.等(2004)Trends Biotechnol，22：346-53)。此外，可构建密码子文库，其所有成员编码同样氨基酸序列但使用不同密码子。可筛选此类文库获得高表达和遗传稳定的成员，它们特别适合大规模生产含URP产物。

多价非结构化重组蛋白(MURP)：

如上所述，在设计具有治疗价值的蛋白时主题URP是非常有用的模块。因此，本发明提供包含一个或多个主题URP的蛋白。本文中此类蛋白命名为非结构化重组蛋白(MURP)。

为了构建MURP，将一个或多个URP序列与蛋白N末端或C末端融合，或将其插入到蛋白中间，如插入到蛋白环中或感兴趣蛋白模块之间，使所得修饰蛋白与未修饰蛋白相比性质改善。连接于蛋白的URP序列的总长度可为40、50、60、70、80、90、100、150、200或更多个氨基酸。

主题MURP具有如下详述的一种或多种改善的性质。

改善的半衰期：

将URP序列加在药学活性蛋白可改善该蛋白的多种性质。具体说，加入长URP序列能显著延长蛋白的血清半衰期。此类URP通常包含至少约40、50、60、70、80、90、100、150、200或更多个氨基酸的氨基酸序列。

可使URP片段化，以使所得蛋白包含多个URP或多个URP片段。一些或所有这些独立URP序列可短于40个氨基酸，只要所得蛋白中所有URP序列的总长度至少为30个氨基酸。优选地，所得蛋白中URP总长度超过40、50、60、70、80、90、100、150、200或更多个氨基酸。在一个方面，融合URP能增加蛋白的流体力学半径并因此降低肾从血液中清除该蛋白的速率。可利用超速离心、大小排阻色谱或光散射检测所得融合蛋白流体力学半径相对于未修饰蛋白的增加。

改善的组织选择性：

流体力学半径增加引起组织渗透减少，可利用这点将药学活性蛋白的副作用降至最小。已有记载，由于增强的透性和滞留(EPR)效应，亲水性聚合物趋于选择性蓄积于肿瘤组织中。EPR效应的潜在原因是肿瘤血管的渗漏属性(McDonald，D.M.等(2002)Cancer Res，62：5381-5)以及肿瘤组织中缺少淋巴流出。因此，通过加入亲水性聚合物可增强用于肿瘤组织的药学活性蛋白的选择性。同样，掺入主题URP可提高给定药学活性蛋白的治疗指数。

降解保护和免疫原性降低：

加入URP序列能显著提高蛋白质的蛋白酶抗性。可设计URP序列使其自身具有蛋白酶抗性，并通过将其与蛋白连接使该蛋白避免接近降解酶。可将URP序列加入药学活性蛋白以达到减少蛋白与其它受体或表面的不良相互作用的目的。为了达到这个目的，宜将URP序列加入到药学活性蛋白中以接近造成此类不良接触的蛋白位点。具体说，可将URP序列加入到药学活性蛋白以减少其与免疫系统的任意组分相互作用以阻止对本发明产物的免疫应答。将URP序列加入到药学活性蛋白能减少与预存抗体或B细胞受体的相互作用。而且，加入URP序列能减少抗原递呈细胞对本发明产物的摄取和加工。优选在蛋白中加入一种或多种URP序列以降低其免疫原性，因为它可在很多物种中抑制免疫应答，这使得人们能够根据动物数据预测产品在病人中的免疫原性。单独测试其免疫原性的此类物种不可能用于基于人T细胞表位鉴定或移除或与人序列进行序列比较的方法。

打断T细胞表位：

将URP序列引入蛋白以打断T细胞表位。对于合并多个分离功能模块的蛋白这点非常有用。T细胞表位的形成需要蛋白抗原的肽段与MHC结合。MHC分子与递呈肽中通常为9个毗连残基的短氨基酸区段相互作用。蛋白分子中不同结合模块的直接融合可引起T细胞表位跨越两个相邻结构域。如图7所示利用URP模块分隔功能模块阻止此类模块跨越式T细胞表位的形成。在功能模块之间插入URP序列也可干扰抗原递呈细胞中的蛋白酶解加工，引起免疫原性的进一步降低。另一个降低免疫原性风险的方法破坏产物功能模块内的T细胞表位。当为微生物蛋白时，一种方法是使一些半胱氨酸间环(不参与靶点结合)富甘氨酸化。在结构中含有少数半胱氨酸的微生物蛋白中，事实上可将不参与靶点结合的多数或所有残基替换为甘氨酸、丝氨酸、谷氨酸和苏氨酸，从而在不影响靶点亲合力的前提下减少免疫原性的可能。例如，可通过对所有残基进行“甘氨酸扫描”来进行，在这个过程中各残基被替换成甘氨酸，然后利用噬菌体展示或筛选来挑选保持靶点结合的克隆，并合并所有允许的甘氨酸替换。通常，与URP模块相比功能模块包含T细胞表位的概率高得多。通过利用小亲水性残基如gly、ser、ala、glu、asp、asn、gin、thr取代所有或许多非关键氨基酸残基来降低功能模块中T细胞表位出现的频率。利用一些随机或基于结构的蛋白工程方法可鉴定功能模块中允许取代的位置。

提高的溶解度：

蛋白功能模块具有有限的溶解度。具体说，结合模块趋于在表面携带疏水性残基，从而限制其溶解度并导致聚集。利用URP序列隔开或侧接此类功能模块可提高所得产物的总体溶解度。对于携带显著比例的亲水性或带电残基的URP模块尤其如此。通过用可溶性URP模块分隔功能模块可降低这些功能模块的分子内相互作用。

改善的pH性质及产物电荷的均一性：

设计URP序列使其携带过量的负电荷或正电荷。结果是，它们对融合伙伴产生静电场，可用于改变酶或结合相互作用的pH性质。而且，带电URP序列的静电场可增加蛋白产物表面电荷pKa值的均一性，这将引起配体相互作用的pH性质的锐化(sharpen)和等电聚焦或色谱聚焦分离的锐化。

由于产物pKa较尖锐(sharp)造成改善的纯化性质：

溶液中的每种氨基酸本身具有单一固定的pKa，这是一半官能团被质子化的pH值。典型的蛋白具有多种类型的残基，由于相互靠近和蛋白的喘息效应，它们以多种方式改变彼此的有效pKa。因此，在宽范围的pH条件下，一般蛋白可采取各自具有不同分子量和净电荷的数百种不同的离子化形式，因为存在很多种带电和中性氨基酸残基的组合。这被称作宽离子化谱并对该类蛋白的分析(即质谱)和纯化造成困难。

PEG不带电并且不影响与其连接的蛋白质质子化谱，使其保持宽的质子化谱。然而，原则上含有高含量Gly和Glu的URP仅以两种状态存在：当pH低于谷氨酸pKa时为中性(-COOH)，当pH高于谷氨酸pKa时带负电(-COO^-)。URP模块可形成单一、均匀离子化的分子类型并在质谱中产生单一质量。

所需的是，将MURP与单一电荷类型(Glu)以恒定间隔分布在整个URP模块上的URP融合表达。可选择在每20kD URP中掺入25-50个Glu残基，并且所有这25-50个残基具有很相似的pKa。

此外，将25-50个带负电荷加到诸如IFN、hGH或GCSF(仅含20个带电残基)等小蛋白中会增加产物的电荷均一性并锐化其等电点，使等电点与游离谷氨酸的pKa非常相近。

与传统的PEG化相比，蛋白群体电荷均一性的提高会带来有利的加工特性，如在离子交换、等电聚焦、质谱等中的特性。

改善的制剂和/或递送：

在药学活性蛋白中加入URP能显著简化所得产物的制剂和/或递送。设计URP序列使其亲水性非常高，从而提高人蛋白的(例如)溶解性，这些人蛋白常含用于与其它蛋白结合的疏水斑(patch)。此类人蛋白如抗体的制剂很具挑战性，经常限制其浓度和递送选择。URP可减少产品的沉淀和聚集，并可使用较简单的包含较少成分的制剂，这些成分是在溶液中稳定产物通常所需的。含URP序列产物溶解性的提高使其能够以更高浓度制剂，因此减少可注射产品的注射体积，这样可进行仅限于非常小体积注射的家庭注射。加入URP序列也可简化所得制剂产物的储存。可在药学活性蛋白中加入URP以利于其口服、肺部、直肠或鼻内摄取。因为允许更高产物浓度和增强了产物的稳定性，所以URP序列可利于多种递送模式。设计利于膜渗透的URP序列可达到进一步改进的目的。

改进生产：

加入URP序列对所得产物的生产有显著益处。许多重组产物，尤其是天然人蛋白，在生产过程中趋于形成难以或不能溶解的聚集体，甚至将其从最终产物移除后会再次出现。这常因为这些(天然人)蛋白通过疏水斑与其它(天然人)蛋白接触，并且出于免疫原性的考虑，突变这些残基是有风险的。然而，URP能增加此类蛋白的亲水性，并且在无需突变人蛋白序列的前提下改善其制剂。URP序列能利于蛋白折叠以达到其天然状态。利用重组技术产生的许多药学活性蛋白是非天然聚集态。需要对这些产物进行变性，然后在允许其折叠成为天然活性状态的条件下孵育。常在复性过程中发生的副反应是产生聚集体。URP序列与蛋白的融合物显著降低其形成聚集体的倾向，因此利于产物中药学活性成分的折叠。与聚合物修饰蛋白相比，含URP的产物更易于制备。在纯化活性蛋白之后，化学聚合物修饰需要额外的修饰和纯化步骤。相反，URP序列能以重组DNA方法与药学活性蛋白一起制造。与聚合物修饰产物相比，本发明产物明显易于鉴定。因为采用重组生产方法，可获取多个具有明确分子特征的多种均一产物。URP序列也可利于产物纯化。例如，URP序列可包含能被亲和色谱捕获的亚序列。一个例子是富含组氨酸的序列，它可被固化金属如镍的树脂捕获。可设计URP序列，使其含有过多的带负电荷或正电荷的氨基酸。因此它们能显著影响产物的净电荷，这有利于通过离子交换色谱或制备电泳纯化该产物。

主题MURP含有多种模块，包括但不限于结合模块、效应模块、多聚化模块、C末端模块和N末端模块。图1说明具有多个模块的示例MURP。然而，MURP也可具有如图2所示的相对简单的构造。MURP也可包含片段化位点。它们可为蛋白酶敏感序列或化学敏感序列，当MURP到达其靶点时这些序列能够被优先切割。

结合模块(BM)：

本发明的MURP可包含一个或多个结合模块。结合模块(BM)指能特异性与一个或多个靶点结合的肽或蛋白质序列，所述靶点可为一个或多个治疗性靶点或附属靶点，如用于靶向细胞、组织或器官的靶点。BM可为线性肽或环肽、半胱氨酸约束肽、微生物蛋白、支架蛋白(如纤连蛋白、锚定蛋白、晶体、链霉亲和素、抗体片段、结构域抗体)、肽激素、生长因子、细胞因子、或任意类型(人或非人、天然或非天然)的蛋白结构域，它们可基于天然支架或不基于天然支架的，或基于其组合，或者上述任何物质的片段。任选地，这些BM可通过加入、移除或取代一个或多个氨基酸进行工程改造以增强其结合属性、稳定性或其它性质。结合模块可获自天然蛋白，通过设计或遗传包展示，包括噬菌体展示、细胞展示、核糖体展示或其它展示方法获得。结合模块可结合于同一靶点的同一拷贝，导致亲合或与同一靶点的不同拷贝结合(如果这些拷贝某种程度上由(如)细胞膜联系或连接，可导致亲合)，或它们可与两个不相关靶点结合(如果这些靶点某种程度上由(如)膜连接，导致亲合)。通过筛选或分析肽或蛋白的随机文库可鉴定结合模块。

尤其需要的结合模块是一旦掺入MURP后，MURP产生所需的T表位评分的那些结合模块。蛋白的T表位评分是该蛋白与多个最常见人MHC等位基因结合Kd(解离常数、亲合力、解离速率)的对数值，如Stumiolo，T.等(1999)Nature Biotechnology17：555)所述。这些评分范围覆盖至少15个对数值，从约10、9、8、7、6、5、4、3、2、1、0、-1、-2、-3、-4、-5(10e¹⁰Kd)至约-5。优选MURP产生的评分小于约-3.5[KKW：绝对比例？]

尤其感兴趣的还有包含由成对的两个半胱氨酸残基形成的二硫键的结合模块。在某些实施方式中，结合模块包含具有高半胱氨酸含量或高二硫键密度(HDD)的多肽。HDD家族的结合模块通常具有5-50％(5、6、7、8、9、10、12、14、16、18、20、25、30、35、40、45或50％)的半胱氨酸残基，每一结构域通常含有至少两个二硫键以及任选的辅因子如钙或其它离子。

HDD支架的存在允许这些模块小但仍采取相对刚性的结构。刚性对于获取高结合亲合力、蛋白酶(包括参与抗原加工的蛋白酶)和热抗性很重要，因此使这些分子具有低免疫原性或没有免疫原性。无需多数模块内部的大量疏水侧链相互作用，二硫键框架就能折叠该模块。小尺寸也有利于快速组织渗透和其它任选的递送途径，如口服、鼻腔、肠道内、肺部、血脑屏障等。此外，小尺寸也有助于降低免疫原性。通过增加二硫键的数目或利用含有较少氨基酸和同样数目二硫键的结构域，可获得较高二硫键密度。也需要减少非半胱氨酸固定残基的数目，以便使更高比例的氨基酸用于靶点结合。

含半胱氨酸的结合模块能采取各种二硫键成键模式(DBP)。例如，两个二硫键模块可具有三种二硫键成键模式(DBP)，三个二硫键模块可有15种不同的DBP，四个二硫键模块可有多至105种不同的DBP。所有2SSDBP、大部分3SSDBP和少于一半的4SS DBP有天然例子。在一个方面，根据公式可计算二硫键成键模式的总数：错误！无法从编辑域代码中创建对象，其中n＝半胱氨酸残基形成的二硫键的预测数目，其中错误！无法从编辑域代码中创建对象代表(2i-1)的结果，其中i为1-n的正整数。

因此，在一个实施方式中，MURP中使用的模块为含天然或非天然产生的半胱氨酸(C)的支架，该指甲对靶分子有结合特异性，其中根据选自公式错误！无法从编辑域代码中创建对象代表的一组排列模式，含非天然半胱氨酸(C)的支架包含支架内半胱氨酸，其中n等于半胱氨酸残基形成二硫键的预测数目，并且错误！无法从编辑域代码中创建对象代表产物(2i-1)，其中i为1-n的正整数。在一个方面，天然或非天然产生的含半胱氨酸的模块包含具有由多肽中成对半胱氨酸根据选自C^1-2，3-4、C^1-3，2-4或C^1-4，2-3的模式形成的两个二硫键的多肽，其中两个由连字符连接的数字表示从多肽N末端起哪两个半胱氨酸配对形成二硫键。在另一方面，天然或非天然产生的含半胱氨酸的模块包含具有由成对支架内半胱氨酸根据选自C^{1-2，3-4，5-6}、C^{1-2，3-5，4-6}、C^{1-2，3-6，4-5}、C^{1-3，2-4，5-6}、C^{1-3，2-5，4-6}、C^{1-3，2-6，4-5}、C^{1-4，2-3，5-6}、C^{1-4，2-6，3-5}、C^{1-5，2-3，4-6}、C^{1-5，2-4，3-6}、C^1-5， ^2-6，3-4、C^{1-6，2-3，4-5}或C^{1-6，2-5，3-4}的模式形成的三个二硫键的多肽，其中两个由连字符连接的数字表示从多肽N末端起哪两个半胱氨酸配对形成二硫键。另一方面，天然或非天然产生的含半胱氨酸模块含有具有由多肽中成对半胱氨酸根据选自上述公式定义的排列模式形成的至少四个二硫键的多肽。另一方面，天然的或非天然产生的含半胱氨酸的模块含有具有由多肽中成对半胱氨酸根据选自上述公式定义的排列模式形成的至少五个、六个或更多个二硫键的多肽。共待批申请[系列号11/528,927和11/528,950，全文纳入本文作参考]中任何含半胱氨酸蛋白或支架为候选结合模块。

结合模块可选自在二硫键结合的半胱氨酸间有4、5、6、7、8、9、10、11和12个随机或部分随机氨基酸的半胱氨酸约束环肽文库(如以构建模式)，在一些情况下可用数种方法在胱氨酸对外侧构建额外的随机氨基酸。可利用各种方法，包括噬菌体展示、核糖体展示、酵母展示和其它本领域所知方法鉴定对感兴趣靶点具有特异性的文库成员。可利用此类环肽作为MURP中的结合模块。在一个优选的实施方式中，可利用使结合模块含有一个以上二硫键的构建方法进一步工程改造半胱氨酸限制肽，以提高其结合亲合力、蛋白酶解稳定性和/或特异性。图25显示了一个特定的构建方法。该方法基于在起先所选环肽的N末端一侧以及C末端一侧加上单独的半胱氨酸及多个随机残基。可产生如图25所设计的文库。可利用噬菌体展示或相似技术鉴定具有改进特性的结合模块。此类构建文库可包含在环肽的N末端一侧以及C末端一侧的1-12个随机位置。新加随机侧翼半胱氨酸残基和环肽中半胱氨酸残基之间的距离可在1-12个残基间变化。此类文库每一成员包含四个半胱氨酸残基，两个来自原始环肽，两个位于新加侧翼。该方法偏好1-42-3DBP或DBP的变化，打破了现有的1-2个二硫键(＝4-半胱氨酸构建物中的2-3个)形成1-23-4或1-32-4DBP。可利用克隆特异性引物进行这种构建方法，使得不在文库区域间留下固定序列(如图25所示)，或者利用(也因此留下)起先选择的肽两侧的固定序列的引物进行，因此这些同样的引物可用于任何起先选择的克隆，如图26所示。如图26所示的方法可应用于对感兴趣靶点具有特异性的环肽集合。已证明这两种构建方法在构造抗VEGF亲和成熟中均能发挥作用。重复该方法以产生含有六个或更多个半胱氨酸残基的结合模块。

图27显示了另一种将一个二硫键构造入2-二硫键序列中。该方法包括原先选择的1-二硫键肽库与其本身的二聚化，以致预选择肽库在N末端以及C末端位置终止。该方法利于构建靶点两个不同表位的2-二硫键序列的构造。

另一构造方法包括加入包含两个半胱氨酸的6-15个残基的(部分)随机化序列，这两个半胱氨酸中间相隔4、5、6、7、8、9、或10个氨基酸，在连接的半胱氨酸外还可任选附加随机位置。在预先选择肽的N末端一侧或C末端一侧加上该2-半胱氨酸随机序列。该方法偏好1-23-4DBP，虽然也会形成其它DBP。重复该方法以产生含有六个或更多半胱氨酸残基的结合模块。

可根据天然蛋白支架构建结合模块。可通过数据库检索鉴定此类支架。基于天然支架的文库可进行噬菌体展示淘选，然后筛选以鉴别特异性结合感兴趣靶点的序列。

用于构建结合模块的天然支架选择范围很宽。特定支架的选择依赖于目标靶点。天然支架的非限制性例子包括蛇毒样蛋白，如蛇毒毒素和人细胞表面受体的胞外结构域。蛇毒毒素的非限制性例子为扁尾蛇毒素B、γ-心脏毒素、抗胆碱酯酶神经毒素、毒蕈碱毒素、半环扁尾海蛇神经毒素A、神经毒素I、心脏毒素V4II(毒素III)、心脏毒素V、α-眼镜蛇毒素、长神经毒素1、FS2毒素、金环蛇毒素、马来环蛇毒素、心脏毒素CTXI、心脏毒素CTXIIB、心脏毒素II、心脏毒素III、心脏毒素IV、眼镜蛇毒素2、α-毒素、神经毒素II(眼镜蛇毒素B)、毒素B(长神经毒素)、坎多毒素(Candotoxin)、布卡尼。(人)细胞表面受体胞外结构域的非限制性例子包括CD59、II型活化素受体、BMP受体Ia外结构域、TGF-βII型受体胞外结构域。其它天然支架包括但不限于A-结构域、EGF、Ca-EGF、TNF-R、Notch、DSL、Trefoil、PD、TSP1、TSP2、TSP3、Anato、整联蛋白B、甲状腺球蛋白、抵御素1、抵御素2、植物环蛋白、SHKT、去整联蛋白、肌肉毒素、γ-硫因、芋螺毒素、μ-芋螺毒素、ω-蜘蛛毒素毒素、δ-Atraco毒素以及在共待审申请系列号11/528,927和11/528,950公开的家族，全文纳入本文的参考文献。

已经描述过如何从大的变体文库中鉴定结合分子的多种方法。一种方法是化学合成。在珠上合成文库成员，因此每个珠子携带不同的肽序列。利用标记的结合伙伴鉴定携带所需特异性配体的珠子。另一方法是产生肽子文库，以重复过程鉴定特异性结合序列(Pinilla，C.等(1992)BioTechniques，13：901-905)。更常用的是在噬菌体、蛋白或细胞的表面表达变体文库的展示方法。这些方法的共同点在于编码文库中每一变体的DNA或RNA物理连接于配体。这样可以检测或获取感兴趣配体并通过对连接的DNA或RNA进行测序来确定其肽序列。本领域熟练技术人员可利用展示方法从大的随机变体文库中富集具有所需结合特性的文库成员。常常，通过筛选富集文库中具有所需特性的单个分离物可从富集文库中鉴定具有所需结合特性的变体。展示方法的例子是与lac阻抑物融合(Cull，M.等(1992)Proc.Natl.Acad.Sci.USA，89：1865-1869)、细胞表面展示(Wittrup，K.D.(2001)Curr Opin Biotechnol，12：395-9)。尤其感兴趣的方法是连接于噬菌体颗粒的随机肽或蛋白。常用的是M13噬菌体(Smith，G.P.等(1997)Chem Rev，97：391-410)和T7噬菌体(Danner，S.等(2001)Proc Natl AcadSci USA，98：12954-9)。可利用多种方法在M13噬菌体上展示肽或蛋白。许多情况下，文库序列与M13噬菌体肽pIII的N末端融合。噬菌体通常携带3-5个拷贝的这种蛋白，因此该文库内的噬菌体在多数情况下携带3-5个拷贝的文库成员。这种方法是多价展示。另一种方法是文库由噬菌粒编码的噬菌粒展示。通过用辅助噬菌体感染携带噬菌粒的细胞可形成噬菌体颗粒(Lowman，H.B.等(1991)Biochemistry，30：10832-10838)。这一过程通常引起单价展示。在一些情况下，优选单价展示以获得高亲和力的结合子。另一些情况下则优选多价展示(O′Connell，D.等(2002)JMol Biol，321：49-56)。

已经描述过用噬菌体展示富集具有所需特性的序列的数种方法。可通过结合于免疫管、微孔板、磁珠或其它表面固定感兴趣靶点。然后，噬菌体文库与固定靶点接触，缺少结合配体的噬菌体被洗去，在多种条件下洗脱携带靶点特异性配体的噬菌体。洗脱可在低pH、高pH、尿素或其它趋于打断蛋白-蛋白接触的条件下进行。也可加入大肠杆菌细胞洗脱结合的噬菌体，使洗脱噬菌体可直接感染加入的大肠杆菌宿主。一个有趣的试验方案是利用可降解噬菌体结合配体或固定靶点的蛋白酶洗脱。蛋白酶也可用作富集蛋白酶抗性噬菌体结合配体的工具。例如，在淘选感兴趣靶点之前，将噬菌体结合配体文库与一种或多种(人或小鼠)蛋白酶孵育。这一过程从文库中降解并移除了蛋白酶不稳定性配体(Kristensen，P.等(1998)Fold Des，3：321-8)。也可通过与复杂生物样品结合富集配体的噬菌体展示库。例子为在固化细胞膜组分(Tur，M.K.等(2003)Int JMol Med，11：523-7)或整个细胞(Rasmussen，U.B.等(2002)Cancer Gene Ther，9：606-12；Kelly，K.A.等(2003)Neoplasia，5：437-44)上进行淘选。在一些情况下，优化淘选条件以提高从噬菌体展示库中富集细胞特异性结合物的效率(Watters，J.M.等(1997)Immunotechnology，3：21-9)。噬菌体淘选也可在活体病人或动物上进行。这一方法对于鉴定结合于血管靶点的配体尤感兴趣(Arap，W.等(2002)Nat Med，8：121-7)。

本领域熟练技术人员可利用数种克隆方法产生编码肽文库的cDNA文库。可使用核苷酸的随机混合物合成包含一个或多个随机位置的寡核苷酸。这一过程可控制随机位置的数目及随机化程度。此外，通过部分消化生物样品的DNA可获得随机或半随机DNA序列。可使用随机寡核苷酸构建预先却带位置中随机化的质粒或噬菌体的文库。可通过(de Kruif，J.等(1995)J Mol Biol，248：97-105)所述方法进行PCR融合。其它方法基于DNA连接(Felici，F.等(1991)JMol Biol，222：301-10；Kay，B.K.等(1993)Gene，128：59-65)。其它常用方法为康可尔(Kunkel)诱变，其中以单链环状DNA为模板合成质粒或噬菌粒的诱变链。参见：Sidhu，S.S.等(2000)Methods Enzymol，328：333-63；Kunkel，T.A.等(1987)Methods Enzymol，154：367-82。

康可尔诱变使用含有可从大肠杆菌菌株如CJ236获取的随机掺入尿嘧啶碱基的模板。含尿嘧啶模板链优选在转化进入大肠杆菌后降解，而体外合成的诱变链被保留。结果多数转化细胞携带诱变的噬菌粒或噬菌体。增加文库多样性的有价值的方法是合并多个子文库。可通过上述任意方法生成这些子文库，它们可以基于相同或不同支架。

近来已描述产生大的短肽噬菌体文库的有用方法(Scholle，M.D.等(2005)Comb Chem High Throughput Screen，8：545-51)。该方法与康可尔方法相关但无需生成包含随机尿嘧啶碱基的单链模板。事实上，该方法从携带一个或多个接近诱变区域突变的模板噬菌体开始，所述突变使噬菌体无感染力。该方法使用某些位置携带随机密码子并能校正模板中噬菌体失活突变的诱变寡核苷酸。结果是，仅诱变噬菌体颗粒在转化后具有感染性，极少数亲本噬菌体包含于此类文库中。还可以数种途径进一步修饰该方法。例如，可利用多个诱变寡核苷酸同时诱变噬菌体的多个非毗连区域。我们进一步利用该方法，将其应用于＞25、30、35、40、45、50、55和60个氨基酸的整个微生物蛋白，而非＜10、15或20个氨基酸的短肽，这是另一个挑战。该方法在一次转化后产生多于10e10个转化子(最多10e11)的文库，因此预计10次转化可得到多样性为10e12的单一文库。

超力(Scholle)方法的另一变型是设计诱变寡核苷酸，使模板中的琥珀终止密码子转化为赭石终止密码子，下一诱变循环中则是赭石成为琥珀。这种情况下，模板噬菌体和诱变文库成员必须培养于不同大肠杆菌抑制子菌株中，赭石抑制子和琥珀抑制子菌株交替。这样可通过在两种类型的终止密码子和两种抑制子菌株之间交替进行连续的噬菌体诱变改变。

另一种超力方法的变型涉及使用单链噬菌体DNA模板及大引物。大引物是产生自前一轮淘选选择的噬菌体库的文库插入物的长ssDNA。目的是从先前的库中捕获各种文库插入物，在一个或多个区域对它进行诱变并以其它区域可被诱变的方法将其转至新文库中。可利用含有感兴趣基因终止密码子的相同模板对大引物进行重复数个循环的加工。大引物是ssDNA(任选通过PCR产生)，包含1)与ssDNA模板互补的至少15个碱基的5’和3’重叠区，2)拷贝自(任选通过PCR)原先选择的克隆库的一个或多个原先选择文库区域(1，2，3，4或更多)，和3)下一轮淘选中选择的新诱变的文库区域。任选通过以下方法制备大引物：1)合成一个或多个编码新合成文库区域的寡核苷酸，2)可选地利用交叠PCR将其与DNA片段融合(可选地通过PCR得到)，所述DNA片段包含原先优化的其它文库区域。利用合并(交叠)PCR产物的失控(Run-off)或单链PCR产生包含所有原先优化区域以及将在下一轮淘选实验中优化的其它区域的新文库的单链大引物。预计该方法能够利用多次快速文库创建循环进行蛋白亲和成熟，每一轮生成10e11-10e12的多样性，然后进行淘选。

可应用数种方法在(预先选择或原始)微生物蛋白文库中引入序列多样性，或诱变单个微生物蛋白克隆，目的是增强其结合或其它特性，如制造、稳定性或免疫原性。原则上，所有可被用于产生文库的方法也可用于在微生物蛋白富集(原先选择的)文库中引入多样性。具体说，可合成具有所需结合或其它特性的变体并根据这些序列设计部分随机化寡核苷酸。该过程允许控制随机化的位置和程度。可利用数种计算机算法(Jonsson，J.等(1993)Nucleic Res，21：733-9；Amin，N.等(2004)，Protein Eng Des Sel，17：787-93)由多个变体序列数据推断蛋白质中单个突变的效用。尤其感兴趣用于富集库再诱变的方法是DNA改组(Stemmer，W.P.C.(1994)Nature，370：389-391)，这将在富集文库中产生单个序列的重组子。利用多种改良的PCR条件进行改组，并且可部分降解模板以增强重组。另一可选方案是利用基于限制性酶的克隆在预定位置进行重组。尤其感兴趣的是利用能在序列识别位点外切割DNA的IIS型限制性酶的方法(Collins，J.等(2001)J Biotechnol，74：317-38)。可使用能产生非回文结构突出端的限制性酶在多个位点切割编码变体混合物的质粒或其它DNA，并且通过连接再组装完整质粒(Berger，S.L.等(1993)Anal Biochem，214：571-9)。另一引入多样性的方法是PCR-诱变，在诱变条件下对编码文库成员的DNA序列进行PCR。已描述导致相对高突变频率的PCR条件(Leung，D.等(1989)Technique，1：11-15)。此外，可使用保真性降低的聚合酶(Vanhercke，T.等(2005)AnalBiochem，339：9-14)。尤其感兴趣的方法是基于突变子株的方法(Irving，R.A.等(1996)Immunotechnology，2：127-43；Coia，G.等(1997)Gene，201：203-9)。这些菌株携带一个或多个DNA修复基因突变。这些菌株中的质粒或噬菌体或其它DNA在正常复制的过程中累积突变。可繁殖突变子菌株中的单个克隆或富集群体以引入遗传多样性。上述许多方法可用于重复过程。可对整个基因或基因的一部分应用多轮诱变和筛选或淘选，或在每一后续轮次中对蛋白的不同部分进行诱变(Yang，W.P.等(1995)J Mol Biol，254：392-403)。

进一步处理文库以减少伪像。噬菌体淘选的已知伪像包括1)基于疏水性的非特异性结合，2)与靶点的多价结合，原因是a)五价pIII噬菌体蛋白，或b)不同微生物蛋白间形成的二硫键，产生多聚体，或c)固相支持物上靶点的高密度涂层，并且3)环境(context)依赖的靶点结合，其中靶点的环境(context)或微生物蛋白的环境(context)对于结合或抑制活性至关重要。采取不同的处理步骤以将这些问题的幅度减至最小。例如，此类处理可应用于整个文库，但一些移除坏克隆的有用处理仅能应用于可溶性蛋白库或单个可溶性蛋白。

含半胱氨酸支架的文库可能含有游离巯基，巯基通过与其它蛋白交联使定向演化变得复杂。一种方法是通过流过游离巯基柱移除文库中最坏克隆，因此可以移除具有一个或多个游离巯基的所有克隆。有游离SH基团的克隆也可与生物素-SH试剂反应，以便使用链霉亲和素柱有效移除有反应性SH基团的克隆。另一方法是不移除游离巯基，但可利用巯基反应性化合物如碘乙酸加帽而使其失活。尤其感兴趣的是减少非特异性结合或修饰变体的大容量或亲水性巯基试剂。

环境(context)依赖性例子为所有的恒定序列，包括pIII蛋白、接头、肽标签、生物素-链霉亲和素、Fc和其它参与相互作用的融合蛋白。避免环境依赖性的典型方法包括尽量频繁地变化环境以避免构建(buildup)。可包括不同的展示系统之间的改变(即M13对T7，或M13对酵母)、改变所用标签和接头、改变固定用的(固体)支持物(如固定化学)以及改变靶蛋白本身(不同的供应商及不同的融合物)。

也可使用文库处理选择具有优选特性的蛋白。一种选择就是利用蛋白酶处理文库以从文库中移除不稳定变体。所使用的蛋白酶通常为那些本申请中遇到的蛋白酶。为了进行肺部递送，可使用(例如)灌肺得到的肺蛋白酶。相似地，可获得来自血清、唾液、胃、肠、皮肤和鼻腔等的蛋白酶的混合物。大范围的蛋白酶列表见[附件E]。例外地，噬菌体本身对大多数蛋白酶和苛刻处理条件具有抗性。

例如，可能通过暴露于浓度递增的还原性试剂(即DTT或β巯基乙醇)，首先清除最不稳定的结构，来选择最稳定结构的文库，即那些具有最强的二硫键的文库。通常使用还原性试剂(即DTT、BME和其它试剂)浓度为2.5mM、至5mM、10mM、20mM、30mM、40mM、50mM、60mM、70mM、80mM、90mM或甚至100mM，这取决于所需的稳定性。

也可能通过用高水平还原剂还原整个展示文库，接着逐渐再氧化蛋白文库以重建二硫键，然后去除含有游离SH基团的克隆，来选择能够体外有效折叠的克隆。可重复一次或多次该过程以消除体外折叠效率低的克隆。

一种方法是应用遗传方法来选择蛋白表达水平、折叠和溶解性，如A.C.Fisher等(2006)“利用双精氨酸移位通路折叠质控特性进行的蛋白溶解性的遗传选择”(Genetic selection for protein solubility enabled by the folding qualitycontrol feature of the twin-arginin translocation pathway)Protein Science(在线)所述。进行展示文库淘选(可选)之后，可避免在蛋白水平筛选数千个克隆的靶点结合、表达水平和折叠。另一个方案是将整个所选插入物库克隆入β内酰胺酶融合载体中，当在β内酰胺上铺板时，作者证明其对表达良好的、完全二硫键键合的可溶性蛋白的选择性。

在M13噬菌体展示蛋白文库和一次或数次循环的靶点淘选之后，有数种途径可以继续进行，包括(1)利用噬菌体ELISA筛选个体噬菌体克隆，这能测定结合于固定靶点的噬菌体颗粒的数目(利用抗-M13抗体)；(2)由M13转移到T7噬菌体展示文库。第二种方法在减少基于价态的假阳性的发生率方面尤其有用。任何一种文库格式趋于偏好可与靶点形成高亲合力接触的克隆。尽管很缓慢，但这是筛选溶解蛋白很重要的原因。T7噬菌体展示形成的多价与M13展示中形成的相当不同，T7和M13间的循环可作为减少基于价态的假阳性发生率的绝佳方法。

滤膜提升(filter lift)是另一种可用于在大琼脂板上高密度培养细菌菌落(10e2-10e5)的方法。少量的某些蛋白被分泌进入培养基并最终结合于滤膜上(硝基纤维素或尼龙)。在脱脂牛奶、1％酪蛋白水解物或1％BSA溶液中封闭滤膜，然后与荧光染料或指示酶(通过抗体或生物素-链霉亲和素直接或间接)标记的靶蛋白培育。通过将滤膜平铺于平板背面确定菌落的位置，选择所有的阳性菌落，并用于其它鉴定。滤膜提升的优势在于可通过在洗涤后不同时段读取信号而将其设计为有亲和选择性。高亲和力克隆的信号“衰减”慢，而低亲和力克隆的信号则衰减快。此类亲和鉴定通常需要三点实验及基于孔的实验，并且与基于孔的实验相比提供了更好的克隆-克隆间的可比性。将菌落划分成网格阵列是将菌落尺寸和位置带来的差异最小化的有用方法。

N末端模块：

主题MURP可包含N末端模块(NM)，在促进MURP产生中特别有用。当产物在大肠杆菌细胞质中表达时，NM可以为单一甲硫氨酸残基。典型产物的形式是与治疗性蛋白融合的URP，它在细菌胞质中表达因此N末端为甲酰甲硫氨酸。甲酰甲硫氨酸可为永久或临时的(如果被生物或化学加工移除)。

NM也可以是为蛋白酶解过程进行工程改造的肽序列，可用于移除标签或移除融合蛋白。经工程改造，N末端模块可通过包含亲和标签如Flag-、Myc-、HA-或His-标签而利于MURP的纯化。N末端模块也可包含用于检测MURP的亲和标签。可将NM进行工程改造或选择以高水平表达MURP。也可将其工程改造或选择以增强所得MURP的蛋白酶抗性。可生产具有利于表达和/或纯化的N末端模块的MURP。在生产过程中利用蛋白酶可将N末端模块切去，以使最终产物不包含N末端模块。

通过优化N末端模块的氨基酸和密码子选择可增加重组产量。N末端模块也可包含可被特定蛋白酶如Xa因子、凝血酶、或肠激酶、番茄蚀纹病毒(TEV)蛋白酶切割的加工位点。可设计加工位点以便被化学水解切割。一个例子是可在酸性条件下被切割的氨基酸序列asp-pro。也可设计利于MURP纯化的N末端模块。例如，可设计N末端模块包含多个his残基，以便通过固定金属色谱捕获产物。N末端模块可包含能特异性被抗体捕获或识别的肽序列。例子是FLAG、HA、c-myc。

C末端模块：

MURP可包含在促进MURP生产中特别有用的C末端模块。例如，C末端模块可包含进行蛋白酶解加工移除融合序列、从而提高蛋白质表达或促进纯化的切割位点。具体说，C末端模块也可包含可被特定蛋白酶如Xa因子、凝血酶、TEV蛋白酶或肠激酶切割的加工位点。设计可被化学水解切割的加工位点。例子是可以在酸性条件下切割的氨基酸序列asp-pro。C末端模块可以是利于MURP纯化的亲和标签。例如，可设计C末端模块以使其包含多个his残基，以便通过固定金属色谱捕获产物。C末端模块可包含能特异性被抗体捕获或识别的肽序列。标签的非限制性例子包括FLAG-、HA-、c-myc或His-标签。也可工程改造或选择C末端模块以增强所得MURP的蛋白酶抗性。

所需的是，可将该蛋白的N末端与其自身C末端相连。例如，通过创造氨基酸样天然连接(肽键)或使用外源性连接体将这两个模块连接起来。尤其感兴趣的是环肽，它是一类天然发生的小蛋白家族。预计采用类似环肽的结构形式能够提供对抗外源性蛋白酶的更多的稳定性。在较低蛋白浓度下这类分子内连接能工作得更好。

效应模块：

MURP可包含一个或多个效应模块(EM)或根本没有效应模块。效应模块通常不提供靶向，但提供治疗效果所需的活性，如细胞杀伤。EM可为药学活性小分子(即毒性药物)、肽或蛋白。非限制性例子为完整的细胞因子、抗体酶、生长因子、激素、受体、受体激动剂或拮抗剂，或其片段或结构域。效应模块也可包含携带合成或天然的化学连接小分子药物的肽序列。可选地，这些效应分子可通过化学接头与效应模块连接，可在选定条件下切割或不切割这些接头，从而释放毒性活性。EM也可包含放射性同位素及其螯合物，以及用于PET和MRI检测的不同标记物。效应模块也可对细胞或组织有毒。尤其感兴趣的是包含毒性效应模块以及与疾病组织或疾病细胞类型特异性结合的结合模块的MURP。此类MURP可以特异性蓄积于疾病组织或疾病细胞中，并优先在疾病细胞或组织中发挥其毒性作用。下列为效应模块的例子。

酶-效应模块可为酶。尤其感兴趣的是降解对细胞生长至关紧要的代谢物，如糖或氨基酸或脂或辅助因子的酶。其它具有酶活性的效应模块的例子为RNA酶、DNA酶和磷酸酶、天冬酰胺酶、组氨酸酶、精氨酸酶、β内酰胺酶。具有酶活性的效应模块当递送至组织或细胞时可具有毒性。尤其感兴趣的是将毒性效应模块和特异性结合疾病组织的结合模块组合在一起的MURP。能在肿瘤位点将非活性前药转化为活性药物的酶也是潜在的效应模块。

药物-主题MURP可包含药物作为效应物。所需的是，可设计用于药物分子的器官选择性递送的序列。一个例子见图8。URP序列可与优选结合于疾病组织的蛋白融合。同样的URP序列可包含经修饰可以与药物分子结合的一个或多个氨基酸残基。此类偶联物以高度特异性结合于疾病组织，所连接的药物分子能够产生局部作用，从而将细胞药物的全身接触减至最小。通过引入可在所需作用位点被天然蛋白酶切割的蛋白酶敏感位点，可设计MURP以利于药物分子的在靶点处的释放。利用URP序列设计药物递送构建物的显著优势是可避免药物分子和构建物靶向结构域之间的不良相互作用。可与靶向结构域偶联的许多药物分子具有显著的疏水性，使得所得偶联物趋于聚集。通过将亲水性URP序列加入到此类构建物可提高所得递送构建物的溶解性，从而降低聚集趋势。而且，通过加上长URP序列可增加与靶向结构域融合的药物分子的数目。此外，使用URP序列可优化药物偶联位点之间的距离以利于完成偶联。适合的药物列表包括但不限于化疗药，如：硫替派和环磷酰胺(环磷酰胺^TM)；烷基磺酸，如白消安、英丙舒凡和哌泊舒凡；吖丙啶，如苯佐替派、卡波醌、美妥替哌和乌瑞替派；氮丙啶和甲蜜胺，包括六甲蜜胺、曲他胺、三亚乙基磷酰胺、三亚乙基硫代磷酸胺和三羟甲蜜胺；氮芥，如苯丁酸氮芥、萘氮芥、氯磷酰胺、雌莫司汀、异环磷酰胺、双氯乙基甲胺、盐酸氧氮芥、美法仑、新恩比兴、苯乙酰胆固醇氮芥、泼尼莫司汀、曲磷胺、乌拉莫司汀；亚硝基脲，如卡莫司汀、吡葡亚硝脲、福莫司汀、洛莫司汀、尼莫司汀、雷莫司汀；抗生素，如阿柔比星、放线菌素、安曲霉素、偶氮丝氨酸、博来霉素、放线菌素c、卡奇霉素、卡拉比星(carabicin)、洋红霉素、嗜癌霉素、色霉素、放线菌素d、道诺霉素、地托比星、6-重氮-5-氧代-L-正亮氨酸、多柔比星、表柔比星、依索比星、黄胆素、马赛罗霉素、丝裂霉素、霉酚酸、诺拉霉素、橄榄霉素、培洛霉素、波非罗霉素(potfiromycin)、嘌呤霉素、三铁阿霉素、罗多比星、链黑霉素、链佐星、块菌素、乌苯美司、净司他丁、佐柔比星；抗代谢物，如甲氨蝶呤和5-氟尿嘧啶(5-FU)；叶酸类似物，如二甲叶酸、甲氨蝶呤、蝶罗呤、三甲曲沙；嘌呤类似物，如氟达拉滨、6-巯基嘌呤、硫咪嘌呤、硫鸟嘌呤；嘧啶类似物，如安西他滨、阿扎胞苷、6-氮尿苷、卡莫氟、阿糖胞苷、二脱氧尿苷、去氧氟尿苷、依诺他滨、氟尿苷；雄激素如卡普睾酮、丙酸屈他雄酮、环硫雄醇、美雄烷、睾内酪；抗肾上腺素药，如氨鲁米特、米托坦、曲洛司坦；叶酸补充物，如叶烷酸；醋葡醛内酯；醛磷酰胺糖苷；氨基乙酰丙酸；安吖啶；贝塔布辛(bestrabucil)；比生群；伊达曲沙；地磷酰胺(defofamine)；秋水仙胺；地吖醌；多卡霉素(duocarmycin)，美登碱(maytansin)、耳他汀(auristatin)、艾佛米新(elfomithine)；依利醋胺；依托格鲁；硝酸镓；羟基脲；蘑菇多糖；氯尼达明；米托胍腙；米托蒽醌；莫哌达醇；二胺硝吖啶；喷司他丁；蛋氨氮芥；吡柔比星；鬼臼酸；2-乙基酰肼；丙卡巴肼；PSK.R^TM；雷佐生；西佐喃；锗螺胺；细交链孢菌酮酸；三亚胺醌；2，2′，2"-三氯三乙基胺；乌拉坦；长春地辛；达卡巴嗪；甘露莫司汀；二溴甘露醇；二溴卫矛醇；哌泊溴烷；加胞嘧啶；阿糖胞苷(“Ara-C”)；环磷酰胺；硫替派；紫杉烷，如紫杉醇(紫杉醇^TM，百时美施贵宝肿瘤学部，新泽西州普林斯顿)(Bristol-Myers Squibb Oncology，Princeton，N.J.))和多西他赛(泰索帝^TM，Rhone-Poulenc Rorer，法国安东尼省)(Antony，France))；苯丁酸氮芥；吉西他滨；6-硫鸟嘌呤；巯基嘌呤；甲氨蝶呤；铂类似物，如顺铂和卡铂；长春碱；铂；依托泊甙(VP-16)；异环磷酰胺；丝裂霉素C；米托蒽醌；长春新碱；长春瑞滨；诺维本；二羟基蒽醌；替尼泊苷；道诺霉素；氨蝶呤；适罗达；伊班膦酸盐；喜树碱-11(CPT-11)；拓朴异构酶抑制剂RFS2000；二氟甲基鸟氨酸(DMFO)；视黄酸；埃拉霉素(esperamicins)；卡培他滨；和上述物质的药学上可接受的盐、酸或衍生物。也包括的合适化疗细胞调节剂，它们是用于调解或抑制激素对肿瘤作用的抗激素试剂，如抗-雌激素，包括如他莫昔芬、雷洛昔芬、芳香酶抑制4(5)-咪唑、4-羟基他莫昔芬、曲沃昔芬、雷洛昔芬盐酸盐、LY117018、奥那司酮和托瑞米芬(Fareston)；以及抗雄激素，如氟他胺、尼鲁米特、比卡鲁胺、亮丙瑞林、戈舍瑞林、多柔比星、道诺霉素、多卡霉素(duocarmycin)、长春新碱和长春碱。

其它可用作效应模块的的药物包括用于治疗感染疾病、心脏病、传染病、呼吸疾病、自身免疫病、神经和肌肉失常、代谢紊乱以及癌症的药物。

其它可用作MURP效应物的药物包括：去痛药和消炎药，如组胺和组胺拮抗剂、缓激肽和缓激肽拮抗剂、5-羟基色胺(5-羟色胺)、生物转化选择性水解膜磷脂的产物所产生的脂质、类花生酸、前列腺素、血栓素、白三烯、阿司匹林、非类固醇消炎剂、扑热息痛药、抑制前列腺素和血栓素合成的药物、诱导性环加氧酶的选择性抑制剂、诱导性环加氧酶2的选择性抑制剂、自身活性物质、旁分泌激素、促生长素抑制素、胃泌素、在体液和细胞免疫应答中介导相互作用的细胞因子、脂质衍生的自身活性物质、类花生酸、β-肾上腺素激动剂、异丙托铵、糖皮质激素类、甲基黄嘌呤、钠通道阻断剂、阿片受体激动剂、钙通道阻断剂、膜稳定剂和白三烯抑制剂。

其它用作效应物的药物包括治疗消化性溃疡的药物、治疗胃食管反流病的药物、胃肠动力药物、止吐药、肠易激综合征用药、腹泻用药、便秘用药、炎性肠病用药、胆汁病用药以及胰腺病用药。

放射性核素-设计MURP用于放射性核素的组织靶向递送以及利用放射性核素成像。可通过改变URP长度来优化半衰期，因此URP是成像的理想材料。多数成像应用中，可能优选中等长度的URP，半衰期为5分钟至数小时、而非几天到数周。设计MURP使其仅含单个或少量确定数量的可被放射性同位素如锝、铟、钇(扩展)的螯合剂(如DOTA)修饰的氨基。另一种偶联方法是通过保守半胱氨酸侧链偶联。可使用此类携带放射性核素的MURP治疗肿瘤或其它疾病组织，以及用于成像。

许多药学活性蛋白或蛋白结构域可用作MURP中的效应模块。例如下列蛋白及其片段：细胞因子、生长因子、酶、-受体、微生物蛋白、激素、红细胞生成素(erythopoetin)、腺苷脱亚胺酶、天冬酰胺酶、精氨酸酶、干扰素、生长激素、生长激素释放激素、G-CSF、GM-CSM、胰岛素、水蛭素、TNF-受体、尿酸酶、拉布立酶、阿索开、RNA酶、DNA酶、磷酸酶、假单胞菌外毒素、蓖麻毒蛋白、白树毒素、氨普酶、拉罗尼酶、凝血酶、凝血酶、VEGF、普洛托品(protropin)、生长激素、阿替普酶、白介素、IIV因子、VIII因子、X因子、IX因子、链球菌DNA酶、葡糖脑苷脂酶、促滤泡素、胰高血糖素、促甲状腺激素、奈西立肽、阿替普酶、甲状旁腺素、阿加糖酶、拉罗尼酶、甲硫氨酸酶。

蛋白酶激活的MURP：为了提高效应模块的治疗指数，可将蛋白酶不稳定序列插入到URP序列中，该URP序列对于在血清或MURP治疗的靶组织中优先发现的蛋白酶敏感。该方法见图9。一些设计可以构建到达靶组织时选择性激活的蛋白。尤其感兴趣的是在疾病位点激活的MURP。为了利于此类靶点特异性激活，可将URP序列连接在效应模块的活性位点或受体结合位点附近，由此得到的融合蛋白生物学活性有限。尤其感兴趣的是在肿瘤位点激活效应模块。许多肿瘤组织以相对高的浓度表达蛋白酶，可将这些肿瘤蛋白酶特异性切割的序列插入到URP序列中。例如，多数前列腺肿瘤组织含有高浓度的前列腺特异性抗原(PSA)，这是一个丝氨酸蛋白酶。由与抗癌药物多柔比星偶联的PSA不稳定性肽组成的前药可在前列腺组织中选择性激活[DeFeo-Jones，D.等(2000)Nat Med，6：1248]。尤其感兴趣的疾病特异性激活是具有细胞生长抑制活性或细胞毒性的蛋白，如TNFα和许多细胞因子和白介素。另一个应用是在炎症位点或者病毒或细菌感染位点的蛋白选择性激活。

生产方法-利用本领域熟知的分子生物学方法可生产包含URP序列的MURP。可将数种克隆载体用于各种表达系统中，如哺乳动物细胞、酵母和微生物。尤其感兴趣的表达宿主是大肠杆菌、酿酒酵母、毕赤酵母和中国仓鼠卵巢细胞。尤其感兴趣的是经过优化扩展其密码子使用的宿主。尤其感兴趣的是经过修饰增强GRS表达的宿主。可通过提供编码甘氨酸特异性tRNA的DNA达到这一目的。此外，可工程改造宿主以增加甘氨酸特异性tRNA的载量。可将编码增强蛋白的DNA操作地连接于启动子序列。编码增强蛋白的DNA及操作性连接的启动子可作为质粒载体、病毒载体的一部分或可被插入到宿主的染色体中。

在利于增强蛋白生产的条件下培养宿主细胞以进行生产。尤其感兴趣的是能提高GRS产量的条件。

主题MURP可采用数种形式。例如，MURP可包含与药学活性蛋白融合的URP从而得到缓释产物。此类产物可被局部注射或植入，例如病人皮肤或在皮肤之下。由于其大的流体力学半径，含URP序列的产物从注射或植入位点缓慢释放，从而减少了注射或植入的频率。可设计URP序列，使其包含与细胞表面或组织结合的区域以延长药物在注射位点的局部滞留时间。尤其感兴趣的是将含URP的产物制成注射后聚集或沉淀的可溶化合物。改变制剂产品和注射位点的pH可触发聚集或沉淀。另一个选择是可通过改变氧化还原环境引起沉淀或形成聚集的含URP的产物。另一种方法是通过加入非活性溶质在溶液中稳定，但注射后由于增溶溶质扩散引起沉淀或聚集的含URP的产物。另一种方法是设计在URP序列中有一个或多个赖氨酸或半胱氨酸残基并可在注射前交联的含URP的产物。

所需的是，在制造、制剂和注射时，MURP是单体(这里指未交联)，但当皮下注射后，蛋白开始自身交联或与天然人蛋白交联，在皮肤下形成聚合物，活性药物分子十分缓慢的释放。这种释放可以是图18所示的二硫键还原或二硫键改组，或由图19所示蛋白酶解介导，释放活性片段到循环中。非常重要的是这些活性片段足够大，以获得长半衰期，因为分泌半衰期越长，释放蛋白的剂量越低，这样可以使用较低剂量的产物进行注射或注射间隔较长。

一种带来这些优势的方法是二硫键介导的蛋白交联。例如，可制造含有(一个或多个)环肽的蛋白药物。该环肽可参与或不参与靶点的结合。制造该蛋白，形成环肽，即氧化形式的蛋白，以简化纯化。然而，还原产物并通过制剂保持蛋白还原态。非常重要的是在低浓度还原剂，如0.25、0.5、1.0、2.0、4.0或8.0mM二硫苏糖醇或β巯基乙醇或半胱氨酸或等同还原剂中还原环肽，因此可在不还原产物中其它含二硫键的蛋白模块的条件下还原环肽。优选使用FDA批准的还原剂，如半胱氨酸或谷胱甘肽。皮下注射后，低分子量还原剂快速扩散或被人蛋白中和，使药物在高摩尔浓度时暴露于氧化环境中，造成不同蛋白链中的半胱氨酸交联，引起药物在注射位点的聚合。环肽中半胱氨酸的距离越远，药物浓度越高，药物聚合的程度越高，因为聚合与环肽的重整(reformation)竞争。一段时间后，二硫键的还原和氧化引起二硫键改组，这样使环肽重整和单体化，并使药物再溶解。可通过创建血清蛋白酶切割位点来靶向、控制或增加药物经蛋白酶解作用从聚合物的释放。可利用化学蛋白-蛋白交联剂进行蛋白交联，如[表x]所列。理想(的化学交联剂)为已被FDA批准的试剂，如那些用于疫苗或化合物与蛋白偶联的试剂。

除了利用二硫键之外，也可使用很多种交联剂稳定蛋白对抗蛋白酶降解作用。下列多数试剂由皮尔斯化学品公司(Pierce Chemicals)以相同名字销售，其使用说明书可从网上获得(www.piercenet.com)。导致与二硫键所得同样链间距的试剂可用于此应用。短接头试剂如DFDNB是最理想的。从如www.piercenet.com所示化合物结构易于测定链间距。

大量聚体化学产品以下列少数基本反应方案发挥作用，所有内容均参见www.piercenet.com上的详述。有用的交联剂例子为咪唑、活性卤素、马来酰亚胺、二硫吡啶、NHS酯。同源双功能交联剂有两个相同的反应基团并经常用于一步化学交联步骤中。例如，BS3(非可切割水溶性DSS类似物)、BSOCOES(碱基可逆)、DMA(己二亚氨二甲酯二盐酸)、DMP(庚二胺二甲酯盐酸)、DMS(辛二硝酸二甲酯二盐酸)、DSG(DSS的5碳类似物)、DSP(罗曼特试剂(Lomant’s reagent))、DSS(非可切割的)、DST(可被氧化剂切割)、DTBP(二甲基3，3’-二硫代双丙亚氨酸二甲酯二盐酸)、DTSSP、EGS、磺基-EGS、THPP、TSAT、DFDNB(1，5-二氟-2，4-二硝基苯)在小空间距离间交联时特别有用(Komblatt，J.A.和Lake，D.F.(1980)，利用二氟二硝基苯交联细胞色素氧化酶亚基(Cross-linking of cytochrome oxidase subunits with difluorodinitrobenzene)，Can J.Biochem.58，219-224)。

巯基反应性同源双功能交联剂是与巯基反应的常基于马来酰亚胺的同源双功能蛋白交联剂，在pH6.5-7.5时与-SH基团反应形成稳定的硫醚连接。BM[PEO]3是一个8原子聚醚间隔区，可降低巯基-巯基交联应用中偶联物沉淀的可能。BM[PEO]4类似但具有11个原子的间隔区。BMB是一个非可切割的交联剂，其具有四碳间隔区。BMDB形成可被高碘酸盐切割的连接。BMH是一个广泛使用的同源双功能巯基反应性交联剂。BMOE具有一个特别短的接头。DPDPB和DTME是可切割的交联剂。HVBS不具有马来酰亚胺的水解潜能。TMEA是另一个选择。异源双功能交联剂有两个不同的反应基团。例子是通过EDC活化的NHS酯和胺/肼、AEDP、ASBA(光反应性，可碘化(iodinatable))、EDC(水溶性碳二亚胺)。胺-巯基反应双功能交联剂是AMAS、APDP、BMPS、EMCA、EMCS、GMBS、KMUA、LC-SMCC、LC-SPDP、MBS、SBAP、SIA(特别短)、SIAB、SMCC、SMPB、SMPH、SMPT、SPDP、磺基-EMCS、磺基-GMBS、磺基-KMUS、磺基-LC-SMPT、磺基-LC-SPDP、磺基-MBS、磺基-SIAB、磺基-SMCC、磺基-SMPB。氨基反应性异源双功能交联剂为ANB-NOS、MSA、NHS-ASA、SADP、SAED、SAND、SANPAH、SASD、SFAD、磺基-HSAB、磺基-NHS-LC-ASA、磺基-SADP、磺基-SANPAH、TFCS。

一个不同的缓释形式含有His6标签标记的药物，它与镍-三乙酸腈-偶联的珠(Ni-NTA珠)混合并共同注射，GMO版本的珠可购自凯杰公司(Qiagen)。如图20所示，药物缓慢从珠子上脱落(teach off)，提供储库和缓释。珠是可选的，可被能组装成更大聚合物的交联聚合镍-三乙酸腈替代。

URP序列可包含已知能够形成多聚体如α2D[Hill，R.等(1998)J Am ChemSoc，120：1138-1145]的序列，用于使抗体片段二聚化[Kubetzko，S.等(2005)MolPharmacol，68：1439-54]。有用的同源二聚肽的例子是序列SKVILFE。有用的异源二聚化序列的例子是肽ARARAR，它可与序列DADADA和相关序列形成二聚体。多聚化可通过增加亲合力来提高分子的生物学功能，并可影响所得MURP的药代动力学性质和组织分布。

“多聚化模块是利于MURP形成二聚体或多聚体的氨基酸序列。多聚化模块可自身结合形成二聚体或多聚体。或者，多聚化模块也可与MURP其它模块结合。这些模块可为亮氨酸拉链或形成反向平行的同源聚合物小肽如Hydra头激活物衍生物(SKVILF-样)，或形成高度亲和的反相平行异源聚合物的肽如RARARA和DADADA。使用一个、两个或多个拷贝的肽可强制形成蛋白质二聚体、线性多聚体或分枝多聚体。

可通过改变肽的类型、长度和组成来改变结合亲合力。许多应用需要如图21所示形成同源二聚体的肽。其它应用需要异源二聚体。在一些情况下，一旦结合，通过在两条蛋白链间(通常在肽的任一侧)形成二硫键可将肽锁定在位置上。如图21所示多聚化模块可用于连接两个MURP分子(头对尾、头对头或头尾对尾)。为形成二聚体，多聚化模块可位于N或C末端。若两个末端均有多聚化模块，则形成长线性聚合物。如果每一蛋白中出现两个以上多聚化模块，则可形成分支聚合网络。如图23所示，可组合多聚化和化学偶联的构思，以便用于延长半衰期、库存形成、引起活性药物从储库或注射位点缓慢释放。

主题MURP可掺入遗传的或通用的URP。一种方法是表达含有长URP模块(提供半衰期)的URP，并包含允许与结合特定靶点的肽(即线性、环状、2SS、3SS等)位点特异性偶联的多个(通常4-10个)赖氨酸(或其它位点)。该方法的优势是URP模块是遗传的并可与其它任意靶点特异性肽偶联。理想的，靶点特异性肽与URP的连接是直接连接，因此URP上的残基仅能与靶点特异性肽的残基反应，并且穷尽性偶联(exhaustive coupling)只能产生单一种类，即在每个赖氨酸上与肽连接的URP。该复合物行为在结合性质方面类似高亲合多聚体，但易于生产。该方法参见图24。

主题MURP也可掺入URP，以便进行跨组织屏障的递送。可工程改造URP以增强跨越皮肤、口腔、口颊、小肠、鼻、血-脑、肺部、鞘、腹膜、直肠、阴道或许多其它组织屏障的递送。

口服蛋白递送的一个主要障碍是多数蛋白对于消化系统的蛋白酶敏感。与URP序列的偶联能提高药学活性蛋白对蛋白酶的抗性并利于其摄取。已显示通过加入分子载体可提高蛋白在消化系统中的摄取。这些载体的主要任务是提高透膜性[Stoll，B.R.等(2000)J Control Release，64：217-28]。因此可将序列包含在提高透膜性的URP序列中。已知许多序列可以提高透膜性，例如富精氨酸序列[Takenobu，T.等(2002)Mol Cancer Ther，1：1043-9]。因此可通过组合两种功能、减少感兴趣蛋白的蛋白酶降解及增加融合产物的透膜性，来设计提高蛋白的细胞或口服摄取的URP序列。可选地，可将对优选位于感兴趣药物的靶组织的蛋白酶敏感但对消化道蛋白酶稳定的序列加入URP序列中。此类URP序列的例子为包含长GRS区域的序列，以及富含碱性氨基酸尤其是精氨酸并利于膜转运的序列。可以类似途径利用URP，以提高蛋白经鼻内、肺内或其它递送途径的摄取。

聚体产物示例：

DR4/DR5激动剂-DR4和DR5是表达于许多肿瘤细胞的死亡受体。可通过三聚化触发这些受体，导致细胞死亡和肿瘤消退。可通过噬菌体淘选或其它展示方法获取DR4或DR5的特异性结合域。如图12所示，利用URP模块作为接头可将这些DR4或DR5特异性结合域多聚化。尤其感兴趣的是包含三个或多个对DR4或DR5或两者具有特异性的结合模块的MURP。如图12所示，MURP可包含对肿瘤组织中过度表达的肿瘤抗原具有特异性的其它结合模块。这样则可构建特异性蓄积于肿瘤组织中并触发细胞死亡的MURP。MURP可包含结合DR4或DR5的模块。尤其感兴趣的是含有同时结合DR4和DR5的结合模块的MURP。

肿瘤靶向白分素2-白介素2(IL2)是增强对肿瘤组织免疫应答的细胞因子。然而，全身性IL2治疗的特征是其显著的副作用。如图13所示，可构建包含对肿瘤抗原有特异性的结合域及作为效应模块的IL2的MURP。此类MURP能选择性蓄积于肿瘤组织中，并在最大程度降低细胞因子治疗全身副作用的同时引发肿瘤选择性免疫应答。此类MURP可靶向数种肿瘤抗原如EpCAM、Her2、CEA、EGFR、汤姆逊弗莱德利奇抗原(Thomsen Friedenreich Antigen)。尤其有用的是结合于显示缓慢内化的肿瘤抗原的MURP。可使用其它细胞因子或肿瘤坏死因子α作为效应模块，设计类似MURP。

肿瘤选择性天冬酰胺酶-使用天冬酰胺酶治疗急性白血病人。来自大肠杆菌和欧文菌(Erwinia)的天冬酰胺酶均可用于治疗。两种酶均能导致免疫原性和超敏反应。昂卡斯帕(Oncaspar)是PEG化的天冬酰胺酶，具有降低的免疫原性。然而，该蛋白难以制造并以同种型混合物进行给药。在末端和/或环内部加入URP序列允许直接重组制造一种天冬酰胺酶变体，该变体是均质的并具有低的免疫原性。比较不同的URP序列和连接位点以确定URP序列连接的最佳位置。多种其它酶可降解被报道具有抗肿瘤活性的氨基酸。例子是精氨酸酶、甲硫氨酸酶、苯丙氨酸解氨酶和色氨酸酶。尤其感兴趣的是海洋链霉菌(streptomycesmaritimus)的苯丙氨酸解氨酶，它具有高的特异性活性并无需辅因子[Calabrese，J.C.等(2004)Biochemistry，43：11403-16]。多数这些酶是细菌或其它非人来源并可能引发免疫反应。加入一个或多个URP序列可降低这些酶的免疫原性。此外，连接URP序列后增加的流体力学半径能提高这些酶的治疗指数和PK性质。

可设计主题MURP靶向任意细胞蛋白。下面提供的是非限制性列表。

VEGF，VEGF-R1，VEGF-R2，VEGF-R3，Her-1，Her-2，Her-3，EGF-1，EGF-2，EGF-3，A3，cMet，ICOS，CD40L，LFA-1，c-Met，ICOS，LFA-1，IL-6，B7.1，B7.2，OX40，IL-1b，.TACI，IgE，BAFF或BLys，TPO-R，CD19，CD20，CD22，CD33，CD28，IL-1-R1，TNFα，TRAIL-R1，补体受体1，FGFa，骨桥蛋白，玻连蛋白，Ephrin A1-A5，Ephrin B1-B3，α-2-巨球蛋白，CCL1，CCL2，CCL3，CCL4，CCL5，CCL6，CCL7，CXCL8，CXCL9，CXCL10，CXCL11，CXCL12，CCL13，CCL14，CCL15，CXCL16，CCL16，CCL17，CCL18，CCL19，CCL20，CCL21，CCL22，PDGF，TGFb，GMCSF，SCF，p40(IL12/IL23)，IL1b，IL1a，IL1ra，IL2，IL3，IL4，IL5，IL6，IL8，IL10，IL12，IL15，IL23，Fas，FasL，Flt3配体，41BB，ACE，ACE-2，KGF，FGF-7，SCF，神经生长因子(netrin)1、2，IFNa、b、g，胱冬酶2、3、7、8、10，ADAMS1，S5、8、9、15，TS1，TS5；Adiponectin，ALCAM，ALK-1，APRIL，膜联蛋白V，血管生成素，双调蛋白，促血管生成素1、2、4，B7-1/CD80，B7-2/CD86，B7-H1，B7-H2，B7-H3，Bcl-2，BACE-1，BAK，BCAM，BDNF，bNGF，bECGF，BMP2、3、4、5、6、7、8；CRP，钙粘着蛋白6、8、11；组织蛋白酶A、B、C、D、E、L、S、V、X；CDlla/LFA-1，LFA-3，GP2b3a，GH受体，RSVF蛋白，IL-23(p40、p19)，IL-12，CD80，CD86，CD28，CTLA-4，α4β1，α4β7，TNF/淋巴毒素，IgE，CD3，CD20，IL-6，IL-6R，BLYS/BAFF，IL-2R，HER2，EGFR，CD33，CD52，地高辛，Rho(D)，水痘，肝炎，CMV，破伤风，牛痘，抗蛇毒素，肉毒杆菌，Trail-R1，Trail-R2，cMet，TNF-R家族，如LANGF-R，CD27，CD30，CD40，CD95，淋巴毒素a/b受体，Wsl-1，TL1A/TNFSF15，BAFF，BAFF-R/TNFRSF13C，TRAILR2/TNFRSF10B，TRAILR2/TNFRSF10B，Fas/TNFRSF6CD27/TNFRSF7，DR3/TNFRSF25，HVEM/TNFRSF14，TROY/TNFRSF19，CD40配体/TNFSF5，BCMA/TNFRSF17，CD30/TNFRSF8，LIGHT/TNFSF14，4-1BB/TNFRSF9，CD40/TNFRSF5，GITR/TNFRSF18，骨保护素/TNFRSF11B，RANK/TNFRSF11A，TRAILR3/TNFRSF10C，TRAIL/TNFSF10，TRANCE/RANKL/TNFSF11，4-1BB配体/TNFSF9，TWEAK/TNFSF12，CD40配体/TNFSF5，Fas配体/TNFSF6，RELT/TNFRSF19L，APRIL/TNFSF13，DcR3/TNFRSF6B，TNFRI/TNFRSF1A，TRAILR1/TNFRSF10A，TRAILR4/TNFRSF10D，CD30配体/TNFSF8，GITR配体/TNFSF18，TNFSF18，TACI/TNFRSF13B，NGFR/TNFRSF16，OX40配体/TNFSF4，TRAILR2/TNFRSF10B，TRAILR3/TNFRSF10C，IWEAKR/INFRSF12，BAFF/BLyS/INFSF13，DR6/TNFRSF21，TNF-α/TNFSF1A，Pro-TNF-α/TNFSF1A，淋巴毒素βR/TNFRSF3，淋巴毒素βR(LTbR)/Fc嵌合体，TNFRI/TNFRSF1A，TNF-β/TNFSF1B，PGRP-S，TNFRI/TNFRSF1A，TNFRII/TNFRSF1B，EDA-A2，TNF-α/TNFSF1A，EDAR，XEDAR，TNFRI/TNFRSF1A。

尤其感兴趣的是以纯化形式购得的人靶蛋白。例子如：4EBP1、14-3-3ζ、53BP1、2B4/SLAMF4、CCL21/6Ckine、4-1BB/TNFRSF9、8D6A、4-1BB配体/TNFSF9、8-氧代-dG、4-氨基-1，8-萘酰亚胺、A2B5、氨基肽酶LRAP/ERAP2、A33、氨基肽酶N/ANPEP、Aag、氨基肽酶P2/XPNPEP2、ABCG2、氨基肽酶P1/XPNPEP1、ACE、氨基肽酶PILS/ARTS1、ACE-2、Amnionless、肌动蛋白、双调蛋白、β-肌动蛋白、AMPKα1/2、活化素A、AMPKα1、活化素AB、AMPKα2、活化素B、AMPKβ1、活化素C、AMPKβ2、活化素RIA/ALK-2、雄激素R/NR3C4、活化素RIB/ALK-4、血管生成素、活化素RIIA、促血管生成素-1、活化素RIIB、促血管生成素-2、ADAM8、促血管生成素-3、ADAM9、促血管生成素-4、ADAM10、类促血管生成素1、ADAM12、类促血管生成素2、ADAM15、类促血管生成素3、TACE/ADAM17、类促血管生成素4、ADAM19、类促血管生成素7/CDT6、ADAM33、血管抑素、ADAMTS4、膜联蛋白A1/膜联蛋白I、ADAMTS5、膜联蛋白A7、ADAMTS1、膜联蛋白A10、ADAMTSL-1/Punctin、膜联蛋白V、Adiponectin/Acrp30、ANP、AEBSF、AP位点、聚集蛋白聚糖、APAF-1、集聚蛋白、APC、AgRP、APE、AGTR-2、APJ、AIF、APLP-1、Akt、APLP-2、Akt1、载脂蛋白AI、Akt2、载脂蛋白B、Akt3、APP、血清蛋白、APRIL/TNFSF13、ALCAM、ARC、ALK-1、Artemin、ALK-7、芳基硫酸酯酶A/ARSA、碱性磷酸酶、ASAH2/N-酰基鞘氨醇氨基水解酶-2、α2u-球蛋白、ASC、α-1-酸性糖蛋白、ASGR1、甲胎蛋白、ASK1、ALS、ATM、成釉蛋白、ATRIP、AMICA/JAML、Aurora A、AMIGO、Aurora B、AMIGO2、Axin-1、AMIGO3、Ax1、氨基酰基酶/ACY1、天青杀素/CAP37/HBP、氨基肽酶A/ENPEP、B4GALT1、BIM、B7-1/CD80、6-生物素-17-NAD、B7-2/CD86、BLAME/SLAMF8、B7-H1/PD-L1、CXCL13/BLC/BCA-1、B7-H2、BLIMP1、B7-H3、Blk、B7-H4、BMI-1、BACE-1、BMP-1/PCP、BACE-2、BMP-2、Bad、BMP-3、BAFF/TNFSF13B、BMP-3b/GDF-10、BAFFR/TNFRSF13C、BMP-4、Bag-1、BMP-5、BAK、BMP-6、BAMBI/NMA、BMP-7、BARD1、BMP-8、Bax、BMP-9、BCAM、BMP-10、Bcl-10、BMP-15/GDF-9B、Bcl-2、BMPR-IA/ALK-3、Bcl-2相关蛋白A1、BMPR-IB/ALK-6、Bcl-w、BMPR-II、Bcl-x、BNIP3L、Bcl-xL、BOC、BCMA/TNFRSF17、BOK、BDNF、BPDE、苯甲酰胺、鼠短尾突变体(Brachyury)、共用β链、B-Raf、βIG-H3、CXCL14/BRAK、β动物纤维素、BRCA1、β-防御素2、BRCA2、BID、BTLA、双链蛋白聚糖、Bub-1、类Bik杀伤蛋白、c-jun、CD90/Thy1、c-Rel、CD94、CCL6/C10、CD97、C1qR1/CD93、CD151、C1qTNF1、CD160、C1qTNF4、CD163、C1qTNF5、CD164、补体成分Clr、CD200、补体成分Cls、CD200R1、补体成分C2、CD229/SLAMF3、补体成分C3a、CD23/FcεRII、补体成分C3d、CD2F-10/SLAMF9、补体成分C5a、CD5L、钙粘着蛋白-4/R-钙粘着蛋白、CD69、钙粘着蛋白-6、CDC2、钙粘着蛋白-8、CDC25A、钙粘着蛋白-11、CDC25B、钙粘着蛋白-12、CDCP1、钙粘着蛋白-13、CDO、钙粘着蛋白-17、CDX4、E-钙粘着蛋白、CEACAM-1/CD66a、N-钙粘着蛋白、CEACAM-6、P-钙粘着蛋白、Cerbems1、VE-钙粘着蛋白、CFTR、钙结合素D、cGMP、钙调磷酸酶A、ChemR23、钙调磷酸酶B、Chemerin、内质网钙结合蛋白-2、趋化因子样品包、CaM激酶II、类壳多糖酶31、cAMP、壳三糖酶/CHIT1、大麻素R1、Chk1、大麻素R2/CB2/CNR2、Chk2、CAR/NR1I3、CHL-1/L1CAM-2、碳酸酐酶I、胆碱乙酰基转移酶/ChAT、碳酸酐酶II、Chondrolectin、碳酸酐酶III、Chordin、碳酸酐酶IV、类Chordinl、碳酸酐酶VA、类Chordin2、碳酸酐酶VB、CINC-1、碳酸酐酶VI、CINC-2、碳酸酐酶VII、CINC-3、碳酸酐酶VIII、卡环(claspin)、碳酸酐酶IX、Claudin-6、碳酸酐酶X、CLC、碳酸酐酶XII、CLEC-1、碳酸酐酶XIII、CLEC-2、碳酸酐酶XIV、CLECSF13/CLEC4F、羧甲基赖氨酸、CLECSF8、羧基肽酶A1/CPA1、CLF-1、羧基肽酶A2、CL-P1/COLEC12、羧基肽酶A4、丛生蛋白、羧基肽酶B1、类聚集素1、羧基肽酶E/CPE、CMG-2、羧基肽酶X1、CMVUL146、心肌营养素-1、CMVUL147、肌肽二肽酶1、CNP、Caronte、CNTF、CART、CNTFRα、胱冬酶、凝集因子II/凝血酶、胱冬酶-1、凝集因子III/组织因子、胱冬酶-2、凝集因子VII、胱冬酶-3、凝集因子X、胱冬酶-4、凝集因子XI、胱冬酶-6、凝集因子XIV/蛋白质C、胱冬酶-7、COCO、胱冬酶-8、Cohesin、胱冬酶-9、胶原I、胱冬酶-10、胶原II、胱冬酶-12、胶原IV、胱冬酶-13、公用γ链/IL-2Rγ、胱冬酶肽抑制剂、COMP/血小板反应蛋白-5、过氧化氢酶、补体成分C1rLP、β-联蛋白、补体成分C1qA、组织蛋白酶1、补体成分C1qC、组织蛋白酶3、补体因子D、组织蛋白酶6、补体因子I、组织蛋白酶A、补体MASP3、组织蛋白酶B、连接蛋白43、组织蛋白酶C/DPPI、接触蛋白-1、组织蛋白酶D、接触蛋白-2/TAG1、组织蛋白酶E、接触蛋白-4、组织蛋白酶F、接触蛋白-5、组织蛋白酶H、Corin、组织蛋白酶L、Cornulin、组织蛋白酶O、CORS26/ClqTNF、3、组织蛋白酶S、大鼠皮层干细胞、组织蛋白酶V、氢化可的松、组织蛋白酶X/Z/P、COUP-TFI/NR2Fl、CBP、COUP-TFII/NR2F2、CCI、COX-1、CCK-AR、COX-2、CCL28、CRACC/SLAMF7、CCR1、C-反应蛋白、CCR2、肌酸激酶、肌肉/CKMM、CCR3、肌酸酐、CCR4、CREB、CCR5、CREG、CCR6、CRELD1、CCR7、CRELD2、CCR8、CRHBP、CCR9、CRHR-1、CCR10、CRIM1、CD155/PVR、畸胎癌生长因子(cripto)、CD2、CRISP-2、CD3、CRISP-3、CD4、横脉缺失-2、CD4+/45RA-、CRTAM、CD4+/45RO-、CRTH-2、CD4+/CD62L-/CD44、CRY1、CD4+/CD62L+/CD44、隐蛋白(Cryptic)、CD5、CSB/ERCC6、CD6、CCL27/CTACK、CD8、CTGF/CCN2、CD8+/45RA-、CTLA-4、CD8+/45RO-、Cubilin、CD9、CX3CR1、CD14、CXADR、CD27/TNFRSF7、CXCL16、CD27配体/TNFSF7、CXCR3、CD28、CXCR4、CD30/TNFRSF8、CXCR5、CD30配体/TNFSF8、CXCR6、CD31/PECAM-1、亲环蛋白A、CD34、Cyr61/CCN1、CD36/SR-B3、胱抑素A、CD38、胱抑素B、CD40/TNFRSF5、胱抑素C、CD40配体/TNFSF5、胱抑素D、CD43、胱抑素E/M、CD44、胱抑素F、CD45、胱抑素H、CD46、胱抑素H2、CD47、胱抑素S、CD48/SLAMF2、胱抑素SA、CD55/DAF、胱抑素SN、CD58/LFA-3、细胞色素c、CD59、脱辅基细胞色素c、CD68、成熟细胞色素c、CD72、细胞角蛋白8、CD74、细胞角蛋白14、CD83、细胞角蛋白19、CD84/SLAMF5、Cytonin、D6、DISP1、DAN、Dkk-1、DANCE、Dkk-2、DARPP-32、Dkk-3、DAX1/NR0B1、Dkk-4、DCC、DLEC、DCIR/CLEC4A、DLL1、DCAR、DLL4、DcR3/TNFRSF6B、d-萤光素、DC-SIGN、DNA连接酶IV、DC-SIGNR/CD299、DNA聚合酶β、DcTRAILR1/TNFRSF23、DNAM-1、DcTRAILR2/TNFRSF22、DNA-PKcs、DDR1、DNER、DDR2、多巴脱羧酶/DDC、DEC-205、DPCR-1、Decapentaplegic、DPP6、核心蛋白多糖、DPPA4、Dectin-1/CLEC7A、DPPA5/ESG1、Dectin-2/CLEC6A、DPPII/QPP/DPP7、DEP-1/CD148、DPPIV/CD26、Desert Hedgehog、DR3/TNFRSF25、结蛋白、DR6/TNFRSF21、桥粒芯蛋白-1、DSCAM、桥粒芯蛋白-2、DSCAM-L1、桥粒芯蛋白-3、DSPG3、蓬乱蛋白(Dishevelled)-1、Dtk、蓬乱蛋白-3、动力素、EAR2/NR2F6、EphA5、ECE-1、EphA6、ECE-2、EphA7、ECF-L/CHI3L3、EphA8、ECM-1、EphB1、Ecotin、EphB2、EDA、EphB3、EDA-A2、EphB4、EDAR、EphB6、EDG-1、Ephrin、EDG-5、Ephrin-A1、EDG-8、Ephrin-A2、eEF-2、Ephrin-A3、EGF、Ephrin-A4、EGFR、Ephrin-A5、EGR1、Ephrin-B、EG-VEGF/PK1、Ephrin-B1、eIF2α、Ephrin-B2、eIF4E、Ephrin-B3、Elk-1、外成蛋白(Epigen)、EMAP-II、表皮形态发生素/突触融合蛋白2、EMMPRIN/CD147、边条曲菌素、CXCL5/ENA、EPR-1/Xa受体、内皮细胞特异性分子、ErbB2、Endoglin/CD105、ErbB3、内聚糖、ErbB4、核酸内切酶III、ERCC1、核酸内切酶IV、ERCC3、核酸内切酶V、ERK1/ERK2、核酸内切酶VIII、ERK1、Endorepellin/串珠素(perlecan)、ERK2、内皮抑素、ERK3、内皮缩血管肽-1、ERK5/BMK1、锯齿状蛋白-2、ERRα/NR3B1、EN-RAGE、ERRβ/NR3B2、肠肽酶/肠激酶、ERRγ/NR3B3、CCL11/趋化胞蛋白(趋化胞蛋白)、红细胞生成素、CCL24/趋化胞蛋白-2、红细胞生成素R、CCL26/趋化胞蛋白-3、ESAM、EpCAM/TROP-1、ERα/NR3A1、EPCR、ERβ/NR3A2、Eph、外切核酸酶III、EphA1、类Exostosin2/EXTL2、EphA2、类Exostosin3/EXTL3、EphA3、FABP1、FGF-BP、FABP2、FGFR1-4、FABP3、FGFR1、FABP4、FGFR2、FABP5、FGFR3、FABP7、FGFR4、FABP9、FGFR5、补体因子B、Fgr、FADD、FHR5、FAM3A、纤连蛋白、FAM3B、纤维胶凝蛋白-2、FAM3C、纤维胶凝蛋白-3、FAM3D、FITC、成纤维细胞激活蛋白α/FAP、FKBP38、Fas/TNFRSF6、Flap、Fas配体/TNFSF6、FLIP、FATP1、FLRG、FATP4、FLRT1、FATP5、FLRT2、FcγRI/CD64、FLRT3、FcγRIIB/CD32b、Flt-3、FcγRIIC/CD32c、Flt-3配体、FcγRIIA/CD32a、卵泡抑素、FcγRIII/CD16、卵泡抑素样蛋白1、FcRH1/IRTA5、FosB/G0S3、FcRH2/IRTA4、FoxD3、FcRH4/IRTA1、FoxJ1、FcRH5/IRTA2、FoxP3、Fc受体样3/CD16-2、Fpg、FEN-1、FPR1、胎球蛋白A、FPRL1、胎球蛋白B、FPRL2、酸性FGF、CX3CL1/Fractalkine、碱性FGF、卷曲蛋白-1、FGF-3、卷曲蛋白-2、FGF-4、卷曲蛋白-3、FGF-5、卷曲蛋白-4、FGF-6、卷曲蛋白-5、FGF-8、卷曲蛋白-6、FGF-9、卷曲蛋白-7、FGF-10、卷曲蛋白-8、FGF-11、卷曲蛋白-9、FGF-12、Frk、FGF-13、sFRP-1、FGF-16、sFRP-2、FGF-17、sFRP-3、FGF-19、sFRP-4、FGF-20、弗林蛋白酶(Furin)、FGF-21、FXR/NR1H4、FGF-22、Fyn、FGF-23、G9a/EHMT2、GFRα-3/GDNFRα-3、GABA-A-Rα1、GFRα-4/GDNFRα-4、GABA-A-Rα2、GITR/TNFRSF18、GABA-A-Rα4、GITR配体/TNFSF18、GABA-A-Rα5、GLI-1、GABA-A-Rα6、GLI-2、GABA-A-Rβ1、GLP/EHMT1、GABA-A-Rβ2、GLP-1R、GABA-A-Rβ3、胰高血糖素、GABA-A-Rγ2、葡糖胺(N-乙酰基)-6-硫酸酯酶/GNS、GABA-B-R2、G1uR1、GAD1/GAD67、G1uR2/3、GAD2/GAD65、G1uR2、GADD45α、G1uR3、GADD45β、Glut1、GADD45γ、Glut2、半乳凝素-1、Glut3、半乳凝素-2、Glut4、半乳凝素-3、Glut5、半乳凝素-3BP、谷氧还蛋白1、半乳凝素-4、甘氨酸R、半乳凝素-7、血型糖蛋白A、半乳凝素-8、磷脂酰肌醇蛋白聚糖2、半乳凝素-9、磷脂酰肌醇蛋白聚糖3、GalNAc4S-6ST、磷脂酰肌醇蛋白聚糖5、GAP-43、磷脂酰肌醇蛋白聚糖6、GAPDH、GM-CSF、Gasl、GM-CSFRα、Gas6、GMF-β、GASP-1/WFIKKNRP、gp130、GASP-2/WFIKKN、糖原磷酸化酶BB/GPBB、GATA-1、GPR15、GATA-2、GPR39、GATA-3、GPVI、GATA-4、GR/NR3C1、GATA-5、Gr-1/Ly-6G、GATA-6、颗粒溶素、GBL、粒酶A、GCNF/NR6A1、粒酶B、CXCL6/GCP-2、粒酶D、G-CSF、粒酶G、G-CSFR、粒酶H、GDF-1、GRASP、GDF-3GRB2、GDF-5、小鬼蛋白(Gremlin)、GDF-6、GRO、GDF-7、CXCL1/GROα、GDF-8、CXCL2/GROβ、GDF-9、CXCL3/GROγ、GDF-11、生长激素、GDF-15、生长激素R、GDNF、GRP75/HSPA9B、GFAP、GSK-3α/β、GFI-1、GSK-3α、GFRα-1/GDNFRα-1、GSK-3β、GFRα-2/GDNFRα-2、EZFIT、H2AX、组氨酸、H60、HM74A、HAI-1、HMGA2、HAI-2、HMGB1、HAI-2A、TCF-2/HNF-1β、HAI-2B、HNF-3β/FoxA2、HAND1、HNF-4α/NR2A1、HAPLN1、HNF-4γ/NR2A2、气道类胰蛋白酶/HAT、HO-1/HMOX1/HSP32、HB-EGF、HO-2/HMOX2、CCL14a/HCC-1、HPRG、CCL14b/HCC-3、Hrk、CCL16/HCC-4、HRP-1、αHCG、HS6ST2、Hck、HSD-1、HCR/CRAM-A/B、HSD-2、HDGF、HSP10/EPF、血红蛋白、HSP27、Hepassocin、HSP60、HES-1、HSP70、HES-4、HSP90、HGF、HTRA/蛋白酶Do、HGF激活蛋白、HTRA1/PRSS11、HGFR、HTRA2/Omi、HIF-1α、HVEM/TNFRSF14、HIF-2α、乙酰透明质酸、HIN-1/分泌球蛋白3A1、4-羟基壬烯酸、Hip、CCL1/I-309/TCA-3、IL-10、cIAP(全)、IL-10Rα、cIAP-1/HIAP-2、IL-10Rβ、cIAP-2/HIAP-1、IL-11、IBSP/唾液酸蛋白II、IL-11Rα、ICAM-1/CD54、IL-12、ICAM-2/CD102、IL-12/IL-23p40、ICAM-3/CD50、IL-12Rβ1、ICAM-5、IL-12Rβ2、ICAT、IL-13、ICOS、IL-13Rα1、艾杜糖醛酸2-硫酸酯酶/IDS、IL-13Rα2、IFN、IL-15、IFN-α、IL-15Rα、IFN-α1、IL-16、IFN-α2、IL-17、IFN-α4b、IL-17R、IFN-αA、IL-17RC、IFN-αB2、IL-17RD、IFN-αC、IL-17B、IFN-αD、IL-17BR、IFN-αF、IL-17C、IFN-αG、IL-17D、IFN-αH2、IL-17E、IFN-αI、IL-17F、IFN-αJ1、IL-18/IL-1F4、IFN-αK、IL-18BPa、IFN-αWA、IL-18BPc、IFN-α/βR1、IL-18BPd、IFN-α/βR2、IL-18Rα/IL-1R5、IFN-β、IL-18Rβ/IL-1R7、IFN-γ、IL-19、IFN-γR1、IL-20、IFN-γR2、IL-20Rα、IFN-ω、IL-20Rβ、IgE、IL-21、IGFBP-1、IL-21R、IGFBP-2、IL-22、IGFBP-3、IL-22R、IGFBP-4、IL-22BP、IGFBP-5、IL-23、IGFBP-6、IL-23R、IGFBP-L1、IL-24、IGFBP-rp1/IGFBP-7、IL-26/AK155、IGFBP-rP10、IL-27、IGF-I、IL-28A、IGF-IR、IL-28B、IGF-II、IL-29/IFN-λ1、IGF-IIR、IL-31、IgG、IL-31RA、IgM、IL-32α、IGSF2、IL-33、IGSF4A/SynCAM、ILT2/CD85j、IGSF4B、ILT3/CD85k、IGSF8、ILT4/CD85d、IgY、ILT5/CD85a、IkB-β、ILT6/CD85e、IKKα、印度Hedgehog、IKKε、INSRR、IKKγ、胰岛素、IL-1α/IL-1F1、胰岛素R/CD220、IL-1β/IL-1F2、前胰岛素、IL-1ra/IL-1F3、细胞溶解酶/IDE、IL-1F5/FIL1δ、整联蛋白α2/CD49b、IL-1F6/FIL1ε、整联蛋白α3/CD49c、IL-1F7/FIL1ζ、整联蛋白α3β1/VLA-3、IL-1F8/FIL1η、整联蛋白α4/CD49d、IL-1F9/IL-1H1、整联蛋白α5/CD49e、IL-1F10/IL-1HY2、整联蛋白α5β1、IL-1RI、整联蛋白α6/CD49f、IL-1RII、整联蛋白α7、IL-1R3/IL-1RAcP、整联蛋白α9、IL-1R4/ST2、整联蛋白αE/CD103、IL-1R6/IL-1Rrp2、整联蛋白αL/CD11a、IL-1R8、整联蛋白αLβ2、IL-1R9、整联蛋白αM/CD11b、IL-2、整联蛋白αMβ2、IL-2Rα、整联蛋白αV/CD51、IL-2Rβ、整联蛋白αVβ5、IL-3、整联蛋白αVβ3、IL-3Rα、整联蛋白αVβ6、IL-3Rβ、整联蛋白αX/CD11c、IL-4、整联蛋白β1/CD29、IL-4R、整联蛋白β2/CD18、IL-5、整联蛋白β3/CD61、IL-5Rα、整联蛋白β5、IL-6、整联蛋白β6、IL-6R、整联蛋白β7、IL-7、CXCL10/IP-10/CRG-2、IL-7Rα/CD127、IRAK1、CXCR1/IL-8RA、IRAK4、CXCR2/IL-8RB、IRS-1、CXCL8/IL-8、Islet-1、IL-9、CXCL11/I-TAC、IL-9R、锯齿蛋白(Jagged)1、JAM-4/IGSF5、锯齿蛋白2、JNK、JAM-A、JNK1/JNK2、JAM-B/VE-JAM、JNK1、JAM-C、JNK2、激肽原、激肽释放酶3/PSA、Kininostatin、激肽释放酶4、KIR/CD158、激肽释放酶5、KIR2DL1、激肽释放酶6/甘油磷酸钙、KIR2DL3、激肽释放酶7、KIR2DL4/CD158d、激肽释放酶8/甘油磷酸钙、KIR2DS4、激肽释放酶9、KIR3DL1、血浆激肽释放酶/KLKB1、KIR3DL2、激肽释放酶10、Kirre12、激肽释放酶11、KLF4、激肽释放酶12、KLF5、激肽释放酶13、KLF6、激肽释放酶14、Klotho、激肽释放酶15、Klothoβ、KC、KOR、Keap1、Kremen-1、Kell、Kremen-2、KGF/FGF-7、LAG-3、LINGO-2、LAIR1、Lipin2、LAIR2、脂质运载蛋白(lipocalin)-1、层粘连蛋白α4、脂质运载蛋白-2/NGAL、层粘连蛋白γ1、5-脂肪氧合酶、层粘连蛋白I、LXRα/NR1H3、层粘连蛋白S、LXRβ/NR1H2、层粘连蛋白-1、Livin、层粘连蛋白-5、LIX、LAMP、LMIR1/CD300A、Langerin、LMIR2/CD300c、LAR、LMIR3/CD300LF、Latexin、LMIR5/CD300LB、Layilin、LMIR6/CD300LE、LBP、LMO2、LDLR、LOX-1/SR-E1、LECT2、LRH-1/NR5A2、LEDGF、LRIG1、Lefty、LRIG3、Lefty-1、LRP-1、Lefty-A、LRP-6、Legumain、LSECtin/CLEC4G、瘦激素、光蛋白聚糖、瘦激素R、CXCL15/Lungkine、白三烯B4、XCL1/淋巴细胞趋化因子、白三烯B4R1、淋巴毒素、LIF、淋巴毒素β/TNFSF3、LIFRα、淋巴毒素βR/TNFRSF3、LIGHT/TNFSF14、Lyn、限制蛋白(Limitin)、Lyp、LIMPII/SR-B2、赖氨酰氧化酶同源物、LIN-28、LYVE-1、LINGO-1、α2-巨球蛋白、CXCL9/MIG、MAD2L1、Mimecan、MAdCAM-1、Mindin、MafB、盐皮质激素R/NR3C2、MafF、CCL3L1/MIP-1α同种型LD78β、MafG、CCL3/MIP-1α、MafK、CCL4L1/LAG-1、MAG/Siglec-4a、CCL4/MIP-1β、MANF、CCL15/MIP-1δ、MAP2、CCL9/10/MIP-1γ、MAPK、MIP-2、Marapsin/Pancreasin、CCL19/MIP-3β、MARCKS、CCL20/MIP-3α、MARCO、MIP-I、Mash1、MIP-II、Matrilin-2、MIP-III、Matrilin-3、MIS/AMH、Matrilin-4、MISRII、Matriptase/ST14、MIXL1、MBL、MKK3/MKK6、MBL-2、MKK3、黑皮质素3R/MC3R、MKK4、MCAM/CD146、MKK6、MCK-2、MKK7、Mcl-1、MKP-3、MCP-6、MLH-1、CCL2/MCP-1、MLK4α、MCP-11、MMP、CCL8/MCP-2、MMP-1、CCL7/MCP-3/MARC、MMP-2、CCL13/MCP-4、MMP-3、CCL12/MCP-5、MMP-7、M-CSF、MMP-8、M-CSFR、MMP-9、II型MCV、MMP-10、MD-1、MMP-11、MD-2、MMP-12、CCL22/MDC、MMP-13、MDL-1/CLEC5A、MMP-14、MDM2、MMP-15、MEA-1、MMP-16/MT3-MMP、MEK1/MEK2、MMP-24/MT5-MMP、MEK1、MMP-25/MT6-MMP、MEK2、MMP-26、贝美噻嗪、MMR、MEPE、MOG、甲丙氨酯α、CCL23/MPIF-1、甲丙氨酯β、M-Ras/R-Ras3、Mer、Mre11、Mesothelin、MRP1Meteorin、MSK1/MSK2、甲硫氨酸氨基肽酶1、MSK1、甲硫氨酸氨基肽酶、MSK2、甲硫氨酸氨基肽酶2、MSP、MFG-E8、MSPR/Ron、MFRP、Mug、MgcRacGAP、MULT-1、MGL2、武藏蛋白(Musashi)-1、MGMT、武藏蛋白-2、MIA、MuSK、云母、MutYDNA糖基酶、MICB、MyD88、MICL/CLEC12A、髓系过氧化物酶、β2微球蛋白、Myocardin、肝素结合细胞因子、Myocilin、MIF、肌珠蛋白、NAIPNGFI-Bγ/NR4A3、Nanog、NgR2/NgRH1、CXCL7/NAP-2、NgR3/NgRH2、Nbs1、巢蛋白-1/巢蛋白、NCAM-1/CD56、巢蛋白-2、NCAM-L1、氮氧化物、连接素-1、硝基酪氨酸、连接素-2/CD112、NKG2A、连接素-3、NKG2C、连接素-4、NKG2D、Neogenin、NKp30、脑啡肽酶/CD10、NKp44、脑啡肽酶-2/MMEL1/MMEL2、NKp46/NCR1、Nestin、NKp80/KLRF1、NETO2、NKX2.5、神经突起生长导向因子-1、NMDAR、NR1亚基、神经突起生长导向因子-2、NMDAR、NR2A亚基、神经突起生长导向因子-4、NMDAR、NR2B亚基、神经突起生长导向因子-Gla、NMDAR、NR2C亚基、神经突起生长导向因子-G2a、N-Me-6、7-diOH-TIQ、神经调节蛋白-1/NRG1、Nodal、神经调节蛋白-3/NRG3、Noggin、Neuritin、Nogo受体、NeuroD1、Nogo-A、神经束蛋白、NOMO、神经源素-1、Nope、神经源素-2、Norrin、神经源素-3、eNOS、溶神经素、iNOS、(垂体)后叶激素运载蛋白II、nNOS、神经菌毛蛋白-1、Notch-1、神经菌毛蛋白-2、Notch-2、Neuropoietin、Notch-3、Neurotrimin、Notch-4、Neurturin、NOV/CCN3、NFAM1、NR AGE、NF-H、NrCAM、NFkB1、NRL、NFkB2、NT-3、NF-L、NT-4、NF-M、NTB-A/SLAMF6、NG2/MCSP、NTH1、NGFR/TNFRSF16、NuCleostemin、β-NGF、Nurr-1/NR4A2、NGFI-Bα/NR4A1、OAS2、阿立新B、OBCAM、OSCAR、OCAM、OSF-2/Periostin、OCIL/CLEC2d、制瘤素M/OSM、OCILRP2/CLEC2i、OSMRβ、Oct-3/4、Osteo活化素/GPNMB、OGG1、Osteoadherin、Olig1、2、3、骨钙素、Olig1、Osteocrin、Olig2、骨桥蛋白、Olig3、护骨素/TNFRSF11B、少突胶质细胞标记物O1、Otx2、少突胶质细胞标记物O4、OV-6、OMgp、OX40/TNFRSF4、Opticin、OX40配体/TNFSF4、阿立新A、OAS2、阿立新B、OBCAM、OSCAR、OCAM、OSF-2/Periostin、OCIL/CLEC2d、制瘤素M/OSM、OCILRP2/CLEC2i、OSMRβ、Oct-3/4、骨活化素/GPNMB、OGG1、Osteoadherin、Olig1、2、3、骨钙素、Olig1、OsteoCrin、Olig2、骨桥蛋白、Olig3、护骨素/TNFRSF11B、少突胶质细胞标记物O1、Otx2、少突胶质细胞标记物O4、OV-6、OMgp、OX40/TNFRSF4、Opticin、OX40配体/TNFSF4、阿立新A、RACK1、Ret、Rad1、REV-ERBα/NR1D1、Rad17、REV-ERBβ/NR1D2、Rad51、Rex-1、Rae-1、RGM-A、Rae-1α、RGM-B、Rae-1β、RGM-C、Rae-1δ、Rheb、Rae-1ε、核糖体蛋白S6、Rae-1γ、RIP1、Raf-1、ROBO1、RAGE、ROBO2、RalA/RalB、ROBO3、RalA、ROBO4、RalB、ROR/NR1F1-3(pan)、RANK/TNFRSF11A、RORα/NR1F1、CCL5/RANTES、RORγ/NR1F3、Rap1A/B、类RTK孤儿受体1/ROR1、RARα/NR1B1、类RTK孤儿受体2/ROR2、RARβ/NR1B2、RP105、RARγ/NR1B3、RPA2、Ras、RSK(pan)、RBP4、RSK1/RSK2、RECK、RSK1、Reg2/PAP、RSK2、RegI、RSK3、RegII、RSK4、RegIII、R-Spondin1、RegIIIa、R-Spondin2、RegIV、R-Spondin3、松弛素-1、RUNX1/CBFA2、松弛素-2、RUNX2/CBFA1、松弛素-3、RUNX3/CBFA3、RELMα、RXRα/NR2B1、RELMβ、RXRβ/NR2B2、RELT/TNFRSF19L、RXRγ/NR2B3、抵抗素、S100A10、SLITRK5、S100A8、SLPI、S100A9、SMAC/Diablo、S100B、Smadl、S100P、Smad2、SALL1、Smad3、δ-肌聚糖、Smad4、Sca-1/Ly6、Smad5、SCD-1、Smad7、SCF、Smad8、SCFR/c-kit、SMC1、SCGF、α-平滑肌肌动纤维、SCL/Tall、SMUG1、SCP3/SYCP3、Snail、CXCL12/SDF-1、钠钙交换蛋白1、SDNSF/MCFD2、Soggy-1、α-分泌酶、SonicHedgehog、γ-分泌酶、SorCS1、β-分泌酶、SorCS3、E-选择素、Sortilin、L-选择素、SOST、P-选择素、SOX1、脑信号蛋白3A、SOX2、脑信号蛋白3C、SOX3、脑信号蛋白3E、SOX7、脑信号蛋白3F、SOX9、脑信号蛋白6A、SOX10、脑信号蛋白6B、SOX17、脑信号蛋白6C、SOX21脑信号蛋白6D、SPARC、脑信号蛋白7A、类SPARC1、分离酶、SP-D、丝氨酸/苏氨酸磷酸酶底物I、Spinesin、丝氨酸蛋白酶抑制剂A1、F-Spondin、丝氨酸蛋白酶抑制剂A3、SR-AI/MSR、丝氨酸蛋白酶抑制剂A4/Kallistatin、Src、丝氨酸蛋白酶抑制剂A5/蛋白C抑制剂、SREC-I/SR-F1、丝氨酸蛋白酶抑制剂A8/血管紧张素原、SREC-II、丝氨酸蛋白酶抑制剂B5、SSEA-1、丝氨酸蛋白酶抑制剂C1/抗凝血酶-III、SSEA-3、丝氨酸蛋白酶抑制剂D1/肝素辅因子II、SSEA-4、丝氨酸蛋白酶抑制剂E1/PAI-1、ST7/LRP12、丝氨酸蛋白酶抑制剂E2、美卡拉明-1、丝氨酸蛋白酶抑制剂F1、美卡拉明-2、丝氨酸蛋白酶抑制剂F2、斯钙素1、丝氨酸蛋白酶抑制剂G1/C1抑制剂、斯钙素2、丝氨酸蛋白酶抑制剂I2、STAT1、血清淀粉样A1蛋白、STAT2、SF-1/NR5A1、STAT3、SGK、STAT4、SHBG、STAT5a/b、SHIP、STAT5a、SHP/NR0B2、STAT5b、SHP-1、STAT6、SHP-2、VE抑素、SIGIRR、Stella/Dppa3、Siglec-2/CD22、STRO-1、Siglec-3/CD33、物质P、Siglec-5、硫酸酰胺酶/SGSH、Siglec-6、硫酸酯酶修饰因子1/SUMF1、Siglec-7、硫酸酯酶修饰因子2/SUMF2、Siglec-9、SUMO1、Siglec-10、SUMO2/3/4、Siglec-11、SUMO3、Siglec-F、超氧化物歧化酶、SIGNR1/CD209、超氧化物歧化酶-1/Cu-ZnSOD、SIGNR4、超氧化物歧化酶-2/Mn-SOD、SIRPβ1、超氧化物歧化酶-3/EC-SOD、SKI、存活蛋白、SLAM/CD150、突触蛋白I、睡美人转座酶、多配体蛋白聚糖-1/CD138、Slit3、多配体蛋白聚糖-2、SLITRK1、多配体蛋白聚糖-3、SLITRK2、多配体蛋白聚糖-4、SLITRK4、TACI/TNFRSF13B、TMEFF1/Tomoregulin-1、TAO2、TMEFF2、TAPP1、TNF-α/TNFSF1A、CCL17/TARC、TNF-β/TNFSF1B、Tau、TNFRI/TNFRSF1A、TC21/R-Ras2、TNFRII/TNFRSF1B、TCAM-1、TOR、TCCR/WSX-1、TP-1、TC-PTP、TP63/TP73L、TDG、TR、CCL25/TECK、TRα/NR1A1、结合腕蛋白C、TRβ1/NR1A2、结合腕蛋白R、TR2/NR2C1、TER-119、TR4/NR2C2、TERT、TRA-1-85、Testican1/SPOCK1、TRADD、Testican2/SPOCK2、TRAF-1、Testican3/SPOCK3、TRAF-2、TFPI、TRAF-3、TFPI-2、TRAF-4、TGF-α、TRAF-6、TGF-β、TRAIL/TNFSF10、TGF-β1、TRAILR1/TNFRSF10A、LAP(TGF-β1)、TRAILR2/TNFRSF10B、潜伏TGF-β1、TRAILR3/TNFRSF10C、TGF-β1.2、TRAILR4/TNFRSF10D、TGF-β2、TRANCE/TNFSF11、TGF-β3、TfR(转铁蛋白R)、TGF-β5、脱铁转铁蛋白、潜伏TGF-βbp1、饱和转铁蛋白、潜伏TGF-βbp2、Trappin-2/Elafin、潜伏TGF-βbp4、TREM-1、TGF-βRI/ALK-5、TREM-2、TGF-βRII、TREM-3、TGF-βRIIb、TREML1/TLT-1、TGF-βRIII、TRF-1、嗜热菌蛋白酶、TRF-2、硫氧还蛋白-1、TRH-降解外向酶/TRHDE、硫氧还蛋白-2、TRIM5、硫氧还蛋白-80、三肽基肽酶I、类硫氧还蛋白5/TRP14、TrkA、THOP1、TrkB、血栓调节蛋白/CD141、TrkC、血小板生成素、TROP-2、血小板生成素R、肌钙蛋白I肽3、血小板反应蛋白-1、肌钙蛋白T、血小板反应蛋白-2、TROY/TNFRSF19、血小板反应蛋白-4、胰蛋白酶1、胸腺生成素、胰蛋白酶2/PRSS2、胸腺趋化因子-1、胰蛋白酶3/PRSS3、Tie-1、类胰蛋白酶-5/Prss32、Tie-2、类胰蛋白酶α/TPS1、TIM-1/KIM-1/HAVCR、类胰蛋白酶β-1/MCPT-7、TIM-2、类胰蛋白酶β-2/TPSB2、TIM-3、类胰蛋白酶ε/BSSP-4、TIM-4、类胰蛋白酶γ-1/TPSG1、TIM-5、色氨酸羟化酶、TIM-6、TSC22、TIMP-1、TSG、TIMP-2、TSG-6、TIMP-3、TSK、TIMP-4、TSLP、TL1A/TNFSF15、TSLPR、TLR1、TSP50、TLR2、β-III微管蛋白、TLR3、TWEAK/TNFSF12、TLR4、TWEAKR/TNFRSF12、TLR5、Tyk2、TLR6、磷酸酪氨酸、TLR9、酪氨酸羟化酶、TLX/NR2E1、酪氨酸磷酸酶底物I、泛素、UNC5H3、Ugi、UNC5H4、UGRP1、UNG、ULBP-1、uPA、ULBP-2、uPAR、ULBP-3、URB、UNC5H1、UVDE、UNC5H2、Vanilloid R1、VEGFR、VASA、VEGFR1/Flt-1、Vasohibin、VEGFR2/KDR/Flk-1、Vasorin、VEGFR3/Fit-4、血管抑素、多能蛋白聚糖、Vav-1、VG5Q、VCAM-1、VHR、VDR/NR1I1、波形蛋白、VEGF、玻连蛋白、VEGF-B、VLDLR、VEGF-C、vWF-A2、VEGF-D、Synuclein-α、Ku70、WASP、Wnt-7b、WIF-1、Wnt-8aWISP-1/CCN4、Wnt-8b、WNK1、Wnt-9a、Wnt-1、Wnt-9b、Wnt-3a、Wnt-10a、Wnt-4、Wnt-10b、Wnt-5a、Wnt-11、Wnt-5b、wnvNS3、Wnt7a、XCR1、XPE/DDB1、XEDAR、XPE/DDB2、Xg、XPF、XIAP、XPG、XPA、XPV、XPD、XRCC1、Yes、YY1、EphA4。

数种人离子通道是尤其感兴趣的靶点。限制性例子包括：5-羟色胺3受体B亚基、5-羟色胺3受体前体、5-羟色胺受体3亚基C、AAD14蛋白、乙酰基胆碱受体蛋白、α亚基前体、乙酰基胆碱受体蛋白、β亚基前体、乙酰基胆碱受体蛋白、δ亚基前体、乙酰基胆碱受体蛋白、ε亚基前体、乙酰基胆碱受体蛋白、γ亚基前体、酸性感觉离子通道3剪接变体b、酸性感觉离子通道3剪接变体c、酸性感觉离子通道4、ADP-核糖焦磷酸酶、线粒体前体、A1A-电压依赖性钙通道、氨氯吡咪敏感型阳离子通道1、神经元氨氯吡咪敏感阳离子通道2、神经元氨氯吡咪敏感阳离子通道4、同种型2、氨氯吡咪敏感钠通道、氨氯吡咪敏感钠通道α-亚基、氨氯吡咪敏感钠通道β-亚基、氨氯吡咪敏感钠通道δ-亚基、氨氯吡咪敏感钠通道γ-亚基、膜联蛋白A7、类顶端蛋白、ATP敏感性内向整流钾通道1、ATP敏感性内向整流钾通道10、ATP敏感性内向整流钾通道11、ATP敏感性内向整流钾通道14、ATP敏感性内向整流钾通道15、ATP敏感性内向整流钾通道8、钙通道α12.2亚基、钙通道α12.2亚基、钙通道α1E亚基、δ19δ40δ46剪接变体、钙激活钾通道α亚基1、钙激活钾通道β亚基1、钙激活钾通道β亚基2、钙激活钾通道β亚基3、钙-依赖性氯通道-1、阳离子通道TRPM4B、CDNA FLJ90453fis、克隆NT2RP3001542、高度类似包含6的钾通道四聚化结构域、CDNA FLJ90663fis、克隆PLACE1005031、高度类似氯胞内通道蛋白5、CGMP门控阳离子通道β亚基、氯通道蛋白、氯通道蛋白2、氯通道蛋白3、氯通道蛋白4、氯通道蛋白5、氯通道蛋白6、氯通道蛋白C1C-Ka、氯通道蛋白ClC-Kb、氯通道蛋白、骨骼肌、氯胞内通道6、氯胞内通道蛋白3、氯胞内通道蛋白4、氯胞内通道蛋白5、CHRNA3蛋白、Clcn3e蛋白、CLCNKB蛋白、CNGA4蛋白、挑选蛋白-5(Cullin-5)、环GMP门控钾通道、环核苷酸门控阳离子通道4、环核苷酸门控阳离子通道α3、环核苷酸门控阳离子通道β3、环核苷酸门控嗅觉通道、囊性纤维化病跨膜电导率调节物、细胞色素B-245重链、二氢吡啶敏感型L型、钙通道α-2/δ亚基前体、含FXYD结构域离子转运调节物3前体、含FXYD结构域的离子转运调节物5前体、含FXYD结构域的离子转运调节物6前体、含FXYD结构域的离子转运调节物7、含FXYD结构域的离子转运调节物8前体、G蛋白激活内向整流钾通道1、G蛋白激活内向整流钾通道2、G蛋白激活内向整流钾通道3、G蛋白激活内向整流钾通道4、γ-氨基丁酸受体α-1亚基前体、γ-氨基丁酸受体α-2亚基前体、γ-氨基丁酸受体α-3亚基前体、γ-氨基丁酸受体α-4亚基前体、γ-氨基丁酸受体α-5亚基前体、γ-氨基丁酸受体α-6亚基前体、γ-氨基丁酸受体β-1亚基前体、γ-氨基丁酸受体β-2亚基前体、γ-氨基丁酸受体β-3亚基前体、γ-氨基丁酸受体δ亚基前体、γ-氨基丁酸受体e亚基前体、γ-氨基丁酸受体γ-1亚基前体、γ-氨基丁酸受体γ-3亚基前体、γ-氨基丁酸受体π亚基前体、γ-氨基丁酸受体ρ-1亚基前体、γ-氨基丁酸受体ρ-2亚基前体、γ-氨基丁酸受体θ亚基前体、GluR6卡因酸受体、谷氨酸受体1前体、谷氨酸受体2前体、谷氨酸受体3前体、谷氨酸受体4前体、谷氨酸受体7、谷氨酸受体B、谷氨酸受体δ-1亚基前体、谷氨酸受体、离子化作用的(ionotropic)卡因酸1前体、谷氨酸受体、离子化作用的卡因酸2前体、谷氨酸受体、离子化作用的卡因酸3前体、谷氨酸受体、离子化作用的卡因酸4前体、谷氨酸受体、离子化作用的卡因酸5前体、谷氨酸[NMDA]受体亚基3A前体、谷氨酸[NMDA]受体亚基3B前体、谷氨酸[NMDA]受体亚基ε1前体、谷氨酸[NMDA]受体亚基ε2前体、谷氨酸[NMDA]受体亚基ε4前体、谷氨酸[NMDA]受体亚基ζ1前体、甘氨酸受体α-1链前体、甘氨酸受体α-2链前体、甘氨酸受体α-3链前体、甘氨酸受体β链前体、H/ACA核蛋白蛋白复合物亚基1、高亲和免疫球蛋白ε受体β-亚基、假拟蛋白DKFZp313I0334、假拟蛋白DKFZp761M1724、假拟蛋白FLJ12242、假拟蛋白FLJ14389、假拟蛋白FLJ14798、假拟蛋白FLJ14995、假拟蛋白FLJ16180、假拟蛋白FLJ16802、假拟蛋白FLJ32069、假拟蛋白FLJ37401、假拟蛋白FLJ38750、假拟蛋白FLJ40162、假拟蛋白FLJ41415、假拟蛋白FLJ90576、假拟蛋白FLJ90590、假拟蛋白FLJ90622、假拟蛋白KCTD15、假拟蛋白MGC15619、肌醇1、4、5-三磷酸肌醇受体1型、肌醇1、4、5-三磷酸肌醇受体2型、肌醇1、4、5-三磷酸肌醇受体3型、中电导钙激活钾通道蛋白4、内向整流钾通道13、内向整流钾通道16、内向整流钾通道4、内向调校K(+)通道负调节物Kir2.2v、卡因酸受体亚基KA2a、KCNH5蛋白、KCTD17蛋白、KCTD2蛋白、角质形成细胞相关跨膜蛋白1、Kv通道相互作用蛋白4、美拉丝汀(Melastatin)1、膜蛋白MLC1、MGC15619蛋白、Mucolipin-1、Mucolipin-2、Mucolipin-3、多药耐药相关蛋白4、N-甲基-D-天冬氨酸受体2C亚基前体、NADPH氧化酶同源1、Nav1.5、神经元乙酰基胆碱受体蛋白、α-10亚基前体、神经元乙酰基胆碱受体蛋白、α-2亚基前体、神经元乙酰基胆碱受体蛋白、α-3亚基前体、神经元乙酰基胆碱受体蛋白、α-4亚基前体、神经元乙酰基胆碱受体蛋白、α-5亚基前体、神经元乙酰基胆碱受体蛋白、α-6亚基前体、神经元乙酰基胆碱受体蛋白、α-7亚基前体、神经元乙酰基胆碱受体蛋白、α-9亚基前体、神经元乙酰基胆碱受体蛋白、β-2亚基前体、神经元乙酰基胆碱受体蛋白、β-3亚基前体、神经元乙酰基胆碱受体蛋白、β-4亚基前体、神经元电压依赖性钙通道α2D亚基、P2X嘌呤受体1、P2X嘌呤受体2、P2X嘌呤受体3、P2X嘌呤受体4、P2X嘌呤受体5、P2X嘌呤受体6、P2X嘌呤受体7、胰腺钾通道TALK-1b、胰腺钾通道TALK-1c、胰腺钾通道TALK-1d、磷酸神经膜前体、浆脂蛋白、多囊肾病2相关蛋白、类多囊肾病1蛋白、类多囊肾病2蛋白、多囊肾病和受体卵胶相关蛋白前体、多囊病蛋白-2、钾通道调节蛋白、钾通道亚家族K成员1、钾通道亚家族K成员10、钾通道亚家族K成员12、钾通道亚家族K成员13、钾通道亚家族K成员15、钾通道亚家族K成员16、钾通道亚家族K成员17、钾通道亚家族K成员2、钾通道亚家族K成员3、钾通道亚家族K成员4、钾通道亚家族K成员5、钾通道亚家族K成员6、钾通道亚家族K成员7、钾通道亚家族K成员9、包含3的钾通道四聚体结构域、包含蛋白2的钾通道四聚体结构域、包含蛋白14的钾通道四聚体结构域、包含蛋白2的钾通道四聚体结构域、包含蛋白4的钾通道四聚体结构域、包含蛋白5的钾通道四聚体结构域、包含10的钾通道四聚体结构域、包含蛋白13的钾通道四聚体结构域、包含1的钾通道四聚体结构域、钾电压门控通道亚家族A成员1、钾电压门控通道亚家族A成员2、钾电压门控通道亚家族A成员4、钾电压门控通道亚家族A成员5、钾电压门控通道亚家族A成员6、钾电压门控通道亚家族B成员1、钾电压门控通道亚家族B成员2、钾电压门控通道亚家族C成员1、钾电压门控通道亚家族C成员3、钾电压门控通道亚家族C成员4、钾电压门控通道亚家族D成员1、钾电压门控通道亚家族D成员2、钾电压门控通道亚家族D成员3、钾电压门控通道亚家族E成员1、钾电压门控通道亚家族E成员2、钾电压门控通道亚家族E成员3、钾电压门控通道亚家族E成员4、钾电压门控通道亚家族F成员1、钾电压门控通道亚家族G成员1、钾电压门控通道亚家族G成员2、钾电压门控通道亚家族G成员3、钾电压门控通道亚家族G成员4、钾电压门控通道亚家族H成员1、钾电压门控通道亚家族H成员2、钾电压门控通道亚家族H成员3、钾电压门控通道亚家族H成员4、钾电压门控通道亚家族H成员5、钾电压门控通道亚家族H成员6、钾电压门控通道亚家族H成员7、钾电压门控通道亚家族H成员8、钾电压门控通道亚家族KQT成员1、钾电压门控通道亚家族KQT成员2、钾电压门控通道亚家族KQT成员3、钾电压门控通道亚家族KQT成员4、钾电压门控通道亚家族KQT成员5、钾电压门控通道亚家族S成员1、钾电压门控通道亚家族S成员2、钾电压门控通道亚家族S成员3、钾电压门控通道亚家族V成员2、钾电压门控通道亚家族H成员7同种型2、钠钾超激活激活环核苷酸-门控通道1、钠钾超激活激活环核苷酸-门控通道2、钠钾超激活激活环核苷酸-门控通道3、钠钾超激活激活环核苷酸-门控通道4、可能线粒体输入受体亚基TOM40同系物、嘌呤能受体P2X5、同种型A、推定四重复电压(Putative4repeat voltage-)门控离子通道、推定氯通道蛋白7、推定GluR6卡因酸受体、推定离子通道蛋白CATSPER2变体1、推定离子通道蛋白CATSPER2变体2、推定离子通道蛋白CATSPER2变体3、推定钾通道调节蛋白变体1、推定酪氨酸-蛋白磷酸酶TPTE、兰尼定受体1、兰尼定受体2、兰尼定受体3、SH3KBP1结合蛋白1、短瞬时受体电压通道1、短瞬时受体电压通道4、短瞬时受体电压通道5、短瞬时受体电压通道6、短瞬时受体电压通道7、小电导钙激活钾通道蛋白1、小电导钙激活钾通道蛋白2、同种型b、小电导钙激活钾通道蛋白3、同种型b、小电导钙激活钾通道SK2、小电导钙激活钾通道SK3、钠通道、钠通道β-1亚基前体、钠通道蛋白质IIα型亚基、钠通道蛋白质IIIα型亚基、钠通道蛋白IVα型亚基、钠通道蛋白IXα型亚基、钠通道蛋白Vα型亚基、钠通道蛋白VIIα型亚基、钠通道蛋白VIIIα型亚基、钠通道蛋白Xα型亚基、钠通道蛋白XIα型亚基、钠氯激活ATP敏感性钾通道、钠/钾转运ATP酶γ链、精子相关阳离子通道1、精子相关阳离子通道2、同种型4、突触融合蛋白-1B1、瞬时受体电压阳离子通道亚家族A成员1、瞬时受体电压阳离子通道亚家族M成员2、瞬时受体电压阳离子通道亚家族M成员3、瞬时受体电压阳离子通道亚家族M成员6、瞬时受体电压阳离子通道亚家族M成员7、瞬时受体电压阳离子通道亚家族V成员1、瞬时受体电压阳离子通道亚家族V成员2、瞬时受体电压阳离子通道亚家族V成员3、瞬时受体电压阳离子通道亚家族V成员4、瞬时受体电压阳离子通道亚家族V成员5、瞬时受体电压阳离子通道亚家族V成员6、瞬时受体电压通道4ε剪接变体、瞬时受体电压通道4ζ剪接变体、瞬时受体电压通道7γ剪接变体、肿瘤坏死因子、α-诱导蛋白1、内皮两孔通道蛋白2、VDAC4蛋白、电压门控钾通道Kv3.2b、电压门控钠通道β1B亚基、电压依赖性阴离子通道、电压依赖性阴离子通道2、电压依赖性阴离子-选择性通道蛋白1、电压依赖性阴离子-选择性通道蛋白2、电压依赖性阴离子-选择性通道蛋白3、电压依赖性钙通道γ-1亚基、电压依赖性钙通道γ-2亚基、电压依赖性钙通道γ-3亚基、电压依赖性钙通道γ-4亚基、电压依赖性钙通道γ-5亚基、电压依赖性钙通道γ-6亚基、电压依赖性钙通道γ-7亚基、电压依赖性钙通道γ-8亚基、电压依赖性L-型钙通道α-1C亚基、电压依赖性L-型钙通道α-1D亚基、电压依赖性L-型钙通道α-1S亚基、电压依赖性L-型钙通道β-1亚基、电压依赖性L-型钙通道β-2亚基、电压依赖性L-型钙通道β-3亚基、电压依赖性L-型钙通道β-4亚基、电压依赖性N-型钙通道α-1B亚基、电压依赖性P/Q-型钙通道α-1A亚基、电压依赖性R-型钙通道α-1E亚基、电压依赖性T-型钙通道α-1G亚基、电压依赖性T-型钙通道α-1H亚基、电压依赖性T-型钙通道α-1I亚基、电压门控L-型钙通道α-1亚基、电压门控钾通道β-1亚基、电压门控钾通道β-2亚基、电压门控钾通道β-3亚基、电压门控钾通道KCNA7。

GPRC的例子包括但不限于：A类类视紫质受体，如Musc脊椎动物1型乙酰基胆碱、Musc脊椎动物2型乙酰基胆碱、Musc脊椎动物3型乙酰基胆碱、Musc脊椎动物4型乙酰基胆碱；肾上腺素受体(1型α肾上腺素受体、2型α肾上腺素受体、1型β肾上腺素受体、2型α肾上腺素受体、3型α肾上腺素受体、1型脊椎动物多巴胺、2型脊椎动物多巴胺、3型脊椎动物多巴胺、4型脊椎动物多巴胺、1型组胺、2型组胺、3型组胺、4型组胺、1型5-羟色胺、2型5-羟色胺、3型5-羟色胺、4型5-羟色胺、5型5-羟色胺、6型5-羟色胺、7型5-羟色胺、8型5-羟色胺、其它型5-羟色胺，痕量胺，1型血管紧张素、2型血管紧张素、铃蟾肽、缓激肽、C5a过敏毒素、Fmet-leu-phe、类APJ、A型白介素-8、B型白介素-8、其它型白介素-8、1-11型C-C趋化因子及其它类型、C-X-C趋化因子(2-6型及其它)、C-X3-C趋化因子、胆囊收缩素CCK、A型CCK、B型CCK、其它CCK、内皮缩血管肽、黑素皮质素受体(黑色素细胞刺激激素、促肾上腺皮质激素、黑素皮质素受体激素)、达菲抗原、促乳素释放肽(GPR10)、神经肽Y(1-7型)、神经肽Y、其它神经肽Y、神经降压素、阿片类(D、K、M、X型)、促生长素抑制素(1-5型)、速激肽(底物P(NK1)、底物K(NK2)、神经调节肽K(NK3)、类速激肽1、类速激肽2、加压素/催产加压素(1-2型)、催产加压素、催产素/中催产素、芋螺抑素(Conopressin)、类甘丙肽、类蛋白酶激活、食欲肽和神经肽FF、QRFP、类趋化因子受体、类神经调节肽U(神经调节肽U、PRXamide)、激素蛋白(促卵泡激素、孕酮-绒毛膜雌激素、促甲状腺激素、I型促性腺素、II型促性腺素)、视蛋白(视紫红质)、脊椎动物视网膜色素(1-5型)、脊椎动物视网膜色素5型、节肢动物视网膜色素、节肢动物视网膜色素1型、节肢动物视网膜色素2型、节肢动物视网膜色素3型、软体动物视网膜色素、视网膜色素、嗅觉(嗅觉II fam1-13)、前列腺素(前列腺素E2EP1亚型、前列腺素E2/D2EP2亚型、前列腺素E2EP3亚型、前列腺素E2EP4亚型、前列腺素F2-α、环前列腺素、血栓烷、腺苷1-3型、嘌呤受体、嘌呤受体P2RY1-4、6、11GPR91、嘌呤受体P2RY5、8、9、10GPR35、92、174、嘌呤受体P2RY12-14GPR87(UDP-葡萄糖)、大麻素、血小板激活因子、促性腺素释放激素、促性腺素释放激素I型、促性腺素释放激素II型、类脂肪动员激素、Corazonin、促甲状腺激素释放激素和促分泌素、促甲状腺激素释放激素、生长激素促分泌素、类生长激素促分泌素、蜕皮触发激素(ETHR)、褪黑激素、溶血鞘脂和LPA(EDG)、鞘氨醇1-磷酸Edg-1、溶血磷脂酸Edg-2、鞘氨醇1-磷酸Edg-3、溶血磷脂酸Edg-4、鞘氨醇1-磷酸Edg-5、鞘氨醇1-磷酸Edg-6、溶血磷脂酸Edg-7、鞘氨醇1-磷酸Edg-8、Edg其它白三烯B4受体、白三烯B4受体BLT1、白三烯B4受体BLT2、A类孤儿/其它、推定神经传递素、SREB、Mas原癌基因和Mas-相关(MRGs)、类GPR45、半胱氨酰白三烯、G-蛋白偶联胆酸受体、游离脂肪酸受体(GP40、GP41、GP43)、类促胰液素B类、降钙素、促肾上腺皮质激素释放因子、胃抑制肽、胰高血糖素、生长激素释放激素、甲状旁腺激素、PACAP、促胰液素、血管活性小肠多肽、Latrophilin、l型Latrophilin、2型Latrophilin、3型Latrophilin、ETL受体、脑特异性血管新生抑制剂(BAI)、类玛士撒拉(Methuselah)蛋白(MTH)、钙粘着蛋白EGFLAG(CELSR)、极大G蛋白偶联受体、C类代谢型谷氨酸/信息素、代谢型谷氨酸I-III组、类钙感知、胞外钙感知、信息素、其它类钙感知、推测信息素受体、GABA-B、GABA-B亚型1、GABA-B亚型2、类GABA-B、孤儿GPRC5、孤儿GPCR6、无七蛋白桥(Bride of sevenless proteins、BOSS)、味觉受体(T1R)、D型真菌信息素、类真菌信息素因子A(STE2、STE3)、类真菌信息素因子B(BAR、BBR、RCB、PRA)、E类cAMP受体、视觉白化蛋白、卷曲蛋白/平滑家族、卷曲蛋白A组(Fz1、2、4、5和7-9)、卷曲蛋白B组(Fz3和6)、卷曲蛋白C组(其它)、犁鼻受体、线虫趋化受体、昆虫气味受体以及Z类古细菌/细菌/真菌视蛋白。

可设计主题MURP靶向任意细胞蛋白，包括但不限于：细胞表面蛋白、分泌蛋白、胞质蛋白和核蛋白。尤其感兴趣的0靶点是离子通道。

离子通道是一类蛋白质超家族，包括钾通道(K-通道)家族、钠通道(Na-通道)家族、钙通道(Ca-通道)家族、氯通道(C1-通道)家族和乙酰基胆碱通道家族。这些家族各自包含亚家族，并且每一超家族通常包含起源于单一基因的特定通道。例如，K-通道家族包含名为Kv1.x和Kv3.x的电压门控K-通道亚家族。亚家族Kv1.x包含Kv1.1、Kv1.2和Kv1.3通道，对应单一基因的产物，因此称为“种类”。同样对Na-、Ca-、Cl-和其它通道家族归类。

根据通道操作机制对离子通道进行归类。具体地，离子通道蛋白的主要类型的特征在于开闭通道蛋白以允许或阻止特定离子透过通道蛋白和穿过脂质双层细胞膜所使用的方法。一类重要的通道蛋白是电压门控通道蛋白，它对跨膜电位改变作出开启或关闭(门)的反应。尤其感兴趣的是作为治疗靶点的电压门控钠通道1.6(Nav1.6)。另一类离子通道蛋白是机械门控通道，蛋白上的机械应力开启或关闭该通道。另一种类型称作配体门控通道，特定配体与蛋白结合与否决定其开闭。配体可为胞外部分，如神经递质，或胞内部分，如离子或核苷酸。

离子通道通常允许离子沿化学电势梯度被动流下，然而离子泵使用ATP逆梯度转运。包括反向转运体和协同转运体在内的偶联转运体借助其它离子种类顺势运动提供的能量使一种离子种类逆梯度运动。

一种几乎在所有动物细胞膜都能找到的最常见的通道蛋白类型允许钾离子特异性通过细胞膜。具体说，钾离子快速通过K⁺通道蛋白穿透细胞膜(快至每秒10^-8离子)。而且，钾通道蛋白具有非常准确的鉴别钾离子和其它小碱金属离子如Li⁺或Na⁺的能力。具体说，钾离子至少比钠离子透性大10000倍。钾通道蛋白通常含有四个(通常一样的)亚基，因此细胞表面的靶点以四聚体呈现，允许MURP的四价结合。一类亚基含有六个长疏水区段(可为跨膜)，而其它类型包含两个疏水区段。

另一重要通道家族是钙通道。通常根据电生理特性将钙通道分为低电压激活(LVA)或高电压激活(HVA)通道。HVA通道包括至少三组通道，即已知的L-、N-和P/Q-型通道。根据其药理学和配体结合特性，已将这些通道在电生理学和生物化学上进行区分。例如，与L-型钙通道α₁亚基结合的二氢吡啶、二苯基-烷基胺和哌啶阻断了神经元组织中的被称为L-型钙电流的一部分HVA钙电流。N-型钙通道对ω芋螺肽，但对于二氢吡啶化合物，如尼莫地平和硝苯地相对不敏感平。另一方面，P/Q型通道对二氢吡啶不敏感，但对漏斗形蜘蛛毒素Aga IIIA敏感。由于大的膜去极化激活R-型钙通道，如L-、N-、P-和Q型通道，因此归类为高电压激活(HVA)通道。R型通道通常对二氢吡啶和ω芋螺肽不敏感，但如P/Q、L和N通道对漏斗形蜘蛛毒素AgaIVA敏感。免疫细胞化学染色表明这类受体位于整个脑，尤其在深中线结构(尾壳核、丘脑、下丘脑、杏仁核、小脑)以及腹部中脑核脑干的核中。神经元电压敏感钙通道通常由中央α₁亚基、α₂/δ亚基、β亚基和95kD亚基组成。

另外的非限制性例子包括Kir(内向整流钾通道)、Kv(电压门控钾通道)、Nav(电压门控钠通道)、Cav(电压门控钙通道)、CNG(环核苷酸门控通道)、HCN(超极化激活通道)、TRP(瞬时受体电压通道)、ClC(氯通道)、CFTR(囊性纤维化病跨膜电导率调节蛋白、氯通道)、IP3R(三磷酸肌醇受体)、RYR(兰尼定受体)。其它通道类型为2-孔通道、谷氨酸受体(AMPA、NMDA、KA)、M2、连接蛋白和Cys-环受体。

离子通道蛋白，如Kv1.2、Kv3.1、Shaker、TRPC1和TRPC5的通常结构图是6个如下排列的跨膜区段：

N-末端---S1---E1---S2---X1---S3---E2---S4---X2---S5---E3---S6---C-末端

其中S1-6为跨膜序列，E1-3为细胞外表面环，X1-2为胞内表面环。E3环通常是三个胞外环中最长的并且具有亲水性，是药物和MURP结合的良好靶点。多数通道的孔形成部分是跨膜α螺旋的多聚(如四聚或五聚体)复合物。通常有孔环，它是蛋白的一个绕回膜形成选择性滤膜的区域，决定了哪种离子可以穿透。此类通道被称为“孔环”通道。

离子通道是药物设计的有价值的靶点，因为它们涉及广泛的生理过程。在人体中，存在大约超过三百种离子通道蛋白，其中许多涉及遗传疾病。例如，已显示离子通道表达异常或功能紊乱引起各种疾病，包括心脏、神经元、肌肉、呼吸代谢疾病。该部分主要描述离子通道，但相同概念和方法同样可应用于所有膜蛋白，包括7TM、1TM、G-蛋白和G-蛋白偶联受体(GPCR)等。一些离子通道为GPCR。

离子通道通常形成包含紧密结合附属蛋白亚基的大分子复合物，此类亚基的联合使用造成离子通道的多样性。这些附属蛋白也可与主题MURP、微生物蛋白和毒素靶点结合。

可设计主题MURP，使其结合本领域已知以及本文指出的任何通道。可通过任意本领域已知的重组或生化技术(如表达和展示)选择具有所所需离子通道结合能力(包括特异性和亲合力)的MURP。例如，可通过包括但不限于噬菌体和孢子的遗传包展示MURP，并进行抗完整细胞膜的淘选，或优选完整细胞，如完整哺乳动物细胞。为了移除与其它非靶细胞表面分子结合的噬菌体，标准步骤是对具有受体水平低或无法检测到的相似细胞系进行消减淘选。然而，Popkov等(J.Immunol.Methods291：137-151(2004))显示相关细胞类型对于消减并不理想，因为它们表面的靶点通常会减少但仍为显著水平，这会降低所需噬菌体克隆的数目。甚至当淘选转染靶点编码基因的细胞，然后对未转染细胞进行负向选择/消减时，这个问题也会发生，特别是当天然靶点基因未被敲除时。同时，Popkov等显示如果利用过量的与普通淘选(正向选择)相同的细胞进行操作，负向选择或消减淘选的效果更好，除非利用高亲合力、靶点特异性抑制剂如小分子、肽或抗靶点的抗体将靶点封闭，从而使活性位点不可利用。这个过程被称作“利用表位遮蔽细胞进行负向选择”，这在选择具有所需离子通道结合能力的主题MURP时尤其有用。

在一个单独的实施方式中，本发明提供了微生物蛋白，尤其是对至少一种离子通道家族具有结合能力的微生物蛋白。本发明也提供了展示此类微生物蛋白的遗传包。主题微生物蛋白结合的非限制性离子通道的例子是钠、钾、钙、乙酰胆碱和氯通道。尤其感兴趣的是那些微生物蛋白及展示此类微生物蛋白的遗传包，它们对天然靶点具有结合能力。天然靶点通常是已知微生物蛋白能够结合的天然分子或其片段及衍生物，通常包含文献中报道的那些已知结合靶点。

本发明也提供了展示修饰的离子通道结合微生物蛋白的遗传包。修饰的微生物蛋白可(a)与对应未修饰微生物蛋白相比，与不同的离子通道家族结合；(b)与对应未修饰微生物蛋白相比，与同一通道家族的不同亚家族结合；(c)与对应未修饰微生物蛋白相比，与同一通道亚家族的不同种类结合；(d)与对应未修饰微生物蛋白相比，与同一通道的不同位点结合；和/或(e)与对应未修饰微生物蛋白相比，与同一通道的同一位点结合但产生不同的生物学效应。

图22和46显示如何将与同一离子通道不同位点结合的微生物蛋白结构域或毒素组合成单一蛋白。这两种微生物蛋白结合的两个结合位点可以在来自不同家族的两个通道、来自同一家族不同亚家族的两个通道、来自同一亚家族但不同种类(基因产物)的两个通道、或者在同一通道(种类)上的两个不同结合位点上，或者因为通道是多聚体，它们可(同时或不同时)结合于同一通道(种类)的同一结合位点。与通道位点结合的结合模块和结构域可为微生物蛋白结构域(天然的或非天然的，含有2到8个二硫键)、单二硫键肽或线性肽。可独立地选择这些模块或将其合并，或者可在固定的活性结合模块存在下由文库中选择。后一种情况下，展示文库可展示多种模块，其中一种模块可包含变体文库。典型的目标是从文库中选择比起始的活性单体具有更高亲和力的二聚体。

在另一实施方式中，本发明提供了包含多个离子通道结合域的蛋白，其中各结构域经修饰以便(a)与对应未修饰的微生物蛋白结构域相比，该微生物蛋白结构域与不同通道家族结合；(b)与对应未修饰的微生物蛋白结构域相比，该微生物蛋白结构域与同一通道家族的不同亚家族结合；(c)与对应未修饰的微生物蛋白结构域相比，该微生物蛋白结构域与同一亚家族的不同种类结合；(d)与对应未修饰的微生物蛋白结构域相比，该微生物蛋白结构域与同一通道的不同位点结合；(e)与对应未修饰的微生物蛋白结构域相比，该微生物蛋白结构域与同一通道的同一位点结合但产生不同生物学效应；和/或(f)与对应未修饰的微生物蛋白结构域相比，该微生物蛋白结构域与同一通道的同一位点并产生相同的生物学效应。所需的是，微生物蛋白结构域可包含天然的或非天然的序列。可通过异源接头将单个结构域连接起来。单个微生物蛋白结构域可结合相同或不同通道家族、相同或不同通道亚家族、同一亚家族的相同或不同种类、相同通道的相同或不同位点。

主题微生物蛋白可为毒素。优选地，毒素部分或全部保留了毒性谱。具体说，有毒的动物，如蛇，遇到一些捕食者或入侵者物种时，毒液毒素对不同物种的不同受体产生不同的活性。毒液包含了大量相关或非相关的毒素，每一毒素具有“活性谱”，即毒素能产生可测量活性的全部物种的全部受体。“活性谱”中所有的靶点被认为是“天然靶点”，这包括任一毒素活性对抗的人靶点。微生物蛋白或毒素的天然靶点包括所有文献已报道毒素可抑制的靶点。对靶点的亲合力或活性越高，靶点越可能是天然、原始的靶点，但很少发现毒素能够作用于同一物种的多个靶点。天然靶点可为毒素活性对抗的人或非人的受体。

对于与展示载体融合后保留与细胞结合能力的毒素，可能需要使用合成DNA文库方法测试融合物的N末端和C末端以及不同融合位点(即，如果毒素结构域为含半胱氨酸结构域，毒素结构域中第一个半胱氨酸之前或最后一个半胱氨酸之后的0、1、2、3、4、5、6个氨基酸)，优选编码形成最小氨基酸链的富甘氨酸接头文库是不带电的，最有可能与毒素和靶点的结合相容。既然N末端氨基和C末端羧基可能参与了靶点结合，则该文库应当包含模拟带正电氨基的赖氨酸或精氨酸(以便(or)与毒素N末端融合)和模拟带负电羧基的谷氨酸或天冬氨酸(以便与毒素C末端融合)。

在负向选择时用于阻断靶点的抑制剂可为天然或非天然的小分子、肽或蛋白。除了简单消减外，抑制剂混合物的选择是控制所设计离子通道抑制剂特异性的有用工具。因为总共有超过300种例子通道具有部分交叠的特异性和序列相似性，并且每个通道具有多个调节位点，各自具有不同效应，所以特异性的要求很复杂。

当修饰毒素活性或当将两种不同毒素合并为一个蛋白时，这两种毒素可结合于同一通道的同一位点具有相同的生理效应，或结合于同一通道的同一位点但具有不同的生理效应，或结合于同一通道的不同位点，或结合于属于同一亚家族的不同通道(即Kv1.3和Kv1.2；意味着不同的基因产物或“种类”)，或结合于相同家族的不同通道(即均为K-通道)，或结合于属于不同家族的通道(即K-通道对Na-通道)。

离子通道通常具有许多跨膜区段(钠通道有24个)，因此为调节物以不同方式改变通道活性提供了数个不同、非竞争和非交叠的结合位点。一种方法从存在的不同位点的结合物创造相同通道上一个位点的结合物，即使这些位点是无关的。为了达到这个目的，使用现有的毒素作为靶向1-2-3-或4-二硫键蛋白文库的靶向试剂，通过一个5、6、7、8、9、10、12、14、16、18、20、25、30、35、40或50个氨基酸的可变接头与靶向毒素分隔。当靶向试剂亲合力不是很高时这很有用，因此新文库的亲合力对总体亲合力有显著贡献。另一方法是从其它序列或结构相关的通道的已存在的调节物来创建新的通道调节物。例如，芋螺毒素家族包含Ca-、K、Na-通道和烟碱乙酰胆碱受体的序列相关和结构相关的调节物。似乎利用芋螺毒素衍生物的文库将K通道调解物转换为Na通道调节物是可行的，反之亦然。例如，κ-芋螺毒素抑制K-通道，μ-芋螺毒素和Δ-芋螺毒素抑制Na-通道，ω-芋螺毒素抑制Ca-通道和α-芋螺毒素抑制乙酰胆碱受体。

来自同一离子通道的对通道活性具有不同效应的不同结合位点的接近使利用可变接头连接抑制剂以产生具有各自结合不同位点的两个结构域的单个抑制剂很吸引人。或具有两个结合于相同位点不同拷贝的结构域的单个蛋白，产生二价高亲和力的相互作用(亲合力)。该方法尚未用于天然毒素，大概因为它们作用迅速，因此为了具有最大组织渗透性需保持很小，但是对于制药来说，作用速度并不重要，使其成为吸引人的方法。

因此可创建各自是天然或修饰的二聚化、三聚化、四聚化或多聚化毒素/调节物的文库，并且直接在蛋白水平筛选这些文库，或利用遗传包淘选这些文库中以亲和力(亲合力，如果同时在多个位点发生结合)提高的文库，接着利用蛋白表达和纯化以及基于细胞的实验，包括膜片钳实验鉴定这些多聚化克隆的特异性和活性。这些单个模块可各自分离地独立淘选和选择，或可将它们设计为共同存在的形式，因此将新结构域加到也包含用作文库靶向元件的固定的活性拷贝的展示系统文库中，并且仅选择和鉴定显著优于固定的活性单体的克隆。

图46和47显示了一些可由原始(天然)毒素产生的单体衍生物，一些多聚体可与靶点的多个不同结合位点结合。接头显示为富甘氨酸的rPEG，但接头可为任意序列并可利用分子文库进行优化，然后进行淘选。利用上述多种诱变策略可在活性原始毒素本身内部产生文库，或在活性毒素的N末端或C末端侧创建文库以扩大与靶点接触的面积，期望能够创建与靶点另外的接触。此类文库可基于对所述位点具有已知活性的现有毒素，或者它们可为基于非相关微生物蛋白支架的原始1-、2-、3-、4-二硫键文库。这些附加接触元件可加于活性结构域的一侧或两侧，并且可直接与现有调节结构域相邻，或通过可变接头与其隔离。基于结构域序列相似性或多聚物结构域靶点特异性，初始多聚物或最终改进的多聚物可为同源多聚物或异源多聚物。因此，包含该多聚物的单体可与同一靶点的相同或不同序列结合。已知10-100种不同天然毒素与各个通道家族结合，并且每个克隆具有2、3、4、5或6个结构域，即便仅使用天然毒素序列，也可创建具有巨大组合多样性的展示文库。可利用基于氨基酸相似性或家族内系统发生取代率的低水平合成诱变产生高质量的突变体文库，预计其中绝大部分能保留功能，一些感兴趣特性的功能提高概率很大。

可按照Hill系数测量主题MURP、微生物蛋白或毒素与给定离子通道的结合能力。Hill系数反映结合相互作用的化学计量。Hill系数为2表明两种抑制剂结合于每一通道。也可评估变构调节，这是由远端位点结合引起的某一位点的活性调解。

可利用多种体外和体内实验评估离子通道的生物学活性或效应及主题MURP、微生物蛋白或毒素调解离子通道活性的能力。例如，可从本领域获得测量电压，电流，膜电位，离子流如钾流、铷流，离子浓度，门控，第二信使和转录水平的方法，以及使用电压敏感染料、放射性示踪剂和膜片钳电生理的方法。具体说，这些实验可用于检测那些可抑制或激活感兴趣离子通道的微生物蛋白和毒素。

具体地，可与合适对照相比检测可能的通道抑制剂或激活剂以测定调解程度。对照样品可为未用候选激活剂或抑制剂处理的样品。与对照相比给出的离子通道活性值约为90％、80％、70％、60％、50％、40％、30％、20％、10％或更低时，存在抑制。IC50是用于确定抑制作用的常用单位(降低50％离子通道活性的抑制剂浓度)。相似地有IC90。与对照相比，所选给定离子通道活性值增加10％、20％、30％、40％、50％、60％、70％、80％、90％、100％、200％、500％或更多时，实现通道激活。

检测表达感兴趣通道的细胞或膜的极化(即电位)变化，以评估离子流的变化。例如，一种检测细胞极化的方法是利用电压钳和膜片钳技术，以(例如)“细胞贴附”模式、“内翻外”模式或“全细胞”模式测量电流变化(从而测量极化变化)(参见例如，Ackerman等，New Engl.J.Med.336：1575-1595(1997))。利用标准方法可方便测量全细胞电流(参见例如，Hamil等，Pflugers.Archiv.391：85(1981)。其它已知方法包括：放射性标记铷流实验以及利用电压敏感染料的荧光实验(参见例如，Vestergarrd-Bogind等，J.Membrane Biol.88：67-75(1988)；Daniel等，J.Pharmacol.Meth.25：185-193(1991)；Holevinsky等，J.Membrane Biology137：59-70(1994))。

候选MURP、微生物蛋白或毒素对于感兴趣通道功能的影响可通过电流或离子流改变或者电流或离子流改变的后果进行测量。候选蛋白对离子流的下游效应可能不同。因此，可利用任意合适的生理学变化评定候选蛋白对测试通道的影响。候选蛋白的影响可由毒素结合实验测定。当利用完整细胞或动物测定功能性结果时，也可测定数种效应，如递质释放(如多巴胺)、激素释放(如胰岛素)、已知或未鉴定遗传标记物的转录变化(如northern印记)、细胞体积变化(如红细胞)、免疫应答(如T细胞激活)、细胞代谢变化如细胞生长或pH变化以及胞内第二信使如Ca2⁺的变化。

其它离子通道的关键生物学活性是离子选择性和门控。选择性是某些通道鉴别离子种类的能力。允许一些离子通过孔道而排除另一些离子。门控则是开放和关闭状态的变换。可通过本领域已知方法或本文公开方法评估。

其它可用于选择主题MURP、微生物蛋白或毒素的生物学性质是靶通道开关的频率，称为门控频率。门控频率受到电压(在通过膜电压改变而开关的电压门控通道中)和配体结合的影响。开关状态的转换速率通常＜10微秒，但可被其它分子增加或减少。离子通道开启时通过孔洞的流速(电流)为每秒10e7个离子数量级上，偶联交换物则少很多。开启后，一些电压门控通道进入失活的非传导状态，这时它们难以进行去极化。

实施例

实施例：基于人序列设计甘氨酸-丝氨酸寡聚体

在人类基因组数据库中搜索富甘氨酸序列。将三条序列鉴定为合适的供体序列，见表X。

表X：GRS设计A的供体序列

基于表X中的序列，我们设计了包含多个具有序列GGGSGSGGGGS肽A重复的富甘氨酸序列。将肽A寡聚化形成具有式(GGGSGSGGGGS)_n的结构，其中n为2-20。图5显示表3中所列至少一种蛋白中包含的肽A寡聚体中所有可能的9聚体子序列。因此肽A寡聚体不包含人T细胞表位。检视图5揭示基于肽A寡聚体的GRS可在肽A的任意位点开始和结束。

实施例：基于人序列设计甘氨酸-脯氨酸寡聚体

基于序列GPGGGGGPGGGGGPGGGGPGGGGGGGPGGGGGGPGGG设计富甘氨酸序列，代表登录号NP_006228的人4类POU结构域的146-182氨基酸。图6显示具有序列GGGGGPGGGGP的肽B寡聚体可用作GRS。POU结构域序列也包含所有具有序列(GGGGGPGGGGP)_n的肽中所有可能的9聚体子序列。因此，这类寡聚序列不包含T细胞表位。

实施例：设计甘氨酸-谷氨酸寡聚体

可根据核糖体蛋白S6激酶(登录号BAD92170)一部分的子序列GAGGEGGGGEGGGPGG设计富甘氨酸序列。例如，具有序列GGGGE的肽C寡聚体形成核糖体蛋白S6激酶序列中包含多数9聚体子序列的序列。因此，具有一般结构(GGGGE)_n的寡聚化GRS具有极低的包含T细胞表位的风险。

实施例：鉴定人亲水性富甘氨酸序列

在人蛋白质数据库中搜索富甘氨酸残基的子序列。这些子序列包含至少50％甘氨酸。仅允许GRS中出现如下非甘氨酸残基：ADEHKPRST。鉴定出70种最小长度为20个氨基酸的子序列。附件A中列出这些子序列。可利用它们构建在人体中具有低免疫原潜能的GRS。

实施例：构建rPEG_J288

下述实施例描述构建编码含288个氨基酸及序列(GSGGEG)₄₈的URP序列的密码子优化基因。首先，我们构建图40所示的填充载体pCW0051。图42显示了pCW0051中的表达盒序列。该填充载体基于pET载体并包含T7启动子。该载体编码Flag序列后随侧接BsaI、BbsI和KpnI位点的填充序列。如图42所示，插入BsaI和BbsI位点因此在消化后产生相容性突出端。该填充序列后随His₆标签和绿色荧光蛋白(GFP)基因。该填充序列包含终止密码子，因此携带填充质粒pCW0051的大肠杆菌细胞形成无荧光菌落。利用BsaI和KpnI消化填充载体pCW0051。如图41所示构建编码36个氨基酸长度的URP序列的密码子文库。该URP序列编号为rPEG_J36并具有氨基酸序列(GSGGEG)₆。将编码氨基酸序列GSGGEGGSGGEG的合成寡核苷酸对以及编码KpnI位点衔接子的一对寡核苷酸退火形成插入物。使用下列寡核苷酸：pr_LCW0057正向：AGGTAGTGGWGGWGARGGWGGWTCYGGWGGAGAAGG，pr_LCW0057反向：ACCTCCTTCTCCWCCRGAWCCWCCYTCWCCWCCACT，pr_3KpnI终止子正向：AGGTTCGTCTTCACTCGAGGGTAC，pr_3KpnI终止子反向：CCTCGAGTGAAGACGA。连接退火的寡核苷酸，得到代表不同重复数目rPEG_J12重复的不同长度的产物混合物。利用琼脂糖电泳从混合物中分离对应rPEG_J36长度的产物并将其连接到BsaI/KpnI消化的填充载体pCW0051中。所得到的指定为LCW0057的文库中多数克隆诱导后显示绿色荧光，这表面序列rPEG_J36已被连接至GFP基因框内。图14显示rPEG_J36序列的筛选和重复多聚化过程。我们筛选了来自LCW0057文库的288种分离物中具有高水平荧光的分离物。对48种具有强荧光的分离物进行PCR分析以证实rPEG_J区段的长度，并且鉴定出16个克隆具有所需的rPEG_J36长度。这样得到16种rPEG_J36分离物的集合，显示出高表达并具有不同的密码子使用。利用图40所示方法将分离物汇集并二聚化。使用BsaI/NcoI消化质粒混合物，分离出包含rPEG_J36序列和一部分GFP的片段。利用BbsI/NcoI消化同一质粒混合物，分离出包含rPEG_J36、大部分质粒载体和剩余GFP基因的片段。将两种片段混和，连接并转化BL21，筛选分离物的荧光。如图14所示再进行两轮二聚化过程。在每一轮中，我们将rPEG_J基因长度加倍，最终获得编码rPEG_J288的基因集合。rPEG_J288的氨基酸和核苷酸序列如图15所示。可看到rPEG_J288模块包含氨基酸序列相同、但核苷酸序列不同的rPEG_J36的区段。因此我们将基因内部同源性最小化，降低自发性重组的风险。我们培育携带编码rPEG_J288质粒的大肠杆菌BL21至少进行了20次倍增，未发现自发性重组。

实施例：构建rPEG_H288

利用与构建rPEG_J288相同的步骤来构建编码称为rPEG_H288A的288个氨基酸URP的基因文库。rPEG_H288具有氨基酸序列(GSGGEGGSGGSG)₂₄。图14显示了构建过程的流程图。图16给出了rPEG_H288一个分离物的完整氨基酸序列及核苷酸序列。

实施例：rPEG_J288的血清稳定性

包含N末端Flag标签和与绿色荧光蛋白N末端融合的A融合的URP序列rPEG_J288的融合蛋白在50％小鼠血清中于37℃孵育三天。在不同时间点采集样品，利用SDS PAGE分析并利用Western分析检测。抗N末端flag标签的抗体用于Western检测。结果显示于图28，表明具有288个氨基酸的URP序列在血清中至少三天是完全稳定的。

实施例：血清中缺少rPEG_J288的预存抗体

抗URP抗体的存在表明可能对富甘氨酸序列产生免疫原性应答。为了检测血清中是否存在抗体，通过将URP-GFP固定于支持物并接着用30％血清孵育的ELISA来检测URP-GFP融合物。使用抗IgG马辣根过氧化物酶抗体及底物检测与URP-GFP结合抗体的存在。数据如图29所示。数据显示，融合蛋白可被抗GFP或Flag的抗体检测到，但无法被鼠血清检测到。这表明鼠血清中不含具有URP序列的抗体。

实施例：纯化包含rPEG_J288的融合蛋白

我们纯化结构形如Flag-rPEG_J288-H6-GFP的蛋白。利用大肠杆菌BL21在SB培养基中表达该蛋白。18℃下0.5mM IPTG诱导培养物过夜。离心收集细胞。在含有Bezonase和市售蛋白酶抑制剂混合物的TBS缓冲液中重悬细胞团块。在70℃水浴中加热悬液10分钟以裂解细胞。离心去除不溶物。利用固定金属离子特异性(IMAC)柱处理，接着流过固定抗-Flag抗体的柱子，以便纯化上清。图43显示纯化过程的PAGE分析。该过程产生至少90％纯度的蛋白。

实施例：构建rPEG_J288和干扰素-α的融合蛋白

利用用于大肠杆菌表达的密码子优化设计编码人干扰素的基因。将合成基因与编码rPEG_J288的基因融合。将一个His6标签置于N末端以利于融合蛋白的检测和纯化。图44给出融合蛋白的氨基酸序列。

实施例：构建rPEG_J288-G-CSF融合物

利用用于大肠杆菌表达的密码子优化设计编码人G-CSF的基因。将合成基因与编码rPEG_J288的基因融合。将一个His6标签置于N末端以利于融合蛋白的检测和纯化。图44给出融合蛋白的氨基酸序列。

实施例：构建rPEG_J288-hGH融合物

利用用于大肠杆菌表达的密码子优化设计编码人生长激素的基因。将合成基因与编码rPEG_J288的基因融合。将一个His6标签置于N末端以利于融合蛋白的检测和纯化。图44给出融合蛋白的氨基酸序列。

实施例：rPEG_J288和人蛋白的融合蛋白的表达

将rPEG_J288和两个人蛋白-干扰素-α和人生长激素的融合蛋白克隆进T7表达载体并转化大肠杆菌BL21。细胞在37℃生长至光密度为0.5OD。然后，将细胞在18℃培养30分钟。接着加入0.5mM IPTG并将培养物在18℃振荡培养过夜。离心收集细胞，利用BugBuster(诺瓦基公司)(Novagen)释放可溶性蛋白，利用SDS-PAGE分离不溶性蛋白和可溶性蛋白成分，通过Western利用抗N-末端His6标签的抗体检测融合蛋白。图45显示了两个融合蛋白的Western分析，rPEG_J288-GFP作为对照。融合蛋白均有表达，主要蛋白在可溶性组分中。这是rPEG_J288高溶解性的证据，因为文献报道很多表达人干扰素-α和人生长激素的多数尝试均得到不溶性的包含体。图45显示了大部分融合蛋白以全长蛋白的形式表达，即没有检测到表明不完全合成或部分蛋白降解的片段。

实施例：VEGF多聚体的构建和结合

如文献所述[Scholle，M.D.等(2005)Comb Chem High Throughput Screen，8：545-51]构建半胱氨酸限制性肽的文库。用抗人VEGF对这些文库进行淘选，并发现由氨基酸序列FTCTNHWCPS或FQCTRHWCPI组成的两个结合模块。将编码氨基酸序列FTCTNHWCPS的寡核苷酸连接到编码具有序列(GGS)₁₂的URP序列rPEG_A36的核苷酸序列中。然后利用限制性酶和连接步骤将融合序列二聚化以构建包含以融合于GFP的rPEG_A36分隔的4拷贝VEGF结合模块的分子。图30比较了包含0-4个VEGF结合单位的融合蛋白的VEGF结合亲和力。仅包含与GFP融合的rPEG_A36的融合蛋白未显示对VEGF的亲和力。随着VEGF结合模块的增加所得到的融合蛋白亲和力也增加。

实施例：发现针对治疗靶点的1SS结合模块

依照Scholle等[Scholle，M.D.等(2005)Comb Chem High ThroughputScreen，8：545-51]所述产生随机肽文库。原始肽文库展示了具有被4-10个随机残基分隔的半胱氨酸的半胱氨酸限制性肽。下表展示了文库的设计：

表X：原始1SS文库：

使用下述方案针对一系列的治疗相关靶点淘选文库：利用含5μg/ml靶点抗原的PBS4℃包被免疫吸附ELISA板孔过夜。用PBS冲洗包被板，用封闭缓冲液(含0.5％BSA或0.5％卵清蛋白的PBS)室温封闭非特异性位点2h。然后用PBST(含0.05％吐温20的PBS)冲洗板，在孔中加入含1-5x10¹²/ml噬菌体颗粒的结合缓冲液(含0.05％吐温20的封闭缓冲液)，室温下振荡2h。清空孔并用PBST冲洗。利用100mM HC1室温下孵育10分钟从孔中洗脱结合噬菌体，转移到灭菌管中并利用1M TRIS碱中和。为了感染，在中和的噬菌体洗脱物中加入在含5μg/ml四环素的Super肉汤培养的对数期大肠杆菌SS320中，并于37℃振荡培养30分钟。然后将感染的培养物转移到装有含5μg/ml四环素的Super肉汤的更大的管中，37℃振荡培养过夜。离心过夜培养物去除大肠杆菌，并加入20％PEG和2.5M NaC1溶液至PEG浓度4％，使噬菌体颗粒沉淀。离心收集沉淀噬菌体，并将噬菌体团块重悬于1ml PBS中，离心去除残余的大肠杆菌并转移到新管中。分光光度法估测噬菌体浓度，使用噬菌体进行下一轮选择。3或4轮噬菌体淘选后，筛选单个克隆对靶点的结合亲合力。挑选淘选当中选自噬菌体克隆的单个噬菌斑转移至含5μg/ml四环素Super肉汤中，并在37℃振荡培养过夜。4℃以3μg/ml抗原和对照蛋白(BSA、卵清蛋白、IgG)包被ELISA板过夜。用PBS冲洗包被板，用封闭缓冲液室温封闭非特异性位点(含0.5％BSA或0.5％卵清蛋白的PBS)2h。离心去除过夜培养液中的大肠杆菌，用结合缓冲液(含0.05％吐温20的封闭缓冲液)以1∶10稀释上清并转移到PBST(含0.05％吐温20的PBS)冲洗过的ELISA板中。室温下振荡孵育板2h。PBST冲洗后，在孔中加入用PBS以1∶5000稀释的抗-M13-HRP(法马西亚公司)(Pharmacia)抗体。室温下振荡孵育该板30分钟，并利用PBST和PBS先后冲洗。将含50mM磷酸柠檬酸钠缓冲液配制的0.4mg/ml ABTS和0.001％H₂O₂的底物溶液加入到孔中，显色40分钟后，在405nm读板。该ELISA读数能够确定克隆特异性，并且可利用成熟商品化方法对抗原特异性克隆进行测序。

表X：EpCAM特异性结合模块的序列

表X：CD28特异性结合模块的序列

表X：CD28特异性结合模块的序列

K H Y C F G P K S W T T C A R G sNG0030S3.096P W C H L C P G S P S R C C Q P sNG0030S3.091P E S K L I S E E D L N G D V S sNG0030S3.042

表X：Tiel特异性结合模块的序列

I W D R V C R M N T C H Q H S H sNG0032S3.096P Y T I F C L H S S C R S S S S sNG0032S3.087D W C L T G P N T L S F C P R R sNG0032S3.031

表X：DR4特异性结合模块的序列

L S T W R C L H D V C W P P L K sNG0033S3.072

表X：DR5特异性结合模块的序列

表X：TrkA特异性结合模块的序列

K T W D C R N S G H C V I T F K sNG0035S3.074A T W D C R D H N F S C V R L S sNG0035S3.089

实施例：aEpCAM药物偶联物

从根据Scholle等[Scholle，M.D.等(2005)Comb Chem High ThroughputScreen，8：545-51]产生的随机肽库中分离抗-EpCAM肽。原始肽文库展示了具有被4-10个随机残基分隔的半胱氨酸的半胱氨酸限制性肽。对上述文库进行三轮亲和选择后，分离到数个EpCAM特异性肽配体(EpCaml)(表X)。EpCaml分离物具有四个氨基酸的保守半胱氨酸间隔(CXXXXC)。利用编码3-9个残基的密码子将EpCaml肽配体柔和(softly)随机化(除了半胱氨酸位置)，并移至噬菌粒载体。接着用EpCAM对噬菌粒文库进行亲和力选择以分离有利于结合的肽配体(表X，EpCam2)。EpCam2配体包含保守的CXXXXC半胱氨酸间隔物。此外，多数抗-EpCam序列不含赖氨酸残基，这样有利于在结合序列外偶联游离胺基。而且，通常可将抗-EpCam肽配体与(任意长度的)URP序列融合，并利用重复二聚化进行多聚化。可使用所得抗-EpCAM MURP特异性靶向EpCAM，其亲和力高于单体序列。图31显示一个四聚体EpCAM-URP氨基酸序列的例子。该序列仅包含两个位于N末端Flag标签的赖氨酸残基。这些赖氨酸残基的侧链对于药物偶联尤其合适。

表X.抗-EpCam序列

实施例：加入随机序列

通过在结合序列的N末端、C末端或N和C末端加上接头和随机序列可使结合模块亲和成熟或延长。图32显示将原始半胱氨酸限制性序列加在抗-EpCAM结合模块上。可使用单链或双链DNA克隆方法产生添加随机序列文库。一旦产生，可用最初靶蛋白或第二蛋白对文库进行亲和选择。例如，包含抗-EpCAM结合模块的添加文库可用于选择包含两个或多个靶蛋白结合位点的序列。

实施例：构建2SS构建文库

设计一系列的寡核苷酸以构建基于VEGF结合1SS肽FTCTNHWCPS的文库。以半胱氨酸距离模式向寡核苷酸的侧接序列中掺入变异，但VEGF结合肽序列保持固定。

正向寡核苷酸：

LMS70-1

CAGGCAGCGGGCCCGTCTGGCCCGTGYTTTACTTGTACGAATCATTGGTGTCCT

LMS70-2

CAGGCAGCGGGCCCGTCTGGCCCGTGYNNKTTTACTTGTACGAATCATTGGTG TCCT

LMS70-3

CAGGCAGCGGGCCCGTCTGGCCCGTGYNNKNNKTTTACTTGTACGAATCATTG GTGTCCT

LMS70-4

CAGGCAGCGGGCCCGTCTGGCCCGTGYNHTNHTNHTTTTACTTGTACGAATCA TTGGTGTCCT

LMS70-5

CAGGCAGCGGGCCCGTCTGGCCCGTGYNHTNHTNHTNHTTTTACTTGTACGAA TCATTGGTGTCCT

LMS70-6

CAGGCAGCGGGCCCGTCTGGCCCGTGYKMTKMTKMTKMTKMTTTTACTTGTA CGAATCATTGGTGTCC

反向寡核苷酸(反向互补)：

LMS70-1R

ACCGGAACCACCAGACTGGCCRCACGAAGGACACCAATGATTCGTACAA

LMS70-2R

ACCGGAACCACCAGACTGGCCRCAMNNCGAAGGACACCAATGATTCGTACAA

LMS70-3R

ACCGGAACCACCAGACTGGCCRCAMNNMNNCGAAGGACACCAATGATTCGTACAA

LMS70-4R

ACCGGAACCACCAGACTGGCCRCAADNADNADNCGAAGGACACCAATGATTCGTACAA

LMS70-5R

ACCGGAACCACCAGACTGGCCRCAADNADNADNADNCGAAGGACACCAATGATTCGTACAA

LMS70-6R

ACCGGAACCACCAGACTGGCCRCAAKMAKMAKMAKMAKMCGAAGGACACCAATGATTCGTACAA

寡核苷酸溶液

混合物1(自100μM母液)：100μl70-6，33μl70-5，11μl70-4，3.66μl70-3，1.2μl70-2，0.4μl70-1。混合物2(自100μM母液)：100μl70-6R，33μl70-5R，11μl70-4R，3.66μl70-3R，1.2μl70-2R，0.4μl70-1R

PCR组装

10.0μl模板寡核苷酸(5μM)、10.0μl10X缓冲液、2.0dNTPs(10mM)、1.0μl cDNA聚合酶(克隆泰克公司)(Clonetech)、77μl DS H₂O。PCR程序：95℃1分钟，(95℃15秒，54℃30秒，68℃15秒)x5，68℃1分钟。

PCR扩增

引物、10.0μl组装混合物、10.0μl10X缓冲液、2.0dNTPs(10mM)、10.0μlLIBPTF(5μM)、10.0μl LIBPTR(5μM)、1.0μl cDNA聚合酶(克隆泰克)、57μl DSH₂O。PCR程序：95℃1分钟，(95℃15秒，54℃30秒，68℃15秒)x25，68℃1分钟。利用Amican柱Y10纯化产物。利用SfiI和BstXI消化产物并连接入噬菌粒载体pMP003。在MJ PCR仪器上16℃连接过夜。EtOH沉淀纯化连接产物。使用电穿孔转化到新鲜的感受态ER2738细胞中。

如下所述用VEGF对所得文库进行淘选。鉴定出数个相对1SS起始序列VEGF结合能力提高的分离物。图38显示了结合和表达数据。图39显示了序列和构建克隆的Western分析数据。

实施例：构建文库的噬菌体淘选

第一轮淘选：

1)第一轮，每文库包被4孔进行筛选。利用含0.25μg VEGF₁₂₁抗原的25μlPBS包被科斯达(Costar)96-孔ELISA板。用封板膜封板。可在4℃包被过夜或在37℃包被1小时。

2)甩出包被溶液后，加入150μl PBS/BSA1％封闭孔。封板并在37℃孵育1小时。

3)甩出封闭溶液后，在孔中加入50μl新鲜制备的噬菌体(参见文库再扩增方案)。仅适用于第一轮：也加入5μl5％的吐温。封板并在37℃孵育2小时。。

同时，将2ml SB培养基加上2μl5mg/ml四环素以及2μl ER2738细胞制备物共孵育，37℃250rpm生长2.5h。每一筛选文库培养一个培养物，包括负性选择。采取所有措施以避免含噬菌体的培养物受到污染。

4)甩出噬菌体溶液，每孔加入150μl PBS/吐温0.5％并剧烈吹打5次。5分钟后，甩出并重复冲洗步骤。第一轮中，这样冲洗5次，第二轮10次，第3、4、5轮15次。

5)甩出最终冲洗溶液后，加入含50μl新鲜制备的10mg/ml胰蛋白酶的PBS，封板并在37℃孵育30分钟。剧烈吹打10次，将洗脱物(第一轮4x50μl，第二轮2x50ml，后续轮1x50μl)转移到制备的2ml大肠杆菌培养物中，并在室温下孵育15分钟。

6)加入6ml预热的SB培养基、1.6μl羧苄青霉素和6μl5mg/ml四环素。将培养物转移到50ml聚丙烯管中。

7)37℃250rpm振荡8ml培养物1h，加入2.4μl100mg/ml羧苄青霉素，再于37℃250rpm振荡1h。

8)加入1ml VCSM13辅助噬菌体并转移到500ml聚丙烯离心瓶中。加入91ml预热的(37℃)SB培养基和46μl100mg/ml羧苄青霉素及92μl5mg/ml四环素。37℃300rpm振荡100ml培养物1/2-2h。

9)加入140μl50mg/ml卡那霉素并继续37℃300rpm振荡过夜。

10)4℃4000rpm离心15分钟。将上清转移到干净的500ml离心瓶中并加入25ml20％PEG-8000/NaCl2.5M。冰上放置30分钟。

11)4℃9000rpm离心15分钟。弃去上清，纸巾倒置放干至少，并用纸巾从离心瓶上部擦去剩余液体。

12)沿离心瓶一侧上下吹打将噬菌体团块重悬于2ml PBS/BSA0.5％/吐温0.5％缓冲液中。利用1ml移液管进一步上下吹打重悬，4℃全速离心1分钟，上清通过0.2μm滤膜后流入干净的2ml离心管。

13)接步骤3)进行下一轮，并将噬菌体制备物储存于4℃。加入0.02％(w/v)叠氮化钠可作长期储存。每轮仅使用新鲜制备的噬菌体。

第二轮淘选

第二轮，每文库包被2孔进行筛选。利用含0.25μgVEGF₁₂₁抗原的25μlPBS包被科斯达(Costar)96-孔ELISA板。用封板膜封板。可在4℃包被过夜或在37℃包被1小时。

每一文库也封闭2个未包被孔作为计算富集率的阴性对照。

第三轮淘选

第三轮，每文库包被1孔进行筛选。利用含0.25μg VEGF₁₂₁抗原的25μlPBS包被科斯达(Costar)96-孔ELISA板。用封板膜封板。可在4℃包被过夜或在37℃包被1小时。

每一文库也封闭1个未包被孔作为计算富集率的阴性对照。

实施例：基于溶液的淘选：

1.按照生产商说明将靶蛋白生物素化。

2.用含1.0μg中性抗生物素蛋白(皮尔斯公司)(Pierce)的PBS包被一共8孔(每个选择)并于4℃包被过夜。

3.室温下使用SuperBlock(皮尔斯公司)封闭孔1小时。将包含封闭缓冲液的板储存待用(步骤6中)。

4.使用100nM生物素化靶蛋白并加入1012噬菌体/ml(溶于PBST中)，使用SuperBlock和0.05％吐温20使总体积为100-200μl。

5.室温下翻转混悬噬菌体-靶点混合物至少1h。

6.利用700μl SuperBlock稀释100μl噬菌体-靶点，混和并在8个中性抗生物素蛋白(neutravidin)包被板孔中每孔加入100μl(来自步骤3)。

7.室温下孵育5分钟。

8.用PBST冲洗8次。

9.用100μl100mM HC1洗脱噬菌体10分钟。

10.加入10μl1M TRIS pH＝8.0中和。

11.感染用于铺板的细胞，扩增噬菌体用于接下来轮次的溶液淘选。

实施例：用噬菌体ELISA筛选VEGF阳性克隆

1)在96孔深孔板中加入含50μg/ml羧苄青霉素的0.5ml SB。挑选一个克隆并孵育细胞。

2)37℃300rmp振荡含细菌培养物的培养板过夜。

3)制备4ng/μl靶点蛋白的PBS溶液。每孔中加入25μl(100ng)蛋白并在4℃孵育过夜。

4)甩出包被的ELISA板并用PBS冲洗2次。加入150μl/孔PBS+0.5％BSA(封闭缓冲液)。室温下封闭1h。

5)离心微型管架(3000rpm；20分钟)。

6)制备结合缓冲液(封闭缓冲液+0.5％吐温20)。在低蛋白结合96孔板中分装每孔135μl结合缓冲液。

7)甩干ELISA板孔并用PBST(PBS+0.5％吐温20)洗涤2次。

8)用PBST稀释来自过夜培养物的15μl噬菌体，吹打混匀并在每一蛋白包被孔中转移30μl。室温下温和振荡2h。

9)用PBST洗板6次。

10)每孔加入含M13-HRP1∶5000稀释的50μl结合缓冲液。室温下温和振荡30分钟。

11)用PBST洗板4次，用H₂O洗板2次。

12)制备6ml ABTS溶液(5.88ml柠檬酸钠缓冲液加120μl ABTS和2μlH₂O₂)。每一ELISA板的每孔分装50μl。

13)室温下孵育并用ELISA读板机根据信号在合适时间点(至多1h)读取405nm O.D.。

实施例：结合模块的二聚化

按照标准方法创建10e9-10e11种环肽的噬菌体展示文库，环肽在二硫键半胱氨酸之间包含4、5、6、7、8、9、10、11和12个随机化或部分随机化的氨基酸，并且一些情况下在半胱氨酸对外侧有其它的随机化氨基酸。用许多靶点包括人VEGF淘选这些环肽文库，可靠地产生特异性结合于hVEGF但不结合BSA、卵清蛋白或IgG的肽。

实施例：构建和淘选基于plexin的文库

根据Plexin支架设计两个文库。如图35所示使用Pfam蛋白数据库对天然产生的plexin结构域进行系统发生学比对。plexin支架中间部分(Cys24-Gly25-Trp26-Cys27)在两个文库设计中保守并用作N-和C-文库产生时的交叉区域。图36显示两个plexin文库的随机化方案。将编码两个文库的寡核苷酸交叠在交叉区域，并在pull-thru PCR后进行限制性克隆(SfiI/BstXI)，克隆到噬菌粒载体pMP003中，从而得到两个文库。所得plexin文库被称为LMP031(N末端文库)和LMP032(C末端文库)，各自的复杂度约为5x10⁸个独立转化子。通过PCR对每一未选文库的约24个Carb抗性克隆进行分析以验证。对产生正确大小片段(375bp)的克隆进一步进行DNA测序分析。分别从LMP031和LMP032文库中获得50％和67％正确全长的plexin序列。

以50/50的比例将两个文库混和用固定于96孔ELISA板上的VEGF、死亡受体Dr4、ErbB2和HGFR进行平行淘选。进行4轮淘选，第一轮使用1000ng蛋白，第二轮使用500ng蛋白，第三轮使用250ng蛋白，第四轮使用100ng蛋白。最后一轮淘选后，用噬菌体ELISA和偶联辣根过氧化物酶的抗-M13多克隆Ab分析每次选择的192个Carb抗性克隆与100ng固定蛋白靶点、人IgG、卵清蛋白和BSA的结合。获得的以下靶点的阳性克隆比例最高：依次为DR4(69％)、ErbB2(53％)、HGFR(13％)和BoNT靶点(1％)。对阳性克隆进一步进行PCR和DNA测序分析。所有克隆揭示独特序列，除了一个克隆(针对DR4)衍生自LMP032(C末端文库)。图37显示了一些鉴定的靶点选择性分离物序列。

为了进一步分析，首先将一类选定的靶点特异性结合物亚克隆到蛋白质表达载体pVS001中，然后以可溶性性微生物蛋白的形式生产，最终用热裂解法进行纯化。对纯化的靶点特异性微生物蛋白进行蛋白质ELISA分析以确认靶点识别，SDS-PAGE确认单体形成，表面等离振子共振检测与靶点的亲和力。将最好的克隆用于下轮文库生产以进一步改良其特性。

实施例：构建基于蛇毒的文库

使用标准方法创建10e8-10e10个三指毒素(3FT)支架的噬菌体展示文库，其中指1和指2的下降部分或指3和指2的上升部分含有部分随机化氨基酸。

使用两个3FT支架作为产生3FT文库的模板(指1和指2结构)。图33显示3FT支架的结构和相关序列的多重序列比对。如图34所示设计文库使毒素的两个表面环随机化。将编码四个文库的寡核苷酸交叠在退火区域，并进行pull-thru PCR，接着限制性克隆(SfiI/BstXI)到噬菌体载体pMP003中，得到部分随机化的3FT支架文库。所得的3FT文库称为LMP041。

实施例：将结合肽嫁接到微生物蛋白支架中-靶点特异性肽辅助的随机化

这里目的是使用已被鉴定对感兴趣靶点具有特异性的肽产生3SS加靶点特异性结合物。该策略使用VEGF特异性肽转移到3FT支架的指1中，并修饰指2的AA残基，该残基与靶点特异性序列接近，以产生高亲和力的VEGF结合物。利用如上所述标准方法创建10e8-10e10个3指毒素(3FT)支架的噬菌体展示文库，其中含有指1的VEGF特异性序列和指2的部分随机下降部分，除了2个随机指1正向引物被编码下述序列的F1-VEGF特异性正向引物替代：PS G P S C H T T N H W P I S A V T C P P。

将编码四个文库的寡核苷酸交叠在退火区域并进行pull-thru PCR，然后限制性克隆(SfiI/BstXI)到噬菌体载体pMP003中，得到关注的含有部分随机化指2的(VEGF特异性)3FT支架文库。所得的3FT文库称为LMP042。

实施例：MURP的血浆半衰期

基本如[Pepinsky，R.B.等(2001)JPharmacol Exp Ther，297：1059-66]所述在将MURP i.v.或i.p.注射插管大鼠后测定MURP的血浆半衰期。在不同时间点(5分钟、15分钟、30分钟、1小时、3小时、5小时、1天、2天、3天)取血样并利用ELISA检测MURP的血浆浓度。利用WinNonlin2.0版(科学顾问公司)(Scientific Consulting Inc.，Apex，NC)计算药代动力学参数。为了分析URP的效应，可比较含URP模块蛋白的血浆半衰期和不含URP模块的相同蛋白的血浆半衰期。

实施例：MURP的融解性测试

将处于生理缓冲液如磷酸盐缓冲盐水中的纯化MURP样品浓缩至范围在0.01mg/ml-10mg/ml之间的不同浓度，以测定MURP的溶解度。可将样品孵育长至数周。浓度超过MURP溶解度的样品出现浑浊的沉淀，可通过分光光度计测定。可通过离心或过滤移除沉淀物质，然后利用蛋白实验如布拉德夫(Bradford)实验测定280nm吸光度值，以检测上清中蛋白浓度。可在-20℃冷冻样本再融化以加速溶解度研究。该过程经常导致溶解性差的蛋白沉淀。

实施例：MURP的血清结合活性

可用感兴趣的MURP包被微孔板，用对照蛋白包被板中的其它孔。然后，在孔中加入感兴趣的血清样本孵育1h。然后，用洗板机洗板。结合的血清蛋白可被加入的已与酶如辣根过氧化物酶或碱性磷酸酶偶联的抗血清蛋白抗体检测到。检测MURP血清结合的另一方式是加入感兴趣的MURP至血清中约1h使其结合。然后，用抗MURP序列中表位的抗体免疫沉淀MURP。对沉淀的样品进行PAGE分析，任选用Western分析检测与MURP共沉淀的蛋白。利用质谱可检测共沉淀的血清蛋白。

Claims

(b)经Chou-Fasman算法测定至少50％的所述氨基酸缺少二级结构。

3.如权利要求1或2所述的URP，其特征在于，所述URP包含非天然氨基酸序列。

4.如权利要求1或2所述的URP，其特征在于，选择所述URP掺入异源蛋白质中，将所述URP掺入异源蛋白质后，与不含所述URP的相应蛋白质相比，所述异源蛋白质的血清半衰期较长和/或溶解度较高。

5.如权利要求1或2所述的URP，其特征在于，将所述URP掺入异源蛋白质后，所述异源蛋白质的血清分泌半衰期比不含所述URP的相应蛋白质长至少2倍。

6.如权利要求1或2所述的URP，其特征在于，将所述URP掺入异源蛋白质导致该蛋白经大小排阻色谱估算的表观分子量增加至少2倍。

7.如权利要求1或2所述的URP，其特征在于，所述URP的T表位评分小于-4。

8.如权利要求1或2所述的URP，其特征在于，所述氨基酸主要是亲水性残基。

9.如权利要求1或2所述的URP，其特征在于，经Chou-Fasman算法测定所述URP中至少50％氨基酸缺少二级结构。

10.如权利要求1或2所述的URP，其特征在于，所述URP中甘氨酸残基占所述URP中全部氨基酸的至少约50％。